AIを使ったリアルタイムボイスチェンジャー「MMVC(RealTime-Many to Many Voice Conversion)」 で使用するモデルを学習するためのソフトです。
Google Colaboratory (Google Colab) を用いることで、個人の環境に依存せず、かつ簡単に機械学習の学習フェーズを実行可能です。
「簡単」「だれでも」「好きな声に」「リアルタイムで」
v1.3.0.0は制作中だそうだ。 v1.2.0.0
・Google アカウント
2つのパターンがあります。
アプリを頼れば、簡単にセットアップできます!!
dataset
├── textful
│ ├── 00_myvoice
│ │ ├── text
│ │ │ ├── emoNormal_001.txt
│ │ │ ├── emoNormal_002.txt
│ │ │ ├── ...
│ │ └── wav
│ │ ├── emoNormal_001.wav
│ │ ├── emoNormal_002.wav
│ │ ├── ...
│ │── 01_target
│ │ ├── text
│ │ └── wav
│ │
│ └── 1205_zundamon
│ ├── text
│ │ ├── emoNormal_001.txt
│ │ ├── emoNormal_002.txt
│ │ ├── ...
│ └── wav
│ ├── emoNormal_001.wav
│ ├── emoNormal_002.wav
│ ├── ...
│
└── textless
notebookディレクトリにある「03_MMVC_Interface.ipynb」をgoogle colab 上で実行してください。
Voice Changer Trainer and Player
様々な環境でMMVCを動かすように作成されたClient software。
# | os | middle | トレーニングアプリ | ボイスチェンジャー |
---|---|---|---|---|
1 | Windows | Anaconda | 未 | 未 |
2 | Windows(WSL2) | Docker | wsl2+ubuntuで確認 | wsl2+ubuntuで確認 |
3 | Windows(WSL2) | Anaconda | 未 | ubuntuで確認 |
4 | Mac(Intel) | Anaconda | 未 | 動作するが激重。(2019, corei5) |
5 | Mac(M1) | Anaconda | 未 | M1 MBA, M1 MBPで確認 |
6 | Linux | Docker | debianで確認 | debianで確認 |
7 | Linux | Anaconda | 未 | 未 |
8 | Colab | Notebook | 確認済み | 確認済み |
ある程度最近のものであればCPUでの稼働も可能です(i7-9700Kで実績あり。下記デモ参照)。
| 前準備編 | ニコニコ動画 | YouTube | | :————– | :——————————————————– | :——————————————————————— | | 要修正音声 | ニコニコ動画 | YouTube | | 前準備編2 | ニコニコ動画 | YouTube | | 学習編_前1 | ニコニコ動画 | YouTube | | 学習編_前2 | ニコニコ動画 | YouTube | | 学習編_後 | ニコニコ動画 | YouTube | | リアルタイム編 | ニコニコ動画 | YouTube | | 質問編 | ニコニコ動画 | YouTube | | 応用編_九州そら | ニコニコ動画 | YouTube | | 応用編_音街ウナ | ニコニコ動画 | YouTube |
FAQをご参考ください。
本家の開発の最新情報や、不明点のお問合せ、MMVCの活用法などMMVCに関するコミュニティサーバです。
MMVCに関する疑問・質問等の本家の開発者への問い合わせはPIXIV FANBOXで受け付けています。
Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
vits
このファイルは、本家のREADMEを一部編集したものです。