coqui-ai/ttsでvocoderの学習

sound python

こちらの続きとしてvocoderの学習と、生成したmelspectrogramをvocoderに通して音声生成してみる https://jsapachehtml.hatenablog.com/entry/2021/06/16/094213 学習前回書いた通りmultiband-melganを試してみる。データセットもJSUTで同じくLJSpeechと同…

#TTS #Pytorch

2021-06-16

coqui-ai/ttsで日本語音声合成を試す

machine learning sound pytorch

いままで音声の生成はやってみたことがないため勉強のためにやってみたのでメモ。目的としてはどういうことを行っているのか理解したいというのと、TTSを学習させてみた場合にどの程度のコストがかかってどのくらいの音声が生成できるのかというのが気にな…

#TTS #machine learning #Deep learning

2020-12-19

音に対するdeep learningの入門として環境音の識別をやってみる(3)

python pytorch machine learning sound

こちらの続き https://jsapachehtml.hatenablog.com/entry/2020/10/24/183410?_ga=2.58998701.1453230663.1604732830-1050067043.1602897991 今回はBC Learningを実装してみたのでメモ BC Learning 論文: https://arxiv.org/pdf/1711.10282.pdf 公式repo: ht…

#machine learning #Pytorch

2020-10-24

音に対するdeep learningの入門として環境音の識別をやってみる(2)

python pytorch machine learning sound

こちらの記事の続き https://jsapachehtml.hatenablog.com/entry/2020/10/17/231526 今回はEnvNetを実装してみたのでメモ EnvNet 論文：https://www.mi.t.u-tokyo.ac.jp/assets/publication/LEARNING_ENVIRONMENTAL_SOUNDS_WITH_END-TO-END_CONVOLUTIONAL_NE…

#machine learning #pytorch #sound

2020-10-17

音に対するdeep learningの入門として環境音の識別をやってみる

python pytorch machine learning sound

音の扱いがどのようになっているか知りたいと思ったため、最も簡単にできそうなものということで環境音の識別をやってみることにしたいろいろググっているとこちらのqiitaがこれまでの経緯をまとめてくれていたためこれを参考にしていくつか実装してみる ht…

#machine learning #Pytorch #sound