論文紹介
自分がよく使うモデルは理解を深めておこうの精神。 MelGAN の論文はこちら [1] MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis Multi-band MelGAN (以下 MB-MelGAN)の論文はこちら [2] Multi-band MelGAN: Faster Waveform G…
目次 Nvidia Mellotron とは Mellotron で出来ること Mellotron の手法詳細 モデルの構造 モデルの学習方法 PitchContour SpeakerId Global Style Token モデルによる推論方法 入力データを用意する方法 音声データを用意する場合 楽譜データを用意する場合 …