SHIMADA Hirofumi [email protected]

データを作る:openGameArtのCC0英語ボイスを調達し、バッチ生成して...

SHIMADA Hirofumi [email protected]

というわけでパッチ当てて、Quadro RTX5000で動くモードを追加した。

SHIMADA Hirofumi [email protected]

調節雑ハック:読めないカタカタパターンをフィルタする。滑舌があやしいが破綻するよりはまし。

SHIMADA Hirofumi [email protected]

いろいろ考え試した:バックエンドをpyopenjtalkにする?espeak-ngをメンテする?後処理で修正する?

SHIMADA Hirofumi [email protected]

なぜ破綻するのか:音素化バックエンドが espeak-ngだが、日本語サポートが不完全

SHIMADA Hirofumi [email protected]

意地悪な内容のコーパスだが、テストデータとしてはきわめて正しい

SHIMADA Hirofumi [email protected]

ただ、ダメでした。半分くらいの文章で出力が破綻する。

SHIMADA Hirofumi [email protected]

Style-Bert-VITS2 : 最近人気の日本語TTS。これをZonosに作らせればいいやんということで

SHIMADA Hirofumi [email protected]

いいことばかりではないが、それだけでは惜しいクローン性能をもっている。

SHIMADA Hirofumi [email protected]

Zonos:いわゆるワンショットTTS。新しく出たもの。同種よちかなり高いクローン性能。

SHIMADA Hirofumi [email protected]

次は飛び入りのzgockさん。自力でTTS用モデルを作った話。

SHIMADA Hirofumi [email protected]

いいところまでいっているけど不安定

SHIMADA Hirofumi [email protected]

スイッチングハブ部門が、Device Treeで動かすにはかなりしんどい状況でもある、という説明

SHIMADA Hirofumi [email protected]

Debianでの先行事例がいくつかある。

SHIMADA Hirofumi [email protected]

ソフトウェア的には :realtel: リファレンスからの変更が大きい。