二次元裏@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
おなまえ
E-mail
題  名
コメント
添付File []
削除キー(削除用.英数字で8字以内)

画像ファイル名:1780139649811.png-(4988927 B)
4988927 BAIエロボイススレNameとしあき26/05/30(土)20:14:09No.1411434257そうだねx1 31日01:09頃消えます
AIエロボイススレ
1.Irodoriをインストール
https://huggingface.co/Aratako/Irodori-TTS-500M-v3
2.キャラサンプルボイスを参照
3.絵文字をgeminiに覚えさせてセリフ生成
4.最強に美味い完成


※版権サンプリングの音声ファイル投稿は禁止

demo
https://huggingface.co/spaces/Aratako/Irodori-TTS-500M-v3-Demo

IrodoriでGeminiと会話するやつ
https://xgf.nu/B3gzE
1無念Nameとしあき26/05/30(土)20:16:32No.1411435006+
雑談、セリフ、オリジナル音声参照は投稿OK
2無念Nameとしあき26/05/30(土)20:17:07No.1411435187+
なんかスレが荒れがちなのでなかよくしましょう
3無念Nameとしあき26/05/30(土)20:18:16No.1411435531+
とりあえず会話システムの感想聞きたい。ちゃんと動いてるのかも謎
4無念Nameとしあき26/05/30(土)20:21:01No.1411436341+
取り合えずスレ画に声付けた方が良くない……?看板的な物な訳だし
5無念Nameとしあき26/05/30(土)20:22:00No.1411436607+
ほら、さっさと出しなさいよ。😏😏……ふん、相変わらず見栄えのしないアレね。……な、何よその目は! 🥵🥵……ちょっとは感謝しなさいよね! 👂👂……ほら、いくわよ。👅👅……ん、んぅ……。👅👅レロ、レロォ……。👅👅……んっ、いきなり固くなって。……あんた、ほんとに分かりやすいわね。😏😏👅👅
6無念Nameとしあき26/05/30(土)20:23:28No.1411437026+
版権ボイスでなければボイスつけてもセーフ
7無念Nameとしあき26/05/30(土)20:24:34No.1411437362+
キャラボイスサンプリングじゃないと看板画像意味ないから難しいとこだな
8無念Nameとしあき26/05/30(土)20:24:58No.1411437495+
職人にアスカっぽい声作ってもらうとか
9無念Nameとしあき26/05/30(土)20:29:21No.1411438781+
誰かそれっぽい声作れる人いる?
10無念Nameとしあき26/05/30(土)20:31:36No.1411439411そうだねx7
    1780140696979.mp4-(6991783 B)
6991783 B
委員長 読んで!
11無念Nameとしあき26/05/30(土)20:33:43No.1411440009+
アスカとか独特の粘るようなクセのある声の再現は滅多に成功しない……
12無念Nameとしあき26/05/30(土)20:34:26No.1411440217+
官能小説読み上げもいいな
13無念Nameとしあき26/05/30(土)20:35:32No.1411440549+
確かに独特な少し鼻にかかった感じが難しいきがする
14無念Nameとしあき26/05/30(土)20:35:36No.1411440566+
アンアンいくいくは速攻で飽きて
委員長読んでシリーズばかり作ってる
15無念Nameとしあき26/05/30(土)20:40:56No.1411442104+
1回の音声の短さのせいで絶妙に抜きにくいのが難点だよな。落ち着かない
16無念Nameとしあき26/05/30(土)20:41:32No.1411442281+
>1回の音声の短さのせいで絶妙に抜きにくいのが難点だよな。落ち着かない
編集しなさいな……
17無念Nameとしあき26/05/30(土)20:41:40No.1411442320+
音声をつなぐのも絶妙にだるい
18無念Nameとしあき26/05/30(土)20:42:42No.1411442601そうだねx1
みんな1ファイルに連結してるの
19無念Nameとしあき26/05/30(土)20:43:36No.1411442866+
LoRA学習したいけどEMOJIのスライスと文字つけしたのに形式違うぞゴラって通してくれない
20無念Nameとしあき26/05/30(土)20:44:57No.1411443229+
>版権ボイスでなければボイスつけてもセーフ
参照を切ってジェネレートするだけじゃんっておもったら
ねっとり男性ボイスファイルが爆誕
あげたほうがいい?
21無念Nameとしあき26/05/30(土)20:45:32No.1411443392+
元気系キャラでサンプリングしてLoRA作るとテンション低い時はどうなるのだろう
22無念Nameとしあき26/05/30(土)20:46:28No.1411443632+
>>版権ボイスでなければボイスつけてもセーフ
>参照を切ってジェネレートするだけじゃんっておもったら
>ねっとり男性ボイスファイルが爆誕
>あげたほうがいい?
ねっとり女性ボイスなら…
23無念Nameとしあき26/05/30(土)20:46:43No.1411443707そうだねx1
ローカルLLM使える人用のやつ
https://github.com/kn86elt/BridgeTTS
24無念Nameとしあき26/05/30(土)20:47:12No.1411443842+
実際の声優使うと問題があるらしいので
声だけは可愛い嫁に短文朗読してもらったサンプルを利用している
25無念Nameとしあき26/05/30(土)20:47:44No.1411443981+
画像動画無断転載しまくってる掲示板なのに何でダメなん?
26無念Nameとしあき26/05/30(土)20:49:40No.1411444533+
声優の声をサンプリングしてアップするのは危険すぎるので
27無念Nameとしあき26/05/30(土)20:49:48No.1411444574+
ボイスデザイン版も学習させてみたが
こっちもキャプション次第でキャラ再現切り替え簡単にできるな
ある程度ならそっからちょっと大人びた声とか調整もできる
28無念Nameとしあき26/05/30(土)20:51:35No.1411445085そうだねx3
版権ボイスはアウトなのに版権キャラ絵でスレ立てるのか
29無念Nameとしあき26/05/30(土)20:51:55No.1411445172+
>ローカルLLM使える人用のやつ
>https://github.com/kn86elt/BridgeTTS
ローカルLLMでできるのは熱い。
30無念Nameとしあき26/05/30(土)20:53:37No.1411445682+
とし達はリスク回避能力だけは高い
31無念Nameとしあき26/05/30(土)20:56:22No.1411446422そうだねx1
別に声優参照エロボイスをローカルで遊ぶ分には問題ないけど、アップは危険がすぎるので
32無念Nameとしあき26/05/30(土)20:57:29No.1411446725+
「その声優のキャラ」だと知っているし演技の幅の分の違和感あるけど「そのキャラ」だったら完璧に近いのが出て来るとかもはや怖いよ……
33無念Nameとしあき26/05/30(土)20:57:49No.1411446807そうだねx1
ここを転載してるバカもいるからな
34無念Nameとしあき26/05/30(土)21:02:02No.1411448042+
ローカルLLMと音声生成使ったAIエロゲーやりたい
35無念Nameとしあき26/05/30(土)21:02:41No.1411448223+
>No.1411435531
起動しないよ
36無念Nameとしあき26/05/30(土)21:03:12No.1411448368そうだねx1
Irodori-ttsのアプデで追加されたSpeaker Inversion embedding学習がLoRaと同じデータセットで作れて取り回しと絵文字の効きが凄い良いからおすすめ
37無念Nameとしあき26/05/30(土)21:05:38No.1411449053+
>>No.1411435531
>起動しないよ
うわぁぁあ
38無念Nameとしあき26/05/30(土)21:06:34No.1411449295+
絵文字がテキストに掛かったり単体で発声したり制御できないんだけどどうすればいいんだ
39無念Nameとしあき26/05/30(土)21:08:35No.1411449894+
>絵文字がテキストに掛かったり単体で発声したり制御できないんだけどどうすればいいんだ
テキストを短くして回数をこなす
40無念Nameとしあき26/05/30(土)21:09:32No.1411450196+
>Irodori-ttsのアプデで追加されたSpeaker Inversion embedding学習がLoRaと同じデータセットで作れて取り回しと絵文字の効きが凄い良いからおすすめ
ゼロショットとLoRaの中間みたいな?
41無念Nameとしあき26/05/30(土)21:11:35No.1411450756+
>>絵文字がテキストに掛かったり単体で発声したり制御できないんだけどどうすればいいんだ
>テキストを短くして回数をこなす
ガチャ回すしかないのか
42無念Nameとしあき26/05/30(土)21:14:16No.1411451517+
イラストと違って性癖丸出しの投稿が少ないのはなぜなんだぜ
43無念Nameとしあき26/05/30(土)21:18:46No.1411452850+
>ゼロショットとLoRaの中間みたいな?
大体そんな感じ実装した人のブログ
https://zenn.dev/platina/articles/speaker-inversion
44無念Nameとしあき26/05/30(土)21:29:20No.1411455877+
いま話題になっている所で
わざわざ火を付けるようなバカなことをするとしあきはいない
安心した
45無念Nameとしあき26/05/30(土)21:31:12No.1411456392+
自分に刺さるセリフを自分で書いてるわけだから公開はイラストより恥ずかしい
46無念Nameとしあき26/05/30(土)21:34:51No.1411457406そうだねx1
やってると自分にいかに語彙が無いかわかる。同じ言葉ばっか使っちゃう
47無念Nameとしあき26/05/30(土)21:40:24No.1411458950+
>ローカルLLM使える人用のやつ
>https://github.com/kn86elt/BridgeTTS
良く分かってないんだけど
ローカルでIrodoriTTS使ってて上のアドレスチャッピーに突っ込めばセットアップできるのかな?
48無念Nameとしあき26/05/30(土)21:44:44No.1411460159そうだねx1
    1780145084496.mp4-(192573 B)
192573 B
サンプルに上げてみるIrodori-TTSアプデして音声参照の隣のタブのSpeaker EmbeddingにこのファイルDLして音声ファイルみたいに読ませたら再現できるよ
https://50.gigafile.nu/0606-dff427643813c77dab1f05134da11f694
49無念Nameとしあき26/05/30(土)21:46:47No.1411460785+
スレ画のデモサイトはUIのバージョン古くてSpeakerEmbeddingのタブが無いからローカル限定です
50無念Nameとしあき26/05/30(土)21:49:01No.1411461456+
>サンプルに上げてみるIrodori-TTSアプデして音声参照の隣のタブのSpeaker EmbeddingにこのファイルDLして音声ファイルみたいに読ませたら再現できるよ
>https://50.gigafile.nu/0606-dff427643813c77dab1f05134da11f694
クオリティ高い
51無念Nameとしあき26/05/30(土)21:49:06No.1411461485+
irodoriで参照音声によって上手くいくときとそうでないときの差が激しい
普通のナレーションとかはすばらしい出来だけど
あえぎ声とかになると差が出る
52無念Nameとしあき26/05/30(土)21:49:28No.1411461608+
ずんだもんほぼ完璧にできてる
53無念Nameとしあき26/05/30(土)21:59:52No.1411464584+
>ローカルでIrodoriTTS使ってて上のアドレスチャッピーに突っ込めばセットアップできるのかな?
ローカルでIrodori動いてるならCodeって所からZipダウンロードしてバッチファイルを動かす→LMStudioからGemma4 E4Bとかの小さ目のモデルをダウンロードしてデベロッパタブからサーバとして動かすとかでいけるんじゃないかな
54無念Nameとしあき26/05/30(土)22:03:10No.1411465526+
>>ローカルでIrodoriTTS使ってて上のアドレスチャッピーに突っ込めばセットアップできるのかな?
>ローカルでIrodori動いてるならCodeって所からZipダウンロードしてバッチファイルを動かす→LMStudioからGemma4 E4Bとかの小さ目のモデルをダウンロードしてデベロッパタブからサーバとして動かすとかでいけるんじゃないかな
ありがとう・・・
でも書いてくれてることが1mmも分からない・・・
それ以前に今でもIrodori-TTS-500M-v2-Demo使ってるのってアウト?
なんかチャッピーに「v3が本筋で・・・」みたいなこと言われたんだけど・・・
55無念Nameとしあき26/05/30(土)22:06:36No.1411466580+
demoはデモ用にWEBに上げてるだけだから自分のPCにv3をインストールしないと動かないと思うよ
56無念Nameとしあき26/05/30(土)22:07:15No.1411466786+
早速入れてみたけどデバイスがCPUだわ
CUDAになってないからなんかミスったかな?
57無念Nameとしあき26/05/30(土)22:09:13No.1411467345+
>それ以前に今でもIrodori-TTS-500M-v2-Demo使ってるのってアウト?
それはローカルじゃないかもしれない…
強めのグラボ(VRAM8GB以上)付いてるPC持ってるならチャッピーにURL教えてインストールの仕方教えてって言えばいいかも
58無念Nameとしあき26/05/30(土)22:11:19No.1411467914+
>CUDAになってないからなんかミスったかな?
WEBUI(gradio_app.py)の方なら画面からデバイス選べるはず
59無念Nameとしあき26/05/30(土)22:14:19No.1411468794+
>demoはデモ用にWEBに上げてるだけだから自分のPCにv3をインストールしないと動かないと思うよ
アホな事言ってると思うんだけど今PCで動いてるって事はそのv3ってのが入ってるのかな…

>それはローカルじゃないかもしれない…
無限生成出来てるからローカルの筈…
導入した時もURL教えてチャッピー任せでしたし…
60無念Nameとしあき26/05/30(土)22:14:47No.1411468912+
面白いとかマイナーな体位プロンプトください
61無念Nameとしあき26/05/30(土)22:16:25No.1411469360+
>WEBUI(gradio_app.py)の方なら画面からデバイス選べるはず
選択肢に無いんだよね
おそらくPyTorchかcuda toolkit絡みだと思うけど他のAIでも使うから下手にアプデできないんだよね
別ver同居させなきゃならないんだろうなぁ……
62無念Nameとしあき26/05/30(土)22:17:06No.1411469539+
>導入した時もURL教えてチャッピー任せでしたし…
PCでできてるならいっそcodex使ってみては?
多分ChatGPTの無料アカウントでもこの辺のソフトのインストールくらい勝手にやってくれると思うけど
63無念Nameとしあき26/05/30(土)22:18:16No.1411469874+
>早速入れてみたけどデバイスがCPUだわ
>CUDAになってないからなんかミスったかな?
アプデでpyproject.tomlに変更入ったからかも
uv run --extra cu128 --extra api python gradio_app.pyで起動してもダメ?
project.optional-dependenciesを明示的にcu128呼び出すの
64無念Nameとしあき26/05/30(土)22:18:52No.1411470049+
>誰かそれっぽい声作れる人いる?
いやもうネットで拾える音声使えば自由自在だろ
アップロードはしないけど
65無念Nameとしあき26/05/30(土)22:19:26No.1411470202+
>>導入した時もURL教えてチャッピー任せでしたし…
>PCでできてるならいっそcodex使ってみては?
codexを調べてみます…
66無念Nameとしあき26/05/30(土)22:19:43No.1411470290+
>別ver同居させなきゃならないんだろうなぁ……
Irodoriはuv使ってるからそんな難しい事ないはず(勝手にいい感じのバージョンのvenv作ってくれるはず)
uv syncはしてます?
67無念Nameとしあき26/05/30(土)22:21:22No.1411470765+
>Irodoriはuv使ってるからそんな難しい事ないはず(勝手にいい感じのバージョンのvenv作ってくれるはず)
>uv syncはしてます?
してるはず
なんか確認方法あったけ?
68無念Nameとしあき26/05/30(土)22:27:15No.1411472402+
>やってると自分にいかに語彙が無いかわかる。同じ言葉ばっか使っちゃう
もう俺はそれもAIに考えてもらってる
69無念Nameとしあき26/05/30(土)22:28:24No.1411472734+
Irodori-TTS動いてたらプロセス止める → Irodori-TTS>uv sync --extra cu128 --extra api
で更新かけるくらいしか思い浮かばないな
70無念Nameとしあき26/05/30(土)22:29:35No.1411473077+
>なんか確認方法あったけ?
irodoriのインストールされてるフォルダ開けてアドレスバーにcmdって入れてenterするとコマンドプロンプトが開くから
uv run python -c "import torch; print(torch.cuda.is_available())"
って入れる
trueって出なければcudaがirodori用に入ってない
71無念Nameとしあき26/05/30(土)22:32:20No.1411473865+
>職人にアスカっぽい声作ってもらうとか
>誰かそれっぽい声作れる人いる?
30回ほどアスカ風を目指してVoicdDesign回してみたけど
俺には無理だった

>アスカとか独特の粘るようなクセのある声の再現は滅多に成功しない……
wav参照で本人音源を参照しても全然似ない
SpeakerEmbeddingなら似るの?そっちから試すか…
72無念Nameとしあき26/05/30(土)22:32:44No.1411473968+
>trueって出なければcudaがirodori用に入ってない
falseだ!
uv sync --extra cu128は既にした後
73無念Nameとしあき26/05/30(土)22:36:20No.1411474911そうだねx1
    1780148180424.png-(59914 B)
59914 B
俺がちょっと前に直したときのログ

.\.venv\Scripts\python.exe -m pip uninstall torch torchaudio -y
.\.venv\Scripts\python.exe -m pip install torch==2.1.0+cu121 torchaudio==2.1.0+cu121 --index-url https://download.pytorch.org/whl/cu121
.\.venv\Scripts\python.exe -c "import torch; print('CUDA available:', torch.cuda.is_available())"
74無念Nameとしあき26/05/30(土)22:37:40No.1411475297+
Audibleの5分プレビューで作るのが今俺の中でホットだ
75無念Nameとしあき26/05/30(土)22:41:46No.1411476402+
--extra cu128で一応torch==2.10.0+cu128がインストールはされるんだけど
uv run python -c "import torch; print(torch.cuda.is_available())"を入れて確認するとUninstalled 2 packagesされて2.10.0+cpuを再度入れられちゃう
76無念Nameとしあき26/05/30(土)22:42:20No.1411476539+
>30回ほどアスカ風を目指してVoicdDesign回してみたけど
>俺には無理だった
釘宮っぽい高い声は出来るけど宮村的なしっとり感が出ない……
77無念Nameとしあき26/05/30(土)22:46:22No.1411477674+
ネット上に落ちとるアスカのボイス集を読み込ませてやったらかなり似てくれてるけど
そういうのじゃあかんの?
78無念Nameとしあき26/05/30(土)22:46:29No.1411477706+
>uv run python -c "import torch; print(torch.cuda.is_available())"を入れて確認するとUninstalled 2 packagesされて2.10.0+cpuを再度入れられちゃう
uv run --extra cu128 python -c "import torch; print(torch.cuda.is_available())"
でtrue って出るなら
uv run --extra cu128 python gradio_app.py --server-name 0.0.0.0 --server-port 7860
でWEBUIを起動するとか
そもそもcu128が合ってないならnvidia-smi で対応cudaの最大バージョンが右上に出るからそれを調べる
79無念Nameとしあき26/05/30(土)22:46:34No.1411477720そうだねx1
>早速入れてみたけどデバイスがCPUだわ
>CUDAになってないからなんかミスったかな?
もうchatgptに導入聞いたチャットのまま「cudaが選択できないよおおお!」
「その辺弄ったら他のAIに影響出るんじゃないの?!怖い何とかしてええええ!」って聞いた方がいいと思う割とマジで
80無念Nameとしあき26/05/30(土)22:47:53No.1411478087+
>Audibleの5分プレビューで作るのが今俺の中でホットだ
なるほど…頭いい
81無念Nameとしあき26/05/30(土)22:48:17No.1411478198+
>ネット上に落ちとるアスカのボイス集を読み込ませてやったらかなり似てくれてるけど
>そういうのじゃあかんの?
制御できないから痒い所に手が届かない的な……
82無念Nameとしあき26/05/30(土)22:48:20No.1411478214そうだねx1
作った音声をアップロードする勇気はない
83無念Nameとしあき26/05/30(土)22:48:30No.1411478260+
400人くらい再現できるモデルはあるがアスカはまだ入れてないな
84無念Nameとしあき26/05/30(土)22:49:51No.1411478578+
>作った音声をアップロードする勇気はない
デザインの方なら問題ないでしょ?
85無念Nameとしあき26/05/30(土)22:50:08No.1411478656+
>早速入れてみたけどデバイスがCPUだわ
>CUDAになってないからなんかミスったかな?
何も分からない自分がやった時はチャッピーで分からないループに入ったのでコパァにタッチしたら出来た

- GazouBBS + futaba-