好きな声で好きなセリフを。無料で使える音声合成AI「Irodori-TTS」とは

3行でわかるこの記事

  • 何が起きた? 好きな声と好きなセリフを指定できる音声合成AI「Irodori-TTS」の新しいバージョンが登場しました。
  • 重要なポイント 絵文字を混ぜるだけで、声の感情まで調整できるようになりました。
  • なぜ注目? ネットにつながなくても、自分のパソコンで無料で何度でも使えるからです。

はじめに

「好きな声でAIにしゃべらせるなんて、特別な機材やお金がいるんでしょ?」

そう思う方も多いかもしれません。でも実は、文字を打ち込むだけで好きな声で読み上げてくれるAIが、無料で配られています。しかも、ネットにつながず自分のパソコンの中だけで動くので、回数の制限もありません。

この記事では、こんなことをお伝えします。

  • Irodori-TTSって、何ができるの?
  • 絵文字で感情を変えるって、どういうこと?
  • 私たちはこれで、何を楽しめるの?

少し変わった話に見えるかもしれませんが、できるだけわかりやすくお伝えしますね。

ひとことで言うと

好きな声、好きなセリフ、そして声の感情まで自分で決められる読み上げAIが、無料で自分のパソコンに置けるようになりました。ここからは、その面白さを順番に見ていきましょう。

そもそも、Irodori-TTSって何ができるの?

Irodori-TTSは、打ち込んだ文字を音声に変えてくれる、日本語が得意な読み上げAIです。今回はこれが新しいバージョンに進化しました。

面白いのは、声を自由に選べるところです。お手本にしたい声のファイルを用意すれば、その声の雰囲気をまねて、こちらが書いた文章を読み上げてくれます。さらに、文章で「落ち着いた女性の声」のように説明して、声の感じを指定する使い方もあります。

読み上げのスピードも調整できます。「この長さに収めたい」と秒数を伝えると、それに合わせて話す速さを変えてくれます。動画のナレーションのように、決まった尺にぴったり合わせたいときに便利そうです。

絵文字で感情を変えるって、どういうこと?

ここが今回いちばん面白いところだと思います。

これまでの読み上げAIは、文章を平らに読むだけのものが多くありました。Irodori-TTSの新しいバージョンでは、文章に絵文字を混ぜるだけで、声の感情が変わります。たとえば、ちょっとからかうような顔の絵文字を入れると、声にもその雰囲気がにじむ、といった具合です。

うれしい場面、すねた場面、得意げな場面。書いたセリフに合う絵文字を添えるだけで、棒読みではない、表情のある声になります。文章を書くついでに気持ちのスイッチを押せる感覚で、操作のために専門的な知識はほとんどいりません。

夜、自分で考えた短いセリフを打ち込んで、絵文字を一つ足して再生ボタンを押す。返ってきた声に表情が乗っていると、つい何度も試したくなります。

私たちはこれで、何を楽しめるの?

使い道は、思っているより身近にありそうです。

たとえば、自分で作った短い動画にナレーションをつけたいとき。家族向けのちょっとしたメッセージを声にしたいとき。物語の登場人物それぞれに違う声をあてて読ませてみたいとき。これまでは録音したり外のサービスにお金を払ったりしていた部分が、自分のパソコンの中だけで完結します。

ネットにつながないので、打ち込んだ文章が外に出ていかないのも安心できる点です。回数の制限もないため、納得いくまで何度でも作り直せます。

これから、声を作る楽しさはどう広がる?

無料で誰でも触れる形になったことで、声を作って遊ぶ人はこれから増えていきそうです。

ただ、誰かの声をまねできるということは、使い方しだいでは人を傷つけたり、だましたりする道具にもなりかねません。便利さと隣り合わせのこわさがあることは、頭の片隅に置いておきたいところです。

まずは、自分の好きなセリフを一行打ち込んで、絵文字を一つ添えてみる。そこから、声で遊ぶ新しい時間が始まります。

用語ミニ解説

  • 音声合成AI: 打ち込んだ文字を、人が話しているような声に変えてくれるAIのこと。(カーナビや駅のアナウンスの、もっと自由がきく版)
  • ローカルで動く: ネットにつながず、自分のパソコンの中だけで処理が完結すること。(外のお店に出さず、自宅の台所で料理するイメージ)
  • オープンソース: 中身が公開されていて、誰でも無料で使ったり改良したりできる仕組みのこと。(みんなで育てる無料の道具箱のようなもの)

Me-Moon編集後記 🌙

文字だけだと素っ気なく見えそうで、メッセージについ絵文字を足してしまう。そんな経験のある方は多いと思います。同じ絵文字ひとつで、AIの声の表情まで変わるというのは、素直に面白いです。

便利な一方で、誰かの声をそっくりまねできてしまうぶん、悪い使われ方をしないか少し心配にもなります。それでも、自分の言葉に好きな声と気持ちを乗せられる時間は、やっぱりわくわくしますね🌙

参考リンク

この掲載情報は各取得情報によって提供されています。

※内容の真偽や広告内容についてはご自身でご判断ください。

監修者

小宮 滉

コインチェック株式会社を経て、現在はGUILD株式会社および一般社団法人Web3人材マネジメント協会の代表理事を務める。

Web3・仮想通貨分野では、「NGG(NinjaGuild_Japan)」というコミュニティの運営や、「IVS Crypto THE DEMODAY」MetaMeトラックでの優勝など、多くの実績を有する。

また、AI・ブロックチェーン開発を強みとしたDXサービスを提供し、企業の成長を支援します。AI・ブロックチェーン技術との統合を通じて、DX体験をシームレスに実現し、ユーザーと企業の双方に新たな価値を創出することを目指して、開発支援やマーケティングを行っております。

X (Twitter) →

一緒に記事を書いてみませんか?✍️

ライター登録はこちら →