最近のAI技術を使うことで、曲を作成したり、作詞ができたり、簡単に動画の編集ができることは別の記事でもご紹介いたしました。
でも、最近、YouTubeでも音声ディープフェイクを使ったコンテンツも上がっています。たとえば、人気ラッパーDrake(ドレイク)の音声を使ったAI生成楽曲や、1991年に亡くなったFreddy Mercury(フレディ・マーキュリー)の音声を使ったものなどです。実現できないことをAIの技術を使って実現させます。このような合成音声の使い方であれば人生を楽しむことができます。
この記事では、ディープフェイクと呼ばれる技術を使った「合成音声」ができるツールと作成方法をご紹介いたします。
- 目次
- ディープフェイク音声とは?
- ディープフェイク音声のやり方とツール紹介!有名人の声も模倣可能
- ディープフェイク音声作成際の注意事項
- ディープフェイク音声を騙さないように
ディープフェイク音声とは?
まず「ディープフェイク音声って何?」と思われる方が多いでしょう。ディープフェイク音声またはディープフェイクボイスは英語で「Deepfake Audio」と呼ばれており、深層学習技術を用いて生成される偽音声のことを示します。この深層学習技術の原則を応用することで、特定の話者の声質や話し方を学習し、その声を模倣して音声を生成するのが特徴です。
この合成音声の使い道はさまざまです。たとえば、カーナビゲーションの音声案内や音声アシスタントの声設定などに用いられております。しかし、この技術を悪用するケースもあることを知っておきましょう。他人の声を模倣して、日本の「オレオレ詐欺」のような詐欺行為を働くための使い方も考えられます。
ディープフェイク音声のやり方とツール紹介!有名人の声も模倣可能
それではここから実際に「ディープフェイクボイス」を使った合成音声が作れるツールをご紹介していきます。今回ご紹介するツールでは、有名人の声も模倣することができますよ。
今回は以下3つのツールを簡単にご紹介します。
新しい次元の声体験!-Vidnoz AIボイスチェンジャー
Vidnoz Aiが誇る最新の製品、AIボイスチェンジャーは、言語の垣根を越え、驚くべき音声変換の体験を提供します。この革新的なテクノロジーは、100⁺言語に対応しており、ユーザーが自由自在に異なる言語でコミュニケーションを楽しむことを可能にします。
そして、Vidnoz Aiボイスチェンジャーサイトは、有名人の声を含む多彩な音声オプションを提供し、ユーザーにその魅力的な声を体験させます。会話やオーディオメッセージを送る際に、お気に入りの有名人の声に変換してみませんか?
製品の魅力はそれだけではありません。AIボイスチェンジャーは、ユーザーが独自の音声をカスタマイズすることも可能です。個性を表現し、独自のスタイルを作り上げるために、さまざまな調整オプションが提供されています。
では、この音声の作成方法を解説します。
1.Vidnoz Aiボイスチェンジャーサイトにアクセスし、会員登録をします。
2.音声キャラクターを選択、喋らせたい内容を入力し、喋らせる言語を忘れずに、「今すぐ音声を変換」をクリックします。
3.音声が生成されました。ダウンロード上限回数はなくて、自由にダウンロードしたり、友達と共有することができます。
メリット
- 有名人の音声サンプル選択自由
- 音声が100⁺言語を対応
- 操作が簡単
- 制限一切なし
- 生成された音声は様々な場面にも対応可能
AIで有名人やその他の人の声を変換する- 無料
有名人の声を無料ですぐに真似できます。
任意のAI音声を変換し、無料でダウンロードできます。
140以上の言語の音声を自動生成できます。
AIボイスチェンジャー
FakeYou
「FakeYou」はなんといっても本ツールの醍醐味は多彩な合成音声です。2023年9月の執筆時点では、1617もの種類が使えるようになっています。本サービスは随時アップデートをしておりますので、今後も数が増えていくことが期待されます。
AIツールを使ったサービスは3つあります。テキストを指定した音声で読み上げたり、ある音声の声を別の声に変えたり、動画に登場する人物の唇の動きをアジャストしたりできます。今回は「音声を別の声に変える」サービスを利用してみたいと思います。ツールの使い方は次の章でご説明します。
メリット:
デメリット:
-
無料プランは変換までの待ち時間が長い
-
ロボット感がある
FakeYouの料金プランは3つあります。メールアドレスを登録することで無料でも利用できますが、上述の通り、処理の優先度が低く待ち時間が長いです。
プラン名
|
プラス
|
プロ
|
エリート
|
月額
|
7ドル
|
15ドル
|
25ドル
|
処理の優先度
|
通常
|
速い
|
速い
|
テキストの読み上げ
|
30秒まで
|
60秒まで
|
120秒まで
|
音声から音声の変換
|
4分まで
|
5分まで
|
無制限
|
wav2lip(*1)
|
1分まで
|
2分まで
|
2分まで
|
*1:wav2lipは、ビデオに映る人物の唇の動きを、ターゲットの音声に一致させるlip-syncing技術のこと。
Celebrity Voice Changer
次に「Celebrity Voice Changer(セレブリティ・ボイス・チェンジャー)」をご紹介いたします。本ツールの特徴はスマホ専用であることです。スマホのアプリ(Android / iOS)に対応しているので、スマホで音声を録音し、その場でディープフェイクボイスチェンジができてしまいます。ツールの名前からも想像いただけるようにトランプ元米大統領のようなセレブの音声も使えます。
料金は毎週800円と少し高額にも感じます。3日間の無料トライアルがあるので、一度使ってみて必要であれば継続すると良いでしょう。あまり使う機会がないなと思う方は無料トライアル期間中の購読キャンセル手続きをお忘れなく。
メリット:
デメリット:
-
ブラウザ上で使えない
-
ロボット感がある
-
無料トライアルがない
CoeFont
最後に「CoeFont(コエフォント)」をご紹介します。日本人開発者のサービスであるため、日本人の音声が多く登録されています。無料で実業家ひろゆきさんの音声が使えるので、ぜひ使ってみてください。そのクオリティにちょっと驚きますよ。
個人利用向け料金プランは「フリー」と「スタンダード」の2種類があります。
プラン
|
フリー
|
スタンダード
|
料金
|
無料
|
4,000円〜(*1)
|
利用可能な音声の種類
|
数種類
|
5,000種類以上
|
作品数
|
1つ
|
無制限
|
クレジット表記の義務
|
あり
|
なし
|
商用利用
|
不可
|
可
|
*1:年間一括払いにすることで、ひと月あたり税抜3,000円。30日間の無料トライアルあり。
メリット:
-
公式サイトが日本語に対応している
-
変換された音声がリアルに近い
-
音声の変換速度が速い
-
英語や中国語の音声も使える
-
30日間無料で使える
-
音声のタグ検索ができる
-
音声のサンプルが確認できる
デメリット
ディープフェイクボイスを作成する方法
それではここでは「FakeYou」の使い方をご紹介します。3つあるサービスの中で、今回は「Voice to Voice(音声から音声への変換)」を選びました。使い方は以下の通りです。本サービスを使う前にユーザー登録しておきましょう。
ステップ1:Choose Target Voice(音声を選択)からご自身の好きな音声を選ぶ。今回はアメリカの有名シンガーChris Brown(クリス・ブラウン)にしてみました。
ステップ2:Microphone(マイク)を選択し、Start Recording(録音開始)をクリックしましょう。録音が開始されるので発声してみてください。録音が開始すると、Start Recordingが「Stop Recording」に変わるので、録音が終わったら忘れずにクリックしてください。
ステップ3: 録音した音声を確認して「Upload Audio(音声をアップロード)」をクリックしましょう。
ステップ4:アップロードが完了したら、「Convert(変換)」をクリックします。
ステップ6:変換が終わるまで気長に待ちます。待ち時間を短縮するためには「メンバーシップに加入すること」を推奨しています。
ステップ7:変換が完了したら、「Download File(ファイルをダウンロード)」をクリックします。
手順は以上となります。今回のクリス・ブラウンの仕上がりは正直いまいちでした。この後、アメリカ人ラッパーの50cent(50セント)で試してみましたが、こちらのクオリティは高かったです。ぜひ、いろんな著名人の音声でボイスチェンジを試してみてください。
ディープフェイク音声作成際の注意事項
ここまでディープフェイクを使った音声合成ツールと、その合成方法をご紹介してきました。このように簡単に有名人の音声を作成できるなら、誰しもが自分の好きな有名人の声でオリジナルフレーズを発声させてみたいと思うことでしょう。
でも、ディープフェイク音声を作成する際、悪用に注意しなければなりません。
前に述べた通りです。音声ディープフェイク技術の発展と共に、「オレオレ詐欺」型などの音声ディープフェイクを利用する詐欺です。読者の皆さまは違法な行動に走らないよう、また、そういった詐欺行為に引っかからないよう注意しましょう。
ディープフェイク音声を騙さないように
前の章でもお伝えした通り、ディープフェイク音声を悪用するケースがあります。今後の社会では、こういった違法行為を撲滅するための施策に取り組んでいく必要があります。法規制の整備などでAIによる合成音声および、その利用について制限されていくでしょう。
法規制の整備に期待するのではなく、個々人が詐欺行為に引っかからないよう注意しなければなりません。この世の中にあなたの声を真似できてしまう技術がすでに存在しています。この事実を鑑みて、自ら詐欺行為の対策を講じましょう。たとえば、家族内で暗証番号やキーワードを決めておき、オレオレ詐欺の疑いがある場合は確認すると良いでしょう。
この記事ではディープフェイク音声に関する情報をご提供いたしましたが、いかがでしたでしょうか? 新しいAI技術の可能性と危険性の両方を把握した上で、ご自身のコンテンツ作りに生かしていただけると嬉しいです!