米国のオープンAIは24日、対話型AIサービス「ChatGPT」に新たな音声対話機能を追加することを発表した。これにより、応答速度が大幅に向上し、まるで人間と会話しているかのようにスムーズな対話が可能になるという。また、日本語にも対応している。
ChatGPT新機能「アドバンスドボイスモード」とは
新機能は「アドバンスドボイスモード」という名称で、24日から順次、有料会員向けに提供が開始される。従来の機能では音声応答に3~5秒かかっていたが、新機能では人間とほぼ同じ約0.3秒で応答が可能となる。発音やアクセントがより自然に改善され、感情を込めた表現も可能になった。
この新機能は、日本語や英語を含む50以上の言語に対応しており、9種類の声色からAIの音声を選べる。また、当面は利用回数などに制限が設けられる予定だ。将来的には、スマートフォンのカメラで撮影した文字や文章を理解し、音声で返答する機能も追加される予定である。
この機能は当初5月に発表されたが、AIの音声が米国の女優に似ているという指摘を受け、一部機能が一時停止された。その後、夏から限定的に利用者を対象に試験運用が行われていた。
新機能では、利用者が指示することで声色を自由に変えることができるため、悪用されると詐欺や偽情報の拡散につながるリスクがある。11月に予定されている米国大統領選挙を前に、「ディープフェイク」の拡大につながる可能性も懸念されている。
オープンAIは、AIが実在の人物の声を模倣したり、有名な楽曲を歌って歌手の著作権を侵害するような問題が発生しないよう、徹底的な対策を講じていると強調している。
専門家の反応は?
生成AIのデッドヒートが繰り返されている。ChatGPTの『アドバンスドボイスモード』が2024年9月24日から有料会員向けへ提供された。しかし、筆者を含め、まだまわりで使えた人は少ない。これは時間の問題として、2024年は3ヶ月ごとにAPIトークン料金が半額になったりと技術進化のすごさを物語る年だ。
一方、テクノロジストとそうでない人との間で『生成AI』の理解の幅は大きく深まった。しかし、このような『0.3秒』で応答できるような音声AIの登場は、『スマートスピーカー』などに標準搭載されることによってAIが一気に『民主化』していくことだろう。誰もが、資料作成や企画にAIを活用するだけでなく、話し相手として、普通に『生成AI』とつきあうようになる。そういった意味での『音声』というインタフェースはAIの民主化に拍車をかけるだろう。
「人間のオペレーターと話していると思ったら実はAIだった」なんてことが、今後当たり前になるかもしれません。
AIをサポートチャットなどに導入する動きが加速していますが、音声で「人間並みに」対応できるとなると、チャットだけでなく、電話サポートへのAI導入も増えてきそうです。
オペレーターを代替することで「人間の仕事を奪う」とも言えますが、いわゆる“カスハラ”にあいがちな職種でもあるので、AIへの置き換えは人間を守ることにもつながりそうです。
音声でやり取りできるAdvanced Voice Modeは、月間20ドルの有料プラン「ChatGPT Plus」ユーザーしか利用できない点に注意が必要です。 上記ユーザー向けにChatGPTアプリで今週中に提供が始まります(順次ロールアウトとのこと)。
アプリ経由ということで、移動中や別の作業中など画面に集中できないときの利用が想定されていると思われます。
また、「喋る」ということは語学学習にも向いているでしょう。 近年はAI英会話学習が増えてきましたが、ChatGPT単体でも学習が捗るようになりそうです。
ネットの反応は?
ChatGPTの新機能、結構すごいと思いますよ。特に、画像生成なんかは驚きました。今までテキストだけだったのに、リクエストに応じてイメージを形にできるっていうのは、ちょっとクリエイティブな感じがして面白いです。
あと、会話の内容を覚えてくれる機能もいいですね。前回話したことを覚えてくれるから、また同じ説明をする必要がなくなって、かなり親しみやすく感じます。まるで長い間話してる友達みたいな感じ。自分のペースに合わせて進められるのが嬉しいです。
現行モデルでもかなり自然ですが、今以上となると楽しみですね。
たまに遊びで使ったりもしますが、日本語に関しては「日本語が堪能な欧米人のビジネスマンが話してる日本語」という感じです。
随所に英語っぽい訛りがあって、まぁそれはそれで人間味があって良いのですが… 逆に既存の音声アシスタント(Siriやアレクサ、Googleアシスタント)特有の訛りは無く、訛り方が人間くさいという点はむしろ凄いと見るべきなのか…
これが、日本人が話す日本語、ネイティブな発音や抑揚になってくると、いよいよAIだと分からなくなってきそうです。
編集後記
製品のサポートセンターでAIチャットがありますが、今後電話サポートもAIなんてことになるんでしょうね。
コメント