「ChatGPTがついに声で会話！？高度な音声モードが一部ユーザー向けに解禁！」

OpenAI、ChatGPTに高度な音声モードを導入、一部ユーザーに提供開始

OpenAIは、新たに「ChatGPT」で高度なVoice Mode（音声モード）のα版を一部の「ChatGPT Plus」（月額20ドル）ユーザー向けに提供開始しました。この新機能は、今秋までにはすべてのChatGPT Plusユーザーが利用できるようになる予定です。

この高度な音声モードでは、より自然でリアルタイムな会話が可能となり、話し手の感情を感知して反応する新機能も搭載されています。トーンや複数の話者、背景ノイズなどを認識しながら、あたかも人と対話しているかのように応答します。5月に行われた発表時には、この機能による自然な会話のデモンストレーションが披露されました。

使用されるAIモデルは「GPT-4o」であり、高度な音声機能は45の言語で100人以上の外部チームによってテストされています。プライバシー保護のため、モデルは4つのプリセット音声のみでトレーニングされており、それ以外の出力はブロックされます。また、暴力的な表現や著作権保護されたコンテンツへのリクエストを防ぐガードレールも実装されています。

α版ユーザーには手順を記載したメールとアプリ内メッセージが送信され、順次ユーザー拡大が進められています。また、ビデオと画面共有機能については後日リリース予定です。

OpenAIの公式Twitterでも、この新しい高度なVoice Modeについて告知されています。「我々は、高度なVoice Modeを小規模グループのChatGPT Plusユーザーに提供開始しました。このモードではより自然でリアルタイムな会話が可能になり、いつでも中断できるほか、感情も感知して反応します。」

最新技術によってさらに進化するChatGPTから目が離せません。

Source link