OpenAI、リアルタイムの音声・視覚・テキスト推論を実現するアップデートを発表

By PANews – 2024/10/02 20:39:34 (JST)

OpenAIは、AIモデルに関する重要なアップデートを発表し、リアルタイムの音声、視覚、テキスト推論の能力を強化しました。リアルタイムAPIの導入により、開発者はAI生成の音声を通じて自然な会話を促進するアプリケーションを作成できるようになり、レイテンシを削減し、複数のモデルを必要としなくなります。この進展は、音声アシスタントに似たシームレスなユーザー体験を提供することを目指しています。

リアルタイムAPIに加えて、OpenAIはAIが画像を理解し処理する能力を向上させる画像ファインチューニングツールを導入しました。これにより、視覚検索や物体検出が強化されます。開発者は人間のフィードバックを取り入れることでAI生成の応答を洗練させ、より正確で関連性の高い出力を得ることができます。

その他の注目すべきアップデートには、「モデル蒸留」と「プロンプトキャッシング」が含まれ、これにより小さなモデルが大きなモデルから学ぶことができ、最終的には開発コストと時間を削減します。OpenAIの財務見通しは明るく、2025年までに予想される収益は$11.6 billionに達し、2024年の$3.7 billionから大幅に増加する見込みです。

※これは引用元記事をもとにAIが書いた要約です (画像の権利は引用元記事に記載のクレジットに帰属します)

(β版: 記事が長い場合は動かない可能性があります)

類似記事

Share on: