弊誌はアフィリエイト広告を利用しています。

OpenAI、新型生成AI「GPT-4o」を発表

 米OpenAIは5月13日(現地時間)、新たな生成AI「GPT-4o」を発表しました。

 「o」は「全て」を意味するラテン語「オムニ」から来ており、その名の通り、同モデルはテキスト・音声・画像全ての組み合わせを受け入れ&出力することが可能な、マルチモーダルな生成AIモデルとなっています。

 発表会で行われたOpenAIによるデモでは、相手の表情を読み取ったり、会話中に冗談を挟んだりと人間らしく会話をする様子や、数式の画像から解法を提示する様子が披露され、GPT-4と比較して、音声・画像認識能力が著しく向上していることが伺えます。

 また、テキスト処理の面では、複数のベンチマークにおいてGPT-4 Turboと同等のスコアを打ち出しており、GoogleのGeminiやMetaのLlamaといった競合他社モデルを凌駕する性能であることが確認できます。

 加えて、生成速度も大幅に向上。平均応答時間は320ミリ秒、音声入力においては232ミリ秒と、人間とほぼ同じ速度での応答が可能であるとOpenAIは主張。デモでは、同モデルがこの速さを活かして同時通訳をしてみせる場面もありました。

 GPT-4oは発表同日より、字数制限付きで無償利用が可能です。制限付きとはいえ、無料で使えるのは嬉しいですね。会話モードはまだ実装されていませんが、数週間以内にPlusユーザー向けにアルファ版が配信される予定です。

情報元OpenAI
詳しく読む
すまほん!!を購読しませんか?

Twitterでも最新更新を配信・通知しています

フォローする 再度表示しない