弊誌はアフィリエイト広告を利用しています。

メチャクチャ唐突!Gemini 2.0 Flash登場

 Googleは、同社が提供するLLMであるGeminiの最新バージョンである「Gemini 2.0 Flash」を突如公開し、試験運用版としてGeminiアプリやWebから利用できるようにしました。

 現行の最新バージョンであるGemini 1.5 Flash/Proは今年の2月に登場したモデルであり、今年の9月末ごろのGemini 1.5 Flash/Pro 002や数多の試験運用版により、幾度となくアップデートを実施して性能を大きく向上させてきました。

 数日前にも、LLMとしての性能を競うChatbot Arenaにおいてo1-previewやChatGPT最新モデルを抑えて1位を獲得した「Gemini-Exp-1206」を発表するなど、かなり頑張っている印象です。

 Gemini 2.0 Flashの特徴を簡単に説明すると、高性能なGemini 1.5 Proより高い性能を発揮しながら、同モデルの2倍の応答速度を実現するとのこと。正直応答速度はFlash同士で比較してほしいところではありますが、実際に試したところ応答速度はGemini 1.5 Flashに遜色ありませんでした。

 空間理解能力が向上しているのも特徴で、画像に対してそのどこの部分がどういうオブジェクトであるかという画像認識も行えます。さらに、多言語のネイティブオーディオ出力や画像出力に対応。APIを利用する開発者が、簡単にAIエージェントと会話したり画像を生成するアプリケーションを開発することができます。

 最後に、未来を感じさせるMultimodal Live APIの紹介を。これは以前のGoogle I/Oなどで紹介されていたような機能で、テキストは当然として音声と映像入力を使用し、リアルタイムで音声とテキスト出力を行えるもの。つまりビデオ通話のようにGeminiに問いかけることができる上に、Geminiも音声で返してくれるということです。

 Gemini 2.0 FlashはGeminiアプリやWeb、またはGoogle AI Studioから使用できます。また、Gemini Advanced加入者はGemini 1.5 Pro with Deep ResearchがGeminiアプリ・Webより利用可能ですが、こちらは英語のみサポートしています。

 現在、OpenAIは12日連続で何らかの発表を行うという、競合他社にとって悪夢のような少し早いクリスマスプレゼントを贈っているのですが、Googleもこれに負けじと矢継ぎ早に生成AI関連技術を発表しており、温めていたモデルを試験運用版として出してきた可能性はありそうです。

すまほん!!を購読しませんか?

Twitterでも最新更新を配信・通知しています

フォローする 再度表示しない