弊誌はアフィリエイト広告を利用しています。

これ結構便利じゃない?Gemini、もうすぐPDFをネタにラジオ感覚で聴ける機能をスマホにも導入か

 Googleは競合を突き放す資源と開発リソースを注ぎ、生成AI関連の機能を続々と開発しています。その中の一つに、NotebookLMというサイトで利用できる「Audio Overview」がありますが、これがスマホ版Geminiで利用できるようになるかもしれないようです。Android Authorityが伝えています。

 まずはNotebookLMについての簡単な説明を。Geminiをはじめとした大規模言語モデル(LLM)は構造上、ユーザーの質問に対して見当違いな回答、存在しない回答(ハルシネーション)を行ってしまうことがあります。NotebookLMはこのAIの弱点を緩和し使いやすくしたサービスで、ユーザーがあらかじめ与えておいた資料にのみ基づいてAIが回答するシステムとなっています。AIの回答の重要な箇所にはソースが提示されており、情報源の確認も容易になっています。

 そんなNotebookLMで9月ごろから利用できるようになったのが、音声生成機能のAudio Overview。名前の通りの機能で、NotebookLMに与えられたソースをもとに、2人の人物がその情報を要約しつつ解説していくものとなっており、ユーザーはラジオやポッドキャスト感覚で聴くことができます。

 読み上げ音声は非常に感情豊かでしっかり聞き取りやすいものとなっており、料理や家事、運転時など目や手が離せない際などにとても魅力的な機能です。Audio Overviewで生成された音声のサンプルはここから再生できます。

 そんなAudio Overviewですが、どうやらスマホ版Geminiでも利用できるようになるようです。Android Authorityがベータ版のGoogleアプリを分析したところ、一部に「Generate audio overview」といった文字列が見つかったようです。

 このベータ版Geminiアプリでは、ユーザーがPDFなど適切なドキュメントを送信した際に、Geminiがオーディオによる概要のオプションを提案するところまで動作しているようで、実際に音声の概要を処理する部分までは実装されていないとのこと。

 なお、Googleは比較的日本語での各種AI機能も早めに対応してくるイメージではありますが、音声による概要は現時点で英語のみのサポートとなっています。迅速な対応に期待したいところです。

詳しく読む
すまほん!!を購読しませんか?

Twitterでも最新更新を配信・通知しています

フォローする 再度表示しない