
スマートTVが密かにWebを巡回?
Webデータ収集企業のBright Dataが、SamsungやLGのスマートTVアプリを足がかりに、AI訓練用の公開Webデータを収集する仕組みをストリーミングサービス事業者に提案していることが分かりました。テクノロジー・エンタメ分野のニュースレター「Lowpass」を運営するJanko Roettgers氏が伝え、The Vergeが詳報を掲載しています。
具体的には、SamsungのTizenやLGのwebOS向けストリーミングアプリにBright SDKを組み込む手法です。アプリをインストールした利用者に対し、初回起動時などにオプトイン画面を表示し、同意した端末をプロキシネットワークの一部として稼働させる仕組みだといいます。利用者が改めてオプトアウトするか、アプリをアンインストールしない限り、端末はWebデータの取得に関与し続けるとのことです。
オプトイン画面の文面例は、端末の「空きリソース」と世帯のIPアドレスを使って公開Webデータをダウンロードする旨を記していました。Bright Dataは帯域や処理能力に影響しない範囲で動かすとしており、1台あたりのデータ量は1日およそ50MB程度だと説明しています。ただ、利用者がSDKの動作状況をリアルタイムに把握する手段は乏しく、OSや権限の条件次第ではアプリが前面にない状態でもバックグラウンドで動き得るのだとか。
Bright DataはPCやモバイル端末なども含む住宅用プロキシネットワークを世界で約1億5000万規模で運用していると主張しています。こうしたネットワーク経由で集めた公開Webデータはペタバイト級に達し、AIモデルの訓練などの用途で企業に再販売することもあるのだそうです。
「住宅用プロキシネットワーク」とは、一般家庭のネット回線を中継地点として借り受け、企業がそこを経由してWebにアクセスする仕組みのことです。普通の家庭回線を通るため、アクセス先からはごく普通の個人ユーザーに見えるのがミソ。大規模なWebデータ収集などに使われますが、回線を貸す側が知らないうちに組み込まれていると問題になります。
同社は過去にRoku、Android TV、Fire TV向けのアプリ開発者にも同様の仕組みを提案していましたが、広報担当者によると現在はそれらを「サポートしていない」とのことです。背景として、Googleは開発者向けにプロキシサービスを「アプリの主要なユーザー向け機能」である場合に限ると案内しています。Amazonも開発者ポリシーで第三者向けプロキシを促進するアプリを禁じており、Rokuも同種のプロキシ利用を制限しているそうです。
一方、同社はTizenとwebOSを対応プラットフォームとして挙げており、LGのアプリストアにはBright Dataが公開したアプリが200本以上あるとも伝わっています。ただし、ストアへの掲載がそのままWebデータ取得の証拠になるわけではありません。
プライバシーの観点では、利用者の知らないうちに家庭の回線やIPアドレスを経由して第三者の通信が走り得る点や、動作の透明性が低い点が気がかりです。EFFは過去にスマートTVの音声機能やプライバシーポリシーの問題を取り上げており、スマートTVにまつわるプライバシーリスクの延長線上で今回の提案を不安視する声も出てきそうです。
メーカー側の対応について、Samsungは複数回の問い合わせに回答しなかったとのことです。LGはBright SDKについて「LGとして正式にサポートしておらず、webOS上での動作は保証されない」とコメントしています。


















