Amazonは、音声アシスタント「Alexa(アレクサ)」の音声認識技術を強化するため、Echoデバイスへの会話を録音し、それを人力で解析していたことがわかりました。
これはBloombergが、Alexaのプロジェクトで働いている従業員を情報源として報じたもの。
AmazonのスマートスピーカーEchoシリーズは、呼びかけをきっかけに会話を録音し、Amazonのサーバーへと送信。人間の発話に対するAlexaの理解のギャップを埋めるため、人員がフィードバックしているとのこと。Alexaのトレーニングを人間が行っているというわけですね。
人員の数は世界中に数千人。このプログラムを公に話すことを禁止する秘密保持契約を結んでいるといいます。この秘密保持契約に署名した人によれば、このチームはボストンからコスタリカ、インド、ルーマニアといった拠点で働く請負業者とフルタイムのAmazon従業員らで構成。各レビュアーが1シフトにつき最大1000オーディオクリップを解析しながら1日9時間勤務。
個人情報を聞いてしまった場合は、音声クリップに重要なデータであるとマークして次の音声クリップの解析に進むのだそうです。中には性的暴行の犯罪現場の音声と思われる録音を聞き、心が動揺した従業員も2人いるそうです。Amazonはそうした音声に遭遇した場合の対処法を構築したと伝えられているものの、実際はAmazonが行動を起こす責任はないと言われたとのことです。
レビュープロセスで生身の人間によって音声認識と自然言語理解のトレーニングが捗るのはわかりますが、そうした事実は案外知られていないかもしれませんね。ちなみにSiriも改善のために人間によるレビュープロセスを採用しています。
そして裏方の生身の人間が不適切な音声を聞いてしまう場合もありえるのだということに思いを馳せる必要はあるのかもしれません。