同じ画質のまま容量は最大3分の1。
画像ファイル、もっと小さくならないかなぁ……と思いながら容量と格闘してきた人に朗報です。Appleの研究チームが、機械学習を使った新しい画像圧縮コーデック「PICO(Perceptual Image Codec)」を公開しました。論文とプロジェクトページ、GitHubで同時に公開されたもので、現時点では製品機能ではなく研究発表という位置づけです。ひとことで言えば「見た目の品質を保ちながら、ファイルサイズをかなり削る」ことを狙った技術なんです。
どれくらい削れるのか、が本題ですよね。Appleの説明によると、AV1、AV2、VVC、ECM、JPEG-AIといった従来・次世代・学習型を含む比較対象に対して2.3〜3倍のビットレート節約を実現したとのこと。つまり同じ知覚品質として評価される画像を、およそ1/2.3〜1/3のデータ量で表現できる、という意味です。さらに、既存の強力な学習型コーデック代替と比べても20〜40%のビットレート節約になるといいます。条件つきではありますが、なかなかの数字ですよ。
PICOの肝は「人間の目にどう見えるか」を強く意識した点にあります。従来の圧縮評価では、元画像との数値的な近さをどれだけ保てるかが重視される場面も多くありました。しかしPICOはそこを変えて、実際に人がどう「きれいに見えるか」を基準に学習や評価を組み合わせているんです。平たく言えば、数式の上で近い絵だけでなく、人間の目に自然な絵を優先するということ。おかげで細かいテクスチャを保ちつつ、小さな文字の崩れやタイル境界の色ズレといった不自然なアーティファクトも抑えようとしているのだとか。
処理速度も実機で測ってあります。論文では、iPhone 17 Pro Max上で1200万画素の画像をエンドツーエンドでエンコード最短約230ミリ秒、デコード150ミリ秒で処理できたとのこと。これは、V100 GPUで動く多くの上位MLベースコーデックより速い水準だといいます。クラウドに投げず、研究上の実装でスマホ上のオンデバイス処理を示しているのは、地味に効いてきますね。
もちろん万能ではありません。極端に単純なカートゥーン風の合成画像では、従来方式より逆にビットレートを食う場合があるそうです。また、HEICのように端末側で長年最適化されてきた方式と比べると、処理そのものはまだ遅い面もあります。そのあたりは研究発表らしく正直に書いてあるのが、好印象でした。
気になる実用化ですが、Appleは製品やOSへの搭載時期を明かしていません。現時点ではあくまで研究段階です。とはいえ写真をしこたま撮るiPhoneユーザーにとって、ストレージ不足は永遠の悩み。HEICやJPEGの次を担う候補のひとつとして、いつか「設定」の片隅にこっそり現れる日を待ちたいところです。
































