米グーグルは1月26日、オンライン広告を表示する際の新たな仕組みとして、「Topics API」を発表した。現在、主流の「サードパーティ・クッキー」や「フィンガープリント」よりも個人を識別する情報を大幅に削減でき、インターネット利用者のプライバシーを守れるとした。間もなく開発者向け技術検証を始める。クッキーの代替と目されていたFLoC(コホートの連合学習)は2021年7月で、試験を停止していた。
「Topics API」は、導入・実行するWebサイトに、過去3週間の閲覧履歴から推定したユーザーの興味・関心項目=「トピック」を知らせる。サイト側は取得した「トピック」に基づいて広告を表示することで、より利用者の関心事に沿うことができるという。
「トピック」の推定は、まずWebブラウザーが閲覧履歴に基づいて、1週間ごとに利用者の関心を表す項目を5つ、さらにアトランダムな項目1つの計6つから「トピック候補」を決定。Webサイト側はAPIを通じて、過去3週間それぞれの「トピック候補」から1つずつ、最大3つまで取得できる。ブラウザ設定になどで「トピック」が返されないようにすることもできる。
候補から1つずつ選ぶ仕組み上、同じブラウザーで閲覧していても、Webサイトごとに異なる「トピック」が送られることもある。また、5%の確率で、全く関係のない「トピック」になる。「トピック」から個人を特定しづらくする目的だという。
「トピック」は350項目以下で開始する見込みで、閲覧情報からの推定時には「トピック」とWebサイトのホスト名とを関連付けたデータも用いるようだ。グーグルの説明によると、Webサイトによってはどの「トピック」とも対応しなかったり、1つのサイトが複数の「トピック」に関連付けられることもある。対応状況は公開する予定で、サイト運営者が確認できるツールの開発にも期待を寄せている。
「トピック」は今後、数千規模に拡大する考え。APIの説明文では「『トピック』を介して、性別や人種といったデリケートなカテゴリーを統計的に推論することは可能かもしれず、(この仕組みが)理想的とは言えない。しかし、『クッキー』で提供されていたようなWebサイト間でのユーザー識別子や、URLすべてやコンテンツを含む訪問サイトの情報よりも、判明するユーザー情報はかなり少ないものとなっている」とした。
「トピック」に近いものと考えられる、米インタラクティブ広告協会(IAB)が提唱する「オーディエンス・タクソノミー1.1(閲覧者分類1.1)」は約1680項目ある。