「bokete camera」
入力した画像を題材に、AI(人工知能)技術で「ボケ」を返すツール。ユーザー投稿型の大喜利サイト「写真で一言ボケて(bokete)」(開発・運営=オモロキ社)に蓄積されたデータを活用している。2021年9月には、アマゾン ウェブ サービス 主催イベントで、「bokete camera」をベースとした大喜利イベント「ボケて電笑戦」を開催し、参加各社が「AIはどこまで人間を笑わせられるか?」を競い合った。
――AIが写真を題材にボケる「bokete camera」を通じて、どんなことがわかりましたか。
石川 電通デジタル アドバンストクリエーティブセンター(ACRC)はAIに注力しているのですが、「bokete camera」はAIとクリエイティビティが共存したものができたのではないかと思っています。
三浦 「ボケ」と「クリエイティビティ」には似た部分があるというか。
テレビCMだけに限りませんが、広告は表現のとっかかりとして、さまざまな切り口を設けますよね。実際、プランナーの方が商品など広告の題材を多角的に観察する姿を見たことがあります。
「あっ その言い方があったか」という読後感をもたらすという部分においては、似ているのではないかと。
ボケについては鎌田さんに話してもらったほうがいいですね。
鎌田 ボケって、第一に「まちがい」なんですよ。
たとえば、いまここに「犬の写真」があるとします。お題は「この犬はなんて言っているでしょう?」。なんて答えます?
(一同、数秒考える)
鎌田 にゃーん。
三浦、石川 あー、なるほど。
鎌田 この答えが面白いかどうかは別の問題なので、それはちょっと置いておきましょうよ。
三浦、石川 (笑)
鎌田 「ワン!」だったら「正解」じゃないですか。「この犬はなんて言っているでしょう?」「ワン!」。これだと大喜利ではなく、クイズになります。
僕たちは子どもの頃から――大人になっても、ですけど、クイズに答える訓練を非常にしますよね。学校の勉強もそうですし、仕事もある意味ではそうかもしれません。
一方、「まちがえる」ことについては、多くの人がそういったトレーニングを受けていない。だからこそ、ボケられる人は決して多くないわけですね。
さらに、もうひとつ大事なところがあって。
石川 なんですか?
鎌田 いま「この犬はなんて言っているでしょう?」というお題を設けましたが、「写真で一言」って、実はお題から考える必要があります。写真を見て、自分でお題を考えて、ボケる、という構造。作問能力が問われるんです。
三浦 広告でも、クライアントから課題を提示されますが、あえて課題から考えてみたり、そもそも課題設定からかかわったり、ということがありますね。
石川 「何をするか」など企画自体、作問の性質が強いかもしれない。
鎌田 そのためだと思いますが、広告会社には、ボケるのが上手な方が多いのではないかと。
――AIは「ボケ」を進化させられるでしょうか。
鎌田 「bokete camera」を見るかぎり、人間とは違うボケをしてきます。たしか、「お花畑の写真」に対して、「久しぶりに借りた」ってボケを返してきたんです。「あ、これは人間が出せないボケだ」って思いました。
――人間には出せない、というと。
鎌田 人間だと、もう少し文脈や連想に寄るんだと思います。「█████の頭の中」とか。
三浦 自分は電車の写真を入れて出てきた、「車検の代車がこれ」というのがよかったです。どうやら無機物の写真を入れると、AIは面白い答えを出してくる印象でした。
――それは、「bokete camera」の仕組みとしてそうなっているんですか。
石川 システムのことを言うと、2つのAIを使っています。ひとつは、入力された写真が何かを認識するAI。もうひとつは、文章生成のAIです。
先ほど、「ボケはまちがえること」という話が出ましたが、AIによる画像認識では、ちょっと大雑把に言うと、いくつかの可能性を示すようになっているんです。
たとえば、「机に裏返しで置かれたスマホの写真」を認識させると、スマホである確率が70%、名刺入れ10%、すずりが5%、ようかん3%……などと認識します。数字は仮ですけど。
「bokete camera」は、これを踏まえて文章を生成するので、人間だと無意識に捨てるような選択肢――いわば「まちがい」から、人間には思いつきづらいボケを出せるんだと思います。被写体が何であろうとフラットにボケられる。
三浦 人間だとスマホを見たら、スマホ以外のものとは認識しないですからね。
石川 そうなんです。AIなら犬の写真を見せても、猫という認識をすることはあるので、犬の写真を入力した場合、「にゃーん」とボケてくる可能性はあります。
――先ほど、面白いかどうかは別の問題、というお話もありました。
鎌田 ボケられなくても、面白いかどうかはわかりますよね。そして、面白いかどうかは、見た人、聞いた人が判断すること。
三浦 ただ間違えればいいわけではないですもんね。広告でも、ありきたりな表現ではつまらなくて見てもらえないですが、かといって奇をてらったり、ひねりすぎたりすると全然伝わらない。
鎌田 笑えるズレの範囲は人によって違います。人間は、それを意識的にか、無意識的にか、調整して、コミュニケーションしているはずなんです。
三浦 本当にそうだと思います。笑いのツボって、性別や年齢、よく買う飲み物といった表出するデータと、無関係ではないにせよ、それだけではわからない。広告で言うならインサイトですが、「何が面白いか」という心の動きを探るのは、人間にしかできなさそうです。
……けど、どうなんでしょう?
石川 AIでもできるかもしれないです。実は。
「面白い」や「きれい」という感覚を学習させること自体は可能です。個人的に、アートディレクターの方に、いい写真と悪い写真、いいと思うバナーとよくないと思うバナーを振り分けてもらって、それをAIに学習させたことがあります。すると結構な精度で、その人がどう判定するかを予測できるAIが作れたんです。
みんなが面白いと感じるかを予測するAIも、データ次第で作れるかもしれません。ボケをセレクトできるところまでたどり着ける可能性もあるのではないかと思います。
――「bokete camera」は今後も続くプロジェクトなんでしょうか。
三浦 続けていきたいと考えています。そもそもどういう発端だったかというと、ゲームアプリのSNSプロモーションで、「ボケるbotを作ろう」と考えたのが始まりだったんです。
試作のために石川さんに相談したところ、「AIがボケるためには、ボケの学習データが必要」とのことでした。そこで、「『ボケて』しかない」と思い、オモロキさんの問い合わせフォームから連絡して鎌田さんに許可をいただいて。
石川 もし万が一、人を傷つけるようなボケを出力してしまったり、悪印象を与えてしまったりするとよくないので、プロモーション企画としては実現しなかったんです、しかし、せっかくデータ提供もいただいたので、ブラッシュアップを続けて、完成したのが「bokete camera」です。
AIは広告の文脈でいうと、バナー画像の最適化だったり、効果予測だったりと、とりわけ実利のために活用されることがほとんどなんですね。
一方、人間が見て面白い「ボケ」を出させることもできますし、AWSさんが、企業のAI活用を推進していることもあってご縁をいただき、「電笑戦」で「bokete camera」を実際に使ってくださる方々とも出会えて……と、とても波が広がっている感覚があります。
三浦 業務の傍ら、こうしたプロジェクトに携われるという環境は本当にありがたいです。
鎌田 お二人はとても仲が良さそうに見えますし、一緒にいていやな感じにならないというか、いい人。こういうプロジェクトでは実はそうした点も大事です。「bokete camera」も浅く長く続けていってほしいと思います。
三浦 「笑いを育てるツールを通じて、人を笑わせること自体に興味を持ってもらえる」。それが「bokete camera」のいいところ。
なにより、「テクノロジーでこういうことができる」ということ自体が、個人的には大きな発見でした。AIでクリエイティビティを進化させる余地は、まだまだ残されているのではないかと感じます。
お問い合わせ
株式会社電通デジタル
URL:https://www.dentsudigital.co.jp/
各種お問い合わせhttps://www.dentsudigital.co.jp/contact/