【前回記事】「ローカルテレビ局はどう生き残るのか?地元に密着する岡山放送に新しいカタチを見た」はこちら
テレビメタデータとは何か
「メタデータ」という言葉を耳にしたこと、ありますか?「メタ」とは「上位の」とか「間の」とかいう意味で、例えば「メタフィクション」というと物語の中に物語があったり、物語の中に作者が登場したりすることを言います。だから「メタデータ」とは、「データの上位概念的なデータ」とか、「データの間にあるデータ」とか、そんな意味になるでしょう。
テレビの世界でも「テレビメタデータ」と呼ばれる概念が登場しています。テレビ放送や番組に関するあらゆるデータの集合体で、番組の時間や出演者だけでなく、その概要や登場したすべての要素をまとめたもの。例えば1時間の情報番組の中には様々な話題が登場し多彩な人物が出てきてしゃべり、ものすごい量の情報が詰まっています。それをすべて網羅しようというのがテレビメタです。
このテレビメタを生成して提供する会社の雄が、エム・データという会社です。あらかじめ断っておくと私はこの会社の“顧問研究員”といういささか偉そうな肩書きを授かっています。顧問といってもあれやこれやをお手伝いしているのですが、要するに関係者なんです。なんだ内輪話かよ、と言われるともともこもないのですが、この連載にふさわしい、「ビデオコミュニケーションの21世紀」に間違いなく登場する重要なプレイヤーなので、ここで紹介したいと思います。
テレビメタとは、先述の通り放送された番組のあらゆる要素をテキスト化したものです。何日何時からの何という番組で何分から何分までこの話題を扱い、その内容はこれこれこんなことでした。そんなテキストを次から次に生成するのがエム・データ社の仕事です。それは例えばこんな感じ。ニュースであれ、情報番組であれ、どんな内容かが記録されています。CMでさえテキスト化されデータとなるのです。
「生成」と書くとプログラムで自動的に生み出されるみたいですが、エム・データ社のやり方は、なんと人力です!聞くところでは某巨大検索会社がプログラム化しようとしてできなかったとか。複雑でどんどん送り出される放送番組をデータ化するには人力しかない、ということのようです。エム・データ社の本社機能は虎ノ門にありますが、データ生成作業は水戸にあるデータセンターで行われています。デスクにパソコンがずらりと並び、数十名の人たちがテレビ番組を見ながらひたすら文字入力をしています。
その様子を見てください。作業ごと、チャンネルごとにチームが組まれて入力されています。実際に見ると壮観です。
個々の作業を間近で見るとさらに圧倒されます。番組の画面と音声から繰り出される情報を次から次にテキスト化していく。耳で聞いた言葉を漢字にもするわけで、けっこう知識が求められる作業です。政治討論では政治家や小難しい法案名もすぐに漢字にしなければならない。芸能情報では新しいタレントやヒット曲の名前などもあらかじめ知っておかねばなりません。単純作業に見えて、実は高度に知的な作業なのです。実際、入力作業を実際に行うまで半年間は研修が必要で、分野別に専門が分かれたりもします。