同社のAIツール「ElevenLabs」は料金プランに応じて様々な機能が使用可能。テキスト読み上げ(TEXT TO SPEECH)では、人間のようなAIボイスでコンテンツを読み上げる。ほか、ボイスチェンジャー(SPEECH TO SPEECH)や吹き替えに加え、様々な声を複製できる「ボイスクローン」、効果音を生成する「SFX生成」、バックグラウンドノイズを除去する「ボイスアイソレーター」、そして市場でもっとも高速かつ高精度とされる「音声テキスト変換」なども備えている。
日本を選んだ理由は、同社の技術が貢献できる土壌があると判断したため。映像系コンテンツにとどまらず、文字による文学作品やオーディオブックなど、多様なコンテンツが海外へと広がっており、低コストで必要な言語を生成できる同製品の強みが発揮されると見ている。
インバウンド需要の高まりにより、海外からの非日本語話者が増加している。そのため、一般企業のコールセンターのみならず、行政においても多言語での対応が求められている。ビジネスにおいても、グローバル展開に伴う教育や研修用コンテンツの多言語化が必要とされており、同社は多くのビジネスチャンスがあると見ている。
一方、日本においては生成AIに対する安全性やコンプライアンスに関する懸念が根強い。特に近年では、生成AIによって作成された本人そっくりの「クローン音声」を用いた「なりすまし詐欺」が横行している。同社は、不適切な使用の検知やモニタリングを通じて、必要に応じて悪質なユーザーを強制的に排除するほか、「No Go Voices セーフガード」および「voiceCAPTCHA」技術を導入し、無許可のボイスクローンの作成を防止している。
イレブンラボジャパン Japan&Korea ゼネラルマネージャーの田村元氏は「何がコンプライアンスに抵触するのか、安全性を脅かすものなのかを理解していない人も多い」と指摘し、「人間は、分からないものに対して恐怖を感じるものである」と述べた。そのうえで、各社の事例を紹介することで、こうした不安を払拭したいとしている。
