NEC(矢野薫社長)は5月29日、映像・音声コンテンツに含まれる音声から話題(トピック)の変化を検出し、コンテンツを話題ごとに分割する「トピック分割技術」を開発したと発表した。

 自然な話し言葉を高い精度でテキスト(文章)に変換する「音声認識技術」と、テキストを意味のあるまとまりに切り分ける「テキスト分割技術」によって実現したもの。話題が違えば語やフレーズの出現傾向も違うという「話題間の差異」に着目してトピックを分類することで、話題の具体的内容に影響されることなく、「政治」「芸能」「スポーツ」などに分割する。これにより、デジタル放送やインターネット上で大量に流通する映像・音声コンテンツを話題ごとに検索・頭出し・視聴・閲覧することができ、映像コンテンツを効率的に提供・視聴できるようになる。

 現在、映像コンテンツの検索方法として、電子番組表(EPG)やコンテンツに付随する字幕などのメタデータ(関連情報)をキーワード検索する方法などが取られているが、メタデータ作成に大きなコストがかかるうえ、キーワードを用いた単純な検索では、1つのニュース項目など意味のある単位での視聴が難しいなどの問題があった。

 今回の開発はこうした課題を克服するもので、コンテンツを話題ごとに正確に分割することで、意味的にまとまった話題単位でのコンテンツの頭出しや視聴を低コストで実現できる。同社では、今後、コンテンツ関連事業での製品化を目指し、研究開発を強化していく計画。