NECは、利用者の意図を推定して効率的に検索するシステムを開発したと発表した。利用者が指定した条件をもとに、抽出ルールを推定・作成することで、絞り込みを行う検索するもの。これによって、従来、検索漏れが多かったり、逆に不要な情報が多いという、検索の問題点を克服することができる。

 言葉の意味に着目することで、例えば「新製品」の「発売」に関する検索のように単語の使われ方を特定した検索や、「歯磨き粉」「口臭消臭剤」といった「オーラルケア製品」の一括検索のように、単語の上位概念も含めた包括的な検索が比較的簡単にできるようになる。

 使用する技術は3種類。まず、日本語の文書を自動解析し、単語に人名・地名・商品名などの属性を自動的に付与して構造化した文書データに変換する技術。さらに、構造化した文書データに対して、システムが作成した抽出ルールを適用し、ルールに該当する部分を文書から取り出す技術。利用者の簡単な指示から、抽出ルールを絞り込み、利用者の意図を推定して最終的な抽出ルールを作り出す技術。これらを組み合わせ、利用者との簡単なやり取りで正しい検索結果を抽出する

 同社では今後、社内利用による導入効果の実証と改良をすすめ、ドキュメント管理製品・ソリューション、検索サービスなどでの早期の実用化を目指す。