ソースネクスト、画像から文字データを読み取りテキスト化できるPDFソフト

ニュース

2005/12/06 16:36



 ソースネクスト(松田憲幸社長)は、PDFから書類を作成できる「いきなりPDF to Data」の上位版として、画像からのPDF作成など新機能を搭載した「いきなりPDF to Data Professional」を12月16日に発売する。価格は2970円。

 「いきなりPDF to Data」は、PDFのデータを読み取り、ExcelやWordファイルとして出力するソフト。出力したい形式を選びドラッグ&ドロップするだけで、簡単にPDFデータを希望のファイル形式に出力できる。

 上位版「いきなりPDF to Data Professional」では、BMP・JPEG形式の画像から文字データを読み取り、テキスト化できる機能を追加。また、文字データを含まないPDFでも、文字検索可能なPDFに変換できる「透明テキスト付きPDF」の作成、デスクトップ上で該当部分を囲むだけのテキスト出力などが可能になった。

 出力可能なファイル形式は、Microsoft Excel 2000/2002/2003(xls)、Microsoft Word 2000/2002/2003(doc)、テキスト(txt)、JPEG、BMP、同社のOCRソフト「本格読取」(TIF)。出力ファイルの形式を「本格読取」に指定し、同ソフトで開くと、写真は写真、テキストはテキストとして読み取ることができる。

 なお、印刷したPDFをスキャンしてOCRソフトで文字認識を行うのと同様の仕組みで実行しているため、印刷制限されたPDFではテキストが読み取れない。また、パスワード制限付きのPDFは、読み取り時にパスワードを入力する必要がある。