声を消すマスク、AI音声入力で再評価【道越一郎のカットエッジ】
AIの進歩で音声入力の精度が爆上がりしている。キーボード入力より効率的と、音声入力を常用する人も増えた。一方で、入力中の声が周りの迷惑になったり気恥ずかしかったり、という大きなデメリットもある。それを解決するのが「プライバシートーク(Privacy Talk)」だ。一見、ちょっと大ぶりな布製マスク。中にマイクが仕込んである。このマスクを付けて話すと、1m程離れると話し声がほとんど聞こえなくなる。Acoustic Metamaterials Group(AMG)の技術を活用した「迷路状の構造」で、物理的に声を拡散する。消音効果は約-20dB。家庭用の簡易防音室と同様の性能だ。
持ち運べる防音室とも言える
「プライバシートーク(Privacy Talk)」
発売は2024年3月。キヤノンマーケティングジャパンがリリースした。コロナ禍を受け、オフィスの自席やカフェでオンライン会議を行うような用途を想定して企画・開発した製品だ。ところが、発売はコロナ禍が終息した後。オンライン会議は日常化したものの、特需を捉えるまでには至らなかった。その後、音声入力需要の高まり、という形で、波は再びやってきた。昨今、爆発的な勢いで進化が止まらないAIの恩恵を受け、音声認識の精度は以前とは比べ物にならないほど向上している。単に声を文字にするだけではない。話している文脈から、ちょっとした言い間違いも自動的に修正できる。音声入力が、にわかに注目を集め始めている。
PCに向かってブツブツと話す光景は不気味だ。内容によってはセキュリティーの問題もあるだろう。一人でいるなら問題ないが、周りに第三者がいる状況では、音声入力は、なかなかお勧めできない。自分の声を周りの人に聞こえなくする工夫が必要だ。カフェや電車などで、電話やオンライン会議の声が気になるのは「ハーフアローグ現象(Halfalogue effect)」によるもの、という研究もある。片方の声は明瞭に聞こえつつ、もう片方の声が聞こえないことで、無意識に脳内で聞こえない声を補おうとする。その分、イライラしたり気疲れしてしまう、というものだ。最近のカフェでは、オンライン会議をする際に「周囲への配慮」を求めるところも増えた。AIへの音声入力も声を出す、という点では同様だ。
プライバシートークを装着した。
マスクの中に本体の消音ユニットがあるため、
口周りがかなり前に突き出た「カッパ風」の見た目になるのはご愛敬
実際、プライバシートークは使えるのか?使い勝手を検証した。ヘッドセット同様、本体にはマイクとイヤホンを備える。PCやスマートフォンとはBluetoothかUSB-Cのどちらかで接続可能だ。内蔵バッテリーで約3時間連続して使用できる。話している声は、もごもごと聞こえるだけ。何か言っているのはわかるが、内容はほとんど聞き取れない。重量は106g。当然ながら普通のマスクより重いが、類似品に比べると圧倒的に軽い。中にムレ防止のファンも仕込んであり、装着時の不快感はあまりない。ファンのノイズがマイクに入らないようキャンセルするシステムも組み込まれている。ただ、口周りを覆って声が漏れないようにする構造上、口の動きが若干制限される。意識して話さないと、きちんとした発音にならない場合もあった。実際の通話や録音で確認してみたところ、音質は、ややこもって聞こえる。音がいいとは言えない。
マスクの中にある本体の消音ユニット。左右からイヤホンが出ている。
全面に二つある黒い部分はマジックテープの片割れ。
これに布製マスク「ファブリックカバー」を付けて使用する
AIの音声入力用途にはどれくらい耐えるのか。若干こもった音質が影響してか、時折誤認識が発生した。試したのは、GeminiとChatGPT、Copilot、そしてClaude。それぞれ無料Web版だ。Windows PCとAndroidスマートフォン、タブレットで確かめた。Gemini、ChatGPT、Copilotでは、若干の誤認識はあるものの実用上ほぼ問題なく使用できた。プラットフォーム別に認識精度にばらつきがあり、ChatGPTの精度がやや高い印象を持った。一方、Claudeでは、Claude自身が日本語の音声認識には対応していない。Web版では使えなかった。ただ、OSの音声認識機能を使って音声入力することは可能。私の環境では、Windowsのデスクトップアプリ使用時のみ日本語の音声入力に成功した。ただし精度は低い。もちろん英語であれば音声入力も可能だが、発音の問題もあってか、こちらも精度はイマイチだった。特にClaudeでは「Whisper」系のAI音声入力エンジンなどと組み合わせて使うべきだろう。
本体内部にはファンが二つとマイクが二つある。
周囲にあるのはシリコン製のマウスパッド。これで口周りを覆う構造だ
いずれのAIプラットフォームについても、音声認識精度が十分高ければ、音の悪さをカバーし、実用レベルで利用できる水準だと感じた。とはいえ、マイクの音質をもう少し向上できれば誤認識も激減し、使い勝手はさらに良くなるだろう。物理的に音を抑える機構上、やむを得ない部分もあろうが、マイクの配置やイコライザーなどの音質調整で解決できそうに思う。最近注目され始めた「バイブコーディング(Vibe Coding=雰囲気や自然言語でAIと対話しながら行うプログラミング)」での音声入力にも活用できそうだ。AIの音声入力に特化したバージョン2の開発、発売に期待したい。
実はこのプライバシートーク、キヤノンオンラインショップでは既に販売が終了している。以前は家電量販店などでも取り扱っていたが、現在はAmazonのみで販売中だ。価格は発売当初2万3650円(税込み、以下同)だったが、今年2月に1万4300円に値下げ。4月23日現在、Amazonでの販売価格は9900円まで下がっている。今作は在庫限りの販売で、次作が出るかどうかは未知数。確保するなら早めの行動をお勧めする。(BCN・道越一郎)
「プライバシートーク(Privacy Talk)」
発売は2024年3月。キヤノンマーケティングジャパンがリリースした。コロナ禍を受け、オフィスの自席やカフェでオンライン会議を行うような用途を想定して企画・開発した製品だ。ところが、発売はコロナ禍が終息した後。オンライン会議は日常化したものの、特需を捉えるまでには至らなかった。その後、音声入力需要の高まり、という形で、波は再びやってきた。昨今、爆発的な勢いで進化が止まらないAIの恩恵を受け、音声認識の精度は以前とは比べ物にならないほど向上している。単に声を文字にするだけではない。話している文脈から、ちょっとした言い間違いも自動的に修正できる。音声入力が、にわかに注目を集め始めている。
PCに向かってブツブツと話す光景は不気味だ。内容によってはセキュリティーの問題もあるだろう。一人でいるなら問題ないが、周りに第三者がいる状況では、音声入力は、なかなかお勧めできない。自分の声を周りの人に聞こえなくする工夫が必要だ。カフェや電車などで、電話やオンライン会議の声が気になるのは「ハーフアローグ現象(Halfalogue effect)」によるもの、という研究もある。片方の声は明瞭に聞こえつつ、もう片方の声が聞こえないことで、無意識に脳内で聞こえない声を補おうとする。その分、イライラしたり気疲れしてしまう、というものだ。最近のカフェでは、オンライン会議をする際に「周囲への配慮」を求めるところも増えた。AIへの音声入力も声を出す、という点では同様だ。
マスクの中に本体の消音ユニットがあるため、
口周りがかなり前に突き出た「カッパ風」の見た目になるのはご愛敬
実際、プライバシートークは使えるのか?使い勝手を検証した。ヘッドセット同様、本体にはマイクとイヤホンを備える。PCやスマートフォンとはBluetoothかUSB-Cのどちらかで接続可能だ。内蔵バッテリーで約3時間連続して使用できる。話している声は、もごもごと聞こえるだけ。何か言っているのはわかるが、内容はほとんど聞き取れない。重量は106g。当然ながら普通のマスクより重いが、類似品に比べると圧倒的に軽い。中にムレ防止のファンも仕込んであり、装着時の不快感はあまりない。ファンのノイズがマイクに入らないようキャンセルするシステムも組み込まれている。ただ、口周りを覆って声が漏れないようにする構造上、口の動きが若干制限される。意識して話さないと、きちんとした発音にならない場合もあった。実際の通話や録音で確認してみたところ、音質は、ややこもって聞こえる。音がいいとは言えない。
全面に二つある黒い部分はマジックテープの片割れ。
これに布製マスク「ファブリックカバー」を付けて使用する
AIの音声入力用途にはどれくらい耐えるのか。若干こもった音質が影響してか、時折誤認識が発生した。試したのは、GeminiとChatGPT、Copilot、そしてClaude。それぞれ無料Web版だ。Windows PCとAndroidスマートフォン、タブレットで確かめた。Gemini、ChatGPT、Copilotでは、若干の誤認識はあるものの実用上ほぼ問題なく使用できた。プラットフォーム別に認識精度にばらつきがあり、ChatGPTの精度がやや高い印象を持った。一方、Claudeでは、Claude自身が日本語の音声認識には対応していない。Web版では使えなかった。ただ、OSの音声認識機能を使って音声入力することは可能。私の環境では、Windowsのデスクトップアプリ使用時のみ日本語の音声入力に成功した。ただし精度は低い。もちろん英語であれば音声入力も可能だが、発音の問題もあってか、こちらも精度はイマイチだった。特にClaudeでは「Whisper」系のAI音声入力エンジンなどと組み合わせて使うべきだろう。
周囲にあるのはシリコン製のマウスパッド。これで口周りを覆う構造だ
いずれのAIプラットフォームについても、音声認識精度が十分高ければ、音の悪さをカバーし、実用レベルで利用できる水準だと感じた。とはいえ、マイクの音質をもう少し向上できれば誤認識も激減し、使い勝手はさらに良くなるだろう。物理的に音を抑える機構上、やむを得ない部分もあろうが、マイクの配置やイコライザーなどの音質調整で解決できそうに思う。最近注目され始めた「バイブコーディング(Vibe Coding=雰囲気や自然言語でAIと対話しながら行うプログラミング)」での音声入力にも活用できそうだ。AIの音声入力に特化したバージョン2の開発、発売に期待したい。
実はこのプライバシートーク、キヤノンオンラインショップでは既に販売が終了している。以前は家電量販店などでも取り扱っていたが、現在はAmazonのみで販売中だ。価格は発売当初2万3650円(税込み、以下同)だったが、今年2月に1万4300円に値下げ。4月23日現在、Amazonでの販売価格は9900円まで下がっている。今作は在庫限りの販売で、次作が出るかどうかは未知数。確保するなら早めの行動をお勧めする。(BCN・道越一郎)






