音声合成ソフトウェア『初音ミク』――。「未来からきた初めての音」がタイトルの由来という。北海道に本社を構えるクリプトン・フューチャー・メディアの大ブレイク商品だ。歌詞とメロディをパソコンに入力すれば、仮想の歌手「初音ミク」が合成音声で歌ってくれる。コンピュータと音の接点をベースに、お客様に喜んでもらえるソフトウェアを追求し続ける伊藤さんに、起業当時のエピソードをはじめ独自のビジネス観などについて熱く語っていただいた。(聞き手:BCN社長 奥田喜久男)


奥田 伊藤さんは今すごく有名でいらっしゃるけど、あまり表には出てこられないですね。

伊藤 いやあ、有名じゃあないですよ。まあ、表に出てこないというのは、地理的に東京ではなくて、札幌だってところも大きいでしょう。それに、雄弁に語るというのが不得意ですし…。仕様書を書いてシステム設計するというのが性に合ってるんでしょうね。

奥田 経営もしっかりとやっておられる。

伊藤 でも、典型的な経営者タイプというのではないですし、クリエイターとか物を作っていく側の立場が合っているんでしょうね。だから外に出る機会は、そんなに多くはありません。 

コンピュータと音楽の接点



奥田 創業されたのは?

伊藤 1995年の7月です。いきさつから話しますと、会社を創る前は大学の職員をやっていたんです。公務員試験を受けて、ごくごく普通の就職でした。

奥田 勤務先は北海道大学でしたよね。

伊藤 ええ、そうです。それで就職して、赴任した職場が研究室だったんです。高校を出て、公務員試験を受けて入ったのですが、研究室ってところは初めてでしたし、最初はちょっとカルチャーショックというかギャップを感じましたね。でも、自由な雰囲気のある職場でした。実際の仕事は学生と一緒に“研究ごっこ”をしているというような感じもありましたね。学生はみんな同年代でしたし。

奥田 どんな学科の研究室だったんですか。

伊藤 工学部の精密工学科っていうところでした。職員もどんどん研究をやりなさいというような雰囲気で、ちょっと珍しい職場だと思います。そういう環境でしたから、私の前任の先輩も後輩も職員から大学の先生になっています。私も今、北海道情報大学で客員教授として教えています。そういった自由な気風がありましたね。

奥田 そこでコンピュータにも出会われた。

伊藤 そうです、そのあたりからですね。それで、職員ですから異動がありまして、大学の電算管理システムをやるようなセクションに移って、プログラムなんかも本格的にいろいろ覚えていきました。

奥田 音との係わり合いは?

伊藤 幼い頃から音楽が好きで、大きくなってからは趣味でギターを弾いていました。仕事では当時流行り始めたコンピュータをやっていて、趣味で音楽をやっている。つまり、コンピュータと音楽の接点にいたわけです。そうした自分が興味を持ち始めたのが、コンピュータで音楽をつくっていくということだった。マルチメディアパソコンの出始めの頃ですね。大学の研究室にもあって、それを使って音楽というか音をいろいろと加工してつくっていました。

音をつくり、世界に売る



奥田 今のお仕事にだんだん近づいてきましたね。

伊藤 そうこうしているうちに、自分でつくった音をいろんな人に使って欲しいなという思いが膨らんできたわけです。

奥田 どんな音をつくってたんですか。

伊藤 シンセサイザーで加工した効果音みたいなものや、荘厳な感じの小曲やダンスミュージックのようなものなど、いろんな音ですね。それで、そういう音をどうすれば多くの人に使ってもらえるかを考えていたんです。本屋さんに行ったら、たまたま『キーボード』という音楽系の雑誌に出会いました。英語の雑誌で、後ろのほうに個人広告を載せるスペースがあるんです。何ドルか支払えば、誰でも広告が載せられるというものです。三行広告ですね。よし、これに広告を載せてみようと思ったんです。

奥田 どんな内容の広告だったんですか。

伊藤 「自分の音を売ります」、そんな感じですね。

奥田 まだ大学職員の頃ですね。

伊藤 そうです。それがまあビジネスの世界に入るきっかけになったんですね。そうやって広告を出していると、世界中に流通しますから、いろいろな国の人から、エアメールで問い合わせがくる。まだインターネットが普及する前の時代ですから。

奥田 問い合わせはどのくらい来たんですか。

伊藤 段ボール箱一杯はありましたから、1000通近くあったでしょうか。

奥田 広告料はどのくらいでした?

伊藤 1回50ドルくらいだったですね。毎月出稿して、5年くらい続けていました。

奥田 ビジネス的にはどうだったんですか。

伊藤 当時のことですから、フロッピーディスクに音を入れて売るわけですけど、けっして儲かりはしませんでしたね。収支とんとんといったところでした。でも、世界中の人たちと連絡がとれるということが、非常にフレッシュな感じでしたね。今はインターネットがありますから、世界につながることにそんなにフレッシュ感はないかもしれませんけれど。

奥田 そのフロッピー・ディスクは、1枚どのくらいの価格だったんですか。

伊藤 10ドルほどでしたから、千数百円というところですか。そうしているうちにだんだん円高になってきて、収支もとんとんから厳しくなってきて、そろそろやめようかと思っていたところに、逆の話が舞い込んできたんです。

奥田 逆の話というと?

伊藤 世界中の音好きの人とやりとりをしていたわけですけど、そのなかの何人かから「音をつくったので、日本で売ってくれないか」という依頼がきました。海外でつくった音を日本で売る、と。ちょうど円高だったので、有利なわけです。じゃあ、試しにということで、日本の媒体に広告を出して実験的にやってみることにしました。

奥田 どんな媒体ですか。

伊藤 リットーミュージックから出ている『サウンド&レコーディング・マガジン』という、コンピュータで音楽をつくるのが好きな人のための雑誌です。そこに出稿したわけです。ただ、音を売るというのは日本では誰もやったことがないので…。

奥田 当時はまだ、そうだったのでしょうね。

伊藤 ええ、だからうまくいくかどうかはわからなかったけれど、僕自身が欲しいから他の人も欲しいだろうという安易な考えで始めました。でも、やっているとそこそこ物も動くし、だんだん引っ込みがつかなくなって、会社を立ち上げたわけです。

奥田 それは何年のことですか。

伊藤 1995年の7月です。

奥田 二足のわらじの時代がけっこう長かったんですね。

伊藤 そうですね。自分の音を世界に売ることを88年頃から93年頃まで5年間ほどやっていて、そこからさらに世界の音を日本で売るビジネスを始めて、95年に会社を作った、というのが経緯です。

奥田 だんだんビジネスっぽい話になってきました。

伊藤 会社をつくって最初に決めていたことは、音に特化したことだけをやろうということでした。いろんなところに手を伸ばしても、結局中途半端になる、音だけで商売をやっていこうと。

奥田 売る相手は?

伊藤 番組を制作するテレビ局や映画会社、ゲームをつくるプロダクションなんかですね。非常に限定的なジャンルなので、マーケティングはしやすい面があります。セグメントしやすいし、対面販売するものではないですから、札幌にいて、カタログをつくって送って、ビジネスをやっていったわけです。まだ紙のカタログでした。

奥田 そういった音はどんなシーンで使われるんですか。

伊藤 たとえば、やくざ映画では拳銃の音なんかですね。つくった音を後から入れるんです。缶コーヒーをプシュッと開ける音なんかも、より鮮明にするために加工してつくった音を後から入れます。そうやって通常、音を使ってコンテンツをつくっているわけです。制作会社にとっては、いろんな音があれば、つくる作品の質が上がっていく。だからある程度、音の需要があることはわかっていました。

奥田 そういった音をつくる競合会社って、当時あったんでしょうか。

伊藤 あんまりなかったですね。レコード会社が花火の音とかをアナログのレコード盤でつくっていたくらいです。しかし、それらはデジタルと比べれば種類も少ないですし、利便性もそれほどあるとはいえない。

奥田 なるほどね。

伊藤 だけど、いかんせん買ってくれる会社の数が知れている。マーケットが小さいんですね。
___page___

携帯電話の着メロでビジネスが広がる



伊藤 それでなんとかマーケットを広げられないかと常に考えていたわけですけど、ひとつのきっかけになったのが携帯電話でした。

 携帯電話の着メロが2000年頃からビジネスになり始めてきて、最初はメロディだけだったんですが、短いちょっとした音を録音して、それを着メロの中に含めることができるようになったんです。着信したときに「ホーホケキョ」と鳴くとか、音としての着メロができるようになってきた。ほんの小さな音しか入りませんが、われわれとしては、一般の人に音を売る窓口として、携帯電話っていうのがありだと気がついたわけです。だからすぐに携帯電話のキャリアに企画書を持っていって、公式サイトをいくつかつくらせてもらいました。それは今も継続的にやっています。

奥田 それは全キャリアで?

伊藤 そうです。それの延長でいろんな音の入ったプリセットをメーカーにライセンスしたりもしています。ただ、それにしても音を売るというのはビジネスとしても非常にニッチな世界なんですね。まあそういうなかで、音のビジネスをもっと広げていこうということでバーチャル・インスツルメントへも力を入れていったわけです。

バーチャル・インスツルメントへの展開



奥田 バーチャルな楽器ということですか。

伊藤 要するに仮想楽器ですね。パソコンにインストールして使う楽器です。グランドピアノやもっといえばオーケストラなんかは普通、もちたくてももてないわけですね。それをパソコンのソフトウェアで実現できれば、自分のものにすることができる。オーケストラだって可能なわけです。コストも大幅に安いし、限りなく生の音に近いものがつくれます。

奥田 そんなに生に近い音がつくれるの?

伊藤 ピアノでいえば、たとえば午前中は「ベーゼンドルファー」を弾いて、午後からは「スタインウェイ」を弾く、なんてことがバーチャル・インスツルメントではできるんですね。

奥田 へえ、それは驚きですね。

伊藤 オーケストラの演奏も可能で、うちでも販売していますが、フルセットで200万円を切る値段です。高いといえば高いかもしれませんが、オーケストラを呼んで会場を借りてと考えると…。それにバーチャル・インスツルメントなら何度でも使えるわけですし、結局は大幅に得になります。

奥田 そういうものを買われるお客様っていうのは?

伊藤 たとえばゲームの制作会社などですね。ゲームのなかでちょっとしたオーケストラ音楽を使ったりする場合には、オーケストラを呼ばなくてもバーチャル・インスツルメントでつくれば、それですんじゃう。

奥田 生に近い音をどういう風にしてつくっていかれるのでしょう。

伊藤 ピアノでいうと、本物のピアノの音をオーディオデータとして全部録音するんです。それをMIDI鍵盤で弾いて、対応する音を出す。単純にいえばそういう仕組みです。ただ、元の音を録音するといっても、一つ一つの音でも当然強弱もありますから、それらの可能性を全部録音するんです。だから相当な量になります。

奥田 そこが企業秘密ですね。どのくらいの量になるんですか。

伊藤 何十GBになりますね。だからハードディスクには入っても、RAMには読みきれません。RAMは2GBぐらいですから。せっかく録った音も、RAMには全部をロードしきれない。それを技術的にどうやって解決しているかというと、ハードディスクストリーミングという技術を使います。たとえば音の出だしの1秒だけをRAMにもってきて、残りをハードディスクに蓄えておく。バーンと弾いた出だしの音をRAMから引っ張ってきて再生して、1秒間が終わるところで残りをハードディスクから探し集めて再生しているわけです。

奥田 それは昔からあった技術?

伊藤 2000年頃からですか。そういう技術があるからバーチャル・インスツルメントが高品質で、パソコンのなかでつくれるわけです。ガリガリに書いたプログラムがそういった処理をしているわけですね。プログラムの勝利ということです。

人間の歌声もバーチャル・インスツルメントで再現できたら



奥田
 それで、いよいよ人間の声ですか。

伊藤 そうです。ヤマハがVOCALOID(ボーカロイド)というバーチャルな歌声を合成する技術を開発していたんですね。それでわれわれもプロジェクトに参加させてもらったわけです。VOCALOIDというのはOSという感じで、そこにアプリケーションを載せて動かすわけです。そのアプリケーションをわれわれがつくるということです。

奥田 これも先ほどのピアノのように生の声を録音していくんでしょうか。

伊藤 そうです。人間の声の発音のパターンを延々と録音、編集して、VOCALOIDで合成することによって音声のデータをつくるわけです。だから、最初に録音する人の声によってさまざまなものができます。かわいらしい女の子の声だったら、そういう声がVOCALOIDによって再生されるわけです。

奥田 『初音ミク』がそのパターンですね。

伊藤 そうです。

奥田 このタイトルはどこから考えられたんでしょう。

伊藤 『初音ミク』というのは未来で、「未来からきた初めての音」ということです。

奥田 ああ、なるほど。

伊藤 『初音ミク』の場合は、人格みたいなものをもたせたのがミソだったですね。

奥田 というと?

伊藤 ギターやピアノだったら、「バーチャルリアルギター」とか「バーチャルグランドピアノ」とか、そんな商品名で出します。「ボーカル」の場合はどういうネーミングで出すのか、さんざん議論したんです。最初はパッケージにマイクでも書いて、タイトルは「バーチャルソング なんとか君」とか「シンガー君」とか、そんな風に考えていました。でも、どうもしっくりこない。いっそのこと、中に人がいることにしようということになったんです。お客様の目線からみると、それが一番わかりやすい、と。中に人がいて歌ってくれるんだと。そうなると、パッケージもマイクだとそぐわない、アニメとかの絵がいいんじゃないかとなった。

 『初音ミク』は最初からああいうキャラクターのコンセプトがあったわけではなく、つくっていくなかで、お客様に対するわかりやすさと宣伝しやすさも含めて検討した結果、行き着いたわけです。

奥田 そこに行き着くまでにはどのくらいの期間がかかりました?

伊藤 2004年の11月にVOCALOIDで『MEIKO』というのを出しました。バーチャル・インスツルメントというのはニッチな市場で、業界では1000本売れれば、「よかった、よかった」というところなんですが、『MEIKO』は初年度3000本売れたんです。『MEIKO』を出すときにキャラクターにしようという発想が生まれたわけですけど、これでコンセプトは間違っていないと確認できたんです。

奥田 これが2007年の『初音ミク』につながっていくわけだ。

伊藤 途中、2006年に『KAITO』というのを出しました。これは男の子でしたが、さっぱり売れなかった。500本ほどでしたか。やっぱり売れるのは女の子だとわかったんですね。そうこうしているうちにVOCALOID2がヤマハから出ることになって、こちらも何か投入しようということになりました。それが『初音ミク』なんです。
___page___

いよいよデビュー『初音ミク』



伊藤 そういうことで『初音ミク』は、過去の二つのタイトル『MEIKO』『KAITO』の教訓を活かしてつくり始めました。

奥田 具体的にはどんなことを?

伊藤 声なんかもそうですね。過去の二つのタイトルはプロのシンガーの声を収録してつくったのですが、『初音ミク』を開発するにあたっては、シンガーではなく声優さんでやろうと考えました。なぜかというと、お客様が望んでいるのは、歌がうまいというのではなくて、声がかわいいとかかっこいいとか、歌声に特徴があって歌わせたくなるような新しい個性が重要だと感じていたからです。そうなると、全体的にもアニメキャラクターというような方向性が明確になってきたのです。

奥田 そういうことって議論の途中で出てくるものですか。

伊藤 ブレーンストーミングをやるわけです。

奥田 どんなメンバーで?

伊藤 基本的には若い人です。僕はあまり参加しません。種を蒔くだけです。基本的なことを言うだけですね。声優さんでやろうとか、中に人がいるイメージでとか。あとは現場の人間でやります。ちょうどその頃、ちょっとオタクの新入社員が入社してくれたんですね。女性社員です。これがよかった。

奥田 なんのオタク?

伊藤 アニメや声優とかに詳しいオタクです。それまではうちの会社にオタクは一人もいなかったんです。だから、みんなによく言いました。マンガやアニメを見て勉強しろって、号令をかけたりして。そんな感じで『初音ミク』をつくっていったんです。やっていく過程ではあまり口出しはしないです。

「『初音ミク』は、シンガーではなく声優さんでやろうと考えました。歌声に特徴があって歌わせたくなるような新しい個性が重要だと感じていたからです」と、誕生の経緯を語る伊藤博之さん

奥田 開発メンバーの平均年齢はどのくらいですか。

伊藤 その新入社員が20歳で、ほかの担当者は25~26歳といったところ。『初音ミク』に限らず、携帯の新しいサイトなんかもこういうやり方で進めています。

「やりたいことをやろう」の発想



奥田 仕事の方向を決めるときには、何か決め事か何かがあるんでしょうか。

伊藤 基本的には、やりたいことをやろうというスタンスで仕事に向かいます。自分もそういうふうにやらしてもらってきましたし…。やりたいことというのは、たとえば、この商品を1万個売ってこいというのではなくて、どうしたらお客様にこの商品で喜んでもらえるかを考えることですね。われわれでしたら、どうすれば音を使って人を喜ばせることができるか、ビジネスを広げていくことができるか、そういうところから発想していくわけです。

奥田 なるほどね。

伊藤 経営の教科書も先行する技術もマーケットもないわけですから、それを克服するには興味がないとダメです。興味があって自分の楽しみとしてやってもらわないと、途中で確実に息切れする。やらされているという感じでは絶対にうまくいかないし、勤まらない。だから、やりたいことをやる、そういう感覚で社員には取り組んでもらっています。

 たとえば、紙に音が貼れれば面白いな、なんてことを考えるんです。名刺が自分の挨拶をしゃべってくれたり、年賀状から音が出たり。なんか面白いじゃないですか。そんなところから発想していくわけです。

奥田 なるほど、なるほど。

伊藤 どうやればその発想に近づけるか、可能になるか、ブレーンストーミングしていけば、いろいろアイデアが出てくるんですね。

奥田 それで、名刺に音は貼れるんですか。

伊藤 QRコードと携帯電話でできます。携帯を介することになりますが。

奥田 面白いですね。応用でいろんなことが考えられますね。もう完成していますか。

伊藤 ええ、もうできています。ラジオを紙に貼るなんてことも考えています。そんなことができれば、いろんな媒体の価値も変わってくるかもしれませんね。
___page___

“深掘りと応用”の経営を貫く



伊藤 先ほどの音を貼るというのもそうですが、われわれのところは、音で発想して、それに何か付加価値を付けていこうという考えですね。

奥田 どうしてそんなに音にこだわるんですか。

伊藤 うちの会社のコア・コンピタンスは音だと、音に関しては深掘りしていくということです。でも深く掘っていってもビジネスとしてはニッチなわけですね。深掘りだけしていくと、技術オタクになってしまいますから、深く掘ったら、それを応用していくことを考えなければ、意味がない。だから、着メロをやったり、VOCALOIDを手がけたり、音を貼るビジネスに首を突っ込むとか、応用をしていくわけです。深掘りが縦の線だとすると応用が横の線になって、三角形が形づくられる。深掘りだけでも、応用だけでも三角形はいびつですよね。深掘りと応用がうまくかみ合わせれば、バランスのとれた三角形が完成するんです。

奥田 それは持論なんですか。

伊藤 そうですね、経営をやってるうちに考えたことです。うちができる範囲というのをセグメントしてコンパクトにまとめておかないと、どっちつかずになってしまう。だから守備範囲を広げないようにしています。

 もし、広げていくべき領域があるなら、その領域が得意なところと手を組んでやっていこうと。ただし音の部分は自分たちでということです。

奥田 音を深掘りしていく、その縦軸の先にはいったい何があるんでしょう。

伊藤 ちょっと抽象的な言い方になりますが、時代に合った自分たちの役割、つまり音ですね、それをその時代時代に再定義しながら、ぶれないということだと思っています。

奥田 一方の「応用」という横軸の延長線上には何が見えてくるんでしょうか。

伊藤 広げ過ぎないというのがミソだと思っています。たとえば音の分野が詳しいからといって、じゃあ、レコード会社をつくろうか、といっても無理ですからね。

奥田 その手がけるかどうかの判断は、市場規模とかのマーケティング的なところから出ているんですか。

伊藤 いや、そのレベルには達していません。自分たちの技術がどこのところで応用できるかというところと、それに対して反応するお客さんの層がどれほどいそうかという、それが今の判断材料ですね。市場規模を考えて、その何%が取れるかというような判断はこれからの課題でしょうね。

奥田 今のところは経験に基づく勘で判断されているということですね。法人化されて14年目ですが、人的、売上的にみて今の現状はどのあたりと。

伊藤 まったくしょぼいです。山でいえば一合目くらいですね。

収益モデル、収穫モデル



奥田 もう少し経営の話を聞かせてください。

伊藤 これまでずっと、新しいことを始める時に、収益が立たないケースが多かったんですね。たとえば、ソフトウェアを開発するとき、これまでの経験でいけば何本売れて、売上がこのくらいで経費がこの程度だから、粗利はこれくらいはいけるだろうという予想でスタートするのが普通でしょう。だけど、あまりそういう計算はしなかったですね。着メロビジネスも、なんかわからないけどやっておけば将来はいいことがあるだろう、くらいの感覚だった。初音ミクなんかもそうです。まあ、そこのところをしっかりと区分していて、収益がしっかり立てられるものを「収益モデル」、何かわかんないけど面白そうだからやってみて、うまくいったら「収益モデル」に格上げしようというものを「収穫モデル」といっているんです。

奥田 「収穫」って、それはどういうこと?

伊藤 要するに農業といっしょで、台風が来て全滅しちゃうかもしれないし、思いのほかいいものができるかもしれない。そういうものを「収穫」と呼んでいるんです。

奥田 「収穫」って、面白い言い方ですね。

伊藤 「収益モデル」だけをやっていても面白くないですよ。手堅いかもしれませんが、ぜんぜん面白くない。
 
奥田 『初音ミク』はどっちになるの?

伊藤 「収穫」から始めて今は「収益」ですね。着メロなんかも最初は「収穫」です。やらないリスクを考えれば、やったほうがいいと。だいたい新規のものは「収穫」ですから、「収益」から投資してやりくりしています。内部のキャッシュフローで賄っていくというやり方です。だから今までずっと無借金経営です。

インターネットの時代、地方にチャンスが眠っている



奥田 お生まれの北海道は広いですけれど、どんなところで育ったんですか。

伊藤 4~5月になると春の匂いがして、秋は水たまりに氷が張って、それを割りながら学校へ行くという、そういうところですね。釧路湿原の中にある小さな町です。

奥田 ふ~ん、目に浮かびますね。

伊藤 だから、非常に都会に憧れました。情報が少なかったですから、ラジオから流れてくるジャズとかロックとか、そういうものに文化とかを感じていました。まあ、その頃は、ですが…。

奥田 というと?

伊藤 今はインターネットがあって、ネットワークの時代ですから、地方にチャンスがあると思っているんですね。むしろ東京より地方にチャンスが眠っているような気がしています。

奥田 うん、うん。

伊藤 なぜ集まって住まなくてはいけなかったというと、コミュニケーションをとるのってコストがかかるわけですね、集まっていればそれがかからないわけです。電話がない時代には、たった100メートル離れていても、お互いが意思疎通して仕事ができなかったんですね。だからみんなが集まったわけです。そして学校が建てられ、店ができて、町が形成されていくわけです。町中心の社会設計という発想がずっとあったわけです。

 その根幹にあるのは高いコミュニケーションコストだと思っているんですよ。で、インターネットが登場してユビキタスになれば、コミュニケーションコストは劇的に下がると思うんです。今も下がってますが、まだまだ下がる。となってくると、知的な労働をしたい人は、別に集まっていなくても、自分が生まれた田舎にいて、親のそばで暮らしながら仕事もちゃんとこなせる。そのほうが幸せだと、ぼくは感じているんです。そういう時代が確実に来ると思っています。

奥田 熱い話を長時間ありがとうございました。今から最終便で札幌へ帰られるということですが、お気をつけて。またお会いしましょう。

■プロフィール
伊藤博之(いとうひろゆき)

1965年、北海道生まれ。北海学園大学経済学部卒業。北海道大学に職員として在籍後、1995年、クリプトン・フューチャー・メディア株式会社を札幌市に設立。効果音やBGM、携帯電話の着信メロディなど、音に特化した事業を展開。2007年音声合成ソフト『初音ミク』を発売、大ヒット商品となる。北海道情報大学客員教授。
※編注:文中の企業名は敬称を省略しました。

▽コラム「人ありて、我あり【奥田喜久男】」 BCN Bizlineにて不定期更新中 adpds_js('http://ds.advg.jp/adpds_deliver', 'adpds_site=bcnranking&adpds_frame=waku_111369');