2012年9月号
特集 - 新産業創造
東京理科大学大学院 イノベーション研究科 客員教授 森 健一
日本語ワープロ開発に学ぶイノベーション

1962年東京大学工学部応用物理学科卒業、東京芝浦電気株式会社(現、株式会社東芝)入社。1983年同社情報システム研究所長、1994年同社パーソナル情報機器事業本部長、1995年同社取締役、映像メディア事業本部長 兼 記憶情報メディア事業本部長、1996年同社常務取締役、1999年東芝テック株式会社取締役社長、2004年東京理科大学MOT大学院教授、現在客員教授。

世界で最初の日本語ワードプロセッサーは、東芝が1978年9月に発表し、翌年出荷を開始した「JW-10」。学会では、日本語ワープロの根幹である「かな漢字変換」は実現不可能と言われていた。研究開発チームを率いていたのが森健一氏だ。当初、手書きの書類を読み取る装置を作ろうとしていたが、役人から、「欧米の役所の生産性が高いのは、タイプライターを使って文書を作っているからだ」と指摘され、手書きの書類を作らなくて済むように、“ワープロ”の開発を目指した。最初は、会社の正式な開発テーマでなく、水面下の研究だった。
なぜ、かな漢字変換、そして日本語ワープロの開発は成功したのか。そのストーリーから、イノベーション創出のヒントを探る。

(聞き手・まとめ:登坂和洋)

「貢献限度レベル」を定める

大学では工学部で応用物理学を学び、1962年に東京芝浦電気(現在の東芝)に入社し、新製品開発に従事しました。初めは「磁気コアメモリ」、次に「文字認識」の研究です。郵便番号の読み取りについて、当時、数字をこう書いてください、という「制限付き」にするか、「自由手書き」にするかという議論がありました。1942年7月1日の郵政審議会で、制限付きでは国民の協力を得られない、だから、自由手書きの数字を読み取る装置を1943年3月までに作ってくれないかいうことになりました。3社による競争が始まり、期限までにできたのがわれわれのグループでした。

そのとき開発したのは1桁読み取りです。1桁当たりの読み取り率が90%。1桁当たり10%読めないということは、3桁あると――独立現象だとすると――30%は読めません。そして読み誤りは0.1%以下。こういう条件で立ち会い試験があり、その通りになりました。

われわれ研究者としては、世界で初めて1つの国民の手書き文字(数字)を相手にして、自由手書きで、1字90%、書状当たり70%処理できれば十分役立つと勝手に思っていたんです。そうしたら、そのときの郵政審議官が、この方は非常に頭のいい人で、これは確かに約束どおりの性能だが、今読み取れなかった30%の郵便物をもう一遍装置で読ませたらどうなるか見たい、という。全部読めませんとなればこれは安定したいい装置だという思いがあったんでしょうね。ところが、何とそのまた7割を正しく読んでしまいました。そうしたらその方が「この機械は1桁当たりの読み取りの性能が90%だと言っているけれども、2回読みすると97%の性能を持っているじゃないか」と言う。処理量でみると、最初に読めなかった3割のうちの7割を読んだので21%。最初に読んだ70%と合わせると91%になる。研究者として、この結果の理由を十分には説明できない。この事実を突きつけられて、ぐうの音も出なかったんですよ。私自身は非常に恥ずかしいと思いました。

郵政省は書状当たり90%を求めている、手で処理するのが10分の1に減る設計だったらこの機械を入れることに意味があると判断をしている。われわれは、そういう点の考慮を全然していませんでした。

人間社会の役に立って、初めて工学技術の意味がある。ただ研究しているだけでは意味がない。その人に教えられました。

工学の研究では、ある目標値を超えない限り、その技術は人間社会に貢献しない。そのレベルを「貢献限度レベル」と私は呼んでいます。その根拠もきちんと説明できる目標値です。貢献限度レベルを研究者自身がきちんと定めておかなければ駄目です。

手書きの数字の読み取り率の目標が97%以上というとき、ある方法で85%ぐらいまでしかいかないとしたら、その方法論は捨てなければいけません。今まで一生懸命研究してきてもあえて捨てて、違う考え方、違う方法を見つけ出さなければならない。

産総研と開発した新しい文字認識装置

郵便番号読み取りの商用機を1969年に納入しました。1970年から通産省(当時)が始めた高性能電子計算機システムの文字認識装置の開発に参画しました。一緒にやることになったのは産業技術総合研究所(産総研)の飯島泰蔵先生の研究室です。既に飯島先生はパターン認識の理論について本をお書きになっていました。この理論を使ってやってくれないかという話だった。典型的に産総研流ですね、成果が出たからこれを使って応用を考えたいという。

われわれのほうは、手書き数字のデータをたくさん持っていました。郵便の方でどんどん手に入りますからね。手書き数字を読み取る方法論としては、97%以上読み取るものを持っていました。ところが、先生の理論どおりにシミュレーションしても97%に行かないんですよ。だから、この理論はまだ改良の余地があるはずだと、われわれは主張しました。先生の理論は通信理論からきています。通信理論というのは、通信の信号にどこかで雑音が乗ってそれが届くというもの。届いたものの中から雑音分をフィルターで除去すると正しい信号に戻る、という考え方が基本です。しかし、この基本的な方法論に基づいて改良してもちっともよくならない。

意見が対立したまま1年半ぐらい経過し、産総研の若い人たちは、自分たちでハードを作り始めました。私は飯島先生に「困りましたね、どうしましょうか」と相談しましたが、先生が「もう少しこの理論の改良を続けてみたい」とおっしゃるので、改良を続けました。そんな時、若い研究者が「雑音が加わる」という考え方が問題じゃないかと思い付いたんです。例えば手書きの字というのはいろいろな字形がありますね。それを信号プラス雑音と考えるべきではない。要するに、字形そのものにいろいろなゆがんだものが入っている実態をつかまえないといけないんじゃないかと。

手書き文字や印刷された文字はどれだけ変形の要素が加わっているのかを主因子分析でやってみようということになった。手始めに印刷されたアルファベットを分析しました。そうしたら、印刷活字は、変形の要因が何と3つだと分かったんです。字体によって大きさは同じにしておくと、横線がずれるか、縦線がずれるか、線が細いか太いかの3次元で表せる。その3つは独立現象ですよね。

手書きの数字を分析してみると15次元ぐらい、音声は20次元ぐらい、こういうことで文字の変形の実態がどんどん分かってきたんです。そうすると、飯島先生は本当に素晴らしい先生で、変形に煩わされないで認識する方法論を作ってくれたんです。その理論が「複合類似度法」です。これをシミュレーションしてみたら、97%を超える。やっとわれわれは世界的な新しい方法を編み出した。しかも数字だけじゃなくてアルファベットや漢字まで十分対応できる。それで、1971年にアスペクト71という名前を付けてその装置を公開しました。

開発は潜在ニーズ調査から

この研究の続きとして、会社が通産省に、印刷された漢字を読む機械の開発を提案しまして、それで漢字認識装置の研究開発というプロジェクトが始まりました。

まず、市場調査を行いました。通産省、法務省、外務省などの役所や新聞社を回り、「手書きの文章、書類を読み取る装置を作ろうと思うんですが、どんな場面で使っていただけますか」「どんな使い方が考えられますか」「どのくらいの値段の装置だったら、その業務としてペイしますか」などと聞きました。要するに、潜在ニーズを探り出そうとするのが常に私のやり方なんです。技術が先じゃないんです。

通産省の計算機室長だった辻井さんという方が「確かに役所は手書きの書類だらけ。だけど、日本語のいいタイプライターがないから、仕方なく手で書いている。日本の役所が欧米の役所より生産性が低いとよく言われるが、欧米ではタイプライターを使って文書を作っているから能率がまるっきり違う」と言う。だから、手書きの文書、つまり既に書いてしまった書類を読む機械を作るんだったら、その前にそんなことしなくてもいい日本語の良いタイプライターを作ってくれよ――という指摘が、ワープロ開発に関心を持ったきっかけです。他の新聞社や役所の方などにいろいろ聞いても、「外国で使われているようなタイプライターが欲しいよな」と言われました。

その当時、学会では、日本語ワープロの根幹であるかな漢字変換は実現不可能だと言われていました。しかし、私は、研究所の所長に、こういうコンセプトの日本語タイプライターを実現したい、そのための方法論を研究したいと申し入れました。「文字読み取りの研究はどうするんだ」と言うから、「それは、オンザテーブルの研究としてちゃんとやります。アンダーザテーブル研究でワープロの研究をやるということを認めてください」と説明しました。所長は、アンダーザテーブルの研究段階ではどんな成果を出したって評価の対象にしない、正式研究テーマでないから研究費は使わせないが、おまえがそれだけ言うなら、1%の所長枠の経費があるから使えと言ってくださったんです。それで、文字読み取りの研究をしている仲間を説得し、私を含め4人が夕方5時以降、かな漢字変換方法について議論し、実験を行いました。

製品のコンセプトを3行に整理

日本語のワープロ、当初は日本語のタイプライターと言っていましたが、その開発も、市場の潜在的なニーズをつかむことから始めました。いろいろな人に「日本語の良いタイプライターとはどういうものをイメージされますか、どういう機能があったらいいと思いますか」ということを聞いて、メモしていくわけです。

それから、われわれ4人でコンセプト創造というのをやりました。日本語のいいタイプライターというのは3行で表したらどんなものなのかと。調査した結果を整理、グループ分けして、最終的にまとまったのは次のようなものです。

・手書きよりも早く日本語の文章ができる

・欧米のタイプライターのようにどこにでも持っていけるポータビリティー

・文書ファイルに、電話線を通じてどこからでもアクセスできる

1行目の「手で書くより早く」を実現するために、先ほどの貢献限度レベルというのが出てくる。「かな」あるいはローマ字で入力して漢字に直す時に日本語に多い同音異義語が問題です。入力したい単語を、1回目の変換でどれだけ出せるのか、つまり第一変換率をどれだけ高くできるかがカギです。実験した結果、手書きより早くしようと思ったら、第一変換率が95%以上でなければ駄目という、貢献限度レベルを見つけたわけです。

当時、例えば九州大学の先生がかな漢字変換の方法論の研究をやっていて、それを研究しているメーカーもありました。われわれも最初その方法をチェックしたんです。ところが、その方法だと貢献限度レベルが85%ぐらいしかいかない、どうやっても。今までの方法論では、絶対これは越えられない。割合早い時期に見切りをつけました。みんなでアイデアを出して、シミュレーションやってみてやっぱり駄目だ、あれも駄目だと、そういう繰り返しです。かな漢字変換にめどをつけるのに6年かかりました。6年目に、あらためてワープロ研究開発の企画書を会社に出しました。これが通って1972年にやっと正式な研究テーマになりました。その後、初めてその研究を専任でやる研究グループを作ってくれました。

人材育成に大学と連携

新入社員を国内留学させるなど、大学と人材面の連携も進めました。文字読み取りの研究グループには、私を含めコンピュータで言語を扱うということをやった者がいなかった。だから、基礎知識をきちんとマスターしなければどうにもならないと思っていた。われわれの文字読み取りの研究に入ってきた新人をすぐ京都大学の長尾真先生のところへ勉強に行かせようとしたんです。そうしたら人事部から文句がきてね、何で最初からそういう人材を採用しないのかと。

計算機で言語を処理するというのは、長尾先生や同じく京都大学の坂井利之先生のところが始めたばかり。その新人は言語研究の素養があるので、本格的にそういうことを勉強させたいのでと説明したが、すぐには認められず、次の年の4月から認められた。京都大学で学び、戻る時に修士の人を連れてきました。

こうして、研究を続け、1978年9月26日に最初の日本語ワープロJW-10を発表しました。

コンセプト創造の方法論を実践

国産ワープロを開発したときのコンセプト創造の方法論を、1991年、私がパーソナル情報機器事業本部長になったときに、実際にやらせました。この本部には3つ事業部があり、その1つのパソコン事業部が赤字でした。事業を改善する時にV字回復では不十分で、J字回復にしようということで、パソコンの潜在ニーズを探らせた。そのときは世界市場の99%がデスクトップパソコンでした。課長クラスをリーダーに3つのチームに、市場が潜在的に求めているパソコンのコンセプトを創らせたわけです。

1番目のチームは営業マンを未来顧客としてA4大学ノート3冊分の大きさ、厚さ、1キログラム以下という1行のコンセプトになりました。1992年に最初の製品ができましたが、厚さは3センチぐらい、重さは3キログラムぐらいありました。だけど、大きさがノートというのでノートPCという名前を付けました。だから、今ノートPCの元祖は東芝だということになっているんです。

2番目のチームは、背広の内ポケットに入らなきゃ駄目だというので、リブレットというサブノートを提案。翌年の1993年に売り出しました。3番目のチームは、箸にも棒にもかからないというので没。

コンセプトを創る時に7つのステップが必要です。その7ステップの中で5番目のステップが時間がかかるんですよ。

第1のステップは、仲間を7人集めること。

第2のステップは、未来の「お客さん」の定義をすること。

第3のステップは、その未来の「お客さん」に該当する人々にヒアリングし、自分のアイデアも加え、みんなでブレーンストーミングをすること。

第4のステップは、さまざまなアイデアをグループに分ける。15とか20のコンセプト・グループができる。それぞれのグループについて、その中のアイデアの大部分が実現したら未来の「お客さん」にどのようなメリットをもたらすのかを1行で表現する。

最大3つ残して他は捨てる

第5のステップは、多くのメリットの中で未来の「お客さん」にとって最も重要なものを最大3つ残して、それ以外は捨ててしまう。ところが、この捨てるというのができません。議論が始まると、このお客さんにとってはこの機能のメリットはすごく重要ですよと言い出す人がでてくる。そうなって、議論がまとまらなかったら、議論することを一切やめて、チームを解散してしまいます。何週間、何カ月かが経つと、頭の中でだんだん整理が進むわけです。重要と思ったけど、そうでもないよなといって沈んでいくアイデアもある。そうした時に誰かが、こういう切り口では前に議論しなかったんじゃないですかとリーダーに言ってくる。何か新しい切り口を見つけるんですよ、着眼点を。そうしたら、そうだね、それじゃもう1回集まってもらおうかといって議論を再開すると、一気に最も重要なメリットがどれであるかが決められるのですよ。

そこで6番目のステップになる。3行を選んだとしても、これは7人が合意しただけなんです。だから、もう一遍未来のお客さんのところに行って、お客さんの言ってくださったことはこんなものですかといってその3行―1行でもいい―についての感想を聞く。そうして、7割以上のお客さんから肯定的なレスポンスがなかったらやり直す。肯定的なレスポンスというのは「これだ、これだ、おれが言ったのは」とか「これいつできるんだ」というもの。もう自分で使うことを想定しているわけですよ。ところが、否定的な回答を見極めるのは難しい。「面白いね、だけど……」と「だけど」がついているのは何か不満があるわけですよ。だから、それは否定的な感想に分類する。で、聞いた未来のお客さんの7割以上が―聞きに行くお客さんというのは何となくこっちに好意を持っている人だから、その人が5割じゃ駄目なんです―このコンセプト結構面白いじゃないかとか言ってくれなきゃ駄目なんですよ。

肯定的なお客さんには、その3行のうちどれを最初に実現したらいいと思いますかということも聞くんです。

最後に7番目のステップで、その3行は今の技術で実現できるかどうかをチェックする。もしも実現できない技術があったらば研究開発のテーマにする。

根本の発想が違うマニュアルレス

4年ぐらい前でしたか、ある会で「買ってはならない携帯型情報機器」というタイトルで話をしたことがあります。

チェックの条件は3つ。店に行ったら、この機器は幾つ機能を持っていますかと聞く。その機器のボタンの数よりも機能の数が多かったら買ってはいけません。

2番目は、その機器のマニュアル、取り扱い説明書を見せてもらう。それがポケットに入らないような厚さだったら、その機器は買ってはいけません。

3番目の条件は、壊れたり使い方がわからないときに相談するコールセンターの電話番号を聞きます。店でその番号に電話をかけて、つながらない場合は、その会社のコールセンターは混んでいる、つまりその設計がよくない証拠である。

そういう話をしたら、意外と沸いて、目の前に座っていた大手メーカーの副社長が、「森さん、きついな、あんなこと言われたらうちの製品は全部アウトだよ」って。

そうしたら、2番目のマニュアルなしという製品が出たんです。あれはさすがだと思ったね。アップル社のiPod、iPad、iPhone、全部マニュアルレス。マニュアルがないのが共通項なんです。これに気が付いている人はあんまりいないんです、学生たちにも聞いているんだけど。マニュアルレスにするというのは、スティーブ・ジョブズがすごくこだわっていました。僕はパターン認識なんかやっていたものだから、アップルの研究所に何回か行き、研究者とディスカッションなんかしました。スティーブ・ジョブズは、最初に社長になったときから、マンマシンインタフェースに強い関心を持っていました。

iPodが出たとき、日本の評論家が、あれはウォークマンの後継機種だ、だからソニーから出て不思議はないのに、と評論しました。僕は、その評論は大間違いだと思いました。iPodの一番すぐれているところはマンマシンインタフェースなんですが、マニュアルレスにするという研究をソニーは長時間掛けて研究していない。

マニュアルレスは根本の発想が違います。従来の延長線上じゃないですからね。ジョブズは、潜在ニーズをつかんでいてそれを実現したからヒット商品を3連打でき、事業はどんどん伸びたわけです。

今の日本は、上の人が本当のイノベーションを、つまり革新を求めないからこうなってしまっている。上の人が安定路線をやると下の人もその通りになる。だから、若い人のせいじゃないと僕は思っています。