【TURING 山本CEOインタビュー➂】ソフトウェアとハードウェアを仲良く
大好評、今日本一熱い自動車ベンチャー「TURING」山本CEO(@issei_y)インタビュー。
第3回は「ソフトウェアとハードウェアを仲良く」、よりよいクルマをつくるために必要なこと、自動運転のために必要なAIの進化、「カメラ」を採用した理由、自動運転の「イマ」についてお聞きしました。とても充実した、ここでしか読めない対談。それでは早速続きをどうぞ。
ソフトウェアとハードウェアを仲良く
山本:やっぱり生産技術は、日本は世界トップクラスなのは間違いないと思います。一方で、弱点はやっぱりソフトウェアですよね。
すごく問題なのは、ソフトウェアとハードウェアが仲良くできていない。異文化過ぎてそもそもどうやって付き合えばよいかわからない。TURINGの仮説はソフトウェアとハードウェアが仲良くなれば、日本からもっといいクルマが作れる。重要なのはこの点だと思ってるんですよね。
カッパ:TURINGさんは、ソフトウエア、AIドリブンのところを掲げているのはすごく新しい、日本の中では他にない会社だなっておもっています。
山本:みんな下(ハードウェア)から車作りますもんね。
カッパ:自動車業界の中でもハードウエア、エンジン屋さんが一番強くて、ソフトウェアが一番弱かった。これからはどんどん自動運転を含めてソフトウェアが強くなっていく中で、ソフトウェアのところから発進、スタートでやっていくことは、日本の自動車業界に新しい風として受け入れられると思ってます。
山本:一方で気をつけなければ我々上(ソフトウェア)から作ってきてるんですけど、別に下(ハードウェア)に対する敬意がないのは絶対ダメ、ちゃんと下周りの勉強をしていかないといけないと思ってます。TURINGでも少なくとも電装系に関しては相当わかるようになってきています。
上から下までちゃんとやっていくし、別にどこが偉いとか本来はないわけですよ。理想的な話をすれば向くべきは社内の関係性じゃなくて、お客さん。これは難しいですけど、すべてのレイヤーはお客さんのためであるべきです。
カッパ:自動車が難しいのは、人の命をどうしても扱うというところがあるので、そこでの堅牢性、安全性をすごく重視してつくられているところですよね。特にハードウエアに関して。
山本:乗り越えなきゃいけないところの要求水準の高さは、本当に桁違いかなと思っています。
社会のクリティカルパスまで進出したAIの進歩
山本:ただ、ソフトウエアやAI、スタートアップがそういった社会の本当のクリティカルパスに関われるようになったことは誇りでもありますね。言ってしまえば、ちょっと前のAIは将棋など、いわばゲームだったわけです。別に生き死にの問題じゃないじゃなかった。ゲームに命がけな人もいるのでその点はおいておいて、基本的な意味では、生き死にの問題ではなかったわけなんですね。一方で、車や医療、例えば画像診断などとまさに生き死にの問題に直結するところで、人に替わる判断、AIが人を超える判断をしていく時代になってきていて、これはすごく誇りあることだなと思ってます。
世界を理解しないとレベル5は作れない
山本:これはよく思う話なんですが、TURINGがハンドルがない車を作れるか作れないかは、一旦おいておき、おそらくテスラか、あるいは中国のまだ名前もないようなスタートアップによって、そんなに遠くない未来にハンドルがない車の製造はされるだろうと思っています。
カッパ:それはレベル4じゃなくて5という意味ですか?
山本:レベル4と5は一見、隣にいるように見えるんですがプライベートカーだと、技術的にはかなりギャップがありますよね。
カッパ:そうですね。レベル5だと、地域を問わず、全部走れるっていうのはとてもハードルが高い。特定の地域に限るレベル4だけだったらまだしも、レベル5は本当に難しい。
山本:レベル4と5はアプローチが違うと思っていて、レベル5はこの世界を包括的に理解できるようなAIがないと実現できない。最近話題の絵を描くAI。あれはパソコン、ネットワークの中に世界知識が相当内包されていて、世界に関して相当詳しいんですよ。恐ろしい話ですよね。
我々もこの脳みその中に、世界に対しての理解が入ってるから運転ができる。今の運転支援は、この世界の知識とかではないです。白線に関する知識などいくつかドメインスペシフィックなデータはたっぷり入ってるんですけど、そうではなくて、この世界作っている深い、いろんなレイヤーの知識が入ってないとレベル5は実現できないと思っています。そういうことを達成しようと、テスラは考えてますよね。
なぜ「カメラ」なのか
https://note.com/issei_y/n/n367368c7c5bcより
カッパ:世界を学ぶという点で、運転は認知、判断、操作がある中でTURINGさんは認知でカメラを採用されています。他のLiDARやミリ波センサーではなくて、世界を知るためにカメラを採用したところを選択された大きな理由ってあるんでしょうか。今、テスラが唯一カメラを推していて、他はLiDARが中心になっているトレンドがあると思うのですが。
山本:そんなにこだわりがある訳ではないのですが、センサーのチョイスは幾つかレイヤーの話がごちゃごちゃになっているので、一番強調したい話をします。
解像度、レゾリューションの点で、ほかのセンサー類に比べるとカメラが圧倒的にレゾリューションがずば抜けていて、たくさん有用な情報が来ます。もちろんLiDARでもセンサーでも、あるいはマイクなどからもいろんな良い情報が来るんですけど、カメラの解像度がずば抜けてます。人間も主にカメラと同じ可視光を上手く扱って、運転しています。
コンピューターサイエンスの中で画像、可視光を扱うコンピュータビジョンの領域はAIが非常に進んでいる世界。その点から見ると可視光は車の話と関係なく、今後どんどんのびる。そう言った意味で、カメラは非常に興味深く、まず最初に挙げるべきセンサーだと思っています。LiDARはだいぶ安くなってきたとはいえ、ポンとつけるにはちょっとしんどい値段です。
カッパ:高いですね。まだまだ高い。
山本:特にSLAM(Simultaneous Localization and Mapping, 自己位置推定と環境地図作成の同時実行)をしようと思うと、かなり高価なものにする必要がありますし、まず前提としてSLAMが実現すること、ローカライゼーションができていたら、自動運転ができるのかは疑問があります。ただ衝突センサーとして、非常に便利なのはありますけどね。カメラとセンサーの使い方は一対一対応してるわけではないので、この問題は難しいんですけど、今のところ、カメラで必要十分ではと思っています。
もちろん、他のセンサーがavailability(正常な状態で継続的に使い続けることができる耐久性)が良くて、非常に安くなってという話があったら、使わないこともないと思うんですが、今のところセンサー界隈の値段とコンピュータサイエンスで基本的に可視光を使う学問が進んでいることを見ると、カメラでいいんじゃないかって思っています。
「頭が良い」から運転できる
山本:すごい大事だなと思ってるのは、人間は視力がいいから、運転できてるわけじゃない、頭がいいから運転できているんですよ。
カッパ:判断、操作の部分ですね。
山本:頭いいから運転できてる、まずそこは絶対。だから、レベル4、5になるとそこから逃げることはできない。実現するためには頭の良いAIを作らないといけない。認知判断も分けていましたけど、人間は渾然一体となって判断してますし、これからのAIは分けずにやるべきなんだろうなって思ってます。
カッパ:AIを作っていく際には、山本さんの得意分野、深層学習でやられると思うんですが、頭の良いAIにするためには教えないといけません。その教え方はたくさんの運転データを取ってくるところから始まります。個人的にすごく気になっているのは、深層学習で取ってくるデータの中で、運転の上手い下手があると思っていて、その評価とかってどういうふうになってるのかなと。どういう風に学習させていくのか。
山本:まだ運転の上手い下手とかいうレベルじゃないんですよ。
将棋ならプロ棋士の中で誰がうまいとか考えなくちゃいけないようなレベルに到達しているかもしれないですけど、自動運転は今はそもそもまともにできてないっていうレベル。普通に運転できる人は、今のAIからすれば、桁違いに上手いです。テスラをもってしても。ですので、現段階ではそれほど気にしなくてよいはずです。
自動運転の「イマ」
カッパ:山本さんはテスラを所有されていると思うのですが、人間の運転と比べてテスラの自動運転はどうですか。
山本:一部特定の場面だと人間を超えているなというところもあります。
日本版、アメリカ版は能力の制限具合が違って、日本版は非常に限定的な能力ですけど、高速道路などの車線に対して間を走る能力は完全に人間を超えてますよね。トップの人間を出せば、また変わるかもしれないですけど、少なくとも私よりは上手い(笑)
自動運転の良いところは、集中力が途切れないところですよね。減らない体力という点で圧倒的かなって思ってます。例えば、新東名とかを走るんだったら、是非使いたい能力ですよね。
一方で難しいなと思ってるのは、下道とか高速道路でも環状線回りとか入り組んでいるところ。限定された環境下では、人間を上回ってますけど、やっぱり判断が絡んでくる場面になると全然ダメですよね。車線の間を走るのではなく、複雑な判断をして走るところはAIはまだ全然ダメ。
ただ、これも急速に伸びていて、私は5年後「まだ全然」とは言えないと思ってます。
日本でもバズっているテスラの自動運転能力を検証する動画、アメリカでは、すでに結構自動運転が実用されていて、それを見ると、部分的にはかなり強力な能力を持っています。例えば、対向車や歩行者と「あなたが先に行くから私は止まります」「あなたが待ってるから私は先へ行きます」といったある種のネゴシエーションができている。
これはセンサーの話じゃないですよね。センサーがどれだけ良かろうが、判断ができなければどうしようもない。逆に言うと、判断がすごい賢いんだったら、レゾリューションが大きい方が良いという点でカメラが優れている。例えば他のセンサーだと人の挙動、ボディーランゲージや、あるいはフェイシャルレコグニション(顔認識)までは届かないわけです。我々は人の顔を見て運転してますよね。そういう意味で、やっぱりポテンシャルではカメラがずば抜けていると思っています。
カメラの弱点はどうする?
カッパ:カメラ、ハードウェアの観点だと、どうしても視認性、見えなくなったときにどうするのか問題は付きまとってしまうと思うんですが、その点ってどう思われますか?センサーやLiDARと比べると、その問題は大きく、ハードウエアとしての安定性が乏しいんじゃないかと言われています。
山本:人間はどうやって運転しているのでしょう。
カッパ:そうなんですよね。人間が雪や雨などの視認性の悪い中でどう運転しているのか。
山本:まず前提として、人間も雪や雨の中では危ない。別にどんなセンサーを持ってこようが、雪の日は雨の日は危ない。自動運転にしても人にしても危ない。だからどう補完し合うかという関係であるのですが、レゾリューションの面ではカメラがずば抜けているので、ポテンシャルを出しきるのだったら、カメラはすごく有用だと思います。
何のセンサーを使ってもいいんですけど、本当にたくさんの情報が欲しい。例えば、人の顔を読むことは、人間は普通にやっています。そうするとカメラは外すという選択はないはずです。一方で人間もミリ波レーダーがあれば、ピピッと言ってくれるだけで駐車はかなり楽になります。
カッパ:直近でテスラがテストで子供をひいてしまう動画がすごいバズってましたけど、あれも結局LiDARが衝突物を検知がしやすいという話と、カメラの使い方、判断の違いかなと思っています。
山本:あれはテスラダメなんじゃないかと思ったりしますけどね(笑)
例えば難しい話、人の写真や絵をどう認識するか。トラックの上に、人が描いてあることは往々にしてあります。作り物を認識して、判定しないようにしなきゃいけない、そういう難しさがありますね。
カッパ:一時期ネットで話題になった、天下一品の看板を「止まる」の標識と認識してしまう、ガスタンクローリーで、ピッカピカの面に車が映ってそれをどう認識するのかといった問題はありますよね。
山本:どのセンサーを採用しても、ガラス、鑑、フェンスは鬼門ですよ。LiDARだから解決できる話じゃない。透過と反射は波長帯の問題があって、絶対にこれが正解と完全に言えない。フェンスやコーンはセンサーが良くても分からないんですよ。
カッパ:テスラはコーンの認識が苦手とニュースで見た記憶があります。
山本:そんなことはないですね。テスラのコーンの認識力はすごいですよ。明らかに人よりコーンの認識が得意。我々は人間なんで人間に興味があり、コーンに関心はさほどない。テスラの自動運転、日本版ではコーンの認識は人間よりもはるかに優秀ですね。道路上でコーンは極めて有用な情報です。
次回、最終回は「AI、そしてTURINGが世界を変えていく」AIが人間を超える時と社会的需要性やTURINGの「イマ」「これから」についてお聞きしました。
最終回までばっちり面白い、中身の濃いインタビューになっております。乞うご期待です!
【イベントのお知らせ】
15日21時からぜひ予約を!
twitter.com/i/spaces/1lDxL… Scheduled: 今日本一自動車ベンチャーTURING山本CEOにいろいろ聞いちゃうspace カッパッパ@ニュースレター「モビイマ!」🚗’s Space · Where live audio conversatio twitter.com
質問してほしいことがあればTwitter宛にDMもしくはリプいただければ!自動車のみならず、ベンチャー、AI、深層学習関連の質問でもOKです。
皆さんのご参加お待ちしてます!
・CASEなどの業界トレンドを詳細に解説
・各自動車メーカーの戦略や決算分析
すでに登録済みの方は こちら