Gプレス
シェイク!Vol.12 見せ方一つでデータを面白くする(2)
小国士朗(NHK制作局)×有沢慎太郎(NHK編成局) ×田中直基(Dentsu Lab Tokyo)×金沢慧(データスタジアム) ×森永真弓(博報堂DYメディアパートナーズ)
異なる業種で活躍する5人がそれぞれの視点で語り合い、新たな価値観を生み出すヒントを見つけるトークセッション「シェイク!」。
連載2回目は、いよいよZUNOさんプロジェクトの立ち上がりから核心へと迫っていきます。
ZUNOさんはどう作られた?
ZUNOさんが脚光を浴びたきっかけは、いちばん最初にやった順位予測ですよね。
見ました見ました!
なんか、阪神をね、最下位にしちゃったんですけど(場内笑)。
あれを見たときの阪神ファンの気持ちを察してください(笑)。
ざわついたよねー。
そうですね。阪神ファンの方から、「zunoを道頓堀に沈めるぞー」とかけっこう言われました。ディープラーニングを使って順位予測を出したんですけど、今、だいぶ順位も見えてきて……まあ結構外れてますよね(笑)。特にパリーグは大谷選手の怪我でだいぶ予測がしづらくなりました。
ZUNOさんには入れられるデータは全部データを入れた、とのお話ですが、たとえば7年投げているピッチャーが、2年前にフォームを変更していた場合、7年分のデータを入れるより、最初の5年のデータは捨てて2年分のデータだけで予測た方が精度が高くなりそうですけど、今回はそういった調整はされたんですか?
持っているデータはぜんぶ提供しました。プロ野球って1年間で25万球あるんですね。我々は2004年から、その1球1球について、どこのコースにどんな球速の球がいったのかを手作業で取っています。ぜんぶ提供したなかで、どういうふうにディープラーニングをして予測していくかは、deep learningをメインで担当していた徳井さんにやっていただいていました。
ZUNOさんにはすべての投げた結果を学習させています。いわゆる逆球や、コントロールの悪いピッチャーの暴投、全部ふくめて結果を学習しています。なので、フォームを途中から変えていたとしても、インプットという意味ではすべての年の分を均等に学習しています。あと、AIプロジェクトってどれもそうだと思うんですが、ZUNOさんは、完成体というよりも、実験的に試行錯誤してどんどんアップデートしていくものなんです。
我々のデータのなかには、フォームが途中から変わったっていうデータはないんですね。ただ、たとえばストレートの割合が多い時期が続いていたのに8月からはスライダーが60%になりました、つまり、ストレートを投げなくなりました、と、ディープラーニングで判断している可能性はあります。結果的に合っているもの、正しそうだと思うものをどんどん学習していって予測を出しているのではないでしょうか。
配球という言葉をよく使うからZUNOさんはピッチャーの視点で考えられがちなんですけど、実際はバッターの視点に近い。バッターにとっては、すっぽぬけだろうが逆球だろうが、来た球こそが結果なので。バッター視点で大量の学習データのなかから、次になにが来るかを予測しています。先日、テストとして元メジャーリーガーの高橋尚成さんにZUNOさんと予測対決をしてもらったのですが、やっぱり、元ピッチャーだと、自分ならこう投げるというバイアスがかかって意外と外しちゃったりすることが分かりました。
このピッチャーは外れがちとか、さっきの大谷くんみたいなコントロールがいいピッチャーは当たりがちとか、何試合か回した中で見えてきたものはありました?
この間はピッチャーがたまたま調子が悪くて制球できてなかったんです。そのときはZUNOさんも大外しでした。
じゃあやっぱり、ZUNOさんが予測を得意なピッチャーと不得意なピッチャーがいる?
たぶん、いつもと同じ投球を常にするピッチャーはやりやすい。今日はカットボールがいいからっていきなりカットボールを70%ぐらいにするダルビッシュとかは、今日いいよっていうのをその日のなかで学習しないと予測ができない。
いつ投げてもコントロールが悪いピッチャーは当たるとも言えます。この日だけは悪いっていうのだと、このシチュエーションならこれの可能性が高いという予測がズレてくるかもしれない。
もう引退しちゃいましたけど、新庄みたいなタイプは気まぐれすぎてまったく追えなくなるんでしょうか。
でも意外と、データで見たら気まぐれでもなかった、ということがあったりします。
気まぐれとか非論理的に言われることも、データで見たらなんらかの傾向が見つかったりするのは面白いですね。他にも、火事場の馬鹿力みたいなことって神がかった言い方をされるけど、データを見たら、こういう状況では火事場の馬鹿力が出やすいという傾向が見つかるんじゃないかってよく話してます。
ZUNOさんを解説者と対決させるだけじゃなくて、実況アナウンサーにZUNOさんを持たせて、アナウンサーがそれを見ながら解説者に厳しい質問をするという使い方もできると思ったんです。ZUNOさんによって番組を作る側が変わることも起こるんじゃないか。データやAIが出てきたことで人も変わる、みたいなことって、野球の中継でも起きたりしそうでしょうか。
アナウンサーって情報量がすごいんですよ。スポーツアナの実況前のメモを見せてもらうと、半端じゃない量を調べている。しかも足を使って取材するので、一次情報を取ってるんですよね。その情報をどのタイミングで話すかも重要です。データと取材力と話芸の掛け算でできている。なので、単純なデータでどうこうってことはあんまりないような気もするんですけど。ただ、いいサポーターにはなりそうな気がします。なんか、松木本安太郎が叫んでるけど、まあまあ落ち着いて、ZUNOさんはこう言ってるよ、みたいな(笑)。演出側としては幅が広がる気はします。エンターテイメント性が出て、入り方として面白いと思います。
ZUNOさんに番組サポーターの機能が出てきたら、野球にくわしくない女子アナやタレントさんを持ってくるような作り方もできるようになる?
あるかもしれませんね。それも面白いと思います。
ZUNOさんの準備期間はどのくらいですか?
議論した期間は長かったんですが…
いざやるぞとなってからは、2~3ヶ月で作りました。
その短い期間でできたのは、データスタジアムさんのデータセットがすでにあったことが大きいです。ディープラーニングの場合、データを一から作ることが多いんですけど、今回の場合は、そのステップを飛ばすことができたのが大きいです。
あと、それが効くかどうかはわからないけど、こういうデータを入れたほうがいいという話もしました。例えば、ピッチャーが右のときにバッターが左なのか右なのかによって投げる球種が変わってくることがあります。ほんとはディープラーニングでぜんぶ検索してほしいところではあるのですが、最初から分けたデータにしておけば解析もしやすいだろうと。データセットを加工するというよりは、視点ですね。こういう視点を入れたほうがいいと思います、という話は最初からしてました。
そうですね。いろいろアドバイスをいただいたおかげで、トライアンドエラーをする過程が短く済みました。
私はぜんぜんスポーツに興味がなくて、仮にAIを組める知識があったとしても、ZUNOさんは作れないなと思いました。やはり、手作業で作られた野球のデータがあったからこそ、ZUNOさんは完成したのかなあと。逆に、データの専門家だけどAIの中身をまったく知らない人が作ってもうまくはいかないと思うんですね。知識の組み合わせや協力の関係が大事なのかなと思いました。
我々の存在意義はそこにあるのかなあと思ってやっているのですが、どうですか?
いやまさにそうですね。今回、データスタジアムさんがいなかったらうまくいってないと思います。そもそも我々チームに野球経験者がいないという。
直基くんはサッカーだもんね。おれバスケだし。だから金沢さんに助けられました。
金沢さんは特異な存在ですよね。野球とデータ両方の知識がある方が一人いるだけで、だいぶ助かりました。
そうすると、データと何かの組み合わせの知識を持った人がいる業界といない業界で、発達が変わってきそうですね?
そういう意味で、スポーツは遅いほうだと思います。高校野球ばりばりやっててプログラミングも得意ですって人、あんまりいない(笑)。
野球が好きな人は統計に興味がないし、統計学やプログラミングが好きな人は野球に興味がない。
データスタジアムさんって、以前は会社にお邪魔すると、明らかに体格がいい体育会系出身ぽい方々でオフィスが占められてたんですよ。ところがここ数年、おそらくスポーツ経験してなさそうなテクノロジー系やゲーマー系の社員が増えてきてますよね。社員の層が変わってきています。
ニコ動の生主が新卒で入ってきました。
実況者が。
多様だなぁ。
スポーツ業界も少しずつ変わってくるのかもしれないですね。