トピックス

「数理・データサイエンスと大学」インタビュー

第7回 京都大学情報学研究科教授
国際高等教育院附属データ科学イノベーション教育研究センター長
学際融合教育研究推進センター高度情報教育基盤ユニット長 山本章博教授
論理で周囲を説得し
進むべき方向へ踏み出せる人になれ

全学部の1、2年生だけでなく、大学院修士1年生にもデータサイエンスの共通教育を施している京都大学。大学院生向けで実用性の高い入門プログラム「データ科学概観」は短期集中型。これを協力校や他大学にも提供できないか現在検討を重ねている。京都大学国際高等教育院附属データ科学イノベーション教育研究センター長の山本章博教授に、6大学コンソーシアムにおける京大の役割や、期待する人材像について聞いた。

第3の“語学”であるデータ科学を駆使できる力を養う

―京都大学におけるデータサイエンスの教育体制について教えてください。

今の時代の基礎教養として欠かせない情報学・統計学・数理科学の3つを、全学部を横断して体系的に学ぶためのカリキュラムや教材を開発する目的で、2017年、国際高等教育院という組織の下に「附属データ科学イノベーション教育研究センター」(以下、データ科学センター)を設置しました。

国際高等教育院は、全学部の主に1、2年生を対象とした教養・共通教育、さらに大学院の修士課程1年生を主な対象とした共通科目を統括する役割を担っており、データ科学センターのほかにも外国語教育を目的とした「附属国際学術言語教育センター」、留学生に日本語と日本文化を教える「附属日本語・日本文化教育センター」の3つのセンターを統括しています。つまり、データ科学は第3の語学であり、全員が修得してしかるべき科目なのだと学生たちには話しています。

―京都大学全学部の1、2年生が、共通教育として語学と同じように必ずデータサイエンスの科目を学ぶ仕組みになっているのでしょうか。

全学部が必修ではありませんが、学部ごとに「自然科学系」から何科目を選択しなさいと縛りを設けてあり、自然科学系科目としてデータサイエンス科目を取る形になっています。

―履修の状況はいかがですか。

1学年2800人中、1800人ほどが「統計入門」あるいは「数理統計」を選択しています。医学部は必修、理系学部ではほぼ必修であったり、履修しておくと有利に働くようにカリキュラムを組んでいる学部・学科も多いです。

文系の学生も共通して学べる教材をデータ科学センターで制作しているところです。まずは15回分の教材をつくりました。希望する大学にはコンソーシアムを通じて提供しています。

ちなみに本学は文部科学省の「関西広域医療データ人材教育拠点形成事業」の代表校でもあり、その担当組織である医学研究科とわれわれデータ科学センターとが相互に連携する体制にもなっています。

データ科学の最前線に触れる「データサイエンススクール」

―6大学コンソーシアムにおける京大の役割について教えてください。

京都大学は、大阪大学、滋賀大学と共に近畿ブロック155大学に数理・データサイエンス教育を普及させていくことがミッションです。京大ならではの特色を打ち出したプログラムを提供できればと考えています。

前述のように本学では国際高等教育院が大学院修士1年生に対しても共通教育を提供しています。学部生では半年かけてカリキュラムをこなしていきますが、大学院生の場合はより実用性の高い内容を2週間から1ヵ月の間で集中的に特訓していきます。これは学部学生もやる気があれば受講できるようになっていますが、この大学院生向けの入門集中プログラム「データ科学概観」を他大学にも提供することを考えています。

京大のもう一つの特色ある試みが、研究所の先生や企業から講師を招きデータサイエンスの最前線を学生たちに学んでもらう「データサイエンススクール」です。1回の日程は1~2日間で、講義とPCを使った演習を組み合わせています。講師が許可した場合は、他大学の学生や社会人も受講することができます。

京大には多くの研究所やセンターがあります。学部は10学部ですが、研究所・センターは20を超えます。研究所・センターには著名な先生が数多く所属しており、自分の研究がいかに魅力的か、学部生にアピールする機会を探しています。ですからデータサイエンススクールの講師をお願いすると、みなさん快く引き受けてくれます。学生にとっても研究の最先端に触れられるチャンスとなるので、こうした機会をできるだけ増やしていこうと考えています。

―データサイエンススクールの反響はいかがですか。

2018年3月から2019年の11月まででデータサイエンススクールを33回開催しており、学生の中には複数回を受講するリピーターが増えています。また先生の側からも「講師をやらせてほしい」と声をかけてもらえるようになり、好循環が生まれています。

医学部附属病院の先生が講師を務めた回では、保健医療のビッグデータを用いた研究について解説してもらいました。また企業から講師を招くこともあります。企業側としては、将来の人材獲得につながるとあって、非常に力を入れて教材をつくりこんできます。学生も注目していて、全国に実験農場を展開する企業による「農業データの活用」をテーマにした回などは、あっという間に席が埋まりました。

データサイエンススクールは、学生たちにデータサイエンスを学ぶ動機づけをするのが目的です。データサイエンスの面白さに目覚める機会を提供することで、自ら「もっと統計学を学んでみたい」という気持ちが増幅するような形に持っていこうと考えています。

エビデンスとして不可欠な統計、新しい価値を創るための情報学

―データサイエンスは情報学・統計学・数理科学が三位一体となっています。このうち情報学と統計学は近いようにも思えますが、違いはどこにありますか。

かつての情報教育は、コンピュータを使えるようにすることが目的でしたが、現在では社会にあふれている膨大な情報をきちんと扱える人材の育成に主眼を置いています。さまざまな情報技術を使いこなして新しい価値を創り出していくことが、情報学の目標です。

一方で情報の中には数値的なものもあります。そうした数値データを利活用する局面で必要になるのが統計学です。欧米では都市問題や農業問題などの政策を打ち出す上で統計学は欠かせません。統計データを政策の根拠としています。また生存率などの医学的エビデンスにも統計学は不可欠です。

統計学の大家ウィリアム・ゴセット(筆名:スチューデント)はギネスビール社の社員でもあり、推測統計学を用いて品質管理に役立てました。数値に還元して大量のモノを管理する、あるいは工程を改善していく上で、統計学は重要な役割を果たします。そうしたことも学生たちには理解しておいてほしいですね。

データサイエンスはデータを集め分析して終わり、ではない

―データサイエンス教育に関して、山本先生の考えを教えてください。

私は実は数学の出身で、大学院から情報学に転向しました。そのときに数学で得た知識が大変役に立ちました。まさに数学と情報学の両方が必要なのだということを痛感しました。統計学については私の場合、学ぶチャンスがあまりなく、自分なりに勉強するしかありませんでした。だからこそ学生たちには数学、情報学、統計学の3つをバランスよくしっかり学んでほしいという思いがあります。

これからはデータの時代です。エビデンスとなるデータはインターネット上にたくさんあり、簡単に集めることができます。しかしデータを集め、分析して終わり、では駄目です。最後に重要になるのは論理です。いかにして相手を説得し、進むべき方向に向けて一歩踏み出せるかが大事です。エビデンスをデータサイエンスによって示し、プレゼンテーションできる人材となってほしいと思っています。

―論理的思考を育むために必要なことは何でしょうか。

生(なま)のデータを見て、そこから言葉を自分で組み上げていくプロセスが大事です。数学がこの世にあるのは、相手を説得するためだと私は思っています。数式を使えば、相手は否定することができません。数理的、情報的、統計的知識を駆使して挑み、対話によって結論を導ける人がぜひ現れてほしいと思っています。

Profile 山本章博

理学博士。1990年、北海道大学工学部講師、94年、同大学工学部助教授を経て、03年、京都大学大学院情報学研究科教授。15年-18年、京都大学大学院情報学研究科長。18年、京都大学国際高等教育院附属データ科学イノベーション教育研究センター長(併任)。研究分野は、数理論理学および形式言語理論を基礎とした機械学習と知識発見。