トピックス

「数理・データサイエンスと大学」インタビュー

第2回 東京大学 数理・情報教育研究センター長
情報理工学系研究科 数理情報学専攻 工学部 計数工学科 駒木文保教授
産業界コンソーシアムの知見を盛り込み、全大学に役立つ標準カリキュラムをつくりたい

6大学コンソーシアムの幹事校として全体を取りまとめると同時に、カリキュラム分科会では主査を務めるメンバーを出すなど、標準カリキュラムの作成を進める東京大学。数理・情報教育研究センター(MIセンター:Mathematics and Informatics Center)を主体として産業界とも連携。学内のデータサイエンス教育の全学的な普及を図るとともに、そこで得た知見を標準カリキュラムに盛り込む。そんな取り組みについてセンター長の駒木文保教授に聞いた。

幹事校としてコンソーシアムを牽引、産業界との連携も進める

―東京大学は、教育強化拠点の大学で形成する「6大学コンソーシアム」の幹事校です。コンソーシアムではどのような活動をしていますか。

全国の大学に向けたモデルとなるデータサイエンス教育の「標準カリキュラム」と「教材」づくりに取り組んでいます。また実験データや調査データなど、さまざまなデータを収集して「教育用データベース」をつくり、各大学が使用できる環境を整備していきます。

これらのミッションを達成するため「カリキュラム分科会」「教材分科会」「データベース分科会」を立ち上げました。6大学のメンバーは、それぞれ各分科会に属しています。「カリキュラム分科会」は東京大学のメンバーが主査が務めており、他大学のメンバーと協働して「標準カリキュラム」の作成にあたっています。

ちなみに滋賀大学のメンバーには「教材分科会」の主査を、北海道大学のメンバーには
「データベース分科会」の主査お願いしています。教材については、教科書『データサイエンス入門』シリーズを2019年秋から刊行します。全10巻の予定で、私は編集委員として『最適化手法入門』と『モンテカルロ統計計算』を担当しています。大学ごとに得意分野があるので、それがうまくかみ合っていけばいいと思っています。

―カリキュラムの作成はどのように進めるのですか。

「スキルセット」や「参照基準」を分科会で審議し、策定していきます。スキルセットというのは、「これは理解している必要がある」という基本的な項目、例えば「回帰分析」「主成分分析」……といったように羅列した表です。各項目ごとに、内容をどこまで教えるかを決めていきます。

参照基準というのは、各大学がカリキュラムを組む時に参考にしてもらうものです。その専門教育ですべての学生が身につけるべき基本的な素養や、学習成果の評価方法などに関する考え方を示したものです。

スキルセットに関しては1年くらいで暫定版を出し、それをベースに改善していきます。
参照基準の策定はそれよりもう少し時間がかかると思います。

―2017年2月、学内に設置したMIセンターでは、どのような取り組みを?

社会に流通している大量のデータを数理的思考で解析し、課題を発見し、解決していく能力は、いまや文系分野を含め、さまざまな分野で重要性を増しています。MIセンターは「数理情報部門」「数学基礎教育部門」「基盤情報部門」「応用展開部門」の4部門で構成されており、数理的手法やデータサイエンス、情報技術に関する教育基盤を総合的な視点から見据え、データに基づく課題抽出や問題解決、価値創造ができる人材の育成を目指しています。もちろん6大学コンソーシアムのサポートもしていきます。

MIセンターのメンバーは兼務教員も含めて現在30人。まだ増える予定で、データサイエンスの推進に必要な優れた人にどんどん入ってもらっています。

―データサイエンス教育には、企業の実際の事例を活用するなど、実践的な内容を盛り込むことが求められています。産業界とはどのように連携していきますか。

東大は、6大学コンソーシアムとは別に「UTokyo MDSコンソーシアム」という産学連携を推進する産業界コンソーシアムを17年10月に設立しました。データサイエンス人材を育成するMIセンターの活動を産業界が支援し、また産学連携により成果を産業界で活用していくねらいがあります。

現在、メンバーは日本電気、三井住友フィナンシャルグループなどの5社。4月から、統計学や機械学習などの基本的なコースを提供する社会人教育のトラアルプログラムも開始します。産業界からのこうした社会人教育の要請は、非常に強くあります。


理系・文系にまたがる学部横断型教育プログラムを開始

―データサイエンス教育に関して、学内の現状をどう見ていますか。

東大では数理・データサイエンスに関連する講義がすでにたくさんあります。文系でも経済学部などはデータサイエンス関連の講義が多いですし、統計学についても総じて本学の学生たちはよく履修しています。教養学部の統計学の講義ともなるとひとつの教室での受講者は平均約300人です。統計学の重要性を学生もよく認識しているのだと思います。ただ、皆が必ず履修しているかといえば、そうではありません。

「T型、Π(パイ)型人材」という表現がありますね。専門分野に加え、幅広い知識を持っているのが「T型」人材。近年は2つの専門分野を併せ持つ、つまり縦串が2本の「Π型」が優位とされています。さらに今の時代、単に広い知識というだけでなく「情報」の横串を通していかないと、社会に出て戦えない。MIセンターでは、文学部、法学部のような文系学部であっても、データを分析して課題解決に役立てられるよう、全学部に対しデータサイエンス教育の底上げを図っていきます。

―具体的には、どのように強化していくのでしょうか。

将来の研究や実務面で必要なデータサイエンス分野の知識、技術を身につけてもらうため、学部横断型の「数理データサイエンス教育プログラム」を18年度からスタートします。このプログラムでは、MIセンターが中心となり、全学部生を対象に理系文系に共通する体系化された数理・データサイエンスに関する科目を提供していきます。

科目は、「確率論」や「最適化手法」、「統計データ解析」や「データマイニング入門」、機械学習や人工知能の分野で多く使われている言語「Pythonプログラミング入門」など、数理・統計・情報分野の12科目で構成されます。必修科目や選択科目の区別はなく、12単位以上取ると修了証が交付されます。工学部、理学部、教養学部で開講しますが、全学部の学生が受講できます。


多様な関連科目を可視化し学生にわかりやすく提示する

―東大ではデータサイエンス関連の講義が多いということですが、どれくらいあるのですか。

学部ごとの数理・データサイエンス関連の講義を合わせると約180ほどあります。しかし残念ながら全学的に見たときに、学部間でのレベルや、科目の相関が見えにくい状態にありました。

そこで、東大におけるデータサイエンス関連科目の全体像を把握し、可視化・構造化して、学生にわかりやすく示す「データサイエンス イニシアチブ」の開設を今準備しています。これができ上がれば、学生が履修の際にどんな講義がどこで開設されているか、レベルはどれくらいか、他学部でも聴講可能かなどが、一目で分かるようになります。科目をクリックすれば、シラバスも閲覧できる仕組みにします。

今春には東大の公式ホームページ「UTAS」の情報を基に、データサイエンス関連科目のページを一気に更新する予定です。多様な科目が学内で開講していることを学生に知ってもらい、積極的に履修してほしいと思っています。

また各部局で類似の科目もあるので、将来的には科目間の関係を見て「この学部でこの科目を履修すれば、データサイエンス関連科目を履修したと見なす」というように、体系を整えて学生がデータサイエンスを修得しやすいようにしていくつもりです。

一方、ホームページでは講義動画の公開もしています。17年度には「確率論」「統計データ解析」など4科目を公開しました。学生に限らず誰でも視聴でき、「確率論」、「統計データ解析」、「数値解析」などの講義には大きな反響があります。

―現在の課題と将来へ向けた展望をお聞かせください。

いま、一番の課題はデータサイエンスを教えられる人材の不足です。全国の大学でこの分野の需要が高まっており、良い教員をいかに確保するかに頭を悩ませています。もう一つは継続性です。文部科学省のデータサイエンス教育の強化事業は、5年間の時限付きプロジェクトです。しかし、教育を強化・向上させていくには、サスティナブルな取り組みが何より重要です。それゆえ、産業界の方にもデータサイエンス教育の重要性を説き、MIセンターの継続的な活動を支援していただけるように努めています。

苦労はありますが、先進的教育モデルの拠点として、全国の大学が参考にできる優れたカリキュラムを、ぜひ普及させたいと考えています。

駒木文保 教授 プロフィール

1987年、東京大学工学部計数工学科卒業。同大学院工学系研究科修士課程を経て、総合研究大学院大学数物科学研究科修了。2009年、東京大学大学院情報理工学系研究科教授。2017年より数理・情報教育研究センター長。予測分布の理論など統計的推測理論や、ベイズ的な時系列モデルなどを利用した統計解析手法の開発を主な研究テーマとしている。