トピックス

「数理・データサイエンスと大学」インタビュー

第5回 大阪大学大学院 教授、基礎工学研究科 研究科長
大阪大学 数理・データ科学教育研究センター センター長 狩野 裕教授
工夫を凝らした例題を共有化し
新入生や文系学生にも興味が持てる
魅力的な教材の開発を

文系を含むすべての学生に、大学4年間でデータ・リテラシーを身に着けさせるために、初心者向けの教材開発が急ぎ進められている。長い間、文系学生に独自の教材を使って分かりやすくデータ科学を教えてきた大阪大学の狩野裕教授に、初心者向け教材を開発した際の体験と、そこから導かれる要点を聞いた。

数式を使わずに統計を教える
文系学生を振り向かせる挑戦

―長年にわたり大学でデータ科学教育に携わってきて、現状にどのような課題を感じていますか。

痛感しているのは、「魅力的な教材」を用意する難しさです。データ科学になじみのない学部低学年では、まず身近な現象・データをきちんと咀しゃくして見ることのできる力をつけるところからスタートし、そこから専門基礎としてのデータ科学へ入っていくことが重要だと、私は考えています。

しかし、「身近」で、しかも「インパクトのある」例を持ってくることが意外と大変です。難しい例を使って「難しいやろ?」と言うのは簡単ですが、「四則演算レベルで解けるけれども、データの見方を分からなかったら間違うんやで」と示すことができて、かつ、学生が「何でそうなるん?」と興味を持つような例を探すのは結構大変なのです。

でも、大学の教員はあまりそういうことに関心がありません(笑)。だからこれまで、そのようなテキストもほとんどなかったのです。とはいえ、どの先生も「1回目の授業で使うために」など、一つ二つは興味を惹く例題を用意しておられるでしょう。そういう例題を集めてブラッシュアップし、1セットの教材に作り上げ、それを共有することが大事ではないかと思います。

―初心者向けのテキストの必要性を感じたのは、何かきっかけがあったのでしょうか。

97年に母校の大阪大学に助教授として戻ってきたとき、人間科学部という文系の学部に着任したのです。私自身、理学部の数学科出身ですし、それまでずっと理系の学生を教えてきましたが、だんだんと「同じやり方では文系の学生には響かない」ということが分かってきました。

彼らにこちらの思いを伝え、彼ら自身にプラスになるような授業にするにはどうしたらいいか――。日々考えるなかで、まず目標にしてみたのは、「数式を使わずに統計を教える」という試みです。文系の学生たちは、「統計は数学や。数学はキライ」と思っているわけです。だから、数式を使わないほうがアレルギーを起こさずにすむ。

もっとも、魅力的なテキストが必要であるという点は、文系・理系に共通した課題です。一般に、理工系の学生にものごとを教えるときは、統計を使うよりも、それぞれの分野における第一原理から演繹して説明するほうが理解しやすい。統計というのは、どうもよく分からんところを「データを取って傾向を見てみましょう」ということなので、理工系の学生はそういう曖昧さに違和感を持ちやすいようです。


卒業式直後のアンケート
「統計学、受けてよかった」

―学部低学年を対象とする講義では、実際にどんな話をするのですか。

私が最初の授業で学生に話すのは、こんな例です。大阪大学の人間科学部は、社会科学系の学部としては珍しく、数学と統計学が必修です。たいていの学生はそのことを知らず、入学してからびっくりする。そこで私は、卒業生の約9割が「数学・統計学の必修があってよかった」と答えている、というアンケート結果のデータを見せるのです。「今、君らは『嫌や』と言うてるけど、4年経ったら変わるよ」と。そして、「これについてどう思いますか?」と問うわけです。

実は、この調査は卒業式の直後に行ったもの。それは当然で、大学サイドは学業を全て終えた後の満足度等を知りたいのだが、大学を離れた後はデータ採取が大変だから卒業式の直後で調査となる。人間誰でも山を越えてきて、1年生の数学・統計から始まって卒論も無事に終えたら、どんなことでもいい思い出になるに決まっているんですよ、それは(笑)。だから本当は、少し間引いて考えなくてはいけない。この「間引いて考える」ことに気づくことも重要なデータの見方なのです。

もちろん、卒業のときに「数学・統計を受講してよかった」と思う学生がたくさんいることは事実。だから君たちもがんばれ、ということを新入生に伝えたいという思いが一番なのですが、同時に、「誰を対象として、どういう状況のとき、どんな質問の仕方で収集したデータなのか」をきちんと見ないと、データから正確な情報は得られない。データ採取の状況を想起しながらデータを適切に見ることができるようになってほしい」というメッセージも込めているのです。

―身近な例を使って、学生に「これまでのデータの見方は間違っていた」と気づかせるわけですね。

そうです。まずそこを認識してもらって、「では、正しく見るためにはどんな方法があるのか」という話につなげます。この例で言えば、「①在学中」と「②卒業式を終えてホッとしているとき」、「③卒業して5年後」では、同じ人でも回答が変わるかもしれないという前提でデータを観る。満足度がどのように変化していくのかを調べるためには、一つの個体(一人の学生)を①②③と順に追っかけてデータを取っていく必要がある。これを経時データまたは縦断的データと言います。これはもう、教育の題材とか演習問題のレベルではなく研究活動の範囲ですが。

多くの学生(一般の方も)はアンケートに回答した経験があると思います。あんなに適当に回答したデータに基づいていったい何が分るんだ、と感じている方も多いのではないでしょうか。ある日の午前に回答した内容は同日午後にはもう忘れているというような適当さです。しかし、回答の揺れ(不確実性)を誤差の確率変動とモデル化し、その背後に存する本質を「誤差を排して」捉えていく、そのための道具が統計モデルや検定・推定です。確率的な現象を正しく把握するには統計的なアプローチが必要だということが分かったら、次は勝ち負けなら「二項分布」、身長のデータなら「正規分布」などと、どんな現象がどんな分布をしているかということを説明していく。数学から入るのではなく、身近なところから入って、最後に数学を持ってくるようにしています。数学嫌いの学生には「なんで統計なんかやらないかんのや」という反発の気持ちがありますから、それをほぐしてやることが大事だと思うんです。

大学で文系を選んだとしても、高校入試を真面目に取り組んだ学生なら、数学はけっこうできる。中学・高校程度の数学の知識が身についていれば、かなりいろいろなデータ分析が使えます。その経験から高等数学の必要性を感じたらその段階で勉強すればよい。自分からシャットアウトしてその知識を使わないのでは、その学生は先の人生、ずいぶん損をすることになる。


データと分析のコンテクストを
セットにした教材が理想

―6大学コンソーシアムでは、データサイエンス入門教科書シリーズの編集が進んでいます。

そうですね。ただ、私から見ると、まだ従来の延長上を脱していない気がします。もっと皆さんが授業で実践しているひと工夫、ふた工夫を一挙に集めて教材に整え、例題のデータベースを構築するのがいいと思うのですけどね。みなさん、「こんなものを出すのは恥ずかしい」と謙遜されているのかもしれません。

というのは、ひとつの統計的な手法を説明するために挙げた例は、厳密に言えば正しくないとか、他の手法で解くと別の答えになるかもしれない、ということがあるからです。初心者向けにシンプルに説明しようとすればするほど、別の角度から見ると違う、ということが起こりがちで、突っ込みどころはいくらでもある。それを突っ込まれないように書くから面白味がなくなるわけですが、まあこれは大学教員の習性かもしれません。

―初心者向けの教材として最も重要なことは何でしょうか。

大事なのは、コンテクストです。「このデータは、最初はこう見えたが、分析していったら最後はこんなドンデン返しが起こった!」となったら、面白いじゃないですか(笑)。学生の興味を引きつけながら、こうやってデータを見ていくんですよ、と教えることができる。

しかし、これまで統計学のトレーニング用の教材は、「こんなデータがあります。どうぞ分析してください」と、ただデータだけが置いてある状況で、分析の仕方が少しでも説明してあればいいほうでした。これでは、食材だけを示して料理の手順が書いていないレシピのようなものです。

本来ならば、そこからいろいろなストーリーが考えられるはず。1セットのデータがあれば、例えばPower Pointで20シート分ぐらいは、分析する観点があるのです。そういう、素材と料理の仕方を一緒にしたレシピを100種類ぐらい用意する。教員は、たとえば「この部分はこう変えて、後半は省こう」など、自由にアレンジできるようにすればいいと思います。

―狩野先生自身は、これまでどうやって「コンテクストのある教材」を作っていましたか。

実際には、そう簡単にコンテクストの描けるデータと分析が見つかるわけではありません。私の場合ラッキーだったのは、人間科学部で7年間教えていたときに、学生の卒業論文の審査などで、さまざまな実社会の研究テーマに接する機会を得たことです。データ科学の授業で使えそうだと思った論文やデータをもらってきて、自分でアレンジを加えました。

でも、実はここからが大変なのです。コンテクストの面白さを残したまま、教えたい統計学のポイントを強調しつつ、しかも90分の授業で説明できるシンプルなシチュエーションに凝縮して、教材として仕上げなければいけません。これはものすごく手間のかかる作業です。だからわれわれはつい、シンプルすぎてコンテクストのない無味乾燥の例題を使ってしまいがちなのです。

しかし、データ科学とはそもそも、現実社会の課題に対し、統計学的な手法を使って分析とフィードバックのPDCAサイクルを回す、その全体の制度設計そのものです。現実とかけ離れた例題では、そのダイナミズムが学生に伝わるはずがありません。教材づくりは大変ですが、私は「教材とは、最初からあるものではなく、努力して作り上げるものだ」と今では思っています。

狩野 裕 教授 プロフィール

1981年、大阪大学理学部数学科卒業。 84年、大阪大学大学院基礎工学研究科博士後期課程退学。同年に運輸省海技大学校教養科助手となる。86年、工学博士。 87年に大阪大学基礎工学部助手。大阪府立大学工学部講師、筑波大学数学系助教授を経て97年、大阪大学人間科学部助教授。04年から同大学大学院基礎工学研究科教授。18年度に第23回日本統計学会賞受賞