トピックス

「数理・データサイエンスと大学」インタビュー

第12回 横浜市立大学大学院データサイエンス研究科 研究科長
医学部臨床統計学教室 教授 山中竹春氏
データサイエンス・AIと共生する豊かな社会へ
鍵を握る文系学生の教育

当コンソーシアムの「モデルカリキュラムの全国展開に関する特別委員会」委員であり、内閣府の進める「数理・データサイエンス・AI教育プログラム認定制度」の検討にも関与する横浜市立大学の山中竹春教授。国によるこれらの取り組みやデータサイエンス・AI教育の現状と、同大学の教育体制、さらには最近話題を集めた「新型コロナウイルス感染症回復者を対象とする抗体調査」について聞いた。
(※撮影を除き、本取材はリモートで行われました)

現場オリエンテッドな横浜市大のデータサイエンス教育

―横浜市立大学は、2018年に首都圏初のデータサイエンス学部、2020年に大学院データサイエンス研究科を開設し、医学部とデータサイエンス学部を併設する大学としての教育体制を確立しましたね。

本学は神奈川県内の国公立大学で唯一、医学部を持つ大学です。また、伝統的に商学部は横浜や東京の財界に人材を輩出しており、古くから医学・商学といった実学をベースとする大学でした。2015年頃から、その伝統をもとにより未来志向の学問を模索する中でデータサイエンスに関する学部設置案が浮上し、私が委員長を務めた新学部設置準備委員会において制度設計が開始されました。実学が強いからこそ、データサイエンス学部の生まれやすい土壌があったと言えるでしょう。

学部で学んだ後の受け皿として、大学院も開設しました。大学院にはエキスパートを養成する「データサイエンス専攻」と、医療者や医療行政者などヘルス関連データに基づく判断や応用を求められる人材を育成する「ヘルスデータサイエンス専攻」を設けました。

―山中先生は医学部の教授ですが、大学では文系の学部を卒業し、大学院で数学を専攻されたそうですね。

大学は早稲田大学の政治経済学部でした。経済の現場から出てくるデータを扱うことを学ぶうちに、もっと本格的に統計や数理を学ぶ必要を感じたのです。学部在籍中から数学科の授業に入り浸ってました。その後、大学院時代に、とあることがきっかけとなり、医学系のデータに興味を持つようになり、最終的に医療統計に行き着きました。

専門は「バイオメトリックス(計量生物学)」ですが、学部の時は「エコノメトリックス(計量経済学)」に関心がありました。誤解を恐れずに言えば、扱うデータの出どころが経済の現場か、医療の現場かという違いだけです。アプローチこそ異なるものの、現場オリエンテッドであることは変わってませんね。

データ収集に苦労した新型コロナ回復者の抗体調査

―最近では、山中先生の研究チームが発表した「新型コロナウイルス感染症の回復者に抗体が残存している」という成果がマスコミを賑わせました。

本学のウイルス学者で、精度の高い抗体検査技術を開発した梁明秀教授から「抗体を測る意味をデータで実証したい」と持ちかけられて始まったプロジェクトです。臨床研究の分野では「デザイン」と呼ばれる、どのようにデータを収集するか、その計画の立て方を考えることがデータサイエンスの重要な貢献となります。効率的に大量のデータを集めたから得られた成果と言えるでしょう。

これまで、新型コロナウイルスは「抗体は消える」と世の中では言われていました。しかし、元になった原著論文を読む限り、そう結論づけられるのは疑問でした。論文の著者たちもそこまで断定していないのに、不確かなネットニュースが一気に拡散してしまった感があります。Bad news travels fast.の典型例だと思います。

余談ですが、プロジェクトでは計画を立てたのち、実際にデータを集める段階では苦労しましたね。陽性者の名簿を管理している保健所へ共同研究を申し入れたところ、7〜8カ所回ってすべて断られてしまいました。感染者に対する風評被害の問題があったし、行政データを研究用途に提供することへの抵抗感もあったかもしれません。

そこで研究の周知を広げることに方針転換しました。自身も回復者であるフリーアナウンサーの赤江珠緒さんや元プロ野球選手の片岡篤史さんに協力を依頼したところ、快諾を頂きました。記者会見を開いて一般に参加を呼びかけたところ、たくさんのメディアに取り上げられ、びっくりするほど多くの回復者が名乗りを上げてくれました。

わずか2カ月でそのうちの600名を超える方から参加希望を頂きました。当時は日本全体1~2万人くらいの感染者数だったことを踏まえると、驚くべき数字だと思います。そして、ほとんどの回復者が半年後にも「抗ウイルス抗体」と、ウイルスが細胞に侵入するのを阻害し再感染を防ぐ「中和抗体」を保有していることが分かりました。

どんなに良いテーマの研究で、高度な解析手法を適用しようとしても、データが入手できなければどうにもなりません。

インターネットで自動的に集まるようなアクセスログデータのようなケースもありますが、一からデータを集めなければならない状況もたくさんある。ビッグデータをどう生かすかも、必要なデータをどう入手するかの戦略を立てるのも、どちらもデータサイエンスの一環。“現場の匂い”のする教育をして、そういうセンスを身に着けてもらいたいですね。

社会の課題解決を意識した教育へのモードチェンジを

―データサイエンス・AI教育の現状をどう見ていますか。

「データサイエンス・AIを学んだ後、それをどう生かすか」まで導ける教育がまだ確立されていないということです。過渡期ゆえに、どの大学も苦しんでいる。

マイケル・ギボンズの『モード論』では、いわゆる伝統的な学問体系を「モード1」、具体的な社会課題の解決を目指すミッション・オリエンテッドな学問を「モード2」と定義しています。医学分野に例えれば、「基礎」と「臨床」のような関係かもしれません。

今のデータサイエンス・AI教育には、このモード2がまだ十分ではないように思えます。もちろん、全員がモード2へ移行するべきというわけではありません。従来どおりモード1を究める人がいないと理論が発展しませんし、モード2の学問にもモード1の“基礎体力”がいる。どちらも大切です。ただ現状の教育は、まだまだモード1に偏っていると言わざるを得ません。

モード1の成果を評価するのは論文のレフェリーをはじめ、同輩集団です。一方、モード2の成果を評価するのは「社会」であり、実際に社会課題の解決に役立つかどうかが基準になる。ところが、われわれ教員の多くはモード1の教育を受けてきて、それで学位を取り、研究者人生もそこに捧げています。「社会からどう評価されるか」という点は昔から言われてきたことですが、データサイエンス・AIの時代になり、あらためて、われわれ自身が、発想の転換を求められているのです。

―「データサイエンス・AIをどう生かすか」という部分は、具体的にどのようなイメージでしょうか。

データサイエンス・AIの方法論や思考法はすべての人が学ぶべきだと考えています。そして、理系と文系で分けて考えたほうがいいでしょう。まず理系を中心とする一部の学生には、トップレベルのデータサイエンティストをイメージさせるような教育ができればいいと思っています。つまり、「統計やAI、データをこんなふうに使えば、社会の課題を解決し、世の中を変えられる。自分もそういう風に変えていきたい」と実感できるような教育です。

一方で、これからの社会には、トップレベルのデータサイエンティストといわゆるエンドユーザーの間に、両者のブリッジになるような人材が必要です。ガートナー社のハイプサイクルに登場する「シチズンデータサイエンティスト」の存在が社会実装の際には必要だと考えています。文系の学生には、その役割を担ってほしい。こういった役割は理系の人よりも文系の方が向いています。データサイエンス・AIの原理や “考え方”を理解しつつ、データを使ってどんなことができるかを踏まえ、データに基づくプロジェクトの企画や運営をできる人が増えなければ、産業界のDX(デジタルトランスフォーメーション)は進みません。データサイエンス・AIを社会実装するためには、多様な人材による「結びつきのアプローチ」が必要なのです。

日本の大学は全部で795校あり、学生のおよそ6割は文系です。経済学部の一部の教育のように数式を使うものもあるとはいえ、数学とはほぼ無縁の学部が多いです。文系の学生には、プログラミングや数理を駆使するゴリゴリのデータサイエンティストではなく、より広い視野に立ってプロジェクトの企画や運営上、不可欠な役割を担えるようになれると思います。その教育がとても大事だと思います。

国民全体のデータリテラシーを底上げすれば社会が変わる

―当コンソーシアムが進めるモデルカリキュラムの展開については、どうお考えですか。

モデルカリキュラムは、将来のエンドユーザー層を含むすべての学生50万人を対象とする「リテラシーレベル」と、学生25万人を対象とする「応用基礎レベル」に分かれています。毎年、これだけ多くのデータ人材を社会に増やし続けるわけですから、じつに革新的な取り組みです。

これには大きく二つの意味があります。一つは、組織で決定権を持つリーダーたちが、データドリブンに事業判断をできるようになること。日本の政財界のリーダー層は圧倒的に理系よりも文系が多いのが実態ですので、文系学生に「データサイエンス・AIの心が分かる教育」をすれば、20年後、30年後の社会は大きく変わり、国力が向上するでしょう。

もう一つは、国民全体のリテラシーが向上すること。これは「AIと共生する社会」をつくるための必須条件です。

過渡期には、機械の自動化の失敗によって事故などが起こる可能性が否定できません。また、行き過ぎた監視社会などの問題も生まれるかもしれない。そうしたときに世論が過剰なアレルギー反応を示せば、AI活用によって豊かな社会を享受する流れにブレーキがかかってしまう。国民がAI社会のリスクとベネフィットのバランスを正しく判断できるようになることが重要です。

―山中先生は当コンソーシアムのモデルカリキュラムの全国展開と、内閣府の「数理・データサイエンス・AI教育プログラム認定制度」に関わっていますが、両者の位置づけは?

モデルカリキュラムは教えるべき項目を具体的に示すものですから、今データサイエンス・AI教育に苦労している全国の大学にとっては道案内になるでしょう。一方で、認定制度は一定水準を満たすデータサイエンス・AI教育を行っている大学などを認定するものであり、必ずしもモデルカリキュラムどおりのプログラムである必要はありません。ユニークな取り組みがどんどん評価されるべきです。

いずれにしても、こうした取り組みを国の主導により進めることで、データサイエンス・AI教育の普及が加速することを期待しています。

Profile 山中竹春

横浜市立大学医学部教授。1995年に早稲田大学政治経済学部経済学科を卒業後、同大学院理工学研究科数学専攻へ進み、2000年に修了。同年に九州大学医学部附属病院医療情報部文部教官助手。米国国立衛生研究所(National Institutes of Health)リサーチフェロー、国立がん研究センター生物統計部門長などを経て、2014年に横浜市立大学医学部教授に就任。現在、同大学学長補佐、同大学大学院データサイエンス研究科長、2021年度より国立がん研究センター東病院データサイエンス部部長(クロスアポイントメント)を兼務。文部科学省、厚生労働省、内閣府等の専門委員を多数兼務。研究分野はヘルスデータサイエンス、臨床研究のデザインと解析など。