トピックス

「数理・データサイエンスと大学」インタビュー

第19回 東北大学データ駆動科学・AI教育研究センター センター長 早川 美徳教授 「数理」という軸を通すことで
普遍性のある理論構築が可能になる

東北大学は2019年、現代的リベラルアーツとして求められる知識や技能をテーマに沿って修得する独自の教育プログラム「挑創カレッジ」を開講。数理・データサイエンス分野のプログラムも含んでおり、より高度な内容を求める学生のニーズに応えている。センター長の早川美徳教授に学生の知識欲を刺激する取り組みや、ご自身の研究について聞いた。

旺盛な知識欲に応える学びの場「挑創カレッジ」

―2019年に「東北大学 データ駆動科学・AI教育研究センター」が設立された経緯を教えてください。

本学は2018年に「東北大学ヴィジョン2030」を策定しました。21世紀の社会を世界的視野で先導する新しいリーダーを育むことが目的です。このヴィジョンにおいて「グローバルリーダーシップ」「数理データサイエンスAI」「アントレプレナーシップ(起業家精神)」の3つを教育の柱に位置づけました。そしてこれらの素養を習得する学びの場として「挑創カレッジ」を2019年度にスタート、同時に数理データサイエンス関係の推進母体となる責任部局として「データ駆動科学・AI教育研究センター」が設立されました。

―東北大学では数理・データサイエンス・AI分野を、略して「AIMD(AI、Math、DS)」と呼称していますね。「挑創カレッジ」で行われているAIMD教育の内容を聞かせてください。

母体となっているのは、主に1、2年生が学ぶ全学教育のプログラムですが、その他に特徴のある科目群を複数設けています。所定の科目群を学ぶと、大学の修了に加えて「挑創カレッジ」のプログラムを修了したと認定され、デジタル証明書が発行される仕組みです。

「挑創カレッジ」におけるAIMD教育の正式なプログラム名は「コンピュテーショナル・データサイエンス・プログラム(CDS)といい、このプログラムを通じてAIMDの全学教育を1、2年生に向けて行っています。ですから全学教育のプログラムとしてはかなりしっかりしたものです。ベースラインとして、1年生前期に学ぶ科目「情報とデータの基礎」があります。これは文理問わず各学部共通で同じ理念の元に設計されており、全員必修です。

こうしたベーシックな内容に飽き足らない、さらに旺盛な知識欲を持つ学生に対し、上の階層として用意しているのが「挑創カレッジ」です。プログラムの中には、基本的なAIの知識や実践的機械学習といった基礎的であるが重要な科目を複数用意しています。「挑創カレッジ」の修了認定条件として必修2科目の他に選択科目をいくつか履修する必要があり、「挑創カレッジ」を修了した学生は、かなりの実力が備わっているはずです。挑創カレッジに進むのは全員ではなくあくまで本人次第で、学部の卒業要件にはなっていません。

―「挑創カレッジ」の履修者はどのくらいいますか。

カレッジの修了認定を始めたのは2020年度からなので、修了した学生はまだ100人未満です。しかしカレッジの科目を履修している学生はかなり増えてきました。その必修科目に機械学習の座学の授業があり、昨年度は学年2500人中800人以上が履修しました。その前年は200人でしたから、教える側の対応が追いつかない状況です。オンライン授業などをうまく活用し、何とか学生の旺盛な履修ニーズに応えていきたいと考えています。

当センターはAIMD教育だけではなく、東北大学内の教育のための情報システム基盤や各種情報サービスの提供も担っています。ですから情報機器や情報サービスを積極的に活用し、一度に300人が同時受講できるような体制をつくることも、私たちの仕事です。

「G検定」や「E資格」の受験対策を無料でサポート

―センターが発足して以降、学生の学ぶ姿勢や学習成果に変化は見られますか。

挑創カレッジの受講者数が順調に伸びていることから、学生の興味に応えられているのであろうとは感じています。また学生もこの分野の重要性は認識してきています。一方で一時は脚光を浴びていたAIもコモディティ化しつつあり、新しさを感じにくくなっています。英語教育と同じで、ただ必要性だけ説いても学生の心に響かず、学習意欲に結びつかない。どのように学びの意欲を触発すればいいか模索しているところです。

例えば、挑創カレッジの取り組みの一つとして、学生に対し(社)日本ディープラーニング協会が実施している機械学習やAI、データサイエンスに関する民間認定の受験に向けたサポートを始めています。同協会が実施しているのはビジネスパーソン向けの「G検定」と、AI機械学習エンジニアのスキルを認定する「E資格」。2020年度からこれらの受験を希望する学生に、東北大学のパートナー企業の協力を得て、市販の教育コンテンツを無料で提供しています。

今、「ChatGPT」など生成系のAIが出てきて、第4次AIブームの到来と言われます。従来と少しアングルを変えて、そうした学生を引きつける魅力的な見せ方を考えつつ、数学や統計の基本的なところは押さえる――そんな二面作戦で取り組んでいく必要があると考えています。

渡り鳥がV字編隊で飛ぶのは合理性があるから

―早川先生ご自身はどのような研究をしていますか。

研究室に配属になった当初は、「ランダムな樹枝状パターンの形成とフラクタル(自己相似)」が研究テーマでした。金属の結晶が木の枝が延びるように成長していくシステムの特徴を掴むため、実験で形成された形を写真に撮り、当時は大型計算機センターに写真を持って行ってデジタル化していました。そうした過程で画像処理を含めた様々なデータ処理の経験を積んでいきました。

最近は、渡り鳥がたくさん飛来する宮城県の伊豆沼などに出向いて、飛行する鳥の群れを対象に集団動力学の計測と解析に取り組んでいます。白鳥やガンはV字に編隊を組んで飛びますね。あれは前を飛ぶ鳥の翼によって引き起こされる流体の渦の効果を活用して楽に飛行するためだろうと言われてきました。

ただ、この論理でいけば、すべての個体がひと連なりの隊形を組むのが最も効率的なはずですが、実際は、大小の群れがあり、隊形も鈎型や直線などさまざまです。また、途中で編隊同士が合体したり、分裂したりしています。そこで、その動きの過程をモデル化しました。

マガンの飛行を観察していると、前方で異変が生じると後ろに伝播し、やがては飛行隊形がグラグラ揺れて壊れたりもします。なぜ安定しないのかは制御理論に基づいており、数式化することができる。高速道路のサグ(勾配が下りから上りに変わる)地点で自動車が渋滞するのと数理的にはほぼ同じ構造で、いわばマガンが空中で交通渋滞を起こしているわけです。これは、ものが連なって運動する際の背後にある共通のからくりなので、例えば複数のドローンをいっせいに飛ばす際の制御などにも応用できます。

私の研究の上で、数理・データサイエンス・AIは、どれも深く関係しています。数理という軸で見ると、普遍性のある理論構築が可能になることが一つの強みです。そのためにはデータの裏付けがなくてはいけない。データを取るにはAIが強力なツールになる。そういう形で私の研究にAIMDは役立っています。

AIMDの素養があれば、データを通じてわかり合える

―東北大学は、膨大な材料データをAIなどで解析して効率的に材料を開発する「マテリアル・インフォマティクス」の分野で強い印象があります。

来年度から青葉山新キャンパスの「次世代放射光施設」が稼働します。高分子素材についてナノスケールの世界まで観察できる軟X線向け放射光施設です。この施設から産出されるペタバイト級の量のデータをはじめとする“未踏スケールデータ”の解析・分析手法を開発し、価値創出に挑んでいくために、昨年「未踏スケールデータアナリティクスセンター」が設立されました。

両者の連携により、次世代放射光施設から得られる未踏スケールデータを活用すれば、マテリアル・インフォマティクスの進展がさらに加速するでしょう。こうした先鋭的な研究者たちの活躍の場ができたことで、私たちのセンターも協働の可能性を広げられると思っています。

―生成系のAIの登場などで今後社会の大きな変化が予想される中、学生はどのようにデータサイエンスと向き合うべきなのか、アドバイスをお願いします。

社会課題の解決には、高い専門性を持つと同時に、分野を渡り合い、多分野の人々と協調・協働しながら事を進めていく必要があります。そのときに共通言語となるのがAIMDです。文系でも理系でも同じ俎上で語り合え、データを通じてわかり合える。そのための素養、教養としてAIMDを身につけてほしいと思っています。

Profile 早川 美徳

2000年、東北大学大学院・理学研究科助教授。2009年、同大学教育情報基盤センター教授。2019年より同大学データ駆動科学・AI教育研究センター教授。近年は鳥の群れの集団動力学や制御機構をテーマに研究している。著書に「数理思考演習」(共立出版、共著)、「コンピュテーショナル・シンキング」(共立出版、共著)ほか。