第6回 データサイエンスコンテスト
コンテストの概要
数理・情報教育研究センターは、東京大学内外における数理・情報の新しい教育体系を整備する連携研究機構であり、「産業界コンソーシアム」はこの理念に賛同する協力企業と東京大学により編成した産学連携組織です。本コンソーシアムでは様々な実践的教育を検討しており、その一環として、この度、加盟企業から提供された実社会データを使い、数理・情報技術を用いてデータ解析を行うコンテストを開催します。結果は加盟企業によって産業界の視点で審査されます。実業界のニーズを体験する貴重な機会ですので、ぜひ奮って参加してください。 ポスター
最新のお知らせ
本ホームページは随時アップデートしていきます.応募を検討する場合は,こまめに本ページをチェックしてくださるようお願いします.ホームページの更新等はここでお知らせしていきます.
- 2023.11.14 開催レポート 「第6回データサイエンスコンテスト発表審査会を開催しました」 を公開いたしました。
- 2023.07.10 データ構造説明会終了しました。説明会スライドをECCSアカウント制限付きでコンテスト応募者に公開しています。
- 2023.06.29 参加応募締切を7月5日(水)17時まで延長いたします。
-
2023.06.28 データ構造説明会のZOOM情報は、説明会前日までに参加登録者全員宛にお送りします。
データ構造説明会では、データの構造、過去の分析結果、ならびにGoogle Colaboratoryで分析に使用できるサンプルコードをご紹介します。
応募にあたって
■内容 |
目的:企業提供データを用い,自ら目標を定めて分析し,何らかのビジネス価値に繋がる提案を行う. データ:コンソーシアム加盟企業提供のマーケティングデータ. データのどの部分を用いるか,どのような分析を行いどのようなビジネス価値を考えるかは自由. 分析結果は「分析目的・分析データ(どの部分を使ったか)・分析手法・分析結果・ビジネス価値」の全体像が分かるような A4 用紙数枚程度のレポート(日本語)として提出.その他詳細は分析開始時点で参加者にのみ通知. 産業界コンソーシアム加盟企業による審査を受け,結果発表会(スライドによる10分程度のプレゼン;一般聴衆も参加することを予定)にて順位を決定. 上位入賞チームには表彰等を予定.また数理・情報教育研究センターの支援により学会等での発表を奨励. |
---|---|
■参加資格 | 本学在籍の学部・大学院生によるチーム制(1チーム1~5名). |
■参加条件 | ・本ページ記載の諸条件に同意できること. |
■応募方法 |
まず,本ページに記載の内容(特に下記注意事項等)をよくお読みください. コンテストに応募した時点で,これらに同意したものとみなします. その上で,下記のとおり参加登録,およびデータ利用誓約書の提出を行ってください. (1)参加登録:下記フォームより →申し込みフォーム← (東大ECCSアカウント制限付google form利用.登録者が連絡担当者となります.) なお,申し込みに当たっては下記情報が必要となるので,予め揃えておくこと.
(これを過ぎた申し込みは無効となる恐れがあるので注意すること.) (2)データ利用誓約書:企業提供データの取り扱いに関し,誓約書の内容を理解しそれに同意することが必要です.内容をよく読み,参加者全員の署名・捺印済み誓約書を,分析開始までに提出してください. チーム全員の誓約書を提出したチームに,7月3日以降データをお渡しします. データ利用誓約書(PDF;印刷して署名・捺印のこと) 原本は各自大切に保管すること 署名・捺印済み誓約書(スキャンまたは撮影したpdf、jpegファイル)の提出については、登録時のメールに記載しています. |
■データ構造説明会 |
2023年7月7日(金) 17:00~18:30(オンライン開催) 途中入退室可能 |
各種日程(予定)
応募締切:2023年6月30日(金) 17:00
分析期間:2023年7月3日(月)~9月1日(金) 正午(期間終了までに分析結果を提出)
データ構造説明会:2023年7月7日(金) 17:00~18:30
プレゼン発表会・審査会:2023年9月22日(金) 本郷キャンパス工学部2号館213号室
その他注意事項・詳細等
- データや分析環境等の詳細は,分析開始日に参加チーム連絡担当者に一斉に通知します.その後,計算環境のアカウントを請求して分析をスタートしてください.
- 本コンテストに参加するためには,以下の点への同意が必要です.
- 企業提供データに関する利用誓約書に同意し署名すること(その内容を守り使用すること).
- コンテスト計算環境(下記)を,一般的な情報倫理精神に則り適正に使用できること.
- 結果発表会はオープンな会として開催されるため,そこで発表した内容はその時点で公知の事実となり,知的財産として特許申請等ができなくなることを理解しそのことに同意できること.(ただし分析チーム自身が,データ利用誓約書の定める範囲内で後日学会発表等を行うことは可能です.)
- 分析結果を学会発表する場合は,必ずコンテスト問い合わせ先と相談の上,指導教員(またはそれに準ずる者)の同意を得て行うこと.(上位入賞・センターからの旅費補助の有無にかかわらず.)
-
分析環境は,情報理工学系研究科の計算クラスタをご用意します.
本クラスタはCPU・GPUから成る4サーバー群から成っており,それらすべての上でPythonと関連機械学習・深層学習ライブラリ(scikit-learnなど代表的なもの)がインストールされています. - 提供するクラスタ以外に,ECCSアカウント内GoogleDrive上でのデータ共有も可能とするが,ECCSアカウント以外への共有は禁止とし,データを流出させないよう注意すること.
- 応募状況によって,プレゼン審査会でのプレゼンに進めるチーム数を制限する場合があります. また,その他やむを得ない事情によりコンテスト詳細を変更する場合があります.その場合,本ページで告知しつつ,各チームの連絡代表者に連絡します.
- 応募に際し収集する個人情報(氏名,所属,メールアドレス等)は,本コンテストに関する連絡のためだけに,数理・情報教育研究センター事務局およびコンテスト実施関係者に限定して用います.
第6回データサイエンスコンテスト発表審査会を開催しました
2023 年 9 月 22 日(金)、第6回データサイエンスコンテスト発表審査会を開催しました。 (オンサイト開催@工学部 2 号館 213 号講義室)
本学学生より編成された7チーム 23 名が、加盟企業から提供された実社会データを使い、 データ解析を行った結果の発表を行いました。
審査員による議論と熟慮を経て、審査結果は以下の通りとなりました。
-
最優秀賞:チーム「株式会社 a.s.ist」 テーマ「セールス魔人
アキナイター」
メンバー:新領域創成科学研究科 塩谷佳介、新領域創成科学研究科 林悠偉、新領域創成 科学研究科 竝河伴裕(敬称略)最優秀賞チームよりコメント;
私達は,企業がどのようなデータを持っているのか、そして解析する際にどのような難しさがあるかを知るために参加させていただきました。 提供されたデータは非常に多くの変数を含んでおり、どの変数に着目して解析を行うかを考えるのが難しかったです。 チームで解析の方針や手法、結果の見せ方を話し合い、タスクの分担を行う過程は楽しく、勉強にもなりました。
-
優秀賞:チーム「西川・杉山」
テーマ「美容・身だしなみ意識の定量化:行動との相関分析およびビジネス戦略への応用」
メンバー:情報理工学系研究科 西川直輝、情報理工学系研究科 杉山友浩(敬称略) -
学生賞:チーム「とうだい☆データ菜園ス」
テーマ「健康食品・サプリメントを売るには?」
メンバー:工学系研究科 青田聖治、情報理工学系研究科 関健太郎、 情報理工学系研究科 木村元紀、工学部 熊田順一、理学系研究科 須田涼太郎(敬称略)
最後は記念撮影を行い、審査員からも講評が述べられ、和やかなムードのうちにイベントは終了しました。
問い合わせ先
本コンテストに関する問い合わせは,下記メールアドレスにお願いします.
数理・情報教育研究センター事務局 DSコンテスト担当: mds-contest@mi.u-tokyo.ac.jp