新潟大学教育・学生支援機構コモンリテラシーセンター

コモンリテラシーセンター数理・データサイエンス部門活動報告ビギナー向けデータサイエンスコンテスト(2021)

活動報告

実施概要 

主催:数理・データサイエンス部門
共催:MathWorks Japan
参加対象:新潟大学在籍の学生・教職員
参加方法:MATLABのサンプルプログラムを参考に課題に取り組み
ファイルを提出する
提出期間:2021/10/5~2021/10/29
応募総数:37作品

コンテスト総評(新潟大学数理・データサイエンス部門長 山田修司)

今回のコンテストには、学生だけでなく教員からも参加があり、計37名に参加していただきました。投稿されたデータ分析結果の対象は、生活の中で得られる身近なデータや学術的なデータなど多岐に渡っており、データサイエンスの汎用性の高さを改めて実感させられました。また、参加者の多くは分析結果に対して論理的思考に基づく考察を与えており、データサイエンティストに必要とされている姿勢が身に付いていることを確認できました。今回のコンテストをよい機会として、多くの方にデータサイエンスの有効性が認識されることを期待します。


優秀作品の紹介(10件、順不同)

(投稿作品の掲載はプライバシー保護等により加工ないし非公開を含みます。)


 『地震に関するツイートにどのような単語が含まれているのか』 <投稿作品PDF>
  村山美友樹, 創生学部創生学習過程
[審査員選評]
まず、地震の際にTwitterで交わされるやり取りを地震直後から翌日まで定期的に観測することで、地震に関わる状況や心情の変化を探ろうとする着眼点が面白いと感じました。また、「大丈夫」の異なる2つの意味合いを明確に区別するなど、注意深く考察されている点もよいと思いました。様々な問題を考慮しなければならないかもしれませんが、有事の際の行動把握や適切な情報提供にもつながるような詳細な分析を期待しています。

 『近い意味を持つ3つの言葉がどのように異なるのか』 <投稿作品PDF>
  伊勢田氷琴, 創生学部創生学習過程
[審査員選評]
本作品は近しい意味を持つ3つの単語をツイートのワードクラウドの比較による違いの抽出に挑戦しています。データ収集やデータクレンジングには応用的な技術も入っていますが、サンプルプログラムを使用してアイディアを丁寧にまとめた点がよかったです。考察では今回の分析にはない情報が多く見られますが、データ分析の結果を主軸に考察できれば、次回必要な追加データや分析手法がより鮮明になるでしょう。時系列解析、期待しています。

 『新潟の日照時間はほんとに短いの?』
  酒巻摩周, 医学部医学科
[審査員選評]
本作品は、新潟の自殺死亡率が高いのは日照時間が短いからだと囁かれる仮説を考察するため、その日照時間の前提の真偽を確かめている。新潟(市内)と全国55都市の10年以上にわたる日照時間を年毎および月間平均で可視化し、新潟(市内)の日照時間が平均より短かったこと、月毎の変動が大きいことを示している。自殺という社会課題の分析を目的とし、感覚的な仮説についてデータに基づき検証している点、今後の分析の課題を整理している点を評価できる。

 『企業に期待される大学はどのような特徴があるのか』 <投稿作品PDF>
  草野曜圭, 自然科学研究科材料生産システム専攻
[審査員選評]
企業に期待される大学とは?入試偏差値という定量的な評価指標に疑問を呈し、大学の理念及び中期戦略をワードクラウド化して定性的な比較に挑戦しています。可視化結果は比較グループで特徴が分かれていて興味深いです。「技術」と「研究」の同一化と、「結果」より「人材」といった結論には多少飛躍が見られますが、研究実績を利用した比較とも組み合わせてそれらを一連の考察にできるよう頑張ってください。

 『130年分の気象データを分析する』 <投稿作品PDF>
  青木雄大, 工学部工学科社会基盤工学プログラム
[審査員選評]
現実社会で課題となっている温暖化に対して、過去の膨大なデータを用いて温暖化の事実を線形回帰線で明確に示し、将来の予測も行っている。丁寧な考察記述と、わかりやすいグラフが内容の理解を助けている点も素晴らしい。MATLABにはfitlm といった線形回帰の関数が用意されており、これを使うと統計的なパラメータが出力されるのでお勧め。感想で言及されているが、社会に存在する様々なデータの解析に挑戦してほしい。

 『Minmax法により最善手を打つプログラムを用いた局面の変化点を分析する』 <投稿作品PDF>
  (匿名希望), 工学部工学科知能情報システムプログラム
[審査員選評]
2人令和完全情報ゲーム「Mancala」に対して、コンピュータと人間が対戦するプログラムをC++で作成しており、コンピュータの戦略にはMinimax法を用いている。また、Minimax法を用いる際に重要となる評価関数にも工夫がされている。さらに、Minimax法により得られた最善手の評価値と対戦開始からの経過時間の関係に着目し、MATLABによるグラフ表示で分析しており、興味深い試みを行っている。

 『新潟で運動会を実施するのに最適な日付はいつか?』 <投稿作品PDF>
  岡本和樹, 保健学研究科保健学専攻
[審査員選評]
実用的なテーマで着眼点が面白い。imagesc 関数で解析結果をカラーマップでイメージ化して、年間の傾向を視覚的に捉えようとした工夫も良い。imagescの後に1行colorbarと追加するだけでカラーバーが表示されるのでお勧め。晴れだけでなく、気温も解析対象に含めたり、予備日を考慮して晴天が連続する期間といった条件を取り入れると、実用性がさらに高まると思われる。市内小中学校の運動会中止がゼロになることを期待。

 『身体計測・調査票などのデータを分析する』
  塩﨑悠香, 医歯学総合研究科医科学専攻
[審査員選評]
プログラムと解説、実行結果のグラフが一体化して読みやすいレポート様式となっている。プログラムはセクションごとに説明が記載されているため、筆者が実施したことを順を追って理解しやすい。検定関数の活用、2次元、3次元プロットを用いた可視化など、プログラミングの技術に光るものがあり、インポートツールや、duration配列を駆使している点も良い。まだまだあるMATLABの機能を活用して研究活動に役立ててほしい。

 『スマートフォンで記録した自分の移動履歴を解析する』
  木村莉子, 工学部工学科人間支援感性科学プログラム
[審査員選評]
買い物中の速度変化に着目した点が独創的で、考察が実社会での活用に直結する内容になっている点も評価したい。考察中「商品を探している時は速度が落ちて取ってからは速くなる」という指摘は言われてみれば当たり前だが、実測データから導いた定量的な考察で説得力がある。なるほど商品を探している間が勝負とばかりに世の中の商品がこぞって目立つ外装なのも頷ける。結びで言及している異なる条件下の購買行動分析も是非試してほしい。

 『歯学部臨床実習におけるポートフォリオへのフィードバックに対する考察』 <投稿作品PDF>
  大川純平, 歯学部包括歯科補綴学分野(教職員)
[審査員選評]
テキスト解析を選んだ応募作品が多い中で、解析の目的が具体的かつ実用的という点に加えて、解析精度を高めるために丹念に前処理を行った点が注目を集めた。また、前処理を実装するにあたり自身で必要な情報を収集しており、前処理の方法や参考にした情報の出典を明記している点も高く評価した。教育効果の改善を目指す取り組みに対し、教育活動を支援する立場のMathWorksとして深く敬意を表し、更なる活用を期待する。