コンテスト実施概要
主催:教育基盤機構未来教育開発部門コモンリテラシー教育支援室
共催:MathWorks Japan
参加対象:新潟大学在籍の学生・教職員
参加方法:MATLABのサンプルプログラムをいずれか参考に課題に取り組み、
成果物(pdfファイル)を提出する。
提出先※:ds-contest@ge.niigata-u.ac.jp
提出期間:2022/11/7~2022/12/8 17:00 2022/12/16 17:00 (期間延長しました)
※優秀作品は氏名及びpdfがHPに掲載されます。氏名、作品の公開を希望しない場合、メールにその旨を記載してください。
コンテスト総評(コモンリテラシー教育支援室長 山田修司)
昨年度に引き続き、今年度は2回目のデータサイエンスコンテストを実施しました。 今回のコンテストでは、経済分析、気象データの解析から身近なSNSのデータ分析まで幅広い内容のレポートが提出され、データサイエンスの汎用性の高さを実感させられました。 また、参加者の多くはデータに基づいて論理的思考により考察を与えており、データサイエンティストに必要とされている姿勢が身に付いていることを確認できました。今後もこのようなコンテストを継続的に開催し、多くの方にデータサイエンスに取り組んでもらえる機会を設けていきたいと考えています。
優秀作品の紹介(5件、順不同)
(投稿作品の掲載はプライバシー保護等の理由により加工ないし非公開を含みます。)
『日本語における「全然」と共起する語の分析』 黒澤百果, 人文学部 |
---|
[審査員選評] 本作品は、「全然」という語と共起する述語が、否定的な場合と肯定的な場合の両方がある点に着目し、その利用頻度を分析しています。 現代日本語書き言葉均衡コーパス(BCCWJ)「中納言」のデータを文語的な用例と口語的な用例に分けて分析結果をまとめています。 意外にも、「全然」という語が肯定的な述語と共起する用例が多いことが示されています。 共起しやすい述語をワードクラウドで可視化する際、フォントの色やスタイルに工夫が凝らされ、今後の課題を整理している点も高く評価できます。 |
『台風の軌跡のクラスタリング』 (匿名希望), 工学部 |
---|
[審査員選評] 本作品は、気象庁の2021年台風位置表データを用いて、22個の台風の軌跡の距離をDTW(Dynamic Time Warping,動的時間伸縮法)によって求めてクラスタリングしている。 ダウンロードしたデータに前処理を施し、MATLABの関数を用いて簡潔に記述している。また、台風の軌跡を各クラスタ別に色分けして地図上に可視化しており、見せ方も工夫されている。 記載の感想によると、1次元データのクラスタリング分析は過去経験があったが2次元時系列データは初挑戦だったそうで、DTWによる距離計算の方法を勉強することに苦労したとのこと。 丁寧な取り組みと意欲に満ちた学習動機を学生コンテストにふさわしいものとして評価する。 |
『過去の日本とアメリカの経済指標を分析する』 (匿名希望), 工学部 |
---|
[審査員選評] 自身の資産運用の経験から経済の動向に興味を持ち、その理解のためにデータ分析を試みており、動機付けと目的が明確。そして、分析の目的から結果、考察までがロジカルに繋がっていて読み手が理解しやすい記述になっている。また、データ収集などの準備段階から分析に至るまで随所に工夫が見られるのも優れており、得られた結果からより精度の高い分析と考察を視野に入れている点も高く評価したい。MATLABは経済、金融向けの関数や機能も充実しているので更なる活用を期待したい。自身の資産運用に生かすだけでなく、もし金融業界へ就職活動される際は本受賞をぜひアピールしてみてください。 |
『1985年と2020年の歌詞の傾向の違いを分析・再現』 <投稿作品PDF> 青木雄大, 自然科学研究科 |
---|
[審査員選評] 多くの審査員から「面白い」という声が挙がるほど、歌詞から年代の特徴を考察するその発想がとてもユニークで面白い。発想だけでなく分析作業においても、ワードクラウドで年代別に歌詞の傾向を分析しただけでなく、機械学習を用いてその年代っぽい歌詞を自動生成するという、分析と結果を応用した予想(歌詞の創造)のふたつのプロセスを実行したこと、更には分析結果から得られた考察が深く、特に機械学習において学習させる歌詞の数が鍵になることを発見をされていることも審査員の関心を集めた。筆者には本作品に留まらず、アイデアの具現化が容易なMATLABを引き続き活用して、独自のユニークで面白い発想を次々と具現化して世間を楽しませてくれることを期待しています。 |
『新潟県の自動車保有率と交通事故死者率の関係を分析する』 <投稿作品PDF> 伊藤隆人, 工学部 |
---|
[審査員選評] 交通事故死者数を自動車利用のデメリットと位置付け、今後どのような傾向があるかを、自治体別のデータを用意して回帰分析と散布図を用いた複数の比較検討を行っています。 挑戦したテーマが困難に過ぎたがために考察や取り組みのインパクトは薄いものの、 自身の分析計画に沿ってデータを集め、グラフを描画しながら考察をする過程が丁寧に記述されており、その手続き的な部分を評価しました。 引き続き勉強して困難なテーマに果敢に挑戦してほしいと思います。 |