会誌「情報処理」Vol.63 No.2(Feb. 2022)「デジタルプラクティスコーナー」

人文・社会科学系大学におけるデータサイエンス教育

増川純一1  辻 智2  田村光太郎3

1成城大学  2成城大学データサイエンス教育研究センター  3(株)野村総合研究所データサイエンスラボ 

人文・社会科学系の4学部からなる成城大学においても,数理科学のリテラシーを持ち,データ分析に詳しい人材の育成は教育目標の大きな柱の1つである.本学では 2015 年度より全学共通教育科目としてデータサイエンス科目群を設置しその教育課題に取り組んできた.本稿では6年間実施してきたデータサイエンス教育プログラムを振り返り,その教育成果と課題を整理したい.また,プログラムの次のステージに向けての今後の展開を述べたい.

1.人文・社会科学系大学におけるデータサイエンス教育の目的

成城大学(以下本学)は,経済学部,文芸学部,法学部,社会イノベーション学部の人文・社会学系4学部からなるいわゆる文科系大学である.本学では,2015年度に,全学共通教育科目としてデータサイエンス科目群を設置した.

なぜ,文科系大学にデータサイエンス科目を設置するのか.その経緯については次章で述べるが,設置当時,2014年には「日経ビッグデータ」☆1が創刊され,蓄積した膨大なデータを分析,活用して商品開発やマーケティング,業務の効率化や収益の向上などを達成したという多くの先進的な企業の姿が日経新聞などでも頻繁に報道されるようになった頃である.早晩,製造,販売,金融,物流,サービスなどあらゆる業種のあらゆる部署の企業活動に,ビッグデータ活用が波及することは想像できた.しかしながら,そのスキルを持つ人材は理系学生や社内教育では賄いきれず,常に不足していた.今でもその状況は大きく変わっていないように思われる.

本学2020年度卒業生の就職先を業種別に表1に示した.理科系学部に比べると製造業への就職比率が小さいが,どの学部も,さまざまな業種に極端な偏りなく就職している.

表1 学部ごとの就職先
学部ごとの就職先

ビッグデータを活用するための科学をデータサイエンスと位置付けるならば,文科系大学とはいえ,卒業後多様な現場で働く学生にとっては必要な素養となる.本学では,カリキュラムの目標として「データに関心を持ち,データに基づき考え,行動する学生の育成」を掲げ,カリキュラム作成にあたっては,統計学的なデータ分析手法の習得に終始するのではなく,実用例を通して,データに目を止めて考える姿勢を身につけることを重視した.

このような,人文・社会科学系大学におけるデータサイエンス教育に対する考え方は,数理・データサイエンス教育強化拠点コンソーシアム☆2が推奨する数理・データサイエンス・AI(リテラシーレベル)モデルカリキュラム[1]とも合致するものであり,本学データサイエンス・カリキュラムの基礎的部分は,文部科学省より令和3年度「数理・データサイエンス・AI教育プログラム(リテラシーレベル)」として認定された[2].

学生が社会に出てから必要になる素養というだけではなく,人文・社会科学系大学の学生がデータサイエンス教育を学ぶべき理由はまだある.

国の第5期,第6期の科学技術・イノベーション基本計画で目指すべき方向としているSociety 5.0は,ITとディープラーニングに代表されるような高度な機械学習の技術をフルに使って,スマートな情報活用社会の実現と環境問題,経済格差などの難しい課題の分野横断的な解決を目指すというものである.Society 5.0が目指す新しい社会は,理工系,情報系人材の独壇場ではない.これらの難しい課題を解決するためには,どのように社会や経済が回っているのか,環境問題はなぜ,どのようにして起こるのかといった社会・経済の問題に関する深い洞察とデータサイエンスとのリンクが必須であると考えられる.

科学リテラシーを「科学の常識や知見にしたがって意思決定し,行動できる能力」,データリテラシーを「データ(エビデンス)に基づき論理的に意思決定し,行動できる能力」と定義したならば,これらの重要性の認識は社会が大きな困難に直面するたびに高まっているように感じる☆3.これらは市民として社会全体が持たなければならないリテラシーであり,それは教育でしか成し遂げられないものである.

2.成城大学におけるデータサイエンス教育導入の経緯

2.1 経済学部専門科目としてのデータサイエンス教育

まず,全学データサイエンス教育導入以前より行っていた,経済学部における専門科目としてのデータサイエンス教育について紹介する.基礎科目として「データ解析入門」(経済学科)あるいは「データ分析」(経営学科)習得後に,専門科目として「統計学」(経済学科)「経営統計学」(経営学科)を選択することができる.さらに,2021年度よりプログラミングや機械学習の基礎を学べる科目も導入した.また,「経営情報論」(経営学科専門科目)では,2012年度から1つのトピックとしてビッグデータの活用を取り上げ,商品企画・開発,マーケティング,収益(集客,客単価)の向上,災害時の危機管理,医療,集合知を利用した予測など幅広い分野での事例紹介を行ってきた.学生にとっては身近なテーマが多く,大変興味を持って聞いてくれている.

2.2 全学共通教育科目としてのデータサイエンス教育の導入

学校法人成城学園は,2017年に学園創立100周年を迎えたことを機に,次の100年の教育目標として「国際教育」「理数系教育」「情操・教養教育」の3つを掲げて教育改革を進めている.教育改革“3つの柱”の主な取り組みは以下のとおりである.

  • 国際教育:語学的教養を通じて国際性を強化する「国際教育」の取り組み
  • 理数系教育:数学的教養を通じて論理的な思考力を強化する「理数系教育」の取り組み
  • 情操・教養教育:芸術的教養を通じて人間性を強化する「情操・教養教育」の取り組み

理数系教育の中核として,データサイエンス教育を行うという発想は,2013年,当時の油井学長が学外会議で同席した日本IBMの方々との情報交換の中で生まれた.2014年,成城大学は日本IBM東京基礎研究所と包括的な連携協定を締結した.その内容は「成城大学の持つ経済学,文化芸術,法学など人文・社会科学的視点と,日本IBM東京基礎研究所のデータベース,自然言語処理,機械学習,人工知能などの高度なICTとの融合を図り,より豊かな未来社会の実現と学術研究の振興に寄与すると同時に,ビックデータを活用できる人材の育成をともに目指す」というものである.

2015年度からは,日本IBM東京基礎研究所より授業科目「データサイエンス概論」の提供を受け,それを本学におけるデータサイエンスへの入門科目として,全学共通教育科目の中に,データサイエンス科目群6科目を設置した.

2.3 データサイエンス教育研究センター(CDS3)の開設

本学は,「情操・教養教育」を担うセンタとして共通教育研究センターが2007年に開設されており,「国際教育」を担うセンタとして2015年に国際交流室を国際センターに改組した.理数系教育の中核としてのデータサイエンス教育の企画・運営は,共通教育研究センターに設置された専門部会が行っていたが,その任務を担う専門部署として2019年4月にデータサイエンス教育研究センター(以下CDS3:Education and Research Center for Data-driven Social Science & Humanities of Seijo University)を開設した(図1).本稿の筆者の1人増川は初代センター長を務めた☆4

成城大学データサイエンス教育研究センター(9号館2F)(左:9号館全景,右:共創の場としてのスクエア)
図1 成城大学データサイエンス教育研究センター(9号館2F)
(左:9号館全景,右:共創の場としてのスクエア)

CDS3は,中核ミッションとして,教育「データに関心を持ち,データに基づき考え,行動する学生の育成」と研究「データサイエンスの人文・社会科学分野への応用」の2つを掲げて,人文・社会科学の専門知識とデータサイエンスの基礎力を兼ね備えた独創的な教養人の育成を目標としている.

次章で述べる正規の教育プログラムに加え,統計検定やG検定等の資格取得の支援,企業が主催するデータ関連コンテストやSignateやKaggleコンペの参加支援も行っていきたいと考えており,2020年度からディープラーニング協会が主催するG検定のための講習会を開催している.

また,CDS3の活動を学内外に発信するためのシンポジウムを定期的に開催している.2019年度は「人文・社会科学系大学におけるデータサイエンス教育」と題するシンポジウムを開催した[3].CDS3は,大学や企業で実際にデータサイエンティストとして活躍されている研究者や実務家の方々に,外部アドバイザリー委員として企画運営にご協力いただいている.シンポジウムでは,これらの方々と人文・社会科学系大学におけるデータサイエンス教育の在り方や今後の方向性について議論した.2021年度は「人文・社会科学研究におけるデータサイエンス」をテーマとしたシンポジウムを開催する.

そのほか,与えられたデータを使ってビジネス提案を競う学内「データサイエンス・コンテスト」[4]や,「データサイエンス・ワークショップ」(2021年度は,計量文献学へのデータサイエンスの応用を学ぶ「データサイエンス・ワークショップ2021―文学作品のテキストマイニングーデータサイエンスが解き明かす作品の痕跡―」[5])開催などにより,データサイエンスの実践を通してより多くの学生にその面白さを知ってもらうための企画を行っている.

3.成城大学におけるデータサイエンス教育

ここからは具体的に成城大学におけるデータサイエンス教育の内容について述べる.

3.1 カリキュラムデザイン

本学のデータサイエンス教育においては「文系でもできる!」をスローガンとして,学習する内容は,文理融合的で実践的・実務的なものとなっている.この科目群を系統的に学ぶことで,専門以外の分野にも視野を広げ,卒業後どのような分野に進んでも活かせるデータ分析力を身につけることを目標としている.

表2に現行のカリキュラムと科目ごとの到達目標を示した☆5.現行のカリキュラムは全部で6科目(12単位)でリテラシー・基礎4科目と応用2科目の2群からなる.データサイエンスの基礎を身につけた学生には「基礎力ディプロマ」が,さらにその上の応用力を身につけた学生には「EMSディプロマ」☆6が授与される制度となっている.2020年度終了時点で26人が「基礎力ディプロマ」を5人が「EMSディプロマ」を授与されている.

表2 データサイエンス・カリキュラム(現行)
データサイエンス・カリキュラム(現行)

3.2 シラバス

3.2.1 リテラシー・基礎レベル教育~基礎力ディプロマ~

リテラシー・基礎レベル教育の科目は,AIやデジタル・トランスフォーメーションを概観する「データサイエンス概論」,記述統計学を学ぶ「データサイエンス入門I」,推測統計学を中心とした「データサイエンス入門II」,実践的スキルをさらに伸ばすための「データサイエンス・スキルアップ・プログラム」の4科目である.希望する学生全員が履修可能となるように,どの科目も「前提がないのが前提」との方針なので,履修生のレベルを揃えるような事前のテスト等は実施していない.各学部・学科の授業を優先させる形で,曜日・時限の調整を可能な限り行っており,5時限も積極的に活用している.さらに,通年授業は行わず,前期・後期で同じ授業を展開し,なるべく多くの学生が履修しやすいように工夫している.

特に本プログラムの導入科目でもある「データサイエンス概論」は,文系学生の理数系科目に対する苦手意識に留意し,授業とハンズオンを毎回組み合せている.このことにより,「学ぶ楽しさ」や「学ぶことの意義」が体感的に進むように工夫している.授業の部分では,パワーポイントによる資料投影を中心とした授業形式で行う.その際,ビデオ資料投影も多く盛り込み,映像と音声により臨場感を高め,体感的に理解が進むようにしている.ハンズオンでは,実際に卓上からWebやクラウドにアクセスして,AI系のアブリやコンテンツにより実習を行う.その際,海外のデータセンタとのやりとりでも,数秒で結果が戻ってくる.この圧倒的なスピード感で現実のITやネットワークの最新技術を体感する.また,90分という限られた授業時間の中でも,このスピードが功を奏し,実習は時間的にもかなり思いどおりに進めることができる.

「データサイエンス概論」は,6科目のデータサイエンス科目群の中で最も入り口に位置するため,この科目で失敗すると,後の科目履修に続かない恐れがあり,どのような内容にするのかがとても重要である.学生がワクワクする内容が必要であり,AIやデジタル・トランスフォーメーションを概観できるようなトピックの組合せを考える必要がある.また,“コンピュータ・サイエンス”のような大きくて硬いイメージの題目ではなく,“社会やビジネスを大きく変える”や“医療技術支援”のような身近に感じる題目を多く取り入れた.シラバス作成にあたっては,ICT業界側の視点が多く盛り込まれているのも特徴で,さらに履修生の要望を取り入れて,年々進化させている☆7

3.2.2 応用レベル教育~EMSディプロマ~

データサイエンスの応用レベル科目は,データサイエンスの概観を知り,入門を終えた学生を対象とし,統計を中心に教える「データサイエンス応用」と機械学習・AIを教える「データサイエンスアドバンスドプログラム」がある.授業のねらいは,実際の現場で利用されることの多いデータサイエンスの各手法に関して広く触れてもらうことと,興味や目的に応じて自身で深めていくことができるようになってもらうことである☆7

前半は講義形式,後半は分析プロジェクトで構成される.統計や機械学習の手法の紹介だけでなく,実際のデータサイエンスの現場を視野に入れて,与えられたデータに価値をもたらし,データ分析により課題を解決するという点も重視している.

講義形式の授業では,スライドを使った説明と,その内容をPythonやR言語で実装していくプログラミングの2つを行う.難しい数学を前提にしないよう,また,プログラミングの経験がない学生が多いため,授業の中で学生に大きな負担がかからず,興味を失わないことを念頭に進めている.プログラミングでは,授業中に十分な時間を取り,教員のサポートの基,授業内容の実装とともに簡単な課題を与え,結果を提出させることで評価を行っている.

後半ではプロジェクトベースドラーニング(以下,PBLと表記する)が行われる.学生複数人からなるグループを作り,各グループが分析のテーマを定め,分析を実施し,結果を発表することが求められる.ここでは「企画」「分析」「表現」の一連のデータ解析プロジェクトのプロセスを体験する.実務に近い状況でのデータサイエンスの適用を学ぶとともに,自身に課せられた分析に対して,分析の理解や説明能力が高まることが期待される.授業の最終回では発表会を開催し,各グループの成果を外部の実務家講師などにお願いする審査員に講評していただいている.

本授業でPBLが導入されている背景として,実務では,分析手法の深い理解だけでなく,プロジェクトをマネジメントするスキルも,データサイエンティストの中では重要なスキルとして認識されていることによる[7]☆8.データサイエンティスト協会が公表するデータサイエンティストの3スキルの中では,ビジネススキルと呼ばれる.これは,ビジネス課題に関連するデータとその分析がもたらす価値を評価したり,複雑な手法を利用者に説明したりするコミュニケーション能力である.複数のメンバで構成される実務のデータサイエンスプロジェクトでは,コミュニケーション能力は重要なスキルであり,データサイエンティストに欠かせない基礎体力と考えている.

2015年度のカリキュラム設置の初期から,このようなPBLを導入できたことは,若手教員や実務家からアドバイスを受ける形でシラバスの設計を行ってきたことが大きい.現在も構成を大きく変えずにシラバスが組まれていて,特に,人文・社会科学系の学生向けのプログラムとして適していると考えている.

3.3 履修生の理解度

3.3.1 リテラシー・基礎レベル

履修学生の構成は,学期やクラスごとにコントロールしていないので,授業初回にアンケートを実施し,これまでの経験やスキル,今後の授業への希望や不安を聞いて,クラス全体としてのレベルや雰囲気を分析し,その後の授業の進め方を決めている.また,毎回の授業の後,感想や要望をリアクションとして書いてもらい,それを基に授業の細かな軌道修正も適宜行っている.

「データサイエンス概論」の授業は全15回の構成であるが,ほとんどが初年度の学生なので,当然のことながらデータサイエンスに関して初学者が多い.開始時の第1回と終了時の第15回には同じ質問内容の認知度アンケート調査を行い,理解度のチェックを行っている.「次のデータサイエンスに関する用語の認知として,あなたに当てはまるレベルをクリックしてください」という問いかけで,あらかじめ設定した85のデータサイエンスに関する用語に関して認知度を聞いている.学生にとってよく耳にする用語から,聞いたことがないような専門用語までを意図的に選定している.これらの用語に対して,4段階の順序尺度で認知度を聞いている.また,アンケートの最後部には,第1回には「この授業への期待,要望,質問,不安など」,第15回では「この授業の良かった点,残念だった点」などを自由記述形式で書き込みできるように設定している.第2回から第14回までの途中の回でも,毎回授業の終わりに理解度や要望を50〜300字程度の自由記述形式で書いてもらっている.

データサイエンス概論の2019年度前期(教室での対面授業)の第1回授業前と第15回授業後を比較した結果を例示する.図2は,第1回授業前(以下,Beforeで表す)と第15回授業後(以下,Afterで表す)の学生の認知度を集計し,出力したものである.分析サンプルとしてのコメント数は,Beforeが42,Afterが37となっている.図2には,興味深い点がいくつかある.10の用語は,人工知能(AI)に関係した用語である.AIに関しては,高校において学習してきたためか,Beforeの段階でほとんど認知されており,機械学習についてもかなり認知されている結果となっている.Beforeでは,ほかの用語に関しても,認知している割合が多くなっている.Afterになると,AIおよび機械学習もよく理解していて,他者に説明できる割合が増え,授業でツールとして使用してきたIBM Watson,Microsoft Azureなどへの認知度も大幅に増えている.また,学生の積極的自己学習のおかげで,チャットボットなど授業中にトピックとして扱った内容以外でも,サポートベクタマシンなど,授業では説明していないにもかかわらず,Afterで認知度が大幅に上がっている.また,AIに関する認知度のスコアはBeforeとAfterであまり変わらないが,その質が大きく変化することが特徴として挙げられる.その理由は,途中回のコメントを追跡することで分かる.AIに関しては,授業が進むたびにその理解が深まり,サポートベクタマシンについては,自分で授業内容について調べているうちに目に触れるようである.

データサイエンス理解度チェック(2019年度)
図2 データサイエンス理解度チェック(2019年度)

教室での対面授業とオンデマンド授業の効果を比較するために,授業初回と最終回に実施している認知度アンケートの結果を,2021年度前期(オンデマンド授業)のデータサイエンス概論に関して,図3に示す.今回示す2019と2021のデータは,学年や学部が同じような構成のクラス同士をクラス単位で比較している.図2と図3を比べてみると,人工知能関連用語10語に関する結果であるが,2019前期教室対面授業と2021前期オンデマンド授業では,Before & Afterで各語の認知度の変化傾向は似ている.この結果からは,教室対面授業からオンデマンド授業になっても,履修生の授業に対する理解度は大きく変化せず,理解度が著しく落ち込むということはなかったようである.

データサイエンス理解度チェック(2021年度)
図3 データサイエンス理解度チェック(2021年度)
3.3.2 応用レベル

履修生は数学をあまり得意としない文系の学生であるため,数理的な知識を前提にしない授業形態や,プログラミングの直接指導を行っていることを先に書いた.この授業設計は,学生同士あるいは教員との議論をやりやすくするので,細部で行き詰まってしまう学生を減らすことができる.

応用レベルの授業での細部についての学生の理解は,さまざまである.しかし,ライブラリ(汎用性の高いプログラムをまとめたもの)の利用やオープンソースソフトウェアによって,分析は問題なく実施できる.手法の細部まで知ることを後回しにしても,ライブラリの使用方法さえ理解できれば,わずか数行のスクリプトで分析が実施でき,結果について素早く学生と議論できるからである.これらの取り組みは,数理的な理論についていけなくなって学生が履修をあきらめてしまうことや,プログラミングに対する抵抗感をなくすことができ非常に有意義である.

最終的に,いずれの学生もデータ解析プロジェクトではメンバの一員として,授業の中で興味を持った手法やスキルを目的に応じて自身で深め,プロジェクトの中で他者に説明できるまでのレベルに達している.発表会やレポートの内容は,発表会審査員や外部講師から高い評価を得ていることからも,授業を通して学生のデータサイエンスへの理解は高まっているといえる.

4.成城大学におけるデータサイエンス教育導入の成果

データサイエンス科目群は,開設以来順調に履修者数を伸ばしている.図4に2015年度から2021年度の履修者数の推移を示している.また,図5は2021年度を例としたデータサイエンス概論の学部別,学年別の履修者の割合である.経済学部が半数,それに次いで多いのが文芸学部,それに社会イノベーション学部,法学部と続いている.これは毎年ほぼ同じ傾向である.文芸学部にデータサイエンスに関心を持つ学生が多いことは本学の特色であろう.

データサイエンス科目群履修者数推移
図4 データサイエンス科目群履修者数推移
データサイエンス概論の学部別,学年別の履修者の割合
図5 データサイエンス概論の学部別,学年別の履修者の割合

4.1 学生による授業評価アンケートから

本学では,毎年前期・後期に履修する学生全員を対象にした「授業改善アンケート」を実施している.表3は,2020年度後期で実施されたアンケートにおける評価点(5点満点)のデータサイエンス科目群全体の平均値と大学全体のすべての授業科目の平均値の比較である,学生からの授業評価は非常に良い評価を得ている.

表3 授業改善アンケート(2021 年度後期授業)
授業改善アンケート(2021 年度後期授業)

アンケート結果では,データサイエンス科目群は,本学Webサイトに公開している12項目すべてで大学全体の平均値を上回っていた.中でも「この授業は総合的に判断して自分にとって有意義だった」という設問で,大学全体の平均値が4.2に対して,データサイエンス科目群は4.6であり,データサイエンス科目群の履修学生の満足度と理解度の高さを示している.

応用レベルの授業に関しては,比較的難易が高いとの声もあるが,それに対する努力や授業後の興味関心の高まりは良い傾向にある.学生にとっては,なじみのない内容の授業内容であるが,授業のかなりの時間を学生のサポートに割くことで,多くのコミュニケーションが生まれることから,多様な質問や希望を授業に反映できる点が重要な要因と考える.

「授業改善アンケート」の中に,「この授業を通じて,下記の各資質・能力のうち,どの項目が身につきましたか.身についた資質・能力をすべてマークしてください」という設問があり,データサイエンス科目群履修学生は,本アンケートの大学全体の平均値よりも,以下の項目で「身についた」と回答した割合が高かった.1.この分野の知識・学力,2.数理的能力,3.構想力,4.柔軟な発想力,5.俯瞰力,6.課題発見力,7.課題解決力,8.協働力である.中でも,2.数理的能力(大学全体平均値6.5%に対して27.4%),5.俯瞰力(大学全体平均値8.9%に対して17.7%),6.課題発見力(大学全体平均値9.8%に対して17.7%)の割合が特に高かった.

しかしながら,応用レベルの授業では途中で履修を辞めてしまう学生がいることも事実である.特に,プログラミングに難しさを感じる学生はいまだに多い印象であり,履修人数が増えていく状況やコロナ禍でのオンライン/オンデマンド授業で,一人ひとりをどのようにフォローしていくかは課題が残る.現状は,ティーチングアシスタントの導入により,リソースを増やす形で,プログラミング支援を検討している.

4.2 担当教員から見た学生の変化

リテラシー・基礎レベルの授業についてはすでに述べたので,ここでは応用レベルのデータサイエンス科目を履修した学生の変化について紹介する.

履修する学生は,人文・社会科学系の学生であるため,データサイエンスの理論やプログラミングに不慣れな学生が多い.しかし,どのように学んでいくのかを知りたいというモチベーションの学生が多く,データサイエンス自体には強い興味を持つ傾向にある.

このような学生は,未経験のプログラミングであっても,授業でインターネットでの調べ方などを教えることで,自律的に学習できるようになる.特に,授業で扱うプログラミングの技術が一定程度のレベルに達すると,学外のコンペティションやコンペティションサイトへ参加したりと,自身で積極的にデータサイエンスへかかわろうとする意欲を持つ学生が増えていく.データサイエンスのスキルを客観的に示したいという意志で応募する傾向があり,データサイエンスへ参加する場を求める傾向にあると考えている.

そのため,データサイエンス応用やアドバンスト・プログラムの授業後半のPBLのグループワークにおいて,さまざまな形でデータサイエンスを体験することは非常に有意義であると感じる.データサイエンスに何らかの形で貢献したという経験により,モチベーションが高まる学生が多く,実際に,データサイエンス系の企業に就職した者や,大学院に進学した学生が出てきている.

本データサイエンス・カリキュラムは2015年度より開講されているが,履修する学生の経年の変化も多分に感じられる.特に最近では,授業参加時点でプログラミングの経験がある学生が増えてきた点である.データサイエンスの最初の接点として,KaggleやSignateなどのデータサイエンスのコンペティションサイトへの参加を経験していたり,興味やある程度の知見を持っている学生が増えてきている.そのため,授業との関連性においても無視できない.正規のプログラム以外に,外部のイベントなどを積極的に活用していくことも今後重要と考えている.

学生同士でデータサイエンス科目群の履修を進める動きが出てきたことは,我々にとって大変嬉しいことである,たとえば,学部デーを利用して,学生有志がデータサイエンス授業を語る場があり,先輩から後輩へとその経験が受け継がれている.また,ディプロマ修了者が大学案内等の各種パンフレットにロールモデルとして登場して,データサイエンス科目群について率直な感想を述べていることも,在学生の授業履修に繋がっている.

4.3 人文・社会科学系専門科目へのフィードバック

応用レベル教育では,統計とAI・機械学習を中心に,データ分析を学ぶことになる.実際のデータサイエンスの現場では,意思決定支援において統計分析の利用も多く,データサイエンスと人文系・社会科学系の共通部分は大きく,親和性も高い.本カリキュラムでは,マーケティングデータから国家統計のようなビジネスから経済まで幅広いデータを扱う.さまざまなデータでの分析仮説を立てたり,その検証をしたりすることで,基本的なデータ操作や基礎分析を身に着けることができ,他分野にも有用と考える.

一方で,統計分析では十分に対応できないタスクも存在する.たとえば,自然言語処理,画像処理/認識である.これらは,業務の自動化が求められるプロジェクトではよく問われる領域でもあるし,人文・社会科学系でも多くの分析需要があり,機械学習やAIが得意とする領域でもあるので,本授業では発展的な内容として教えている.人文・社会科学系の授業や研究にも新たにバリエーションを与える領域とも期待されていて,データサイエンスのスキルを身につけることはこれらの領域での実務にも貢献できると期待される.

5.今後の展望

2022年度から,表3に示した成城大学データサイエンス教育プログラムの次のバージョンがスタートする(表4).

表4 データサイエンス・新カリキュラム(2022〜)
データサイエンス・新カリキュラム(2022〜)

新カリキュラムの大きな特徴は3つある.1つは,カテゴリを3つに改編したことである.リテラシーレベルのDS概論とDS基礎は基礎力ディプロマ取得のための必修科目であるが,現行カリキュラムのDS入門I,IIとDSスキルアッププログラムの統計学や機械学習といったやや数理科学的な内容の科目を分離して,データアナリティクス基礎,機械学習基礎として基礎・応用レベルに組み込んだ.これは,基礎力ディプロマを取りやすくして,数学に特に苦手意識のある学生にもデータサイエンスを学んでほしいからである.データアナリティクス基礎,機械学習基礎は中級ディプロマ取得の必修科目であるが,さらに詳しく統計学や機械学習を学びたい学生のための選択科目として,データアナリティクス応用,機械学習応用を設けた.リテラシーレベルと中級レベルのプログラムの必修科目は,それぞれ,数理・データサイエンス教育強化拠点コンソーシアムが推奨する数理・データサイエンス・AIモデルカリキュラムのリテラシーレベル[1]と応用基礎レベル[8]の内容を含むものとなっている.これも特徴である.

3つ目の特徴は,発展レベルをより実践的な内容にしたことである.EMSディプロマはDSワークフロー・プログラム,DSアドバンスト・プログラム,DS特殊授業I〜IVから2科目を選択することを必修とした.DSワークフロー・プログラムはビジネス・ファイナンス系の実践的データサイエンスを企業で実務に携わる方に担当してもらう授業・演習科目である.また,DS特殊授業I〜IVは主専攻の専門科目とデータサイエンスとの連携を目的とした科目群で,人文・社会学系の分野でデータサイエンスを応用した研究を行っている方に担当していただく予定である.先に述べた,毎年開催する予定のデータサイエンス・ワークショップ[5]はそのための調査・準備の役割がある.

2021年度からは,公立はこだて未来大学との連携を行う.その1つの試みとしてデータサイエンス科目のTA(ティーチング・アシスタント)として大学院生を派遣していただくことになっている.理系の大学院生と議論することで,人文・社会科学系の学生と発想の違いを学び,データサイエンスの広さを知ることができる.ほかにも,KaggleやSignateといった外部コンペティションサイトやハッカソンへ共同で参加を行うなど,いろいろと期待を膨らませている.

また,データサイエンス関連イベントへの参加や関連資格取得の支援は,積極的に行っていきたい.最近,データサイエンティスト協会からデータサイエンス検定が発表されるなど[9],一定の認知がある資格やイベントなどが増えてきている.スキルを証明することが難しく悩む学生には,それが視覚化される資格やイベント参加などの実績は,就職活動などで大きな武器となると考えられる.

データサイエンスはすべての学生が「育むべき新たな力」であることは間違いない.それをどのように学生に伝えたら良いのか,CDS3は「人文・社会科学系大学におけるデータサイエンス教育」をこれからも模索していく.

参考文献
脚注
  • ☆1 今は「日経クロストレンド」に統合された.
  • ☆2 本学も2021年度より連携校として参画した.
  • ☆3 東日本大震災時の福島原発事故による放射能汚染に対する対応や,コロナ禍での行動変容などに表れるリスクに対する個人の認識には大きなばらつきがある.
  • ☆4 2021年度より小宮路経済学部教授がセンター長に就任した.
  • ☆5 2022年度より新カリキュラムがスタートする.
  • ☆6 EMS : Excellently Motivated Student
  • ☆7 シラバスの詳細は成城大学Webサイトをご覧いただきたい[6].
  • ☆8 数理・データサイエンス教育強化拠点コンソーシアム「モデルカリキュラム」,データサイエンティスト協会「スキルチェックリスト」,情報処理推進機構「ITSS+」など.
増川純一
増川純一(非会員)maskawa@seijo.ac.jp

1958年生.1987年大阪大学工学部基礎工学研究科後期博士課程修了.工学博士.成城大学経済学部教授.専門は経済物理学.物理学会会員.

辻 智
辻 智(非会員)dstsuji@seijo.ac.jp

1959年生.1986年日本アイ・ビー・エム(株)入社.1996年名古屋大学大学院工学研究科量子工学専攻博士後期課程修了.博士(工学).2018年より成城大学特別任用教授.日本認知科学会会員.

田村光太郎
田村光太郎(非会員)k.tamura.phd@gmail.com, k4-tamura@nri.co.jp

1988年生.2016年東京工業大学大大学院総合理工学研究科博士課程修了.博士(理学).(株)野村総合研究所主任データサイエンティスト,成城大学データサイエンス教育研究センタ外部アドバイザリー委員,電気通信大学客員准教授.専門は複雑系物理学,データサイエンス.物理学会会員, 人工知能学会会員.

受付日:2021年9月1日
採録日:2021年9月30日
編集担当:江谷典子(Peach・Aviation(株))

会員登録・お問い合わせはこちら

会員種別ごとに入会方法やサービスが異なりますので、該当する会員項目を参照してください。