人工知能(AI)の第3次ブームと言われ、様々な応用にAI技術が組み込まれるようになってきています。特に深層学習をはじめとする機械学習技術まわりは、技術の改良・発展と応用展開が著しいスピードで進んでいます。このような時代にあって、安全で信頼性の高いシステムを効率良く開発・運用するためのソフトウェアエンジニアリングにも新しい考え方・方法論が必要になってきました。そこで、本セミナーでは、AI応用システムの開発プロセスの全体像を示すとともに、AI×ソフトウェアエンジニアリングへの取り組み、注目するツールや開発方法論を紹介します。その中では、従来のV字型開発モデルが通用しない理由や、機械学習技術が組み込まれた際に生じる品質保証・再利用・要求定義に関わる課題についても議論します。
【略歴】1982年東京大学理学部物理学科卒業、NEC入社。以来、中央研究所にて自然言語処理・サーチエンジン等の研究開発・事業化および人工知能・ビッグデータ研究開発戦略を担当。工学博士。2005~2009年NEC中国研究院副院長。2011~2013年東京大学大学院情報理工学研究科客員教授(兼任)。2016年4月から科学技術振興機構研究開発戦略センターフェロー。2015~2017年人工知能学会理事、2018年~同学会監事。1992年情報処理学会論文賞、1997年情報処理学会坂井記念特別賞、2003年オーム技術賞等を受賞。
昨今のAIブームにより、機械学習の業務活用が急速に進んでいる。しかし、機械学習を用いたシステムを開発するノウハウ・方法は体系化されておらず、そのため、従来のITシステムを開発していたSEにとっては敷居が高くなっている。本講演は、機械学習を用いたシステムの開発を行ったことがないエンジニア・マネージャーに対して、従来との違いを中心に開発プロセスを解説する。また、目的設定・トライアル(Proof of Concept)・要件定義・実装・テスト・運用(再学習)の各フェーズにおいて、開発者やプロジェクトマネージャーが気を付けるべき点を紹介する。
【略歴】2006年東京大学工学系研究科産業機械工学専攻修士課程修了。NECにて、人工知能・知識科学・データマイニングの研究開発および実業務適用に従事。現在までに、機械学習を用いた業務システムの導入を多数実施。著書「人工知能システムのプロジェクトがわかる本」(翔泳社、2018)。2010年度山下記念研究賞、2015年 先端科学技術大賞フジサンケイビジネスアイ賞等を受賞。
深層学習(ディープラーニング)の発展に伴って統計的機械学習を利用するシステムは急速に社会に浸透しつつある。しかしその一方で、従来型のITシステムに用いられてきた様々なソフトウェア工学的手法は、統計的機械学習を組み込んだシステム(機械学習応用システム)にはほとんど通用しない。このような現状を踏まえ、機械学習応用システムに対しては「ソフトウェア工学」に対応する「機械学習工学」ともいうべき知識の体系化が必要と考え、2018年4月に日本ソフトウェア科学会 機械学習工学研究会を立ち上げた。機械学習工学で議論すべき項目は、開発・運用プロセス、訓練データの準備と管理、生成物の再利用、品質の担保とテスト、解釈可能性、要求工学、計算資源とその管理、ソフトウェア・アーキテクチャ・パターン、など多岐にわたる。この講演では、機械学習工学研究会の8ヶ月の活動を振り返り、その間に得られた知見について議論する。
【略歴】1983年東京工業大学修士課程修了。同年日本アイ・ビー・エム入社。ジャパン・サイエンス・インスティテュート(後の東京基礎研究所)にて、人工知能、自然言語処理などの研究に従事。1997-2000年東京工業大学 情報理工学研究科 客員教授 XML、Webサービス、及びセキュリティの研究・開発・標準化を行なう。2003-2004年IBMビジネスコンサルティングサービス株式会社へ出向。2006-2009年東京基礎研究所所長。執行役員。2009-2010年キヤノン株式会社 デジタルプラットフォーム開発本部 副本部長。2011-2016年大学共同利用機関法人 情報・システム研究機構 統計数理研究所 教授。2016年4月から、株式会社Preferred Networks 最高戦略責任者。
近年、学術研究としてのみならず、ビジネスの現場においても、人工知能・機械学習を活用することはもはや常識となっている。このような状況において、ビジネスサイクルをより高速に回すために、OSSの活用は必須なものである。ここ数年で、Stanなどの確率的プログラミング言語や、Googleのデータフローダイアグラムを活用した機械学習ライブラリであるTensorFlowなど、Cutting Edgeな技術に基づいたOSSも台頭してきた。本講演においては、このようなOSSライブラリの新潮流を簡単に紹介・解説するとともに、どのように実ビジネスの現場において活用していくべきかについて紹介したい。
【略歴】北海道大学大学院理学研究科物理学専攻修士課程修了・総合研究大学院大学複合科学研究科統計科学専攻博士課程在学中。 材料科学系財団・金融系シンクタンク・リクルート系企業を経て現職。 翻訳書 『R言語徹底解説』(共立出版 、2014) 、翻訳書 『みんなのR』 (マイナビ、2015)、翻訳書 『Rによる自動データ収集』 (共立出版、2017)など多数。
近年、身の回りのモノをインターネットに繋げるIoT技術の進展により、多種多様な機器やセンサーから計測されるデータをビジネスに活用する取り組み広がっている。一方、ソフトウェア開発においても、ソーシャルコーディングの普及とともに、ソフトウェア版のIoTとも言える多種多様なWeb上の開発ツールが活用されるようになり、それらツールによるデータ蓄積・共有がなされるようになっている。ソフトウェアリポジトリマイニングは、それら蓄積データを分析し、開発に活用するための技術であり、ソフトウェア工学分野の主要な研究テーマの一つとなっている。本講演では、このような近年のソフトウェア開発スタイルについて概説するとともに、ソフトウェアリポジトリマイニングの研究動向を紹介する。
【略歴】平成6年名古屋大学工学部電気学科卒業。平成10年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了。同年同大学同研究科助手。平成16年同大学助教授。平成19年同大学准教授。平成27年岡山大学大学院自然科学研究科教授。平成15~16年Auckland大学客員研究員。博士(工学)。実証的ソフトウェア工学、ソフトウェアプロテクション、ヒューマンファクタ等の研究に従事。平成29年より日本ソフトウェア科学会ソフトウェア工学の基礎研究会主査を務める。
深層ニューラル・ネットワークを用いた機械学習ソフトウェアの機能振舞いは訓練データセットで決まる。データセットは具体的なデータの集まりであって簡潔な要求仕様を伴わない。また、学習プログラムは未知の学習結果を求めるものでテスト・オラクルが存在しない。正しさの基準が不確かでありプログラムの品質を論じることが難しい。一般の工業製品では、不具合原因となる欠陥の特徴に合わせて、品質保証の方法を考える。装置製品などのハードウェアは物理的な劣化や故障による誤動作を起こす。偶発的な欠陥が不具合の主な原因である。また、ソフトウェアの不具合は決定論的な欠陥に起因すると云われる。では、データセットに依存する機械学習ソフトウェアの欠陥は、どのような性質を持つだろうか。本講演では、これまでにソフトウェア工学で得られた知見が、機械学習ソフトウェアの信頼性および安全性の向上に、どのように役立つかを考えたい。
【略歴】1979年東京大学理学部物理学科卒業、1981年同大学院理学系研究科物理学専攻修士課程修了。博士(学術)。NEC、法政大学を経て2004年より国立情報学研究所教授。2005年より総合研究大学院大学教授(併任)。この間JSTさきがけ研究員およびSORST研究員を兼務。情報処理学会2001・2015年度山下記念研究賞、日本ソフトウェア科学会第8回論文賞・第34回高橋奨励賞受賞。ソフトウェア工学、形式手法、モデル検査、CPSとイノベーションの研究に従事。