連続セミナー2022「その先へ 情報技術が貢献できること」

第1回【6月22日(水) 13:00~15:30】

機械学習工学の進展:開発・運用の技術


第3次AIブームを受け、機械学習技術、特に深層学習技術を用いたAIシステムの産業応用が盛んに取り組まれてきた.機械学習を用いたAIシステムでは、データからの訓練を通して機能を構築するために、従来のソフトウェアとは異なる特性がある。この点から、2019年頃から品質や開発効率などソフトウェア工学観点での課題が多く提起され、議論されてきた。本セミナーにおいては、この「機械学習工学」とも呼ばれる動向について、ソフトウェア工学技術の研究開発の観点、品質マネジメントや規格・標準、知財管理などの実践の観点から、最新動向を論じる。
  • [13:00-13:05]オープニング

    石川 冬樹
    石川 冬樹(情報・システム研究機構 国立情報学研究所 アーキテクチャ科学研究系 / 先端ソフトウェア工学・国際研究センター 准教授 / 副センター長)

    【略歴】近年では、自動運転システムおよびAIシステムに対するテスティング・デバッグ・安全性論証に関する技術に主に取り組む。AIシステムの品質技術に関しては、品質技術日本ソフトウェア科学会機械学習工学研究会やAIプロダクト品質保証コンソーシアム等において産業界と連動した活動を行っている。
  • [13:05-13:45]Session1「機械学習の産業応用におけるソフトウェア工学の課題と進展」

    石川 冬樹

    機械学習技術、特に深層学習技術の進展を受け、第3次AIブームとしてAIシステムの産業応用が盛んに追及されてきた。機械学習技術においては予測性能を高めることが最も重要な観点であったが、産業応用にあたっては、それに限らない品質の定義やマネジメント、そしてシステム全体の開発や運用の効率が求められている。一方で、データからシステムの挙動を訓練により導出するという機械学習技術に対しては、従来のソフトウェア工学やシステム工学そのままでは対応が難しい点もある。このような課題については2018年頃から議論されるようになり、ソフトウェア工学分野での研究開発や、産学合同でのガイドライン策定など、非常に活発な追及がなされてきた。本講演では、2週にわたるセミナーの序論として、これらの「機械学習工学」とも呼べる取り組みの背景や進展について概観する。

    石川 冬樹(情報・システム研究機構 国立情報学研究所 アーキテクチャ科学研究系 / 先端ソフトウェア工学・国際研究センター 准教授 / 副センター長)
  • [13:45-13:55]休憩

  • [13:55-14:35]Session2「AIシステムのためのテスト・デバッグ技術の展開」

    徳本 晋

    ソフトウェアシステムの品質保証を行う上で、テストは欠かせないプロセスである。しかし人間が直接的に振舞いを決めていた従来ソフトウェアと異なり、機械学習を用いたAIシステムはデータによって振舞いが定められるため、テストにおける正解が分からないことやどれだけテストすれば振舞いを網羅できるか分からないといった問題がある。また、テストなどの品質保証活動を通じて修正が必要な欠陥が見つかったときに、従来ソフトウェアのように人間が直接プログラムを修正することができないため、一般的にはデータによる再訓練をすることで振舞いを修正する。しかし、再訓練による修正は、大量のデータが必要な上、他の振舞いに影響を与えずに狙った振舞いのみを修正することは困難である。このような多くの課題のあるAIシステムのテスト・デバッグに対する研究は、この4、5年で急激に増えており、ソフトウェア工学における1つの大きなトレンドとなっている。本講演では、従来のソフトウェア工学技術がAIシステムのためのテスト・デバッグ技術においてどのように取り入れ展開されているかについて、最新のトピックも交えながら紹介・解説する。

    徳本 晋(富士通株式会社 研究本部 人工知能研究所 AI品質PJ 主任研究員)

    【略歴】2002年早稲田大学理工学部電子・情報通信学科卒業。2004年東京大学大学院情報理工学系研究科コンピュータ科学専攻修士課程修了。同年富士通株式会社入社。富士通研究所にてソフトウェアエンジニアリング技術の研究開発に従事。現在はAIシステムにおけるテスト・デバッグ技術の研究開発に取り組む。情報処理学会ソフトウェア工学研究会幹事、日本科学技術連盟ソフトウェア品質管理研究会講師などを務める。博士(情報理工学)。
  • [14:35-14:45]休憩

  • [14:45-15:25]Session3「機械学習デザインパターン」

    鷲崎 弘宜

    効果的かつ効率的な機械学習システム開発運用に向け、機械学習モデルやシステム全体の良い設計の指針、さらには開発運用のあり方の整理と共有が必要です。機械学習デザインパターンは、そうした指針を再利用しやすいように、データの表現やモデルの構築、訓練、MLOpsにおいて頻出の問題と解決策をまとめたものです。新時代の新常識として、AIエンジニアが知るべきベストプラクティスといえます。本講演ではAI活用成熟度や機械学習ライフサイクルとあわせて機械学習デザインパターンの全体像ならびに主要パターンを解説します。特にGoogle Cloudデータ分析トップLakshmanan氏らがまとめた『機械学習デザインパターン』(講演者ら訳、オライリージャパン、2021)と、それらへの追加として講演者らが整理した『Software-Engineering Design Patterns for Machine Learning Applications』(講演者ら著、Computer、2022)を取り上げます。

    鷲崎 弘宜(早稲田大学 グローバルソフトウェアエンジニアリング研究所長・教授/国立情報学研究所 客員教授/株式会社システム情報 取締役(監査等委員)/株式会社エクスモーション 社外取締役)

    【略歴】早稲田大学グローバルソフトウェアエンジニアリング研究所長・教授。国立情報 学研究所 客員教授。㈱システム情報 取締役(監査等委員)。㈱エクスモーショ ン 社外取締役。IEEE-CS 副会長。情報処理学会ソフトウェア工学研究会主査。 JST CREST 信頼されるAI システム領域アドバイザ。AI・IoT リカレント教育 ス マートエスイー事業責任者。JST未来社会eAI プロジェクトにてフレームワーク や機械学習デザインパターン研究をリード。
  • [15:25-15:30]クロージング

    石川 冬樹
    石川 冬樹(情報・システム研究機構 国立情報学研究所 アーキテクチャ科学研究系 / 先端ソフトウェア工学・国際研究センター 准教授 / 副センター長)