FIT2015第14回情報科学技術フォーラム 開催日:2015年9月15日(火)~17日(木) 会場:愛媛大学城北キャンパス
イベント企画
ビッグデータ解析のための機械学習技術
9月17日(木) 9:30-12:00
第3イベント会場(講義棟1階 講11)
【セッション概要】 ビッグデータを有効に活用するための技術として注目されている機械学習のチュートリアル企画です。機械学習はマーケティング、自然言語処理、画像分析など多様な分野で利用されています。また、情報通信技術やセンサ技術の発展とともに様々なデータが入手できるようになっており、機械学習の適用分野はますます広がっています。本企画では、3人の機械学習研究者を招き、機械学習技術をやさしく解説するとともに、応用事例を紹介します。データを活用しきれていないと感じている学生や実務家を対象に、各自の課題に対してどのようにアプローチすればよいかを考える際に参考になる講演を行います。
司会:岩田 具治(NTTコミュニケーション科学基礎研究所 主任研究員(特別研究員))
【略歴】 2001年慶應義塾大学環境情報学部卒業。2003年東京大学大学院総合文化研究科修士課程修了。2003年日本電信電話株式会社入社。2008年京都大学大学院情報学研究科博士課程修了。博士(情報学)。データマイニング、機械学習の研究に従事。
9:30-10:20 講演(1) 統計的パターンマイニング
杉山 麿人(大阪大学 産業科学研究所 助教)
【概要】 マーケットバスケット解析に端を発するパターンマイニングは、共起して発現する遺伝子の検出や、特定の活性をもつ化合物が共有している構造の発見など、ビッグデータに潜む組合せ的構造を見つけるための中心的手法として研究が進み、超高速アルゴリズムが発達している。一方、データから発見した知識の信頼性を担保するためには、統計的手法による分析が欠かせない。本講演では、パターンマイニングと多重検定法を融合した、最新の統計的パターンマイニング手法について紹介する。
【略歴】 2006年京都大学工学部情報学科卒業。2012年京都大学大学院情報学研究科知能情報学専攻博士課程修了。京都大学博士(情報学)。独マックスプランク研究所研究員、フンボルト財団ポスドクフェローを経て、2014年から大阪大学産業科学研究所助教。JSTさきがけ研究者を兼任。機械学習、データマイニングの研究に従事。
10:20-11:10 講演(2) Deep Learningの基礎と応用
得居 誠也(Preferred Networks リサーチャー)
【概要】 Deep Learningは主に音声認識や画像認識を中心に様々なタスクにおいて大幅な性能改善を果たし、これらの分野において避けては通れない技術となっている。さらに近年では自然言語処理や質問応答などにも適用されるなど、適用範囲はさらに広がっている。現在成功しているDeep Learningは巨大なニューラルネットを基礎としたもので、アルゴリズムとしては誤差逆伝播法と確率的最適化の単純な組み合わせだが、ニューラルネット自体の設計には様々な工夫が必要となる。本講演では、Deep Learningの応用例に触れながら、その背後で使われる基礎技術やノウハウを解説し、実際の使い方も簡単に紹介する。
【略歴】 2010年、東京大学理学部数学科卒業。2012年、東京大学大学院情報理工学研究科修士課程修了。同年、株式会社Preferred Infrastructure入社。2014年、株式会社Preferred Networks入社。機械学習、特に深層学習の技術を映像認識やIoTに応用するための技術研究・開発に従事。
11:10-12:00 講演(3) コンパクトなデータ表現による機械学習
田部井 靖生(科学技術振興機構 さきがけ「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」 専任研究員)
【概要】 日々のビッグデータ処理において、大規模かつ多様性のあるデータからモデルを学習し、意味のある情報を抽出しなければならい状況がよくある。このような状況において、データをコンパクトに表現してモデルを学習することは、ビッグデータ処理における有効なアプローチの一つである。そこで、本講演では始めに、locality sensitive hashing (LSH)やminwise hashing (minhash)などのハッシュ法と大規模データ上でのモデル学習との関わりを紹介する。次に、データを圧縮した状態で様々な操作を提供する簡潔データ構造が、省メモリーかつ高速にデータから意味のある情報を抽出することにどう貢献するかを説明する。適用例として、大規模文書分類データ、評判分析データ、ドラッグ-ターゲット相互作用データなどを用いた実験結果を提示する。
【略歴】 2009年9月東京大学大学院新領域創成科学研究科情報生命科学専攻博士号(科学)取得。2009年10月産業技術総合研究所生命情報工学研究センター(日本学術振興会PD)。2010年4月科学技術振興機構ERATO湊離散構造処理系プロジェクト研究員。2013年10月現職。