連続セミナー2013「ビッグデータの深化と真価 ~最新技術から活用事例まで~」
ホーム > スケジュール > 第1回「ビッグデータ活用のための機械学習技術」
第1回「ビッグデータ活用のための機械学習技術」開催日:2013年6月26日(水)10:00-17:15
 ※講師の方のご都合により、セッション2とセッション4の時間が当初から変更になっております。ご注意ください。
第1回の概要
機械学習とは、データの背後に潜む規則や知識を見つけ出すための技術の総称です。機械学習の技術は、近年の計算機やネットワークの飛躍的な性能向上と相まって、目覚ましい速さで発展しています。このように日進月歩で進化している機械学習の最先端のアルゴリズムは、統計学、確率論、最適化理論などの高度な数学を駆使して設計されています。そのため、初学者が習得するのは必ずしも容易でなく、大きな参入障壁となっています。そこで本セミナーでは、ビッグデータを活用するための機械学習理論の基礎をわかりやすく解説するとともに、実用的なアルゴリズム、および、それらの実世界問題での応用事例を紹介します。
コーディネータ:杉山 将 (東京工業大学 大学院情報理工学研究科 准教授)
【略歴】2001年に東京工業大学博士課程修了、博士(工学)。2001年より同大学の助手、2003年より助教授(2007年より准教授に改称)。2011年に情報処理学会長尾真記念特別賞を受賞。機械学習の理論研究とアルゴリズムの開発、および、その信号処理、画像処理、ロボット制御などへの応用研究に従事。
プログラム
SESSION.1 10:00-11:00
ビッグデータは怖くない:最小二乗法で楽々解析
【講演概要】線形最小二乗法は、最も古典的かつ基礎的なデータ解析手法の一つです。その統計的な性質はほぼ完全に明らかにされていますので、最小二乗法の振る舞いは手に取るようにわかります。また、解の計算は非常に簡単ですので、大規模なデータやストリームデータに対しても容易に適用することできます。本講演では、この単純な最小二乗法を駆使することによって、高度なデータ解析を容易に行うことができることを示します。具体的には、確率密度関数の比を線形最小二乗法で推定することにより、ドメイン適応学習、マルチタスク学習、異常検知、二標本検定、特徴抽出、独立成分分析、因果推論、条件付き確率推定などが実現できます。
講師:杉山 将 (東京工業大学 大学院情報理工学研究科 准教授)
【略歴】2001年に東京工業大学博士課程修了、博士(工学)。2001年より同大学の助手、2003年より助教授(2007年より准教授に改称)。2011年に情報処理学会長尾真記念特別賞を受賞。機械学習の理論研究とアルゴリズムの開発、および、その信号処理、画像処理、ロボット制御などへの応用研究に従事。
SESSION.2 11:15-12:15
ビッグデータからのモデリング
【講演概要】ビッグデータのアクセスや検索など、基本的な情報処理を効率的に実行する計算機アーキテクチャやアルゴリズムの研究開発が盛んに行われている。その一方で、ビッグデータから知識を抽出するデータマイニングや機械学習技術に関する最近の研究進展はあまり広く知られていない。ビッグデータから知識を抽出するモデル化やパターン発掘の観点からは、データ件数の多さ以上に変数の多さに起因するいわゆる次元の呪いと呼ばれる様々な問題や、データの内容が疎であることに起因する種々の困難をどう扱うかが重要となっている。本講演では,多点同時センシングデータや同じく膨大な語彙や商品名などからなるトランザクションデータから、その背後の対象をモデリングする問題やモデリングで必要となる適切な変数組み合わせの選択問題を取り上げ、最近の我々の研究成果も交えながら幾つかの基礎的手法を紹介する。
講師:鷲尾 隆 (大阪大学 産業科学研究所 教授)
【略歴】1983年東北大学工学部原子核工学科卒業。1988年同大学院原子核工学専攻博士課程修了。工学博士。1988~90年にかけてマサチューセッツ工科大学原子炉研究所客員研究員。1990 年(株)三菱総合研究所入社。1996 年退社。大阪大学産業科学研究所助教授。2006 年同教授。現在に至る。原子力システムの異常診断手法に関する研究、定性推論、科学的知識発見に関する研究を経て、現在は人工知能の基礎研究、特にデータマイニング基礎研究などに従事。平成21年度人工知能学会功績賞受賞。計測自動制御学会、情報処理学会、AAAI、IEEE Computer Society 各会員。
お昼休み 12:15-13:45
SESSION.3 13:45-14:45
ビッグデータとクラウドソーシング
【講演概要】不特定多数の人々から貢献を募ることで、必要なサービス、アイデア、コンテンツを生みだす行為はクラウドソーシングと呼ばれ、近年、オンラインコミュニティの広まりとともに、様々な分野でこういったクラウドソーシングのサービスに注目が集まっています。クラウドソーシングはその業態によってはビッグデータを生み出す一方、クラウドソーシングを賢く活用することで、ビッグデータの解析も効率的に行うことが可能となります。本講演では、2006年にジャーナリストJeff Howeによって提唱されたクラウドソーシングというコンセプトの様々な実施例、世界の才能を上手く利用する海外のクラウドソーシング事情、アカデミアでの様々な取り組み、また、今年スタートしたヤフーのクラウドソーシングサービスについてご紹介いたします。
講師:清水 伸幸 (ヤフー株式会社 Yahoo! JAPAN研究所 主任研究員)
  【略歴】2006年ニューヨーク州立大学オルバニー校にて博士課程修了。2007年より東京大学情報基盤センター特任助教。2010年より同センター特任講師。2011年よりYahoo! JAPAN研究所勤務。クラウドソーシング企画、自然言語処理と機械学習の研究開発に従事。博士(情報工学)。
SESSION.4 15:00-16:00
機械学習におけるオンライン確率的最適化の理論
【講演概要】ビッグデータ時代の機械学習手法の運用においては、しばしそのデータ量の多さおよび高次元性により計算量がボトルネックとなることが多い。大量データにおける効率的な学習手法の設計はその重要性によりこれまで盛んに研究がなされきているが、その中でもオンライン学習および確率的最適化手法は一つの強力なアプローチである。これらの手法は全てのデータをメモリに保持する必要がないという点で大量データの学習に有用である。本講演ではこれらの手法のベースとなる考え方から最近の発展までを概観する。具体的には、近接勾配法や双対平均化法といった標準的な手法の解説をはじめ、データの構造を利用したスパース構造的正則化学習に対するオンライン学習手法などの最近の関連手法を紹介する。各種手法を包括して理解できるように適宜理論的視点を通した解説を行う。
講師:鈴木 大慈 (東京大学 大学院情報理工学系研究科 助教)
【略歴】2004年東京大学工学部計数工学科卒業。2006年同情報理工学系研究科数理情報学専攻修士課程修了。2009年同博士課程終了。2009年より同専攻において助教。統計学、統計的学習理論、機械学習の研究に従事。博士(情報理工学)。
SESSION.5 16:15-17:15
ベイズの定理でビッグデータ解析
【講演概要】ビッグデータの解析技術として、機械学習技術が注目されていますが、機械学習技術の一つのアプローチとして、ベイズ統計を土台とする統計的学習技術があります。専門的には生成モデルアプローチと呼ばれています。本アプローチに基づく学習技術の場合、技術の理解には、確率統計の基礎理論や推論アルゴリズムなどの専門知識が必要ということもあり、初学者には分かりずらい技術と言えます。本セミナーでは、生成モデルアプローチに焦点をあて、そもそも生成モデルアプローチがビッグデータ解析で何故有用なのか、そもそも生成モデルとは何か、また、それによりどのような解析が実現できるのか、などの基本的な問いに応えるべく、具体的なデータ解析例を通して、生成モデルアプローチの考え方、モデルの立て方、推論手法の各々について、分かりやすく解説します。
講師:上田 修功 (日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
          機械学習・データ科学センタ センタ統括(上席特別研究員))
  【略歴】1982年大阪大学工学部通信工学科卒業、1984年同大学院通信工学専攻修士課程修了。同年日本電信電話公社(現NTT)横須賀電気通信研究所入所。1993年-1994年米国Purdue大学客員研究員。2010-2013年3月NTTコミュニケーション科学基礎研究所所長、2013年4月同研究所機械学習・データ科学センタ長(上席特別研究員)、国立情報学研究所客員教授、京都大学大学院情報学研究科連携教授。統計的機械学習とそのパターン認識、データマイニング応用の研究に従事。博士(工学)。