FIT2016 第15回情報科学技術フォーラム 開催日:2016年9月7日(水)~9日(金) 会場:富山大学キャンパス
イベント企画
ここから始める情報処理 ~画像、音声、テキスト、検索、学習、一気にまとめてチュートリアル~
9月7日(水) 13:00-15:00
第2イベント会場(共通教育棟A棟2階A21)
【セッション概要】 様々な研究分野でAPIやツールキットが公開され、以前に比べて研究活動の効率が格段に伸びている。これは、自分の研究分野を広げ、異分野の知見を取り入れる大きなチャンスである一方、自分の専門分野以外のツールはそもそも何に使えるか、どうやって使えばよいかわからないとう問題が生じる。そこで、画像、音声、テキスト、情報検索、機械学習の5分野について最新の研究動向、またはツールの使い方などを紹介する。
13:00-13:25 講演(1) 深層学習フレームワークChainerを用いた画像識別 -「ディープラーニングでおそ松さんの六つ子は見分けられるのか」を題材として-
石田 陽太(株式会社ネクスト グループ経営戦略部 R&Dユニット リッテルラボラトリー)
【概要】 深層学習の発展により画像認識技術が飛躍的に進歩し、簡単に使える様々なフレームワークが登場している。そのため個人が自分の興味対象の画像を判別させてみたという事例が出てきている。そこで講演では、画像認識の技術動向を踏まえつつ、おそ松さんの顔判別事例を参考に、物体検出、クラス分類、画像生成などを、無償提供されているライブラリ・フレームワークを用いて行う方法を紹介する。主に深層学習フレームワークのChainer、TensorFlow、画像処理ライブラリのOpenCV、dlibなどを紹介する。また機械学習における画像認識は、データセットの量・質に大きく影響し、そのデータセット作成に手間がかかることが多い。そこで高精度かつ効率的なデータセット作成手法についても述べる。
【略歴】 2014年金沢大学大学院自然科学研究科修士課程卒業。同年株式会社ネクストに入社。iOSアプリケーション開発を経て、画像処理・深層学習の研究開発に従事。スマートハウス、深層学習などの先端の研究を身近なものに適用する野生の研究者。おうちハッカー。
13:25-13:50 講演(2) 音声認識ツールキットKaldiを用いた大語彙日本語音声認識
篠崎 隆宏(東京工業大学 工学院情報通信系 准教授)
【概要】 音声認識ツールキットKaldiは、様々な最新の音声認識技術に対応した音声認識の基盤ソフトウエアである。国際的な研究者コミュニティにより活発な開発が行われており、オープンソースとして公開されている。Kaldiでは音声や統計モデルの操作のための各種コマンドに加えて、様々なコーパスに対してほぼ全自動で認識システムを構築し認識実験を行うためのスクリプト(レシピ)が用意されている。本講演では、Kaldiツールキットの概要とともに、日本語話し言葉コーパス(CSJ)のデータを用いて大語彙日本語音声認識システムの構築と認識評価を行うCSJレシピについて紹介する。CSJレシピの認識システムは、DNN音響モデルやリカレントニューラルネット言語モデルなどを組み合わせたものである。また東工大のスーパーコンピューターTSUBAME2.5を用いた大規模な進化計算により、モデル構造等のシステムパラメタの最適化が行われている。これらにより、日本語話し言葉音声に対して非常に高い認識精度が実現されている。
【略歴】 2004年東京工業大学大学院情報理工学研究科計算工学専攻博士後期課程修了。米ワシントン大学研究員、京都大学特任助教、東京工業大学特別研究員および助教、千葉大学助教を経て、2013年から東京工業大学准教授。音声認識を中心とした音声言語処理の研究に従事。日本音響学会、電子情報通信学会、情報処理学会、IEEE各会員。博士(学術)。
13:50-14:15 講演(3) ゼロから始める自然言語処理
荒瀬 由紀(大阪大学 大学院情報科学研究科マルチメディア工学専攻ビッグデータ工学講座 准教授)
【概要】 知識は言語によって記述され、文書として蓄積される。ニュースや特許文書のようなカタい文書を始め、Yahoo! 知恵袋のようなオンラインQ&A、食べログのような口コミ、TweetのようなSNSデータから、自然言語処理技術を用いることで多種多様な知識を抽出し利用できる。例えばニュース記事から競合他社関係を抽出したり、Tweetを使ってバズワードを抽出できる。本講演はこれまで自然言語処理にふれたことはないがテキストデータを使ってみたい、テキストから知識を取り出してみたい、という方を対象に、既存の自然言語処理ツールを使ってテキストを処理する手順について紹介する。データのクローリングからクリーニング、既存ツールとその使い方まで解説する。
【略歴】 2010年大阪大学大学院情報科学研究科博士後期課程修了。博士(情報科学)。同年、北京のMicrosoft Researchに入社、自然言語処理に出会い虜となる。言い換え表現抽出、統計的機械翻訳に関する研究開発に従事。2014年より大阪大学大学院情報科学研究科准教授に着任、現在に至る。言い換え表現抽出、機械翻訳技術、対話システム、Webデータマイニングに取り組んでいる。
14:15-14:40 講演(4) 検索評価ツールキットNTCIREVALを用いた様々な情報アクセス技術の評価方法
加藤 誠(京都大学 大学院情報学研究科 特定助教)
【概要】 情報アクセス技術(検索、質問応答、情報抽出、情報要約など)の有効性を正しく評価するためには、適切な評価方法・評価指標を選択することが重要である。このチュートリアルでは、基本的な評価指標から、最新の評価指標までを概説し、情報アクセス技術が利用される状況に即した評価指標の選択方法について説明する。また、情報アクセス技術評価ワークショップNTCIRにて提供されている検索評価ツールキットNTCIREVALの利用方法についても述べる。
【略歴】 2012年京都大学大学院情報学研究科社会情報学専攻博士後期課程修了。博士(情報学)。現在、京都大学大学院情報学研究科特定助教。主に情報検索の研究に従事しており、特に対話的情報検索、適合性、情報検索評価に興味を持つ。
14:40-15:00 講演(5) Support Vector Machineを使い倒す
山崎 俊彦(東京大学 大学院情報理工学系研究科電子情報学専攻 准教授)
【概要】 ビッグデータ解析、人工知能の分野では機械学習技術が非常に重要である。様々な機械学習アルゴリズムがオープンソース化・パッケージ化され身近に利用できるようになった半面、機械学習の研究者以外は技術の詳細はブラックボックスとして取り扱われることがおおい。また、そのようなライブラリではごく一般的な使い方のみをサポートしている場合も多い。本チュートリアルではサポート・ベクトル・マシン(SVM)に焦点を当て、パラメータの最適化、確率値の出力、超平面最適化時の戦略変更、不均一な学習データの取り扱い、予め定義されていないカーネルの利用、並列化・GPU処理、など研究で役立つであろう使い方について説明する。(なお、本機械学習チュートリアルは深層学習については取り扱いません)
【略歴】 1999年東京大学工学部電子工学科卒業。2004年同大学工学系研究科電子工学専攻修了。博士(工学)。現在、同大学情報理工学系研究科電子情報学専攻准教授。ビッグ・マルチメディア・データを用いた「魅力工学」という新たな分野を研究すると共に、物体認識、パターン認識、機械学習、3次元映像処理などに従事。