FIT2016 第15回情報科学技術フォーラム 開催日:2016年9月7日(水)~9日(金) 会場:富山大学キャンパス
イベント企画
Python によるデータ分析 - 分析の基本とデータ分析コンペでの実践
9月9日(金) 13:00-16:00
第2イベント会場(共通教育棟A棟2階A21)
【セッション概要】 統計や機械学習などのデータ分析技術は、幅広い分野に対する基盤技術として、その重要性が高まっています。データ分析では状況に合わせてプログラミングをする必要があります。このプログラミングには、NumPy/SciPyという科学技術計算用のパッケージが早くから整備されたPythonがプログラミング言語として幅広く用いられています。本講演の前半では、Pythonのデータ分析技術に関連するパッケージを俯瞰し、その利用例を示します。後半では、KDD CupやKaggleなどのデータ分析コンペでの経験を踏まえ、各種パッケージの利用の実際を紹介します。
司会:神嶌 敏弘(産業技術総合研究所 主任研究員)
【略歴】 1968年生。1992年京都大学工学部情報工学科卒業。1994年同大学院工学研究科情報工学専攻修士課程修了。2001年博士(情報学)。1994年電子技術総合研究所入所。2001年電子技術総合研究所は産業技術総合研究所へ再編。推薦システム、データマイニング、機械学習に関する研究に従事。Tokyo-SciPyやIBISMLチュートリアル講演などで、機械学習分野でのPythonの普及活動を行う。
13:00-14:10 講演(1) 科学技術計算関連Pythonパッケージの概要
神嶌 敏弘(産業技術総合研究所 主任研究員)
【概要】 本講演ではPythonによる機械学習プログラミングの基本的な操作および、機械学習に関連したパッケージを紹介する。なお、機械学習の基礎的な知識、プログラミング言語Pythonの文法に関する基本的な知識についてはここではふれない。前半では、Pythonによる数値計算の基本パッケージであるNumPyとSciPyについて紹介する。Pythonによる数値計算環境についてふれたのち、NumPyを用いた配列の生成と操作について述べ、数式を実装する手続きを紹介する。SciPyについては、利用できる関数群の概要を紹介する。後半では、数値計算に関連したパッケージ群を紹介する。対話環境を構築するためのIPythonの他、いくつかの機械学習関連パッケージの概要を紹介し、最後にさらにPythonによる数値プログラミングについて詳しく知るための情報源を紹介する。  【イベント企画資料はこちら】
【略歴】 1968年生。1992年京都大学工学部情報工学科卒業。1994年同大学院工学研究科情報工学専攻修士課程修了。2001年博士(情報学)。1994年電子技術総合研究所入所。2001年電子技術総合研究所は産業技術総合研究所へ再編。推薦システム、データマイニング、機械学習に関する研究に従事。Tokyo-SciPyやIBISMLチュートリアル講演などで、機械学習分野でのPythonの普及活動を行う。
14:30-15:40 講演(2) データ分析コンペでのPython利用の実践
小嵜 耕平(株式会社リクルートテクノロジーズ アドバンスドテクノロジーラボ シニアソフトウェアエンジニア)
【概要】 統計や機械学習などのデータ分析技術は、幅広い分野に対する基盤技術として、その重要性が高まっています。データ分析では状況に合わせてプログラミングをする必要があります。このプログラミングには、NumPy/SciPyという科学技術計算用のパッケージが早くから整備されたPythonがプログラミング言語として幅広く用いられています。本講演の前半では、Pythonのデータ分析技術に関連するパッケージを俯瞰し、その利用例を示します。後半では、KDD CupやKaggleなどのデータ分析コンペでの経験を踏まえ、各種パッケージの利用の実際を紹介します。
【イベント企画資料はこちら】
【略歴】 2011年奈良先端科学技術大学院大学情報科学研究科博士前期課程修了(工学)。2014年、同博士後期課程単位取得退学。2015年、データ分析コンテストKDD Cup 2015優勝。同年11月より現職。データ分析および機械学習に関する技術開発に従事。