ITフォーラム:ビッグデータ活用実務フォーラム

ビッグデータ:機械学習とデータマイニングの最前線~500人大集会:そのツールと応用~

(会場:一橋講堂
【セッション概要】本セッションは午後のメインセッションの導入と位置づけ、人工知能、ロボット、自然言語処理などへの展開も踏まえて考察します。本セッション「ビッグデータ活用実務フォーラム」は、「ビッグデータ:機械学習とデータマイニングの最前線〜500人大集会:そのツールと応用〜」と題し、機械学習およびデータマイニングツールであるR、Python、Sparkなどとその最新動向についてご紹介し、ビジネスやアカデミアでの機械学習およびデータマイニングツールの利活用促進と情報共有を行うことを目的に企画します。さらには、応用編として医療、農業への応用に関して、スパコンを用いた数理モデリングと予測分析、農業ITとビッグデータ解析の展開について議論します。なお、このセッションはニコニコ動画を通じて全世界に向けて放映されます。

プログラム[09:30〜12:00]

石井 一夫 司会:石井 一夫(東京農工大学 特任教授/静岡大学 非常勤講師)
【略歴】徳島大学大学院医学研究科博士課程修了。東京大学医科学研究所 ヒトゲノム解析センター、理化学研究所ゲノム科学総合研究センター、フランス国立遺伝子多型解析センターCNG、米国ノースウエスタン大学Feinberg医学部などを経て現職。著書『図解よくわかる データマイニング』(日刊工業新聞社、2004)、翻訳書『ソフトウェアエンジニアリング 論文集80's~デマルコセレクション』(翔泳社、2006)、著書『統計解析環境R によるバイオインフォマティクスデータ解析』(共立出版、2007)、翻訳書『翻訳バイオエレクトロニクス』(NTS、2008)、翻訳書『Rによる計算機統計学』(オーム社、2011)。
〈機械学習ツール編〉
【講演概要】DATUM STUDIOにおける、Rを用いた機械学習およびデータマイニングのビジネス活用事例について紹介する。
里 洋平 里 洋平(DATUM STUDIO 株式会社 取締役副社長)
【略歴】R言語の東京コミュニティTokyo.R主催者。ヤフー株式会社で、推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社ディー・エヌ・エーで大規模データマイニングやマーケティング分析業務に従事。その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業を経て、DATUM STUDIO株式会社を設立。著書に『データサイエンティスト養成読本』(技術評論社)、『ビジネス活用事例で学ぶデータサイエンス入門』(ソフトバンククリエイティブ)、『Rではじめるビジネス統計分析』(翔泳社)、『戦略的データマイニング (シリーズ Useful R 4)』(共立出版)、『Rパッケージガイドブック』(東京図書)。
【講演概要】リクルートライフスタイル全サービス横断でリアルタイムにログを収集・分析するための基盤を構築する「CET(Capture EveryThing)」プロジェクトにおける、Rを中心としたデータマイニングの活用について紹介する
高柳慎 高柳 慎一(株式会社リクルートコミュニケーションズ 兼 株式会社リクルートライフスタイル)
【略歴】北海道大学大学院理学研究科物理学専攻修士課程修了・総合研究大学院大学複合科学研究科統計科学専攻博士課程2年。材料科学系財団・金融系シンクタンクを経て現職。著書『Rパッケージガイドブック』(東京図書、2011)、著書 『金融データ解析の基礎』(共立出版 、2014) 、翻訳書 『みんなのR (マイナビ、2015)。
【講演概要】スクリプト言語Pythonを使った機械学習アルゴリズムの実装について、最新の動向を説明する。既存のライブラリをできるだけ活用する立場と、最初から自分で実装する立場の両方の視点から、有益なライブラリや手法を紹介する。
加藤公一 加藤 公一(シルバーエッグ・テクノロジー株式会社 エンジニアリング部 チーフサイエンティスト)
【略歴】東京大学情報理工学系研究科博士課程修了。博士(情報理工学)。大手SI企業にてシステムエンジニア、研究職を経て現職。共著『データサイエンティスト養成読本 機械学習入門編』(技術評論社、2015)。
〈応用編〉
【講演概要】IoTの普及により、農業や医療・介護の現場での多様な利活用が一般的になりつつある。本講演では、介護分野における介護者の気づきデータの集積とその利活用をサービスサイエンスの観点から論じると共に、同じ手法を農業分野に当てはめた際の事例とその横展開を見据えた政府全体の取り組みについてまとめる。
神成 淳司 神成 淳司(慶應義塾大学 環境情報学部・ 医学部 准教授/内閣官房 副政府CIO)
【略歴】慶應義塾大学大学院政策・メディア研究科修士課程修了・岐阜大学大学院工学研究科博士後期課程修了・博士(工学)。IAMAS助手、講師、岐阜県情報技術顧問等を経て、現職。同医学部 兼担准教授を併任。内閣官房 副政府CIO(Deputy Chief Information Officer)も務める。
【講演概要】スパコンを用いた数理モデリングと予測分析の医療および農業への応用についてRを中心に紹介する。
石井 一夫 石井 一夫(東京農工大学 特任教授/静岡大学 非常勤講師)
【略歴】徳島大学大学院医学研究科博士課程修了。東京大学医科学研究所 ヒトゲノム解析センター、理化学研究所ゲノム科学総合研究センター、フランス国立遺伝子多型解析センターCNG、米国ノースウエスタン大学Feinberg医学部などを経て現職。著書『図解よくわかる データマイニング』(日刊工業新聞社、2004)、翻訳書『ソフトウェアエンジニアリング 論文集80's~デマルコセレクション』(翔泳社、2006)、著書『統計解析環境R によるバイオインフォマティクスデータ解析』(共立出版、2007)、翻訳書『翻訳バイオエレクトロニクス』(NTS、2008)、翻訳書『Rによる計算機統計学』(オーム社、2011)。
【討論概要】前半の各講演の質疑応答などを通して、R、Python、Sparkなどを始めとする機械学習ツールとデータマイニングの最新情報とその活用について議論する。また、ビッグデータ解析の医療及び農業などその他のビジネスへの展開について、午後の「メインセッション:人工知能が2020年を変える」への橋渡し、導入となるような人工知能、ロボット、自然言語、Watsonなどについても踏まえて議論を展開する。
丸山宏 司会:丸山 宏データサイエンティスト協会 理事/統計数理研究所 教授
【略歴】1983年東京工業大学修士課程修了。日本IBM東京基礎研究所にて自然言語処理、Webサービス、セキュリティなどの研究開発に従事。同社執行役員、東京基礎研究所長を経て2011年より現職。工学博士。
里 洋平 パネリスト:里 洋平(DATUM STUDIO 株式会社 取締役副社長)
【略歴】R言語の東京コミュニティTokyo.R主催者。ヤフー株式会社で、推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社ディー・エヌ・エーで大規模データマイニングやマーケティング分析業務に従事。その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業を経て、DATUM STUDIO株式会社を設立。著書に『データサイエンティスト養成読本』(技術評論社)、『ビジネス活用事例で学ぶデータサイエンス入門』(ソフトバンククリエイティブ)、『Rではじめるビジネス統計分析』(翔泳社)、『戦略的データマイニング (シリーズ Useful R 4)』(共立出版)、『Rパッケージガイドブック』(東京図書)。
高柳 慎一 パネリスト:高柳 慎一(株式会社リクルートコミュニケーションズ 兼 株式会社リクルートライフスタイル)
【略歴】北海道大学大学院理学研究科物理学専攻修士課程修了・総合研究大学院大学複合科学研究科統計科学専攻博士課程2年。材料科学系財団・金融系シンクタンクを経て現職。著書『Rパッケージガイドブック』(東京図書、2011)、著書 『金融データ解析の基礎』(共立出版 、2014)、翻訳書 『みんなのR(マイナビ、2015)。
加藤 公一 パネリスト:加藤 公一(シルバーエッグ・テクノロジー株式会社 エンジニアリング部 チーフサイエンティスト)
【略歴東京大学情報理工学系研究科博士課程修了。博士(情報理工学)。大手SI企業にてシステムエンジニア、研究職を経て現職。共著『データサイエンティスト養成読本 機械学習入門編』(技術評論社、2015)。
神成 淳司 パネリスト:神成 淳司(慶應義塾大学 環境情報学部・ 医学部 准教授/内閣官房 副政府CIO)
【略歴】慶應義塾大学大学院政策・メディア研究科修士課程修了・岐阜大学大学院工学研究科博士後期課程修了・博士(工学)。IAMAS助手、講師、岐阜県情報技術顧問等を経て、現職。同医学部 兼担准教授を併任。内閣官房 副政府CIO(Deputy Chief Information Officer)も務める。
石井 一夫 パネリスト:石井 一夫(東京農工大学 特任教授/静岡大学 非常勤講師)
【略歴】徳島大学大学院医学研究科博士課程修了。東京大学医科学研究所 ヒトゲノム解析センター、理化学研究所ゲノム科学総合研究センター、フランス国立遺伝子多型解析センターCNG、米国ノースウエスタン大学Feinberg医学部などを経て現職。著書『図解よくわかる データマイニング』(日刊工業新聞社、2004)、翻訳書『ソフトウェアエンジニアリング 論文集80's~デマルコセレクション』(翔泳社、2006)、著書『統計解析環境R によるバイオインフォマティクスデータ解析』(共立出版、2007)、翻訳書『翻訳バイオエレクトロニクス』(NTS、2008)、翻訳書『Rによる計算機統計学』(オーム社、2011)。

なお、このセッションは以下のシンポジウムも兼ねています
日本計算機統計学会スタディグループ「ビッグデータ分析と計算機統計学の未開拓領域への挑戦」シンポジウム
公益社団法人日本技術士会登録グループ「データサイエンス研究会」シンポジウム
科研費シンポジウム「基盤研究(C)26330325新規ビッグデータ解析手法による精神神経系診断薬開発法の確立」