ビッグデータ活用実務フォーラム

機械学習と人工知能の最前線:マシンラーニングのら猫勉強会in一橋大講堂2018「ビッグデータ、IoT、機械学習、人工知能利活用の新展開」

【セッション概要】本年は、PythonやJuliaなどデータ分析や機械学習関連のツールを中心に最近の機械学習をめぐる現状を「ビッグデータ、IoT、機械学習、人工知能利活用の新展開」をテーマに議論したいと思います。ディープラーニングを発端とする人工知能ブームはほぼ定着してきています。身近なツールを使って誰もが、データサイエンティストになれる時代になってきています。色々な書籍や情報もあふれています。その中で、本セッションでは、データ分析には何が重要なのか、データ分析はただ単にデータを流し込めば答えが出るというような単純なものなのか、そういう観点からデータ分析を見つめ直します。統計と機械学習の違い、データモデリングの問題点、データモデリングのチューニングのコツなど、データ分析をめぐる本質的な部分を、最新ツールで解決の解説などを試みます。

石井一夫

司会:石井 一夫

(久留米大学 バイオ統計センター 准教授)
【略歴】専門分野:ビッグデータ分析、計算機統計学、データマイニング、数理モデリング、機械学習、人工知能など。1995年徳島大学大学院医学研究科博士課程修了。東京大学医科学研究所、理化学研究所、東京農工大学などを経て現職。2015年度情報処理学会優秀教育賞受賞。日本技術士会フェロー、APECエンジニア、IPEA国際エンジニア。

ビッグデータ活用実務フォーラムの展開と最新のデータ分析ツールの動向

【講演概要】ビッグデータ活用実務フォーラムは、2013年から勉強会をベースに最新のデータ分析に関する情報の共有とメンバーのスキルアップ支援を目的に活動を展開してきた。現在は、「マシンラーニングのら猫勉強会」とそのメンバーによる翻訳出版などが主要な活動である。現在、本フォーラムが勉強会で展開しているJuliaやPython、TensoFlowなどデータ分析ツールの最新動向の紹介を中心に、本フォーラムの今後の展開についてご紹介したい。

石井一夫

石井 一夫

(久留米大学 バイオ統計センター 准教授)
【略歴】専門分野:ビッグデータ分析、計算機統計学、データマイニング、数理モデリング、機械学習、人工知能など。1995年徳島大学大学院医学研究科博士課程修了。東京大学医科学研究所、理化学研究所、東京農工大学などを経て現職。2015年度情報処理学会優秀教育賞受賞。日本技術士会フェロー、APECエンジニア、IPEA国際エンジニア。

人工知能(AI)のビジネス活用事例のご紹介

【講演概要】ディープラーニングを発端として、人工知能(AI)のビジネス活用が注目されています。しかしながら、現状AIやディープラーニング、機械学習というキーワードが一人歩きしており、活用が上手く行っていないケースも多く見られます。本セッションでは、「AIを導入するには何から始めればよいのか」「何があれば実現できるのか」という概論や条件等をご説明した後、実際に弊社で導入した企業様の事例をご紹介します。

里洋平

里 洋平

(DATUM STUDIO 株式会社 取締役CAO)
【略歴】R言語の東京コミュニティTokyo.Rの主催者。ヤフー株式会社で、推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社ディー・エヌ・エーで大規模データマイニングやマーケティング分析業務に従事。その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業を経て、DATUM STUDIO株式会社を設立。
■著書
・データサイエンティスト養成読本 機械学習入門編
・ビジネス活用事例で学ぶ データサイエンス入門
・データサイエンティスト養成読本

データ分析・機械学習OSSの新潮流とその活用

【講演概要】学術研究のみならず、機械学習のビジネスの現場においての実活用においても、データ分析・機械学習OSSの活用はなくてはならないものになっています。また、ここ数年で、Stanなどの確率的プログラミング言語や、Googleの深層学習ライブラリであるTensorFlowなど、Cutting Edgeな技術に基づいたOSSなも台頭してきました。本公演では、このような新OSSライブラリを簡単に紹介するとともに、どのように実ビジネスの現場において活用していくべきかについて講演致します。

高柳慎一

高柳 慎一

(LINE株式会社 DataLabs データサイエンティスト)
【略歴】北海道大学大学院理学研究科物理学専攻修士課程修了・総合研究大学院大学複合科学研究科統計科学専攻博士課程4年。材料科学系財団・金融系シンクタンク・リクルート系企業を経て現職。翻訳書 『R言語徹底解説』(共立出版 、2014) 、翻訳書 『みんなのR』 (マイナビ、2015)、翻訳書 『Rによる自動データ収集』 (共立出版、2017)など多数。

放射線医学分野での機械学習

【講演概要】巷ではAIが盛んに謳われ、医療をキーワードに追加すれば、ゲノム、創薬といった言葉で世界は溢れかえっています。でも、医療はそれだけではありません。本講演では、放射線医学分野で、どのように機械学習が使われようとしているのかについてお伝えしようと思います。実は、放射線医学分野は、数ある医学分野の中でも自動化と特に相性が良く、機械学習向きの分野です。最新の話題と、我々のグループの取り組みについて、ご紹介したいと思います。

古徳純一

古徳 純一

(帝京大学 大学院医療技術学研究科 教授)
【略歴】東京大学大学院理学系研究科物理学専攻博士課程修了.博士(理学).宇宙物理分野で,次世代の装置開発に取り組む.理化学研究所JRA,日本学術振興会特別研究員PD,国立天文台研究員などを経て,現職.医学分野に,数理の力で新たな地平を切り拓きたいと考えている.共著『放射線測定技術』(通商産業研究社,2018)共訳『Juliaデータサイエンス―Juliaを使って自分でゼロから作るデータサイエンス世界の探索』(エヌ・ティー・エス,2017)

文章自動生成における主な手法の比較考察

【講演概要】まず、前提となる背景としてビッグデータの時代であるがゆえに、その処理や活用法の有効性が鍵となる。次に、最近のディープラーニングの発展は著しく、画像処理の分野から音声認識、そして自然言語処理の分野まで浸透し発展し続けている。そこで本考察では、検索した結果、上位に表示されるSEO対策の視点から、ウェブサイト中のテキスト挿入文を自動生成するタスクを設定した。本タスクの遂行に際し、次の3つの主な手法を取り上げ、比較考察したものである。1)マルコフ連鎖、2)自動要約、3)ディープラーニング(RNN/ LSTM/ GAN)の手法よる文章自動生成である。課題として、一文が自然な文で生成されても、文と文とのつながりが不自然であることが見受けられた。そこで、その対応策を検討し、実務で通用する自然な文と文とのつながりの実現を提案するものである。

太田博三

太田 博三

(放送大学 教養学部 データサイエンティスト)
【略歴】2004年上智大学大学院地球環境学研究科後期課程単位修得満期退学。データサイエンティスト、ディープラーニングを用いた文章生成や対話生成を得意とする。

手元のPCから高性能サーバまで~Unix シェルによるスケーラブルなデータ処理~

【講演概要】ビッグデータ分析は計算機科学の範囲を超えて、いまや分野を問わず注目されています。これまでも Excel や R などを利用してデータ分析の試みが行なわれてきました。しかし、それらのアプリケーションでは実装上の制約からビッグデータの処理は不可能でした。本発表では Windows Subsystem for Linux を通じて Unix シェルを利用する事で、手元の PC でもこれまでよりはるかに大きなデータの分析が可能であること、さらに、手元の PC と全く同じ操作で、より高性能なサーバによる分析も可能であることを紹介いたします。Unix シェルはプラットフォームを問わないツールであり、計算機の専門家を頼ることの出来ない多くの人々にもビックデータ分析を身近なもとにしてくれるものです。

當仲寛哲

當仲 寛哲

(有限会社USP研究所 代表取締役所長)
【略歴】1990年 東京大学工学部機械工学科卒業。東京大学大学院修士課程(情報工学専攻)中退。1992年株式会社ダイエー入社 システム改善により社長賞受賞。2000年IPA助成事業実施主幹。2004年株式会社ダイエー依願退職し、USP研究所を創立。ユニケージ開発手法が、IPAの「ソフトウェア・プロダクト・オブ・ザ・イヤー2008基盤ソフトウェア部門」を受賞。

ビッグデータ、IoT、機械学習、人工知能利活用の新展開

【講演概要】本講演の質疑応答を含む講演の総括と、JuliaやPython, TensoFlowなどデータ分析ツールの最新動向の展望と機械学習、人工知能、IoTなどへの展開、本フォーラムの今後の活動などについて議論する。

石井一夫

石井 一夫

(久留米大学 バイオ統計センター 准教授)
【略歴】専門分野:ビッグデータ分析、計算機統計学、データマイニング、数理モデリング、機械学習、人工知能など。1995年徳島大学大学院医学研究科博士課程修了。東京大学医科学研究所、理化学研究所、東京農工大学などを経て現職。2015年度情報処理学会優秀教育賞受賞。日本技術士会フェロー、APECエンジニア、IPEA国際エンジニア。
里洋平

里 洋平

(DATUM STUDIO 株式会社 取締役CAO)
【略歴】R言語の東京コミュニティTokyo.Rの主催者。ヤフー株式会社で、推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社ディー・エヌ・エーで大規模データマイニングやマーケティング分析業務に従事。その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業を経て、DATUM STUDIO株式会社を設立。
■著書
・データサイエンティスト養成読本 機械学習入門編
・ビジネス活用事例で学ぶ データサイエンス入門
・データサイエンティスト養成読本
高柳慎一

高柳 慎一

(LINE株式会社 DataLabs データサイエンティスト)
【略歴】北海道大学大学院理学研究科物理学専攻修士課程修了・総合研究大学院大学複合科学研究科統計科学専攻博士課程4年。材料科学系財団・金融系シンクタンク・リクルート系企業を経て現職。翻訳書 『R言語徹底解説』(共立出版 、2014) 、翻訳書 『みんなのR』 (マイナビ、2015)、翻訳書 『Rによる自動データ収集』 (共立出版、2017)など多数。
古徳純一

古徳 純一

(帝京大学 大学院医療技術学研究科 教授)
【略歴】東京大学大学院理学系研究科物理学専攻博士課程修了.博士(理学).宇宙物理分野で,次世代の装置開発に取り組む.理化学研究所JRA,日本学術振興会特別研究員PD,国立天文台研究員などを経て,現職.医学分野に,数理の力で新たな地平を切り拓きたいと考えている.共著『放射線測定技術』(通商産業研究社,2018)共訳『Juliaデータサイエンス―Juliaを使って自分でゼロから作るデータサイエンス世界の探索』(エヌ・ティー・エス,2017)
太田博三

太田 博三

(株式会社Speee デジタルコンサルティング事業本部 データサイエンティスト)
【略歴】2004年上智大学大学院地球環境学研究科後期課程単位修得満期退学。データサイエンティスト、ディープラーニングを用いた文章生成や対話生成を得意とする。
當仲寛哲

當仲 寛哲

(有限会社USP研究所 代表取締役所長)
【略歴】1990年 東京大学工学部機械工学科卒業。東京大学大学院修士課程(情報工学専攻)中退。1992年株式会社ダイエー入社 システム改善により社長賞受賞。2000年IPA助成事業実施主幹。2004年株式会社ダイエー依願退職し、USP研究所を創立。ユニケージ開発手法が、IPAの「ソフトウェア・プロダクト・オブ・ザ・イヤー2008基盤ソフトウェア部門」を受賞。