【セッション概要】2018年1月23日に「ビッグデータ解析のビジネス実務利活用研究グループ(PBD-gr)」の新設が情報処理学会で承認され、本ITフォーラム「ビッグデータ活用実務フォーラム」は、2018年4月から、新研究グループに移行します。本セッションは、新研究グループのキックオフミーティングとしてその概要、目的、今後の展開について紹介します。また、本セッションでは、PythonやJuliaなどデータ分析や機械学習関連のツールを中心に最近の機械学習をめぐる現状を「ビッグデータ、IoT、機械学習、人工知能利活用の新展開」をテーマに議論したいと思います。ディープラーニングを発端とする人工知能ブームはほぼ定着してきています。身近なツールを使って誰もが、データサイエンティストになれる時代になってきています。色々な書籍や情報もあふれています。その中で、本セッションでは、データ分析には何が重要なのか、データ分析はただ単にデータを流し込めば答えが出るというような単純なものなのか、そういう観点からデータ分析を見つめ直します。統計と機械学習の違い、データモデリングの問題点、データモデリングのチューニングのコツなど、データ分析をめぐる本質的な部分を、最新ツールで解決の解説などを試みます。
司会:石井 一夫
(久留米大学 バイオ統計センター 准教授)【講演概要】2018年4月から活動開始する「情報処理学会ビッグデータ解析のビジネス実務利活用研究グループ(PBD-gr)」の概要および今後の研究グループ活動などについて紹介し、さらにJuliaやPython, TensoFlowなどデータ分析ツールの最新動向の展望と機械学習、人工知能、IoTなどへの展開についても議論する。
石井 一夫
(久留米大学 バイオ統計センター 准教授)【講演概要】ディープラーニングを発端として、人工知能(AI)のビジネス活用が注目されています。しかしながら、現状AIやディープラーニング、機械学習というキーワードが一人歩きしており、活用が上手く行っていないケースも多く見られます。本セッションでは、「AIを導入するには何から始めればよいのか」「何があれば実現できるのか」という概論や条件等をご説明した後、実際に弊社で導入した企業様の事例をご紹介します。
里 洋平
(DATUM STUDIO 株式会社 取締役CAO)【講演概要】学術研究のみならず、機械学習のビジネスの現場においての実活用においても、データ分析・機械学習OSSの活用はなくてはならないものになっています。また、ここ数年で、Stanなどの確率的プログラミング言語や、Googleの深層学習ライブラリであるTensorFlowなど、Cutting Edgeな技術に基づいたOSSなも台頭してきました。本講演では、このような新OSSライブラリを簡単に紹介するとともに、どのように実ビジネスの現場において活用していくべきかについて講演いたします。
高柳 慎一
(LINE株式会社 DataLabs データサイエンティスト)【講演概要】巷ではAIが盛んに謳われ、医療をキーワードに追加すれば、ゲノム、創薬といった言葉で世界は溢れかえっています。でも、医療はそれだけではありません。本講演では、放射線医学分野で、どのように機械学習が使われようとしているのかについてお伝えしようと思います。実は、放射線医学分野は、数ある医学分野の中でも自動化と特に相性が良く、機械学習向きの分野です。最新の話題と、我々のグループの取り組みについて、ご紹介したいと思います。
古徳 純一
(帝京大学 大学院医療技術学研究科 教授)【講演概要】まず、前提となる背景としてビッグデータの時代であるがゆえに、その処理や活用法の有効性が鍵となる。次に、最近のディープラーニングの発展は著しく、画像処理の分野から音声認識、そして自然言語処理の分野まで浸透し発展し続けている。そこで本考察では、検索した結果、上位に表示されるSEO対策の視点から、ウェブサイト中のテキスト挿入文を自動生成するタスクを設定した。本タスクの遂行に際し、次の3つの主な手法を取り上げ、比較考察したものである。1)マルコフ連鎖、2)自動要約、3)ディープラーニング(RNN/ LSTM/ GAN)の手法よる文章自動生成である。課題として、一文が自然な文で生成されても、文と文とのつながりが不自然であることが見受けられた。そこで、その対応策を検討し、実務で通用する自然な文と文とのつながりの実現を提案するものである。
太田 博三
(放送大学 教養学部 データサイエンティスト)【講演概要】ビッグデータ分析は計算機科学の範囲を超えて、いまや分野を問わず注目されています。これまでも Excel や R などを利用してデータ分析の試みが行なわれてきました。しかし、それらのアプリケーションでは実装上の制約からビッグデータの処理は不可能でした。本発表では Windows Subsystem for Linux を通じて Unix シェルを利用する事で、手元の PC でもこれまでよりはるかに大きなデータの分析が可能であること、さらに、手元の PC と全く同じ操作で、より高性能なサーバによる分析も可能であることを紹介いたします。Unix シェルはプラットフォームを問わないツールであり、計算機の専門家を頼ることの出来ない多くの人々にもビックデータ分析を身近なものにしてくれるものです。
當仲 寛哲
(有限会社USP研究所 代表取締役所長)【講演概要】本講演の質疑応答を含む講演の総括と、JuliaやPython, TensoFlowなどデータ分析ツールの最新動向の展望と機械学習、人工知能、IoTなどへの展開、本フォーラムの今後の活動などについて議論する。
司会:石井 一夫
(久留米大学 バイオ統計センター 准教授)パネリスト:里 洋平
(DATUM STUDIO 株式会社 取締役CAO)パネリスト:高柳 慎一
(LINE株式会社 DataLabs データサイエンティスト)パネリスト:古徳 純一
(帝京大学 大学院医療技術学研究科 教授)パネリスト:太田 博三
(放送大学 教養学部 データサイエンティスト)パネリスト:當仲 寛哲
(有限会社USP研究所 代表取締役所長)2018年2月2日(金)
プログラム[09:30〜12:00]
会場:2,3F一橋講堂