【セッション概要】本年は、PythonやJuliaなどデータ分析や機械学習関連のツールを中心に最近の機械学習をめぐる現状を「ビッグデータ、IoT、機械学習、人工知能利活用の新展開」をテーマに議論したいと思います。ディープラーニングを発端とする人工知能ブームはほぼ定着してきています。身近なツールを使って誰もが、データサイエンティストになれる時代になってきています。色々な書籍や情報もあふれています。その中で、本セッションでは、データ分析には何が重要なのか、データ分析はただ単にデータを流し込めば答えが出るというような単純なものなのか、そういう観点からデータ分析を見つめ直します。統計と機械学習の違い、データモデリングの問題点、データモデリングのチューニングのコツなど、データ分析をめぐる本質的な部分を、最新ツールで解決の解説などを試みます。
司会:石井 一夫
(久留米大学 バイオ統計センター 准教授)【講演概要】ビッグデータ活用実務フォーラムは、2013年から勉強会をベースに最新のデータ分析に関する情報の共有とメンバーのスキルアップ支援を目的に活動を展開してきた。現在は、「マシンラーニングのら猫勉強会」とそのメンバーによる翻訳出版などが主要な活動である。現在、本フォーラムが勉強会で展開しているJuliaやPython、TensoFlowなどデータ分析ツールの最新動向の紹介を中心に、本フォーラムの今後の展開についてご紹介したい。
石井 一夫
(久留米大学 バイオ統計センター 准教授)【講演概要】巷ではAIが盛んに謳われ、医療をキーワードに追加すれば、ゲノム、創薬といった言葉で世界は溢れかえっています。でも、医療はそれだけではありません。本講演では、放射線医学分野で、どのように機械学習が使われようとしているのかについてお伝えしようと思います。実は、放射線医学分野は、数ある医学分野の中でも自動化と特に相性が良く、機械学習向きの分野です。最新の話題と、我々のグループの取り組みについて、ご紹介したいと思います。
古徳 純一
(帝京大学 大学院医療技術学研究科 教授)【講演概要】まず、前提となる背景としてビッグデータの時代であるがゆえに、その処理や活用法の有効性が鍵となる。次に、最近のディープラーニングの発展は著しく、画像処理の分野から音声認識、そして自然言語処理の分野まで浸透し発展し続けている。そこで本考察では、検索した結果、上位に表示されるSEO対策の視点から、ウェブサイト中のテキスト挿入文を自動生成するタスクを設定した。本タスクの遂行に際し、次の3つの主な手法を取り上げ、比較考察したものである。1)マルコフ連鎖、2)自動要約、3)ディープラーニング(RNN/ LSTM/ GAN)の手法よる文章自動生成である。課題として、一文が自然な文で生成されても、文と文とのつながりが不自然であることが見受けられた。そこで、その対応策を検討し、実務で通用する自然な文と文とのつながりの実現を提案するものである。
太田 博三
(株式会社Speee デジタルコンサルティング事業本部 データサイエンティスト)【講演概要】ビッグデータ分析は計算機科学の範囲を超えて、いまや分野を問わず注目されています。これまでも Excel や R などを利用してデータ分析の試みが行なわれてきました。しかし、それらのアプリケーションでは実装上の制約からビッグデータの処理は不可能でした。本発表では Windows Subsystem for Linux を通じて Unix シェルを利用する事で、手元の PC でもこれまでよりはるかに大きなデータの分析が可能であること、さらに、手元の PC と全く同じ操作で、より高性能なサーバによる分析も可能であることを紹介いたします。Unix シェルはプラットフォームを問わないツールであり、計算機の専門家を頼ることの出来ない多くの人々にもビックデータ分析を身近なもとにしてくれるものです。
中村 和敬
(有限会社ユニバーサル・シェル・プログラミング研究所 技術研究員)【講演概要】本講演の質疑応答を含む講演の総括と、JuliaやPython, TensoFlowなどデータ分析ツールの最新動向の展望と機械学習、人工知能、IoTなどへの展開、本フォーラムの今後の活動などについて議論する。
石井 一夫
(久留米大学 バイオ統計センター 准教授)
古徳 純一
(帝京大学 大学院医療技術学研究科 教授)
太田 博三
(株式会社Speee デジタルコンサルティング事業本部 データサイエンティスト)
中村 和敬
(有限会社ユニバーサル・シェル・プログラミング研究所 技術研究員)2018年2月2日(金)
プログラム[09:30〜12:00]
会場:2,3F一橋講堂