連続セミナー2012「ビッグデータとスマートな社会」全6回シリーズで開催
ホーム > スケジュール > 第4回「ソーシャルメディアの大規模ネットワーク分析」
第4回「ソーシャルメディアの大規模ネットワーク分析」開催日:2012年10月10日(水)10:00-17:20
第4回の概要
第4回は「ソーシャルメディアの大規模ネットワーク分析」という題名で、現在急速に普及しているブログやTwitterなどのソーシャルメディアのユーザや情報の関係を表すネットワーク構造を分析する技術を取り上げる。従来の社会ネットワーク分析との大きな違いは、膨大なデータから自動的にネットワーク構造を抽出することと、そのネットワーク構造がはるかに巨大であることである。まず、ソーシャルメディアからのデータ収集から、得られたネットワーク構造の特徴量計算・クラスタリング・分析・可視化などの、ネットワーク分析に必要な一連の手法の基本的な概念と大規模データ処理を可能にする技術を説明し、さらにそれらの技術を用いた実際の応用事例を紹介する。
コーディネータ:風間 一洋 (日本電信電話株式会社 未来ねっと研究所 主任研究員)
【略歴】1988年京都大学大学院工学研究科精密工学専攻修士課程修了。同年日本電信電話(株)入社。2005年京都大学大学院情報学研究科システム科学専攻博士課程修了。博士(情報学)。サーチエンジンの研究開発やWebマイニングの研究に従事。さらに、Java、C#、JavaScriptなどのWeb関連技術の仕様策定や国際化作業にも関わる。情報処理学会、人工知能学会、日本ソフトウェア科学会、日本データベース学会、ACM各会員。
プログラム
SESSION.1 10:00-11:10
ソーシャルメディアにおける大量データの収集と分析
【講演概要】近年ソーシャルメディアと呼ばれるWEB上のサービスが増加している。その中でも、Twitterを始めとするマイクロブログは近況をつぶやくというこれまでにない情報共有の形を示しており、注目され様々な研究が行なわれている。本講演では、Twitterを対象としてそのデータ収集の手法とそのデータ分析手法について述べる。TwitterにおけるTweetの取得方法には二種類存在する。一つはStreamingAPIによる取得であり、もう一つはTwitterAPIによる取得である。それぞれ取得できるデータには違いがあるため、それぞれの特徴と収集方法について述べる。また、収集したデータは膨大なものとなるが、Twitterにおける大規模ネットワークの種類および、その分析手法について述べる。
講師:鳥海 不二夫 (東京大学 大学院工学系研究科システム創成学専攻 准教授)
【略歴】2004年3月 東京工業大学大学院理工学研究科機械制御システム専攻博士課程修了(博士(工学))。2004年7月 名古屋大学大学院情報科学研究科助手。2007年4月 同助教。2012年4月 東京大学大学院工学系研究科准教授。
SESSION.2 11:20-12:30
大規模ネットワークの構造的特徴量の計算手法
【講演概要】一般的なネットワークの構造的特徴量の紹介ならびに、計算手法に関して紹介する。比較的小規模なネットワークの分析にもちいられるソフトウェアを紹介するとともに、数万から数100万ノードから構成されるネットワークの構造的特徴量を計算するために、C++のライブラリであるboost/graph を中心としたライブラリの紹介とプログラムの実装例、ならびにOpenMPを用いた並列化などを紹介する。
講師:篠田 孝祐 (独立行政法人理化学研究所 光グリーンテクノロジー特別研究ユニット 協力研究員)
【略歴】2004年 北陸先端科学技術大学院大学 知識科学研究科 博士後期課程終了。博士(知識科学)、現在、独立行政法人理化学研究所にて協力研究員として、レーザー技術の社会応用の研究に従事。マルチエージェントシステム、大規模社会シミュレーション、複雑系ネットワークに興味をもつ。人工知能学会会員。
お昼休み 12:30-13:30
SESSION.3 13:30-14:40
大規模社会ネットワークのクラスタリング
【講演概要】クラスタリングは複雑かつ、グラフとして表現される大規模な社会ネットワークを、濃密に結合した小集団に分割する手段である。クラスタリングは、社会学者が集団のなかからコミュニティを同定するための綿密な努力を、グラフを用いて社会を模した構造から機械的に発見することと見做すことができる。本講演では、社会ネットワークのためのクラスタリング手法として著名なNewmanのモジュール性に基づいた方式を中心に、その手法と応用などを紹介する。
講師:脇田 建 (東京工業大学 大学院情報理工学研究科/JST CREST )
【略歴】1989年東京大学理学部情報科学科卒。1991年同大学大学院理学系研究科情報科学専攻修士課程修了。1992年同専攻博士課程中退。博士(理学)。社会ネットワーク解析、プログラミング言語、ユーザインタフェースに興味を持つ。情報処理学会、日本ソフトウェア科学会、ACM、IEEE各会員。
SESSION.4 14:50-16:00
大規模ストリーミングデータのグラフ可視化
【講演概要】Web上で増え続けるビッグデータ分析においては、データストリームの処理と同時に、インタラクティブかつリアルタイムに「見える化」することが重要な課題とされている。近年では、ソーシャルメディアから抽出した話題語を提供するサービスは既に多く存在しているが、関連する語がまとめられず、どのような話題がどのように発生して移り変わっていったのかをリアルタイムに把握することは容易ではなかった。また、監視するキーワードをあらかじめ指定しておく必要があった。そこで我々は、抽出された多数の話題語の関連性をネットワークで表現し、ウェブブラウザ上で高速にする描画する技術を開発した。本講演では、ストリーミングデータに適した、HTML5を用いたインタラクティブなリアルタイムグラフ可視化システムの紹介を行う。また、GPUによる並列高速化技術の研究紹介も合わせて行う。
講師:松林 達史 (日本電信電話株式会社 サービスエボリューション研究所 研究主任)
【略歴】2000年京都大学理学部物理学科卒業。2002年10月より2年半、理化学研究所非常勤研究員。2005年東京工業大学理工学研究科地球惑星科学専攻博士課程修了。同年 NTT入社。NTT コミュニケーション科学基礎研究所に配属。2010年12月より、NTT サイバーソリューション研究所 研究主任。スパコンやGPUなどによる並列処理の研究を行い、主としてグラフ可視化の高速化に関する研究に従事。博士(理学)。情報処理学会員。
SESSION.5 16:10-17:20
大規模多メディアWeb情報を用いたネットワーク分析及び可視化
【講演概要】Webの情報空間は、ブログ、画像、動画、リンク等の情報共有、ソーシャルネットワーク、マイクロブログといった多様なサービスの発展に伴い多数のメディアが共存する多メディア化が進んでいる。一方、テレビ放送などマスメディアの影響力は依然として大きく、こうした実世界情報とWeb情報が相互に及ぼし合う影響も拡大している。社会学、言語学、リスク管理、マーケティング等の社会分析を行うためには、これら多メディアWeb情報の大規模な収集・解析・可視化が不可欠である。本講演では、Webサイト、ブログ、マイクロブログ等のWeb上における多メディア情報に関するネットワーク分析及び可視化手法について紹介する。
講師:豊田 正史 (東京大学 生産技術研究所 戦略情報融合国際研究センター 准教授)
【略歴】1999年東京工業大学大学院情報理工学研究科 博士(理学)。東京大学生産技術研究所戦略情報融合国際研究センター准教授。1999年より日本の大規模ウェブアーカイブを開始。ウェブマイニング、ユーザインタフェース、情報可視化に興味を持つ。