イベント企画
トップコンファレンス4-1 コンピューティングとデータベース
9/14 9:30-12:00
第3イベント会場

座長:入江 英嗣(東京大学)

9:30-9:50 講演(1) 【タイトル邦題】 KVM における仮想 CPU の過剰なスピンの発生の抑制
石黒 健太(法政大学 研究開発 大学任期付教員(常勤))
【原発表の書誌情報】 Kenta Ishiguro, Naoki Yasuno, Pierre-Louis Aublin, and Kenji Kono: Mitigating Excessive vCPU Spinning in VM-Agnostic KVM, In Proceedings of the 17th ACM SIGPLAN/SIGOPS International Conference on Virtual Execution Environments (VEE '21), April, 2021
【概要】 本論文では仮想 CPU のオーバサーブスクライブ環境における仮想 CPU の過剰なスピンを緩和する手法を提案する.
これによって,仮想 CPU の過剰なスピンの発生回数を抑えることで仮想マシンの性能向上を可能にする.
【略歴】 2022年慶應義塾大学理工学研究科単位取得退学
2022年から法政大学にて大学任期付教員(常勤)
9:50-10:10 講演(2) 【タイトル邦題】 マイクロ秒レイテンシのフラッシュメモリを用いて、小サイズランダム読み出しにおいて、DRAM 性能に迫る:新アクセス方法とそのグラフ処理への適用
鈴木 智哉(キオクシア株式会社 )
【原発表の書誌情報】 Suzuki T., Hiwada K., Kajihara H., Sano S., Nomura S., Shiozawa T.: Approaching DRAM performance by using microsecond-latency flash memory for small-sized random read accesses: a new access method and its graph applications, Proceedings of the VLDB Endowment, Volume 14, Issue 8, April 2021, pp 1311–1324
【概要】 近年のランダム読み出し性能が高い SSD では、読み出しのための CPU 側の処理負荷が重く、SSD の性能を出し切れないことがある。本論文では、CPU 側の処理負荷を低減する手法を提案し、その適用例としてグラフ処理の結果を示す。
【略歴】 2006 年、奈良先端科学技術大学院大学修士課程修了。同年、株式会社東芝に入社し、無線通信用半導体の研究開発に従事。2017 年より、東芝メモリ株式会社・現在のキオクシア株式会社に所属し、フラッシュメモリや SCM を用いたコンピュータシステムの研究開発に従事。
10:10-10:30 講演(3) 【タイトル邦題】 アンカーグラフハッシングのための高速化アルゴリズム
藤原 靖宏(日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 特別研究員)
【原発表の書誌情報】 Fujiwara,Y., Kanai, S., Ida, Y., Kumagai, A., Ueda, N.: Fast Algorithm for Anchor Graph Hashing, Proc. VLDB Endow. 14(6) (pVLDB), pp. 916-928 (2021)
【概要】 アンカーグラフハッシングは多次元データに対する近似検索を行うための代表的な技術であり,がん検診やウェブページの分類などに用いられる.本研究ではアンカーグラフハッシングにおいてデータのハッシュ値を高速に計算するアルゴリズムを提案する.
【略歴】 2003 年早稲田大学大学院理工学研究科電気工学専攻修士課程修了.同年,日本電信電話株式会社入社.2011 年東京大学大学院情報理工学系研究科電子情報学専攻博士課程修了.博士(情報理工学).現在,NTT コミュニケーション科学基礎研究所特別研究員.データ工学,データマイニング,人工知能などの研究開発に従事.
10:30-10:50 講演(4) 【タイトル邦題】 マルチコアによる並列処理アプローチを用いた高速なDensity-Peaks Clustering
天方 大地(大阪大学 )
【原発表の書誌情報】 Daichi Amagata and Takahiro Hara, Fast Density-Peaks Clustering: Multicore-based Parallelization Approach, In Proceeding of the ACM SIGMOD International Conference on Management of Data (SIGMOD) , pages 49-61, 2021.
【概要】 多次元データに対するクラスタリングは多くの分野における基本的な処理であり,特に密度ベースクラスタリングは多くのアプリケーションに利用されている.本研究では密度ベースクラスタリングの一種であるDensity-Peaks Clustering(DPC)に取り組み,既存のアルゴリズムよりも大幅な高速化を達成するアルゴリズムを提案する.
【略歴】 2015年大阪大学大学院情報科学研究科博士後期課程修了.同年より大阪大学大学院情報科学研究科助教.多次元データ空間におけるクエリ処理・データマイニングに対する高速アルゴリズムに関する研究に従事.
10:50-11:10 講演(5) 【タイトル邦題】 データレークから効率的に結合可能なテーブル探索
董 于洋(NEC データサイエンス研究所 特別研究員)
【原発表の書誌情報】 Efficient joinable table discovery in data lakes: A high-dimensional similarity-based approach Y Dong, K Takeoka, C Xiao, M Oyamada 2021 IEEE 37th International Conference on Data Engineering (ICDE), 456-467
【概要】 データレークにおける結合可能テーブルの発見は,データ統合,データ増強,データ解析,およびデータ市場のような多くのアプリケーションにおける重要手順である。従来の研究は、結合値が完全一致(equi-join)のテーブルという制約が掛けて、意味的な類似性が対応できなかった。本研究では、意味的に類似性を対応するために、テーブル内のテキスト値を単語埋め込み技術でベクトルに変換し、結合可能なテーブル探索問題をベクトル集合の検索問題にフォーマライズして、そして効率的な解決手段を提案した。
【略歴】 2019年筑波大学システム情報研究科博士課程修了。2019年よりNECデータサイエンス研究所入社。データ探索、データ統合、などについて研究に従事。
11:10-11:30 講演(6) 【タイトル邦題】 超平面配置によるランキング分布のモデル
鍛冶 静雄(九州大学 マス・フォア・インダストリ研究所 教授)
【原発表の書誌情報】 Kaji S., Horiguchi A., Abe T., Watanabe Y.: A Hyper-surface Arrangement Model of Ranking Distributions, Proc. of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining (KDD'21), pp 796--804 (2021)
【概要】 決まったラベル集合が与えられた時,その順位づけ(並べ替え)をランキングといい,多数のランキングからなるデータをランキング分布と呼ぶ.本講演ではランキングデータの幾何的なモデルを紹介する.部分的なランキングからの学習,高速なサンプリング,高い表現力,幾何的な正則化などのトピックに触れたい.
【略歴】 2007年京都大学理学研究科博士課程修了.福岡大学助教,山口大学講師・准教授,九州大学准教授を経て2021年より現職九州大学 マス・フォア・インダストリ研究所教授.トポロジーとその計算機科学への応用についての研究に従事.