D分野 データベース |
選奨セッション データベース応用 |
9月4日(水) 9:30-12:00 1c会場
座長 北山 大輔(工学院大学)
福田 悟志(中央大学) |
CD-001 |
マルチメトリック空間における効率的な近似最近傍探索
◎植村 玲央・天方 大地・原 隆浩(大阪大学)
×
CD-001マルチメトリック空間における効率的な近似最近傍探索
◎植村 玲央・天方 大地・原 隆浩(大阪大学)
本論文では,マルチメトリック最近傍探索問題に取り組む.この問題は,情報検索や機械学習に用いられている.このような応用例ではデータの画像やテキストは高次元ベクトルで表現されている.最も素朴なアルゴリズムとして線形探索があげられるが,大量データでは遅延が大きい.そのため,高速に高精度な近似解を求める手法が提案されている.しかし,既存手法はメトリック間の重みを考慮できないものや無駄な距離計算を削減できていない.本研究では,上記の課題を解決するために,近接グラフを用いた新しいマルチメトリック最近傍探索アルゴリズムを提案する.実データを用いた評価実験により,提案アルゴリズムの有効性を示す. |
CD-002 |
ユーザの関心度を考慮した多変量ホークス過程に基づく音楽推薦手法
◎山田 航平・原川 良介・岩橋 政宏(長岡技術科学大学)
×
CD-002ユーザの関心度を考慮した多変量ホークス過程に基づく音楽推薦手法
◎山田 航平・原川 良介・岩橋 政宏(長岡技術科学大学)
ユーザの一連の音楽聴取履歴を基に,次に聴取する音楽を推定可能とする音楽推薦手法が種々提案されている.既存手法の多くは,ユーザが次に聴取する音楽をground truthと仮定している.しかしながら,この仮定は必ずしも成立しないという報告が存在する.本文では,ユーザが各音楽を聴取した時間に基づき関心度を定義することで,新しいground truthを提案する.さらに,この新しいground truthに対応するための音楽推薦手法を提案する.我々は,最新の音楽推薦手法が採用している多変量ホークス過程を改良することで,ユーザの各音楽に対する関心度に応じて強度関数を最適化可能とした.広く用いられているオープンデータセットであるLast.FM 1K User Datasetに対する実験によって,提案手法が各ユーザに適した音楽を推薦可能とすることを示した. |
CD-003 |
多様な人物が執筆したテキストデータを対象としたその人物の性向を表す語彙・文体特徴の抽出方式
◎小椋 佳歩・岡田 龍太郎・峰松 彩子・中西 崇文(武蔵野大学)
×
CD-003多様な人物が執筆したテキストデータを対象としたその人物の性向を表す語彙・文体特徴の抽出方式
◎小椋 佳歩・岡田 龍太郎・峰松 彩子・中西 崇文(武蔵野大学)
本稿では,多様な人物が執筆したテキストデータを対象としたその特定の人物の性向を表す語彙・文体の特徴抽出方式について示す.一般的にそれぞれの人物が執筆した文章は,その人物の経験や性格といった性向が表れると言われている.しかしながら,それらの性向を表す語彙・文体を抽出することは難しい.本稿では,これまで我々が研究してきたapproximate inverse model explanations(AIME)を用いて,人物IDからそれぞれの人物が執筆した文章から抽出した語彙・文体の逆演算を行うことにより,その人物の性向を表す語彙・文体を導出を試みる.これによって,文章テキストデータから客観的に自身の性向を自己分析する一助となりうる. |
マルチメディア処理 |
9月4日(水) 13:10-15:10 2b会場
座長 中西 崇文(武蔵野大学) |
D-001 |
画像認識によるファッションアイテム推薦システムの構築
◎竹内 惟織・土屋 誠司・渡部 広一(同志社大学)
×
D-001画像認識によるファッションアイテム推薦システムの構築
◎竹内 惟織・土屋 誠司・渡部 広一(同志社大学)
近年、ファン活動の一環として「推し活」が注目されており,特にファッションにおいても展開されている.本研究では,入力画像に写るファッションアイテムを検出し,類似したアイテムを推薦するシステムの開発を目的とする.手法としてDeepfashion2データセットを使用してYOLOの学習モデルの作成を行い,入力画像に対してアイテムのカテゴリと座標の検出をする.データベース内の画像と入力画像の特徴抽出にVGG16を用いて,それを基にコサイン類似度を計算し,類似度の高い順にアイテムを推薦する.特徴抽出において他のアルゴリズムとの比較実験も行った. |
D-002 |
量子コンピュータ教科書に見る図の分類
○笹倉 万里子・岩田 健一(鳥取大学)
×
D-002量子コンピュータ教科書に見る図の分類
○笹倉 万里子・岩田 健一(鳥取大学)
量子コンピュータは次世代のコンピュータアーキテクチャとして注目を集めている.しかし,量子コンピュータの動作原理とそれを活かした量子アルゴリズムは,従来のコンピュータの考え方とは大きく異なり,理解が難しい.一般に,理解が難しい概念を理解しやすくするために,図を用いるというアプローチが行われることが多い.本発表では,量子コンピュータおよび量子アルゴリズムの教科書や論文に,どのような図が使われているかを調査し,それを分類する.その結果に基づき,量子プログラミングの教育支援としてのあらたな視覚化手法の検討を行う. |
D-003 |
類似軌跡探索における高速かつ高精度なスケッチ間類似度
◎河野 大督・古賀 久志(電気通信大学)
×
D-003類似軌跡探索における高速かつ高精度なスケッチ間類似度
◎河野 大督・古賀 久志(電気通信大学)
近年取得可能な軌跡データ数が増加し,計算量の大きいフレシェ距離を用いた類似軌跡探索が困難になっている。高速に類似軌跡探索を行うため、軌跡をスケッチに変換しスケッチ間類似度を調べる手法が提案されている。既存手法では複数のディスクをランダムに配置し、軌跡が通過するディスク番号の履歴をスケッチとし、スケッチ間で文字列編集距離を算出している。しかし、ディスクへの入りと出の両者を記録するためスケッチが長く、さらにスケッチが2次元情報を持たないためフレシェ距離との相関が低いという問題があった。本研究では、軌跡を構成する各点に対して最も中心が近いディスクを対応付けることでスケッチ長を短縮し、さらにディスクの中心座標を記憶しておくことで2次元情報をもつスケッチを算出する。得られたスケッチ間のフレシェ距離をスケッチ間類似度とすることで、フレシェ距離を用いた類似軌跡探索を高速かつ高精度で近似できることを示す。 |
D-004 |
部分構造の相対的な位置関係を考慮した順序あり木の類似検索
◎大高 一輝・古賀 久志(電気通信大学)
×
D-004部分構造の相対的な位置関係を考慮した順序あり木の類似検索
◎大高 一輝・古賀 久志(電気通信大学)
木は遺伝子やXMLを表現するのに用いられる基本データ構造であり、その類似検索も重要性が高い。木に対する代表的な類似度として木編集距離が存在するが、 計算量が非常に大きい。そこで木を部分木の集合として表現し、木の類似検索を集合間類似検索に帰着するアプローチが近年見られる。しかし、部分木集合は 部分木の元の木における位置情報を捨てるため、木編集距離に基く類似検索と検索結果が大きく異なる場合がある。そこで、本研究では木を相対的な位置関係を 畳み込んだ部分木ペアの集合として表現する手法を提案する。ここで相対的な位置関係とは上下(親子関係)あるいは左右(兄弟関係)であり、部分木の元の木に おける位置を反映する。遺伝子データを用いた実験によって、提案手法である部分木ペア集合に基づいた類似度が部分木集合に基く類似度よりも木編集距離との 相関係数が高くなることを確認した。 |
機械学習とWeb |
9月5日(木) 15:30-17:30 5d会場
座長 新井 淳也(日本電信電話株式会社) |
D-005 |
問題文と数式を考慮した数学の類題検索
◎居樹 彩乃・湯本 高行(兵庫県立大学)
×
D-005問題文と数式を考慮した数学の類題検索
◎居樹 彩乃・湯本 高行(兵庫県立大学)
ある問題を解いてその類題を復習するというのが基本的な勉強法だが、特に高校数学において類題を探すことは非常に手間となる。そこで本研究では高校数学の問題の類似度算出方法を提案する。問題の類似度は、文章部分の類似度と数式部分の類似度の加重平均で定義する。文章部分では、数学用語に着目したうえでSimpson係数を用いて類似度を算出する。数式部分に関しては、数式の公式集で学習した教師なしSimCSEで各数式をベクトル化し、そのコサイン類似度を使用する。このように文章部分と数式部分を別の処理を行った総合的な類似度を用いることで、ベースラインよりも良い結果が得られた。 |
D-006 |
競技クイズにおける問題文の別解・ミスリード検出
◎河合 弘理・湯本 高行(兵庫県立大学)
×
D-006競技クイズにおける問題文の別解・ミスリード検出
◎河合 弘理・湯本 高行(兵庫県立大学)
クイズの1分野に競技クイズがある。競技クイズで問題作成をする際には、別解がないか、ミスリードになっていないかなどを全ての問題で確認する必要があるが、これは非常に時間がかかる。この問題を解決するために本研究では既存の解答生成モデルを使った別解検出とミスリード検出を行う。別解には別名や表記ゆれなどの同義的別解と、問題文により生じる異義的別解が存在する。本研究ではこの2つの別解にそれぞれ異なるアプローチをとり、結果を組み合わせることで別解検出を行う。また、ミスリード検出では、解答生成モデルに与える問題文の長さを変えたときのモデルが出力する確信度の変化からミスリードの有無を検出する。 |
D-007 |
目標達成のための欲求上昇を奨励する個人ごとのメッセージ生成
◎和田 仁聖・島川 博光(立命館大学)
×
D-007目標達成のための欲求上昇を奨励する個人ごとのメッセージ生成
◎和田 仁聖・島川 博光(立命館大学)
本研究では、学習者が設定した目標の達成に向けた日々の振り返りからモチベーションのパターンを分析し、これを維持及び向上させる手法を提案する。本研究は、マズローの欲求階層論に基づき人のモチベーションにも欲求と関連した階層が存在するという仮説を立てる。トランスフォーマーモデルをチューニングし、振り返りのテキストからモチベーションレベルをtransformerで分析し、個人に最適化された症例分を生成して送信する。提案手法は、欲求階層を下から上に繊維させる、個人ごとに最適化されたメッセージを生成するので、目標達成での効率と成功率を大幅に向上させることができる。 |
D-008 |
アスリートに対するSNS上の誹謗中傷検出におけるリプライ元ツイートの有効性の検証
◎西谷 千乃与・安藤 一秋(香川大学)
×
D-008アスリートに対するSNS上の誹謗中傷検出におけるリプライ元ツイートの有効性の検証
◎西谷 千乃与・安藤 一秋(香川大学)
現代では,誰もがSNS上で簡単に情報を発信できるため,第三者に対する誹謗中傷が深刻な社会問題となっている.特に,アスリートに対する誹謗中傷も増えており,彼らのキャリアに深刻な影響を与える事例も確認されている.本研究では,特にアスリートに対する誹謗中傷に注目し,SNSからそれらを自動検出する手法の実現を目指す.著者らの先行研究では,悪口単語辞書を用いて,選手本人に対するメンションツイートと選手本人のツイートに対するリプライツイートを収集した後,各種の素性に基づく検出モデルと事前学習済みモデルに基づく検出手法を提案した.本稿では,誹謗中傷検出におけるリプライ元ツイートの有効性について検証する. |
D-009 |
大規模言語モデルを用いた賛否両論ある検索トピックに関するウェブページのスタンス判定
◎萩原 諒・山本 岳洋・湯本 高行(兵庫県立大学)
×
D-009大規模言語モデルを用いた賛否両論ある検索トピックに関するウェブページのスタンス判定
◎萩原 諒・山本 岳洋・湯本 高行(兵庫県立大学)
本研究の目的は、賛否両論あるトピックに関するウェブページがどのような意見(支持・支持しない・中立・関係ない)を結論付けているかを判定することである。賛否両論あるトピックとは、「小学生に宿題は必要か」のような賛成意見と反対意見が存在するトピックである。本研究では、大規模言語モデルを用いた3つの手法を提案する。ChatGPTを用いた手法では、zero-shotプロンプトとCoTプロンプトを用いた手法を検討する。BERTを用いた手法では、ChatGPTで生成した疑似データを用いてファインチューニングを行う。これらの手法を、実際のウェブページを複数人でアノテーションを行い、得られたデータで評価する。 |
D-010 |
MILを用いた加速度センサからの放牧牛発情時インタラクションの検出
◎中川 蓮・大川 剛直・大山 憲二(神戸大学)
×
D-010MILを用いた加速度センサからの放牧牛発情時インタラクションの検出
◎中川 蓮・大川 剛直・大山 憲二(神戸大学)
本研究では、畜産業の抱える課題である人手不足を低減するために放牧牛の発情時に観察されるインタラクションをAIを用いて検知することを目的とする。具体的には、2023年1月から2024年4月にかけて収集された黒毛和種繁殖雌牛群の目視観察データを基に、マウンティング・スタンディングの41例、異常接近の15例、膣粘液漏出の28例を発情とみなし、この際に観察されるインタラクションを調査した。牛ごとに取り付けた機器から加速度情報を取得し、深層学習モデルであるMultiple Instance Learning(MIL)を用いて発情候補点の検出を行った。さらに、検出された発情候補点に対して、動画の目視確認による定性評価を実施し、発情時インタラクションの検出を試みた。 |
ストリームデータとデータ管理 |
9月6日(金) 9:30-12:00 6c会場
座長 湯本 高行(兵庫県立大学) |
D-011 |
異周期カウンタを用いたスライディングウィンドウ型ストリームに対する頻度クエリの精度向上
○山川 竜太郎・古賀 久志(電気通信大学)
×
D-011異周期カウンタを用いたスライディングウィンドウ型ストリームに対する頻度クエリの精度向上
○山川 竜太郎・古賀 久志(電気通信大学)
ビックデータ時代の到来によりストリームデータ処理に重きが置かれるようになった.ストリームデータは大量のデータを生成するので,小メモリでストリームデータを要約するスケッチが注目されている.近年,ハッシュテーブルを用いた要素の近似頻度を返すスケッチである Count-Min Sketch をスライディングウィンドウモデルに拡張したSliding Sketchが提案された.Sliding Sketchは複数のカウンタを持ち,それらを位相が異なる同一周期でリセットすることで常に1つのカウンタが約1日分のデータを持つことを保証する.こうして過去1日の要素の近似頻度を返す.しかし,Sliding Sketchでは複数のカウンタが同時に約1日分のデータを持つことがないため,ハッシュ衝突があると近似精度が低下する.そこで,本研究では異なる周期のカウンタを混在させて複数のカウンタが同時に約1日分のデータを持つ状況を作り,近似精度の低下を防止する手法を提案する. |
D-012 |
コンセプトドリフトが想定される環境でのオンラインK-medoidsクラスタリングの代表データ選択
◎田山 凜太郎・古賀 久志(電気通信大学)
×
D-012コンセプトドリフトが想定される環境でのオンラインK-medoidsクラスタリングの代表データ選択
◎田山 凜太郎・古賀 久志(電気通信大学)
ビッグデータの活用が進む現代、ストリームデータに対するクラスタリングの重要性は増している。その中で、Nadeemらはシーケンスデータを対象としてK-medoids法を拡張したSECLEDSアルゴリズムを提案した。SECLEDSでは各クラスタは複数の代表点を持ち、代表点は同じクラスタに属する他データからの投票によって決定される。しかし、SECLEDSが使用する代表点選択手法は一時的なノイズもコンセプトドリフトであると判定するという欠点が存在する。そこで本研究では、データに対して票を与えるスキームを変更することで、ドリフトへの対応能力を維持しつつノイズにロバストな代表点選択手法を2種類提案する。ドリフトが含まれる通信データセットに対する実験の結果、提案手法はSECLEDSに対して20%程度の精度向上を実現した。 |
D-013 |
データ連携基盤における一次データと派生データとの整合性担保方式の一提案
◎田中 沙弥・鹿島 理華・田中 覚・杣 信吾(三菱電機)
×
D-013データ連携基盤における一次データと派生データとの整合性担保方式の一提案
◎田中 沙弥・鹿島 理華・田中 覚・杣 信吾(三菱電機)
近年、複数の事業者間でデータ授受を行う仕組みの一つとして、データ提供者とデータ利用者、および両者のデータ授受を支援するデータ仲介者からなるデータ流通基盤が広く知られている。各事業者がデータを保有するデータ流通基盤において、提供データの定義変更などの更新は、データの利用状況とは独立して行われる。本稿では、提供データ更新の影響を受けるサービスやデータをバージョン情報と共に管理することで、提供データ更新時にデータ利用者側のサービスやデータの整合性を担保し易くするための一案を述べる。 |
D-014 |
複数のデータ連携基盤にまたがるデータ利活用の課題に関する一検討
○石井 陽介・伊藤 大生(日立製作所)
×
D-014複数のデータ連携基盤にまたがるデータ利活用の課題に関する一検討
○石井 陽介・伊藤 大生(日立製作所)
データ連携基盤とは、複数のシステムやサービス間で蓄積されたデータを効率的に収集・変換・管理・利用する仕組みを提供するものである。このデータ連携基盤は、行政機関間連携、官民連携、および民間サービス同士の連携などの目的に応じて、複数存在している。一つのデータ連携基盤内でデータ利活用する場合は問題ないケースであっても、異なるデータ連携基盤から取得してデータ利活用する場合は、それぞれのデータ連携基盤でデータ形式や取り扱い方が異なることがあり、その対応が課題となる。本稿では、複数のデータ連携基盤にまたがるデータ利活用の課題と、課題解決方針について報告する。 |
D-015 |
製造業におけるデータ管理のためのデータモデリングシステムアーキテクチャの提案
◎萩原 岳大・石田 仁志(日立製作所)
×
D-015製造業におけるデータ管理のためのデータモデリングシステムアーキテクチャの提案
◎萩原 岳大・石田 仁志(日立製作所)
近年、製造業では、顧客ニーズの多様化やデジタル化の進展で、市場環境が急速に変化している。変化に対応する取り組みとしてSC(サプライチェーン)の強靭化やDX(デジタルトランスフォーメーション)による競争力の向上などがあげられている。SCの強靭化のためには、事業を構成する業務のつながりを意識し、SC全体の業務プロセスを最適化することが重要であるが、部門横断的なデジタル化の推進は不十分であり、データについても業務ごとの改善に活用されるに留まる場合が多い。本検討では、業務プロセスおよび関連するデータを管理するためのデータモデルについて、データドリブンで構築するためのシステムアーキテクチャを提案する。 |
D-016 |
分散合意判定機能をもつ分散トランザクション管理ミドルウェアにおける未決着トランザクションの管理方式
○坂井 秀行(日立製作所)
×
D-016分散合意判定機能をもつ分散トランザクション管理ミドルウェアにおける未決着トランザクションの管理方式
○坂井 秀行(日立製作所)
デジタルトランスフォーメーションの潮流に伴いマイクロサービスの採用が進んでおり、複数のマイクロサービスのリソース更新からなる分散トランザクションの管理が必要となっている。多様な分散トランザクション管理ミドルウェアが提供される中、分散合意判定機能により基幹系業務に適用できるような耐障害性をもつものもあるが、ネットワーク越しのトランザクションの状態を把握することは難しく、障害発生時にはロールバックを選択するケースもある。そこで本研究では上記のようなミドルウェアにおいて、障害発生時の未決着トランザクションをロールフォワードできるケースを明確化し、トランザクションの成功率を高める方式を提案する。 |
位置情報と観光 |
9月6日(金) 13:10-15:40 7e会場
座長 福田 悟志(中央大学) |
D-017 |
細粒度のユーザ属性に基づく観光地レビューの検索
◎徳留 壮哉・山本 岳洋・湯本 高行(兵庫県立大学)
×
D-017細粒度のユーザ属性に基づく観光地レビューの検索
◎徳留 壮哉・山本 岳洋・湯本 高行(兵庫県立大学)
観光地のレビューサイトでは、人気な観光地ほどたくさんの数や種類のレビューが寄せられるが、全てのレビューを確認するには、膨大な時間と手間がかかってしまう。また現在、年齢や性別ではなく、「足腰の悪い高齢者」といった細粒度のユーザ属性では検索できない。 そこで本研究では、細粒度のユーザ属性に合ったレビューを検索するため、大規模言語モデルで属性に関連するレビューを生成し、生成されたレビューとの類似度が高い実際のレビューを検索する手法を提案する。例えば、「足腰の悪い高齢者」といった細粒度のユーザ属性に対しては、「砂利道が多くて転びそうになった」といったレビューを生成して、検索に用いる。 |
D-018 |
生成AIを利用した顧客満足度の向上の実現
◎Lim ChanWoo・島川 博光(立命館大学)
×
D-018生成AIを利用した顧客満足度の向上の実現
◎Lim ChanWoo・島川 博光(立命館大学)
本研究は外食産業の人手不足の解決策として、ロボットやエージェントが提供する料理に対する蘊蓄を語るウエーターの役割を果たすことを考える。ロボットやエージェントが料理のエピソードを語り、顧客にインタラクティブな経験を提供し、料理への興味・満足度を高める。本研究ではこのエピソードを生成するために、生成モデルを3段階に分けて訓練する。まず、インターネット上で料理や説明などを収集し、エピソードを生成するためのコーパスを作成する。次に人がどのような要素に惹かれるかについて考察する。最後に、収集したコーパスを考察結果に基づいてチューニングし、メッセージ生成モデルを完成する。 |
D-019 |
アテンションリカレントネットワークを用いた人流データ解析の評価と考察
◎服部 まどか・中野 美由紀・来住 伸子(津田塾大学)・小口 正人(お茶の水女子大学)
×
D-019アテンションリカレントネットワークを用いた人流データ解析の評価と考察
◎服部 まどか・中野 美由紀・来住 伸子(津田塾大学)・小口 正人(お茶の水女子大学)
近年、人流データは災害対応や観光、まちづくりなど様々な分野における活用が期待されている。本研究では、DeepMove: Predicting Human Mobility with Attentional Recurrent Networksのアルゴリズムを用いた人流解析を行い、人流制御への有効性について検討を行っている。人工的に作った人流データを用いてアルゴリズムの性能評価を行った。その評価結果から精度向上のための考察を行い、今後の展望について検討を行う。 |
D-020 |
ストリートビューとバードビューの自動切り替えによる経路情報提示方式
○児玉 美緒(関西学院大学)・王 元元(山口大学)・河合 由起子(京都産業大学/大阪大学)・角谷 和俊(関西学院大学)
×
D-020ストリートビューとバードビューの自動切り替えによる経路情報提示方式
○児玉 美緒(関西学院大学)・王 元元(山口大学)・河合 由起子(京都産業大学/大阪大学)・角谷 和俊(関西学院大学)
近年, ストリートビューやバードビューなど, 経路を表現する研究がおこなわれるようになった. ストリートビューは目前の地物の確認, バードビューは経路全体の確認に適するという特徴を持つ. Googleのイマーシブビューでは, 3DCGを操作することで多角的にルートを確認できるが, ユーザの操作は煩雑であるという問題がある. そこで, 本研究は視覚特性と地理特性に基づき,ストリートビューとバードビューの切り替えを自動で行う手法を提案する. さらに, 進行方向を基準としたバードビューの演出方式を提案する. これにより, 従来の経路案内より経路の概略や方向の確認を容易に行うことができる. |