D分野 データベース |
選奨セッション テキスト分析とシステム構築 |
9月6日(水) 9:30-12:00 1d会場
座長 佐々木 勇和(大阪大学)
本多 賢(駒澤大学) |
CD-001 |
グラフ理論に基づくSSHサーバログの統合管理およびリアルタイム可視化システムの提案
◎大歳 英征・中原 崇・波多 悠輔・前田 達哉・大堀 天照・岩井 陸人・森井 駿・田中 直人・小林 孝史(関西大学)
×
CD-001グラフ理論に基づくSSHサーバログの統合管理およびリアルタイム可視化システムの提案
◎大歳 英征・中原 崇・波多 悠輔・前田 達哉・大堀 天照・岩井 陸人・森井 駿・田中 直人・小林 孝史(関西大学)
SSHは,認証と暗号化の技術を用いて安全に遠隔サーバへのアクセス環境を提供し,UNIX等のOSで広く用いられている.しかし,その目的がサーバへの直接的なシェル操作であることから,企業の機密情報などを狙う攻撃者からの標的となりやすい.日常的にSSHサーバのログを監視・分析することは,それらの脅威に対処することに有用であるが,監視・分析作業は管理者にとって労力がかかることである.そこで,本稿では,グラフ理論を用いたSSHサーバログの統合管理およびリアルタイムに可視化するシステムを提案する. |
CD-002 |
メトリックの統合によるツイート話題分類の高精度化に関する検討
○熊本 忠彦(千葉工業大学)
×
CD-002メトリックの統合によるツイート話題分類の高精度化に関する検討
○熊本 忠彦(千葉工業大学)
本稿では,コロナ禍に関連するツイートを対象に,より粒度の細かい話題に分類する深層学習ベースの手法を示し,その高精度化について検討する.具体的には,ツイートとそのツイートから抽出されるトピックをベクトル化し,両者を比較することで,より高精度な話題分類を実現する.トピックの抽出には,代表的なトピックモデルの一つであるLatent Dirichlet Allocation(LDA)を用い,ツイートやトピックのベクトル化には,深層学習ベースの分散表現生成手法の一つであるfastTextを用いる.なお,ベクトルどうしの近さを測るためのメトリックとして,一般的にはコサイン類似度かユークリッド距離のいずれかを用いることが多いが,本稿ではこの2つのメトリックとLDAが算出するトピック確率(各ツイートがそれぞれのトピックに属する確率)を統合することで,より高精度な話題分類を実現することができることを示す. |
CD-003 |
楽器で演奏された単旋律フレーズをクエリとした楽曲検索システム
◎松下 陸・伊藤 克亘(法政大学)
×
CD-003楽器で演奏された単旋律フレーズをクエリとした楽曲検索システム
◎松下 陸・伊藤 克亘(法政大学)
ハミング音符検索システムは楽器音声を前提としておらず、楽器演奏者には演奏による楽曲検索が困難である。そこで本研究では楽器の単旋律フレーズを用いた楽曲検索システムを提案する。クエリ生成にはfastTextの学習により得られた単語分散表現を用い、クエリマッチングには計算量が少なく高速なコサイン類似度を利用した。fastTextにより誤った入力フレーズにも対応した。実験の結果、提案手法は従来手法と同等の評価指標であったが、提案手法は42,000曲という従来の約10倍の楽曲数の大規模なデータベースを利用して構築されているため、従来システムよりも優れた検索システムであることが示された。 |
CD-004 |
講義スライド作成のためのトピック説明度合いと提示順序に基づく編集サポート方式
◎佐野 逸稀(関西学院大学)・王 元元(山口大学)・河合 由起子(京都産業大学/大阪大学)・角谷 和俊(関西学院大学)
×
CD-004講義スライド作成のためのトピック説明度合いと提示順序に基づく編集サポート方式
◎佐野 逸稀(関西学院大学)・王 元元(山口大学)・河合 由起子(京都産業大学/大阪大学)・角谷 和俊(関西学院大学)
講義スライドを作成する講師にとって,常に講義全体の構成を意識しながらスライドを作成するのは負担が大きく,難しい.そこで本研究は,講師が既に作成したスライドの構成を可視化する方式を提案する.このとき,スライドの構成はトピックの説明度合いと説明順序という2つの要素で表される.これにより,講師は既に作成したスライドを,講義全体の構成を基に,確認,編集することができる.また,編集結果をスライド構成に反映し,再度可視化することによって,講師は常に講義全体の構成を意識しながらスライドを完成させることができる. |
テキスト分析 |
9月6日(水) 15:30-17:30 3c会場
座長 北山 大輔(工学院大学) |
D-001 |
新型コロナ関連トピックと非関連トピック間のコミュニティ類似性の分析
◎成田 省吾(東京都立大学)・横山 昌平(東京都立大学/国立情報学研究所/東京大学)
×
D-001新型コロナ関連トピックと非関連トピック間のコミュニティ類似性の分析
◎成田 省吾(東京都立大学)・横山 昌平(東京都立大学/国立情報学研究所/東京大学)
コロナ禍において,SNS上では感染予防対策に関する議論や新型コロナワクチンに関する情報の拡散などが行われてきた.その中で,単一のトピックに関する分極化やエコーチェンバーが問題として挙げられる.本研究では,一般的にユーザは複数のトピックに興味を持っていることに着目し,関連はしていないがコミュニティが類似しているトピック間の関係を分析した.具体的には,Twitterデータを用いてLDAによりトピックを分類し,ユーザが共通しているトピックペアの中でも,特に意味的に遠いペアに注目することで,新型コロナ関連トピックの性質を明らかにした. |
D-002 |
BARTを用いたツイートされる多様な病気症状の事実性解析
◎安藤 樹・安藤 一秋(香川大学)
×
D-002BARTを用いたツイートされる多様な病気症状の事実性解析
◎安藤 樹・安藤 一秋(香川大学)
近年,医療分野に自然言語処理を応用する研究が注目されている.当研究室では,特定の病気や感染症であるか否かを問わず,いつ,どこで,どのような病気・症状がツイートされているのかを収集・分析し,地域別・時系列別に可視化するシステムの構築を進めている.当研究室の先行研究では,一般的な病気症状14種のみを事実性解析の対象に設定していたため,対象外となる病気症状が多数存在していた.そこで本稿では,患者表現辞書に収録されている11種の標準病名に対応する84種の出現形を対象に,BARTの事前学習済みモデルを利用して,多様な病気症状に対応できる事実性解析手法について検討する. |
D-003 |
アスリートに対する誹謗中傷ツイートの分析と検出法の初期検討
◎西谷 千乃与・安藤 一秋(香川大学)
×
D-003アスリートに対する誹謗中傷ツイートの分析と検出法の初期検討
◎西谷 千乃与・安藤 一秋(香川大学)
パソコンやスマートフォンの普及に伴い,誰でも簡単に情報発信できるようになった.しかし,SNS上での誹謗中傷は大きな問題となっている.特に,アスリートに対して心無い言葉を投げかけ,彼らのキャリアを脅かす事例が発生している.これまでにSNS上の誹謗中傷を検出する研究はいくつか実施されているが,アスリートを対象とする研究は少ない.本研究では,Twitter上で発信されるアスリートに対する誹謗中傷を自動検出する手法の実現を目指す.本稿では,まず悪口単語辞書を構築し,その辞書を用いて誹謗中傷を含むツイート候補を収集する.そして,収集したツイート候補を分析し,誹謗中傷ツイートを検出する手法について初期検討する. |
D-004 |
階層性に着目したレビューコーパスの特徴可視化
◎林 沙也加・松下 光範(関西大学)
×
D-004階層性に着目したレビューコーパスの特徴可視化
◎林 沙也加・松下 光範(関西大学)
複数コーパス間を組み合わせ,その内容の偏りに着目して活用する手法が注目されている.多様なカテゴリが含まれるコーパスの場合,カテゴリ毎の情報の偏りに着目することで一つのコーパス内であっても同様の活用が可能である.こうした利用のために部分コーパスを作成するには,ユーザがカテゴリに含まれる情報を事前に確認する手間が必要になる.そこで本研究では,この作業を簡便に行うためにコーパスが持つ階層性に着目し,階層ごとに含まれる情報を比較できるように可視化することでユーザがカテゴリ毎の情報の偏りを容易に把握し,部分コーパスを作成する支援を試みる. |
D-005 |
コスメレビューを用いたメイクパターン特性の可視化および時系列分析
◎福本 真以子(関西学院大学)・牛尼 剛聡(九州大学)・角谷 和俊(関西学院大学)
×
D-005コスメレビューを用いたメイクパターン特性の可視化および時系列分析
◎福本 真以子(関西学院大学)・牛尼 剛聡(九州大学)・角谷 和俊(関西学院大学)
近年, 「韓国メイク」や「ナチュラルメイク」など, ブームとともに隆盛したものから根強いものまで, 様々なメイクパターンが混在している. 異なるメイクパターンの間でも, メイクの特徴や使用されるコスメが類似する場合がある. また, 「ツヤ肌」など流行の影響を受け, 各メイクパターンの持つ特徴は時代とともに変化する. そこで本研究では, コスメレビューに出現する言語表現に着目して, 複数のメイクパターン間の関連性を期間を区切ったうえで可視化し, 各メイクパターンの時系列分析を行う. |
D-006 |
食材集合を用いたレシピ分類
邑中 ひな(NECネッツエスアイ)・◎加藤 未響・小早川 倫広・岩田 満(産業技術高等専門学校)
×
D-006食材集合を用いたレシピ分類
邑中 ひな(NECネッツエスアイ)・◎加藤 未響・小早川 倫広・岩田 満(産業技術高等専門学校)
食材をデータ表現する方法は、食材をベクトル表現する方法と、集合表現する方法の2種類がある。ベクトル表現した場合、2つのレシピの類似性はベクトル間距離を利用可能であり、一般的なクラスタリング手法が適用可能である。一方、集合表現した場合、集合と集合の間の集合間類似度のみが算出可能であり、距離を用いた一般的なクラスタリング手法を適用できない。本稿では、レシピの食材集合の集合間類似度に基づくレシピ分類手法を提案し、その枠組みを収集したレシピデータ集合(レシピ数 5,000件、料理カテゴリ 20)を用いて提案するレシピ分類手法の性能を評価する。評価実験の結果、平均再現率 0.7246、平均適合率 0.7028を得た。 |
データベースとマイニング |
9月7日(木) 9:30-12:00 4c会場
座長 横山 昌平(東京都立大学) |
D-007 |
(講演取消) |
D-008 |
連合学習がデータ転送の無駄なく実現できるデータ仮想化エンジンPGSpiderの分散データ処理機能
○片山 大河・廣瀬 繁雄・熊谷 宏樹(東芝)
×
D-008連合学習がデータ転送の無駄なく実現できるデータ仮想化エンジンPGSpiderの分散データ処理機能
○片山 大河・廣瀬 繁雄・熊谷 宏樹(東芝)
様々な場所でデータが生成されるようになる一方で、その分散データの活用にはデータサーバからアプリへの生データの移動による転送量やプライバシーの課題がある。また、その課題の回避のためにアプリを分散配置させた場合、その管理が複雑になるという課題もある。その解決策としてPostgreSQLベースのデータ仮想化エンジンPGSpiderに分散ストアドファンクション機能を実現した。本機能により、通常のデータベースのままPGSpiderを用意するだけで機械学習処理など分散データ処理をサーバサイドで容易に実行可能になり、MNISTデータに対する連合学習に適用して実現性を確認した。その結果データ移動の最小限化と学習処理の一元管理が両立できるようになった。 |
D-009 |
空間類似結合におけるK近傍グラフ作成の効率化
今井 健太郎・○大森 匡・新谷 隆彦・藤田 秀之(電気通信大学)
×
D-009空間類似結合におけるK近傍グラフ作成の効率化
今井 健太郎・○大森 匡・新谷 隆彦・藤田 秀之(電気通信大学)
空間上の位置情報と内容に関するテキスト情報の両方を持つレコード集合Dにおいて,距離ε以下でテキスト類似度θ以上となるレコードの組(x,y)を全て求める演算を空間類似結合(STSjoin)と言う.本稿ではこの定義下において各x in Dから類似度の高い順に上位K個のy (in D)を決める問題,つまりK近傍グラフの計算問題を扱い,類似結合下のKNNグラフ計算法であるAnastasiuらのL2Knng法を空間類似結合の枠組みに合わせて変形適用した技法を報告する. |
D-010 |
オカレンスの非重複を考慮した探索候補削減による複数の時間帯に注目した長時間エピソード抽出手法
◎松崎 太一・新谷 隆彦・大森 匡・藤田 秀之(電気通信大学)
×
D-010オカレンスの非重複を考慮した探索候補削減による複数の時間帯に注目した長時間エピソード抽出手法
◎松崎 太一・新谷 隆彦・大森 匡・藤田 秀之(電気通信大学)
近年ではウェアラブル端末の普及によりライフログの活用に関心が高まっている.我々はユーザがどの程度の動きを行ったかを表す運動状態データを収集し,ユーザの生活特性を示す長い時間を占めた行動に相当する長時間エピソードを抽出する研究を進めてきた.行動が行われた時間帯の偏りを考慮して長時間エピソード抽出手法が報告されているが,1つの時間帯のみしか扱うことができなかった.本研究では注目する時間帯が複数となる場合の長時間エピソードの抽出を検討する.複数の時間帯を対象とした場合,従来の探索候補削減手法ではエピソードの成長を冗長に見積もる問題があった.そこで,本手法ではオカレンスの非重複を考慮して冗長な見積もりの排除を行う手法を検討し,実データを用いた評価実験を行なった. |
D-011 |
投稿における炎上推定モデル生成のための疑似学習データセット構築の検討
◎吉田 裕輔・鷹野 孝典(神奈川工科大学)
×
D-011投稿における炎上推定モデル生成のための疑似学習データセット構築の検討
◎吉田 裕輔・鷹野 孝典(神奈川工科大学)
本稿では,SNSに投稿された意見やコメントに対する炎上可能性の推定モデル生成を目的とした,疑似学習データセット構築手法の検討について報告する.炎上可能性の推定のために,多様な要因に対応した炎上推定モデルの構築が重要である.炎上要因の一つとして,投稿者の考えと世間の考えのズレが大きく異なる乖離度が挙げられる.乖離度計算には,時系列で展開される意見間の対立度を必要とするが,分析のための実データの取得が困難である.本研究では,多様な視点の意見集合を対象として,意見間の時系列と対立度に着目したニューラルネトワークモデル学習のための,疑似学習データセットの構築手法について提案する. |
システム構築 (1) |
9月7日(木) 15:30-17:30 5d会場
座長 鷹野 孝典(神奈川工科大学) |
D-012 |
視野の広い情報取得のための閲覧ページに対する他者観点の提示方法
◎小竹 神・北山 大輔(工学院大学)
×
D-012視野の広い情報取得のための閲覧ページに対する他者観点の提示方法
◎小竹 神・北山 大輔(工学院大学)
通常検索というものは,ユーザ自身の検索クエリとSERP(Search Engine Result Page)によって行われる.そのような背景から,ユーザ自身の観点での検索となる.また,情報ニーズ自体は,他者と類似していることも多い.しかし,同様の情報ニーズであっても,ユーザによって閲覧する情報は異なる.本研究では,他者のユーザのモデルをOpenAIが公開したChatGPTにクエリ履歴を入力することで作成し,それによって検索ユーザが閲覧したページ中の部分コンテンツの判定を行い,その判定結果に基づいてその部分コンテンツを強調表示するシステムの実装する. |
D-013 |
大規模言語モデルのためのサービスに対する口コミを用いた入力自動補完の検討
◎笹本 まこと・堀川 達平・北山 大輔(工学院大学)
×
D-013大規模言語モデルのためのサービスに対する口コミを用いた入力自動補完の検討
◎笹本 まこと・堀川 達平・北山 大輔(工学院大学)
ChatGPTをはじめとする汎用的な大規模言語モデルは、どんな入力に対してもそれなりの結果を返すことができる。しかし、人が新しく何かを始めるときは検索自体が難しく、入力内容が曖昧であるために、意図した出力にならないことがある。また、これらのモデルは、最新情報に疎く、ありきたりな内容を出力したりすることもある。本研究では,入力としてサービスに関する問い合わせを想定し、入力内容に対象サービスの専門的な内容を含めるために、サービスに対する口コミデータを用いて、サービスの良い特徴・悪い特徴を自動的に抽出し、入力に補完する。入力を具体的にすることで、より適した出力を得ることが可能になり、ユーザの調べ物や意思決定を支援する。 |
D-014 |
作業内容の実況に対する応援コメントの自動生成によるタスク遂行促進手法の提案
◎堀川 達平・北山 大輔(工学院大学)
×
D-014作業内容の実況に対する応援コメントの自動生成によるタスク遂行促進手法の提案
◎堀川 達平・北山 大輔(工学院大学)
我々は様々なタスクを抱えて生活しているが、時には集中力の低下やモチベーションの喪失により、作業を円滑に進められない場合がある。そのような中、近年YouTubeなどの動画配信プラットフォームにおいて、作業配信と呼ばれる自身の作業状況を実況しつつリスナーとコメントのやり取りを行い、作業を進めていく配信が行われている。この作業配信は、作業内容を実況させるという自己説明による課題解決促進効果と、応援やアドバイスといったリスナーからのリアクションによる発話促進効果という2つの効果の相乗効果によりタスク遂行が促進されている。しかし、これを行うには自身の行動をインターネット上に配信する必要と、ある程度の規模のリスナーを獲得する必要があり、どちらも作業配信を行う上での障壁となっている。そこで本研究では、ユーザの発話や操作に反応し、作業の応援やアドバイスを行うコメントを自動生成する手法を提案する。 |
D-015 |
オンデマンド授業におけるユーザ視聴操作に基づく事後学習支援方式
◎小西 真愛・井上 沙紀(関西学院大学)・王 元元(山口大学)・河合 由起子(京都産業大学/大阪大学)・角谷 和俊(関西学院大学)
×
D-015オンデマンド授業におけるユーザ視聴操作に基づく事後学習支援方式
◎小西 真愛・井上 沙紀(関西学院大学)・王 元元(山口大学)・河合 由起子(京都産業大学/大阪大学)・角谷 和俊(関西学院大学)
近年, 新型コロナウイルスの影響により, 録画した授業映像をインターネットで配信するオンデマンド形式の授業が普及し始めている. オンデマンド授業のメリットとして生徒が視聴するタイミングやペースを自身で決定できることが挙げられる. 一方で, オンデマンド授業のデメリットとして, 一方通行の授業であること, 復習を教員の補助なしに授業内容を理解しなければならないことが挙げられる. そこで本研究では, ユーザの視聴操作を用いてシーンごとの理解度を推定し, ユーザが再視聴すべきシーンを復習教材として推薦するシステムを提案する. これによりユーザ自身で再視聴が必要なシーンを探す必要がなくなり, 効率的に学習を支援することができる. |
D-016 |
生活習慣病改善に向けた移動中の代謝量増加および認知バイアス軽減手法の提案
◎YANG XINNI・羽倉 輝(京都産業大学)・王 元元(山口大学)・シリアーラヤ パノット(京都工芸繊維大学)・河合 由起子(京都産業大学)
×
D-016生活習慣病改善に向けた移動中の代謝量増加および認知バイアス軽減手法の提案
◎YANG XINNI・羽倉 輝(京都産業大学)・王 元元(山口大学)・シリアーラヤ パノット(京都工芸繊維大学)・河合 由起子(京都産業大学)
日常生活で健康に対する意識と自己欲求とのトレードオフを考慮することで、生活習慣病の改善が期待される。本研究では、生活習慣病の基本戦略となる運動不足の解消と過食の防止を目指し、代謝量を増加させつつ非合理的になる心理現象である認知バイアスを軽減する経路推薦システムを提案する。具体的には、改善したい生活習慣病をユーザが指定すると、認知バイアスが発生する要因を抽出し、代謝量と要因に基づき複数の移動方法と移動経路を推薦する。特に本稿では、実装した移動時間または移動距離を一定とした移動方法と経路推薦システムについて報告する。 |
D-017 |
製造業におけるデータ管理のためのデータモデリングシステムの検討
◎萩原 岳大・石田 仁志・川村 陸・宮本 啓生(日立製作所)
×
D-017製造業におけるデータ管理のためのデータモデリングシステムの検討
◎萩原 岳大・石田 仁志・川村 陸・宮本 啓生(日立製作所)
近年、製造業では、デジタルデータを活用したデジタルツインの考え方に基づいた、高効率な生産システムの構築が注目されているが、部門横断的なデジタル化の推進は不十分であり、データについても業務ごとの改善に活用されるに留まる場合が多い。日立製作所では、製造業における業務プロセスを、業務と4Mデータ(Human, Machine, Material, Method)から構成されるデータモデルで整理することで、業務プロセス全体の最適化に向けたデータ活用を支援するソリューションを開発している。本検討では、業務+4Mデータモデルについて、製造現場で発生する現場データからプロセスマイニング技術により推定し、モデルの継続的更新を容易化する方法を提案する。 |
システム構築 (2) |
9月8日(金) 9:30-12:00 6c会場
座長 本多 賢(駒澤大学) |
D-018 |
セレンディピティ指向観光スポット推薦のためのGPTを用いたユーザエージェントの構築とその評価
◎関 峰・北山 大輔(工学院大学)
×
D-018セレンディピティ指向観光スポット推薦のためのGPTを用いたユーザエージェントの構築とその評価
◎関 峰・北山 大輔(工学院大学)
一般的に旅行計画時には,有名な観光情報を中心に取得ことが多く,その場合,ユニークな魅力を持つ場所を見逃しがちである.ユーザにとって独特の魅力を持つセレンディピティ性のある観光地を発見するために,ユーザ自身の視点に基づいて観光地を紹介することが有効と考える.本研究の目的は,ユーザが情報を得たい観光地に対して,一定期間の間,観光スポット情報を定期的に提供することで,ユーザの潜在的な観光ニーズを喚起することである.そのために,対象エリアのランダムなスポットに対して,GPTを用いてユーザの興味や性格に基づくそのスポットのレビュー文を生成し,スポット情報と生成したレビュー文をユーザに提示する手法を提案する.実験において,生成レビュー文を提示する場合と提示しない場合の比較を行い,レビュー文生成の効果を評価する.また,スポット選択に関してランダムに選択する場合とユーザの興味や性格に基づいて選択する場合を比較することで,セレンディピティ性についても評価する. |
D-019 |
旅行時の対応能力向上のための大規模言語モデルを用いたトラブル当てゲーム
◎斉藤 さつき・小竹 神・北山 大輔(工学院大学)
×
D-019旅行時の対応能力向上のための大規模言語モデルを用いたトラブル当てゲーム
◎斉藤 さつき・小竹 神・北山 大輔(工学院大学)
旅行慣れしていない人は予期せぬトラブルに対処することが難しいことがある.トラブルが発生した場合,旅行が予想以上にストレスになり,楽しむことができなくなってしまう.このような事態を避けるために,旅行前に予防策を講じ,適切な対処法をすぐに実行することが重要だ.本研究では,提示される旅行計画に対してユーザが発生しうるトラブルとそのトラブルの対処法を考えることで,トラブルの対応能力を向上させる会話型のトラブル当てゲームを提案する.トラブル自体の妥当性や,その対処法の妥当性に関してはGPTモデルを用いて判定を行う.このゲームを通じて,楽しみながらトラブルに備え,旅行をより快適なものにすることを目指す. |
D-020 |
GPTを用いた自然言語による地図検索手法の検討
◎小柳 慶真・関 峰・北山 大輔(工学院大学)
×
D-020GPTを用いた自然言語による地図検索手法の検討
◎小柳 慶真・関 峰・北山 大輔(工学院大学)
地図検索をするとき我々はスポットや目的の入力を行い,示された複数の場所から行き先を決定し,地図アプリが示す経路を辿って目的の場所へ到達する.このような手順で行われる地図検索では,自然言語を用いることが出来ない.自然言語の解釈に関しては,近年,大規模言語モデルが発達し,入力文に対して適切な出力が行えるようになってきている.しかし,ハルシネーションという事実とは異なる出力をする問題もあり,特に地理情報に関しては,ハルシネーションを起こしやすい.そこで,本研究では大規模言語モデルとしてGPT を用いた自然言語による地図検索手法を提案する. |
D-021 |
Webデータに基づく質問応答システムを用いた情報処理技術者試験応募法人の推定
○奥村 明俊・市瀬 規善・久寿居 大・石川 開・鳥澤 健太郎・大竹 清敬(情報処理推進機構)
×
D-021Webデータに基づく質問応答システムを用いた情報処理技術者試験応募法人の推定
○奥村 明俊・市瀬 規善・久寿居 大・石川 開・鳥澤 健太郎・大竹 清敬(情報処理推進機構)
近年,情報技術者試験に応募する個人や法人が多様化しており,広報のターゲティングの見直しが必要である.特に,パンフレット配布や説明会開催は,精度の高いターゲティングが求められる.パンフレット配布や説明会開催は,法人を対象に行っており,応募者数が潜在的に多い法人を正確に推定する必要がある.従来,Web検索によってターゲット法人を選定していた.本論文では,Webデータに基づく質問応答システムを用いて情報処理技術者試験応募法人を推定する手法について提案する.本システムを3000社以上の法人について適用し実際の応募法人と評価したところ,Web検索によりも高い精度を得られた.今後,実際の広報活動に活用していく予定である. |
D-022 |
一日のトピック示す五七五:ソーシャルビッグデータを用いた一日の出来事を表す五七五の生成
◎金子 卓矢(東京都立大学)・横山 昌平(東京都立大学/国立情報学研究所/東京大学)
×
D-022一日のトピック示す五七五:ソーシャルビッグデータを用いた一日の出来事を表す五七五の生成
◎金子 卓矢(東京都立大学)・横山 昌平(東京都立大学/国立情報学研究所/東京大学)
SNSには毎日たくさんの投稿がされており,様々な出来事が発生する.多くの投稿の中から,重要な情報を一目で見つけるというのは難しい.例えば,新型コロナウイルス感染症は中国で感染者の第一例目が報告された後,世界的に流行した.そして,緊急事態宣言やオリンピックの開催延期,ワクチンなど日によって話題となるものは異なる.そこで,ある一日の重要なトピックをSNSから見つけ五七五にまとめることにより,一日の出来事を簡潔に知ることができ,かつ印象に残りやすくする.本研究ではTwitterの全量データを使用し,ツイートからコロナ禍における出来事を表す単語を見つけ出し,一日の特徴を示す五七五を生成した. |