【セッション概要】国立情報学研究所、情報処理学会、日本情報オリンピック委員会が2020年4月より共同で実施している情報科学の達人プログラムは、2023年度JST「次世代科学技術チャレンジプログラム」として新たなスタートを切った。高校生・高専生のトップ才能に対して世界最先端の情報学研究に触れてもらい早期に研究を開始する本企画では、プログラムの取り組みを紹介するとともに、4期生(第二段階修了)ならびに5期生(第一段階修了)の各受講生によるポスター形式の研究成果発表を行う。
【略歴】1988年 京大工学部情報工学科卒,1990同大学院 修士,1995同博士(社会人)了.博士(工学).1990~2004年 NTT研究所に勤務.2004年 北大情報科学研究科 助教授,2010年 同教授.2018年 京大情報学研究科 教授(現職).2009~2015年 JST ERATO湊離散構造処理系プロジェクト 研究総括.2012年 日本科学未来館「フカシギの数え方」展示監修.2020年より科研・学変(A)「アルゴリズム基盤」領域代表.2018~2019年および2021年より情報処理学会理事.2023年より「情報科学の達人」プログラム運営委員.情報処理学会フェロー,電子情報通信学会,IEEE 各シニア会員,人工知能学会,日本計算機統計学会 各会員.
【略歴】早稲田大学グローバルソフトウェアエンジニアリング研究所所長・教授、国立情報学研究所客員教授、株式会社エクスモーション 社外取締役、株式会社SI&C顧問、人間環境大学 顧問。IEEE Computer Society 2025 President。ISO/IEC/JTC1 SC7/WG20 Convenor。情報処理学会ソフトウェア工学研究会主査。IoT・AI・DXリカレント教育 スマートエスイー事業責任者。編著に『Guide to the Software Engineering Body of Knowledge (SWEBOK Guide), Version 4.0』『AIプロジェクトマネージャのための機械学習工学』『機械学習工学 (機械学習プロフェッショナルシリーズ)』ほか多数。
【講演概要】講演者は,現在,高校生・高専生のトップ才能(情報オリンピック経験者など)が,日本のトップ研究組織で研究遂行を行うJST 「情報科学の達人」と,大学院生,そして若手研究者対象のACT-X「数理・情報のフロンティア」の総括を行っている. 本講演では,本プログラムでの新たなる取り組み、4期生,5期生の受講生が行ったプログラムを紹介するを紹介するとともに,これらのプログラムを通して10年間でどのように数多くのトップ研究者を育成していくかの展望を講演する.
【略歴】1998年慶応大学理工学部卒,2001年慶応大学理工学研究科後記博士課程終了(理学博士).2003年東北大学情報科学研究科助手,2006年国立情報学研究所助教授,2009年より同教授,2019年より同副所長.現在ビッグデータ数理国際センター長,およびJST ACT-X「数理・情報のフロンティア」の総括.離散数学,アルゴリズム,理論計算機科学からAI,データマイニングの研究に従事.2008年度IBM科学賞,2012年度日本学術振興会賞,日本学士院学術奨励賞.SODA’13 Best paper、2021年Fulkerson Prize.JST GSC「情報科学の達人」コーディネータ
【講演概要】国際情報オリンピック (IOI) は,情報科学領域における国際科学オリンピックである.その目的は,中等教育段階の生徒が情報科学(コンピュータサイエンス)への興味関心を高めることや,各国から才能豊かな生徒を集め科学的経験や文化的経験を共有させることなどにある.情報オリンピック日本委員会では,中高生競技プログラマー日本一を決める日本情報オリンピック (JOI) の開催やIOI日本代表選手の選抜・派遣だけでなく,情報科学の普及啓発にも力を入れている.本講演では,JOI 女性部門・JOI 入門講座・国際情報科学コンテストビーバーチャレンジなどの普及活動や国際大会中の様子を含めて,情報オリンピック日本委員会の取り組みを紹介する.
【略歴】日本大学文理学部 教授.(一社)情報オリンピック日本委員会 専務理事.計算論的位相幾何学・複雑ネットワーク解析などの研究,および,情報科学の普及活動に従事.IPSJ MOOC(https://sites.google.com/a.ipsj.or.jp/mooc/)「コンピュータとプログラミング」の制作に携わる.
ポスター/研究紹介ビデオ: https://www.nii.ac.jp/tatsujin/2025/03/tatsujinposter_video.pdf
展示 番号 |
ポスタータイトル・応募者・概要 |
---|---|
#01 | 「Downfall等の攻撃に対するユーザ指定に基づいたプログラム保護手法」 |
一部のCPUにはDownfallやMDSなど、SMTを用いて同一物理コア上で同時に実行しているプログラムからデータが盗み取られるという脆弱性が存在する。これに対する緩和策としてSMTの無効化があるが、これは大幅なパフォーマンス低下を招く。また、Downfallに対してはマイクロコードアップデートが提供されているものの、適用により最大50%の性能低下が生じるという問題がある。そこで本研究では、ユーザがソースコード内の重要なデータを示す部分をマーキングし、コンパイル時にそのデータを使用する箇所の前後にOSへの命令を挿入する手法を提案する。実行時には、OSがこれらの命令を検出し、該当プログラムを他のプロセスから隔離することで安全性を確保する。本システムにより、ユーザによる簡単な操作のみで、SMTを無効化することなく脆弱性からプログラムを保護することを目指す。 | |
#02 | 「Louvain 法をベースとした拡張モジュラリティ最適化アルゴリズムの提案」 |
ネットワーク内の密接に結びついた部分グラフ(コミュニティ)を検出することは、近年、活発に研究されている重要なテーマの一つである。コミュニティの凝縮性を評価する指標や手法は多岐にわたるが、特に広く用いられている指標の一つにモジュラリティがある。従来のモジュラリティは、各頂点がちょうど一つのコミュニティに属することを前提としているが、これを拡張し、頂点が複数のコミュニティに属する場合にも適用可能な拡張モジュラリティという指標も提案されている。 モジュラリティおよび拡張モジュラリティの厳密な最大化はNP困難であり、効率的な近似解を求める手法として、貪欲法やスペクトル最適化などが提案されている。これらの手法では、計算量と解の質の間にトレードオフが存在するため、扱うグラフの規模に応じた適切なアルゴリズムの選択が求められる。 本研究では、モジュラリティおよび拡張モジュラリティの最適化を目的とし、焼きなまし法をベースとした手法を提案する。特に、頂点数が約10,000の大規模グラフに対して、既存手法と比較してより高い性能を発揮することを目指す。 | |
#03 | 「数式生成データを用いた環境音分類の事前学習」 |
従来の環境音分類タスクではAudioSetを始めとする大規模なデータセットを事前学習に用いていた。しかし大規模なデータセットの構築にはデータ収集やラベリングに必要なコストが大きく、プライバシー等の倫理的問題が発生する。数式ドリブン教師あり学習(Formula-Driven Supervised Learning)は、数式から自動生成したデータを用いて事前学習を行い、比較的少量の実データによる追加学習を行う枠組みであり、前述の問題を解決し、画像分野では従来手法に近い精度を達成している。本研究では環境音分類に数式ドリブン教師あり学習を適用させることを目標とした。1次元Perlin雑音を用いて5万サンプルの音響データを生成し、50クラスのPerlinWaveDB-50を構築した。また、畳み込みニューラルネットワークであるResNetで学習を行い、事前学習を行わない場合に比べて3,4ポイントの精度向上を達成した。 | |
#04 | 「多項式表現を用いたSETH還元の困難性の証明」 |
計算量理論において、問題の計算量の下界を示す手法の一つとして、計算量の下界が既に仮定されている別の問題への帰着が広く用いられている。その代表的な例として、SETHに基づく還元がある。しかし、一部の問題については、SETHを用いた適切な還元が困難であることが知られている。特に、ある問題が低次元の多項式で表現された場合、その問題の困難性をSETHに適切に伝えることが難しいことが先行研究において示されている。本発表では、このようにSETH還元の困難性を多項式表現を用いて議論し、既存の成果を踏まえつつ新しい視点を提供することを目標とする。 | |
#05 | 「共円ゲームの必勝判定」 |
一年目に引き続き、「共円ゲーム」と呼ばれる二人制ゲームの必勝判定問題がPSPACE完全であると証明することを目標に研究を行なった。 共円ゲームは碁盤上などで行われるゲームで、先手後手が交互に格子点に石を置いていくものだが、この時どの四つの石も「同一円周上」または「同一直線上」にあってはならないという制限がついている。最終的に石を置けなくなった方が負けであり、必勝判定問題では与えられた盤面から先手が勝つか判定することが目標である。 そもそもこのゲームは考案されてから日が浅く、ほとんど何も研究されていないに等しい。僕の一年目の研究では、このゲームにあるルールを追加し、そのルールを追加した共円ゲームの必勝判定問題がPSPACE完全であることを証明した。そこで今年の研究では、このルールをなくし、元の形での共円ゲームに関して問題を証明することを最終的なゴールとした。 | |
#06 | 「入力データ制約を利用したプログラムの空間的最適化」 |
さまざまな問題を解くプログラムに対し、入力されるデータサイズの上限が決まっているにもかかわらず競技プログラミングでは慣習的に64bit整数を使用し、メモリ使用量が過剰になる場合がある。そこで本研究では、標準入力からデータを受け取る予定の変数に制約を追加し、その制約に応じて整数型を最低限のビット幅まで縮小することによる最適化を試み、メモリ使用量に関する実験を行った。具体的には、まずC言語を基に、入力予定データの制約情報をコード中に追加できる言語(以下、制約付加可能C言語とする)を設計した。次に、制約付加可能C言語を中間言語であるLLVM IRに変換するコンパイラを作成し、制約付加可能C言語の構文解析時に制約情報をLLVM IRのMetadataに変換できるようにした。さらに、このMetadataを読み込んだ上で必要に応じてビット幅を64bitから32bitに縮小するLLVM Passを実装した。実験では、制約付加可能C言語のコードをLLVM IRコードに変換した後、Pass適用前後それぞれのLLVM IRコードから実行ファイルを生成・実行し、メモリ使用量を測定した。 | |
#07 | 「ZDDを用いたアイスバーンの自動生成」 |
アイスバーンは、格子状の盤面に制約を満たす線を書き込むペンシルパズルであり、その求解はNP完全である。 盤面は通常マスと、色のある特別なマスであるアイスバーンマスから成る。 本研究では、「おもしろい」アイスバーンパズル問題を自動生成する手法を提案する。 最初に、アイスバーンパズルを辺ラベル付きグラフに変換し、その求解をグラフ上の制約付きパス発見問題として定式化をした。 さらに、ZDD(Zero-suppressed Decision Diagram)を構成するフロンティア法を提案し、ZDD上のカウンティング・サンプリング演算を用いて「おもしろい」問題を生成する手法を提案する。 提案手法を実装し、問題の生成時間・生成した問題の評価を行った。実験の結果、提案手法が平均30秒程度で問題を生成できることを確認した。また、生成した問題をパズル投稿サイトに投稿し、評価を比較したところ、ランダム生成に比べて提案手法の評価が高いことも確認できた。 | |
#08 | 「Euphrasis: インタラクティブに音楽嗜好を言語化するシステム」 |
音楽の好みを言語化する行為は、個人の嗜好をより深く理解するとともに、音楽そのものへの理解を高める上でも有益である。一方、真に包摂的な言語化を実現するためには、好きな楽曲や音楽家の具体例に留まらず、それらに共通する音楽の側面や特徴、技術的な音楽知識への言及が必要であり、専門教育を受けていない多くの人にとって必ずしも容易ではない。近年、music captioning により音楽の特徴量を言語化する技術が確立されつつあるが、複数の楽曲から共通項や特筆すべき点を見出すモデルの研究はまだ限られている。そこで本研究は、入力された各音楽の music caption から適切な音楽用語を収集し、説明とともに提示することで個々の音楽体験と言語表現の溝を埋めるインタラクティブシステム「Euphrasis」を提案する。言語と音楽をつなぐ本システムを通して、音楽への理解の深化とより豊かな音楽表現の実現を目指す。 | |
#09 | 「全天球画像を用いた表情認識」 |
Facial Expression Recognition(FER)は、人間とコンピュータの自然な対話やドライバーの状態監視、AIを活用したサービスなど多岐にわたる応用が期待される重要な技術である。しかし既存の研究はほとんどが一般的なカメラで撮影された画像を対象としており、魚眼歪みに適応した大規模なデータセットはこれまで存在していなかった。そこで本研究では、魚眼カメラ向けのFERタスクに特化した大規模データセットとしてFisheyemoを提案する。Fisheyemoは、AffectNetに準拠した八つの感情をラベル付けした画像で構成されている。また比較対象として、同様の手法で作成したが魚眼歪みを含まないUndistorted-Fisheyemoも併せて作成、歪みが感情認識モデルに与える影響を評価できる環境を提供する。さらに本研究では、Fisheyemoを用いたベンチマーク実験に加え、魚眼画像の歪みに特化した畳み込みニューラルネットワーク(CNN)を組み込んだ新たなモデルを提案する。 | |
#10 | 「LLMを用いた機械翻訳の自動評価」 |
自然言語生成分野において大規模言語モデル(LLM)の飛躍的進展が見られるものの、自動評価システムは詳細な誤り注釈の欠如により、十分な評価が困難である。従来の手法であるG-EvalやPrometheusは、プロンプト設計や人手注釈データを活用しているが、評価の包括性には課題が残る。本稿では、機械翻訳における人間の評価フレームワークMulti-dimensional Quality Metrics (MQM)をLLMを応用し、複数のプロンプト設計を比較することで評価精度の向上を図る。LLMに誤りの詳細検出と直接採点を比べ、評価手法が一貫性および人間判断との整合性に与える影響を検証する。さらに、人間の評価傾向や、Few-shot Learningを導入することで、自動評価の妥当性と堅牢性の強化を目指す。 | |
#11 | 「Fine-tuningを用いたスクールカウンセリングchat botの提案」 |
本研究では、ChatGPT 4o miniにFine-tuningを行い、スクールカウンセリングに特化したChat Botを開発した。文部科学省のスクールカウンセリング活用事例を基に、日本語のデータセットを作成し、PEFTを用いた効率的なFine-tuningを実施。評価は未実施だが、LLMを用いた多角的な指標による評価を計画している。課題として、ユーザー実験の未実施や心理学的知識の不足が挙げられる。今後は実際のユーザーとの実験や人間のスクールカウンセラーとの比較を通じて、モデルの有効性を検証していく予定である。 | |
#12 | 「ZDDを用いたヘルゴルフの解列挙」 |
ヘルゴルフというグリッド上のパズルについて解きます。ZDDを用いて解の列挙を行います。C++で実際に実装して実行します。 | |
#13 | 「整数計画を用いた電動キックボードのポート配置最適化」 |
電動キックボードは、近距離移動に適した環境にやさしい乗り物として、近年注目を集めている。都市部には多くのポートが設置されているが、その配置は交通量や利用者の需要を十分に反映しておらず、利便性が低いという課題がある。この問題は、利用者が希望する場所での貸出・返却が難しい状況を生み出し、サービスの利用効率や満足度を低下させている。本研究では、この課題を解決するために数理モデルを用いたポート配置の最適化を行い、利便性の向上効果を検討する。利便性は「需要とポート配置による供給の一致度」として定義し、整数計画問題を用いてポート再配置問題を定式化する。また、実際の駅周辺ポート情報を基にデータを収集し、整数計画ソルバーに入力して解を求める。これにより、現在のポート配置からの利便性向上について評価を行う。 | |
#14 | 「4次元ルービックキューブの最短手数」 |
4 次元ルービックキューブとは、通常の 3×3×3 のルービックキューブを 4 次元空間に拡張したパズルである。本パズルは 3 次元の面に相当する「セル」が 8 つ存在し、それぞれのセルは立方体で 3 次元ルービックキューブのように回転可能である。操作の複雑さは 3 次元ルービックキューブを遥かに超え、すべての状態からの最短手数の上界を求めるのは困難である。 本研究では、まず 3 次元ルービックキューブの基本操作を置換とみなした「ルービックキューブ群」の概念を 4 次元に拡張する。これにより 4 次元ルービックキューブの状態の集合を πDD(permutation decision diagrams) を用いて表現し、すべての状態からの最短手数の上界を効率的に求める手法を提案する。 | |
#15 | 「大規模言語モデルの電子透かしにおける言語間の差異」 |
近年、ChatGPTなどを始めとする大規模言語モデルは前と比べ著しい進化を遂げている。その一方で、それが悪用されてしまう可能性があるという問題点がある。このような状況を改善するため、現在ではある文章が人間によって書かれたものかどうかを判断するための、事前にLLMの出力を調整する大規模言語モデルにおける電子透かしの技術についての議論が進んでいる。このポスターでは、大規模言語モデルにおける電子透かしの技術の一つについて、英語や日本語などのそれぞれの言語における出力された文章の質やある文章が人間によって書かれたものかを見誤ってしまう確率の差異を評価することを目標としている。 | |
#16 | 「抜き型により複数ピースを同時に動かすスライドパズル」 |
一般的な15パズルのようなスライドパズルでは、基本的に1つのピースが抜けており、その状態で上下左右に空いているスペースへピースを動かすことで、パズルを完成させる。 本研究では、ピースを抜く場所を型によって定め、四方向に傾ける操作を行い、抜いたピースを戻すといった操作を繰り返しながら、ゴールとなる絵へ導くスライドパズル問題を考える。 ビームサーチを用いることで、少ない手数で解を求めるアルゴリズムを提案する。 | |
#17 | 「生物模倣的自己注意機構を導入したスパイキングニューラル ネットワークによる神経動態予測モデルの提案」 |
ニューロンモデルに生物学的な自己注意機構を導入することで、スパイキングニューラルネットワーク(SNN)の神経動態予測精度を向上させると共に、より生物学的な挙動を再現することを目的としている。SNNの時間的情報処理能力にTransformer の強力な注意機構とイオンチャネル等の神経論的計算科学の理論を統合した新しいモデル(CSnT)を提案することで、現在76%の精度でのスパイク予測を達成している。 実際にモデルをシミュレーションして得られた神経活動には、興奮性シナプス後電位に見られる特徴である数ミリ程度の電位変動が見られること、不規則な振動パターンを再現できていることから神経活動の特性をつかめていると考えられる。 Loss及びAccuracy の変異について、SpikeのLossは0.0062、DVTのLossは0.0008とかなり収束が良いと考えられる。一方で、SpikeのAccuracyは76.69%と高くないことから、評価メトリクス及び損失関数の最高が必要である。 | |
#18 | 「多様な路上条件を考慮したサイクリングの周回ルートの探索」 |
自転車は、移動手段としてだけでなく、レジャー手段としても広く利用されており、それに伴い、サイクリングルートを提案するアプリケーションも普及している。 サイクリングの満足度は勾配や交通量などの路上条件に影響されるため、これらの条件はルート選択にあたって重要な要素となる。既存のアプリケーションではこれらの条件を考慮して、目的地までのルートを探索することが可能である。 また、健康増進や散策を目的とするサイクリングでは特定の目的地を設定せず、一定距離を走行して出発地点に戻る場合がある。このような需要に対応したアプリケーションでは、指定距離の周回ルートを探索できるが、そのアルゴリズムでは、路上条件のうち主に交通量と舗装状況のみを考慮している。 そこで本研究では、既存のアプリケーションでは十分に考慮されていない勾配などの多様な路上条件を取り入れた周回ルート探索アルゴリズムを提案し、OpenStreetMapの道路データを用いて実装することを試みる。 | |
#19 | 「動画生成AI Soraが生成するアーティファクトに関する研究」 |
近年、動画生成AIを用いたコンテンツ制作が普及しているが、生成過程で生じる様々な描画不具合(アーティファクト)が問題視されている。本研究では、Soraによって生成された動画におけるアーティファクトを分析し、動画品質向上と修正プロセスの効率化に貢献することを目的とする。 本研究は、10秒程度の動画に対して1秒あたり2フレームを抽出し、破綻・不備の有無をマルチラベル分類で学習・検知する。初期アノテーションと自動判定を反復的に行うことで、ラベル定義のブラッシュアップとモデル精度の向上を同時に進める仕組みを構築する。最終的には、Soraが生成する動画の品質評価や修正工程に役立つアーティファクト検出フレームワークを提案することを目指す。今回は、これらの手法を用いた初期分析の結果について報告する。 | |
#20 | 「LLMを活用した自律運用型動画メディアの開発」 |
動画プラットフォームの成長や縦型短編動画サイトの普及により、インターネットを介した動画メディアは広く利用されるようになった。しかし、動画の制作には依然として多くの労力が必要である。そこで、本研究ではLLMをはじめとする生成AIを活用し、動画の生成や内容の選定を自動化することで、自律的に運用できる動画メディアの開発を目指す。 | |
#21 | 「確率分布と情報量に基づく適応共鳴理論の拡張とModern Hopfield Networkへの適用」 |
Modern Hopfield Network(MHN)は、エネルギー最小化の観点からHopfield Networkを拡張することで、モデル構造を完全二部グラフ的な構造へ、パラメータの更新をTransformerのSelf-Attention的な仕組みへと変化させた学習モデルである。MHNは、feature neuronsとmemory neuronsと呼ばれる二種類のニューロンを持ち、前者は状態パターンを、後者は暗黙的なパターンのクラスタを表す。一方、適応共鳴理論(ART)は、脳の学習過程や記憶をモデル化した理論であり、入力パターンとカテゴリーのプロトタイプベクトルの類似度をもとに、カテゴリの更新と新たなカテゴリの形成を行う。本研究では、これまでL2距離やコサイン類似度などが使用されていたARTの類似度に対して、類似度と最大値の選択を確率分布と情報エントロピーに置き換え、カテゴリ数を可変ではなく固定長とし、使用率を表すパラメータを与えるといった拡張を実施した。この拡張したARTをMHNに適用し、単純なデータやMNISTでの検証をおこなった。 | |
#22 | 「強化学習による作曲生成AIの作成」 |
LSTMと強化学習を用いて、コード進行の得点表を学習させ、コードを生成するモデルを作成した。 従来の生成AIは学習に膨大なデータが必要であるが、本研究ではコード進行の得点表のみからコード進行を強化学習させることにより、生成AIの作成を試みた。 作成したモデルでは高得点に設定した同じコード進行のみが連続して生成されるようになってしまったため、これを防ぐためにエントロピー正則化を行うことで、生成AIとして意味のある多様性のあるコード進行が生成されるようになった。 この仕組みを用いれば、多大な学習データを必要とせず、アーティストの著作権を侵害することのない生成AIを作成することができるようになる可能性がある。 | |
#23 | 「Vision Language Navigationにおけるロバスト高速環境理解推論」 |
近年の進歩により、VLNエージェントは視覚情報と自然言語情報を統合して環境を認識し、指示されたタスクを実行する能力を大きく向上させている。しかし、依然として、リアルタイム性と多様な環境に対するロバスト性において、課題がある。本研究では、人間の神経科学的作用であるトップダウン処理に着目し、指示実行に必要な情報に絞って推論を行う手法を提案する。具体的には、セグメンテーションモデルとLLMを用いて、ナビゲーションタスクに関わる重要なクラス(例: 「ドア」、「階段」)を抽出し、抽出されたクラスの領域に対してのみ、シーン理解のためのVLMや深度推定を適応する。これにより、従来のシステムと比較してVLNエージェントに入力として渡す情報を、タスクを考慮した上で厳選でき、深度推定モデルやVLMが扱う情報量もできるため、より高速かつロバストなタスク実行ができる。これらの統合されたVLNシステムを実験し、既存手法に対する優位性を検証する。 | |
#24 | 「Minimum Cost b-flowのNetwork Simplex Algorithmによる実装と性能評価」 |
Minimum Cost b-flowとは、辺の容量制約と頂点の需要条件を満たすフローの中でコストが最小のものを見つける問題である。この問題に対する解法は複数知られているが、例えばFord-Fulkerson Algorithmを応用したSuccessive Shortest Path(SSP)というアルゴリズムがある。 本研究では、線形計画問題を解くSimplex Algorithmの特殊化であるNetwork Simplex Algorithmを実装し、いくつかの種類のインスタンスについてSSPとの性能を比較する。 | |
#25 | 「LLMを使ったソースコードの時間計算量の評価について」 |
ソースコードの時間計算量を評価するのは難しいタスクである。複数回の実行の際に結果を再利用するなどの手法により一見した計算量よりも改善させることができる場合がある。しかし、たとえばこの改善手法が上手くいっていない場合、想定と実際の実行時間に大きな差が生じる可能性がある。LLMなどを用いて自動で計算量の評価をすることができれば、より正確な実行時間予測と効率的なコード開発に貢献できると考えられる。 本研究では、プロンプトエンジニアリングなどを用いてLLMを用いた時間計算量の評価精度の向上を目指す。 | |
#26 | 「個人情報保護に向けた配信者の着座検知による自動配信終了システム」 |
近年、オンラインでの配信・会議が増加したことに伴い、意図せぬ映り込みや音声漏洩が問題となっている。例えば、配信者がオンライン配信の終了時に配信を切り忘れたために、私生活を晒してしまうことがある。そこで本研究では、オンラインでの配信や会議を行うユーザが椅子に座っているかどうかを検知し、離席時には自動的にマイクとカメラをオフにするシステムを提案する。ユーザの着座検知には薄型の感圧センサを用い、センサデータをマイクとカメラオフのコマンドに変換する。 | |
#27 | |
#28 | 「range minimum queryのretroactive化と応用例」 |
retroactiveデータ構造とは,処理対象となる操作列に変更が生じるときに,最終結果や途中結果を高速に取得できるようなデータ構造の総称である.queue,stack,deque,priority queueやUnionFindなどは,Demaineら (2007)によってretroactive化する方法が提案されている. 本研究では,retroactive priority queueを用いて,一点変更と区間minimum取得をretroactiveに処理できるデータ構造を設計し,応用例として区間 mex (minimum excluding value)クエリを高速に処理する方法を紹介する. | |
#29 | 「議論ファシリテーションに向けたLLMによるリアルタイム発言構造化と話題提案」 |
会議で議論が複雑化すると、話の関連性が不明瞭になり、脳が混乱して効率的な進行を阻害する要因となる。この問題は司会者の手腕に大きく依存し、高度な知識と経験が求められる。一方、大規模言語モデル(LLM)を活用すれば、リアルタイムでの議事録作成だけでなく、発言の要約や論点の整理も自動化できる。また、ファシリテーションを担うアクターとして発話を切り出し、論点を提示することで、平均を上回る議論促進が期待される。本研究では、LLMによるリアルタイムの発言内容の構造化と、要点・質疑の適切な提示機能を検討することで、会議の質と効率を高めることを目指す。これにより、議論内容が重複する局面でも、LLMが会話の筋道を整理し、より建設的な意見交換を促す役割を担うことが期待され、今後の会議支援技術の発展に寄与することが期待される。 | |
#30 | 「AtCoder Heuristic Contestにおけるsimulated anealingとsimulated temperingの比較について」 |
AtCoder Heuristic Contestにおける焼きなまし法(SA)とシミュレーテッドテンパリング(ST)の比較研究は、近年のAHC上位解法で利用頻度が増加しているSTに着目し、その有効性をSAと比較検証する。AHC過去問を題材に、SAとSTの実装を行い、パラメータ調整の容易性、計算時間、探索性能などの観点から比較分析を行う。特に、温度制御戦略の違いが探索性能に与える影響を詳細に分析し、STがSAよりも局所解からの脱出能力が高いことを示す。さらに、AHCにおける問題特性とSTの適合性について考察し、STが有効となる条件を明らかにする。最後に、本研究の知見に基づき、AHCにおけるさらなる探索アルゴリズムの発展に向けた展望を示す。 | |
#31 | 「情報量規準の理論と活用」 |
統計モデルを選択する過程において、モデルの選択の基準をどのように定めるかは重要な課題である。モデル選択の基準の指標として、 Akaike(1973) による AIC (赤池情報量規準) や Schwarz(1978) による BIC(ベイズ情報量規準)、それらを発展させた Watanabe(2009, 2013) による WAIC(広く使える情報量規準), WBIC(広く使えるベイズ情報量規準) などが知られており、さまざまな形で応用されている。本発表では、これらの情報量規準を考えるモチベーションについて触れたうえで、規準を適用することが適切な対象や活用方法について示す。 | |
#32 | 「習字学習アプリの開発」 |
この習字学習アプリは、ユーザーが筆と半紙で書いた作品を撮影し、アップロードすることでフィードバックを受けられるアプリである。私自身、小学一年生から十年以上習字を続けているが、上達に苦しんだ経験がある。特に、自分の作品のどこが悪いのかを客観的に評価し、改善するのは難しく、指導者の助けが必要であった。しかし近年、習字の教師が減少し、日本の伝統文化である習字を学ぶ機会が限られつつある。 そこで、本アプリの主な機能は、ユーザーが撮影した習字の画像をお手本と比較し、一致度をパーセンテージで表示することである。さらに、このアプリの最大の特徴は、機械学習を活用して、習字において重要な「とめ」「はね」「はらい」のフィードバックも行える点である。 | |
#33 | 「機械学習を用いた脆弱性の予測」 |
プログラムの脆弱性の検知を機械学習を使用して発見する手法には様々なものが存在するが、コードをそのまま自然言語処理でベクトル化してしまうものが多く、同じ脆弱性でもコードの書き方が変わってしまうと、検出できない問題がある。 今回の研究では、機械学習を使用して脆弱性を学習させ、コードの書き方が変わっても効果的に対応できるよう、ASTとTBCNNを使用して使用してコードの構造を読み取れるようなベクトルにし、より効果的に学習ができるのかを検証する。 | |
#34 | 「将棋の終盤の学習を効率化する実戦詰将棋生成システム」 |
アマチュア将棋において、終盤は最も重要な部分であるにもかかわらず、体系的な勉強法は確立されていない。その中でも、実際の対局で登場した局面を題材とした実戦詰将棋は終盤力を向上させる有効な手段の1つである。本研究では、棋譜のデータが豊富に存在し容易に入手できる点に着目し、棋譜から実戦詰将棋を自動生成し、難易度や戦型ごとに分類するシステムを作成した。その結果、1局あたり平均8.7秒で3.19問の実戦詰将棋を生成することができた。本システムを活用することで、個々の棋力や戦型、課題に応じた問題を効率的に解くことが可能となり、学習効率の向上が期待される。 | |
#35 | 「特殊ケースにおける2次元セグメント木とその応用」 |
2 次元セグメント木とは、2 次元配列上において長方形領域のモノイド積取得クエリに高速に答えるデータ構造である。 これに加えて長方形領域の更新も高速に行うデータ構造は、かなり制限された状況であっても実現不可能だと考えられている。 本研究では、更新の種類を限定した 2 次元セグメント木の高速化について検討する。 結果として、区間 mex (minimum excluding value) や区間種類数など、比較的 ad-hoc な区間クエリに応用可能な 2 次元セグメント木を提案する。 また、その実装と実行時間の計測を行う。 | |
#36 | 「人と植物のインタラクションを促進するための触覚インタフェースの開発」 |
本研究は、人と植物のインタラクションを促進する触覚インタフェースの開発を目的としている。従来の科学や哲学は人間中心的な視点から植物をモノや資源として扱う傾向にある。本研究では、植物の生命性を触覚を介して伝えることで共在感覚を喚起し、「自然は相対する存在ではなく、共同体である」という視点を提示する。提案する触覚インタフェースでは、植物の生体電位を解析し、その栄養状態を推定する。その結果と生体電位の波形の変化から、心臓の鼓動をメタファーとした触覚フィードバックを生成し、植物の生命感をユーザに伝達する。本システムを通じて、触覚インタフェースを通じた植物との触れ合いが人の心理に与える影響を考察し、より豊かな人と植物の共生関係の構築を目指す。 | |
#37 | 「Keystoneに対するRowHammerの攻撃可能性の評価」 |
Trusted Execution Environment(TEE)は、機密性・完全性・真正性などが保証された、信頼できるコード実行環境を提供する技術であり、クラウドコンピューティングやモバイルなどでの活用が広がっている。しかし近年、Spectreを利用した攻撃の成功などにより、ハードウェアの脆弱性がTEEの安全性に与える影響について、研究の必要性が明らかになっている。そこで本研究では、DRAMの著名な脆弱性であるRowHammerに注目し、RISC-VのTEEであるKeystoneの保護機能が回避可能か調査を行った。 TEEへRowHammerを行う試みは初めてではなく、SGX-Bombでも同様なことが行われている。しかしながら、SGX-BombがDoSを目標として、メモリの完全性保証のあるIntel SGXを対象としていることに対し、我々はTEEの保護機能の回避を目指し、メモリの完全性保証のないKeystoneを対象としている。 | |
#38 | 「Dynamic Time Warpingを用いたテニスにおけるプロのサーブフォームの分類」 |
テニスにおけるサーブの打ち方はプロの間でも様々であり、テニスプレイヤーが上達のためにプロのサーブを真似しようとする場合、自分に似たサーブフォームのプロを参考にする必要がある。そこで、プレイヤーが自分に似たサーブを打つプロを見つけるための前段階として、本研究ではテニスにおけるプロのサーブフォームを分類する手法を提案する。 具体的には、プロがサーブを打つ動画についてMeta社が発表しているビジョンモデル「Sapiens」を用いて骨格の推定を行い、その結果を用いてクラスタリングを行う。その際、動画同士でサーブのタイミングが異なることや、打ち方が似ていてもフォームの速さが異なる場合があることに注意する必要がある。そこでデータ間の距離を測る手法として時系列の速度や周期が異なっていても類似度を測定できるDynamic Time Warping(動的時間伸縮法)を用いることでより高精度なフォーム分類を目指す。 | |
#39 | 「Minecraftにおけるレイヤー分割・接続式経路探索の拡張A*アルゴリズム」 |
ゲームキャラクタやロボットの経路探索でA*アルゴリズム(Hart+ 1968)が普及し、2Dから3Dへの拡張も一般的になった(例えばVashisth+ 2024)。経路探索はもちろん複雑な動作の生成や人間らしい動作の評価にも展開しやすい環境としてMinecraftを選び、3D経路探索で一般的な標高や勾配をコストに導入したA*アルゴリズムを試してみた。しかし、実際の地形よりも起伏変化が激しくかつ離散的な世界のためにうまく機能しなかった。そこで、ユーザの位置から一定の標高範囲をレイヤーと呼び、その単位で部分的にA*アルゴリズムで経路探索した結果を繋げていく方法を考案した。レイヤーと地表との交線および飛び降り可能エリアを仮ゴールかつレイヤー同士の接続領域と定義し、仮ゴールを次のレイヤーの出発点として経路探索を続け、最終ゴールに達したところで逆にたどって経路が得られる。 | |
#40 | 「3次元物体の修復アルゴリズムを用いた金継ぎシュミレーションシステムの構築」 |
金継ぎとは、壊れた物体を金で継ぎより美しくする日本の伝統的な修復技法のひとつである。しかしながら、金継ぎは修復後の形が想像しにくいため、その良さが伝わらないという問題がある。本研究では、壊れた物体の修復後の形を3Dで生成する金継ぎシュミレーションシステムを提案する。壊れた物体から金継ぎで修復した形を3Dで生成するために、3D物体の修復アルゴリズムを応用する。この研究は、金継ぎを様々な物体を修復をすることに応用できる可能性がある。また様々な分野、例えば恐竜の骨の修復など人にしかできないとされているものへの応用も期待される。 今回の発表では、金継ぎシュミレーション問題と3D物体の修復アルゴリズム問題の違いを明らかにし、金継ぎに応用するための方法を説明する。 | |
#41 | 「性質検査の手法とその応用」 |
性質検査は主に巨大なデータを対象とした入力がある性質を満たすかどうかを判定する高速なアルゴリズムを設計する分野である. ここでデータは巨大なので, 入力の全てを参照せずに一部のみを検証に利用することで対数時間や定数時間でのアルゴリズムを設計することを考える. これは不可能であるが, 条件を緩和してまったく性質を満たしていないような入力と性質を満たしているものを高確率で区別できるアルゴリズムを設計することは可能であり, これは枝刈りやデータ自体にノイズが含まれる場合, そして何よりも膨大なデータを高速に処理することができ有用である. また, アルゴリズムの正当性の証明には性質を判定しやすいような形に言い換える必要が生じ, これはその性質自体の理解を深めることに他ならない. 今回は, さまざまな性質検査の手法とその応用を紹介し, そのシンプルなアルゴリズムとそれに対照的な背後に隠れる美しい構造について説明する. | |
#42 | 「Raspberry Pi AIカメラの脆弱性解析:誤作動・故障を狙う攻撃の可能性」 |
近年AIカメラの需要増加に伴い、エッジデバイスが取り付けられたカメラが増加している。カメラ側にもマイクロコンピュータや不揮発性メモリを搭載することでAIモデルの保存(読み込み時間の短縮)や親機の演算負担軽減を図ることができる。しかし、それらの機能に対するセキュリティの実装は遅れている。実社会でAIカメラの普及が進む中、脆弱性を理解しセキュリティを向上させる重要性は向上するため、本研究はSonyのimx500と呼ばれるAIカメラが搭載されたRaspberry Pi AIカメラを対象に脆弱性を解析する。 | |
#43 | 「より一般的な順序集合におけるDR劣モジュラ関数とその最大化」 |
劣モジュラ関数は限界効用逓減性を持つ集合関数であり、例としてはグラフカットや線形関数、被覆関数などがある。また、その最大化や最小化は機械学習にも応用がある。劣モジュラ関数の定義域はある集合の部分集合全体の集合だが、応用の際には目的関数の定義域が分配束やモジュラ束を成している場合を考えることも多い。このような場合でも劣モジュラ関数と同じような議論を可能にするためにDR劣モジュラ関数が定義された。 本研究ではより一般の順序集合におけるDR劣モジュラ関数を定義し、単調DR劣モジュラ関数の最大化問題において通常の劣モジュラ関数の場合と類似した結果を得ることを試みた。 | |
#44 | 「日本語におけるLLMの入力の事前翻訳による精度の変化」 |
多くの大規模言語モデル(LLM)は英語での学習データが他言語と比較して圧倒的に多く、英語での入力を用いた方が精度の高い結果が得られるとされている。そのため、日本語などの非英語言語での利用においては、入力を事前に英語に翻訳してから推論を行うことで、より精度の高い結果が得られると考えられている。 しかし、多言語対応モデルである「PaLM2」を用いた研究では、日本語を含む多くの言語では事前翻訳を行わない直接的な推論の方が精度が高くなったという結果が示されている。ただし、この研究では単一のモデル・少数のタスクでの実験に留まっており、単一言語に特化したモデルや広範の技能での知見は得られていない。 そこで本研究では日本語における入力の事前翻訳による精度の変化を、より多様なモデル・タスクを用いることでより網羅的に評価し、どのような場面に事前翻訳が有効であるのかを明確にすることを目指す。 | |
#45 | 「スコア時間減衰オリエンテーリング問題に対する焼きなまし法に基づく解法」 |
オリエンテーリング問題とは、訪れると獲得できるスコアが定められた複数の地点が与えられ、これらの地点を所定の移動コスト以内で巡る部分巡回路を求め、獲得できるスコアを最大化する最適化問題である。 本研究では、各地点で獲得できるスコアが時間減衰する、スコア時間減衰オリエンテーリング問題を考える。さらに、拠点となる地点が 1 つ設定されており、その拠点を出発して 1 つ以上の地点を巡回し、拠点に到着することで、この間に訪れた地点に関して拠点に到着した時点でのスコアを獲得できるものとする。なお、拠点を訪れる回数に制限はなく、1 つの地点からスコアを獲得できる回数は 1 回までとする。 この問題に対し、焼きなまし法に基づく解法を提案し、貪欲法などと比較してその性能を評価する。 | |
#46 | 「ライントレースにおけるカメラを用いたショートカット走行」 |
ライントレースとは、ロボットが床に描かれた曲線に沿って走行する技術であり、ロボット競技会の課題などで広く知られている。一般的には、カラーセンサーなどを用いて機体直下のライン情報を取得し、それに基づいて制御を行う。しかし、前方の状況を把握できれば、連続するカーブを含むような複雑なコースにおいて、ショートカットを活用することで効率的な走行が可能となる。本研究では、カメラを用いて前方のラインを検出し、リアルタイムにショートカット経路を計算しながら走行することで、より高速かつ効率的なライントレースの実現を目指す。 | |
#47 | 「ギター演奏動画からのTab譜自動生成手法の検討」 |
ギター演奏をコピーする際、五線譜よりも、どの弦のどのフレットを押さえるかまで具体的に示されたTab譜が一般的に利用される。しかし、ネット上の演奏動画などではTab譜が付されていないものが多く、自身でフレットや運指を一つ一つ確認して譜面に起こす作業は大変な負担となる。 本研究では、SegmentAnythingと線形判定技術を用い動画からギターのフレット位置を自動検出し、さらに機械学習ベースのハンドポーズ推定と組み合わせることで、フレット上の指の位置を特定する手法を提案する。さらに得られた映像情報と音響情報を組み合わせることで単なる画像解析では低下しがちな精度の問題を克服し、より正確なTab譜を生成することを目指す。実際に演奏動画を入力とした実験により、フレット検出精度や指運の認識精度、音声情報との同期精度を評価する。 | |
#48 | 「心拍変動と音楽キャプショニングを用いた感情ベースの音楽推薦システムの開発」 |
音楽は人の感情に大きな影響を与えるが、既存の音楽推薦システムは主にユーザーの視聴履歴や楽曲の特徴に基づいており、リアルタイムの心理状態を考慮するものは少ない。そこで、本研究では心拍変動(HRV)を用いた感情推定と音楽キャプショニング技術を組み合わせ、ユーザーのリアルタイムの心理状態に応じた音楽推薦を行うシステムを構築する。 本システムは以下の3つのステップで構成される。(1)心拍変動を解析し、ユーザーの感情をラベルAとして推定する。(2)音楽データセットにMusic Captioningを適用し、各楽曲に対するテキスト情報Bを生成する。(3)感情ラベルAと音楽キャプションBの意味的な距離を測定し、類似度の高い楽曲を推薦する。類似度計算には、大規模言語モデル(LLM)を用いる。 本研究では、心拍変動による感情推定の精度、および推薦された音楽の主観的評価をもとに、感情適応型音楽推薦手法のの有効性を検証する。 |