【セッション概要】国立情報学研究所,情報処理学会,日本情報オリンピック委員会が共同で2020年4月より実施している,高校生,高専生のトップ才能に対して,世界最先端の情報学研究に触れてもらい,早期に研究を開始する「情報科学の達人」プログラムは、2023年度よりJST「次世代科学技術チャレンジプログラム」として新たなスタートを切った。本企画では,本プログラムでの新たなる取り組み、4期生となる今年度の受講生が行ったプログラムを紹介するとともに,受講生によるポスター形式の研究成果発表を行う.
【略歴】1988年 京大工学部情報工学科卒,1990同大学院 修士,1995同博士(社会人)了.博士(工学).1990~2004年 NTT研究所に勤務.1997年 米国スタンフォード大 客員研究員(1年間).2004年 北大 情報科学研究科 助教授,2010年 同教授.2018年 京大 情報学研究科 教授(現職).2009~2015年 JST ERATO湊離散構造処理系プロジェクト 研究総括.2012年 日本科学未来館「フカシギの数え方」展示監修.2020年より科研・学術変革(A)「アルゴリズム基盤」領域代表.2017年より日本学術会議 連携会員.2018~2019年および2021年より情報処理学会 理事.2023年より「情報科学の達人」プログラム運営委員.情報処理学会,電子情報通信学会,IEEE 各シニア会員,人工知能学会,日本計算機統計学会 各会員.
【講演概要】講演者は,現在,高校生・高専生のトップ才能(情報オリンピック経験者など)が,日本のトップ研究組織で研究遂行を行うJST GSC「情報科学の達人」と,大学院生,そして若手研究者対象のACT-X「数理・情報のフロンティア」の総括を行っている. 本講演では,本プログラムでの新たなる取り組み、4期生となる今年度の受講生が行ったプログラムを紹介するを紹介するとともに,これらのプログラムを通して10年間でどのように数多くのトップ研究者を育成していくかの展望を講演する.
【略歴】1998年慶応大学理工学部卒,2001年慶応大学理工学研究科後記博士課程終了(理学博士).2003年東北大学情報科学研究科助手,2006年国立情報学研究所助教授,2009年より同教授,2019年より同副所長.現在ビッグデータ数理国際センター長,およびJST ACT-X「数理・情報のフロンティア」の総括.離散数学,アルゴリズム,理論計算機科学からAI,データマイニングの研究に従事.2008年度IBM科学賞,2012年度日本学術振興会賞,日本学士院学術奨励賞.SODA’13 Best paper、2021年Fulkerson Prize.JST GSC「情報科学の達人」コーディネータ
【講演概要】国際情報オリンピック (IOI) は,情報科学領域における国際科学オリンピックである.その目的は,中等教育段階の生徒が情報科学(コンピュータサイエンス)への興味関心を高めることや,各国から才能豊かな生徒を集め科学的経験や文化的経験を共有させることなどにある.情報オリンピック日本委員会では,中高生競技プログラマー日本一を決める日本情報オリンピック (JOI) の開催やIOI日本代表選手の選抜・派遣だけでなく,情報科学の普及啓発にも力を入れている.本講演では,JOI 女性部門・JOI 入門講座・国際情報科学コンテストビーバーチャレンジなどの普及活動を含めて,情報オリンピック日本委員会の取り組みを紹介する.
【略歴】1994年早稲田大学大学院理工学研究科博士後期課程単位取得退学,1996年 博士(理学)(早稲田大学).2005年より日本大学文理学部教授.計算論的位相幾何学,グラフアルゴリズム,複雑ネットワーク解析などの研究,及び,情報科学教育の普及活動に従事.2005年より情報オリンピック日本委員会理事,2006年〜2010年 国際情報オリンピック日本選手団団長,2015年〜2019年 国際情報オリンピック国際委員.
ポスター発表実施要領 https://u.kyoto-u.jp/tatsujin-86taikai-poster-jisshi
展示 番号 |
ポスタータイトル・応募者・概要 |
---|---|
#01 | 「バイナリ実行ファイルに基づく脆弱性検出手法」 |
プログラムに含まれる脆弱性をソースコード中から検出する手法は数多く提案されてきたが、実際にはソースコードが知的価値やセキュリティの観点から非公開にされ、入手できない場合も多い。 そこで本研究では、ソースコードによらず、プログラムのバイナリ実行ファイルから脆弱性を検出する手法を提案する。 具体的には、脆弱性を含むプログラムのバイナリ実行ファイルからなるデータセットを構築し、自然言語処理の機械学習手法にならってバイナリ実行ファイルからプログラム中の脆弱性を検出する機械学習モデルを訓練する。モデルの学習後、機械学習のパフォーマンスの可視化により得られるフィードバックを通してソースコード中での脆弱性が含まれる関数とバイナリ中での位置の対応を特定することで、データセットの改良、モデルの再学習を行い、モデルの脆弱性検出精度の向上を図る。 | |
#02 | 「時間帯に応じた集中度`の違いを考慮した学習プラン提案ツールの作成」 |
自主学習において学習スケジュールを立てることは重要なプロセスであるが、苦手と認識している中高生は多い。本研究では個人が自主学習においてより高い集中度を保ちながら勉強を進められるような学習プランを提案するツールを作成した。プラン作成の際に特徴量として考慮に入れたのは先行研究で集中力と関係があることが明らかになっている睡眠時間だけでなく、集中力と勉強時間、勉強科目の相関関係であり、ここに注目したのが本研究の最大の特徴である。コードの実装は機械学習のscikit-learnをメインに行い、実際に3人の高校生に利用してもらった。短期間での集中力の向上は限定的だったものの勉強におけるモチベーションの向上や成績の向上といった成果が得られたほか、長期的な実験により成績向上が見られた例もあった。さらに改善を進め、より予測値の誤差が少なくなるように考慮する時間の幅や指定できる時間幅の調整を行った。 | |
#03 | 「Mitigating Hallucination of Language Models without References by Uncertainty Estimation and Rule-based Analysis」 |
Hallucinationは質問応答タスクで誤った回答を生成するLarge Language Model(LLM) の現象である。LLMは自然言語推論、要約、質問応答といったタスクで高い性能を持ち、教育や行政サービス、マスコミュニケーションなどでも活用が進められている。Hallucinationはこういったシステムの信頼性を損ねかねない。Hallucinationの抑制手法として、文章生成時に適宜、外部資料を読み込ませるRetrieval-Augmented Generation(RAG)があるが、抑制には外部資料に強く依存するため、網羅性、安定性に欠ける。 本研究では、生成時のLLMの内部の振る舞い、生成された文章の特徴から、文章がどれくらい正確であるかの信頼性(不確実性)を計算する。不確実性が高い文章は、該当する文章を抽象化することによって、誤った回答生成を避けることを目指す。 | |
#04 | 「単眼全天球カメラ画像を用いた人物感情識別に関するー検討」 |
単眼カメラで撮影された画像を用いてそこに写った人物の感情を推定することには、人間の感情を理解可能なロボットの開発や車のドライバーの状態管理など多くのアプリケーションへの活用が期待できる。これまで、画像に映り込んだ人物の感情認識を行う研究として、画像から抽出した顔のランドマークを手がかりとするものや、深層機械学習を活用するものが多く提案されてきた。しかしながら、これらの手法は一般的なカメラで撮影された画像を入力とすることが多く、より広範囲に位置する人物の感情を推定することには適していない。そこで提案手法では、より広い画角での撮影を可能とする魚眼レンズで撮影された全天球画像を用いる。このようなタスクの大規模データセットが存在しないことから、本研究では既存の人物感情認識データセットを活用した、画像合成による新規データセットの構築も試みる。本発表では、提案手法の実装に関する初期検討結果を報告する。 | |
#05 | 「Mastering Tableturf Deckbuilding combined with Player Enhancement」 |
ゲームの一分野として、プレイヤーが実際に対戦する前に、持っているカードの中から一部のカードを選びデッキを構築する Collectible Card Cames (CCG) がある。これまでの論文で提案されたデッキ構築手法では、プレイヤーアルゴリズムと相手のデッキとを固定した下でデッキを生成するため、デッキの強さが不十分である可能性がある。 そこで本研究では、CCGの一種である『陣取大戦ナワバトラー』を取り上げ、デッキとプレイヤーアルゴリズムとを交互に強化していく手法を提案し、既存の手法とデッキの強さを比較して、提案手法の有効性を検証する。 | |
#06 | 「XなどのSNSにおけるデマの真偽判定と拡散防止のためのラッパーUI」 |
令和5年奥能登地震の際、X(旧Twitter)などのSNS上では様々なデマが発信・拡散された。デマの拡散は、災害などの緊急時においてユーザが真実の情報に到達できる確率を低下させる危険性がある。そこで本研究では、複数の緊急事態のうち特に地震を対象として、発信されたデマと思われる情報の真偽判定を行い、さらにデマだと判定された情報を非表示にするXのラッパーUIを実現する。ユーザは、提案UIを使う限りデマと思われる情報を観測することがなくなるため、結果的にデマの拡散を防止できると考えられる。本発表ではUIの実装と評価について述べる。 | |
#07 | 「安全な生成言語ステガノグラフィにおける曖昧さ回避」 |
生成言語ステガノグラフィとは, 大規模言語モデルを用いた生成ベースのステガノグラフィ技術である. 近年のニューラル言語モデルの進歩により, より現実的な文章を生成することが可能となりセキュリティ安全性が高まっている. 既存の手法では言語モデルによって与えられた確率に着目して文章を生成することで生成する文章の分布と言語モデルの分布の差を小さくしてセキュリティを保持できるようになった. しかし, 情報を埋め込む時に確率のみに着目して文章を生成しているため, 日本語のような文章の分割が曖昧である言語において, 復元時に文章のトークン列への分解が一意に定まらない場合が存在し, 可逆性が保証できない問題を抱えている. 本研究では言語モデルによって与えられた確率とトークンのテキストに従って, トークンの候補を絞り込み, 適応的及び動的にグループ化して生成していく手法を提案する. この手法により生成した文章の分布と言語モデルの分布の差を抑えながら, 日本語のような言語における分割の曖昧さを回避することが可能となる. | |
#08 | 「ニューラルネットワークを用いたクラシック音楽における和声分析の半自動化」 |
和声分析は和音の進行を分析し楽曲の構成や音の役割を理解する楽曲分析の一環であり、クラシック音楽家にとっては音楽の句読点であるフレーズの区切りを明確にしたりメロディーの動きや抑揚をより深く理解したりするための重要なツールである。近年、機械学習の発展とともに和声分析の自動化が研究されてきたが、和声分析には個人間による解釈のゆれやデータセットの不足等といった根本的な問題があり、高精度な和声分析モデルに対する期待値は機械学習のその他の応用先と比べても低い。そこで本研究では、基礎的で解釈のゆれが起こりにくい部分の分析はニューラルネットワークモデルが自動で行い、複雑な部分はユーザ自身がモデルの提案を受けながら分析するインタラクティブな和声分析手法を提案する。今まですべて手動で行われてきた和声分析を半自動化することによって、データセットの整備や和声分析のとっつきにくさ改善に貢献できると考えられる。 | |
#09 | 「学習時の行動に内部報酬に基づく方策を適用した強化学習手法」 |
強化学習において効率的な学習を行うための重要な要素の一つとして、効果的な経験収集を行うことがある。これを達成するために、Badiaらによる手法NeverGiveUp(NGU)では学習時に行動後の状態がエピソード内と学習全体それぞれでどれほど新鮮かを示す値に基づいた内部報酬を使用して学習を行った。 本研究ではある状態に対する内部報酬がエージェントの行動の有無によらず計算可能であることを利用し、学習時の行動前に現在の状態に対する内部報酬を計算、それによってエージェントの行動方策を変化させた。より具体的には、現在の状態が一つのエピソード内で複数回繰り返されたものである場合にはよりランダムに行動する一方で、学習全体において繰り返されている状態であるほどその効果を下げた。この手法により、NGUの後続手法であるAgent57と比較してAtari57のいくつかのゲームで性能の向上が認められた。 | |
#10 | 「ZDDによるアイスバーンの解列挙」 |
アイスバーンとは、格子状の盤面上で始点から終点までを制約を満たすように移動するパズルであり、その求解はNP完全である。盤面にはいくつかの矢印が配置されており、解は各矢印をその向きに従って通過しなければならない。さらに、盤面にはいくつかの氷があり、縦横に隣接している氷は一つの氷として扱われる。解は各氷に入ることが必要であり、氷に入るとその氷を出るまで曲がることはできない。また、交差は氷上でのみ行うことができる。 本研究ではアイスバーンを格子グラフ上の制約付きパス列挙問題として定式化し、その解を効率的に列挙するアルゴリズムを提案する。提案手法はstパスに対するフロンティア法に上記の制約を追加することでアイスバーンの解集合を表現するZDDを構築する。 | |
#11 | 「人物動画を結合する手法の検討」 |
近年、スマートフォンに搭載するカメラの性能の向上やSNSの普及によって、動画編集を行うユーザ数も増加している。その多くが家族や友人などの人物を写した動画である。動画編集を行う上では、素材となる映像を撮影などにより準備する必要があるが、一般ユーザが長時間にわたり1カットで高品質な動画を撮影できるとは限らない。そのため、短い素材を繋ぎ合わせて1つの動画を作成することには大きなニーズがある。しかし、動画中に人物などの動きのある物体が写り込んでいる場合には、単純に動画を結合すると時系列的な不整合が生じ、違和感のある動画が生成されてしまう。そこで本研究では、より違和感なく人物動画を結合する手法を提案する。具体的には、動画中の人物姿勢を抽出し、姿勢の状態で違和感なく2つの動画を結合させてから、人物領域および背景領域を合成する。本発表ではその初期検討結果を報告する。 | |
#12 | 「重ね切り絵の制作支援ソフトウェアの開発」 |
重ね切り絵は複数の切り絵を組み合わせて作る切り絵作品の一形態であり、クリエイターが作品を実際に切り絵を作成するまで、色の組み合わせや遠近感が不自然になる可能性が大きい。本研究では、画像処理を用いてユーザーがアップロードした画像をユーザー自身が輪郭に沿って自由に切り分け、それぞれに対して白黒の切り絵の型紙にし、自由に色を変えてそれぞれの型紙を重ね合わせることで、web上で重ね切り絵の完成図のシミュレーションができる制作支援ソフトウェアの構築を目指す。 これにより、クリエイターは実際の制作前に色や配置を確認し、不自然な部分を事前に修正することが可能となる。 | |
#13 | 「共円ゲームの必勝判定」 |
今回, 「共円ゲームの必勝判定」ということで, 共円ゲームという二人ゲームの必勝判定がどのような計算量クラスに属するか特定する研究を行った. 共円ゲームは一般的にオセロなどの盤面上で行われ, 先手後手が交互に格子点上に石を置いていく. このとき, どの4個の石も「同一円周上」または「同一直線上」にあってはならない. 先に石を置けなくなった方が負けである. このゲームは2005年の日本数学オリンピック代表選考合宿で考案された新しいもので, 数学的な面から研究は多少されてきたが, 情報科学の面から研究はされてこなかった. そこで, このゲームの性質をゲーム理論の視点から観察するのが今回の目的である. 具体的には, PSPACE完全な問題からの帰着を目標とし, そのために共円に関する幾何的な考察を行った. 比較的初等的な幾何学を用いている点で, 一般のゲーム理論に関するとは異なる面白いものになっていると思う. | |
#14 | 「Sumpleteの解列挙」 |
Sumpleteとは、数字が書かれたn次正方行列が与えられ、「各列・各行において、選んだ数字の総和が指定された数字に一致する」という制約を満たすように、いくつかの成分を選ぶパズルゲームである。これは、「総和が指定された数字に一致するように、n個の数字からいくつかの数字を選ぶ」という部分和問題の、二次元への拡張であると捉えることができる。 本研究では、Sumpleteの効率的な解列挙手法を提案する。 Sumpleteの問題は、各成分を選ぶかどうか、2^(n^2)の場合を全探索することで解くことができるが、nが大きくなるにつれて、組み合わせの数は爆発的に増加していく。そこでSumpleteを、各行・列に関する2n個の部分和問題について、それぞれの解が与えられたとき、その解を矛盾なく組み合わせる問題として定式化した。これをもとに、制約に矛盾が起きていないかを検証しながら枝刈り探索を行うアルゴリズムを考案した。また、考案手法を全探索アルゴリズムと比較して、その効率性を確認した。 | |
#15 | 「詭弁検出システムの提案」 |
詭弁とは、故意に行われる虚偽の議論や、外見をもっともらしく見せた虚偽の論法のことを指す。議論等で詭弁が使用されることで、話が議題の本質から外れてしまったり、誤った結論に達してしまう恐れがある。そこで、論証に対し、社会心理学によって分類された論理的誤謬に当てはまるかを検証するシステムの提案を行う。具体的には、文章とそれに該当する論理的誤謬をラベリングしたコーパスを作成し、自然言語処理モデルや機械学習の分類モデルを構築する。自然言語処理モデルにはBertを採用する。 | |
#16 | 「k分木のSegment Treeにおける定数倍」 |
Segment Treeは区間に対する情報を高速に取得・更新できるデータ構造である。現在、競技プログラミングに用いられるSegment Treeは基本的に二分木だが、本当に二分木のSegment Treeが最適なのか、k分木のSegment Treeが見る頂点数を計算して検証した。 | |
#17 | 「英語の音変化を認識するリスニング補助システムの作成」 |
日本には多くの英語学習者が存在する。しかし日本の英語学習者の中には英文を読むことはできるが聞くことができないという人が多く存在しており、その理由の一つに英語における音声変化を知らないことがあげられる。音声変化とは英文を読むときに単語の発音が変化することで、連続する単語の音がつながる「連結」、連続する単語の音がくっついて別の音に変わる「同化」、連続する単語の一部が発音されなくなる「脱落」、単語の発音が弱くなる「弱形」などがある。これらの音声変化の知識がないと単語の発音自体は知っていても実際の英文は聞き取れないということが起こる。そこで本研究では英語の音声から上で挙げた4つの音声変化を認識して英語学習者に英文中のどの単語でどのような音声変化が起こっているかを知らせるシステムを提案する。提案システムを使うことで英語学習者は音声変化を意識して、より効率的にリスニングの学習を進められることが期待できる。 | |
#18 | 「オンライン二部マッチング問題における Replacement 回数の評価」 |
予め与えられたサーバーに対してクライアントが順番に到着するとき、サーバーとクライアントのマッチングを維持しつつサーバーの再割り当て回数を減らす問題を考える。これは二部グラフのオンラインマッチングにおいて replacement 回数を減らす問題として定式化することができる。 アルゴリズムに対する replacement 回数の評価は難しいが、 Server Flow という概念を導入することで、単純な貪欲アルゴリズムが O(N log^2 N) の上界を達成することが示されている。本研究ではこの概念を利用して、整数性に着目することで解析結果を改善した。また、実応用における割り当ては単純なグラフのマッチングとは限らずいくつかの拡張モデルが考えられるが、それらにおける同様の問題においても検討する。 | |
#19 | 「MuseCocoによるインタラクティブな音楽生成に向けた検討」 |
入力された文字列から条件を解釈し、それに基づいた音楽を生成する機械学習モデルであるMuseCocoがMicrosoft社から発表されている。これにより作曲作業が大幅に短縮されることが期待されている一方で、文字列で指定したジャンルがうまく生成結果に反映されない場合が多々ある。例えば、electronicジャンルを指定したのにもかかわらず明らかにクラシカルなピアノ楽曲が生成されるなどといった事例が発生している。これは公開されているフリーMIDI素材におけるクラシック音楽の潤沢さ、そして一部ジャンル(electronic, jazzなど)の圧倒的な枯渇が主な原因であると推測できる。そこで本研究では、入力されたジャンルをより正確に生成楽曲に反映させるモデルを検討する。 | |
#20 | 「cut-pair の利用によるペンシルパズルソルバの高速化」 |
橋のない連結な無向グラフに対して、ある辺の組が cut-pair であるとは、その二辺を取り除くとグラフが非連結になることを言う。 cut-pair 自体は多く存在する可能性があるが、全ての辺に対しその辺を含む cut-pair が存在するかを判定する問題は線形時間で解けることが知られている。 また、ペンシルパズルと呼ばれる種々のパズルでは、与えられた条件を満たすようにマス目に線を引いたり、塗りつぶしたりする。ペンシルパズルの中には NP 完全性が証明されているなど、解くのが難しいものもある。それらにおいては、小さい盤面の問題を解く手段として、充足可能性問題として定式化する方法が取られる。また、マスを頂点とみなし、隣接するマス間に辺を張ることで、グラフ理論の問題として考えることもできる。 本研究では、 cut-pair の辺はハミルトン閉路に必ず含まれることを利用し、ペンシルパズルソルバの高速化を図る。 | |
#21 | 「部首及び偏旁冠脚を用いた未知語の予測」 |
これまでにword2vec、BERTやMLMなど様々な手法が存在しているがそれらの殆どは英語での文法などを元にしている。そのため手法をそのまま日本語などの他言語に適用するのではなく、それぞれの言語に応じて少し工夫を加えたほうが性能が向上するのではと考えた。とくに日本語や中国語などの言語の漢字のような一部の文字には、一文字またはそれらの部分のみで意味を表すものがある。そこで本研究では、日本語MLMでのsub-wordの分割単位を単語単位ではなく部首及び偏旁冠脚を分割単位として学習を行うことでマスクされた部分が未知語であっても予測することができるかということについて調べる。具体的には、先にあげた分割単位でトークンを作成し、マスクされた単語に含まれるトークンを、配列や行列を用いて表現したものを予測する。そして、ボキャブラリにない難読漢字等の漢字熟語について正しく予測できるかどうかを調べる。 | |
#22 | 「数式ドリブン教師あり学習を用いた音声分類タスクの事前学習」 |
数式ドリブン教師あり学習(FDSL:Fomula-Driven Supervised Learning)は、数式で自動生成した画像で事前学習を行うことで、比較的少ない量の実画像データでのfine-tuningでも、従来手法に近い精度を出すことができる手法である。この手法では、実画像を集めたりラベリングすることのコストや、倫理的問題などを解決することができる。本研究では、数式ドリブン教師あり学習を音声分類に適用させることを目的とする。1次元のPerin Noiseを用いて5秒の音声データを自動生成し、50カテゴリ1000データのPerlin1dDBを作成した。Perlin1dDBを用いた事前学習では、CQT(Constant-Q transform)などの前処理を行った。環境音分類タスクとして、ESC-50とUrbanSound8K DatasetをMel-Spectrogramの前処理を行ったものを用いてfine-tuningを行った。 | |
#23 | 「LLMを用いたトランスパイラの正確性向上と、その評価について」 |
トランスパイラの実装には専門的な知識や相応の時間が必要で、コストがかかる。そこでLLMを用いればこのコストを削減できると予測した。ただし現時点ではLLMはトランスパイルの正確性が比較的低いため、その正確性を向上させる手法と正確性の定量的な評価が必要と考えた。 本研究では、LLMを用いたトランスパイラをPythonで実装し、その正確性向上が期待できる手法の実験を行った。 実験では、翻訳前後の2言語間に擬似プログラミング言語を挟む手法や、Examplesの数を変化させながらFew-shot Learningを行う手法を調べた。さらに、それぞれの手法がもたらす効果について、競技プログラミングのジャッジシステムを応用した定量的方法で評価した。 また、この結果からFew-shot Learningはトランスパイル時最適化にも応用できるのではないかと予測される。 | |
#24 | 「Liquid Time-Constant Networks を用いた乱流シミュレーション」 |
乱流とは、流体力学において、粘性力の影響が小さく、慣性力の影響が大きいときに発生する、不規則な変動をする流れのことである。また、流体の運動を記述するナビエストークス方程式は非線形項を含んでおり、一般解が見つかっていないことも知られている。乱流シミュレーションに対しては幾つかの手法が考案されてきたが、計算コストと精度のトレードオフが問題となっていた。近年は機械学習を用いた手法でトレードオフを解決しようとしている研究も増えている。 本研究では時系列データに対して少ないニューロン数で精度のよい予測をするとされる Liquid Time-Constant Networks を用いることで、乱流モデルである二次元のコルモゴロフ流に対してより軽量にシミュレートすることを試みた。 | |
#25 | 「性格類型を用いた相談特化型Chatbotの提案」 |
既存のChatbotは相談に特化されているものが少なく、ユーザーの性格に基づいた相談などといったカウンセリングのような内容では対話することが難しいものが多い。そこで、性格類型と呼ばれる性格や人格などをいくつかの典型的な類型に分類する心理学を用いたChatbotの提案・開発を行う。 エニアグラムという性格類型を用いて、エニアグラムの理論「統合(精神的に標準の状態より健全であること)」「退後(精神的に標準の状態より不健全であること)」という概念を利用して各タイプのユーザーにはどのようなタイプのカウンセラーが合っていて、どのようなタイプが行う解決策がユーザーを健全な方向に導けるのかということを判断した。 ChatbotはOpenAI社のGPT-3を用い、カウンセラーにユーザーのエニアグラムタイプの退後先であるタイプの人格を設定し具体的に提示する解決策としてユーザーのエニアグラムタイプの統合先であるタイプが行いやすい行動を設定した。 | |
#26 | 「修学旅行の自由行動における経路最適化問題」 |
修学旅行は、学校外に旅行してその土地の自然や文化に触れ、人間関係や集団行動、公衆道徳などについて経験を通じて学ぶ学校行事である。その中でも自由行動は、生徒自身が目的地や経路、移動手段を計画することで、自主性や計画性、他者との協調を学ぶものである。一般的に自由行動は複数の生徒から成るグループ毎に行動しなければならないので、グループの全員が満足しつつ、時間や費用の制約を満たすように旅行計画を立てることは難しい。 そこでこの研究では修学旅行の自由行動における経路の計画を組合せ最適化問題として定式化し、旅行計画支援システムを作成することを目標とする。 組合せ最適化問題の目的関数としてグループ全体の満足度を表す指標を導入し、制約として経路の所要時間と費用が決められた値以下であるかを導入した。またこの組合せ最適化問題に対する枝刈り探索手法を実装し、人工的な旅行計画問題に適用することで、定式化の妥当性を検証した。 | |
#27 | 「碁石拾いの解列挙」 |
碁石拾いとは江戸時代以前から遊ばれている碁石を用いたパズルゲームであり、碁盤上に配置された碁石を縦横に移動しながらすべて拾うことを目的とする。ただし、碁石を拾う際は碁石のない目で曲がることはできず、また碁石を飛び越えて進んだり、碁石を取ったときに元の方向に戻ったりすることは許されない。碁石拾いの解の候補数は配置されている碁石の数に対して指数的に増加し、碁石拾いの求解はNP困難であることが知られている。 本研究では、碁石拾いを拾う石の順番を決定する制約充足問題として定式化し、碁石拾いの盤面を双方向ポインタ行列によって表現することで、高速な枝刈り探索を実現した。また提案手法を実際の碁石拾いパズルに適用することで、その有用性を確認した。 | |
#28 | 「Union-Findデータ構造とその応用について」 |
Union-Findは互いに素な集合を効率的に管理する、よく知られたデータ構造である。具体的にはn個の要素がそれぞればらばらの集合を成す状態から始めて、次の2種類で構成される、長さmの操作列を効率的に処理する。 findset(v): vが属する集合を表す代表元を返す。 unite(v,u): vが属する集合とuが属する集合を破棄し、新たな集合としてそれらの和集合を追加する。 これは適切に実装することでO((m+n)α(n))の計算量が達成できることが知られている。ここでα(n)はアッカーマン関数の逆関数を表す。 また、特殊な状況下においては、より高速な手法も知られている。 このようなデータ構造であるUnion-Findについて、研究内容を発表する。 | |
#29 | 「1型及び2型2色覚のためのリアルタイムでの視認性改善手法」 |
3色覚者には弁別が容易な色の組でも、2色覚者にとっては弁別が困難であり視認性が著しく低くなる場合がある。 色覚バリアフリーの実現のため、画像が持つ印象を損ねることなく、2色覚者にとっても見やすい画像へと変換する手法がいくつか提案されている。これらは主に、画像の色相を調節する手法、明度を調節する手法に分けられる。 今回は1型及び2型2色覚に焦点を当て、画像のリアルタイムでの視認性改善を目標とした。色が持つ印象を維持するため、主に明度の調節を行う。 | |
#30 | 「Downfallの効率的な緩和手法」 |
Downfallとは、特定のIntel CPUに存在する、Gather命令の投機的実行中にレジスタの中身を盗むことができてしまうという脆弱性である。緩和策としてマイクロコードアップデートがリリースされているが、これを適用すると最大50%のパフォーマンス低下を引き起こす可能性があることや、慣れていないユーザには適用が難しい場合があるという問題がある。そこで本研究では、このアップデートを適用しなくてもDownfallを緩和できる新しい手法を提案する。Downfallはマイクロコードアップデートの他にもハイパースレッディングを無効化することで回避できるが、これを無効化すると大きなパフォーマンスの低下を引き起こしてしまう。そこで、被攻撃者と攻撃者がプログラムを実行する論理プロセッサをそれぞれ異なる物理コアのものにすることで、パフォーマンス低下を防ぎつつDownfallを回避することができることを示す。 | |
#31 | 「一般化三並べにおける畳敷き戦略を用いた負け型動物の探索」 |
一般化三並べは無限に広い格子状の盤面上に2人のプレイヤーが交互に石を打ち、先に目標の石の配置(動物)を構成したプレイヤーが勝者となるゲームである。動物は連続した石の配置(ポリオミノ)で定義され、その石の数を細胞数と呼ぶ。また元の動物に対し、90度の回転と反転の組合せで得られる配置は同一の動物とみなす。一般化三並べでは、如何なる動物を目標にした場合も後手必勝は存在せず、先手必勝である動物を勝ち型とそれ以外の動物を負け型と呼ぶ。細胞数が5以下のすべての動物は勝ち型・負け型の分類がなされているが、細胞数が6である動物についてはまだ勝ち型か負け型かが知られていない配置が存在する。 本研究ではまだ型が判明していない動物に対して、型分類を与えることを目的とする。 一般化三並べの動物の型判定のテクニックの1つに畳敷き戦略が知られている。 本研究では、畳敷き戦略の畳の敷き方に注目することで、型が未知である動物に対する新たな畳敷きの考案を目指す。 | |
#32 | 「Transformerを用いたかな漢字変換」 |
ベタ書きのひらがなによる文章をかな漢字混じりの文章に変換するアルゴリズムは、日本語入力システムの基礎として広く使われているところである。その中でも連文節変換といういくつかの文節をまるごと処理するアルゴリズムにおいては、クラスBi-gramや単純Tri-Gram、RNNLMなど様々な手法が実装されてきた。この研究では、かな漢字変換をTransformerを用いて実装して精度の向上を目指す。 | |
#33 | 「自走式ディスプレイによる画面よりも大きな画像のインタラクティブな表示法」 |
近年、ニュース番組などの収録では、横幅10 m以上の巨大なディスプレイに風景映像を表示しておき、その前に出演者を配置した状態で別のカメラから撮影を行うことで擬似的な現場ロケを実現することがある。しかし、巨大なディスプレイは限られたスタジオにしか存在せず、一般のユーザが同じような撮影を行うのは不可能である。そこで本研究では、人間と同程度の大きさのディスプレイにオムニホイールを装着し、自走可能にしたデバイスを提案する。このデバイスは、出演者などユーザの動きに追従して移動し、移動した位置に合わせて適切な映像を出力する。この様子を別のユーザやカメラから見ると、巨大ディスプレイで行っている疑似的な現地ロケ撮影が一般的な大きさのディスプレイで実現できる。 また、本手法はメタバース環境にも利用できる。自走式ディスプレイは広大なメタバースを覗き込むインタラクティブな「窓」のように作用し、従来は個人がHMDを装着することで可能だった広大なVR/ARなどの体験を、多人数に拡張することも可能だと考えられる。 | |
#34 | 「決定性素数判定アルゴリズムについて」 |
素数判定問題について、決定的なアルゴリズムにおいては、AKS素数判定法(https://www.cse.iitk.ac.in/users/manindra/algebra/primality_v6.pdf)という多項式時間でのアルゴリズムが発見され、現在はそれが改善されてGaussian periodsを用いたlogN^6でのアルゴリズム(https://math.dartmouth.edu/~carlp/aks111216.pdf)が最速である。確率的なアルゴリズムにおいては、ミラーラビン判定法というlogN^2でのアルゴリズム(https://math.dartmouth.edu/~carlp/PDF/reliable.pdf)がある。 プレプリントで素数判定をlogN^3で行う手法を提案している論文(https://eccc.weizmann.ac.il/report/2023/200/)があるので、それの正当性を確かめる。 | |
#35 | 「自律移動ロボットによる迷路全探索についての考察」 |
地震などの災害時に用いられる救助用の自律移動ロボットには、短時間で広範囲を探索し、多くの被災者を救助して、探索を開始した場所まで帰還する能力が必要とされる。そこで、本研究では、様々な迷路探索アルゴリズムを搭載した実機の自律移動ロボットが迷路を全探索するのに要した時間を計測し、その結果について考察した。計測に使用した実機の自律移動ロボットは、ToFセンサやIMUを搭載していて、簡易的なマッピングや自己位置推定を行うことができる。 | |
#36 | 「2次元アバターの顔画像を用いた、対話型AIの開発」 |
対話型AIの開発において、文面上からは読み取りづらい感情を同時に得られる顔の映像から推定することによってより細かなニュアンスを得られるのではないかと考えた。本研究は、バーチャルYouTuberの2次元アバターの画像データを訓練データとし、畳み込み学習による感情推定を試み、fine-tuningによる対話型AIへの反映を行う。 | |
#37 | 「焼きなまし法をベースとしたモジュラリティ最適化アルゴリズムの提案」 |
近年の SNS の発達などにより、ネットワーク内の凝縮性の高い部分グラフ、すなわちコミュニティを検出することが活発に研究されている。コミュニティ検出に関する評価指標や手法は多く存在するが、その中でも多く使われている指標としてモジュラリティという指標がある。これは、全体の頂点をいくつかの集合に分割した際の誘導部分グラフを考え、凝縮性を測る。 このモジュラリティを厳密に最大化する問題はNP困難であり、多項式時間で良い解を出す手法として貪欲法やスペクトル最適化など様々な手法が提案されている。そしてこれらは、計算量と解の質がトレードオフの関係であるため、扱うグラフサイズによって使用するアルゴリズムを適切に選択する必要がある。 本研究では、この最適化に対する、焼きなまし法をベースとした手法を提案する。頂点数が10000程度の大きさのグラフに対して、既存の手法と比べより高い性能を出すことを目指す。 | |
#38 | 「 同期現象のシミュレーション」 |
同期現象とは異なる振動のリズムがそろっていく現象のことである。ホタルの点滅、心臓細胞の律動などで見られ、異なる振動のリズムをしていた物体がお互いに影響し合って起こるとされている。学校での探究活動では1つの台車のメトロノームを2つのせ、2つの台車を弱い相互作用になるようにつなぐと集団効果による同期現象が見られること、集団効果によって同期現象が起こると台車のなかでは同相同期が見られ、集団内では逆相同期が見られることを実証実験によって調べた。そこで今回の研究では、集団効果による同期現象をシミュレーションすることによって、集団間の相互作用強度εを徐々に大きくしたときに集団間の同期がどのように変化するか調べる。 | |
#39 | 「Transformer を利用したスパムレビュー検出」 |
スパムレビューの検出は、オンラインプラットフォーム上での信頼性の高いレビューシステムを維持するために重要な課題である。しかし、スパムレビュー検出は、その曖昧さとラベル付けの困難さから、データセットの量や質に関する問題が生じやすい。過去には、PU learningやn-gramなどの手法がスパムレビュー検出に試みられている。本研究では、先進的な自然言語処理技術であるTransformerを利用したテキスト分析によって、スパムレビュー検出の精度向上を目指す。 |