I分野 グラフィクス・画像 |
選奨セッション セキュリティと画像処理(L分野と共催) |
9月4日(水) 9:30-12:00 1h会場
座長 矢野 智彦(セコム株式会社 IS研究所)
木谷 佳隆(KDDI総合研究所) |
CL-001 |
カーネルデータ監視による特権昇格攻撃検出手法の提案と評価
○葛野 弘樹(神戸大学)・山内 利宏(岡山大学)
×
CL-001カーネルデータ監視による特権昇格攻撃検出手法の提案と評価
○葛野 弘樹(神戸大学)・山内 利宏(岡山大学)
動作中のオペレーティングシステムのカーネルにて,特定のカーネルデータを監視し,脆弱性を利用したメモリ破壊攻撃による改ざんを検出することは困難である.
本稿では,動作中カーネルにて特定のカーネルデータを監視,カーネルデータ改ざんを検出するセキュリティ機構を提案する.
提案するセキュリティ機構では,特定のカーネルデータを格納する専用カーネルページを導入し,定期的,および動的な監視機能を実現した.
提案するセキュリティ機構では攻撃用ユーザプロセスによる特権昇格攻撃による権限情報改ざん検出を実現した.
評価にて,提案するセキュリティ機構の特権昇格攻撃検出能力を検証,また,オーバヘッドを測定する. |
CL-002 |
Jeddak: the Application of Privacy Enhanced Technology in Practical Data Business
○Hong Jue・Zhang Qizhi・Wu Ye(Bytedance)・Han Dongli(Central University of Finance and Economics, China)
×
CL-002Jeddak: the Application of Privacy Enhanced Technology in Practical Data Business
○Hong Jue・Zhang Qizhi・Wu Ye(Bytedance)・Han Dongli(Central University of Finance and Economics, China)
The Privacy Enhanced Technologies (PETs) are now widely used to protect user privacy and to meet the requirements of legal compliance. However, the gap between cryptographic concepts/protocols and business flow, and its high computation cost renders PETs uneasy to apply in real business scenarios. In this paper we present the Jeddak system, which provides the abilities of privacy-preserving data processing and sharing using comprehensive PETs. We first describe the design and architecture of Jeddak, which makes it integrated with existing business flow smoothly. Then show how Jeddak handles the performance challenges caused by billion-scale data from real applications. Finally, we give a dozen application examples of Jeddak to demonstrate how PETs help enable data sharing between businesses with privacy preservation. |
CL-003 |
グラフアクセス構造を表現する非コミットメント型カードプロトコルの上下カードへの適用と不正入力攻撃の考察
○須賀 祐治(インターネットイニシアティブ)
×
CL-003グラフアクセス構造を表現する非コミットメント型カードプロトコルの上下カードへの適用と不正入力攻撃の考察
○須賀 祐治(インターネットイニシアティブ)
2者間非コミットメント型カードプロトコルにおいて,グラフをアクセス構造として取り扱う.与えられたグラフから1頂点を選択することを秘密のカード入力とし,入力を秘匿しつつ2点間の距離に応じた出力する秘密計算が提案されており,この手法は一致関数の拡張として考えることができる.特にJohnson association schemesを実現する2色カードを用いたナイーブなプロトコル実装の拡張と考えることもできる.
今回,ランダムカットを用いた単純な新しいカード入力の制限方法を導入する際に,2色カードではなく,名刺や一部の麻雀牌のような上下カードを適用することを検討する.このとき2色カードでは考慮する必要のなかったカード入力不正もしくは誤入力の検知と対策方法について考察を与える. |
CI-001 |
値域フーリエ級数展開による冗長ウェーブレット変換
◎林 晃平・本田 宗一朗・亀井 宏和(名古屋工業大学)・前田 慶博(芝浦工業大学)・福嶋 慶繁(名古屋工業大学)
×
CI-001値域フーリエ級数展開による冗長ウェーブレット変換
◎林 晃平・本田 宗一朗・亀井 宏和(名古屋工業大学)・前田 慶博(芝浦工業大学)・福嶋 慶繁(名古屋工業大学)
本論文では,局所コントラスト変換を扱う冗長なウェーブレット変換を提案する.提案手法では,全てのレベル,全ての位置のウェーブレット係数1つに対して,局所的にコントラスト変換した画像をウェーブレット変換して計算する.そのため,特定の位置ではなく,画像の全ての位置でコントラストが改善された画像のウェーブレット係数を得ることができる.ただし,係数1つを求めるためにウェーブレット変換を1回必要とするこの処理は,画素数に比例する回数のウェーブレット変換を必要とするため計算コストが高い.そこで,フーリエ級数展開で近似を行い,数回の冗長なウェーブレット変換で処理を実現して計算を高速化する. |
CI-002 |
StrongSORTと密度推定による密度に依存しないグループ検出
◎植野 直次朗・土屋 達弘(大阪大学)・中川 博之(岡山大学)
×
CI-002StrongSORTと密度推定による密度に依存しないグループ検出
◎植野 直次朗・土屋 達弘(大阪大学)・中川 博之(岡山大学)
カメラで撮影された動画から人間の行動を分析する技術が求められている.特に動画中の群衆からグループを検出する技術に関心が高まっている.例えば,公共施設に設置されたカメラによるグループ検出は,混雑状況に合わせた警備員配置の最適化を可能とする.本研究では群衆の映る動画からグループを余すことなく検出することを目標とする.オブジェクトトラッキングツールとしてStroingSORTを,密度推定技術としてDM-Countを用い,群衆密度に依存しないグループ検出技術を提案する.実世界で撮影された動画を用いた評価実験を通じて,提案手法により様々な密度でグループ検出が可能となることを確認した. |
グラフィックス |
9月4日(水) 13:10-15:10 2k会場
座長 佐藤 周平(法政大学) |
I-001 |
距離場と包含球を用いた3次元Bスプラインの編集
○西田 友是(プロメテックCGリサーチ/デジタルハリウッド大学/福山大学)
×
I-001距離場と包含球を用いた3次元Bスプラインの編集
○西田 友是(プロメテックCGリサーチ/デジタルハリウッド大学/福山大学)
CGやCADにおいて形状表現や軌跡に曲線が多用される。一般に使用されるBスプライン曲線は制御点の位置の調整で形状を制御できる。また、ノット挿入で局所的な曲線形状を調整できる。本稿では曲線上の任意の点をマウスで自由に変位させ、あるいはノットの挿入(曲線分割)する方法を提案する。パラメータから曲線上の点を計算するのは容易であるが、逆に曲線上の点(近傍)からパラメータを計算するのは容易ではない。3次元空間では特に難しい。この問題はスクリ-ン上でマウスで指定した点(視線に相当)に対する曲線上の最近点を検出することで解決できる。本稿ではBスプライン曲線を構成するベジエ曲線の包含球とスクリーン上の曲線からの距離場を利用してマウス(レイ)の近傍の曲線上の点を検出する方法を提案する。 |
I-002 |
小規模天体の形状モデルにおける,不均一ポリゴン分割に係る一考察
○三浦 昭(宇宙航空研究開発機構)・諸田 智克(東京大学)・菊地 紘(学習院大学)・横田 康弘(宇宙航空研究開発機構)・和田 浩二(千葉工業大学)
×
I-002小規模天体の形状モデルにおける,不均一ポリゴン分割に係る一考察
○三浦 昭(宇宙航空研究開発機構)・諸田 智克(東京大学)・菊地 紘(学習院大学)・横田 康弘(宇宙航空研究開発機構)・和田 浩二(千葉工業大学)
筆者らは小規模天体の形状モデル作成について検討してきた. 例えば10㎞規模の天体に小さなクレータや岩石等の特徴が見受けられる場合,特徴的な局所形状付近に絞って詳細なポリゴン分割をすることで全体的なポリゴン数の増大を抑えることが選択肢のひとつとなる. 一方で自然地形等の模擬手法のひとつである中点変位法等は,レンダリング時のポリゴンサイズと生成画像の解像度との関係によっては,適切な形状や質感を得ることが難しくなることがある. 本稿においては,上記のような不均一な分割手法について概説すると共に,生成された形状モデルのレンダリングを含めた,利点や留意点等について考察する. |
I-003 |
畳み込みニューラルネットワークに基づく複素ホログラム計算の量子化
○遠藤 優(金沢大学)・老川 稔(高知大学)・下馬場 朋禄・伊藤 智義(千葉大学)
×
I-003畳み込みニューラルネットワークに基づく複素ホログラム計算の量子化
○遠藤 優(金沢大学)・老川 稔(高知大学)・下馬場 朋禄・伊藤 智義(千葉大学)
ホログラフィックディスプレイの実用化のために,ホログラム計算の軽量化・高速化が求められている.近年,高速なホログラム計算手法として,畳み込みニューラルネットワーク (CNN) を用いるアプローチが提案されている.本研究では,複素ホログラム計算のための CNN を軽量化・高速化するため,CNN モデルの量子化を行った.提案する量子化モデルでは,モデルサイズと実行速度を削減しつつ,量子化前と同程度の画質を実現した. |
I-004 |
二台のホログラフィックプロジェクタを用いた空中像の重ね合わせ
◎中谷 優月・花岡 直弥・内田 十内・高田 直樹(高知大学)
×
I-004二台のホログラフィックプロジェクタを用いた空中像の重ね合わせ
◎中谷 優月・花岡 直弥・内田 十内・高田 直樹(高知大学)
ホログラフィックプロジェクタは,コンピュータで作成された計算機合成ホログラムを用いて,三次元映像を投影することができる.著者らは,ホログラフィックプロジェクタと再帰性反射シートを用いたホログラフィック空中ディスプレイ装置を提案している.ホログラフィックプロジェクタによる三次元像を立体スクリーンに投影し,その透過拡散光を再帰反射させて空中に三次元映像を実像として表示する.複数の観察者が同時に裸眼で目の前に浮かぶ三次元映像を眺めることができる. 本研究では,ホログラフィック空中ディスプレイ装置を2台用いて,2つの空中像を再生する.スクリーンの位置を変えることで再生される空中像の重ね合わせを試みた. |
認識 |
9月5日(木) 9:30-12:00 4m会場
座長 西村 仁志(KDDI総合研究所) |
I-005 |
音響イベントを構成する音響イベントの情報量に関する考察
◎山城 遼・荒井 秀一(東京都市大学)
×
I-005音響イベントを構成する音響イベントの情報量に関する考察
◎山城 遼・荒井 秀一(東京都市大学)
音響シーン推定は音響認識タスクの中でも盛んに研究されており、現在では1秒の音響データから音響シーンを推定することも可能となってきている。しかし、音響シーンは様々な音響イベントの組み合わせによって構成されているため、1秒のデータから音響シーンを推定することは本来できないはずである。そこで本稿では、音響シーンを構成する音響イベントが持つ情報量を定義し、その環境でどのような音がしているかを明らかにした上で、音響シーンを推定する方法を検討する。 |
I-006 |
実際の毛筆を筆記入力デバイスとする仮想書道システム
○金山 知俊(南山大学)
×
I-006実際の毛筆を筆記入力デバイスとする仮想書道システム
○金山 知俊(南山大学)
本研究は実際の毛筆を筆記入力のデバイスとする仮想書道システムの構築を目的とする。本研究のシステムでは机の奥から利用者に向けてRGB-Dカメラを配置し、手に持った毛筆の軸に取り付けたマーカの位置を計測することで筆の位置姿勢を推定し、仮想空間内での毛筆の動きを決定する。またRGB-Dカメラで撮影した机の平面を仮想の紙面位置とし、仮想の毛筆の穂先との接触によって筆記位置を決定る。毛筆の穂先は弾性をもつ棒としてシミュレートすることで紙面に接触した穂先の変形を再現し、穂先と紙面の接触領域の変化から筆跡を生成する。本研究の手法により実際の書道や習字と同様の書き味で毛筆の筆記動作をデジタルデータとして記録することが可能になる |
I-007 |
(講演取消) |
I-008 |
(講演取消) |
I-009 |
(講演取消) |
画像工学 |
9月5日(木) 15:30-17:30 5n会場
座長 三柴 数(鳥取大学) |
I-010 |
画像のエントロピーによる機械学習モデルの性能評価
◎阿部 莉子・檀 裕也(松山大学)
×
I-010画像のエントロピーによる機械学習モデルの性能評価
◎阿部 莉子・檀 裕也(松山大学)
ニューラルネットワークによる機械学習には,クラスに分類された画像の学習モデルにおいて,データセットおよびテスト画像の特徴によって認識精度の違いがある。具体的にはCIFAR-10に対して,誤差逆伝播法などの手法による認識精度の低い画像の特徴を捉えるために,各種エントロピーを使って比較した実験の結果について述べる。 |
I-011 |
CNNを特徴量抽出器としてSVMを用いた低解像度ナンバープレート数字の識別
○松岡 剛史・藤田 和弘(龍谷大学)・四宮 康治(兵庫県警察本部科学捜査研究所)
×
I-011CNNを特徴量抽出器としてSVMを用いた低解像度ナンバープレート数字の識別
○松岡 剛史・藤田 和弘(龍谷大学)・四宮 康治(兵庫県警察本部科学捜査研究所)
警察の捜査等において要望のある防犯カメラなどの車両の自動車登録番号票は小さく, 車両登録番号の画素数が十分でなく,そのまま,目視で数字を識別することは困難なことがある. また,DCNNを用いて識別を行うと,高い確信度で誤識別する場合がある. これを避けるために,複数の識別手法をsoft votingなどにより統合する手法が提案されている. 本研究では,DCNNのCNN部分(畳込み処理部分), つまり,全結合層より前の部分を特徴量抽出器として用い, その特徴量に対してSVMを適用し,高い確信度で誤識別することを避ける手法を提案し, その識別結果を,先行研究と比較する. |
I-012 |
360度カメラを用いた深層学習型自由視点画像生成における最適なカメラ台数の評価
◎北條 海斗・青木 輝勝(東京工科大学)
×
I-012360度カメラを用いた深層学習型自由視点画像生成における最適なカメラ台数の評価
◎北條 海斗・青木 輝勝(東京工科大学)
視点を自由に切り替えることのできる画像を生成する技術として自由視点画像と呼ばれる技術がある.しかし,自由視点画像の生成を行う場合, 通常対象物の周囲に数十~数百台ものカメラを配置する必要がある.カメラ設置台数を減らすための一方策として, 一般的なカメラを360度カメラに置き換えることが考えられる. 本研究では,360度カメラを用いて自由視点画像の生成を行う際,自由視点画像生成に最適なカメラの台数について評価を行う.これにより,撮影準備が簡易かつ品質の高い自由視点画像を生成するための条件を得ることができる. |
I-013 |
自由視点画像と顔姿勢推定を用いた被写者視点画像の生成
◎山崎 颯大・北條 海斗・青木 輝勝(東京工科大学)
×
I-013自由視点画像と顔姿勢推定を用いた被写者視点画像の生成
◎山崎 颯大・北條 海斗・青木 輝勝(東京工科大学)
本稿では,写真に写っている被写者が「何を見ているのか」を画像として出力する被写者視点画像システムを提案する.このシステムでは自由視点画像を入力とする. 自由視点画像生成技術の歴史は長いが, 近年深層学習の導入により飛躍的に精度が向上した. また, 従来多数(場面によっては100台単位)のカメラの設置が必要であったが, その数も大幅に低下し, 誰もが自由視点画像を容易に生成できる環境が整いつつある. このような状況のもと,本稿では,自由視点画像生成と顔姿勢推定の技術を用いた被写者視点画像の生成とその応用について試論する.(261文字) |
I-014 |
V-DMCにおけるサブメッシュ境界情報のインター符号化に関する検討
◎岸本 広輝・河村 圭・加藤 晴久(KDDI総合研究所)
×
I-014V-DMCにおけるサブメッシュ境界情報のインター符号化に関する検討
◎岸本 広輝・河村 圭・加藤 晴久(KDDI総合研究所)
動的メッシュ符号化技術(V-DMC)の国際標準化がMPEGで2022年から進められている.現在検討されているV-DMCでは,動的メッシュをメッシュの一領域(サブメッシュ)ごとに符号化し,サブメッシュ境界に発生する穴を境界情報に基づき補正する.しかしながら,V-DMCでは境界情報がもつフレーム間の相関を利用しないため,境界情報の符号化効率は低い.この問題を解決するために,参照フレームの境界情報を利用したサブメッシュ境界情報のインター符号化手法を提案する.実験では,MPEGにおけるデータセットを用い,従来手法と比較して符号化効率の向上を確認した. |
VR |
9月6日(金) 9:30-12:00 6k会場
座長 雨車 和憲(工学院大学) |
I-015 |
周辺視におけるβ運動の奥行と形状の変化の知覚に関する研究
◎北野 奨悟・佐藤 隆・鉄谷 信二(東京電機大学)
×
I-015周辺視におけるβ運動の奥行と形状の変化の知覚に関する研究
◎北野 奨悟・佐藤 隆・鉄谷 信二(東京電機大学)
物理的に運動をしていないものが動いて見えるような現象を仮現運動と呼ぶ.そのうち,光点などを適当な感覚で順次点滅させることによって移動して見える運動をβ運動と呼ぶ.また,平面上の表示で水平・垂直方向のβ運動は周辺視野で観察すると高速化知覚現象が起きることを示している.しかし,この現象が他の軌跡方向において起こるのかは明らかになっていない. そこで本研究では,以下の2点について実験および考察を行う. 1.β運動の奥行き移動方向での高速化知覚現象 2.平面方向での円などの様々な運動軌跡形状においての高速化知覚現象と形状知覚変化 |
I-016 |
動き効果を用いた電子コミックに関する研究
○伊藤 美佳・北野 奨悟・佐藤 隆・鉄谷 信二(東京電機大学)
×
I-016動き効果を用いた電子コミックに関する研究
○伊藤 美佳・北野 奨悟・佐藤 隆・鉄谷 信二(東京電機大学)
近年, スマートフォンやタブレットPCなどのデジタルデバイスの普及やインターネット網の整備により高速モバイルインターネットを利用することが当たり前となっている.その中で漫画は紙媒体から電子媒体へと形を変え,様々なアプリケーションやWebサイトが登場しデジタルデバイスで読むことができるようになり,利用者も増えている.しかし,漫画の背景や効果音に動きをつけること等が可能になっているにも関わらず,その効果を持たせるデジタル漫画は普及していない.本研究では, 動き効果を用いた電子コミックについて,動き変化の速さとコンテンツの特徴による印象の評価および視線の動きから考察を行い、 これらの結果から新たな知見を得ることを目的とする. |
I-017 |
VR空間内の回転実歩行の速度変化における視線および感覚に関する研究
◎滝澤 壮太・北野 奨悟・佐藤 隆・鉄谷 信二(東京電機大学)
×
I-017VR空間内の回転実歩行の速度変化における視線および感覚に関する研究
◎滝澤 壮太・北野 奨悟・佐藤 隆・鉄谷 信二(東京電機大学)
仮想空間での移動と実歩行との連動を用いるとき,デメリットとして現実空間に広いスペースを必要とすることが挙げられる.この問題点を解消するため,限られた現実空間でも大きな仮想空間を移動しているよう感じさせる研究が行われている.これに代わる移動方法として,筆者らは回転椅子を用いた無限回転歩行により広大な仮想空間を直進する手法を提案・評価している.結果として,回転歩行はユーザにとって負担が大きく,実用化にあたり障壁が存在することがわかった.仮想空間での視覚上の移動が直線方向であるのに対して,身体方向は回転しているという不一致の環境下では,身体への負担が大きいことが一つの原因であると考えられる.また,回転歩行中は直進歩行中と比べ,視線の動きが大きいことが明らかになっている. 本研究では,回転実歩行の速度に関係なくVR空間内の直線移動速度の映像を通常の歩行速度に固定し,回転実歩行の速度を変えたときの視線の動きの計測および感覚に対する主観評価を行い,それらの結果について考察する. |
I-018 |
対人コミュニケーションにおけるTDとASDの注視行動比較のためのVRシステム開発
◎大村 美鶴穂・原田 翔太(広島市立大学)・土屋 彩茜・大須 理英子(早稲田大学)・満上 育久(立命館大学)
×
I-018対人コミュニケーションにおけるTDとASDの注視行動比較のためのVRシステム開発
◎大村 美鶴穂・原田 翔太(広島市立大学)・土屋 彩茜・大須 理英子(早稲田大学)・満上 育久(立命館大学)
定型発達者(TD)と自閉スペクトラム症者(ASD)などの発達障がい者が共存するニューロダイバーシティのある組織では,イノベーションの貢献や生産性の向上が期待される一方で,コミュニケーションの齟齬により心理的安全性が脅かされ,生産性の向上に繋がらないという課題がある.そこで本研究では,コミュニケーション円滑化の第一段階としてTDとASDの認知特性を比較するため,同一のコミュニケーションが疑似体験できるVRシステムを開発し,注視行動データを収集する.そして,注視点の分布や時間推移,各物体カテゴリに対する注視時間割合などについて,TDとASDの違いを分析する. |
UI・コンテンツ生成 |
9月6日(金) 13:10-15:40 7p会場
座長 橋田 光代(福知山公立大学) |
I-019 |
脳波デバイスを用いた大規模言語モデルとの視覚的コミュニケーション形式の提案"こそあど言葉"を含む指示語を用いた画像を通じた対話
◎茶谷 瑛佑・佐藤 啓宏(京都先端科学大学)
×
I-019脳波デバイスを用いた大規模言語モデルとの視覚的コミュニケーション形式の提案"こそあど言葉"を含む指示語を用いた画像を通じた対話
◎茶谷 瑛佑・佐藤 啓宏(京都先端科学大学)
大規模言語モデル(LLMs)を用いて、画像に映っている内容や関連する情報の文章生成を行うマルチモーダルアプリケーションが開発されている。人間同士のコミュニケーションでは、言語のみならず視覚情報も共有され、あいまいな表現を用いても双方が意味を理解し、会話が進行する。そこで本研究では、直感的に入力することが期待できる脳波デバイスを使用して「こそあど言葉」のようなあいまいな指示語を大規模言語モデルが理解し、ユーザーに適切な応答を提供することを目的とする。具体的には、脳波デバイスNextMindを活用し、画面上のオブジェクトについての内容や関連情報をユーザーに提供するシステムを提案する。会話の流れに沿ってマーカーの候補が動的に切り替わる点に工夫がある。 |
I-020 |
ニューラルネットワークを用いたハンドジェスチャー認識によるゲームユーザーインターフェースの研究
◎郭 翔・山富 龍・齋藤 友彦・二宮 洋(湘南工科大学)
×
I-020ニューラルネットワークを用いたハンドジェスチャー認識によるゲームユーザーインターフェースの研究
◎郭 翔・山富 龍・齋藤 友彦・二宮 洋(湘南工科大学)
ハンドジェスチャー認識は,人間とコンピューターのインタラクションにおいて,直感的かつ自然な方法を提供する.特に,ゲームや仮想現実の分野において,ユーザーが物理的なデバイスに依存せずにインタラクションを行えるようにする点で重要である.本研究では,ゲームにおけるハンドジェスチャー認識について検討を行う.ハンドジェスチャー認識にはMediaPipe及びニューラルネットワークを用いる.MediaPipeはGoogleが提供する機械学習ライブラリーであり,カメラに映る手をリアルタイムで検出することができる.本研究では,ハンドジェスチャー認識を用いた射的ゲームを開発し,ジェスチャー認識精度及び操作性の検証を通じ,有効性について考察する. |
I-021 |
StyleGAN2に基づくゲームキャラクタの顔画像生成における生成画像の品質制御方式
◎周 逸峰・阿倍 博信(東京電機大学)
×
I-021StyleGAN2に基づくゲームキャラクタの顔画像生成における生成画像の品質制御方式
◎周 逸峰・阿倍 博信(東京電機大学)
キャラクタを動かすゲームの開発においては,大量の顔画像が必要になる.近年,AIを用いて顔画像を自動生成するサービスが増加しているが,我々もゲームへの素材の提供を想定して,StyleGAN2に基づく表情差分付きのゲームキャラクタの顔画像生成システムの開発に取り組んでいる.その中で,生成画像において,一定数の異常画像が存在することが課題となっていた.そこで,本研究では,機械学習により生成した顔画像を正常画像と異常画像を分類することで,StyleGAN2で生成したゲームキャラクタの顔画像を品質制御する方式について提案する.評価実験を行った結果,その有効性について確認することができた. |
I-022 |
線画に着目した2Dアニメーション制作のための髪パーツの自動分割方式
◎シュ カトウ・阿倍 博信(東京電機大学)
×
I-022線画に着目した2Dアニメーション制作のための髪パーツの自動分割方式
◎シュ カトウ・阿倍 博信(東京電機大学)
2Dキャラクターアニメーションの制作時では,元画像である2Dイラストに対して目や髪などの個別のパーツに分割する必要がある.従来,この作業は手作業で行う必要があったため,作業時間の増大が課題となっていた.そこで,本研究では髪パーツを対象としたパーツ分割作業において,分割精度の向上を目的として,深層学習に基づくセグメンテーション処理に元画像から抽出した線画を用いた後処理を追加する方式を提案する.具体的には,元データに対するセグメンテーション処理結果に対して後処理としてその不完全な部分を補完する処理を追加することで精度向上を実現する,評価実験を行った結果,その有効性について確認することができた. |
I-023 |
大規模言語モデルを用いた制作者の意図に基づくオブジェクトの自動選定・配置システムの提案
◎西居 有花・石戸 莞楽・中村 亮太(武蔵野大学)
×
I-023大規模言語モデルを用いた制作者の意図に基づくオブジェクトの自動選定・配置システムの提案
◎西居 有花・石戸 莞楽・中村 亮太(武蔵野大学)
バーチャル空間は様々な分野で活用されているが、その生成には3DCGソフトウェアの操作に関する前提知識や多大な時間と労力が必要とされる。本研究では、3DCGソフトウェアで構築した空間内において、大規模言語モデルを用いてユーザから入力されたテキストから制作意図を推定し、推定結果に基づいてリストの中から適したオブジェクトを自動選定・配置するシステムを開発した。本システムにより、3DCGソフトウェアに精通していない制作者でも、対話しながら容易にバーチャル空間を制作することが可能になる。これにより、バーチャル空間の制作における敷居が下がり、より多くの人々がバーチャル空間を活用できるようになることが期待される。 |