I分野 グラフィクス・画像 |
選奨セッション 画像工学 |
9月3日(水) 9:30-12:00 1g会場
座長 木谷 佳隆(KDDI総合研究所)
福嶋 慶繁(名古屋工業大学) |
CI-001 |
階層スケーラブル符号化における高速化手法の一考察
◎小浦 陽・丹羽 直也・岩崎 裕江(東京農工大学)
×
CI-001階層スケーラブル符号化における高速化手法の一考察
◎小浦 陽・丹羽 直也・岩崎 裕江(東京農工大学)
近年、映像配信サービスの需要増加に伴い、異なる解像度のデバイスへ同時に映像を配信可能な空間スケーラブル符号化が注目されている。しかし、この方式は通常の符号化に比べて処理時間が長く、低遅延配信の妨げとなる。本研究では、次世代映像符号化方式VVCにおける空間スケーラブル符号化の高速化手法を提案した。下位層フレームのブロック分割情報を用いて上位層の分割候補を適応的に絞り込み、探索処理を削減することで、画質や圧縮効率を保ちながら符号化時間を大幅に短縮できることを確認した。また、本手法の有効性に加え、さらなる高速化の可能性や応用展開に向けた今後の研究課題についても考察を行った。 |
CI-002 |
雲被り衛星画像に対するクロロフィルa濃度推定のためのU-Netモデルの検討
◎徳永 穂乃香・松岡 諒(北九州市立大学)
×
CI-002雲被り衛星画像に対するクロロフィルa濃度推定のためのU-Netモデルの検討
◎徳永 穂乃香・松岡 諒(北九州市立大学)
クロロフィルa(Chl-a)濃度の空間的分布推定は,水質モニタリングや藻類の動態把握において重要である.しかし,光学衛星画像は雲の影響を受けやすく,雲被り領域ではスペクトル情報が欠損するため,精度の高い推定が困難である.本研究では,雲補完とクロロフィルa濃度推定を統合的に行うため,U-Netベースの深層学習モデルを構築した.Sentinel-2などの光学データに加え,SAR,LSTなどのマルチモーダルデータを統合し,雲被り領域のスペクトル再構成を行う.実験により,本手法の有効性が確認された. |
CI-003 |
双方向シーンフロー推定と時間的サンプリングに基づく点群フレーム補間
○松﨑 康平・野中 敬介(KDDI総合研究所)
×
CI-003双方向シーンフロー推定と時間的サンプリングに基づく点群フレーム補間
○松﨑 康平・野中 敬介(KDDI総合研究所)
動的点群シーケンスのフレームレート向上に有効な技術として,点群フレーム補間に注目が集まっている.本稿では,双方向シーンフロー推定と時間的サンプリングに基づく点群フレーム補間手法を提案する.提案手法では,はじめに時間的に連続する二つの点群フレームから双方向シーンフロー推定によって個別に中間フレームを構築する.そして,補間時間を考慮した時間的サンプリングによって二つの中間フレームを単一のフレームに統合する.さらに,サンプリングのための真値ラベルを動的に作成する自己教師あり学習手法を導入する.三つの大規模な動的点群シーケンスデータセットを用いた評価実験を通じて,提案手法の有効性を確認する. |
デジタルコンテンツ制作技術 |
9月3日(水) 13:10-15:10 2r会場
座長 水野 慎士(愛知工業大学) |
I-001 |
デジタル空間の表現方法に適したデータの形式に関する調査
◎久原 巧夢・中原 匡哉(大阪電気通信大学)
×
I-001デジタル空間の表現方法に適したデータの形式に関する調査
◎久原 巧夢・中原 匡哉(大阪電気通信大学)
近年,VRやデジタルツインに注目が集まっており,様々な用途での利活用の検討が進められている.そのため,リアリティの高い空間表現が求められており,用途ごとに適した表現方法の選択が必要である.例えば,デジタルツインの表現に2次元の動画データは適していないため,3次元データの活用が求められる.しかし,用途ごとに様々な表現方法を比較した調査は十分には行われていない.そこで,本研究では,利用用途ごとに適切なデータ形式を調査することで,今後のデジタル空間の構築における方針を明らかにすることを目的とする.具体的には,動画,点群データ,3Dモデルやボリュームレンダリングなどのデータ形式の特徴から,用途ごとの適性を調査する. |
I-002 |
Gaussian Splattingに適した3Dモデルの半透明表現と統合レンダリング手法の検討
○山崎 賢人・皆川 純・岡原 浩平(三菱電機)
×
I-002Gaussian Splattingに適した3Dモデルの半透明表現と統合レンダリング手法の検討
○山崎 賢人・皆川 純・岡原 浩平(三菱電機)
多視点画像から3D空間を学習することで,任意の視点の画像を生成する3D Gaussian Splatting (3DGS)がある.3DGSでは多くの学習済みガウシアンを任意の視点に投影するため,高速なレンダリングを実現している.この空間内に半透明な3Dモデルを配置する場合,3Dモデルがメッシュ表現では,レンダリングの順番が複雑になるため,学習済みガウシアンと3DモデルのメッシュをZソートするだけでは不整合が発生する.そこで3Dモデルを点群で表現することで,学習済みガウシアンと同種とみなし,区別なくZソートし,投影する手法を検討した.本論文では,検討した手法によりレンダリングした結果について共有する. |
I-003 |
映像と音声のマルチモーダル学習によるライブ感のある歌声生成のための検討
◎畠山 智之・藤井 一貴・伊原 滉也(サイバーエージェント)
×
I-003映像と音声のマルチモーダル学習によるライブ感のある歌声生成のための検討
◎畠山 智之・藤井 一貴・伊原 滉也(サイバーエージェント)
実際のアイドルのライブ現場では,ダンスに伴う息遣いの変化や,会場の盛り上がりに応じたアドリブ表現など,スタジオ収録の歌唱には含まれない要素が存在する.仮想キャラクターによるライブ表現においても,こうした要素が歌声に自然に反映されることが望ましい.本研究では,ライブ映像を条件付けとした,スタジオ収録歌唱からライブ歌唱への歌声スタイル変換を行うことにより,これらの要素を再現することを目的としている.これにより,スタジオ収録の歌唱に対して仮想キャラクターによるダンス映像を条件としてスタイル変換することで,実際のライブ歌唱に近づけることを目指す. |
I-004 |
CLIPを用いたテキスト駆動型の3D自然背景自動生成手法
◎阿部 遥太朗・渡邊 海斗(筑波大学)・中山 弘敬(国立天文台)・白木 厚司・伊藤 智義(千葉大学)・干川 尚人(筑波大学)
×
I-004CLIPを用いたテキスト駆動型の3D自然背景自動生成手法
◎阿部 遥太朗・渡邊 海斗(筑波大学)・中山 弘敬(国立天文台)・白木 厚司・伊藤 智義(千葉大学)・干川 尚人(筑波大学)
近年メタバースなどの発展に伴い,3Dモデルの需要が増加している.しかし自然背景は大きく,制作コストも割けない.この解決のため,自然物のフラクタル性と進化的計算を用いて3Dモデルを自動生成する研究が進められている.従来手法は入力に写真など元データを必要とするため,ユーザーの意図を柔軟に反映できない課題があった.本研究ではマルチモーダル基盤モデルのCLIPを用い,入力をテキスト形式に拡張した.これにより生成される3Dモデルとテキストの関連性を評価して,進化計算の適応度とする仕組みを提案する.本報告では,提案手法に基づき既存の3Dフラクタルモデル生成システムを書き換え,その有効性を評価した. |
I-005 |
大規模言語モデルを用いた競輪記事生成におけるレース紹介記事の要素選択手法の提案
◎早貸 虎之介・横山 想一郎・山下 倫央・川村 秀憲(北海道大学)
×
I-005大規模言語モデルを用いた競輪記事生成におけるレース紹介記事の要素選択手法の提案
◎早貸 虎之介・横山 想一郎・山下 倫央・川村 秀憲(北海道大学)
本研究は、競輪レース紹介記事の自動生成に向けて、記事に含めるべき要素を適切に選択する手法を提案する。従来は経験則に基づく静的なルールにより記事要素が決定されていたため、読者の関心や記事要素間の関係性を十分に反映できないという課題があった。提案手法では、過去の競輪記事を分析し、出場選手のプロフィール・戦績・戦法、ライン構成、展開予測などの要素を抽出し、出現する頻度や順序に基づいて記事要素の掲載優先度を設定する。提案手法で得られた記事要素をプロンプトとして大規模言語モデルに与え、記事を生成する。さらに、記事要素や表現の使用履歴を管理することで、一定期間内の記事群における冗長性を抑制し、多様性を維持する。評価実験を通じて、提案手法が実際の競輪記事と比較して、同様の記事内容の適切性、構成の明瞭性、多様性を実現できるかを確認する。 |
エンタテインメント |
9月3日(水) 15:30-17:30 3r会場
座長 松下 光範(関西大学) |
I-006 |
機械学習とプロジェクションマッピングを用いた書道パフォーマンスのエンターテイメント性向上に関する研究
◎髙木 万記・中村 嘉彦・山本 椋太(苫小牧工業高等専門学校)
×
I-006機械学習とプロジェクションマッピングを用いた書道パフォーマンスのエンターテイメント性向上に関する研究
◎髙木 万記・中村 嘉彦・山本 椋太(苫小牧工業高等専門学校)
人体を用いたパフォーマンスにおいて、演出効果として投影技術が多く用いられている。しかし、あらかじめ作成された映像を投影するだけの例が多く、演者は映像に動きを合わせる必要があり、高度なスキルが求められる。これが、投影演出を取り入れる際のハードルとなっている。 そこで本研究では、人物や骨格を自動で検出し、その動きに応じてエフェクトをリアルタイムで描画・投影するシステムを開発する。演者が映像に動きを合わせる必要がなくなり、アマチュアの書道パフォーマンスでも手軽に投影演出を取り入れられることを目指す。 |
I-007 |
LLMを用いたじゃんけんにおける行動誘導発話生成の検証
◎唐井 希・坂本 充生・伊原 滉也(サイバーエージェント)
×
I-007LLMを用いたじゃんけんにおける行動誘導発話生成の検証
◎唐井 希・坂本 充生・伊原 滉也(サイバーエージェント)
対人対戦においては,プレイヤーの心理に影響を与える発話など,本来のゲーム構造以外の情報が勝敗に影響を及ぼす要素が存在する.しかし従来のゲームAIは,既定のゲーム内行動(例:じゃんけんにおけるグー・チョキ・パー)のみを選択肢としており,発話などの外的要因を考慮していない.本研究では,じゃんけんを題材として,行動選択と行動誘導発話を統合した方策の学習フレームワークを構築する.LLMを仮想的な対戦相手とした実験により,発話行動が勝率に与える影響を定量的に評価し,人間との対戦における新たなゲーム体験創出を目指す. |
I-008 |
LLMベースのマルチエージェント句会シミュレーションによる俳句評価基準の変遷
◎前嶋 瞭佑・横山 想一郎・山下 倫央・川村 秀憲(北海道大学)
×
I-008LLMベースのマルチエージェント句会シミュレーションによる俳句評価基準の変遷
◎前嶋 瞭佑・横山 想一郎・山下 倫央・川村 秀憲(北海道大学)
俳句は、形式的制約の中で洗練された表現を目指す日本の伝統的短詩であり、句会を通じた俳人同士の評価が作風の成熟に寄与してきた。近年、大規模言語モデル(LLM)を用いた俳句の自動生成や評価が進展しているが、句会における俳人同士の相互作用による評価基準の変化は十分な検討がされていない。本研究では、異なる作風を持つLLMベースの俳人エージェントとしてモデル化し、句会を模したマルチエージェントシステムを構築した。実験では、複数回の句会を通じて各エージェントが他者評価を参考に作風や評価基準を更新し、特定の傾向に収束する様子が観察された。この収束傾向は、各エージェントの初期設定に影響されることが示唆された。 |
コンピュータグラフィックス (1) |
9月4日(木) 9:30-12:00 4q会場
座長 藤村 真生(大阪工業大学) |
I-009 |
輪郭線からの雲画像生成と潜在表現による類似画像検索システムの構築
◎中村 薫・澤山 正貴(北海道大学)・土橋 宜典(北海道大学/プロメテックCGリサーチ)
×
I-009輪郭線からの雲画像生成と潜在表現による類似画像検索システムの構築
◎中村 薫・澤山 正貴(北海道大学)・土橋 宜典(北海道大学/プロメテックCGリサーチ)
本研究では、ユーザが描いた雲の輪郭線に対して、類似した雲画像を検索するシステムを構築した。本システムは2つのモデルで構成されている。まず、畳み込みオートエンコーダ(CAE)により雲画像を64次元の潜在表現へと圧縮し、再構成画像と元画像との差分画像とともにデータベースに保存する。次に、UNetベースの画像生成モデルにより、ユーザが描いた輪郭線から雲画像を生成する。生成画像をCAEに入力し、得られた潜在表現とデータベース内の潜在表現を比較し、最も近いものを検索することで、その潜在表現から得られる再構成画像並びに対応した差分画像を取得し、その2つから元画像を計算することで類似した雲画像を提示する。 |
I-010 |
スケッチ入力による3次元の炎のシミュレーションの制御手法
◎工藤 理香(法政大学)・佐藤 周平(法政大学/プロメテックCGリサーチ)・土橋 宜典(プロメテックCGリサーチ/北海道大学)
×
I-010スケッチ入力による3次元の炎のシミュレーションの制御手法
◎工藤 理香(法政大学)・佐藤 周平(法政大学/プロメテックCGリサーチ)・土橋 宜典(プロメテックCGリサーチ/北海道大学)
コンピュータグラフィックスによる映像制作では,煙や炎などの流体現象の映像を物理ベースのシミュレーションを用いて制作するのが一般的になっている.物理シミュレーションを用いることでリアルな映像を制作できるが,目的とする表現を得るには多くの試行錯誤を伴うことが課題である.そこで本研究では,スケッチを用いた直感的な操作によって,所望の炎のアニメーションを得るための手法を提案する.具体的には,二次元上に描かれた炎の輪郭をもとに,その形状に沿うような3次元の炎の流れが得られるよう,シミュレーションを自動で制御する. |
I-011 |
移動最小二乗法を用いたメッシュ変形による3Dキャラクタの誇張表現
◎大室 絢葉・秋元 優希(法政大学)・佐藤 周平(法政大学/プロメテックCGリサーチ)
×
I-011移動最小二乗法を用いたメッシュ変形による3Dキャラクタの誇張表現
◎大室 絢葉・秋元 優希(法政大学)・佐藤 周平(法政大学/プロメテックCGリサーチ)
近年のアニメ制作では,キャラクタや背景などにCGを利用することが増えている.しかし,現実に則したモデルでは,シーンによって迫力に欠ける場合がある.そのため,手作業でキャラクタの体の一部を誇張的に変形する手法が用いられているが,3Dモデルの変形作業は煩雑であり,制作の負担となっている.そこで本研究では,原画や漫画に見られるような誇張表現を3Dモデルに自動で反映する手法の開発を目的とする.具体的には,原画や漫画等の画像を目標として入力し,それに合うよう3Dのキャラクタモデルを変形する. |
I-012 |
アニメ調イラストからの変形ベースの3D顔モデリング手法
◎秋元 優希(法政大学)・佐藤 周平(法政大学/プロメテックCGリサーチ)・櫻井 快勢(サイバーエージェント)
×
I-012アニメ調イラストからの変形ベースの3D顔モデリング手法
◎秋元 優希(法政大学)・佐藤 周平(法政大学/プロメテックCGリサーチ)・櫻井 快勢(サイバーエージェント)
本研究では,顔の正面と側面のアニメ調イラスト2枚から,3Dモデルを生成することを目的としている.これまでに,入力から得た顔全体や顔パーツの3次元輪郭線を境界条件とした最小化問題を解くことで,3Dモデルを得る方法を提案した.しかし,顔の中心が尖った形状となってしまう問題が生じた.これは,側面顔のイラストにおける顔輪郭には正面から見えない箇所があるため,顔輪郭の深度の正確な取得が難しいことが原因である.そのため,参照となるモデルを用意し,入力に合わせて変形して用いることで,より尤もらしいモデルを生成可能か検証した.本発表ではその結果について報告する. |
I-013 |
ブラックホール時空における追跡ゲームの改良:円弧テッセレーションによる降着円盤の描画
○山下 義行(西九州大学)
×
I-013ブラックホール時空における追跡ゲームの改良:円弧テッセレーションによる降着円盤の描画
○山下 義行(西九州大学)
著者はブラックホールが空間原点に存在する時空でプレイヤーが敵宇宙船を追跡するシミュレーションゲームを開発中である。既存研究ではブラックホール周辺の膠着円盤を三角形のテッセレーションで描画する方法およびポイントスプライトで描画する方法の二つを提案したが、前者では描画コストから描画速度が遅くゲームとしての操作性が悪く、後者では降着円盤のリアルな描画が難しい。本研究では膠着円盤を多数の細長い円弧として定義し、それぞれの円弧にテッセレーションを適用し、重力レンズ効果の描画を実現する。これによってゲームとして必要な描画速度を確保しつつ、よりリアルな表現が可能となる。 |
I-014 |
Assessment of Local and Global Methods for AR Marker-Based Pose Estimation
◎Islam Md Nurul・Prima Oky Dicky Ardiansyah(Iwate Prefectural University)
×
I-014Assessment of Local and Global Methods for AR Marker-Based Pose Estimation
◎Islam Md Nurul・Prima Oky Dicky Ardiansyah(Iwate Prefectural University)
AR markers provide a simple and effective solution for 6DoF pose estimation, enabling accurate projection of 3D objects in space. Pose accuracy can be improved by incorporating multiple markers, which helps mitigate occlusion issues and supplies additional data for estimation. This study introduces and compares two pose estimation methods—local and global—based on multiple AR markers. The local method selects a single marker that is oriented closely to the camera axis, while the global method utilizes multiple markers, excluding those with extreme angles to the camera. Both methods emphasize the importance of acquiring high-quality corner points for improved accuracy. Experimental results demonstrate that while both approaches yield stable pose estimation, the global method offers enhanced robustness when tracking moving marker targets. |
コンピュータグラフィックス (2) |
9月4日(木) 15:30-17:30 5q会場
座長 佐藤 周平(法政大学) |
I-015 |
携帯搭載型LiDARを用いたスキャニング技術向上の検討
◎藤村 春允・柳 祐希・藤村 真生(大阪工業大学)
×
I-015携帯搭載型LiDARを用いたスキャニング技術向上の検討
◎藤村 春允・柳 祐希・藤村 真生(大阪工業大学)
空間情報の取得手段として用いられるLiDAR(Light Detection and Ranging)センサーは、自動運転や測量、建築など多様な分野で注目を集めている。一方で、高精度な専用機器の一般利用には、導入・運用にかかるコストが大きな障壁となっている。近年では、携帯電話への搭載により、より手軽な空間計測が可能となりつつあるが、既存アプリにおける操作性や測定精度には依然として課題が残されている。そこで本研究では、利用者補助による精度向上を目的とし、スキャン時に結果精度や操作ガイドを表示する機能を備えたアプリケーションの開発を行い、スマートフォン単体でのスキャニング技術の高度化を目指す。 |
I-016 |
視線上の特徴量を用いたボリュームレンダリングの基礎検討
◎松田 英悟(北海道大学)・土橋 宜典(北海道大学/プロメテックCGリサーチ)・澤山 正貴(北海道大学)
×
I-016視線上の特徴量を用いたボリュームレンダリングの基礎検討
◎松田 英悟(北海道大学)・土橋 宜典(北海道大学/プロメテックCGリサーチ)・澤山 正貴(北海道大学)
本研究では、視線上のボリュームデータの特徴量とユーザの入力画像の輝度との対応に基づいて目的の画像を生成するボリュームレンダリング手法を提案する。本手法では、特徴量分布に主成分分析(PCA)を適用し、次元削減後に放射基底関数(RBF)補間を行う。これにより、事前計算と実時間処理を分け、高速かつユーザの意図に応じたレンダリングを可能とした。 |
I-017 |
飲食店の顧客移動設計を支援するインタラクティブツールの開発
◎美濃輪 真吾・澤山 正貴(北海道大学)・土橋 宜典(北海道大学/プロメテックCGリサーチ)
×
I-017飲食店の顧客移動設計を支援するインタラクティブツールの開発
◎美濃輪 真吾・澤山 正貴(北海道大学)・土橋 宜典(北海道大学/プロメテックCGリサーチ)
本研究では、ユーザの指定した家具配置および希望動線に基づき、動線の滑らかさ、席との距離、動線同士の重なりを考慮した逐次更新処理によって適切な動線を生成するシステムを構築した。得られた動線はRVOに基づき歩行者の移動をシミュレーションし、統計情報を算出して評価を行う。本手法により、レイアウトに応じた実用的な動線設計支援が可能となる。 |
I-018 |
画像観察時のfMRI脳活動パターンを用いた物体姿勢パラメータの推定
◎鈴木 勇翔(北海道大学)・田中 美里・青木 俊太郎(国際電気通信基礎技術研究所/京都大学)・澤山 正貴(北海道大学)・神谷 之康(国際電気通信基礎技術研究所/京都大学)・土橋 宜典(北海道大学/プロメテックCGリサーチ)
×
I-018画像観察時のfMRI脳活動パターンを用いた物体姿勢パラメータの推定
◎鈴木 勇翔(北海道大学)・田中 美里・青木 俊太郎(国際電気通信基礎技術研究所/京都大学)・澤山 正貴(北海道大学)・神谷 之康(国際電気通信基礎技術研究所/京都大学)・土橋 宜典(北海道大学/プロメテックCGリサーチ)
近年,fMRIで測定した脳活動をパターン解析することで,被験者が観察した画像を再構成する試みが行われている.しかし,画像の根底にある実世界の情報を,脳活動からどの程度推定できているかについては不明な点が多い.本研究では,順光学過程によって画像生成を行う際の物理パラメータを脳活動によってどの程度推定できるかを探ることで,この問題を扱う.具体的には, CG画像を観察時のfMRI活動を測定したデータを用い,脳活動から再構成した画像と最も近い画像特徴を持つ物体回転角度を推定した.80枚のCG画像を用いた推定の結果,多くの画像で真値に近い値を推定できる一方で,一部の画像においては大きな誤差が確認された. |
I-019 |
グラフィカルアブストラクト生成のプロンプトエンジニアリングに関する考察
大橋 美紗希・岡 愛美・○小澤 賢司(山梨大学)
×
I-019グラフィカルアブストラクト生成のプロンプトエンジニアリングに関する考察
大橋 美紗希・岡 愛美・○小澤 賢司(山梨大学)
グラフィカルアブストラクト(GrAb)は,科学論文の要点を視覚的に表現して読者に伝えるために有用である。本報告では,論文のアブストラクト(Ab)に基づいて,生成AIによりGrAbを自動生成させるプロンプトエンジニアリングについて検討した。具体的には,3種のプロンプト「(1) Abそのまま」「(2) Abを20単語で要約」「(3) Abに加えて細かな要件指定」を与えて画像を生成した。20編の論文について,生成された3種のGrAbを10名の学生/大学院生が主観評価を行ったところ,「関心喚起度」としてプロンプト(2)の評価が高いことが示された。また,GrAbを見たことで「論文内容推測度」が向上することが認められ,自動生成されたGrAbでも効果があることが示された。 |
圧縮、3D表示 |
9月5日(金) 9:30-12:00 6n会場
座長 河村 圭(KDDI総合研究所) |
I-020 |
VVC/H.266におけるアフィン予測効率化の一考察
◎川口 昇太・丹羽 直也・岩崎 裕江(東京農工大学)
×
I-020VVC/H.266におけるアフィン予測効率化の一考察
◎川口 昇太・丹羽 直也・岩崎 裕江(東京農工大学)
映像配信サービスなどの普及により、インターネット上の映像トラフィックは急速に増加している。このトラフィックの削減を目的として、高効率な映像符号化技術の研究が進められており、最新の映像符号化規格であるH.266/VVCではアフィン予測などの手法が採用されている。アフィン予測は、フレーム間予測の際に矩形領域に複数の予測ベクトルを持たせることで、物体の回転や変形などの複雑な動きを表現し、符号化効率を高める手法である。しかし、その予測ベクトルの探索には高い演算量が必要であり、課題となっている。本論文では、アフィン動き探索の処理を解析し、効率的なアフィン予測の実現に向けた検討を行う。 |
I-021 |
モバイルSINETによる双方向映像伝送の評価実験
◎小林 寛弥・丹羽 直也・岩崎 裕江(東京農工大学)
×
I-021モバイルSINETによる双方向映像伝送の評価実験
◎小林 寛弥・丹羽 直也・岩崎 裕江(東京農工大学)
スポーツ中継やライブ配信など、IPネットワークを活用したさまざまなリアルタイム映像配信サービスが普及している。リアルタイム映像配信のエンターテインメント性を向上させる手法として、クラウドでのリアルタイム映像編集を取り入れたライブエンターテインメント制作が注目されている。そのために、クラウドで編集された映像を撮影現場に送り返すための低遅延な双方向映像伝送が求められる。また、撮影現場とクラウド間の固定回線は高コストであることから、移動体通信技術を活用した双方向映像伝送の導入が期待されている。本論文では、リアルタイム編集を目的としたモバイルSINETによる双方向映像伝送実験の評価結果を報告する。 |
I-022 |
(講演取消) |
I-023 |
動的メッシュ符号化技術の国際標準規格V-DMC対応リアルタイムエンコーダの開発
◎岸本 広輝・木谷 佳隆(KDDI総合研究所)
×
I-023動的メッシュ符号化技術の国際標準規格V-DMC対応リアルタイムエンコーダの開発
◎岸本 広輝・木谷 佳隆(KDDI総合研究所)
動的メッシュ符号化技術の国際標準規格 V-DMC(Video-based Dynamic Mesh Coding)が2022年からMPEGで開発されている。V-DMCでは、動的メッシュの大まかな構造を基本メッシュで、細部を変位量で表現し、それらをデータ特性に応じた方式で符号化することで、高効率な符号化を実現している。しかし、MPEGが開発しているV-DMC参照ソフトウェアの処理は複雑なため、符号化速度が課題となっている。この問題を解決するために、符号化アルゴリズムの簡素化と並列化を提案する。実験では、提案手法によって主観品質を維持しつつ、大幅に符号化速度を改善することを確認した。 |
I-024 |
Beyond 5Gにおけるホログラフィ伝送を目指したCGHのストリーミング伝送・表示システムの設計
○山口 一弘(公立諏訪東京理科大学)
×
I-024Beyond 5Gにおけるホログラフィ伝送を目指したCGHのストリーミング伝送・表示システムの設計
○山口 一弘(公立諏訪東京理科大学)
3D表示技術の1つであるホログラフィでは,人が眼で被写体を観察する時と同様に自然な立体視が可能であり,将来,ホログラフィをベースとした3DTVの実現が期待されている.本研究では,ホログラフィによる映像をネットワークを介して遠隔地へと届けるホログラフィ伝送の実現を目指し,Beyond 5Gにおけるネットワーク網を想定したシステム設計を行なった.本システムでは,コンピュータホログラフィにより生成したCGH(計算機合成ホログラム)をネットワークによりストリーミング伝送し,遠隔地の電子ホログラフィ装置によりストリーミング表示することで,3D映像のネットワーク伝送を行う.これに関するシステム構成や性能について報告する. |
I-025 |
裸眼式3Dディスプレイにおける実写映像の自然な立体視に向けた疑似輻輳角の実装
◎山城 未莉果・佐藤 圭浩(東京都市大学)
×
I-025裸眼式3Dディスプレイにおける実写映像の自然な立体視に向けた疑似輻輳角の実装
◎山城 未莉果・佐藤 圭浩(東京都市大学)
近年、映像のリアリティと没入感を追求する次世代ディスプレイ技術が発展しており、中でも裸眼式3Dディスプレイは、専用のメガネやヘッドマウントディスプレイを必要とせず立体視を可能にするため多様な分野での応用が期待されている。しかし、投影される映像はCGが中心であり、現実空間を撮影した実写映像の活用は限定的である。その要因としてクロストークが挙げられ、自然な立体視を実現する上での課題となっている。本研究では、4連並行カメラを用いて、輻輳角を疑似的に実装する新たな手法を開発した。これにより、現実空間の奥行き情報をより忠実に再現し、自然で快適な立体視体験を提供する。 |
画像処理・解析・認識 |
9月5日(金) 13:10-15:40 7n会場
座長 岡原 浩平(三菱電機) |
I-026 |
深層学習によるSNSにおけるハッシュタグ自動推薦に関する研究
◎奈須田 潤平・張 善俊(神奈川大学)・吉野 和芳(神奈川工科大学)
×
I-026深層学習によるSNSにおけるハッシュタグ自動推薦に関する研究
◎奈須田 潤平・張 善俊(神奈川大学)・吉野 和芳(神奈川工科大学)
ソーシャルメディアへの画像の投稿は、テキスト情報やユーザーやコミュニティによって付与された独自の文脈、当時のトレンドなど視覚的情報に留まらない様々な情報が反映されている。ハッシュタグはこのような付属された情報を明示し、投稿の分類やアクセス性を向上させる上で有用に働く。一方でハッシュタグが有用に機能するためにはユーザー自身が正確なハッシュタグを自分で選定する必要があり、ユーザーへの負担や正確性の側面で課題が残っていると考えられる。本研究は深層学習によって視覚情報以外の情報も汲み取った上で適切なハッシュタグを推薦することで、画像の検索性やアクセス性を向上させる事をテーマとしている。 |
I-027 |
(講演取消) |
I-028 |
3次元マルチフラクタル解析法に向けた2次元マルチフラクタル解析法の拡張手法の検証
◎高原 朗・佐藤 圭浩(東京都市大学)
×
I-0283次元マルチフラクタル解析法に向けた2次元マルチフラクタル解析法の拡張手法の検証
◎高原 朗・佐藤 圭浩(東京都市大学)
近年、2次元マルチフラクタル解析を用いてコンポジット材料の定量評価手法の検討がなされ、2次元マルチフラクタル解析値と物性値との関連があることが明らかにされた。しかしながら、実際の材料は3次元構造を持ち、2次元解析から物性値の対応関係を正確に把握することが難しい。そこで本研究では2次元フラクタル解析の拡張によって、3次元フラクタル解析値を把握することを目的とし、2次元フラクタル解析法を拡張し厚みを持たせた2次元フラクタル手法を考案した。実験では3次元自己組織化構造をシミュレーションし、その断面を用いて提案手法の分析を行った。 |
I-029 |
ファインチューニング手法に基づく被災建物画像の多クラス損傷度分類の精度改善
◎山田 悠人・鈴木 海友・松田 一朗・多賀 祥平・松澤 智史・柏田 仁・二瓶 泰雄(東京理科大学)
×
I-029ファインチューニング手法に基づく被災建物画像の多クラス損傷度分類の精度改善
◎山田 悠人・鈴木 海友・松田 一朗・多賀 祥平・松澤 智史・柏田 仁・二瓶 泰雄(東京理科大学)
地震・津波など大規模自然災害直後に被災家屋の損傷度及び原因を正確に判定することは,防災対策の観点から重要である.しかし現在,その判定は専門家の目視に依存しており,自動化が強く求められている.先行研究においてResNet-50-単一モデルを用いたファインチューニングに基づく手法が提案されているが,モデルや学習手法の改善による精度向上の余地が残されていた.そこで本研究では,異なるアーキテクチャの事前学習済みモデルを比較すると共に,効率的なファインチューニング手法であるLow-Rank Adaptation(LoRA)の導入を図った.実験の結果,先行研究を上回る分類精度を達成することが確認された. |
I-030 |
光学ズームによる焦点変化を利用した映り込み除去手法
◎小田 舞遥・宮本 拓実・松岡 諒(北九州市立大学)
×
I-030光学ズームによる焦点変化を利用した映り込み除去手法
◎小田 舞遥・宮本 拓実・松岡 諒(北九州市立大学)
近年,監視カメラや車載カメラの普及により,ガラス越しの撮影が増加し,映り込みが物体認識や画像処理に悪影響を与える課題がある.既存手法は深層学習や偏光カメラを用いるが,実用性や汎用性に課題がある.そこで本研究では,光学ズームによる焦点距離と被写体サイズの変化を利用し,ズームイン・アウト画像を参照に背景エッジを検出し,最適化により背景と映り込みを分離する手法を提案する.この手法は,モデルのトレーニングや特殊なカメラ機器を必要とせず,汎用性の高い一般的なカメラで撮影された画像のみを用いて映り込みを除去できる.実験では,入力画像および参照画像を用いて,提案手法と最適化問題に基づく従来手法を定量的・定性的に比較した.その結果,提案手法の有効性が示された. |
I-031 |
複素グラフ表現を用いた色差復元に基づく画像ステガノグラフィの提案
◎新名 栞里・雨車 和憲(工学院大学)
×
I-031複素グラフ表現を用いた色差復元に基づく画像ステガノグラフィの提案
◎新名 栞里・雨車 和憲(工学院大学)
画像ステガノグラフィはデータハイディングの一種であり,情報が隠されていること自体を気づかせずに画像に別の情報を埋め込むことを目的としている. 従来手法では,輝度画像から作成される変換行列を利用して色差成分を低次元に圧縮する手法を用いて,効率的な画像ステガノグラフィが提案されている. このとき,変換行列の作成にはグラフ信号値復元が用いられているが,画像が持つRGB成分を効果的に利用できているとは言えない. この問題に対し,本研究では複素数グラフ表現を用いることで,より効果的な画像ステガノグラフィの手法を提案する. |
I-032 |
大規模並列計算アーキテクチャに基づく画像処理プログラムの高速化に関する考察
○河畑 則文(金沢大学)
×
I-032大規模並列計算アーキテクチャに基づく画像処理プログラムの高速化に関する考察
○河畑 則文(金沢大学)
画像処理を始めとするグラフィックスに関するプログラムを実行する際には,計算時間と処理能力がパラメータとして必要となる.特に,計算アーキテクチャを並列計算処理して実行することで高速化するとされるが,画像処理毎にどの程度の並列処理や実行環境であればよいかは明らかではない.本研究では,まず,複数の画像処理プログラムを準備し,その後,プログラムの高速化を目的として,大規模並列計算のアルゴリズムとアーキテクチャを考慮して画像処理プログラムの検証実験を行い,その結果を考察した. |