H分野 画像認識・メディア理解 |
選奨セッション コンピュータビジョン・パターン認識(1) |
9月3日(水) 9:30-12:00 1f会場
座長 古田 諒佑(東京大学)
金子 直史(東京電機大学) |
CH-001 |
時系列行動セグメンテーションにおける汎用的性能向上のための行動境界識別用チャネル拡張手法の提案
◎光岡 日菜子・堀田 一弘(名城大学)
×
CH-001時系列行動セグメンテーションにおける汎用的性能向上のための行動境界識別用チャネル拡張手法の提案
◎光岡 日菜子・堀田 一弘(名城大学)
本研究では,時系列行動セグメンテーションにおける認識精度向上を目的とし,出力チャネルを1つ追加して行動境界を予測させるシンプルな拡張手法を提案する.既存のモデルに対し軽微な変更のみで適用可能であり,行動境界の識別専用のブランチを設ける従来手法に比べて構造の複雑化を回避できる.50SaladsおよびGTEAデータセットにおいてMS-TCNおよびFACTに適用し,定量・定性の両面で効果を検証した結果,提案手法はベースラインおよび従来手法と比較して同等以上の性能を示し,オーバーセグメンテーションの緩和にも寄与することが確認された. |
CH-002 |
雲画像とキャプション生成を統合した雲形分類モデルの検討
○西野 大河・矢野 耕太郎・遠藤 聡志(琉球大学)・武井 弘樹(ウェザーニューズ)
×
CH-002雲画像とキャプション生成を統合した雲形分類モデルの検討
○西野 大河・矢野 耕太郎・遠藤 聡志(琉球大学)・武井 弘樹(ウェザーニューズ)
雲は降水予測の重要な手がかりであり、特に積乱雲の発生は急激な天候変化を示すため、雲形分類の精度向上が求められる。近年、画像とテキスト情報を統合するVLMが注目されており、キャプション生成を通じて分類精度の向上に寄与する可能性が示唆されている。本研究では、地上で撮影した雲画像とその画像から生成されたキャプションを統合することで、画像の視覚的特徴を言語化し、分類モデルが重要なパターンを捉えやすくなることを目指す。実験では、BERTによるテキスト分類と、画像とキャプションの特徴を統合して行うMLPによる分類を実施し、画像単独での分類と比較して精度向上を評価する。 |
CH-003 |
固定カメラ画像に対する降雨強度推定に向けた注視改善を伴う回帰モデルの構築
◎矢野 耕太郎・遠藤 聡志(琉球大学)・武井 弘樹(ウェザーニューズ)
×
CH-003固定カメラ画像に対する降雨強度推定に向けた注視改善を伴う回帰モデルの構築
◎矢野 耕太郎・遠藤 聡志(琉球大学)・武井 弘樹(ウェザーニューズ)
空画像に降雨強度を付与し実況の気象をリポートすることにより、局所的な降雨観測が可能となる。本研究では定点カメラ画像とレーダ雨量計の観測結果からデータセットを構築し、EfficientNetV2B0による回帰モデルにより降雨強度を推定した。Byunらの従来手法に比べ、降雨強度レベル分類を前処理に取り入れることで推定精度を向上させた。しかしGrad-CAM++による可視化では不適切な注視傾向が確認された。そこでCNNベースのモデルに代えて、Vision TransformerにおけるAttention機構を活用し、注視点と精度の改善を試みる。 |
CH-004 |
Abnormal detection in nuclear security based on label-specific threshold-free mechanism and future frame prediction network
◎李 湛・菅原 和将・出町 和之(東京大学)
×
CH-004Abnormal detection in nuclear security based on label-specific threshold-free mechanism and future frame prediction network
◎李 湛・菅原 和将・出町 和之(東京大学)
This paper mainly focus on the abnormal detection of surveillance camera videos in nuclear security, to maintain the stable and safe operation of nuclear power plants. Based on traditional calculation framework, the reasoning results tend to be identical without discriminative ability. In this research, a label-specific threshold-free framework is applied to solve such limitations. Furthermore, a future frame prediction network is proposed and obtained better performances than our previous work, with obviously higher accuracy value of 0.7917 and higher F1-score value of 0.8000. |
CH-005 |
フーリエ密度モデルのパラメータ設定と画像圧縮への応用
◎大貫 創悟・孫 鶴鳴(横浜国立大学)
×
CH-005フーリエ密度モデルのパラメータ設定と画像圧縮への応用
◎大貫 創悟・孫 鶴鳴(横浜国立大学)
近年では圧縮技術に深層学習が多く取り入れられている。この場合、入力信号の畳み込み後の潜在変数を符号化するが、学習によってその潜在変数の分布は異なるから、ここに数理モデルを置いた適切な潜在変数分布推定を行うことが必要である。本研究では、フーリエ密度モデルを定義・実装し学習型画像圧縮を例に学習を行うほか、学習パラメータ設定を分析し調整を行った。その結果、既存のノンパラメトリック密度モデルよりも実際の潜在変数分布に対するKL距離を小さくし、適切な推定を可能とした。また、パラメータ数の増加に伴い、よりフィッティング性能を高めた。 |
選奨セッション コンピュータビジョン・パターン認識(2) |
9月3日(水) 13:10-15:10 2f会場
座長 荻野 有加(日本電気株式会社)
伊東 聖矢(情報通信研究機構) |
CH-006 |
説明性向上マルチモーダルAIによるMOCの潜在的異常見える化
○中井 淳一(アドヴィックス)・藤村 拓弥(名古屋大学)・髙田 将典・浅野 憲司・若松 智之(アドヴィックス)・戸田 智基(名古屋大学)
×
CH-006説明性向上マルチモーダルAIによるMOCの潜在的異常見える化
○中井 淳一(アドヴィックス)・藤村 拓弥(名古屋大学)・髙田 将典・浅野 憲司・若松 智之(アドヴィックス)・戸田 智基(名古屋大学)
弊社では、主力製品であるMOC(Motor on Caliper)を題材にDX推進に向けた研究開発を行っている。MOCの複雑な機構から発生する複数の時系列データをマルチモーダルAIで処理し、異常の発生の予見を狙う。具体的には、異常の要因調査は、経験者(品管担当・設計者)の熟練したスキルが必要となるため、生産規模拡大時には経験者を増やさないといけない。しかし、経験者でも、MOCの異常の要因調査は、異常が増加してからでないと行えず、異常の兆候となる潜在的異常を捉えられていない。このような、広く自動車部品に共通する問題に対して報告する。この問題に対し、我々の提案手法は、AIならではの潜在的異常抽出を可能とし、異常の発生を予見する。 |
CH-007 |
弱教師あり領域分割のための高品質な疑似ラベルの選択
◎藤森 和泉・大野 将樹・獅々堀 正幹(徳島大学)
×
CH-007弱教師あり領域分割のための高品質な疑似ラベルの選択
◎藤森 和泉・大野 将樹・獅々堀 正幹(徳島大学)
画像レベルのクラスラベルのみを用いる弱教師あり領域分割(WSSS)は,疑似ラベルのノイズを学習し,領域分割モデルは性能が低下することが知られている.半教師あり領域分割(SSSS)は,限られた量の正解データであっても,データの正確性が,領域分割精度を向上させる.これらの背景を踏まえ,本論文では,WSSSの疑似ラベルの中から高品質な疑似ラベルを選択し,選択された疑似ラベルに対応する画像をラベル付き画像とし,残りの画像をラベルなし画像として,SSSSの学習手法に適用することを提案する.本手法の有効性を示すために,PASCAL VOC 2012データセットを用いた実験を行った.その結果,従来のWSSSに比べて領域分割精度が向上することが確認された. |
CH-008 |
ステレオビジョンと深層学習を用いた卓球競技におけるデータ分析システムの開発
◎羽鳥 駿久・伊藤 建一・上島 慶(新潟工科大学)
×
CH-008ステレオビジョンと深層学習を用いた卓球競技におけるデータ分析システムの開発
◎羽鳥 駿久・伊藤 建一・上島 慶(新潟工科大学)
卓球競技において、戦術解析を進める上で打球情報は非常に有用な情報となる。本研究では、卓球競技におけるボールの動態解析を行うためステレオビジョンと深層学習を組み合わせたデータ分析システムを開発を目的とする。ステレオカメラで取得した2視点画像に対して深層学習によるボール検出を行い、推定された左右画像それぞれのボールの2次元座標から三角測量の原理を用いてボールの3次元位置を推定する。さらにイベントの自動検出を行い、試合中の打球とバウンスイベントの位置を推定した。提案手法により、卓球プレーの定量的な分析が実現可能であることを示した。 |
CH-009 |
(講演取消) |
CH-010 |
Orientation Estimation of 3D Human Scans Using Interior Point Clouds and Vision Transformer
◎李 伊晴・藤田 悟(法政大学)
×
CH-010Orientation Estimation of 3D Human Scans Using Interior Point Clouds and Vision Transformer
◎李 伊晴・藤田 悟(法政大学)
We propose a novel method for estimating the facing direction of human 3D scan data using Vision Transformers (ViT). Unlike existing approaches that rely on clean, standardized poses, our method handles noisy scans of various poses by extracting interior point clouds, which are more stable and informative. Interior point clouds are then sliced horizontally and projected into 2D binary images for ViT-based orientation prediction. Our results improved robustness and accuracy, highlighting the method’s potential for applications such as automatic rigging, 3D scan alignment, and avatar animation. |
コンピュータビジョン・パターン認識(3) |
9月3日(水) 13:10-15:10 2p会場
座長 堀田 一弘(名城大学) |
H-001 |
3Dガウススプラッティングを用いた3次元再構成における静止物体の除去
◎菊地 佑太・小池 敦・山田 和範(東北大学)
×
H-0013Dガウススプラッティングを用いた3次元再構成における静止物体の除去
◎菊地 佑太・小池 敦・山田 和範(東北大学)
環境の画像から自由視点画像を得る技術として3D Gaussian Splatting(3DGS)がある。ドローンを用いて屋外撮影をする場合、時刻とともに人や物の位置が変化してしまうため、3次元再構成が困難になるが、それに対する対策なども研究されている。本研究では映り込んだ不要物体を除去することを考える。提案手法では、テキストで除去する物体を指定することで、自由視点画像から所望の物体を除去することができる。これによりドローン画像の3次元再構成への活用がしやすくなる。これを実現するために、学習用画像から不要な物体をCLIP等のマルチモーダル画像分類器で同定し、再構成画像の最適化を試みた。 |
H-002 |
顕著性マップから抽出した関心領域に基づく視線遷移予測
◎大野 永遠・田中 雄一・東 広志(大阪大学)
×
H-002顕著性マップから抽出した関心領域に基づく視線遷移予測
◎大野 永遠・田中 雄一・東 広志(大阪大学)
人が視覚情報を収集する際の視線遷移は,人間の複雑な視覚プロセスを解明するための重要な手掛かりである.視線遷移は,Fixation(視点が一定期間留まる点)とSaccade(Fixation 間の素早い遷移)から成るScanpath で構成され,多数の予測モデルが提案されてきた. 従来モデルの多くはFixation座標に基づき次の注視点を予測するが,人間の視線は座標ではなく対応する物体に向けられると考える方が自然である. そこで本研究では,各Fixationを興味対象物体に対応付け,次の注視対象を予測するモデルを提案する.提案モデルは,次に視線が向かう領域の予測において従来手法を上回る性能を示した. |
H-003 |
廃炉作業における原子炉内環境モデリング: カメラ軌道推定にもとづく遠隔操作機器の移動記録生成
○羽成 敏秀・今渕 貴志・川端 邦明(日本原子力研究開発機構)
×
H-003廃炉作業における原子炉内環境モデリング: カメラ軌道推定にもとづく遠隔操作機器の移動記録生成
○羽成 敏秀・今渕 貴志・川端 邦明(日本原子力研究開発機構)
我々は福島第一原子力発電所の廃炉作業における原子炉格納容器内からの安全かつ着実な燃料デブリ取り出し作業を支援するために、作業空間を迅速に3次元モデリングするための研究開発を進めている。その一環として、長時間撮影された動画データから撮影に使用した遠隔操作機器の移動を推定し、その移動記録の生成する手法の開発を行っている。この遠隔操作機器の移動の推定のために、動画から抽出された時系列画像からオプティカルフローを計算し、画像間の相対的な位置の変化を求める手法の適用を試みた。本発表では、移動と停止を繰り返す動画に対して本手法の適用性を検証する実験を行った結果について報告する。 |
H-004 |
サンプリング点の最適化とCoarse-to-fineの統合
◎有村 玲音・太田 和宏・向田 眞志保・小野 智司(鹿児島大学)
×
H-004サンプリング点の最適化とCoarse-to-fineの統合
◎有村 玲音・太田 和宏・向田 眞志保・小野 智司(鹿児島大学)
Neural Radiance Fields(NeRF)は高品質な3次元再構成が可能であり,自由視点画像生成の分野で注目されている.NeRFモデルのサンプリング点が対象シーンに対して適切でない場合に,レンダリング画像の品質が低下する問題がある.このため,シーンの特性に基づいて適応的にサンプリング点を選択するSampling Point Optimization(SPO)が提案されており,従来のNeRFよりもレンダリング品質が向上することが確認されている.一方,従来のNeRFはcoarse-to-fineによるモデル訓練により性能を上げており,SPOにC2F訓練を組み合わせることで,性能の向上が期待できる.本研究では,SPOにC2Fを統合することによる性能の変化を検証し,さらなるレンダリング画像の品質向上を目指す. |
H-005 |
観測画像と環境情報を活用した高精度GPRデータ生成モデルの提案
○谷口 功・辰巳 嵩豊・村田 大智・安藤 健人(日立製作所)
×
H-005観測画像と環境情報を活用した高精度GPRデータ生成モデルの提案
○谷口 功・辰巳 嵩豊・村田 大智・安藤 健人(日立製作所)
近年、GPR(Ground Penetrating Radar)データを用いた地中埋設物検出に深層学習を活用 する研究が進展しているが、高精度な検出には大規模なデータセットが必要であり、その取 得は困難である。本論文では、任意の観測環境や観測物体に対応した観測画像を生成する新 たな手法を提案する。生成モデルの入力に観測画像とともに、導電率や地下埋設物の形状な どの環境情報を条件として加えることで、環境特性を忠実に反映したデータ生成を可能にし た。さらに、導電率を条件として入力した実験では、導電率の変化に応じた生成画像の視覚 的変化が確認され、提案手法の有効性が示された。 |
コンピュータビジョン・パターン認識(4) |
9月3日(水) 13:10-15:10 2q会場
座長 川上 玲(東京科学大学) |
H-006 |
尿路上皮細胞診システムにおけるSemantic Segmentation用学習画像の自動生成
◎箱井 星音・大野 将樹・尾矢 剛志・常山 幸一・獅々堀 正幹(徳島大学)
×
H-006尿路上皮細胞診システムにおけるSemantic Segmentation用学習画像の自動生成
◎箱井 星音・大野 将樹・尾矢 剛志・常山 幸一・獅々堀 正幹(徳島大学)
尿細胞診は患者に与える負担が少ない臨床検査であるが,一部の検査工程は手作業であるため多大な時間と労力が必要である.そこで,深層学習を用いた細胞診断の自動化手法として,国際的な診断基準に準拠した診断システムが提案された.このシステムの課題は,領域分割画像から算出した核と細胞質の比(N/C 比)の過小評価によって誤判定が生じることである.領域分割モデルとして使用したU-netの学習用領域分割画像のN/C比が基準を下回っていたことが要因とみられる.本研究では,細胞の分類クラスに応じたN/C比の基準を満たす学習用領域分割画像の生成手法を提案する.提案手法で生成した画像でU-netの学習を行い,生成画像のN/C比を評価する. |
H-007 |
深層学習による各家庭の給湯消費電力量の予測: Uncertainty Weightingによる分類・回帰のマルチタスク学習
○新美 潤一郎(名城大学/理化学研究所)・塚本 高浩(中京大学)・竹内 真登(名古屋市立大学)・柴田 与夢(リンナイ)
×
H-007深層学習による各家庭の給湯消費電力量の予測: Uncertainty Weightingによる分類・回帰のマルチタスク学習
○新美 潤一郎(名城大学/理化学研究所)・塚本 高浩(中京大学)・竹内 真登(名古屋市立大学)・柴田 与夢(リンナイ)
近年では、各家庭での電力消費パターンの多様化が進んでいる。しかしながら、従来的な分析手法ではこれら複雑化する消費形態を十分に捉えきれておらず、発電計画やピークシフトの策定にあたり高精度の予測モデルの作成が急務となっている。そこで本研究では、給湯器から取得したIoTログを用いて、ある単位時間における給湯電力の消費の有無とその量を同時予測することにより予測値を補正し、最終的な消費量を高精度で予測可能なマルチタスク型深層学習モデルを提案する。解析では、Transformer等を含む主要な参照モデルを用いた網羅的な比較検討により、提案モデルの有用性を示した。 |
H-008 |
Realtime Scene-aware Human Motion Prediction
◎須藤 雅基・張 善俊・清藤 汐音(神奈川大学)
×
H-008Realtime Scene-aware Human Motion Prediction
◎須藤 雅基・張 善俊・清藤 汐音(神奈川大学)
In recent years, real-time applications such as human–computer interaction and safety monitoring have demanded methods capable of predicting a person’s future motions with both high accuracy and high speed. In this study, we propose a framework that takes a 2D image and the preceding motion sequence as inputs, and rapidly predicts human movement while taking surrounding objects into consideration. |
H-009 |
画像認識AIを用いたエレキベース演奏映像における運指推定
◎宇治田 良輔・黒木 修隆・沼 昌宏(神戸大学)
×
H-009画像認識AIを用いたエレキベース演奏映像における運指推定
◎宇治田 良輔・黒木 修隆・沼 昌宏(神戸大学)
本研究では,物体検出AIのYOLOv9と手の姿勢推定AIのMediaPipe Handsを用いて,エレキベース演奏映像から運指動作を自動で推定する手法を提案する.評価実験の結果,本手法は演奏者やエレキベースの機種に依存することなく動作し,84.6%の推定精度を達成した. |
H-010 |
生成AIによる視覚的確認機能を備えたファッション画像推薦システム
◎奥村 侑生・黒木 修隆・沼 昌宏(神戸大学)
×
H-010生成AIによる視覚的確認機能を備えたファッション画像推薦システム
◎奥村 侑生・黒木 修隆・沼 昌宏(神戸大学)
本研究では、ファッション画像に対する推薦と視覚的確認を可能にするシステムの構築を目的とする。コーディネート画像からYOLOv9により上衣・下衣を検出し、CLIPのImageEncoderを用いて特徴を抽出する。得られた特徴は商品データセットと比較され、類似アイテムを推薦する。推薦結果は仮想試着を通じて視覚的に確認できる。 |
コンピュータビジョン・パターン認識(5) |
9月3日(水) 15:30-17:30 3p会場
座長 榎田 修一(九州工業大学) |
H-011 |
ハイパースペクトルカメラによる高次元分光画像を用いた青果物の非破壊糖酸比推定の精度検証:みかんを対象として
◎桑原 拓大・栗原 陽介(青山学院大学)
×
H-011ハイパースペクトルカメラによる高次元分光画像を用いた青果物の非破壊糖酸比推定の精度検証:みかんを対象として
◎桑原 拓大・栗原 陽介(青山学院大学)
青果物の味は消費者の購買意思決定において主要な要因の一つであり,その風味や鮮度の重要な評価指標として糖酸比が用いられている.しかし,従来の糖度および酸度の測定法では,糖酸比を非破壊で計測することが困難である.本研究では対象とする成果物をみかんとし,ハイパースペクトルカメラによる高次元分光画像から得られる吸光スペクトルから,糖酸比を非破壊で推定する手法を提案する.吸光スペクトルに対して照度のばらつき補正のため標準正規変換を適用し,2次曲線への決定係数を特徴量とする.得られた特徴量に対し,ガウス過程回帰を適用した結果,RMSEが2.23の精度で糖酸比の推定を行えることが確認された. |
H-012 |
YOLOとエッジ検出を用いた自動二輪車向けの道路損傷検出
◎柳 祐希・藤村 春允・藤村 真生(大阪工業大学)
×
H-012YOLOとエッジ検出を用いた自動二輪車向けの道路損傷検出
◎柳 祐希・藤村 春允・藤村 真生(大阪工業大学)
自動二輪車は自動車よりも路面の影響を受けやすく、ひび割れ、穴、凹凸などの損傷が転倒や車両損傷のリスクを高める。特に自動二輪車は、ヘルメットの着用により運転者の視界が遮られ、損傷の発見や回避が遅れる場合がある。そのため、運転者が走行中に損傷を認識し、安全に回避することが重要である。また、道路の点検は主に人手によって行われており、全国の道路調査には多くの時間と労力を要し、損傷が修繕されず残る場合がある。そこで、運転者が走行中に路面の状況確認を支援する仕組みの導入が効果的だと考えた。本研究では、自動二輪車の走行中に撮影した映像に対し、YOLOとエッジ検出を用いて、損傷を検出するシステムを構築する。 |
H-013 |
Visual Wordを活用した自己位置推定の最適化手法の提案
○HYUN JUWON・赤嶺 有平(琉球大学)・根路銘 もえ子(沖縄国際大学)
×
H-013Visual Wordを活用した自己位置推定の最適化手法の提案
○HYUN JUWON・赤嶺 有平(琉球大学)・根路銘 もえ子(沖縄国際大学)
拡張現実(AR)では、現実世界に仮想コンテンツを正確に重ね合わせることで、臨場感や没入感のある体験を提供することができる。また、ユーザーにより自然で快適な体験を提供するためには、現実世界に仮想コンテンツを正確な位置に重ね合わせて表示する必要がある。さらに、近年ではモバイル端末によるARコンテンツの需要が高まっており、限られたバッテリや処理性能下での効率的な自己位置推定を実現することが求められている。 本研究では、特徴量をK-meansクラスタリングすることで求められる中心点(Visual Word)に自己位置推定に必要なSfMで再構築された3次元構造データ及びSIFTで得られた特徴量データを割り当てる。これにより、ユーザーが撮影した画像のVisual Wordを求めることで自己位置推定に必要なデータを絞り込み、高速かつ効率的に自己位置推定が可能になる。 |
H-014 |
物体追跡と深層学習による歩容認証を用いた動画像データに基づく放牧牛の自動個体識別
◎坂本 直暉・大川 剛直・大山 憲二(神戸大学)
×
H-014物体追跡と深層学習による歩容認証を用いた動画像データに基づく放牧牛の自動個体識別
◎坂本 直暉・大川 剛直・大山 憲二(神戸大学)
近年,畜産農家の高齢化や減少が深刻化しており,動画像解析による飼養管理の自動化が注目されている.特に黒毛和種の牛は,色や斑紋といった外観特徴の利用が困難であるため,外観に依存しない歩容認証による個体識別が有効である.本研究では,特定のスペースを自由に動き回る牛を対象とし,多様な歩行経路による個体内変動に対応可能な深層学習に基づく歩容認証手法GaitSetに着目する.歩行画像系列の取得には物体追跡手法YOLOv5+DeepSORT,歩行シルエット抽出にはセグメンテーションのための基盤モデルSegment Anything Modelを用い,これらを統合した放牧牛の自動個体識別の枠組みを提案する. |
H-015 |
奄美希少野鳥の鳴き声特徴抽出および自動識別について
◎上村 優介・福元 伸也・鹿嶋 雅之・渡邊 睦・鵜川 信・榮村 奈緒子(鹿児島大学)
×
H-015奄美希少野鳥の鳴き声特徴抽出および自動識別について
◎上村 優介・福元 伸也・鹿嶋 雅之・渡邊 睦・鵜川 信・榮村 奈緒子(鹿児島大学)
2021年に生物の多様性などが評価され, 奄美大島が世界自然遺産に登録された. 継続的な希少種の存在確認の重要性が増す一方で, 調査には時間を要することに加え人の存在が調査を妨げることが課題となっている. そこで, 本研究では録音された環境音から野鳥の種類を判別する機械学習モデルの作成を行った. 音源から2秒ごとにスペクトログラム画像を作成し, これを人の手によって分類した教師画像をGMM-HMM, DNN-HMM, RNN, CNNで学習させ, 識別結果を比較した. 学習したのは絶滅危惧種を含む奄美大島に生息する野鳥10種である. 結果として, CNNで93.5%の識別精度を得ることができた. 今後はデータベースやサーバーを設置し, システム全体の自動化を進めていく. |
H-016 |
Development of an intelligent shopping robot based on human-robot visual communication: Segmentation and recognition of a display object's barcode
◎Pham Flora Thach Thao・丹上 結乃純(九州工業大学)
×
H-016Development of an intelligent shopping robot based on human-robot visual communication: Segmentation and recognition of a display object's barcode
◎Pham Flora Thach Thao・丹上 結乃純(九州工業大学)
In the context of growing aging population, this study proposes an intelligent shopping robot which may contribute to improving elderly people's quality of life by giving them more autonomy. An autonomous robot is proposed that employs visual communication with a distant user at a shopping site for targeting an object which the user wishes to get, and gives warning, if necessary, for dietary restrictions specified by the user. This is realized by recognizing the barcode of the object. This paper presents segmentation and recognition methods of a barcode on a real object with some experimental results. |
コンピュータビジョン・パターン認識(6) |
9月4日(木) 9:30-12:00 4n会場
座長 斎藤 英雄(慶応義塾大学) |
H-017 |
単眼深度推定とモデル予測制御に基づく小型ドローンの動的障害物回避
◎藤本 涼・嶋田 知泰(立命館大学)・孔 祥博(富山県立大学)・冨山 宏之(立命館大学)
×
H-017単眼深度推定とモデル予測制御に基づく小型ドローンの動的障害物回避
◎藤本 涼・嶋田 知泰(立命館大学)・孔 祥博(富山県立大学)・冨山 宏之(立命館大学)
近年,多岐にわたる産業分野でドローンの利用が急拡大し,人と空間を共存する自律飛行への需要が高まっている.航空法改正に伴い100 g以上の機体は登録や許可が必須となり,小型ドローンの展開が一層期待される.しかし,動的障害物回避には高性能なセンサーが必要である一方,高価かつ重量制約により小型ドローンへの搭載が困難である.そこで本研究では,単眼カメラによる絶対深度推定とモデル予測制御(MPC)を融合した動的障害物回避手法を提案する.シミュレーション評価では,障害物の正面往復移動で94 %,横往復移動で82 %の回避成功率を達成した. |
H-018 |
「正常サンプル」の曖昧さを考慮した異常検知シナリオにおける従来の外観検査手法とVQ-FastFlowの比較検証
◎齋藤 令次・堀田 一弘(名城大学)
×
H-018「正常サンプル」の曖昧さを考慮した異常検知シナリオにおける従来の外観検査手法とVQ-FastFlowの比較検証
◎齋藤 令次・堀田 一弘(名城大学)
深層学習を用いた外観検査では,異常サンプルの不足や多様性に対応するため,正常サンプルのみを用いた学習による異常検知が有効とされている.しかし,実際の現場では「正常サンプル」の定義は曖昧であるため,仕様変更に柔軟な対応が求められる.本稿では,背景ノイズによる誤検出を抑制可能なVQ-FastFlowを用いることにより,仕様変更に対する頑健性の向上を目指す.また,従来の評価指標では正しく評価されない問題を解決するため,AUACの差分を積分する新たな評価指標を提案する.VQ-FastFlowはA2Nシナリオでは従来手法を上回る性能を示し,N2Aシナリオでは従来手法と同等の性能を示した. |
H-019 |
Semi-supervised Unmixing for Hyperspectral images
◎XIE WEIXUAN・鎌田 清一郎(早稲田大学)
×
H-019Semi-supervised Unmixing for Hyperspectral images
◎XIE WEIXUAN・鎌田 清一郎(早稲田大学)
This paper proposes a novel semi-supervised framework for hyperspectral unmixing using limited prior information—specifically, endmember abundance distributions. The framework estimates endmember spectra and corresponding pixel-wise abundances through two separate pathways. Endmember spectra are initialized with prior knowledge and refined via backpropagation. Abundances are predicted using a dual-branch Mamba module that extracts spectral and spatial features independently. Experiments on datasets like Urban demonstrate improved accuracy, generalization, and faster convergence compared to existing methods. |
H-020 |
深さ分離畳み込みと多次元協調注意機構を利用した効率的な単眼深度推定
◎東内 元気・嶋田 知泰(立命館大学)・孔 祥博(富山県立大学)・冨山 宏之(立命館大学)
×
H-020深さ分離畳み込みと多次元協調注意機構を利用した効率的な単眼深度推定
◎東内 元気・嶋田 知泰(立命館大学)・孔 祥博(富山県立大学)・冨山 宏之(立命館大学)
自己教師あり単眼深度推定は、RGBカメラ単体で深度画像を推定できる手法として自動運転や無人搬送車などのシーン理解に広く用いられているが、高精度な大規模モデルは演算コストが大幅に増加するため、リソース制約のあるエッジデバイス上での実装が困難である。そこで本研究では、(1)デコーダ内の3×3畳み込みを深さ方向分離畳み込み(Depth Separable Convolution)に置き換え、(2)エンコーダとデコーダ間のスキップ接続直前に多次元協調注意機構(Multidimensional Collaborative Attention Module)を挿入し、(3)エンコーダ最深層の畳み込みブロックを10層から4層に削減した。KITTIベンチマーク上の評価では、提案手法がLite-Monoと比べて学習可能パラメータ数を約42.1%削減(1.8M)すると同時に、平均二乗相対誤差を約4.5%改善した。 |
H-021 |
Finetuning-Less 視差推定に向けた NeRFを用いた学習データ生成の検討
◎中野 和香子・谷村 崇仁・城戸 英彰(日立製作所)・入江 耕太(Astemo)
×
H-021Finetuning-Less 視差推定に向けた NeRFを用いた学習データ生成の検討
◎中野 和香子・谷村 崇仁・城戸 英彰(日立製作所)・入江 耕太(Astemo)
自動運転の視差推定において,複数車種の実車でのラベル付き学習データの収集は,LiDARやカメラ設置コストが高く十分なデータ取得が困難である.従来は,ゲームエンジンによる合成データで事前学習し,少数の実車データでFinetuningを実施していた.近年はNeRF等の深層学習を用いた高精度シミュレーション技術が注目されているが,生成視差の精度の課題から実車データの活用は必須である.本研究では,カメラ画像とLiDAR情報を組み合わせたNeRFによる写実性の高い学習データの自動生成パイプラインを構築,生成データで学習した視差推定モデルの評価を通じFinetuning依存の低減可能性を検討する. |
H-022 |
MediaPipeを用いた多視点画像による3Dポーズ推定法の検討
◎徳田 泰地・弘中 哲夫(広島市立大学)
×
H-022MediaPipeを用いた多視点画像による3Dポーズ推定法の検討
◎徳田 泰地・弘中 哲夫(広島市立大学)
本研究では、少ないカメラでも多くのランドマークを正確に検出可能な3Dポーズ推定手法の開発を目的とし、MediaPipe Poseと三角測量を組み合わせた新たな3Dポーズ推定法を提案し、その精度を評価した。提案手法では、複数のカメラ映像から2Dポーズを推定し、それらを基に三角測量を行うことで3Dランドマークを復元する。CMU Panopticデータセットを用いた実験により、わずか2台のカメラで32個の3Dランドマークを復元可能であること、さらに軽度の遮蔽があっても安定した推定が可能であることを確認した。今後は、処理速度や精度に関する定量的な評価を通じて、実用化に向けた検証を進める必要がある。 |
コンピュータビジョン・パターン認識(7) |
9月4日(木) 9:30-12:00 4p会場
座長 カストナー マークアウレル(広島市立大学) |
H-023 |
画像分類のための色変換行列最適化
◎昇 洋太・小篠 裕子(東京電機大学)・田中 正行(東京科学大学)
×
H-023画像分類のための色変換行列最適化
◎昇 洋太・小篠 裕子(東京電機大学)・田中 正行(東京科学大学)
深層学習モデルの認識精度は、モデル構造や学習手法のみならず、入力画像の特性、とりわけ色彩情報にも大きく左右される。本研究は、入力画像の色彩情報を決定づけるカメラの色変換行列(CCM)に着目する。特に、深層学習モデルの画像分類性能を最大化することを目的とし、カメラの色変換行列(CCM)を設計する手法を提案する。具体的には、CCMのパラメータを深層学習モデル内に組み込み、分類タスクの損失関数を用いてモデルパラメータと同時に最適化する。実験により、本手法で最適化されたCCMを用いた場合、標準的なCCMを用いる場合と比較して、画像分類精度の向上した。 |
H-024 |
ニューラル場表現による大規模空間における自由視点映像生成手法の検討
○服部 航大・北原 格・謝 淳(筑波大学)
×
H-024ニューラル場表現による大規模空間における自由視点映像生成手法の検討
○服部 航大・北原 格・謝 淳(筑波大学)
本研究では、ニューラル場表現を用いてサッカースタジアムのような大規模空間を対象とした自由視点映像生成手法を提案する。サッカーシーンは、撮影空間が広大である一方で、選手領域は画面上で小さく観測されるため、精緻な三次元再構成が求められ、大規模空間を表現可能なニューラルネットワークの構築が必要である。本手法では、サッカーシーンの多視点画像から、観測サイズと射影歪みを補正した選手領域画像群を生成し、それらからニューラル場表現を学習することで、大規模空間に適した自由視点映像の生成を目指す。 |
H-025 |
複数の深層学習モデルを用いた広角画像からのブドウ葉検出手法の検討
◎三浦 怜・小嶋 和徳・伊藤 慶明(岩手県立大学)
×
H-025複数の深層学習モデルを用いた広角画像からのブドウ葉検出手法の検討
◎三浦 怜・小嶋 和徳・伊藤 慶明(岩手県立大学)
近年,農業従事者が減少しており,人手不足の問題が深刻になっている.この問題を解決するためにドローンを活用した負担軽減が推進されている.本研究では,ブドウ葉の健康状態管理を目的としたシステム構築を提案する.ドローンで撮影した動画から画像を切り出し,ブドウ葉の画像から健康状態を識別する.本稿では,複数の深層学習モデルを用いた広角画像からのブドウ葉検出手法について検討する.具体的には,複数の深層学習モデルと半教師あり学習を組み合わせることで,ブドウ葉検出精度の向上を目指す.本手法により,ドローンを活用したブドウ葉の健康状態管理の効率化を目指す.これにより,ブドウ園の農業従事者の負担軽減が期待される. |
H-026 |
透明物体検出のための円偏光背景パタンと識別器の同時学習
◎平井 愛唯奈・吉田 道隆・岡部 孝弘(岡山大学)
×
H-026透明物体検出のための円偏光背景パタンと識別器の同時学習
◎平井 愛唯奈・吉田 道隆・岡部 孝弘(岡山大学)
透明物体の見えは背景シーンの透過光が支配的であるため,その検出は容易ではない.本稿では,透明物体による屈折や複屈折のために生じる透過光の位置ずれと位相差の両方を活用したワンショットの透明物体検出法を提案する.提案手法では,ディスプレイと円偏光板により生成した円偏光背景パタンの透過光を偏光カメラで撮影した画像を用いて,機械学習ベースの検出を行う.このとき,背景パタンと識別器が互いに依存することから,基底関数の線形結合で表現した背景パタンと識別器を同時に学習することで,検出性能の向上を図る.プロトタイプシステムを用いた実画像実験を行い,提案手法の有効性,特に,円偏光の活用と背景パタン最適化の有効性を示す. |
H-027 |
マスクを用いた堅牢な自己位置推定
◎厳 海旻・石原 章翔・嶋田 知泰(立命館大学)・孔 祥博(富山県立大学)・冨山 宏之(立命館大学)
×
H-027マスクを用いた堅牢な自己位置推定
◎厳 海旻・石原 章翔・嶋田 知泰(立命館大学)・孔 祥博(富山県立大学)・冨山 宏之(立命館大学)
近年、ディープラーニングの進展により、視覚的自己位置推定は、さまざまな応用分野において重要な役割を果たしています。しかし、季節変動や植生などの環境要因により、位置推定精度が低下するという課題はあります。本研究では、この問題に対処するために、色検出および画像セグメンテーションを用いたマスキング手法を提案し、高精度な視覚的自己位置推定の実現を目指します。マスキングの有無による位置推定性能を、異なる 2 種類の撮影条件下で比較・分析し、位置推定誤差を定量的に評価しました。その結果、特定の環境条件において、マスク処理を適用し、位置および姿勢推定の精度向上が確認されました。 |
コンピュータビジョン・パターン認識(8) |
9月4日(木) 15:30-17:30 5n会場
座長 林 剣之介(オムロン株式会社) |
H-028 |
手技習得を目的とした腹腔鏡手術映像に対する映像補完用マスク画像の自動生成
◎大西 涼介・大野 将樹・獅々堀 正幹(徳島大学)
×
H-028手技習得を目的とした腹腔鏡手術映像に対する映像補完用マスク画像の自動生成
◎大西 涼介・大野 将樹・獅々堀 正幹(徳島大学)
近年,手術手技の映像教材を用いた教育支援が進む中で,能動的な学習を促す手法として鉗子を除去した補完映像の活用が有効である.本研究では,映像補完に必要なマスク画像の自動生成において生じる精度の低いマスク画像(不備マスク)を,YOLOによって検出された鉗子領域とマスク領域の面積比に基づいて自動的に検出する手法を提案した.2つの腹腔鏡手術映像に本手法を適用した結果,平均検出率88.7%を達成し,高い精度で不備フレームを検出できることを確認した.これにより,マスク作成作業の負担軽減および補完映像の品質向上が期待される.今後は検出精度のさらなる向上と他の術式への適用を目指す. |
H-029 |
PatchCoreを用いた撮影環境に堅牢な異常検知
◎大竹 智之・黒木 啓之(東京都立産業技術高等専門学校)
×
H-029PatchCoreを用いた撮影環境に堅牢な異常検知
◎大竹 智之・黒木 啓之(東京都立産業技術高等専門学校)
建設機材の汚れや歪みを人の目で判定する場合,精度,判別時間,人件費等の問題点があり,その解決方法として近年ニューラルネットワークがよく用いられる.しかし,AutoEncoderのような従来の異常検知手法のみの場合,撮影環境や天候によって入力画像が学習データと異なった場合に十分な精度が得られない.そのため本研究では,異常検知精度が高く,推論時間が短いPatchCoreと他のNNを組み合わせ,ノイズが含まれた機材の画像に対し,高速で十分な精度を発揮できる異常検知を行うことを目的とする.ここでは,低照度の画像を明るくするNNや,雨粒のようなノイズを除去するNN等を組み合わせる方法を用いる. |
H-030 |
3D-CNNを用いた大脳皮質形成異常分類に関する原因遺伝子特定に向けた閾値分類の検討
◎高橋 尚生・佐藤 圭浩(東京都市大学)・加藤 光広(昭和医科大学)・山口 敦⼦(東京都市大学)
×
H-0303D-CNNを用いた大脳皮質形成異常分類に関する原因遺伝子特定に向けた閾値分類の検討
◎高橋 尚生・佐藤 圭浩(東京都市大学)・加藤 光広(昭和医科大学)・山口 敦⼦(東京都市大学)
人工知能技術による画像処理の高度化は、医療の現場において画像強調やセグメンテーションによって医療支援に用いられている。また近年では、希少疾患に対する原因遺伝子の特定について画像処理技術を用いる働きも高まっている。本研究ではニューラルネットワークによる画像処理モデルを用いて、滑脳症患者の三次元MRI画像データに対して、原因遺伝子特定の分類タスクを実施した。分類タスクでは、原因遺伝子クラス数をLIS1,DCX及びその他と設定し、クラスに属する確率閾値を設定することで分類に与える影響について検討を行った。 |
H-031 |
畳み込みオートエンコーダを用いた自閉症スペクトラム障害の脳機能特徴抽出
◎金 珍成・佐藤 圭浩(東京都市大学)
×
H-031畳み込みオートエンコーダを用いた自閉症スペクトラム障害の脳機能特徴抽出
◎金 珍成・佐藤 圭浩(東京都市大学)
自閉症スペクトラム障害(ASD)は、対人関係やコミュニケーションの困難、強いこだわりを特徴とする発達障害の一種であり、脳の発達異常が関与しているとされる。早期診断によって、ASD患者に対する適切な介入や教育プログラムの提供により、症状の緩和と社会適応の向上が期待できる。本研究では、畳み込みオートエンコーダ(CAE)に機能的磁気共鳴画像(fMRI)データを適用することで、ASDに関連する脳活動の特徴を抽出し、ASD患者と健常者の脳機能の違いを分析した。 |
H-032 |
拡散モデルを用いた道路インフラ点検の自動化に向けた異常検知システム
◎藤田 生吹・関根 栄子(茨城大学)
×
H-032拡散モデルを用いた道路インフラ点検の自動化に向けた異常検知システム
◎藤田 生吹・関根 栄子(茨城大学)
近年、老朽化が進む道路インフラの維持管理は社会的な課題となっており、効率的に損傷を発見・対応する技術の導入が求められている。特に、損傷箇所の見逃しや点検作業の負担軽減のため、自動的に異常を検知できるシステムの実現が期待されている。異常検知にはAIの活用が進められているが、損傷データの収集や分類といった教師あり学習に必要なコストが課題となっている。本研究では、正常画像のみを用いて学習可能な教師なし学習手法として、画像生成分野で注目される拡散モデルを活用し、異常スコアに基づいて路面の損傷を検知するシステムを構築している。これにより、拡散モデルの高い生成品質と安定性を活かしつつ、性能評価を通じて、学習コストを抑えた実用的なインフラ点検支援を目指す。 |
H-033 |
(講演取消) |
コンピュータビジョン・パターン認識(9) |
9月4日(木) 15:30-17:30 5p会場
座長 平川 翼(中部大学) |
H-034 |
採点ミス発見支援システムの採点ミス検出精度向上
◎伊藤 慶治郎・松尾 賢一・高寺 昌吾(奈良工業高等専門学校)
×
H-034採点ミス発見支援システムの採点ミス検出精度向上
◎伊藤 慶治郎・松尾 賢一・高寺 昌吾(奈良工業高等専門学校)
本研究は,採点済み答案画像を入力として,採点ミスを採点者に提示する「採点ミス発見支援システム」の採点ミス検出精度向上を目的とする.現状のシステムでは,採点記号と部分点の両パターンの認識結果に基づき,採点ミス判定の処理がなされていたため,回答内容と採点記号との整合性判定はされておらず,単に採点記号と部分点の両パターンの不一致の検出数がそのまま本システムの採点ミス検出結果となっていた.そこで,回答内容の文字認識結果も整合判定に加えることで,システムの出力精度である採点ミス検出率向上に寄与するかを調査する. |
H-035 |
OpenCVを用いた絵画の構図分析
◎鈴木 真歩・渡部 広一・土屋 誠司(同志社大学)
×
H-035OpenCVを用いた絵画の構図分析
◎鈴木 真歩・渡部 広一・土屋 誠司(同志社大学)
本研究の目的は,芸術に精通していないユーザーの絵画鑑賞をサポートするシステムの開発である.これまで絵画解析は,絵画の中の主役を意味するフォーカルポイントや,フォーカルポイントへ視線を誘導するリーディングラインの検出を行ってきたが,本研究では絵画の構成要素をコンピュータが数学的に読み取り,絵画の「構造」の分析を提案する.本発表では,絵画の構造を「構図」と記し,OpenCVを用いて絵画のオブジェクトを検出し,それらの配置関係から構図を読み取る. |
H-036 |
統計的識別および存在確率のボクセル管理によるVisual SLAMにおける移動障害物の除去
◎月野 駿佑・木室 義彦(福岡工業大学)
×
H-036統計的識別および存在確率のボクセル管理によるVisual SLAMにおける移動障害物の除去
◎月野 駿佑・木室 義彦(福岡工業大学)
Visual SLAMで生成された3次元環境地図にはしばしば人や可動物体などの移動障害物がノイズとして含まれる.このノイズは,位置推定やナビゲーションに影響を及ぼすため,その除去が望まれている.移動障害物の属性が事前に分かっている場合,背景差分処理や機械学習を用いた手法を用いることができる.そうでない場合,障害物の移動として点群データを確率的に扱うことが考えられる.例えば,ERASORは,地面上の移動障害物を確率的に扱っている.本研究は,屋内環境において,天井や壁面,移動障害物を統計的に識別,その存在確率をボクセル単位で管理することで移動障害物を除去する手法を検討した. |
H-037 |
深層学習による材木画像での樹種判定
◎西嶋 勘太・蛭田 雄也(旭川工業高等専門学校)
×
H-037深層学習による材木画像での樹種判定
◎西嶋 勘太・蛭田 雄也(旭川工業高等専門学校)
本研究では、未塗装の材木を画像によって樹種特定する学習モデルを構築した。近年、木材の樹種判定が可能な技術者が少なくなり、木材加工現場での樹種選択間違いによって、材木価値が下がることやなくなることが多くなっている。本システムは加工でよく使用される材木画像を入力とし、深層学習に基づく畳み込みニューラルネットワーク(CNN)を用いて樹種を分類する。 |
H-038 |
StyleGANの潜在空間を利用した顔表情の認識に関する検討
◎中村 優太・木村 誠聡・辻 裕之(神奈川工科大学)
×
H-038StyleGANの潜在空間を利用した顔表情の認識に関する検討
◎中村 優太・木村 誠聡・辻 裕之(神奈川工科大学)
近年,医療やマーケティング分野への応用を想定し,顔画像から人の様々な表情を認識する研究が盛んに行われている.本研究では,顔の表情変化を高精度に生成可能なStyleGANの潜在空間を用いた,生成モデルに基づく顔の表情認識手法について検討を行う. 提案法では,StyleGAN Generatorをデコーダとして採用したpSpと呼ばれるオートエンコーダを導入し,その中間表現にあたる次元の潜在空間を利用して自然な表情(neutral)とエクマンの基本6感情の合計7種類の表情の分類・認識を実現する.本稿では,実験を通して潜在空間のうち顔の表情変化に関わる部分空間を特定し,そこに射影した部分ベクトルを用いることで,従来法と同程度の識別精度が得られることを確認した. |
コンピュータビジョン・パターン認識(10) |
9月5日(金) 9:30-12:00 6k会場
座長 西山 正志(鳥取大学) |
H-039 |
衛星画像における車両検出のための合成データセットの提案
○寺岡 知紀・飯山 将晃(滋賀大学)
×
H-039衛星画像における車両検出のための合成データセットの提案
○寺岡 知紀・飯山 将晃(滋賀大学)
衛星画像における車両検出は都市計画や商用分析など多様な分野で活用されているが、学習用アノテーション付き画像の準備には多大なコストを要する。特に、検出対象となる車両が小さく大量に存在するシーンでは、正確なアノテーションを行うことは現実的ではない。この問題に対し、本研究では、衛星画像下における車両検出を目的とした人工データセットの生成を提案する。提案手法では,与えられた衛星画像に対して、車両の配置・数・色を自動生成し、さらに太陽の位置や影を考慮した画像を合成する。生成された合成データの有効性を検証するために、少量の実写画像データで精度評価を行った。 |
H-040 |
少量のアノテーション画像と基盤モデルによる藻場の推定
◎大下 真之介・飯山 将晃(滋賀大学)
×
H-040少量のアノテーション画像と基盤モデルによる藻場の推定
◎大下 真之介・飯山 将晃(滋賀大学)
近年、カーボンニュートラルの実現に向けて水中画像から藻場の分布を自動的に計測する技術の重要性が高まっている。水中画像からセマンティックセグメンテーションにより藻場の領域を推定する際、水中画像特有の画像劣化と学習に用いるアノテーション画像が少ないという問題がある。そこで本研究では、画像復元処理を施した水中画像に対してCLIPを活用して疑似ラベルを生成し、半教師あり学習を導入することで、この課題の解決を図る。 |
H-041 |
農作物可視光画像を用いたセマンティックセグメンテーションによる葉面上水分検出法
◎宮倉 将・竹石 光希(東京理科大学)・村松 駿(東京大学)・吉田 孝博(東京理科大学)
×
H-041農作物可視光画像を用いたセマンティックセグメンテーションによる葉面上水分検出法
◎宮倉 将・竹石 光希(東京理科大学)・村松 駿(東京大学)・吉田 孝博(東京理科大学)
農作物の成長において、葉面上の水分を適切に管理することで、生育促進や病害抑制につなげることが可能である。葉面上の水分を検出する既存の手法として、人工葉やサーモセンサ等を用いる手法が存在するが、機材が高価である上に広範囲にわたる複数の葉面の水分を一括で検出することが困難である。そこで本研究では、セマンティックセグメンテーションを基にした深層学習モデルを適用することで、カメラで広範囲に撮影した農作物の可視光画像で複数の葉面上の水分検出を一括で行う手法を開発した。それに加え、農地における支柱や雑草などの農作物以外の要素に対してロバストとなる手法改善も実現した。 |
H-042 |
尿路上皮細胞診システムにおける Semantic Segmentationの改善
◎橋本 明空・大野 将樹・尾矢 剛志・常山 幸一・獅々堀 正幹(徳島大学)
×
H-042尿路上皮細胞診システムにおける Semantic Segmentationの改善
◎橋本 明空・大野 将樹・尾矢 剛志・常山 幸一・獅々堀 正幹(徳島大学)
本研究では,尿中の癌細胞を検出する画像処理AIの開発を目的とする.具体的には,癌細胞は通常の細胞と比較して細胞核の色が濃く,形が歪になるという特徴に着目し,細胞核の検出に特化した画像識別モデルと細胞全体の形の検出に特化した画像識別モデルを個別に用いる手法を提案する.識別対象の細胞画像に対して,それら2つのモデルで識別を行い,最終的に2つの識別結果を合成することで最終識別結果とする.また,細胞核の識別の際に出力された識別結果を細胞全体の学習及び識別にも利用するアプローチなども導入し,識別精度を向上することに成功した. |
H-043 |
AIを用いた電子顕微鏡像の結晶形状解析
○内田 美幸・宍戸 龍之介・神内 拓真・早瀬 麻穂・織田 達広・塩見 康友(東芝)
×
H-043AIを用いた電子顕微鏡像の結晶形状解析
○内田 美幸・宍戸 龍之介・神内 拓真・早瀬 麻穂・織田 達広・塩見 康友(東芝)
セラミック製品の開発においては、製造プロセス開発や結晶の出来栄え評価のために、電子顕微鏡で撮像した結晶形状と製造プロセスや特性データを関連付けている。従来、人手作業による官能的な評価に留まっていた結晶形状評価について、本研究では、感度を調整可能なAIを用いて電子顕微鏡像の結晶輪郭を抽出し、独自の手法により形状を数値化した。数値化結果と製造条件や特性データとの関係を解析することで、製造プロセスの迅速な決定や特性予測が可能となり、製品開発の効率向上が期待される。 |
コンピュータビジョン・パターン認識(11) |
9月5日(金) 9:30-12:00 6m会場
座長 西山 正志(鳥取大学) |
H-044 |
黒毛和種放牧牛の映像検出による位置推定結果とGPSデータの最適化による統合
◎中川 蓮・大川 剛直・大山 憲二(神戸大学)
×
H-044黒毛和種放牧牛の映像検出による位置推定結果とGPSデータの最適化による統合
◎中川 蓮・大川 剛直・大山 憲二(神戸大学)
近年,和牛農家の担い手減少に伴い,飼養管理の自動化が急務となっている.飼養管理の自動化にむけた課題として発情行動確認時の観察記録がある.黒毛和種は外観特徴が乏しく遠方観察からの個体識別が困難なため,発情行動の発生時は耳標タグを目視確認することにより個体を特定し記録している.この作業の省力化のために,映像上の牛の個体識別の自動化が求められている.本研究では,映像ベースの牛検出手法による映像上の牛追跡結果を射影変換を用いて世界座標に変換し,GPSデータと最適マッチングを行うことによりGPSデータから映像上の個体を特定する手法を提案する.本研究により,黒毛和種の個体識別の自動化への貢献が期待される. |
H-045 |
筆記途中の手書き漢字を学習した早期認識手法
◎重杉 健士朗・坂井 浩志郎・中井 満(富山県立大学)
×
H-045筆記途中の手書き漢字を学習した早期認識手法
◎重杉 健士朗・坂井 浩志郎・中井 満(富山県立大学)
コンピュータへの手書き入力は,直感的で自由な操作が可能であり,教育現場やクリエイティブな作業で注目されている.しかし,キーボード入力と比べて筆記に時間がかかるという課題があり,効率性が求められる環境では普及の妨げとなっている.本研究では,筆記途中の漢字データを活用し,書き始めの段階で文字を認識する早期認識手法を提案する.LSTMやGRUを用いたモデル構築とラベル設計の改良により,筆記の進行段階に応じた認識精度の向上を目指した.特に、1文字を半分程度書いた時点で、書き終えた文字と同等の認識精度を達成することが確認され、効率的な入力支援の可能性を示した。 |
H-046 |
深層学習を用いたイノシシ検出モデルの構築と汎化性能の評価
◎中川 竣介・山本 慶悟・松尾 玲亜・廣瀬 誠(鳥羽商船高等専門学校)・高橋 完(アイエスイー)・山端 直人(兵庫県立大学)・江崎 修央(鳥羽商船高等専門学校)
×
H-046深層学習を用いたイノシシ検出モデルの構築と汎化性能の評価
◎中川 竣介・山本 慶悟・松尾 玲亜・廣瀬 誠(鳥羽商船高等専門学校)・高橋 完(アイエスイー)・山端 直人(兵庫県立大学)・江崎 修央(鳥羽商船高等専門学校)
近年、国内の農作物は害獣による深刻な被害を受けており、特にシカやイノシシによる被害が全体の約6割を占めている。我々はこれまで、シカとイノシシを対象に、機械学習を用いた害獣識別器の構築に取り組んできた。この識別器は、従来の検証において高い識別精度を示していたが、それは特定の地点で撮影された画像に限定されたものであった。したがって、本研究では識別器の汎化性能を評価するため、学習に使用していない別地点で撮影された画像を用いて新たに学習と検証を実施した。これにより、異なる環境条件下でも高い識別性能を維持できるかを検証し、実運用に向けた有効性を評価することを目的とした。 |
H-047 |
画像情報を用いたあまおうの育成モニタリングに向けた自動周回撮影車両の試作
◎田中 悠登・古賀 矢響・前原 秀明(福岡工業大学)・前村 健太(マエムラファーム)
×
H-047画像情報を用いたあまおうの育成モニタリングに向けた自動周回撮影車両の試作
◎田中 悠登・古賀 矢響・前原 秀明(福岡工業大学)・前村 健太(マエムラファーム)
高齢化による労働力不足が深刻化する日本の農業において、現場負担を軽減しつつ高頻度に生育状況を把握できる仕組みが求められている。本研究では、福岡特産「あまおう」を対象に、カメラを搭載した自律走行車両を開発し、圃場内を周回撮影することで時間的・空間的に連続した画像データを取得する。取得画像に対し、生育度合い検出するアルゴリズムを実装し、可視化までを一体化したモニタリングを構想した。今回は、車両制御・画像処理双方の設計と試作車両について報告する。 |
H-048 |
クラス情報による誘導が可能なDiscrete Flow Matchingによるデータ生成モデルの検討
◎藤岡 雅大・鈴木 海友・松田 一朗(東京理科大学)
×
H-048クラス情報による誘導が可能なDiscrete Flow Matchingによるデータ生成モデルの検討
◎藤岡 雅大・鈴木 海友・松田 一朗(東京理科大学)
Discrete Flow Matching (DFM)は,連続時間マルコフ過程における確率経路の回帰を通じて離散データを生成する,生成モデルの枠組みである.DFMは,言語生成や画像生成といった高次元離散データの評価タスクにおいて高い性能を示している.一方,生成モデルにおいては,所望の出力を得るために,目的に応じたサンプル生成の制御が求めれる.しかし,現行のDFMでは,外部入力によって生成結果を誘導する手法が未確立である.本研究では,クラス情報を用いて生成過程を誘導するための定式化を行い,外部入力に基づく離散データ生成の制御手法の検証を行う. |
コンピュータビジョン・パターン認識(12) |
9月5日(金) 13:10-15:40 7k会場
座長 住吉 信一(デンソーアイティーラボラトリ) |
H-049 |
RGB特徴量のクラスタリングによるトマト収穫推定システムの基礎検討
◎川尻 脩斗(北海道科学大学)・小島 伊織(室蘭工業大学)・小島 汐織(札幌市立大学)・石川 勇人・山本 諒太(苫小牧工業高等専門学校)・合田 元清(北海道科学大学)・岩波 俊介(苫小牧工業高等専門学校)・小島 洋一郎(北海道科学大学)
×
H-049RGB特徴量のクラスタリングによるトマト収穫推定システムの基礎検討
◎川尻 脩斗(北海道科学大学)・小島 伊織(室蘭工業大学)・小島 汐織(札幌市立大学)・石川 勇人・山本 諒太(苫小牧工業高等専門学校)・合田 元清(北海道科学大学)・岩波 俊介(苫小牧工業高等専門学校)・小島 洋一郎(北海道科学大学)
農作物の熟度推定や選別において、画像解析と機械学習を融合した非破壊評価技術が急速に発展している。本研究では、中玉トマトの適熟期を高精度に推定するため、RGB画像の色彩特徴量に着目し、教師なし学習であるクラスタリングの有効性を検証した。異なる収穫時期のトマト画像から果実領域のRGBデータを抽出し、クラスター分析を実施した。色彩類似性に基づき明確なサンプル群の分離を示した。特にヒートマップ分析から、R成分が適熟期判別に重要な特徴量であることが示唆された。RGB情報による5クラス分類でも一定の精度があり、本手法の基礎的な有用性を確認した。今後は、圃場でのリアルタイムな収穫適期推定システムの開発を目指す予定である。 |
H-050 |
CNNにおけるBatch Normalizationのドメイン適用への活用に関する調査
◎外川 宙・神野 健哉(東京都市大学)
×
H-050CNNにおけるBatch Normalizationのドメイン適用への活用に関する調査
◎外川 宙・神野 健哉(東京都市大学)
畳み込みニューラルネットワークの転移学習では,大規模データセットで事前学習されたモデルを出発点とし,目的のタスクに対して一部のパラメータを調整することでドメイン適用を行う.本研究では,より効果的なドメイン適用を実現するために,転移学習におけるBatch Normalization(BN)の活用について調査を行う.我々は,転移学習時に,分類器に加えてBN層も調整を行うことで,より効果的なドメイン適用が可能であることを明らかにする.この結果は,ドメイン適用において,BN層のアフィン変換が有効であることを示しており,より効率的で効果的な転移学習を実現するための知見となる. |
H-051 |
CycleGANによる教師なしドメイン適応を用いた運転者視点画像に対する物体検出
◎髙橋 暖人・猿田 和樹・陳 国躍・寺田 裕樹(秋田県立大学)
×
H-051CycleGANによる教師なしドメイン適応を用いた運転者視点画像に対する物体検出
◎髙橋 暖人・猿田 和樹・陳 国躍・寺田 裕樹(秋田県立大学)
交通事故の発生要因のうち約半数がドライバーの認知ミスであることから,運転者の認知能力向上を目的として,運転者視点映像に対して物体検出を行い,運転者が注視している物体を判定する研究が行われている.先行研究では,物体検出モデルの訓練・検証に用いたデータセットは昼間画像で構成されており,交通事故が最も多い薄暮時の検出性能について検証が行われていない.また,照度の低い画像はアノテーションが困難である.本研究ではCycleGANを用いて昼間画像を夜間画像に変換し、変換後の画像をモデルの訓練に用いることでアノテーションコストを削減しつつ薄暮画像に対する検出性能の向上を図り,有効性を明らかにした. |
H-052 |
水面領域抽出のためのグラフカットベースのアノテーション手法の精度向上と評価
◎中島 慶・島 和之(広島市立大学)
×
H-052水面領域抽出のためのグラフカットベースのアノテーション手法の精度向上と評価
◎中島 慶・島 和之(広島市立大学)
土砂災害の前兆現象を早期に検知し,住民に避難を促すことで人的被害を減少させることが期待されている.従来の水位計測にはコストやメンテナンスの課題があり,安価で扱いやすい監視カメラを用いた水位推定が検討されている.先行研究では,深層学習を活用したセマンティックセグメンテーションにより,監視カメラ画像から水面領域を抽出し,水位を推定する手法の提案を行った.しかし,モデル学習時に数百から数千枚におよぶ画像へのアノテーションが必要であり,すべてを手作業で行うのは大きな労力を要する.そこで本研究では,必要な精度を効率的に達成するため,グラフカットを用いた半自動的なアノテーション手法の提案を行った. |
H-053 |
3DCGを用いた光源推定による自然画像からの光源色の影響低減に関する研究
◎青沼 奏志・中村 嘉彦・山本 椋太(苫小牧工業高等専門学校)
×
H-0533DCGを用いた光源推定による自然画像からの光源色の影響低減に関する研究
◎青沼 奏志・中村 嘉彦・山本 椋太(苫小牧工業高等専門学校)
現在,深層学習と画像処理を組み合わせたアプリケーションが多数開発されている.その際,画像中の物体は光源の影響で色が変化することがある.光源の影響を受けた画像では,これらのアプリケーションの精度が低下する可能性がある.そこで,光源推定により光源色を推定できれば,画像から光源の影響を低減できる. しかし,深層学習を用いた光源推定では,多様なシーンを含む高コストな光源推定用データセットが必要である. 本研究の目的は,低コストな3DCG画像のデータセットで光源推定が可能か検証すること,3DCG画像と光源推定により光源の影響を低減すること,画像処理アプリケーションの精度向上を実現すること,の3つである. |
H-054 |
(講演取消) |
コンピュータビジョン・パターン認識(13) |
9月5日(金) 13:10-15:40 7m会場
座長 飯山 将晃(滋賀大学) |
H-055 |
手書き文字が有する多様な情報から筆者個人性を選択的に学習する筆者識別アーキテクチャ
◎山城 遼・荒井 秀一(東京都市大学)
×
H-055手書き文字が有する多様な情報から筆者個人性を選択的に学習する筆者識別アーキテクチャ
◎山城 遼・荒井 秀一(東京都市大学)
手書き文字は、文字が持つ意味、筆者の感情、筆者の個人性などの情報を持ち、筆者識別を行うには手書き文字の持つ情報から筆者の個人性のみを選択して学習する必要がある。しかし、近年研究されている深層学習を用いた筆者識別アーキテクチャはEnd to Endで学習するため、手書き文字が持つ筆者の個人性を表す特徴のみを学習していない。そのため、「はね」や「はらい」といった個人性が表れやすい局所的特徴を抽出せずに筆者識別をする場合がある。そこで本稿では、アーキテクチャの特徴抽出層の設計を行い、抽出できる特徴に制限をもたせることで手書き文字が持つ情報から筆者の個人性のみを選択して学習するアーキテクチャについて検討する。 |
H-056 |
カメラ映像を用いた人物間の関係性推定手法の検討
◎丸尾 元一・尾崎 敦夫(大阪工業大学)
×
H-056カメラ映像を用いた人物間の関係性推定手法の検討
◎丸尾 元一・尾崎 敦夫(大阪工業大学)
デジタルサイネージ広告の高度化を目指した、人物間の関係性(知人/他人)を考慮した広告配信が求められている。本研究は、単眼カメラ映像から人物間の関係性をリアルタイムで推測するアルゴリズムの開発を目的としている。提案手法では、YOLOによる人物の向きの推定値とホモグラフィ変換による座標値を算出し、それらの時系列データを統合して関係性を推測する。知人/他人を模倣した実験の結果、提案手法は81.1%の正解率で関係性を判定でき、人物の姿勢と動きの情報が有効であることを示すことができた。一方、特定の人物配置では誤判定も生じており、深層学習の導入などによる判定精度の改善が今後の課題である。 |
H-057 |
ユニバーサル基板の配線画像解析による回路図復元
◎林 哲矢・田中 剛・遠藤 雅樹・寺田 憲司・大野 成義(職業能力開発総合大学校)
×
H-057ユニバーサル基板の配線画像解析による回路図復元
◎林 哲矢・田中 剛・遠藤 雅樹・寺田 憲司・大野 成義(職業能力開発総合大学校)
教育現場におけるユニバーサル基板を用いた電子回路基板の試作実習では,回路図と等価な機能を満たしていれば,部品配置や配線経路が異なっていても問題にはならない.しかし,複数の学生が独自に設計・試作・評価を行う中で,基板が期待通りに動作しないケースに学生が自力で解決できないため,その都度教員が個別にトラブルシューティングを行わざるを得ない.そこで,本研究では教員による目視確認のデジタル化と効率化を目的とし,ユニバーサル基板の配線画像からパターンを自動抽出し,部品面情報と統合して回路図を自動復元する手法を提案する.提案手法を試作基板の実画像に適用し,復元精度を検証することで有効性を確認した. |
H-058 |
境界重視型損失関数を追加したHQ-SAMの提案とダクトホース内部検査への応用
久保田 愛梨(九州工業大学)・相馬 康宏・相馬 貴之(修美工業)・今川 孝久・○榎田 修一(九州工業大学)
×
H-058境界重視型損失関数を追加したHQ-SAMの提案とダクトホース内部検査への応用
久保田 愛梨(九州工業大学)・相馬 康宏・相馬 貴之(修美工業)・今川 孝久・○榎田 修一(九州工業大学)
株式会社修美工業では,エコーナシステムにより橋梁の老朽化した塗面を除去し,ダクトホース経由で塗膜片を集塵機にて安全に回収している.しかし,一部の塗膜片がダクトホース内に残存するため,現在は利用時間等に基づきダクトホースの交換時期を判断している.本研究では,ダクトホース内部画像を用いた塗膜片残存率自動検査の実現を目指す.画像内の残存物をピクセル単位で認識するため,意味的領域分割手法であるHQ-SAMを用いる.HQ-SAMは,比較的細い領域の検出で高精度な結果を示すと報告されているが,本研究では前景領域の境界に着目した損失関数を追加することで,意味的領域分割のさらなる精度向上を図る. |
H-059 |
移動する人物に対する視線推定
◎井手 美優・池西 俊仁・木谷 哲・吉田 道学(三菱電機)
×
H-059移動する人物に対する視線推定
◎井手 美優・池西 俊仁・木谷 哲・吉田 道学(三菱電機)
近年、人物の視線は様々な場面で活用されている。視線推定では一般に、眼球形状の個人差や周囲環境などに起因する誤差が存在するため、誤差低減を目的としてキャリブレーション(校正)が行われる。従来のキャリブレーションでは、街中を移動する人物などセンサと人物間や人物と注視対象物間の位置関係や姿勢が変化する場合に誤差が増大する問題があった。そこで本稿では、視線情報と相関の高いパラメータを判別し、そのパラメータを用いて視線を表現することで、未知の環境下を移動する人物に対しても視線をキャリブレーション可能な手法を検討し、効果の評価を行った。 |