(邦訳:医用画像拡張に向けた,病変部を意識した敵対的生成ネットワーク)
韓 昌熙 エルピクセル(株)CEO補佐 |
キーワード
医用画像診断 | 敵対的生成ネットワーク | データ拡張 |
[背景]AIや人間のロバストな学習には大量のデータが必要
[問題]大量の医用画像収集・正解作りは高コスト・高負荷
[貢献]望みの疾患画像を合成し,データ拡張・医師教育を実現
Convolutional Neural Networks(CNNs)による正確な医用画像診断は,大量の正解付きデータセットを必要とする.しかし,そうしたデータセットの準備は高コストで手間もかかる.この文脈だと,Generative Adversarial Networks(GANs)はリアルかつ多様なサンプルを生成できるので,効果的に実画像分布を補える.内挿(既知の数値データ分布内の新しいデータの生成)の観点からすると,医療モダリティは個体差を上手く捉えつつも,固定された人体の強い解剖学的一貫性を表せるので,GANsによる医用画像拡張は信頼できる.
そこで本研究は,noise-to-image GANs(例:ランダムなノイズサンプルから,多様な疾患画像を生成するGANs)による (i)医療データ拡張,(ii)医師教育を提案する.データ拡張においては,GAN生成画像は教師あり学習によるコンピュータ支援診断に役立てる.医師教育においては,GANsは学習データとは分布が多少離れた望みの疾患画像を生成し,施設間制約や法的制約にとらわれず医療研修生を支援できる.本研究の4つのプロジェクトは,常に医師と協力し,そうしたGANsの新しい応用の臨床的関連性を示すことを目指す.我々の手法はより一般的に応用できるが,本研究はMRIとCTを使った腫瘍学的応用だけを取り上げる.
プロジェクト1は,上記の2つの応用を提案した上で,GANsがノイズサンプルからリアルかつ多様な128×128の全脳MRIを生成できることを示した.医師ですら合成MRIと実際のMRIを識別できなかった.プロジェクト2では,画像拡張の2次元分類に取り組む.ほとんどのCNNsは予測において256×256の入力サイズを使うので,我々はGANsを使って,リアルかつ多様な256×256の全脳MRIを腫瘍あり・なしで分けて生成した.その結果,腫瘍・非腫瘍の分類における感度を94%から98%に大幅に向上できた.
プロジェクト3では,2次元検出に向けて画像拡張する.さらなるデータ拡張は検出に病変部の位置特定が必要で,高度な医師教育は医師が臨床現場で稀にしか見かけない画像の生成が必要となる.どちらの臨床的要望にも応えるべく,我々はGANsに腫瘍に関する条件を漸次的に与え,望みの位置・大きさのリアルかつ多様な腫瘍を有する256×256の全脳MRIを生成した.その結果,腫瘍検出における感度を83%から91%に大幅に向上できた.外挿(既知の数値データ分布を超えた新しいデータの推定)の観点からすると,よく知られた医学的知見や望みの医学的特性は条件付けに有効なので,そうした病変部を意識したGANsは有望である.
プロジェクト4では3次元検出に取り組む.病変は3次元の位置・外観にバラツキが大きいので,3次元の病変部を意識した複数条件付けは重要である.そこで我々は,結節をノイズボックス化し,そこにGANsで再度結節を生成することで,望みの位置・大きさ・性状のリアルかつ多様な結節を有する64×64×64の肺CTを生成した.その結果,どの結節サイズ・性状においても陽性と判定されるべきものを正しく陽性と判定する確率を向上でき,医師は合成結節を実際の結節とほとんど識別できなかった.
以下の2つの議論を通じて,我々の病変部を意識したGANsの臨床的関連性を確認した.(i)9人の医師に対する,我々のプロジェクトに関するアンケート調査.(ii)さまざまなAIおよび/あるいは医療の背景を持つ7人の専門家に対する,臨床現場にフィットする医療AI開発に向けたワークショップ.
[貢献]望みの疾患画像を合成し,データ拡張・医師教育を実現
Convolutional Neural Networks(CNNs)による正確な医用画像診断は,大量の正解付きデータセットを必要とする.しかし,そうしたデータセットの準備は高コストで手間もかかる.この文脈だと,Generative Adversarial Networks(GANs)はリアルかつ多様なサンプルを生成できるので,効果的に実画像分布を補える.内挿(既知の数値データ分布内の新しいデータの生成)の観点からすると,医療モダリティは個体差を上手く捉えつつも,固定された人体の強い解剖学的一貫性を表せるので,GANsによる医用画像拡張は信頼できる.
そこで本研究は,noise-to-image GANs(例:ランダムなノイズサンプルから,多様な疾患画像を生成するGANs)による (i)医療データ拡張,(ii)医師教育を提案する.データ拡張においては,GAN生成画像は教師あり学習によるコンピュータ支援診断に役立てる.医師教育においては,GANsは学習データとは分布が多少離れた望みの疾患画像を生成し,施設間制約や法的制約にとらわれず医療研修生を支援できる.本研究の4つのプロジェクトは,常に医師と協力し,そうしたGANsの新しい応用の臨床的関連性を示すことを目指す.我々の手法はより一般的に応用できるが,本研究はMRIとCTを使った腫瘍学的応用だけを取り上げる.
プロジェクト1は,上記の2つの応用を提案した上で,GANsがノイズサンプルからリアルかつ多様な128×128の全脳MRIを生成できることを示した.医師ですら合成MRIと実際のMRIを識別できなかった.プロジェクト2では,画像拡張の2次元分類に取り組む.ほとんどのCNNsは予測において256×256の入力サイズを使うので,我々はGANsを使って,リアルかつ多様な256×256の全脳MRIを腫瘍あり・なしで分けて生成した.その結果,腫瘍・非腫瘍の分類における感度を94%から98%に大幅に向上できた.
プロジェクト3では,2次元検出に向けて画像拡張する.さらなるデータ拡張は検出に病変部の位置特定が必要で,高度な医師教育は医師が臨床現場で稀にしか見かけない画像の生成が必要となる.どちらの臨床的要望にも応えるべく,我々はGANsに腫瘍に関する条件を漸次的に与え,望みの位置・大きさのリアルかつ多様な腫瘍を有する256×256の全脳MRIを生成した.その結果,腫瘍検出における感度を83%から91%に大幅に向上できた.外挿(既知の数値データ分布を超えた新しいデータの推定)の観点からすると,よく知られた医学的知見や望みの医学的特性は条件付けに有効なので,そうした病変部を意識したGANsは有望である.
プロジェクト4では3次元検出に取り組む.病変は3次元の位置・外観にバラツキが大きいので,3次元の病変部を意識した複数条件付けは重要である.そこで我々は,結節をノイズボックス化し,そこにGANsで再度結節を生成することで,望みの位置・大きさ・性状のリアルかつ多様な結節を有する64×64×64の肺CTを生成した.その結果,どの結節サイズ・性状においても陽性と判定されるべきものを正しく陽性と判定する確率を向上でき,医師は合成結節を実際の結節とほとんど識別できなかった.
以下の2つの議論を通じて,我々の病変部を意識したGANsの臨床的関連性を確認した.(i)9人の医師に対する,我々のプロジェクトに関するアンケート調査.(ii)さまざまなAIおよび/あるいは医療の背景を持つ7人の専門家に対する,臨床現場にフィットする医療AI開発に向けたワークショップ.
博士論文審査会(公聴会)発表動画URL:https://youtu.be/mXI2j0lkEtk |
(2020年5月30日受付)