一般市民が,社会における科学技術のあり方や政策決定する場に参画する動きは世界的にも検討されてきた.一般市民は知識がないという欠如モデルに基づく科学コミュニケーションではなく,一般市民は具体的な状況に関しては専門家よりも知識が多く,それらは「智恵(folk knowledge)」と認識されている一方で,科学知識を典型とする知識と比べて正当な評価を受けることは少なかった.その後,アメリカで開発された「コンセンサス会議」で,科学技術に関わる政策的議論の場に一般市民が関わる可能性が模索され,現在では一般市民がそのような場に参画することが日常になってきた[1].
一方,これら場面において,一般市民が参画していくにあたり,諸外国との文化的背景や国民性の違いに留意することが重要である.日本はハイコンテクスト文化であり,相手に伝える努力をしなくても分かり合えるという側面が強い.一方,欧米のローコンテクスト文化の場合は言語に依存したコミュニケーションである[2].この特徴を踏まえると,諸外国のように,一般市民の「個人」の潜在ニーズを政策等の場に迅速に反映することは難しいと思われるが,現状,一般市民の潜在的なニーズを自動抽出する方法論やそれらを政策決定の意思決定の場に声として反映させるためのシステムは存在しない[3], [4].
日本のハイコンテクスト文化を踏まえると,対象者に配慮した環境での対面でのインタビューやアンケート等の文字テキストを通じた意思伝達は容易であると考えられる.そこで本研究では,口語テキストから発話者の潜在的ニーズの自動抽出をするための機械学習モデル構築,および口語テキストに含まれる膨大な単語から潜在ニーズを精度高く予測するために,ニューラルネットワークを用いて単語をベクトル変換する手法であるWord2Vecモデルを用いて同義語辞書を作成し,近い意味の単語に同一の特徴量を付与する新手法の有用性を検討した.
Word2Vecとは,単語の意味は周辺単語分布によって形成されるという分布仮説に基づき,単語の分布傾向をニューラルネットワークによって学習し,前後に出現する分布傾向が近い単語同士を近いベクトル表現へ変換するモデルを構築可能な手法である[5].
まず初めに予備検討では,発話者の潜在ニーズ予測のための機械学習モデル構築において最適なモデルの選択を行うための実験を行った.次に,本調査では,前述の予備検討で選択したモデルでの機械学習モデルの精度向上を目的に,新手法(Word2Vecモデルを用いた同義語辞書の作成)の適応別で精度比較を行い,新手法の有用性を評価した.
本研究では,特定非営利活動法人 健康と病いの語りディペックス・ジャパンより提供を受けた,「健康と病いの語り」データのうち,ウェブサイトで一般公開されている語りウェブページの口語テキストを使用した[6].
この選択理由は,近年,認知症患者の増加に伴いその家族を含めた潜在的ニーズが多くある一方で市民の声を政策等の場への反映の必要性が高い領域と考え選択した.
インタビュー者の問い1つに対して,対象者が回答した文章群を1レコードとし,全1107レコードを本研究の分析対象とした.次に,各文章群において期待や改善して欲しいといった対象者の潜在ニーズが含まれている可能性が高い関連表現として「あるといい」「いい」「やっぱり」「やっぱ」「やはり」という表現を1つ以上含む文章群に対して注目すべき意味を含む文章群と判定した[7].その後,独立した2名が,これら文章群に対して,対象者の潜在ニーズの有無を判定した.このニーズ判定にあたっては,2名の意見が分かれた文章群に対しては協議を行い,疑義がなくなるまで繰り返し検討を重ねた.
分析対象の口語テキストに対して,形態素解析を行った後,入力データは,単語(名詞),立場(本人/家族等)とし,出力データは,潜在ニーズの有無とした.形態素解析エンジンは,形態素解析器MeCab(mecab-python3 v1.0.5)を,形態素解析用辞書は,辞書の定期更新を含むメンテナンスが定期的になされており,新語や固有表現に強いことからmecab-ipadic-NEologd(2022年2月時点公開版)を選択した.予備検討では,最適な機械学習モデル選択のため,解釈性の高い木構造モデルである決定木,ランダムフォレスト,xgboostの3つのモデルで精度比較を行った.
分析対象の口語テキストに対して,2)予備検討と同様の手順で形態素解析にて名詞抽出を行った.
予備検討では,形態素解析後にBoWで抽出した名詞を特徴量化したが,単語の意味の近さの程度によらず同等の特徴量を単語に付与するため,予備検討のモデル選択だけでは,高精度の機械学習をさせることは難しいと予想した.そこで,予備検討で構築した機械学習モデルの精度向上を目的に,近い意味の単語に対して,同一の特徴量を付与するための新たな手法(同義語辞書の作成)を考案した.
同義語辞書の作成にあたっては,オープンソースであるPython 3.7.12ライブラリとしてGensim 3.6.0の主なアルゴリズムのうち,Word2Vecモデルを用いて同義語辞書を作成した.本研究では,前後に出現する単語の分布傾向が近い単語同士は同義語の関係にあると仮定し,分析対象の口語テキストに対してWord2Vecモデルを用いて文脈情報から単語同士の意味的な距離関係を学習させ,単語をベクトル化し,「ウォード法」で近い意味の単語をクラスタリングすることで同義語辞書を作成した.
「ウォード法」とは,凝集型クラスター分析の手法の1つで,分類感度が高いため,一般的によく使用される手法である.よって,本研究でもウォード法を採用した.この手法は,それぞれのデータと平均値の差を二乗した値の和を求め,平方和が小さなものからクラスターを作成していく手法であり,最終的に1つのクラスターになる.なお,最適なクラスター数が未知の場合,クラスター数を変化させ比較することで最適な基準を定めるとされている[8].本研究では,最適なクラスター数を決定するために,研究者がデンドログラムにて各クラスターの特徴を目視で確認したうえで,複数の閾値を適応し,複数の同義語辞書を作成した.
形態素解析後にBoWで抽出した名詞を特徴量化させる際,上述の3)(1)②で作成した同義語辞書1から3を用いて,近い意味の単語に対しては同一の特徴量を付与した.
同義語辞書の有無別で,予備検討で構築したモデルの精度比較を行った.
機械学習モデルの予測に寄与した特徴量を可視化させるための手法であるSHapley Additive exPlanations(SHAP)解析を用いることで機械学習モデルの解釈が可能となるため[9],本研究では,分析対象の口語テキストから潜在ニーズの予測に寄与した特徴量である単語群(クラスター)を明らかにすることによって,モデルの有用性を評価した.
具体的には,SHAP解析後,特徴量ごとのSHAP値を図へプロットのうえ,予測値に対して大きな影響を与えている特徴量(単語のクラスター番号)を上から順に図に示した.
その後,高頻出のSHAP値が大きい潜在ニーズ予測に対して,寄与度が高いクラスターの単語を含む文脈を確認したうえで,発話者の潜在ニーズの有無および解釈を行った.
予備検討の結果,最も精度が高ったモデルはxgboostであり,F値0.54であった(表1).そのため,機械学習モデルとしてはxgboostを選択した.
同義語辞書の有無別に予備検討で構築したモデルの精度比較を行った.複数の同義語辞書作成のための閾値は,研究者がデンドログラムにて各クラスターの特徴を目視で確認したうえで,12.5,15,17.5の3種の閾値を設定した.その結果,同義語辞書なしの場合はF値0.54であったのに対して,同義語辞書2の場合,F値0.61と最も高かった(表2).
最後にSHAP解析で潜在ニーズ予測に寄与したクラスターの出現頻度とそれらが潜在ニーズの有無のどちらの予測に対してどの程度,寄与したのかを可視化した(図1).
潜在ニーズ予測に対して,寄与度が高いクラスター順に,[不安],[病名,行動],[意識,正常],[場合]と続いた.また,[病名,行動]クラスターで,SHAP値が大きく,かつクラスター出現頻度も高かった.たとえば,[病名]を含む,口語テキストでの前後の文脈としては,『(以下,転載)ところが,あの,現実,その病名を出さなきゃいけないので,レビー小体型認知症ということで,…(略)…,ほかの認知症とはやっぱりちょっと違う.だから,身体症状とか,それから,どうしてそれが起きるのかっていうことはきちっと勉強してもらわないと,やっぱり,ケアするにしても,気を付けなきゃいけないことがたくさんあるんですよね.』であった.研究者は,この発話者の潜在ニーズとして,「介護者に対して,本人自身との関わりでは,事前に疾患の特徴を理解して欲しい」というニーズが含まれていたと解釈した.
予測値に対して大きな影響を与えている特徴量(クラスター番号)を上から順に示した.各プロットは,クラスターが含まれるレコードで,クラスター出現頻度を低(青色)から高(赤色)で示した.横軸に潜在ニーズ有無のどちらの予測に対して寄与したのかを数値で示した.SHAP値0起点に正がニーズあり,負がニーズなしへの寄与度を示す.
本研究は,口語テキストから発話者の潜在ニーズを自動抽出するための機械学習モデル構築とその有用性の検討,およびニューラルネットワークを用いて単語をベクトル変換する手法であるWord2Vecモデルを用いて作成した同義語辞書の適応による機械学習モデルの精度改善を検討した.
予備検討の結果,3つの木構造モデルの中でもxgboostを使用した場合が最も良い予測精度であった.xgboostとは,勾配ブースティングと呼ばれるアンサンブル学習と決定木を組み合わせた手法で非常に高い汎化能力があり,一般的に決定木よりも予測精度が高いと言われている[10].そのため,本研究においてもxgboostで最も予測精度が高かったと思われる.一方,ランダムフォレストで最も予測精度が低かったが,その理由としてバギングと呼ばれるアンサンブル学習と決定木を組み合わせた手法であった点が考えられた.バギングとは,学習データからランダムサンプリングしてサブ学習データを複数作成のうえ,それぞれのサブ学習データを用いて木構造モデルを作成する.それぞれの木構造モデルの予測結果を集約し最終的な結果を出力させる手法である.つまり,同義語辞書を用いて単語をクラスタリングせずに,学習データからサブ学習データを作成したことで,特徴量の分布の偏りが大きいサブ学習データが作成されたことから,予測精度が低くなったと考えられた.
本調査において,Word2Vecモデルを用いた同義語辞書の適応が精度改善に寄与しており,本アプローチの有用性を確認することができた.同様の先行研究においては,単語の共起関係に基づく機械学習による文書分類を検討した福本らの報告があり,シソーラスの分類語を用いて,単語の特徴ベクトルである共起行列を生成する手法を提案されていたが,モデルとしてはランダムフォレストで正識別率88.7%と高精度であったことから[11],本アプローチは一定の有用性があるものを考えられた.
最後に,SHAP解析を用いた潜在ニーズの可視化では,寄与度が高くかつ出現頻度が高い[病名,行動]クラスター文脈において,潜在ニーズとして解釈可能な口語テキストが含まれていたことが確認できた.精度が高い機械学習モデルを構築したとしても,その予測の根拠を十分に説明できない場合,その後,実用化につなげることは困難であるため,SHAP解析を用いた潜在ニーズの可視化とその意味解釈には意義があったと言える.そのため,本研究で検討した新手法は,今後,社会実装可能な技術であったと示唆された.
研究の限界として,小規模なデータセットでの検討であったため,今後,さらに大規模なデータセットでの検討により,さらなる機械学習モデルの精度向上が見込まれる.
口語テキストから発話者の潜在的ニーズを予測するための機械学習モデルに対して,ニューラルネットワークを用いて単語をベクトル変換する手法であるWord2Vecモデルによる同義語辞書の適応はモデルの精度改善に寄与した.
謝辞 調査にあたっては,医薬基盤・健康・栄養研究所の藤浪淑子氏の協力に感謝の意を表する.本研究は,科学研究費助成事業(学術研究助成基金助成金)基盤研究(C)(一般)(課題番号20K07206)の助成を受け実施された.
医薬基盤・健康・栄養研究所.
独立研究者.
千葉大学医学部附属病院.
医薬基盤・健康・栄養研究所.
医薬品医療機器総合機構.
医薬基盤・健康・栄養研究所.
会員種別ごとに入会方法やサービスが異なりますので、該当する会員項目を参照してください。