山口 通智 東芝デバイス&ストレージ株式会社 |
[背景]オンラインサービスを保護するCAPTCHAの普及
[問題]視覚障害者には既存のCAPTCHAの利用が困難
[貢献]視覚障害者が利用可能な言語型/聴覚型CAPTCHAの提案
提案方式では,複数階数のマルコフ連鎖モデルを利用して,異なる「文の自然さ」を持つ機械合成文の組を生成し,利用者により自然(もしくは不自然)な方を解答させることで前述の問題点を解決した.この方式では,機械合成文のみがCAPTCHAとして提示されるので, 自然文の性質に起因する脆弱性を克服できる.さらに,常に異なる自然さを持つ文を比較して解答できるため,認知バイアスの影響による人間の正答率低下を抑制できる.本研究では,既存/提案方式の実装と実験による評価を通して,安全性と人間の正答率において,既存方式に対する提案方式の優位性を明らかにした.
(本研究は現職の東芝デバイス&ストレージ株式会社との関連性はございません)
[問題]視覚障害者には既存のCAPTCHAの利用が困難
[貢献]視覚障害者が利用可能な言語型/聴覚型CAPTCHAの提案
CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)は,人間とロボット(ソフトウェアによる自動化エージェント)を判別するテストであり,ロボットによるオンラインサービスの不正を防止する技術として普及している.
CAPTCHAは,人間とロボットの間にある能力差を用いたテストで,歪曲や雑音挿入を施した画像や音声の解釈問題が利用されてきた.近年では,AI技術の進展に伴い,人間の持つより高度な認知能力を利用する方式も提案されている.その一方で,大部分のCAPTCHAが画像認知・解釈を作問に利用する視覚型であるため,視覚障害者は利用困難である.視覚型の代替となる聴覚型CAPTCHAについては,音声の歪みや雑音が強すぎるため,人間には難しすぎると米国視覚障害者団体により抗議の声があがっている.このように,現状のCAPTCHAは,視覚障害者のウェブ利用の障害になっている.
本研究は,CAPTCHAのアクセシビリティ問題を解決するため,視覚障害者にも利用可能な言語型/聴覚型CAPTCHAの新方式を提案した.同じ視覚障害者であっても,聴覚や言語学習などにおける障害を重複する事例も多いため,さまざまな知覚チャネルに対応できるよう複数方式を準備することは重要である.本文では,提案方式の一つである言語型CAPTCHAに焦点を当てて説明する.言語型CAPTCHAは,人間の持つ文意・文脈の解釈能力を利用する方式である.
既存の言語型には,人間が記述した自然文と機械合成文(翻訳文)の間にある「文の自然さ」の違いを作問に利用するCAPTCHAがある.これらの方式は,1文ずつ自然文もしくは機械合成文を提示し,利用者にその識別をせさる.「文の自然さ」は,その評価基準が明確に定義できないため,ロボットが直接評価するのは困難だと期待できる.しかしながら,既存方式には問題点が2つ存在する.
CAPTCHAは,人間とロボットの間にある能力差を用いたテストで,歪曲や雑音挿入を施した画像や音声の解釈問題が利用されてきた.近年では,AI技術の進展に伴い,人間の持つより高度な認知能力を利用する方式も提案されている.その一方で,大部分のCAPTCHAが画像認知・解釈を作問に利用する視覚型であるため,視覚障害者は利用困難である.視覚型の代替となる聴覚型CAPTCHAについては,音声の歪みや雑音が強すぎるため,人間には難しすぎると米国視覚障害者団体により抗議の声があがっている.このように,現状のCAPTCHAは,視覚障害者のウェブ利用の障害になっている.
本研究は,CAPTCHAのアクセシビリティ問題を解決するため,視覚障害者にも利用可能な言語型/聴覚型CAPTCHAの新方式を提案した.同じ視覚障害者であっても,聴覚や言語学習などにおける障害を重複する事例も多いため,さまざまな知覚チャネルに対応できるよう複数方式を準備することは重要である.本文では,提案方式の一つである言語型CAPTCHAに焦点を当てて説明する.言語型CAPTCHAは,人間の持つ文意・文脈の解釈能力を利用する方式である.
既存の言語型には,人間が記述した自然文と機械合成文(翻訳文)の間にある「文の自然さ」の違いを作問に利用するCAPTCHAがある.これらの方式は,1文ずつ自然文もしくは機械合成文を提示し,利用者にその識別をせさる.「文の自然さ」は,その評価基準が明確に定義できないため,ロボットが直接評価するのは困難だと期待できる.しかしながら,既存方式には問題点が2つ存在する.
(1)問題文として提示される自然文の性質を利用した攻撃に対して脆弱:まず,自然文の量は有限であるため,既存方式は出題履歴を利用した攻撃に脆弱である.オンライン文章などの大量のリソースで対抗する場合は,引用した自然文が検索にヒットするため,検索結果を利用した攻撃に脆弱となる.
(2)プライミングなどの人間の認知バイアスによる正答率低下:既存方式では1文ずつ「文の自然さ」の評価をするため,同じ問題文であっても,その直前の問題文によって受ける印象が変化してしまう.
提案方式では,複数階数のマルコフ連鎖モデルを利用して,異なる「文の自然さ」を持つ機械合成文の組を生成し,利用者により自然(もしくは不自然)な方を解答させることで前述の問題点を解決した.この方式では,機械合成文のみがCAPTCHAとして提示されるので, 自然文の性質に起因する脆弱性を克服できる.さらに,常に異なる自然さを持つ文を比較して解答できるため,認知バイアスの影響による人間の正答率低下を抑制できる.本研究では,既存/提案方式の実装と実験による評価を通して,安全性と人間の正答率において,既存方式に対する提案方式の優位性を明らかにした.
(本研究は現職の東芝デバイス&ストレージ株式会社との関連性はございません)
(2017年5月31日受付)