6V-06
eKYCのための教師無し犯罪情報体系化手法の開発
○百々優志郎(長岡技科大),野中尋史(愛知工大),井若玄貴(マヨラボ),飛内尚正,宍戸俊裕,望月正俊,中村 昇(KYCコンサルティング),伊豫田彬(愛知工大)
対面での取引や電子取引など、さまざまな形態の取引が多く行われている現在では、取引を行う相手の情報やその信頼性の高さが重要である。通常、これらの取引においてはコンサルティング会社などで作成し扱われている顧客情報によって信頼性が担保され、対面・電子での取引や本人確認が行われている。本人確認で重要な指標の一つに、犯罪情報がある。取引する人や取引先の従業員が過去に犯罪を犯したことがあるかどうかによって、その人や企業への信頼度は大きく異なるため、犯罪情報は非常に大事な情報である。また、近年、対面や郵送での本人確認のKYC(Know Your Customer)に加えて、オンライン上で本人確認を完結するための技術である、eKYC(electronic Know Your Customer)が広く普及されつつある(以下の3つの参考文献参照)。さらにこれらの論文(メルペイの論文2つ)から、UXが重視されて開発が進められているほどeKYCの重要性や需要の高まりがわかる。
しかし、これらのKYC/eKYCの際に使用されている顧客情報などのコンテンツを自動で作成する方法は、著者らが知る限り存在せず、作成には非常に時間がかかる。これは、大量のコンテンツを使用するKYC/eKYCにおいては非常にコストがかかる重大な問題である。
そこで、本研究ではKYCにおける顧客情報などのコンテンツ作成の自動化を目的とする。本論文では、顧客情報の抽出のために、ネット上に公開されているニュース記事から自動で犯罪者名と犯罪内容を抽出し、それらをまとめた顧客情報を教師なし学習によって作成する。教師無し学習を採用したのは、教師あり学習だと大量のアノテーションデータが必要であるためである。これによって、顧客情報の作成にかかるコストの削減やより精度の高い大量のデータを扱えるようになることが期待できる。そのため、我々は大規模な教師データなしに顧客情報を自動抽出するための手法についてまとめ上げ、実験、考察を行った。