デジタルプラクティス Vol.8 No.1(Jan. 2017)

被写体認識技術+OCR技術を活用したスマートフォンアプリによるマイナンバー収集代行サービスの実用化

増田 隆1  宮越 一郎1

1NECネクサソリューションズ(株) 

マイナンバー制度が始まり,2016年1月からは税や社会保障などの手続きに個人番号(通称 マイナンバー:以下「マイナンバー」という)が必要になった.当社では事業者がその従業員や扶養家族のマイナンバーを収集するための代行サービスを開発・運営しているが,より効率良く,正確でセキュアな収集を実現するために被写体認識技術とOCR技術の組み合わせを活用したスマートフォン(iPhoneやAndroid端末)向けアプリを開発した.本稿では,マイナンバー収集代行における課題を述べ,被写体認識技術+OCR技術による解決策を示すとともに,本技術の今後の活用可能性についても述べる.

1.スマートフォンを利用したマイナンバー収集

2016年1月よりマイナンバー制度がスタートし,税や社会保障などの手続きを行う事業者は,対象となる従業員などのマイナンバーを収集することが必要になった.

行政手続における特定の個人を識別するための番号の利用等に関する法律」(通称 番号法)ではマイナンバーを含む情報は「特定個人情報」とされ,その提供や取り扱い,保管に関して,適正を確保するための必要な措置を求めている.そのため,事業者がマイナンバーを収集,保管,利用する際は,特定個人情報保護委員会が公開しているガイドラインに沿った運用を行う必要があり,そのための新たな業務プロセス構築やコスト負担,セキュリティ対策といった問題が顕在化した.

当社はそのような事業者の抱える問題を解決するために,制度開始に合わせて「マイナンバー対応BPOサービス」(BPO = Business Process Outsourcing)の提供を2015年11月に開始した.「マイナンバー対応BPOサービス」は,マイナンバーの収集や保管を,事業者に成り代わり行うものであり,セキュリティが確保された中で,その業務プロセス自体を提供するサービスである(図1の①②).

図1
図1 マイナンバー対応BPOサービスの概要

その中でマイナンバー収集の代行を行う「マイナンバー収集代行サービス」においては,郵送による収集とスマートフォンアプリによる収集サービスを提供しているが,ここではそのスマートフォンアプリで用いている技術について紹介する(図2).

図2
図2 マイナンバー収集代行サービスの概要

1.1 収集の仕組み

事業者はマイナンバーの取り扱いに際し,その担当者を「個人番号利用事務実施者」として特定する必要がある.そのため収集においても,各従業員がマイナンバーを記入した書類を担当者に直接提出したり,書留郵便で郵送したりするなど,ほかの従業員が介在しないようなプロセスを実現する必要がある.ただし,人手による書類記載・郵送では,配付された個人番号通知カードから書類への記載ミスや,書類に記載された番号を手入力する際の入力ミスのリスクが大きい.また,確証として同時提出が求められる本人確認書類のミスや漏えいリスクもある.

そこで,ITを活用することでこのリスクを低減することを狙い,多くの人にとって一番身近なデバイスとなっているスマートフォンに搭載されたカメラの活用を考えた.各個人のスマートフォンを用い,収集対象者(従業員)自身がそのカメラでマイナンバーが記された通知カードを撮影し,その画像を送信することにより,転記や入力ミスを防ぐことができるとともに,必要に応じて運転免許証などの本人確認書類も同じように送信することができる(図3).

図3
図3 スマートフォンによる一般的なマイナンバー収集

なお,利用者に対してはこのようなスマートフォンアプリによる収集を推奨しているが,スマートフォンを保有しないなどの個別事情もあるため,書類郵送による収集にも対応している.

1.2 収集における課題

スマートフォンでの単純なカメラ撮影によるマイナンバーの収集は操作が簡単であるが,その反面,以下に示すような課題がある.これらの課題は次のような方法で抽出した.まず業務フロー全体を描き,どのプロセスにどのようなリスクがあるかを洗い出した.また,過去の業務システム構築経験から,画像認識技術やOCR技術を適用する際に課題になりそうな点もピックアップした.

課題1:撮影の失敗

過去,画像認識技術の業務適用試行の際,手ブレやピンボケなどのほか,照明によるテカリや撮影角度などが画像認識率に大きく影響していた.

マイナンバー収集は不特定の個人がその操作を行うことから,撮影技術や撮影する環境のばらつきは大きいことが想定された.

手ブレやピンボケ,あるいは斜め位置からの撮影による画像のゆがみ,撮影したカードがはみ出していてマイナンバーが読めないケースが考えられた.

課題2:撮影する対象物の間違い

マイナンバー収集代行サービスの業務設計においては,どのプロセスにリスクがあるか,業務フローをベースに検討を行った.その際,家族の個人番号通知カードの取り違いリスクが判明した.

マイナンバー収集は扶養対象となる家族も対象となり,その個人番号通知カードは個人ごとに分かれていることから,誤って別の家族のカードを撮影してしまうことが想定され,正しいカードの判別が必要となる.

課題3:マイナンバーの読み取り不良

画像からの番号文字の読み取りにおいてはOCRの活用が一般的であるが,その読み取り精度に問題があることは,過去の業務システム構築の経験から明らかであり,さらに不特定個人が撮影するとなると,その撮影品質が大きく影響することが想定された.

また一般的には特定されたフォントをベースに,読み取りエンジンのチューニングを行うが,マイナンバー収集代行サービスの開発時点では,実際の通知カードサンプルが入手できず,どのようなフォントが使用されるのか不明であり,求める精度レベルの実現にはリスクがあった.

課題4:データの流出

マイナンバー対応BPOサービスの開発にあたっては,情報漏えいなどが発生した場合の社会的影響が最も懸念された.そのため,一連のプロセスにおいてセキュリティ評価を行い,リスクの洗い出しを行った.

主なリスクとしては,撮影した画像は不特定多数が利用するネットワーク回線を経由して,センターの収集データベースに送られるため,盗聴などの危険性があること,また撮影した画像の取り扱いが不適切だと,間違えて画像をSNSなどを通じて第三者に公開してしまうなどがある.

マイナンバー収集の事業化を考えた場合,以上のような課題をクリアしなければ,収集のやり直しなどの修正作業が発生し,サービスコストの増加と顧客満足度の低下を引き起こすとともに,セキュリティ事故が起こった場合には社会的信用を損なう結果となる.そのためより精度の高いマイナンバー読み取りと,よりレベルの高いセキュリティ対策が求められた.

2.被写体認識技術+OCR技術の利用

当社では以前よりNEC中央研究所と協力して映像理解技術をさまざまな用途で活用する適用検証を行ってきた.映像理解技術[1]には,人間の顔を対象とした「顔認証」[2]や部品などを対象にした「物体指紋認証」[3]などの技術があるが,我々が適用検証を進めてきたのは高精度・リアルタイムな画像認識を実現する「被写体認識」技術と,文字を読み取るOCR技術を組み合わせたものであり,今回はそれをマイナンバー収集に活用した.

2.1 被写体認識技術

被写体認識技術とは,カメラなどで撮影した画像について,高精度かつ高速に,それが何であるかを認識する技術である.

認識したい対象に認識のための情報を付加するバーコードやICタグなどとは異なり,被写体認識技術は対象物そのものを認識する.そのため,デザイン上の制約が少ない,既存のものに手を加えずに認識できる,などといったメリットがある.

被写体認識技術では,認識したい被写体の特徴データをあらかじめマスタデータベースに登録しておき,カメラ撮影時にその画像から特徴データを抽出し,データベースに登録してある特徴データと照合することで被写体を認識する(図4).

図4
図4 被写体認識技術

画像の特徴データで照合することにより,登録した被写体とは異なる撮影角度・大きさ・照明条件でも認識でき,また被写体の一部が隠れていても認識することができる特長がある.

2.2 マイナンバー読み取りへの応用

マイナンバーを読み取るためのスマートフォンアプリ開発においては,この「被写体認識技術」とOCR技術を組み合わせた認識エンジンを開発し,アプリに組み込んでいる.この認識エンジンを以下のように活用して,より精度の高いマイナンバーの読み取りを実現している(図5).

図5
図5 マイナンバー収集のスマートフォンアプリ

活用1:撮影の失敗対策

通知カードや個人番号カードの撮影で手ブレやピンボケがひどい場合,被写体認識技術でのカードの認識ができなくなる.このことを利用して,対象のカードがきれいに撮影できているかをチェックしている.

また通知カードや個人番号カードの撮影時に近寄りすぎたり左右にずれたりして,カードがはみ出すことが考えられる.本アプリでは被写体認識技術により,撮影した画像のどの位置に被写体があるのかが判別可能なため,被写体が画像からはみ出していないかどうかをチェックすることができる.

上に述べたような,認識できないケースや被写体がはみ出しているケースなどは撮影失敗と判定し(図6),カードの撮影をやり直すように利用者にフィードバックする.これにより課題1に挙げた不特定多数の個人による撮影品質のバラつきを,ある程度コントロールすることが可能となる.

図6
図6 被写体認識技術による撮影失敗対策

活用2:撮影対象物の確認

本アプリではカードに印字されている対象者の情報(たとえば生年月日)も,被写体認識技術と連動したOCR技術によって高精度に読み取り,事業者からあらかじめ提供された本人や家族の個人情報と照合して対象者に間違いがないかをチェックしている(図7).

図7
図7 撮影対象物の確認

もし照合結果が一致しない場合は,正しい対象者のカードを撮影し直すように利用者にフィードバックする.これにより課題2に挙げた家族の通知カードの取り違いを極力防ぐことができる.

活用3:個人番号の高精度読み取り

通知カードや個人番号カードに記載された個人番号については,被写体認識技術と連動したOCR技術によってデータ化する.

その際に,傾いて撮影した画像だとOCR読み取りの精度が低下する.そのような画像の場合は,まず被写体認識技術により,撮影された画像の角度などを補正していったん正面画像に変換してから, OCR読み取りを実行している.このようなOCR読み取りを簡単化する前処理を行うことで,より安定して高い精度での読み取りを実現している(図8).

図8
図8 撮影画像の補正によるOCR読み取りの簡単化

また想定される対象フォントから,ボケ・白とび・ゆがみなど,実際の撮影環境を想定したシミュレーションを行うことで大量の学習データを生成し,あらゆる撮影条件で,かつ使用フォントが特定されていない文字を対象とした識別精度の向上をはかった(図9).

図9
図9 大量の学習データによる文字識別精度向上

これらにより課題3に挙げた,撮影した画像からのマイナンバーの読み取り精度の問題を解決した(図10).

図10
図10 通知カードの読み取りイメージ

3.セキュリティの確保

1.2節にも前述したとおり,マイナンバーは機密性の高い情報であり,適切な取り扱いが求められる.番号法にはマイナンバーなどの特定個人情報の提供や保護に関する規定があり,個人情報保護法よりも厳しい罰則が設けられている.

そのため,マイナンバー収集代行サービスのスマートフォンアプリの開発においても,考え得る最も高度な基準を適用している.

具体的には以下のような対策を実施し,課題4に挙げたリスクへの対策を施している.

対策1:通信の暗号化

マイナンバー収集代行サービス専用のスマートフォンアプリに通信暗号化システムを組み込み,センターとの通信を確実に暗号化することにより,マイナンバーの盗聴を防止している.

これにより盗聴リスクの高い,公衆無線LAN環境などにおいても,データ送信の際のセキュリティを確保できる.

対策2:データ消去

マイナンバー収集代行サービス専用のスマートフォンアプリでは,撮影した画像や,画像から読み取ったマイナンバーの情報はメモリ上のみで取り扱い,利用が終わったらすみやかに消去している.これにより,利用者の操作ミスによるSNSなどへの投稿や,悪意のある他者のスマートフォンアプリによる情報流出を防ぐことができる.

4.サービス稼働状況

マイナンバー収集代行サービスは,マイナンバー制度のスタートに先立つ個人番号通知カードの配付から間もない,2015年11月に本サービスを開始した.

2016年8月現在,本サービスを利用する事業者は200以上となり,50万世帯以上のマイナンバーを収集している.

NECグループ従業員のマイナンバー収集においても,本サービスが利用されており,8万件以上の収集をサービス開始後間もなく実施した.

サービス開始直後は,機種依存の問題によるアプリの動作不良や,センター側のサーバ負荷によるレスポンス悪化などのトラブルは若干あったが,アプリの更新やセンターサーバの増強などにより,その後は安定したサービス提供を継続している.

サービス提供にあたっては,利用者からの問合せを受け付けるコールセンターを開設しているが,スマートフォンアプリに関する問合せは,当初全体の半分を占めたが,アプリの改善によりその後は全体の5%に満たないレベルになっている.

1.2節で想定した4つの課題以外に大きな技術的課題は特に発生していない.収集結果を見ても,カードの認識とマイナンバーの読み取りは期待通りの精度が確保できていると考えられる.

また2016年9月現在においては,セキュリティに関する事故は報告されていない.

5.今後の展望

今回開発したマイナンバー収集アプリでは被写体認識技術とOCR技術の組み合わせを活用することで,マイナンバーを簡単にかつ正確に収集することを実現し,それに伴ってサービスオペレーションコストの削減とお客さま満足度の向上を実現した.

このような効率的な情報収集を目的とした仕組みのほか,消費者向けサービスや業務効率化の分野で被写体認識技術を適用できる領域は,今後もさらに広がっていくと考えている.

たとえば,

  • 棚に陳列された複数の商品を同時に認識して店頭調査に活かせるシステム
  • カタログを読み取ってそこから発注できるシステム
  • 機器や設備に付されている銘板と,そこに記載されている型番や製造番号などから保守点検等に必要な情報を提供するシステム
  • 訪日外国人対応に向けた案内看板やパンフレットなどから,自分のスマートフォンの言語設定に合わせた多言語対訳コンテンツを表示するシステム(図11
など,さまざまな場面を想定した研究開発や実験を行っている.

図11
図11 多言語対訳コンテンツ表示の活用例

ただし,実際の用途開発にあたっては,いろいろな場面を想定した認識精度の向上が不可欠である.

商品パッケージを識別する場合,同じデザインパッケージを部分的な「グラム数」や「増量」などのごく一部の表記で識別する必要があったり,設備などの銘板を読み取るには打刻文字のような照明の角度や加減で見え方が違うものがあったり,屋外看板では錆や汚れ,時間によって異なる日陰の具合なども考慮する必要がある.

このような課題をクリアして,実用に耐え得る認識精度を実現することが,事業化には必須であり,さらなる技術研究開発を進めなければならない.

「被写体認識技術+OCR技術」は多くのデバイスに搭載され,多くの人が使用している「カメラ」を利用する技術であり,それを使って,手軽に,安価に,実世界とディジタル世界をつなぐことができる技術である.

先進的な技術の活用により,今後もよりよいサービスを提供していきたいと考えている.

参考文献
増田 隆(非会員)masuda-takashi@nexs.nec.co.jp

NECネクサソリューションズ(株)第四システム事業部 主任.新技術研究や用途開発などを経験し,現在はWebシステムやスマートデバイスを利用したシステムの開発に従事

宮越 一郎(非会員)miyakoshi-ichiro@nexs.nec.co.jp

NECネクサソリューションズ(株)カスタマーリレーション推進部長.新事業の企画・開発などを経験し,現在はマーケティング部門統括に従事.

採録決定:2016年9月20日
編集担当:福島俊一((独)科学技術振興機構)