デジタルプラクティス Vol.9 No.1 (Jan. 2018)

デジタル・ガバメントと
オープンデータの推進について

平本 健二1

1内閣官房 政府CIO上席補佐官/経済産業省CIO補佐官 

社会の情報化とともに,デジタル・ガバメント,政府の情報化に関する取り組みが行われている.その中で行政機関の情報をオープンデータとして多くの方々に利用していただく取り組みを進めている.これらの政策の全体像と推進状況について解説する.

1.政府の推進方針

世界最先端IT国家創造宣言は,ITにかかわる基本的な政府の全体戦略である.その戦略のひとつとして,データの標準化について以前より取り組んでいる(図1).2016年12月に議員立法で官民データ活用推進基本法が成立し,データ活用を推進するための法律が整備された.それを受けて世界最先端IT国家創造宣言(以後,IT国家創造宣言と略す)とセットとなる基本計画[1],つまり今後官民データをどのように活用していくのか,またそのための環境をどう作っていくのかの計画がまとめられている.これらの計画ではデータの規格の整備,情報システムにかかわる規格の整備および,互換性や相互運用性の確保等の視点から見たプラットフォーム整備がまとめられている.

図1 国内の推進戦略と方針

この2つの戦略の下,重点分野に関する方針が作られている.そのひとつとしてデジタル・ガバメントの推進方針が同日に出されている.デジタル・ガバメント推進方針[2]は全体の方針であるが,具体化のための実行計画の策定も2017年12月末に向け行われている.その中にはサービスデザイン,つまり一連のサービス全体を通して良いものを作っていくためにどうすべきかという視点,またプラットフォームをどう実現すべきか,政府自身が使うプラットフォームがどうあるべきかという視点が含まれている.行政活動は社会活動の基盤であり,そのためのプラットフォームはどうあるべきかという視点である.これらを議論したものが,デジタル・ガバメントの推進方針であり,また同日に,公開データの形式やオープンデータの基本的な方針を改めて見直したものとしてオープンデータ基本指針が公表されている.

2.世界最先端IT国家創造宣言・官民データ活用推進計画

IT国家創造宣言は数年来進めてきたIT戦略であるが,法律の整備を受け,官民データ活用推進基本計画と一体とした.データ流通時代の到来に伴いIT戦略の中でオープンデータ施策等も推進してきており,またさまざまなIT化にも取り組んできたので,オープンデータやIT化が定着してきていると認識している.今回の改定ではこれを前提として,社会のあらゆる場面でネット上の情報を使うようになってきた状況,スマートフォンの普及が広まってきている状況を考慮し,この基盤の上でどのようなサービスを作っていくかということを重視して戦略として取りまとめている.

また,IT国家創造宣言・官民データ活用基本計画の重点8分野として,「電子行政」,「健康・医療・介護」,「観光」,「金融」,「農林水産」,「ものづくり」,「インフラ防災・減災」,それに「移動」を定め,重点的にIT化を進める計画を現在進めている.

官民データ活用基本計画によって大きくクローズアップされているのが図2のとおり,国・行政・民間(特に公益企業等)によって作り出される公益的なデータである.民間企業でも出せるデータは各社が協調して出すことによってより活用を広げ,さらにデータをオープンにすることによって自らの企業価値を上げるというかたちでデータのオープン化が進むことを期待している.

図2 社会全体の中でのデジタル化

併せて,データが公開されさえすればすぐに使えるというものではないため,データを活用しやすくするためのルール整備を行っている.2014年に政府標準利用規約として政府のWebページに掲載されているデータをオープンデータとして使用可能とするためのルールを作ったが,それ以外にもいろんなルールが必要である.データの取り引きのためにはどのようなルールが必要なのか,いわゆる情報銀行といわれているようなデータを貯める仕組みはどうあるべきか,加えて個人情報,知的財産等の扱いなど,いろいろな課題がある.課題解決のためにデータ活用のルール整備とデータをオープンにすることを同時にやっていく必要がある(図2).

データがオープンになり,利用ルールが整備されれば,それでデータの活用が促進されるわけではない.データが提供されていてもデータの形式等がばらばらでは使いづらい.データをうまく活用するためのデータ標準化が必要である.図2に語彙,コード,文字とあるが,基本的なデータの形式としてその標準の整備を行っている.さらにAPIの整備も必要である.当然ながらデータにアクセスするためには認証,アクセス権限についても考慮する必要があり,そのためのプラットフォームの用意も必要となる.

プラットフォームとは何なのかということが、よく問題になる.上述のような標準や認証処理のように実際に動く仕掛け,さらにデータ変換ツール等,このようなものを含めて利用者にとってデータを使いやすくするための環境が必要である.これを実現するために整備する対象がプラットフォームと呼ばれるものである.

また、ここ数年来,データの利活用においてキーになっているのが,図2で下から支えている番号制度,つまりはマイナンバーと法人番号である.従来,個人や法人の情報をうまく活用しようとしても同一性の確認が困難だったが,番号制度という日本の基盤制度によりこれが容易に可能となった.データの活用が非常にやりやすくなったといえる.

以前から一貫していわれていることだが,デジタル・デバイド対策も必要である.インターネットが普及し,スマートフォンをお年寄りの方々も使っている時代だが,使えない方々もいる.デジタル・デバイド対策としてそのような方々でも利用できる環境を用意する必要がある.日本国民全員がスマートフォンを使う必要はないはずであり,たとえば周囲の人が支援するとか,最近精度が向上している手書き認識,音声認識の活用が考えられる.使えない方々に無理にIT機器を使ってもらうのではなく,ITを使ってそのような方々を支えたり,周囲の方々がITを使って支えていくような仕組みである.

研究開発の観点では,地道にデータを出す部分もあれば,データ解析を高速化するためのデータ処理に関する研究開発もある.人材育成は,現在は大学中心で行われているが,実践の場を通じていろいろな情報を発信したり,データ活用のトレーニングコースのようなものを整備して人材育成していくことも必要である.IT,データ活用といっても,一般の方々からすれば,実感としてよく分からなく感じることがまだまだ多いであろう.データをうまく活用するとこんな良いことがあるという利便性を感じていただき,普及啓発を進めることも必要である.このようなことを総合的に進めていくのがIT戦略と官民データ活用の推進基本計画である.

3.デジタル・ガバメント推進方針

これらの活動を具体化するものとしてデジタル・ガバメント推進方針がある.前述のように,サービスデザイン指向を入れたサービス改革を検討中である.電子政府の戦略では1994年の最初の策定からずっと利用者視点といっている.利用者視点で,それぞれの部門が一番良いと考えるものを作ってきた.しかし,隣の部署と連携するともっと利用者にとって便利になるのではないかとか,本当に利用するときにこれで便利なのかという視点では,検討が不十分であった.そのような意味で,サービスデザインという観点から利用者視点でもう一度見直してみるべきであると考えている.

プラットフォームとガバナンスという観点で考えてみる.プラットフォームは前述のように,社会の基盤を提供する.今まで我々が電子行政とか電子政府といっていたものは,どちらかといえばどうやったら失敗しないシステムを作るかとか,コストをどうやったら下げることができるとか,そういうところにフォーカスされ,非常にガバナンス寄りだった.今回は,政府自身がサービサーとして,良いサービスをどんどん提供していこうというふうに大きく舵を切っている.そのために国とか,行政機関だけで閉じるのではなくて,民間サービスと組み合わせてより良いサービスを提供するにはどうあるべきかということをきちんと考えていこうというのが,今回のデジタル・ガバメントの推進方針である(図3).

図3 デジタル・ガバメント推進方針

もう少し具体的にデジタル・ガバメントの推進方針について説明する.今までと大きく変わっていることに注意していただきたい.サービスデザインだけでなく,もっとマーケティング的なことも考えなければいけないとしている.たとえば,国で作ったデータを対象にオープンデータ政策をやっているが,国民の方々,事業者の方々にもっと使ってもらうためには,政策をもっと知ってもらう必要があると考えている.システムを作ると満足して安心してしまうが,使ってもらわなくてはならない.使ってもらったら当然のことながらフィードバックをいただいて改善する.民間では当たり前のことだが,こういうようなことがまだまだできていなかったという面もある.また,さまざまなデータを分析し,後述するEPBM(Evidenced Based Policy Making)で政策立案にも使っていく計画である.たとえば,サービスの流れを電子化して,インターネットで全部できるようにしているのに,最後に印鑑を印刷した用紙に押して送付してくださいといったケースがある.このような場合は制度の壁も越えなければいけないこともある.しかし,メールの添付のようなことで代替できるものもあるかもしれない.さまざまなケースを想定して,全体をセットで見直していく.

4.オープンデータ基本指針

デジタル・ガバメント推進方針と並行して示したのがオープンデータ基本指針である(図4)[3].

図4 オープンデータ基本指針

これまでも数年来,オープンデータについてさまざまな指針を出して取り組んできたところだが,改めてオープンデータの推進方針を整理した.オープンデータの定義として,二次利用が可能,機械判読に適する,無償で利用できる等がある.各府省が保有するデータは原則オープンデータとして出すことを推奨してきたが,公開できていないものもある.多くの方々の要望を踏まえ,さまざまなデータを出していきたい.そのためには,完全なオープンデータだけでなく限定公開という手法も積極的に活用していく必要がある.たとえば,公開するのはあまり相応しくないというデータも当然あり,そのようなものは,データのうちの8割ぐらいは公開し,公開できない部分もあるといった方法である.このようにデータを出す側としてもやりやすい緩やかな方式も取りながら,全体の総量としてのオープンデータを増やすことを狙っている.利用規約で二次利用が可能になるようなルールを提供する.さらにダウンロード等も「100ファイルあるものを1個1個ダウンロードすると大変だ」という要望等が結構ある.さまざまな知見が貯まってきたので,一括ダウンロードする機能やAPIを作る等,使いやすい環境をオープンデータ環境にも入れていくことが必要である.

公開データの形式は,機械判読に適したコードおよびデータ形式ということだが,ただ単にデータの形式を揃えるというだけではなく,データ構造を考えていく.また,法人番号の併記を推奨している.法人関連のデータとして法人番号は自由に使えるので,これを基に情報を集めると産業分析とか,経済分析とか結構いろんな分析ができる.このようなデータ活用事例を積極的に作っていく.

公開済みのデータも課題である.今までもデータカタログサイトを整備してきたが,データを更新するのが大変である.そのため年に一度しか更新しない等の対応となっているものがある.オープンデータを使ったアプリの開発側からすると,せっかくそのデータに合わせてアプリを作ったのにデータが更新されないため,自分の作ったアプリが活用されないということになる.産業界から見てもそれでは使えないので,可能な限り迅速に公開するようにすることが重要である.たとえば,年次統計等を定期的に出すとか,設備であれば更新したタイミングで出すといったことを推進することを考えなければならない.

オープンデータ・バイ・デザインについて説明する.オープンデータについては,従来はどちらかというと現在持っているデータをどうやって使いやすいかたちで公開するかというところにフォーカスしてきた.しかし,今後はデータの設計段階からさまざまな配慮をし整備しておくことが重要となる.データ設計に共通語彙基盤などを参照したデータ設計を行うなど開発面の配慮と,データの収集時の同意書をオープンデータを前提とした規約にしておく等のルール面の配慮が必要である.

また,だれに相談したらいいのか分からないという意見がかなりあることから,推進体制として相談窓口を提供することにした.

5.情報提供に関する総合的な取り組みの推進

デジタル・ガバメントの取り組みではオープンデータも含めた情報提供に関する総合的な取り組みの推進を行っている(図5).オープンデータ・バイ・デザインもその一部である.情報の入口,情報収集の段階から持っているデータをシームレスにすることで,出口まで一貫して効率的に情報提供できるように考えている.

図5 情報提供の総合的な推進

まず,情報収集の段階で,先ほど述べたように,オープンデータを基本として設計することに加えてデジタル・ファーストという戦略を進めている.基本的に申請等の手続き書類はデジタルで情報を出してもらうとか,行政機関内部もデジタルで情報を作っているので,その整合性を取っていく.「なぜデジタルで作ったワープロ書類をファックスで送ったような汚いスキャンで公開しているのか.それをまた皆がOCRで読み込まなければならないではないか」という批判がよくある.このような不毛な作業は実際行われていると思われる.このような事態にならないように,最初からデジタルで作ったものはデジタルでそのまま活用することを入口の方針として掲げている.

しかし,単にオープンデータとして公開するという目的だけでは内部の職員からすると自らのメリットが感じられずやらされ感がある.それに対しては,デジタル化することによって業務自体の効率化,たとえば,数字領域に漢字を入れていないかの自動チェックができるといったメリットを説明している.さらに最近求められているEPBM(Evidenced Based Policy Making:エビデンスに基づいた政策立案),要するに「人口がこう増えているからこういう政策を打つ」,「経済状況の統計がこういう値を示しているのでこのような施策を打つ」,「こういうニーズがこうあるのでこのように打つ」,を実現するためには,デジタルデータを我々政府内や地方自治体でもうまく使いこなさなければいけないということを説明している.そのためには,最初の段階からデジタルで入り,その後もデジタルをうまく使おうと考える必要がある.行政職員は普通にパソコンで業務を遂行しているわけだが,データを活用し分析できるようになるためにはデータ活用人材の育成も必要である.

情報提供に向けて,出口の戦略としてオープンデータの推進があるが,まず情報量を充実させるということも当然必要である.充実したデータ群の中から,利用者がより良いデータを選択し,分析に活用してもらう.

そのために,我々が今取り組んでいるのは,ドメイン改革である.必要なデータを入手するためにどこのサイトを見に行けばいいのかが分からないことがある.ドメインを整理することによって,どこに行けばこういうデータが取れるのかを分かりやすくする.それとともに,Web改革にも取り組んでいる.府省のサイトは,「字が小さくて,メニューがたくさんあって,何がどこにあるのか分からない.ほかの自治体に行くとさらに分からなくなってしまう」等,いろいろなご意見をいただいている.ドメインの整理で,コンタクトポイントをまず明確にし,Webサイトのデザインやユーザビリティをきちんと整備することで,情報全体として使いやすくなると考えている.さらにAPIの整備である.オープンデータとAPIのセットで,システム連携ができるようなかたちを目指している.

また,政府統計にはデータが山のようにあり,これは宝の山である.これをもっと使いやすいかたちで出していく必要がある.

これらの総合的な取り組みを通じて,どこに必要な情報があるかをすぐに探すことができ,量もたくさんあるというかたちで,面としての情報のオープン化を目指していきたい.

今までオープンデータとか,電子政府の戦略を打ち出してきているが,それを強力に進められるのかどうか心配な方もいると思う.今回,IT基本法に続くIT系の法律として官民データ活用推進基本法が整備され,法律の中でデータ活用環境の整備と,データの標準化,APIの整備ということを明確にしている.さらに,国だけでなく,自治体も今後,官民データ活用の計画を作ることになっており,都道府県では義務,市町村では努力義務となっている.その意味で,国全体として,政策として非常に強力なエンジンがかかってきた.今までも強力に推進していたわけだが,さらに後押しするための法整備ができてきたと考えている.

その法律の推進を支援するものとしてデジタル・ガバメント推進方針とオープンデータ基本指針があり,デジタルを基本に社会を改革するための足元がしっかり固まってきたという感がある.

6.データ標準化の新たな局面

最後にデータ標準化の新たな局面を説明する(図6)[4].

図6 データ標準化の新たな局面

オープンデータに関して,現在,政府でいろいろ事例やモデルを示して,自治体も一緒にやろうというかたちで推進している,そうすると当然のことながらモデルの範囲だけでなく,他分野のオープンデータについても揃えられるところは揃えようという話が出てくる.たとえば,住所の書き方なども揃えたほうが効果的である.このように面としてのオープンデータが大きく広がり始めると考えている.

システムに関してもオープンデータ・バイ・デザインを考えると,オープンデータで使いやすいデータの形式がシステムの設計にも影響を与える.公開データと,設計時のデータは表裏一体である.その意味で,非常に広範なデータの標準化が今後強力に進んでいくと考えている.これまでのさまざまなデジタル・ガバメントの取り組みが融合していくことになる(図7).

図7 データ標準化の取り組み

デジタル・ガバメントを支えるデータ標準化として,共通語彙基盤が整備されており,データの構造化をし,データの組合せ方を決定して,データの意味を定義する,というかたちでデータのフレームワークを整備している.さらに踏み込んで裾野を広げた標準化として行政データ連携標準(仮称)も考えている.データ設計をしていると,表を定義し,データ項目を決めると,その桁数は何桁にするのか,取りうる値の属性をどうするか,という話になるが,そうではなく,たとえば,日付のデータの表現はどうするかといったことである.日本だと 2017/MM/DDと書くケースが多いが,国際標準ではハイフンで2017-MM/DDある.電話番号は日本では括弧で書く場合,あるいはハイフンつなぎで書く場合が多いが,ヨーロッパではスペース区切りが一般的である.どれを採用すべきか,あるいは性別のコードはどうするのか等のコード設計のようなことも検討が必要である.

オープンデータでも従来の普通のシステム設計でも,これまでは人間が判断していたのでそれなりに揺らぎがあっても何とか処理ができていた.しかし,オープンデータとして複数のデータが公開され,それをマッシュアップするときに,これだけは揃えておこうというところを精査する議論が必要だと考えている.

現在,いろいろなケースを調べているが住所が難しい.たとえば,字(アザ)が含まれている場合に,字(アザ)を省略してしまう人とか,字(アザ)以降全体を省略する人もいる.このような場合はマッチングがしづらくなる.「霞が関2丁目」という地名は,行政文書では「二丁目」と漢字で書いている場合が多いが,普通の生活の中では2丁目を,2-XX-YYというようにハイフンつなぎで書くことが多い.英語で書くときにも同様の表現が多い.このようなことについても,データをマッチングして組み合わせていくときには重要で,どのように書いてどのように変換すればいいのかを今後検討していく必要がある.このような面も含めて幅広に,総合的に取り組んでいきたい.

参考文献
平本 健二(正会員)hiramoto-kenji@meti.go.jp

政府CIO上席補佐官.経済産業省CIO補佐官.デジタル技術による行政サービス改革を担当.国・自治体を通じた調達情報,支援制度情報総合サイトの構築・運用をするとともに,文字,語彙,コード等の基盤整備,Webサイトの見直し等,行政サービス改革を総合的に推進.本会シニア会員.

採録決定:2017年12月12日
編集担当:藤瀬哲朗((株)三菱総合研究所)

会員登録・お問い合わせはこちら

会員種別ごとに入会方法やサービスが異なりますので、該当する会員項目を参照してください。