データ流通市場の歩き方

株式会社日本データ取引所の公式ブログです。

行政オープンデータの歴史に学ぶ、データ公開の制度と実践 #3 オープンデータの作り方──現場の悩みと解決策

データ流通ことはじめバナー画像

こんにちは。本連載では、データ流通市場に関連する用語や、業界動向を解説しています。連載第15回から、政府のオープンデータ運動をテーマとして取り上げてきました。今回は、組織でオープンデータを作る方法やそのメリット、課題の乗り越え方を見ていきます。 

オープンデータ作りの手順

自組織でオープンデータを作るにはどうすればいいのでしょうか。作業手順は「5つ星オープンデータソン作業手順」などにまとまっていますので、ここでは日本と米国の「考え方の違い」を比べてみましょう。参照するのは「オープンデータをはじめよう」 [内閣官房 情報通信技術(IT)総合戦略室]と「Data Lifecycle Recommendations」(The 2016 U.S. Open Data Roundtable)です。

図 12 オープンデータ作成手順の日米比較

図 12 オープンデータ作成手順の日米比較

 

日本の資料は真っ先に「担当チームを決めよう」を挙げるなど、組織のルール・意識づくりに焦点を当てます。「地方自治体における情報システム基盤の現状と方向性の調査」 [独立行政法人情報処理推進機構, 2016]で、自治体が「推進体制が決まっていない」(66.1%)「職員のスキル、ノウハウが不足している」(66.3%)を最上位の課題だと回答していることと符号していますね。

対して米国の資料では、データ品質向上を推奨するほか(Standarization, Managing Privacy)、組織外から協力を得ながら進める姿勢が垣間見えます(Communities and Collaboration)。そして、どちらも改善(Improvement)を重視しています。たしかに、一度データを公開したら終わりではなく、利用者の声を集めたり、データの利用状況をモニタリングすることは重要です。

「投資対効果は?」と聞かれたら

とはいえ、自治体ごとにも温度差があります。内閣官房総務省が熱心に成功事例を紹介したり [内閣官房, 2016] [総務省, 2015]、2017年2月にはIT総合戦略室が自治体向け標準フォーマット例を公開したり [電子行政オープンデータ実務者会議, 2017]しているのですが、「地方自治体における情報システム基盤の現状と方向性の調査 [独立行政法人情報処理推進機構, 2016]」では、「未検討」が45.2%。「効果が実感できない」との声が毎年寄せられます。市場規模1.0~1.2兆円、直接効果1.5兆円、経済波及効果5.4兆円といった推計 [林雅之, オープンデータ・ビジネス(3)オープンデータの経済効果, 2014]はあるものの、はっきりした「効果」を実感できる身近な事例が、まだ多くないからかもしれません。

Gartnerの発表によると、2019年までには、数百万人規模の都市の50%以上の市民が、IoTやソーシャルネットワークを通じて自らのデータ共有に応じ、全ての自治体の20%が、付加価値のあるオープンデータにより収入を獲得すると予測しています。 [Gartner, 2016] 一方で、「Innovation Nippon 研究会報告書 オープンデータの経済効果推計」では、オープデータの経済効果を年間1,800億円~3500億円と試算しつつも、オープンデータの経済効果について「厳密な値ではない」「意味が多義的である」と効果推計の難しさを論じています。

事業メリットは大いにある?

もっと分かりやすいメリットも考えてみましょう。グルメ口コミサイトYelpでは、サンフランシスコ市、ニューヨーク市がオープンにした飲食店の衛生管理データをAPIで取り込み、自社サイトで表示しています。飲食店にとっては宣伝効果や信頼醸成が期待でき、利用者は衛生状態を考慮してお店が選べるようになり、Yelpにとっては掲載情報が充実できます。

この例では、衛生管理データを公開したあとにページ閲覧や予約、口コミ、売上などが増えたお店を見つけて、それ以前のデータと比較すれば、衛生管理データの公開が生み出した経済価値を推計できます(掲載に伴って店舗側のサービスが向上したなど派生要因も含むので、データ公開自体が持つ効果は限定的かもしれませんが)。

ほかには、後述する行政サービスのコスト削減情報資産の可視化といった経済効果が考えられます。

自由と制限の折り合いは? 

埼玉県の広域オープンデータプロジェクト

日本にも参考になる事例があります。2015年に埼玉県が「県の広報情報をオープンデータとして民間企業へ提供開始!」したとき、利用規約で利用方法や利用条件、申請方法を厳しく制限していたことから、「埼玉県の「オープンデータ」が色んな意味ですごい!」と疑問の声が上がり、公開からわずか2日でWebサイトが閉鎖。政府や市民からも指摘が相次ぎ、毎日新聞にも取り上げられる騒ぎになりました。「オープンの意味が分かっていない」とする立場と、「オープンデータであることよりも、オープンであることの方が重要」 [東富彦, 2015]とする立場で意見も割れました。その後、埼玉県庁では、利用規約から事前申請を必須とする一文を削除。いまではCC-BYでデータを利用でき、「埼玉県の対応の早さには驚いた」と評価されました。

 

こうした試行錯誤を経て、「Open Data Saitama」では、2017年から埼玉県内の58市町村が参加し、10種類のデータセットを共通フォーマットで提供し始めました。 [埼玉県, 2017] 対象データ選定や共通フォーマット検討のため、当初からデータ保有者である19の市町村に加え、データを利用したい民間企業・組織が参加したワーキンググループを開催(ヤフー、日立公共システム、ソフトバンク・テクノロジー富士通りそな銀行などが参加)。利用ニーズの強いデータを数ヶ月に渡って共同検討し、相互運用性の高いIMI共通語彙基盤を取り入れた提供形式で公開(経済産業省独立行政法人情報処理推進機構IPA)が協力)。すでに株式会社ミラボが予防接種アプリに施設情報・イベント情報を、一般社団法人オープン・コーポレイツ・ジャパンが「マイ広報紙」にイベント情報を、株式会社ぱどが情報誌「ぱど」にイベント情報を掲載予定です。

意外なハードルの柔らかい乗り越え方

トップダウンボトムアップの組み合わせで、各方面の利害調整を巧みに実現した事例です。政府の指針に沿って埼玉県庁が音頭を取ることで、県内自治体は首長の同意を得やすくなりました。また、担当職員が原課にデータ公開を求めるとき、共同検討の成果が説得材料になりました。そして、共通語彙基盤を採用したことで、「どんな形式で公開すべきか」との議論も避けられています。

ワーキンググループを取りまとめた企画財政部情報システム課の森田康二朗主査は「自治体では、データをどう出せば良いのかを決めるハードルが意外に高い。ワーキンググループには、行政がデータを出しやすくなるきっかけを作る意味があった」と語っています。 [大豆生田崇志, 2017] このように、制限を覚悟しながら外圧も借りつつ、段階的に鍵を開けていった埼玉県の取り組みは、日本の自治体に案外フィットしているように思います。

コスト削減の効果は?

負担軽減にはつなげやすい

コスト削減の効果はどうでしょうか。例えば、道路改修や除雪といった地域の行政サービスは、予算や人手も限られるなかで、より効率のよい作業が求められます。「FixMyStreet」のように市民の口コミを投稿する場を設けたり、センシングデータを公開したりすることは有益です。

対処が必要な箇所の特定を全て職員が実施した場合のコストと、センサーデータや市民の協力によって場所を特定する場合のコストは比較的簡単に試算できそうです。また、オンラインでデータを公開すれば、遠方の地域にも簡単に情報を届けられます。従来手法の通信費やメディア掲載費が削減できるわけで、こちらも換算対象になりそうです。 [Matsuoka, 2015]

人口1万6400人の町で

北海道森町は、高齢化が進む小さな町ながら、オープンデータ先進自治体として著名。山形巧哉総務課情報管理係長は、オープンデータ推進派として全国から引っ張りだこです。

森町では、Linkdata.orgを活用してサーバー構築・運用のコストを抑えつつ、IMI共通語彙基盤を取り入れたオープンデータを公開。アーバンデータチャレンジ2016でアプリ部門銀賞に輝いた [一般社団法人社会基盤情報流通推進協議会, 2017]小学校の給食献立アプリ「オガルコ」などにデータが利用されています。

「小さな町の小さなリソースだからこそ、オープン化の効果が出やすい」(山形氏)との談は、取組みの意義が大都市だけのものではないことを示唆しています。たしかに、人口の少ない地域の広報は、大都市よりも制作・配達の単価は高くなります。スマートフォンやデータポータルなどの既存インフラを活用すれば、運用コストも抑えられます。

成果が他の自治体に真似されるようになれば、町の知名度が向上し、標準・ひな型として全国に普及する動機づけにもできます。結果として庁内でデータや用語の共通化が進み、文書管理も徹底できたといいます。 [山形巧哉, 2017] [山形巧哉, 人口1万6404人 北海道森町目線でのオープンデータ, 2016]

効果が見えづらい、大変な割に褒められない、予算がない、進め方がわからないなど、データ公開のハードルは枚挙に暇がありません。人材やリソースの不足を逆手にとって、できることから進めていく森町の取組みは、こうしたハードルを超えようとする自治体のヒントになるはずです。 [柏崎吉一, 2017]

どうやって収益化すればいい?

地道な取り組みで理解の輪を広げる「マイ広報紙」

一般社団法人オープン・コーポレイツ・ジャパンが運営する「マイ広報紙」は、全国約300の自治体広報紙をデジタル化し、「子育て」「くらし」「講座」などに分類して無料公開しています。従来の主要流通チャネルだった新聞宅配が減少し、市民に情報を届けづらくなった自治体の新たな広報チャネルとして評価されています。2016年からは自治体ごとのスマホアプリも提供し、2017年にはNTTドコモiコンシェル」を通じた記事提供も始まりました。 [大豆生田, 2017]  今後は、ニュースサイトや地域フリーペーパーなどへもコンテンツ提供して収益化を目指します。 [一般社団法人オープン・コーポレイツ・ジャパン]

もっとも初めは、外部メディアへのコンテンツ提供に対する自治体の理解は進みませんでした。しかしデータ作成をオープン・コーポレイツ・ジャパンがすべて無償で行うことで、地道に対象を拡大してきました。自治体は、素材提供と権利処理だけで、新しい広報チャネルを無償で利用できます。記事ごとにアクセス数も分かるので、「コンテンツの効果測定ができた」と好評です。

副産物としての「業務効率化」

「マイ広報誌」の意外な副産物は、広報担当者の業務負担の改善でした。420紙の約22,000記事が毎月蓄積されるとあって、担当職員が他地域の広報誌を読んで、地元の記事作りに活用していたのです。居住地はもちろん、勤務先や地元、実家の情報をいつでも読めますので、ある自治体では訪日観光客が「マイ広報紙」を見て来訪した例もあったとか。

実は、オープンデータ推進でもっとも効果が大きいのは、公開作業に伴う、情報資産の棚卸しかもしれません。公共機関に限らず、組織内のデータの所在、内容、分量、利用目的、更新者などを一元管理できている団体は多くないのではないでしょうか。ある自治体でも、保育園や幼稚園の情報を公開したいのに、所管部署が分からなかったり、分散していたりして、「誰に頼めばいいのか探すところから始めた」(関係筋)。職員の方々にも「把握していない情報が独り歩きしたらどうしよう」といった「浮遊ファイルのトラウマ」が根強くあると言われます。 [アライド・ブレインズ株式会社, 2013]

自組織にはどのようなデータが、どのような形式で、どれだけ存在するのか。どんな人に使われているのか。これを把握するだけでも、どの部署でどんな業務が行われているか可視化できます。その業務がどこまで必要なのかも再評価できます(BPR:Business Process Re-engineering)。実際に「効果があった」と言及するケースもあります。 [山形巧哉, 人口1万6404人 北海道森町目線でのオープンデータ, 2016]

担当者が忙殺されないためには?

こうした潮流は、21世紀初頭に自治体によるネット広報の黎明期を想起させます。例えば2003年の調査では、広報媒体に「ホームページ」を挙げた自治体はまだ55.9%。 [~自治体「広報」に関するアンケート~, 2003] 原課がMicrosoft Wordで作成した原稿を、IT部門でHTMLやPDFにして公開することが珍しくなかった時代です。DreamweaverやHomepage Builderといったウェブ制作ソフトは高価で難解だったため、「詳しい誰か」に仕事が偏らざるを得ませんでした。

やがて「みんなの公共サイト運用ガイドライン」(総務省, 2005年)の制定も手伝い、自治体ホームページでの情報発信が認知され始めると、Webページ制作の知識がない人でも直接編集でき、サイト全体の体裁・構成を共通テンプレートで管理できるCMS製品が普及します。CMS製品が「HTMLページを作る作業負荷」を減らしたことで、情報の探しやすさやサイト全体の統一感・デザイン、アクセシビリティへの配慮といった「コンテンツ」に注力されるように。ホームページの運用担当部署は、徐々にIT部門から広報部門へ、広報部門から原課へとシフトして行きました。

オープンデータ推進も、よく似た軌跡を辿るのでしょうか。京都市が採用したオープンデータ公開支援ソリューション「DKAN」 [ANNAI株式会社, 2016] や、Google米国が支援する「Frictionless Data」など、職員が手をかけずにオープンデータを公開できる仕組みも提供されています。「データを作る作業負荷」や公開データの管理や効果測定など、ツールの導入で解決できることは、やがて自動化されて行くでしょう。

データの価値は、どう評価するの?

「価値のあるデータ」の候補は公表されている

評価基準の策定も進んでいます。前述した「オープンデータ憲章」は、価値の高いデータを分野ごとに具体的に指定して、G8加盟各国に公開を推奨します。

図 13:G8で合意した公開すべき『価値の高いデータ』

図 13:G8で合意した公開すべき『価値の高いデータ』

出典:東富彦「G8で合意した公開すべき『価値の高いデータ』 (http://okfn.jp/tag/high-value-data/
Open Data Census」は、Open Knowledge Foundationが2013年から発表している評価で、各国の推進レベルを15分野別に評価しています。日本は、31位(2014年)。Election ResultsやHealth Performanceの分野で赤色が目立ち、2013年の19位から順位を落としました。 [渡辺智暁, 2014]

 

図 14 Open Data Censusのランキング

図 14 Open Data Censusのランキング

出典:Global Open Data Index(http://index.okfn.org/place/

活動の進捗評価も指標がある

推進活動そのものの評価では、ワールド・ワイド・ウェブ財団(World Wide Web  Foundation)とOpen Data Instituteが、2013年10月から「Open Data Barometer」を発表しています(図 15 Open Data Barometerの枠組み(ODB-3rdEdition-Indicatorsより作成))。準備(Readiness)、実施(Implementation)、影響(Impact)の3つの枠組みから評価を行っており、3年連続首位の英国は、2015年には全評価項目で100点満点を記録。日本の順位は13位(2015年)で、「実施」は53/100点とやや低いものの、「影響」が前年の30点から65点に改善し、19位から6段階上がりました。「Open Data 500 Global Network」(2014年-, ニューヨーク大学(NYU)のGovlab)では、各国の民間企業500社を対象に、利用しているオープンデータの提供元となった府省を調査しています。

図 15 Open Data Barometerの枠組み(ODB-3rdEdition-Indicatorsより作成)

図 15 Open Data Barometerの枠組み(ODB-3rdEdition-Indicatorsより作成)

指標の取り入れ方には要注意

どの評価プログラムも、これから制度設計を行う方の参考になります。とはいえ採点基準や目標が異なることには注意しましょう。順位に一喜一憂せず、自国に適した指標を参考にするのが妥当でしょうか。電子政府実務者会議でも、「1.各指標の評価対象となっているが日本での公開数が少ない分野については、重点的に公開を進める」「2.日本での公開数は多いものの国際指標で評価対象となっていない分野について、評価対象に含めてもらうよう、実施団体へ働きかけ」の2本立てで対策を講じるよう提案しています。 [電子行政オープンデータ実務者会議 , 2015]

図 16 電子政府実務者会議での分析資料

図 16 電子政府実務者会議での分析資料

出典:電子行政オープンデータ実務者会議(http://www.kantei.go.jp/jp/singi/it2/densi/kwg/dai2/siryou1.pptx

 

行政オープンデータをテーマにしたシリーズも、次回がラストの予定です。次回は今後の展望として、企業と行政の連携、そして産学連携についての話題も取り上げます! どうぞご期待ください。

▼次回記事はこちら

blog.j-dex.co.jp

編集部からのお知らせ 

私たち日本データ取引所は、売りたいデータを簡単に出品でき、欲しいデータをすぐに探せるデータマーケットプレイス「JDEX」を運営しています。データ活用を一歩前に進めたい方は、ぜひ以下のリンクにアクセスしてみてください。

www.service.jdex.jp

(著作:清水響子+編集部 編集・構成:編集部)