Cabinet Office Japan

研究機関の各種エビデンスを共有する「e- CSTI」を構築


可視化の自由度が高まり、求められていた表現も可能になった

Tableau Publicで分析結果の一般公開も容易に

我が国の科学技術力の向上を図っていく上で、重要な役割を担っている大学等の研究機関。その「研究力」や「教育力」、「資金獲得力」を高めていくことが、重要な課題になっています。これを適切に行うには、大学等の研究機関における「研究」「教育」「資金獲得」の状況に関するエビデンスを収集・分析し、その情報を関係者と共有する仕組みが欠かせません。そのために構築されたデータ共有プラットフォームが、内閣府の「e-CSTI(Evidence data platform constructed by Council for Science,Technology and Innovation)」です。

「エビデンスシステム構築の構想は2016 年頃からありました」と語るのは、内閣府 政策統括官付 参事官でエビデンスを担当する宮本 岩男 氏。その後2018 年4 月には、専任の組織がスタートしていたと振り返ります。ここで何を行うかを議論した上で、2019 年3 月にe-CSTI の主要な5 機能が、以下のように明確化されています。

(1) 科学技術関係予算の見える化
(2) 国立大学・研究開発法人等の研究力の見える化
(3) 大学・研究開発法人等の外部資金・寄付金獲得の見える化
(4) 人材育成に係る産業界ニーズの見える化
(5) 地域における大学等の目指すべきビジョンの見える化

「すでに(1)に関しては2019 年8 月に着手しており、当初はスタンドアロンPC 上でBI ツールを動かし、可視化していました。科学技術関係の事業は毎年5000 ~ 6000 案件あり、その内容をテキストマイニングした上で可視化するという構想にもとづき、試作品が作られたのです。その後、(2)~(5)が明確化されたため、改めてBIツールの見直しを行うことになりました。最初に使っていたBIツールには、いくつかの問題があったからです」(宮本氏)。

問題の1 つとして宮本氏が挙げたのが、ドットプロットのグラフを拡大表示したときに、ラベリングが行えなかったことです。例えば(3)で産学連携の状況を研究機関毎にプロットしていくと、座標軸の似た場所に点が集まる傾向があり、どれがどの研究機関なのかが識別しにくくなるのだと説明します。

またスタンドアロンPC 上で構築された仕組みでは、分析結果の公開が難しいという問題もありました。「e-CSTI で最も重要なのはエビデンスの収集・分析自体ではなく、その結果を政策立案者や研究機関が活用することです。そのためには公開手段の確保も求められました」。

クロス集計を取ってグラフ化するスピードの速さが、他のツールとは革命的に違うところです。例えば任期付きと任期なしで論文数がどう違うのか、データさえきちんと取ればグラフ化はあっという間です。グラフ化が高速に行えれば、試行錯誤をどんどん行えます

Tableau の導入・運用環境について

そこで新たなツールとして選定されたのが、Tableauでした。採用が決まったのは2019 年10 月。すでに(1)と(2)は他のBI ツールで構築が進んでいましたが、これらも含めてTableau へと一本化することに決定します。

e-CSTI では、多様なデータソースから科学技術に関する各種エビデンスデータを収集し、データベース管理システムに格納した上で、Tableau Server に取り込んでいます。これと並行してe-CSTI のWebサイトも立ち上げられており、2020 年3 月には関係省庁へと公開。Tableau の分析結果をどのように活用できるのかといったチュートリアルも、このWeb サイトで紹介しています。

利用方法は、まずe-CSTI のWeb サイトにログインし、そこからTableau Server へとログインすることで、公開されたダッシュボードを参照する、という形になります。座標軸の変更やデータのフィルタリング、グラフの拡大縮小といった操作は、アクセスしたユーザーが自由に行えるようになっています。

これを2020 年7 月には国立大学法人・国立研究開発法人等へも開放。さらに2020 年9 月には、一般公開可能なデータに限り、e-CSTI の公開サイトで公開されています。なおこの公開サイトではTableau Public が活用されています。

Tableau 選定の理由について

最終的にTableau を選定したのは、機能面および価格面で優位性が見られたからです」と宮本氏は述べています。そのうち機能面で評価されたポイントとしては、以下の4 点を挙げています。

ドットプロットのラベリングが可能
まず第1 は、以前のBI ツールで問題になっていたドットプロットのラベルングが可能なことです。著名なBI ツールを複数調べた結果、これが可能なのはTableau だけだったと宮本氏は振り返ります。

Tableau Public の存在
関係省庁や国立大学法人・国立研究開発法人等にダッシュボードを提供する場合には、オンプレミス型のTableau Server でも対応可能ですが、これだけではダッシュボードの一般公開は困難です。しかしTableau Public を外部に公開されるWeb サイトに埋め込むことで、一般公開も可能になります。

画面表示の美しさ
Tableau は他のBI ツールに比べ、画面表示が洗練されていると評価されています。これについて宮本氏は「昔のWindows とMacintosh の違いのようなイメージ」だと説明します。

印刷機能の柔軟性
Tableau は印刷画面の設定を行うことで、多様なパターンで印刷を行えます。これはサイズの大きいグラフを印刷する場合に、重要なポイントになると宮本氏は指摘します。

「例えば(4)の人材育成に関するグラフの中には、265 項目が並ぶ横長のものが存在します。以前のBI ツールではスクリーンショットしか印刷できなかったため、少しずつスクロールしながら印刷する必要がありました。これに対してTableauでは、画面を圧縮して印刷することが可能です。しかもこういった設定がユーザー側で行えます」。

Tableau の導入効果について

Tableau の導入効果について、宮本氏は次のように説明します。

「これまでも定性的な議論は様々な形で行われてきましたが、その定量的な実態がどうなのかといったデータは、関係省庁毎にサイロ化された状態でした。これを取りまとめて全分野を網羅するデータを提供し、関係省庁や研究機関で定量的な議論を行うためのプラットフォームがe-CSTI です。そのためには、全体を全体として見ながらも、自分に関係がある部分を詳細に見られるツールが必要です。これを簡単に実現できるのが、Tableau の最大の特徴です。Excel などを使ったレポートでは、このようなデータの見方はできません」。

またデータをまとめる際のスピードも、大幅に向上していると指摘します。

「私は内閣府に着任する前、経済産業省に在籍していましたが、そこではExcel でデータをまとめていました。e-CSTI でTableau を使うようになって、スピード感は数十倍になっています」。

今後の展開について

e-CSTI の分析結果を活用した政策立案は、すでに複数の案件で行われています。例えば「研究者の任期の有無と研究アウトプットの関係」の分析では、「任期なし」研究者の方が論文数、被引用数ともに高い傾向が定量的に示されており、若手研究者の雇用環境安定化が重要だということがわかっています。

これにもとづき創発的研究支援事業が立ち上がっており、約500 億円の予算要求につながっています。また2021 年4 月からは新たな「科学技術・イノベーション基本計画」の5 か年が始まりますが、そこで何を行うかという議論のベースとしても活用されています。

「e-CSTI で可視化したデータをベースに様々な議論を行い、それを政策担当者が政策に反映させることで、より研究しやすい研究現場が作られ、研究力の向上につながっていきます。その結果、同じ資金量でもより大きな成果を達成できるようになるのです。重要なのは分析そのものではなく、これをどう使ってもらうかです。より多くの人がe-CSTI を使いこなすことで、日本全体が良くなっていくと確信しています」。