JBIF:地球規模生物多様性 情報機構日本ノード

GBIFに登録されているデータセット名とデータ件数を取得する

GBIF日本ノードポータルサイトでは、GBIFポータルサイトで公開されている標本・観察データの統計情報を公開しています。(データ統計のページ

統計の算出にはGBIF APIを利用しています。ここでは、公開されている標本・観察データのデータセットについて、各々の名称とデータ件数を知るために、どのようにGBIF APIを利用しているかを説明します。

提供機関の情報を取得する

はじめに、すべての提供機関の情報を取得します。リソースURLとして"/organization"を利用します。

http://api.gbif.org/v1/organization?limit=10000

2016年2月1日時点の提供機関数は982ですので、limit(取得件数)を10,000とすれば、すべての提供機関の情報を1ファイルで取得することができます。

提供機関ごとのデータセット情報を取得する

上の操作でダウンロードしたJSONには、提供機関ごとに割り振られたキー(key)が記されています。この値をもとに、提供機関ごとのデータセット情報を取得します。

例えば国立科学博物館のキーは"4fd82480-ea1c-11da-8db4-b8a03c50a862"ですので、リソースURL"/organization/{UUID}"を利用して、

http://api.gbif.org/v1/organization/4fd82480-ea1c-11da-8db4-b8a03c50a862/publishedDataset?offset=0

とすれば、国立科学博物館が提供しているデータセット情報を20件取得することができます。21件目以降を取得するためには、offsetの値を増やしていく必要があります。

http://api.gbif.org/v1/organization/4fd82480-ea1c-11da-8db4-b8a03c50a862/publishedDataset?offset=20

1つの提供機関に対してすべてのデータを取得しきるまで、これを繰り返します。

データセットごとの件数を取得する

上の操作でダウンロードしたJSONを参照します。そのうちデータセットの種別(type)が"OCCURRENCE"であるデータセットについて、データセットごとに割り振られたキー(key)とデータセット名(title)を抽出します。今回は以下のデータセットの件数を調べます。

  • データセットキー:4965c6a0-338c-4b27-8cf0-523abe237fac
  • データセット名:Annelida collection of National Museum of Nature and Science

データセットキーをもとに、データセットごとの件数を取得します。リソースURLは"/occurrence/count"を利用して、

http://api.gbif.org/v1/occurrence/count?datasetKey=4965c6a0-338c-4b27-8cf0-523abe237fac

とすれば、データセットに含まれる件数のみ記されたファイルを取得できます。これにより、"Annelida collection of National Museum of Nature and Science"は、30,926件の標本・観察データをもつデータセットであることがわかります。