developer's diary

最近はc#のエントリが多いです

「国会会議録検索システム 検索用APIの仕様」を調査

概要

項目 内容
APIが返却するもの 国会会議録検索システム(ウェブサイト)の内容
返却形式 XMLかJSON
検索条件 APIの種類に関わらず共通
操作方法 開始位置と、次開始位置を辿ることですべて取得できる仕組み

APIの利用について

営利・非営利 区分 結果
共通 アクセス 多重リクエストを避け、
データを取得し終えてから、
数秒程度空けて次のリクエストを行う
共通 公開 出典(国会会議録検索システム)を明記すること
共通 著作権 著作権は、個々の発言者が所有
共通 責任範囲 国立国会図書館は何ら責任を負いません
非営利 著作権の許諾 不要 (連絡すると喜ばれる)
営利 著作権の許諾 必要

APIの種類

種類 API 内容 最大取得件数
(デフォルト件数)
会議単位簡易出力 meeting_list 発言者の一覧 100(30)
会議単位出力 meeting 発言者と発言の一覧 100(30)
発言単位出力 speech 発言の詳細 10(3)

共通の出力項目(操作用)

1アクセスで取得する最大の件数があるため、次開始位置をもとに、アクセスを繰り返し辿っていくことで 全体を取得することができる。その操作の為の出力項目

No. 論理名 物理名
1 総結果件数 numberOfRecords
2 返戻件数 numberOfReturn
3 開始位置 startRecord
4 次開始位置(※存在する場合のみ) nextRecordPosition

共通の出力項目

No. 論理名 物理名
1 会議録ID issueID
2 発言ID speechID
3 イメージ種別(会議録・目次・索引・附録・追録) imageKind
4 国会回次 session
5 院名 nameOfHouse
6 会議名 nameOfMeeting
7 号数 issue
8 開催日付 date
9 閉会中フラグ closing

会議単位簡易出力の出力項目

No. 論理名 物理名
1 発言番号 speechOrder
2 発言者名 speaker
3 発言URL speechURL

会議単位出力

No. 論理名 物理名
1 発言番号 speechOrder
2 発言者名 speaker
3 発言者よみ speakerYomi
4 発言者所属会派 speakerGroup
5 発言者肩書き speakerPosition
6 発言者役割 speakerRole
7 発言 speech
8 発言が掲載されている開始ページ startPage
9 レコード登録日時 createTime
10 レコード更新日時 updateTime
11 発言URL speechURL

発言単位出力

No. 論理名 物理名
1 検索対象箇所(議事冒頭・本文) searchObject
2 発言番号 speechOrder
3 発言者名 speaker
4 発言者よみ speakerYomi
5 発言者所属会派 speakerGroup
6 発言者肩書き speakerPosition
7 発言者役割 speakerRole
8 発言 speech
9 発言が掲載されている開始ページ startPage
10 発言URL speechURL
11 会議録テキスト表示画面のURL meetingURL
12 会議録PDF表示画面のURL(※存在する場合のみ) pdfURL

検索パラメータ

国会会議録検索システム 検索用APIの仕様の 5. 詳細仕様 > 検索リクエスト > 3.指定可能な検索パラメータ が分かりやすいです。

参考

国会会議録検索システム 検索用APIの仕様 を参考に本エントリを作成しました。

国会会議録検索システムの使い方についてはマニュアルをご覧ください。

補足

※出力項目のNo.は自分の為に勝手につけました

利用してみる

PHPから利用したサンプルのエントリを書きました。

mitsugeek.net