對于大多數的數據庫而言,API接口可以方便的從數據庫中檢索數據。kegg 數據庫的API 鏈接如下:
API 其實就是一種約定號的URL 規則,通過特定的URL 返回不同的數據。kegg 的 API 的URL 構成如下:
http://rest.kegg.jp/operation/argument[/argument2[/argument3 …]]
前綴都是 http://rest.kegg.jp, 接下來就是對應的操作,kegg 一共提供了以下7種操作:
info
list
find
get
conv
link
ddi
接下來詳細看下每種操作的用法
info
主要用于展示每個數據庫共有多少條記錄的統計信息和于該數據相關的其他數據庫,url 格式如下:
http://rest.kegg.jp/info/database
database = kegg | pathway | brite | module | ko | genome | genes | org | vg | ag | ligand | compound | glycan | reaction | rclass | enzyme | network |
variant | disease | drug | dgroup | environ
示例 : 查看pathway 數據庫的基本信息
pathway KEGG Pathway Database
path Release 85.0+/03-11, Mar 18
Kanehisa Laboratories
570,005 entries
linked db module
ko
genome
<org>
compound
glycan
reaction
rclass
enzyme
network
disease
drug
pubmed
list
列出數據庫中所有的記錄,或者列出指定條目的記錄
對于list 操作,共有3種不同的URL 格式
第一種,查看數據庫中所有的記錄
http://rest.kegg.jp/list/database
database = pathway | brite | module | ko | genome | org | vg | ag | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | organism | medicus
示例:查看所有ko的信息
ko:K00001 E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1]
ko:K00002 AKR1A1, adh; alcohol dehydrogenase (NADP+) [EC:1.1.1.2]
ko:K00003 E1.1.1.3; homoserine dehydrogenase [EC:1.1.1.3]
第二種,只針對pathway和 module 數據庫 ,查看特定物種的信息,格式如下
http://rest.kegg.jp/list/database/org
database = pathway | module
示例:查看human對應的所有pathway 信息
path:hsa00010 Glycolysis / Gluconeogenesis - Homo sapiens (human)
path:hsa00020 Citrate cycle (TCA cycle) - Homo sapiens (human)
path:hsa00030 Pentose phosphate pathway - Homo sapiens (human)
第三種,查看數據庫中的某幾條記錄,使用數據庫中的標識符進行查找,多個標識符用+ 鏈接,最多1個URL 中允許查找10個
http://rest.kegg.jp/list/dbentries
dbentries = Entries of the following database
database = pathway | brite | module | ko | genome | org | vg | ag | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | medicus
示例:查看pathway 中 map00010 和 map00040 的信息
path:map00010 Glycolysis / Gluconeogenesis
path:map00040 Pentose and glucuronate interconversions
find
find 用于在數據庫中根據關鍵詞進行查找, 格式如下
http://rest.kegg.jp/find/database/query
database = pathway | brite | module | ko | genome | genes | org | vg | ag |
ligand | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | medicus
示例:根據關鍵詞 shiga和toxin 查找相關的基因
ece:Z1464 stx2A; shiga-like toxin II A subunit encoded by bacteriophage BP-933W
ece:Z1465 stx2B; shiga-like toxin II B subunit encoded by bacteriophage BP-933W
ece:Z3343 stx1B; shiga-like toxin 1 subunit B encoded within prophage CP-933V
關于后面4種操作的用法,我們下一篇進行介紹,今天就到此為止。