KEGG API 用法詳解下篇

本篇接著介紹下列 4種 api 的用法:

  1. get

  2. conv

  3. link

  4. 4.ddi

get

根據提供的kegg 標識符,返回特定的記錄,多個標識符之間用+ 連接,一次最多允許10個標識符,格式如下

http://rest.kegg.jp/get/dbentries[/option]
dbentries = KEGG database entries of the following database
database = pathway | brite | module | ko | genome | org | vg | ag | compound |
glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | disease_ja | drug_ja | dgroup_ja | environ_ja | compound_ja
option = aaseq | ntseq | mol | kcf | image | conf | kgml | json

共有兩種用法

第一種用法,不帶任何的option, 返回的結果和網頁版的結果類似

示例:返回hsa:10458基因的信息

http://rest.kegg.jp/get/hsa:10458

ENTRY       10458             CDS       T01001
NAME        BAIAP2, BAP2, FLAF3, IRSP53
DEFINITION  (RefSeq) BAI1 associated protein 2
ORTHOLOGY   K05627  BAI1-associated protein 2
ORGANISM    hsa  Homo sapiens (human)
PATHWAY     hsa04520  Adherens junction
            hsa04810  Regulation of actin cytoskeleton
BRITE       KEGG Orthology (KO) [BR:hsa00001]
             Cellular Processes
              Cellular community - eukaryotes
               04520 Adherens junction
                10458 (BAIAP2)
              Cell motility
               04810 Regulation of actin cytoskeleton
                10458 (BAIAP2)
            Membrane trafficking [BR:hsa04131]
             Endocytosis
              Bin/Amphiphysin/Rvs (BAR) family proteins
               I-BAR proteins
                10458 (BAIAP2)
POSITION    17q25.3
...

第二種用法,后面加上options 操作,需要注意的是,特定的數據庫有特定的option。

對于gene 數據庫而言,支持 aaseq 和 ntseq, 返回基因的序列
示例:返回基因的核酸序列

http://rest.kegg.jp/get/hsa:10458/ntseq

>hsa:10458 K05627 BAI1-associated protein 2 | (RefSeq) BAIAP2, BAP2, FLAF3, IRSP53; BAI1 associated protein 2 (N)
atgtctctgtctcgctcagaggagatgcaccggctcacggaaaatgtctataagaccatc
atggagcagttcaaccctagcctccggaacttcatcgccatggggaagaattacgagaag
gcactggcaggtgtgacgtatgcagccaaaggctactttgacgccctggtgaagatgggg
gagctggccagcgagagccagggctccaaagaactcggagacgttctcttccagatggct
gaagtccacaggcagatccagaatcagctggaagaaatgctgaagtcttttcacaacgag
ctgcttacgcagctggagcagaaggtggagctgga

對于pathway 數據庫而言,支持 image , conf, kgml ,但是一次只允許查詢1條記錄
示例: 返回hsa05130的通路圖

http://rest.kegg.jp/get/hsa05130/image

image.gif

對于 compound, glycan, drus 數據庫,支持 images , mcol, kcf 操作,對于images , 一次只允許返回一條記錄

示例 : 返回 C00002的結構示意圖

http://rest.kegg.jp/get/C00002/image

image

conv

轉換kegg 的ID 和其他數據庫的ID
第一種格式,所有記錄之間的轉換

http://rest.kegg.jp/conv/target_db/source_db
(target_db source_db) = (kegg_db outside_db) | (outside_db kegg_db)
For gene identifiers:
kegg_d> = org
org = KEGG organism code or T number
outside_d> = ncbi-geneid | ncbi-proteinid | uniprot
For chemical substance identifiers:
kegg_db = compound | glycan | drug
outside_db = pubchem | chebi

示例: human的ncbi entrez ID 和 kegg 的ID 進行轉換

http://rest.kegg.jp/conv/hsa/ncbi-geneid

ncbi-geneid:1    hsa:1
ncbi-geneid:10    hsa:10
ncbi-geneid:100    hsa:100
ncbi-geneid:1000    hsa:1000
ncbi-geneid:100008587    hsa:100008587
ncbi-geneid:100008588    hsa:100008588
ncbi-geneid:100008589    hsa:100008589
ncbi-geneid:100009667    hsa:100009667
ncbi-geneid:100009676    hsa:100009676

第二種格式, 某幾條記錄之間的轉換,格式和第一種相同,只不過每次返回幾條記錄之間的對應關系,多條記錄用+ 連接,1次最多允許10條記錄

示例,查詢hsa:10458ece:Z5100 兩個基因對應的 ncbi protein id

http://rest.kegg.jp/conv/ncbi-proteinid/hsa:10458+ece:Z5100

hsa:10458    ncbi-proteinid:NP_059345
ece:Z5100    ncbi-proteinid:AAG58814

link

檢索兩個數據庫之間的關聯,共有兩種用法

第一種,兩個數據庫之間的關聯

http://rest.kegg.jp/link/target_db/source_db
target_db = database
source_db = database
database = pathway | brite | module | ko | genome | org | vg | ag | compound |
glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | atc | jtc | ndc | yj | pubmed

示例:human 基因和pathway 之間的對應關系

http://rest.kegg.jp/link/pathway/hsa

hsa:10327    path:hsa00010
hsa:124    path:hsa00010
hsa:125    path:hsa00010
hsa:126    path:hsa00010
hsa:127    path:hsa00010
hsa:128    path:hsa00010
hsa:130    path:hsa00010

第二種,查詢某幾條記錄在兩個數據庫之間的關聯

示例:查詢hsa:10458和ece:Z5100 兩個基因對應的pathway 信息

http://rest.kegg.jp/link/pathway/hsa:10458+ece:Z5100

hsa:10458 path:hsa04520
hsa:10458 path:hsa04810
ece:Z5100 path:ece05130

ddi

查找藥物之間的相互作用關系 , URL 格式如下

http://rest.kegg.jp/ddi/dbentry
dbentry = Single entry of the following database
database = drug | ndc | yj
可以提供1個藥物的ID, 也可以一次提供多個,多個ID 用 + 連接

示例 : 查詢和D005664 這種藥物存在相互作用的記錄

http://rest.kegg.jp/ddi/D00564

dr:D00564    cpd:C00304    P    unclassified
dr:D00564    cpd:C01946    P    unclassified
dr:D00564    cpd:C04931    P    unclassified
dr:D00564    cpd:C05849    P    unclassified

總結:

kegg API 允許我們方便的獲取各種資源,最大的好處是我們可以通過程序批量下載,比如批量下載一個物種所有的pathway通路圖或者kgml 文件。API的用法也很簡單,關鍵是我們要理解返回的數據有什么意義,比如 kgml 文件中記錄了哪些信息,conf 文件中的數字代表了什么,后續我會詳細介紹這些東西,通過kgml ,conf , 可以實現很多有意思的功能。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,156評論 6 529
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 97,866評論 3 413
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 174,880評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,398評論 1 308
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,202評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,743評論 1 320
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,822評論 3 438
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 41,962評論 0 285
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,476評論 1 331
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,444評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,579評論 1 365
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,129評論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,840評論 3 344
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,231評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,487評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,177評論 3 388
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,568評論 2 370

推薦閱讀更多精彩內容