核酸數據庫
-
NCBI [https://www.ncbi.nlm.nih.gov/genbank/]
NCBI (National Center for Biotechnology Information)是指美國國立生物技術信息中心
-
EMBL [https://www.ebi.ac.uk/ena]
歐洲分子生物學實驗室EMBL(The European Molecular Biology Laboratory)
-
DDBJ [https://www.ddbj.nig.ac.jp/index-e.html]
DDBJ(DNA Data Bank of Japan),于1984年建立,是世界三大DNA 數據庫之一,與NCBI的GenBank,EMBL的EBI數據庫共同組成國際DNA數據庫
-
CNGB [https://db.cngb.org/]
中國國家數據庫(China National GeneBank)位于深圳大鵬新區,是繼世界三大數據庫之后的全球第四大國家級數據庫。它是中國首個,也是唯一一個國家基因庫,相對于全球另外三個基因庫而言,國家基因庫樣品保存的規模、存儲量和可訪問的數據量皆是全球最大。
-
BIGD [https://bigd.big.ac.cn/]
中國國家基因組科學數據中心 生命與健康大數據中心 (National Genomics Data Center BIG Data Center)
非編碼RNA數據庫
1.非編碼小RNA數據庫
miRBase [http://www.mirbase.org/]
piRNAbank [http://pirnabank.ibab.ac.in/]
piRNAbank [http://gtrnadb.ucsc.edu/]
SILVA [https://www.arb-silva.de/]
2.長非編碼RNA數據庫:
-
LncRNAdb [http://www.lncrnadb.org/]
真核生物
-
LncRNAwiki [http://lncrna.big.ac.cn/index.php/Main_Page]
人類長非編碼RNA數據庫
3.非編碼RNA家族數據庫
-
類似于Pfam的RNA家族注釋數據庫
4.非編碼RNA序列數據庫
- RNAcentral [https://rnacentral.org/ ]
蛋白質數據庫
0.蛋白質信息
-
Human protein atlas [http://www.proteinatlas.org/ ]
人體蛋白在細胞、組織、病理條件下的表達
1.蛋白序列數據庫
-
Pfam [http://pfam.xfam.org/]
Pfam是蛋白質家族的數據庫,包括使用隱馬爾可夫模型生成的注釋和多序列比對。
-
SwissProt [http://us.expasy.org/sprot/]
手動注釋的非冗余蛋白序列數據庫
UniProt [ https://www.uniprot.org/]
Antibodies [http://www.bioinf.org.uk/abs/]
BRENDA [ http://www.brenda-enzymes.org/]
HPRD [http://www.hprd.org/]
-
InterPro [http://www.ebi.ac.uk/interpro/]
通過整合多個蛋白相關數據庫,提供了一個方便的對蛋白序列進行功能注釋的平臺,包括對蛋白質家族、結構域、功能位點的預測
iProClass [http://pir.georgetown.edu/iproclass/]
2.蛋白質結構數據庫
-
通過實驗測定的結構
CATH [http://www.cathdb.info/]
3.蛋白組數據庫
4.蛋白質功能域數據庫
-
PROSITE [https://prosite.expasy.org/]
最全面
-
Pfam [http://pfam.xfam.org/]
最專業
ProDom [http://prodom.prabi.fr/]
Prints [http://www.bioinf.man.ac.uk/dbbrowser/PRINTS/index.php]
TIGRFAM [http://www.tigr.org/TIGRFAMs/]
5.蛋白互作數據庫
STRING [https://string-db.org/]
-
DIP [https://dip.doe-mbi.ucla.edu/dip/Main.cgi]
實驗驗證的蛋白相互作用數據庫
BioGRID [https://thebiogrid.org/] :
IntAct [ https://www.ebi.ac.uk/intact/]
代謝數據庫
MapMan:一個功能強大的代謝途徑查看和編輯軟件
1.代謝途徑數據庫
KEGG [https://www.kegg.jp/]
NCBI BioSystems [https://www.ncbi.nlm.nih.gov/biosystems]
plantCyc [https://www.plantcyc.org/]
MANET [ https://manet.illinois.edu/]
MetaNetX [ https://www.metanetx.org/]
2.代謝組學常用數據庫
MataboLights [https://www.ebi.ac.uk/metabolights/]
HMDB [http://www.hmdb.ca/]
YMDB [http://www.ymdb.ca/]
ECMDB [http://ecmdb.ca/]
3.表型數據庫
Planteome [http://www.planteome.org/]
序列比對
1.序列與數據庫比對
2.多序列間比對
- Clustal
3.序列進化樹分析
- MEGA
基因分析
0.基因信息
GeneCard [https://www.genecards.org/]
Gene Wiki[https://en.wikipedia.org/wiki/Wikipedia:Gene_Wiki ]
1.基因注釋
Interproscan [http://www.ebi.ac.uk/interpro/],
2.基因功能預測:
FGENESH [http://linux1.softberry.com/berry.phtml?topic=fgenesh&group=programs&subgroup=gfind]
AUGUSTUS [http://bioinf.uni-greifswald.de/augustus/submission.php ]
GENESCAN [http://argonaute.mit.edu/GENSCAN.html]
GeneMark [http://topaz.gatech.edu/GeneMark/]
3.基因結構預測
-
Exon-Intron Graphic Maker [http://wormweb.org/exonintron]
根據候選基因的外顯子和內含子等信息繪制基因結構
-
Blastp [https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome]
可在線獲取蛋白結構域的注釋和位置信息
4.同源基因分析
- OrthoDB是直系同源物的綜合目錄[https://www.orthodb.org/]
5.亞細胞定位預測
- PSORT Prediction [http://psort1.hgc.jp/form.html]
6.啟動子分析
7.調控目的基因的miRNA預測
8.表達分析
-
ArrayExpress [https://www.ebi.ac.uk/arrayexpress/ ]
數據來自EMBL的高通量功能基因組學實驗的數據;
-
在分析基因功能時,通常會參考基因的表達模式,即基因在植物不同組織不同發育時期的表達豐度變化。通過在線分析網站BAR對候基因進行表達分析。 是一個植物生信分析資源網站,用該網站分析基因表達時,不僅可以獲得基因表達模式的熱圖,還可以獲得可視化的電子熒光圖片,直觀呈現基因在植物組織中的表達位置。
9.基因結構繪制
-
GSDS [http://gsds.cbi.pku.edu.cn/]
Gene Structure Display Server,基于基因組注釋文件繪制序列基因結構等功能
蛋白質分析
1.蛋白二級三級結構預測及繪圖
- CFSSP [http://www.biogem.org/tool/chou-fasman/]
- SOPMA [https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html]
- PredictProtein [https://www.predictprotein.org/]
- SWISS-MODEL [https://swissmodel.expasy.org/interactive]
2.蛋白特性分析
-
ProtParam [http://web.expasy.org/protparam/]
蛋白特性分析是指蛋白的一些物理和化學參數,如分子量、等電點、氨基酸和原子組成、消光系數、半衰期、不穩定系數、脂肪族氨基酸指數、親水性。這些參數,有助于進行蛋白的相關生化實驗。比如在體外體系(大腸桿菌、酵母等)表達和純化目的蛋白時,需要考慮蛋白的分子量、等電點、消光系數、不穩定系數和親水性等。在酶活實驗中,也需要根據這些參數優化實驗體系。
3.蛋白親疏水性分析
-
Protscale [https://web.expasy.org/protscale/]
蛋白氨基酸的親疏水性主要由其側鏈基團R,如果R只是H或是C、H兩元素組成的話,都是疏水的,如果含有極性側鏈基團,如-OH、-SH、-COOH、-NH2 等,則就是極性的(親水的)。疏水性氨基酸有酪氨酸、色氨酸、苯丙氨酸、纈氨酸、亮氨酸、異亮氨酸、丙氨酸和蛋氨酸(甲硫氨酸)。疏水性氨基酸在蛋白質內部,在保持蛋白質的三級結構上,酶和基質、抗體和抗原間的相互作用等各種非共價鍵的分子結合方面,具有重要作用。
4.跨膜結構分析
-
TMHMM [http://www.cbs.dtu.dk/services/TMHMM/]
蛋白的跨膜結構分析對于預測蛋白的亞細胞定位密切相關。如果具有跨膜結構,蛋白很可能定位于細胞中與膜相關的結構,如細胞質膜、葉綠體膜或線粒體膜等內膜系統。此外,蛋白跨膜結構分析對于蛋白功能分析也有一定的幫助。比如某蛋白沒有跨膜結構,但是亞細胞定位實驗顯示其可定位于膜相關結構,這說明該蛋白可能通過其他膜定位蛋白招募過去的。
5.信號肽分析
-
SignalP [http://www.cbs.dtu.dk/services/SignalP/]
峰信號位置為信號肽切割點,峰之前的序列為信號肽
信號肽是指引導新合成的蛋白質向分泌通路轉移的短肽鏈,常位于蛋白的N-末端,負責把蛋白質引導到不同膜結構的亞細胞器內。編碼分泌蛋白的mRNA在翻譯時首先合成N末端的信號肽,它被信號肽識別蛋白(SRP)所識別,SRP將核糖體攜帶至內質網上,內質網膜上的 SPR 受體識別并與之結合。新合成蛋白在信號肽引導下到達內質網內腔,而信號肽則在信號肽酶的作用下被切除。由于它的引導,新生的多肽就能夠通過內質網膜進入腔內,最終被分泌到胞外。在宿主菌中表達外源蛋白時,可用信號肽引導外源蛋白定位分泌到胞外,提高蛋白可溶性,在原核表達系統(大腸桿菌、芽孢桿菌等)和真核表達系統(如畢赤酵母)中均有應用。
6.磷酸化位點分析
-
KinasePhos-2.0 [http://kinasephos2.mbc.nctu.edu.tw/]
蛋白質磷酸化指由蛋白質激酶催化的把 ATP 的磷酸基轉移到底物蛋白質氨基酸殘基(絲氨酸、蘇氨酸、酪氨酸)上的過程,或者在信號作用下結合 GTP(通常以 GTP 取代 GDP),是生物體內一種普通的調節方式,在細胞信號轉導的過程中起重要作用。在信號達到時通過獲得一個或幾個磷酸集團而被激活,而在信號減弱時能去除這些集團,從而失去活性。有時某個信號蛋白磷酸化通常造成下游的蛋白依次發生磷酸化,形成磷酸化級聯反應。
參考:
http://www.pathguide.org
http://www.lxweimin.com/p/e09dd3db76c3?utm_campaign=haruki&utm_content=note&utm_medium=reader_share&utm_source=weixin_timeline&from=timeline
http://m.sohu.com/a/202115741_629408
https://bigd.big.ac.cn/?lang=zh