生物數據庫介紹——NCBI
NCBI(National Center for Biotechnology Information,美國國家生物技術信息中心)除了維護GenBank核酸序列數據庫外,還提供數據分析和檢索資源。NCBI資源包括Entrez、Entrez編程組件、MyNCBI、PubMed、PudMed Central、PubReader、Gene、the NCBI Taxonomy Browser、BLAST、Pimer-Blast、COBALT、RefSeq、UniGene、HomoloGene、ProtEST、dbMHC、dbSNP、dbVar、Epigenomics、the Genetic Testing Registry、Genome和相關工具、比對查看器、跟蹤存檔、Sequence Read Archive、BioProject、BioSample、ClinVar、MedGen、HIV-1/人類蛋白質相互作用數據庫、Gene Expression Omnibus、Probe、Online Mendelian Inheritance in Animals、the Molecular Modeling Database、the Conserved Domain Database、the Conserved Domain Architecture Retrieval Tool、Biosystem、Protein Clusters and thePubChem suite of small molecule databases,所有這些資源可以在NCBI主頁找到。
Databases
一個提供有關基因組組裝結構,裝配名稱和其他元數據,統計報告以及基因組序列數據鏈接等信息的數據庫。
一個有關培養物、動植物樣本和其他自然樣本的精選元數據集。 記錄顯示樣本狀態,有關館藏的機構的信息,以及NCBI中相關數據鏈接。
BioProject (formerly Genome Project)
基因組學,功能基因組學和遺傳學研究的集合以及其結果數據集的鏈接。 此資源描述項目范圍,材料和目標,并提供一種機制來檢索由于注釋不一致,多個獨立提交以及通常存儲在不同數據庫中的各種數據類型的不同性質而經常難以找到的數據集。
BioSample數據庫包含實驗測定中使用的生物來源材料的描述。
根據生物關系對生物醫學文獻,小分子和序列數據進行分組的數據庫。
可直接搜索或從其他NCBI數據庫中的鏈接數據搜索的生物醫學書籍集合。 該系列包括生物醫學、其他科學主題書,GeneReviews等遺傳資源和NCBI幫助手冊。
儲存人類變異與觀察到的健康狀況之間關系的記錄以及支持證據的數據庫。可以通過記錄上的超鏈接訪問NIH Genetic Testing Registry (GTR),MedGen,Gene,OMIM,PubMed相關信息。
世界各地公開和私人支持的臨床研究的登記和結果數據庫。
Computational Resources from NCBI's Structure Group
一個由對NCBI計算生物學分會(CBB)結構組開發的資源的訪問和鏈接的集中頁面。 這些資源包括幫助研究大分子結構,保守結構域和蛋白質分類,小分子及其生物活性,以及生物途徑和系統的數據庫和工具。
人類和小鼠一致注釋和高質量的核心蛋白質編碼區域。
Conserved Domain Database (CDD)
CDD是一種蛋白質注釋資源,由一系列經過充分注釋的古代結構域和全長蛋白質序列比對模型組成。
Database of Genomic Structural Variation (dbVar)
dbVar數據庫儲存了大規模基因組變異相關的信息,包括大插入,缺失,易位和倒位。 除了分類突變之外,dbVar還存儲已定義突變與表型信息的關聯。
Database of Genotypes and Phenotypes (dbGaP)
儲存基因型和表型相互作用研究結果和描述的數據庫,這些研究包括全基因組關聯(GWAS)、醫學重測序、分子診斷,以及基因型與非臨床性狀之間的關聯。
Database of Short Genetic Variations (dbSNP)
數據庫包含單核苷酸突變、微衛星和小規模插入和缺失信息。
NIH基因序列數據庫,是所有公開可用DNA序列的注釋集合。NCBI的GenBank數據庫和日本DNA數據庫(DDBJ),歐洲分子生物學實驗室(EMBL)每天交換數據,保證數據實時跟新。 GenBank由幾個部分組成,大部分序列可以通過Nucleotide數據庫訪問。 例外的是EST和GSS分區,分別通過Nucleotide? EST和Nucleotide GSS數據庫訪問。
一個可搜索的基因數據庫,專注于已經完全測序的基因組,并且有一個活躍的研究團體來提供基因特異性數據。基因信息包括命名法、染色體定位、基因產物及其屬性(例如,蛋白質相互作用)、相關標記、表型、相互作用、引文鏈接、序列、突變詳情、圖譜、表達報告、同源物、蛋白結構域內容和外部數據庫鏈接。
Gene Expression Omnibus (GEO) Database
公共功能基因組數據庫,支持符合MIAME標準的數據提交。接受基于芯片和測序數據,并提供工具以幫助用戶查詢和下載實驗數據并研究基因表達譜。
Gene Expression Omnibus (GEO) Datasets
存儲從Gene Expression Omnibus(GEO)數據庫組裝的基因表達和分子豐度數據集。數據集每個記錄包含其他資源,包括集群工具和差異表達式查詢。
Gene Expression Omnibus (GEO) Profiles
存儲從Gene Expression Omnibus(GEO)數據庫組裝的單個基因表達和分子豐度配置文件。 基于基因注釋或預先計算的輪廓特征搜索感興趣的特定配置。
NCBI Bookshelf上專家撰寫的同行評審疾病描述集,將基因檢測應用于具有特定遺傳病癥的患者和家屬的診斷,管理和遺傳咨詢。
選定遺傳疾病的信息摘要,討論潛在的突變和臨床特征,以及相關數據庫和組織的鏈接。
Genetic Testing Registry (GTR)
基因測試和實驗室記錄,包括測量的詳細信息,如測量和分析以及臨床有效性。 GTR也是遺傳條件信息的紐帶,并提供與各種資源的特定背景相關的鏈接,包括實踐指南,已發表的文獻和遺傳數據/信息。 GTR的最初范圍包括孟德爾疾病的單基因測試,以及陣列,小組和藥物遺傳學測試。
包含來自1000多種生物的全基因組的序列和比對數據。 基因組代表完全測序的生物和正在進行測序的生物, 三個主要領域(細菌,古細菌和真核生物),以及許多病毒,噬菌體,類病毒,質粒和細胞器。
Genome Reference Consortium (GRC)
基因組參考聯盟(GRC)負責人和小鼠參考基因組,成員包括華盛頓大學的基因組中心,Wellcome Trust Sanger研究所,歐洲生物信息學研究所(EBI)和國家生物技術信息中心(NCBI)。 GRC致力于糾正錯誤代表的位點并完善剩余的裝配間隙。 此外,GRC尋求為復雜或結構變異的基因組位點提供替代組裝。 在GRC網站(http://www.genomereference.org)上,公眾可以查看目前正在審查的基因組區域,報告基因組相關問題并聯系GRC。
HIV-1, Human Protein Interaction Database
已知HIV-1蛋白與人宿主蛋白相互作用的數據庫。 它提供了已發表的蛋白質相互作用報告的注釋書目,并附有相應PubMed記錄和序列數據的鏈接。
描述在GenBank和RefSeq中注釋的編碼區中鑒定的蛋白質,以及SwissProt和PDB蛋白質序列的綜合記錄集合。 該資源允許研究人員獲得更有針對性的搜索結果并快速識別感興趣的蛋白質。
來自NIAID流感基因組測序項目和GenBank的數據集合,它提供了流感序列分析,注釋和GenBank提交工具。 該資源還包含其他流感序列資源的鏈接,以及有關流感病毒的出版物和一般信息。
NLM目錄數據庫的子數據庫,提供NCBI數據庫記錄中引用的期刊信息,包括PubMed摘要。支持期刊標題,MEDLINE或ISO縮寫,ISSN或NLM目錄ID搜索此數據庫。
MeSH(醫學主題詞)是美國國家醫學圖書館用于索引MEDLINE / PubMed文章的受控詞匯表。MeSH術語提供了一種一致的方法來檢索可能對相同概念使用不同術語的信息。
醫學遺傳學信息門戶,MedGen包含來自多個來源的術語列表,并將它們組織成概念分組和層次分組。還提供了NIH Genetic Testing Registry (GTR),ClinVar,Gene,OMIM,PubMed和其它來源中的相關鏈接信息。
NCBI C++工具包綜合手冊,包括其設計和開發框架,C++庫參考,軟件示例和演示,常見問題解答和發行說明。該手冊可在線搜索,可以下載為一系列PDF文檔。
提供教程和培訓材料的鏈接,包括PowerPoint幻燈片和打印講義。
作為NCBI手冊的一部分,本詞匯表包含NCBI工具和首字母縮寫詞,生物信息學術語和數據表示格式的描述。
有關NCBI數據庫和軟件的文章集合。,專為新手用戶設計,每篇文章都提供了資源及其設計的一般概述,以及搜索和使用可用分析工具的提示。所有文章都可以在線搜索并以PDF格式下載;該手冊可以通過NCBI Bookshelf訪問。
通過NCBI Bookshelf訪問,幫助手冊包含許多NCBI資源的文檔,包括PubMed,PubMed Central,Entrez系統,Gene,SNP和LinkOut。所有章節均可以PDF格式下載。
NCBI Pathogen Detection Project
一個關于收集和分析源自食品,環境和患者分離物的細菌病原體基因組序列的項目。目前,自動化分析集群并識別主要由公共衛生實驗室提供的序列,以協助調查食源性疾病爆發并發現潛在的食物污染源。
National Library of Medicine (NLM) Catalog
圖書館館藏中所有期刊,書籍,視聽,計算機軟件,電子資源和其他資料的書目數據。
來自多個來源的核苷酸序列的集合,包括GenBank,RefSeq,第三方注釋(TPA)數據庫和PDB。
Online Mendelian Inheritance in Man (OMIM)
人類基因和遺傳疾病的數據庫。NCBI維護當前內容并繼續支持其與其他NCBI數據庫的搜索和集成。但是,OMIM現在在omim.org上有一個新主頁,用戶可以直接訪問該站點進行全面顯示。
來自比較研究的相關DNA序列的數據庫:系統發育,種群,環境以及在較小程度上的突變。數據庫中的每個記錄都是一組DNA序列。例如,群體集提供有關生物體內遺傳變異的信息,而系統發育集可以包含從幾個相關生物獲得的單個基因的序列及其比對。
用于各種生物醫學研究應用的核酸試劑數據庫,有關試劑比例、探針有效性和序列相似性等信息。
相關蛋白質序列(簇)的集合,由完整的原核和細胞器質粒和基因組編碼的參考序列蛋白組成。 該數據庫提供對注釋信息,出版物,域,結構,外部鏈接和分析工具的輕松訪問。
包含來自各種來源的蛋白質序列記錄的數據庫,包括GenPept,RefSeq,Swiss-Prot,PIR,PRF和PDB。
由沉積的生物活性數據和用于篩選PubChem物質數據庫中包含的化學物質的生物活性測定的描述組成,包括篩選程序特有的條件和讀數(生物活性水平)的描述。
包含可以使用名稱,同義詞或關鍵詞搜索的,經過驗證的唯一化學結構(小分子)。如果不同的研究者提供相同的結構,則復合記錄可以鏈接到多個PubChem物質記錄。這些化合物記錄反映了用于描述PubChem物質中物質的經過驗證的化學描述信息。
PubChem物質記錄包含提交人提交給PubChem的物質信息,這包括提交的任何化學結構信息,以及化學名稱,評論和提交人網站的鏈接。
MEDLINE和其他生命科學期刊的生物醫學文獻引文和摘要數據庫。
全文生物醫學和生命科學期刊文獻,包括臨床醫學和公共衛生。
人類基因特異性參考基因組序列的集合。
由NCBI產生的主持的,非冗余的基因組DNA,轉錄物(RNA)和蛋白質序列的集合。
專門用于支持逆轉錄病毒研究的資源數據庫
SARS冠狀病毒(CoV)的數據摘要,包括與最新序列數據和出版物的鏈接,與其他SARS相關資源的鏈接,以及來自各種分離株的基因組序列的預先計算的比對。
序列讀取存檔(SRA)存儲來自下一代測序平臺的測序數據,包括Roche 454GSSystem?,Illumina GenomeAnalyzer?,Life Technologies ABSOLiDSystem?,HelicosBiosciencesHeliscope?,CompleteGenomics?和PacificBiosciencesSMRT?
Structure (Molecular Modeling Database)
包含源自蛋白質數據庫的大分子3D結構,以及用于可視化和比較分析的工具。
包含NCBI數據庫中具有分子數據的160,000多種生物的名稱和系統發育譜系。
Third Party Annotation (TPA) Database
包含從GenBank中現有主序列數據構建的序列的數據庫。
用于各種大規模測序項目的單次讀取的DNA序列色譜圖(跡線),堿基調用和質量估計的存儲庫。
廣泛的資源,包括病毒生物學的簡述、Entrez Genome中病毒基因組序列的鏈接,以及有關病毒參考序列的信息、數千個病毒基因組的參考序列的集合。
將流感病毒資源擴展到其他生物體,提供下載所選病毒序列集的界面,分析工具,包括病毒特異性BLAST頁面和基因組注釋管道。
Tools
一個交互式圖形查看器,允許用戶研究由1000 Genomes Project生成的突變、基因型和支持證據(例如,比對的序列read數)。
該工具允許用戶通過比較它們的結構和化學性質,預測由突變引起的蛋白質序列變化,查看常見的取代,以及瀏覽保守結構域中給定殘基的功能來探索氨基酸的特征。
將跟蹤存檔中找到的原始序列信息與公開可用的序列存儲庫(GenBank / EMBL / DDBJ)中的裝配信息相鏈接。Assembly Viewer允許用戶查看多序列比對以及實際序列色譜圖。
對選定的完整真核和原核基因組中的相似序列進行BLAST搜索。
對RefSeqGene/LRG集中的基因組序列進行BLAST搜索。
此頁面鏈接到許多與BLAST相關的教程和指南,包括BLAST算法的選擇指南,BLAST輸出格式的說明,獨立BLAST參數的說明,在本地機器上設置獨立BLAST的說明以及使用BLAST URL API。
Basic Local Alignment Search Tool (BLAST)
找到生物序列之間的局部相似性區域,該程序將核苷酸或蛋白質序列與序列數據庫進行比較,并計算匹配的統計顯著性。 BLAST可用于推斷序列之間的功能和進化關系,以及幫助鑒定基因家族的成員。
允許你提交Nucleotide、Protein或其他Entrez數據庫中的GI、登錄號或其他唯一標識符的文件,從許多Entrez數據庫中檢索記錄。
一個用于分類蛋白質序列和調查其進化關系的應用程序。CDTree可以導入,分析和更新現有的保守域(CDD)記錄和層次結構,還允許用戶創建自己的記錄和層次結構。CDTree與Entrez CDD和Cn3D緊密集成,允許用戶創建和更新蛋白質域對齊。
COBALT是一種蛋白質多序列比對工具,使用RPS-BLAST,BLASTP和PHI-BLAST找到從保守結構域數據庫,蛋白質基序數據庫和序列相似性衍生的成對約束的集合。
用于從NCBI的Entrez檢索服務查看三維結構的獨立應用程序。
作為NCBI Bookshelf的一部分,Coffee Break結合了近期生物醫學發現的報告和NCBI工具的使用。每份報告都包含互動教程,展示NCBI生物信息學工具如何用作研究過程的一部分。
Conserved Domain Architecture Retrieval Tool (CDART)
顯示構成給定蛋白質序列的功能域。它列出了具有相似結構域結構的蛋白質,并且可以檢索含有特定結構域組合的蛋白質。
Conserved Domain Search Service (CD Search)
鑒定蛋白質序列中存在的保守結構域。
在常規Web查詢界面之外提供對NCBI Entrez系統內數據訪問的工具。
允許用戶使用在線表單構建E-utility分析流程,然后生成Perl腳本以執行分析流程的工具。
Gene Expression Omnibus (GEO) BLAST
用于將查詢序列(核苷酸或蛋白質)與包含在GEO數據庫中的微陣列或SAGE平臺上的GenBank序列對齊的工具。
在表和分類樹中顯示分類法數據庫中生物的遺傳密碼。
該工具將核苷酸或蛋白質序列與基因組序列數據庫進行比較,并使用基本局部比對搜索工具(BLAST)算法計算匹配的統計顯著性。
Genome Data Viewer (GDV)? ? ? ? ?
用于真核RefSeq基因組裝配的交互式導航的基因組瀏覽器,其具有對基因,表達,變異和其他注釋的全面檢查。(RefSeq數據庫,即RefSeq參考序列數據庫,美國國家生物信息技術中心(NCBI)提供的具有生物意義上的非冗余non-redundent的基因和蛋白質序列。)
Genome Decoration Page? ? ? ? ?
一種可幫助生成關于基因組組裝注釋和序列名稱的期刊質量數字工具。
Genome Remapping Service? ? ? ? ?
NCBI的重映射工具允許用戶映射注釋數據并將特征的位置從一個基因組版本轉換為另一個,或通過堿基分析將RefSeqGene序列轉換為RefSeqGene序列。
用于查看和分析序列數據的集成應用程序。
一種允許第三方直接從PubMed和其他Entrez數據庫記錄鏈接到Entrez系統之外的相關Web可訪問資源服務。
Map Viewer(被genome data viewer取代了)
為生物的子集提供比對和組裝序列的特殊瀏覽功能。
Multiple Sequence Alignment Viewer
一種交互式Web應用程序,使用戶能夠可視化由數據庫搜索結果或其他軟件應用程序創建的多個對齊。
提供有關新的和更新的資源以及NCBI研究和開發項目的信息。
NCBI用于生成分子生物學便攜式模塊化軟件的一套軟件和數據交換規范。
一個公共領域質量保證軟件包,有助于根據實驗室特定的協議評估多重短串聯重復(STR)DNA譜。
Open Reading Frame Finder (ORF Finder)
一種圖形分析工具,用于查找用戶序列中或已存在于數據庫中的序列中的所有開放閱讀框。
允許用戶從CDD記錄或位置特異性迭代(PSI)-BLAST蛋白質搜索中顯示,排序,子集和下載位置特異性評分矩陣(PSSM)。
Phenotype-Genotype Integrator (PheGenI)
支持通過表型,染色體位置,基因和SNP標識符查詢人類表型/基因型關系。
Primer-BLAST工具使用Primer3設計序列模板的PCR引物。然后通過針對用戶指定數據庫的BLAST搜索自動分析潛在產品,以檢查對目標的特異性。
用于計算蛋白質與基因組核苷酸序列的比對的實用程序。
PubChem Power User Gateway (PUG)? ? ? ? ?
PUG通過編程接口提供對PubChem服務的訪問。
PubChem Standardization Service
PubChem術語中的標準化是以與貢獻者原始結構創建PubChem化合物記錄相同的方式處理化學結構。
PubChem Structure Search? ? ? ? ?
PubChem結構搜索允許通過化學結構或化學結構模式查詢PubChem化合物數據庫。
專門的PubMed搜索表,面向臨床醫生和醫療服務研究人員。該頁面簡化了臨床研究類別的搜索,查找系統評價和搜索醫學遺傳學文獻。
PubMed搜索和鏈接的一系列Web和Flash教程,使用MeSH和其他PubMed服務在MyNCBI中保存搜索。
相關結構工具允許用戶從分子建模數據庫(MMDB)中查找與查詢蛋白質序列相似的3D結構。
SNP Database Specialized Search Tools
有多種工具可用于搜索SNP數據庫,允許使用BLAST通過基因型,方法,群體,提交者,標記和序列相似性進行搜索。
Sequence Cytogenetic Conversion Service
一種在線工具,可轉換人類,大鼠,小鼠和果蠅基因組裝配的序列和細胞遺傳學坐標。
提供核苷酸或蛋白質序列的可配置圖形顯示以及已在該序列上注釋的特征。
用于計算cDNA到基因組序列比對的實用程序。
支持使用部分分類名稱,通用名稱,通配符和語音相似的名稱搜索分類樹。
為選定的一組生物生成分類樹。用戶可以上傳分類標識或名稱的文件,也可以直接輸入名稱或ID。
顯示給定排名和包含日期的數據庫中的分類節點數。
顯示一組分類節點或ID的當前狀態。
用于創建和顯示系統發育樹數據的工具。Tree Viewer可以分析您自己的序列數據,將可打印的矢量圖像生成為PDF,并且可以嵌入到網頁中。
用于搜索和查看dbSNP,dbVar和ClinVar數據庫中列出的基因組變異的基因組瀏覽器。
一種用于快速鑒定可能是載體來源的核酸序列區段的系統。
Vector Alignment Search Tool (VAST)
一種識別相似蛋白質三維結構的計算機算法。
該工具有助于識別病毒序列的基因型。