UniProt - 维基百科,自由的百科全书



通用蛋白质资源库
UniProt
内容
获取的数据类型Protein annotation
有机体(生物)所有
相关信息
研究中心英国欧洲分子生物学实验室-欧洲生物信息研究所(EMBL-EBI)瑞士生物信息研究所(SIB)英语Swiss Institute of Bioinformatics、美国蛋白质信息资源(PIR)英语Protein Information Resource
主要参考文献(引用)Ongoing and future developments at the Universal Protein Resource[1]
访问
数据格式Custom flat file, FASTA英语FASTA, GFF英语GFF, RDF, XML.
网站www.uniprot.org
下载网址www.uniprot.org/downloads&用於下載完整的數據集ftp.uniprot.org
网络服务网址是 – JAVA应用程序接口在這裡看到信息&表現層狀態轉換在這裡看到信息
工具
网络高級搜索,BLASTClustalO,批量檢索/下載,ID映射
其它信息
许可創作共用署名-禁止改作
軟件版本號
数据发布频率4周一次
管理政策是 – 手動和自動。 數據庫監護人和計算算法生成的自動註釋規則。
可否列为书签是 – 個別蛋白質條目和搜索

通用蛋白质资源库(英語:Universal Protein resource直译:「通用/联合蛋白质资源」,混成词UniProt),是通过结合瑞士蛋白质数据库(Swiss-Prot)、欧洲分子生物学实验室核苷酸序列数据库与蛋白质翻译库(Translation of European Molecular Biology Laboratory nucleotide sequence database,缩写TrEMBL)和蛋白质信息资源-蛋白质序列数据库(PIR-PSD)创建的蛋白质数据中央数据库,一个全面的,高质量的,免费使用蛋白质序列与功能信息数据,许多内容来自基因组计划,它还包含了大量来自研究文献的关于蛋白的生物学功能信息。

UniProt共同体

[编辑]

UniProt共同体由欧洲生物信息研究所(EBI),瑞士生物信息研究所(SIB)英语Swiss Institute of Bioinformatics,以及美国蛋白质信息资源(PIR)英语Protein Information Resource组成。欧洲生物信息研究所坐落于英国欣克斯顿英语Hinxton惠康信任基因组园区英语Wellcome Genome Campus,拥有大量的生物信息学数据库及服务资源。瑞士生物信息研究所位于瑞士的日内瓦,维持专家蛋白质分析系统英语ExPASy,该系统是一个蛋白质组学工具和数据库资源中心服务器的运作。PIR由美国华盛顿特区乔治城大学医学中心的国家生物医学研究基金会 (National Biomedical Research Foundation,NBRF) 主办,是最早的蛋白质序列数据库,玛格丽特·戴霍夫于1965年首次出版的《蛋白质序列和结构图集》(Atlas of Protein Sequence and Structure)。2002年,EBI,SIB和PIR联合成为UniProt共同体[2]

UniProt数据库的根源

[编辑]

每个共同体成员都积极参与蛋白质数据库维护和注释。 直到最近,欧洲生物信息研究所(EBI)和瑞士生物信息研究所(SIB)一起产生了瑞士蛋白质数据库(Swiss-Prot)和TrEMBL数据库,而蛋白质信息资源(PIR)产生了蛋白质序列数据库(Protein Information Resource-Protein Sequence Database,PIR-PSD)[3][4][5]。 这些数据库与不同的蛋白质序列覆盖和注释优先级共存。

参考文献

[编辑]
  1. ^ PMID 21051339PMID 21051339
    本引用來源將由机器人自動扩充。您可以检查英文对应模板手動擴充
  2. ^ 2002 Release: NHGRI Funds Global Protein Database. National Human Genome Research Institute (NHGRI). [14 April 2018]. (原始内容存档于2015-09-24). 
  3. ^ O'Donovan, C.; Martin, M. J.; Gattiker, A.; Gasteiger, E.; Bairoch, A.; Apweiler, R. High-quality protein knowledge resource: SWISS-PROT and TrEMBL. Briefings in Bioinformatics. 2002, 3 (3): 275–284. PMID 12230036. doi:10.1093/bib/3.3.275. 
  4. ^ Wu, C. H.; Yeh, L. S.; Huang, H.; Arminski, L.; Castro-Alvear, J.; Chen, Y.; Hu, Z.; Kourtesis, P.; Ledley, R. S.; Suzek, B. E.; Vinayaka, C. R.; Zhang, J.; Barker, W. C. The Protein Information Resource. Nucleic Acids Research. 2003, 31 (1): 345–347. PMC 165487可免费查阅. PMID 12520019. doi:10.1093/nar/gkg040. 
  5. ^ Boeckmann, B.; Bairoch, A.; Apweiler, R.; Blatter, M. C.; Estreicher, A.; Gasteiger, E.; Martin, M. J.; Michoud, K.; O'Donovan, C.; Phan, I.; Pilbout, S.; Schneider, M. The SWISS-PROT protein knowledgebase and its supplement TrEMBL in 2003. Nucleic Acids Research. 2003, 31 (1): 365–370. PMC 165542可免费查阅. PMID 12520024. doi:10.1093/nar/gkg095. 

外部链接

[编辑]