Гены-сироты — Википедия

Гены-сироты (англ. Orphan gene или ORFans, главным образом, в литературе по микробиологии)[1][2] — это гены без обнаруженных гомологов в других эволюционных ветвях[en][2]. Сироты — подгруппа таксономически ограниченных генов (TRG), которые являются уникальными для определённого таксономического уровня (например, для конкретного растения)[3]. В отличие от несиротных TRG, сироты обычно считаются уникальными для очень узкого таксона, в основном вида.

Классическая модель эволюции базируется на дупликации, перестройке и мутации генов с идеей общего происхождения[4][5]. Гены-сироты отличаются тем, что они специфичны по происхождению без известной истории общей дупликации и перестановки вне их специфических видов или клады[6]. Гены-сироты могут возникать с помощью различных механизмов, таких как горизонтальный перенос генов, дупликация и быстрая дивергенция, а также появление гена de novo[en] из некодирующей последовательности[2]. Эти процессы могут действовать с разной скоростью у насекомых, приматов и растений[7]. Несмотря на их относительно недавнее происхождение, гены-сироты могут кодировать функционально важные белки[8][9].

История изучения генов-сирот[править | править код]

Гены-сироты были впервые обнаружены после начала проекта по секвенированию генома дрожжей в 1996[2]. На гены сироты приходилось примерно 26 % генома дрожжей, но считалось, что эти гены можно классифицировать по гомологам, если секвенировать большее количество геномов[3]. В то время дупликация генов считалась единственной серьёзной моделью эволюции генов[2][4][10], тогда было секвенировано только несколько геномов для сравнения, таким образом, отсутствие поддающихся обнаружению гомологов считалось наиболее вероятным из-за отсутствия данных секвенирования, а не из-за истинного отсутствия гомологии[3]. Однако гены-сироты продолжали существовать по мере роста количества секвенированных геномов[3][11], что в конечном итоге привело к выводу, что гены-сироты распространены повсеместно во всех геномах[2]. Оценки процента генов, оставшихся сиротами, сильно различаются между видами и исследованиями; 10-30 % — обычно цитируемая цифра[3].

Изучение генов-сирот возникло в значительной степени на рубеже веков. В 2003 году в исследовании Caenorhabditis briggsae[en] и родственных ему видов сравнивалось более 2000 генов[3]. Они предположили, что эти гены должны эволюционировать слишком быстро, чтобы их можно было обнаружить, и, следовательно, являются участками очень быстрой эволюции[3]. В 2005 году Уилсон исследовал 122 вида бактерий, чтобы попытаться выяснить, является ли большое количество генов-сирот у многих видов действительно генами-сиротами[11]. Исследование показало, что это было верным предположением и сыграло роль в адаптации бактерий. Определение таксономически ограниченных генов было введено в литературу, чтобы гены-сироты казались менее «загадочными»[11].

В 2008 году было обнаружено, что дрожжевой белок с установленной функциональностью, BSC4, произошел de novo[en] из некодирующих последовательностей, гомология которых всё ещё обнаруживалась у сестринских видов[12].

В 2009 году был обнаружен ген-сирота, регулирующий внутреннюю биологическую сеть: сиротский ген QQS из Arabidopsis thaliana влияет на метаболизм крахмала[13]. Белок-сирота QQS взаимодействует с консервативным фактором транскрипции NF-YC4, это объясняет увеличение продукции белка, которое вызывается, когда ген QQS внедряют при помощи генетической инженерии в другие виды растений[14].

В 2011 году на модельном растении «Arabidopsis thaliana» было проведено всестороннее геномное исследование распространения и эволюционного происхождения генов-сирот у растений[15].

Как определить гены-сироты[править | править код]

Гены можно условно классифицировать как сиротские, если у близлежащих видов не обнаруживаются ортологичные белки[7].

Одним из методов, используемых для оценки сходства нуклеотидных или белковых последовательностей, указывающих на гомологию (то есть сходство из-за общего происхождения), является инструмент поиска базового локального выравнивания (BLAST). BLAST позволяет быстро искать последовательности в больших базах данных[16][17]. Моделирование предполагает, что при определённых условиях BLAST подходит для обнаружения дальних родственников гена[18]. Однако BLAST может легко пропустить, короткие и быстро эволюционирующие гены[19].

Систематическое обнаружение гомологии для аннотирования генов-сирот называется филостратиграфией[en][20]. Филостратиграфия генерирует филогенетическое дерево, в котором вычисляется гомология между всеми генами основного вида и генами других видов. Самый ранний общий предок гена определяет возраст или филогенетический слой[en] гена. Термин «сирота» иногда используется только для самого молодого филогенетического слоя, содержащего только один вид, но при широком толковании как таксономически ограниченный ген, он может относиться ко всем филогенетическим слоям, кроме самого старого, с осиротевшим геном в более крупной кладе.

Откуда берутся гены-сироты?[править | править код]

Гены-сироты возникают из множества источников, преимущественно в результате возникновения de novo[en], дупликации и быстрой дивергенции, а также горизонтального переноса генов[2].

Появление de novo[править | править код]

Новые сиротские гены постоянно возникают de novo[en] из некодирующих последовательностей[21]. Эти новые гены могут быть достаточно полезными, чтобы их можно было зафиксировать путем отбора. Или, что более вероятно, они снова отойдут на негенный фон. Последний вариант подтверждается исследованиями на дрозофилах, показывающими, что молодые гены с большей вероятностью вымирают[22].

Когда-то считалось, что появление генов de novo практически невозможно из-за сложных и потенциально хрупких тонкостей создания и поддержания функциональных полипептидов[10], но исследования приблизительно последних лет 10, обнаружили несколько примеров генов de novo, некоторые из них связаны с важными биологическими процессами, особенно функции яичек у животных. Гены de novo были также обнаружены у грибов и растений[12][23][24][5][25][26][27].

Для молодых генов-сирот иногда можно найти гомологичные некодирующие последовательности ДНК в сестринских таксонах, что обычно считается убедительным доказательством происхождения de novo. Однако вклад происхождения de novo в таксономически ограниченные гены более древнего происхождения, особенно в отношении традиционной теории дупликационной эволюции генов, остается спорным[28][29].

Дупликация и дивергенция[править | править код]

Модель дупликации и дивергенции для генов-сирот предполагает, что новый ген создается в результате некоторого события дупликации или дивергенции, и проходит период быстрой эволюции, когда всё обнаруживаемое сходство с первоначально дублированным геном теряется[2]. Хотя это объяснение согласуется с текущим пониманием механизмов дублирования[2], количество мутаций, необходимых для потери обнаруживаемого сходства, достаточно велико, чтобы быть редким событием[2][18], а эволюционный механизм, с помощью которого дубликат гена может быть изолирован и так быстро расходиться, остается неясным[2][30].

Горизонтальный перенос генов[править | править код]

Другое объяснение того, как возникают гены-сироты, связано с механизмом дуплицирования, называемым горизонтальным переносом генов, когда исходный дублицированный ген происходит от отдельной, неизвестной линии[en][2]. Это объяснение происхождения генов-сирот особенно актуально для бактерий и архей, где горизонтальный перенос генов обычен.

Характеристики белка[править | править код]

Гены-сироты, как правило, очень короткие (примерно в 6 раз короче зрелых генов), а некоторые слабо экспрессируются, тканеспецифичны и более просты в использовании кодонов и аминокислотном составе[31]. Гены-сироты имеют тенденцию кодировать внутренне неупорядоченные белки[en][32][33][34], хотя некоторая структура была обнаружена в одном из наиболее охарактеризованных генов-сирот[35]. Из десятков тысяч ферментов первичного или специализированного[en] метаболизма, которые были охарактеризованы на сегодняшний день, ни один не является сиротским или даже ограниченным по происхождению; очевидно, для катализа требуются сотни миллионов лет эволюции[31].

Биологические функции[править | править код]

Несмотря на то, что распространенность генов-сирот признана, эволюционная роль сирот и, как следствие, её важность все ещё обсуждаются. Одна из теорий состоит в том, что многие сироты не играют эволюционной роли; геномы содержат нефункциональные открытые рамки считывания (ORF), которые создают ложные полипептидные продукты, не поддерживаемые селекцией, а это означает, что они вряд ли сохранятся между видами и, вероятно, будут обнаружены как гены-сироты[3]. Однако множество других исследований показали, что по крайней мере некоторые сироты функционально важны и могут помочь объяснить появление новых фенотипов[2][3][11][13][14][15].

Примечания[править | править код]

  1. Fischer, D.; Eisenberg, D. Finding families for genomic ORFans // Bioinformatics. — 1999. — 1 сентября (т. 15, № 9). — С. 759—762. — doi:10.1093/bioinformatics/15.9.759. — PMID 10498776.
  2. 1 2 3 4 5 6 7 8 9 10 11 12 13 Tautz, D.; Domazet-Lošo, T. The evolutionary origin of orphan genes (англ.) // Nature Reviews Genetics. — 2011. — Vol. 12, no. 10. — P. 692—702. — doi:10.1038/nrg3053. — PMID 21878963.
  3. 1 2 3 4 5 6 7 8 9 Khalturin, K; Hemmrich, G; Fraune, S; Augustin, R; Bosch, T. C. More than just orphans: are taxonomically-restricted genes important in evolution? (англ.) // Trends in Genetics  (англ.) : journal. — Cell Press, 2009. — Vol. 25, no. 9. — P. 404—413. — doi:10.1016/j.tig.2009.07.006. — PMID 19716618.
  4. 1 2 Ohno, Susumu. Evolution by Gene Duplication. — Springer Science & Business Media, 2013. — ISBN 978-3-642-86659-3.
  5. 1 2 Zhou, Qi; Zhang, Guojie; Zhang, Yue; Xu, Shiyu; Zhao, Ruoping; Zhan, Zubing; Li, Xin; Ding, Yun; Yang, Shuang. On the origin of new genes in Drosophila (англ.) // Genome Research  (англ.). — 2008. — 1 September (vol. 18, no. 9). — P. 1446—1455. — doi:10.1101/gr.076588.108. — PMID 18550802. — PMC 2527705.
  6. Toll-Riera, M.; Bosch, N.; Bellora, N.; Castelo, R.; Armengol, L.; Estivill, X.; Alba, M. M. Origin of primate orphan genes: a comparative genomics approach (англ.) // Molecular Biology and Evolution  (англ.) : journal. — Oxford University Press, 2009. — Vol. 26, no. 3. — P. 603—612. — doi:10.1093/molbev/msn281. — PMID 19064677.
  7. 1 2 Wissler, L.; Gadau, J.; Simola, D. F.; Helmkampf, M.; Bornberg-Bauer, E. Mechanisms and Dynamics of Orphan Gene Emergence in Insect Genomes (англ.) // Genome Biology and Evolution  (англ.) : journal. — 2013. — Vol. 5, no. 2. — P. 439—455. — doi:10.1093/gbe/evt009. — PMID 23348040. — PMC 3590893.
  8. Reinhardt, Josephine A.; Wanjiru, Betty M.; Brant, Alicia T.; Saelao, Perot; Begun, David J.; Jones, Corbin D. De Novo ORFs in Drosophila Are Important to Organismal Fitness and Evolved Rapidly from Previously Non-coding Sequences (англ.) // PLoS Genet  (англ.) : journal. — 2013. — 17 October (vol. 9, no. 10). — P. e1003860. — doi:10.1371/journal.pgen.1003860. — PMID 24146629. — PMC 3798262.
  9. Suenaga, Yusuke; Islam, S. M. Rafiqul; Alagu, Jennifer; Kaneko, Yoshiki; Kato, Mamoru; Tanaka, Yukichi; Kawana, Hidetada; Hossain, Shamim; Matsumoto, Daisuke. NCYM, a Cis-Antisense Gene of MYCN, Encodes a De Novo Evolved Protein That Inhibits GSK3β Resulting in the Stabilization of MYCN in Human Neuroblastomas (англ.) // PLoS Genet  (англ.) : journal. — 2014. — 2 January (vol. 10, no. 1). — P. e1003996. — doi:10.1371/journal.pgen.1003996. — PMID 24391509. — PMC 3879166.
  10. 1 2 Jacob, F. Evolution and tinkering (англ.) // Science : journal. — 1977. — 10 June (vol. 196, no. 4295). — P. 1161—1166. — doi:10.1126/science.860134. — Bibcode1977Sci...196.1161J. — PMID 860134.
  11. 1 2 3 4 Wilson, G. A.; Bertrand, N.; Patel, Y.; Hughes, J. B.; Feil, E. J.; Field, D. Orphans as taxonomically restricted and ecologically important genes (англ.) // Microbiology : journal. — 2005. — Vol. 151, no. 8. — P. 2499—2501. — doi:10.1099/mic.0.28146-0. — PMID 16079329.
  12. 1 2 Cai, Jing; Zhao, Ruoping; Jiang, Huifeng; Wang, Wen. De Novo Origination of a New Protein-Coding Gene in Saccharomyces cerevisiae (англ.) // Genetics : journal. — 2008. — 1 May (vol. 179, no. 1). — P. 487—496. — doi:10.1534/genetics.107.084491. — PMID 18493065. — PMC 2390625. Архивировано 11 ноября 2020 года.
  13. 1 2 Li, L.; Foster, C. M.; Gan, Q.; Nettleton, D.; James, M. G.; Myers, A. M.; Wurtele, E. S. Identification of the novel protein QQS as a component of the starch metabolic network in Arabidopsis leaves (англ.) // The Plant Journal  (англ.) : journal. — 2009. — Vol. 58, no. 3. — P. 485—498. — doi:10.1111/j.1365-313X.2009.03793.x. — PMID 19154206.
  14. 1 2 Li, L; Zheng, W; Zhu, Y; Ye, H; Tang, B; Arendsee, Z; Jones, D; Li, R; Ortiz, D; Zhao, X; Du, C; Nettleton, D; Scott, P; Salas-Fernandez, M; Yin, Y; Wurtele, E. S. The QQS orphan gene regulates carbon and nitrogen partitioning across species via NF-YC interactions (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2015. — Vol. 112, no. 47. — P. 14734—14739. — doi:10.1073/pnas.1514670112. — Bibcode2015PNAS..11214734L. — PMID 26554020. — PMC 4664325.
  15. 1 2 Donoghue, M.T.A; Keshavaiah, C.; Swamidatta, S.H.; Spillane, C. Evolutionary origins of Brassicaceae specific genes in Arabidopsis thaliana (англ.) // BioMed Central  (англ.) : journal. — 2011. — Vol. 11, no. 1. — P. 47. — doi:10.1186/1471-2148-11-47. — PMID 21332978. — PMC 3049755.
  16. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs (англ.) // Nucleic Acids Research  (англ.) : journal. — 1997. — 1 September (vol. 25, no. 17). — P. 3389—3402. — doi:10.1093/nar/25.17.3389. — PMID 9254694. — PMC 146917.
  17. NCBI BLAST homepage. Дата обращения: 8 сентября 2020. Архивировано 21 августа 2020 года.
  18. 1 2 Alba, M; Castresana, J. On homology searches by protein BLAST and the characterization of the age of genes (англ.) // BioMed Central  (англ.) : journal. — 2007. — Vol. 7. — P. 53. — doi:10.1186/1471-2148-7-53. — PMID 17408474. — PMC 1855329.
  19. Moyers, B. A.; Zhang, J. Phylostratigraphic Bias Creates Spurious Patterns of Genome Evolution (англ.) // Molecular Biology and Evolution  (англ.) : journal. — Oxford University Press, 2014. — 13 October (vol. 32, no. 1). — P. 258—267. — doi:10.1093/molbev/msu286. — PMID 25312911. — PMC 4271527.
  20. Domazet-Lošo, Tomislav; Brajković, Josip; Tautz, Diethard. A phylostratigraphy approach to uncover the genomic history of major adaptations in metazoan lineages (англ.) // Trends in Genetics  (англ.) : journal. — Cell Press, 2007. — 11 January (vol. 23, no. 11). — P. 533—539. — doi:10.1016/j.tig.2007.08.014. — PMID 18029048.
  21. McLysaght, Aoife; Guerzoni, Daniele. New genes from non-coding sequence: the role of de novo protein-coding genes in eukaryotic evolutionary innovation (англ.) // Philosophical Transactions of the Royal Society B : journal. — 2015. — 31 August (vol. 370, no. 1678). — P. 20140332. — doi:10.1098/rstb.2014.0332. — PMID 26323763. — PMC 4571571.
  22. Palmieri, Nicola; Kosiol, Carolin; Schlötterer, Christian. The life cycle of orphan genes (англ.) // eLife : journal. — 2014. — 19 February (vol. 3). — P. e01311. — doi:10.7554/eLife.01311. — PMID 24554240. — PMC 3927632.
  23. Zhao, Li; Saelao, Perot; Jones, Corbin D.; Begun, David J. Origin and Spread of de Novo Genes in Drosophila melanogaster Populations (англ.) // Science : journal. — 2014. — 14 February (vol. 343, no. 6172). — P. 769—772. — doi:10.1126/science.1248286. — Bibcode2014Sci...343..769Z. — PMID 24457212. — PMC 4391638.
  24. Levine, Mia T.; Jones, Corbin D.; Kern, Andrew D.; Lindfors, Heather A.; Begun, David J. Novel genes derived from noncoding DNA in Drosophila melanogaster are frequently X-linked and exhibit testis-biased expression (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2006. — 27 June (vol. 103, no. 26). — P. 9935—9939. — doi:10.1073/pnas.0509809103. — Bibcode2006PNAS..103.9935L. — PMID 16777968. — PMC 1502557.
  25. Heinen, Tobias J. A. J.; Staubach, Fabian; Häming, Daniela; Tautz, Diethard. Emergence of a New Gene from an Intergenic Region (англ.) // Current Biology : journal. — Cell Press, 2009. — 29 September (vol. 19, no. 18). — P. 1527—1531. — doi:10.1016/j.cub.2009.07.049. — PMID 19733073.
  26. Chen, Sidi; Zhang, Yong E.; Long, Manyuan. New Genes in Drosophila Quickly Become Essential (англ.) // Science : journal. — 2010. — 17 December (vol. 330, no. 6011). — P. 1682—1685. — doi:10.1126/science.1196380. — Bibcode2010Sci...330.1682C. — PMID 21164016. — PMC 7211344.
  27. Silveira A. B., Trontin C., Cortijo S., Barau J., Del-Bem L. E., Loudet O., Colot V., Vincentz M. Extensive Natural Epigenetic Variation at a De Novo Originated Gene (англ.) // PLoS Genetics  (англ.) : journal. — 2013. — Vol. 9, no. 4. — P. e1003437. — doi:10.1371/journal.pgen.1003437. — PMID 23593031. — PMC 3623765.
  28. Neme, Rafik; Tautz, Diethard. Evolution: Dynamics of De Novo Gene Emergence (англ.) // Current Biology : journal. — Cell Press, 2014. — 17 March (vol. 24, no. 6). — P. R238–R240. — doi:10.1016/j.cub.2014.02.016. — PMID 24650912.
  29. Moyers, Bryan A.; Zhang, Jianzhi. Evaluating phylostratigraphic evidence for widespread de novo gene birth in genome evolution (англ.) // Molecular Biology and Evolution  (англ.) : journal. — Oxford University Press, 2016. — 11 January (vol. 33, no. 5). — P. 1245—1256. — doi:10.1093/molbev/msw008. — PMID 26758516. — PMC 5010002. Архивировано 31 июля 2016 года.
  30. Lynch, Michael; Katju, Vaishali. The altered evolutionary trajectories of gene duplicates (англ.) // Trends in Genetics  (англ.) : journal. — Cell Press, 2004. — 1 November (vol. 20, no. 11). — P. 544—549. — doi:10.1016/j.tig.2004.09.001. — PMID 15475113.
  31. 1 2 Arendsee, Zebulun W.; Li, Ling; Wurtele, Eve Syrkin. Coming of age: orphan genes in plants (англ.) // Trends in Plant Science  (англ.) : journal. — Cell Press, 2014. — November (vol. 19, no. 11). — P. 698—708. — doi:10.1016/j.tplants.2014.07.003. — PMID 25151064.
  32. Mukherjee, S.; Panda, A.; Ghosh, T.C. Elucidating evolutionary features and functional implications of orphan genes in Leishmania major (англ.) // Infection, Genetics and Evolution : journal. — 2015. — June (vol. 32). — P. 330—337. — doi:10.1016/j.meegid.2015.03.031. — PMID 25843649.
  33. Wilson, Benjamin A.; Foy, Scott G.; Neme, Rafik; Masel, Joanna. Young genes are highly disordered as predicted by the preadaptation hypothesis of de novo gene birth (англ.) // Nature Ecology & Evolution  (англ.) : journal. — 2017. — 24 April (vol. 1, no. 6). — P. 0146—0146. — doi:10.1038/s41559-017-0146. — PMID 28642936. — PMC 5476217.
  34. Willis, Sara; Masel, Joanna. Gene Birth Contributes to Structural Disorder Encoded by Overlapping Genes (англ.) // Genetics : journal. — 2018. — 19 July (vol. 210, no. 1). — P. 303—313. — doi:10.1534/genetics.118.301249. — PMID 30026186. — PMC 6116962.
  35. Bungard, Dixie; Copple, Jacob S.; Yan, Jing; Chhun, Jimmy J.; Kumirov, Vlad K.; Foy, Scott G.; Masel, Joanna; Wysocki, Vicki H.; Cordes, Matthew H.J. Foldability of a Natural De Novo Evolved Protein // Structure. — 2017. — Ноябрь (т. 25, № 11). — С. 1687–1696.e4. — doi:10.1016/j.str.2017.09.006. — PMID 29033289. — PMC 5677532.