Пангеном — Википедия

Пангено́м[1], также супрагеном (англ. pan-genome[2], pangenome[3], supragenome[4]) — совокупность всех генов рассматриваемой группы организмов (как правило, монофилетической), для которой возможно генетическое разнообразие между близкородственными штаммами или экотипами (Рис. 1). Пангеном объединяет набор генов всех штаммов, составляющих кладу[5]: вид[2], род[6] или таксон более высокого порядка[7]. Традиционно понятие пангенома применяется к видам бактерий и архей.

Обычно пангеном характеризуется U-кривой — графиком, показывающим зависимость между количеством штаммов и количеством групп генов, которые присутствуют ровно в этом числе штаммов[8] (Рис. 2).

Рис. 1. Схематическое изображение группы близкородственных геномов с различающимся составом генов
Рис. 2. U-кривая — зависимость количества ортологичных групп генов от количества штаммов, в которых эти гены присутствуют

Концепция пангенома[править | править код]

В традиционном понимании термин «пангеном» и его определение были введены в 2005 году Херве Теттелином[2]. К этому времени были расшифрованы геномы многих модельных организмов, таких, как гемофильная палочка (Haemophilus influenzae) — первый отсеквенированный геном[9] — и кишечная палочка (Escherichia coli). Успехи этих исследований были столь значительными, что расшифровка одного референсного[en] (эталонного) генома для каждого вида считалась учеными достаточной для понимания всех биологических процессов. Однако развитие технологий секвенирования позволило быстро определять последовательности ДНК для многих штаммов бактерий одного вида[10].

Сравнив геномы восьми штаммов одного из видов стрептококка (Streptococcus agalactiae), Теттелин обнаружил значительное различие между геномами разных штаммов: каждый новый штамм отличался от остальных в среднем на 33 гена. Так было показано существование значительного генетического разнообразия внутри видов. Информация о внутривидовом разнообразии может быть использована для изучения эволюции, а также для оценки метаболических возможностей вида в медицинских и биотехнологических целях, что и привело к идее исследования пангеномов, то есть генов всех имеющихся штаммов вида в совокупности[2].

Ввиду быстрых скоростей эволюции проблема внутривидового генетического разнообразия особенно остро стоит для бактерий и архей. Так, известно, что три первых отсеквенированных штамма кишечной палочки совпали по составу генов лишь на 39 %[11].

Структурные элементы пангенома[править | править код]

Рис. 3. Изображение универсальной и вариабельной частей пангенома в виде диаграммы Венна.

Пангеном традиционно разделяется на три части[12]. Первая часть — универсальный геном — гены, присутствующие во всех штаммах исследуемого таксона. В этой части оказываются гены, необходимые для существования бактерии, а именно кодирующие белки систем трансляции, репликации и получения энергии. Также используют понятие «мягкого» универсального генома, включающего гены, которые присутствуют у 92 — 95 % штаммов. Такую поправку делают из расчета на ошибки сборки и аннотации[en][13]. Второй структурный элемент — уникальные гены, имеющиеся в единственном экземпляре лишь у одного из штаммов, и собственно определяющие различия между штаммами и серотипами бактерий. Значительную долю уникальных генов опять же составляют ошибки аннотации генов, поэтому во многих исследованиях этот элемент исключается из рассмотрения. Третья часть расположена между первыми двумя — это геном периферии (вариабельный геном)[5][14][15]. Его составляют гены, которые присутствуют в геномах не у всех штаммов рассматриваемого таксона[2][16], и отвечают за приспособление штаммов к выживанию в определённых экологических нишах (например, необходимые для фотосинтеза или симбиоза). Пангеном удобно визуально представлять в виде диаграммы Венна, показывающей степень сходства геномов, которые использовались для его построения (Рис. 3).

Типы пангенома по размеру[править | править код]

Важным показателем генетического разнообразия внутри таксона является понятие открытого и закрытого пангеномов[2] (Рис. 4).

  • Если при добавлении каждого нового штамма в рассмотрение общее количество генов в таксоне продолжает расти, то такой пангеном называют открытым.
  • Если, начиная с некоторого количества штаммов, размер пангенома достигает насыщения, то такой пангеном называется закрытым.

Наличие у вида открытого пангенома позволяет судить о значительном внутривидовом генетическом разнообразии вида. Это, как правило, связано с большим количеством событий горизонтального переноса генов, происходящих внутри данного вида. У большинства видов бактерий открытый пангеном, в частности, у кишечной палочки[17].

Рис. 4. Изображение открытого и закрытого пангеномов в виде диаграмм Венна.

У групп с закрытым пангеномом большая часть генов являются универсальными для всех рассматриваемых штаммов, поэтому и общее количество генов в закрытом пангеноме, как правило, меньше, чем в открытом. Примером вида бактерий с закрытым пангеномом является возбудитель сибирской язвы Bacillus anthracis. После рассмотрения четырёх штаммов этого вида последующее добавление новых штаммов не приводит к увеличению размера пангенома. Это объясняется тем фактом, что этот вид возник сравнительно недавно, и его генетическое разнообразие заключено в основном на плазмиде, содержащей гены вирулентности[18][19].

Однако было замечено, что генетически Bacillus anthracis скорее напоминает клон другого вида — Bacillus cereus, нежели является независимым видом. Возбудителя сибирской язвы отличают от родственника лишь две плазмиды, одна из которых кодирует токсин[20]. Этот пример демонстрирует несоответствие критерия выделения видов реальной генетической информации[21]. Существует мнение, что только вид, обладающий открытым пангеномом, является настоящим видом[2].

Факторы, определяющие размер пангенома[править | править код]

Размер пангенома может отражать взаимодействие рассматриваемой группы с факторами окружающей среды. Такое взаимодействие заключается в балансировании между процессами потери и приобретения генов. Например, значительное изменение экологической обстановки приводит к тому, что многие функции становятся ненужными, в результате чего происходит потеря генов белков, выполняющих эти функции. Утрата генов наблюдается у эндосимбионтов (организмов, живущих внутри чужих клеток) и других аллопатрических видов (живущих в изолированных географических нишах), для которых характерны небольшие закрытые пангеномы[22]. Наоборот, группы, обитающие в большом количестве разнообразных экологических ниш взаимодействуют со своими соседями, приобретая новые гены путем горизонтального переноса. Среди приобретенных участков генома значительную часть составляют «эгоистичные» мобильные элементы. Бактериофаги, интегразы, транспозазы и другие системы способствуют накоплению в геноме эгоистичных элементов. Вся их совокупность в геноме называется мобиломом[en] Чем больше количество видов-соседей, тем больше вероятность для вида приобрести паразитические мобильные элементы. В результате симпатричные виды бактерий, сосуществующие с большим количеством видов-соседей, имеют открытые пангеномы.[23]

Построение и анализ пангеномов[править | править код]

Создание и анализ пангеномов сопряжены с рядом трудностей, не в последнюю очередь связанных с объёмом используемых данных. Все методы для построения пангеномов и дальнейшего анализа можно разделить на две группы по принятому в них определению пангенома: основанные на аннотациях генов и основанные на последовательностях[24].

Методы, основанные на аннотациях генов[править | править код]

В данной группе методов за пангеном принимается совокупность генов как функциональных единиц, и работа проводится на наборе генных аннотаций для исследуемой группы организмов. В рабочем процессе можно выделить три этапа[24]:

  • построение ортологических рядов;
  • идентификация пангенома;
  • дальнейший анализ.

Структура построенного пангенома напрямую зависит от точности разбиения генов на ортологические группы. В подавляющем большинстве случаев для нахождения ортологов используются подходы, основанные на построении графов[25]: последовательности объявляются вершинами, ребра графа взвешиваются согласно попарному сходству последовательностей. Для выявления мульти-видовых ортологических групп последовательности кластеризуют[25], оценивая вхождение гена в группу по выбранному порогу. После этого строится сам пангеном. Методы дальнейшего анализа могут включать в себя множественное выравнивание последовательностей универсальной части пангенома, реконструкцию филогении, различные визуализации[24].

  • Программа Proteinortho[26] — один из популярных инструментов для построения ортологических рядов.
  • OrthoMCL — ещё один популярный метод построения ортологических рядов, позволяет группировать ортологичные и паралогичные гены.
  • PGAT (The Prokaryotic-genome Analysis Tool)[27] — веб-сервис, основанный на базе данных геномов различных прокариот. Позволяет идентифицировать гены, присутствующие или отсутствующие в выбранной группе организмов, получать информацию о SNP для каждого такого гена, строить множественные выравнивания, обращаться к базе метаболических путей KEGG. Функционал сервиса ограничен имеющимися в базе геномами, загружать свою информацию нельзя.
  • PGAP (The Pan-genome Analysis Pipeline)[28] — набор Perl-скриптов для анализа пангеномов, состоящий из пяти модулей. Среди доступных функций есть кластерный анализ функциональных генов, анализ пангеномного профиля и генетической вариации. В 2018 г. был представлен PGAP-X[29] — расширенный вариант PGAP, в который были добавлены модули для дополнительного анализа и визуализации. Новые аналитические компоненты позволяют строить выравнивание последовательностей и кластеризацию генов по ортологии. Модули визуализации позволяют сравнивать структуры геномов и строить распределения генов по консервативности и вариабельности.
  • GET_HOMOLOGUES[30] — пакет для анализа пангеномов. Пользователь может выбрать между тремя алгоритмами кластеризации ортологов, основанных на использовании алгоритма BLAST. Дополнительно есть возможность провести поиск HMM-профилей против базы Pfam для получения информации о доменном составе белков. Помимо трех основных частей пангенома программа также определяет «мягкий» универсальный геном.
  • PanCoreGen[31] — программа с графическим интерфейсом. Процедура построения пангенома основана на итеративном использовании BLASTN. Позволяет генерировать файлы со списками генов по типам в форматах FASTA и Excel, имеет доступ к базе NCBI.
  • Pan-Tetris[32] — программа для интерактивной визуализации пангеномов, которые находятся через построение локальных выравниваний ортологических групп генов с предварительно построенным «супергеномом». Интерактивное взаимодействие с результатом призвано помочь пользователям в нахождении ошибок аннотации.

Методы, основанные на последовательностях геномов[править | править код]

Термином «пангеном» также можно определить набор последовательностей геномов исследуемых организмов[33]. В отличие от предыдущего подхода, при построении этого типа пангеномов используются не ортологические ряды, а множественные выравнивания последовательностей, или графы, объединяющие сходные участки. Подобный подход позволяет избегать ошибок разметки генов при построении пангеномов эукариот, гены которых чаще различаются за счет однонуклеотидных полиморфизмов чем прокариотические.

  • Panseq[34] — онлайн-сервис, основанный на построении выравниваний. Позволяет строить множественные выравнивания генов универсального генома и бинарную матрицу присутствия генов периферии.
  • GenomeMapper[35] — программа, реализующая графовый метод построения пангенома. Каждый геном разбивается на блоки одинаковой длины, при этом блок, общий для нескольких геномов будет сохранен только один раз. Соседние блоки соединяются ребрами. После этого для всех последовательностей нуклеотидов определённой длины из каждого генома строится хеш-таблица блоков, в которых эти последовательности встречаются, и позиций, на которых они находятся в этих блоках. Для сжатия данных в программе используется обобщение BWT в виде конечного автомата[24].

Пангеномы в эволюционных исследованиях[править | править код]

Построение пангеномов является популярным инструментом при изучении эволюции организмов методами сравнительной геномики. Анализ пангенома позволяет определить уровень генетического разнообразия в рассматриваемой группе организмов. Генетическое разнообразие вида бактерий или архей, как правило, является результатом горизонтального переноса генов. События горизонтального переноса зачастую позволяют сделать выводы об эволюции групп организмов.

Рис. 5. Пангеном S. pneumoniae. (a) Зависимость количества новых генов от числа секвенированных геномов. (b) Зависимость количества универсальных генов от числа секвенированных геномов.[36]

Так, пангеном, построенный по 44 штаммам Streptococcus pneumoniae, оказался открытым, то есть добавление каждого нового генома увеличивало размер пангенома. Однако с помощью модели было предсказано, что после рассмотрения более чем 50 штаммов новые гены перестанут добавляться (Рис. 5). Основным источником новых генов в периферии пангенома, построенного на 44 штаммах, оказался другой вид стрептококка — Streptococcus mitis, чьи гены были получены путем горизонтального переноса.[36]

Эволюционная история генов, переносящихся горизонтально, не совпадает с таковой для генов, передающихся от предков к потомкам, то есть посредством вертикального переноса. Поэтому возникла идея о том, что эволюцию, прежде всего, микроорганизмов и некоторых высших организмов[37] более естественно представлять не в виде филогенетического дерева, а в виде филогенетической сети[38]. Информацию, необходимую для построения таких филогенетических сетей, извлекают именно из пангеномов[33].

Известны примеры использования пангеномов для уточнения эволюционных отношений между организмами. Так, при построении совместного пангенома кишечной палочки и бактерий рода Shigella было показано, что у этих бактерий одинаковый состав генов, то есть у шигелл нет значимых генетических отличий от кишечных палочек[8]. Это подтвердило более раннее исследование, в котором на основании анализа филогенетических деревьев был сделан вывод о том, что Shigella не являются отдельным родом[39]. Причина выделения шигелл в отдельный от кишечных палочек род — их патогенное действие, которое определяется генами вирулентности, расположенными на хромосоме[40]. Однако эти генетические различия между шигеллами и кишечными палочками не более значимы, чем таковые между патогенными и безвредными штаммами кишечных палочек[8].

Пангеномы в метагеномике[править | править код]

Пангеномы часто используются в метагеномных исследованиях, в которых в помощью секвенирования определяется видовой и количественный состав организмов в определённом местообитании. При этом используется непривычное определение пангенома: он строится для организмов, объединенных не общим происхождением, а совместным пребыванием в одной экологической нише в одно время. Применение пангенома позволяет выявить общие адаптации к факторам окружающей среды в конкретном местообитании[33]. Подобные исследования ограничены сложностью сборки геномов при метагеномных исследованиях.

Пангеномы в медицине[править | править код]

Так как патогенные микроорганизмы, как правило, приобретают инфекционные гены и гены устойчивости к антибиотикам путем горизонтального переноса, то построение пангенома можно применить в эпидемиологических исследованиях. К примеру, для вида-патогена очень важно знать размер вариабельного генома, так как чем он больше, тем более патоген склонен приобретать гены путем горизонтального переноса и, значит, тем опаснее патоген. Размер периферии принято оценивать с помощью доли универсального генома во всем пангеноме. Особенно полезно вычислять эту характеристику для патогенов, которые могут сохранять жизнеспособность во внешней среде. В этом случае есть опасность того, что патоген может приобрести гены устойчивости к антибиотикам при взаимодействии с видами из природных местообитаний[23].

Например, возбудитель сибирской язвы (Bacillus anthracis) сохраняет жизнеспособность в почве[41], но при этом обладает закрытым пангеномом и доля универсального генома у него составляет 99 %. Это можно объяснить тем, что Bacillus anthracis находится в почве в форме неактивных спор и не может в таком состоянии осуществлять обмен генами с другими почвенными организмами.

Другой пример — Legionella pneumophila — патоген человека, который способен жить внутри клеток амеб и не сохраняет жизнеспособность за их пределами[42]. Однако он обменивается генетической информацией с другими микроорганизмами, живущими внутри клеток амеб, чем и обусловлен его открытый пангеном.[23]

Новое определение референсного генома[править | править код]

В современной биоинформатике большое значение имеют эталонные референсные геномы. Они служат основой для исследований по функциональной геномике и при изучении генетического разнообразия путем ресеквенирования. Парадигма единственного референсного генома приобрела большую популярность благодаря простоте работы и визуализации: в большинстве геномных браузеров референсные геномы представлены в виде линейных последовательностей. Недостаток этого подхода заключается в том, что в условиях все растущего числа секвенированных геномов единственный референсный геном для вида не отражает внутривидовой вариабельности генома. Этот факт позволил переосмыслить понятие референсного генома вида[33].

Одна из идей заключается в том, чтобы использовать вместо одной последовательности референсного генома пангеном, который содержал бы информацию обо всем генетическом разнообразии вида. Развитие этой концепции сопряжено с рядом технических трудностей, так как, несмотря на большое количество пангеномных исследований, анализ в них осуществлен с помощью разных подходов. Более того, для многих биологических задач до сих пор не выяснено, как наилучшим образом извлекать информацию из отдельных пангеномов. Для решения задач подобного характера сформировалась дисциплина вычислительная пангеномика[33].

Расширенный пангеном человека[править | править код]

В майском номере журнала Nature за 2023 год было опубликовано описание пангенома человека, сделанного на основе полного генетического описания (англ. genetic blueprints) 47 человек, включая выходцев из Африки, Азии, Карибского басейна, Америки и Европы. Ученые планируют в течение двух лет дать описание пангенома на основе генетического описания 350 человек, представляющих весь мир[43].

Примечания[править | править код]

  1. Л. И. Патрушев, И. Г. Минкевич. Проблема размера геномов эукариот (рус.) // Успехи биологической химии. — 2007. — Т. 47. — С. 293–370.
  2. 1 2 3 4 5 6 7 Hervé Tettelin, Vega Masignani, Michael J. Cieslewicz, Claudio Donati, Duccio Medini. Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: Implications for the microbial “pan-genome” // Proceedings of the National Academy of Sciences. — 2005-09-27. — Т. 102, вып. 39. — С. 13950–13955. — doi:10.1073/pnas.0506758102.
  3. Elisa Anastasi, Iain MacArthur, Mariela Scortti, Sonsiray Alvarez, Steeve Giguère. Pangenome and Phylogenomic Analysis of the Pathogenic ActinobacteriumRhodococcus equi (англ.) // Genome Biology and Evolution. — 2016-09-16. — Vol. 8, iss. 10. — P. 3140–3148. — ISSN 1759-6653. — doi:10.1093/gbe/evw222. Архивировано 26 мая 2018 года.
  4. N. Luisa Hiller, Benjamin Janto, Justin S. Hogg, Robert Boissy, Susan Yu. Comparative Genomic Analyses of Seventeen Streptococcus pneumoniae Strains: Insights into the Pneumococcal Supragenome (англ.) // Journal of Bacteriology. — 2007-11-15. — Vol. 189, iss. 22. — P. 8186–8195. — ISSN 1098-5530 0021-9193, 1098-5530. — doi:10.1128/JB.00690-07. Архивировано 13 сентября 2019 года.
  5. 1 2 Duccio Medini, Claudio Donati, Hervé Tettelin, Vega Masignani, Rino Rappuoli. The microbial pan-genome // Current Opinion in Genetics & Development. — Т. 15, вып. 6. — С. 589–594. — doi:10.1016/j.gde.2005.09.006.
  6. Lars Snipen, David W. Ussery. Standard operating procedure for computing pangenome trees (англ.) // Standards in Genomic Sciences. — 2010/01. — Т. 2, вып. 1. — С. 135. — ISSN 1944-3277. — doi:10.4056/sigs.38923. Архивировано 6 апреля 2018 года.
  7. Estimating the size of the bacterial pan-genome (англ.) // Trends in Genetics. — 2009-03-01. — Vol. 25, iss. 3. — P. 107–110. — ISSN 0168-9525. — doi:10.1016/j.tig.2008.12.004.
  8. 1 2 3 Evgeny N. Gordienko, Marat D. Kazanov, Mikhail S. Gelfand. Evolution of Pan-Genomes of Escherichia coli, Shigella spp., and Salmonella enterica (англ.) // Journal of Bacteriology. — 2013-06-15. — Vol. 195, iss. 12. — P. 2786–2792. — ISSN 1098-5530 0021-9193, 1098-5530. — doi:10.1128/jb.02285-12. Архивировано 2 июня 2018 года.
  9. R. D. Fleischmann, M. D. Adams, O. White, R. A. Clayton, E. F. Kirkness. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd (англ.) // Science. — 1995-07-28. — Vol. 269, iss. 5223. — P. 496–512. — ISSN 1095-9203 0036-8075, 1095-9203. — doi:10.1126/science.7542800. Архивировано 29 марта 2018 года.
  10. The Pangenome: Are Single Reference Genomes Dead? The Scientist. Дата обращения: 5 апреля 2018. Архивировано 9 декабря 2016 года.
  11. R. A. Welch, V. Burland, G. Plunkett, P. Redford, P. Roesch. Extensive mosaic structure revealed by the complete genome sequence of uropathogenic Escherichia coli (англ.) // Proceedings of the National Academy of Sciences. — 2002-12-24. — Vol. 99, iss. 26. — P. 17020–17024. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.252529799. Архивировано 6 апреля 2018 года.
  12. Pascal Lapierre, J. Peter Gogarten. Estimating the size of the bacterial pan-genome // Trends in genetics: TIG. — March 2009. — Т. 25, вып. 3. — С. 107–110. — ISSN 0168-9525. — doi:10.1016/j.tig.2008.12.004. Архивировано 20 апреля 2018 года.
  13. Rolf S. Kaas, Carsten Friis, David W. Ussery, Frank M. Aarestrup. Estimating variation within the genes and inferring the phylogeny of 186 sequenced diverse Escherichia coli genomes // BMC Genomics. — 2012-10-31. — Т. 13. — С. 577. — ISSN 1471-2164. — doi:10.1186/1471-2164-13-577.
  14. Yuri I. Wolf, Kira S. Makarova, Natalya Yutin, Eugene V. Koonin. Updated clusters of orthologous genes for Archaea: a complex ancestor of the Archaea and the byways of horizontal gene transfer // Biology Direct. — 2012-12-14. — Т. 7. — С. 46. — ISSN 1745-6150. — doi:10.1186/1745-6150-7-46.
  15. George Vernikos, Duccio Medini, David R Riley, Hervé Tettelin. Ten years of pan-genome analyses // Current Opinion in Microbiology. — Т. 23. — С. 148–154. — doi:10.1016/j.mib.2014.11.016. Архивировано 17 февраля 2019 года.
  16. Duccio Medini, Davide Serruto, Julian Parkhill, David A. Relman, Claudio Donati. Microbiology in the post-genomic era (англ.) // Nature Reviews Microbiology. — 2008/06. — Т. 6, вып. 6. — ISSN 1740-1534. — doi:10.1038/nrmicro1901.
  17. David A. Rasko, M. J. Rosovitz, Garry S. A. Myers, Emmanuel F. Mongodin, W. Florian Fricke. The Pangenome Structure of Escherichia coli: Comparative Genomic Analysis of E. coli Commensal and Pathogenic Isolates (англ.) // Journal of Bacteriology. — 2008-10-15. — Vol. 190, iss. 20. — P. 6881–6893. — ISSN 1098-5530 0021-9193, 1098-5530. — doi:10.1128/JB.00619-08. Архивировано 11 апреля 2018 года.
  18. P. Keim, L. B. Price, A. M. Klevytska, K. L. Smith, J. M. Schupp. Multiple-Locus Variable-Number Tandem Repeat Analysis Reveals Genetic Relationships within Bacillus anthracis (англ.) // Journal of Bacteriology. — 2000-05-15. — Vol. 182, iss. 10. — P. 2928–2936. — ISSN 1098-5530 0021-9193, 1098-5530. — doi:10.1128/JB.182.10.2928-2936.2000. Архивировано 3 июня 2018 года.
  19. Claudio T. Sacchi, Anne M. Whitney, Leonard W. Mayer, Roger Morey, Arnold Steigerwalt. Sequencing of 16S rRNA Gene: A Rapid Tool for Identification of Bacillus anthracis // Emerging Infectious Diseases. — 2002-10. — Т. 8, вып. 10. — С. 1117–1123. — ISSN 1080-6040. — doi:10.3201/eid0810.020391. Архивировано 17 декабря 2020 года.
  20. Genomics of the Bacillus cereus group of organisms (англ.) // FEMS Microbiology Reviews. — 2005-04-01. — Vol. 29, iss. 2. — P. 303–329. — ISSN 0168-6445. — doi:10.1016/j.femsre.2004.12.005. Архивировано 9 мая 2012 года.
  21. The microbial pan-genome (англ.) // Current Opinion in Genetics & Development. — 2005-12-01. — Vol. 15, iss. 6. — P. 589–594. — ISSN 0959-437X. — doi:10.1016/j.gde.2005.09.006. Архивировано 26 мая 2020 года.
  22. Samuel K. Sheppard, Xavier Didelot, Keith A. Jolley, Aaron E. Darling, Ben Pascoe. Progressive genome-wide introgression in agriculturalCampylobacter coli (англ.) // Molecular Ecology. — 2013-02-01. — Vol. 22, iss. 4. — P. 1051–1064. — ISSN 1365-294X. — doi:10.1111/mec.12162.
  23. 1 2 3 L. Rouli, V. Merhej, P.-E. Fournier, D. Raoult. The bacterial pangenome as a new tool for analysing pathogenic bacteria (англ.) // New Microbes and New Infections. — 2015-09-01. — Т. 7. — С. 72–85. — ISSN 2052-2975. — doi:10.1016/j.nmni.2015.06.005.
  24. 1 2 3 4 Tina Zekic, Guillaume Holley, Jens Stoye. Pan-Genome Storage and Analysis Techniques (англ.) // Comparative Genomics. — Humana Press, New York, NY, 2018. — P. 29–53. — ISBN 9781493974610, 9781493974634. — doi:10.1007/978-1-4939-7463-4_2. Архивировано 2 апреля 2018 года.
  25. 1 2 Arnold Kuzniar, Roeland C.H.J. van Ham, Sándor Pongor, Jack A.M. Leunissen. The quest for orthologs: finding the corresponding gene across genomes // Trends in Genetics. — Т. 24, вып. 11. — С. 539–551. — doi:10.1016/j.tig.2008.08.009. Архивировано 6 апреля 2018 года.
  26. Marcus Lechner, Sven Findeiß, Lydia Steiner, Manja Marz, Peter F. Stadler. Proteinortho: Detection of (Co-)orthologs in large-scale analysis // BMC Bioinformatics. — 2011-04-28. — Т. 12. — С. 124. — ISSN 1471-2105. — doi:10.1186/1471-2105-12-124.
  27. M. J. Brittnacher, C. Fong, H. S. Hayden, M. A. Jacobs, Matthew Radey. PGAT: a multistrain analysis resource for microbial genomes (англ.) // Bioinformatics. — 2011-09-01. — Vol. 27, iss. 17. — P. 2429–2430. — ISSN 1367-4803. — doi:10.1093/bioinformatics/btr418. Архивировано 7 апреля 2018 года.
  28. Yongbing Zhao, Jiayan Wu, Junhui Yang, Shixiang Sun, Jingfa Xiao. PGAP: pan-genomes analysis pipeline (англ.) // Bioinformatics. — 2012-02-01. — Vol. 28, iss. 3. — P. 416–418. — ISSN 1367-4803. — doi:10.1093/bioinformatics/btr655. Архивировано 19 июня 2018 года.
  29. Yongbing Zhao, Chen Sun, Dongyu Zhao, Yadong Zhang, Yang You. PGAP-X: extension on pan-genome analysis pipeline // BMC Genomics. — 2018-01-19. — Т. 19, вып. 1. — С. 36. — ISSN 1471-2164. — doi:10.1186/s12864-017-4337-7.
  30. Bruno Contreras-Moreira, Pablo Vinuesa. GET_HOMOLOGUES, a Versatile Software Package for Scalable and Robust Microbial Pangenome Analysis (англ.) // Applied and Environmental Microbiology. — 2013-12-15. — Vol. 79, iss. 24. — P. 7696–7701. — ISSN 1098-5336 0099-2240, 1098-5336. — doi:10.1128/aem.02411-13. Архивировано 1 июня 2018 года.
  31. Sandip Paul, Archana Bhardwaj, Sumit K. Bag, Evgeni V. Sokurenko, Sujay Chattopadhyay. PanCoreGen — Profiling, detecting, annotating protein-coding genes in microbial genomes // Genomics. — Т. 106, вып. 6. — С. 367–372. — doi:10.1016/j.ygeno.2015.10.001. Архивировано 7 апреля 2018 года.
  32. André Hennig, Jörg Bernhardt, Kay Nieselt. Pan-Tetris: an interactive visualisation for Pan-genomes // BMC Bioinformatics. — 2015-08-13. — Т. 16, вып. 11. — С. S3. — ISSN 1471-2105. — doi:10.1186/1471-2105-16-S11-S3.
  33. 1 2 3 4 5 Tobias Marschall, Manja Marz, Thomas Abeel, Louis Dijkstra, Bas E. Dutilh. Computational pan-genomics: status, promises and challenges (англ.) // Briefings in Bioinformatics. — 2018-01-01. — Vol. 19, iss. 1. — P. 118–135. — ISSN 1467-5463. — doi:10.1093/bib/bbw089. Архивировано 6 апреля 2018 года.
  34. Chad Laing, Cody Buchanan, Eduardo N. Taboada, Yongxiang Zhang, Andrew Kropinski. Pan-genome sequence analysis using Panseq: an online tool for the rapid analysis of core and accessory genomic regions // BMC Bioinformatics. — 2010-09-15. — Т. 11. — С. 461. — ISSN 1471-2105. — doi:10.1186/1471-2105-11-461.
  35. Korbinian Schneeberger, Jörg Hagmann, Stephan Ossowski, Norman Warthmann, Sandra Gesing. Simultaneous alignment of short reads against multiple genomes // Genome Biology. — 2009-09-17. — Т. 10. — С. R98. — ISSN 1474-760X. — doi:10.1186/gb-2009-10-9-r98.
  36. 1 2 Claudio Donati, N Luisa Hiller, Hervé Tettelin, Alessandro Muzzi, Nicholas J Croucher. Structure and dynamics of the pan-genome of Streptococcus pneumoniae and closely related species // Genome Biology. — 2010. — Т. 11, вып. 10. — С. R107. — ISSN 1465-6906. — doi:10.1186/gb-2010-11-10-r107. Архивировано 22 июня 2016 года.
  37. Alastair Crisp, Chiara Boschetti, Malcolm Perry, Alan Tunnacliffe, Gos Micklem. Expression of multiple horizontally acquired genes is a hallmark of both vertebrate and invertebrate genomes // Genome Biology. — 2015-03-13. — Т. 16. — С. 50. — ISSN 1465-6906. — doi:10.1186/s13059-015-0607-3.
  38. Daniel H. Huson, Celine Scornavacca. A Survey of Combinatorial Methods for Phylogenetic Networks (англ.) // Genome Biology and Evolution. — 2011-01-01. — Vol. 3. — P. 23–35. — doi:10.1093/gbe/evq077. Архивировано 8 апреля 2018 года.
  39. Gulietta M. Pupo, Ruiting Lan, Peter R. Reeves. Multiple independent origins of Shigella clones of Escherichia coli and convergent evolution of many of their characteristics // Proceedings of the National Academy of Sciences. — 2000-09-12. — Т. 97, вып. 19. — С. 10567–10572. — doi:10.1073/pnas.180094797.
  40. Localization of Shiga toxin gene in the region of Shigella dysenteriae 1 chromosome specifying virulence functions (англ.) // FEMS Microbiology Letters. — 1985-12-01. — Vol. 30, iss. 3. — P. 301–305. — ISSN 0378-1097.
  41. Rapid detection of Bacillus anthracis spores using a super-paramagnetic lateral-flow immunological detectionsystem (англ.) // Biosensors and Bioelectronics. — 2013-04-15. — Vol. 42. — P. 661–667. — ISSN 0956-5663. — doi:10.1016/j.bios.2012.10.088.
  42. Gregory Gimenez, Claire Bertelli, Claire Moliner, Catherine Robert, Didier Raoult. Insight into cross-talk between intra-amoebal pathogens // BMC Genomics. — 2011-11-02. — Т. 12. — С. 542. — ISSN 1471-2164. — doi:10.1186/1471-2164-12-542.
  43. A new, more diverse human genome offers hope for rare genetic diseases Архивная копия от 11 мая 2023 на Wayback Machine, The Washington Post, May 10, 2023