Genetic Diversity and Evolution of the Biological Features of the Pandemic SARS-CoV-2

Aleksandra A. Nikonova; Никонова Александра Александровна; Eugene B. Faizuloev; Файзулоев Евгений Бахтиерович; Anastasia V. Gracheva; Грачева Анастасия Вячеславовна; Igor Yu. Isakov; Исаков Игорь Юрьевич; Vitaly V. Zverev; Зверев Виталий Васильевич

doi:10.32607/actanaturae.11337

Генетическое разнообразие и эволюция биологических свойств коронавируса SARS-CoV-2 в условиях глобального распространения

Авторы: Никонова А.А.¹, Файзулоев Е.Б.¹, Грачева А.В.¹, Исаков И.Ю.¹, Зверев В.В.¹
Учреждения:
1. Научно-исследовательский институт вакцин и сывороток им. И.И. Мечникова
Выпуск: Том 13, № 3 (2021)
Страницы: 77-89
Раздел: Обзоры
Дата подачи: 20.01.2021
Дата принятия к публикации: 14.04.2021
Дата публикации: 15.11.2021
URL: https://actanaturae.ru/2075-8251/article/view/11337
DOI: https://doi.org/10.32607/actanaturae.11337
ID: 11337

Цитировать

Полный текст

Аннотация

Новая коронавирусная инфекция (COVID-19) представляет серьезную угрозу для глобального здравоохранения. С начала пандемии число пациентов с подтвержденной инфекцией в мире превысило 117 млн, из них более 2.6 млн скончались. Несмотря на беспрецедентные ответные меры общественного здравоохранения, направленные на сдерживание распространения заболевания, ряд стран столкнулся с кризисом в отделениях интенсивной терапии. В настоящее время предпринимаются большие усилия по мониторингу генетической изменчивости этиологического агента COVID-19 – коронавируса SARS-CoV-2. Секвенирование сотен тысяч геномов вирусов, выделенных в разных регионах мира, позволяет изучать эволюцию SARS-CoV-2 и отслеживать его географическое распространение с течением времени. Понимание эволюции SARS-CoV-2 необходимо не только для ретроспективного анализа причин появления и закономерностей распространения новой коронавирусной инфекции, но и для создания терапевтических и профилактических средств против COVID-19. В этом обзоре представлена общая характеристика SARS-CoV-2 и вызываемого им заболевания, а также проанализированы источники, описывающие генетическое разнообразие вируса и его взаимосвязь с биологическими свойствами SARS-CoV-2, такими, как вирулентность и контагиозность.

Ключевые слова

коронавирусы, SARS-CoV-2, патогенность, вирулентность, контагиозность, эволюция вирусов, вирусный геном

Полный текст

ВВЕДЕНИЕ

После появления первых случаев заражения в китайском Ухане в декабре 2019 года новая коронавирусная инфекция COVID-19, вызванная SARS-CoV-2, распространилась во всех странах земного шара и стала первой в истории человечества пандемией, вызванной коронавирусом [1]. По состоянию на март 2021 года COVID-19 диагностирован более чем у 117 млн человек в мире и стал причиной более 2.6 млн смертей [2]. В настоящее время профилактические вакцины доступны не во всех странах и не всем слоям населения, поэтому карантин, социальное дистанцирование и особые санитарные меры предосторожности остаются важнейшими мерами предотвращения распространения инфекции.

В связи с быстрым и широким распространением нового коронавируса неизбежна его дивергенция, появление штаммов с различными биологическими свойствами, наиболее значимым из которых является вирулентность. О фенотипическом разнообразии коронавируса SARS-CoV-2, учитывая короткий период его изучения, известно очень мало. К сожалению, при описании геномных последовательностей информация о пациенте скудна и ограничивается возрастом и полом, тогда как информация о тяжести, особенностях и исходе заболевания зачастую отсутствует.

Одной из актуальных задач фундаментальной и медицинской вирусологии остается определение природы патогенности и вирулентности вирусов, в том числе животного происхождения. Несмотря на прогресс, достигнутый в понимании эволюции вирусов, вопрос об эволюции вирулентности, возникшей в результате межвидовой передачи, остается дискуссионным. Становится ли вирус более или менее вирулентным в новом хозяине? Каким образом уровень вирулентности модулируется под влиянием естественного отбора и почему? Существуют ли закономерности эволюции вирулентности вирусов в новом хозяине, позволяющие прогнозировать направление этого процесса? Упрощенная интерпретация эволюции вирулентности заключается в том, что естественный отбор будет оптимизировать уровень вирулентности таким образом, чтобы повысить эффективность передачи вируса, характеризующуюся базовым репродуктивным числом (R0) [3]. Адаптация вируса в новом хозяине формируется сложным набором взаимодействий факторов хозяина-возбудителя. Согласно современным представлениям, при межвидовой передаче первоначальная вирулентность вируса может варьироваться от отсутствия патогенности (бессимптомное носительство) до высокой патогенности, причем прогнозировать направление изменения вирулентности крайне сложно. Встреча человечества с высоковирулентным пандемическим вирусом животного происхождения происходит не очень часто – 1 раз за несколько десятилетий, однако последствия этого тяжелейшие и имеют глобальное значение. В связи с этим крайне важно понимать и прогнозировать, как будут эволюционировать биологические свойства коронавируса SARS-CoV-2. Целью обзора является анализ результатов научных исследований, посвященных поиску взаимосвязи генетических изменений вируса SARS-CoV-2 с его биологическими свойствами, включая патогенность, вирулентность и контагиозность.

Под патогенностью вируса понимается его способность вызывать заболевание. Термин «вирулентность» в зависимости от контекста может иметь различные значения. В настоящем обзоре под вирулентностью вируса подразумевается мера его патогенности, т.е. способность вызывать более или менее тяжелые заболевания; при этом степень вирулентности определяется коэффициентом летальности. Контагиозность (трансмиссивность) вируса – это его способность передаваться от больных организмов здоровым. Мерой контагиозности являются взаимосвязанные показатели: индекс контагиозности (доля лиц из числа восприимчивых, которые заболели после контакта с источником возбудителя) и базовое репродуктивное число R0 (среднее количество лиц, напрямую инфицированных больных в течение всего заразного периода при условии попадания его в полностью восприимчивую популяцию).

ОБЩАЯ ХАРАКТЕРИСТИКА SARS-CоV-2

Пандемический SARS-CoV-2, наряду с вирусом SARS-CoV, относится к семейству Coronaviridae, подсемейству Orthocoronavirinae, роду Betacoronavirus, подроду Sarbecovirus, виду Severe acute respiratory syndrome-related coronavirus [4]. Следует отметить, что вместе с перечисленными патогенами к подроду Sarbecovirus относятся также коронавирусы, выделенные от летучих мышей, в частности, подковоносов (род Rhinolophus) [5]. Установлено, что последовательность генома SARS-CoV-2 на 96.2 и 93.3% совпадает с геномом коронавирусов летучих мышей RaTG13 [6] и RmYN02 [7] соответственно. Степень сходства нуклеотидных последовательностей и эволюционный анализ лежат в основе гипотезы о том, что именно летучие мыши являются природным резервуаром SARS-CoV-2, который через неизвестных промежуточных хозяев попал в человеческую популяцию [8, 9]. Кроме того, показано, что сходство с геномом коронавирусов, выделенных от панголинов, составляет 85.5–92.4% [10], с геномом SARS-CoV – 80% [6] и MERS-CoV, принадлежащего к подроду Merbecovirus, – 50% [11]. Однако степень гомологии генома сильно варьирует в зависимости от генов, а также геномных локусов [5]. При этом основные различия между этими вирусами наблюдаются в последовательности ORF1a и гена, кодирующего шиповидный белок S, который играет ключевую роль при взаимодействии вируса с клеткой [12]. Эти особенности организации генома могут быть следствием межвирусной рекомбинации [13].

SARS-CoV-2 представлен вирионами плеоморфной (обычно сферической) формы со средним диаметром 108 ± 8 нм в диапазоне от 84 до 126 нм [14]. На поверхности вирусных частиц расположены выступающие шипы длиной примерно 9–12 нм, что придает вирусу форму короны. Морфология вирионов SARS-CoV-2 имеет сходство с другими представителями семейства Coronaviridae, включая SARS-CoV и MERS-CoV [15].

Геном SARS-CoV-2 представлен несегментированной одноцепочечной РНК позитивной полярности размером 29.9 т.н. и состоит из шести основных открытых рамок считывания (ORF) (рис. 1). Трансляция кодируемой вирусом РНК-зависимой РНК-полимеразы (репликазы) необходима для инициации репликации вируса в клетке и синтеза субгеномных вирусных РНК, которые в свою очередь служат матрицей для синтеза структурных и вспомогательных белков вируса [16]. Размер ORF1ab, которая кодирует репликазу, составляет 2/3 от размера всего вирусного генома. За ней следуют гены шиповидного белка (S), ORF3a, белка оболочки (E), белка мембраны (M), ORF6, ORF7a, ORF7b, ORF8, нуклеокапсида (N) и ORF10. Кроме того, Nelson и соавт. доказали, что SARS-CoV-2 содержит новый перекрывающийся ген (OLG – overlapping gene) ORF3d [17], который имеется и у коронавирусов, выделенных от панголинов в районе Гуанси на юге Китая, но не обнаружен у других коронавирусов, выделенных от панголинов и летучих мышей.

Рис. 1. Основные мутации в геноме SARS-CoV-2, зафиксированные в течение года с момента начала пандемии (создано в онлайн-программе BioRender)

Шиповидный белок S коронавирусов SARS-CoV и SARS-CoV-2 инициирует слияние оболочки вируса с плазматической мембраной клетки-хозяина, а ангиотензинпревращающий фермент 2 (ACE2) служит клеточным рецептором для прикрепления вируса. Рецептором MERS-CoV является hDPP4 (дипептидилпептидаза 4, или CD26 человека) [18]. В S-белке выделяют два домена: S1 и S2. Домен S1 опосредует связывание с ACE2, а S2 – последующее слияние вирусной оболочки с клеточной мембраной [19]. Рецепторсвязывающий домен (RBD) – это ключевой функциональный компонент S1, который отвечает за связывание SARS-CoV-2 с ACE2 [20]. Кроме того, RBD SARS-CoV содержит коровый мотив и рецепторсвязывающий мотив (RBM), который опосредует контакты с ACE2. На поверхности ACE2 расположены две точки, которые SARS-CoV-2 использует для прикрепления [21]. Стадия адсорбции и проникновения SARS-CoV-2 в клетку зависит не только от ACE2-рецептора, но и от трансмембранной сериновой протеазы TMPRSS2 и пропротеинконвертазы фурин, функция которых состоит в праймировании S-белка SARS-CoV-2 [22, 23]. Таким образом, SARS-CoV-2 может проникать в клетку двумя различными способами (рис. 2): через позднюю эндосому, где S-белок расщепляется катепсинами, или через клеточную мембрану, или через раннюю эндосому, используя трипсиноподобные протеазы для расщепления S-белка [23, 24].

Рис. 2. Строение вириона и основные этапы цикла репродукции SARS-CoV-2 (создано в онлайн-программе BioRender)

I. Адсорбция вируса. После адсорбции вирус может проникнуть в клетку двумя путями: через эндосому (I-a) или путем слияния с плазматической мембраной (I-b)

II. Рецептор-опосредованный эндоцитоз

III. Раздевание вируса в результате слияния оболочки вируса с мембраной эндосомы. Высвобождение рибонуклеопротеидного комплекса (РНП)

IV. Трансляция вирусного генома. Синтез вирусных белков, ответственных за репликацию и транскрипцию генома, включая РНК-зависимую РНК-полимеразу (RdRp)

V. Репликация и транскрипция вирусного генома

VI. Синтез вирусных белков на эндоплазматической сети (ЭПС)

VII. Сборка и транспорт вириона к мембране клетки

VIII. Выход из клетки путем экзоцитоза

Белок E формирует ионные каналы и регулирует сборку вирионов [25]. Белок M также участвует в сборке вирусных частиц [26], тогда как белок N формирует с вирусной РНК рибонуклеопротеиновый комплекс и выполняет несколько функций, таких, как усиление транскрипции вирусного генома и взаимодействие с вирусным мембранным белком во время сборки вириона [27].

Рецептор клеток-мишеней, который вирус использует для проникновения в клетку, является фактором, определяющим, какие органы и ткани чувствительны к заражению. Рецептор ACE2 экспрессируется на поверхности эпителиальных клеток альвеол, трахеи, бронхов, бронхиальных желез, а также на альвеолярных макрофагах. Кроме того, ACE2 присутствует на слизистых оболочках, таких, как роговица глаза, бокаловидные и ресничные клетки в носовой полости [28], которые, судя по всему, служат входными воротами инфекции. Патогенетический механизм COVID-19 заключается в том, что вирус проникает в клетку, используя рецептор ACE2, и высвобождает одноцепочечную вирусную РНК, которая соединяется с рибосомой клетки-мишени и инициирует синтез РНК-репликазы, которая в свою очередь воспроизводит копии геномной и субгеномной РНК, а также фрагменты РНК, служащие матрицей для синтеза белков вирусной оболочки. Молекулы геномных вирусных РНК позитивной полярности вместе со структурными вирусными белками формируют новые вирионы SARS-CoV-2, которые высвобождаются из клетки и инфицируют интактные клетки-мишени (рис. 2) [29].

МНОГООБРАЗИЕ КЛИНИЧЕСКИХ ПРОЯВЛЕНИЙ COVID-19

Характер заболевания, вызванного SARS-CoV-2, может существенно различаться [30]. Наблюдается большая вариабельность клинических проявлений COVID-19 даже среди близких контактов инфицированного и членов одной семьи [30]. Спектр симптоматики при COVID-19 колеблется от легкой и умеренной формы до критической и фатальной [31–33]. Также часто фиксируются случаи бессимптомного течения заболевания. Установлено, что доля случаев бессимптомного носительства достигает 40–50%, при этом инфицированный человек является источником заражения на протяжении более 14 дней [34]. Кроме того, бессимптомное течение инфекции может быть ассоциировано с субклиническими нарушениями в легких, которые выявляются при проведении компьютерной томографии [34]. Таким образом, SARS-CoV-2 обладает повышенной вирулентностью с тактическим преимуществом – способностью поддерживать передачу от человека к человеку даже при бессимптомном носительстве [35], что позволяет вирусу быстро распространяться.

Согласно докладу Китайского центра по контролю и профилактике заболеваний [36], при анализе 44500 подтвержденных случаев инфекции с оценкой тяжести заболевания установлено, что умеренная форма течения COVID-19 (без пневмонии или со слабовыраженной пневмонией) наблюдается в 81% случаев. Тяжелая форма (с одышкой, гипоксией или >50% поражением легких) зарегистрирована в 14% случаев. Заболевание в критической форме (с дыхательной недостаточностью, шоком или полиорганной дисфункцией) наблюдается в 5% случаев. При этом общий уровень летальности составил 2.3% (среди некритических случаев не зарегистрировано ни одного случая смерти).

Заболевание COVID-19 в тяжелой форме может наблюдаться у практически здоровых людей любого возраста, но встречается преимущественно у лиц старше 65 лет и/или с сопутствующими заболеваниями (сердечно-сосудистые заболевания, сахарный диабет, гипертония, хронические заболевания легких и почек, рак, ожирение, курение) [32, 36, 37], тогда как у большинства молодых взрослых инфекция протекает в легкой форме без осложнений.

Описано несколько осложнений, вызванных COVID-19. Среди них острый респираторный дистресс-синдром – тип дыхательной недостаточности, при которой необходимо проводить реанимационные действия, включая искусственную вентиляцию легких. В такой помощи нуждаются от 12 до 24% госпитализированных пациентов [38, 39]. Также выявляют сердечно-сосудистые [40], тромбоэмболические осложнения [41], воспалительные реакции [42], суперинфекции [43].

Дети наименее подвержены инфицированию вирусом – в общей структуре случаев COVID-19 доля детей варьирует от 1 до 6.3% [44, 45]. Согласно докладу Китайского центра по контролю и профилактике заболеваний, из 72314 случаев заболевания, зарегистрированных по состоянию на 11 февраля 2020 года, только 2% составляли лица в возрасте до 19 лет [36]. У детей с COVID-19 также описан мультисистемный воспалительный синдром с клиническими признаками, сходными с болезнью Кавасаки и синдромом токсического шока [46]. Мониторинг детской заболеваемости, проведенный Мескиной, показал, что доля бессимптомных форм COVID-19 у детей составляет 62%, в том числе у новорожденных – 73.1%, с низкой частотой тяжелых форм – 0.38% [45].

ГЕНЕТИЧЕСКАЯ ДЕТЕРМИНАЦИЯ БИОЛОГИЧЕСКИХ СВОЙСТВ SARS-CоV-2

Открытым остается вопрос о причинах таких разнообразных клинических проявлений COVID-19 у разных категорий населения. Можно предположить, что это разнообразие зависит от определенных генетических профилей организма-хозяина. В соответствии с этой гипотезой генетическую основу восприимчивости к инфекции можно объяснить полиморфизмом функциональных рецепторов, необходимых для проникновения вируса в клетки-мишени. В частности, наблюдаемая при COVID-19 полиорганная дисфункция, включая фатальные повреждения легких и миокарда, может быть связана c функциональными характеристиками рецепторов ACE2 в популяции [47–49]. Так, Hou и соавт. на основе анализа ~ 81000 геномов человека исследовали восприимчивость к COVID-19, обусловленную полиморфизмом генов ACE2 и TMPRSS2 (двух ключевых факторов хозяина SARS-CoV-2). Обнаружено, что полиморфизмы (p.) ACE2 (такие, как p.Arg514Gly в африканской/афроамериканской популяции) связаны с сердечно-сосудистыми и легочными заболеваниями вследствие изменения взаимодействий ангиотензиногена и ACE2. Уникальные, но распространенные полиморфизмы (включая p.Val160Met (rs12329760)) в TMPRSS2 потенциально могут быть причиной дифференциальной генетической восприимчивости к COVID-19 [50].

При помощи полногеномного поиска ассоциаций (GWAS) проанализировано 8582968 однонуклеотидных полиморфизмов (SNP) от 1980 пациентов с тяжелой формой COVID-19 из итальянского и испанского эпицентров пандемии в Европе. Исследование не выявило значимых ассоциаций тяжелой формы заболевания с одним геном, скорее с мультигенным кластером на хромосоме 3 (гены SLC6A20, LZTFL1, CCR9, FYCO1, CXCR6 и XCR1) [51].

Используя методы NGS, китайские ученые проанализировали генетические профили 332 пациентов с различной степенью тяжести COVID-19. Результаты полногеномного поиска ассоциаций (GWAS) свидетельствуют о том, что наиболее значимый локус, связанный с тяжестью заболевания, находится в TMEM189–UBE2V1, который участвует в сигнальном пути интерлейкина-1 (IL-1). Частота миссенс-вариантов p.Val197Met гена TMPRSS2, влияющих на стабильность белка, у пациентов с тяжелой формой инфекции ниже, чем при легком течении заболевания и в общей популяции. Кроме того, установлено, что аллели HLA-A*11:01, B*51:01 и C*14:02 значительно предрасполагают к тяжелому течению COVID-19 [52].

Селективность в отношении генетических профилей организма-хозяина (как фактор вирулентности SARS-CoV-2) может быть одной из особенностей вируса. У вируса гриппа, ставшего причиной глобальной пандемии в 1918 году, такое свойство не описано. Это может быть связано с тем, что в начале XX века уровень техники и знаний не позволял провести исследований на эту тему. Опубликованы данные о восприимчивости к ВИЧ-1, генетически детерминированной вариациями хемокиновых рецепторов хозяина [53]. Эти данные дают основание полагать, что такая избирательность может определять вирулентность и тканевую специфичность и других вирусов, включая SARS-CoV-2.

В исследованиях, направленных на изучение молекулярных механизмов патогенности и контагиозности коронавирусов, наибольшее внимание уделяется детерминантам тропизма коронавирусов к клеткам дыхательных путей человека, основанного на рецептор-опосредованном проникновении вируса в клетку. Эти детерминанты находятся в поверхностном S-белке коронавирусов. Распространено мнение, что именно мутации в эпитопах белка S, ответственных за связывание с вирусными рецепторами, определяют эффективность межвидовой передачи и адаптации вируса к новому хозяину [54]. Экспериментально обоснована способность коронавируса летучих мышей, S-белок которых модифицирован методами обратной генетики, преодолевать видовой барьер (инфицировать клетки человека) [55]. Однако на сегодняшний день отсутствует экспериментальное подтверждение того, что только один S-белок SARS-CoV-2 опосредует контагиозность или высокую вирулентность вируса у человека. Ранее на примере высокопатогенного вируса гриппа А птиц H5N1 доказали, что способность распознавать вирусные рецепторы клеток эпителия дыхательных путей млекопитающих может достигаться введением в гемагглютинин (НА) от двух до четырех аминокислотных замен, важных для связывания НА с α-2,6-сиаловыми рецепторами [56, 57]. Тем не менее только этих мутаций оказалось недостаточно для того, чтобы вирус приобрел контагиозность и высокую вирулентность для хорьков [56, 57]. Это свидетельствует о том, что дополнительные детерминанты контагиозности и вирулентности вероятно закодированы во «внутренних генах» вируса. Патогенность вируса опосредована не только его способностью эффективно проникать в клетки-мишени, но и множеством других вирусных факторов. Примером тому служат вакцинные штаммы, входящие в состав живых аттенуированных вакцин. По данным Klimov и соавт. [58], детерминантами аттенуации холодоадаптированного вакцинного штамма вируса гриппа A/Leningrad/134/47/17 являются мутации в генах белков полимеразного комплекса (PB1, PB2, PA, NP), М-белка и неструктурного белка NS2, но не поверхностных белков нейраминидазы N и гемагглютинина H. Более 10 примеров изменения вирулентности разных вирусов млекопитающих, обусловленных лишь одной или двумя аминокислотными заменами, приведено в обзоре [3]. Подавляющее большинство этих примеров касается РНК-содержащих вирусов (вирусы гриппа А и В, энтеровирусы, вирус Эбола, ВИЧ, вирус лихорадки Западного Нила, вирус болезни Ньюкасла, вирус репродуктивно-респираторного синдрома свиней и др.).

Вирусы, относящиеся к одному биологическому виду, могут значительно различаться вирулентностью, что связано с дивергенцией в ходе эволюции. Смертность при заражении сезонными вирусами гриппа А (вид Influenza A virus семейства Orthomyxoviridae) серотипов H3N2, H1N1 составляет 0.04–1.0%, тогда как смертность от заболеваний, вызванных отдельными штаммами вируса птичьего гриппа A, в том числе H5N1, H7N7, H9N2, H7N3 и H7N9, достигала 60% [59, 60]. Коронавирусы человека не являются исключением. Так называемые сезонные коронавирусы (HCoV-NL63, -229Е, -OC43, -HKU1) ассоциированы в основном с легкими и среднетяжелыми формами ОРВИ, тогда как коронавирусы животного происхождения – SARS-CoV, MERS-CoV и SARS-CoV-2 – с развитием тяжелого острого респираторного синдрома и более высоким риском летальности (по разным оценкам от 1 до 40% от числа лабораторно подтвержденных случаев).

Группа Кунина недавно выявила возможные генетические детерминанты, определяющие повышенную летальность в результате заражения высоковирулентными коронавирусами – SARS-CoV, MERS-CoV и SARS-CoV-2 – по сравнению с низковирулентными сезонными HCoV-NL63, -229Е, -OC43 и -HKU1 [61]. В геноме высокопатогенных коронавирусов SARS-CoV, MERS-CoV и SARS-CoV-2 в результате анализа более 3000 коронавирусных геномов выявили четыре области (три в гене нуклеопротеина N и одну в гене S-белка), значимо отличающиеся по аминокислотным последовательностям от сезонных коронавирусов. Отличия в гене N предположительно определяют усиление сигналов ядерной локализации и экспорта этого белка. Отличия в гене S находятся в области узнавания рецепторов и слияния вирусной оболочки с клеточной мембраной и гипотетически отвечают за усиление этапа прикрепления и входа вируса в клетку. Полученные результаты проливают свет на вероятные детерминанты вирулентности коронавирусов, но не имеют пока эмпирического подтверждения, поскольку работа выполнена методами компьютерного анализа.

В геноме любого вируса постоянно появляются новые мутации, часть которых способна изменить биологические свойства вируса, включая степень контагиозности, способность ускользать от иммунного ответа организма-хозяина, вирулентность. РНК-содержащий SARS-CoV-2 характеризуется высокой (но ниже, чем у других РНК-вирусов) частотой мутаций [62].

На сегодняшний день известны сотни тысяч геномных последовательностей коронавируса SARS-CoV-2. Результаты исследований пополняют базу данных геномных последовательностей GISAID, которая на январь 2021 года включает информацию о более чем 323493 последовательностей. В GISAID, помимо SARS-CoV-2, представлены геномные последовательности коронавирусов, выделенных от летучих мышей и панголинов. Основываясь на данных о вирусных последовательностях, а также информации о географическом происхождении образцов из GISAID, другой информационный ресурс Nextstrain (https://nextstrain.org) [63] размещает филогенетический, географический и геномный анализ SARS-CoV-2. Благодаря базе данных GISAID и ресурсу Nextstrain за эволюцией вируса можно наблюдать в режиме реального времени. Анализ Nextstrain прогнозирует появление примерно 26 замен в геноме SARS-CoV-2 в год. Учитывая размеры генома SARS-CoV-2 (29.9 т.н.), расчетная скорость эволюции составляет примерно 0.90 × 10^-3 замен/сайт/год [5]. Значение этого показателя сопоставимо с показателями, зарегистрированными для SARS-CoV (0.80–2.38 × 10^-3) [64], MERS-CoV (0.63–1.12 × 10^-3) [65] и HCoV-OC43 (0.43 × 10^-3) [66]. Частота мутаций (количество однонуклеотидных замен на сайт за цикл репликации) у SARS-CoV-2 скорее всего будет ниже, чем у других РНК-содержащих вирусов, таких, как, например, вирусы гриппа. Это связано с тем, что геном коронавирусов кодирует 3’–5’-экзорибонуклеазу (nsp14-ExoN), обладающую редактирующей активностью [67]. Этим обусловлена высокая стабильность генома коронавирусов, включая SARS-CoV-2. Анализ нуклеотидных последовательностей 48635 изолятов вируса подтверждает низкую частоту мутаций, которая составила в среднем 7.23 мутации на образец по отношению к эталонным последовательностям генома SARS-CoV-2 (NC_045512.2) [68].

Кроме того, показано, что геном SARS-CoV-2 имеет гораздо более низкую частоту мутаций и генетическое разнообразие по сравнению с вирусом SARS-CoV, который вызвал вспышку атипичной пневмонии в 2002–2003 годах [69]. Следует также отметить, что RBD-домен S-белка (~90 аминокислот) SARS-CoV-2, который непосредственно реагирует с рецептором ACE2 на поверхности клеток-мишеней, значительно отличается от RBD SARS-CoV, особенно в двух областях, которые взаимодействуют с ACE2, и является самой вариабельной частью SARS-CoV-2 [70]. Последнее предполагает участие нескольких механизмов, задействованных в процессе проникновения вируса в клетку. Определены шесть аминокислотных остатков RBD S-белка (Leu455, Phe486, Gln493, Ser494, Asn501 и Tyr505), которые играют ключевую роль в связывании с ACE2. Причем пять из них отличаются от RBD SARS-CoV, что следует учитывать при разработке специфических противовирусных препаратов, блокирующих вход вируса в клетку [70].

Следует отметить, что многочисленные элементы генома вируса в разной степени подвержены мутациям. Так, на основе анализа около 223000 полноразмерных последовательностей протеома SARS-CoV-2 была рассчитана частота мутаций каждого вирусного белка. Самой высокой частота мутаций была у белков S, NSP12, NS9c и N [71].

Анализ нуклеотидных последовательностей изолятов SARS-CoV-2 выявил несколько областей генома с повышенной частотой мутаций [72–81]. Среди них следует выделить одну – D614G, в C-концевой области домена S1 [72–74, 77, 81]. Показано, что в Европе доминирует мутантный вирус с заменой D614G в S1-домене [68]. Сравнение функциональных свойств S-белка с аспарагиновой кислотой в положении 614 (S^D614) и глицином (S^G614) показало, что псевдовирусы, несущие S^G614, проникают в клетки, экспрессирующие ACE2, более эффективно, чем вирусы с S^D614 [82]. Хотя накопление данных все еще продолжается, однако растущая доля вируса с заменой D614G предполагает, что вирусы с этой мутацией имеют преимущество в виде более эффективной передачи от человека к человеку. Интересно, что эта мутация, по-видимому, не влияет существенно на тяжесть течения заболевания [73, 79].

В декабре 2019 года появились сообщения о выделении в Великобритании нового штамма SARS-CoV-2, характеризующегося повышенным уровнем контагиозности [83]. По данным филогенетического анализа этот штамм формирует отдельный филогенетический кластер (линия B.1.1.7) [84]. В S-белке этого вируса идентифицированы семь характерных мутаций: RBD (N501Y, A570D), S1 (ΔH69/V70) и S2 (P681H, T716I, S982A и D1118H) [83]. Мутация N501Y в рецепторсвязывающем домене (RBD) обеспечивает повышенную аффинность по отношению с ACE2 человека и мыши [85]. Делеция ΔH69/V70 в S1 способствует ускользанию вируса от иммунного ответа. Мутация P681H непосредственно примыкает к участку расщепления фурином между S1 и S2 в S-белке. Кроме того, представлены данные, указывающие на существование нескольких независимых линий SARS-CoV-2, для которых характерна делеция ΔH69/V70 в S-белке, и рост циркуляции этих вирусов в некоторых странах Европы, наблюдаемый с августа 2020 года [83].

В январе 2021 года в Южной Африке зафиксировано появление новой линии SARS-CoV-2 (501Y. V2), которая быстро распространилась и стала доминирующей в нескольких регионах страны. Выявлено восемь характерных для этой линии мутаций в S-белке, включая три в RBD (K417N, E484K и N501Y), которые могут иметь функциональное значение. Две из них (E484K и N501Y) расположены в рецепторсвязывающем мотиве (RBM), который непосредственно взаимодействует с ACE2 [86]. Мутация N501Y также характерна для линии B.1.1.7, выявленной в Великобритании. Возможно, эта мутация определяет уровень контагиозности SARS-CoV-2.

Также появились сообщения о новой линии P.1. SARS-CoV-2 в Бразилии [87]. Следует отметить появление конвергентных мутаций, общих для линий P1, B.1.1.7 и B.1.351 (табл. 1). Это мутация N501Y в S-белке и делеция в ORF1b (del11288–11296 (3675–3677 SGF) общие для P.1 и британского B.1.1.7, а также мутации в RBD (K417N/T, E484K, N501Y), характерные как для P.1, так и для южноафриканского B.1.351.

Таблица 1. Наиболее значимые генетические варианты SARS-CoV-2

Генетический вариант SARS-CoV-2	Регион, где впервые был зафиксирован	Характерные мутации	Характерные особенности
B.1.1.7	Великобритания	S-белок: RBD (N501Y, A570D), S1 (ΔH69/V70), S2 (P681H, T716I, S982A и D1118H)	Высокая контагиозность
B.1.351 (N501Y.V2)	ЮАР	S-белок: RBD (K417N, E484K и N501Y)	Некоторые вакцины менее эффективны в отношении этого варианта, высокая контагиозность
Р1-потомок варианта В. 1.1.28	Бразилия	S-белок: RBD (E484K, K417T и N501Y).	Высокая контагиозность
Fin-796H	Финляндия	S-белок: RBD (E484K, K417T и N501Y)	Не детектируется в ПЦР

Набор мутаций/делеций, характерных для линий P.1, B.1.1.7 и B.1.351, возник, вероятно, совершенно независимо. Кроме того, мутации, общие для P.1 и B.1.351, по-видимому, связаны с быстрым увеличением случаев инфекции в местах, где ранее уже был зафиксирован высокий уровень заболеваемости. Поэтому крайне важно выяснить, существует ли повышенная вероятность повторного заражения людей, перенесших COVID-19 [87]. В средствах массовой информации появилась информация о выделении нового штамма SARS-CoV-2 (Fin-796H), который имеет сходство как с британским, так и с южноафриканским вариантом вируса, но при этом выявление этого варианта при ПЦР-анализе может быть затруднено.

Следует отметить, что мутации в S-гене представляют особый интерес для исследователей. На ресурсе GISAID регулярно обновляются данные о вариантах гена S-белка вируса SARS-CoV-2. Самые распространенные из них на январь 2021 года указаны на рис. 1.

Анализ 95 полноразмерных последовательностей генома SARS-CoV-2, доступных в GenBank на период с декабря 2019 по апрель 2020 года, позволил обнаружить 116 мутаций, из которых наиболее часто встречались 8782C > T в гене ORF1ab, 28144T > C в гене ORF8 и 29095C > T в гене N. Предполагается, что выявленные мутации могут влиять на вирулентность и контагиозность SARS-CoV-2 [88].

Еще одна попытка исследовать взаимосвязь определенных мутаций в геноме SARS-CoV-2 с вирулентностью вируса сделана Young и соавт. [89]. В частности, изучено, каким образом делеция нуклеотида в положении 382 (Δ382) в области ORF8 генома SARS-CoV-2 влияла на клинические особенности инфекции. Установлено, что вариант Δ382 SARS-CoV-2, по-видимому, связан с более легким течением инфекции.

В настоящее время продолжается сбор и анализ данных о взаимосвязи мутаций в геноме SARS-CoV-2 с вирулентностью и контагиозностью вируса. Основные мутации, зафиксированные за год циркуляции пандемического вируса, обозначены на рис. 1. Очевидно, что значительная доля мутаций, которые влияли на трансмиссивность вируса, содержится в гене, кодирующем S-белок. Это очень важное наблюдение должно быть принято во внимание разработчиками вакцин против SARS-CoV-2, подавляющее число которых основано на S-белке [90]. Показано, что сыворотки от 20 человек, вакцинированных BNT162b2 (РНК-вакцина, кодирующая S-белок), нейтрализовали псевдовирусы SARS-CoV-2 с мутациями N501 и Y501 [91]. Возможно, что при разработке вакцин следует обратить внимание на другие белки вируса, включая белок нуклеокапсида N. Так, например, 90% эпитопов при Т-клеточном ответе расположено в ORF1ab гена белка нуклеокапсида SARS-CoV-2 [92].

СИСТЕМАТИЗАЦИЯ И ГЕОГРАФИЧЕСКАЯ РАСПРОСТРАНЕННОСТЬ ГЕНЕТИЧЕСКИХ ВАРИАНТОВ SARS-CoV-2

Молекулярно-генетический мониторинг новой коронавирусной инфекции и филогенетический анализ позволили выделить разные генетические варианты SARS-CoV-2, отличающиеся своей географической распространенностью. Существует несколько подходов к сравнительному геномному анализу вариантов SARS-CoV-2. В одном из них, предложенном Forster P. и соавт., выделяют три основных варианта SARS-CoV-2 (A, B, C), которые различаются аминокислотными заменами. При проведении филогенетического анализа близкородственный коронавирус летучих мышей BatCoVRaTG13, выделенный в провинции Юньнань [93], определен как предковый и помещен в основу филогенетического дерева (кластер А) [94]. Выделяют два подкластера А, которые различаются синонимичной мутацией T29095C. Вариант B произошел от А в результате двух мутаций: синонимичной T8782C и несинонимичной C28144T, изменяющей лейцин на серин. При этом тип С отличается от своего родительского типа наличием несинонимичной мутации G26144T, которая приводит к замене глицина на валин [94]. Типы А и C встречаются в основном в Европе и Америке. Напротив, тип В наиболее распространен в Восточной Азии, а его предковый геном, видимо, не вышел за пределы Восточной Азии, что предполагает существование иммунологической или экологической устойчивости к этому типу за пределами Азии [94]. Эти исследования дополнены группой ученых из Гонконга [95], которые провели филогенетический и филодинамический анализ 247 геномных последовательностей SARS-CoV-2, доступных в базе данных GISAID на 5 марта 2020 года. Среди них идентифицировали четыре генетических кластера вирусов, названных «суперраспространителями» (super-spreaders, SS), т.е. вирусы, которые вызвали крупные вспышки заболевания COVID-19 в разных странах мира. Так, SS1 был широко распространен в Азии и США и в основном ответствен за вспышки в штатах Вашингтон и Калифорния, а также в Южной Корее, тогда как SS4 способствовал развитию пандемии в Европе. Используя сигнатурные мутации каждого SS в качестве маркеров, дополнительно проанализировали 1539 последовательностей генома SARS-CoV-2, зарегистрированных после 29 февраля 2020 года, и обнаружили, что 90% этих геномов были «суперраспространителями», причем доминировал SS4 [95]. Проводя параллели с работой [94], следует отметить, что вирус, идентифицированный как SS1, эквивалентен типу B, SS2 – типу C, а тип A – предковый вариант. Результаты географического распространения разных типов вирусов совпадают в обоих исследованиях.

Популяционный генетический анализ 103 геномов SARS-CoV-2 показал [96], что вирусы можно разделить на два основных типа (L и S), которые различаются двумя точечными мутациями в аминокислотной последовательности сайта 84 (S84L) гена ORF8. Несмотря на то что тип L (~70%) более распространен, чем тип S (~30%), результаты эволюционного анализа предполагают, что тип S, скорее всего, является предковой версией SARS-CoV-2. Кроме того, предполагается, что тип L более агрессивен и распространяется быстрее, чем S, а вмешательство человека, возможно, изменило соотношение L- и S-типов вскоре после первой вспышки SARS-CoV-2. Однако в настоящее время неясно, произошел ли L-тип в результате эволюции S-типа коронавируса человека или промежуточных хозяев. Также неясно, является ли L-тип более вирулентным, чем S-тип [96].

Чтобы оценить связь генетических мутаций с уровнем вирулентности вируса, Zhang и соавт. изучили клинические, молекулярные и иммунологические характеристики 326 пациентов с подтвержденной инфекцией SARS-CoV-2 в Шанхае [97]. Они идентифицировали два основных клайда. Клайд I включал несколько подгрупп, характеризующихся различиями в ORF3a – p.251G> V (субклайд V), или S – p.614D> G (субклайд G). Клайд II отличается от клайда I двумя связанными мутациями в ORF8: p.84L> S (28144T> C) и ORF1ab: p.2839S (8782C> T). Такая классификация не согласуется с S/L-типированием [96], несмотря на то, что она основана на тех же двух связанных полиморфизмах. Кроме того, авторы не выявили существенных различий в частоте мутаций и трансмиссивности у вирусов, относящихся к клайду I или II, а также в клинических особенностях вызываемых ими заболеваний.

Еще один подход к систематизации генетических вариантов SARS-CoV-2 представлен в препринте [98]. При сравнении полноразмерных вирусных геномов рассчитывали коэффициент сходства Жаккара. При этом в анализ не включали информацию о географическом происхождении образцов и не пытались моделировать эволюционные взаимоотношения различных геномов SARS-CoV-2 с помощью филогенетического анализа. Несмотря на это, результаты проведенного анализа отражают хронологическое распространение SARS-CoV-2 по всему земному шару, начиная с первых случаев заболевания, наблюдавшихся в Китае, и заканчивая современными вспышками заболевания в Европе и Северной Америке. Кроме того, использование данных о нуклеотидной последовательности 7 640 геномов SARS-CoV-2, представленных в базе данных GISAID, позволило сделать вывод о том, что вирусы группируются в четыре отдельные генетические подгруппы [98].

Анализ десятков тысяч геномов SARS-CoV-2, проведенный группой ученых из Темпльского университета, позволил выявить его прародительский штамм (препринт [99], опубликованный на сайте bioRxiv.org). Со временем мутации в геноме предкового вируса дали начало семи доминантным линиям, которые распространились по разным континентам. Использование технологии молекулярного баркодирования позволило установить, что геномные последовательности североамериканских коронавирусов отличаются от последовательностей коронавирусов, циркулирующих в то же время в Европе и Азии [99].

На основе анализа 75 полноразмерных геномов выделены шесть кластеров, названных Ухань, Бриллиантовая принцесса, Азиатский, Европейский, США и Пекин [100]. Обнаруженные в образцах из Южной Кореи, Индии, Греции, Испании, Австралии, Швеции и Юньнани мутации в гене, кодирующем шиповидный гликопротеин S, возможно, предполагают преобладание мутировавших штаммов с разной степенью вирулентности.

Несмотря на многообразие подходов к классификации SARS-CoV-2, консорциум GISAID сформировал собственную, обобщенную систему классификации [101], согласно которой выделяют семь основных клайдов (на основе характерных наборов мутаций): S, L, V, G, GH, GR, GV (табл. 2).

Таблица 2. Современные подходы к субвидовой классификации SARS-CoV-2

Клайды по GISAID [101] и характерные мутации		Линии по Rambaut [103]	Клайды по Hodcroft [105] и характерные мутации
S	C8782T, T28144C, включая NS8-L84S	A	19A 19B	C8782T T28144C
L	C241, C3037, A23403, C8782, G11083, G26144, T28144 (референсная последовательность - штамм WIV04, GISAID: hCoV-19/Wuhan/WIV04/2019)	B.2	20A	C3037T, C14408T и A23403G
V	G11083T, G26144T NSP6-L37F + NS3-G251V	B.1
G	C241T, C3037T, A23403G, включая S-D614G	B.1*
GH	C241T, C3037T, A23403G, G25563T, включая S-D614G + NS3-Q57H	B.1.1.	20C	C1059T и G25563T
GR	C241T, C3037T, A23403G, G28882A, включая S-D614G + N-G204R		20B	G28881A, G28882A и G28883C
GV	C241T, C3037T, A23403G, C22227T, включая S-D614G + S-A222V

Согласно [68], клайды G и GR преобладают в Европе, в то время как S и GH – в основном в Северной и Южной Америке. Референсный клайд L представлен преимущественно последовательностями из Азии. В настоящее время представители клайда G и его производных – GH и GR, наиболее распространены среди секвенированных геномов SARS-CoV-2, на долю которых в глобальном масштабе приходится 74% всех известных последовательностей. В частности, клайд GR, несущий комбинацию мутаций D614G S-белка и RG203KR N-белка, в настоящее время является самым распространенным представителем SARS-CoV-2 в мире. Исходный вирусный штамм, представленный клайдом L, по-прежнему составляет 7% от числа секвенированных геномов [68].

Проведен анализ 1566 последовательностей генома SARS-CoV-2, выделенных в 10 азиатских странах [102]. Последовательности сравнивали с эталонной последовательностью штамма WIV04 (Accession no MN996528.1) для идентификации мутаций в различных областях генома. Анализ in silico показал, что изоляты из 10 азиатских стран формируют клайды G, GH, GR, L, S, O и V. При этом самый высокий уровень мутаций зафиксирован в клайдах GH и GR [102].

Классификация GISAID дополняется более детальной динамической системой номенклатуры, предложенной Rambaut и соавт. [103]. Согласно этой системе, выделяют 81 линию SARS-CoV-2 и большая их часть относится к линиям A, B и B.1. Выделены шесть линий, производных от линии A (A.1–A.6), и две сублинии-потомки A.1 (A.1.1 и A.3). Также описано 16 линий, производных от линии В. Линия B.1, включающая на апрель 2020 года 70 сублиний, является преобладающей. Линия B.2 имеет шесть сублинейных потомков. Согласно этой классификации, клайды S, V, G, GH, GR, GV соответствуют линиям A, B.2, B.1, B.1*, B.1.1. (табл. 2) [68]. На основе этой системы разработано программное обеспечение pangolin [104], которое позволяет автоматически классифицировать новые геномы.

Еще один подход к систематизации описан в работе Hodcroft с соавт. [105]. Авторы предлагают указывать в названии год выявления штаммов, входящих в определенный клайд. При этом клайд формируется из штаммов, которые циркулируют в течение нескольких месяцев и имеют характерное географическое распространение. Согласно этой классификации, в настоящее время выделяют следующие клайды: 19A, 19B, 20A, 20B, 20C (табл. 1). Клайды 19A и 19B преобладали в Азии в начале пандемии, тогда как 20A был детектирован в Европе в начале 2020 года. Клайд 20B также распространился в Европе, тогда как 20С в основном в Северной Америке.

Таким образом, в настоящее время продолжается формирование удобной и понятной системы классификации пандемического SARS-CoV-2. Следует отметить, что на момент написания обзора не было опубликовано официальных рекомендаций МКТВ (ICTV) по субвидовой таксономии SARS-CoV-2.

В конце января 2020 года в России зафиксировали первые случаи заражения SARS-CoV-2, а с мая 2020 года Россия входит в число четырех стран с наибольшим количеством подтвержденных случаев заболевания COVID-19. На март 2021 года в России зафиксировано 4.3 млн случаев COVID-19 и 87000 смертельных исходов. Однако вспышка в России началась позже, чем во многих соседних европейских странах, возможно, благодаря принятым мерам по ограничению транспортного сообщения с Китаем. Филогенетический анализ изолятов SARS-CoV-2, выделенных в России, показал, что большинство образцов соответствуют линиям B.1, B.1.1 и B.1* (номенклатура PANGOLIN) или клайдам G, GR и GH (номенклатура GISAID), широко распространенным в Европе [106]. При этом самой распространенной генетической линией является GR / 20B / B.1.1 (номенклатура GISAID, Nextstrain, Pangolin соответственно) [107]. В результате филогенетического анализа российских штаммов установлено, что, как и повсеместно, российские изоляты SARS-CoV-2 характеризовались низкой частотой мутаций. Однако обнаружена высокая частота несинонимичных мутаций, приводящих к неконсервативным заменам. Большинство несинонимичных замен найдены в нуклеотидных последовательностях, кодирующих нуклеопротеин N. Предполагается, что это наблюдение может служить косвенным доказательством интенсивной циркуляции вируса в человеческой популяции и его адаптации к новым носителям [108].

ЗАКЛЮЧЕНИЕ

При глобальном распространении SARS-CoV-2 с отчетливым порогом начала пандемии новой для иммунной системы человека вирусной инфекции возникли условия, когда возможно получение достаточно убедительных данных о том, зависит ли структура клинических форм COVID-19 от динамических изменений генетически обусловленных биологических свойств вируса, или же она детерминируется только характеристиками хозяина. Этот вопрос принципиально важен для разработки вакцин и планирования ресурсов общественного здравоохранения. По истечении 12 месяцев от начала распространения нового коронавируса в человеческой популяции все меньше остается сомнений в дивергенции SARS-CoV-2, т.е. в появлении штаммов, отличающихся по биологическим свойствам, что обусловлено высокой пластичностью геномов РНК-вирусов и благоприятными условиями для их эволюции.

Любые изменения вирусного генома, нарушающие взаимодействие с клеткой хозяина, изменяющие условия для репродукции коронавируса, экспрессию генов хозяина или противодействие иммунитету хозяина, могут изменить степень его контагиозности и вирулентности. Более того, биологические свойства вируса может изменить одна или несколько точечных мутаций, как показано в ряде исследований. При этом взаимодействие между коронавирусом и хозяином является ключом к патогенезу коронавирусных заболеваний и, в конечном счете, определяет исход инфекции.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-04-60079.