Усилия по изучению ранних стадий пандемии коронавируса получили помощь из удивительного источника. Биолог в Соединенных Штатах “раскопал” частичные последовательности генома SARS-CoV-2 из самого начала вероятного эпицентра пандемии в Ухане, Китай, которые были депонированы — но позже удалены — из правительственной базы данных США.
Частичные последовательности генома решают эволюционную головоломку о раннем генетическом разнообразии коронавируса SARS-CoV-2, хотя ученые подчеркивают, что они не проливают свет на его происхождение. Также не совсем ясно, почему исследователи из Уханьского университета попросили удалить последовательности из Архива чтения последовательностей (SRA), хранилища необработанных данных секвенирования, поддерживаемого Национальным центром биотехнологической информации (NCBI), входящим в состав Национального института здравоохранения США (NIH).
“Эти последовательности информативны, они не двусмысленны”, – говорит Джесси Блум, вирусный эволюционный генетик из Исследовательского центра рака Фреда Хатчинсона в Сиэтле, штат Вашингтон, который описывает в препринте от 22 июня, как он восстановил эти геном-последовательности.
Блум обнаружил эти последовательности после поиска геномных данных с ранних стадий пандемии. Исследовательская работа от мая 2020 года содержала таблицу общедоступных данных о последовательности, которая включала записи, с которыми Блум не сталкивался. Эти последовательности были связаны с работой, в которой исследователи использовали технологию секвенирования нанопор для обнаружения генетического материала SARS-CoV-2 в образцах людей. Это исследование было опубликовано в журнале Small в июне 2020 года и опубликовано на сайте bioRxiv в марте того же года.
Когда Блум искал последовательности в SRA, используя детали, перечисленные в статье за май 2020 года, база данных не возвращала никаких записей. Но SRA хранит последовательности в облачном хранилище, поддерживаемом Google, и Блум задался вопросом, сможет ли он найти архивные версии последовательностей на облачных серверах. Этот подход сработал, и Блум смог восстановить данные из 50 образцов, 13 из которых содержали достаточно исходных данных для генерации частичных последовательностей генома.
ЭВОЛЮЦИОННАЯ ТАЙНА
Эти последовательности помогали решить эволюционную загадку о ранних стадиях пандемии, говорит Блум. Самые ранние вирусные последовательности из Уханя получены от людей, связанных с городским рынком морепродуктов Хуанань в декабре 2019 года, который первоначально считался местом, где коронавирус впервые перескочил от животных к людям. Но последовательности на рынке морепродуктов более отдаленно связаны с ближайшими родственниками SARS-CoV-2 у летучих мышей — наиболее вероятным конечным источником вируса — чем более поздние последовательности, включая одну, собранную в Соединенных Штатах.
Это было удивительно, говорит Блум, потому что можно было бы ожидать, что вирусы с ранних стадий уханской эпидемии будут наиболее тесно связаны с родственниками SARS-CoV-2, которые заражают летучих мышей. Восстановленные последовательности, которые, вероятно, были собраны в январе и феврале 2020 года, показывают, что это так — они более тесно связаны с вирусами летучих мышей, чем последовательности от людей, связанных с рынком морепродуктов.
Это добавляет еще одно доказательство к растущему количеству доказательств, включая сообщения о вероятных случаях, датируемых ноябрем 2019 года, что первые случаи заболевания людей COVID-19 не были связаны с рынком морепродуктов Хуанань, говорят Блум и другие ученые.
“Мне показалось, что уханьский рынок был одним из первых суперраспространяющих событий”,-говорит Судхир Кумар, эволюционный генетик из Университета Темпл в Филадельфии, штат Пенсильвания. Последовательности, которые Блум раскопал, добавляет он, предполагают, что SARS-CoV-2 развил обширное разнообразие на ранних стадиях пандемии в Китае, в том числе в Ухане.
Стивен Голдштейн, вирусолог из Университета Юты в Солт-Лейк-Сити, указывает, что последовательности, найденные Блумом, не были скрыты: они подробно описаны с достаточной информацией о последовательностях, чтобы знать их эволюционное родство с другими ранними последовательностями SARS-CoV-2, в Небольшой статье. “Я не думаю, что этот препринт говорит нам много нового, но он действительно выдвигает на передний план данные о последовательностях, которые были общедоступны, хотя и скрыты под радаром”, – говорит Гольдштейн.
Блум говорит, что, хотя последовательности были опубликованы, их удаление из SRA означало, что мало кто из ученых знал о них. В докладе, подготовленном по заказу Всемирной организации здравоохранения о происхождении пандемии, эти последовательности не были включены в эволюционный анализ ранних данных SARS-CoV-2. – Никто не заметил, что они существуют, – говорит Блум.
Соответствующие авторы той статьи не ответили на вопросы новостной команды Nature о том, почему они попросили удалить последовательности из SRA, что произошло до того, как статья была опубликована. В заявлении NIH говорится, что оно удалило данные по просьбе исследователей, которые заявили, что планируют передать их в другую базу данных.
Блум — который является соавтором письма, призывающего к возобновлению исследования происхождения пандемии, включая возможность того, что вирус сбежал или просочился из лаборатории, – говорит, что его исследование не проливает свет на происхождение пандемии и на то, почему последовательности были удалены. Но он надеется, что его усилия побудят исследователей “мыслить нестандартно” и обратиться к другим источникам, таким как архивные данные, чтобы собрать больше информации о первых днях пандемии. “Вероятно, там больше данных”, – говорит он.
Эта статья воспроизводится с разрешения автора и впервые была опубликована 24 июня 2021 года.
Опубликовано: 29.06.2021 в 03:39