CASBench: эталонный набор белков с аннотированными каталитическим и аллостерическим сайтами в их структурах
- Авторы: Злобин A.С.1, Суплатов Д.А.1, Копылов K.Е.1, Швядас В.К.1
-
Учреждения:
- Московский государственный университет им. М.В. Ломоносова, НИИ физико-химической биологии им. А.Н. Белозерского
- Выпуск: Том 11, № 1 (2019)
- Страницы: 74-80
- Раздел: Экспериментальные статьи
- Дата подачи: 17.01.2020
- Дата публикации: 15.03.2019
- URL: https://actanaturae.ru/2075-8251/article/view/10308
- DOI: https://doi.org/10.32607/20758251-2019-11-1-74-80
- ID: 10308
Цитировать
Аннотация
В последние годы все большее внимание уделяется явлению аллостерии. Это обусловлено как фундаментальным интересом к поиску новых путей регуляции функциональных свойств белков, так и перспективами использования аллостерических сайтов в качестве мишеней для дизайна лекарствен ных препаратов с меньшей токсичностью за счет большей селективности связывания и специфичности ме ханизма действия. Современные методы биоинформатики позволяют в отдельных случаях обнаруживать ранее неизвестные центры связывания лигандов, однако для создания более универсальных и эффектив ных подходов необходимо дальнейшее изучение общих закономерностей и отличительных особенностей структурной организации функциональных (каталитических) и аллостерических сайтов, эволюции их аминокислотных последовательностей в семействах гомологичных белков, а также путей аллостерической коммуникации. Эталонный набор CASBench содержит 91 запись о ферментах, в структурах которых на основании экспериментальной информации из баз данных ASD, CSA и PDB аннотированы как катали тические, так и аллостерические сайты. Полученная выборка может быть использована для оценки эф фективности существующих методов и разработки/обучения перспективных алгоритмов поиска новых каталитических и регуляторных сайтов в структурах белков, а также для изучения механизмов аллостерии на большой выборке ферментов. Установление взаимосвязи между структурой, функцией и регуляцией должно улучшить наше понимание механизмов действия ферментов и предоставить новые возможности для создания новых лекарств и дизайна более эффективных биокатализаторов. Работать с CASBench мож но офлайн на локальном компьютере или онлайн с использованием встроенных интерактивных инструмен тов по адресу https://biokinet.belozersky.msu.ru/casbench.
Полный текст
ВВЕДЕНИЕ Аллостерия - процесс регуляции функции белка при связывании лиганда или другого белка на соот ветствующем участке структуры [1]. Пятьдесят лет назад, когда на основании первых известных на тот момент случаев были предложены классические модели кооперативности, этот феномен считался особенностью полисубъединичных белков, функ ционирующих на уровне четвертичной структуры [2, 3]. Исследования последних лет позволили нако пить большое количество свидетельств наличия ал лостерии в белках с разным строением и функцией, в том числе в небольших мономерных белках. Стало понятно, что аллостерия - не исключительное свой ство сложно организованных полисубъединичных комплексов, а широко распространенное явление, которое играет важную роль в регуляции многих био логических процессов [4-8]. Методы компьютерной биологии были применены для изучения феномена аллостерии в попытке понять взаимосвязь между функцией и регуляцией [6, 9]. Биоинформатический анализ показал, что аминокислотная последова тельность регуляторных сайтов менее консерва тивна по сравнению с каталитическими центрами [10]. Установлено, что каталитические и аллостерические центры насыщены так называемыми специфическими позициями, которые консервативны только внутри функциональных подсемейств, но раз личаются между ними и могут отвечать за функци ональное разнообразие представителей одного су персемейства, обуславливая, например, различия в специфичности к субстратам и регуляторным ли гандам [11-13]. Анализ коррелирующих замен в ами нокислотных последовательностях топологически независимых, но функционально взаимосвязанных центров в структуре родственных белков все более активно используется для изучения молекулярных механизмов аллостерии [9, 14]. Показано, что та кие коррелирующие/ко-эволюционирующие пози ции могут образовать цепочку взаимодействующих остатков между функциональным и регуляторным сайтами в структуре белка, обеспечивая их коммуни кацию путем последовательных конформационных изменений, инициированных связыванием регуля торного агента [15, 16]. Описаны случаи прямой кор реляции между позициями, расположенными в раз ных сайтах связывания на значительном удалении друг от друга (например, в семействе бактериаль ных факторов транскрипции LacI [17]). Информация о физически контактирующих аминокислотных остатках, а также удаленных коррелирующих пози циях, в принципе, может быть использована для ан нотации новых участков связывания и изучения молекулярных механизмов аллостерической комму никации [18]. Структура белка все чаще рассматривается как набор конформеров, равновесие между которы ми может измениться при связывании практически любого вещества на поверхности глобулы, вопрос со стоит лишь в эффективности такого сдвига и его вли янии на функцию [19-22]. В таком случае аллосте рия должна представлять универсальное явление, характерное для большинства белков. Обнаружение такого регуляторного механизма в белках, у которых аллостерия еще не известна, вызывает большой ин терес в связи с важностью установления новых путей регуляции белков/ферментов с фундаментальной точки зрения и перспективами создания на осно ве аллостерических модуляторов лекарственных средств, обладающих меньшей токсичностью за счет большей селективности действия [4, 23-26]. В по следние годы все большее внимание уделяется раз работке компьютерных методов нахождения новых регуляторных сайтов в структурах белков и поиска комплементарных им селективных лигандов, связы вание которых способно влиять на функциональную активность биополимера [9]: с использованием геоме трических [27-30], энергетических [31, 32] или био информатических критериев [13, 33-35], обучающих выборок экспериментально аннотированных сай тов [36, 37] и процедуры высокопроизводительно го виртуального скрининга [38, 39]. Компьютерные программы могут предсказать много новых сайтов в структуре выбранного белка (десятки или даже сотни, в зависимости от размера глобулы и заданных параметров поиска), однако затем необходимо по нять их функциональную роль и классифицировать в соответствии с выбранной оценочной функцией, на пример, по степени насыщения сайтов статистически значимыми консервативными [34, 35] или специфи ческими позициями [13]. Существующие методы по зволяют в отдельных случаях находить новые регу ляторные центры, однако очевидно, что возможности эффективного предсказания аллостерических сайтов пока весьма ограничены и необходимы достаточно универсальные компьютерные подходы, позволяю щие выйти за рамки частных решений этой задачи. Можно отметить общий недостаток большинства известных алгоритмов поиска - они не учитывают различий между функциональными (каталитически ми) и регуляторными (аллостерическими) центрами, а потому не могут дискриминировать сайты разных типов. Для создания более эффективных стратегий необходимо систематическое изучение общих зако номерностей, а также отличительных особенностей структурной организации сайтов разных типов и эво люции их аминокислотных последовательностей в семействах гомологичных белков. Первая попытка обобщить накопленный массив экспериментальной информации об аллостериче ских сайтах была предпринята в рамках базы данных ASD, которая содержит почти две тысячи записей [40]. База ASD является важным ресурсом для сбора экспериментальной информации об аллостерических белках, но содержит избыточные (повторяющиеся) данные, а также аннотации низкого качества, поэто му только небольшая часть этой коллекции может использоваться для изучения аллостерии и обуче ния/тестирования новых алгоритмов (235 записей [41]). Кроме того, в базе ASD не приведена аннотация функциональных (каталитических) центров - эта информация представлена в отдельной базе данных CSA [42]. В основе CSA лежат экспериментальные данные об одной тысяче ферментов, а методы биоинформатики используются для того, чтобы с вы сокой степенью значимости аннотировать наиболее консервативные каталитические остатки в ближай ших гомологах с известной структурой, что позво ляет расширить объем базы до десятков тысяч запи сей. Совместное использование экспериментальной информации об известных каталитических и алло стерических сайтах в структурах белков/фермен тов могло бы помочь в изучении взаимосвязи между структурой, функцией и регуляцией, однако особен ности организации и сложности форматирования записей в базах ASD и CSA делают их прямое сопо ставление невозможным. В данной работе на основании анализа публичных баз данных ASD, CSA и PDB составлена коллекция CASBench с описанием всех ферментов, в струк турах которых на основании экспериментальных данных аннотированы каталитические и аллостери ческие сайты связывания. CASBench может быть ис пользована в качестве эталонного набора для оценки эффективности существующих и разработки пер спективных методов поиска новых функциональ ных и регуляторных сайтов в структурах белков. Наличие аннотации обоих центров в каждом белке позволит изучить особенности организации сайтов разных типов и научить компьютерные алгоритмы распознавать их. Работать с CASBench можно оф лайн на локальном компьютере или онлайн с исполь зованием встроенных интерактивных инструментов. ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ Создание эталонного набора CASBench Сопоставлены последние версии трех публичных баз данных - аннотаций аллостерических сайтов в ASD, аннотаций каталитических сайтов в CSA и струк турной информации, содержащейся в PDB. Работа выполнена с помощью оригинального программного обеспечения на Python 3 с использованием пакета BioPython [43], а также библиотек numpy и ProDy. Протокол создания CASBench состоял из четырех основных этапов: (1) нумерация остатков аллостери ческих сайтов в ASD была приведена к нумерации остатков в репрезентативных PDB-структурах со ответствующих белков; (2) для каждого белка в ASD собрана актуальная информация о всех структурах, представленных в PDB; (3) записи в ASD были со поставлены с записями в CSA для выбора белков, представленных в обеих базах; (4) аннотация ката литического и аллостерического сайта по ASD и CSA уточнена с использованием информации о лигандах в структурах всех найденных кристаллографических комплексов и с учетом четвертичной структуры каж дого белка (при наличии). На первом этапе аннотация аллостерических сайтов каждого белка в ASD была приведена к еди ной нумерации в соответствии с записями в PDB. Трудность в работе с ASD заключалась прежде всего в неоднозначной нумерации аминокислотных остат ков, образующих регуляторный сайт, которая ино гда не соответствовала нумерации аминокислотной последовательности белка ни по PDB, ни по Uniprot, или была заменена на условные обозначения (напри мер, DFG motif), что в некоторых случаях делало невозможной однозначную идентификацию сайта. Нумерация аминокислотных остатков сайта, анно тированного в ASD, которая не совпадала с нумера цией остатков соответствующего белка ни по PDB, ни по UniProt, автоматически корректировалась - проводился перебор всех возможных локализаций аминокислотных остатков сайта в последовательно сти каждой цепи PDB с учетом возможных замен, делеций и вставок. Те записи в ASD, однозначное установление нумерации остатков аллостерического сайта которых в соответствии с нумерацией по PDB структуре было невозможно, далее не рассматрива ли. На втором этапе была собрана информация о всех представленных в PDB структурах каждого белка в ASD. Для этого аминокислотные последователь ности всех белков, представленных в PDB, класте ризовали на уровне сходства 95% с использованием программы CD-HIT [44] (набор PDB95). Все PDB структуры кластера, содержащего репрезентатив ную PDB-структуру, включали в соответствующую запись ASD для дальнейшего анализа. Четвертичная структура каждого белка (при наличии) была вос становлена по соответствующим записям BIOMT. На третьем этапе записи в ASD сопоставляли с за писями в CSA. Аннотации каталитических сайтов в CSA для белков, схожих на 95% и более, объединя ли в одну запись на основании выравниваний соот ветствующих аминокислотных последовательностей. Белки в ASD, которые не были аннотированы в CSA (т.е. ни одна PDB-структура белка, найденная на пре дыдущем этапе, не представлена в CSA), исключали из дальнейшего рассмотрения. На последнем этапе протокола в оставшихся записях (т.е. белках, у кото рых известен и каталитический, и аллостерический центры) первичная аннотация сайтов была уточне на. Аннотации сайтов в базах ASD и CSA могут быть представлены только несколькими остатками, роль которых проверена экспериментально (например, ключевые каталитически важные аминокислоты), что не дает представления о размерах и границах участков связывания. Для уточнения аннотации цен тров использована вся доступная экспериментальная информация о кристаллографических комплексах белков с лигандами. Собранная информация о всех структурах в PDB каждого белка, представленного в ASD и в CSA, использована для поиска лигандов, расположенных в каждом сайте на расстоянии не бо лее 5 Å от любого остатка, включенного в аннотацию. После этого первичную аннотацию каталитического и аллостерического сайтов по ASD и CSA дополня ли вторичной аннотацией, полученной на основании анализа доступных кристаллографических комплек сов - в каждой структуре выделены все остатки, расположенные на расстоянии не более 5 Å от соот ветствующего лиганда, полученные таким образом вторичные аннотации каждого сайта объединяли (дополняли) по всем PDB-структурам одного белка. Сформированный таким образом набор CASBench содержал записи о 91 ферменте. Построение множественного выравнивания семейств белков Уникальные цепи каждого белка, представленно го в CASBench, использовали в качестве затравок для построения множественных выравниваний со ответствующих семейств с использованием метода Mustguseal [45]. Поиск по сходству аминокислотных последовательностей использован для того, чтобы отобрать не более 5000 гомологов для последующего анализа [46]. Полученную первичную выборку филь тровали для исключения слишком похожих и слиш ком далеких белков. Вначале удаляли все последо вательности, длина которых отличалась от затравки более чем на 20% - для исключения неполных запи сей и предотвращения образования колонок с избыт ком делеций в финальном выравнивании. Затем ис пользовали алгоритм CD-HIT [44] для кластеризации белков на уровне сходства 95% по аминокислотной последовательности. Из каждого кластера автома тически выбирали одного представителя, остальные белки исключали из дальнейшего рассмотрения, затем удаляли белки, значительно отличающиеся по аминокислотной последовательности от затрав ки (сходство менее чем 0.25 бит на колонку и таким образом могли вызвать ошибки при выравнивании) [47, 48]. Множественное выравнивание полученной выборки представителей одного семейства строили алгоритмом MAFFT [49]. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ Эталонный набор CASBench содержит 91 запись о ферментах, в структурах которых аннотированы как каталитические, так и аллостерические сайты на основании информации из баз данных ASD и CSA и анализа кристаллографических структур соот ветствующих комплексов с лигандами. CASBench включает ферменты всех основных функциональ ных классов ЕС-классификации, которые представ лены пропорционально встречаемости в других ба зах данных (рис. 1). Топологический анализ показал, что CASBench содержит белки с разной простран ственной организацией, а каталитический и аллосте рический сайты в структуре могут быть по-разному расположены друг относительно друга (рис. 2). В 70% случаев в CASBench представлена аннотация моно мерных белков, которые состоят из одной цепи, а в 30% речь идет о многомерных белках, состоящих из нескольких одинаковых или разных субъединиц. В 5% записей оба сайта образованы в области меж субъединичных контактов, в 22% один из сайтов фор мируется на стыке субъединиц, а в 73% случаев оба центра образованы непрерывными полостями, распо ложенными внутри отдельных цепей. Во всех аннота циях, представленных в CASBench, центры разных типов топологически независимы друг от друга, т.е. представляют отдельные полости в структуре фер мента, но в 30% случаев каталитический и аллосте рический сайты имеют общую область или границу, а в 70% записей находятся на значительном удалении друг от друга и не пересекаются в структуре. Запись CASBench для каждого белка имеет иден тификатор вида CAS0001 (CAS0002, CAS0003 и т.д.) и содержит аннотацию всех центров, а также свя занных в них лигандов во всех имеющихся кри сталлографических структурах в базе данных PDB. Информация представлена в виде бинарных файлов в формате PSE для программы PyMOL Molecular Graphics System, которые могут быть использованы для визуального экспертного анализа, а также в виде текстовых файлов, предназначенных для автомати зированной обработки. Нужно отметить, что первич ная аннотация каталитических и аллостерических сайтов в базах ASD и CSA может состоять только из нескольких остатков, роль которых в функции и регуляции белка проверена экспериментально. Важной особенностью CASBench является уточне ние аннотаций сайтов, приведенных в ASD и CSA, с использованием информации о кристаллографи ческих комплексах из PDB - в эталонном наборе учитываются все остатки, непосредственно взаимо действующие с лигандами, что представляется бо лее удобным для последующего анализа, поскольку дает четкие представления о размерах и границах участков связывания (рис. 3). Для каждой записи CASBench также доступны множественные вырав нивания представителей соответствующих семейств белков в формате FASTA, которые могут быть по лезны при тестировании алгоритмов, использующих биоинформатический анализ для поиска и/или ран жирования центров связывания лигандов в струк турах белков (например, pocketZebra [13]). Вся ин формация, содержащаяся в записях CASBench, доступна для работы офлайн на локальном компью тере или онлайн с использованием интерактивных инструментов. Доступ к веб-версии CASBench осу ществляется через единый список всех доступных записей, а также через функцию поиска по иден тификатору структуры белка в базе PDB или клю чевым словам, содержащимся в PDB-аннотации. Каждая запись CASBench представлена на отдель ной веб-странице, где содержится информация обо всех доступных PDB-структурах соответствующего белка, аннотированных центрах и связанных в них лигандах. Аннотация каталитических и аллостериче ских сайтов может быть визуализирована на струк туре или аминокислотной последовательности белка с использованием встроенных интерактивных ин струментов - JSMol [50] и Strap [51] соответственно. Онлайн-интерактивность имплементирована на язы ке HTML5 и не требует установки плагинов или Java на компьютер пользователя. ЗАКЛЮЧЕНИЕ Тенденцией последних лет является возрастающее внимание к аллостерической регуляции функцио нальных свойств белков/ферментов, поиску соот ветствующих модуляторов и возможности создания на их основе лекарственных средств, обладающих меньшей токсичностью за счет большей селектив ности действия. Однако, несмотря на большой инте рес к изучению взаимосвязи структуры, функции и регуляции, а также к разработке методов поиска новых регуляторных центров в структурах белков, эти проблемы еще далеки от разрешения. В дан ной работе на основании анализа баз данных ASD, CSA и PDB составлен эталонный набор CASBench с описанием всех ферментов, в структурах которых на основании экспериментальных данных анноти рованы каталитические и аллостерические сайты связывания. Полученная выборка может использо ваться для оценки эффективности существующих методов и разработки/обучения алгоритмов поиска новых сайтов в структурах белков, а также для из учения механизмов аллостерической коммуника ции между топологически независимыми центрами на большой выборке конкретных семейств фермен тов. Установление взаимосвязи между структурой, функцией и регуляцией должно улучшить наше понимание механизмов действия ферментов и от крыть ранее неизвестные пути для создания новых лекарств и дизайна более эффективных биокатали заторов.
Об авторах
A. С. Злобин
Московский государственный университет им. М.В. Ломоносова, НИИ физико-химической биологии им. А.Н. Белозерского
Email: vytas@belozersky.msu.ru
Россия
Д. А. Суплатов
Московский государственный университет им. М.В. Ломоносова, НИИ физико-химической биологии им. А.Н. Белозерского
Email: vytas@belozersky.msu.ru
Россия
K. Е. Копылов
Московский государственный университет им. М.В. Ломоносова, НИИ физико-химической биологии им. А.Н. Белозерского
Email: vytas@belozersky.msu.ru
Россия
В. К. Швядас
Московский государственный университет им. М.В. Ломоносова, НИИ физико-химической биологии им. А.Н. Белозерского
Автор, ответственный за переписку.
Email: vytas@belozersky.msu.ru
Россия
Список литературы
- Laskowski R.A., Gerick F., Thornton J.M. // FEBS Lett. 2009, V.583, №11, P.1692-1698
- Monod J., Wyman J., Changeux J.P. // J. Mol. Biol. 1965, V.12, №1, P.88-118
- Koshland D.E., Nemethy G., Filmer D. // Biochemistry. 1966, V.5, №1, P.365-385
- Nussinov R., Tsai C.J. // Cell. 2013, V.153, №2, P.293-305
- Cui Q., Karplus M. // Protein Sci. 2008, V.17, №8, P.1295-1307
- Goodey N.M., Benkovic S.J. // Nat. Chem. Biol. 2008, V.4, №8, P.474-482
- Arkin M.R., Wells J.A. // Nat. Rev. Drug Discov. 2004, V.3, №4, P.301-317
- Hardy J.A., Wells J.A. // Curr. Opin. Struct. Biol. 2004, V.14, №6, P.706-715
- Suplatov D., Švedas V. // Acta Naturae. 2015, V.7, №4, P.34-45
- Yang J.S., Seo S.W., Jang S., Jung G.Y., Kim S. // PLoS Comput Biol. 2012, V.8, №7, e1002612
- Suplatov D., Shalaeva D., Kirilin E., Arzhanik V., Švedas V. // J. Biomol. Struct. Dyn. 2014, V.32, №1, P.75-87
- Suplatov D., Kirilin E., Takhaveev V., Švedas V. // J. Biomol. Struct. Dyn. 2014, V.32, №11, P.1752-1758
- Suplatov D., Kirilin E., Arbatsky M., Takhaveev V., Švedas V. // Nucleic Acids Research 2014, V.42, №W1, P.W344-W349
- de Oliveira S., Deane C. // F1000 Research. 2017, V.6, P.1224
- Anishchenko I., Ovchinnikov S., Kamisetty H., Baker D. // Proc. Natl. Acad. Sci. USA. 2017, V.114, №34, P.9122-9127
- Reynolds K.A., McLaughlin R.N., Ranganathan R. // Cell. 2011, V.147, №7, P.1564-1575
- Raman S., Taylor N., Genuth N., Fields S., Church G.M. // Trends Genet. 2014, V.30, №12, P.521-528
- Suplatov D.A., Sharapova Ya.A., Timonina D.S., Kopylov K.E., Švedas V. // J. Bioinform. Comput. Biol. 2018, V.16, №2, P.1840005
- Gunasekaran K., Ma B., Nussinov R. // Proteins. 2004, V.57, №3, P.433-443
- Chennubhotla C., Yang Z., Bahar I. // Mol. Biosyst. 2008, V.4, №4, P.287-292
- Hilser V.J., Thompson E.B. // Proc. Natl. Acad. Sci. USA. 2007, V.104, №20, P.8311-8315
- Popovych N., Sun S., Ebright R.H., Kalodimos C.G. // Nat. Struct. Mol. Biol. 2006, V.13, №9, P.831-838
- Wenthur C.J., Gentry P.R., Mathews T.P., Lindsley C.W. // Annu. Rev. Pharmacol. Toxicol. 2014, V.54, P.165-184
- Lu S., Li S., Zhang J. // Med. Res. Rev. 2014, V.34, №6, P.1242-1285
- Eglen R., Reisine T. // Pharmacol. Ther. 2011, V.130, №2, P.144-156
- Nussinov R., Tsai C.J., Csermely P. // Trends Pharmacol. Sci. 2011, V.32, №12, P.686-693
- Yu J., Zhou Y., Tanaka I., Yao M. // Bioinformatics. 2010, V.26, №1, P.46-52
- Le Guilloux V., Schmidtke P., Tuffery P. // BMC Bioinformatics. 2009, V.10, №1, P.168
- Yaffe E., Fishelovitch D., Wolfson H.J., Halperin D., Nussinov R. // Nucleic Acids Research 2008, V.36, №July, S2, P.W210-W215
- Weisel M., Proschak E., Schneider G. // Chem. Cent. J. 2007, V.1, №7, P.1-17
- Hernandez M., Ghersi D., Sanchez R. // Nucleic Acids Research 2009, V.37, S2, P.W413-W416
- Laurie A.T.R., Jackson R.M. // Bioinformatics. 2005, V.21, №9, P.1908-1916
- Saroj Devi N., Shanmugam R., Ghorai J., Ramanan M., Anbarasan P., Doble M. // Mol. Inform. 2017, V.36, P.1700073
- Kalinina O.V., Gelfand M.S., Russell R.B. // BMC Bioinformatics. 2009, V.10, №1, P.174
- Huang B., Schroeder M. // BMC Struct. Biol. 2006, V.6, №1, P.19
- Huang W., Lu S., Huang Z., Liu X., Mou L., Luo Y., Zhao Y., Liu Y., Chen Z., Hou T., Zhang J. // Bioinformatics. 2013, V.29, №18, P.2357-2359
- Volkamer A., Kuhn D., Grombacher T., Rippmann F., Rarey M. // J. Chem. Inf. Model. 2012, V.52, №2, P.360-372
- Gushchina I.V., Nilov D.K., Zakharenko A.L., Lavrik O.I., Švedas V.K. // Acta Naturae. 2017, V.9, №2, P.59-66
- Suplatov D., Popova N., Zhumatiy S., Voevodin V., Švedas V. // J. Bioinform. Comput. Biol. 2016, V.14, №2, P.1641008
- Huang Z., Zhu L., Cao Y., Wu G., Liu X., Chen Y., Wang Q., Shi T., Zhao Y., Wang Y. // Nucleic Acids Research 2011, V.39, S1, P.D663-D669
- Huang W., Wang G., Shen Q., Liu X., Lu S., Geng L., Huang Z., Zhang J. // Bioinformatics. 2015, V.31, №15, P.2598-2600
- Furnham N., Holliday G.L., de Beer T.A., Jacobsen J.O., Pearson W.R., Thornton J.M. // Nucleic Acids Research 2014, V.42, №D1, P.D485-D489
- Cock P.J.A., Antao T., Chang J.T., Chapman B.A., Cox C.J., Dalke A., Friedberg I., Hamelryck T., Kauff F., Wilczynski B., De Hoon M.J. // Bioinformatics. 2009, V.25, №11, P.1422-1423
- Fu L., Niu B., Zhu Z., Wu S., Li W. // Bioinformatics. 2012, V.28, №23, P.3150-3152
- Suplatov D., Kopylov K., Popova N., Voevodin V., Švedas V. // Bioinformatics. 2018, V.34, №9, P.1583-1585
- Vouzis P.D., Sahinidis N.V. // Bioinformatics. 2010, V.27, №2, P.182-188
- Fischer J.D., Mayer C.E., Söding J. // Bioinformatics. 2008, V.24, №5, P.613-620
- Söding J., Biegert A., Lupas A.N. // Nucleic Acids Research 2005, V.33, №S2, P.W244-W248
- Katoh K., Standley D.M. // Mol. Biol. Evol. 2013, V.30, №4, P.772-780
- Hanson R.M., Prilusky J., Renjian Z., Nakane T., Sussman J.L. // Isr. J. Chem. 2013, V.53, №3-4, P.207-216
- Gille C., Fähling M., Weyand B., Wieland T., Gille A. // Nucleic Acids Research 2014, V.42, №W1, P.W3-W6
- Sadovnichy V., Tikhonravov A., Voevodin Vl., Opanasenko V. // Contemp. High Perform. Comput. Petascale Exascale. Boca Raton, USA 2013, P.283-307