
Американские и британские исследователи провели систематический обзор рукописей научных статей по генетике, поданных за два года в профильный рецензируемый журнал, и обнаружили в каждой из них ошибки в номенклатуре генов и их вариантов, которые затрудняли рутинный поиск по базам данных. Статья об этом опубликована в журнале Clinical Chemistry.
Точное описание человеческих генетических вариантов критично для поиска их связи с заболеваниями, исследований и клинической диагностики. Поэтому существует стандартизованная и строго рекомендованная к использованию геномная номенклатура, разрабатываемая Обществом вариантов человеческого генома (HGVS) и Международным постоянным комитетом по человеческой цитогеномной номенклатуре (ISCN). Несмотря на требования рецензируемых журналов использовать эту номенклатуру, многие авторы пользуются нестандартными или историческими подходами к наименованию генов и их вариантов, а у многих журналов нет системных механизмов и ресурсов для проверки на соответствие стандартам.
Редакция журнала Genetics in Medicine при участии Рабочей группы по отчету о вариантах последовательностей Международной организации по изучению генома человека (HUGO-RSVWG) разработала подробные инструкции для авторов и протокол для научных редакторов, призванные повысить приверженность к соблюдению стандартов и верификации номенклатуры с помощью общедоступного программного обеспечения. Тем не менее, многие авторы продолжили использовать нестандартные и исторические подходы. Питер Фримен (Peter Freeman) из Манчестерского университета с коллегами провел систематический обзор 52 рукописей, поданных в Genetics in Medicine и Genetics in Medicine Open в 2023–2024 годах, используя протокол журнала и предлагаемые им рубрикацию и оценку тяжести ошибок номенклатуры (важность этих ошибок для поиска и доступности интерпретации генетических вариантов), как при рецензировании статей.
Обзор показал, что 100 процентов рукописей содержали по меньшей мере одну критическую ошибку («ожидаемо приводящую к снижению поисковой доступности») в виде отсутствия дополнительных деталей, таких как идентификационные данные транскрипта или сборка генома, а также явно ошибочной номенклатуры. Все рукописи, кроме одной, содержали критические ошибки в небольших вариантах (однонуклеотидных полиморфизмах или инделах), чаще всего из-за неверной номенклатуры или неуказания референсной хромосомной последовательности. В 67 процентов статей критически недоставало данных для классификации вариантов или классификационных критериев, в 85 процентах не перечислялись стабильные цифровые идентификаторы генов, более половины содержали мелкие ошибки, например, неправильное использование скобок в номенклатуре.
В дополнение исследователи проверили, как использование неверной номенклатуры однонуклеотидных полиморфизмов и небольших инделов влияет на поиск статей с ними. Для этого они провели поиск 18 таких генетических вариантов, содержащихся в четырех статьях из Genetics in Medicine, с помощью инструментов с открытым кодом ClinVar, LitVar2 и Franklin. Выяснилось, что лишь два из 18 вариантов (11 процентов) ищутся каждым из поисковых инструментов, использование комбинации всех трех инструментов повысило это число до 15 вариантов (83 процента).
Авторы заключили, что четкое следование стандартам номенклатуры генов и их вариантов имеет критическое значение в публикациях, а скрупулезного инструктирования авторов недостаточно, чтобы его добиться. Для решения этой проблемы они порекомендовали всем журналам, публикующим статьи по генетике, придерживаться четырех принципов. Во-первых, строго применять руководства по номенклатуре генов и их вариантов ко всем публикуемым статьям. Во-вторых, внедрять жесткие процессы рецензирования для следования стандартам номенклатуры. В-третьих, поддерживать автоматическую отправку структурированных данных по вариантам и их классификации в открытые репозитории. И в-четвертых, работать с издателями, чтобы информировать продюсерские и редакторские команды.
В 2023 году из-за ошибок и фальсификаций отозвано более 10 тысяч научных статей, а рекордсменом по одновременному отзыву с 434 статьями стал в 2019 году алжирский Journal of Fundamental and Applied Sciences. О том, как борются со скомпроментированными научными публикациями в России и в мире можно почитать в блогах «Большая чистка» и «Кладбище отозванных статей».