Des ensembles de données modifiés soulèvent plus de questions sur la fiabilité des études clés sur les origines des coronavirus

Imprimer Email Partager Twitter

Les révisions des ensembles de données génomiques associées à quatre études clés sur les origines des coronavirus ajoutent des questions supplémentaires sur la fiabilité de ces études, qui fournissent un soutien fondamental à l'hypothèse que le SRAS-CoV-2 provient de la faune. Les études, Peng Zhou et coll.., Hong Zhou et coll.., Lam et coll. Xiao et coll., a découvert des coronavirus liés au SRAS-CoV-2 chez des chauves-souris fer à cheval et des pangolins malais.

Les auteurs des études ont déposé des données de séquence d'ADN appelées lecture de la séquence, qu'ils utilisaient pour assembler les génomes des coronavirus de chauve-souris et de pangolin, au Centre national d'information sur la biotechnologie (NCBI) archive de lecture de séquence (SRA). Le NCBI a créé la base de données publique pour aider à la vérification indépendante des analyses génomiques basées sur des technologies de séquençage à haut débit.

US Right to Know a obtenu des documents par une demande de dossiers publics qui afficher les révisions aux données SRA de ces études plusieurs mois après leur publication. Ces révisions sont étranges car elles ont eu lieu après la publication, et sans aucune justification, explication ou validation.

Par exemple, Peng Zhou et coll. et Lam et coll. mis à jour leurs données SRA aux deux mêmes dates. Les documents n'expliquent pas pourquoi ils ont modifié leurs données, mais seulement que certaines modifications ont été apportées. Xiao et coll. fait de nombreux changements à leurs données SRA, y compris la suppression de deux ensembles de données le 10 mars, l'ajout d'un nouvel ensemble de données le 19 juin, un remplacement le 8 novembre des données publiées pour la première fois le 30 octobre et un autre changement de données le 13 novembre - deux jours après Nature a ajouté une «note de préoccupation» de l'éditeur à propos de l'étude. Hong Zhou et coll. n'ont pas encore partagé l'ensemble de données SRA complet qui permettrait une vérification indépendante. Alors que les journaux aiment Nature exiger des auteurs qu'ils rendent toutes les données "rapidement disponible”Au moment de la publication, les données SRA peuvent être publiées après publication; mais il est inhabituel de faire de tels changements des mois après la publication.

Ces modifications inhabituelles des données SRA ne rendent pas automatiquement les quatre études et leurs ensembles de données associés peu fiables. Cependant, les retards, les lacunes et les changements dans les données SRA ont assemblage et vérification indépendants entravés des séquences génomiques publiées, et ajouter à les questions et préoccupations A propos de Meliology le validité des quatre études, telles que:

  1. Quelles ont été les révisions post-publication exactes des données SRA? Pourquoi ont-ils été fabriqués? Comment ont-ils affecté les analyses génomiques et les résultats associés?
  2. Ces révisions SRA ont-elles été validées indépendamment? Si c'est le cas, comment? le La seule validation du NCBI Le critère pour publier un SRA BioProject - au-delà des informations de base telles que le «nom de l'organisme» - est qu'il ne peut pas être un double.

Pour en savoir plus : 

La Centre national d'information sur la biotechnologie (NCBI) les documents peuvent être trouvés ici: Courriels NCBI (Pages 63)

US Right to Know publie des documents issus de nos demandes de dossiers publics pour notre enquête sur les risques biologiques. Voir: Documents FOI sur les origines du SRAS-CoV-2, les dangers de la recherche sur le gain de fonction et les laboratoires de biosécurité.

Page de fond sur l'enquête de US Right to Know sur les origines du SRAS-CoV-2.