Ändrade datamängder ger fler frågor om tillförlitligheten hos viktiga studier om koronavirusursprung

Skriva ut E-post Dela Tweeta

Revideringar av genomiska datamängder associerade med fyra viktiga studier om koronavirusursprung lägger till ytterligare frågor om tillförlitligheten hos dessa studier, vilket ger grundläggande stöd för hypotesen att SARS-CoV-2 har sitt ursprung i vilda djur. Studierna, Peng Zhou et al., Hong Zhou et al., Lam et al.och Xiao et al., upptäckte SARS-CoV-2-relaterade koronavirus i hästskofladdermöss och malaysiska pangoliner.

Studiens författare deponerade DNA-sekvensdata som anropades sekvensen läser, som de använde för att montera genom- och pangolin-coronavirusgenom, i National Center for Biotechnology Information (NCBI) sekvensläst arkiv (SRA). NCBI grundade den offentliga databasen för att hjälpa oberoende verifiering av genomiska analyser baserade på sekvenseringstekniker med hög kapacitet.

USA: s rätt att veta erhållna dokument genom en offentlig register begär att visa revisioner till dessa studier SRA-data månader efter det att de publicerades. Dessa revisioner är udda eftersom de inträffade efter publicering och utan någon motivering, förklaring eller validering.

Till exempel, Peng Zhou et al. och Lam et al. uppdaterade sina SRA-uppgifter samma två datum. Dokumenten förklarar inte varför de ändrade sina uppgifter, bara att vissa ändringar gjordes. Xiao et al. gjort många ändringar till deras SRA-data, inklusive borttagning av två datamängder den 10 mars, tillägg av en ny datamängd den 19 juni, en ersättning den 8 november av data som först släpptes den 30 oktober och en ytterligare dataändring den 13 november - två dagar efter Natur lade till en redaktörs "not av bekymmer" om studien. Hong Zhou et al. har ännu inte delat hela SRA-datasetet som möjliggör oberoende verifiering. Medan tidskrifter gillar Natur kräva att författare gör alla uppgifter ”omedelbart tillgänglig”Vid tidpunkten för publicering kan SRA-data släppas efter offentliggörande; men det är ovanligt att göra sådana ändringar månader efter publicering.

Dessa ovanliga ändringar av SRA-data gör inte automatiskt de fyra studierna och deras tillhörande datamängder opålitliga. Förseningarna, luckorna och förändringarna i SRA-data har dock hindrat oberoende montering och verifiering av de publicerade genomssekvenserna och lägga till frågor och oro handla om de giltighet av de fyra studierna, såsom:

  1. Vilka var de exakta revisionerna av SRA-uppgifterna efter publiceringen? Varför skapades de? Hur påverkade de associerade genomiska analyser och resultat?
  2. Validerades dessa Vägverkets revisioner oberoende? Om så är fallet, hur? De NCBI: s enda validering kriterium för att publicera ett SRA BioProject - utöver grundläggande information som ”organismens namn” - är att det inte kan vara ett duplikat.

För mer information

Vårt National Center for Biotechnology Information (NCBI) dokument finns här: NCBI-e-postmeddelanden (63 sidor)

USAs rätt att veta publicerar dokument från våra offentliga registerförfrågningar för vår utredning av biohazards. Ser: FOI-dokument om ursprunget till SARS-CoV-2, risker med forskning om vinnande funktion och biosäkerhetslaboratorier.

Bakgrundssida om USA: s rätt att veta undersökning av ursprunget till SARS-CoV-2.