Ändrade datamängder ger fler frågor om tillförlitligheten hos viktiga studier om koronavirusursprung

Skriva ut E-post Dela Tweeta

Revideringar av genomiska datamängder associerade med fyra viktiga studier om koronavirusursprung lägger till ytterligare frågor om tillförlitligheten hos dessa studier, vilket ger grundläggande stöd för hypotesen att SARS-CoV-2 har sitt ursprung i vilda djur. Studierna, Peng Zhou et al., Hong Zhou et al., Lam et al.och Xiao et al., upptäckte SARS-CoV-2-relaterade koronavirus i hästskofladdermöss och malaysiska pangoliner.

Studiens författare deponerade DNA-sekvensdata som anropades sekvensen läser, som de använde för att montera genom- och pangolin-coronavirusgenom, i National Center for Biotechnology Information (NCBI) sekvensläst arkiv (SRA). NCBI grundade den offentliga databasen för att hjälpa oberoende verifiering av genomiska analyser baserade på sekvenseringstekniker med hög kapacitet.

USA: s rätt att veta erhållna dokument genom en offentlig register begär att visa revisioner till dessa studier SRA-data månader efter det att de publicerades. Dessa revisioner är udda eftersom de inträffade efter publicering och utan någon motivering, förklaring eller validering.

Till exempel, Peng Zhou et al. och Lam et al. uppdaterade sina SRA-uppgifter samma två datum. Dokumenten förklarar inte varför de ändrade sina uppgifter, bara att vissa ändringar gjordes. Xiao et al. gjort många ändringar till deras SRA-data, inklusive borttagning av två datamängder den 10 mars, tillägg av en ny datamängd den 19 juni, en ersättning den 8 november av data som först släpptes den 30 oktober och en ytterligare dataändring den 13 november - två dagar efter Natur lade till en redaktörs "not av bekymmer" om studien. Hong Zhou et al. har ännu inte delat hela SRA-datasetet som möjliggör oberoende verifiering. Medan tidskrifter gillar Natur kräva att författare gör alla uppgifter ”omedelbart tillgänglig”Vid tidpunkten för publicering kan SRA-data släppas efter offentliggörande; men det är ovanligt att göra sådana ändringar månader efter publicering.

Dessa ovanliga ändringar av SRA-data gör inte automatiskt de fyra studierna och deras tillhörande datamängder opålitliga. Förseningarna, luckorna och förändringarna i SRA-data har dock hindrat oberoende montering och verifiering av de publicerade genomssekvenserna och lägga till frågor och oro handla om de giltighet av de fyra studierna, såsom:

 1. Vilka var de exakta revisionerna av SRA-uppgifterna efter publiceringen? Varför skapades de? Hur påverkade de associerade genomiska analyser och resultat?
 2. Validerades dessa Vägverkets revisioner oberoende? Om så är fallet, hur? De NCBI: s enda validering kriterium för att publicera ett SRA BioProject - utöver grundläggande information som ”organismens namn” - är att det inte kan vara ett duplikat.

För mer information: 

Vårt National Center for Biotechnology Information (NCBI) dokument finns här: NCBI-e-postmeddelanden (63 sidor)

USAs rätt att veta publicerar dokument från våra offentliga registerförfrågningar för vår utredning av biohazards. Ser: FOI-dokument om ursprunget till SARS-CoV-2, risker med forskning om vinnande funktion och biosäkerhetslaboratorier.

Bakgrundssida om USA: s rätt att veta undersökning av ursprunget till SARS-CoV-2.

Giltigheten hos nyckelstudier om koronavirus är i tvivel; vetenskapliga tidskrifter som undersöker

Skriva ut E-post Dela Tweeta

Av Carey Gillam

Eftersom den utbrott av COVID-19 i den kinesiska staden Wuhan i december 2019 har forskare letat efter ledtrådar om vad som ledde till framväxten av dess orsakande medel, det nya koronaviruset SARS-CoV-2. Att avslöja källan till SARS-CoV-2 kan vara avgörande för att förhindra framtida utbrott.

En serie av fyra hög profil studier publicerades tidigare i år gav vetenskaplig tro på hypotesen att SARS-CoV-2 härstammar från fladdermöss och sedan hoppade till människor genom en typ av anteater som kallas en pangolin - bland världens mest trafikerade vilda djur. Medan det specifik teori med pangoliner har varit till stor del diskonteradefortsätter de fyra studier som kallas "pangolinpapper" att stödja uppfattningen att coronavirus nära besläktade med SARS-CoV-2 cirkulera i naturen, vilket betyder att SARS-CoV-2 som orsakade COVID-19 kommer troligen från en vildkälla. 

Fokuset på en vildkällkälla, den "zoonotiska" teorin, har blivit ett kritiskt element i global diskussion om viruset och riktar allmänhetens uppmärksamhet bort från möjligheten att viruset kan ha sitt ursprung inne i ett kinesiskt statligt laboratorium - Den Wuhan Institute of Virology.

US Right to Know (USRTK) har dock lärt sig att två av de fyra artiklarna som utgör grunden för den zoonotiska teorin verkar vara bristfälliga och att redaktörerna vid de tidskrifter där tidningarna publicerades - PLoS-patogener och Natur - undersöker kärndata bakom studierna och hur data analyserades. De andra två verkar också drabbas av brister.

Problemen med forskningsdokumenten väcker "allvarliga frågor och oro" om giltigheten av den zoonotiska teorin totalt, enligt Dr Sainath Suryanarayanan, en biolog och vetenskaps sociolog, och USRTK personal forskare.  Studierna saknar tillräckligt tillförlitliga data, oberoende verifierbara datamängder och en transparent peer review och redaktionell process, enligt Dr Suryanarayanan. 

Se hans e-postmeddelanden med seniorförfattare av tidningarna och tidskriftsredaktörer och analys: Natur och PLoS-patogener undersöker vetenskapliga riktigheten hos nyckelstudier som kopplar pangolin coronavirus till ursprunget till SARS-CoV-2.

Kinesiska myndigheter först främjade idén att källan till orsakssubstansen för COVID-19 hos människor kom från ett vilddjur i december. Kinesiska regeringsstödda forskare stödde sedan den teorin i fyra separata studier som lämnades in i tidskrifterna mellan 7 och 18 februari.

Världshälsoorganisationens gemensamma uppdragsteam i Kina undersöker framväxten och spridningen av COVID-19 i Kina anges i februari : "Eftersom COVID-19-viruset har en genomidentitet på 96% till ett SARS-liknande koronavirus och 86% -92% till ett SARS-liknande coronavirus av pangolin, är en djurkälla för COVID-19 mycket troligt." 

Det kinesiskt initierade fokuset på en vildkälla hjälpte till att kyla samtal för en utredning av Wuhan Institute of Virologydär koronavirus från djur länge har lagrats och genetiskt manipulerats. Istället har det internationella vetenskapliga och politiska beslutssamhällets resurser och ansträngningar varit kanaliseras för att förstå de faktorer som skapar kontakt mellan människor och vilda djur. 

De fyra artiklarna i fråga är Liu et al., Xiao et al. , Lam et al. och Zhang et al. De två som för närvarande undersöks av tidningsredaktörerna är Liu et al och Xiao et al. I kommunikation med författarna och tidskriftsredaktörerna för dessa två artiklar har USRTK lärt sig om allvarliga problem med publiceringen av dessa studier, inklusive följande:    

 • Liu et al. publicerade eller delade inte (på begäran) råa och / eller saknade data som skulle göra det möjligt för experter att självständigt verifiera sina genomiska analyser.
 • Redaktörer på båda Natur och PLoS-patogener, liksom professor Stanley Perlman, redaktören för Liu et al., har erkänt i e-postkommunikation att de är medvetna om allvarliga problem med dessa tidningar och att tidskrifterna undersöker dem. Ändå har de inte offentliggjort de potentiella problemen med tidningarna.  

Tystningen i tidskrifterna angående deras pågående utredningar innebär att större samhällen av forskare, politiska beslutsfattare och allmänheten som påverkas av COVID-19 är omedvetna om problemen i samband med forskningsdokumenten, säger Dr Suryanarayanan. 

"Vi tror att dessa frågor är viktiga, eftersom de kan forma hur institutioner reagerar på en katastrofal pandemi som har radikalt påverkat liv och försörjning över hela världen," sa han.

Länkar till dessa e-postmeddelanden finns här: 

I juli 2020, USAs rätt att veta började skicka in offentliga registerförfrågningar i jakten på data från offentliga institutioner i ett försök att upptäcka vad som är känt om ursprunget till det nya koronaviruset SARS-CoV-2, som orsakar sjukdomen Covid-19. Sedan början av utbrottet i Wuhan har SARS-CoV-2 dödat mer än en miljon människor, medan de sjuksköter miljoner till i en global pandemi som fortsätter att utvecklas.

På november 5, USAs rätt att veta väckte en rättegång mot National Institutes of Health (NIH) för brott mot bestämmelserna i Freedom of Information Act. Rättegången, inlämnad vid US District Court i Washington, DC, söker korrespondens med eller om organisationer som Wuhan Institute of Virology och Wuhan Center for Disease Control and Prevention, samt EcoHealth Alliance, som samarbetade med och finansierade Wuhan Institute of Virologi.

US Right to Know är en ideell forskningsgrupp som fokuserar på att främja öppenhet för folkhälsan. Du kan stödja vår forskning och rapportering genom att donera här. 

Natur och PLoS-patogener undersöker vetenskaplig riktighet hos nyckelstudier som kopplar pangolin coronavirus till ursprunget till SARS-CoV-2

Skriva ut E-post Dela Tweeta

Anmäl dig till få uppdateringar från Biohazards Blog.

Av Sainath Suryanarayanan, doktor 

Här tillhandahåller vi våra e-postmeddelanden med seniorförfattare av Liu et al. och Xiao et al.och redaktörerna för PLoS-patogener och Natur. Vi presenterar också en fördjupad diskussion om de frågor och problem som tas upp i dessa e-postmeddelanden, vilket tvivlar på giltigheten av dessa nyckelstudier om ursprunget till det nya koronaviruset SARS-CoV-2 som orsakar COVID-19. Se vår rapportering om dessa e-postmeddelanden, Giltigheten hos nyckelstudier om koronavirus är i tvivel; vetenskapliga tidskrifter som undersöker (11.9.20)


E-postkommunikation med Dr. Jinping Chen, seniorförfattare till Liu et al:


Dr. Jinping Chens e-postmeddelanden väcker ett antal problem och frågor: 

1– Liu et al. (2020) samlade sin publicerade pangolin coronavirus-genomssekvens baserad på coronavirus samplade från tre pangoliner, två prover från ett smugglat parti i mars 2019 och ett prov från en annan batch som fångades upp i juli 2019. National Center for Biotechnology Information (NCBI) databas , där forskare måste deponera sekvensdata för att säkerställa oberoende verifiering och reproducerbarhet av publicerade resultat, innehåller sekvensläst arkivdata (SRA) för de två mars 2019-proverna men saknar data för juli 2019-provet. När han frågades om detta saknade prov, som Dr. Jinping Chen identifierar som F9, uppgav Dr. Jinping Chen: ”Rådata för dessa tre prover kunde hittas under NCBI: s anslutningsnummer PRJNA573298, och BioSample ID var SAMN12809952, SAMN12809953 och SAMN12809954, dessutom, individ (F9) från olika satser var också positiv, rådata kan ses i NCBI SRA SUB 7661929, som släpps snart för vi har ytterligare en MS (under granskning)”(Vår betoning).

Det gäller Liu et al. har inte publicerat data som motsvarar en av de tre pangolinsproverna som de använde för att samla sin pangolin coronavirus-genomsekvens. Dr. Jinping Chen delade inte heller dessa uppgifter när han blev tillfrågad. Normen inom vetenskapen är att publicera och / eller dela all data som gör det möjligt för andra att självständigt verifiera och återge resultaten. Hur gjorde PLoS-patogener låt Liu et al. undvika att publicera viktiga exempeldata? Varför delar Dr. Jinping Chen inte data som hör till detta tredje pangolinprov? Varför skulle Liu et al. Vill du släppa opublicerade uppgifter om detta tredje pangolinprov som en del av en annan studie som har skickats till en annan tidskrift? Oron här är att forskare skulle felattributera det saknade pangolinprovet från Liu et al. till en annan studie, vilket gör det svårt för andra att därefter spåra viktiga detaljer om detta pangolinprov, till exempel i vilket sammanhang pangolinprovet samlades in.

2– Dr. Jinping Chen förnekade att Liu et al. har haft någon relation med Xiao et al. (2020) Natur studie. Han skrev: ”Vi skickade in vårt PLOS-patogenpapper den 14 februari 2020 före Nature-papperet (referens 12 i vårt PLOS-patogenpapper, de skickade in den 16 februari 2020 från deras inlämningsdatum i Nature), vårt PLOS-patogenpapper förklara att SARS-Cov-2 inte är direkt från pangolin coronavirus och pangolin inte som mellanliggande värd. Vi kände till deras arbete efter deras nyhetsrapport den 7 februari 2020, och vi har olika åsikter med dem, de andra två artiklarna (Virus och Nature) har listats i PLOS Pathogen-papperet som referenspapper (referensnummer 10 och 12), vi är olika forskargrupper från naturpappersförfattare och det finns ingen relation med varandraoch Vi tog prover med detaljerad provinformation från Guangdong djurlivsredningscenter med hjälp från Jiejian Zou och Fanghui Hou som våra medförfattare och vi vet inte var proverna från Nature-papperet kommer ifrån. ” (våra betoning)

Följande punkter väcker tvivel om Dr. Chens påståenden ovan: 

a– Liu et al. (2020), Xiao et al (2020) och Liu et al. (2019) delade följande författare: Ping Liu och Jinping Chen var författare på 2019 Virus papper och 2020 PLoS-patogener papper, seniorförfattare Wu Chen om Xiao et al. (2020) var medförfattare till 2019 Virus papper, och Jiejian Zhou och Fanghui Hou var författare på både Xiao et al. och Liu et al. 

b– Båda manuskriptet deponerades på den offentliga förtrycksservern bioRxiv samma datum: 20 februari 2020. 

c– Xiao et al. ”Bytt namn på pangolinprover först publicerade av Liu et al. [2019] Virus utan att nämna sin studie som den ursprungliga artikeln som beskrev dessa prover, och använde metagenomiska data från dessa prover i sin analys ”(Chan och Zhan). 

d– Liu et al. är fullständigt genom av pangolin coronavirus 99.95% identiska vid nukleotidnivån till det fullständiga pangolin-coronavirus-genomet publicerat av Xiao et al. Hur kunde Liu et al. har producerat ett helt genom som är 99.95% identiskt (endast ~ 15 nukleotidskillnad) med Xiao et al. utan att dela datamängder och analyser?

När olika forskargrupper oberoende kommer fram till liknande uppsättningar av slutsatser om en given forskningsfråga ökar det sannolikheten för sanningen för de inblandade påståendena. Oron här är att Liu et al. och Xiao et al. utfördes inte oberoende studier enligt Dr. Chen. Var det någon samordning mellan Liu et al. och Xiao et al. om deras analys och publikationer? Om så är fallet, vad var omfattningen och karaktären av den samordningen? 

3– Varför gjorde Liu et al. inte offentliggöra de råa amplikonsekvenseringsdata som de använde för att montera sitt genom av pangolin coronavirus? Utan dessa rådata kan pangolin coronavirus-genomet som samlats av Liu et al., Andra inte oberoende verifiera och reproducera resultaten av Liu et al. Som tidigare nämnts är normen i vetenskapen att publicera och / eller dela all data som gör det möjligt för andra att självständigt verifiera och reproducera resultaten. Vi bad Dr. Jingping Chen att dela Liu et al.: S råa amplikonsekvensdata. Han svarade genom att dela Liu et al.: S RT-PCR-produktsekvensresultat, som inte är de råa amplikondata som används för att montera genomet av pangolin coronavirus. Varför är Dr. Jinping Chen ovillig att släppa rådata som gör det möjligt för andra att självständigt verifiera Liu et al.s analys.

4 Liu et al. Virus (2019) publicerades i oktober 2019 och dess författare hade deponerat sina pangolin coronavirus (sekvensläst arkiv) SRA-data hos NCBI september 23, 2019, men väntade till Januari 22, 2020 för att göra dessa uppgifter offentligt tillgängliga. Forskare släpper vanligtvis råa genomiska sekvensdata på offentligt tillgängliga databaser så snart som möjligt efter publiceringen av sina studier. Denna praxis säkerställer att andra oberoende kan komma åt, verifiera och använda sådan information. Varför gjorde Liu et al. 2019 vänta 4 månader på att göra deras SRA-data offentligt tillgängliga? Dr. Jinping Chen valde att inte svara direkt på denna fråga i vårt svar den 9 november 2020.

Vi kom också i kontakt med Dr. Stanley Perlman, PLoS-patogener Redaktör för Liu et al. och det här var vad han hade att säga.

Framför allt erkände Dr Perlman att:

 • ”PLoS Pathogens undersöker denna uppsats mer detaljerat” 
 • Han ”verifierade inte riktigheten i juli 2019-urvalet under peer review före publicering”
 • ”[C] oro över likheten mellan de två studierna [Liu et al. och Xiao et al.] kom fram när båda studierna hade publicerats. ”
 • Han ”såg inga amplikondata under peer review. Författarna gav ett anslutningsnummer för det sammansatta genomet ... även om det efter publicering kom fram att anslutningsnumret som anges i artikelns datatillgänglighetsförklaring är felaktigt. Det här felet och frågorna kring de råa sekvensuppgifterna för contig behandlas för närvarande som en del av fallet efter publicering. ”

När vi kontaktade PLoS-patogener med våra bekymmer om Liu et al. vi har följande svar från seniorredaktören för PLoS-teamet för publikationsetik:

E-post från Xiao et al.

Den 28 oktober, den Chief Biological Sciences Redaktör för Natur svarade (nedan) med nyckelfrasen "vi tar dessa frågor på allvar och kommer att undersöka ärendet du tar upp mycket noggrant." 

Den 30 oktober förklarade Xiao et al. till sist offentligt släppt deras råa amplikonsekvensdata. Emellertid, från och med publiceringen av denna bit, har amplikonsekvensdata som lämnats in av Xiao et al. saknas de faktiska rådatafilerna som gör det möjligt för andra att montera och verifiera deras pangolin coronavirus genomssekvens.

Viktiga frågor kvarstår som måste tas upp: 

 1. Är pangolin coronavirus riktiga? Bildtexten för Figur 1e i Xiao et al. säger: "Virala partiklar ses i dubbelmembranblåsor i överföringselektronmikroskopbilden taget från Vero E6-cellodling inokulerad med supernatanten av homogeniserad lungvävnad från en pangolin, med morfologi som indikerar koronavirus." Om Xiao et al. isolerade pangolin coronavirus, skulle de dela det isolerade virusprovet med forskare utanför Kina? Detta kan gå långt för att verifiera att detta virus faktiskt existerar och kommer från pangolinvävnad.
 2. Hur tidigt 2020 eller till och med 2019 var Liu et al., Xiao et al., Lam et al. och Zhang et al. medveten om att de skulle publicera resultat baserat på samma dataset?
  a. Fanns det någon samordning med tanke på att en var förtryckt den 18 februari och tre var förtryckta den 20 februari?
  b. Varför gjorde Liu et al. (2019) inte göra deras sekvenslästa arkivdata offentligt tillgängliga samma dag som de deponerade dem på NCBI: s databas? Varför väntade de till den 22 januari 2020 med att offentliggöra denna pangolin coronavirus-sekvensdata.
  c. Innan Liu et al. 2019 Virus data släpptes på NCBI den 22 januari 2020, var dessa uppgifter tillgängliga för andra forskare i Kina? Om så är fallet, vilken databas lagrades sekvenseringsdata för pangolin coronavirus på, vem hade åtkomst och när deponerades och gjordes informationen?
 3. Kommer författarna att samarbeta i en oberoende undersökning för att spåra källan till dessa pangolinprover för att se om fler SARS-CoV-2-liknande virus kan hittas i partier av smugglade djur i mars till juli 2019 - som kan finnas som frysta prover eller vara fortfarande lever i Guangdong Wildlife Rescue Center?
 4. Och kommer författarna att samarbeta i en oberoende utredning för att se om smugglarna (fängslades eller fick böter och släpptes?) Har SARS-virusantikroppar från regelbunden exponering för dessa virus?