Endrede datasett reiser flere spørsmål om påliteligheten til viktige studier av koronavirusopprinnelse

Skrive ut E-post Del Tweet

Revisjoner av genomiske datasett assosiert med fire viktige studier av koronavirusopprinnelse, legger til ytterligere spørsmål om påliteligheten til disse studiene, som gir grunnleggende støtte for hypotesen at SARS-CoV-2 stammer fra dyrelivet. Studiene, Peng Zhou et al., Hong Zhou et al., Lam et al.og Xiao et al., oppdaget SARS-CoV-2-relaterte koronavirus i hestesko-flaggermus og malaysiske pangoliner.

Studienes forfattere deponerte DNA-sekvensdata kalt sekvensen lyder, som de brukte til å samle bat- og pangolin-coronavirus-genomer, i National Center for Biotechnology Information (NCBI) sekvenslest arkiv (SRA). NCBI opprettet den offentlige databasen for å hjelpe uavhengig verifisering av genomiske analyser basert på sekvenseringsteknologier med høy gjennomstrømning.

USAs rett til å få innhentede dokumenter ved en offentlig registrering ber om at Vis revisjoner til disse studienes SRA-data måneder etter at de ble publisert. Disse revisjonene er rare fordi de skjedde etter publisering, og uten noen begrunnelse, forklaring eller validering.

For eksempel, Peng Zhou et al. og Lam et al. oppdaterte SRA-dataene sine på de samme to datoene. Dokumentene forklarer ikke hvorfor de endret dataene sine, bare at det ble gjort noen endringer. Xiao et al. gjort mange endringer til deres SRA-data, inkludert sletting av to datasett 10. mars, tillegg av et nytt datasett 19. juni, en 8. november erstatning av data som først ble utgitt 30. oktober, og en ytterligere dataendring 13. november - to dager etter Natur la til en redaktørs "note of concern" om studien. Hong Zhou et al. har ennå ikke delt hele SRA-datasettet som muliggjør uavhengig verifisering. Mens tidsskrifter liker Natur kreve at forfattere lager alle data “umiddelbart tilgjengelig”På publiseringstidspunktet kan SRA-data frigjøres etter utgivelse; men det er uvanlig å gjøre slike endringer måneder etter publisering.

Disse uvanlige endringene av SRA-data gjør ikke automatisk de fire studiene og tilhørende datasett upålitelige. Imidlertid har forsinkelsene, hullene og endringene i SRA-dataene det hindret uavhengig montering og verifisering av de publiserte genom-sekvensene, og legger til spørsmål og bekymringer handle om de gyldighet av de fire studiene, for eksempel:

  1. Hva var de nøyaktige revisjonene av SRA-dataene etter publisering? Hvorfor ble de laget? Hvordan påvirket de tilhørende genomiske analyser og resultater?
  2. Ble disse SRA-revisjonene validert uavhengig? I så fall hvordan? De NCBIs eneste validering kriterium for å publisere et SRA BioProject - utover grunnleggende informasjon som "organismenavn" - er at det ikke kan være et duplikat.

For mer informasjon

De Nasjonalt senter for informasjon om bioteknologi (NCBI) dokumenter finner du her: NCBI-e-post (63 sider)

US Right to Know legger ut dokumenter fra våre offentlige arkivforespørsler for vår biohazard-etterforskning. Se: FOI-dokumenter om opprinnelsen til SARS-CoV-2, farer ved forskning og biosikkerhetslaboratorier.

Bakgrunnsside om US Right to Know etterforskning av opprinnelsen til SARS-CoV-2.

Gyldigheten av nøkkelstudier om opprinnelse til koronavirus i tvil; vitenskapelige tidsskrifter som undersøker

Skrive ut E-post Del Tweet

Av Carey Gillam

Siden utbrudd av COVID-19 i den kinesiske byen Wuhan i desember 2019 har forskere søkt etter ledetråder om hva som førte til fremveksten av dets forårsakende middel, romanen coronavirus SARS-CoV-2. Å avdekke kilden til SARS-CoV-2 kan være avgjørende for å forhindre fremtidige utbrudd.

En serie av fire høy profil studier publisert tidligere i år ga vitenskapelig tro på hypotesen om at SARS-CoV-2 stammer fra flaggermus og deretter hoppet til mennesker gjennom en type anteater kalt en pangolin - blant verdens mest trafikkerte ville dyr. Mens det spesifikk teori involverer pangolins har vært stort sett diskontertfortsetter de fire studiene kjent som “pangolin-papirene” å støtte oppfatningen om at coronavirus er nært knyttet til SARS-CoV-2 sirkulere i naturen, som betyr at SARS-CoV-2 som forårsaket COVID-19, sannsynligvis kommer fra en villkilde. 

Fokuset på en villkildekilde, den "zoonotiske" teorien, har blitt et kritisk element i global diskusjon om viruset, og rettet allmenn oppmerksomhet bort fra muligheten at viruset kan ha sitt utspring inne i et kinesisk statlig laboratorium - Den Wuhan Institute of Virology.

US Right to Know (USRTK) har imidlertid lært at to av de fire papirene som utgjør grunnlaget for den zoonotiske teorien ser ut til å være feil, og at redaksjonen ved tidsskriftene der papirene ble publisert - PLoS patogener og Natur - undersøker kjernedataene bak studiene og hvordan dataene ble analysert. De to andre ser også ut til lider av mangler.

Problemene med forskningsoppgavene reiser "alvorlige spørsmål og bekymringer" om gyldigheten av den zoonotiske teorien generelt, ifølge Dr. Sainath Suryanarayanan, en biolog og vitenskapssosiolog, og USRTK personalforsker.  Studiene mangler tilstrekkelig pålitelige data, uavhengig verifiserbare datasett og en gjennomsiktig fagfellevurdering og redaksjonell prosess, ifølge Dr. Suryanarayanan. 

Se e-postene hans med seniorforfattere av papirene og tidsskriftredaktører, og analyse: Natur og PLoS Patogener undersøker vitenskapelig sannhet i viktige studier som knytter pangolin coronavirus til opprinnelsen til SARS-CoV-2.

Kinesiske myndigheter først fremmet ideen at kilden til årsaksmidlet for COVID-19 hos mennesker kom fra et vilt dyr i desember. Kinesiske regjeringsstøttede forskere støttet deretter teorien i fire separate studier som ble sendt til tidsskriftene mellom 7. og 18. februar.

Verdens helseorganisasjons Kina Joint Mission Team som undersøker fremveksten og spredningen av COVID-19 i Kina oppgitt i februar : "Siden COVID-19-viruset har en genomidentitet på 96% til et flaggermus-SARS-lignende coronavirus og 86% -92% til et pangolin-SARS-lignende coronavirus, er en dyrekilde for COVID-19 høyst sannsynlig." 

Det kinesiskinitierte fokuset på en villkilde hjalp til med å slappe av samtaler for en etterforskning av Wuhan Institute of Virology, hvor koronavirus fra dyr lenge har blitt lagret og genetisk manipulert. I stedet har det internasjonale vitenskapelige og politiske beslutningssamfunnet vært ressurser og innsats kanaliseres mot forståelse av faktorene som former kontakten mellom mennesker og dyreliv. 

De fire papirene det er snakk om er Liu et al., Xiao et al. , Lam et al. og Zhang et al. De to som for tiden etterforskes av tidsskriftredaktørene er Liu et al og Xiao et al. I kommunikasjon med forfatterne og tidsskriftredaktørene for disse to papirene, har USRTK lært om alvorlige problemer med publiseringen av disse studiene, inkludert følgende:    

  • Liu et al. ikke publiserte eller delte (etter å ha blitt spurt) rå og / eller manglende data som gjorde det mulig for eksperter å uavhengig verifisere sine genomiske analyser.
  • Redaktører på begge Natur og PLoS patogener, i tillegg til professor Stanley Perlman, redaktøren av Liu et al., har i e-postkommunikasjon erkjent at de er klar over alvorlige problemer med disse papirene, og at tidsskriftene undersøker dem. Likevel har de ikke offentliggjort de potensielle problemene med papirene.  

Taushetens stillhet angående deres pågående undersøkelser betyr at større samfunn av forskere, beslutningstakere og publikum som er påvirket av COVID-19, ikke er klar over problemene knyttet til forskningsartiklene, sa Dr. Suryanarayanan. 

"Vi mener at disse spørsmålene er viktige, siden de kan forme hvordan institusjoner reagerer på en katastrofal pandemi som har påvirket liv og levebrød over hele verden radikalt," sa han.

Lenker til disse e-postmeldingene finner du her: 

I juli 2020, US Right to Know begynte å sende inn offentlige forespørsler i jakten på data fra offentlige institusjoner i et forsøk på å oppdage hva som er kjent om opprinnelsen til romanen coronavirus SARS-CoV-2, som forårsaker sykdommen Covid-19. Siden begynnelsen av utbruddet i Wuhan har SARS-CoV-2 drept over en million mennesker, mens de sykeliggjør flere i en global pandemi som fortsetter å utfolde seg.

På november 5, USAs rett til å vite inngav søksmål mot National Institutes of Health (NIH) for brudd på bestemmelsene i Freedom of Information Act. Søksmål, arkivert i US District Court i Washington, DC, søker korrespondanse med eller om organisasjoner som Wuhan Institute of Virology og Wuhan Center for Disease Control and Prevention, samt EcoHealth Alliance, som samarbeidet med og finansierte Wuhan Institute of Virologi.

US Right to Know er en ideell etterforskningsgruppe med fokus på å fremme åpenhet for folkehelsen. Du kan støtte vår forskning og rapportering ved å donere her. 

Natur og PLoS Patogener undersøker vitenskapelig sannhet i nøkkelstudier som knytter pangolin coronavirus til opprinnelsen til SARS-CoV-2

Skrive ut E-post Del Tweet

Registrer deg for å motta oppdateringer fra Biohazards Blog.

Av Sainath Suryanarayanan, PhD 

Her gir vi e-postene våre med seniorforfattere av Liu et al. og Xiao et al., og redaksjonen av PLoS patogener og Natur. Vi presenterer også en grundig diskusjon av spørsmålene og bekymringene som er reist av disse e-postmeldingene, som tviler på gyldigheten av disse nøkkelstudiene om opprinnelsen til det nye coronavirus SARS-CoV-2 som forårsaker COVID-19. Se rapporteringen vår om disse e-postene, Gyldigheten av nøkkelstudier om opprinnelse til koronavirus i tvil; vitenskapelige tidsskrifter som undersøker (11.9.20)


E-postkommunikasjon med Dr. Jinping Chen, seniorforfatter av Liu et al:


Dr. Jinping Chens e-postmeldinger reiser en rekke bekymringer og spørsmål: 

1– Liu et al. (2020) samlet sin publiserte pangolin coronavirus-genomssekvens basert på coronavirus samplet fra tre pangoliner, to prøver fra en smuglet batch i mars 2019, og en prøve fra en annen batch fanget opp i juli 2019. National Center for Biotechnology Information (NCBI) database , der forskere er pålagt å deponere sekvensdata for å sikre uavhengig verifisering og reproduserbarhet av publiserte resultater, inneholder SRA-data (sequence read archive) for de to mars 2019-prøvene, men mangler data for juli 2019-prøven. Etter å ha blitt spurt om dette manglende prøven, som Dr. Jinping Chen identifiserer som F9, uttalte Dr. Jinping Chen: "Rådataene til disse tre prøvene ble funnet under NCBI-tiltredelsesnummer PRJNA573298, og BioSample ID var SAMN12809952, SAMN12809953, og SAMN12809954, dessuten, individ (F9) fra forskjellige batcher var også positiv, rådataene kan sees i NCBI SRA SUB 7661929, som snart vil bli utgitt for vi har en ny MS (under gjennomgang)”(Vår vektlegging).

Det gjelder at Liu et al. har ikke publisert data som tilsvarer 1 av de 3 pangolinprøvene som de brukte til å samle deres pangolin coronavirus-genomssekvens. Dr. Jinping Chen delte heller ikke disse dataene etter å ha blitt spurt. Normen i vitenskapen er å publisere og / eller dele alle data som gjør det mulig for andre å uavhengig verifisere og reprodusere resultatene. Hvordan gjorde PLoS patogener la Liu et al. unngå å publisere viktige eksempeldata? Hvorfor deler ikke Dr. Jinping Chen data knyttet til denne tredje pangolinprøven? Hvorfor skulle Liu et al. ønsker å frigjøre upubliserte data vedrørende denne tredje pangolinprøven som en del av en annen studie som er sendt til en annen journal? Bekymringen her er at forskere ville feilattribuere den manglende pangolinprøven fra Liu et al. til en annen studie, noe som gjør det vanskelig for andre å spore viktige detaljer om denne pangolinprøven, for eksempel konteksten der pangolinprøven ble samlet.

2– Dr. Jinping Chen benektet at Liu et al. har hatt noe forhold til Xiao et al. (2020) Natur studere. Han skrev: “Vi sendte inn PLOS Pathogens-papiret vårt den 14. februar 2020 før Nature-papiret (referansen 12 i vår PLOS-patogenpapir, de sendte inn 16. februar 2020 fra innleveringsdatoen i Nature), vårt PLOS-patogenpapir forklare at SARS-Cov-2 ikke er direkte fra pangolin coronavirus og pangolin ikke som mellomvert. Vi kjente arbeidet deres etter nyhetsopplysningen 7. februar 2020, og vi har forskjellige meninger med dem, de to andre papirene (Virus og natur) er oppført i PLOS Pathogen-papiret som referansepapir (referansenummer 10 og 12), vi er forskjellige forskningsgrupper fra naturpapirforfattere, og det er ikke noe forhold til hverandreog vi tok prøver med detaljert prøveinformasjon fra Guangdong naturredningssenter med hjelp fra Jiejian Zou og Fanghui Hou som våre medforfattere og vi vet ikke hvor prøvene fra Nature-papiret kommer fra. ” (våre vektlegginger)

Følgende punkter reiser tvil om Dr. Chens påstander ovenfor: 

a– Liu et al. (2020), Xiao et al (2020) og Liu et al. (2019) delte følgende forfattere: Ping Liu og Jinping Chen var forfattere på 2019 Virus papir og 2020 PLoS patogener papir, seniorforfatter Wu Chen om Xiao et al. (2020) var medforfatter av 2019 Virus papir, og Jiejian Zhou og Fanghui Hou var forfattere på både Xiao et al. og Liu et al. 

b– Begge manuskriptene ble deponert på den offentlige preprint-serveren bioRxiv på samme dato: 20. februar 2020. 

c– Xiao et al. “Omdøpt til pangolinprøver først publisert av Liu et al. [2019] Virus uten å sitere studien som den opprinnelige artikkelen som beskrev disse prøvene, og brukte metagenomiske data fra disse prøvene i analysen ”(Chan og Zhan). 

d– Liu et al.s fulle pangolin coronavirus genom er 99.95% identisk på nukleotidnivået til hele pangolin coronavirus-genomet publisert av Xiao et al. Hvordan kunne Liu et al. har produsert et helt genom som er 99.95% identisk (bare ~ 15 nukleotidforskjell) med Xiao et al. uten å dele datasett og analyser?

Når forskjellige forskningsgrupper uavhengig kommer til lignende sett med konklusjoner om et gitt forskningsspørsmål, øker det sannsynligheten for sannhet for de involverte påstandene. Bekymringen her er at Liu et al. og Xiao et al. ble ikke uavhengig gjennomført studier som hevdet av Dr. Chen. Var det noen koordinering mellom Liu et al. og Xiao et al. om deres analyse og publikasjoner? Hva var i så fall omfanget og arten av denne koordineringen? 

3– Hvorfor gjorde Liu et al. ikke offentliggjøre de rå amplikonsekvenseringsdataene de brukte til å samle pangolin coronavirus-genomet sitt? Uten disse rådataene, kan pangolin coronavirus-genomet samlet av Liu et al., Andre ikke uavhengig verifisere og reprodusere resultatene fra Liu et al. Som nevnt tidligere, er normen i vitenskapen å publisere og / eller dele alle data som gjør det mulig for andre å uavhengig verifisere og reprodusere resultatene. Vi ba Dr. Jingping Chen dele Liu et al. Sine rå amplikon-sekvensdata. Han svarte med å dele Liu et al .'s RT-PCR produktsekvensresultater, som ikke er de rå amplikondataene som brukes til å montere pangolin coronavirus-genomet. Hvorfor er Dr. Jinping Chen tilbakeholdne med å frigjøre rådataene som gjør det mulig for andre å uavhengig verifisere Liu et al.s analyse.

4- Liu et al. Virus (2019) ble publisert i oktober 2019 og forfatterne hadde deponert SRA-data for pangolin coronavirus (sekvenslest arkiv) hos NCBI september 23, 2019, men ventet til Januar 22, 2020 for å gjøre disse dataene offentlig tilgjengelige. Forskere slipper vanligvis rå genomiske sekvensdata på offentlig tilgjengelige databaser så snart som mulig etter publisering av studiene. Denne praksisen sikrer at andre uavhengig kan få tilgang til, verifisere og bruke slike data. Hvorfor gjorde Liu et al. 2019 vente 4 måneder på å gjøre SRA-dataene sine offentlig tilgjengelige? Dr. Jinping Chen valgte ikke å svare direkte på dette spørsmålet vårt i sitt svar 9. november 2020.

Vi kom også i kontakt med Dr. Stanley Perlman, PLoS patogener Redaktør av Liu et al. og dette var det han hadde å si.

Spesielt erkjente Dr. Perlman at:

  • “PLoS Pathogens undersøker denne artikkelen nærmere” 
  • Han “bekreftet ikke sannheten i juli 2019-prøven under fagfellevurdering før publisering”
  • “[C] bekymringer om likhet mellom de to studiene [Liu et al. og Xiao et al.] kom først frem etter at begge studiene hadde blitt publisert. ”
  • Han “så ingen amplikondata under fagfellevurderingen. Forfatterne oppga et tiltredelsesnummer for det samlede genomet ... selv om det etter publisering kom frem at tiltredelsesnummeret som er oppført i artikkelens datatilgjengelighetserklæring er feil. Denne feilen og spørsmålene rundt dataene for rå sekvensering av konti blir foreløpig behandlet som en del av saken etter publisering. "

Da vi kontaktet PLoS patogener med våre bekymringer om Liu et al. vi fikk følgende svar fra seniorredaktør for PLoS-publikasjonens etiske team:

E-post fra Xiao et al.

28. oktober ble den Chief Biological Sciences Editor of Natur svarte (nedenfor) med nøkkeluttrykket "vi tar disse problemene veldig seriøst og vil se på saken du tar opp veldig nøye." 

30. oktober, Xiao et al. til slutt offentlig utgitt deres rå amplikonsekvensdata. Imidlertid fra og med publiseringen av dette stykket, sendes amplikonsekvensdataene fra Xiao et al. mangler de faktiske rådatafilene som gjør det mulig for andre å montere og verifisere deres pangolin coronavirus-genomssekvens.

Viktige spørsmål gjenstår som må tas opp: 

  1. Er pangolin coronavirus ekte? Teksten til Figur 1e i Xiao et al. sier: "Virale partikler sees i dobbeltmembranblærer i overføringselektronmikroskopibildet tatt fra Vero E6-cellekultur inokulert med supernatanten av homogenisert lungevev fra en pangolin, med morfologi som indikerer koronavirus." Hvis Xiao et al. isolerte pangolin coronavirus, ville de dele den isolerte virusprøven med forskere utenfor Kina? Dette kan gå langt for å verifisere at dette viruset faktisk eksisterer og kommer fra pangolinvev.
  2. Hvor tidlig i 2020, eller til og med 2019, var Liu et al., Xiao et al., Lam et al. og Zhang et al. klar over at de ville publisere resultater basert på samme datasett?
    en. Var det noen koordinering med tanke på at en ble fortrykt 18. februar og tre ble fortrykt 20. februar?
    b. Hvorfor gjorde Liu et al. (2019) ikke gjøre deres sekvensleste arkivdata offentlig tilgjengelig den dagen de deponerte dem på NCBIs database? Hvorfor ventet de til 22. januar 2020 med å offentliggjøre disse pangolin coronavirus-sekvensdataene.
    c. Før Liu et al. 2019 Virus data ble utgitt på NCBI 22. januar 2020, var disse dataene tilgjengelige for andre forskere i Kina? I så fall, hvilken database lagret pangolin coronavirus-sekvenseringsdataene på, hvem hadde tilgang, og når ble dataene deponert og gjort tilgjengelige?
  3. Vil forfatterne samarbeide i en uavhengig undersøkelse for å spore kilden til disse pangolinprøvene for å se om flere SARS-CoV-2-lignende virus kan bli funnet i mars til juli 2019 batcher av smuglede dyr - som kan eksistere som frosne prøver eller være fortsatt i live i Guangdong Wildlife Rescue Center?
  4. Og vil forfatterne samarbeide i en uavhengig undersøkelse for å se om smuglerne (ble de fengslet? Eller bøtelagt og gitt slipp?) Har SARS-virusantistoffer fra regelmessig eksponering for disse virusene?