Set di dati modificati sollevano ulteriori domande sull'affidabilità degli studi chiave sulle origini del coronavirus

Stampa E-mail Share Tweet

Le revisioni ai set di dati genomici associati a quattro studi chiave sulle origini del coronavirus aggiungono ulteriori domande sull'affidabilità di questi studi, che forniscono un supporto fondamentale per l'ipotesi che SARS-CoV-2 ha avuto origine nella fauna selvatica. Gli studi, Peng Zhou et al., Hong Zhou et al., Lam et al. e Xiao et al., ha scoperto coronavirus correlati alla SARS-CoV-2 nei pipistrelli a ferro di cavallo e nei pangolini malesi.

Gli autori degli studi hanno depositato i dati della sequenza di DNA chiamati letture di sequenza, che hanno usato per assemblare i genomi di pipistrello e pangolino-coronavirus, nel National Center for Biotechnology Information (NCBI) archivio di lettura della sequenza (SRA). L'NCBI ha creato il database pubblico per assistere la verifica indipendente delle analisi genomiche basate su tecnologie di sequenziamento ad alto rendimento.

Il diritto statunitense di conoscere i documenti ottenuti da un registro pubblico lo richiedono mostra revisioni ai dati SRA di questi studi mesi dopo la loro pubblicazione. Queste revisioni sono strane perché sono avvenute dopo la pubblicazione e senza alcuna motivazione, spiegazione o convalida.

Per esempio, Peng Zhou et al. con Lam et al. hanno aggiornato i propri dati SRA nelle stesse due date. I documenti non spiegano perché hanno alterato i loro dati, solo che sono state apportate alcune modifiche. Xiao et al. ha apportato numerose modifiche ai loro dati SRA, inclusa la cancellazione di due set di dati il ​​10 marzo, l'aggiunta di un nuovo set di dati il ​​19 giugno, una sostituzione dell'8 novembre dei dati rilasciati per la prima volta il 30 ottobre e un'ulteriore modifica dei dati il ​​13 novembre - due giorni dopo Natura ha aggiunto una "nota di preoccupazione" del redattore sullo studio. Hong Zhou et al. devono ancora condividere l'intero set di dati SRA che consentirebbe la verifica indipendente. Mentre alle riviste piace Natura richiedere agli autori di rendere tutti i dati "prontamente disponibile”Al momento della pubblicazione, i dati SRA possono essere rilasciati dopo pubblicazione; ma è insolito apportare tali modifiche mesi dopo la pubblicazione.

Queste alterazioni insolite dei dati SRA non rendono automaticamente inaffidabili i quattro studi e i set di dati associati. Tuttavia, i ritardi, le lacune e i cambiamenti nei dati SRA hanno ha ostacolato l'assemblea e la verifica indipendenti delle sequenze genomiche pubblicate e aggiungere a domande con preoccupazioni about i validità dei quattro studi, come:

  1. Quali sono state le esatte revisioni successive alla pubblicazione dei dati SRA? Perché sono stati realizzati? Come hanno influenzato le analisi genomiche e i risultati associati?
  2. Queste revisioni SRA sono state convalidate in modo indipendente? Se é cosi, come? Il L'unica convalida dell'NCBI Il criterio per pubblicare un SRA BioProject - al di là delle informazioni di base come "nome dell'organismo" - è che non può essere un duplicato.

Per maggiori informazioni: 

Il Centro nazionale per le informazioni biotecnologiche (NCBI) i documenti possono essere trovati qui: E-mail NCBI (pagine 63)

US Right to Know sta pubblicando documenti dalle nostre richieste di archivi pubblici per la nostra indagine sui rischi biologici. Vedere: Documenti FOI sulle origini di SARS-CoV-2, sui rischi della ricerca sul guadagno di funzione e sui laboratori di biosicurezza.

Pagina di sfondo sull'indagine degli Stati Uniti Right to Know sulle origini della SARS-CoV-2.