Los conjuntos de datos alterados plantean más preguntas sobre la confiabilidad de los estudios clave sobre los orígenes del coronavirus

Correo electrónico Compartir Tweet

Las revisiones de los conjuntos de datos genómicos asociados con cuatro estudios clave sobre los orígenes del coronavirus añaden más preguntas sobre la confiabilidad de estos estudios, que brindan un apoyo fundamental para la hipótesis que el SARS-CoV-2 se originó en la vida silvestre. Los estudios, Peng Zhou y col.., Hong Zhou y col.., Lam y col., y Xiao y col., descubrió los coronavirus relacionados con el SARS-CoV-2 en murciélagos de herradura y pangolines malayos.

Los autores de los estudios depositaron datos de secuencia de ADN llamados lecturas de secuencia, que utilizaron para ensamblar genomas de coronavirus de murciélago y pangolín, en el Centro Nacional de Información Biotecnológica (NCBI) secuencia de lectura de archivo (SRA). NCBI estableció la base de datos pública para ayudar a la verificación independiente de análisis genómicos basados ​​en tecnologías de secuenciación de alto rendimiento.

US Right to Know obtuvo documentos mediante una solicitud de registros públicos que mostrar revisiones a los datos de SRA de estos estudios meses después de su publicación. Estas revisiones son extrañas porque ocurrieron después de la publicación y sin ningún fundamento, explicación o validación.

Por ejemplo, los Peng Zhou y col. e Lam y col. actualizaron sus datos SRA en las mismas dos fechas. Los documentos no explican por qué alteraron sus datos, solo que se hicieron algunos cambios. Xiao y col. hizo numerosos cambios a sus datos de SRA, incluida la eliminación de dos conjuntos de datos el 10 de marzo, la adición de un nuevo conjunto de datos el 19 de junio, un reemplazo del 8 de noviembre de los datos publicados por primera vez el 30 de octubre y un cambio de datos adicional el 13 de noviembre - dos días después Naturaleza agregó una "nota de preocupación" del editor sobre el estudio. Hong Zhou y col. aún tienen que compartir el conjunto de datos completo de la SRA que permitiría una verificación independiente. Mientras que las revistas como Naturaleza exigir a los autores que realicen todos los datos "disponible de inmediato”En el momento de la publicación, los datos de la SRA pueden publicarse después publicación; pero es inusual hacer tales cambios meses después de la publicación.

Estas alteraciones inusuales de los datos de la SRA no hacen automáticamente que los cuatro estudios y sus conjuntos de datos asociados sean poco fiables. Sin embargo, los retrasos, lagunas y cambios en los datos de la SRA han obstaculizado el montaje y la verificación independientes de las secuencias del genoma publicadas, y agregar a preguntas e preocupaciones sobre nosotros el validez de los cuatro estudios, tales como:

  1. ¿Cuáles fueron las revisiones exactas posteriores a la publicación de los datos de la SRA? ¿Por qué se hicieron? ¿Cómo afectaron los análisis y resultados genómicos asociados?
  2. ¿Se validaron de forma independiente estas revisiones de la SRA? ¿Si es así, cómo? los La única validación de NCBI El criterio para publicar un Bioproyecto de SRA, más allá de información básica como “nombre del organismo”, es que no puede ser un duplicado.

Para más información: 

La Centro Nacional de Información Biotecnológica (NCBI) los documentos se pueden encontrar aquí: Correos electrónicos de NCBI (Páginas 63)

US Right to Know está publicando documentos de nuestras solicitudes de registros públicos para nuestra investigación de peligros biológicos. Ver: Documentos de FOI sobre los orígenes del SARS-CoV-2, los peligros de la investigación de ganancia de función y los laboratorios de bioseguridad.

Página de fondo sobre la investigación de US Right to Know sobre los orígenes del SARS-CoV-2.