Autores
M. Arroyo Varela, R. Larrosa Jiménez, R. Bautista Moreno
Introducción
<p>La medicina de precisión se basa en el uso de biomarcadores validados con los que clasificar a los pacientes por su riesgo de padecer una enfermedad, diagnosticarlos, realizar un pronóstico y predecir su respuesta a un tratamiento.</p> <p>Gracias al conocimiento de mutaciones concretas, así como de las rutas metabólicas que se ven afectadas, se pueden ofrecer tratamientos personalizados, como ya sucede con multiples mutaciones (EGFR, BRAF V600E, MET, PIK3, HER2,...), fusiones (ALK, RET, NTRK, ...) o reordenaciones genéticas (ROS1,...).<br /><br /></p>
Metodología
<p>Hemos usado las muestras de tejido tumoral y sano de adenocarcinoma de pulmón proveniente de ocho pacientes del Hospital.</p> <p>Esas muestras han pasado por un flujo de trabajo consistente en su preprocesamiento con la herramienta SeqTrimNext (v2.0.67) para eliminar las lecturas de baja calidad, los adaptadores de secuenciación y cualquier contaminante. Las lecturas útiles fueron mapeadas sobre el genoma humano (versión hg38) utilizando la herramienta STAR (v2.5.3a) . El resultado se indexó con la herramienta samtools (1.13) para poder realizar un acceso rápido a las lecturas alineadas.<br />A continuación se usó la herramienta deepvariant (v1.2.0) ue es una aplicación desarrollada por Google que busca variantes usando métodos de aprendizaje profundo, basados en la conversión tensores de los alineamientos, y en el análisis de esos tensores mediante redes neuronales convolucionales, y que toma como entrada los ficheros de alineamiento del paso anterior y genera como salida los ficheros con las variaciones en formato VCF y gVCF.</p>
Resultados
<p>Tras usar deepvariant y pasar sus resultados por glnexus obtenemos un fichero con las variantes encontradas en tejido sano, en total 1473803 variantes, y otro con las encontradas en tumoral, 1906053 variantes, lo que confirma el conocimiento de que el tejido tumoral presenta múltiples mutaciones respecto al sano.</p> <p>Al unificar esos dos ficheros se generan ficheros donde aparecen las variaciones que aparecen en las muestras sanas, 854628 variantes, otro con las 1286878 variaciones de las tumorales y otro con las variantes en común de ambos grupos, 618960.</p> <p> </p>
Conclusiones
<p>Se ha puesto a punto y comprobado el funcionamiento de un nuevo flujo de trabajo basado en redes neuronales y aprendizaje profundo, y se ha usado para buscar las variaciones presentes en las muestras sanas y tumorales de 8 pacientes de adenocarcinoma. Se han encontrado los genes que presentan mutaciones patogénicas, lo que podría ayudar en tratamientos de medicina personalizada.</p> <p> </p>