Perfil taxonómico y funcional de microbiomas usando MG7

La metagenómica ha supuesto un importante desafío para la bioinformática. La computación en la nube permite afrontar el análisis de datos masivos (Big Data) y proporciona una computación escalable en tiempo real para el análisis de datos de microbiomas. Te ofrecemos un análisis rápido y completo de datos masivos, desde el análisis de secuencias 16S al  análisis de perfiles funcionales en muestras complejas de metagenómica shotgun. 

Era7 Bioinformatics está trabajando intensamente en el análisis de datos de microbiomas. Nosotros adaptamos nuestro servicio de análisis a los requerimientos y características de cada proyecto y diseñamos soluciones para objetivos específicos como la detección de genes con funcionalidades específicas o actividades enzimáticas, o como la comparación de comunidades o la detección de diferencias antes y despues de un tratamiento o los cambios en la abundancia de determinadas especies en diferentes condiciones ambientales o el análisis de rutas metabólicas.

¿Qué es MG7?

MG7 es una herramienta de análisis de datos de metagenómica muy completa desarrollada por Era7 Bioinformatics para la asignación taxonómica de grandes conjuntos de secuencias. Las pipelines de MG7 estan en un proceso continuo de actualización incorporando las más nuevas aproximaciones para analizar datos de metagenómica.

DB7: Nuestra base de datos de secuencias de referencia

Hemos constuido nuestra propia base de datos de secuencias de referencia basada en RNAcentral release 5. RNAcentral es una base de datos general que incluye todos los tipos de RNA no codificante. Está mantenida por el  RNAcentral Consortium: 

 

Nuestra base de datos DB7 incluye secuencias 16S y 18S de las más importantes bases de datos de metagenómica:

  • Silva
  • GreenGenes
  • RDP
  • ENA
  • RefSeq

Hemos refinado manualmente la base de datos y hemos diseñado aproximaciones sistemáticas de curación que permitirán realizar una curación rápida de las próximas reñeases de RNAcentral.

Asignación taxonómica exhaustiva

Nosotros comparamos cada read contra todas las secuencias de nuestra base de datos DB7 (ver arriba). La asignación taxonómica de cada read está basada en los resultados de BLASTN de cada read frente a nuestra base de datos DB7 de secuencias 16S y 18S.

MG7 hace una asignación específica para cada read evitando cualquier tipo de binning o clusterización. Algunos métodos hacen una asignación menos exhausitiva ya que sólo la read representante de cada cluster es la que se asigna a un taxón. La asignación directa de cada read hecha por similitud a una secuencia de referencia, asignando una por una, es un método muy exhaustivo de asignación que da muy buenos resultados siempre que la base de datos de referencia sea suficientemente amplia [Segata-2013] [Morgan-2012].

Uitilzamos 2 métodos diferentes de asignación taxonómica: Best Blast Hit (BBH) y Lowest Common Ancestor (LCA).

Best Blast Hit (BBH) 

La asignación taxonómica está basada en el Best BLAST Hit obtenido haciendo un BLASTN de cada read frente a nuestrabase de datos DB7.

Cada read es asignada al taxón correspondiente al best BLAST Hit. Sólo los hits por encima de un umbral de similitud y con una región alineada por encima de un porcentaje de la read son considerados. Despues de seleccionar todos los hits con el máximo porcentaje de identidad asignamos al taxón correspondiente al hit com mayor bitscore

Los parámetros pueden adaptarse para cada proyecto dependiendo de la longitud de las reads, del porcentaje de error de cada tecnología e incluso en lo poco conocidos que sean los organismos que se espera encontra en la muestra.

Lowest Common Ancestor (LCA)

En este caso la signación taxonómica está basada en el paradigma de Lowest Common Ancestor. Los hits se filtran del mismo modo que para la asignación BBH seleccionando igualmente aquellos con el máximo porcentaje de identidad pero en este caso para ese conjunto de hits buscamos el Lowest Common Ancestor. 

El paradigma LCA de asignación ha sido adoptado por herramientas de análisis de datos de metagenómica avanzadas como MEGAN [Huson–2013]. 

Pasos del doble proceso de asignación

Para cada read estos son los pasos que se realizan:

  • Seleccionatr todos los hits con qcovs (porcentaje de la secuencia query alineada a la secuecnia subject) por encima del umbral
    • Seleccionar los hits con el máximo perc_identity (porcentaje de identidad) obtenido para esa read
      • LCA: Para cada read calcular el Lowest Common Ancestor sensu stricto para las taxa de los hits que alcanzaron ese máximo perc_identity
      • BBH: Para cada read seleccionar el Best BLAST Hit con el mayor bitscore entre esos Hits que alcanzaron el máximo perc_identity
Lowest Common Ancestor Algorithm of assignment used in MG7

Pasos del proceso de análisis de MG7

Las reads se analizan siguiendo un complejo proceso de análisis usando métodos avanzados de paralelización en la nube utilizando las posibilidades de infrestructuras en la nube que aporta el uso de AWS (Amazon Web Services).

En este proceso cada read se asigna a un taxon basádose en la similitud con secuencias de la base de datos. MG7 orquesta las tareas masivas de BLAST y ejecuta los algoritmos de asignación en paralelo y de determinación de frecuencias utilizando el árbol de la taxonomía de la base de datos de grafos Bio4j. (Ver MG7 preprint in http://biorxiv.org/content/early/2015/09/28/027714).

 

Steps of the taxonomic assignment process in MG7 microbiome analysis tool developed by Era7

 


 

Aplicaciones del microbioma

La secuenciación tradicional del genoma microbiano se realizaba con cultivos clonales, pero esta nueva era de la genómica está haciendo frente a un nuevo desafío: el análisis metagenómico.

El análisis genómico de las comunidades microbianas que se encuentran en una muestra del entorno es una de las aplicaciones de los datos de Next Generation Sequencing, tanto en el caso de la metagenómica de amplicones 16S o 18S, o shotgun.

El número de publicaciones sobre microbiomas crece exponencialmente y todo apunta a que estamos asisitiendo a una nueva etapa postgenómica que podríamos llamar la era del microbioma.

Haz click sobre cada área del panel para ver publicaciones recientes sobre microbioma en esa área de conocimiento:

Metagenomics application areas Metagenomics in veterinary Metagenomics in Environmental Sciences Metagenomics in Crop Sciences Metagenomics in agrifood sector Biotechnology and drug discovery Microbiome and infections Microbiome and diseases Microbiome influence in health


 

Visualizaciones interactivas de datos de metagenómica

.El servicio MG7 aporta Informes personalizados para cada proyecto y gráficos de muchos tipos con la posibilidad de visualizaciones interactivas:


 

Pregunta por este servicio por e-mail

  • info@era7.com

o rellenando el siguiente formulario:



Introduzca el texto que aparece en la imagen
* Campos obligatorios.