Características del genoma
El borrador de los genomas de Ophiocordyceps generado en este estudio (Tabla 1) se ensamblaron con lecturas generadas a través de varias ejecuciones de secuenciación utilizando dos tipos de bibliotecas de ADN. Solo se utilizaron para el ensamblaje las ejecuciones que dieron lugar a lecturas de alta calidad (consulte Materiales y métodos). El ensamblaje de Contig dio como resultado tamaños de genoma que oscilaban entre 21,91 y 23,92 millones de pares de bases (Mbp) para O. unilateralis s.l. y O. australis s.l. especies. Por el contrario, O. subramanianii s.l. tenía un tamaño de genoma estimado de 32,31 Mb. La predicción génica arrojó entre 7.621 y 8.629 genes para las especies O. unilateralis y O. australis. Ophiocordyceps subramanianii s.l. se predijo que tenía 11 275 genes. Además, el contenido de GC en O. subramanianii s.l. (es decir, 60,35%) fue mucho mayor en comparación con las otras especies de Ophiocordyceps en este estudio (54,66% + / – 1,57%) (Tabla 1).
También mejoramos el ensamblaje y la predicción de genes del genoma de O publicado anteriormente. unilateralis sl cepa SC16a (Cuadro complementario S1), que ahora ha recibido el nombre de especie O. kimflemingiae 20. Además de estar menos fragmentado, el nuevo conjunto es más pequeño de lo que se informó anteriormente18. Lo más probable es que esto se deba a un mejor ensamblaje de regiones repetitivas, que se encontraron más altas en la especie unilateralis (6.59–6.83%) en comparación con las especies que infectan a otras hormigas en este estudio (Tabla 1). A pesar del tamaño de ensamblaje más pequeño, la nueva predicción de genes aumentó el recuento de genes con 798 genes. Este aumento se debe principalmente a la predicción de menos quimeras (es decir, genes vecinos que se fusionaron incorrectamente en un modelo genético) utilizando la canalización Braker1 (datos no mostrados).
Para todos menos uno de los genomas generados en En este estudio, la predicción de genes se basó en lecturas de RNA-Seq. Para la especie unilateralis norteamericana O. kimflemingiae reportada anteriormente, se utilizaron las lecturas generadas en ese estudio anterior18. Debido a las dificultades para cultivar O. camponoti-rufipedis brasileña, no se obtuvo suficiente material para generar datos de RNA-Seq además de las lecturas de ADN necesarias para obtener un borrador del genoma. Debido a que tanto O. kimflemingiae como O. camponoti-rufipedis residen dentro del mismo complejo de especies (unilateralis), intentamos mapear las lecturas de especies unilateralis de América del Norte en el genoma de O. camponoti-rufipedis para ver si podían usarse para informar la anotación. Sin embargo, mientras que el 93% de las lecturas de O. kimflemingiae se asignan a su propio genoma, solo el 43% se asigna al genoma de O. camponoti-rufipedis (Tabla complementaria S2). Además, asignamos las lecturas a otro O. unilateralis s.l. publicado. genoma, el de O. polyrhachis-furcata 22, para determinar si este sería un efecto de mapeo cruzado más general o específico del genoma de O. camponoti-rufipedis. Resultó un mapeo similar del 41%. Esto sugiere que, en general, las especies de unilateralis podrían tener una relación bastante lejana, lo que hace que el mapeo cruzado para informar la anotación sea menos adecuado. Con fines informativos, también hicimos un mapa cruzado de las especies australis entre sí (cepas MAP-64 de Brasil y 1348a de Ghana). Esto dio como resultado un 71% y 82% de lecturas de mapeo cruzado frente al 86% y 97% mapeado a sus propios genomas, respectivamente (Tabla complementaria S2). Esto implica que las especies en el complejo australis están probablemente mucho más relacionadas entre sí que las especies dentro del complejo unilateralis.
Agrupaciones ortólogas
Nos propusimos investigar qué predicciones genéticas de las especies de Ophiocordyceps que infectan a las hormigas en este estudio probablemente estén conservadas y compartidas con otros ascomicetos. Además, nuestro objetivo era descubrir qué especializaciones específicas de especie y «específicas de manipulación» podrían haber tenido lugar. Como tal, los proteomas predichos de nuestros cinco hongos que infectan hormigas se compararon con los de otros 18 hongos ascomicetos. De estas especies, diez eran animales parásitos (dos mamíferos infectantes, dos nematodos infecciosos y seis insectos infecciosos) y 13 residen en el mismo orden (Hypocreales). Cuatro especies pertenecían a la misma familia (Ophiocordycipitaceae) y dos pertenecían al mismo género (Ophiocordyceps). A La reconstrucción filogenética basada en 67 genes conservados presentes en cada uno de estos organismos se muestra en la Fig. 2.
Un total de 51,012 grupos ortólogos incluyeron todas las proteínas anotadas de cada uno de los 23 ascomicetos incluidos en este análisis (Datos suplementarios S1). Las estadísticas resumidas con respecto a este agrupamiento se pueden encontrar en la Figura complementaria S1. Comparamos la superposición de grupos ortólogos entre tres rangos de especies: 1) los hongos que infectan a las hormigas, que comprendían los cinco genomas en borrador generados en este estudio, 2) los otros hongos que infectan a los insectos, Ophiocordyceps sinensis, Tolypocladium inflatum, tanto Metarhizium como ambas especies de Cordyceps y 3) todos los ascomicetos que no infectan insectos, que incluyen otros hongos que infectan animales, plantas, hongos y saprofitos. Los resultados de este análisis se muestran en el diagrama de Venn de la figura 3a. Posteriormente, realizamos análisis de enriquecimiento para las anotaciones funcionales de genes de especies que infectan hormigas que se encontraron dentro de las diversas partes superpuestas y no superpuestas del diagrama. De los 7931 grupos ortólogos que se encontraron dentro de los tres rangos de especies, las anotaciones de Ontología Genética (GO) para procesos biológicos generales estaban significativamente sobrerrepresentadas. Esto sugiere, como era de esperar, que los ascomicetos con diferentes estilos de vida utilizan mecanismos similares para procesos generales como la transcripción, traducción, transporte de proteínas y transducción de señales. Sin embargo, los genes que se predice que codifican proteínas secretadas (pequeñas), proteínas con anotaciones GO para procesos y patogénesis de múltiples organismos y, más específicamente, enterotoxinas putativas secretadas, estaban subrepresentadas. De hecho, cuando realizamos un análisis de enriquecimiento de las anotaciones presentes en agrupaciones ortólogas que solo se encontraron en las especies que infectan a las hormigas (es decir, 6.672 agrupaciones, Fig. 3a), encontramos el resultado opuesto. Las anotaciones GO para (en gran medida los mismos) procesos biológicos generales estaban significativamente subrepresentadas, mientras que las proteínas secretadas (pequeñas), las proteínas con anotaciones GO para procesos de múltiples organismos y patogénesis, y supuestas enterotoxinas estaban sobrerrepresentadas. Esto sugiere que una parte significativa del secretoma de los hongos que infectan a las hormigas en este estudio es específico para ellos. Esta especificidad apareció en parte debido a las enterotoxinas que son parte del secretoma y las proteínas pequeñas secretadas bioactivas (SSP) que podrían ser importantes en las interacciones entre hongos y hormigas. Las proteínas secretadas (pequeñas) también estaban sobrerrepresentadas entre los grupos que los hongos que infectan a las hormigas compartían exclusivamente con otros entomopatógenos (262 grupos) o no entomopatógenos (449 grupos). Esto indica que sus secretomos también contienen proteínas específicas de entomopatógenos más generales, así como proteínas que se comparten exclusivamente con ascomicetos no entomopatógenos.
También examinamos cómo los racimos ortólogos, que solo se encontraron entre los hongos que infectan hormigas, estaban representados por esas especies (Fig. 3b). Del total de 6.672 conglomerados en esta comparación, el 90,6% parecía ser específico de la especie. La superposición de conglomerados fue, por tanto, marginal a pesar de que todas las especies de este estudio residen dentro del mismo género (Ophiocordyceps) y en algunos casos incluso dentro del mismo complejo de especies (O. unilateralis s.l. y O. australis s.l.). El análisis del enriquecimiento de términos de anotación funcional en estos grupos específicos de especies resultó nuevamente en sobrerrepresentaciones de proteínas secretadas (pequeñas). Aunque marginal, la mayor parte de la superposición de grupos se encontró entre especies más estrechamente relacionadas dentro del mismo complejo (es decir, O. australis s.l., 289 agrupaciones y O. unilateralis s.l., 182 agrupaciones Fig. 3b). También aquí, los análisis de enriquecimiento revelaron una sobrerrepresentación de proteínas secretadas (pequeñas). Por tanto, parece que una cantidad estadísticamente significativa del secretoma fúngico de estas especies que infectan hormigas es complejo o específico de la especie. Además, encontramos una sobrerrepresentación de términos de patogenicidad GO entre los grupos ortólogos específicos del complejo. Este hallazgo podría atribuirse a la presencia de enterotoxinas ortólogas en especies dentro del mismo complejo.Solo cuatro grupos que no estaban presentes en ninguno de los otros ascomicetos en nuestra comparación se compartieron entre las cinco especies que infectan hormigas (Fig. 3b). Ninguno de estos cuatro grupos recibió una anotación funcional, pero tres de ellos contenían genes con señales de secreción predichas. Para tres de los cuatro grupos, un análisis BLASTp de los genes frente a la base de datos del NCBI resultó únicamente en hipotéticos aciertos de proteínas con la versión previamente depositada del genoma de O. kimflemingiae18. Esto indica que estos grupos podrían representar proteínas que son exclusivas de las especies de Ophiocordyceps que infectan hormigas. Las secuencias de proteínas dentro del cuarto grupo dieron como resultado aciertos con metaloproteasas además de alinearse nuevamente con una proteína hipotética de O. kimflemingiae (XA68_3159), (Tabla complementaria S3). Por tanto, este grupo podría contener metaloproteasas putativas que se encuentran únicamente en los genomas de las especies de hongos que infectan hormigas examinadas aquí. Además, solo 2 de los grupos que se encuentran únicamente en los hongos que infectan a las hormigas se compartieron entre las cuatro especies que inducen el comportamiento de picadura (Fig. 3b). Un análisis BLASTp de los genes dentro de estos grupos nuevamente dio como resultado hipotéticos impactos de proteínas con la versión previamente depositada del genoma de O. >
Analizamos la conservación de genes candidatos asociados con el evento de picadura manipulada observado en hormigas infectadas. Utilizamos datos transcriptómicos publicados previamente18 y volvimos a determinar la expresión diferencial de genes mapeando los datos a la nueva versión del genoma de O. kimflemingiae. Según el estudio publicado anteriormente, seguimos el razonamiento de que los genes candidatos, involucrados en el establecimiento de un comportamiento de mordida manipulado, se regularían al alza durante este evento y se regularían rápidamente de nuevo después. Como tal, se identificaron 547 genes candidatos, 49 más de lo informado en el análisis anterior18. De acuerdo con los datos informados anteriormente, los genes implicados en la replicación del ADN, los procesos de oxidación-reducción, la secreción y el metabolismo secundario estaban sobrerrepresentados.
La conservación de genes candidatos a manipulación también se analizó mediante agrupamiento ortólogo. Comparamos la superposición de grupos ortólogos que contienen esos genes candidatos, que fueron significativamente regulados al alza y a la baja después del comportamiento de morder manipulado en O. kimflemingiae, con tres rangos de especies: 1) los otros hongos que infectan a las hormigas, que comprendían los cuatro nuevos proyectos genomas generados en este estudio, 2) los otros hongos que infectan a los insectos, y 3) todos los ascomicetos que no infectan a los insectos que se usaron para comparación anteriormente. Los resultados de este análisis se representan en el Diagrama de Venn de la Fig. 4. De los genes de manipulación candidatos, el 78% parecían ser ortólogos de genes presentes en los otros tres rangos de especies (es decir, 423 agrupaciones, Fig. 4). Esto implica que los genes expresados durante la mordedura manipulada inducida por O. kimflemingiae probablemente no sean específicos de la manipulación. Entre estos genes ampliamente compartidos, los CYP y otras funciones relacionadas con la oxidación-reducción estaban sobrerrepresentadas, así como los genes que codifican proteínas y proteasas secretadas. Varias anotaciones de metabolismo secundario (grupos 7, 8 y 9) también estaban sobrerrepresentadas entre estos grupos ortólogos más ampliamente compartidos. Comprenden una triptófano dimetilaliltransferasa involucrada en la síntesis de alcaloides del cornezuelo de centeno, varios citocromos, pequeñas proteínas secretadas, una policétido sintasa (PKS) y un híbrido PKS-NRPS (proteína sintetasa no ribosómica). Entre los genes de manipulación candidatos que parecían ser exclusivos de O. kimflemingiae (es decir, 59 grupos, figura 4), solo los SSP estaban sobrerrepresentados. Sin embargo, el 92% de estos genes «únicos» no recibieron una anotación funcional. Cuando se encontró cualquier otra superposición con los rangos de las tres especies, las SSP también estaban sobrerrepresentadas, al igual que las proteínas secretadas más grandes. hongos (es decir, 24 grupos Fig. 4), nuevamente la mayoría (79%) no recibió una anotación funcional. Entre los siete grupos ortólogos que estaban presentes en todas las especies que infectan insectos, pero no en otros ascomicetos, encontramos un supuesto, enterotoxina secretada. Esta enterotoxina estaba presente en las especies inductoras del comportamiento de picadura O. kimflemingiae (dos ortólogos), O. camponoti-rufipedis (1 ortólogo), O. subramanianii sl (dos ortólogos) y O. australis-Ghana (dos ortólogos) , así como en O. australis-Brasil y O. sinensis. Además, uno de los dos ortólogos de enterotoxina en O. kimflemingiae mostró un patrón de expresión dramático con un > 3000 veces mayor -regulación durante la manipulación y una regulación descendente de 200 veces después18. Por tanto, esta enterotoxina podría ser potencialmente un actor clave importante en el establecimiento de la manipulación del comportamiento por estas especies de Ophiocordyceps.
Conservación de grupos de metabolitos secundarios
Una hipótesis general es que los comportamientos alterados del hospedador se establecen mediante la secreción de metabolitos secundarios además de compuestos bioactivos más grandes . Esta hipótesis está respaldada por la sobrerrepresentación de ciertos grupos de metabolitos secundarios anotados entre los genes de O. kimflemingiae que se regulan positivamente durante el comportamiento de morder manipulado18. Examinando estos más de cerca, encontramos que de hecho los genes, dentro pero también directamente flanqueando los grupos de metabolitos secundarios anotados, seguían este patrón de expresión particular (Fig. 5a). Preguntamos si estos grupos se conservaban entre los hongos Ophiocordyceps que infectan insectos. Esto sugeriría una similitud en el uso de metabolitos secundarios por estos hongos para interactuar con sus huéspedes hormiga para establecer los comportamientos manipulados observados. Como tal, examinamos los grupos anotados 7, 8 y 9 de O. kimflemingiae y sus genes directamente flanqueantes. Estos grupos 1) fueron regulados positivamente durante el comportamiento de morder manipulado seguido de una regulación negativa significativa, y 2) ortólogos compartidos con otros ascomicetos (ver arriba). Para los genes dentro de estos grupos, buscamos homólogos (alineación BLASTp) y ortólogos (agrupamiento ortólogo) en los otros cuatro hongos que infectan hormigas (Fig. 5b y Figura complementaria S3). Esto demostró que la especie unilateralis organizó al menos algunos de sus genes relacionados con el metabolismo secundario en grupos muy similares. Las otras especies de Ophiocordyceps tenían homólogos y ortólogos de estos genes del metabolismo secundario esparcidos por sus genomas o no contenían una copia en absoluto (Fig. 5b y Figura complementaria S3). Por ejemplo, el grupo 8 anotado en O. kimflemingiae contenía una triptófano dimetilaliltransferasa flanqueada por CYP relacionados con la oxidación-reducción y un gen con un dominio de unión a FAD. Este grupo está flanqueado directamente por siete genes que siguieron un patrón de expresión similar (Fig. 5a). El genoma de O. camponoti-rufipedis tenía esta triptófano dimetilaliltransferasa de manera similar; flanqueado por CYP y un gen de unión a FAD, seguido de homólogos y ortólogos de los genes vecinos (Fig. 5b). El O. subramanianii s.l. El genoma también tenía una triptófano dimetilaliltransferasa similar. Sin embargo, estaba flanqueado por genes de unión CYP y FAD no homólogos / ortólogos. De hecho, O. subramanianii s.l. tenían homólogos / ortólogos de estos genes pero residían en contigs completamente diferentes, al igual que los genes justo fuera del grupo de metabolitos secundarios anotado (Fig. 5b). Además, ambas especies australis no tenían un gen ortólogo / homólogo que codificara esta triptófano dimetilaliltransferasa en particular. De hecho, la especie australis de Ghana parecía no contener una supuesta triptófano dimetilaliltransferasa en absoluto. Se podrían sacar conclusiones similares analizando los otros grupos de metabolitos secundarios (Figura complementaria S3). Los grupos 7 y 9 de O. kimflemingiae parecían en gran medida comparables a los grupos 31 y 8 de O. camponoti-rufipedis respectivamente. Sin embargo, los genes asociados con estos grupos tampoco estaban presentes o estaban dispersos en los genomas de las otras tres especies que infectan a las hormigas.
Filogenia de enterotoxinas fúngicas
Los genes que contenían un dominio PFAM de enterotoxina anotado (PF01375) y una señal de secreción se indicaron como enterotoxinas secretadas putativas. Los resultados anteriores y nuestro estudio actual implican que los genes que codifican estas enterotoxinas putativas son de importancia en las especies de hongos Ophiocordyceps que manipulan el comportamiento.Estas toxinas secretadas de tipo bacteriano podrían afectar potencialmente el comportamiento de las hormigas al interferir con la producción de moléculas de señalización de quimioterapia en el huésped. Esto se demostró para las enterotoxinas de entomopatógenos bacterianos en las feromonas sexuales del gorgojo del algodón23,24. Sin embargo, también podrían funcionar como simples compuestos letales25. Además, una de estas enterotoxinas putativas fue extremadamente altamente regulada durante el evento de mordedura manipulada solamente18. Este gen en particular estuvo presente en todas las especies de Ophiocordyceps que manipulan hormigas en este estudio, así como en O. australis-Brazil y O. sinensis. Además, los hongos que infectan hormigas parecían tener un número bastante grande de genes que codifican estas proteínas relacionadas con la patogenicidad. Otros ascomicetos generalmente contenían mucho menos (es decir, otros entomopatógenos, hongos que infectan nematodos y Magnaporthe oryzae) o ningún gen que contenga dominios de enterotoxina (es decir, el resto de los ascomicetos en este estudio). Los genomas de las especies de Ophiocordyceps que infectan a las hormigas tenían entre 20 y 36 enterotoxinas putativas, siendo O. australis-Ghana (n = 20) la más pequeña y O. kimflemingiae (n = 36) la más grande. Los hongos Ophiocordyceps minnesotensis y Drechmeria coniospora que infectan nematodos contenían 19 y 25 genes con un dominio PFAM de enterotoxina. Otros entomopatógenos del orden Hypocreales contenían sólo 4-16 anotaciones de enterotoxina, siendo Metarhizium robertsii y Cordyceps bassiana las que más (n = 16 yn = 14, respectivamente). Los otros genomas de ascomicetos de este estudio no tenían genes que codificaran enterotoxinas, excepto el patógeno vegetal M. oryzae, que contenía seis.
Construimos un árbol filogenético basado en todos los genes de hongos en este estudio que contenía el dominio de cadena alfa de enterotoxina termolábil PF01375. Las enterotoxinas se han informado principalmente para especies bacterianas (por ejemplo, refs 23,24,25). Por lo tanto, también incluimos cuatro enterotoxinas bacterianas. Esto resultó en un árbol basado en 252 regiones de dominio. Primero determinamos cómo se agruparían las enterotoxinas de las especies bacterianas y que infectan las plantas (es decir, M. oryzae) con respecto a la mayoría de las especies que infectan a los animales (es decir, los hongos que infectan a los insectos y los nematodos). Esto colocó tres enterotoxinas bacterianas en un clado y el cuarto en un clado separado (Figura complementaria S4). Una enterotoxina bacteriana, de Leptospira mayottensis, formó un grupo externo para el clado M. oryzae que infecta las plantas. M. oryzae reside fuera del orden Hypocreales. Como tal, las enterotoxinas fitopatógenas de esta especie se utilizaron como un grupo externo y el árbol se enraizó en L. mayottensis (Figura complementaria S4). Este árbol mostró que algunas enterotoxinas de hongos que infectan hormigas están relacionadas con las de otras especies que infectan insectos o nematodos. Otras enterotoxinas formaron sus propios clados. Dentro de estos clados específicos de infección por hormigas, a menudo se emparejaban enterotoxinas de las dos especies del complejo unilateralis o del complejo australis. Ophiocordyceps subramanianii s.l. las enterotoxinas a menudo formaban el grupo externo de un clado específico unilateralis o australis (Figura complementaria S4). Además, la enterotoxina que fue altamente regulada durante el comportamiento de morder manipulado (es decir, GeneID Ophio5 | 373 Figura complementaria S4), así como conservada entre todas las especies que infectan hormigas en este estudio (y O. sinensis, ver arriba), residió dentro de un clado que solo contenía especies manipuladoras de hormigas. Esto indica que esta enterotoxina en particular podría ser de importancia clave para establecer el comportamiento manipulado como se observa en las especies incluidas en este estudio.