Características do genoma
Os genomas de esboço de Ophiocordyceps gerados neste estudo (Tabela 1) foram montados com leituras geradas em várias execuções de sequenciamento usando dois tipos de bibliotecas de DNA. Apenas as execuções que levaram a leituras de alta qualidade foram usadas para a montagem (consulte Materiais e métodos). A montagem de Contig resultou em tamanhos de genoma variando de 21,91–23,92 milhões de pares de bases (Mbp) para O. unilateralis s.l. e O. australis s.l. espécies. Em contraste, O. subramanianii s.l. tinha um tamanho de genoma estimado de 32,31 Mb. A predição do gene rendeu entre 7.621 e 8.629 genes para as espécies O. unilateralis e O. australis. Ophiocordyceps subramanianii s.l. foi previsto ter 11.275 genes. Além disso, o conteúdo do GC em O. subramanianii s.l. (ou seja, 60,35%) foi muito maior em comparação com as outras espécies de Ophiocordyceps neste estudo (54,66% + / – 1,57%) (Tabela 1).
Também melhoramos a montagem e a previsão do gene do genoma de O. publicado anteriormente. unilateralis sl cepa SC16a (Tabela Suplementar S1), que agora recebeu o nome de espécie O. kimflemingiae 20. Além de ser menos fragmentada, a nova montagem é menor do que relatado anteriormente18. Isso é provavelmente devido a uma melhor reunião de regiões repetitivas, que foram encontradas mais altas nas espécies unilateralis (6,59-6,83%) em comparação com as outras espécies infectantes de formigas neste estudo (Tabela 1). Apesar do tamanho menor do conjunto, a nova previsão do gene aumentou a contagem de genes com 798 genes. Esse aumento é causado predominantemente pela previsão de menos quimeras (ou seja, genes vizinhos que são mesclados incorretamente em um modelo de gene) usando o pipeline Braker1 (dados não mostrados).
Para todos, exceto um dos genomas gerados em Neste estudo, a previsão do gene foi informada por leituras de RNA-Seq. Para a espécie unilateralis norte-americana relatada anteriormente O. kimflemingiae, leituras geradas naquele estudo anterior foram usadas18. Por dificuldades no cultivo de O. camponoti-rufipedis brasileiro, não foi obtido material suficiente para gerar dados de RNA-Seq além das leituras de DNA necessárias para obter um esboço do genoma. Como O. kimflemingiae e O. camponoti-rufipedis residem no mesmo complexo de espécies (unilateralis), tentamos mapear as leituras de espécies unilateralis da América do Norte no genoma de O. camponoti-rufipedis para ver se eles poderiam ser usados para informar a anotação. No entanto, enquanto 93% das leituras de O. kimflemingiae mapeadas para seu próprio genoma, apenas 43% foram mapeadas para o genoma de O. camponoti-rufipedis (Tabela Suplementar S2). Além disso, mapeamos as leituras para outro O. unilateralis s.l. genoma, o de O. polyrhachis-furcata 22, para determinar se este seria um efeito de mapeamento cruzado mais geral ou específico para o genoma de O. camponoti-rufipedis. Um mapeamento semelhante de 41% resultou. Isso sugere que as espécies unilateralis podem geralmente estar relacionadas de forma bastante distante, tornando o mapeamento cruzado para informar a anotação menos adequado. Para fins informativos, também cruzamos as espécies australis entre si (cepas MAP-64 do Brasil e 1348a de Gana). Isso resultou em 71% e 82% de leituras com mapeamento cruzado contra 86% e 97% mapeados para seus próprios genomas, respectivamente (Tabela Suplementar S2). Isso implica que as espécies no complexo australis são provavelmente muito mais estreitamente relacionadas umas às outras do que as espécies dentro do complexo unilateral.
Aglomerados ortólogos
Partimos para investigar quais previsões de genes de as espécies de Ophiocordyceps que infectam formigas neste estudo são provavelmente conservadas e compartilhadas com outros ascomicetes. Além disso, pretendíamos descobrir quais especializações específicas da espécie e “específicas da manipulação” poderiam ter ocorrido. Como tal, os proteomas previstos dos nossos cinco fungos infectantes de formigas foram comparados aos de 18 outros fungos ascomicetos. Destas espécies, dez eram parasitas animais (dois mamíferos infectantes, dois nematóides infectantes e seis insetos infectantes) e 13 residem na mesma ordem (Hipocreales). Quatro espécies pertenciam à mesma família (Ophiocordycipitaceae) e duas eram do mesmo gênero (Ophiocordyceps). A a reconstrução filogenética baseada em 67 genes conservados presentes em cada um desses organismos é ilustrada na Fig. 2.
Um total de 51.012 clusters ortólogos incluiu todas as proteínas anotadas de cada um dos 23 ascomicetes incluídos nesta análise (Dados Suplementares S1). As estatísticas resumidas a respeito desse agrupamento podem ser encontradas na Figura Suplementar S1. Comparamos a sobreposição de agrupamentos ortólogos entre três intervalos de espécies: 1) os fungos infectantes, que compreendiam todos os cinco genomas de esboço gerados neste estudo, 2) os outros fungos infectantes de insetos Ophiocordyceps sinensis, Tolypocladium inflatum, ambos Metarhizium e ambas as espécies de Cordyceps e 3) todos os ascomicetes não infectantes de insetos, que incluíam outros fungos que infectam animais, plantas, fungos e saprofíticos. Os resultados desta análise são apresentados no Diagrama de Venn da Fig. 3a. Posteriormente, realizamos análises de enriquecimento para as anotações funcionais de genes de espécies infectantes de formigas que foram encontrados nas várias partes sobrepostas e não sobrepostas do diagrama. Dos 7.931 agrupamentos ortólogos encontrados nas três faixas de espécies, as anotações do Gene Ontology (GO) para processos biológicos gerais foram significativamente super-representadas. Isso sugere, como seria de se esperar, que ascomicetes com estilos de vida diferentes usam mecanismos semelhantes para processos gerais, como transcrição, tradução, transporte de proteínas e transdução de sinal. No entanto, os genes previstos para codificar para (pequenas) proteínas secretadas, proteínas com anotações GO para processos de múltiplos organismos e patogênese e, mais especificamente, enterotoxinas putativas secretadas, foram sub-representados. De fato, quando realizamos uma análise de enriquecimento de anotações presentes em clusters ortólogos que foram encontrados apenas nas espécies infectantes de formigas (ou seja, 6.672 clusters, Fig. 3a), encontramos o resultado oposto. As anotações GO para (praticamente os mesmos) processos biológicos gerais foram significativamente sub-representadas, enquanto (pequenas) proteínas secretadas, proteínas com anotações GO para processos de multiorganismos e patogênese e enterotoxinas putativas foram sobrerrepresentadas. Isso sugere que uma parte significativa do secretoma dos fungos infectantes deste estudo é específica para eles. Essa especificidade apareceu em parte devido às enterotoxinas que fazem parte do secretoma e às pequenas proteínas bioativas secretadas (SSPs) que podem ser importantes nas interações fungo-formiga. (Pequenas) proteínas secretadas também foram super-representadas entre os grupos que os fungos infectantes de formigas compartilhavam exclusivamente com outros entomopatógenos (262 grupos) ou não entomopatógenos (449 grupos). Isso indica que seus secretomos também contêm proteínas específicas do entomopatógeno mais gerais, bem como proteínas que são exclusivamente compartilhadas com ascomicetos não entomopatogênicos.
Também examinamos como os agrupamentos ortólogos, que só foram encontrados entre os fungos infectantes de formigas, foram representados por essas espécies (Fig. 3b). Do total de 6.672 agrupamentos nesta comparação, 90,6% pareceram ser específicos da espécie. A sobreposição de aglomerados foi, portanto, marginal, embora todas as espécies neste estudo residam dentro do mesmo gênero (Ophiocordyceps) e em alguns casos até dentro do mesmo complexo de espécies (O. unilateralis s.l. e O. australis s.l.). A análise do enriquecimento de termos de anotação funcional nesses agrupamentos específicos de espécies novamente resultou em super-representações de (pequenas) proteínas secretadas. Embora marginal, a maior parte da sobreposição de aglomerados foi encontrada entre espécies mais estreitamente relacionadas dentro do mesmo complexo (ou seja, O. australis s.l., 289 aglomerados, e O. unilateralis s.l., 182 aglomerados Fig. 3b). Também aqui, as análises de enriquecimento revelaram uma sobre-representação para (pequenas) proteínas secretadas. Assim, parece que uma quantidade estatisticamente significativa do secretoma do fungo dessas espécies infectantes de formigas é específica do complexo ou da espécie. Além disso, encontramos uma super-representação dos termos GO de patogenicidade entre os agrupamentos ortólogos complexos específicos. Esse achado pode ser atribuído à presença de enterotoxinas ortólogas em espécies do mesmo complexo.Apenas quatro grupos que não estavam presentes em nenhum dos outros ascomicetos em nossa comparação foram compartilhados entre todas as cinco espécies infectantes de formigas (Fig. 3b). Nenhum desses quatro clusters recebeu uma anotação funcional, mas três deles continham genes com sinais de secreção previstos. Para três dos quatro clusters, uma análise BLASTp dos genes contra o banco de dados do NCBI resultou apenas em resultados hipotéticos de proteínas com a versão previamente depositada do genoma de O. kimflemingiae18. Isso indica que esses agrupamentos podem, de fato, representar proteínas exclusivas das espécies de Ophiocordyceps que infectam formigas. As sequências de proteínas dentro do quarto cluster resultaram em acertos com metaloproteases, além de se alinharem novamente com uma proteína hipotética de O. kimflemingiae (XA68_3159), (Tabela Suplementar S3). Este agrupamento pode, portanto, conter metaloproteases putativas que são encontradas apenas nos genomas das espécies de fungos infectantes de formigas examinadas aqui. Além disso, apenas 2 dos agrupamentos encontrados exclusivamente nos fungos infectantes de formigas foram compartilhados entre todas as quatro espécies que induzem o comportamento de morder (Fig. 3b). Uma análise BLASTp dos genes dentro desses agrupamentos resultou novamente em acertos hipotéticos de proteínas com a versão previamente depositada do genoma de O. kimflemingiae18 (Tabela Suplementar S4).
Genes de manipulação de candidatos envolvidos no estabelecimento do comportamento de mordida >
Analisamos a conservação de genes candidatos associados ao evento de mordida manipulada observado em formigas infectadas. Usamos dados transcriptômicos publicados anteriormente18 e redeterminamos a expressão diferencial do gene mapeando os dados para a nova versão do genoma de O. kimflemingiae. De acordo com o estudo publicado anteriormente, seguimos o raciocínio de que os genes candidatos, envolvidos no estabelecimento do comportamento de mordida manipulado, seriam regulados para cima durante esse evento e rapidamente regulados para baixo novamente depois. Assim, foram identificados 547 genes candidatos, 49 a mais do que o relatado na análise anterior18. Em linha com os dados relatados anteriormente, os genes envolvidos na replicação do DNA, processos de redução de oxidação, secreção e metabolismo secundário foram super-representados.
A conservação de genes de manipulação candidatos também foi analisada por meio de agrupamento ortólogo. Comparamos a sobreposição de agrupamentos ortólogos contendo esses genes candidatos, que foram significativamente regulados para cima e para baixo após o comportamento de mordida manipulado em O. kimflemingiae, com três faixas de espécies: 1) os outros fungos infectantes de formigas, que compreendiam os quatro novos esboços genomas gerados neste estudo, 2) os outros fungos que infectam insetos e 3) todos os ascomicetes não infectantes usados para comparação anteriormente. Os resultados desta análise estão representados no Diagrama de Venn da Fig. 4. Dos genes de manipulação candidatos, 78% pareceram ser ortólogos de genes presentes em todas as outras três gamas de espécies (i.e. 423 clusters, Fig. 4). Isto implica que os genes expressos durante a manipulação induzida por O. kimflemingiae não são provavelmente específicos para manipulação. Entre esses genes amplamente compartilhados, CYPs e outras funções relacionadas à oxidação-redução foram super-representados, bem como genes que codificam proteínas e proteases secretadas. Várias anotações do metabolismo secundário (clusters 7,8 e 9) também foram super-representadas entre esses clusters ortólogos mais amplamente compartilhados. Eles compreendem uma dimetilaliltransferase de triptofano envolvida na síntese de alcalóides da cravagem, vários citocromos, pequenas proteínas segregadas, uma policetídeo sintase (PKS) e um híbrido de PKS-NRPS (proteína sintetase não ribossômica). Entre os genes de manipulação candidatos que pareciam ser únicos para O. kimflemingiae (isto é, 59 agrupamentos, Fig. 4), apenas SSPs estavam super-representados. No entanto, 92% desses genes “únicos” não receberam uma anotação funcional. Onde qualquer outra sobreposição com as três faixas de espécies foi encontrada, os SSPs também foram sobre-representados, assim como as proteínas secretadas maiores. Dos presentes apenas em antinfecciosos fungos (ou seja, 24 clusters Fig. 4), novamente a maioria (79%) não recebeu uma anotação funcional. Entre os sete clusters ortólogos que estavam presentes em todas as espécies infectantes de insetos, mas não em outros ascomicetos, encontramos um putativo, enterotoxina secretada. Esta enterotoxina estava presente nas espécies indutoras de comportamento de picada O. kimflemingiae (dois ortólogos), O. camponoti-rufipedis (1 ortólogo), O. subramanianii sl (dois ortólogos) e O. australis-Gana (dois ortólogos) , bem como em O. australis-Brasil e O. sinensis. Além disso, um dos dois ortólogos de enterotoxinas em O. kimflemingiae mostrou um padrão de expressão dramático com > 3.000 vezes acima -regulação durante a manipulação e uma regulação negativa de 200 vezes após 18. Essa enterotoxina poderia, portanto, ser um importante ator-chave no estabelecimento da manipulação comportamental por essas espécies de Ophiocordyceps.
Conservação de clusters de metabólitos secundários
Uma hipótese geral é que comportamentos alterados do hospedeiro são estabelecidos através da secreção de metabólitos secundários, além de compostos bioativos maiores . Esta hipótese é apoiada pela super-representação de certos clusters de metabólitos secundários anotados entre genes de O. kimflemingiae que são regulados positivamente durante o comportamento de mordida manipulado18. Examinando-os mais de perto, descobrimos que de fato os genes, dentro, mas também flanqueando diretamente os aglomerados de metabólitos secundários anotados, seguiram este padrão de expressão particular (Fig. 5a). Perguntamos se esses aglomerados foram conservados entre os fungos Ophiocordyceps que infectam insetos. Isso sugere uma semelhança no uso de metabólitos secundários por esses fungos para interagir com suas formigas hospedeiras para estabelecer os comportamentos manipulados observados. Como tal, examinamos os agrupamentos anotados 7,8 e 9 de O. kimflemingiae e seus genes de flanco direto. Esses grupos 1) foram regulados para cima durante o comportamento de mordida manipulado seguido por uma regulação para baixo significativa, e 2) ortólogos compartilhados com outros ascomicetes (veja acima). Para os genes dentro desses agrupamentos, buscamos homólogos (alinhamento BLASTp) e ortólogos (agrupamento ortólogo) nos outros quatro fungos infectantes de formigas (Fig. 5b e Figura Suplementar S3). Isso demonstrou que as espécies unilateralis organizaram pelo menos alguns de seus genes relacionados ao metabolismo secundário em grupos amplamente semelhantes. As outras espécies de Ophiocordyceps tinham homólogos e ortólogos desses genes do metabolismo secundário espalhados por seus genomas ou não continham nenhuma cópia (Fig. 5b e Figura Suplementar S3). Por exemplo, o cluster anotado 8 em O. kimflemingiae continha uma triptofano dimetilaliltransferase flanqueada por CYPs relacionados com a oxidação-redução e um gene com um domínio de ligação FAD. Este cluster é flanqueado diretamente por sete genes que seguiram um padrão de expressão semelhante (Fig. 5a). O genoma de O. camponoti-rufipedis tinha essa triptofano dimetilaliltransferase de maneira semelhante; flanqueado por CYPs e um gene de ligação a FAD, seguido por homólogos e ortólogos dos genes vizinhos (Fig. 5b). O O. subramanianii s.l. o genoma também tinha uma triptofano dimetilaliltransferase semelhante. No entanto, era flanqueado por genes não homólogos / ortólogos de CYP e de ligação a FAD. Na verdade, O. subramanianii s.l. tinha homólogos / ortólogos desses genes, mas eles residiam em contigs completamente diferentes, assim como os genes fora do agrupamento de metabólitos secundários anotado (Fig. 5b). Além disso, ambas as espécies australis não tinham um gene ortólogo / homólogo que codifica para esta triptofano dimetilaliltransferase particular. Na verdade, a espécie australis de Gana parecia não conter uma suposta triptofano dimetilaliltransferase. Conclusões semelhantes podem ser feitas analisando os outros agrupamentos de metabólitos secundários (Figura Suplementar S3). Os aglomerados 7 e 9 de O. kimflemingiae pareciam amplamente comparáveis aos aglomerados 31 e 8 de O. camponoti-rufipedis, respectivamente. No entanto, os genes associados a esses agrupamentos não estavam presentes ou estavam espalhados pelos genomas das outras três espécies infectantes.
Filogenia de enterotoxinas fúngicas
Os genes que continham um domínio PFAM de enterotoxina anotado (PF01375) e um sinal de secreção foram indicados como enterotoxinas putativas secretadas. Resultados anteriores e nosso estudo atual implicam que os genes que codificam para essas enterotoxinas putativas são importantes em espécies de fungos Ophiocordyceps que manipulam o comportamento.Essas toxinas semelhantes às bactérias secretadas podem estar afetando o comportamento das formigas, interferindo na produção de moléculas de sinalização quimio no hospedeiro. Isso foi demonstrado para enterotoxinas de entomopatógenos bacterianos em feromônios sexuais de bicudo23,24. No entanto, eles também podem funcionar como meros compostos matadores25. Além disso, uma dessas enterotoxinas putativas foi extremamente regulada para cima apenas durante o evento de mordida manipulada18. Este gene em particular estava presente em todas as espécies de Ophiocordyceps manipuladoras de formigas neste estudo, bem como em O. australis-Brasil e O. sinensis. Além disso, os fungos que infectam a formiga parecem ter um grande número de genes que codificam essas proteínas relacionadas à patogenicidade. Outros ascomicetos geralmente continham muito menos (isto é, outros entomopatógenos, fungos infectantes de nematóides e Magnaporthe oryzae) ou nenhum gene contendo o domínio de enterotoxina (isto é, o restante dos ascomicetos neste estudo). Os genomas das espécies de Ophiocordyceps que infectam formigas tinham 20-36 enterotoxinas putativas, com O. australis-Ghana (n = 20) tendo o menor e O. kimflemingiae (n = 36) tendo o maior número. Os fungos que infectam nematóides Ophiocordyceps minnesotensis e Drechmeria coniospora continham 19 e 25 genes com um domínio PFAM de enterotoxina. Outros entomopatógenos da ordem Hypocreales continham apenas 4-16 anotações de enterotoxinas com Metarhizium robertsii e Cordyceps bassiana tendo a maioria (n = 16 en = 14, respectivamente). Os outros genomas de ascomicetos neste estudo não tinham genes que codificam enterotoxinas, exceto para o fitopatógeno M. oryzae, que continha seis.
Construímos uma árvore filogenética com base em todos os genes de fungos neste estudo que continha o domínio da cadeia alfa da enterotoxina lábil PF01375. Enterotoxinas foram principalmente relatadas para espécies bacterianas (por exemplo, refs 23,24,25). Portanto, também incluímos quatro enterotoxinas bacterianas. Isso resultou em uma árvore baseada em 252 regiões de domínio. Primeiro determinamos como as enterotoxinas das espécies bacterianas e infectantes de plantas (ou seja, M. oryzae) se agrupariam em relação à maioria das espécies que infectam animais (ou seja, fungos que infectam insetos e nematóides). Isso colocou três enterotoxinas bacterianas em um clado e a quarta em um clado separado (Figura Suplementar S4). Uma enterotoxina bacteriana, de Leptospira mayottensis, formou um grupo externo para o clado infectante de M. oryzae. M. oryzae reside fora da ordem Hypocreales. Como tal, as enterotoxinas fitopatogênicas desta espécie foram usadas como um grupo externo e a árvore foi enraizada em L. mayottensis (Figura Suplementar S4). Esta árvore mostrou que algumas enterotoxinas de fungos infectantes de formigas estão relacionadas com aquelas de outras espécies infectantes de insetos ou nematóides. Outras enterotoxinas formaram seus próprios clados. Dentro desses clados específicos de infecção de formigas, enterotoxinas das duas espécies do complexo unilateral ou das espécies do complexo australiano eram freqüentemente pareadas. Ophiocordyceps subramanianii s.l. enterotoxinas frequentemente formaram o grupo externo para um clado específico unilateral ou australis (Figura Suplementar S4). Além disso, a enterotoxina que foi altamente regulada durante o comportamento de mordida manipulado (ou seja, GeneID Ophio5 | 373 Figura Suplementar S4), bem como conservada entre todas as espécies infectantes de formigas neste estudo (e O. sinensis, veja acima), residia dentro de um clado que continha apenas espécies manipuladoras de formigas. Isso indica que esta enterotoxina em particular pode, de fato, ser de importância fundamental no estabelecimento do comportamento manipulado, conforme observado nas espécies incluídas neste estudo.