Caratteristiche del genoma
Gli Ophiocordyceps disegnano i genomi generati in questo studio (Tabella 1) sono stati assemblati con letture generate in varie corse di sequenziamento utilizzando due tipi di librerie di DNA. Per lassemblaggio sono state utilizzate solo le sequenze che hanno portato a letture di alta qualità (vedere Materiali e metodi). Lassemblaggio di contig ha prodotto dimensioni del genoma comprese tra 21,91 e 23,92 milioni di paia di basi (Mbp) per O. unilateralis s.l. e O. australis s.l. specie. Al contrario, O. subramanianii s.l. aveva una dimensione del genoma stimata di 32,31 Mb. La predizione del gene ha prodotto tra 7.621 e 8.629 geni per le specie O. unilateralis e O. australis. Ophiocordyceps subramanianii s.l. era previsto che avesse 11.275 geni. Inoltre, il contenuto GC in O. subramanianii s.l. (cioè 60,35%) era molto più alto rispetto alle altre specie di Ophiocordyceps in questo studio (54,66% + / – 1,57%) (Tabella 1).
Abbiamo anche migliorato lassemblaggio e la previsione genica del genoma di O. precedentemente pubblicato. unilateralis sl ceppo SC16a (tabella supplementare S1), che ha ora ricevuto il nome di specie O. kimflemingiae 20. Oltre ad essere meno frammentato, il nuovo assemblaggio è più piccolo di quanto riportato in precedenza18. Ciò è molto probabilmente dovuto a un migliore assemblaggio di regioni ripetitive, che sono state trovate più alte nelle specie unilateralis (6,59-6,83%) rispetto alle altre specie che infettano le formiche in questo studio (Tabella 1). Nonostante le dimensioni ridotte dellassieme, la previsione del nuovo gene ha aumentato il numero di geni con 798 geni. Questo aumento è principalmente causato dalla previsione di un minor numero di chimere (cioè geni vicini che sono erroneamente fusi in un modello genico) utilizzando la pipeline Braker1 (dati non mostrati).
Per tutti tranne uno dei genomi generati in questo studio, la previsione del gene è stata informata da letture RNA-Seq. Per la specie unilaterale nordamericana precedentemente segnalata O. kimflemingiae, sono state utilizzate le letture generate in quello studio precedente18. A causa delle difficoltà con la coltivazione di O. camponoti-rufipedis brasiliano, non è stato ottenuto materiale sufficiente per generare dati RNA-Seq oltre alle letture del DNA necessarie per ottenere una bozza del genoma. Poiché sia O. kimflemingiae che O. camponoti-rufipedis risiedono nello stesso complesso di specie (unilateralis), abbiamo tentato di mappare le letture di specie unilateralis nordamericane sul genoma di O. camponoti-rufipedis per vedere se potevano essere utilizzate per informare lannotazione. Tuttavia, mentre il 93% di O. kimflemingiae legge mappato al proprio genoma, solo il 43% è mappato al genoma di O. camponoti-rufipedis (Tabella supplementare S2). Abbiamo inoltre mappato le letture su un altro O. unilateralis s.l. pubblicato. genoma, quello di O. polyrhachis-furcata 22, per determinare se questo sarebbe un effetto di mappatura incrociata più generale o specifico per il genoma di O. camponoti-rufipedis. Ne è risultata una mappatura simile del 41%. Ciò suggerisce che le specie unilaterali potrebbero generalmente essere imparentate in modo piuttosto distante, rendendo la mappatura incrociata per informare lannotazione meno adatta. A scopo informativo, abbiamo anche mappato le specie australis tra loro (ceppi MAP-64 dal Brasile e 1348a dal Ghana). Ciò ha comportato il 71% e l82% di letture con mappatura incrociata rispetto all86% e il 97% mappati rispettivamente ai propri genomi (Tabella supplementare S2). Ciò implica che le specie nel complesso australis sono quindi probabilmente molto più strettamente correlate luna allaltra rispetto alle specie allinterno del complesso unilaterale.
Cluster ortologhi
Ci siamo proposti di indagare su quali predizioni genetiche di le specie Ophiocordyceps che infettano le formiche in questo studio sono probabilmente conservate e condivise con altri ascomiceti. Inoltre, ci siamo proposti di scoprire quali specializzazioni specie-specifiche e “manipolazione-specifiche” potrebbero aver avuto luogo. In quanto tali, i proteomi previsti dei nostri cinque funghi infettanti sono stati confrontati con quelli di altri 18 funghi ascomiceti. Di queste specie, dieci erano parassiti animali (due mammiferi infettanti, due nematodi infettanti e sei insetti infettanti) e 13 risiedono nello stesso ordine (Hypocreales). Quattro specie appartenevano alla stessa famiglia (Ophiocordycipitaceae) e due appartenevano allo stesso genere (Ophiocordyceps). A la ricostruzione filogenetica basata su 67 geni conservati presenti in ciascuno di questi organismi è illustrata in Fig. 2.
Un totale di 51.012 cluster ortologhi includevano tutte le proteine annotate di ciascuno dei 23 ascomiceti inclusi in questa analisi (Dati supplementari S1). Le statistiche riassuntive riguardanti questo raggruppamento possono essere trovate nella Figura supplementare S1. Abbiamo confrontato la sovrapposizione di gruppi ortologhi tra tre gamme di specie: 1) i funghi che infettano le formiche, che comprendevano tutti e cinque i genomi di progetto generati in questo studio, 2) gli altri funghi infettanti gli insetti Ophiocordyceps sinensis, Tolypocladium inflatum, entrambi Metarhizium ed entrambe le specie Cordyceps e 3) tutti gli ascomiceti non infettanti gli insetti, che includevano altri funghi infettanti per animali, piante, funghi e saprofiti. I risultati di questa analisi sono illustrati nel diagramma di Venn della Fig. 3a. Successivamente, abbiamo eseguito analisi di arricchimento per le annotazioni funzionali dei geni delle specie infettanti che sono stati trovati allinterno delle varie parti sovrapposte e non sovrapposte del diagramma. Dei 7.931 cluster ortologhi che sono stati trovati allinterno di tutte e tre le gamme di specie, le annotazioni Gene Ontology (GO) per i processi biologici generali erano significativamente sovrarappresentate. Ciò suggerisce, come ci si aspetterebbe, che gli ascomiceti con stili di vita diversi utilizzino meccanismi simili per processi generali come la trascrizione, la traduzione, il trasporto di proteine e la trasduzione del segnale. Tuttavia, i geni previsti per codificare per (piccole) proteine secrete, proteine con annotazioni GO per processi multi-organismo e patogenesi e, più specificamente, enterotossine putative secrete, erano sottorappresentate. Infatti, quando abbiamo eseguito unanalisi di arricchimento delle annotazioni presenti nei cluster ortologhi che sono stati trovati solo nelle specie che infettano le formiche (cioè 6.672 cluster, Fig. 3a), abbiamo trovato il risultato opposto. Le annotazioni GO per i processi biologici generali (in gran parte uguali) erano significativamente sottorappresentate, mentre le proteine (piccole) secrete, le proteine con annotazioni GO per i processi multi-organismo e la patogenesi e le putative enterotossine erano sovrarappresentate. Ciò suggerisce che una parte significativa del secretoma dei funghi che infettano le formiche in questo studio è specifico per loro. Questa specificità è apparsa in parte a causa delle enterotossine che fanno parte del secretoma e delle piccole proteine bioattive secrete (SSP) che potrebbero essere importanti nelle interazioni fungo-formica. Le proteine (piccole) secrete erano anche sovrarappresentate tra i cluster che i funghi infettanti le formiche condividevano esclusivamente con altri entomopatogeni (262 cluster) o non entomopatogeni (449 cluster). Ciò indica che i loro secretomi contengono anche proteine più generali specifiche dellentomopatogeno, nonché proteine condivise esclusivamente con ascomiceti non entomopatogeni.
Abbiamo anche esaminato come i cluster ortologhi, che sono stati trovati solo tra i funghi che infettano le formiche, fossero rappresentati da quelle specie (Fig. 3b). Del totale di 6.672 cluster in questo confronto, il 90,6% sembrava essere specie-specifico. La sovrapposizione dei cluster è stata quindi marginale anche se tutte le specie in questo studio risiedono nello stesso genere (Ophiocordyceps) e in alcuni casi anche allinterno dello stesso complesso di specie (O. unilateralis s.l. e O. australis s.l.). Lanalisi dellarricchimento dei termini di annotazione funzionale in questi cluster specie-specifici ha portato nuovamente a rappresentazioni eccessive di (piccole) proteine secrete. Sebbene marginale, la maggior parte delle sovrapposizioni dei cluster è stata trovata tra specie più strettamente correlate allinterno dello stesso complesso (cioè O. australis s.l., 289 cluster e O. unilateralis s.l., 182 cluster Fig. 3b). Anche qui, le analisi di arricchimento hanno rivelato una sovrarappresentazione per le (piccole) proteine secrete. Pertanto, sembra che una quantità statisticamente significativa del secretoma fungino di queste specie che infettano le formiche sia complessa o specifica per specie. Inoltre, abbiamo trovato una sovrarappresentazione dei termini GO di patogenicità tra i cluster ortologhi complessi-specifici. Questa scoperta potrebbe essere attribuita alla presenza di enterotossine ortologhe in specie allinterno dello stesso complesso.Solo quattro gruppi che non erano presenti in nessuno degli altri ascomiceti nel nostro confronto sono stati condivisi tra tutte e cinque le specie che infettano le formiche (Fig. 3b). Nessuno di questi quattro cluster ha ricevuto unannotazione funzionale, ma tre di essi contenevano geni con segnali di secrezione previsti. Per tre dei quattro cluster, unanalisi BLASTp dei geni rispetto al database NCBI ha prodotto solo ipotetici hit proteici con la versione precedentemente depositata del genoma di O. kimflemingiae18. Ciò indica che questi cluster potrebbero effettivamente rappresentare proteine uniche per le specie Ophiocordyceps che infettano le formiche. Le sequenze proteiche allinterno del quarto cluster hanno prodotto risultati con metalloproteasi oltre ad allinearsi nuovamente con unipotetica proteina di O. kimflemingiae (XA68_3159), (Tabella supplementare S3). Questo cluster potrebbe quindi contenere presunte metalloproteasi che si trovano esclusivamente nei genomi delle specie fungine che infettano le formiche qui esaminate. Inoltre, solo 2 dei cluster trovati in modo univoco nei funghi che infettano le formiche erano condivisi tra tutte e quattro le specie che inducono un comportamento mordace (Fig. 3b). Unanalisi BLASTp dei geni allinterno di questi cluster ha nuovamente portato a ipotetici colpi di proteine con la versione precedentemente depositata del genoma di O. kimflemingiae18 (tabella supplementare S4).
Geni di manipolazione candidati coinvolti nello stabilire un comportamento mordace
Abbiamo analizzato la conservazione dei geni candidati associati allevento di morso manipolato osservato nelle formiche infette. Abbiamo utilizzato i dati di trascrittomica pubblicati in precedenza18 e abbiamo rideterminato lespressione genica differenziale mappando i dati alla nuova versione del genoma di O. kimflemingiae. Come per lo studio pubblicato in precedenza, abbiamo seguito il ragionamento secondo cui i geni candidati, coinvolti nello stabilire un comportamento mordace manipolato, sarebbero stati sovra-regolati durante questo evento e rapidamente down-regolati nuovamente dopo. In quanto tali, sono stati identificati 547 geni candidati, 49 in più rispetto a quelli riportati nellanalisi precedente18. In linea con i dati riportati in precedenza, i geni coinvolti nella replicazione del DNA, nei processi di riduzione dellossidazione, nella secrezione e nel metabolismo secondario erano sovrarappresentati.
Anche la conservazione dei geni candidati alla manipolazione è stata analizzata mediante raggruppamento ortologo. Abbiamo confrontato la sovrapposizione di cluster ortologhi contenenti quei geni candidati, che erano significativamente up-durante e down-regolati dopo il comportamento morso manipolato in O. kimflemingiae, con tre gamme di specie: 1) gli altri funghi che infettano le formiche, che comprendevano i quattro nuovi progetti genomi generati in questo studio, 2) gli altri funghi che infettano insetti e 3) tutti gli ascomiceti non infettanti usati per il confronto in precedenza. I risultati di questa analisi sono illustrati nel diagramma di Venn di Fig. 4. Dei geni di manipolazione candidati, il 78% sembrava essere ortologo di geni presenti in tutte le altre tre gamme di specie (cioè 423 cluster, Fig. 4). Ciò implica che i geni espressi durante il morso manipolato indotto da O. kimflemingiae non sono probabilmente specifici per la manipolazione. Tra questi geni ampiamente condivisi, i CYP e altre funzioni correlate alla riduzione dellossidazione erano sovrarappresentate, così come i geni che codificano per le proteine secrete e le proteasi. Anche varie annotazioni sul metabolismo secondario (cluster 7,8 e 9) erano sovrarappresentate tra questi cluster ortologhi più ampiamente condivisi. Comprendevano un triptofano dimetilalliltransferasi coinvolto nella sintesi di alcaloidi dellergot, vari citocromi, piccole proteine secrete, una polichetide sintasi (PKS) e un ibrido PKS-NRPS (sintetasi proteica non ribosomiale). Tra i geni di manipolazione candidati che sembravano essere unici per O. kimflemingiae (cioè 59 cluster, Fig.4), solo gli SSP erano sovrarappresentati. Tuttavia, il 92% di questi geni “unici” non ha ricevuto unannotazione funzionale. Laddove è stata trovata qualsiasi altra sovrapposizione con le tre gamme di specie, anche gli SSP erano sovrarappresentati, così come le proteine secrete più grandi. Di quelle presenti solo nelle formiche infettive funghi (cioè 24 cluster Fig. 4), ancora una volta la maggioranza (79%) non ha ricevuto unannotazione funzionale. Tra i sette cluster ortologhi che erano presenti in tutte le specie infettanti, ma non in altri ascomiceti, abbiamo trovato un presunto, enterotossina secreta. Questa enterotossina era presente nelle specie che inducono il comportamento pungente O. kimflemingiae (due orthologs), O. camponoti-rufipedis (1 ortholog), O. subramanianii sl (due orthologs) e O. australis-Ghana (due orthologs) , così come in O. australis-Brasile e O. sinensis. Inoltre, uno dei due ortologhi di enterotossine in O. kimflemingiae ha mostrato un pattern di espressione drammatico con un > 3.000 volte -regolazione durante la manipolazione e down-regulation di 200 volte dopo 18. Questa enterotossina potrebbe quindi essere potenzialmente un importante attore chiave nella creazione della manipolazione comportamentale da parte di queste specie di Ophiocordyceps.
Conservazione dei cluster di metaboliti secondari
Unipotesi generale è che i comportamenti alterati dellospite siano stabiliti attraverso la secrezione di metaboliti secondari oltre a composti bioattivi più grandi . Questa ipotesi è supportata dalla sovrarappresentazione di alcuni cluster di metaboliti secondari annotati tra i geni di O. kimflemingiae che sono sovraregolati durante il comportamento del morso manipolato18. Esaminandoli più da vicino, abbiamo scoperto che in effetti i geni, allinterno ma anche direttamente fiancheggianti i cluster di metaboliti secondari annotati, seguivano questo particolare modello di espressione (Fig. 5a). Abbiamo chiesto se questi grappoli fossero conservati tra i funghi Ophiocordyceps che infettano gli insetti. Ciò suggerirebbe una somiglianza nelluso dei metaboliti secondari da parte di questi funghi per interagire con i loro ospiti di formiche per stabilire i comportamenti manipolati osservati. Pertanto, abbiamo esaminato i cluster annotati 7,8 e 9 di O. kimflemingiae e i loro geni che fiancheggiano direttamente. Questi cluster 1) erano up-regolati durante il comportamento mordace manipolato seguito da una significativa down-regulation e 2) ortologhi condivisi con altri ascomiceti (vedi sopra). Per i geni allinterno di questi cluster, abbiamo cercato omologhi (allineamento BLASTp) e ortologhi (raggruppamento ortologo) negli altri quattro funghi che infettano le formiche (Fig. 5b e Figura supplementare S3). Ciò ha dimostrato che le specie unilaterali hanno organizzato almeno alcuni dei loro geni correlati al metabolismo secondario in cluster in gran parte simili. Le altre specie di Ophiocordyceps avevano omologhi e ortologhi di questi geni del metabolismo secondario sparsi nel loro genoma o non ne contenevano affatto una copia (Fig. 5b e Figura supplementare S3). Ad esempio, il cluster annotato 8 in O. kimflemingiae conteneva un triptofano dimetilalliltransferasi affiancato da CYP correlati alla riduzione dellossidazione e un gene con un dominio di legame FAD. Questo cluster è direttamente affiancato da sette geni che hanno seguito un modello di espressione simile (Fig. 5a). Il genoma di O. camponoti-rufipedis aveva questo triptofano dimetilalliltransferasi in modo simile; affiancato da CYP e un gene legante FAD, seguito da omologhi e ortologhi dei geni vicini (Fig. 5b). La O. subramanianii s.l. genoma aveva anche un simile triptofano dimetilalliltransferasi. È stato tuttavia affiancato da geni CYP e FAD non omologhi / ortologhi. Infatti O. subramanianii s.l. avevano omologhi / ortologhi di questi geni ma risiedevano su contigui completamente diversi, così come i geni appena fuori dal cluster di metaboliti secondari annotati (Fig. 5b). Inoltre, entrambe le specie australiane non avevano un gene ortologo / omologo che codifica per questo particolare triptofano dimetilalliltransferasi. In effetti, la specie australis del Ghana sembrava non contenere affatto un presunto triptofano dimetilalliltransferasi. Conclusioni simili potrebbero essere tratte analizzando gli altri cluster di metaboliti secondari (Figura supplementare S3). I cluster 7 e 9 di O. kimflemingiae sembravano in gran parte paragonabili rispettivamente ai cluster 31 e 8 di O. camponoti-rufipedis. Tuttavia, i geni associati a questi cluster non erano ancora presenti o erano sparsi nei genomi delle altre tre specie infettanti.
Filogenesi di enterotossine fungine
I geni che contenevano un dominio PFAM di enterotossina annotata (PF01375) e un segnale di secrezione sono stati indicati come enterotossine putative secrete. I risultati precedenti e il nostro attuale studio implicano che i geni che codificano per queste presunte enterotossine sono importanti nelle specie di funghi Ophiocordyceps che manipolano il comportamento.Queste tossine secrete simili ai batteri potrebbero potenzialmente influenzare il comportamento delle formiche interferendo con la produzione di molecole di segnalazione della chemio nellospite. Ciò è stato dimostrato per le enterotossine da entomopatogeni batterici nei feromoni sessuali dei punteruoli23,24. Potrebbero tuttavia funzionare anche come semplici composti letali25. Inoltre, una di queste presunte enterotossine era estremamente sovra regolata solo durante levento di morso manipolato18. Questo particolare gene era presente in tutte le specie di Ophiocordyceps che manipolano le formiche in questo studio, nonché in O. australis-Brazil e O. sinensis. Inoltre, i funghi infettanti le formiche sembravano avere un numero piuttosto elevato di geni che codificano per queste proteine correlate alla patogenicità. Gli altri ascomiceti generalmente contenevano o molto meno (cioè altri entomopatogeni, funghi che infettano nematodi e Magnaporthe oryzae) o nessun gene contenente il dominio di enterotossina (cioè il resto degli ascomiceti in questo studio). I genomi delle specie Ophiocordyceps che infettano le formiche avevano 20-36 enterotossine putative con O. australis-Ghana (n = 20) con il numero più piccolo e O. kimflemingiae (n = 36) con il numero maggiore. I funghi che infettano i nematodi Ophiocordyceps minnesotensis e Drechmeria coniospora contenevano 19 e 25 geni con un dominio PFAM dellenterotossina. Altri entomopatogeni dellordine Ipocreale contenevano solo 4-16 annotazioni di enterotossina con Metarhizium robertsii e Cordyceps bassiana che ne avevano la maggior parte (n = 16 en = 14, rispettivamente). Gli altri genomi di ascomiceti in questo studio non avevano geni codificanti per lenterotossina, ad eccezione del patogeno vegetale M. oryzae, che ne conteneva sei.
Abbiamo costruito un albero filogenetico basato su tutti i geni fungini in questo studio che conteneva il dominio della catena alfa dellenterotossina termolabile PF01375. Le enterotossine sono state segnalate principalmente per le specie batteriche (es. Ref 23,24,25). Abbiamo quindi incluso anche quattro enterotossine batteriche. Ciò ha prodotto un albero basato su 252 regioni di dominio. Per prima cosa abbiamo determinato come le enterotossine delle specie batteriche e infettanti per le piante (cioè M. oryzae) si sarebbero raggruppate rispetto alla maggior parte delle specie che infettano animali (cioè funghi infettanti insetti e nematodi). Ciò ha posto tre enterotossine batteriche in un clade e il quarto in un clade separato (Figura supplementare S4). Unenterotossina batterica, da Leptospira mayottensis, formava un outgroup per il M. oryzae clade che infettava le piante. M. oryzae risiede al di fuori dellordine Hypocreales. Pertanto, le enterotossine patogene delle piante di questa specie sono state utilizzate come outgroup e lalbero è stato radicato su L. mayottensis (Figura complementare S4). Questo albero ha mostrato che alcune enterotossine di funghi che infettano le formiche sono correlate a quelle di altre specie che infettano insetti o nematodi. Altre enterotossine hanno formato i propri cladi. Allinterno di questi cladi specifici per linfezione delle formiche, spesso venivano accoppiate enterotossine delle due specie complesse unilaterali o delle specie complesse australis. Ophiocordyceps subramanianii s.l. le enterotossine spesso formavano loutgroup di un clade specifico unilaterale o australiano (Figura complementare S4). Inoltre, lenterotossina che era altamente regolata durante il comportamento di morso manipolato (cioè GeneID Ophio5 | 373 Figura supplementare S4), così come conservata tra tutte le specie infettanti in questo studio (e O. sinensis, vedi sopra), risiedeva allinterno di un clade che conteneva solo specie manipolatrici di formiche. Ciò indica che questa particolare enterotossina potrebbe effettivamente essere di fondamentale importanza nello stabilire un comportamento manipolato come osservato nelle specie incluse in questo studio.