Caractéristiques génomiques
Le projet de génomes Ophiocordyceps généré dans cette étude (Tableau 1) ont été assemblés avec des lectures générées à travers divers cycles de séquençage en utilisant deux types de bibliothèques dADN. Seules les analyses qui ont conduit à des lectures de haute qualité ont été utilisées pour lassemblage (voir Matériaux et méthodes). Lassemblage de Contig a donné des tailles de génome allant de 21,91 à 23,92 millions de paires de bases (Mbp) pour O. unilateralis s.l. et O. australis s.l. espèce. En revanche, O. subramanianii s.l. avait une taille de génome estimée à 32,31 Mb. La prédiction génétique a donné entre 7 621 et 8 629 gènes pour les espèces O. unilateralis et O. australis. Ophiocordyceps subramanianii s.l. a été prédit avoir 11 275 gènes. De plus, le contenu GC dans O. subramanianii s.l. (soit 60,35%) était beaucoup plus élevée que les autres espèces dOphiocordyceps de cette étude (54,66% + / – 1,57%) (Tableau 1).
Nous avons également amélioré lassemblage et la prédiction génique du génome précédemment publié dO. unilateralis sl la souche SC16a (tableau supplémentaire S1), qui a maintenant reçu le nom despèce O. kimflemingiae 20. En plus dêtre moins fragmenté, le nouvel assemblage est plus petit que précédemment rapporté18. Ceci est très probablement dû à un meilleur assemblage de régions répétitives, qui ont été les plus élevées chez les espèces unilateralis (6,59–6,83%) par rapport aux autres espèces infectant les fourmis dans cette étude (tableau 1). Malgré la taille réduite de lassemblage, la nouvelle prédiction génétique a augmenté le nombre de gènes avec 798 gènes. Cette augmentation est principalement causée par la prédiction de moins de chimères (cest-à-dire de gènes voisins qui sont incorrectement fusionnés dans un modèle de gène) en utilisant le pipeline Braker1 (données non présentées).
Pour tous les génomes générés dans cette étude, la prédiction des gènes a été informée par des lectures de RNA-Seq. Pour lespèce unilateralis nord-américaine précédemment signalée O. kimflemingiae, les lectures générées dans cette étude antérieure ont été utilisées18. En raison des difficultés de culture dO. Camponoti-rufipedis brésilien, on na pas obtenu suffisamment de matériel pour générer des données RNA-Seq en plus des lectures dADN nécessaires pour obtenir un projet de génome. Comme O. kimflemingiae et O. camponoti-rufipedis résident dans le même complexe despèces (unilateralis), nous avons tenté de cartographier les lectures despèces unilateralis dAmérique du Nord sur le génome dO. camponoti-rufipedis pour voir si elles pouvaient être utilisées pour informer lannotation. Cependant, alors que 93% des lectures dO. Kimflemingiae sont cartographiées sur son propre génome, seulement 43% sont cartographiées sur le génome dO. camponoti-rufipedis (tableau supplémentaire S2). Nous avons également mappé les lectures sur un autre O. unilateralis s.l. publié. génome, celui de O. polyrhachis-furcata 22, pour déterminer sil sagirait dun effet de cartographie croisée plus général ou spécifique au génome de O. camponoti-rufipedis. Une cartographie similaire de 41% en a résulté. Cela suggère que les espèces unilateralis pourraient généralement être relativement éloignées, ce qui rend la cartographie croisée pour informer lannotation moins appropriée. À des fins dinformation, nous avons également mappé les espèces australis entre elles (souches MAP-64 du Brésil et 1348a du Ghana). Cela a abouti à 71% et 82% de lectures croisées contre 86% et 97% mappés à leurs propres génomes, respectivement (tableau supplémentaire S2). Cela implique que les espèces du complexe australis sont donc probablement beaucoup plus étroitement liées les unes aux autres que les espèces du complexe unilateralis.
Clusters orthologues
Nous avons cherché à déterminer les prédictions génétiques de les espèces dOphiocordyceps infectant les fourmis dans cette étude sont probablement conservées et partagées avec dautres ascomycètes. En outre, nous avons cherché à découvrir quelles spécialisations spécifiques aux espèces et « spécifiques à la manipulation » auraient pu avoir lieu. Ainsi, les protéomes prédits de nos cinq champignons infectant les fourmis ont été comparés à ceux de 18 autres champignons ascomycètes. Parmi ces espèces, dix étaient des parasites animaux (deux mammifères infectieux, deux nématodes infectieux et six insectes infectieux) et 13 résident dans le même ordre (Hypocreales). Quatre espèces appartenaient à la même famille (Ophiocordycipitaceae) et deux appartenaient au même genre (Ophiocordyceps). A la reconstruction phylogénétique basée sur 67 gènes conservés présents dans chacun de ces organismes est représentée sur la figure 2.
Un total de 51 012 clusters orthologues comprenait toutes les protéines annotées de chacun des 23 ascomycètes inclus dans cette analyse (données supplémentaires S1). Des statistiques récapitulatives concernant ce regroupement peuvent être trouvées dans la Figure supplémentaire S1. Nous avons comparé le chevauchement de grappes orthologues entre trois gammes despèces: 1) les champignons infectant les fourmis, qui comprenaient les cinq projets de génomes générés dans cette étude, 2) les autres champignons infectant les insectes Ophiocordyceps sinensis, Tolypocladium inflatum, les deux espèces Metarhizium et Cordyceps et 3) tous les ascomycètes non infectieux par les insectes, qui comprenaient dautres champignons infectant les animaux, les plantes, les champignons et les saprophytes. Les résultats de cette analyse sont représentés dans le diagramme de Venn de la figure 3a. Par la suite, nous avons effectué des analyses denrichissement pour les annotations fonctionnelles des gènes des espèces infectant les fourmis qui ont été trouvés dans les différentes parties qui se chevauchent et ne se chevauchent pas du diagramme. Sur les 7 931 grappes orthologues trouvées dans les trois gammes despèces, les annotations dontologie génique (GO) pour les processus biologiques généraux étaient significativement surreprésentées. Cela suggère, comme on pouvait sy attendre, que les ascomycètes avec des modes de vie différents utilisent des mécanismes similaires pour des processus généraux tels que la transcription, la traduction, le transport des protéines et la transduction du signal. Cependant, les gènes prédits pour coder pour les (petites) protéines sécrétées, les protéines avec des annotations GO pour les processus multi-organismes et la pathogenèse, et plus spécifiquement, les entérotoxines putatives sécrétées, étaient sous-représentés. En effet, lorsque nous avons effectué une analyse denrichissement des annotations présentes dans les grappes orthologues qui nont été trouvées que dans les espèces infectant les fourmis (soit 6672 grappes, Fig. 3a), nous avons trouvé le résultat inverse. Les annotations GO pour les processus biologiques généraux (en grande partie identiques) étaient significativement sous-représentées, tandis que les (petites) protéines sécrétées, les protéines avec des annotations GO pour les processus multi-organismes et la pathogenèse et les entérotoxines putatives étaient surreprésentées. Cela suggère quune partie importante du sécrétome des champignons infectant les fourmis dans cette étude leur est spécifique. Cette spécificité est apparue en partie en raison des entérotoxines qui font partie du sécrétome et des petites protéines sécrétées bioactives (SSP) qui pourraient être importantes dans les interactions fongiques-fourmis. Les (petites) protéines sécrétées étaient également surreprésentées parmi les groupes que les champignons infectant les fourmis partageaient exclusivement avec dautres entomopathogènes (262 groupes) ou des non-entomopathogènes (449 groupes). Cela indique que leurs sécrétomes contiennent également des protéines plus générales spécifiques à lentomopathogène, ainsi que des protéines qui sont exclusivement partagées avec les ascomycètes non entomopathogènes.
Nous avons également examiné comment les grappes orthologues, qui nétaient trouvées que parmi les champignons infectant les fourmis, étaient représentées par ces espèces (Fig. 3b). Sur le total de 6 672 grappes dans cette comparaison, 90,6% semblaient être spécifiques à lespèce. Le chevauchement des grappes était donc marginal même si toutes les espèces de cette étude résident dans le même genre (Ophiocordyceps) et dans certains cas même dans le même complexe despèces (O. unilateralis s.l. et O. australis s.l.). Lanalyse de lenrichissement des termes dannotation fonctionnels dans ces groupes spécifiques despèces a de nouveau abouti à une sur-représentation des (petites) protéines sécrétées. Bien que marginal, la plupart des chevauchements de grappes ont été trouvés entre des espèces plus étroitement apparentées au sein du même complexe (cest-à-dire O. australis s.l., 289 grappes, et O. unilateralis s.l., 182 grappes Fig. 3b). Ici aussi, les analyses denrichissement ont révélé une surreprésentation des (petites) protéines sécrétées. Ainsi, il apparaît quune quantité statistiquement significative du sécrétome fongique de ces espèces infectant les fourmis est soit spécifique du complexe, soit spécifique de lespèce. De plus, nous avons trouvé une surreprésentation des termes GO de pathogénicité parmi les clusters orthologues spécifiques du complexe. Cette découverte pourrait être attribuée à la présence dentérotoxines orthologues chez les espèces du même complexe.Seuls quatre groupes qui nétaient présents dans aucun des autres ascomycètes de notre comparaison ont été partagés entre les cinq espèces infectant les fourmis (Fig. 3b). Aucun de ces quatre groupes na reçu dannotation fonctionnelle, mais trois dentre eux contenaient des gènes avec des signaux de sécrétion prédits. Pour trois des quatre groupes, une analyse BLASTp des gènes par rapport à la base de données NCBI a abouti uniquement à des hits protéiques hypothétiques avec la version précédemment déposée du génome de O. kimflemingiae18. Cela indique que ces groupes pourraient en effet représenter des protéines qui sont uniques aux espèces Ophiocordyceps infectant les fourmis. Les séquences de protéines dans le quatrième groupe ont donné lieu à des hits avec des métalloprotéases en plus de saligner à nouveau avec une protéine hypothétique de O. kimflemingiae (XA68_3159), (tableau supplémentaire S3). Ce cluster pourrait donc contenir des métalloprotéases putatives qui se trouvent uniquement dans les génomes des espèces fongiques infectant les fourmis examinées ici. De plus, seulement 2 des grappes trouvées uniquement dans les champignons infectant les fourmis étaient partagées entre les quatre espèces qui induisent un comportement mordant (Fig. 3b). Une analyse BLASTp des gènes au sein de ces clusters a de nouveau abouti à des attaques protéiques hypothétiques avec la version précédemment déposée du génome de O. kimflemingiae18 (tableau supplémentaire S4).
Gènes de manipulation candidats impliqués dans létablissement du comportement de morsure
Nous avons analysé la conservation des gènes candidats associés à lévénement de piqûre manipulé observé chez les fourmis infectées. Nous avons utilisé des données transcriptomiques publiées antérieurement18 et redéterminé lexpression génique différentielle en cartographiant les données avec la nouvelle version du génome dO. Kimflemingiae. Selon létude publiée précédemment, nous avons suivi le raisonnement selon lequel les gènes candidats, impliqués dans létablissement dun comportement de morsure manipulé, seraient régulés à la hausse pendant cet événement et rapidement à nouveau régulés à la baisse par la suite. Ainsi, 547 gènes candidats ont été identifiés, soit 49 de plus que ce qui avait été rapporté dans lanalyse précédente18. Conformément aux données précédemment rapportées, les gènes impliqués dans la réplication de lADN, les processus doxydoréduction, la sécrétion et le métabolisme secondaire étaient surreprésentés.
La conservation des gènes de manipulation candidats a également été analysée par regroupement orthologue. Nous avons comparé le chevauchement de grappes orthologues contenant ces gènes candidats, qui étaient considérablement régulés à la hausse et à la baisse après avoir manipulé le comportement de morsure chez O. kimflemingiae, avec trois gammes despèces: 1) les autres champignons infectant les fourmis, qui comprenaient les quatre nouveaux projets génomes générés dans cette étude, 2) les autres champignons infectant les insectes, et 3) tous les ascomycètes non infectieux utilisés pour la comparaison plus tôt. Les résultats de cette analyse sont représentés dans le diagramme de Venn de la figure 4. Parmi les gènes de manipulation candidats, 78% semblaient être des orthologues des gènes présents dans les trois autres gammes despèces (cest-à-dire 423 groupes, figure 4). Cela implique que les gènes exprimés lors de la morsure manipulée induite par O. kimflemingiae ne sont probablement pas spécifiques de la manipulation. Parmi ces gènes largement partagés, les CYP et autres fonctions liées à loxydo-réduction étaient surreprésentés, ainsi que les gènes codant pour les protéines et protéases sécrétées. Diverses annotations de métabolisme secondaire (groupes 7, 8 et 9) étaient également surreprésentés parmi ces groupes orthologues plus largement partagés. Ils comprenaient une tryptophane diméthylallyltransférase impliquée dans la synthèse des alcaloïdes de lergot, divers cytochromes, de petites protéines sécrétées, une polycétide synthase (PKS) et un hybride PKS-NRPS (protéine synthétase non ribosomale). Parmi les gènes de manipulation candidats qui semblaient être uniques à O. kimflemingiae (cest-à-dire 59 grappes, figure 4), seuls les SSP étaient surreprésentés. Cependant, 92% de ces gènes « uniques » nont pas reçu dannotation fonctionnelle. Là où un autre chevauchement avec les trois gammes despèces a été trouvé, les SSP étaient également surreprésentées, tout comme les protéines sécrétées plus grosses. Parmi celles présentes uniquement dans les fourmis infectant champignons (soit 24 grappes Fig. 4), là encore la majorité (79%) na pas reçu dannotation fonctionnelle. Parmi les sept grappes orthologues présentes dans toutes les espèces infectant les insectes, mais pas chez les autres ascomycètes, nous avons trouvé un putatif, entérotoxine sécrétée. Cette entérotoxine était présente dans lespèce O. kimflemingiae (deux orthologues), O. camponoti-rufipedis (1 orthologue), O. subramanianii sl (deux orthologues) et O. australis-Ghana (deux orthologues). , ainsi que dans O. australis-Brazil et O. sinensis. De plus, lun des deux orthologues dentérotoxine chez O. kimflemingiae a montré un modèle dexpression dramatique avec un > 3 000 fois supérieur -régulation pendant la manipulation et une régulation à 200 fois vers le bas après 18. Cette entérotoxine pourrait donc potentiellement être un acteur clé important dans la mise en place dune manipulation comportementale par ces espèces dOphiocordyceps.
Conservation des grappes de métabolites secondaires
Une hypothèse générale est que les comportements modifiés de lhôte sont établis par la sécrétion de métabolites secondaires en plus de composés bioactifs plus gros . Cette hypothèse est étayée par la surreprésentation de certains groupes de métabolites secondaires annotés parmi les gènes de O. kimflemingiae qui sont régulés à la hausse lors du comportement de piqûre manipulé18. En les examinant de plus près, nous avons constaté quen effet les gènes, à lintérieur mais aussi directement flanquant les grappes annotées de métabolites secondaires, suivaient ce modèle dexpression particulier (Fig. 5a). Nous avons demandé si ces grappes étaient conservées parmi les champignons Ophiocordyceps infectant les insectes. Cela suggérerait une similitude dans lutilisation de métabolites secondaires par ces champignons pour interagir avec leurs hôtes fourmis afin détablir les comportements manipulés observés. En tant que tel, nous avons examiné les grappes annotées 7, 8 et 9 dO. Kimflemingiae et leurs gènes directement flanquants. Ces groupes 1) ont été régulés à la hausse pendant le comportement de morsure manipulé suivi dune régulation à la baisse significative, et 2) orthologues partagés avec dautres ascomycètes (voir ci-dessus). Pour les gènes au sein de ces groupes, nous avons recherché des homologues (alignement BLASTp) et orthologues (regroupement orthologue) dans les quatre autres champignons infectant les fourmis (Fig. 5b et Figure supplémentaire S3). Cela a démontré que les espèces unilateralis organisaient au moins certains de leurs gènes secondaires liés au métabolisme en grappes largement similaires. Les autres espèces dOphiocordyceps avaient des homologues et orthologues de ces gènes de métabolisme secondaire dispersés dans leurs génomes ou ne contenaient pas du tout de copie (figure 5b et figure supplémentaire S3). Par exemple, le groupe annoté 8 dans O. kimflemingiae contenait une tryptophane diméthylallyltransférase flanquée de CYP liés à loxydo-réduction et un gène avec un domaine de liaison FAD. Ce cluster est directement flanqué de sept gènes qui ont suivi un modèle dexpression similaire (Fig. 5a). Le génome de O. camponoti-rufipedis avait cette tryptophane diméthylallyltransférase dune manière similaire; flanqué de CYP et dun gène de liaison FAD, suivi dhomologues et dorthologues des gènes voisins (figure 5b). Le O. subramanianii s.l. génome avait également une tryptophane diméthylallyltransférase similaire. Il était cependant flanqué de gènes de liaison CYP et FAD non homologues / orthologues. En fait, O. subramanianii s.l. avaient des homologues / orthologues de ces gènes, mais ils résidaient sur des contigs complètement différents, tout comme les gènes juste à lextérieur du cluster annoté de métabolites secondaires (Fig. 5b). De plus, les deux espèces australis navaient pas de gène orthologue / homologue codant pour cette tryptophane diméthylallyltransférase particulière. En fait, lespèce australis du Ghana semblait ne pas contenir du tout de tryptophane diméthylallyltransférase putative. Des conclusions similaires pourraient être tirées en analysant les autres grappes de métabolites secondaires (figure supplémentaire S3). Les grappes 7 et 9 dO. Kimflemingiae semblaient largement comparables aux grappes 31 et 8 dO. Camponoti-rufipedis respectivement. Pourtant, les gènes associés à ces groupes étaient à nouveau absents ou dispersés dans les génomes des trois autres espèces infectant les fourmis.
Phylogénie des entérotoxines fongiques
Les gènes qui contenaient un domaine PFAM dentérotoxine annoté (PF01375) et un signal de sécrétion étaient indiqués comme des entérotoxines putatives sécrétées. Les résultats précédents et notre étude actuelle impliquent que les gènes codant pour ces entérotoxines putatives sont importants dans les espèces de champignons Ophiocordyceps qui manipulent le comportement.Ces toxines de type bactérien sécrétées pourraient potentiellement affecter le comportement des fourmis en interférant avec la production de molécules de signalisation chimio chez lhôte. Cela a été démontré pour les entérotoxines des entomopathogènes bactériens dans les phéromones sexuelles des charançons de la capsule23,24. Ils pourraient cependant également fonctionner comme de simples composés tueurs25. De plus, lune de ces entérotoxines putatives était extrêmement régulée à la hausse uniquement pendant lévénement de piqûre manipulé18. Ce gène particulier était présent dans toutes les espèces dOphiocordyceps manipulant les fourmis dans cette étude, ainsi que dans O. australis-Brazil et O. sinensis. De plus, les champignons infectant les fourmis semblaient avoir un assez grand nombre de gènes codant pour ces protéines liées à la pathogénicité. Dautres ascomycètes contenaient généralement soit beaucoup moins (cest-à-dire dautres entomopathogènes, des champignons infectant les nématodes et Magnaporthe oryzae) ou aucun gène contenant un domaine dentérotoxine (cest-à-dire le reste des ascomycètes dans cette étude). Les génomes des espèces dOphiocordyceps infectant les fourmis contenaient 20 à 36 entérotoxines putatives, O. australis-Ghana (n = 20) ayant le plus petit et O. kimflemingiae (n = 36) le plus grand nombre. Les champignons infectant les nématodes Ophiocordyceps minnesotensis et Drechmeria coniospora contenaient 19 et 25 gènes avec un domaine PFAM dentérotoxine. Dautres entomopathogènes de lordre des Hypocreales ne contenaient que 4 à 16 annotations dentérotoxines, Metarhizium robertsii et Cordyceps bassiana ayant le plus (n = 16 et n = 14, respectivement). Les autres génomes des ascomycètes de cette étude ne possédaient aucun gène codant pour lentérotoxine, à lexception du phytopathogène M. oryzae, qui en contenait six.
Nous avons construit un arbre phylogénétique basé sur tous les gènes fongiques de cette étude qui contenait le domaine de chaîne alpha dentérotoxine thermolabile PF01375. Les entérotoxines ont principalement été signalées pour des espèces bactériennes (par exemple, réf 23,24,25). Nous avons donc également inclus quatre entérotoxines bactériennes. Cela a abouti à un arbre basé sur 252 régions de domaine. Nous avons dabord déterminé comment les entérotoxines des espèces bactériennes et infectieuses des plantes (cest-à-dire M. oryzae) se regrouperaient par rapport à la majorité des espèces infectant les animaux (cest-à-dire les champignons infectant les insectes et les nématodes). Cela a placé trois entérotoxines bactériennes dans un clade et la quatrième dans un clade séparé (figure supplémentaire S4). Une entérotoxine bactérienne, de Leptospira mayottensis, a formé un groupe externe pour le clade M. oryzae, qui infecte les plantes. M. oryzae réside en dehors de lordre Hypocreales. En tant que telles, les entérotoxines phytopathogènes de cette espèce ont été utilisées comme exogroupe et larbre a été enraciné sur L. mayottensis (figure supplémentaire S4). Cet arbre a montré que certaines entérotoxines de champignons infectant les fourmis sont apparentées à celles dautres espèces infectant les insectes ou les nématodes. Dautres entérotoxines formaient leurs propres clades. Au sein de ces clades spécifiques de linfection des fourmis, les entérotoxines des deux espèces complexes unilateralis ou des espèces complexes australis étaient souvent appariées. Ophiocordyceps subramanianii s.l. les entérotoxines formaient souvent lexogroupe dun clade spécifique unilatéral ou australis (figure supplémentaire S4). En outre, lentérotoxine qui était fortement régulée à la hausse pendant le comportement de morsure manipulé (cest-à-dire GeneID Ophio5 | 373 Figure supplémentaire S4), ainsi que conservée parmi toutes les espèces infectant les fourmis dans cette étude (et O. sinensis, voir ci-dessus), résidait au sein dun clade qui ne contenait que des espèces manipulatrices de fourmis. Cela indique que cette entérotoxine particulière pourrait en effet être dune importance clé dans létablissement dun comportement manipulé tel quobservé chez les espèces incluses dans cette étude.