Cechy genomu
Projekt genomów Ophiocordyceps wygenerowanych w tym badaniu (Tabela 1) zebrano z odczytami wygenerowanymi w różnych seriach sekwencjonowania przy użyciu dwóch typów bibliotek DNA. Do montażu wykorzystano tylko przebiegi, które doprowadziły do wysokiej jakości odczytów (patrz Materiały i metody). Złożenie Contig doprowadziło do rozmiarów genomu w zakresie od 21,91–23,92 mln par zasad (Mbp) dla O. unilateralis s.l. i O. australis s.l. gatunki. Natomiast O. subramanianii s.l. miał szacunkową wielkość genomu 32,31 Mb. Przewidywanie genów dało od 7621 do 8629 genów dla gatunków O. unilateralis i O. australis. Ophiocordyceps subramanianii s.l. miał mieć 11 275 genów. Dodatkowo zawartość GC w O. subramanianii s.l. (tj. 60,35%) była znacznie wyższa w porównaniu z innymi gatunkami Ophiocordyceps w tym badaniu (54,66% +/- 1,57%) (Tabela 1).
Poprawiliśmy także składanie i przewidywanie genów wcześniej opublikowanego genomu O. unilateralis sl szczep SC16a (tabela uzupełniająca S1), który obecnie otrzymał nazwę gatunku O. kimflemingiae 20. Oprócz tego, że jest mniej rozdrobniony, nowy zespół jest mniejszy niż wcześniej zgłaszano18. Jest to najprawdopodobniej spowodowane lepszym złożeniem powtarzalnych regionów, które w tym badaniu stwierdzono najwyżej u gatunków unilateralis (6,59–6,83%) w porównaniu z innymi gatunkami zakażającymi mrówki (tab. 1). Pomimo mniejszego rozmiaru złożenia, nowe przewidywanie genów zwiększyło liczbę genów o 798 genów. Ten wzrost jest głównie spowodowany przewidywaniem mniejszej liczby chimer (tj. Sąsiadujących genów, które są nieprawidłowo połączone w jeden model genu) przy użyciu potoku Braker1 (dane niepokazane).
Dla wszystkich genomów z wyjątkiem jednego wygenerowanego w W tym badaniu przewidywanie genów było oparte na odczytach sekwencji RNA. W przypadku wcześniej zgłoszonego północnoamerykańskiego gatunku unilateralis O. kimflemingiae wykorzystano odczyty wygenerowane w tym poprzednim badaniu18. Z powodu trudności z hodowlą brazylijskiego O. camponoti-rufipedis, nie uzyskano wystarczającej ilości materiału do wygenerowania danych RNA-Seq oprócz odczytów DNA potrzebnych do uzyskania szkicowego genomu. Ponieważ zarówno O. kimflemingiae, jak i O. camponoti-rufipedis znajdują się w tym samym kompleksie gatunkowym (unilateralis), podjęliśmy próbę zmapowania odczytów północnoamerykańskiego gatunku unilateralis do genomu O. camponoti-rufipedis, aby sprawdzić, czy można je wykorzystać do sporządzenia adnotacji. Jednakże, podczas gdy 93% odczytów O. kimflemingiae zostało zmapowanych do własnego genomu, tylko 43% zmapowano do genomu O. camponoti-rufipedis (tabela uzupełniająca S2). Dodatkowo przypisaliśmy odczyty do innego opublikowanego O. unilateralis s.l. genom O. polyrhachis-furcata 22, aby określić, czy byłby to bardziej ogólny efekt mapowania krzyżowego, czy specyficzny dla genomu O. camponoti-rufipedis. Uzyskano podobne mapowanie 41%. Sugeruje to, że gatunki unilateralis mogą być generalnie dość daleko spokrewnione, przez co mapowanie krzyżowe w celu informowania adnotacji jest mniej odpowiednie. W celach informacyjnych wykonaliśmy również mapy krzyżowe gatunków australis ze sobą (szczepy MAP-64 z Brazylii i 1348a z Ghany). Spowodowało to 71% i 82% odczytów mapowanych krzyżowo w porównaniu z 86% i 97% mapowanymi odpowiednio do ich własnych genomów (Tabela uzupełniająca S2). Oznacza to, że gatunki w kompleksie australis są zatem prawdopodobnie znacznie bliżej spokrewnione ze sobą niż gatunki w kompleksie unilateralis.
Klastry ortologiczne
Rozpoczęliśmy badanie, które przewidywania genów gatunki Ophiocordyceps zakażające przeciwciała w tym badaniu są prawdopodobnie zachowane i dzielone z innymi workowcami. Ponadto chcieliśmy odkryć, jakie specyficzne dla gatunku i „specyficzne dla manipulacji” specjalizacje mogły mieć miejsce. W związku z tym przewidywane proteomy naszych pięciu grzybów przeciwdziałających infekcjom porównano z 18 innymi grzybami workowatymi. Z tych gatunków dziesięć były pasożytami zwierzęcymi (dwa infekujące ssaki, dwa infekujące nicienie i sześć infekujących owadów), a 13 żyje w tym samym rzędzie (Hypocreales). Cztery gatunki należały do tej samej rodziny (Ophiocordycipitaceae), a dwa należały do tego samego rodzaju (Ophiocordyceps). rekonstrukcję filogenetyczną opartą na 67 konserwatywnych genach obecnych w każdym z tych organizmów przedstawiono na ryc. 2.
Łącznie 51 012 ortologicznych klastrów obejmowało wszystkie opisane białka każdego z 23 workowców objętych tą analizą (dane uzupełniające S1). Podsumowanie statystyk dotyczących tego grupowania można znaleźć na uzupełniającym rysunku S1. Porównaliśmy nakładanie się skupisk ortologicznych między trzema zakresami gatunkowymi: 1) grzyby przeciwzakaźne, które obejmowały wszystkie pięć genomów szkicowych wygenerowanych w tym badaniu, 2) inne grzyby infekujące owady Ophiocordyceps sinensis, Tolypocladium inflatum, oba gatunki Metarhizium i oba gatunki Cordyceps i 3) wszystkie workowce niezakażające owadów, w tym inne grzyby infekujące zwierzęta, rośliny, grzyby i saprofityczne. Wyniki tej analizy przedstawiono na diagramie Venna na rys. 3a. Następnie przeprowadziliśmy analizy wzbogacenia dla funkcjonalnych adnotacji genów gatunków zakażających mrówki, które zostały znalezione w różnych nakładających się i nienakładających się częściach diagramu. Spośród 7931 ortologicznych klastrów, które znaleziono we wszystkich trzech zakresach gatunków, adnotacje Gene Ontology (GO) dotyczące ogólnych procesów biologicznych były znacznie nadreprezentowane. Sugeruje to, jak można się spodziewać, że workowce prowadzące różne style życia wykorzystują podobne mechanizmy w procesach ogólnych, takich jak transkrypcja, translacja, transport białek i transdukcja sygnałów. Jednak geny, które według przewidywań kodują (małe) białka wydzielane, białka z adnotacjami GO dla procesów wieloorganicznych i patogenezy, a dokładniej, wydzielane przypuszczalne enterotoksyny, były niedostatecznie reprezentowane. Rzeczywiście, kiedy przeprowadziliśmy analizę wzbogacenia adnotacji obecnych w skupieniach ortologicznych, które zostały znalezione tylko w gatunkach infekujących mrówki (tj. 6672 klastry, ryc. 3a), uzyskaliśmy odwrotny wynik. Adnotacje GO dotyczące (w większości tych samych) ogólnych procesów biologicznych były znacząco niedostatecznie reprezentowane, podczas gdy (małe) białka wydzielane, białka z adnotacjami GO dla procesów wielorakich i patogenezy oraz domniemane enterotoksyny były nadreprezentowane. Sugeruje to, że znaczna część sekretu grzybów infekujących mrówki w tym badaniu jest specyficzna dla nich. Ta specyficzność pojawiła się częściowo z powodu enterotoksyn, które są częścią sekretu i bioaktywnych małych wydzielanych białek (SSP), które mogą być ważne w interakcjach między grzybami a mrówkami. (Małe) wydzielane białka były również nadreprezentowane w klastrach, w których grzyby infekujące przeciwciała były wspólne albo z innymi entomopatogenami (262 klastry), albo nie-entomopatogenami (449 klastrów). Oznacza to, że ich wydzieliny zawierają również bardziej ogólne białka specyficzne dla entomopatogenów, a także białka, które są wspólne wyłącznie z nie entomopatogennymi workowcami.
Zbadaliśmy również, w jaki sposób skupiska ortologiczne, które znaleziono jedynie wśród grzybów infekujących mrówki, były reprezentowane przez te gatunki (ryc. 3b). Spośród 6 672 klastrów w tym porównaniu 90,6% wydaje się być specyficznymi gatunkami. Nakładanie się klastrów było zatem marginalne, mimo że wszystkie gatunki w tym badaniu zamieszkują ten sam rodzaj (Ophiocordyceps), aw niektórych przypadkach nawet w ramach tego samego kompleksu gatunkowego (O. unilateralis s.l. i O. australis s.l.). Analiza wzbogacenia funkcjonalnych terminów adnotacji w tych specyficznych dla gatunku skupieniach ponownie doprowadziła do nadreprezentacji (małych) wydzielanych białek. Chociaż marginalne, większość nakładających się klastrów stwierdzono między bliżej spokrewnionymi gatunkami w tym samym kompleksie (tj. O. australis s.l., 289 gromad i O. unilateralis s.l., 182 klastry Ryc. 3b). Również tutaj analizy wzbogacenia ujawniły nadreprezentację (małych) białek wydzielniczych. Zatem wydaje się, że statystycznie znacząca ilość sekretu grzybów tych gatunków zakażających przeciwciała jest albo złożona, albo specyficzna dla gatunku. Ponadto stwierdziliśmy nadreprezentację terminów patogeniczności GO wśród złożonych, specyficznych ortologicznych klastrów. To odkrycie można przypisać obecności ortologicznych enterotoksyn u gatunków należących do tego samego kompleksu.Tylko cztery skupiska, które nie były obecne w żadnym z pozostałych workowców w naszym porównaniu, były wspólne dla wszystkich pięciu gatunków infekujących (ryc. 3b). Żaden z tych czterech skupisk nie otrzymał funkcjonalnej adnotacji, ale trzy z nich zawierały geny z przewidywanymi sygnałami wydzielania. W przypadku trzech z czterech klastrów analiza genów BLASTp względem bazy danych NCBI dała jedynie hipotetyczne trafienia w białka z wcześniej zdeponowaną wersją genomu O. kimflemingiae18. Wskazuje to, że te klastry mogą rzeczywiście reprezentować białka, które są unikalne dla gatunków Ophiocordyceps. Sekwencje białek w czwartym klastrze spowodowały trafienia z metaloproteazami, oprócz ponownego dopasowania z hipotetycznym białkiem z O. kimflemingiae (XA68_3159), (tabela uzupełniająca S3). Ta grupa może zatem zawierać przypuszczalne metaloproteazy, które znajdują się wyłącznie w genomach badanych tu gatunków grzybów infekujących mrówki. Co więcej, tylko 2 skupiska występujące wyłącznie w grzybach infekujących przeciwciała były wspólne dla wszystkich czterech gatunków wywołujących gryzienie (ryc. 3b). Analiza BLASTp genów w tych klastrach ponownie zaowocowała hipotetycznymi trafieniami białek w poprzednio zdeponowaną wersję genomu O. kimflemingiae18 (tabela uzupełniająca S4).
Kandydujące geny manipulacji zaangażowane w ustalenie zachowania gryzącego
Przeanalizowaliśmy zachowanie genów kandydatów związanych z manipulowanym ugryzieniem obserwowanym u zarażonych mrówek. Wykorzystaliśmy wcześniej opublikowane dane transkryptomiczne18 i ponownie określiliśmy różnicową ekspresję genów, mapując dane do nowej wersji genomu O. kimflemingiae. Zgodnie z wcześniej opublikowanym badaniem, postępowaliśmy zgodnie z rozumowaniem, że geny kandydatów, zaangażowane w ustalanie zmanipulowanego zachowania gryzącego, byłyby regulowane w górę podczas tego zdarzenia i szybko ponownie regulowane w dół. W związku z tym zidentyfikowano 547 genów kandydujących, czyli o 49 więcej niż podano w poprzedniej analizie18. Zgodnie z wcześniej przedstawionymi danymi, geny zaangażowane w replikację DNA, procesy utleniania-redukcji, wydzielanie i wtórny metabolizm były nadreprezentowane.
Zachowanie genów do manipulacji kandydatami zostało również przeanalizowane poprzez grupowanie ortologiczne. Porównaliśmy nakładanie się ortologicznych klastrów zawierających te geny kandydatów, które były znacznie zwiększone i zmniejszone po manipulowanym zachowaniu gryzącym u O. kimflemingiae, z trzema zakresami gatunkowymi: 1) inne grzyby infekujące mrówki, które obejmowały cztery nowe wersje robocze genomy wygenerowane w tym badaniu, 2) inne grzyby infekujące owady i 3) wszystkie workowce niezakażające owadów użyte wcześniej do porównania. Wyniki tej analizy przedstawiono na diagramie Venna na fig. 4. Spośród kandydatów do manipulacji genami, 78% okazało się ortologami genów obecnych we wszystkich pozostałych trzech gatunkach (tj. 423 klastry, fig. 4). Oznacza to, że geny wyrażane podczas manipulowanego gryzienia wywołanego przez O. kimflemingiae nie są prawdopodobnie specyficzne dla manipulacji. Wśród tych szeroko wspólnych genów nadreprezentowane były CYP i inne funkcje związane z utlenianiem i redukcją, a także geny kodujące białka wydzielane i proteazy. Różne adnotacje dotyczące wtórnego metabolizmu (klastry 7, 8 i 9) były również nadreprezentowane wśród tych bardziej rozpowszechnionych skupień ortologicznych. Obejmowały one tryptofanową dimetyloallilotransferazę zaangażowaną w syntezę alkaloidów sporyszu, różne cytochromy, małe białka wydzielane, syntazę poliketydową (PKS) i hybrydę PKS-NRPS (nie-rybosomalna syntetaza białkowa). Wśród potencjalnych genów manipulacji, które wydawały się być unikalne dla O. kimflemingiae (tj. 59 klastrów, ryc. 4), tylko SSP były nadreprezentowane. Jednak 92% tych „unikalnych” genów nie otrzymało funkcjonalnej adnotacji. Tam, gdzie stwierdzono jakiekolwiek inne pokrywanie się z trzema zakresami gatunków, nadreprezentowane były również SSP, podobnie jak większe białka wydzielane. grzybów (tj. 24 skupiska ryc. 4), ponownie większość (79%) nie otrzymała adnotacji funkcjonalnej. Spośród siedmiu ortologicznych skupisk, które były obecne we wszystkich gatunkach infekujących owady, ale nie u innych workowców, znaleźliśmy domniemane, wydzielana enterotoksyna. Ta enterotoksyna była obecna w wywołujących gryzienie gatunkach O. kimflemingiae (dwa ortologi), O. camponoti-rufipedis (1 ortolog), O. subramanianii sl (dwa ortologi) i O. australis-Ghana (dwa ortologi) , a także w O. australis-Brazil i O. sinensis. Ponadto jeden z dwóch ortologów enterotoksyn w O. kimflemingiae wykazał dramatyczny wzór ekspresji z > 3000 razy w górę -regulacja podczas manipulacji i 200-krotna regulacja w dół po 18. Ta enterotoksyna mogłaby zatem być potencjalnie ważnym kluczowym graczem w ustanowieniu manipulacji behawioralnej przez te gatunki Ophiocordyceps.
Zachowanie wtórnych skupisk metabolitów
Ogólna hipoteza jest taka, że zmienione zachowania gospodarza są ustalane poprzez wydzielanie wtórnych metabolitów oprócz większych związków bioaktywnych . Hipotezę tę potwierdza nadreprezentacja pewnych opisanych grup wtórnych metabolitów wśród genów O. kimflemingiae, które są regulowane w górę podczas manipulowanego gryzienia18. Badając je dokładniej, stwierdziliśmy, że rzeczywiście geny, w obrębie, ale również bezpośrednio flankujące opisane klastry wtórnych metabolitów, podążały za tym szczególnym wzorem ekspresji (ryc. 5a). Zapytaliśmy, czy te skupiska były zachowane wśród infekujących owady grzybów Ophiocordyceps. Sugerowałoby to podobieństwo w stosowaniu wtórnych metabolitów przez te grzyby do interakcji z ich żywicielami-mrówkami w celu ustalenia obserwowanych manipulowanych zachowań. W związku z tym zbadaliśmy z adnotacjami klastry 7, 8 i 9 O. kimflemingiae i ich bezpośrednio flankujące geny. Klastry te 1) były regulowane w górę podczas manipulowanego zachowania gryzącego, po którym nastąpiła znaczna regulacja w dół, i 2) wspólne ortologi z innymi workowcami (patrz powyżej). W przypadku genów w tych skupieniach szukaliśmy homologów (dopasowanie BLASTp) i ortologów (grupowanie ortologiczne) w pozostałych czterech grzybach infekujących przeciwciała (ryc. 5b i ryc. Uzupełniająca S3). To pokazało, że gatunki unilateralis zorganizowały przynajmniej część swoich genów związanych z wtórnym metabolizmem w w dużej mierze podobne skupiska. Inne gatunki Ophiocordyceps miały homologi i ortologi tych genów wtórnego metabolizmu rozproszone w swoich genomach lub w ogóle nie zawierały kopii (ryc. 5b i rysunek uzupełniający S3). Na przykład, odnotowany klaster 8 w O. kimflemingiae zawierał tryptofanową dimetyloallilotransferazę flankowaną przez CYP związane z utlenianiem-redukcją i gen z domeną wiążącą FAD. Ten klaster jest bezpośrednio flankowany przez siedem genów, które podlegały podobnemu wzorowi ekspresji (ryc. 5a). Genom O. camponoti-rufipedis miał tę tryptofanową dimetyloallilotransferazę w podobny sposób; oflankowane przez CYP i gen wiążący FAD, a następnie homologi i ortologi sąsiednich genów (ryc. 5b). O. subramanianii s.l. genom miał również podobną tryptofanową dimetyloallilotransferazę. Został jednak otoczony przez niehomologiczne / ortologiczne geny wiążące CYP i FAD. W rzeczywistości O. subramanianii s.l. miały homologi / ortologi tych genów, ale znajdowały się one na zupełnie innych kontigach, podobnie jak geny znajdujące się tuż poza opisanym drugorzędowym klastrem metabolitów (ryc. 5b). Co więcej, oba gatunki australis nie miały ortologicznego / homologicznego genu kodującego tę konkretną dimetyloallilotransferazę tryptofanu. W rzeczywistości wydaje się, że gatunki australis z Ghany w ogóle nie zawierają domniemanej dimetyloallilotransferazy tryptofanowej. Podobne wnioski można wyciągnąć analizując inne skupiska wtórnych metabolitów (rysunek uzupełniający S3). Gromady 7 i 9 z O. kimflemingiae wydawały się w dużej mierze porównywalne z gromadami 31 i 8 odpowiednio z O. camponoti-rufipedis. Jednak geny powiązane z tymi klastrami ponownie albo nie były obecne, albo były rozproszone w genomach trzech innych gatunków infekujących przeciwciała.
Filogeneza enterotoksyn grzybowych
Geny, które zawierały domenę PFAM z przypisaną enterotoksyną (PF01375) i sygnał wydzielniczy wskazano jako przypuszczalne, wydzielane enterotoksyny. Poprzednie wyniki i nasze obecne badania wskazują, że geny kodujące te przypuszczalne enterotoksyny mają znaczenie w gatunkach grzybów Ophiocordyceps manipulujących zachowaniem.Te wydzielane przez bakterie toksyny mogą potencjalnie wpływać na zachowanie mrówek, zakłócając wytwarzanie cząsteczek sygnalizujących chemię u gospodarza. Zostało to wykazane w przypadku enterotoksyn z bakteryjnych entomopatogenów w feromonach płciowych ryjkowca żółciowego23,24. Mogą jednak również działać jako zwykłe związki zabijające25. Ponadto jedna z tych domniemanych enterotoksyn była wyjątkowo silnie podwyższona tylko podczas manipulowanego zdarzenia gryzienia18. Ten konkretny gen był obecny we wszystkich gatunkach Ophiocordyceps manipulujących mrówkami w tym badaniu, a także u O. australis-Brazil i O. sinensis. Co więcej, grzyby infekujące przeciwciała wydawały się mieć dość dużą liczbę genów kodujących te białka związane z patogennością. Inne workowce generalnie zawierały znacznie mniej (tj. Inne entomopatogeny, grzyby zakażające nicienie i Magnaporthe oryzae) lub nie zawierały genów zawierających domenę enterotoksyn (tj. Pozostała część workowców w tym badaniu). Genomy infekujących przeciwciała gatunków Ophiocordyceps zawierały 20–36 przypuszczalnych enterotoksyn, przy czym O. australis-Ghana (n = 20) miało najmniejszą, a O. kimflemingiae (n = 36) – największą. Grzyby infekujące nicienie Ophiocordyceps minnesotensis i Drechmeria coniospora zawierały 19 i 25 genów z domeną enterotoksyny PFAM. Inne entomopatogeny z rzędu Hypocreales zawierały tylko 4–16 adnotacji enterotoksyn, przy czym najwięcej było Metarhizium robertsii i Cordyceps bassiana (odpowiednio n = 16 i n = 14). Inne genomy workowców w tym badaniu nie miały żadnych genów kodujących enterotoksyny, z wyjątkiem patogenu roślinnego M. oryzae, który zawierał sześć.
W tym badaniu zbudowaliśmy drzewo filogenetyczne na podstawie wszystkich genów grzybów, które zawierał domenę łańcucha alfa enterotoksyny PF01375 nietrwałej termicznie. Enterotoksyny były najczęściej opisywane w przypadku gatunków bakterii (np. Ref. 23,24,25). Dlatego włączyliśmy również cztery enterotoksyny bakteryjne. W rezultacie powstało drzewo oparte na 252 regionach domen. Najpierw ustaliliśmy, w jaki sposób enterotoksyny z gatunków bakterii i roślin (tj. M. oryzae) będą się gromadzić w odniesieniu do większości gatunków zakażających zwierzęta (tj. Grzybów zakażających owady i nicienie). To umieściło trzy bakteryjne enterotoksyny w jednym kladzie, a czwarty w oddzielnym kladzie (rysunek uzupełniający S4). Jedna bakteryjna enterotoksyna z Leptospira mayottensis utworzyła grupę zewnętrzną dla infekującego rośliny kladu M. oryzae. M. oryzae zamieszkuje poza rzędem Hypocreales. W związku z tym enterotoksyny chorobotwórcze dla roślin tego gatunku zostały użyte jako grupa zewnętrzna i drzewo zostało zakorzenione na L. mayottensis (rysunek uzupełniający S4). Drzewo to wykazało, że niektóre enterotoksyny grzybów przeciwdziałających infekcjom są spokrewnione z tymi z innych gatunków infekujących owady lub nicienie. Inne enterotoksyny utworzyły własne klady. W obrębie tych kladów specyficznych dla infekcji mrówek często łączy się w pary enterotoksyny z dwóch złożonych gatunków unilateralis lub gatunków australis. Ophiocordyceps subramanianii s.l. Enterotoksyny często tworzyły grupę zewnętrzną do kladu specyficznego dla jednostronnych lub australis (rysunek uzupełniający S4). Ponadto enterotoksyna, która była silnie zwiększona podczas manipulowanego zachowania gryzącego (tj. GeneID Ophio5 | 373 Rysunek uzupełniający S4), jak również konserwowana wśród wszystkich gatunków zakażonych przez mrówki w tym badaniu (i O. sinensis, patrz powyżej), przebywała wewnątrz kladu, który zawierał tylko gatunki manipulujące mrówkami. Wskazuje to, że ta konkretna enterotoksyna może rzeczywiście mieć kluczowe znaczenie w ustalaniu zmanipulowanego zachowania, jak zaobserwowano u gatunków objętych tym badaniem.