Molekylær versus morfologiske data Rediger
De egenskaber, der bruges til at oprette et kladogram, kan groft kategoriseres som enten morfologiske (synapsid kranium, varmblodet, notochord, encellede osv.) eller molekylær (DNA, RNA eller anden genetisk information). Før fremkomsten af DNA-sekventering anvendte kladistisk analyse primært morfologiske data. Adfærdsmæssige data (for dyr) kan også bruges.
Da DNA-sekventering er blevet billigere og lettere, er molekylær systematik blevet en mere og mere populær måde at udlede fylogenetiske hypoteser på. Brug af et parsimenskriterium er kun en af flere metoder til at udlede en fylogeni ud fra molekylære data. Tilgange som maksimal sandsynlighed, som indeholder eksplicitte modeller for sekvensudvikling, er ikke-hennigianske måder at evaluere sekvensdata på. En anden kraftfuld metode til rekonstruktion af fylogenier er brugen af genomiske retrotransposonmarkører, som menes at være mindre tilbøjelige til problemet med reversion, der plager sekvensdata. De antages også generelt at have en lav forekomst af homoplasier, fordi man engang troede, at deres integration i genomet var helt tilfældig; dette synes dog i det mindste undertiden ikke at være tilfældet.
Apomorphy i kladistik. Dette diagram indikerer “A” og “C” som forfædre stater, og “B”, “D” og “E” som tilstande, der er til stede i terminal taxa. Bemærk, at i praksis er forfædres forhold ikke kendt a priori (som vist i dette heuristiske eksempel), men skal udledes af mønsteret for delte tilstande observeret i terminalerne. I betragtning af at hver terminal i dette eksempel har en unik tilstand, ville vi i virkeligheden ikke være i stand til at udlede noget afgørende om de forfædre stater (bortset fra det faktum, at eksistensen af ikke-observerede stater “A” og “C” ville være upræcise afledninger! )
Plesiomorphies and synapomorphiesEdit
Forskere skal beslutte, hvilke karaktertilstande der er “forfædre” (plesiomorphies), og hvilke der er afledt (synapomorphies), fordi kun synapomorphic tegntilstande giver bevis for gruppering. Denne bestemmelse udføres normalt ved sammenligning med karaktertilstandene i en eller flere udgrupper. Stater, der er delt mellem udgruppen og nogle medlemmer af gruppen, er symplesiomorphies; stater, der kun er til stede i en delmængde af gruppen, er synapomorfier. Bemærk, at tegntilstande, der er unikke for en enkelt terminal (autapomorfier), ikke giver bevis for gruppering. Valget af en udgruppe er et afgørende skridt i kladistisk analyse, fordi forskellige udgrupper kan producere træer med meget forskellige topologier.
HomoplasiesEdit
En homoplasi er en karaktertilstand, der deles af to eller mere taxa på grund af en anden årsag end almindelig herkomst. De to hovedtyper af homoplasi er konvergens (udvikling af den “samme” karakter i mindst to forskellige slægter) og reversion (tilbagevenden til en forfædres karaktertilstand). Tegn, der tydeligvis er homoplastiske, såsom hvid pels i forskellige slægter fra arktiske pattedyr, bør ikke medtages som et tegn i en fylogenetisk analyse, da de ikke bidrager med noget til vores forståelse af relationer. Imidlertid er homoplasi ofte ikke tydeligt ved inspektion af selve karakteren (som for eksempel i DNA-sekvens) og detekteres derefter ved dets inkongruens (uparsimonious distribution) på et mest parsimonious cladogram. Bemærk, at tegn, der er homoplastiske, stadig kan indeholde fylogenetisk signal.
Et velkendt eksempel på homoplasi på grund af konvergent udvikling ville være karakteren “tilstedeværelse af vinger”. Selvom fugle, flagermus og insekter vinger har den samme funktion, udviklede hver sig uafhængigt, som det kan ses af deres anatomi. Hvis en fugl, flagermus og et vinget insekt blev scoret for karakteren “tilstedeværelse af vinger”, ville en homoplasi blive introduceret i datasættet, og dette kunne potentielt forvirre analysen og muligvis resultere i en falsk hypotese om relationer. Selvfølgelig er den eneste grund til, at et homoplasi kan genkendes i første omgang, fordi der er andre tegn, der antyder et mønster af relationer, der afslører dets homoplastiske fordeling.
Hvad der ikke er et cladogramEdit
Et kladogram er det diagrammatiske resultat af en analyse, der grupperer taxa på basis af synapomorfier alene.Der er mange andre fylogenetiske algoritmer, der behandler data noget forskelligt og resulterer i fylogenetiske træer, der ligner kladogrammer, men som ikke er kladogrammer. For eksempel grupperer fænetiske algoritmer, såsom UPGMA og Neighbor-Joining, efter generel lighed og behandler både synapomorfier og symplesiomorphies som bevis for gruppering. De resulterende diagrammer er fænogrammer, ikke cladogrammer. Tilsvarende er resultaterne af modelbaserede metoder (maksimum Sandsynlighed eller Bayesiske tilgange), der tager højde for både forgreningsrækkefølge og “grenlængde”, tæller både synapomorfier og autapomorfier som bevis for eller imod gruppering. Diagrammerne, der er resultatet af den slags analyse, er heller ikke kladogrammer.
Valg af kladogram Rediger
Der er flere algoritmer til rådighed til at identificere det “bedste” kladogram. De fleste algoritmer bruger en metrik til at måle, hvor konsistent et kandidatkladogram er med dataene. De fleste kladogramalgoritmer bruger de matematiske teknikker til optimering og minimering.
Generelt skal kladogramgenereringsalgoritmer implementeres som computerprogrammer, selvom nogle algoritmer kan udføres manuelt, når datasættene er beskedne (for eksempel bare nogle få arter og et par karakteristika).
Nogle algoritmer er kun nyttige, når de karakteristiske data er molekylære (DNA, RNA); andre algoritmer er kun nyttige, når de karakteristiske data er morfologiske. Andre algoritmer kan bruges, når de karakteristiske data inkluderer både molekylære og morfologiske data.
Algoritmer for cladogrammer eller andre typer fylogenetiske træer inkluderer mindste kvadrater, naboforbindelse, parsimonium, maksimal sandsynlighed og Bayesisk inferens.
Biologer bruger undertiden udtrykket parsimonium for en bestemt type cladogramgenereringsalgoritme og undertiden som en paraplyudtryk for alle fylogenetiske algoritmer.
Algoritmer, der udfører optimeringsopgaver (såsom at bygge cladogrammer) kan være følsom over for rækkefølgen, hvor inputdataene (listen over arter og deres karakteristika) præsenteres. Indsendelse af data i forskellige ordrer kan få den samme algoritme til at producere forskellige “bedste” kladogrammer. I disse situationer skal brugeren indtaste dataene i forskellige ordrer og sammenligne resultaterne.
Brug af forskellige algoritmer på et enkelt datasæt kan undertiden give forskellige “bedste” kladogrammer, fordi hver algoritme kan have en unik definition hvad der er “bedst”.
På grund af det astronomiske antal mulige kladogrammer kan algoritmer ikke garantere, at løsningen er den overordnede bedste løsning. Et ikke-optimalt kladogram vælges, hvis programmet afregner på et lokalt minimum snarere end det ønskede globale minimum. For at hjælpe med at løse dette problem bruger mange cladogram-algoritmer en simuleret annealing-tilgang til at øge sandsynligheden for, at det valgte cladogram er den optimale.
Basalpositionen er retningen af en rodfæstet bases (eller rod) fylogenetisk træ eller cladogram. En basalklade er den tidligste klade (af en given taksonomisk rang), der forgrener sig i en større klade.