Molekylær versus morfologiske dataEdit
Egenskapene som brukes til å lage et kladogram kan grovt kategoriseres som enten morfologiske (synapsidskalle, varmblodet, notokord, encellet, etc.) eller molekylær (DNA, RNA eller annen genetisk informasjon). Før fremkomsten av DNA-sekvensering brukte kladistisk analyse primært morfologiske data. Atferdsdata (for dyr) kan også brukes.
Siden DNA-sekvensering har blitt billigere og enklere, har molekylær systematikk blitt en mer og mer populær måte å utlede fylogenetiske hypoteser på. Å bruke et parsimenskriterium er bare en av flere metoder for å utlede en fylogeni fra molekylære data. Tilnærminger som maksimal sannsynlighet, som inkluderer eksplisitte modeller for sekvensutvikling, er ikke-hennigianske måter å evaluere sekvensdata på. En annen kraftig metode for å rekonstruere fylogenier er bruken av genomiske retrotransposonmarkører, som antas å være mindre utsatt for reversjonsproblemet som plager sekvensdata. De antas også generelt å ha en lav forekomst av homoplasier fordi man en gang trodde at deres integrering i genomet var helt tilfeldig; dette virker i det minste noen ganger ikke å være tilfelle.
Apomorphy i kladistikk. Dette diagrammet indikerer «A» og «C» som forfedretilstander, og «B», «D» og «E» som stater som er tilstede i terminal taxa. Merk at i praksis er ikke forfedre forhold kjent på forhånd (som vist i dette heuristiske eksemplet), men må utledes fra mønsteret av delte tilstander observert i terminalene. Gitt at hver terminal i dette eksemplet har en unik tilstand, ville vi i realiteten ikke være i stand til å utlede noe avgjørende om forfedrenes stater (annet enn det faktum at eksistensen av uobserverte tilstander «A» og «C» ville være upersonlige slutninger! )
Plesiomorphies and synapomorphiesEdit
Forskere må bestemme hvilke karaktertilstander som er «forfedre» (plesiomorphies) og hvilke som er avledet (synapomorphies), fordi bare synapomorphic karaktertilstander gir bevis for gruppering. Denne bestemmelsen gjøres vanligvis ved sammenligning med karaktertilstandene til en eller flere utegrupper. Stater som deles mellom utgruppen og noen medlemmer av gruppen er symplesiomorphies; stater som bare er tilstede i en delmengde av gruppen er synapomorfier. Merk at tegntilstander som er unike for en enkelt terminal (autapomorphies) ikke gir bevis for gruppering. Valget av en utegruppe er et avgjørende trinn i kladistisk analyse fordi forskjellige utegrupper kan produsere trær med dypt forskjellige topologier.
HomoplasiesEdit
En homoplasi er en karaktertilstand som deles av to eller mer taxa på grunn av en annen årsak enn vanlig herkomst. De to hovedtyper av homoplasi er konvergens (evolusjon av den «samme» karakteren i minst to forskjellige linjer) og reversjon (retur til en forfedre karakterstatus). Karakterer som åpenbart er homoplastiske, som hvit pels i forskjellige slekter av arktiske pattedyr, bør ikke inkluderes som et tegn i en fylogenetisk analyse, da de ikke bidrar med noe til vår forståelse av relasjoner. Imidlertid er homoplasi ofte ikke tydelig ved inspeksjon av selve karakteren (som for eksempel i DNA-sekvens), og blir deretter oppdaget ved inkongruens (uparsimonious distribution) på et mest parsimonious cladogram. Merk at tegn som er homoplastiske fremdeles kan inneholde fylogenetisk signal.
Et velkjent eksempel på homoplasi på grunn av konvergent evolusjon vil være karakteren «tilstedeværelse av vinger». Selv om vingene til fugler, flaggermus og insekter har samme funksjon, utviklet hver seg uavhengig, noe som kan sees av deres anatomi. Hvis en fugl, flaggermus og et bevinget insekt ble scoret for karakteren «tilstedeværelse av vinger», ville en homoplasi bli introdusert i datasettet, og dette kan potensielt forvirre analysen, muligens resultere i en falsk hypotese om relasjoner. Selvfølgelig er den eneste grunnen til at en homoplasi er gjenkjennelig i utgangspunktet fordi det er andre tegn som antyder et mønster av relasjoner som avslører dens homoplastiske fordeling.
Hva er ikke et kladogramEdit
Et kladogram er det diagrammatiske resultatet av en analyse, som grupperer taksa på grunnlag av synapomorfier alene.Det er mange andre fylogenetiske algoritmer som behandler data noe annerledes, og resulterer i fylogenetiske trær som ser ut som kladogrammer, men som ikke er kladogrammer. For eksempel grupperer fenetiske algoritmer, som UPGMA og Neighbor-Joining, etter generell likhet, og behandler både synapomorphies og symplesiomorphies som bevis på gruppering. De resulterende diagrammene er fenogrammer, ikke kladogrammer. Tilsvarende er resultatene av modellbaserte metoder (Maximum Sannsynlighet eller Bayesiske tilnærminger) som tar hensyn til både forgreningsrekkefølge og «grenlengde», teller både synapomorfier og autapomorfier som bevis for eller mot gruppering. Diagrammene som er resultatet av den slags analyser er heller ikke kladogrammer.
Cladogram selectionEdit
Det er flere algoritmer tilgjengelig for å identifisere det «beste» kladogrammet. De fleste algoritmer bruker en beregning for å måle hvor konsistent et kandidatkladogram er med dataene. De fleste kladogramalgoritmer bruker matematiske teknikker for optimalisering og minimering.
Generelt må kladogramgenereringsalgoritmer implementeres som dataprogrammer, selv om noen algoritmer kan utføres manuelt når datasettene er beskjedne (for eksempel bare noen få arter og et par egenskaper).
Noen algoritmer er bare nyttige når de karakteristiske dataene er molekylære (DNA, RNA); andre algoritmer er bare nyttige når karakteristiske data er morfologiske. Andre algoritmer kan brukes når de karakteristiske dataene inkluderer både molekylære og morfologiske data.
Algoritmer for kladogrammer eller andre typer fylogenetiske trær inkluderer minste kvadrater, nabo-sammenføyning, parsimonium, maksimal sannsynlighet og Bayesisk inferens.
Biologer bruker noen ganger begrepet parsimonium for en bestemt type kladogramgenereringsalgoritme og noen ganger som et paraplyuttrykk for alle fylogenetiske algoritmer.
Algoritmer som utfører optimaliseringsoppgaver (for eksempel å bygge kladogrammer) kan være følsom overfor rekkefølgen inngangsdataene (listen over arter og deres egenskaper) presenteres. Å legge inn dataene i forskjellige ordrer kan føre til at den samme algoritmen produserer forskjellige «beste» kladogrammer. I disse situasjonene bør brukeren legge inn dataene i forskjellige ordrer og sammenligne resultatene.
Bruk av forskjellige algoritmer på et enkelt datasett kan noen ganger gi forskjellige «beste» kladogrammer, fordi hver algoritme kan ha en unik definisjon av hva som er «best».
På grunn av det astronomiske antallet mulige kladogrammer, kan algoritmer ikke garantere at løsningen er den overordnede beste løsningen. Et ikke-optimalt kladogram vil bli valgt hvis programmet legger seg på et lokalt minimum i stedet for ønsket globalt minimum. For å hjelpe til med å løse dette problemet bruker mange kladogramalgoritmer en simulert glødetilnærming for å øke sannsynligheten for at det valgte kladogrammet er det optimale.
Basalposisjonen er retningen til basen (eller roten) til en rotfestet fylogenetisk tre eller kladogram. En basalklade er den tidligste kladen (av en gitt taksonomisk rang) som forgrener seg i en større klade.