Arvelighet

Siden bare P kan observeres eller måles direkte, må arvelighet estimeres ut fra likhetene som er observert hos personer som varierer i nivå med genetisk eller miljømessig likhet. De statistiske analysene som kreves for å estimere de genetiske og miljømessige variantskomponentene, avhenger av prøveegenskapene. Kort fortalt oppnås bedre estimater ved hjelp av data fra individer med vidt forskjellige nivåer av genetisk forhold – som tvillinger, søsken, foreldre og avkom, snarere enn fra fjernere beslektede (og derfor mindre like) forsøkspersoner. Standardfeilen for arvelighetsestimater forbedres med store utvalgstørrelser.

I ikke-menneskelige populasjoner er det ofte mulig å samle informasjon på en kontrollert måte. Blant husdyr er det for eksempel enkelt å ordne at en okse produserer avkom fra et stort antall kyr og å kontrollere miljøer. Slik eksperimentell kontroll er vanligvis ikke mulig når man samler inn menneskelige data, avhengig av naturlig forekommende forhold og miljøer.

I klassisk kvantitativ genetikk var det to tankegang angående estimering av arvelighet.

En tankegang ble utviklet av Sewall Wright ved University of Chicago, og ytterligere popularisert av CC Li (University of Chicago) og JL Lush (Iowa State University). Den er basert på analysen av korrelasjoner og, i forlengelse, regresjon. Path Analysis ble utviklet av Sewall Wright som en måte å estimere arvelighet på.

Den andre ble opprinnelig utviklet av RA Fisher og utvidet ved University of Edinburgh, Iowa State University og North Carolina State University, samt andre skoler. Den er basert på variansanalysen i avlsstudier, ved bruk av intraklassekorrelasjon av slektninger. Ulike metoder for å estimere varianskomponenter (og dermed arvelighet) fra ANOVA brukes i disse analysene.

I dag kan arvelighet estimeres fra generelle stamtavler ved bruk av lineære blandede modeller og fra genomisk sammenheng estimert fra genetiske markører. .

Studier av menneskelig arvelighet benytter seg ofte av adopsjonstudiedesign, ofte med identiske tvillinger som har blitt skilt tidlig i livet og oppvokst i forskjellige miljøer. Slike individer har identiske genotyper og kan brukes til å skille effekten av genotype og miljø. En grense for dette designet er det vanlige prenatale miljøet og det relativt lave antallet tvillinger oppdratt fra hverandre. En andre og mer vanlig design er tvillingstudien der likheten mellom identiske og broderlige tvillinger brukes til å estimere arvelighet. Disse studiene kan begrenses av det faktum at eneggede tvillinger ikke er helt genetisk identiske, noe som potensielt kan resultere i en undervurdering av arvelighet.

I observasjonsstudier, eller på grunn av stemningsfulle effekter (der et genom fremkaller miljøer ved sin effekt på dem), kan G og E være covary: genmiljø korrelasjon. Avhengig av metodene som brukes til å estimere arvelighet, kan korrelasjoner mellom genetiske faktorer og delte eller ikke-delte miljøer forveksles med arvelighet eller ikke.

Regresjons- / korrelasjonsmetoder for estimering Rediger

The første estimeringsskole bruker regresjon og korrelasjon for å estimere arvelighet.

Sammenligning av nære slektninger Rediger

I sammenligningen av slektninger finner vi at generelt,

h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}

der r kan betraktes som koeffisienten for relasjon, b er regresjonskoeffisienten og t er korrelasjonskoeffisienten.

Regresjon av foreldre-avkomEdit

Figur 2. Sir Francis Galtons (1889) data som viser forholdet mellom avkomhøyde (928 individer) som en funksjon av gjennomsnittlig foreldrehøyde (205 sett med foreldre).

Arvelighet kan estimeres ved å sammenligne foreldre og o ffspring trekk (som i fig. 2). Linjens skråning (0,57) tilnærmer seg arvbarheten til egenskapen når avkomverdiene regreserer mot gjennomsnittet hos foreldrene. Hvis bare en av foreldrenes verdi brukes, er arvbarheten to ganger skråningen. (Merk at dette er kilden til begrepet «regresjon», siden avkomverdiene alltid har en tendens til å gå tilbake til gjennomsnittsverdien for befolkningen, dvs. er alltid mindre enn en). Denne regresjonseffekten ligger også til grunn for DeFries – Fulker-metoden for å analysere tvillinger valgt for ett medlem som blir berørt.

Søsken sammenligning Rediger

En grunnleggende tilnærming til arvelighet kan være tatt ved bruk av full-Sib-design: sammenligning av likhet mellom søsken som deler både en biologisk mor og en far. Når det bare er additiv genhandling, er denne søskenfenotypiske korrelasjonen en indeks for fortrolighet – summen av halvparten av den additive genetiske variansen pluss full effekt av det felles miljøet.Det plasserer således en øvre grense for additiv arvelighet på dobbelt så full fenotypisk korrelasjon. Half-Sib-design sammenligner fenotypiske trekk fra søsken som deler en forelder med andre søskengrupper.

Twin studiesEdit
Hovedartikkel: Twin study

Figur 3. Tvillingkonkordanser for syv psykologiske trekk (prøvestørrelse vist i søyler), hvor DZ er broderlig og MZ er identiske tvillinger.

Arvelighet for egenskaper hos mennesker estimeres hyppigst ved å sammenligne likheter mellom tvillinger. «Fordelen med tvillingstudier er at den totale variansen kan deles opp i genetiske, delte eller vanlige miljømessige og unike miljøkomponenter, noe som muliggjør en nøyaktig estimering av arvelighet». Broderlige eller dizygotiske (DZ) tvillinger deler i gjennomsnitt halvparten av genene (forutsatt at det ikke er noen assortativ parring for egenskapen), og så identiske eller monozygotiske (MZ) tvillinger i gjennomsnitt er dobbelt så genetisk like som DZ-tvillinger. Et grovt estimat av arvelighet er da omtrent dobbelt så stor forskjell i korrelasjonen mellom MZ og DZ tvillinger, dvs. Falconer formel H2 = 2 (r (MZ) -r (DZ)).

Effekten av delt miljø, c2, bidrar til likhet mellom søsken på grunn av det felles miljøet de er oppvokst i. Delt miljø er tilnærmet av DZ-korrelasjonen minus halv arvelighet, som er i hvilken grad DZ-tvillinger deler de samme genene, c2 = DZ-1 / 2h2. Unik miljøvarians, e2, gjenspeiler graden som identiske tvillinger oppdratt sammen er forskjellige, e2 = 1-r (MZ).

Analyse av variansmetoder for estimering Rediger

Det andre settet med metoder for estimering av arvelighet involverer ANOVA og estimering av varianskomponenter.

Grunnleggende modellEdit

Vi bruker den grunnleggende diskusjonen om Kempthorne. genetiske modeller, kan vi se på det kvantitative bidraget til et enkelt sted med genotype Gi som

yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}

der gi {\ displaystyle g_ {i}} er effekten av genotype Gi og e {\ displaystyle e} er miljøeffekten.

Vurder et eksperiment med en gruppe stammer og deres avkom fra tilfeldige demninger. Siden avkom får halvparten av genene fra faren og halvparten fra sin (tilfeldige) mor, er avkomligningen

zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}

Intraclass correlationsEdit

Vurder eksperimentet ovenfor. Vi har to grupper av avkom vi kan sammenligne. Den første er å sammenligne de forskjellige avkommene til en individuell far (kalt innen fargruppe). Variansen vil inkludere vilkår for genetisk varians (siden de ikke alle fikk den samme genotypen) og miljøvarians. Dette blir tenkt på som et feiluttrykk.

Den andre gruppen av avkom er sammenligninger av middel for halvsøsken med hverandre (kalt blant fargruppen). I tillegg til feilbegrepet som i innen fargruppene, har vi en tilleggsbetegnelse på grunn av forskjellene mellom forskjellige metoder for halvsøsken. Intraklassekorrelasjonen er

corr (z, z ′) = corr (μ + 1 2 g + e, μ + 1 2 g + e ) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z «) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e») = {\ frac {1} {4}} V_ {g}},

siden miljøeffekter er uavhengige av hverandre.

ANOVAEdit

Bruken av ANOVA for å beregne arvelighet mislykkes ofte å redegjøre for tilstedeværelsen av gen-miljø-interaksjoner, fordi ANOVA har en mye lavere statistisk kraft for å teste for interaksjonseffekter enn for direkte effekter.

Modell med additiv- og dominansbetingelserEdit

For en modell med tilsetnings- og dominansbetingelser, men ikke andre, ligningen for et enkelt sted er

yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}

der

Eksperimenter kan kjøres med et lignende oppsett som det som er gitt i tabell 1. Bruk av annet forhold grupper, kan vi evaluere forskjellige intraklassekorrelasjoner. Ved å bruke V a {\ displaystyle V_ {a}} som additiv genetisk varians og V d {\ displaystyle V_ {d}} som avviksavvik for dominans, blir intraklassekorrelasjoner lineære funksjoner av disse parametrene. Generelt

Korrelasjon mellom klasser = r V a + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}

hvor r {\ displaystyle r} og θ {\ displaystyle \ theta} blir funnet som

r = {\ displaystyle r =} P, og

θ = {\ displaystyle \ theta =} P.

Noen vanlige relasjoner og deres koeffisienter er gitt i tabell 2.

Lineære blandede modeller Rediger

Et bredt utvalg tilnærminger ved bruk av lineære blandede modeller er rapportert i litteraturen. Via disse metodene fordeles fenotypisk varians i genetiske, miljømessige og eksperimentelle designvarianter for å estimere arvelighet.Miljøvarians kan eksplisitt modelleres ved å studere individer over et bredt spekter av miljøer, selv om slutning av genetisk avvik fra fenotypisk og miljømessig variasjon kan føre til undervurdering av arvelighet på grunn av utfordringen med å fange hele spekteret av miljøpåvirkning som påvirker et trekk. Andre metoder for å beregne arvelighet bruker data fra genomdekkende assosiasjonsstudier for å estimere innflytelsen på et trekk av genetiske faktorer, noe som gjenspeiles av frekvensen og innflytelsen av antagelig assosierte genetiske steder (vanligvis enkeltnukleotidpolymorfier) på egenskapen. Dette kan imidlertid føre til undervurdering av arvelighet. Dette avviket blir referert til som «manglende arvelighet» og gjenspeiler utfordringen med nøyaktig modellering av både genetisk og miljømessig varians i arvelighetsmodeller.

Når en stor, kompleks stamtavle eller en annen nevnte type data er tilgjengelig, er arvelighet og andre kvantitative genetiske parametere kan estimeres ved begrenset maksimal sannsynlighet (REML) eller Bayesian-metoder. Rådataene vil vanligvis ha tre eller flere datapunkter for hver enkelt: en kode for faren, en kode for demningen og en eller flere egenskaper. Ulike egenskaper kan være for forskjellige egenskaper eller for forskjellige tidspunkter for måling.

Den for tiden populære metoden er avhengig av høy grad av sikkerhet over identiteten til faren og demningen; det er ikke vanlig å behandle faridentiteten sannsynlig. Dette er vanligvis ikke et problem, siden metodikken sjelden blir brukt på ville bestander (selv om den har blitt brukt i flere villdyr- og fuglebestander), og herrer er alltid kjent med meget høy grad av sikkerhet i avlsprogrammer. Det er også algoritmer som utgjør usikker farskap.

Stamtavler kan sees ved hjelp av programmer som Pedigree Viewer, og analyseres med programmer som ASReml, VCE, WOMBAT, MCMCglmm i R-miljøet eller BLUPF90-familien av programmer.

Stamtavlemodeller er nyttige for å løse sammenblandinger som omvendt årsakssammenheng, maternelle effekter som det prenatale miljøet, og forvirring av genetisk dominans, delt miljø og maternelle geneffekter.

Genomisk arvelighet Rediger

Når genotypedata og fenotyper fra store populasjonsprøver er tilgjengelige, kan man estimere forholdet mellom individer basert på deres genotyper og bruke en lineær blandet modell for å estimere variansen forklart av den genetiske markører. Dette gir et genomisk arvelighetsestimat basert på varians fanget av vanlige genetiske varianter. Det er flere metoder som gjør forskjellige justeringer for allelfrekvens og koblingsforvekt. Spesielt kan metoden kalt High-Definition Likelihood (HDL) estimere genomisk arvelighet ved bruk av bare GWAS-sammendragsstatistikk, noe som gjør det lettere å innlemme stor utvalgstørrelse tilgjengelig i forskjellige GWAS-metaanalyser.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *