Arvelighed

Da kun P kan observeres eller måles direkte, skal arvelighed estimeres ud fra de observerede ligheder hos forsøgspersoner, der varierer i deres niveau af genetisk eller miljømæssig lighed. De statistiske analyser, der kræves for at estimere de genetiske og miljømæssige variationskomponenter, afhænger af prøveegenskaberne. Kort fortalt opnås bedre estimater ved hjælp af data fra personer med meget forskellige niveauer af genetisk forhold – såsom tvillinger, søskende, forældre og afkom snarere end fra mere fjernt beslægtede (og derfor mindre ens) forsøgspersoner. Standardfejlen for arvelighedsestimater forbedres med store stikprøvestørrelser.

I ikke-menneskelige populationer er det ofte muligt at indsamle information på en kontrolleret måde. F.eks. Er det blandt husdyr let at arrangere, at en tyr producerer afkom fra et stort antal køer og kontrollerer miljøer. Sådan eksperimentel kontrol er generelt ikke mulig, når man indsamler menneskelige data, afhængig af naturligt forekommende relationer og miljøer.

I klassisk kvantitativ genetik var der to tanker om estimering af arvelighed.

En tankegang blev udviklet af Sewall Wright ved University of Chicago og yderligere populariseret af CC Li (University of Chicago) og JL Lush (Iowa State University). Det er baseret på analysen af sammenhænge og i forlængelse heraf regression. Path Analysis blev udviklet af Sewall Wright som en måde at estimere arvelighed på.

Det andet blev oprindeligt udviklet af RA Fisher og udvidet ved University of Edinburgh, Iowa State University og North Carolina State University samt andre skoler. Det er baseret på variansanalysen i avlsundersøgelser ved hjælp af intraclass-korrelation af pårørende. Forskellige metoder til estimering af varianskomponenter (og dermed arvelighed) fra ANOVA anvendes i disse analyser.

I dag kan arvelighed estimeres fra generelle stamtavler ved hjælp af lineære blandede modeller og fra genomisk beslægtethed estimeret ud fra genetiske markører .

Undersøgelser af menneskelig arvelighed bruger ofte designundersøgelsesdesign, ofte med identiske tvillinger, der er adskilt tidligt i livet og opvokset i forskellige miljøer. Sådanne individer har identiske genotyper og kan bruges til at adskille virkningerne af genotype og miljø. En grænse for dette design er det almindelige prænatale miljø og det relativt lave antal tvillinger, der opdrættes fra hinanden. Et andet og mere almindeligt design er tvillingundersøgelsen, hvor ligheden mellem identiske og broderlige tvillinger bruges til at estimere arvelighed. Disse undersøgelser kan begrænses af det faktum, at identiske tvillinger ikke er helt genetisk identiske, hvilket potentielt resulterer i en undervurdering af arvelighed.

I observationsstudier eller på grund af stemningsfulde virkninger (hvor et genom fremkalder miljøer ved dets effekt på dem), kan G og E være covary: genmiljø korrelation. Afhængig af de metoder, der anvendes til at estimere arvelighed, kan sammenhænge mellem genetiske faktorer og delte eller ikke-delte miljøer måske eller ikke blandes med arvelighed.

Regressions- / korrelationsmetoder til estimeringEdit

første estimationsskole bruger regression og korrelation til at estimere arvelighed.

Sammenligning af nære slægtningeRediger

I sammenligningen af slægtninge finder vi, at generelt,

h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}

hvor r kan betragtes som koefficienten for sammenhæng, b er regressionskoefficienten og t er korrelationskoefficienten.

Forældre-afkom regressionEdit

Figur 2. Sir Francis Galtons (1889) data, der viser forholdet mellem afkomhøjde (928 individer) som en funktion af den gennemsnitlige forældres højde (205 sæt forældre).

Arvelighed kan estimeres ved at sammenligne forælder og o ffspring træk (som i fig. 2). Linjens hældning (0,57) tilnærmer egenskaben arvelighed, når afkomværdier regresseres mod det gennemsnitlige træk hos forældrene. Hvis der kun bruges en forældres værdi, er arvelighed dobbelt så stor som hældningen. (Bemærk at dette er kilden til udtrykket “regression”, da afkomværdierne altid har tendens til at vende tilbage til gennemsnitsværdien for befolkningen, dvs. er altid mindre end en.) Denne regressionseffekt ligger også til grund for DeFries – Fulker-metoden til analyse af tvillinger, der er valgt for et medlem, der bliver berørt.

Søskens sammenligning Rediger

En grundlæggende tilgang til arvelighed kan være taget ved hjælp af fuld-Sib-design: sammenligning af lighed mellem søskende, der deler både en biologisk mor og en far. Når der kun er additiv genhandling, er denne søskende fænotypisk korrelation et indeks for fortrolighed – summen af halvdelen af additivets genetiske varians plus fuld effekt af det fælles miljø.Det placerer således en øvre grænse for additiv arvelighed på dobbelt så fuld fænotypisk korrelation. Half-Sib-design sammenligner fænotypiske træk hos søskende, der deler en forælder med andre søskengrupper.

Twin studiesEdit
Hovedartikel: Twin study

Figur 3. Tvillingkonkordanser for syv psykologiske træk (prøvestørrelse vist inden i søjler), hvor DZ er broderlig og MZ er identiske tvillinger.

Arvelighed for træk hos mennesker estimeres hyppigst ved at sammenligne ligheder mellem tvillinger. “Fordelen ved tvillingestudier er, at den samlede variation kan opdeles i genetiske, delte eller fælles miljømæssige og unikke miljøkomponenter, hvilket muliggør en nøjagtig estimering af arvelighed”. Broderlige eller dizygotiske (DZ) tvillinger deler i gennemsnit halvdelen af deres gener (forudsat at der ikke er nogen assortativ parring for egenskaben), og så identiske eller monozygotiske (MZ) tvillinger i gennemsnit er dobbelt så genetisk ens som DZ-tvillinger. Et groft skøn over arvelighed er derefter cirka det dobbelte af forskellen i korrelation mellem MZ- og DZ-tvillinger, dvs. Falconers formel H2 = 2 (r (MZ) -r (DZ)).

Effekten af fælles miljø, c2, bidrager til lighed mellem søskende på grund af det miljø, de er opvokset i, fælles. Delt miljø tilnærmes af DZ-korrelationen minus halv arvelighed, hvilket er den grad, hvor DZ-tvillinger deler de samme gener, c2 = DZ-1 / 2h2. Den unikke miljøvarians, e2, afspejler graden af, hvor identiske tvillinger, der er rejst sammen, er forskellige, e2 = 1-r (MZ).

Analyse af variansmetoder til estimeringEdit

Det andet sæt metoder til estimering af arvelighed involverer ANOVA og estimering af varianskomponenter.

Grundlæggende model Rediger

Vi bruger den grundlæggende diskussion af Kempthorne. Vi betragter kun den mest basale af genetiske modeller, kan vi se på det kvantitative bidrag fra et enkelt locus med genotype Gi som

yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}

hvor gi {\ displaystyle g_ {i}} er effekten af genotype Gi og e {\ displaystyle e} er miljøeffekten.

Overvej et eksperiment med en gruppe afkom og deres afkom fra tilfældige dæmninger. Da afkom får halvdelen af deres gener fra faderen og halvdelen fra deres (tilfældige) mor, er afkomligningen

zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}

Intraclass correlationsEdit

Overvej eksperimentet ovenfor. Vi har to grupper af afkom, vi kan sammenligne. Den første sammenligner de forskellige afkom for en individuel far (kaldet inden for fargruppen). Variationen vil omfatte udtryk for genetisk varians (da de ikke alle fik den samme genotype) og miljøvarians. Dette betragtes som et fejludtryk.

Den anden afkomgruppe er sammenligning af middelværdier af halve sib med hinanden (kaldet blandt fargruppen). Ud over fejludtrykket som inden for efterkommergrupperne har vi et tilføjelsesudtryk på grund af forskellene mellem forskellige midler til halvsøber. Intraklassekorrelationen er

corr (z, z ) = corr (μ + 1 2 g + e, μ + 1 2 g + e) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z “) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e”) = {\ frac {1} {4}} V_ {g}},

da miljøeffekter er uafhængige af hinanden.

ANOVAEdit

Anvendelsen af ANOVA til at beregne arvelighed mislykkes ofte at redegøre for tilstedeværelsen af gen-miljø-interaktioner, fordi ANOVA har en meget lavere statistisk styrke til at teste for interaktionseffekter end for direkte effekter.

Model med additiv- og dominansbetingelser Rediger

For en model med additive og dominansbetingelser, men ikke andre, ligningen for et enkelt locus er

yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}

hvor

Eksperimenter kan køres med en lignende opsætning som den, der er angivet i tabel 1. Brug af andet forhold grupper, kan vi evaluere forskellige intraklassekorrelationer. Ved hjælp af V a {\ displaystyle V_ {a}} som additiv genetisk varians og V d {\ displaystyle V_ {d}} som varians for afvigelse af dominans, bliver intraklassekorrelationer lineære funktioner for disse parametre. Generelt

Korrelation mellem intraklasser = r V a + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}

hvor r {\ displaystyle r} og θ {\ displaystyle \ theta} findes som

r = {\ displaystyle r =} P, og

θ = {\ displaystyle \ theta =} P.

Nogle fælles forhold og deres koefficienter er angivet i tabel 2.

Lineære blandede modeller Rediger

En bred vifte af tilgange ved hjælp af lineære blandede modeller er rapporteret i litteraturen. Via disse metoder opdeles fænotypisk varians i genetiske, miljømæssige og eksperimentelle designvarianter for at estimere arvelighed.Miljøvarians kan eksplicit modelleres ved at studere enkeltpersoner på tværs af en bred vifte af miljøer, selvom inferens om genetisk variation fra fænotypisk og miljømæssig variation kan føre til en undervurdering af arvelighed på grund af udfordringen med at fange hele spektret af miljøpåvirkning, der påvirker et træk. Andre metoder til beregning af arvelighed bruger data fra genomdækkende associeringsundersøgelser til at estimere indflydelsen på et træk af genetiske faktorer, hvilket afspejles af hastigheden og indflydelsen af formodentlig associerede genetiske loci (normalt enkeltnukleotidpolymorfier) på træk. Dette kan dog føre til undervurdering af arvelighed. Denne uoverensstemmelse kaldes “manglende arvelighed” og afspejler udfordringen med nøjagtig modellering af både genetisk og miljømæssig variation i arvelighedsmodeller.

Når en stor, kompleks stamtavle eller en anden førnævnte type data er tilgængelig, er arvelighed og andre kvantitative genetiske parametre kan estimeres ved begrænset maksimal sandsynlighed (REML) eller Bayesiske metoder. De rå data vil normalt have tre eller flere datapunkter for hver enkelt person: en kode til faren, en kode for dæmningen og en eller flere egenskabsværdier. Forskellige egenskabsværdier kan være for forskellige egenskaber eller for forskellige tidspunkter for måling.

Den nuværende populære metode er afhængig af høj grad af sikkerhed over faren og dæmningens identiteter; det er ikke almindeligt at behandle farens identitet sandsynligt. Dette er normalt ikke et problem, da metoden sjældent anvendes på vilde populationer (selvom den er blevet brugt til flere vilde hovdyr og fuglepopulationer), og herrer er altid kendt med meget høj grad af sikkerhed i avlsprogrammer. Der er også algoritmer, der tegner sig for usikker faderskab.

Stamtavlerne kan ses ved hjælp af programmer som Pedigree Viewer og analyseres med programmer som ASReml, VCE, WOMBAT, MCMCglmm i R-miljøet eller BLUPF90-familien af programmer.

Stamtavlemodeller er nyttige ved sammenblanding af sammenblandinger som omvendt kausalitet, maternelle effekter såsom det prænatale miljø og sammenblanding af genetisk dominans, fælles miljø og maternelle geneffekter.

Genomisk arvelighed Rediger

Når genotypedata og fænotyper fra store populationsprøver er tilgængelige, kan man estimere forholdet mellem individer baseret på deres genotyper og bruge en lineær blandet model til at estimere variansen forklaret af den genetiske markører. Dette giver et genomisk arvelighedsestimat baseret på den varians, der er fanget af almindelige genetiske varianter. Der er flere metoder, der foretager forskellige justeringer for allelfrekvens og sammenkædningsligevægt. Især kan metoden kaldet High-Definition Likelihood (HDL) estimere genomisk arvelighed ved kun at bruge GWAS-oversigtsstatistikker, hvilket gør det lettere at inkorporere stor stikprøvestørrelse, der er tilgængelig i forskellige GWAS-metaanalyser.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *