Eftersom endast P kan observeras eller mätas direkt, måste ärftligheten uppskattas utifrån de likheter som observerats hos försökspersoner som varierar i deras genetiska eller miljömässiga nivå. De statistiska analyser som krävs för att uppskatta de genetiska och miljökomponenterna som varierar beror på provets egenskaper. Kortfattat erhålls bättre uppskattningar med hjälp av data från individer med mycket olika nivåer av genetiskt förhållande – såsom tvillingar, syskon, föräldrar och avkommor, snarare än från mer avlägset besläktade (och därför mindre lika) ämnen. Standardfelet för uppskattningar av ärftlighet förbättras med stora provstorlekar.
I icke-mänskliga populationer är det ofta möjligt att samla in information på ett kontrollerat sätt. Bland husdjur är det till exempel lätt att ordna en tjur som producerar avkommor från ett stort antal kor och kontrollerar miljöer. Sådan experimentell kontroll är i allmänhet inte möjlig när man samlar in mänskliga data, beroende på naturligt förekommande förhållanden och miljöer.
I klassisk kvantitativ genetik fanns det två tankeskolor om uppskattning av ärftlighet. En tankeskola utvecklades av Sewall Wright vid University of Chicago och populariserades ytterligare av CC Li (University of Chicago) och JL Lush (Iowa State University). Den är baserad på analys av korrelationer och, i förlängning, regression. Path Analysis utvecklades av Sewall Wright som ett sätt att uppskatta ärftlighet.
Den andra utvecklades ursprungligen av RA Fisher och utvidgades vid University of Edinburgh, Iowa State University och North Carolina State University, samt andra skolor. Den är baserad på variansanalysen i avelsstudier med släktskaps korrelation mellan släktingar. Olika metoder för att uppskatta varianskomponenter (och därmed ärftlighet) från ANOVA används i dessa analyser.
Idag kan ärftlighet uppskattas från allmänna stamtavlor med hjälp av linjära blandade modeller och från genomisk besläktning uppskattad från genetiska markörer .
Studier av mänsklig ärftlighet använder ofta designstudier för adoption, ofta med identiska tvillingar som har separerats tidigt i livet och uppfostrats i olika miljöer. Sådana individer har identiska genotyper och kan användas för att separera effekterna av genotyp och miljö. En gräns för denna design är den vanliga prenatala miljön och det relativt låga antalet tvillingar som föds isär. En andra och vanligare design är tvillingstudien där likheten mellan identiska och broderliga tvillingar används för att uppskatta ärftlighet. Dessa studier kan begränsas av det faktum att identiska tvillingar inte är helt genetiskt identiska, vilket potentiellt kan resultera i en underskattning av ärftlighet.
I observationsstudier eller på grund av stimulerande effekter (där ett genom framkallar miljöer genom dess effekt på dem), kan G och E vara covary: genmiljö korrelation. Beroende på metoderna som används för att uppskatta ärftlighet kan korrelationer mellan genetiska faktorer och delade eller icke-delade miljöer förväxlas med ärftlighet.
Regressions- / korrelationsmetoder för uppskattning Redigera
första uppskattningsskolan använder regression och korrelation för att uppskatta ärftlighet.
Jämförelse av nära släktingar Redigera
I jämförelsen av släktingar finner vi att i allmänhet,
h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}
där r kan betraktas som koefficienten för släkt, b är regressionskoefficienten och t är korrelationskoefficienten.
Regression av föräldrar och avkommorEdit
Figur 2. Sir Francis Galtons data (1889) som visar förhållandet mellan avkommans höjd (928 individer) som en funktion av medelföräldrarnas höjd (205 uppsättningar föräldrar).
Ärftlighet kan uppskattas genom att jämföra förälder och o ffspring egenskaper (som i figur 2). Lutningen på linjen (0,57) approximerar egenskapens ärftlighet när avkommans värden regresseras mot den genomsnittliga egenskapen hos föräldrarna. Om endast en förälders värde används är ärftligheten dubbelt så lutande. (Observera att detta är källan till termen ”regression”, eftersom avkommans värden alltid tenderar att gå tillbaka till medelvärdet för befolkningen, dvs lutningen är alltid mindre än en.) Denna regressionseffekt ligger också till grund för DeFries – Fulker-metoden för att analysera tvillingar som valts för en medlem som påverkas.
Syskonjämförelse Redigera
En grundläggande metod för ärftlighet kan vara tagna med hjälp av full-Sib-design: jämför likhet mellan syskon som delar både en biologisk mor och en far. När det bara finns additiv genverkan är denna syskonfenotypiska korrelation ett index av kännedom – summan av hälften av den additiva genetiska variansen plus full effekt av den gemensamma miljön.Det placerar således en övre gräns för additiv ärftlighet av två gånger den fullständiga Sib-fenotypiska korrelationen. Half-Sib-design jämför fenotypiska egenskaper hos syskon som delar en förälder med andra syskongrupper.
TvillingstudierRedigera
Figur 3. Två konkordanser för sju psykologiska egenskaper (provstorlek visas i staplar), där DZ är broderlig och MZ är identiska tvillingar.
Ärftlighet för egenskaper hos människor uppskattas oftast genom att jämföra likheter mellan tvillingar. ”Fördelen med tvillingstudier är att den totala variansen kan delas upp i genetiska, delade eller gemensamma miljö- och unika miljökomponenter, vilket möjliggör en exakt uppskattning av ärftlighet”. Broderliga eller dizygotiska (DZ) tvillingar delar i genomsnitt hälften av sina gener (förutsatt att det inte finns någon assortativ parning för egenskapen), och så identiska eller monozygotiska (MZ) tvillingar är i genomsnitt dubbelt så genetiskt lika som DZ-tvillingar. En grov uppskattning av ärftlighet är då ungefär dubbelt så stor skillnaden i korrelation mellan MZ- och DZ-tvillingar, dvs Falconer formel H2 = 2 (r (MZ) -r (DZ)).
Effekten av delad miljö, c2, bidrar till likhet mellan syskon på grund av den gemensamma miljön de är uppfostrade i. Delad miljö approximeras av DZ-korrelationen minus hälften ärftbarhet, vilket är i vilken grad DZ-tvillingar delar samma gener, c2 = DZ-1 / 2h2 Unik miljövarians, e2, återspeglar graden i vilken identiska tvillingar som är uppfostrade är olika, e2 = 1-r (MZ).
Analys av variansmetoder för uppskattning Redigera
Den andra uppsättningen metoder för uppskattning av ärftlighet involverar ANOVA och uppskattning av varianskomponenter.
BasmodellRedigera
Vi använder den grundläggande diskussionen om Kempthorne. genetiska modeller kan vi titta på det kvantitativa bidraget från ett enstaka lokus med genotyp Gi som
yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}
där gi {\ displaystyle g_ {i}} är effekten av genotyp Gi och e {\ displaystyle e} är miljöeffekten.
Tänk på ett experiment med en grupp av släktingar och deras avkomma från slumpmässiga dammar. Eftersom avkomman får hälften av sina gener från fadern och hälften från sin (slumpmässiga) mor är avkommaekvationen
zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}
Intraklasskorrelationer Redigera
Tänk på experimentet ovan. Vi har två grupper av avkommor som vi kan jämföra. Den första är att jämföra de olika avkommorna för en enskild far (kallas i fargrupp). Variansen kommer att inkludera termer för genetisk varians (eftersom de inte alla fick samma genotyp) och miljövarians. Detta betraktas som ett feluttryck.
Den andra gruppen avkommor är jämförelser av medel för halvbröst med varandra (kallas bland fargruppen). Förutom felbegreppet som inom inom fargrupperna, har vi en tilläggsterm på grund av skillnaderna mellan olika medel för halvsibbar. Intraklasskorrelationen är
corr (z, z ) = corr (μ + 1 2 g + e, μ + 1 2 g + e) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z ”) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e”) = {\ frac {1} {4}} V_ {g}},
eftersom miljöeffekter är oberoende av varandra.
ANOVAEdit
Användningen av ANOVA för att beräkna ärftlighet misslyckas ofta att redogöra för närvaron av interaktioner mellan gen och miljö, eftersom ANOVA har en mycket lägre statistisk förmåga att testa för interaktionseffekter än för direkta effekter.
Modell med additiv och dominansvillkor Redigera
För en modell med tillsats- och dominanstermer, men inte andra, ekvationen för ett enstaka locus är
yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}
där
Experiment kan köras med en liknande inställning som den som ges i tabell 1. Använd en annan relation grupper, kan vi utvärdera olika intraklasskorrelationer. Med hjälp av V a {\ displaystyle V_ {a}} som additiv genetisk varians och V d {\ displaystyle V_ {d}} som avvikelse för dominansavvikelse blir intraklasskorrelationer linjära funktioner för dessa parametrar. I allmänhet
Korrelation mellan klasserna = r V a + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}
där r {\ displaystyle r} och θ {\ displaystyle \ theta} hittas som
r = {\ displaystyle r =} P och
θ = {\ displaystyle \ theta =} P.
Några vanliga förhållanden och deras koefficienter ges i tabell 2.
Linjära blandade modeller Redigera
En mängd olika metoder med linjära blandade modeller har rapporterats i litteraturen. Via dessa metoder fördelas fenotypisk varians i genetiska, miljömässiga och experimentella designvariationer för att uppskatta ärftlighet.Miljövarians kan uttryckligen modelleras genom att studera individer i ett brett spektrum av miljöer, även om slutsats av genetisk varians från fenotypisk och miljövarians kan leda till underskattning av ärftlighet på grund av utmaningen att fånga hela spektrumet av miljöpåverkan som påverkar ett drag. Andra metoder för att beräkna ärftlighet använder data från genomomfattande associeringsstudier för att uppskatta påverkan på ett drag av genetiska faktorer, vilket återspeglas av hastigheten och inflytandet av förmodligen associerade genetiska loci (vanligtvis enkelnukleotidpolymorfier) på egenskapen. Detta kan dock leda till underskattning av ärftligheten. Denna skillnad kallas ”saknad ärftlighet” och återspeglar utmaningen att noggrant modellera både genetisk och miljömässig varians i ärftbarhetsmodeller.
När en stor, komplex stamtavla eller annan ovan nämnd typ av data finns tillgänglig, är ärftlighet och andra kvantitativa genetiska parametrar kan uppskattas med begränsad maximal sannolikhet (REML) eller Bayesiska metoder. Rådata har vanligtvis tre eller flera datapunkter för varje individ: en kod för far, en kod för dammen och ett eller flera egenskaper. Olika egenskaper kan vara för olika egenskaper eller för olika tidpunkter för mätning.
Den för närvarande populära metoden bygger på hög grad av säkerhet vad gäller far och damm; det är inte vanligt att behandla faridentiteten sannolikt. Detta är vanligtvis inte ett problem, eftersom metoden sällan tillämpas på vilda populationer (även om den har använts för flera vilda hov- och fågelpopulationer), och herrar är alltid kända med mycket hög säkerhet i avelsprogram. Det finns också algoritmer som står för osäker faderskap.
Stamtavlorna kan visas med program som Pedigree Viewer och analyseras med program som ASReml, VCE, WOMBAT, MCMCglmm inom R-miljön eller BLUPF90-familjen av program.
Stamtavlamodeller är till hjälp för att lösa upp sammanblandningar som omvänd kausalitet, maternella effekter som prenatal miljö och förvirring av genetisk dominans, delad miljö och moderns geneffekter.
Genomisk ärftlighet Redigera
När genotypdata och fenotyper från stora populationsprover finns tillgängliga kan man uppskatta förhållandet mellan individer baserat på deras genotyper och använda en linjär blandad modell för att uppskatta variansen förklarad av den genetiska markörer. Detta ger en genomisk uppskattning av ärftlighet baserad på variansen som fångas av vanliga genetiska varianter. Det finns flera metoder som gör olika justeringar för allelfrekvens och obalans mellan länkar. I synnerhet kan metoden som kallas High-Definition Likelihood (HDL) uppskatta genomisk ärftlighet med endast GWAS-sammanfattningsstatistik, vilket gör det lättare att införliva stor provstorlek tillgänglig i olika GWAS-metaanalys.