Deoarece numai P poate fi observat sau măsurat direct, ereditatea trebuie estimată din similitudinile observate la subiecți variind în ceea ce privește nivelul lor de asemănare genetică sau de mediu. Analizele statistice necesare pentru estimarea componentelor genetice și de mediu ale varianței depind de caracteristicile eșantionului. Pe scurt, se obțin estimări mai bune folosind date de la indivizi cu niveluri variabile de relație genetică – cum ar fi gemeni, frați, părinți și descendenți, mai degrabă decât de la subiecți mai înruditi (și, prin urmare, mai puțin similari). Eroarea standard pentru estimările de ereditate este îmbunătățită cu eșantioane mari.
La populațiile non-umane este adesea posibilă colectarea informațiilor într-un mod controlat. De exemplu, printre animalele de fermă este ușor să aranjați ca un taur să producă descendenți dintr-un număr mare de vaci și să controleze mediile. Un astfel de control experimental nu este, în general, posibil atunci când colectăm date umane, bazându-ne pe relații și medii naturale.
În genetică cantitativă clasică, existau două școli de gândire cu privire la estimarea eredității.
O școală de gândire a fost dezvoltată de Sewall Wright la Universitatea din Chicago și popularizată în continuare de CC Li (Universitatea din Chicago) și JL Lush (Universitatea de Stat din Iowa). Se bazează pe analiza corelațiilor și, prin extensie, regresie. Analiza căii a fost dezvoltată de Sewall Wright ca o modalitate de estimare a eredității.
A doua a fost inițial dezvoltată de RA Fisher și extinsă la Universitatea din Edinburgh, Universitatea de Stat din Iowa și Universitatea de Stat din Carolina de Nord, precum și alte școli. Se bazează pe analiza varianței studiilor de reproducere, utilizând corelația intraclasă a rudelor. Diferite metode de estimare a componentelor varianței (și, prin urmare, a eredității) de la ANOVA sunt utilizate în aceste analize.
Astăzi, ereditatea poate fi estimată din genealogii generale utilizând modele mixte liniare și din relația genomică estimată din markerii genetici .
Studiile privind ereditatea umană utilizează deseori modele de studiu de adopție, adesea cu gemeni identici care au fost separați la începutul vieții și crescuți în medii diferite. Astfel de indivizi au genotipuri identice și pot fi folosiți pentru a separa efectele genotipului și mediului. O limită a acestui design este mediul prenatal comun și numărul relativ mic de gemeni crescuți în afară. Un al doilea design și mai frecvent este studiul gemenilor în care similitudinea gemenilor identici și frățeni este utilizată pentru a estima ereditatea. Aceste studii pot fi limitate de faptul că gemenii identici nu sunt complet identici din punct de vedere genetic, putând duce la o subestimare a eredității.
În studiile observaționale sau din cauza efectelor evocative (în cazul în care un genom evocă mediile prin efectul său pe ele), G și E pot covaria: corelația mediului genetic. În funcție de metodele utilizate pentru a estima ereditatea, corelațiile dintre factorii genetici și mediile partajate sau non-partajate pot sau nu să fie confundate cu ereditatea.
Metode de regresie / corelație de estimareEdit
prima școală de estimare folosește regresia și corelația pentru a estima ereditatea.
Compararea rudelor apropiateEdit
În comparația rudelor, constatăm că, în general,
h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}
unde r poate fi considerat coeficientul de relaționare, b este coeficientul de regresie și t este coeficientul de corelație.
Regresia părinți-descendențiEdit
Figura 2. Datele lui Sir Francis Galton (1889) care arată relația dintre înălțimea descendenților (928 de indivizi) în funcție de înălțimea medie a părinților (205 seturi de părinți).
Heritabilitatea poate fi estimată comparând părintele și o ffspring trăsături (ca în Fig. 2). Panta liniei (0,57) aproximează ereditatea trăsăturii atunci când valorile descendenților sunt regresate față de trăsătura medie la părinți. Dacă se folosește valoarea unui singur părinte, atunci heritabilitatea este de două ori mai mare decât panta. Acest efect de regresie stă la baza metodei DeFries – Fulker pentru analiza gemenilor selectați pentru un membru afectat. luată utilizând modele full-Sib: compararea similitudinii dintre frații care împărtășesc atât o mamă biologică, cât și un tată. Când există doar acțiune genetică aditivă, această corelație fenotipică a fraților este un indice de familiaritate – suma a jumătate a varianței genetice aditive plus efect complet a mediului comun.Astfel, plasează o limită superioară pentru eritabilitatea aditivă de două ori corelația fenotipică full-Sib. Proiectele Half-Sib compară trăsăturile fenotipice ale fraților care împărtășesc un părinte cu alte grupuri de frați.
Twin StudiesEdit
Figura 3. Concordanțe gemene pentru șapte trăsături psihologice (dimensiunea eșantionului prezentată în interiorul barelor), DZ fiind fratern și MZ fiind gemeni identici.
Heritabilitatea pentru trăsături la om este estimată cel mai frecvent prin compararea asemănărilor dintre gemeni. „Avantajul studiilor gemene este că varianța totală poate fi împărțită în componente genetice, comune sau de mediu comune și componente de mediu unice, permițând o estimare exactă a eredității”. Gemenii fraterni sau dizigotici (DZ) împart în medie jumătate din genele lor (presupunând că nu există o împerechere asortativă pentru trăsătură), și astfel gemenii identici sau monozigoți (MZ) sunt de două ori mai asemănători genetic decât gemenii DZ. O estimare brută a eredității este, apoi, aproximativ de două ori diferența de corelație dintre gemenii MZ și DZ, adică formula lui Falconer H2 = 2 (r (MZ) -r (DZ)).
Efectul de mediu comun, c2, contribuie la similitudinea dintre frați datorită caracterului comun al mediului în care sunt crescuți. Mediul comun este aproximat de corelația DZ minus jumătate de ereditate, care este gradul în care gemenii DZ au aceleași gene, c2 = DZ-1 / 2h2. Varianța de mediu unică, e2, reflectă gradul în care gemenii identici crescuți împreună sunt diferiți, e2 = 1-r (MZ).
Analiza metodelor de varianță de estimareEdit
Al doilea set de metode de estimare a eredității implică ANOVA și estimarea componentelor varianței.
Model model de bază
Folosim discuția de bază despre Kempthorne. Având în vedere doar cele mai elementare dintre modele genetice, putem privi contribuția cantitativă a unui singur locus cu genotipul Gi ca
yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}
unde gi {\ displaystyle g_ {i}} este efectul genotipului Gi și e {\ displaystyle e} este efectul asupra mediului.
Luați în considerare un experiment cu un grup de sire și descendenții lor de la baraje aleatorii. Deoarece descendenții obțin jumătate din genele lor de la tată și jumătate de la mama lor (aleatorie), ecuația descendenței este
zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}
Corelații intraclasăEdit
Luați în considerare experimentul de mai sus. Avem două grupuri de descendenți pe care îi putem compara. Primul este compararea diferiților descendenți pentru un sire individual (numit în cadrul grupului sire). Varianța va include termeni pentru varianță genetică (deoarece nu au obținut toți același genotip) și varianță de mediu. Acest lucru este considerat un termen de eroare.
Al doilea grup de descendenți sunt comparații ale mediilor fraților între ei (numiți între grupul sire). În plus față de termenul de eroare, ca și în cadrul grupurilor de sire, avem un termen de adăugare datorită diferențelor între diferitele mijloace de jumătate de frate. Corelația intraclasă este
corr (z, z ′) = corr (μ + 1 2 g + e, μ + 1 2 g + e ′) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z „) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e”) = {\ frac {1} {4}} V_ {g}},
deoarece efectele asupra mediului sunt independente unul de celălalt.
Editarea ANOVAE
Utilizarea ANOVA pentru calcularea eredității eșuează adesea pentru a ține cont de prezența interacțiunilor genă-mediu, deoarece ANOVA are o putere statistică mult mai mică pentru testarea efectelor de interacțiune decât pentru efectele directe.
Model cu aditiv și termeni de dominanță un model cu termeni de aditivitate și dominanță, dar nu și alții, ecuația pentru un singur locus este yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}
unde
Experimentele pot fi rulate cu o configurație similară cu cea dată în Tabelul 1. Folosind relații diferite grupuri, putem evalua diferite corelații intraclasă. Folosind V a {\ displaystyle V_ {a}} ca varianță genetică aditivă și V d {\ displaystyle V_ {d}} ca varianță a deviației de dominanță, corelațiile intraclasă devin funcții liniare ale acestor parametri. În general,
Corelația intraclasă = r V a + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}
unde r {\ displaystyle r} și θ {\ displaystyle \ theta} se găsesc ca
r = {\ displaystyle r =} P și
θ = {\ displaystyle \ theta =} P.
Unele relațiile comune și coeficienții lor sunt date în Tabelul 2.
Modele mixte lineare Edit
În literatura de specialitate au fost raportate o mare varietate de abordări care utilizează modele mixte liniare. Prin aceste metode, varianța fenotipică este împărțită în varianțe genetice, de mediu și de proiectare experimentale pentru a estima ereditatea.Varianța de mediu poate fi modelată în mod explicit prin studierea indivizilor într-o gamă largă de medii, deși inferența varianței genetice din varianța fenotipică și de mediu poate duce la subestimarea eredității datorită provocării de a captura întreaga gamă a influenței de mediu care afectează o trăsătură. Alte metode pentru calcularea eredității folosesc date din studii de asociere la nivel de genom pentru a estima influența asupra unei trăsături de către factorii genetici, care se reflectă prin rata și influența loci genetici asociați putativ (de obicei, polimorfisme cu un singur nucleotid) asupra trăsăturii. Cu toate acestea, acest lucru poate duce la subestimarea eredității. Această discrepanță este denumită „lipsă de ereditate” și reflectă provocarea modelării precise a varianței genetice și a mediului în modelele de ereditate.
Atunci când este disponibil un pedigree complex, mare sau un alt tip de date menționat anterior, ereditatea și alți parametri genetici cantitativi pot fi estimate prin probabilitate maximă limitată (REML) sau prin metode bayesiene. Datele brute vor avea de obicei trei sau mai multe puncte de date pentru fiecare individ: un cod pentru sire, un cod pentru baraj și una sau mai multe valori ale trăsăturilor. Valori diferite ale trăsăturilor pot fi pentru trăsături diferite sau pentru diferite puncte de timp de măsurare.
Metodologia populară în prezent se bazează pe grade ridicate de certitudine asupra identităților sire și baraj; nu este obișnuit să se trateze identitatea sire probabilistic. Aceasta nu este de obicei o problemă, deoarece metodologia este rar aplicată la populațiile sălbatice (deși a fost utilizată pentru mai multe populații sălbatice de ungulate și păsări), iar sires sunt invariabil cunoscuți cu un grad foarte ridicat de certitudine în programele de reproducere. Există, de asemenea, algoritmi care explică paternitatea incertă.
Pedigree-urile pot fi vizualizate folosind programe precum Pedigree Viewer și analizate cu programe precum ASReml, VCE, WOMBAT, MCMCglmm în mediul R sau familia BLUPF90 de programe.
Modelele genealogice sunt utile pentru dezlănțuirea confuziilor, cum ar fi cauzalitatea inversă, efectele materne, cum ar fi mediul prenatal și confuzia dominanței genetice, a mediului comun și a efectelor genetice materne.
Heritabilitatea genomică
Când sunt disponibile date și fenotipuri de genotip la nivel de genom din eșantioane de populație mare, se poate estima relațiile dintre indivizi pe baza genotipurilor lor și se poate utiliza un model mixt liniar pentru a estima varianța explicată de marcatori. Aceasta oferă o estimare a eredității genomice bazată pe varianța captată de variantele genetice comune. Există mai multe metode care fac ajustări diferite pentru frecvența alelelor și dezechilibrul legăturii. În special, metoda numită High-Definition Likelihood (HDL) poate estima heritabilitatea genomică utilizând doar statistici rezumative GWAS, facilitând încorporarea dimensiunilor mari ale eșantionului disponibile în diferite meta-analize GWAS.