Poiché solo P può essere osservato o misurato direttamente, lereditabilità deve essere stimata dalle somiglianze osservate in soggetti che variano nel loro livello di somiglianza genetica o ambientale. Le analisi statistiche necessarie per stimare le componenti genetiche e ambientali della varianza dipendono dalle caratteristiche del campione. In breve, stime migliori si ottengono utilizzando i dati di individui con livelli molto diversi di relazione genetica – come gemelli, fratelli, genitori e prole, piuttosto che da soggetti più lontanamente imparentati (e quindi meno simili). Lerrore standard per le stime di ereditabilità è migliorato con campioni di grandi dimensioni.
Nelle popolazioni non umane è spesso possibile raccogliere informazioni in modo controllato. Ad esempio, tra gli animali da fattoria è facile far sì che un toro produca prole da un gran numero di mucche e controlli gli ambienti. Tale controllo sperimentale non è generalmente possibile quando si raccolgono dati umani, basandosi su relazioni e ambienti naturali.
Nella genetica quantitativa classica, cerano due scuole di pensiero riguardanti la stima dellereditabilità.
Una scuola di pensiero è stata sviluppata da Sewall Wright presso lUniversità di Chicago, e ulteriormente resa popolare da CC Li (Università di Chicago) e JL Lush (Iowa State University). Si basa sullanalisi delle correlazioni e, per estensione, sulla regressione. Path Analysis è stato sviluppato da Sewall Wright come un modo per stimare lereditabilità.
Il secondo è stato originariamente sviluppato da RA Fisher e ampliato presso lUniversità di Edimburgo, Iowa State University e North Carolina State University, nonché altre scuole. Si basa sullanalisi della varianza degli studi sullallevamento, utilizzando la correlazione intraclasse dei parenti. In queste analisi vengono utilizzati vari metodi per stimare le componenti della varianza (e, quindi, lereditabilità) da ANOVA.
Oggi, lereditabilità può essere stimata da alberi genealogici generali utilizzando modelli misti lineari e dalla correlazione genomica stimata da marcatori genetici .
Gli studi sullereditarietà umana spesso utilizzano progetti di studio sulladozione, spesso con gemelli identici che sono stati separati presto nella vita e cresciuti in ambienti diversi. Tali individui hanno genotipi identici e possono essere utilizzati per separare gli effetti del genotipo e dellambiente. Un limite di questo disegno è lambiente prenatale comune e il numero relativamente basso di gemelli allevati separatamente. Un secondo e più comune disegno è lo studio sui gemelli in cui viene utilizzata la somiglianza di gemelli identici e fraterni per stimare lereditabilità. Questi studi possono essere limitati dal fatto che i gemelli identici non sono completamente geneticamente identici, determinando potenzialmente una sottostima dellereditabilità.
Negli studi osservazionali, oa causa di effetti evocativi (dove un genoma evoca ambienti per il suo effetto su di essi), G ed E possono covare: correlazione genica ambiente. A seconda dei metodi utilizzati per stimare lereditabilità, le correlazioni tra fattori genetici e ambienti condivisi o non condivisi possono o non possono essere confuse con lereditabilità.
Metodi di stima di regressione / correlazioneModifica
prima scuola di stima utilizza la regressione e la correlazione per stimare lereditabilità.
Confronto di parenti stretti Modifica
Nel confronto tra parenti, troviamo che in generale,
h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}
dove r può essere pensato come il coefficiente di parentela, b è il coefficiente di regressione et è il coefficiente di correlazione.
Regressione genitore-figlioModifica
Figura 2. Dati di Sir Francis Galton (1889) che mostrano la relazione tra laltezza della prole (928 individui) in funzione dellaltezza media dei genitori (205 set di genitori).
Lereditabilità può essere stimata confrontando genitore e o ffspring tratti (come in Fig. 2). La pendenza della linea (0,57) approssima lereditabilità del tratto quando i valori della prole sono regrediti rispetto al tratto medio nei genitori. Se viene utilizzato solo il valore di un genitore, lereditabilità è il doppio della pendenza (si noti che questa è la fonte del termine “regressione”, poiché i valori della prole tendono sempre a regredire al valore medio per la popolazione, cioè la pendenza è sempre inferiore a uno). Questo effetto di regressione è anche alla base del metodo DeFries – Fulker per analizzare i gemelli selezionati per un membro interessato.
Confronto tra fratelliModifica
Un approccio di base allereditabilità può essere prese utilizzando i disegni full-Sib: confrontando la somiglianza tra fratelli che condividono sia una madre biologica che un padre. Quando cè solo unazione genica additiva, questa correlazione fenotipica tra fratelli è un indice di familiarità – la somma della metà della varianza genetica additiva più il pieno effetto dellambiente comune.Quindi pone un limite superiore allereditabilità additiva del doppio della correlazione fenotipica completa di Sib. I modelli Half-Sib mettono a confronto i tratti fenotipici di fratelli che condividono un genitore con altri gruppi di fratelli.
Studi sui gemelli Modifica
Figura 3. Concordanze gemelle per sette tratti psicologici (dimensione del campione mostrata allinterno delle barre), con DZ fraterno e MZ gemelli identici.
Lereditarietà dei tratti negli esseri umani viene stimata più frequentemente confrontando le somiglianze tra i gemelli. “Il vantaggio degli studi sui gemelli è che la varianza totale può essere suddivisa in componenti genetiche, ambientali condivise o comuni e componenti ambientali uniche, consentendo una stima accurata dellereditarietà”. I gemelli fraterni o dizigotici (DZ) condividono in media la metà dei loro geni (assumendo che non ci sia accoppiamento assortativo per il tratto), e quindi i gemelli identici o monozigoti (MZ) sono in media due volte più geneticamente simili dei gemelli DZ. Una stima approssimativa dellereditarietà, quindi, è circa il doppio della differenza di correlazione tra i gemelli MZ e DZ, ovvero la formula di Falconer H2 = 2 (r (MZ) -r (DZ)).
Leffetto dellambiente condiviso, c2, contribuisce alla somiglianza tra i fratelli a causa della comunanza dellambiente in cui sono cresciuti. Lambiente condiviso è approssimato dalla correlazione DZ meno metà ereditabilità, che è il grado in cui i gemelli DZ condividono gli stessi geni, c2 = DZ-1 / 2h2. La varianza ambientale unica, e2, riflette il grado in cui gemelli identici cresciuti insieme sono dissimili, e2 = 1-r (MZ).
Analisi dei metodi di stima della varianzaModifica
La seconda serie di metodi di stima dellereditabilità comprende lANOVA e la stima delle componenti della varianza.
Modifica del modello di base
Usiamo la discussione di base di Kempthorne. Considerando solo la parte più elementare di modelli genetici, possiamo guardare al contributo quantitativo di un singolo locus con genotipo Gi come
yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}
dove gi {\ displaystyle g_ {i}} è leffetto del genotipo Gi ed e {\ displaystyle e} è leffetto ambientale.
Considera un esperimento con un gruppo di tori e la loro progenie da madri casuali. Poiché la progenie riceve metà dei suoi geni dal padre e metà dalla madre (casuale), lequazione della progenie è
zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}
correlazioni intraclasseEdit
Considera lesperimento sopra. Abbiamo due gruppi di progenie che possiamo confrontare. Il primo è confrontare le varie progenie per un singolo toro (chiamato allinterno del gruppo di tori). La varianza includerà i termini per la varianza genetica (poiché non hanno tutti lo stesso genotipo) e la varianza ambientale. Questo è pensato come un termine di errore.
Il secondo gruppo di progenie sono confronti tra mezzi di fratellastri tra loro (chiamati tra gruppo di tori). Oltre al termine di errore come nei gruppi di tori interni, abbiamo un termine aggiuntivo a causa delle differenze tra i diversi mezzi di fratellastro. La correlazione intraclasse è
corr (z, z ′) = corr (μ + 1 2 g + e, μ + 1 2 g + e ′) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z “) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e”) = {\ frac {1} {4}} V_ {g}},
poiché gli effetti ambientali sono indipendenti luno dallaltro.
ANOVAEdit
Luso di ANOVA per calcolare lereditarietà spesso fallisce per tenere conto della presenza di interazioni gene-ambiente, perché ANOVA ha un potere statistico molto inferiore per testare gli effetti di interazione rispetto agli effetti diretti.
Modello con termini additivi e dominanza Modifica
Per un modello con termini additivi e dominanza, ma non altri, lequazione per un singolo luogo è
yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}
dove
Gli esperimenti possono essere eseguiti con una configurazione simile a quella fornita nella Tabella 1. Utilizzo di relazioni diverse gruppi, possiamo valutare diverse correlazioni intraclasse. Usando V a {\ displaystyle V_ {a}} come varianza genetica additiva e V d {\ displaystyle V_ {d}} come varianza di deviazione di dominanza, le correlazioni intraclasse diventano funzioni lineari di questi parametri. In generale,
correlazione intraclasse = r V a + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}
dove r {\ displaystyle r} e θ {\ displaystyle \ theta} si trovano come
r = {\ displaystyle r =} P e
θ = {\ displaystyle \ theta =} P.
Alcuni le relazioni comuni ei loro coefficienti sono riportati nella Tabella 2.
Modelli misti lineariModifica
In letteratura è stata riportata unampia varietà di approcci che utilizzano modelli misti lineari. Tramite questi metodi, la varianza fenotipica viene suddivisa in varianze genetiche, ambientali e di progettazione sperimentale per stimare lereditabilità.La varianza ambientale può essere modellata in modo esplicito studiando individui in unampia gamma di ambienti, sebbene linferenza della varianza genetica dalla varianza fenotipica e ambientale possa portare a una sottostima dellereditabilità a causa della sfida di catturare lintera gamma di influenza ambientale che influenza un tratto. Altri metodi per calcolare lereditabilità utilizzano i dati di studi di associazione sullintero genoma per stimare linfluenza su un tratto da parte di fattori genetici, che si riflette sulla velocità e linfluenza di loci genetici presumibilmente associati (di solito polimorfismi a singolo nucleotide) sul tratto. Tuttavia, ciò può portare a una sottostima dellereditabilità. Questa discrepanza viene definita “ereditabilità mancante” e riflette la sfida di modellare accuratamente la varianza sia genetica che ambientale nei modelli di ereditabilità.
Quando è disponibile un albero genealogico ampio e complesso o un altro tipo di dati sopra menzionato, ereditabilità e altri parametri genetici quantitativi possono essere stimati mediante metodi di massima verosimiglianza ristretta (REML) o bayesiani. I dati grezzi di solito hanno tre o più punti dati per ogni individuo: un codice per il toro, un codice per la madre e uno o più valori di tratto. Valori di tratto differenti possono essere per tratti differenti o per differenti momenti di misurazione.
La metodologia attualmente popolare si basa su alti gradi di certezza sulle identità del padre e della madre; non è comune trattare probabilisticamente lidentità del padre. Questo di solito non è un problema, poiché la metodologia è raramente applicata alle popolazioni selvatiche (sebbene sia stata utilizzata per diversi ungulati selvatici e popolazioni di uccelli), ei tori sono invariabilmente conosciuti con un grado molto alto di certezza nei programmi di allevamento. Esistono anche algoritmi che tengono conto della paternità incerta.
I pedigree possono essere visualizzati utilizzando programmi come Pedigree Viewer e analizzati con programmi come ASReml, VCE, WOMBAT, MCMCglmm allinterno dellambiente R o della famiglia BLUPF90 di programmi.
I modelli genealogici sono utili per districare aspetti confusi come la causalità inversa, effetti materni come lambiente prenatale e confusione tra dominanza genetica, ambiente condiviso ed effetti genetici materni.
Ereditabilità genomicaModifica
Quando sono disponibili dati sul genotipo dellintero genoma e fenotipi da campioni di una vasta popolazione, è possibile stimare le relazioni tra gli individui in base ai loro genotipi e utilizzare un modello misto lineare per stimare la varianza spiegata dalla genetica marcatori. Ciò fornisce una stima dellereditabilità genomica basata sulla varianza catturata dalle varianti genetiche comuni. Esistono diversi metodi che apportano regolazioni diverse per la frequenza degli alleli e il disequilibrio di collegamento. In particolare, il metodo chiamato High-Definition Likelihood (HDL) può stimare lereditabilità genomica utilizzando solo statistiche riassuntive GWAS, rendendo più facile incorporare campioni di grandi dimensioni disponibili in varie meta-analisi GWAS.