Erfelijkheid

Aangezien alleen P direct kan worden waargenomen of gemeten, moet de erfelijkheidsgraad worden geschat op basis van de overeenkomsten die worden waargenomen bij proefpersonen die variëren in hun niveau van genetische of omgevingsgelijkenis. De statistische analyses die nodig zijn om de genetische en omgevingscomponenten van variantie te schatten, zijn afhankelijk van de steekproefkenmerken. Kort gezegd worden betere schattingen verkregen met behulp van gegevens van individuen met sterk verschillende niveaus van genetische verwantschap – zoals tweelingen, broers en zussen, ouders en nakomelingen, in plaats van van verder verwante (en dus minder vergelijkbare) proefpersonen. De standaardfout voor erfelijkheidsschattingen wordt verbeterd bij grote steekproeven.

In niet-menselijke populaties is het vaak mogelijk om op een gecontroleerde manier informatie te verzamelen. Bij boerderijdieren is het bijvoorbeeld gemakkelijk om ervoor te zorgen dat een stier nakomelingen produceert van een groot aantal koeien en om de omgeving te controleren. Dergelijke experimentele controle is over het algemeen niet mogelijk bij het verzamelen van menselijke gegevens, waarbij wordt vertrouwd op natuurlijk voorkomende relaties en omgevingen.

In de klassieke kwantitatieve genetica waren er twee denkrichtingen met betrekking tot het schatten van erfelijkheidsgraad.

Een denkrichting werd ontwikkeld door Sewall Wright van de University of Chicago en verder gepopulariseerd door CC Li (University of Chicago) en JL Lush (Iowa State University). Het is gebaseerd op de analyse van correlaties en, bij uitbreiding, regressie. Path Analysis is ontwikkeld door Sewall Wright als een manier om erfelijkheidsgraad te schatten.

De tweede is oorspronkelijk ontwikkeld door RA Fisher en uitgebreid aan de University of Edinburgh, Iowa State University en North Carolina State University, evenals andere scholen. Het is gebaseerd op de variantieanalyse van fokonderzoeken, waarbij gebruik is gemaakt van de intraclasscorrelatie van familieleden. In deze analyses worden verschillende methoden gebruikt om variantiecomponenten (en dus erfelijkheid) te schatten op basis van ANOVA.

Vandaag kan de erfelijkheidsgraad worden geschat op basis van algemene stambomen met behulp van lineaire gemengde modellen en op basis van genomische verwantschap geschat op basis van genetische markers. .

Studies naar menselijke erfelijkheid maken vaak gebruik van adoptiestudies, vaak met identieke tweelingen die vroeg in hun leven gescheiden zijn en in verschillende omgevingen zijn opgegroeid. Dergelijke individuen hebben identieke genotypen en kunnen worden gebruikt om de effecten van genotype en omgeving te scheiden. Een beperking van dit ontwerp is de algemene prenatale omgeving en het relatief lage aantal tweelingen dat apart wordt grootgebracht. Een tweede en meer algemeen ontwerp is de tweelingstudie waarin de gelijkenis van identieke en broederlijke tweelingen wordt gebruikt om de erfelijkheidsgraad te schatten. Deze onderzoeken kunnen worden beperkt door het feit dat identieke tweelingen niet volledig genetisch identiek zijn, wat mogelijk kan resulteren in een onderschatting van de erfelijkheidsgraad.

In observationele studies, of vanwege suggestieve effecten (waarbij een genoom omgevingen oproept door zijn effect op hen), kunnen G en E covariëren: genomgevingcorrelatie. Afhankelijk van de methoden die worden gebruikt om de erfelijkheidsgraad te schatten, kunnen correlaties tussen genetische factoren en gedeelde of niet-gedeelde omgevingen al dan niet worden verward met erfelijkheidsgraad.

Regressie- / correlatiemethoden voor schattingen Bewerken

De eerste schattingsschool gebruikt regressie en correlatie om erfelijkheidsgraad te schatten.

Vergelijking van naaste familieleden Bewerken

In de vergelijking van familieleden zien we dat in het algemeen

h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}

waarbij r kan worden gezien als de coëfficiënt van verwantschap, b is de regressiecoëfficiënt en t is de correlatiecoëfficiënt.

Regressie van ouders en nakomelingen Bewerken

Figuur 2. De gegevens van Sir Francis Galton (1889) tonen de relatie tussen de lengte van het nageslacht (928 individuen) als functie van de gemiddelde lengte van de ouders (205 sets ouders).

De erfelijkheidsgraad kan worden geschat door ouder en o te vergelijken ffspring-eigenschappen (zoals in Fig. 2). De helling van de lijn (0,57) benadert de erfelijkheidsgraad van de eigenschap wanneer de waarden van de nakomelingen worden teruggebracht tegen de gemiddelde eigenschap bij de ouders. Als de waarde van slechts één ouder wordt gebruikt, is de erfelijkheidsgraad tweemaal de helling. (Merk op dat dit de bron is van de term regressie, aangezien de waarden van de nakomelingen altijd de neiging hebben om terug te gaan naar de gemiddelde waarde voor de populatie, dwz de helling is altijd kleiner dan één). Dit regressie-effect ligt ook ten grondslag aan de DeFries-Fulker-methode voor het analyseren van tweelingen die zijn geselecteerd voor één lid dat wordt beïnvloed.

Vergelijking tussen broers en zussen Bewerken

Een basisbenadering van erfelijkheid kan zijn gemaakt met behulp van full-Sib-ontwerpen: vergelijking tussen broers en zussen die zowel een biologische moeder als een vader delen. Als er alleen additieve genactie is, is deze fenotypische correlatie tussen broers en zussen een index van bekendheid – de som van de helft van de additieve genetische variantie plus het volledige effect van de gemeenschappelijke omgeving.Het legt dus een bovengrens aan de additieve erfelijkheidsgraad van tweemaal de fenotypische correlatie van het volledige Sib. Half-Sib-ontwerpen vergelijken fenotypische eigenschappen van broers en zussen die een ouder delen met andere groepen broers of zussen.

Tweelingstudies Bewerken
Hoofdartikel: Tweelingstudie

Figuur 3. Tweelingconcordanties voor zeven psychologische kenmerken (steekproefomvang getoond in balken), waarbij DZ broederlijk is en MZ een identieke tweeling.

Erfelijkheid voor eigenschappen bij mensen wordt het vaakst geschat door gelijkenissen tussen tweelingen te vergelijken. “Het voordeel van tweelingstudies is dat de totale variantie kan worden opgesplitst in genetische, gedeelde of gemeenschappelijke omgevings- en unieke omgevingscomponenten, waardoor een nauwkeurige schatting van de erfelijkheidsgraad mogelijk is”. Broederlijke of dizygote (DZ) tweelingen delen gemiddeld de helft van hun genen (aangenomen dat er geen assortatieve paring voor de eigenschap is), en dus zijn identieke of monozygote (MZ) tweelingen gemiddeld twee keer zo genetisch vergelijkbaar als DZ-tweelingen. Een ruwe schatting van de erfelijkheidsgraad is dus ongeveer tweemaal het verschil in correlatie tussen MZ- en DZ-tweelingen, dwz Falconers formule H2 = 2 (r (MZ) -r (DZ)).

Het effect van gedeelde omgeving, c2, draagt bij aan gelijkenis tussen broers en zussen vanwege de gemeenschappelijkheid van de omgeving waarin ze zijn opgegroeid. Gedeelde omgeving wordt benaderd door de DZ-correlatie min de helft van de erfelijkheidsgraad, wat de mate is waarin DZ-tweelingen dezelfde genen delen, c2 = DZ-1 / 2h2. Unieke omgevingsvariantie, e2, geeft de mate weer waarin identieke tweelingen die samen zijn grootgebracht ongelijk zijn, e2 = 1-r (MZ).

Analyse van variantie-methoden voor schattingen Bewerken

De tweede reeks methoden voor het schatten van erfelijkheid omvat ANOVA en het schatten van variantiecomponenten.

Basismodel Bewerken

We gebruiken de basisbespreking van Kempthorne. genetische modellen kunnen we kijken naar de kwantitatieve bijdrage van een enkele locus met genotype Gi als

yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}

waarbij gi {\ displaystyle g_ {i}} het effect is van genotype Gi en e {\ displaystyle e} het milieueffect.

Overweeg een experiment met een groep stieren en hun nakomelingen van willekeurige moeders. Aangezien de nakomelingen de helft van hun genen van de vader krijgen en de helft van hun (willekeurige) moeder, is de nageslachtvergelijking

zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}

Intraclasscorrelaties Bewerken

Beschouw het bovenstaande experiment. We hebben twee groepen nakomelingen die we kunnen vergelijken. De eerste is het vergelijken van de verschillende nakomelingen voor een individuele vader (genoemd binnen de vadergroep). De variantie omvat termen voor genetische variantie (aangezien ze niet allemaal hetzelfde genotype kregen) en omgevingsvariantie. Dit wordt gezien als een foutterm.

De tweede groep nakomelingen zijn vergelijkingen van de gemiddelden van halfbroers en -zussen met elkaar (de zogenaamde onder de vadergroep). Naast de foutterm zoals in de binnenberengroepen, hebben we een optelterm vanwege de verschillen tussen verschillende gemiddelden van halfbroers. De correlatie tussen klassen is

corr (z, z ′) = corr (μ + 1 2 g + e, μ + 1 2 g + e ′) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z “) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e”) = {\ frac {1} {4}} V_ {g}},

aangezien milieueffecten onafhankelijk van elkaar zijn.

De ANOVAEdit

Het gebruik van ANOVA om erfelijkheidsgraad te berekenen, mislukt vaak om rekening te houden met de aanwezigheid van gen-omgevingsinteracties, omdat ANOVA een veel lager statistisch vermogen heeft voor het testen op interactie-effecten dan voor directe effecten.

Model met additieve en dominante termen Bewerken

Voor een model met additieve en dominante termen, maar andere niet, de vergelijking voor een enkele locus is

yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}

waar

Experimenten kunnen worden uitgevoerd met een vergelijkbare opzet als die gegeven in Tabel 1. Verschillende relaties gebruiken groepen, kunnen we verschillende intraclasscorrelaties evalueren. Met V a {\ displaystyle V_ {a}} als de additieve genetische variantie en V d {\ displaystyle V_ {d}} als de variantie van de dominantie-deviatie, worden intraclasscorrelaties lineaire functies van deze parameters. In het algemeen

Intraclass-correlatie = r V a + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}

waarbij r {\ displaystyle r} en θ {\ displaystyle \ theta} worden gevonden als

r = {\ displaystyle r =} P, en

θ = {\ displaystyle \ theta =} P.

Sommige gemeenschappelijke relaties en hun coëfficiënten worden gegeven in tabel 2.

Lineaire gemengde modellen Bewerken

In de literatuur is een grote verscheidenheid aan benaderingen met behulp van lineaire gemengde modellen gerapporteerd. Via deze methoden wordt de fenotypische variantie opgedeeld in genetische, omgevings- en experimentele ontwerpvariaties om erfelijkheidsgraad te schatten.Omgevingsvariantie kan expliciet worden gemodelleerd door individuen in een breed scala van omgevingen te bestuderen, hoewel gevolgtrekking van genetische variantie uit fenotypische en omgevingsvariantie kan leiden tot onderschatting van erfelijkheidsgraad vanwege de uitdaging om het volledige bereik van omgevingsinvloeden vast te leggen die een eigenschap beïnvloeden. Andere methoden voor het berekenen van erfelijkheidsgegevens gebruiken gegevens uit genoombrede associatiestudies om de invloed van genetische factoren op een eigenschap te schatten, wat wordt weerspiegeld door de snelheid en invloed van vermoedelijk geassocieerde genetische loci (meestal single-nucleotide polymorfismen) op de eigenschap. Dit kan echter leiden tot een onderschatting van de erfelijkheidsgraad. Deze discrepantie wordt “ontbrekende erfelijkheidsgraad” genoemd en weerspiegelt de uitdaging om nauwkeurig zowel genetische variantie als omgevingsvariantie in erfelijkheidsmodellen te modelleren.

Wanneer een grote, complexe stamboom of een ander voornoemd type gegevens beschikbaar is, wordt erfelijkheid en andere kwantitatieve genetische parameters kunnen worden geschat door middel van beperkte maximale waarschijnlijkheid (REML) of Bayesiaanse methoden. De onbewerkte gegevens hebben meestal drie of meer gegevenspunten voor elk individu: een code voor de vader, een code voor de moeder en een of meerdere kenmerkwaarden. Verschillende eigenschapwaarden kunnen voor verschillende eigenschappen of voor verschillende meetmomenten zijn.

De momenteel populaire methodologie is gebaseerd op een hoge mate van zekerheid over de identiteit van de vader en moeder; het is niet gebruikelijk om de identiteit van de vader probabilistisch te behandelen. Dit is meestal geen probleem, aangezien de methodologie zelden wordt toegepast op wilde populaties (hoewel het is gebruikt voor verschillende wilde hoefdieren en vogels), en stieren zijn altijd met een zeer hoge mate van zekerheid bekend in fokprogrammas. Er zijn ook algoritmen die rekening houden met onzeker vaderschap.

De stambomen kunnen worden bekeken met programmas zoals Pedigree Viewer, en geanalyseerd met programmas zoals ASReml, VCE, WOMBAT, MCMCglmm binnen de R-omgeving of de BLUPF90-familie van programmas.

Stamboommodellen zijn nuttig voor het ontwarren van verwarring zoals omgekeerde causaliteit, maternale effecten zoals de prenatale omgeving en verwarring van genetische dominantie, gedeelde omgeving en maternale geneffecten.

Genomische erfelijkheidsbewerking

Wanneer genoombrede genotype-gegevens en fenotypes uit grote populatiestalen beschikbaar zijn, kan men de relaties tussen individuen schatten op basis van hun genotypen en een lineair gemengd model gebruiken om de variantie te schatten die wordt verklaard door de genetische markeringen. Dit geeft een schatting van de genomische erfelijkheidsgraad op basis van de variantie die wordt vastgelegd door algemene genetische varianten. Er zijn meerdere methoden die verschillende aanpassingen maken voor allelfrequentie en koppelingsonevenwicht. In het bijzonder kan de methode genaamd High-Definition Likelihood (HDL) genomische erfelijkheid schatten met behulp van alleen GWAS-samenvattende statistieken, waardoor het gemakkelijker wordt om grote steekproefomvang op te nemen die beschikbaar is in verschillende GWAS-meta-analyses.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *