Heritabilität

Da nur P direkt beobachtet oder gemessen werden kann, muss die Heritabilität anhand der Ähnlichkeiten geschätzt werden, die bei Probanden beobachtet wurden, die sich in ihrem Grad an genetischer oder ökologischer Ähnlichkeit unterscheiden. Die statistischen Analysen, die zur Abschätzung der genetischen und umweltbedingten Varianzkomponenten erforderlich sind, hängen von den Probenmerkmalen ab. Kurz gesagt, bessere Schätzungen werden unter Verwendung von Daten von Personen mit sehr unterschiedlichen genetischen Beziehungen – wie Zwillingen, Geschwistern, Eltern und Nachkommen – und nicht von entfernter verwandten (und daher weniger ähnlichen) Probanden erhalten. Der Standardfehler für Heritabilitätsschätzungen wird bei großen Stichproben verbessert.

In nichtmenschlichen Populationen ist es häufig möglich, Informationen auf kontrollierte Weise zu sammeln. Zum Beispiel ist es bei Nutztieren einfach, einen Bullen dazu zu bringen, Nachkommen von einer großen Anzahl von Kühen zu produzieren und die Umgebung zu kontrollieren. Eine solche experimentelle Kontrolle ist im Allgemeinen nicht möglich, wenn menschliche Daten gesammelt werden, die sich auf natürlich vorkommende Beziehungen und Umgebungen stützen.

In der klassischen quantitativen Genetik gab es zwei Denkrichtungen hinsichtlich der Abschätzung der Erblichkeit.

Eine Denkschule wurde von Sewall Wright an der University of Chicago entwickelt und von CC Li (University of Chicago) und JL Lush (Iowa State University) weiter populär gemacht. Es basiert auf der Analyse von Korrelationen und im weiteren Sinne auf Regression. Die Pfadanalyse wurde von Sewall Wright entwickelt, um die Erblichkeit abzuschätzen.

Die zweite wurde ursprünglich von RA Fisher entwickelt und an der Universität von Edinburgh, der Iowa State University und der North Carolina State University sowie erweitert andere Schulen. Es basiert auf der Varianzanalyse von Zuchtstudien unter Verwendung der Intraclass-Korrelation von Verwandten. In diesen Analysen werden verschiedene Methoden zur Schätzung von Varianzkomponenten (und damit der Heritabilität) aus ANOVA verwendet.

Heute kann die Heritabilität anhand allgemeiner Stammbäume unter Verwendung linearer gemischter Modelle und anhand der aus genetischen Markern geschätzten genomischen Verwandtschaft geschätzt werden

Studien zur Erblichkeit des Menschen verwenden häufig Adoptionsstudiendesigns, häufig mit identischen Zwillingen, die früh im Leben getrennt und in verschiedenen Umgebungen aufgezogen wurden. Solche Individuen haben identische Genotypen und können verwendet werden, um die Auswirkungen von Genotyp und Umwelt zu trennen. Eine Grenze dieses Entwurfs ist die gemeinsame pränatale Umgebung und die relativ geringe Anzahl von Zwillingen, die auseinander gezogen werden. Ein zweites und häufigeres Design ist die Zwillingsstudie, in der die Ähnlichkeit von identischen und brüderlichen Zwillingen verwendet wird, um die Erblichkeit abzuschätzen. Diese Studien können durch die Tatsache eingeschränkt werden, dass eineiige Zwillinge nicht vollständig genetisch identisch sind, was möglicherweise zu einer Unterschätzung der Erblichkeit führt.

In Beobachtungsstudien oder aufgrund evokativer Effekte (bei denen ein Genom durch seine Wirkung Umgebungen hervorruft) auf ihnen) können G und E kovärieren: Genumgebungskorrelation. Abhängig von den Methoden zur Schätzung der Heritabilität können Korrelationen zwischen genetischen Faktoren und gemeinsam genutzten oder nicht gemeinsam genutzten Umgebungen mit der Heritabilität verwechselt werden oder nicht.

Regressions- / Korrelationsmethoden für die SchätzungEdit

Die Die erste Schule der Schätzung verwendet Regression und Korrelation, um die Heritabilität zu schätzen.

Vergleich enger VerwandterEdit

Beim Vergleich von Verwandten stellen wir fest, dass im Allgemeinen

h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}

wobei r als Verwandtschaftskoeffizient angesehen werden kann, b ist Der Regressionskoeffizient und t ist der Korrelationskoeffizient.

Regression der Eltern-NachkommenEdit

Abbildung 2. Die Daten von Sir Francis Galton (1889) zeigen die Beziehung zwischen der Größe der Nachkommen (928 Personen) als Funktion der mittleren Elterngröße (205 Elterngruppen).

Die Heritabilität kann durch Vergleich von Eltern und O geschätzt werden ffspring Merkmale (wie in Abb. 2). Die Steigung der Linie (0,57) nähert sich der Heritabilität des Merkmals an, wenn die Werte der Nachkommen gegen das durchschnittliche Merkmal der Eltern zurückgegangen sind. Wenn nur der Wert eines Elternteils verwendet wird, ist die Erblichkeit doppelt so hoch wie die Steigung. (Beachten Sie, dass dies die Quelle des Begriffs „Regression“ ist, da die Werte der Nachkommen immer dazu neigen, auf den Mittelwert für die Population, dh die Steigung, zurückzufallen ist immer kleiner als eins). Dieser Regressionseffekt liegt auch der DeFries-Fulker-Methode zur Analyse von Zwillingen zugrunde, die für ein betroffenes Mitglied ausgewählt wurden.

GeschwistervergleichEdit

Ein grundlegender Ansatz zur Erblichkeit kann sein Unter Verwendung von Full-Sib-Designs: Vergleich der Ähnlichkeit zwischen Geschwistern, die sowohl eine leibliche Mutter als auch einen Vater teilen. Wenn nur eine additive Genwirkung vorliegt, ist diese phänotypische Korrelation der Geschwister ein Index der Vertrautheit – die Summe der Hälfte der additiven genetischen Varianz plus der vollen Wirkung der gemeinsamen Umgebung.Damit wird die additive Heritabilität auf das Doppelte der phänotypischen Korrelation zwischen Voll-Sib begrenzt. Half-Sib-Designs vergleichen phänotypische Merkmale von Geschwistern, die einen Elternteil mit anderen Geschwistergruppen teilen.

ZwillingsstudienEdit
Hauptartikel: Zwillingsstudie

Abbildung 3. Zwillingskonkordanzen für sieben psychologische Merkmale (Stichprobengröße in Balken), wobei DZ brüderlich und MZ eineiige Zwillinge sind.

Die Heritabilität von Merkmalen beim Menschen wird am häufigsten durch Vergleichen von Ähnlichkeiten zwischen Zwillingen geschätzt. „Der Vorteil von Zwillingsstudien besteht darin, dass die Gesamtvarianz in genetische, gemeinsame oder gemeinsame Umwelt- und einzigartige Umweltkomponenten aufgeteilt werden kann, was eine genaue Abschätzung der Erblichkeit ermöglicht.“ Brüderliche oder dizygote (DZ) Zwillinge teilen im Durchschnitt die Hälfte ihrer Gene (vorausgesetzt, es gibt keine assortative Paarung für das Merkmal), und so sind identische oder monozygote (MZ) Zwillinge im Durchschnitt doppelt so genetisch ähnlich wie DZ-Zwillinge. Eine grobe Schätzung der Erblichkeit ist also ungefähr doppelt so groß wie der Unterschied in der Korrelation zwischen MZ- und DZ-Zwillingen, dh die Falconer-Formel H2 = 2 (r (MZ) -r (DZ)).

Der Effekt der gemeinsamen Umgebung, c2, trägt aufgrund der Gemeinsamkeit der Umgebung, in der sie aufgewachsen sind, zur Ähnlichkeit zwischen Geschwistern bei. Die gemeinsame Umgebung wird durch die DZ-Korrelation minus der halben Erblichkeit angenähert, dh dem Grad, in dem DZ-Zwillinge dieselben Gene teilen, c2 = DZ-1 / 2h2. Die eindeutige Umgebungsvarianz e2 spiegelt den Grad wider, in dem identische Zwillinge, die zusammen aufgezogen werden, unähnlich sind, e2 = 1-r (MZ).

Analyse der VarianzschätzungsmethodenEdit

Der zweite Satz von Methoden zur Schätzung der Heritabilität umfasst die ANOVA und die Schätzung von Varianzkomponenten.

GrundmodellEdit

Wir verwenden die grundlegende Diskussion von Kempthorne In genetischen Modellen können wir den quantitativen Beitrag eines einzelnen Locus mit dem Genotyp Gi als

yi = μ + gi + e {\ betrachten Anzeigestil y_ {i} = \ mu + g_ {i} + e}

wobei gi {\ Anzeigestil g_ {i}} die Auswirkung des Genotyps Gi und e {\ Anzeigestil e} die Auswirkung auf die Umwelt ist.

Betrachten Sie ein Experiment mit einer Gruppe von Vererbern und ihren Nachkommen von zufälligen Muttertieren. Da die Nachkommen die Hälfte ihrer Gene vom Vater und die Hälfte von ihrer (zufälligen) Mutter erhalten, lautet die Nachkommengleichung

zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}

Intraclass-KorrelationenEdit

Betrachten Sie das obige Experiment. Wir haben zwei Gruppen von Nachkommen, die wir vergleichen können. Der erste ist der Vergleich der verschiedenen Nachkommen für einen einzelnen Vater (innerhalb der Vatergruppe genannt). Die Varianz umfasst Begriffe für genetische Varianz (da nicht alle den gleichen Genotyp hatten) und Umweltvarianz. Dies wird als Fehlerbegriff angesehen.

Die zweite Gruppe von Nachkommen sind Vergleiche der Mittelwerte von Halbgeschwistern miteinander (unter der Vatergruppe genannt). Zusätzlich zum Fehlerterm wie in den Vatergruppen haben wir einen Additionsterm aufgrund der Unterschiede zwischen den verschiedenen Mitteln der Halbgeschwister. Die Intraclass-Korrelation ist

corr (z, z ) = corr (μ + 1 2 g + e, μ + 1 2 g + e) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z „) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e“) = {\ frac {1} {4}} V_ {g}},

da Umwelteinflüsse unabhängig voneinander sind.

Der ANOVAEdit

Die Verwendung von ANOVA zur Berechnung der Erblichkeit schlägt häufig fehl um das Vorhandensein von Gen-Umwelt-Wechselwirkungen zu berücksichtigen, da ANOVA eine viel geringere statistische Aussagekraft zum Testen auf Wechselwirkungseffekte aufweist als für direkte Effekte.

Modell mit additiven und dominanten BegriffenEdit

For Bei einem Modell mit additiven und dominanten Begriffen, jedoch nicht anderen, lautet die Gleichung für einen einzelnen Ort

yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}

wobei

Experimente mit einem ähnlichen Aufbau wie in Tabelle 1 durchgeführt werden können. Verwenden einer anderen Beziehung Gruppen können wir verschiedene Intraclass-Korrelationen auswerten. Unter Verwendung von Va {\ displaystyle V_ {a}} als additive genetische Varianz und Vd {\ displaystyle V_ {d}} als Dominanzabweichungsvarianz werden Intraclass-Korrelationen zu linearen Funktionen dieser Parameter. Im Allgemeinen ist

Intraclass-Korrelation = r Va + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}

wobei r {\ displaystyle r} und θ {\ displaystyle \ theta} werden als

r = {\ displaystyle r =} P und

θ = {\ displaystyle \ theta =} P gefunden.

Einige Gemeinsame Beziehungen und ihre Koeffizienten sind in Tabelle 2 angegeben.

Lineare MischmodelleEdit

In der Literatur wurde über eine Vielzahl von Ansätzen unter Verwendung linearer Mischmodelle berichtet. Über diese Methoden wird die phänotypische Varianz in genetische, umweltbedingte und experimentelle Designvarianzen unterteilt, um die Heritabilität abzuschätzen.Die Umweltvarianz kann explizit modelliert werden, indem Individuen in einem breiten Spektrum von Umgebungen untersucht werden. Die Schlussfolgerung der genetischen Varianz aus der phänotypischen und der Umweltvarianz kann jedoch zu einer Unterschätzung der Erblichkeit führen, da die Herausforderung besteht, das gesamte Spektrum der Umwelteinflüsse zu erfassen, die ein Merkmal beeinflussen. Andere Methoden zur Berechnung der Heritabilität verwenden Daten aus genomweiten Assoziationsstudien, um den Einfluss genetischer Faktoren auf ein Merkmal abzuschätzen, was sich in der Rate und dem Einfluss mutmaßlich assoziierter genetischer Loci (normalerweise Einzelnukleotidpolymorphismen) auf das Merkmal widerspiegelt. Dies kann jedoch zu einer Unterschätzung der Erblichkeit führen. Diese Diskrepanz wird als „fehlende Erblichkeit“ bezeichnet und spiegelt die Herausforderung wider, sowohl genetische als auch Umweltvarianz in Erblichkeitsmodellen genau zu modellieren.

Wenn ein großer, komplexer Stammbaum oder eine andere oben genannte Art von Daten verfügbar ist, Erblichkeit und Andere quantitative genetische Parameter können durch REML-Methoden (Restricted Maximum Likelihood) oder Bayessche Methoden geschätzt werden. Die Rohdaten enthalten normalerweise drei oder mehr Datenpunkte für jede Person: einen Code für den Vater, einen Code für die Mutter und einen oder mehrere Merkmalswerte. Unterschiedliche Merkmalswerte können für unterschiedliche Merkmale oder für unterschiedliche Messzeitpunkte gelten.

Die derzeit beliebte Methode beruht auf einem hohen Maß an Sicherheit über die Identität des Vaters und der Mutter. Es ist nicht üblich, die Identität des Vaters probabilistisch zu behandeln. Dies ist normalerweise kein Problem, da die Methode selten auf Wildpopulationen angewendet wird (obwohl sie für mehrere Wildhuftier- und Vogelpopulationen verwendet wurde) und Vererber in Zuchtprogrammen ausnahmslos mit einem sehr hohen Maß an Sicherheit bekannt sind. Es gibt auch Algorithmen, die eine ungewisse Vaterschaft berücksichtigen.

Die Stammbäume können mit Programmen wie Pedigree Viewer angezeigt und mit Programmen wie ASReml, VCE, WOMBAT, MCMCglmm in der R-Umgebung oder der BLUPF90-Familie analysiert werden

Stammbaummodelle sind hilfreich, um Verwechslungen wie umgekehrte Kausalität, mütterliche Auswirkungen wie die pränatale Umgebung und Verwechslungen von genetischer Dominanz, gemeinsamer Umgebung und mütterlichen Geneffekten zu entwirren.

Genomische HeritabilitätEdit

Wenn genomweite Genotypdaten und Phänotypen aus großen Populationsproben verfügbar sind, kann man die Beziehungen zwischen Individuen basierend auf ihren Genotypen abschätzen und ein lineares gemischtes Modell verwenden, um die durch das Gen erklärte Varianz abzuschätzen Marker. Dies ergibt eine genomische Heritabilitätsschätzung basierend auf der Varianz, die von gängigen genetischen Varianten erfasst wird. Es gibt mehrere Methoden, die unterschiedliche Anpassungen für die Allelfrequenz und das Bindungsungleichgewicht vornehmen. Insbesondere kann die als High-Definition Likelihood (HDL) bezeichnete Methode die genomische Heritabilität nur anhand von GWAS-Zusammenfassungsstatistiken abschätzen, wodurch es einfacher wird, große Stichprobengrößen in verschiedene GWAS-Metaanalysen einzubeziehen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.