Dědičnost

Jelikož lze přímo pozorovat nebo měřit pouze P, dědičnost musí být odhadnuta z podobností pozorovaných u subjektů, které se liší úrovní genetické nebo environmentální podobnosti. Statistické analýzy potřebné k odhadu genetických a environmentálních složek rozptylu závisí na charakteristikách vzorku. Stručně řečeno, lepší odhady jsou získány na základě údajů od jedinců s velmi rozdílnými úrovněmi genetického vztahu – jako jsou dvojčata, sourozenci, rodiče a potomci, spíše než od vzdáleněji příbuzných (a tedy méně podobných) subjektů. Standardní chyba odhadů dědičnosti je vylepšena s velkými velikostmi vzorků.

V populacích jiných než člověk je často možné shromažďovat informace kontrolovaným způsobem. Například mezi hospodářskými zvířaty je snadné zařídit, aby býk produkoval potomky z velkého počtu krav a řídil prostředí. Taková experimentální kontrola obecně není při shromažďování údajů o lidech možná, spoléhá se na přirozeně se vyskytující vztahy a prostředí.

V klasické kvantitativní genetice existovaly dvě myšlenkové směry týkající se odhadu dědičnosti.

Jedna myšlenková škola byla vyvinuta Sewallem Wrightem z University of Chicago a dále popularizována CC Li (University of Chicago) a JL Lush (Iowa State University). Je založen na analýze korelací a potažmo regresi. Analýza cesty byla vyvinuta Sewallem Wrightem jako způsob odhadu dědičnosti.

Druhá byla původně vyvinuta RA Fisherem a rozšířena na University of Edinburgh, Iowa State University a North Carolina State University, stejně jako jiné školy. Je založen na analýze rozptylu šlechtitelských studií s využitím intraclassové korelace příbuzných. V těchto analýzách se používají různé metody odhadu složek rozptylu (a tedy dědičnosti) z ANOVA.

Dnes lze dědičnost odhadnout z obecných rodokmenů pomocí lineárních smíšených modelů a z genomové příbuznosti odhadované z genetických markerů .

Studie lidské dědičnosti často využívají koncepty adopčních studií, často s identickými dvojčaty, která byla v raném věku oddělena a vychovávána v různých prostředích. Tito jedinci mají identické genotypy a lze je použít k oddělení účinků genotypu a prostředí. Limit tohoto designu je společné prenatální prostředí a relativně nízký počet dvojčat chovaných od sebe. Druhým a běžnějším designem je studie dvojčat, ve které se k odhadu dědičnosti používá podobnost identických a bratrských dvojčat. Tyto studie mohou být omezeny skutečností, že identická dvojčata nejsou zcela geneticky identická, což může vést k podcenění dědičnosti.

V observačních studiích nebo z důvodu evokujících účinků (kde genom svým účinkem evokuje prostředí. G a E se mohou překrývat: korelace genového prostředí. V závislosti na metodách použitých k odhadu dědičnosti se korelace mezi genetickými faktory a sdíleným nebo nesdíleným prostředím mohou nebo nemusí zaměňovat s dědičností.

Regresní / korelační metody odhaduEdit

První škola odhadu používá k odhadu dědičnosti regresi a korelaci.

Porovnání blízkých příbuzných Upravit

Při srovnání příbuzných zjistíme, že obecně

h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}

kde r lze považovat za koeficient příbuznosti, b je koeficient regrese at je koeficient korelace.

Rodičovský potomek regreseEdit

Obrázek 2. Data sira Francise Galtona (1889) ukazující vztah mezi výškou potomků (928 jedinců) jako funkce střední výšky rodičů (205 sad rodičů).

Dědičnost lze odhadnout porovnáním rodičů a o vlastnosti ffspring (jako na obr. 2). Sklon čáry (0,57) se blíží dědičnosti znaku, když jsou hodnoty potomků sníženy proti průměrnému znaku u rodičů. Pokud je použita pouze jedna rodičovská hodnota, potom je dědičnost dvojnásobkem sklonu. (Všimněte si, že toto je zdrojem výrazu „regrese“, protože hodnoty potomků mají vždy tendenci ustupovat ke střední hodnotě pro populaci, tj. Sklon je vždy menší než jedna). Tento regresní efekt je také základem metody DeFries – Fulker pro analýzu dvojčat vybraných pro jednoho ovlivněného člena.

Sourozenecké srovnáníEdit

Základní přístup k dědičnosti může být převzato pomocí návrhů full-sib: srovnání podobnosti mezi sourozenci, kteří sdílejí biologickou matku i otce. Pokud existuje pouze aditivní genová akce, je tato sourozenecká fenotypová korelace indexem známosti – součet poloviny aditivní genetické variance plus plný účinek společného prostředí.Stanovuje tedy horní limit aditivní dědičnosti dvojnásobku fenotypové korelace plné Sib. Half-Sib designy porovnávají fenotypové rysy sourozenců, kteří sdílejí jednoho rodiče s jinými sourozeneckými skupinami.

Twin studiesEdit
Hlavní článek: Twin twin

Obrázek 3. Dvojité shody pro sedm psychologických vlastností (velikost vzorku je zobrazena uvnitř pruhů), přičemž DZ je bratrská a MZ jsou identická dvojčata.

Dědičnost pro lidské vlastnosti se nejčastěji odhaduje porovnáním podobností mezi dvojčaty. „Výhodou studií s dvojčaty je, že lze celkovou rozptyl rozdělit na genetické, sdílené nebo společné složky prostředí a jedinečné složky prostředí, což umožňuje přesný odhad dědičnosti.“ Bratrská nebo dizygotická (DZ) dvojčata v průměru sdílejí polovinu svých genů (za předpokladu, že pro tento znak neexistuje asortativní páření), a tak jsou identická nebo monozygotní (MZ) dvojčata v průměru dvakrát geneticky podobnější než dvojčata DZ. Surový odhad dědičnosti je tedy přibližně dvojnásobný rozdíl v korelaci mezi dvojčaty MZ a DZ, tj. Falconerův vzorec H2 = 2 (r (MZ) -r (DZ)).

Účinek sdíleného prostředí, c2, přispívá k podobnosti mezi sourozenci kvůli shodnosti prostředí, ve kterém jsou vychováváni. Sdílené prostředí je aproximováno korelací DZ mínus poloviční dědičnost, což je míra, do jaké dvojčata DZ sdílejí stejné geny, c2 = DZ-1 / 2h2. Jedinečná odchylka prostředí, e2, odráží míru, do jaké jsou identická dvojčata vychovaná společně odlišná, e2 = 1-r (MZ).

Analýza variačních metod odhaduUpravit

Druhá sada metod odhadu dědičnosti zahrnuje ANOVA a odhad komponent rozptylu.

Základní modelEdit

Používáme základní diskusi Kempthorne. Vezmeme-li v úvahu pouze nejzákladnější z genetické modely, můžeme se podívat na kvantitativní příspěvek jednoho lokusu s genotypem Gi jako

yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}

kde gi {\ displaystyle g_ {i}} je účinek genotypu Gi a e {\ displaystyle e} je účinek na životní prostředí.

Zvažte experiment se skupinou otců a jejich potomků z náhodných matek. Protože potomci získají polovinu svých genů od otce a polovinu od své (náhodné) matky, potomská rovnice je

zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}

Intraclass correlationsEdit

Zvažte výše uvedený experiment. Máme dvě skupiny potomků, které můžeme srovnávat. První je porovnání různých potomků pro jednotlivého otce (nazývaného v rámci skupiny otců). Rozptyl bude zahrnovat výrazy pro genetickou rozptyl (protože ne všechny získaly stejný genotyp) a rozptyl prostředí. Toto je považováno za chybný termín.

Druhou skupinou potomků jsou srovnání průměrů polovičních sourozenců (nazývaných mezi skupinou otců). Kromě chybného členu jako ve skupinách v rámci otců máme i další člen kvůli rozdílům mezi různými prostředky polovičních sourozenců. Korelace uvnitř třídy je

corr (z, z ′) = corr (μ + 1 2 g + e, μ + 1 2 g + e ′) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z „) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e“) = {\ frac {1} {4}} V_ {g}},

protože vlivy prostředí jsou na sobě nezávislé.

ANOVAEdit

Použití ANOVA k výpočtu dědičnosti často selže zohlednit přítomnost interakcí mezi genem a prostředím, protože ANOVA má mnohem nižší statistickou sílu pro testování účinků interakce než pro přímé účinky.

Model s aditivními a dominančními výrazy Upravit

Pro model s aditivními a dominančními pojmy, ale ne s jinými, rovnice pro jediný lokus je

yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alfa _ {i} + \ alpha _ {j} + d_ {ij} + e,}

kde

Experimenty lze spustit s podobným nastavením, jaké je uvedeno v tabulce 1. Použití jiného vztahu skupiny, můžeme vyhodnotit různé korelace uvnitř třídy. Použitím V a {\ displaystyle V_ {a}} jako aditivní genetické odchylky a V d {\ displaystyle V_ {d}} jako odchylky odchylky dominance se korelace uvnitř třídy stanou lineárními funkcemi těchto parametrů. Obecně platí, že

korelace uvnitř třídy = r PROTI + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}

kde r {\ displaystyle r} a θ {\ displaystyle \ theta} se nacházejí jako

r = {\ displaystyle r =} P a

θ = {\ displaystyle \ theta =} P.

Některé společné vztahy a jejich koeficienty jsou uvedeny v tabulce 2.

Lineární smíšené modely Upravit

V literatuře byla popsána široká paleta přístupů využívajících lineární smíšené modely. Prostřednictvím těchto metod je fenotypová odchylka rozdělena na genetické, environmentální a experimentální konstrukční odchylky pro odhad dědičnosti.Variabilitu prostředí lze explicitně modelovat studiem jednotlivců v širokém spektru prostředí, ačkoli odvození genetické odchylky od fenotypové a odchylky prostředí může vést k podcenění dědičnosti kvůli výzvě zachytit celou škálu vlivů prostředí ovlivňujících danou vlastnost. Jiné metody pro výpočet dědičnosti používají údaje z asociačních studií v celém genomu k odhadu vlivu na znak genetickými faktory, což se odráží v míře a vlivu domněle spojených genetických lokusů (obvykle polymorfismů s jedním nukleotidy) na znak. To však může vést k podcenění dědičnosti. Tato nesrovnalost se označuje jako „chybějící dědičnost“ a odráží výzvu přesného modelování genetické i environmentální odchylky v modelech dědičnosti.

Pokud je k dispozici velký, komplexní rodokmen nebo jiný výše uvedený typ dat, dědičnost a další kvantitativní genetické parametry lze odhadnout pomocí omezené maximální věrohodnosti (REML) nebo Bayesovských metod. Nezpracovaná data budou mít obvykle tři nebo více datových bodů pro každého jednotlivce: kód pro otce, kód pro matku a jednu nebo několik hodnot vlastností. Různé hodnoty vlastností mohou být pro různé vlastnosti nebo pro různé časové body měření.

V současné době populární metodologie spoléhá na vysoký stupeň jistoty ohledně identit otce a matky; není běžné zacházet s identitou otce pravděpodobnostně. To obvykle není problém, protože metodika se zřídka používá u volně žijících populací (ačkoli byla použita pro několik populací divokých kopytníků a ptáků) a otcové jsou v šlechtitelských programech vždy známí s velmi vysokou mírou jistoty. Existují také algoritmy, které zohledňují nejisté otcovství.

Rodokmeny lze prohlížet pomocí programů, jako je Pedigree Viewer, a analyzovat pomocí programů, jako jsou ASReml, VCE, WOMBAT, MCMCglmm v prostředí R nebo rodiny BLUPF90. programů.

Rodokmenové modely jsou užitečné pro rozpletení zmatků, jako je obrácená kauzalita, mateřské efekty, jako je prenatální prostředí, a zmatení genetické dominance, sdíleného prostředí a efektů mateřských genů.

Genomická dědičnostUpravit

Když jsou k dispozici údaje o genotypu a fenotypy pro celý genom ze vzorků velké populace, lze odhadnout vztahy mezi jednotlivci na základě jejich genotypů a pomocí lineárního smíšeného modelu odhadnout rozptyl vysvětlený geneticky markery. To poskytuje odhad genomové dědičnosti na základě rozptylu zachyceného běžnými genetickými variantami. Existuje několik metod, které provádějí různé úpravy frekvence alel a vazebné nerovnováhy. Metoda zvaná High-Definition Likelihood (HDL) dokáže odhadnout genomovou dědičnost pouze pomocí souhrnných statistik GWAS, což usnadňuje začlenění velké velikosti vzorku dostupné v různých metaanalýzách GWAS.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *