Dziedziczność

Ponieważ tylko P można bezpośrednio zaobserwować lub zmierzyć, odziedziczalność należy oszacować na podstawie podobieństw obserwowanych u osobników o różnym poziomie podobieństwa genetycznego lub środowiskowego. Analizy statystyczne wymagane do oszacowania genetycznych i środowiskowych komponentów wariancji zależą od cech próbki. Krótko mówiąc, lepsze szacunki uzyskuje się, wykorzystując dane od osób o bardzo zróżnicowanych poziomach pokrewieństwa genetycznego – takich jak bliźnięta, rodzeństwo, rodzice i potomstwo, a nie od osób bardziej spokrewnionych (a zatem mniej podobnych). Standardowy błąd szacowania odziedziczalności jest poprawiany przy dużych próbach.

W populacjach innych niż ludzie często można zebrać informacje w kontrolowany sposób. Na przykład wśród zwierząt hodowlanych łatwo jest zorganizować byka, aby wydał potomstwo z dużej liczby krów i kontrolował środowisko. Taka kontrola eksperymentalna jest generalnie niemożliwa podczas gromadzenia danych dotyczących ludzi, opierając się na naturalnie występujących związkach i środowiskach.

W klasycznej genetyki ilościowej istniały dwie szkoły myślenia dotyczące szacowania dziedziczenia.

Jedna szkoła myślenia została opracowana przez Sewalla Wrighta z University of Chicago, a następnie spopularyzowana przez CC Li (University of Chicago) i JL Lush (Iowa State University). Opiera się na analizie korelacji i, co za tym idzie, regresji. Analiza ścieżki została opracowana przez Sewalla Wrighta jako sposób szacowania dziedziczności.

Druga została pierwotnie opracowana przez RA Fishera i rozszerzona na University of Edinburgh, Iowa State University i North Carolina State University, a także inne szkoły. Opiera się na analizie wariancji badań hodowlanych z wykorzystaniem korelacji wewnątrzklasowej krewnych. W tych analizach stosuje się różne metody szacowania składników wariancji (a tym samym odziedziczalności) z ANOVA.

Obecnie dziedziczność można oszacować na podstawie ogólnych rodowodów przy użyciu liniowych modeli mieszanych oraz na podstawie pokrewieństwa genomowego oszacowanego na podstawie markerów genetycznych .

Badania nad dziedziczeniem człowieka często wykorzystują projekty badań adopcyjnych, często z identycznymi bliźniakami, które zostały rozdzielone we wczesnym okresie życia i wychowane w różnych środowiskach. Takie osoby mają identyczne genotypy i można ich użyć do oddzielenia skutków genotypu i środowiska. Ograniczeniem tego projektu jest powszechne środowisko prenatalne i stosunkowo mała liczba bliźniaków wychowywanych oddzielnie. Drugim i bardziej powszechnym projektem jest badanie bliźniaków, w którym podobieństwo bliźniąt jednojajowych i braterskich jest wykorzystywane do oszacowania dziedziczności. Badania te mogą być ograniczone faktem, że bliźnięta jednojajowe nie są całkowicie identyczne genetycznie, co może potencjalnie skutkować niedoszacowaniem dziedziczności.

W badaniach obserwacyjnych lub z powodu efektów sugestywnych (gdy genom wywołuje środowisko poprzez swój efekt na nich), G i E mogą być kowarne: korelacja środowiska genów. W zależności od metod stosowanych do szacowania odziedziczalności, korelacje między czynnikami genetycznymi a współdzielonymi lub niewspólnymi środowiskami mogą, ale nie muszą, być mylone z dziedziczeniem.

Regresyjne / korelacyjne metody szacowaniaEdytuj

Pierwsza szkoła estymacji wykorzystuje regresję i korelację do oszacowania odziedziczalności.

Porównanie bliskich krewnychEdit

W porównaniu krewnych, ogólnie stwierdzamy, że

h 2 = br = tr {\ Displaystyle h ^ {2} = {\ Frac {b} {r}} = {\ Frac {t} {r}}}

gdzie r można traktować jako współczynnik pokrewieństwa, b jest współczynnik regresji it jest współczynnikiem korelacji.

Regresja rodzicielsko-potomnaEdit

Rysunek 2. Dane Sir Francisa Galtona (1889) przedstawiające związek między wzrostem potomstwa (928 osobników) jako funkcją średniego wzrostu rodzica (205 zestawów rodziców).

Dziedziczność można oszacować, porównując rodzic i o ffspring traits (jak na ryc.2). Nachylenie linii (0,57) przybliża odziedziczalność cechy, gdy wartości potomstwa są regresowane w stosunku do średniej cechy u rodziców. Jeśli używana jest wartość tylko jednego rodzica, dziedziczność jest dwukrotnie większa od nachylenia. (Należy zauważyć, że jest to źródło terminu „regresja”, ponieważ wartości potomne zawsze mają tendencję do regresu do średniej wartości dla populacji, tj. jest zawsze mniejsza niż jeden). Ten efekt regresji leży również u podstaw metody DeFries-Fulker do analizy bliźniaków wybranych dla jednego członka dotkniętego chorobą.

Porównanie rodzeństwaEdytuj

Podstawowym podejściem do dziedziczenia może być wykonane przy użyciu schematów pełnego rodzeństwa: porównanie podobieństwa między rodzeństwem, które ma wspólną matkę biologiczną i ojca. Gdy występuje tylko addytywne działanie genów, ta korelacja fenotypowa rodzeństwa jest wskaźnikiem znajomości – suma połowy addytywnej wariancji genetycznej plus pełny efekt wspólnego środowiska.W ten sposób nakłada górną granicę na dziedziczność addytywną, która jest dwukrotnie większa niż korelacja fenotypowa pełnej Sib. Projekty Half-Sib porównują cechy fenotypowe rodzeństwa, które dzieli jednego rodzica z innymi grupami rodzeństwa.

Badania bliźniątEdytuj

Główny artykuł: badanie bliźniąt

Rysunek 3. Bliźniacze konkordancje dla siedmiu cech psychologicznych (wielkość próby pokazana w słupkach), gdzie DZ oznacza braterskie, a MZ to identyczne bliźnięta.

Dziedziczność cech u ludzi jest najczęściej szacowana przez porównanie podobieństw między bliźniakami. „Zaletą badań bliźniaczych jest to, że całkowitą wariancję można podzielić na genetyczne, wspólne lub wspólne elementy środowiskowe oraz unikalne komponenty środowiskowe, co umożliwia dokładne oszacowanie dziedziczności”. Bliźnięta braterskie lub dwuzygotyczne (DZ) mają średnio połowę swoich genów (zakładając, że nie ma kojarzenia selekcyjnego dla tej cechy), a więc bliźnięta jednojajowe lub jednojajowe (MZ) są średnio dwukrotnie bardziej podobne genetycznie niż bliźniaki DZ. Zgrubne oszacowanie dziedziczenia jest więc w przybliżeniu dwukrotnością różnicy w korelacji między bliźniakami MZ i DZ, tj. Wzór Falconera H2 = 2 (r (MZ) -r (DZ)).

Efekt środowiska wspólnego, c2, przyczynia się do podobieństwa między rodzeństwem ze względu na podobieństwo środowiska, w którym się wychowują. Środowisko współdzielone jest aproksymowane korelacją DZ minus połowę odziedziczalności, czyli stopień, w jakim bliźnięta DZ mają te same geny, c2 = DZ-1 / 2h2. Unikalna wariancja środowiskowa, e2, odzwierciedla stopień, w jakim identyczne bliźnięta wychowane razem są niepodobne, e2 = 1-r (MZ).

Analiza wariancji metod szacowaniaEdit

Drugi zestaw metod szacowania odziedziczalności obejmuje ANOVA i estymację składowych wariancji.

Model podstawowyEdytuj

Korzystamy z podstawowego omówienia Kempthornea. Rozważając tylko najbardziej podstawowe modele genetyczne, możemy spojrzeć na ilościowy wkład pojedynczego locus z genotypem Gi jako

yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}

gdzie gi {\ displaystyle g_ {i}} to efekt genotypu Gi ie {\ displaystyle e} to efekt środowiskowy.

Rozważmy eksperyment z grupą buhajów i ich potomstwem od losowych matek. Ponieważ potomstwo dostaje połowę swoich genów od ojca i połowę od ich (losowej) matki, równanie potomne jest

zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}

Intraclass correlationsEdit

Rozważ powyższy eksperyment. Mamy dwie grupy potomstwa, które możemy porównać. Pierwszym jest porównanie różnych potomków jednego ojca (nazywanego w obrębie grupy reproduktorów). Wariancja będzie obejmować terminy dotyczące wariancji genetycznej (ponieważ nie wszystkie otrzymały ten sam genotyp) i wariancji środowiskowej. Uważa się to za termin błędny.

Druga grupa potomstwa to porównania między sobą średnich rodzeństwa (tzw. Grupa reproduktorów). Oprócz składnika błędu, tak jak w grupach reproduktorów, mamy dodatkowy składnik ze względu na różnice między różnymi średnimi pół rodzeństwa. Korelacja wewnątrzklasowa to

corr (z, z ′) = corr (μ + 1 2 g + e, μ + 1 2 g + e ′) = 1 4 V g {\ Displaystyle \ operatorname {corr} (z , z „) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e”) = {\ frac {1} {4}} V_ {g}},

ponieważ efekty środowiskowe są niezależne od siebie.

ANOVAEdit

Zastosowanie ANOVA do obliczenia dziedziczenia często zawodzi aby uwzględnić obecność interakcji gen-środowisko, ponieważ ANOVA ma znacznie mniejszą moc statystyczną do testowania efektów interakcji niż w przypadku efektów bezpośrednich.

Model z dodatkowymi i dominującymi warunkamiEdytuj

Dla model z dodatkowymi i dominującymi warunkami, ale nie innymi, równanie dla pojedynczego miejsca jest

yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}

gdzie

Eksperymenty można przeprowadzać z podobną konfiguracją do tej podanej w tabeli 1. Korzystanie z innej zależności grup, możemy ocenić różne korelacje wewnątrzklasowe. Używając V a {\ Displaystyle V_ {a}} jako addytywnej wariancji genetycznej i V d {\ Displaystyle V_ {d}} jako wariancji odchylenia dominacji, wewnątrzklasowe korelacje stają się funkcjami liniowymi tych parametrów. Ogólnie rzecz biorąc,

Intraclass korelacja = r V a + θ V d, {\ Displaystyle = rV_ {a} + \ theta V_ {d},}

gdzie r {\ displaystyle r} i θ {\ displaystyle \ theta} znajdują się jako

r = {\ displaystyle r =} P i

θ = {\ displaystyle \ theta =} P.

Niektóre wspólne zależności i ich współczynniki podano w tabeli 2.

Liniowe modele mieszaneEdit

W literaturze opisano wiele różnych podejść wykorzystujących liniowe modele mieszane. Za pomocą tych metod wariancja fenotypowa jest dzielona na wariancje genetyczne, środowiskowe i eksperymentalne w celu oszacowania dziedziczności.Wariancję środowiskową można jednoznacznie modelować, badając osoby w szerokim zakresie środowisk, chociaż wnioskowanie o zmienności genetycznej na podstawie zmienności fenotypowej i środowiskowej może prowadzić do niedoszacowania dziedziczności ze względu na wyzwanie, jakim jest uchwycenie pełnego zakresu wpływu środowiska na cechę. Inne metody obliczania odziedziczalności wykorzystują dane z badań asocjacyjnych całego genomu do oszacowania wpływu czynników genetycznych na cechę, co znajduje odzwierciedlenie w częstości i wpływie przypuszczalnie powiązanych loci genetycznych (zwykle polimorfizmów pojedynczego nukleotydu) na cechę. Może to jednak prowadzić do niedoceniania dziedziczności. Ta rozbieżność jest określana jako „brakująca odziedziczalność” i odzwierciedla wyzwanie, jakim jest dokładne modelowanie zarówno genetycznej, jak i środowiskowej zmienności w modelach odziedziczalności.

Gdy dostępny jest duży, złożony rodowód lub inny wyżej wymieniony typ danych, odziedziczalność i inne ilościowe parametry genetyczne można oszacować metodami ograniczonego największego prawdopodobieństwa (REML) lub metodami bayesowskimi. Surowe dane będą miały zwykle trzy lub więcej punktów danych dla każdego osobnika: kod ojca, kod matki i jedną lub kilka wartości cech. Różne wartości cech mogą dotyczyć różnych cech lub różnych punktów czasowych pomiaru.

Obecnie popularna metodologia opiera się na wysokim stopniu pewności co do tożsamości ojca i matki; nie jest powszechne traktowanie tożsamości ojca probabilistycznie. Zwykle nie stanowi to problemu, ponieważ metodologia ta jest rzadko stosowana do dzikich populacji (chociaż była stosowana w kilku populacjach dzikich kopytnych i ptaków), a buhaje są niezmiennie znane z bardzo wysokim stopniem pewności w programach hodowlanych. Istnieją również algorytmy, które uwzględniają niepewne ojcostwo.

Rodowody można przeglądać za pomocą programów takich jak Pedigree Viewer i analizować za pomocą programów takich jak ASReml, VCE, WOMBAT, MCMCglmm w środowisku R lub z rodziny BLUPF90 programów.

Modele rodowodowe są pomocne w rozwiązywaniu komplikacji, takich jak odwrotna przyczynowość, skutki matczyne, takie jak środowisko prenatalne oraz pomieszanie dominacji genetycznej, wspólnego środowiska i efektów genów matki.

Dziedziczalność genomowa markery. Daje to oszacowanie odziedziczalności genomu na podstawie wariancji wychwyconej przez wspólne warianty genetyczne. Istnieje wiele metod, które zmieniają częstość alleli i nierównowagę sprzężeń. W szczególności metoda zwana High-Definition Likelihood (HDL) może oszacować odziedziczalność genomu przy użyciu tylko statystyk sumarycznych GWAS, co ułatwia włączenie dużych próbek dostępnych w różnych metaanalizach GWAS.