Puisque seul P peut être observé ou mesuré directement, lhéritabilité doit être estimée à partir des similitudes observées chez des sujets variant dans leur niveau de similitude génétique ou environnementale. Les analyses statistiques nécessaires pour estimer les composantes génétiques et environnementales de la variance dépendent des caractéristiques de léchantillon. En bref, de meilleures estimations sont obtenues en utilisant des données provenant dindividus ayant des niveaux de relation génétique très variables – tels que des jumeaux, des frères et sœurs, des parents et des descendants, plutôt que de sujets plus éloignés (et donc moins similaires). Lerreur standard pour les estimations dhéritabilité est améliorée avec des échantillons de grande taille.
Dans les populations non humaines, il est souvent possible de collecter des informations de manière contrôlée. Par exemple, parmi les animaux de ferme, il est facile de faire en sorte quun taureau produise la progéniture dun grand nombre de vaches et de contrôler les environnements. Un tel contrôle expérimental nest généralement pas possible lors de la collecte de données humaines, en sappuyant sur des relations et des environnements naturels.
En génétique quantitative classique, il y avait deux écoles de pensée concernant lestimation de lhéritabilité.
Une école de pensée a été développée par Sewall Wright à lUniversité de Chicago, puis popularisée par CC Li (Université de Chicago) et JL Lush (Iowa State University). Il est basé sur lanalyse des corrélations et, par extension, sur la régression. Lanalyse de chemin a été développée par Sewall Wright comme un moyen destimer lhéritabilité.
La seconde a été initialement développée par RA Fisher et développée à lUniversité dÉdimbourg, à lIowa State University et à la North Carolina State University, ainsi quà autres écoles. Il est basé sur lanalyse de la variance des études de sélection, en utilisant la corrélation intraclasse des parents. Diverses méthodes destimation des composantes de la variance (et, par conséquent, de lhéritabilité) à partir de lANOVA sont utilisées dans ces analyses.
Aujourdhui, lhéritabilité peut être estimée à partir de généalogies générales en utilisant des modèles mixtes linéaires et à partir de la parenté génomique estimée à partir de marqueurs génétiques .
Les études sur lhéritabilité humaine utilisent souvent des modèles détude dadoption, souvent avec des jumeaux identiques qui ont été séparés tôt dans la vie et élevés dans des environnements différents. Ces individus ont des génotypes identiques et peuvent être utilisés pour séparer les effets du génotype et de lenvironnement. Une limite de cette conception est lenvironnement prénatal commun et le nombre relativement faible de jumeaux élevés séparément. Une deuxième conception plus courante est létude des jumeaux dans laquelle la similitude des jumeaux identiques et fraternels est utilisée pour estimer lhéritabilité. Ces études peuvent être limitées par le fait que des jumeaux identiques ne sont pas complètement génétiquement identiques, ce qui peut entraîner une sous-estimation de lhéritabilité.
Dans les études dobservation, ou à cause deffets évocateurs (où un génome évoque des environnements par son effet sur eux), G et E peuvent covary: corrélation de lenvironnement des gènes. Selon les méthodes utilisées pour estimer lhéritabilité, les corrélations entre les facteurs génétiques et les environnements partagés ou non partagés peuvent ou non être confondues avec lhéritabilité.
Méthodes destimation de régression / corrélationModifier
Le La première école destimation utilise la régression et la corrélation pour estimer lhéritabilité.
Comparaison des parents proches Modifier
Dans la comparaison des parents, nous constatons quen général,
h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}
où r peut être considéré comme le coefficient de parenté, b est le coefficient de régression et t est le coefficient de corrélation.
Régression parent-descendanceEdit
Figure 2. Données de Sir Francis Galton (1889) montrant la relation entre la taille de la progéniture (928 individus) en fonction de la taille moyenne des parents (205 ensembles de parents).
Lhéritabilité peut être estimée en comparant le parent et o traits ffspring (comme sur la figure 2). La pente de la droite (0,57) se rapproche de lhéritabilité du trait lorsque les valeurs de la progéniture sont régressées par rapport au trait moyen chez les parents. Si la valeur dun seul parent est utilisée, lhéritabilité est le double de la pente. (Notez que cest la source du terme «régression», puisque les valeurs de la progéniture ont toujours tendance à régresser vers la valeur moyenne de la population, cest-à-dire la pente est toujours inférieur à un). Cet effet de régression sous-tend également la méthode DeFries – Fulker pour analyser les jumeaux sélectionnés pour un membre affecté.
Comparaison des frères et sœursModifier
Une approche de base de lhéritabilité peut être prises à laide de plans Full-Sib: comparaison de la similitude entre les frères et sœurs qui partagent à la fois une mère biologique et un père. Lorsquil ny a quune action génétique additive, cette corrélation phénotypique des frères et sœurs est un indice de familiarité – la somme de la moitié de la variance génétique additive plus leffet total de lenvironnement commun.Il place ainsi une limite supérieure sur lhéritabilité additive de deux fois la corrélation phénotypique full-Sib. Les conceptions Half-Sib comparent les traits phénotypiques des frères et sœurs qui partagent un parent avec dautres groupes de frères et sœurs.
Etudes de jumeauxModifier
Figure 3. Deux concordances pour sept traits psychologiques (taille de léchantillon indiquée entre les barres), DZ étant fraternel et MZ étant des jumeaux identiques
Lhéritabilité des traits humains est le plus souvent estimée en comparant les ressemblances entre les jumeaux. « Lavantage des études jumelles, cest que la variance totale peut être divisée en composants environnementaux génétiques, partagés ou communs et environnementaux uniques, permettant une estimation précise de lhéritabilité ». Les jumeaux fraternels ou dizygotes (DZ) partagent en moyenne la moitié de leurs gènes (en supposant quil ny ait pas daccouplement assortatif pour le trait), et donc les jumeaux identiques ou monozygotes (MZ) sont en moyenne deux fois plus similaires génétiquement que les jumeaux DZ. Une estimation brute de lhéritabilité est donc environ deux fois la différence de corrélation entre les jumeaux MZ et DZ, cest-à-dire la formule de Falconer H2 = 2 (r (MZ) -r (DZ)).
Leffet denvironnement partagé, c2, contribue à la similitude entre les frères et sœurs en raison de la similitude de lenvironnement dans lequel ils sont élevés. Lenvironnement partagé est approximé par la corrélation DZ moins la moitié de lhéritabilité, qui est le degré auquel les jumeaux DZ partagent les mêmes gènes, c2 = DZ-1 / 2h2. La variance environnementale unique, e2, reflète le degré auquel les jumeaux identiques élevés ensemble sont différents, e2 = 1-r (MZ).
Analyse des méthodes destimation de la variance Modifier
Le deuxième ensemble de méthodes destimation de lhéritabilité implique lANOVA et lestimation des composantes de la variance.
Modélisation de base
Nous utilisons la discussion de base de Kempthorne. En ne considérant que le plus élémentaire de modèles génétiques, nous pouvons examiner la contribution quantitative dun seul locus de génotype Gi comme
yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}
où gi {\ displaystyle g_ {i}} est leffet du génotype Gi et e {\ displaystyle e} est leffet environnemental.
Prenons une expérience avec un groupe de taureaux et leur progéniture issus de mères aléatoires. Puisque la progéniture obtient la moitié de ses gènes du père et lautre moitié de sa mère (aléatoire), léquation de la descendance est
zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}
Corrélations intraclassesEdit
Considérez lexpérience ci-dessus. Nous avons deux groupes de progéniture que nous pouvons comparer. La première consiste à comparer les différentes descendances pour un taureau individuel (appelé au sein du groupe de taureaux). La variance comprendra les termes de variance génétique (puisquils nont pas tous obtenu le même génotype) et de variance environnementale. Ceci est considéré comme un terme derreur.
Le deuxième groupe de progéniture est une comparaison des moyennes des demi-frères les uns avec les autres (appelés parmi le groupe de taureaux). En plus du terme derreur comme dans les groupes de taureaux à lintérieur, nous avons un terme supplémentaire en raison des différences entre les différentes moyennes de demi-frères. La corrélation intraclasse est
corr (z, z ′) = corr (μ + 1 2 g + e, μ + 1 2 g + e ′) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z « ) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e ») = {\ frac {1} {4}} V_ {g}},
puisque les effets environnementaux sont indépendants les uns des autres.
LANOVAEdit
Lutilisation de lANOVA pour calculer lhéritabilité échoue souvent pour tenir compte de la présence dinteractions gène-environnement, car lANOVA a une puissance statistique beaucoup plus faible pour tester les effets dinteraction que pour les effets directs.
Modèle avec des termes additifs et de dominanceModifier
Pour un modèle avec des termes additifs et de dominance, mais pas dautres, léquation pour un seul locus est
yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}
où
Les expériences peuvent être exécutées avec une configuration similaire à celle donnée dans le tableau 1. Utilisation de relations différentes groupes, nous pouvons évaluer différentes corrélations intraclasses. En utilisant V a {\ displaystyle V_ {a}} comme variance génétique additive et V d {\ displaystyle V_ {d}} comme variance décart de dominance, les corrélations intraclasses deviennent des fonctions linéaires de ces paramètres. En général,
Corrélation intraclasse = r V a + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}
où r {\ displaystyle r} et θ {\ displaystyle \ theta} se trouvent sous la forme
r = {\ displaystyle r =} P, et
θ = {\ displaystyle \ theta =} P.
Certains les relations communes et leurs coefficients sont donnés dans le tableau 2.
Modèles mixtes linéairesModifier
Une grande variété dapproches utilisant des modèles mixtes linéaires a été rapportée dans la littérature. Grâce à ces méthodes, la variance phénotypique est divisée en variances de conception génétique, environnementale et expérimentale pour estimer lhéritabilité.La variance environnementale peut être explicitement modélisée en étudiant les individus dans un large éventail denvironnements, bien que linférence de la variance génétique à partir de la variance phénotypique et environnementale puisse conduire à une sous-estimation de lhéritabilité en raison du défi de capturer la gamme complète de linfluence environnementale affectant un trait. Dautres méthodes de calcul de lhéritabilité utilisent des données provenant détudes dassociation à léchelle du génome pour estimer linfluence sur un trait par des facteurs génétiques, ce qui se traduit par le taux et linfluence de loci génétiques putativement associés (généralement des polymorphismes mononucléotidiques) sur le trait. Cela peut cependant conduire à une sous-estimation de lhéritabilité. Cet écart est appelé « héritabilité manquante » et reflète le défi de modéliser avec précision la variance génétique et environnementale des modèles dhéritabilité.
Lorsquun arbre généalogique complexe ou important ou un autre type de données susmentionné est disponible, lhéritabilité et dautres paramètres génétiques quantitatifs peuvent être estimés par des méthodes de probabilité maximale restreinte (REML) ou bayésiennes. Les données brutes auront généralement trois points de données ou plus pour chaque individu: un code pour le père, un code pour la mère et une ou plusieurs valeurs de trait. Différentes valeurs de trait peuvent être pour différents traits ou pour différents moments de mesure.
La méthodologie actuellement populaire repose sur des degrés élevés de certitude quant à lidentité du père et de la mère; il nest pas courant de traiter lidentité du taureau de manière probabiliste. Ce nest généralement pas un problème, car la méthodologie est rarement appliquée aux populations sauvages (bien quelle ait été utilisée pour plusieurs populations dongulés et doiseaux sauvages), et les taureaux sont invariablement connus avec un très haut degré de certitude dans les programmes délevage. Il existe également des algorithmes qui tiennent compte de la paternité incertaine.
Les pedigrees peuvent être visualisés à laide de programmes tels que Pedigree Viewer, et analysés avec des programmes tels que ASReml, VCE, WOMBAT, MCMCglmm dans lenvironnement R ou la famille BLUPF90 des programmes.
Les modèles dascendance sont utiles pour démêler les confusions telles que la causalité inverse, les effets maternels tels que lenvironnement prénatal et la confusion entre la dominance génétique, lenvironnement partagé et les effets des gènes maternels.
Héritabilité génomiqueEdit
Lorsque des données génotypiques à léchelle du génome et des phénotypes provenant de grands échantillons de population sont disponibles, on peut estimer les relations entre les individus en fonction de leurs génotypes et utiliser un modèle mixte linéaire pour estimer la variance expliquée par la génétique Marqueurs. Cela donne une estimation de lhéritabilité génomique basée sur la variance capturée par des variantes génétiques communes. Il existe plusieurs méthodes qui effectuent différents ajustements pour la fréquence des allèles et le déséquilibre de liaison. En particulier, la méthode appelée High-Definition Likelihood (HDL) peut estimer lhéritabilité génomique en utilisant uniquement des statistiques récapitulatives GWAS, ce qui facilite lintégration dune grande taille déchantillon disponible dans diverses méta-analyses GWAS.