Dado que solo P puede observarse o medirse directamente, la heredabilidad debe estimarse a partir de las similitudes observadas en sujetos que varían en su nivel de similitud genética o ambiental. Los análisis estadísticos necesarios para estimar los componentes genéticos y ambientales de la varianza dependen de las características de la muestra. Brevemente, se obtienen mejores estimaciones utilizando datos de individuos con niveles muy variables de relación genética, como gemelos, hermanos, padres e hijos, en lugar de sujetos con parientes más lejanos (y por lo tanto menos similares). El error estándar para las estimaciones de heredabilidad se mejora con muestras de gran tamaño.
En poblaciones no humanas, a menudo es posible recopilar información de forma controlada. Por ejemplo, entre los animales de granja, es fácil disponer que un toro produzca crías de un gran número de vacas y controle los entornos. Este control experimental generalmente no es posible cuando se recopilan datos humanos, dependiendo de las relaciones y los entornos naturales.
En la genética cuantitativa clásica, había dos escuelas de pensamiento con respecto a la estimación de la heredabilidad.
Una escuela de pensamiento fue desarrollada por Sewall Wright en la Universidad de Chicago y más popularizada por CC Li (Universidad de Chicago) y JL Lush (Universidad Estatal de Iowa). Se basa en el análisis de correlaciones y, por extensión, de regresión. Path Analysis fue desarrollado por Sewall Wright como una forma de estimar la heredabilidad.
El segundo fue desarrollado originalmente por RA Fisher y ampliado en la Universidad de Edimburgo, la Universidad Estatal de Iowa y la Universidad Estatal de Carolina del Norte, así como otras escuelas. Se basa en el análisis de varianza de los estudios de reproducción, utilizando la correlación intraclase de parientes. En estos análisis se utilizan varios métodos para estimar los componentes de la varianza (y, por lo tanto, la heredabilidad) a partir de ANOVA.
Hoy en día, la heredabilidad se puede estimar a partir de las genealogías generales mediante modelos lineales mixtos y de la relación genómica estimada a partir de marcadores genéticos .
Los estudios de heredabilidad humana a menudo utilizan diseños de estudios de adopción, a menudo con gemelos idénticos que han sido separados temprano en la vida y criados en diferentes entornos. Estos individuos tienen genotipos idénticos y pueden usarse para separar los efectos del genotipo y el medio ambiente. Un límite de este diseño es el entorno prenatal común y el número relativamente bajo de gemelos criados separados. Un segundo diseño más común es el estudio de gemelos en el que se utiliza la similitud de gemelos idénticos y fraternos para estimar la heredabilidad. Estos estudios pueden estar limitados por el hecho de que los gemelos idénticos no son completamente idénticos genéticamente, lo que puede resultar en una subestimación de la heredabilidad.
En estudios observacionales, o debido a efectos evocadores (donde un genoma evoca ambientes por su efecto sobre ellos), G y E pueden covariar: correlación del entorno genético. Según los métodos utilizados para estimar la heredabilidad, las correlaciones entre los factores genéticos y los entornos compartidos o no compartidos pueden o no confundirse con la heredabilidad.
Métodos de estimación de regresión / correlaciónEditar
El la primera escuela de estimación usa regresión y correlación para estimar la heredabilidad.
Comparación de parientes cercanosEditar
En la comparación de parientes, encontramos que en general,
h 2 = br = tr {\ displaystyle h ^ {2} = {\ frac {b} {r}} = {\ frac {t} {r}}}
donde r se puede considerar como el coeficiente de relación, b es el coeficiente de regresión yt es el coeficiente de correlación.
Regresión padre-hijoEditar
Figura 2. Datos de Sir Francis Galton (1889) que muestran la relación entre la altura de la descendencia (928 individuos) como función de la altura media de los padres (205 grupos de padres).
La heredabilidad se puede estimar comparando el padre yo rasgos de ffspring (como en la Fig. 2). La pendiente de la línea (0,57) se aproxima a la heredabilidad del rasgo cuando los valores de la descendencia se retroceden frente al rasgo promedio de los padres. Si solo se usa el valor de uno de los padres, la heredabilidad es el doble de la pendiente. (Tenga en cuenta que esta es la fuente del término «regresión», ya que los valores de la descendencia siempre tienden a retroceder al valor medio de la población, es decir, la pendiente es siempre menor que uno). Este efecto de regresión también es la base del método DeFries-Fulker para analizar gemelos seleccionados para un miembro afectado.
Comparación de hermanosEditar
Un enfoque básico de la heredabilidad puede ser tomado con diseños de hermanos completos: comparación de similitudes entre hermanos que comparten una madre biológica y un padre. Cuando solo hay acción genética aditiva, esta correlación fenotípica entre hermanos es un índice de familiaridad: la suma de la mitad de la varianza genética aditiva más el efecto total del medio ambiente común.Por lo tanto, establece un límite superior en la heredabilidad aditiva del doble de la correlación fenotípica de Sib completo. Los diseños de medios hermanos comparan los rasgos fenotípicos de los hermanos que comparten un padre con otros grupos de hermanos.
Estudios de gemelosEditar
Figura 3. Concordancias gemelas para siete rasgos psicológicos (el tamaño de la muestra se muestra dentro de las barras), siendo DZ fraterno y MZ gemelos idénticos.
La heredabilidad de los rasgos en humanos se estima con mayor frecuencia comparando semejanzas entre gemelos. «La ventaja de los estudios de gemelos es que la varianza total se puede dividir en componentes ambientales genéticos, compartidos o comunes y ambientales únicos, lo que permite una estimación precisa de la heredabilidad». Los gemelos fraternos o dicigóticos (DZ) comparten en promedio la mitad de sus genes (suponiendo que no haya apareamiento selectivo para el rasgo), por lo que los gemelos idénticos o monocigóticos (MZ) en promedio son dos veces más genéticamente similares que los gemelos DZ. Entonces, una estimación bruta de la heredabilidad es aproximadamente el doble de la diferencia en la correlación entre los gemelos MZ y DZ, es decir, la fórmula H2 de Falconer = 2 (r (MZ) -r (DZ)).
El efecto de entorno compartido, c2, contribuye a la similitud entre hermanos debido a la similitud del entorno en el que se crían. El entorno compartido se aproxima por la correlación DZ menos la mitad de heredabilidad, que es el grado en que los gemelos DZ comparten los mismos genes, c2 = DZ-1 / 2h2. La varianza ambiental única, e2, refleja el grado en que los gemelos idénticos criados juntos son diferentes, e2 = 1-r (MZ).
Análisis de métodos de estimación de varianzaEditar
El segundo conjunto de métodos de estimación de heredabilidad involucra ANOVA y estimación de componentes de varianza.
Modelo básicoEditar
Usamos la discusión básica de Kempthorne. Considerando solo el más básico de modelos genéticos, podemos ver la contribución cuantitativa de un solo locus con genotipo Gi como
yi = μ + gi + e {\ displaystyle y_ {i} = \ mu + g_ {i} + e}
donde gi {\ displaystyle g_ {i}} es el efecto del genotipo Gi y e {\ displaystyle e} es el efecto ambiental.
Considere un experimento con un grupo de toros y su progenie de madres al azar. Dado que la progenie obtiene la mitad de sus genes del padre y la otra mitad de su madre (aleatoria), la ecuación de la progenie es
zi = μ + 1 2 gi + e {\ displaystyle z_ {i} = \ mu + {\ frac {1} {2}} g_ {i} + e}
Correlaciones intraclaseEditar
Considere el experimento anterior. Tenemos dos grupos de progenie que podemos comparar. La primera es comparar las diversas progenies de un padre individual (llamado dentro del grupo de padres). La varianza incluirá términos para la varianza genética (dado que no todos obtuvieron el mismo genotipo) y la varianza ambiental. Esto se considera un término de error.
El segundo grupo de progenie son comparaciones de medias de medios hermanos entre sí (llamado entre el grupo de padres). Además del término de error como en los grupos de padres internos, tenemos un término adicional debido a las diferencias entre los diferentes medios de los medios hermanos. La correlación intraclase es
corr (z, z ′) = corr (μ + 1 2 g + e, μ + 1 2 g + e ′) = 1 4 V g {\ displaystyle \ mathrm {corr} (z , z «) = \ mathrm {corr} (\ mu + {\ frac {1} {2}} g + e, \ mu + {\ frac {1} {2}} g + e») = {\ frac {1} {4}} V_ {g}},
dado que los efectos ambientales son independientes entre sí.
El ANOVAEdit
El uso de ANOVA para calcular la heredabilidad a menudo falla para tener en cuenta la presencia de interacciones gen-ambiente, porque ANOVA tiene un poder estadístico mucho menor para probar los efectos de interacción que para los efectos directos.
Modelo con términos aditivos y dominanciaEditar
Para un modelo con términos aditivos y de dominancia, pero no otros, la ecuación para un solo locus es
yij = μ + α i + α j + dij + e, {\ displaystyle y_ {ij} = \ mu + \ alpha _ {i} + \ alpha _ {j} + d_ {ij} + e,}
donde
Los experimentos se pueden ejecutar con una configuración similar a la que se muestra en la Tabla 1. Usando una relación diferente grupos, podemos evaluar diferentes correlaciones intraclase. Usando V a {\ displaystyle V_ {a}} como la varianza genética aditiva y V d {\ displaystyle V_ {d}} como la varianza de la desviación de dominancia, las correlaciones intraclase se convierten en funciones lineales de estos parámetros. En general,
Correlación intraclase = r V a + θ V d, {\ displaystyle = rV_ {a} + \ theta V_ {d},}
donde r {\ displaystyle r} y θ {\ displaystyle \ theta} se encuentran como
r = {\ displaystyle r =} P, y
θ = {\ displaystyle \ theta =} P.
Algunos las relaciones comunes y sus coeficientes se dan en la Tabla 2.
Modelos lineales mixtosEditar
Se ha informado en la literatura una amplia variedad de enfoques que utilizan modelos lineales mixtos. A través de estos métodos, la variación fenotípica se divide en variaciones genéticas, ambientales y de diseño experimental para estimar la heredabilidad.La variación ambiental se puede modelar explícitamente mediante el estudio de individuos en una amplia gama de entornos, aunque la inferencia de la variación genética a partir de la variación fenotípica y ambiental puede conducir a una subestimación de la heredabilidad debido al desafío de capturar la gama completa de influencia ambiental que afecta un rasgo. Otros métodos para calcular la heredabilidad utilizan datos de estudios de asociación de todo el genoma para estimar la influencia de un rasgo por factores genéticos, lo que se refleja en la tasa y la influencia de loci genéticos supuestamente asociados (generalmente polimorfismos de un solo nucleótido) en el rasgo. Sin embargo, esto puede llevar a una subestimación de la heredabilidad. Esta discrepancia se conoce como «heredabilidad faltante» y refleja el desafío de modelar con precisión la varianza genética y ambiental en los modelos de heredabilidad.
Cuando se dispone de un pedigrí grande y complejo u otro tipo de datos antes mencionado, la heredabilidad y otros parámetros genéticos cuantitativos pueden estimarse mediante métodos bayesianos o de máxima verosimilitud restringida (REML). Los datos brutos suelen tener tres o más puntos de datos para cada individuo: un código para el padre, un código para la madre y uno o varios valores de rasgos. Diferentes valores de rasgos pueden ser para diferentes rasgos o para diferentes puntos de tiempo de medición.
La metodología actualmente popular se basa en altos grados de certeza sobre las identidades del padre y la madre; no es común tratar la identidad del padre de manera probabilística. Esto no suele ser un problema, ya que la metodología rara vez se aplica a poblaciones silvestres (aunque se ha utilizado para varias poblaciones de aves y ungulados silvestres), y los toros se conocen invariablemente con un alto grado de certeza en los programas de reproducción. También existen algoritmos que dan cuenta de la paternidad incierta.
Los pedigríes se pueden visualizar utilizando programas como Pedigree Viewer, y analizarse con programas como ASReml, VCE, WOMBAT, MCMCglmm dentro del entorno R o la familia BLUPF90 de programas.
Los modelos de pedigrí son útiles para desentrañar confusiones como la causalidad inversa, los efectos maternos como el entorno prenatal y la confusión de dominancia genética, entorno compartido y efectos de genes maternos.
Heredabilidad genómicaEditar
Cuando se dispone de datos de genotipos y fenotipos de todo el genoma de muestras de poblaciones grandes, se pueden estimar las relaciones entre los individuos en función de sus genotipos y utilizar un modelo lineal mixto para estimar la varianza explicada por la genética marcadores. Esto da una estimación de heredabilidad genómica basada en la varianza capturada por variantes genéticas comunes. Existen múltiples métodos que realizan diferentes ajustes para la frecuencia de los alelos y el desequilibrio de ligamiento. En particular, el método llamado High-Definition Likelihood (HDL) puede estimar la heredabilidad genómica utilizando solo estadísticas resumidas de GWAS, lo que facilita la incorporación de un gran tamaño de muestra disponible en varios metanálisis de GWAS.