Vimos que es posible usar funciones de diferentes formas (curvas) para modelar datos. Elegir qué curva usar (lineal, cuadrática, exponencial) fue fácil siempre que el diagrama de dispersión se pareciera a la curva real. Pero, ¿qué pasa si no está claro qué curva elegir?
(lineal versus no lineal)
Un residuo es la diferencia entre lo que se traza en su diagrama de dispersión en un punto específico y lo que la ecuación de regresión predice que «debe trazarse» en este punto específico. Si el gráfico de dispersión y la ecuación de regresión «concuerdan» en un valor y (sin diferencia), el residuo será cero.
|
Las asociaciones lineales son las relaciones estadísticas más populares ya que son fáciles de leer e interpretar. Pasaremos la mayor parte de nuestro tiempo trabajando con relaciones lineales, y los residuos pueden indicarnos cuándo tenemos un modelo lineal apropiado.
Cuando miras tu diagrama de dispersión y no estás seguro de si la forma (curva) que elegiste su ecuación de regresión creará el mejor modelo, una gráfica residual le ayudará a tomar una decisión sobre si el modelo que eligió será o no un modelo lineal apropiado.
Modelo lineal apropiado: cuando las parcelas se colocan al azar, por encima y por debajo del eje x (y = 0).
Modelo no lineal apropiado: cuando las parcelas siguen un patrón, parecido a una curva.
un modelo de regresión lineal probablemente no sea apropiado para sus datos.
Se le pide que busque un ecuación para modelar los datos en el conjunto {(1,2), (2,1), (3,3½), (4,3), (5,4½)}. Se prepara una gráfico de dispersión para ver si debe buscar una ecuación de regresión lineal, cuadrática o exponencial. Decide elegir una regresión lineal, pero no está 100% seguro de su elección. Utiliza su calculadora gráfica para encontrar la ecuación de regresión lineal, que es y = 0.7x + 0.7. Grafica la línea de la ecuación de regresión en el diagrama de dispersión, como se ve a continuación. |
|
Los residuos fueron la base de la definición acordada estadísticamente
de un «mejor línea de ajuste (o curva) «.
D12 + D22 + … + Dn2 será un mínimo.
Una curva que tenga esta propiedad, donde el cuadrado de las distancias verticales desde los puntos de datos a la curva sea lo más pequeño posible , se llama curva de mínimos cuadrados.
Línea de regresión de mínimos cuadrados = Línea de regresión del ajuste «óptimo»
Residuos en la calculadora gráfica:
Cuando los modelos de regresión son calculados en la calculadora gráfica, los residuos se almacenan automáticamente en una lista llamada RESID. Siga los enlaces a continuación para ver cómo trabajar con residuos en su calculadora.
|
|||||||
|
|