We zagen dat het mogelijk is om verschillende gevormde functies (curven) te gebruiken om gegevens te modelleren. Kiezen welke curve je wilt gebruiken (lineair, kwadratisch, exponentieel) was eenvoudig, zolang de spreidingsplot maar een gelijkenis vertoonde met de werkelijke curve. Maar wat als het onduidelijk is welke curve te kiezen?
(lineair versus niet-lineair)
Een residu is het verschil tussen wat op een specifiek punt in uw scatterplot wordt geplot en wat de regressievergelijking voorspelt “zou moeten worden uitgezet” op dit specifieke punt. Als het spreidingsdiagram en de regressievergelijking “het eens” zijn over een y-waarde (geen verschil), is het residu nul.
|
Lineaire associaties zijn de meest populaire statistische relaties, aangezien ze gemakkelijk te lezen en te interpreteren zijn. We zullen het grootste deel van onze tijd besteden aan het werken met lineaire relaties, en residuen kunnen ons vertellen wanneer we een geschikt lineair model hebben.
Als je naar je scatterplot kijkt, en je weet niet zeker of de vorm (curve) die je hebt gekozen uw regressievergelijking zal het beste model creëren, een residuale plot zal u helpen een beslissing te nemen of het door u gekozen model wel of niet een geschikt lineair model zal zijn.
Passend lineair model: wanneer plots willekeurig worden geplaatst, boven en onder de x-as (y = 0).
Geschikt niet-lineair model: wanneer plots een patroon volgen en op een curve lijken.
is een lineair regressiemodel waarschijnlijk niet geschikt voor uw gegevens.
U wordt gevraagd een vergelijking om de gegevens in de set {(1,2), (2,1), (3,3½), (4,3), (5,4½)} te modelleren. Je bereidt een scatterplot om te zien of u moet zoeken naar een lineaire, kwadratische of exponentiële regressievergelijking. U besluit een lineaire regressie te kiezen, maar u bent niet 100% zeker van uw keuze. U gebruikt uw grafische rekenmachine om de lineaire regressievergelijking te vinden, namelijk y = 0,7x + 0,7. Je tekent de regressievergelijkingslijn op het scatterplot, zoals hieronder te zien is. |
|
Residuen waren de basis van de statistisch overeengekomen definitie
van een “beste passende lijn (of curve) “.
D12 + D22 + … + Dn2 zal een minimum zijn.
Een curve met deze eigenschap, waarbij het kwadraat van de verticale afstanden van de datapunten tot de curve zo klein mogelijk is , heet een kleinste-kwadratencurve.
Least-Squares Regression Line = Regressielijn van “Best” Fit
Residuen op de grafische rekenmachine:
Wanneer regressiemodellen zijn berekend op de grafische rekenmachine, worden residuen automatisch opgeslagen in een lijst met de naam RESID. Volg de onderstaande links om te zien hoe u met residuen op uw rekenmachine werkt.
|
|||||||
|
|