Residuals – MathBitsNotebook (A1


We zagen dat het mogelijk is om verschillende gevormde functies (curven) te gebruiken om gegevens te modelleren. Kiezen welke curve je wilt gebruiken (lineair, kwadratisch, exponentieel) was eenvoudig, zolang de spreidingsplot maar een gelijkenis vertoonde met de werkelijke curve. Maar wat als het onduidelijk is welke curve te kiezen?

Residuen helpen bepalen of een curve (vorm) is geschikt voor de gegevens.
(lineair versus niet-lineair)

Een residu is het verschil tussen wat op een specifiek punt in uw scatterplot wordt geplot en wat de regressievergelijking voorspelt “zou moeten worden uitgezet” op dit specifieke punt. Als het spreidingsdiagram en de regressievergelijking “het eens” zijn over een y-waarde (geen verschil), is het residu nul.

Residual = Ob geserveerd y-waarde – voorspelde y-waarde

Een residu is de verschil tussen de waargenomen y-waarde (uit scatterplot) en de voorspelde y-waarde (uit regressievergelijkingslijn).
Het is de verticale afstand van het feitelijk geplotte punt tot het punt op de regressielijn.
U kunt een residu zien als hoever de gegevens van de regressielijn “vallen”
(soms aangeduid als “waargenomen fout”).

Lineaire associaties zijn de meest populaire statistische relaties, aangezien ze gemakkelijk te lezen en te interpreteren zijn. We zullen het grootste deel van onze tijd besteden aan het werken met lineaire relaties, en residuen kunnen ons vertellen wanneer we een geschikt lineair model hebben.
Als je naar je scatterplot kijkt, en je weet niet zeker of de vorm (curve) die je hebt gekozen uw regressievergelijking zal het beste model creëren, een residuale plot zal u helpen een beslissing te nemen of het door u gekozen model wel of niet een geschikt lineair model zal zijn.

Een residuale plot is een scatter plot dat de residuen op de verticale as en de onafhankelijke variabele op de horizontale as laat zien. De plot helpt u te beslissen of een lineair model geschikt is voor uw gegevens.

Passend lineair model: wanneer plots willekeurig worden geplaatst, boven en onder de x-as (y = 0).

Geschikt niet-lineair model: wanneer plots een patroon volgen en op een curve lijken.

Wanneer een patroon wordt waargenomen in een residuale plot,
is een lineair regressiemodel waarschijnlijk niet geschikt voor uw gegevens.

U wordt gevraagd een vergelijking om de gegevens in de set {(1,2), (2,1), (3,3½), (4,3), (5,4½)} te modelleren.

Je bereidt een scatterplot om te zien of u moet zoeken naar een lineaire, kwadratische of exponentiële regressievergelijking. U besluit een lineaire regressie te kiezen, maar u bent niet 100% zeker van uw keuze.

U gebruikt uw grafische rekenmachine om de lineaire regressievergelijking te vinden, namelijk y = 0,7x + 0,7.

Je tekent de regressievergelijkingslijn op het scatterplot, zoals hieronder te zien is.

De residuen zijn de rode lijnsegmenten, waarnaar wordt verwezen door de letter “D” (voor afstand), die de punten van de scatterplot verticaal verbinden met de corrdinerende punten op de lineaire regressielijn.

Is het u opgevallen dat de rode lijnsegmenten in de grafiek (de residuen) boven en onder de regressielijn vallen? Dit betekent dat een residu een positieve waarde, een negatieve waarde of nul kan zijn.

Residuen waren de basis van de statistisch overeengekomen definitie
van een “beste passende lijn (of curve) “.

Overeengekomen definitie: Een best passende curve (van welke vorm dan ook) is de curve met de kleinste som van de kwadraten van de residuen.
D12 + D22 + … + Dn2 zal een minimum zijn.

Een curve met deze eigenschap, waarbij het kwadraat van de verticale afstanden van de datapunten tot de curve zo klein mogelijk is , heet een kleinste-kwadratencurve.

Onthoud:
Least-Squares Regression Line = Regressielijn van “Best” Fit

Residuen op de grafische rekenmachine:

Wanneer regressiemodellen zijn berekend op de grafische rekenmachine, worden residuen automatisch opgeslagen in een lijst met de naam RESID. Volg de onderstaande links om te zien hoe u met residuen op uw rekenmachine werkt.
Voor calculatorhulp met
residuen
klik hier .
Voor rekenhulp met
resterende plots
klik hier.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *