Řádek nejlepšího přizpůsobení
Představte si, že máte nějaké body a chcete mít přímku, která jim nejlépe vyhovuje takto:
Řádek můžeme umístit „okem“: zkuste mít čáru co nejblíže ke všem bodům a podobný počet body nad a pod úsečkou.
Ale pro lepší přesnost se podívejme, jak vypočítat úsečku pomocí regrese nejmenších čtverců.
Úsečka
Náš cíl je vypočítat hodnoty m (sklon) a b (průsečík y) v rovnici přímky:
Kde :
- y = jak daleko nahoru
- x = jak daleko podél
- m = sklon nebo sklon (jak strmá je čára)
- b = Intercept Y (kde čára protíná osu Y)
Kroky
Vyhledání linie, která nejlépe vyhovuje N bodům:
Příklad
Pojďme si ukázat, jak na to!
Jak to funguje?
Funguje to tak, že celkem náměstí chyb co nejmenších (proto se jí říká „nejmenší čtverečky“):
Přímka minimalizuje součet čtverců chyby
Takže když každou z těchto chyb srovnáme a sečteme je všechny, je součet co nejmenší.
Můžete si představit (ale ne přesně) každý připojený datový bod na přímku pruhem:
Boing!
Odlehlé hodnoty
Buďte opatrní! Nejméně čtverce jsou citlivé na odlehlé hodnoty. Podivná hodnota přitáhne čáru k ní.
Použijte aplikaci
Hrajte si s kalkulačkou nejmenších čtverců
Ne jen pro řádky
Tuto myšlenku lze použít v mnoha dalších oblastech, nejen v řádcích.
„Nejvhodnější kruh“
Ale vzorce (a kroky) budou velmi odlišné!