Regrese nejmenších čtverců


Řádek nejlepšího přizpůsobení

Představte si, že máte nějaké body a chcete mít přímku, která jim nejlépe vyhovuje takto:

Řádek můžeme umístit „okem“: zkuste mít čáru co nejblíže ke všem bodům a podobný počet body nad a pod úsečkou.

Ale pro lepší přesnost se podívejme, jak vypočítat úsečku pomocí regrese nejmenších čtverců.

Úsečka

Náš cíl je vypočítat hodnoty m (sklon) a b (průsečík y) v rovnici přímky:

y = mx + b

Kde :

  • y = jak daleko nahoru
  • x = jak daleko podél
  • m = sklon nebo sklon (jak strmá je čára)
  • b = Intercept Y (kde čára protíná osu Y)

Kroky

Vyhledání linie, která nejlépe vyhovuje N bodům:

Příklad

Pojďme si ukázat, jak na to!

Jak to funguje?

Funguje to tak, že celkem náměstí chyb co nejmenších (proto se jí říká „nejmenší čtverečky“):


Přímka minimalizuje součet čtverců chyby

Takže když každou z těchto chyb srovnáme a sečteme je všechny, je součet co nejmenší.

Můžete si představit (ale ne přesně) každý připojený datový bod na přímku pruhem:


Boing!

Odlehlé hodnoty

Buďte opatrní! Nejméně čtverce jsou citlivé na odlehlé hodnoty. Podivná hodnota přitáhne čáru k ní.

Použijte aplikaci

Hrajte si s kalkulačkou nejmenších čtverců

Ne jen pro řádky

Tuto myšlenku lze použít v mnoha dalších oblastech, nejen v řádcích.


„Nejvhodnější kruh“

Ale vzorce (a kroky) budou velmi odlišné!

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *