Regresja metodą najmniejszych kwadratów


Linia najlepszego dopasowania

Wyobraź sobie, że masz kilka punktów i chcesz mieć linię, która najlepiej do nich pasuje:

Możemy umieścić linię „na oko”: postaraj się, aby linia była jak najbliżej wszystkich punktów i podobną liczbę punktów powyżej i poniżej linii.

Ale dla lepszej dokładności zobaczmy, jak obliczyć linię przy użyciu regresji najmniejszych kwadratów.

Linia

Nasz cel polega na obliczeniu wartości m (nachylenie) ib (punkt przecięcia z osią y) w równaniu prostej:

y = mx + b

Gdzie :

  • y = jak daleko w górę
  • x = jak daleko wzdłuż
  • m = nachylenie lub gradient (jak stroma jest linia)
  • b = punkt przecięcia Y (gdzie linia przecina oś Y)

Kroki

Aby znaleźć linię najlepiej dopasowaną do N punktów:

Przykład

Zobaczmy przykład, jak to zrobić!

Jak to działa?

Działa poprzez suma kwadratu błędów tak małych jak to tylko możliwe (dlatego nazywa się to „najmniejszymi kwadratami”):


Linia prosta minimalizuje sumę kwadratów błędy

Więc kiedy podnosimy każdy z tych błędów do kwadratu i dodajemy je wszystkie, suma jest tak mała, jak to tylko możliwe.

Możesz sobie wyobrazić (ale nie dokładnie) każdy punkt danych połączony do prostego paska sprężynami:


Boing!

Odstające

Uważaj! Metoda najmniejszych kwadratów jest wrażliwa na wartości odstające. Dziwna wartość pociągnie za sobą linię w jej kierunku.

Użyj aplikacji

Baw się z Kalkulatorem najmniejszych kwadratów

Nie tylko dla linii

Pomysł ten można wykorzystać w wielu innych obszarach, a nie tylko w wierszach.


„Krąg najlepszego dopasowania”

Ale formuły (i podjęte kroki) będą bardzo różne!

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *