Linia najlepszego dopasowania
Wyobraź sobie, że masz kilka punktów i chcesz mieć linię, która najlepiej do nich pasuje:
Możemy umieścić linię „na oko”: postaraj się, aby linia była jak najbliżej wszystkich punktów i podobną liczbę punktów powyżej i poniżej linii.
Ale dla lepszej dokładności zobaczmy, jak obliczyć linię przy użyciu regresji najmniejszych kwadratów.
Linia
Nasz cel polega na obliczeniu wartości m (nachylenie) ib (punkt przecięcia z osią y) w równaniu prostej:
Gdzie :
- y = jak daleko w górę
- x = jak daleko wzdłuż
- m = nachylenie lub gradient (jak stroma jest linia)
- b = punkt przecięcia Y (gdzie linia przecina oś Y)
Kroki
Aby znaleźć linię najlepiej dopasowaną do N punktów:
Przykład
Zobaczmy przykład, jak to zrobić!
Jak to działa?
Działa poprzez suma kwadratu błędów tak małych jak to tylko możliwe (dlatego nazywa się to „najmniejszymi kwadratami”):
Linia prosta minimalizuje sumę kwadratów błędy
Więc kiedy podnosimy każdy z tych błędów do kwadratu i dodajemy je wszystkie, suma jest tak mała, jak to tylko możliwe.
Możesz sobie wyobrazić (ale nie dokładnie) każdy punkt danych połączony do prostego paska sprężynami:
Boing!
Odstające
Uważaj! Metoda najmniejszych kwadratów jest wrażliwa na wartości odstające. Dziwna wartość pociągnie za sobą linię w jej kierunku.
Użyj aplikacji
Baw się z Kalkulatorem najmniejszych kwadratów
Nie tylko dla linii
Pomysł ten można wykorzystać w wielu innych obszarach, a nie tylko w wierszach.
„Krąg najlepszego dopasowania”
Ale formuły (i podjęte kroki) będą bardzo różne!