データをモデル化するためにさまざまな形状の関数(曲線)を使用できることがわかりました。使用する曲線(線形、2次、散布図が実際の曲線に類似している限り、指数関数)は簡単でしたが、どの曲線を選択するかが不明な場合はどうなりますか?
(線形対非線形)
残差は、特定のポイントで散布図にプロットされたものと、回帰方程式は、この特定のポイントで「プロットする必要がある」と予測します。散布図と回帰方程式がy値で「一致」する場合(差なし)、残差はゼロになります。
|
線形関連は、読みやすく解釈しやすいため、最も一般的な統計関係です。時間の大部分を線形関係の処理に費やします。残差は、適切な線形モデルがあるかどうかを示します。
散布図を見ると、選択した形状(曲線)がわからない場合があります。回帰方程式は最良のモデルを作成します。偏残差プロットは、選択したモデルが適切な線形モデルであるかどうかを判断するのに役立ちます。
適切な線形モデル:プロットがx軸の上下にランダムに配置されている場合(y = 0)。
適切な非線形モデル:プロットが曲線に似たパターンに従う場合。
線形回帰モデルはおそらくデータに適していません。
検索するように求められますセット{(1,2)、(2,1)、(3,3½)、(4,3)、(5,4½)}のデータをモデル化する方程式。 準備します。散布図を使用して、線形、2次、または指数回帰方程式を探す必要があるかどうかを確認します。線形回帰を選択することにしましたが、選択が100%確実ではありません。 グラフ電卓を使用して、y = 0.7x +0.7である線形回帰方程式を見つけます。 以下に示すように、散布図に回帰方程式の線をグラフ化します。 |
|
残差は、統計的に合意された「最良」の定義の基礎でした
適合線(または曲線)」。
D12 + D22 + … + Dn2が最小になります。
このプロパティを持つ曲線。データポイントから曲線までの垂直距離の2乗は、可能な限り小さくなります。 、は最小二乗曲線と呼ばれます。
最小二乗回帰直線=「最適」な回帰直線
グラフ電卓の残差:
回帰モデルがグラフ電卓で計算される残差は、RESIDと呼ばれるリストに自動的に保存されます。電卓で残差を操作する方法については、以下のリンクをたどってください。
|
||||||
|
|