線形回帰モデルは、2つの変数または因子間の関係を示したり予測したりするために使用されます。 予測されている因子(方程式が解く因子)は従属変数と呼ばれます。 従属変数の値を予測するために使用される因子は、独立変数と呼ばれます。
線形回帰では、各観測値は二つの値で構成されています。 一つの値は従属変数のためのものであり、一つの値は独立変数のためのものです。 この単純なモデルでは、直線は従属変数と独立変数の間の関係を近似します。
回帰分析で複数の独立変数が使用されている場合、モデルは単純な線形モデルではなくなりました。 これは重回帰として知られています。
単純な線形回帰モデルの式
単純な線形回帰分析に関与する二つの因子は、xとyと指定されています。 Yがxとどのように関連しているかを記述する方程式は、回帰モデルとして知られています。
単純な線形回帰モデルは次のように表されます。
y=β0+γ1x+γ
線形回帰モデルには、γで表される誤差項が含まれています。 誤差項は、xとyの線形関係では説明できないyの変動を説明するために使用されます。θが存在しない場合、xを知ることはyの値を決定するのに十分 モデルのこれらのパラメータは、β0およびβ1によって表される。ここで、
- β0は回帰線のy切片です。
- β0は回帰線のy切片です。
- β0は回帰線のy切片です。
- β0は回帰線のy切片
- β1は傾きです。
- Σ(y)は、xの与えられた値に対するyの平均値または期待値です。
回帰線は、正の線形関係、負の線形関係、または関係なしを示すことができます。
- 関係なし:単純な線形回帰のグラフ化された線は平坦です(傾斜していません)。 2つの変数の間には関係はありません。
- 正の関係:回帰直線は、グラフのy切片(軸)の線の下端と、x切片(軸)から離れたグラフフィールドに上向きに伸びる線の上端と上向きに傾斜します。 2つの変数の間には正の線形関係があります:一方の値が増加するにつれて、他方の値も増加します。
- 負の関係: 回帰直線は、グラフのy切片(軸)にある線の上端と、x切片(軸)に向かってグラフフィールドに向かって下方に伸びる線の下端と、下方に傾斜します。 2つの変数の間に負の線形関係があります:一方の値が増加するにつれて、他方の値は減少します。
推定線形回帰式
母集団のパラメータがわかっている場合、単純な線形回帰式(以下に示す)を使用して、既知のx値に対するyの平均値を計算しかし、実際には、パラメータ値は一般に知られていないため、母集団のサンプルからのデータを使用して推定する必要があります。
Γ(y)=β0+γ1x+γ
母集団パラメータは、サンプル統計を使用して推定されます。 サンプル統計量はβ0とβ1で表されます。 母集団パラメータに標本統計量を代入すると,推定回帰式が形成される。
推定された回帰方程式は次のとおりです。
(λ)=β0+λ1x+λ
推定された単純回帰方程式のグラフは、推定された回帰直線と呼ばれます。
- β0は回帰線のy切片です。
- β1は傾きです。
- (λ)は、xの与えられた値に対するyの推定値です。
単純線形回帰の限界
最良のデータでさえ、完全な物語を伝えるものではありません。 回帰分析は、一般的に相関が変数間に存在することを確立するために研究で使用されています。
回帰分析は、変数間に相関が存在することを しかし、相関は因果関係と同じではありません: 2つの変数間の関係は、一方が他方を引き起こすことを意味するものではありません。 データポイントに適切に適合する単純な線形回帰の線であっても、因果関係を保証するものではありません。
線形回帰モデルを使用すると、変数間の関係がまったく存在するかどうかを発見することができます。 その関係が何であるか、そしてある変数が別の変数を引き起こすかどうかを正確に理解するには、追加の調査と統計分析が必要です。
- β0は回帰線のy切片です。
- β0は回帰線のy切片です。