回帰分析とは?

 第4次産業革命真っ只中の現代、AIやビッグデータを扱う際にデータ分析というものはかなり重要なものになります。従って、これまでの時代よりも統計学というものをしっかりと勉強する必要があります。

 この記事では統計学に出てくる回帰分析という言葉について、簡単に説明を行います!

 

・回帰分析とは?

 ☑気温とビールの売り上げ🍺

 夏の暑い日ほどビールがよく売れることは感覚的にわかりますよね?? 大人たちは暑かったらビールが飲みたいという気分になります。ということは、気温が高ければ高いほど、ビールの売り上げも上がりそうではありませんか?? 実際に、あるメーカーのビールの販売数と気温をまとめたデータを下記に示します。

気温とビールの販売数のデータ

 上のデータをご覧の通り、なんとなく右肩上がりであることはわかりますよね。おそらく、気温が高ければ高いほど、ビールの売り上げが売れると言えることがわかります。

 

 ☑回帰分析とは?

 回帰分析を簡単に説明しますと、「数式でデータの関係を導くこと」です。上記の気温とビールの売り上げの例では、「ビールの売り上げが気温によってどう変化するか知りたい!」となった時に、ビールの売り上げを気温を用いて数式で導出することを回帰分析と言います。

  回帰分析を難しく説明しますと、 「従属変数(被説明変数とも言う)を説明変数を用いて数式で表現すること」です。従属変数を説明変数で回帰分析を行うとも言います。上記のビールの売り上げ例でビールの売り上げが知りたい時は、ビールの売り上げが従属変数気温が説明変数になります。

 ビールの売り上げ(従属変数)を\(y\)、気温(説明変数)を\(x\)とする時、1次関数の式だけでビールの売り上げを表現しようとすることを線形回帰分析といい、それ以外を非線形回帰分析と言います。

 また、説明変数が1つの時は単回帰分析、複数の時は重回帰分析と言います。ビールの例ですと、ビールの売り上げ数は気温以外にも、ビールの値段によっても売り上げ数は変わるかと思います。そこで、ビールの売り上げ数を気温と値段から数式で表そうとすると重回帰分析になります。

 

 ☑ビールの売り上げと気温の関係について回帰分析を行う

 さて、上のビールの売り上げについて、気温を用いて数式で表現することを考えます。上のデータからなんとなく右肩上がりであることはわかりました。ということは、なんとなく次の図の赤線ように線を引っ張ってみたくありませんか??

気温とビールの販売数の回帰分析を行う

 上図のように赤線を引っ張った時に、その1次関数の式 \(y=a+bx\) の \( a \) と \( b\) を求めることを回帰分析を行うと言います。そしてこの時、最適な \( a \) と \( b\) の導出方法の一つに最小二乗法と言うものがあります。最小二乗法については下記の記事で説明を行いたいと思いますので、続けてご覧ください!

 

 

1件のピンバック

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です