Excel-де сызықтық регрессия моделін құру

Сызықтық регрессия дегеніміз не?

Сызықтық регрессия –  бұл тәуелді және тәуелді айнымалының арасындағы сызықтық қатынасты бейнелейтін мәліметтер сызбасы. Әдетте бұл қатынастың беріктігін және нәтижелердің дисперсиясын визуалды түрде көрсету үшін қолданылады – барлығы тәуелді айнымалының мінез-құлқын түсіндіру мақсатында.

Айтыңызшы, біз балмұздақ пен семіздік арасындағы тәуелділіктің күшін тексергіміз келді. Біз тәуелді айнымалыны, балмұздақтың мөлшерін алып, тәуелді айнымалымен, семіздікпен байланыстыратын едік. Берілген регрессия осы қатынастың графикалық көрінісі болып табылады, мәліметтердегі өзгергіштік неғұрлым төмен болса, байланыс неғұрлым күшті болады және регрессия сызығына дәлірек сәйкес келеді.   

Негізгі өнімдер

  • Сызықтық регрессия тәуелді және тәуелсіз айнымалы (лар) арасындағы байланысты модельдейді.
  • Регрессиялық талдауға егер айнымалылар тәуелсіз болса, гетеросседастика болмаса және айнымалылардың қателік шарттары өзара байланысты болмаса қол жеткізуге болады.
  • Excel-де сызықтық регрессияны модельдеу DataProject ToolPak көмегімен оңайырақ болады.

Маңызды мәселелер

Сіздің деректер жиынтығыңыз туралы бірнеше маңызды болжамдар бар, олар регрессиялық талдауды жалғастыру үшін шындыққа сәйкес келуі керек :

  1. Айнымалылар шынымен тәуелсіз болуы керек ( хи-квадрат тестін қолдану арқылы ).
  2. Деректер әр түрлі қате болмауы керек ажырау (осы деп аталады heteroskedasticity (сондай-ақ, жазылған heteroscedasticity)).
  3. Әр айнымалының қателік шарттары өзара байланыссыз болуы керек. Егер олай болмаса, бұл айнымалылар бір-бірімен байланысты екенін білдіреді .

Егер бұл үш нәрсе күрделі болып көрінсе, онда олар. Бірақ сол ойлардың біреуінің әсері шындыққа жанаспайды. Шын мәнінде, сіз өлшейтін қарым-қатынасты бұрмалайтын болар едіңіз.

Excel-де регрессияны шығару

Excel-де регрессиялық талдауды іске қосудың алғашқы қадамы – бұл ақысыз Excel плагинінің Data Analysis ToolPak орнатылғандығын екі рет тексеру. Бұл плагин статистиканың ауқымын есептеуді өте оңай етеді. Ол емес  сызықтық регрессия сызықтық диаграмманы қажет, бірақ ол қарапайым статистика кестелерді құру құрайды. Орнатылғанын тексеру үшін құралдар тақтасынан «Деректер» тармағын таңдаңыз. Егер «Деректерді талдау» параметр болса, функция орнатылған және пайдалануға дайын. Егер орнатылмаған болса, сіз бұл параметрді Office түймешігін басып, «Excel опцияларын» таңдау арқылы сұрай аласыз.

Деректерді талдау құралын қолдану арқылы регрессияның нәтижесін жасау – бірнеше басу.

Маңызды

Тәуелсіз айнымалы X ауқымында жүреді.

S&P 500  қайтарымын ескере отырып, Visa ( қор қайтарымының күші мен байланысын бағалай аламыз ба, жоқ па, соны білгіміз келеді деп айтыңыз. Visa (V) қоры деректерді тәуелді айнымалы ретінде 1 бағанды ​​толтырады. S&P 500 деректері 2-бағанды ​​тәуелсіз айнымалы ретінде толтырады.

  1. Құралдар тақтасынан «Деректерді» таңдаңыз. «Деректер» мәзірі көрсетіледі.
  2. «Деректерді талдау» таңдаңыз. Деректерді талдау – талдау құралдары тілқатысу терезесі көрсетіледі.
  3. Мәзірден «Регрессия» тармағын таңдап, «ОК» батырмасын басыңыз.
  4. Регрессия диалогтық терезесінде «Кіріс ауқымы» өрісін басып, тәуелді айнымалы деректерді таңдаңыз (Visa (V) қор қайтарымы).
  5. «X ауқымын енгізу» өрісін басып, тәуелсіз айнымалы деректерді таңдаңыз (S&P 500 қайтарады).
  6. Нәтижелерді іске қосу үшін «OK» батырмасын басыңыз.

[Ескерту: Егер кесте кішігірім болып көрінсе, суретті тінтуірдің оң жақ түймешігімен басып, жоғары қойылым үшін жаңа қойындыда ашыңыз.]

Нәтижелерді интерпретациялау

Осы деректерді пайдалана отырып ( R-квадрат мақаласында көрсетілгендей) келесі кестені аламыз:

Детерминация коэффициенті деп аталатын R 2 мәні тәуелді айнымалымен түсіндірілген тәуелді айнымалының өзгеру үлесін немесе регрессия моделінің деректерге қаншалықты сәйкес келетіндігін өлшейді. R 2 мәні 0-ден 1-ге дейін, ал жоғары мән сәйкес келуді көрсетеді. P мәні немесе ықтималдық мәні 0-ден 1-ге дейін жетеді және тесттің маңызды екендігін көрсетеді. R 2 мәнінен айырмашылығы кіші р мәні қолайлы, өйткені тәуелді және тәуелсіз айнымалылар арасындағы корреляцияны көрсетеді.

Excel-де регрессияның диаграммасы

Excel-де регрессияны диаграмманы деректерді бөлектеу және шашыраңқы диаграмма ретінде диаграмма арқылы бейнелей аламыз. Регрессия сызығын қосу үшін «Диаграмма құралдары» мәзірінен «Орналасуды» таңдаңыз. Диалог терезесінде «Trendline», содан кейін «Lineline Trendline» таңдаңыз. R 2 мәнін қосу үшін «Trendline мәзірінен» Қосымша Trendline опцияларын «таңдаңыз. Соңында,» диаграммада R-квадрат мәнін көрсету «тармағын таңдаңыз. Көрнекі нәтиже қарым-қатынастың беріктігін қамтамасыз етпеу есебінен шығарады жоғарыдағы кесте сияқты егжей-тегжейлі.