Гомоскедастикалық

Гомоскедастик дегеніміз не?

Гомоскедастикалық («гомосседастикалық» деп те жазылады) регрессия моделіндегі қалдықтың немесе қателік мүшесінің дисперсиясы тұрақты болатын жағдайды айтады. Яғни, болжау шамасының мәні өзгерген сайын қателік термині көп өзгермейді. Мұны айтудың тағы бір тәсілі – деректер нүктелерінің дисперсиясы барлық деректер нүктелері үшін шамамен бірдей. Бұл жүйелілік деңгейін ұсынады және регрессия арқылы модельдеуді және мәліметтермен жұмыс істеуді жеңілдетеді. Алайда гомоскедастиканың болмауы регрессия моделіне тәуелді айнымалының өнімділігін түсіндіру үшін қосымша болжамдық айнымалыларды енгізу қажет болуы мүмкін.

Негізгі өнімдер

  • Гомоскедастика регрессия моделіндегі қателік мүшесінің дисперсиясы тұрақты болған кезде пайда болады. 
  • Егер қате терминінің дисперсиясы гомоскедастикалық болса, онда модель жақсы анықталған. Егер дисперсия тым көп болса, модель жақсы анықталмауы мүмкін. 
  • Қосымша болжамдық айнымалыларды қосу тәуелді айнымалының өнімділігін түсіндіруге көмектеседі.
  • Керісінше, гетероскедастика қателік терминінің дисперсиясы тұрақты болмаған кезде пайда болады.

Гомоскедастика қалай жұмыс істейді

Гомоскедастика – бұл сызықтық регрессиялық модельдеудің бір болжамы және осы типтегі мәліметтер ең кіші квадраттар әдісімен жақсы жұмыс істейді. Егер регрессия сызығының айналасындағы қателіктердің дисперсиясы көп өзгеретін болса, регрессия моделі нашар анықталған болуы мүмкін. Гомоскедастиканың қарама-қарсылығы – гетероскедастикалық, «гомогенді» қарама-қарсы «гетерогенді». Гетероскедастика («гетероскедастика» деп те жазылады) регрессия теңдеуіндегі қателік мүшесінің дисперсиясы тұрақты емес жағдайды айтады.

Маңызды

Дисперсия – бұл болжамдалған нәтиже мен берілген жағдайдың нақты нәтижесі арасындағы өлшенген айырмашылық деп қарастырған кезде, гомоскедастиканы анықтау қай факторларды дәлдікке келтіру керектігін анықтауға көмектеседі.

Ерекше мәселелер

Қарапайым регрессия моделі немесе теңдеу төрт мүшеден тұрады. Сол жағында тәуелді айнымалы орналасқан. Бұл модель «түсіндіруге» ұмтылатын құбылысты білдіреді. Оң жағында тұрақты, болжамды айнымалы және қалдық немесе қате термині бар. Қате термині тәуелді айнымалының өзгергіштік шамасын көрсетеді, ол болжамдық айнымалымен түсіндірілмейді.

Гомоскедастиктің мысалы

Мысалы, сіз оқушылардың тестілеу нәтижелерін әр оқушының оқуға кеткен уақытын пайдаланып түсіндіргіңіз келді делік. Бұл жағдайда тест ұпайлары тәуелді айнымалы болады, ал оқуға кететін уақыт болжамды айнымалы болады. 

Қате термині тест уақытындағы дисперсияның көлемін көрсететін еді, оны оқу уақытымен түсіндірілмеген. Егер бұл дисперсия біркелкі болса немесе гомоскедастикалық болса, онда бұл модельді тесттің нәтижесі үшін адекватты түсіндірме – оқуға кететін уақыт тұрғысынан түсіндіре алады.

Бірақ дисперсия гетероскедастикалық болуы мүмкін. Қате туралы мәліметтер кестесінде оқу уақытының үлкен мөлшері тестілеудің жоғары ұпайларымен өте сәйкес келетіндігін көрсетуі мүмкін, бірақ оқудың төмен уақытындағы тестілеу баллдары әр түрлі болды, тіпті кейбір өте жоғары баллдарды да қамтыды. Сонымен, ұпайлардың дисперсиясын бір болжамдық айнымалымен – оқуға кететін уақытпен жақсы түсіндіруге болмайды. Бұл жағдайда, мүмкін, тағы бір фактор жұмыс істейтін шығар, мүмкін оны немесе оларды анықтау үшін модельді жетілдіру қажет.

Қосымша тергеу барысында кейбір студенттер тест жауаптарын алдын-ала көргендігі немесе олар бұрын осыған ұқсас тест тапсырғандығы, сондықтан осы нақты тест үшін оқудың қажеті жоқтығы анықталуы мүмкін. Осыған байланысты, студенттердің тестілеуден өту қабілеттері әр түрлі деңгейге ие болды, бұл олардың оқу уақытына және пәнге қарамастан, алдыңғы тесттердегі нәтижелеріне тәуелсіз болды.

Регрессия моделін жақсарту үшін зерттеуші деректерге дәлірек сәйкес келетін басқа түсіндірмелі айнымалыларды қолданып көруі керек. Егер, мысалы, кейбір студенттер жауаптарды алдын-ала көрген болса, онда регрессия моделі екі түсіндірмелі айнымалыға ие болар еді: уақытты зерттеу және оқушының жауаптар туралы алдын-ала білуі. Осы екі айнымалының көмегімен тест нәтижелерінің көп дисперсиясы түсіндіріліп, қате терминінің дисперсиясы гомоскедастикалық болуы мүмкін, бұл модель жақсы анықталған дегенді білдіреді.