Winsorized орташа анықтамасы

Winsorized дегеніміз не?

Винзоризацияланған орта дегеніміз – бастапқыда ең кіші және үлкен мәндерді өздеріне жақын бақылаулармен алмастыратын орташа есептеу әдісі. Бұл шамадан тыс немесе әдеттен тыс экстремалды шамалардың немесе шектен тыс көрсеткіштердің есептеуге әсерін шектеу үшін жасалады. Мәндерді ауыстырғаннан кейін орташа арифметикалық формула винсоризацияланған ортаны есептеу үшін қолданылады.

негізгі өнімдер

  • Винсоризацияланған орта дегеніміз – деректер жиынтығының ең кіші және ең үлкен мәндерін оларға жақын бақылаулармен ауыстыруды көздейтін орташа әдіс.
  • Ол шамадан тыс мәндерді ауыстыру арқылы шамадан тыс әсерлерді азайтады.
  • Винзоризацияланған орташа мән, қысқартылған орташа мәнмен бірдей емес, олардың орнына мәліметтер нүктелерін жоюға, керісінше оларды ауыстыруға болмайды, дегенмен екі нәтиже жақын болады.

Winsorized орташа формуласы

Винзоризацияланған құралдар екі жолмен көрсетіледі. «K n » винсоризацияланған орташа мән «k» ең кіші және ең үлкен бақылауларды ауыстыруды білдіреді, мұндағы «k» бүтін сан. «X%» ұтымды мәні деректердің екі жағынан мәндердің берілген пайызын ауыстыруды көздейді.

Винсоризацияланған ортаға ең кіші және ең үлкен деректер нүктелерін ауыстыру, содан кейін барлық деректер нүктелерін қосу және қосындыларды жалпы мәліметтер нүктелерінің санына бөлу арқылы қол жеткізіледі.

Winsorized сізге нені білдіреді?

Винзоризацияланған орташа шамалар аз сезімтал, өйткені оларды аз экстремалды мәндермен алмастыра алады. Яғни, бұл арифметикалық орташадан гөрі жоғары деңгейге аз сезінеді. Алайда, егер дистрибуцияда май құйрықтары болса, дистрибутивтегі ең жоғарғы және ең төменгі мәндерді жою әсері аз болады, өйткені тарату сандарындағы өзгергіштік деңгейі жоғары.

Winsorized орташа мәнін қалай қолдануға болатындығы туралы мысал

Келесі мәліметтер жиынтығы үшін виноризацияланған ортаны есептейік: 1, 5, 7, 8, 9, 10, 34. Бұл мысалда біз ең кіші және ең үлкен мәндерді ауыстыратын бірінші ретті деп есептейміз. олардың жақын бақылаулары.

Деректер жиынтығы енді келесідей пайда болады: 5, 5, 7, 8, 9, 10, 10. Жаңа жиынтықтың орташа арифметикалық мәнін алсақ, орташа мәні 7,7 немесе (5 + 5 + 7 + 8 + 9 + 10) болады. + 10) 7-ге бөлінді, орташа арифметикалық мәннің жоғары болатындығын ескеріңіз – 10,6. Winsorized орташа мәні 34 мәнінің әсерін төмендетеді.

Немесе жоғарғы 10% және төменгі 10% алатын және оларды келесі жақын мәндерімен алмастыратын 20% -дық орташа мәнді қарастырыңыз. Біз келесі мәліметтер жиынтығын таңдаймыз: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Екі ең кіші және ең үлкен деректер нүктелері – 20 деректер нүктесінің 10% – келесі жақын мәндерімен ауыстырылады. Сонымен, жаңа деректер жиынтығы келесідей: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Winsorized орташа мәні 33.9, немесе мәліметтердің жалпы саны (678) мәліметтер нүктелерінің жалпы санына (20) бөлінген.

Winsorized Mean және Trimmed Mean

Winsorized орташа деректер нүктелерін өзгертуді, ал қиылған орта деректер нүктелерін жоюды қамтиды. Winsorized орташа және триммирленген орташа мәні бір-біріне жақын немесе кейде тең болуы әдеттегідей.

Winsorized орташа мәнінің шектеулері

Винзоризацияланған құралдардың бір үлкен кемшілігі – бұл олардың мәліметтер жиынтығына табиғи түрде кейбір жағымсыздықты енгізуі. Шетелдердің әсерін азайту арқылы талдау жақсы талдау үшін өзгертіледі, сонымен бірге негізгі деректер туралы ақпаратты жояды.