Чимал мәгълүматтан оешкан санауга
Мәгълүмат җыйганда, ул еш кына тәртипсез исемлек рәвешендә башлана. 200 клиентка өстенлекле түләү ысулын сорап, озын столбик җавап алуыгызны күз алдына китерегез: кредит картасы, акча, мобиль түләү, кредит картасы, кредит картасы, акча, һ.б. Ешлык таблицасы бу тәртипсезлекне һәр кыйммәтнең ничә тапкыр очрагын санап, чиста йомгакка әйләндерә.
Нигезле ешлык таблицасында ике столбик бар: категория һәм сан (шулай ук ешлык дип атала). Түләү мисалы өчен болай булырга мөмкин: кредит картасы: 95, акча: 52, мобиль түләү: 38, дебет картасы: 15. Хәзер нинди түләү ысулы өстенлек итүен һәм нинди сирәк булуын шундук күрәсез. Бу гади санау тасвирлама статистикасының нигезе.
Нисби һәм кумулятив ешлык
Чимал саннар файдалы, ләкин төрле күләмдәге мәгълүматлар җыелмалары арасында чагыштыру кыен. Бер кибет 200 кешене, икенчесе 1,000 кешене сораган булса, чимал саннарны чагыштыру ялгыш юнәлтә. Нисби ешлык бу проблеманы һәр санны гомуми саннан пропорция яки процент итеп белдереп чишә. 200 дән 95 кредит картасы - 47.5% лы нисби ешлык.
Кумулятив ешлык тагын да алга бара. Ул категорияләр буенча йөргәндә үсеп баручы гомуми санны күрсәтә. Имтихан баллы диапазоннары кебек тәртипле мәгълүматлар өчен кумулятив ешлык "укучыларның ничә проценты 70 балл яки түбәнрәк алды?" кебек сорауларга җавап бирә. Сез бары тик шул ноктага кадәр барлык категорияләрнең ешлыкларын кушасыз. Бу аеруча группаланган мәгълүматлардан медианалар яки процентильләр табарга кирәк булганда файдалы.
Шул ук мәгълүматның бу өч карашы (чимал ешлык, нисби ешлык, кумулятив ешлык) бергәләп тулы сурәт бирә. Чимал саннар чын саннарны күрсәтә, нисби ешлыклар мәгълүматлар арасында чагыштыруга мөмкинлек бирә, кумулятив ешлыклар кыйммәтләрнең таралышын аңларга ярдәм итә.
Сан мәгълүматлары өчен ешлык таблицалары
Мәгълүматыгыз санлы һәм өзлексез булганда - яшьләр, керемнәр, тест баллары кебек - һәр уникаль кыйммәтне санап чыгу мөмкин түгел, чөнки йөзләгән булырга мөмкин. Аның урынына кыйммәтләрне интерваллар - бин яки класслар дип аталган - төркемнәргә берләштерәсез. Мәсәлән, яшьләр 18-25, 26-35, 36-45 һ.б. итеп группалана ала.
Дөрес бин саны сайлау мөһим. Бик аз бин белән деталь югала. Бик күп бин белән таблица чимал мәгълүмат кебек тәртипсез. Таралган кагыйдә - күпчелек мәгълүматлар җыелмалары өчен 5 тән 15 кә кадәр бин куллану. Өстәге гистограмма яш мәгълүматларының алты бинга группаланганда ничек күренүен күрсәтә, таралыш формасын бер караш белән ачыклый.
Укытучы 30 укучының имтихан балларын яза: 45 тән 98 гә кадәр. Ул 10 баллы биннар белән ешлык таблицасы ясый (40-49, 50-59, 60-69, 70-79, 80-89, 90-99). Бу укучыларның күбесе 70 белән 89 арасында балл алганын, бары тик ике укучының 50 дән түбән булуын ачыклый. Ешлык таблицасы шундук класс кайда җыелуен һәм читтән чыгуларның кайда булуын ачыклый - 30 санлы чимал исемлектә күрү кыен булган нәрсәләр.
Кросс-табуляция: бер үк вакытта ике үзгәрүчән
Ешлык таблицасы бер үзгәрүчән белән эшли. Ләкин ике категориаль үзгәрүчән арасындагы бәйләнешне тикшерергә теләсәгезчә? Монда кросс-табуляция (шулай ук контингенция таблицасы яки ике юнәлешле таблица дип атала) кирәк. Ул бер үзгәрүчәннең юлларны, икенченең столбикларны билгеләгән тор ясый, саннар һәр күзәнәктә.
Мәсәлән, хезмәткәрләрдән эш канәгатьлеге (канәгать, битараф, канәгатьсез) турында сорыйсыз, шулай ук бүлекне (сату, инженерия, ярдәм) язасыз. Кросс-таблица һәр бүлектәге ничә хезмәткәрнең һәр канәгатьлек категориясенә керүен күрсәтә. Хәзер инженерия бүлегендә сатуга караганда канәгатьсез хезмәткәрләр күбрәкме, яки ярдәм бүлеге аеруча бәхетлеме - шундук күрәсез.
Кросс-таблар хи-квадрат тесты кебек күп статистик тестларның башлангыч ноктасы. Алар теләсә нинди рәсми анализ алдыннан ике үзгәрүчәннең бәйлеме-юкмы аны визуаль тикшерергә мөмкинлек бирә. Тикшеренүләрне укыганда, чагыштыруны җиңеләйтү өчен юл процентлары яки столбик процентлары белән кросс-табуляция таблицаларын еш күрерсез.
Таблицаларны профессионал кебек укау
Ешлык таблицалары һәм кросс-таблар һәрнәрсәдә очрый: хәбәр мәкаләләрендә, медицина хисапларында, бизнес панельләрендә, академик мәкаләләрдә. Аларны яхшы укау өчен практик киңәшләр. Беренчедән, һәрвакыт йомгакларны тикшерегез. Таблица процентларны, ләкин чимал саннарны күрсәтмәсә, сайлама күләме процентларның мәгънәле булуы өчен бик кечкенә булырга мөмкин (4 кеше генә сораганда "50% А вариантын өстен күрде" дип әйтү тәэсирле яңгырый).
Икенчедән, категорияләрнең ничек билгеләнүенә игътибар итегез. Ешлык таблицасында тигез булмаган бин киңлеге мәгълүмат тәэсирен бозарга мөмкин. "0-10" һәм "11-50" билгеле биннарда табигый рәвештә киңрәк бинда күбрәк сан булыр, нигездәге дәрәҗә бер ук булса да.
Өченчедән, кросс-табларда юл яки столбик процентлары сорауыгыз өчен яраклырак икәнен билгеләгез. Һәр бүлекнең канәгать өлешен белергә теләсәгез, юл процентлары кулланыгыз. Канәгать хезмәткәрләрнең ни кадәре һәр бүлектән икәнен белергә теләсәгез, столбик процентлары кулланыгыз. Ялгыш юнәлеш сайлау дөрес булмаган нәтиҗәләргә китерергә мөмкин.
Ешлык таблицалары чимал мәгълүматларны һәр кыйммәт яки категориянең ничә тапкыр очрагын санап, оешкан йомгакларга әйләндерә. Нисби ешлык саннарны җиңел чагыштыру өчен пропорция итеп белдерә, ә кумулятив ешлык үсеп баручы йомгакларны күзәтә. Кросс-табуляция моны ике үзгәрүчәнгә бер үк вакытта киңәйтеп, категорияләрнең ничек бәйләнүен ачыклый. Бу гади коралар диярлек һәр мәгълүмат анализының беренче адымы һәм көндәлек тормышта статистиканы укуның иң практик осталыкларының берсе.