Поняття зведення і угруповання статистичних даних

Л.І. Ніворожкіна, Т.В. Чернова
Теорія статистики (з завданнями і прикладами з регіональної економіки)
Навчальний посібник. - Ростов н / Д: «Міні Тайп», «Фенікс», 2005. - 220 с.

Зібраний в процесі статистичного спостереження матеріал потребує певної обробки, зведення розрізнених даних воєдино. Науково організована обробка матеріалів спостереження, що включає в себе обов'язковий контроль зібраних даних, їх систематизацію та групування, складання таблиць, отримання підсумків і похідних показників (середніх, відносних величин), називається в статистиці зведенням.

Зведення представляє собою другий етап статистичного дослідження. Метою зведення є отримання на основі зведених матеріалів узагальнюючих статистичних показників, які відображають сутність соціально-економічних явищ і певні статистичні закономірності.

Статистичні дані здійснюється за програмою, яка повинна розроблятися ще до збору статистичних даних, практично одночасно з складанням плану і програми статистичного спостереження. Програма зведення в першу чергу включає визначення груп і підгруп, тобто статистичне зведення здійснюється методом угруповання.

Угруповання - метод обробки і аналізу статистичних даних, при якому статистична сукупність явищ розчленовується на однорідні за окремими ознаками групи і підгрупи, і кожна з яких характеризується системою статистичних показників.

Припустимо, проводиться обстеження домогосподарств міста, з визначення забезпеченості населення житловою площею. Для отримання узагальнюючих об'єктивних характеристик, необхідно зібрані опитувальні листи, де міститься первинна інформація, поділити на різні групи, наприклад, з вигляду житлових будинків (цегляні, блокові, дерев'яні). У регіональних дослідженнях можна зустріти угруповання регіонів за рівнем соціально-економічного розвитку або за ступенем забезпеченості, наприклад, природними ресурсами.

Сталий розмежування об'єктів, що грунтується на найістотніших ознаках, які мало змінюються в часі і в просторі, називається класифікацією, наприклад, класифікація галузей народного господарства, класифікація основних фондів і т. Д. Таким чином, класифікація - це узаконена, загальноприйнята, нормативна угруповання будь-яких об'єктів.

Основними завданнями методу угруповань є вибір группировочного ознаки, визначення інтервалу угруповання і розрахунок числа груп.

під группіровочним ознакою розуміють ознака, по якому відбувається об'єднання окремих одиниць сукупності в однорідні групи (ознаки можуть бути атрибутивними, тобто смисловими, якісними, що не мають кількісного вираження - стать, професія, спеціалізація, і кількісними - розмір території, обсяг продажів і т. п.).

Інтервал окреслює кількісні межі груп. Як правило, він являє собою проміжок між максимальними та мінімальними значеннями ознаки в групі, наприклад розподіл [1] населення на групи за рівнем освіти за даними перепису 2002 р здійснюється з рівним інтервалом 4 роки і виглядає наступним чином, наприклад, в першу групу включається населення від 15 до 19 років; до другої групи від 20 до 24 років і т.д. Інтервали бувають не тільки рівними, коли різниця між максимальним і мінімальним значеннями в кожному з інтервалів однакова, але і нерівними, коли, наприклад, ширина інтервалу поступово збільшується, а верхній інтервал часто не закривається зовсім, тобто залишається відкритим, при відкритих інтервалах є тільки або верхня, або нижня межа. Так в останній віковій групі розглянутої угруповання інтервал відкритий, в цю групу входить населення у віці 70 років і вище. Якщо ж є і нижня, і верхня кордону, то такий інтервал називає закритим.

Для вибору оптимальної величини інтервалу в великих сумах застосовують формулу Стерджесс:

, ,

де х max, х min - найбільше і найменше значення ознаки; N - число одиниць (обсяг) сукупності.

або

. .

Визначення числа груп залежить перш за все від группировочного ознаки. Тут необхідно враховувати кілька умов:

а) число груп залежить від рівня коливання группировочного ознаки. Що гучніше варіація ознаки, тим більше, за інших рівних умов, має бути груп, наприклад, значні відмінності в заробітній платі працівників видобувних галузей по регіонах РФ за даними 2002 р від 8 тис. Руб (м.Шахти Ростовської обл.) До 40 тис. руб. (Г.Норільск Красноярського краю) визначають необхідність формування п'яти-шести груп. Якщо ж проводити угруповання по заробітній платі працівників бюджетної сфери, то вона по регіонах практично не змінюється, тому буде достатньо трьох груп.

б) число груп має відображати реальну структуру досліджуваної сукупності, якщо группіровочний ознака є атрибутивною, то за кількістю варіантів ознаки визначається число груп, наприклад, розподіл населення за статтю;

в) не допускається виділення порожніх груп. Якщо проблема порожніх груп все ж виникає, при проведенні структурних угруповань використовують нерівні інтервали


[1] При побудові інтервалів в кожен інтервал включаються значення ознак, числові значення яких більше нижньої межі інтервалу і менше (або рівні) верхньої межі (або навпаки).