Використання критеріїв згоди. Критерій згоди Що робитимемо з отриманим матеріалом

Критерії згоди (відповідності)

Для перевірки гіпотези про відповідність емпіричного розподілу теоретичному закону розподілу використовуються спеціальні статистичні показники - критерії згоди (або критерії відповідності). До них належать критерії Пірсона, Колмогорова, Романовського, Ястремського та ін. Більшість критеріїв згоди базуються на використанні відхилень емпіричних частот від теоретичних. Очевидно, що чим менше ці відхилення, тим краще теоретичний розподіл відповідає емпіричному (або описує його).

Критерії згоди -це критерії перевірки гіпотез щодо відповідності емпіричного розподілу теоретичному розподілу ймовірностей. Такі критерії поділяються на два класи: загальні та спеціальні. Загальні критерії згоди застосовні до загального формулювання гіпотези, саме до гіпотезі про згоду результатів з будь-яким апріорно передбачуваним розподілом ймовірностей. Спеціальні критерії згоди передбачають спеціальні нульові гіпотези, що формулюють згоду з певною формою розподілу ймовірностей.

Критерії згоди, спираючись на встановлений закон розподілу, дають можливість встановити, коли розбіжності між теоретичними та емпіричними частотами слід визнати несуттєвими (випадковими), а коли – суттєвими (невипадковими). З цього випливає, що критерії згоди дозволяють відкинути або й підтвердити правильність висунутої при вирівнюванні низки гіпотези про характер розподілу в емпіричному ряду і дати відповідь, чи можна прийняти для даного емпіричного розподілу модель, виражену деяким теоретичним законом розподілу.

Критерій згоди Пірсона х 2 (хі-квадрат) – один із основних критеріїв згоди. Запропоновано англійським математиком Карлом Пірсоном (1857-1936) для оцінки випадковості (суттєвості) розбіжностей між частотами емпіричного та теоретичного розподілів:

де k -число груп, куди розбито емпіричне розподіл; fi -емпірична частота ознаки в i-ї групи; / тс °р - теоретична частота ознаки i-йгрупі.

Схема застосування критерію у)до оцінки узгодженості теоретичного та емпіричного розподілів зводиться до наступного.

  • 1. Визначається розрахунковий захід розбіжності % 2 асч.
  • 2. Визначається кількість ступенів свободи.
  • 3. За кількістю ступенів свободи v за допомогою спеціальної таблиці визначається %^бл
  • 4. Якщо % 2 асч >х 2 абл, то при заданому рівні значимості а і числі ступенів свободи гіпотезу про несуттєвість (випадковості) розбіжностей відхиляють. В іншому випадку гіпотезу можна визнати такою, що не суперечить отриманим експериментальним даним і з ймовірністю (1 - а) можна стверджувати, що розбіжності між теоретичними та емпіричними частотами випадкові.

Рівень значимостіце можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. У статистичних дослідженнях залежно від важливості та відповідальності розв'язуваних завдань користуються такими трьома рівнями значимості:

  • 1) а = 0,1 тоді Р = 0,9;
  • 2) а = 0,05, тоді Р = 0,95;
  • 3) а = 0,01, тоді Р = 0,99.

Використовуючи критерій згоди у),необхідно дотримуватися таких умов.

  • 1. Обсяг досліджуваної сукупності повинен задовольняти умову п > 50, при цьому частота або чисельність групи повинна бути не менше 5. Якщо ця умова порушується, необхідно попередньо поєднати невеликі частоти (менше 5).
  • 2. Емпіричний розподіл має складатися з даних, отриманих у результаті випадкового відбору, тобто. вони мають бути незалежними.

Недоліком критерію згоди Пірсона є втрата частини первинної інформації, пов'язана з необхідністю угруповання результатів спостережень в інтервали та об'єднання окремих інтервалів з малою кількістю спостережень. У зв'язку з цим рекомендується доповнювати перевірку відповідності розподілів та критерію у)іншими критеріями. Особливо це необхідно при обсязі вибірки п ~ 100.

У статистиці критерій згоди Колмогорова (також відомий як критерій згоди Колмогорова - Смирнова) використовується для того, щоб визначити, чи підпорядковуються два емпіричні розподіли одному закону, або визначити, чи підпорядковується отриманий розподіл передбачуваної моделі. Критерій Колмогорова заснований на визначенні максимальної розбіжності між накопиченими частотами чи частотами емпіричних чи теоретичних розподілів. Критерій Колмогорова обчислюється за такими формулами:

де Dі d -відповідно максимальна різниця між накопиченими частотами (/-/") та між накопиченими частотами ( р-р") емпіричного та теоретичного рядів розподілів; N -число одиниць у сукупності.

Розрахувавши значення X,по спеціальній таблиці визначається можливість, з якою можна стверджувати, що відхилення емпіричних частот від теоретичних випадкові. Якщо ознака набуває значення до 0,3, це означає, що відбувається повний збіг частот. При великому числі спостережень умов Колмогорова здатний виявити будь-який відступ гіпотези. Це означає, що будь-яка відмінність розподілу вибірки від теоретичного буде з його допомогою виявлено, якщо спостережень буде багато. Практична значущість цієї властивості несуттєва, оскільки у більшості випадків важко розраховувати на отримання великої кількості спостережень у незмінних умовах, теоретичне уявлення про закон розподілу, якому має підкорятися вибірка, завжди наближене, а точність статистичних перевірок не повинна перевищувати точність обраної моделі.

Критерій згоди Романовського заснований використання критерію Пірсона, тобто. вже знайдених значень х 2 > та числа ступенів свободи:

де v – число ступенів свободи варіації.

Критерій Романовського зручний за відсутності таблиць для х 2 . Якщо До рДо? > 3, то невипадкові і теоретичний розподіл неспроможна служити моделлю для досліджуваного емпіричного розподілу.

Б. С. Ястремський використовував у критерії згоди не число ступенів свободи, а кількість груп ( k), особливу величину 0, що залежить від числа груп, та величину хі-квадрат. Критерій згоди Ястремського має той самий сенс, що й критерій Романовського і виражається формулою

де х 2 – критерій згоди Пірсона; / е гр - число груп; 0 - коефіцієнт, число груп менше 20 рівний 0,6.

Якщо 1ф акт > 3, розбіжності між теоретичними та емпіричними розподілами невипадкові, тобто. емпіричний розподіл не відповідає вимогам нормального розподілу. Якщо 1ф акт

МІНІСТЕРСТВО ОСВІТИ ТА НАУКИ УКРАЇНИ

АЗОВСЬКИЙ РЕГІОНАЛЬНИЙ ІНСТИТУТ УПРАВЛІННЯ

ЗАПОРІЗЬКОГО НАЦІОНАЛЬНОГО ТЕХНІЧНОГО УНІВЕРСИТЕТУ

Кафедра математики

КУРСОВА РОБОТА

З дисципліни «СТАТИСТИКА»

На тему: «КРИТЕРІЇ УГОДИ»

студентки 2-го курсу

групи 207 факультету управління

Батури Тетяни Олегівни

Науковий керівник

доцент Косенков О. І.

Бердянськ - 2009р.


ВСТУП

1.2 Критерії згоди χ 2 Пірсона для простої гіпотези

1.3 Критерії згоди на складну гіпотезу

1.4 Критерії згоди χ 2 Фішера для складної гіпотези

1.5 Інші критерії згоди. Критерії згоди на розподіл Пуассона

РОЗДІЛ ІІ. ПРАКТИЧНЕ ЗАСТОСУВАННЯ КРИТЕРІЯ УГОДИ

ДОДАТКИ

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ


ВСТУП

У цій роботі розказано про найпоширеніші умови згоди - омега-квадрат, хі-квадрат, Колмогорова і Колмогорова-Смирнова. Особливу увагу приділено випадку, коли необхідно перевірити належність розподілу даних деякому параметричному сімейству, наприклад нормальному. Ця дуже поширена на практиці ситуація через свою складність досліджена не до кінця і не повністю відображена у навчальній та довідковій літературі.

Критеріями згоди називають статистичні критерії, призначені для перевірки згоди дослідних даних та теоретичної моделі. Найкраще це питання розроблено, якщо спостереження становлять випадкову вибірку. Теоретична модель у разі визначає закон розподілу.

Теоретичний розподіл – це розподіл ймовірностей, яке керує випадковим вибором. Уявлення про нього може дати як теорія. Джерелами знань тут може бути і традиція, і минулий досвід, і попередні спостереження. Треба лише підкреслити, що цей розподіл має бути обраний незалежно від даних, за якими ми збираємося його перевіряти. Інакше кажучи, неприпустимо спочатку «підігнати» за вибіркою певний закон розподілу, а потім намагатись перевірити згоду з отриманим законом щодо цієї ж вибірки.

Прості та складні гіпотези. Говорячи про теоретичний закон розподілу, якому гіпотетично мали б слідувати елементи даної вибірки, треба розрізняти прості та складні гіпотези про цей закон:

· Проста гіпотеза прямо вказує певний закон ймовірностей (розподіл ймовірностей), за яким виникли вибіркові значення;

· Складна гіпотеза вказує на єдиний розподіл, а якесь їх безліч (наприклад, параметричне сімейство).

Критерії згоди засновані на використанні різних заходів відстаней між аналізованим емпіричним розподілом та функцією розподілу ознаки у генеральній сукупності.

Непараметричні критерії згоди Колмогорова, Смирнова, омега квадрат широко використовуються. Проте з ними пов'язані і поширені помилки у застосуванні статистичних методів.

Справа в тому, що перелічені критерії були розроблені для перевірки згоди з відомим теоретичним розподілом. Розрахункові формули, таблиці розподілів та критичних значень широко поширені. Основна ідея критеріїв Колмогорова, омега квадрат та аналогічних їм полягає у вимірі відстані між функцією емпіричного розподілу та функцією теоретичного розподілу. Розрізняються ці критерії видом відстаней у просторі функцій розподілу.

Приступаючи до виконання цієї курсової роботи, я поставила собі за мету, дізнатися які існують критерії згоди, розібратися для чого вони необхідні. Для цієї мети необхідно виконати такі завдання:

1. Розкрити суть поняття "критерії згоди";

2. Визначити які критерії згоди існують, вивчити їх окремо;

3. Зробити висновки щодо проведеної роботи.


РОЗДІЛ I. ТЕОРЕТИЧНЕ ОБГРУНТУВАННЯ КРИТЕРІЯ УГОДИ

1.1 Критерії згоди Колмогорова та омега-квадрат у разі простої гіпотези

Проста гіпотеза. Розглянемо ситуацію, коли вимірювані дані є числами, інакше кажучи, одновимірними випадковими величинами. Розподіл одновимірних випадкових величин може бути описаний вказівкою їх функцій розподілу. І багато критеріїв згоди ґрунтуються на перевірці близькості теоретичної та емпіричної (вибіркової) функцій розподілу.

Припустимо, що маємо вибірку n. Позначимо справжню функцію розподілу, якій підпорядковуються спостереження, G(х), емпіричну (вибіркову) функцію розподілу – F n (х), а гіпотетичну функцію розподілу – F(х). Тоді гіпотеза Н у тому, що справжня функція розподілу є F(х), записується як Н: G(·) = F(·).

Як перевірити гіпотезу H? Якщо Н вірна, то F n і F повинні виявляти певну подібність, і різницю між ними має спадати зі збільшенням n. Внаслідок теореми Бернуллі F n (х) F (х) при n → ∞. Для кількісного вираження подібності функцій Fn і F використовують різні способи.

Для вираження подібності функцій можна використовувати ту чи іншу відстань між цими функціями. Наприклад, можна порівняти F n і F рівномірної метриці, тобто. розглянути величину:

(1.1)

Статистику Dn називають статистикою Колмогорова.

Вочевидь, що D n - випадкова величина, оскільки його значення залежить від випадкового об'єкта F n . Якщо гіпотеза Н 0 справедлива і n → ∞, то F n (x) F (x) при кожному х. Тому природно, що за цих умов D n → 0. Якщо гіпотеза Н 0 невірна, то F n → G і G ≠ F, а тому sup -∞

Як завжди при перевірці гіпотези, міркуємо так, якби гіпотеза була вірна. Зрозуміло, що Н 0 має бути відкинута, якщо отримане експериментально значення статистики D n здається неправдоподібно великим. Але для цього треба знати, як розподілено статистику D n за гіпотези Н: F= G при заданих n і G.

Чудова властивість D n у тому, що й G = F, тобто. якщо гіпотетичний розподіл зазначено правильно, то закон розподілу статистики D n виявляється одним і тим же для всіх безперервних функцій G. Він залежить лише від обсягу вибірки n.

Доказ цього факту полягає в тому, що статистика не змінює свого значення при монотонних перетвореннях осі х. Таким перетворенням будь-який безперервний розподіл G можна перетворити на рівномірний на відрізку. При цьому F n (x) перейде у функцію розподілу вибірки із цього рівномірного розподілу.

При малих п для статистики D n при гіпотезі Н 0 складено таблиці відсоткових точок. При великих п розподіл D n (при гіпотезі Н 0) показує знайдена 1933 р. А.Н.Колмогоровим гранична теорема. Вона говорить про статистику

(оскільки сама величина D n → 0 при Н 0 доводиться множити її на необмежено зростаючу величину, щоб розподіл стабілізувалося). Теорема Колмогорова стверджує, що за справедливості Н 0 і якщо G безперервна:
(1.2)

Ця сума дуже легко вважається Maple. Для перевірки простої гіпотези Н0: G = F потрібно за вихідною вибіркою обчислити значення статистики Dn. Для цього годиться проста формула:

(1.3)

Тут через х k - елементи варіаційного ряду, побудованого за вихідною вибіркою. Отриману величину D n потім треба порівняти з витягнутими з таблиць або розрахованими за асимптотичної формули критичними значеннями. Гіпотезу Н 0 доводиться відкидати (на обраному рівні значущості), якщо отримане досвіді значення D n перевищує обране критичне значення, що відповідає прийнятому рівню значимості.

Інший популярний критерій згоди отримаємо, вимірюючи відстань між Fn та F в інтегральній метриці. Він ґрунтується на так званій статистиці омега-квадрат:

(1.4)

Для його обчислення за реальними даними можна використати формулу:

(1.5)

При справедливості гіпотези Н 0 і безперервності функції G розподіл статистики омега-квадрат, так само, як розподіл статистики D n залежить тільки від n і не залежить від G.

Так само, як для D n ,

при малих n є таблиці відсоткових точок, а великих значень n слід використовувати граничне (при n → ∞) розподіл статистики n . Тут знову доводиться множити на множник, що необмежено зростає. Граничне розподіл було знайдено Н.В.Смирновим в 1939 р. Для нього складено докладні таблиці та обчислювальні програми. Важлива з теоретичної точки зору властивість критеріїв, заснованих на Dn і: вони заможні проти будь-якої альтернативи G≠F.

Так як всі припущення про характер того чи іншого розподілу - це гіпотези, то вони повинні бути піддані статистичній перевірці за допомогою критеріїв згоди, які дозволяють встановити, коли розбіжності між теоретичними і емпіричними частотами слід визнати несуттєвими, тобто. випадковими, а коли – суттєвими (невипадковими). Таким чином, критерії згоди дозволяють відкинути або підтвердити правильність висунутої при вирівнюванні гіпотези про характер розподілу в емпіричному ряду.

Існує низка критеріїв згоди. Найчастіше застосовують критерії Пірсона, Романовського та Колмогорова.

Критерій згоди Пірсона - Один з основних:

де k – число груп, куди розбито емпіричне розподіл,
- спостерігається частота ознаки в i-й групі,
- Теоретична частота.
Для розподілу складено таблиці, де вказано критичне значення критерію згоди для обраного рівня значущості та ступенів свободи df.(або )
Рівень значимості – можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. У статистиці користуються трьома рівнями:

  • a= 0,10, тоді Р=0,90 (у 10 випадках їх 100 може бути відкинуто правильна гіпотеза);
  • a = 0,05, тоді Р = 0,95;
  • a = 0,01 тоді Р=0,99.

Число ступенів свободи df визначається як число груп у ряді розподілу мінус число зв'язків: df = k -z. Під числом зв'язків розуміється число показників емпіричного низки, використаних під час обчислення теоретичних частот, тобто. показників, що пов'язують емпіричні та теоретичні частоти.
Наприклад, при вирівнюванні по кривій нормального розподілу є три зв'язки:
; ; .
Тому при вирівнюванні кривою нормального розподілу число ступенів свободи визначається як df = k –3.
Для оцінки суттєвості розрахункове значення порівнюється з табличним.
При повному збігу теоретичного та емпіричного розподілів, інакше >0. Якщо >, то при заданому рівні значущості та числі ступенів свободи гіпотезу про несуттєвість (випадковість) розбіжностей відхиляємо.
У разі якщо укладаємо, що емпіричний ряд добре узгоджується з гіпотезою про передбачуваний розподіл і з ймовірністю Р=(1-a) можна стверджувати, що розбіжність між теоретичними та емпіричними частотами випадково.
Критерій згоди Пірсона використовується, якщо обсяг сукупності досить великий, у своїй частота кожної групи має бути щонайменше 5.

Критерій Романовського з заснований використання критерію Пірсона, тобто. вже знайдених значень і числа ступенів свободи df:

Він зручний за відсутності таблиць для .
Якщо з<3, то расхождения распределений случайны, если же с>3, то не випадкові і теоретичний розподіл не може служити моделлю для емпіричного розподілу, що вивчається.

Критерій Колмогорова l заснований на визначенні максимальної розбіжності між накопиченими частотами та частостями емпіричних та теоретичних розподілів:
або ,
де D і d – відповідно максимальна різниця між накопиченими частотами та накопиченими частостями емпіричного та теоретичного рядів розподілів;
N - Число одиниць сукупності.
Розрахувавши значення l, таблиці Р(l) визначають ймовірність, з якою можна стверджувати, що відхилення емпіричних частот від теоретичних випадкові. Імовірність Р(l) може змінюватися від 0 до 1. При Р(l)=1 відбувається повний збіг частот, Р(l)=0 – повне розбіжність. Якщо приймає значення до 0,3, то Р(l)=1.
Основна умова використання критерію Колмогорова досить велика кількість спостережень.

У цьому п. ми розглянемо одне з питань, пов'язаних з перевіркою правдоподібності гіпотез, а саме питання про узгодженість теоретичного і статистичного розподілу.

Припустимо, що цей статистичний розподіл вирівняно за допомогою деякої теоретичної кривої f(х)(Мал. 7.6.1). Як би добре не була підібрана теоретична крива, між нею та статистичним розподілом неминучі деякі розбіжності. Природно виникає питання: чи пояснюються ці розбіжності лише випадковими обставинами, пов'язані з обмеженим числом спостережень, чи є суттєвими і пов'язані з тим, що підібрана нами крива погано вирівнює даний статистичний розподіл. Для відповіді на таке запитання є так звані «критерії згоди».

ЗАКОНИ РОЗПОДІЛУ ВИПАДКОВИХ ВЕЛИЧИН



Ідея застосування критеріїв згоди полягає у наступному.

На підставі цього статистичного матеріалу ми маємо перевірити гіпотезу Н,яка полягає в тому, що випадкова величина Xпідпорядковується певному закону розподілу. Цей закон може бути заданий у тій чи іншій формі: наприклад, як функції розподілу F(x)або у вигляді щільності розподілу f(х),або ж у вигляді сукупності ймовірностей p t ,де p t- ймовірність того, що величина Xпотрапить у межі l-торозряду.

Так як з цих форм функція розподілу F(х)є найбільш загальною і визначає собою будь-яку іншу, формулюватимемо гіпотезу Н,як полягає в тому, що величина Xмає функцію розподілу ^(д:).

Для того, щоб прийняти або спростувати гіпотезу Н,розглянемо деяку величину U,характеризує ступінь розбіжності теоретичного та статистичного розподілів. Величина Uможе бути обрана різними способами; наприклад, як Uможна взяти суму квадратів відхилень теоретичних ймовірностей p tвід відповідних частот р*або ж суму тих "* квадратів з деякими коефіцієнтами («вагами»), або ж максимальне відхилення статистичної функції розподілу F*(x)від теоретичної F(x)і т. д. Припустимо, що величина Uобрана тим чи іншим способом. Очевидно, це деяка випадкова величина.Закон розподілу цієї випадкової величини залежить від закону розподілу випадкової величини X,над якою проводилися досліди, та від кількості дослідів п.Якщо гіпотеза Нвірна, то закон розподілу величини Uвизначається законом розподілу величини X(функцією F(x))і числом п.

Припустимо, що цей закон розподілу нам відомий. В результаті цієї серії дослідів виявлено, що обраний нами захід



КРИТЕРІЇ УГОДИ


розбіжності Uприйняла певне значення а.Постає питання, чи можна пояснити це випадковими причинами або ж це розбіжність занадто велика і вказує на наявність суттєвої різниці між теоретичним і статистичним розподілами і, отже, на непридатність гіпотези Н?Для відповіді це питання припустимо, що гіпотеза Нвірна, і обчислимо в цьому припущенні ймовірність того, що за рахунок випадкових причин, пов'язаних з недостатнім обсягом дослідного матеріалу, міра розбіжності Uвиявиться не менше, ніж спостережене нами в досвіді значення і,тобто обчислимо ймовірність події:

Якщо ця можливість дуже мала, то гіпотезу Нслід відкинути як мало правдоподібну; якщо ж ця ймовірність значна, слід визнати, що експериментальні дані не суперечать гіпотезі н.

Виникає питання про те, яким способом слід вибирати міру розбіжності £/? Виявляється, що за деяких способів її вибору закон розподілу величини Uмає досить прості властивості і при досить великому ппрактично не залежить від функції F(x).Саме такими заходами розбіжності і користуються в математичній статистиці як критерії згоди.

Розглянемо один із найчастіше застосовуваних критеріїв згоди - так званий «критерій у?»Пірсона.

Припустимо, що зроблено га незалежних дослідів, у кожному з яких випадкова величина Xнабула певного значення. Результати дослідів зведені в kрозрядів та оформлені у вигляді статистичного ряду.

Теоретичні та емпіричні частоти. Перевірка на нормальність розподілу

При аналізі варіаційних рядів розподілу велике значення має, наскільки емпіричний розподілознаки відповідає нормальному. Для цього частоти фактичного розподілу слід порівняти з теоретичними, які характерні для нормального розподілу. Отже, необхідно за фактичними даними обчислити теоретичні частоти кривої нормального розподілу, які є функцією нормованих відхилень.

Інакше висловлюючись, емпіричну криву розподілу необхідно вирівняти кривою нормального розподілу.

Об'єктивна характеристика відповідності теоретичнихі емпіричних частотможе бути отримана за допомогою спеціальних статистичних показників, які називають критеріями згоди.

Критерієм згодиназивають критерій, який дозволяє встановити, чи є розбіжність емпіричногоі теоретичногорозподілів випадковим чи значимим, т. е. чи узгоджуються дані спостережень з висунутою статистичної гіпотезою чи погоджуються. Розподіл генеральної сукупності, що вона має з висунутої гіпотези, називають теоретичним.

Виникає потреба встановити критерій(правило), яке дозволяло б судити, чи є розбіжність між емпіричним та теоретичним розподілами випадковим чи значущим. Якщо розбіжність виявиться випадковим, то вважають, що дані спостережень (вибірки) узгоджуються з висунутою гіпотезою про закон розподілу генеральної сукупності і, отже, приймають гіпотезу; якщо ж розбіжність виявиться значущимдані спостережень не узгоджуються з гіпотезою і її відкидають.

Зазвичай емпіричні та теоретичні частоти різняться через те, що:

    розбіжність випадково пов'язане з обмеженою кількістю спостережень;

    розбіжність невипадково і тим, що статистична гіпотеза у тому, що генеральна сукупність розподілена нормально - хибна.

Таким чином, критерії згодидозволяють відкинути чи підтвердити правильність висунутої при вирівнюванні низки гіпотези про характері розподілу в емпіричному ряду.

Емпіричні частотиодержують у результаті спостереження. Теоретичні частотирозраховують за формулами.

Для закону нормального розподілуїх можна знайти таким чином:

    Σƒ i- сума накопичених (кумулятивних) емпіричних частот

    h - різниця між двома сусідніми варіантами

    σ - вибіркове середньоквадратичне відхилення

    t-нормоване (стандартизоване) відхилення

    φ(t) – функція щільності ймовірності нормального розподілу (знаходять за таблицею значень локальної функції Лапласа для відповідного значення t)

Є кілька критеріїв згоди, найпоширенішими у тому числі є: критерій хи-квадрат (Пірсона), критерій Колмогорова, критерій Романовського.

Критерій згоди Пірсона 2 – один з основних, який можна представити як суму відносин квадратів розбіжностей між теоретичними (f Т) та емпіричними (f) частотами до теоретичних частот:

    k–число груп, куди розбито емпіричне розподіл,

    f i -спостерігається частота ознаки в i-й групі,

    f T – теоретична частота.

Для розподілу 2 складено таблиці, де вказано критичне значення критерію згоди 2 для обраного рівня значущості α і ступенів свободи df (або ν). Рівень значимості α – можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. Р - статистична достовірністьприйняття правильної гіпотези. У статистиці найчастіше користуються трьома рівнями значимості:

α=0,10, тоді Р=0,90 (у 10 випадках із 100)

α=0,05, тоді Р=0,95 (у 5 випадках із 100)

α=0,01, тоді Р=0,99 (у 1 випадку зі 100) може бути відкинута правильна гіпотеза

Число ступенів свободи df визначається як число груп у ряді розподілу мінус число зв'язків: df = k -z. Під числом зв'язків розуміється число показників емпіричного низки, використаних під час обчислення теоретичних частот, тобто. показників, що пов'язують емпіричні та теоретичні частоти. Наприклад, при вирівнюванні по кривій нормального розподілу є три зв'язки. Тому при вирівнюванні по кривою нормального розподілучисло ступенів свободи визначається як df = k-3. Для оцінки суттєвості розрахункове значення порівнюється з табличним χ 2 табл.

При повному збігу теоретичного та емпіричного розподілів χ 2 =0, інакше χ 2 >0. Якщо χ 2 розрахунків > χ 2 табл, то при заданому рівні значущості та числі ступенів свободи гіпотезу про несуттєвість (випадковості) розбіжностей відхиляємо. У разі, якщо χ 2 розрах.< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсянормальному розподілу. Критерій згоди Пірсона використовується, якщо обсяг сукупності досить великий (N>50), причому частота кожної групи повинна бути не менше 5.

Критерій згоди Колмогоровазаснований на визначенні максимальної розбіжності між накопиченими емпіричними та теоретичними частотами:

де D і d – відповідно, максимальна різниця між накопиченими частотами та накопиченими частостями емпіричного та теоретичного розподілів. По таблиці розподілу статистики Колмогорова визначають ймовірність, що може змінюватися від 0 до 1. При Р(λ)=1- відбувається повний збіг частот, Р(λ)=0 – повне розбіжність. Якщо величина ймовірності Р значна стосовно знайденої величини λ, можна припустити, що розбіжності між теоретичним і емпіричним розподілами несуттєві, т. е. носять випадковий характер. Основна умова використання критерію Колмогорова досить велика кількість спостережень.

Критерій згоди Колмогорова

Розглянемо як критерій Колмогорова (λ) застосовується при перевірці гіпотези про нормальний розподілгенеральної сукупності. Вирівнювання фактичного розподілу по кривій нормального розподілу складається з кількох етапів:

    Порівнюють фактичні та теоретичні частоти.

    За фактичними даними визначають теоретичні частоти кривої нормального розподілу, що є функцією нормованого відхилення.

    Перевіряють, наскільки розподіл ознаки відповідає нормальному.

Для IV колонки таблиці:

У MS Excel нормований відхилення (t) розраховується за допомогою функції НОРМАЛІЗАЦІЯ. Необхідно виділити діапазон вільних осередків за кількістю варіантів (рядок електронної таблиці). Не знімаючи виділення, викликати функцію НОРМАЛІЗАЦІЯ. У діалоговому вікні, що з'явилося, вказати наступні осередки, в яких розміщені, відповідно, спостерігаються значення (X i), середня (X) і середньоквадратичне відхилення Ϭ. Операцію обов'язково завершити одночаснимнатисканням клавіш Ctrl+Shift+Enter

Для V колонки таблиці:

Функцію густини ймовірності нормального розподілу φ(t) знаходимо за таблицею значень локальної функції Лапласа для відповідного значення нормованого відхилення (t)

Для VI колонки таблиці:

Критерій згоди Колмогорова (λ)визначається шляхом поділу модуля max різниціміж емпіричними та теоретичними кумулятивними частотами на корінь квадратний з числа спостережень:

За спеціальною таблицею ймовірності для критерію згоди λ визначаємо, що значення λ=0,59 відповідає ймовірність 0,88 (λ

Розподіл емпіричних та теоретичних частот, щільності ймовірності теоретичного розподілу

Застосовуючи критерії згоди для перевірки відповідності емпіричного розподілу теоретичному, слід розрізняти перевірку простих і складних гіпотез.

Одновибірковий критерій нормальності Колмогорова-Смирнова заснований на максимумі різниціміж кумулятивним емпіричним розподілом вибірки та передбачуваним (теоретичним) кумулятивним розподілом. Якщо D статистика Колмогорова-Смирнова значуща, то гіпотеза у тому, що відповідний розподіл нормально, має бути відкинуто.