Razılıq meyarlarından istifadə. Qəbul meyarı Alınan materialla nə edəcəyik

Razılaşma meyarları (uyğunluq)

Empirik paylanmanın nəzəri paylanma qanununa uyğunluğu haqqında fərziyyəni yoxlamaq üçün xüsusi statistik göstəricilərdən - uyğunluq meyarlarından (və ya uyğunluq meyarlarından) istifadə olunur. Bunlara Pearson, Kolmoqorov, Romanovski, Yastremski və s. meyarları aid etmək olar.Uyğunluq meyarlarının çoxu empirik tezliklərin nəzəri tezliklərdən kənara çıxmalarının istifadəsinə əsaslanır. Aydındır ki, bu sapmalar nə qədər kiçik olsa, nəzəri paylanma empirik ilə bir o qədər yaxşı uyğunlaşır (və ya təsvir edir).

Razılıq meyarları - bunlar empirik paylanmanın nəzəri ehtimal paylanmasına uyğunluğu haqqında fərziyyələri yoxlamaq üçün meyarlardır. Belə meyarlar iki sinfə bölünür: ümumi və xüsusi. Ümumi uyğunluq meyarları bir fərziyyənin ən ümumi formalaşdırılmasına, yəni müşahidə nəticələrinin hər hansı aprior ehtimal paylanması ilə uyğun olduğu fərziyyəsinə tətbiq edilir. Xüsusi uyğunluq testləri ehtimal paylanmasının müəyyən forması ilə razılığı formalaşdıran xüsusi sıfır fərziyyələri nəzərdə tutur.

Müəyyən edilmiş paylama qanununa əsaslanan uyğunluğun yaxşılığı meyarları nəzəri və empirik tezliklər arasındakı uyğunsuzluğun nə vaxt əhəmiyyətsiz (təsadüfi) və nə vaxt əhəmiyyətli (təsadüfi olmayan) kimi tanınmalı olduğunu müəyyən etməyə imkan verir. Buradan belə nəticə çıxır ki, uyğunluq meyarları empirik sıralarda paylanmanın təbiəti haqqında silsilələri bərabərləşdirərkən irəli sürülən fərziyyənin düzgünlüyünü rədd etməyə və ya təsdiq etməyə imkan verir. verilmiş empirik paylanma üçün bəzi nəzəri paylanma qanunu ilə ifadə edilən model.

Pirsonun x2 (xi-kvadrat) uyğunluq yaxşılığı testi əsas uyğunluq meyarlarından biridir. İngilis riyaziyyatçısı Karl Pearson (1857-1936) tərəfindən empirik və nəzəri paylanmaların tezlikləri arasındakı uyğunsuzluqların təsadüfiliyini (əhəmiyyətini) qiymətləndirmək üçün təklif edilmişdir:

harada k- empirik paylanmanın bölündüyü qrupların sayı; fi-əlamətin empirik tezliyi i-ci qrup; / ts °р - əlamətin nəzəri tezliyi i-ci qrup.

Kriteriyaların tətbiqi sxemi y) nəzəri və empirik paylanmaların ardıcıllığını qiymətləndirmək üçün aşağıdakılara endirilir.

  • 1. Hesablanmış uyğunsuzluq ölçüsü % 2 nisbətində müəyyən edilir.
  • 2. Sərbəstlik dərəcələrinin sayı müəyyən edilir.
  • 3. Sərbəstlik dərəcələrinin sayına görə v xüsusi cədvəldən istifadə etməklə %^bl müəyyən edilir
  • 4. Əgər % 2 asch >x 2 abl olarsa, onda verilmiş əhəmiyyət səviyyəsi a və sərbəstlik dərəcələrinin sayı v üçün uyğunsuzluqların əhəmiyyətsizliyi (təsadüfiliyi) fərziyyəsi rədd edilir. Əks halda, fərziyyənin əldə edilmiş eksperimental məlumatlara zidd olmadığı qəbul edilə bilər və ehtimalla (1 - a) nəzəri və empirik tezliklər arasındakı uyğunsuzluqların təsadüfi olduğunu iddia etmək olar.

Əhəmiyyət səviyyəsi - irəli sürülən fərziyyənin səhvən rədd edilməsi ehtimalıdır, yəni. düzgün fərziyyənin rədd edilməsi ehtimalı. Statistik tədqiqatlarda həll olunan vəzifələrin əhəmiyyətindən və məsuliyyətindən asılı olaraq aşağıdakı üç əhəmiyyət səviyyəsindən istifadə olunur:

  • 1) a = 0,1, onda P = 0,9;
  • 2) a = 0,05, onda P = 0,95;
  • 3) a = 0,01, onda P = 0,99.

Uyğunluqdan istifadə y), aşağıdakı şərtlərə əməl edilməlidir.

  • 1. Öyrənilən əhalinin həcmi şərti ödəməlidir n> 50, qrupun tezliyi və ya ölçüsü ən azı 5 olmalıdır. Bu şərt pozulubsa, əvvəlcə kiçik tezlikləri birləşdirməlisiniz (5-dən az).
  • 2. Empirik paylanma təsadüfi seçim nəticəsində əldə edilən məlumatlardan ibarət olmalıdır, yəni. müstəqil olmalıdırlar.

Pearson-un uyğunluq meyarının dezavantajı müşahidənin nəticələrini intervallarda qruplaşdırmaq və ayrı-ayrı intervalları az sayda müşahidələrlə birləşdirmək zərurəti ilə bağlı ilkin məlumatların bir hissəsinin itirilməsidir. Bununla əlaqədar olaraq, meyarlara uyğun olaraq paylanmaların uyğunluğunun yoxlanılmasının əlavə edilməsi tövsiyə olunur. y) digər meyarlar. Bu xüsusilə nümunə ölçüsü olduqda doğrudur P ~ 100.

Statistikada iki empirik paylanmanın eyni qanuna tabe olub-olmadığını müəyyən etmək və ya nəticədə yaranan paylanmanın fərz edilən modelə tabe olub-olmadığını müəyyən etmək üçün Kolmoqorov uyğunluğu testi (həmçinin Kolmoqorov-Smirnov uyğunluğu testi kimi də tanınır) istifadə olunur. . Kolmoqorov meyarı yığılmış tezliklər və ya empirik və ya nəzəri paylanmaların tezlikləri arasında maksimum fərqin müəyyən edilməsinə əsaslanır. Kolmoqorov meyarı aşağıdakı düsturlara əsasən hesablanır:

harada Dd- müvafiq olaraq, yığılmış tezliklər (/-/") və yığılmış tezliklər arasındakı maksimum fərq ( rr") paylanmaların empirik və nəzəri sıraları; N-əhalidəki vahidlərin sayı.

Dəyəri hesabladıqdan sonra x, xüsusi cədvəl empirik tezliklərin nəzəri tezliklərdən sapmalarının təsadüfi olduğunu iddia etmək ehtimalını müəyyən edir. İşarə 0,3-ə qədər qiymət alırsa, bu, tezliklərin tam üst-üstə düşməsi deməkdir. Çox sayda müşahidə ilə Kolmogorov testi fərziyyədən hər hansı bir sapma aşkar etməyə qadirdir. Bu o deməkdir ki, çoxlu müşahidələr olarsa, nümunə paylanmasında nəzəri olandan hər hansı bir fərq onun köməyi ilə aşkar ediləcəkdir. Bu xüsusiyyətin praktik əhəmiyyəti əhəmiyyətsizdir, çünki əksər hallarda sabit şəraitdə çox sayda müşahidə əldə etməyə ümid etmək çətindir, nümunənin tabe olmalı olduğu paylama qanununun nəzəri fikri həmişə təxminidir və statistik yoxlamaların düzgünlüyü seçilmiş modelin düzgünlüyündən artıq olmamalıdır.

Romanovskinin uyğunluq testi Pearson testinin istifadəsinə əsaslanır, yəni. artıq tapılmış dəyərlər x 2 > və sərbəstlik dərəcələrinin sayı:

burada v variasiya azadlığı dərəcələrinin sayıdır.

Romanovski meyarı x 2 üçün cədvəllər olmadıqda rahatdır. Əgər a K rÜÇÜN? > 3 olarsa, onlar təsadüfi deyil və nəzəri paylanma tədqiq olunan empirik paylanma üçün model rolunu oynaya bilməz.

B. S. Yastremski razılaşma meyarında sərbəstlik dərəcələrinin sayından deyil, qrupların sayından ( k), qrupların sayından asılı olaraq xüsusi dəyər 0 və xi-kvadrat dəyəri. Yastremskinin razılıq meyarı Romanovskinin meyarı ilə eyni məna daşıyır və düsturla ifadə edilir.

burada x 2 - Pirsonun razılaşma meyarı; /e gr - qrupların sayı; 0 - əmsal, 20-dən az qrupların sayı üçün 0,6-ya bərabərdir.

1f akt > 3 olarsa, nəzəri və empirik paylanmalar arasındakı uyğunsuzluqlar təsadüfi deyil, yəni. empirik paylanma normal paylanmanın tələblərinə cavab vermir. 1f hərəkət edərsə

UKRAYNA TƏHSİL VƏ ELM NAZİRLİYİ

AZOV RAYONAL İDARƏETMƏ İNSTİTUTU

ZAPORİJİYA MİLLİ TEXNIK UNİVERSİTETİ

Riyaziyyat kafedrası

KURS İŞİ

H intizamı "STATİSTİKA"

Mövzuda: "RAZILIQ MEYARLARI"

2-ci kurs tələbələri

Qrup 207 İdarəetmə Fakültəsi

Batura Tatyana Oleqovna

elmi məsləhətçi

Dosent Kosenkov O.İ.

Berdyansk - 2009


GİRİŞ

1.2 Sadə bir fərziyyə üçün Pearson χ 2 uyğunluq yaxşılığı

1.3 Mürəkkəb fərziyyə üçün uyğunluq

1.4 Mürəkkəb fərziyyə üçün Fişerin χ 2 uyğunluq testi

1.5 Digər razılıq meyarları. Poisson paylanması üçün uyğunluq

BÖLMƏ II. RAZILIQ MEYARININ PRAKTİKİ TƏTBİQİ

TƏTBİQLƏR

İSTİFADƏ OLUNAN ƏDƏBİYYAT SİYAHISI


GİRİŞ

Bu kurs işi uyğunluq meyarlarının ən ümumi yaxşılığını təsvir edir - omeqa-kvadrat, ki-kvadrat, Kolmogorov və Kolmogorov-Smirnov. Verilənlərin paylanmasının bəzi parametrik ailəyə, məsələn, normala aid olub-olmadığını yoxlamaq lazım olduğu halda xüsusi diqqət yetirilir. Təcrübədə çox rast gəlinən bu vəziyyət mürəkkəbliyinə görə tam öyrənilməmiş, tədris-məlumat ədəbiyyatında tam əksini tapmamışdır.

Uyğunluq meyarları eksperimental məlumatlar ilə nəzəri model arasında uyğunluğu yoxlamaq üçün nəzərdə tutulmuş statistik testlər adlanır. Müşahidələr təsadüfi bir nümunəni təmsil edərsə, bu sual ən yaxşı şəkildə tərtib edilir. Bu halda nəzəri model paylama qanununu təsvir edir.

Nəzəri paylanma təsadüfi seçimi idarə edən ehtimal paylanmasıdır. Bu barədə təkcə nəzəriyyə fikir verə bilməz. Ənənə, keçmiş təcrübə və əvvəlki müşahidələr burada bilik mənbəyi ola bilər. Yalnız vurğulamalıyıq ki, bu paylama, onu yoxlayacağımız məlumatdan asılı olmayaraq seçilməlidir. Başqa sözlə, əvvəlcə müəyyən bir paylama qanununu nümunəyə “uyğunlaşdırmaq”, sonra isə eyni nümunə üçün alınan qanunla razılığı yoxlamağa çalışmaq yolverilməzdir.

Sadə və mürəkkəb fərziyyələr. Verilmiş nümunənin elementlərinin hipotetik şəkildə əməl etməli olduğu paylanmanın nəzəri qanunu haqqında danışarkən, bu qanunla bağlı sadə və mürəkkəb fərziyyələri ayırd etməliyik:

Sadə bir fərziyyə birbaşa müəyyən bir xüsusi ehtimal qanununu (ehtimal bölgüsü) göstərir ki, buna uyğun olaraq nümunə dəyərləri yaranır;

Mürəkkəb bir fərziyyə tək bir paylanmanı və bəzilərini (məsələn, parametrik ailəni) göstərir.

Uyğunluq meyarları təhlil edilən empirik paylanma ilə ümumi populyasiyada xüsusiyyətin paylanma funksiyası arasında müxtəlif məsafə ölçülərinin istifadəsinə əsaslanır.

Razılaşmanın qeyri-parametrik testləri Kolmogorov, Smirnov, omega kvadrat geniş istifadə olunur. Bununla belə, onlar statistik metodların tətbiqində geniş yayılmış səhvlərlə də əlaqələndirilir.

Məsələ burasındadır ki, sadalanan meyarlar razılaşmanı tam məlum nəzəri bölgü ilə sınaqdan keçirmək üçün hazırlanmışdır. Hesablama düsturları, paylanma cədvəlləri və kritik dəyərlər geniş istifadə olunur. Kolmogorov, omega kvadrat və oxşar meyarların əsas ideyası empirik paylanma funksiyası ilə nəzəri paylama funksiyası arasındakı məsafəni ölçməkdir. Bu meyarlar paylanma funksiyaları məkanında məsafələr şəklində fərqlənir.

Bu kurs işinə başlayarkən qarşıma məqsəd qoymuşam ki, hansı razılıq meyarlarının mövcud olduğunu öyrənim, onların nə üçün lazım olduğunu başa düşüm. Bu məqsədə çatmaq üçün aşağıdakı vəzifələri yerinə yetirməlisiniz:

1. “Razılıq meyarları” anlayışının mahiyyətini açmaq;

2. Hansı razılıq meyarlarının mövcud olduğunu müəyyənləşdirin, onları ayrıca öyrənin;

3. Görülən işlərdən nəticə çıxarın.


BÖLMƏ I. RAZILIQ MEYARININ NƏZƏRİ ƏSASLANMASI

1.1 Kolmoqorovun uyğunluq meyarları və sadə fərziyyə halında omeqa-kvadrat

Sadə fərziyyə. Ölçülmüş məlumatların ədədlər, başqa sözlə, bir ölçülü təsadüfi dəyişənlər olduğu bir vəziyyəti nəzərdən keçirək. Birölçülü təsadüfi dəyişənlərin paylanması onların paylanma funksiyalarını göstərməklə tam təsvir edilə bilər. Və bir çox uyğunluq testləri nəzəri və empirik (nümunə) paylanma funksiyalarının yaxınlığının yoxlanılmasına əsaslanır.

Tutaq ki, bizdə n nümunəsi var. Müşahidələrin tabe olduğu həqiqi paylanma funksiyasını G(x), empirik (nümunə) paylanma funksiyasını - F n (x) və hipotetik paylanma funksiyasını - F(x) işarə edək. Onda həqiqi paylanma funksiyasının F(x) olması H hipotezi H kimi yazılır: G(·) = F(·).

H hipotezini necə yoxlamaq olar? H doğrudursa, F n və F müəyyən oxşarlıq göstərməli və n artdıqca aralarındakı fərq azalmalıdır. Bernulli teoreminə görə F n (x) → F(x) n → ∞ kimi. F n və F funksiyalarının oxşarlığını kəmiyyətcə müəyyən etmək üçün müxtəlif üsullardan istifadə olunur.

Funksiyaların oxşarlığını ifadə etmək üçün bu funksiyalar arasında bu və ya digər məsafədən istifadə etmək olar. Məsələn, vahid metrikdə F n və F-ni müqayisə etmək olar, yəni. dəyəri nəzərə alın:

(1.1)

D n statistikası Kolmoqorov statistikası adlanır.

Aydındır ki, D n təsadüfi dəyişəndir, çünki onun dəyəri təsadüfi F n obyektindən asılıdır. Əgər H 0 fərziyyəsi doğrudursa və n → ∞ olarsa, istənilən x üçün F n (x) → F(x) olur. Ona görə də təbiidir ki, bu şərtlərdə D n → 0. Əgər H 0 hipotezi yanlışdırsa, onda F n → G və G ≠ F və buna görə də -∞

Həmişə olduğu kimi, bir fərziyyəni sınaqdan keçirərkən, fərziyyənin doğru olduğunu düşünürük. Təcrübədə əldə edilən D n statistikasının dəyəri ağlasığmaz dərəcədə böyük görünsə, H 0-dan imtina edilməli olduğu aydındır. Lakin bunun üçün D n statistikasının H hipotezi altında necə paylandığını bilmək lazımdır: verilmiş n və G üçün F= G.

D n-nin diqqətəlayiq xüsusiyyəti ondan ibarətdir ki, əgər G = F olarsa, yəni. hipotetik paylanma düzgün göstərilibsə, onda D n statistikasının paylanma qanunu bütün fasiləsiz G funksiyaları üçün eyni olur. Bu, yalnız n seçmə ölçüsündən asılıdır.

Bu faktın sübutu ona əsaslanır ki, x oxunun monoton çevrilmələri zamanı statistika öz qiymətini dəyişməz. Belə bir çevrilmə ilə istənilən davamlı paylanma G interval üzrə vahid paylanmaya çevrilə bilər. Bu halda, F n (x) bu vahid paylanmadan nümunənin paylanma funksiyasına keçəcəkdir.

Kiçik n üçün, H 0 hipotezi altında D n statistikası üçün faiz bəndləri cədvəlləri tərtib edilir. Böyük n üçün D n paylanması (H 0 hipotezi ilə) A.N.Kolmoqorovun 1933-cü ildə tapdığı limit teoremi ilə göstərilir. O, statistikadan danışır

(H 0-da dəyərin özü D n → 0 olduğundan, paylanmanın sabitləşməsi üçün onu sonsuz artan qiymətə vurmaq lazımdır). Kolmoqorovun teoremində deyilir ki, əgər H 0 doğrudursa və G davamlıdırsa:
(1.2)

Bu məbləği Maple-da hesablamaq çox asandır. Sadə H 0 hipotezini yoxlamaq üçün: G = F ilkin nümunədən D n statistikasının qiymətini hesablamaq tələb olunur. Bunun üçün sadə bir formula işləyir:

(1.3)

Burada, x k vasitəsilə - orijinal nümunədən qurulmuş variasiya seriyasının elementləri. Alınan dəyər D n sonra cədvəllərdən çıxarılan kritik dəyərlərlə müqayisə edilməli və ya asimptotik düsturla hesablanmalıdır. Təcrübədə alınan D n dəyəri qəbul edilmiş əhəmiyyət səviyyəsinə uyğun gələn seçilmiş kritik qiymətdən artıq olarsa, H 0 hipotezi (seçilmiş əhəmiyyət səviyyəsində) rədd edilməlidir.

Uyğunluğun digər məşhur yaxşılığı inteqral metrikdə F n və F arasındakı məsafəni ölçməklə əldə edilir. Omeqa-kvadrat adlanan statistikaya əsaslanır:

(1.4)

Onu real məlumatlardan hesablamaq üçün düsturdan istifadə edə bilərsiniz:

(1.5)

H 0 fərziyyəsi doğrudursa və G funksiyası davamlıdırsa, omeqa-kvadrat statistikasının paylanması, eynilə D n statistikasının paylanması kimi, yalnız n-dən asılıdır və G-dən asılı deyildir.

Eynilə D n üçün olduğu kimi

kiçik n üçün faiz bəndləri cədvəlləri mövcuddur və böyük n dəyərləri üçün statistik n-nin məhdudlaşdırıcı (n → ∞ kimi) paylanmasından istifadə edilməlidir. Burada yenə sonsuz artan bir əmsala vurmalıyıq. Məhdud paylama 1939-cu ildə N.V.Smirnov tərəfindən tapılmışdır.Bunun üçün ətraflı cədvəllər və hesablama proqramları tərtib edilmişdir. D n və -ə əsaslanan meyarların mühüm nəzəri xüsusiyyəti: onlar istənilən alternativ G ≠ F-ə qarşı etibarlıdır.

Müəyyən bir paylanmanın təbiəti ilə bağlı bütün fərziyyələr fərziyyə olduğundan, onlar statistik yoxlamaya məruz qalmalıdırlar. razılıq meyarları nəzəri və empirik tezliklər arasındakı uyğunsuzluğun nə vaxt əhəmiyyətsiz olduğunu müəyyən etməyə imkan verən, yəni. təsadüfi, və zaman - əhəmiyyətli (qeyri-təsadüfi). Beləliklə, uyğunluq meyarları empirik sıralarda paylanmanın təbiəti haqqında silsilələri bərabərləşdirərkən irəli sürülən fərziyyənin düzgünlüyünü rədd etməyə və ya təsdiq etməyə imkan verir.

Bir sıra razılıq meyarları var. Pearson, Romanovski və Kolmoqorov meyarlarından daha çox istifadə olunur.

Pearson uyğunluq testi - əsaslardan biridir

burada k empirik paylanmanın bölündüyü qrupların sayıdır,
i-ci qrupda əlamətin müşahidə olunan tezliyidir,
nəzəri tezlikdir.
Bölüşdürmə üçün cədvəllər tərtib edilmişdir, burada uyğunluq meyarının kritik dəyəri seçilmiş əhəmiyyətlilik səviyyəsi və sərbəstlik dərəcələri (və ya ) üçün göstərilmişdir.
Əhəmiyyət səviyyəsi irəli sürülən fərziyyənin səhvən rədd edilməsi ehtimalıdır, yəni. düzgün fərziyyənin rədd edilməsi ehtimalı. Statistikada üç səviyyədən istifadə olunur:

  • a= 0,10, onda Р=0,90 (100-dən 10 halda düzgün fərziyyə rədd edilə bilər);
  • a=0,05, onda P=0,95;
  • a=0,01, onda P=0,99.

Sərbəstlik dərəcələrinin sayı df paylama seriyasındakı qrupların sayından istiqrazların sayı çıxılmaqla müəyyən edilir: df = k –z. Əlaqələrin sayı nəzəri tezliklərin hesablanmasında istifadə olunan empirik sıraların göstəricilərinin sayı kimi başa düşülür, yəni. empirik və nəzəri tezlikləri birləşdirən göstəricilər.
Məsələn, normal paylanma əyrisi ilə uyğunlaşdırıldıqda, üç əlaqə var:
; ; .
Buna görə də, normal paylanma əyrisi boyunca nivelirləmə zamanı sərbəstlik dərəcələrinin sayı df = k –3 kimi müəyyən edilir.
Əhəmiyyətliliyi qiymətləndirmək üçün hesablanmış dəyər cədvəl dəyəri ilə müqayisə edilir.
Nəzəri və empirik paylanmaların tam üst-üstə düşməsi ilə, əks halda >0. Əgər > olarsa, onda verilmiş əhəmiyyət səviyyəsi və sərbəstlik dərəcələrinin sayı üçün uyğunsuzluqların əhəmiyyətsizliyi (təsadüfiliyi) fərziyyəsini rədd edirik.
Əgər , belə nəticəyə gəlirik ki, empirik sıra gözlənilən paylanma fərziyyəsi ilə yaxşı uyğunlaşır və R=(1-a) ehtimalı ilə nəzəri və empirik tezliklər arasındakı uyğunsuzluğun təsadüfi olduğunu iddia etmək olar.
Populyasiyanın ölçüsü kifayət qədər böyükdürsə və hər bir qrupun tezliyi ən azı 5 olmalıdırsa, Pearson uyğunluq testindən istifadə olunur.

Romanovskinin kriteriyası ilə Pearson meyarının istifadəsinə əsaslanaraq, yəni. artıq tapılmış dəyərlər və sərbəstlik dərəcələrinin sayı df:

üçün masalar olmadıqda faydalıdır.
Əgər ilə<3, то расхождения распределений случайны, если же с>3, onda onlar təsadüfi deyil və nəzəri paylanma tədqiq olunan empirik paylanma üçün model kimi xidmət edə bilməz.

Kolmoqorovun meyarı l toplanmış tezliklər ilə empirik və nəzəri paylanmaların tezlikləri arasında maksimum uyğunsuzluğun müəyyən edilməsinə əsaslanır:
və ya ,
burada D və d müvafiq olaraq toplanmış tezliklər ilə empirik və nəzəri paylanma sıralarının yığılmış tezlikləri arasında maksimum fərqdir;
N əhali vahidlərinin sayıdır.
l-in qiymətini hesablayaraq, P(l) cədvəli empirik tezliklərin nəzəri tezliklərdən sapmalarının təsadüfi olduğunu iddia etmək ehtimalını müəyyən edir. Ehtimal Р(l) 0-dan 1-ə qədər dəyişə bilər. Р(l)=1 olduqda tezliklərin tam üst-üstə düşməsi, Р(l)=0 – tam uyğunsuzluq var. l 0,3-ə qədər olan dəyərləri qəbul edərsə, P(l)=1.
Kolmogorov meyarından istifadənin əsas şərti kifayət qədər çox sayda müşahidədir.

Bu bölmədə biz fərziyyələrin ehtimalının yoxlanılması ilə bağlı məsələlərdən birini, yəni nəzəri və statistik paylanmalar arasında uyğunluq məsələsini nəzərdən keçirəcəyik.

Fərz edək ki, verilmiş statistik paylanma hansısa nəzəri əyridən istifadə etməklə bərabərləşdirilir f(x)(Şəkil 7.6.1). Nəzəri əyri nə qədər düzgün seçilsə də, onunla statistik paylanma arasında bəzi uyğunsuzluqlar qaçılmazdır. Təbii ki, belə bir sual yaranır: bu uyğunsuzluqlar yalnız məhdud sayda müşahidələrlə əlaqəli təsadüfi hallarla bağlıdır, yoxsa əhəmiyyətlidir və seçdiyimiz əyrinin bu statistik bölgüdən zəif səviyyədə olması ilə bağlıdır. Bu suala cavab vermək üçün sözdə "razılıq meyarları" istifadə olunur.

Təsadüfi DƏYƏNİŞLƏRİN BÖLÜMƏSİ QANUNLARI



Uyğunluq meyarlarının tətbiqi ideyası aşağıdakı kimidir.

Bu statistik materiala əsaslanaraq, fərziyyəni sınaqdan keçirməliyik H, təsadüfi dəyişən olmasından ibarətdir X müəyyən paylama qanununa tabe olur. Bu qanun bu və ya digər formada verilə bilər: məsələn, paylama funksiyası şəklində F(x) və ya paylanma sıxlığı şəklində f(x), və ya ehtimallar toplusu şəklində p t, harada pt- dəyərinin olması ehtimalı X içərisinə düşəcək bir şey boşalma.

Çünki bunlardan paylama funksiyası əmələ gəlir F(x)ən ümumidir və hər hansı digərini müəyyən edir, biz fərziyyəni formalaşdıracağıq H, dəyərinin olmasından ibarət olduğu kimi X paylanma funksiyasına malikdir ^(d:).

Bir hipotezi qəbul etmək və ya rədd etmək H, müəyyən miqdarda nəzərə alın sən, nəzəri və statistik bölgülər arasında uyğunsuzluq dərəcəsini xarakterizə edən. Dəyər U müxtəlif yollarla seçilə bilər; məsələn, kimi U nəzəri ehtimalların kvadratik kənarlaşmalarının cəmini götürmək olar pt müvafiq tezliklərdən R* və ya bəzi əmsalları olan eyni kvadratların cəmi (“çəkilər”) və ya statistik paylanma funksiyasının maksimum sapması F*(x) nəzəri cəhətdən F(x) və s. tutaq ki, kəmiyyət U bu və ya digər şəkildə seçilir. Aydındır ki, bəziləri var təsadüfi dəyər. Bu təsadüfi kəmənin paylanma qanunu təsadüfi dəyişənin paylanma qanunundan asılıdır x, hansı təcrübələrin aparıldığı və təcrübələrin sayından P.Əgər fərziyyə varsa H doğrudur, onda kəmiyyətin paylanma qanunu U kəmiyyətin paylanma qanunu ilə müəyyən edilir X(funksiya F(x)) və nömrə P.

Tutaq ki, bu paylama qanunu bizə məlumdur. Bu silsilə təcrübələr nəticəsində məlum oldu ki, bizim seçdiyimiz ölçü



RAZILIQ MEYARLARI


uyğunsuzluqlar U müəyyən dəyər qazandı a. Sual budur ki, bunu təsadüfi səbəblərlə izah etmək olarmı, yoxsa bu uyğunsuzluq çox böyükdür və nəzəri və statistik paylanmalar arasında əhəmiyyətli fərqin mövcudluğunu və deməli, fərziyyənin uyğunsuzluğunu göstərirmi? H? Bu suala cavab vermək üçün fərziyyənin olduğunu düşünək H düzgündür və bu fərziyyə altında qeyri-kafi miqdarda eksperimental materialla əlaqəli təsadüfi səbəblərə görə uyğunsuzluq ölçüsünün olması ehtimalını hesablayırıq. U təcrübədə müşahidə etdiyimiz dəyərdən az olmayacaq və, yəni hadisənin baş vermə ehtimalını hesablayırıq:

Əgər bu ehtimal çox kiçikdirsə, o zaman fərziyyə Hçox inandırıcı olmadığı üçün rədd edilməlidir; bu ehtimal əhəmiyyətlidirsə, təcrübi məlumatların fərziyyə ilə ziddiyyət təşkil etmədiyini qəbul etmək lazımdır. N.

Sual yaranır ki, uyğunsuzluq ölçüsü £/ hansı şəkildə seçilməlidir? Belə çıxır ki, onu seçmək üçün bəzi yollar üçün kəmiyyətin paylanması qanunu Uçox sadə xüsusiyyətlərə malikdir və kifayət qədər böyükdür P funksiyasından praktiki olaraq müstəqildir F(x). Riyazi statistikada razılıq meyarı kimi məhz belə uyğunsuzluq ölçüləri istifadə olunur.

Ən çox istifadə olunan razılaşma meyarlarından birini - sözdə "meyar"ı nəzərdən keçirək. at?" Pearson.

Fərz edək ki, hər birində təsadüfi dəyişən olan müstəqil təcrübələr var X müəyyən qiymət aldı. Təcrübələrin nəticələri ümumiləşdirilir k rəqəmlərdir və statistik sıra şəklində təqdim olunur.

Nəzəri və empirik tezliklər. Normal paylanma üçün test

Variasiya paylama sıralarını təhlil edərkən necə olması böyük əhəmiyyət kəsb edir empirik paylanma işarəsi uyğun gəlir normal. Bunun üçün faktiki paylanmanın tezlikləri normal paylanma üçün xarakterik olan nəzəri tezliklərlə müqayisə edilməlidir. Bu o deməkdir ki, normallaşdırılmış kənarlaşmaların funksiyası olan normal paylanma əyrisinin nəzəri tezliklərini faktiki məlumatlardan hesablamaq lazımdır.

Başqa sözlə, empirik paylanma əyrisi normal paylanma əyrisi ilə uyğunlaşdırılmalıdır.

Uyğunluğun obyektiv xarakteristikası nəzəriempirik tezliklər adlanan xüsusi statistik göstəricilərdən istifadə etməklə əldə edilə bilər razılıq meyarları.

Uyğunluq meyarı uyğunsuzluğun olub olmadığını müəyyən etməyə imkan verən meyar adlanır empiriknəzəri təsadüfi və ya əhəmiyyətli paylanmalar, yəni müşahidə məlumatlarının irəli sürülən statistik fərziyyə ilə uyğun olub-olmaması. İrəli sürülən fərziyyəyə görə malik olduğu ümumi əhalinin bölgüsü nəzəri adlanır.

Qurulmağa ehtiyac var meyar empirik və nəzəri paylanmalar arasındakı uyğunsuzluğun təsadüfi və ya əhəmiyyətli olub olmadığını mühakimə etməyə imkan verən (qayda). Əgər uyğunsuzluq varsa təsadüfi, onda hesab edirlər ki, müşahidə məlumatları (nümunə) ümumi əhalinin paylanması qanunu haqqında irəli sürülən fərziyyə ilə uyğundur və buna görə də fərziyyə qəbul edilir; uyğunsuzluq olarsa əhəmiyyətli, onda müşahidə məlumatları fərziyyə ilə razılaşmır və onu rədd edir.

Adətən empirik və nəzəri tezliklər ona görə fərqlənir:

    uyğunsuzluq təsadüfi və məhdud sayda müşahidə ilə bağlıdır;

    Uyğunsuzluq təsadüfi deyil və ümumi əhalinin normal paylanmasına dair statistik fərziyyənin səhv olması ilə izah olunur.

Bu minvalla, razılıq meyarları empirik silsilədə paylanmanın xarakteri haqqında silsilələri bərabərləşdirərkən irəli sürülən fərziyyəni rədd etməyə və ya düzgünlüyünü təsdiq etməyə imkan verir.

Empirik Tezliklər müşahidə nəticəsində əldə edilmişdir. Nəzəri tezliklər düsturlarla hesablanır.

üçün normal paylanma qanunu onları belə tapmaq olar:

    Σƒ i- yığılmış (kumulyativ) empirik tezliklərin cəmi

    h - iki bitişik seçim arasındakı fərq

    σ - nümunə standart kənarlaşma

    t-normallaşdırılmış (standartlaşdırılmış) kənarlaşma

    φ(t) normal paylanmanın ehtimal sıxlığı funksiyasıdır (t-nin müvafiq dəyəri üçün yerli Laplas funksiyasının qiymətlər cədvəlindən tapın)

Bir neçə uyğunluq testi var, bunlardan ən çox yayılmışları bunlardır: xi-kvadrat (Pirson) testi, Kolmoqorov testi, Romanovski testi.

Pearson uyğunluq testi χ 2 - nəzəri (f Т) və empirik (f) tezliklər arasındakı kvadrat fərqlərin nəzəri tezliklərə nisbətlərinin cəmi kimi təqdim edilə bilən əsaslardan biri:

    k - empirik paylanmanın bölündüyü qrupların sayı,

    f i - i-ci qrupda əlamətin müşahidə olunan tezliyi,

    f T nəzəri tezlikdir.

χ paylanması üçün seçilmiş α əhəmiyyət səviyyəsi və df (və ya ν) sərbəstlik dərəcələri üçün uyğunluq meyarının χ 2 kritik dəyərini göstərən 2 cədvəl tərtib edilmişdir. Əhəmiyyət səviyyəsi α irəli sürülən fərziyyənin səhvən rədd edilməsi ehtimalıdır, yəni. düzgün fərziyyənin rədd edilməsi ehtimalı. R - statistik etibarlılıq düzgün fərziyyəni qəbul etmək. Statistikada ən çox üç əhəmiyyətlilik səviyyəsindən istifadə olunur:

α=0,10, sonra P=0,90 (100-dən 10-da)

α=0,05, onda R=0,95 (100-dən 5 halda)

α=0,01, onda P=0,99 (100-dən 1 halda) düzgün hipotezi rədd etmək olar

Sərbəstlik dərəcələrinin sayı df paylama seriyasındakı qrupların sayından istiqrazların sayı çıxılmaqla müəyyən edilir: df = k –z. Əlaqələrin sayı nəzəri tezliklərin hesablanmasında istifadə olunan empirik sıraların göstəricilərinin sayı kimi başa düşülür, yəni. empirik və nəzəri tezlikləri birləşdirən göstəricilər. Məsələn, zəng əyrisi düzülüşündə üç əlaqə var. Buna görə də, hizalanarkən zəng əyrisi sərbəstlik dərəcələrinin sayı df =k–3 kimi müəyyən edilir. Əhəmiyyətliliyi qiymətləndirmək üçün hesablanmış dəyər χ 2 cədvəli ilə müqayisə edilir

Nəzəri və empirik paylanmaların tam üst-üstə düşməsi ilə χ 2 =0, əks halda χ 2 >0. Əgər χ 2 calc > χ 2 tab, onda verilmiş əhəmiyyət səviyyəsi və sərbəstlik dərəcələrinin sayı üçün uyğunsuzluqların əhəmiyyətsizliyi (təsadüfiliyi) fərziyyəsini rədd edirik. Əgər χ 2 hesablanır< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсяnormal paylanma. Pearson uyğunluq testi populyasiyanın ölçüsü kifayət qədər böyük olduqda (N>50) istifadə olunur, halbuki hər bir qrupun tezliyi ən azı 5 olmalıdır.

Kolmoqorovun uyğunluq meyarı toplanmış empirik və nəzəri tezliklər arasında maksimum uyğunsuzluğun müəyyən edilməsinə əsaslanır:

burada D və d müvafiq olaraq empirik və nəzəri paylanmaların məcmu tezlikləri ilə məcmu tezlikləri arasındakı maksimum fərqdir. Kolmoqorovun statistikasının paylanma cədvəlinə əsasən 0-dan 1-ə qədər dəyişə bilən ehtimal müəyyən edilir.P(λ)=1-də tezliklərin tam üst-üstə düşməsi, P(λ)=0-da tam fərqlilik var. Əgər P ehtimal dəyəri aşkar edilmiş λ dəyərinə nisbətən əhəmiyyətlidirsə, onda nəzəri və empirik paylanmalar arasındakı uyğunsuzluqların əhəmiyyətsiz olduğunu, yəni təsadüfi xarakter daşıdığını güman etmək olar. Kolmogorov meyarından istifadənin əsas şərti kifayət qədər çox sayda müşahidədir.

Kolmoqorovun uyğunluq meyarı

Kolmoqorov meyarının (λ) nə zaman tətbiq olunduğunu nəzərdən keçirin normal paylanma fərziyyəsinin sınaqdan keçirilməsiümumi əhali. Normal paylanma əyrisi boyunca faktiki paylanmanın uyğunlaşdırılması bir neçə addımdan ibarətdir:

    Faktiki və nəzəri tezlikləri müqayisə edin.

    Faktiki məlumatlara əsasən normal paylanma əyrisinin nəzəri tezlikləri müəyyən edilir ki, bu da normallaşdırılmış kənarlaşmanın funksiyasıdır.

    Xüsusiyyətin paylanmasının normal olana nə dərəcədə uyğun olduğunu yoxlayın.

Cədvəlin IV sütunu üçün:

MS Excel-də normallaşdırılmış kənarlaşma (t) NORMALIZE funksiyasından istifadə etməklə hesablanır. Seçimlərin sayına (elektron cədvəlin cərgələrinə) görə bir sıra pulsuz xanalar seçmək lazımdır. Seçimi silmədən NORMALİZASİYA funksiyasını çağırın. Görünən dialoq qutusunda müvafiq olaraq müşahidə olunan dəyərləri (X i), orta (X) və standart sapma Ϭ olan aşağıdakı xanaları göstərin. Əməliyyat tamamlanmalıdır eyni vaxtda Ctrl+Shift+Enter düymələrini basaraq

Cədvəlin V sütunu üçün:

Normal paylanmanın ehtimal sıxlığı funksiyası φ(t) normallaşdırılmış sapmanın (t) müvafiq dəyəri üçün yerli Laplas funksiyasının qiymətlər cədvəlindən tapılır.

Cədvəlin VI sütunu üçün:

Kolmoqorov uyğunluq meyarı (λ) modulun bölünməsi ilə müəyyən edilir maksimum fərqlər müşahidələrin sayının hər kvadrat kökünə görə empirik və nəzəri məcmu tezliklər arasında:

Uyğunluq meyarının yaxşılığı üçün xüsusi ehtimal cədvəlindən istifadə edərək müəyyən edirik ki, λ=0,59 dəyəri 0,88 (λ) ehtimalına uyğundur.

Empirik və nəzəri tezliklərin paylanması, nəzəri paylanmanın ehtimal sıxlığı

Müşahidə olunan (empirik) paylanmanın nəzəri ilə uyğun olub-olmadığını yoxlamaq üçün uyğunluq testlərini tətbiq edərkən sadə və mürəkkəb fərziyyələrin yoxlanılması arasında fərq qoyulmalıdır.

Bir nümunəli Kolmogorov-Smirnov normallıq testi əsaslanır maksimum fərq nümunənin məcmu empirik paylanması ilə nəzərdə tutulan (nəzəri) məcmu paylanması arasında. Əgər D Kolmoqorov-Smirnov statistikası əhəmiyyətlidirsə, onda müvafiq paylanmanın normal olması ilə bağlı fərziyyə rədd edilməlidir.