Χρήση κριτηρίων συναίνεσης. Κριτήριο αποδοχής Τι θα κάνουμε με το υλικό που λάβαμε

Κριτήρια συμφωνίας (συμμόρφωση)

Για να ελεγχθεί η υπόθεση σχετικά με την αντιστοιχία της εμπειρικής κατανομής με τον θεωρητικό νόμο της κατανομής, χρησιμοποιούνται ειδικοί στατιστικοί δείκτες - κριτήρια καλής προσαρμογής (ή κριτήρια συμμόρφωσης). Αυτά περιλαμβάνουν τα κριτήρια του Pearson, του Kolmogorov, του Romanovsky, του Yastremsky κ.λπ.. Τα περισσότερα από τα κριτήρια καλής προσαρμογής βασίζονται στη χρήση αποκλίσεων εμπειρικών συχνοτήτων από τις θεωρητικές. Προφανώς, όσο μικρότερες είναι αυτές οι αποκλίσεις, τόσο καλύτερα ταιριάζει (ή περιγράφει) η θεωρητική κατανομή με την εμπειρική.

Κριτήρια συναίνεσης -Αυτά είναι κριτήρια για τον έλεγχο υποθέσεων σχετικά με την αντιστοιχία της εμπειρικής κατανομής με τη θεωρητική κατανομή πιθανοτήτων. Τέτοια κριτήρια χωρίζονται σε δύο κατηγορίες: γενικά και ειδικά. Τα γενικά κριτήρια καλής προσαρμογής ισχύουν για την πιο γενική διατύπωση μιας υπόθεσης, δηλαδή την υπόθεση ότι τα παρατηρούμενα αποτελέσματα συμφωνούν με οποιαδήποτε εκ των προτέρων υποτιθέμενη κατανομή πιθανοτήτων. Οι ειδικές δοκιμές καλής προσαρμογής υποδηλώνουν ειδικές μηδενικές υποθέσεις που διατυπώνουν συμφωνία με μια συγκεκριμένη μορφή κατανομής πιθανοτήτων.

Τα κριτήρια καλής προσαρμογής, με βάση τον καθιερωμένο νόμο διανομής, καθιστούν δυνατό να καθοριστεί πότε οι αποκλίσεις μεταξύ θεωρητικών και εμπειρικών συχνοτήτων πρέπει να αναγνωρίζονται ως ασήμαντες (τυχαία) και πότε - σημαντικές (μη τυχαίες). Από αυτό προκύπτει ότι τα κριτήρια καλής προσαρμογής καθιστούν δυνατή την απόρριψη ή την επιβεβαίωση της ορθότητας της υπόθεσης που διατυπώθηκε κατά την ισοπέδωση της σειράς σχετικά με τη φύση της κατανομής στην εμπειρική σειρά και να απαντηθεί εάν είναι δυνατόν να γίνει αποδεκτό μοντέλο που εκφράζεται από κάποιο θεωρητικό νόμο κατανομής για μια δεδομένη εμπειρική κατανομή.

Το τεστ καλής προσαρμογής x2 (chi-square) του Pearson είναι ένα από τα κύρια κριτήρια καλής προσαρμογής. Προτάθηκε από τον Άγγλο μαθηματικό Karl Pearson (1857-1936) για να αξιολογήσει την τυχαιότητα (σημαντικότητα) των αποκλίσεων μεταξύ των συχνοτήτων των εμπειρικών και των θεωρητικών κατανομών:

όπου κ-τον αριθμό των ομάδων στις οποίες χωρίζεται η εμπειρική κατανομή· fi-εμπειρική συχνότητα του χαρακτηριστικού σε Εγώ-η ομάδα? / ts °р - θεωρητική συχνότητα του χαρακτηριστικού σε i-thομάδα.

Σχέδιο Εφαρμογής Κριτηρίων y)για την αξιολόγηση της συνέπειας των θεωρητικών και εμπειρικών κατανομών περιορίζεται στα ακόλουθα.

  • 1. Το υπολογισμένο μέτρο της απόκλισης προσδιορίζεται % 2 στοιχ.
  • 2. Καθορίζεται ο αριθμός των βαθμών ελευθερίας.
  • 3. Σύμφωνα με τον αριθμό των βαθμών ελευθερίας v, χρησιμοποιώντας έναν ειδικό πίνακα, προσδιορίζεται το %^bl
  • 4. Αν % 2 asch >x 2 abl, τότε για ένα δεδομένο επίπεδο σημαντικότητας a και τον αριθμό των βαθμών ελευθερίας v, η υπόθεση της ασημαντότητας (τυχαιότητα) των αποκλίσεων απορρίπτεται. Διαφορετικά, η υπόθεση μπορεί να αναγνωριστεί ότι δεν έρχεται σε αντίθεση με τα πειραματικά δεδομένα που λαμβάνονται και με πιθανότητα (1 - α) μπορεί να υποστηριχθεί ότι οι αποκλίσεις μεταξύ θεωρητικών και εμπειρικών συχνοτήτων είναι τυχαίες.

Επίπεδο σημασίας -είναι η πιθανότητα λανθασμένης απόρριψης της υποθετικής υπόθεσης, δηλ. την πιθανότητα να απορριφθεί η σωστή υπόθεση. Σε στατιστικές μελέτες, ανάλογα με τη σημασία και την υπευθυνότητα των εργασιών που επιλύονται, χρησιμοποιούνται τα ακόλουθα τρία επίπεδα σημαντικότητας:

  • 1) a = 0,1, τότε P = 0,9;
  • 2) a = 0,05, τότε P = 0,95;
  • 3) a = 0,01, τότε P = 0,99.

Χρήση καλής εφαρμογής y),πρέπει να τηρούνται οι ακόλουθες προϋποθέσεις.

  • 1. Ο όγκος του πληθυσμού που μελετήθηκε πρέπει να ικανοποιεί την προϋπόθεση n> 50, ενώ η συχνότητα ή το μέγεθος της ομάδας πρέπει να είναι τουλάχιστον 5. Εάν παραβιαστεί αυτή η συνθήκη, πρέπει πρώτα να συγχωνεύσετε μικρές συχνότητες (λιγότερες από 5).
  • 2. Η εμπειρική κατανομή θα πρέπει να αποτελείται από δεδομένα που λαμβάνονται ως αποτέλεσμα τυχαίας επιλογής, δηλ. πρέπει να είναι ανεξάρτητοι.

Το μειονέκτημα του κριτηρίου καλής προσαρμογής του Pearson είναι η απώλεια ορισμένων από τις αρχικές πληροφορίες που σχετίζονται με την ανάγκη ομαδοποίησης των αποτελεσμάτων παρατήρησης σε διαστήματα και συνδυασμού μεμονωμένων διαστημάτων με μικρό αριθμό παρατηρήσεων. Από αυτή την άποψη, συνιστάται η συμπλήρωση της επαλήθευσης της αντιστοιχίας των διανομών σύμφωνα με το κριτήριο y)άλλα κριτήρια. Αυτό ισχύει ιδιαίτερα όταν το μέγεθος του δείγματος είναι Π ~ 100.

Στις στατιστικές, η δοκιμή καλής προσαρμογής Kolmogorov (επίσης γνωστή ως δοκιμή καλής προσαρμογής Kolmogorov-Smirnov) χρησιμοποιείται για να προσδιοριστεί εάν δύο εμπειρικές κατανομές υπακούουν στον ίδιο νόμο ή για να προσδιοριστεί εάν η προκύπτουσα κατανομή υπακούει σε ένα υποτιθέμενο μοντέλο . Το κριτήριο Kolmogorov βασίζεται στον προσδιορισμό της μέγιστης διαφοράς μεταξύ των συσσωρευμένων συχνοτήτων ή των συχνοτήτων εμπειρικών ή θεωρητικών κατανομών. Το κριτήριο Kolmogorov υπολογίζεται σύμφωνα με τους ακόλουθους τύπους:

όπου ρεκαι ρε-αντίστοιχα, η μέγιστη διαφορά μεταξύ των συσσωρευμένων συχνοτήτων (/-/") και μεταξύ των συσσωρευμένων συχνοτήτων ( rr") εμπειρικές και θεωρητικές σειρές διανομών. Ν-τον αριθμό των μονάδων στον πληθυσμό.

Έχοντας υπολογίσει την τιμή Χ,ένας ειδικός πίνακας καθορίζει την πιθανότητα με την οποία μπορεί να υποστηριχθεί ότι οι αποκλίσεις των εμπειρικών συχνοτήτων από τις θεωρητικές είναι τυχαίες. Εάν το πρόσημο παίρνει τιμές έως και 0,3, τότε αυτό σημαίνει ότι υπάρχει πλήρης σύμπτωση συχνοτήτων. Με μεγάλο αριθμό παρατηρήσεων, το τεστ Kolmogorov είναι σε θέση να ανιχνεύσει οποιαδήποτε απόκλιση από την υπόθεση. Αυτό σημαίνει ότι οποιαδήποτε διαφορά στην κατανομή του δείγματος από τη θεωρητική θα εντοπιστεί με τη βοήθειά του εάν υπάρχουν πολλές παρατηρήσεις. Η πρακτική σημασία αυτής της ιδιότητας είναι ασήμαντη, καθώς στις περισσότερες περιπτώσεις είναι δύσκολο να υπολογίζουμε στην απόκτηση μεγάλου αριθμού παρατηρήσεων υπό σταθερές συνθήκες, η θεωρητική ιδέα του νόμου κατανομής στον οποίο πρέπει να υπακούει το δείγμα είναι πάντα κατά προσέγγιση και η η ακρίβεια των στατιστικών ελέγχων δεν πρέπει να υπερβαίνει την ακρίβεια του επιλεγμένου μοντέλου.

Το τεστ καλής προσαρμογής του Romanovsky βασίζεται στη χρήση του τεστ Pearson, δηλ. έχουν ήδη βρεθεί τιμές x 2 > και ο αριθμός των βαθμών ελευθερίας:

όπου v είναι ο αριθμός των βαθμών ελευθερίας μεταβολής.

Το κριτήριο Romanovsky είναι βολικό ελλείψει πινάκων για x 2. Αν ένα K rΠΡΟΣ ΤΗΝ? > 3, τότε δεν είναι τυχαίες και η θεωρητική κατανομή δεν μπορεί να χρησιμεύσει ως μοντέλο για την υπό μελέτη εμπειρική κατανομή.

Ο B. S. Yastremsky χρησιμοποίησε στο κριτήριο συμφωνίας όχι τον αριθμό των βαθμών ελευθερίας, αλλά τον αριθμό των ομάδων ( κ), μια ειδική τιμή 0 ανάλογα με τον αριθμό των ομάδων και μια τιμή χ-τετράγωνο. Το κριτήριο συμφωνίας του Yastremsky έχει την ίδια σημασία με το κριτήριο του Romanovsky και εκφράζεται με τον τύπο

όπου x 2 - το κριτήριο συμφωνίας του Pearson. /e gr - αριθμός ομάδων; 0 - συντελεστής, για τον αριθμό των ομάδων μικρότερες από 20 ίσο με 0,6.

Εάν 1f πράξη > 3, οι αποκλίσεις μεταξύ της θεωρητικής και της εμπειρικής κατανομής δεν είναι τυχαίες, δηλ. η εμπειρική κατανομή δεν πληροί τις απαιτήσεις μιας κανονικής κατανομής. Αν 1στ πράξη

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΕΠΙΣΤΗΜΗΣ ΤΗΣ ΟΥΚΡΑΝΙΑΣ

ΠΕΡΙΦΕΡΕΙΑΚΟ ΙΝΣΤΙΤΟΥΤΟ ΔΙΑΧΕΙΡΙΣΗΣ ΑΖΟΦ

ΖΑΠΟΡΙΖΕΙΑΣ ΕΘΝΙΚΟ ΠΟΛΥΤΕΧΝΕΙΟ

Τμήμα Μαθηματικών

ΕΡΓΑΣΙΑ ΜΑΘΗΜΑΤΟΣ

H πειθαρχία "ΣΤΑΤΙΣΤΙΚΗ"

Με θέμα: «ΚΡΙΤΗΡΙΑ ΣΥΝΑΙΝΗΣΗΣ»

φοιτητές 2ου έτους

Ομάδα 207 Σχολή Διοίκησης

Batura Tatyana Olegovna

επιστημονικός σύμβουλος

Ο αναπληρωτής καθηγητής Kosenkov O.I.

Μπερντιάνσκ - 2009


ΕΙΣΑΓΩΓΗ

1.2 Pearson χ 2 καλής προσαρμογής για μια απλή υπόθεση

1.3 Καλή προσαρμογή για σύνθετη υπόθεση

1.4 Δοκιμές καλής προσαρμογής χ 2 Fisher για μια σύνθετη υπόθεση

1.5 Άλλα κριτήρια συναίνεσης. Good-of-fit για τη διανομή Poisson

ΕΝΟΤΗΤΑ II. ΠΡΑΚΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ ΣΥΓΚΕΝΤΡΩΣΗΣ ΚΡΙΤΗΡΙΟ

ΕΦΑΡΜΟΓΕΣ

ΚΑΤΑΛΟΓΟΣ ΧΡΗΣΙΜΟΠΟΙΗΜΕΝΗΣ ΛΟΓΟΤΕΧΝΙΑΣ


ΕΙΣΑΓΩΓΗ

Αυτή η εργασία μαθήματος περιγράφει τα πιο κοινά πλεονεκτήματα των κριτηρίων προσαρμογής - ωμέγα-τετράγωνο, χι-τετράγωνο, Kolmogorov και Kolmogorov-Smirnov. Ιδιαίτερη προσοχή δίνεται στην περίπτωση που είναι απαραίτητο να ελεγχθεί εάν η κατανομή δεδομένων ανήκει σε κάποια παραμετρική οικογένεια, για παράδειγμα, κανονική. Λόγω της πολυπλοκότητάς της, αυτή η κατάσταση, που είναι πολύ συνηθισμένη στην πράξη, δεν έχει μελετηθεί πλήρως και δεν αποτυπώνεται πλήρως στην εκπαιδευτική και βιβλιογραφία αναφοράς.

Τα κριτήρια καλής προσαρμογής ονομάζονται στατιστικές δοκιμές που έχουν σχεδιαστεί για να ελέγξουν τη συμφωνία μεταξύ των πειραματικών δεδομένων και ενός θεωρητικού μοντέλου. Αυτή η ερώτηση σχεδιάζεται καλύτερα εάν οι παρατηρήσεις αντιπροσωπεύουν ένα τυχαίο δείγμα. Το θεωρητικό μοντέλο σε αυτή την περίπτωση περιγράφει τον νόμο διανομής.

Η θεωρητική κατανομή είναι η κατανομή πιθανοτήτων που διέπει την τυχαία επιλογή. Όχι μόνο η θεωρία μπορεί να δώσει ιδέες για αυτό. Η παράδοση, η προηγούμενη εμπειρία και οι προηγούμενες παρατηρήσεις μπορούν να αποτελέσουν πηγές γνώσης εδώ. Αρκεί να τονίσουμε ότι αυτή η διανομή πρέπει να επιλεγεί ανεξάρτητα από τα δεδομένα στα οποία πρόκειται να την ελέγξουμε. Με άλλα λόγια, είναι απαράδεκτο να «προσαρμόζεται» πρώτα ένας συγκεκριμένος νόμος διανομής σε ένα δείγμα και μετά να προσπαθεί κανείς να ελέγξει τη συμφωνία με τον ληφθέντα νόμο για το ίδιο δείγμα.

Απλές και σύνθετες υποθέσεις. Μιλώντας για τον θεωρητικό νόμο της κατανομής, τον οποίο θα πρέπει υποθετικά να ακολουθούν τα στοιχεία ενός δεδομένου δείγματος, πρέπει να διακρίνουμε μεταξύ απλών και σύνθετων υποθέσεων σχετικά με αυτόν τον νόμο:

Μια απλή υπόθεση υποδεικνύει άμεσα έναν συγκεκριμένο νόμο πιθανοτήτων (κατανομή πιθανοτήτων) σύμφωνα με τον οποίο προέκυψαν οι τιμές του δείγματος.

Μια σύνθετη υπόθεση υποδεικνύει μια ενιαία κατανομή, και μερικές από αυτές (για παράδειγμα, μια παραμετρική οικογένεια).

Τα κριτήρια καλής προσαρμογής βασίζονται στη χρήση διαφόρων μέτρων απόστασης μεταξύ της αναλυόμενης εμπειρικής κατανομής και της συνάρτησης κατανομής ενός χαρακτηριστικού στο γενικό πληθυσμό.

Οι μη παραμετρικές δοκιμές συμφωνίας Kolmogorov, Smirnov, ωμέγα τετράγωνο χρησιμοποιούνται ευρέως. Ωστόσο, συνδέονται και με εκτεταμένα σφάλματα στην εφαρμογή στατιστικών μεθόδων.

Γεγονός είναι ότι τα αναφερόμενα κριτήρια αναπτύχθηκαν για να δοκιμάσουν τη συμφωνία με μια πλήρως γνωστή θεωρητική κατανομή. Οι τύποι υπολογισμού, οι πίνακες κατανομών και οι κρίσιμες τιμές χρησιμοποιούνται ευρέως. Η κύρια ιδέα των κριτηρίων Kolmogorov, ωμέγα και παρόμοιων κριτηρίων είναι η μέτρηση της απόστασης μεταξύ της συνάρτησης εμπειρικής κατανομής και της θεωρητικής συνάρτησης κατανομής. Αυτά τα κριτήρια διαφέρουν ως προς τις αποστάσεις στο χώρο των συναρτήσεων κατανομής.

Ξεκινώντας αυτό το μάθημα, έθεσα ως στόχο να μάθω ποια κριτήρια συναίνεσης υπάρχουν, να καταλάβω γιατί χρειάζονται. Για να επιτύχετε αυτόν τον στόχο, πρέπει να ολοκληρώσετε τις ακόλουθες εργασίες:

1. Να αποκαλύψει την ουσία της έννοιας των «κριτηρίων συναίνεσης».

2. Προσδιορίστε ποια κριτήρια συναίνεσης υπάρχουν, μελετήστε τα χωριστά.

3. Εξάγετε συμπεράσματα για την εργασία που έγινε.


ΕΝΟΤΗΤΑ Ι. ΘΕΩΡΗΤΙΚΗ ΤΕΚΜΗΡΙΩΣΗ ΤΟΥ ΚΡΙΤΗΡΙΟΥ ΤΗΣ ΣΥΝΑΙΝΗΣΗΣ

1.1 Κριτήρια καλής προσαρμογής και ωμέγα-τετράγωνο Kolmogorov στην περίπτωση μιας απλής υπόθεσης

Απλή υπόθεση. Σκεφτείτε μια κατάσταση όπου τα μετρούμενα δεδομένα είναι αριθμοί, με άλλα λόγια, μονοδιάστατες τυχαίες μεταβλητές. Η κατανομή μονοδιάστατων τυχαίων μεταβλητών μπορεί να περιγραφεί πλήρως καθορίζοντας τις συναρτήσεις κατανομής τους. Και πολλές δοκιμές καλής προσαρμογής βασίζονται στον έλεγχο της εγγύτητας των θεωρητικών και εμπειρικών (δειγμάτων) συναρτήσεων κατανομής.

Ας υποθέσουμε ότι έχουμε ένα δείγμα n. Ας υποδηλώσουμε τη συνάρτηση αληθούς κατανομής, στην οποία υπόκεινται οι παρατηρήσεις, G(x), την εμπειρική (δείγμα) συνάρτηση κατανομής - F n (x), και την υποθετική συνάρτηση κατανομής - F(x). Τότε η υπόθεση H ότι η αληθινή συνάρτηση κατανομής είναι F(x) γράφεται ως H: G(·) = F(·).

Πώς να ελέγξετε την υπόθεση H; Εάν το H είναι αληθές, τότε τα F n και F θα πρέπει να δείχνουν μια ορισμένη ομοιότητα και η διαφορά μεταξύ τους θα πρέπει να μειώνεται όσο αυξάνεται το n. Λόγω του θεωρήματος Bernoulli, F n (x) → F(x) ως n → ∞. Χρησιμοποιούνται διάφορες μέθοδοι για την ποσοτικοποίηση της ομοιότητας των συναρτήσεων Fn και F.

Για να εκφράσουμε την ομοιότητα των συναρτήσεων, μπορεί να χρησιμοποιηθεί η μία ή η άλλη απόσταση μεταξύ αυτών των συναρτήσεων. Για παράδειγμα, μπορεί κανείς να συγκρίνει τα F n και F στην ομοιόμορφη μετρική, δηλ. λάβετε υπόψη την τιμή:

(1.1)

Η στατιστική D n ονομάζεται στατιστική Kolmogorov.

Προφανώς, η D n είναι μια τυχαία μεταβλητή, αφού η τιμή της εξαρτάται από το τυχαίο αντικείμενο F n . Αν η υπόθεση H 0 είναι αληθής και n → ∞, τότε F n (x) → F(x) για οποιοδήποτε x. Επομένως, είναι φυσικό ότι υπό αυτές τις συνθήκες D n → 0. Εάν η υπόθεση H 0 είναι εσφαλμένη, τότε F n → G και G ≠ F, και επομένως sup -∞

Όπως πάντα όταν δοκιμάζουμε μια υπόθεση, σκεφτόμαστε σαν να ήταν αληθινή η υπόθεση. Είναι σαφές ότι το H 0 πρέπει να απορριφθεί εάν η τιμή των στατιστικών D n που ελήφθησαν στο πείραμα φαίνεται απίστευτα μεγάλη. Αλλά για αυτό πρέπει να ξέρετε πώς κατανέμονται τα στατιστικά D n με την υπόθεση H: F= G για δεδομένο n και G.

Μια αξιοσημείωτη ιδιότητα του D n είναι ότι αν G = F, δηλ. Εάν η υποθετική κατανομή έχει καθοριστεί σωστά, τότε ο νόμος κατανομής των στατιστικών D n αποδεικνύεται ότι είναι ίδιος για όλες τις συνεχείς συναρτήσεις G. Εξαρτάται μόνο από το μέγεθος του δείγματος n.

Η απόδειξη αυτού του γεγονότος βασίζεται στο γεγονός ότι η στατιστική δεν αλλάζει την τιμή της υπό μονοτονικούς μετασχηματισμούς του άξονα x. Με έναν τέτοιο μετασχηματισμό, οποιαδήποτε συνεχής κατανομή G μπορεί να μετατραπεί σε ομοιόμορφη κατανομή στο διάστημα . Σε αυτήν την περίπτωση, το F n (x) θα περάσει στη συνάρτηση κατανομής του δείγματος από αυτή την ομοιόμορφη κατανομή.

Για το μικρό n, για τα στατιστικά D n στην υπόθεση H 0, καταρτίζονται πίνακες ποσοστιαίων μονάδων. Για μεγάλο n, η κατανομή D n (κάτω από την υπόθεση H 0) υποδεικνύεται από το οριακό θεώρημα που βρέθηκε το 1933 από τον A.N. Kolmogorov. Μιλάει για στατιστικά

(καθώς η ίδια η τιμή D n → 0 στο H 0 , είναι απαραίτητο να πολλαπλασιαστεί με μια απεριόριστα αυξανόμενη τιμή για να σταθεροποιηθεί η κατανομή). Το θεώρημα του Κολμογκόροφ δηλώνει ότι αν το H 0 είναι αληθές και αν το G είναι συνεχές:
(1.2)

Αυτό το ποσό είναι πολύ εύκολο να υπολογιστεί στο Maple. Για τον έλεγχο μιας απλής υπόθεσης H 0: G = F, απαιτείται να υπολογιστεί η τιμή της στατιστικής D n από το αρχικό δείγμα. Ένας απλός τύπος λειτουργεί για αυτό:

(1.3)

Εδώ, μέσω x k - στοιχεία της μεταβλητής σειράς που κατασκευάστηκαν από το αρχικό δείγμα. Η λαμβανόμενη τιμή Dn πρέπει στη συνέχεια να συγκριθεί με τις κρίσιμες τιμές που εξάγονται από τους πίνακες ή υπολογίζονται με τον ασυμπτωτικό τύπο. Η υπόθεση H 0 πρέπει να απορριφθεί (στο επιλεγμένο επίπεδο σημαντικότητας) εάν η τιμή του Dn που ελήφθη στο πείραμα υπερβαίνει την επιλεγμένη κρίσιμη τιμή που αντιστοιχεί στο αποδεκτό επίπεδο σημαντικότητας.

Ένα άλλο δημοφιλές κριτήριο καλής προσαρμογής προκύπτει με τη μέτρηση της απόστασης μεταξύ F n και F στην ολοκληρωτική μέτρηση. Βασίζεται στα λεγόμενα στατιστικά του ωμέγα τετραγώνου:

(1.4)

Για να το υπολογίσετε από πραγματικά δεδομένα, μπορείτε να χρησιμοποιήσετε τον τύπο:

(1.5)

Εάν η υπόθεση H 0 είναι αληθής και η συνάρτηση G είναι συνεχής, η κατανομή της στατιστικής του ωμέγα τετραγώνου, όπως και η κατανομή της στατιστικής D n , εξαρτάται μόνο από το n και δεν εξαρτάται από το G.

Ακριβώς όπως για το D n , για

για μικρά n, είναι διαθέσιμοι πίνακες ποσοστιαίων μονάδων και για μεγάλες τιμές του n, θα πρέπει να χρησιμοποιείται η περιοριστική (ως n → ∞) κατανομή του στατιστικού n. Εδώ πάλι πρέπει να πολλαπλασιάσουμε με έναν απείρως αυξανόμενο παράγοντα. Η περιοριστική κατανομή βρέθηκε από τον N.V. Smirnov το 1939. Για αυτήν συντάχθηκαν λεπτομερείς πίνακες και υπολογιστικά προγράμματα. Μια σημαντική θεωρητική ιδιότητα των κριτηρίων που βασίζονται στα D n και : ισχύουν έναντι οποιασδήποτε εναλλακτικής G ≠ F.

Δεδομένου ότι όλες οι υποθέσεις σχετικά με τη φύση μιας συγκεκριμένης κατανομής είναι υποθέσεις, πρέπει να υποβάλλονται σε στατιστική επαλήθευση χρησιμοποιώντας κριτήρια συναίνεσης, που καθιστούν δυνατό να διαπιστωθεί πότε οι αποκλίσεις μεταξύ θεωρητικών και εμπειρικών συχνοτήτων θα πρέπει να αναγνωρίζονται ως ασήμαντες, δηλ. τυχαία, και όταν - σημαντική (μη τυχαία). Έτσι, τα κριτήρια καλής προσαρμογής καθιστούν δυνατή την απόρριψη ή την επιβεβαίωση της ορθότητας της υπόθεσης που διατυπώθηκε κατά την ισοπέδωση της σειράς σχετικά με τη φύση της κατανομής στην εμπειρική σειρά.

Υπάρχει μια σειρά από κριτήρια συναίνεσης. Τα κριτήρια Pearson, Romanovsky και Kolmogorov χρησιμοποιούνται συχνότερα.

Δοκιμή καλής προσαρμογής Pearson - ένα από τα κύρια

όπου k είναι ο αριθμός των ομάδων στις οποίες χωρίζεται η εμπειρική κατανομή,
είναι η παρατηρούμενη συχνότητα του χαρακτηριστικού στην i-η ομάδα,
είναι η θεωρητική συχνότητα.
Για την κατανομή έχουν δημιουργηθεί πίνακες, όπου η κρίσιμη τιμή του κριτηρίου της καλής προσαρμογής υποδεικνύεται για το επιλεγμένο επίπεδο σημασίας και βαθμούς ελευθερίας df. (ή )
Το επίπεδο σημαντικότητας είναι η πιθανότητα λανθασμένης απόρριψης της υποθετικής υπόθεσης, δηλ. την πιθανότητα να απορριφθεί η σωστή υπόθεση. Τρία επίπεδα χρησιμοποιούνται στις στατιστικές:

  • a= 0,10, τότε Р=0,90 (σε 10 περιπτώσεις των 100 η σωστή υπόθεση μπορεί να απορριφθεί).
  • a=0,05, μετά P=0,95;
  • a=0,01, μετά P=0,99.

Ο αριθμός των βαθμών ελευθερίας df ορίζεται ως ο αριθμός των ομάδων στη σειρά διανομής μείον τον αριθμό των δεσμών: df = k –z. Ο αριθμός των συνδέσεων νοείται ως ο αριθμός των δεικτών της εμπειρικής σειράς που χρησιμοποιούνται στον υπολογισμό των θεωρητικών συχνοτήτων, δηλ. δείκτες που συνδέουν εμπειρικές και θεωρητικές συχνότητες.
Για παράδειγμα, όταν ευθυγραμμίζεται με μια κανονική καμπύλη κατανομής, υπάρχουν τρεις σχέσεις:
; ; .
Επομένως, όταν ισοπεδώνετε κατά μήκος της καμπύλης κανονικής κατανομής, ο αριθμός των βαθμών ελευθερίας ορίζεται ως df = k –3.
Για την αξιολόγηση της σημαντικότητας, η υπολογιζόμενη τιμή συγκρίνεται με την τιμή του πίνακα.
Με πλήρη σύμπτωση θεωρητικών και εμπειρικών κατανομών, διαφορετικά >0. Αν >, τότε για ένα δεδομένο επίπεδο σημασίας και τον αριθμό των βαθμών ελευθερίας, απορρίπτουμε την υπόθεση της ασημαντότητας (τυχαιότητα) των αποκλίσεων.
Αν , συμπεραίνουμε ότι η εμπειρική σειρά είναι σε καλή συμφωνία με την υπόθεση της αναμενόμενης κατανομής και με την πιθανότητα Р=(1-a) μπορεί να υποστηριχθεί ότι η απόκλιση μεταξύ της θεωρητικής και της εμπειρικής συχνότητας είναι τυχαία.
Το τεστ καλής προσαρμογής του Pearson χρησιμοποιείται εάν το μέγεθος του πληθυσμού είναι αρκετά μεγάλο και η συχνότητα κάθε ομάδας πρέπει να είναι τουλάχιστον 5.

το κριτήριο του Romanovsky με με βάση τη χρήση του κριτηρίου Pearson, δηλ. ήδη βρέθηκαν τιμές και ο αριθμός των βαθμών ελευθερίας df:

Είναι χρήσιμο όταν δεν υπάρχουν πίνακες για .
Αν με<3, то расхождения распределений случайны, если же с>3, τότε δεν είναι τυχαίες και η θεωρητική κατανομή δεν μπορεί να χρησιμεύσει ως μοντέλο για την υπό μελέτη εμπειρική κατανομή.

Το κριτήριο του Κολμογκόροφ μεγάλο βασίζεται στον προσδιορισμό της μέγιστης απόκλισης μεταξύ των συσσωρευμένων συχνοτήτων και των συχνοτήτων εμπειρικών και θεωρητικών κατανομών:
ή ,
όπου D και d είναι, αντίστοιχα, η μέγιστη διαφορά μεταξύ των συσσωρευμένων συχνοτήτων και των συσσωρευμένων συχνοτήτων της εμπειρικής και της θεωρητικής σειράς κατανομών.
N είναι ο αριθμός των πληθυσμιακών μονάδων.
Έχοντας υπολογίσει την τιμή του l, ο πίνακας P(l) καθορίζει την πιθανότητα με την οποία μπορεί να υποστηριχθεί ότι οι αποκλίσεις των εμπειρικών συχνοτήτων από τις θεωρητικές είναι τυχαίες. Η πιθανότητα Р(l) μπορεί να ποικίλλει από 0 έως 1. Στο Р(l)=1 υπάρχει πλήρης σύμπτωση συχνοτήτων, Р(l)=0 – πλήρης απόκλιση. Εάν το l παίρνει τιμές έως και 0,3, τότε P(l)=1.
Η κύρια προϋπόθεση για τη χρήση του κριτηρίου Kolmogorov είναι ένας αρκετά μεγάλος αριθμός παρατηρήσεων.

Σε αυτή την ενότητα, θα εξετάσουμε ένα από τα ζητήματα που σχετίζονται με τον έλεγχο της πιθανότητας υποθέσεων, δηλαδή το ζήτημα της συνέπειας μεταξύ θεωρητικών και στατιστικών κατανομών.

Ας υποθέσουμε ότι η δεδομένη στατιστική κατανομή ισοπεδώνεται χρησιμοποιώντας κάποια θεωρητική καμπύλη f(x)(Εικ. 7.6.1). Ανεξάρτητα από το πόσο καλά επιλεγεί η θεωρητική καμπύλη, ορισμένες αποκλίσεις είναι αναπόφευκτες μεταξύ αυτής και της στατιστικής κατανομής. Φυσικά, τίθεται το ερώτημα: αυτές οι αποκλίσεις οφείλονται μόνο σε τυχαίες περιστάσεις που σχετίζονται με περιορισμένο αριθμό παρατηρήσεων ή είναι σημαντικές και σχετίζονται με το γεγονός ότι η καμπύλη που επιλέξαμε δεν ισοπεδώνει καλά αυτήν τη στατιστική κατανομή. Για να απαντηθεί αυτή η ερώτηση, χρησιμοποιούνται τα λεγόμενα «κριτήρια συναίνεσης».

ΝΟΜΟΙ ΚΑΤΑΝΟΜΗΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ



Η ιδέα πίσω από την εφαρμογή των κριτηρίων καλής προσαρμογής είναι η εξής.

Με βάση αυτό το στατιστικό υλικό, πρέπει να ελέγξουμε την υπόθεση H,που συνίσταται στο γεγονός ότι η τυχαία μεταβλητή Χυπακούει σε κάποιο νόμο οριστικής διανομής. Αυτός ο νόμος μπορεί να δοθεί με τη μία ή την άλλη μορφή: για παράδειγμα, με τη μορφή μιας συνάρτησης διανομής F(x)ή με τη μορφή της πυκνότητας κατανομής f(x),ή με τη μορφή ενός συνόλου πιθανοτήτων p t,όπου pt- την πιθανότητα ότι η τιμή Χθα πέσει μέσα Κάτιαπαλλάσσω.

Αφού από αυτές τις μορφές η συνάρτηση κατανομής F(x)είναι η πιο γενική και καθορίζει οποιαδήποτε άλλη, θα διατυπώσουμε την υπόθεση H,καθώς συνίσταται στο γεγονός ότι η αξία Χέχει συνάρτηση διανομής ^(d:).

Να αποδεχτεί ή να απορρίψει μια υπόθεση H,σκεφτείτε κάποια ποσότητα εσύ,χαρακτηρίζοντας το βαθμό απόκλισης μεταξύ της θεωρητικής και της στατιστικής κατανομής. αξία Uμπορεί να επιλεγεί με διάφορους τρόπους. για παράδειγμα, όπως Uμπορεί κανείς να πάρει το άθροισμα των τετραγωνικών αποκλίσεων των θεωρητικών πιθανοτήτων ptαπό τις αντίστοιχες συχνότητες R*ή το άθροισμα των ίδιων τετραγώνων με κάποιους συντελεστές («βαρίδια»), ή η μέγιστη απόκλιση της συνάρτησης στατιστικής κατανομής F*(x)από θεωρητικό F(x)κλπ. Ας υποθέσουμε ότι η ποσότητα Uεπιλεγμένα με τον ένα ή τον άλλο τρόπο. Προφανώς, υπάρχουν μερικά τυχαία τιμή.Ο νόμος κατανομής αυτής της τυχαίας μεταβλητής εξαρτάται από τον νόμο κατανομής της τυχαίας μεταβλητής Χ,στις οποίες πραγματοποιήθηκαν πειράματα και από τον αριθμό των πειραμάτων Π.Αν η υπόθεση Hείναι αληθές, τότε ο νόμος κατανομής της ποσότητας Uκαθορίζεται από το νόμο κατανομής της ποσότητας Χ(λειτουργία F(x))και αριθμός Π.

Ας υποθέσουμε ότι αυτός ο νόμος διανομής είναι γνωστός σε εμάς. Ως αποτέλεσμα αυτής της σειράς πειραμάτων, διαπιστώθηκε ότι το μέτρο που επιλέξαμε



ΚΡΙΤΗΡΙΑ ΣΥΝΑΙΝΗΣΗΣ


αποκλίσεις Uπήρε κάποια αξία ένα.Το ερώτημα είναι εάν αυτό μπορεί να εξηγηθεί από τυχαίες αιτίες ή εάν αυτή η απόκλιση είναι πολύ μεγάλη και υποδηλώνει την παρουσία σημαντικής διαφοράς μεταξύ της θεωρητικής και της στατιστικής κατανομής και, επομένως, την ακαταλληλότητα της υπόθεσης Η;Για να απαντήσουμε σε αυτό το ερώτημα, ας υποθέσουμε ότι η υπόθεση Hείναι σωστή και κάτω από αυτή την υπόθεση υπολογίζουμε την πιθανότητα ότι, λόγω τυχαίων αιτιών που σχετίζονται με ανεπαρκή ποσότητα πειραματικού υλικού, το μέτρο της ασυμφωνίας Uδεν θα είναι μικρότερη από την τιμή που παρατηρήσαμε στο πείραμα και,Δηλαδή, υπολογίζουμε την πιθανότητα ενός γεγονότος:

Εάν αυτή η πιθανότητα είναι πολύ μικρή, τότε η υπόθεση Hθα πρέπει να απορριφθεί ως όχι πολύ εύλογο. Εάν αυτή η πιθανότητα είναι σημαντική, θα πρέπει να αναγνωριστεί ότι τα πειραματικά δεδομένα δεν έρχονται σε αντίθεση με την υπόθεση Ν.

Τίθεται το ερώτημα, με ποιον τρόπο πρέπει να επιλεγεί το μέτρο της απόκλισης £/; Αποδεικνύεται ότι για κάποιους τρόπους επιλογής του, ο νόμος της κατανομής της ποσότητας Uέχει πολύ απλές ιδιότητες και, για αρκετά μεγάλο Ππρακτικά ανεξάρτητα από τη λειτουργία F(x).Αυτά ακριβώς τα μέτρα ασυμφωνίας χρησιμοποιούνται στις μαθηματικές στατιστικές ως κριτήρια συμφωνίας.

Ας εξετάσουμε ένα από τα πιο συχνά χρησιμοποιούμενα κριτήρια συμφωνίας - το λεγόμενο «κριτήριο στο?" Pearson.

Ας υποθέσουμε ότι υπάρχουν ha ανεξάρτητα πειράματα, σε καθένα από τα οποία η τυχαία μεταβλητή Χπήρε μια ορισμένη αξία. Τα αποτελέσματα των πειραμάτων συνοψίζονται στο κψηφία και παρουσιάζονται με τη μορφή στατιστικής σειράς.

Θεωρητικές και εμπειρικές συχνότητες. Δοκιμή για κανονική κατανομή

Κατά την ανάλυση των σειρών μεταβλητής διανομής, έχει μεγάλη σημασία το πώς εμπειρική κατανομήτο σημάδι αντιστοιχεί κανονικός. Για αυτό, οι συχνότητες της πραγματικής κατανομής πρέπει να συγκριθούν με τις θεωρητικές, που είναι χαρακτηριστικές της κανονικής κατανομής. Αυτό σημαίνει ότι είναι απαραίτητο να υπολογιστούν οι θεωρητικές συχνότητες της καμπύλης κανονικής κατανομής, οι οποίες είναι συνάρτηση κανονικοποιημένων αποκλίσεων, από τα πραγματικά δεδομένα.

Με άλλα λόγια, η εμπειρική καμπύλη κατανομής πρέπει να ευθυγραμμιστεί με την καμπύλη κανονικής κατανομής.

Αντικειμενικό χαρακτηριστικό συμμόρφωσης θεωρητικόςκαι εμπειρικός συχνότητεςμπορούν να ληφθούν χρησιμοποιώντας ειδικούς στατιστικούς δείκτες, οι οποίοι ονομάζονται κριτήρια συναίνεσης.

Κριτήριο συμφωνίαςονομάζεται ένα κριτήριο που σας επιτρέπει να προσδιορίσετε εάν η απόκλιση είναι εμπειρικόςκαι θεωρητικόςκατανομές τυχαίες ή σημαντικές, δηλαδή εάν τα δεδομένα παρατήρησης είναι συνεπή με την προβαλλόμενη στατιστική υπόθεση ή δεν είναι συνεπή. Η κατανομή του γενικού πληθυσμού, που έχει δυνάμει της υπόθεσης που διατυπώθηκε, ονομάζεται θεωρητική.

Υπάρχει ανάγκη καθιέρωσης κριτήριο(κανόνας) που θα επέτρεπε σε κάποιον να κρίνει εάν η διαφορά μεταξύ της εμπειρικής και της θεωρητικής κατανομής είναι τυχαία ή σημαντική. Εάν η απόκλιση είναι τυχαίος, τότε θεωρούν ότι τα δεδομένα παρατήρησης (δείγμα) συνάδουν με την υπόθεση που διατυπώθηκε για τον νόμο κατανομής του γενικού πληθυσμού και, ως εκ τούτου, η υπόθεση γίνεται αποδεκτή. εάν η απόκλιση είναι με νοημα, τότε τα δεδομένα παρατήρησης δεν συμφωνούν με την υπόθεση και την απορρίπτουν.

Συνήθως οι εμπειρικές και οι θεωρητικές συχνότητες διαφέρουν λόγω του γεγονότος ότι:

    η απόκλιση είναι τυχαία και σχετίζεται με περιορισμένο αριθμό παρατηρήσεων.

    Η απόκλιση δεν είναι τυχαία και εξηγείται από το γεγονός ότι η στατιστική υπόθεση ότι ο γενικός πληθυσμός κατανέμεται κανονικά είναι εσφαλμένη.

Με αυτόν τον τρόπο, κριτήρια συναίνεσηςεπιτρέψτε την απόρριψη ή την επιβεβαίωση της ορθότητας της υπόθεσης που διατυπώθηκε κατά την ισοπέδωση της σειράς σχετικά με τη φύση της κατανομής στην εμπειρική σειρά.

Εμπειρικές Συχνότητεςπου προέκυψε από παρατήρηση. Θεωρητικές συχνότητεςυπολογίζεται με τύπους.

Για κανονικός νόμος διανομήςμπορούν να βρεθούν ως εξής:

    Σƒ i- άθροισμα συσσωρευμένων (αθροιστικών) εμπειρικών συχνοτήτων

    h - διαφορά μεταξύ δύο γειτονικών επιλογών

    σ - τυπική απόκλιση δείγματος

    t-κανονικοποιημένη (τυποποιημένη) απόκλιση

    Το φ(t) είναι η συνάρτηση πυκνότητας πιθανότητας της κανονικής κατανομής (βρες από τον πίνακα τιμών της τοπικής συνάρτησης Laplace για την αντίστοιχη τιμή του t)

Υπάρχουν αρκετές δοκιμές καλής προσαρμογής, οι πιο συνηθισμένες από τις οποίες είναι: τεστ chi-square (Pearson's), δοκιμή Kolmogorov, δοκιμή Romanovsky.

Pearson καλής προσαρμογής τεστ χ 2 - ένα από τα κύρια, που μπορεί να αναπαρασταθεί ως το άθροισμα των λόγων των τετραγωνικών διαφορών μεταξύ των θεωρητικών (f Т) και εμπειρικών (f) συχνοτήτων προς τις θεωρητικές συχνότητες:

    k είναι ο αριθμός των ομάδων στις οποίες χωρίζεται η εμπειρική κατανομή,

    f i είναι η παρατηρούμενη συχνότητα του χαρακτηριστικού στην i-η ομάδα,

    f T είναι η θεωρητική συχνότητα.

Για την κατανομή συντάσσονται χ 2 πίνακες, οι οποίοι υποδεικνύουν την κρίσιμη τιμή του κριτηρίου προσαρμογής χ 2 για το επιλεγμένο επίπεδο σημαντικότητας α και βαθμούς ελευθερίας df (ή ν). Το επίπεδο σημαντικότητας α είναι η πιθανότητα λανθασμένης απόρριψης της υποθετικής υπόθεσης, δηλ. την πιθανότητα να απορριφθεί η σωστή υπόθεση. R - στατιστική εγκυρότητααποδεχόμενοι τη σωστή υπόθεση. Στις στατιστικές, τρία επίπεδα σημαντικότητας χρησιμοποιούνται πιο συχνά:

α=0,10, μετά P=0,90 (σε 10 περιπτώσεις από τις 100)

α=0,05, μετά Р=0,95 (σε 5 περιπτώσεις από τις 100)

α=0,01, τότε P=0,99 (σε 1 περίπτωση από τις 100) η σωστή υπόθεση μπορεί να απορριφθεί

Ο αριθμός των βαθμών ελευθερίας df ορίζεται ως ο αριθμός των ομάδων στη σειρά διανομής μείον τον αριθμό των δεσμών: df = k –z. Ο αριθμός των συνδέσεων νοείται ως ο αριθμός των δεικτών της εμπειρικής σειράς που χρησιμοποιούνται στον υπολογισμό των θεωρητικών συχνοτήτων, δηλ. δείκτες που συνδέουν εμπειρικές και θεωρητικές συχνότητες. Για παράδειγμα, σε μια ευθυγράμμιση καμπύλης καμπάνας, υπάρχουν τρεις σχέσεις. Επομένως, κατά την ευθυγράμμιση καμπύλη καμπάναςο αριθμός των βαθμών ελευθερίας ορίζεται ως df =k–3. Για την αξιολόγηση της σημαντικότητας, η υπολογιζόμενη τιμή συγκρίνεται με τον πίνακα χ 2

Με πλήρη σύμπτωση θεωρητικής και εμπειρικής κατανομής χ 2 =0, διαφορετικά χ 2 >0. Αν χ 2 calc > χ 2 καρτέλα, τότε για ένα δεδομένο επίπεδο σημασίας και τον αριθμό των βαθμών ελευθερίας, απορρίπτουμε την υπόθεση της ασημαντότητας (τυχαιότητα) των αποκλίσεων. Αν χ 2 υπολ< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсяκανονική κατανομή. Το τεστ καλής προσαρμογής του Pearson χρησιμοποιείται εάν το μέγεθος του πληθυσμού είναι αρκετά μεγάλο (N>50), ενώ η συχνότητα κάθε ομάδας πρέπει να είναι τουλάχιστον 5.

Το κριτήριο καλής προσαρμογής του Kolmogorovβασίζεται στον προσδιορισμό της μέγιστης απόκλισης μεταξύ των συσσωρευμένων εμπειρικών και θεωρητικών συχνοτήτων:

όπου D και d είναι, αντίστοιχα, η μέγιστη διαφορά μεταξύ των αθροιστικών συχνοτήτων και των αθροιστικών συχνοτήτων της εμπειρικής και της θεωρητικής κατανομής. Σύμφωνα με τον πίνακα κατανομής των στατιστικών του Kolmogorov, προσδιορίζεται η πιθανότητα, η οποία μπορεί να ποικίλλει από 0 έως 1. Στο P(λ)=1- υπάρχει πλήρης σύμπτωση συχνοτήτων, P(λ)=0 - μια πλήρης απόκλιση. Εάν η τιμή πιθανότητας P είναι σημαντική σε σχέση με την τιμή λ που βρέθηκε, τότε μπορεί να υποτεθεί ότι οι αποκλίσεις μεταξύ της θεωρητικής και της εμπειρικής κατανομής είναι ασήμαντες, δηλαδή είναι τυχαίας φύσης. Η κύρια προϋπόθεση για τη χρήση του κριτηρίου Kolmogorov είναι ένας αρκετά μεγάλος αριθμός παρατηρήσεων.

Το κριτήριο καλής προσαρμογής του Kolmogorov

Εξετάστε πώς εφαρμόζεται το κριτήριο Kolmogorov (λ) όταν δοκιμάζοντας την υπόθεση της κανονικής κατανομήςο γενικός πληθυσμός. Η ευθυγράμμιση της πραγματικής κατανομής κατά μήκος της καμπύλης κανονικής κατανομής αποτελείται από διάφορα βήματα:

    Συγκρίνετε πραγματικές και θεωρητικές συχνότητες.

    Σύμφωνα με τα πραγματικά δεδομένα, προσδιορίζονται οι θεωρητικές συχνότητες της καμπύλης κανονικής κατανομής, η οποία είναι συνάρτηση της κανονικοποιημένης απόκλισης.

    Ελέγξτε σε ποιο βαθμό η κατανομή του χαρακτηριστικού αντιστοιχεί στην κανονική.

Για την IV στήλη του πίνακα:

Στο MS Excel, η κανονικοποιημένη απόκλιση (t) υπολογίζεται χρησιμοποιώντας τη συνάρτηση NORMALIZE. Είναι απαραίτητο να επιλέξετε μια περιοχή ελεύθερων κελιών με βάση τον αριθμό των επιλογών (σειρές ενός υπολογιστικού φύλλου). Χωρίς να αφαιρέσετε την επιλογή, καλέστε τη λειτουργία NORMALIZATION. Στο παράθυρο διαλόγου που εμφανίζεται, καθορίστε τα ακόλουθα κελιά, τα οποία περιέχουν, αντίστοιχα, τις παρατηρούμενες τιμές (X i), τη μέση (X) και την τυπική απόκλιση Ϭ. Η λειτουργία πρέπει να ολοκληρωθεί ταυτόχρονοςπατώντας Ctrl+Shift+Enter

Για τη στήλη V του πίνακα:

Η συνάρτηση πυκνότητας πιθανότητας της κανονικής κατανομής φ(t) βρίσκεται από τον πίνακα τιμών της τοπικής συνάρτησης Laplace για την αντίστοιχη τιμή της κανονικοποιημένης απόκλισης (t)

Για τη στήλη VI του πίνακα:

Κριτήριο καλής προσαρμογής Kolmogorov (λ)προσδιορίζεται με διαίρεση του συντελεστή μέγιστες διαφορέςμεταξύ εμπειρικών και θεωρητικών αθροιστικών συχνοτήτων ανά τετραγωνική ρίζα του αριθμού των παρατηρήσεων:

Χρησιμοποιώντας έναν ειδικό πίνακα πιθανοτήτων για το κριτήριο καλής προσαρμογής λ, προσδιορίζουμε ότι η τιμή λ=0,59 αντιστοιχεί σε πιθανότητα 0,88 (λ

Κατανομή εμπειρικών και θεωρητικών συχνοτήτων, πυκνότητα πιθανότητας θεωρητικής κατανομής

Κατά την εφαρμογή δοκιμών καλής προσαρμογής για να ελεγχθεί εάν μια παρατηρούμενη (εμπειρική) κατανομή είναι συνεπής με μια θεωρητική, θα πρέπει να γίνει διάκριση μεταξύ της δοκιμής απλών και σύνθετων υποθέσεων.

Η δοκιμή κανονικότητας Kolmogorov-Smirnov ενός δείγματος βασίζεται σε μέγιστη διαφοράμεταξύ της σωρευτικής εμπειρικής κατανομής του δείγματος και της υπονοούμενης (θεωρητικής) αθροιστικής κατανομής. Εάν D η στατιστική Kolmogorov-Smirnov είναι σημαντική, τότε η υπόθεση ότι η αντίστοιχη κατανομή είναι κανονική πρέπει να απορριφθεί.