Διαστήματα εμπιστοσύνης

Τι είναι το διάστημα εμπιστοσύνης:

Πρόκειται για μια εκτίμηση μιας κλίμακας που χρησιμοποιείται στις στατιστικές, η οποία περιέχει μια πληθυσμιακή παράμετρο. Αυτή η άγνωστη πληθυσμιακή παράμετρος βρίσκεται μέσω ενός μοντέλου δείγματος που υπολογίζεται από τα δεδομένα που συλλέγονται .

Παράδειγμα: ο μέσος όρος ενός δείγματος που συλλέγεται x ^ μπορεί να είναι ή να μην ταιριάζει με τον πραγματικό μέσο πληθυσμό μ. Για το σκοπό αυτό, είναι δυνατόν να ληφθεί υπόψη ένα εύρος μέσων δειγματοληψίας όπου αυτό το μέσο πληθυσμού μπορεί να περιοριστεί. Όσο μεγαλύτερο είναι αυτό το διάστημα, τόσο μεγαλύτερη είναι η πιθανότητα να συμβεί αυτό.

Το διάστημα εμπιστοσύνης εκφράζεται ως ποσοστό, εκφρασμένο σε επίπεδο εμπιστοσύνης, με τα 90%, 95% και 99% να είναι τα πιο ενδεικτικά. Στην παρακάτω εικόνα, για παράδειγμα, έχουμε ένα διάστημα εμπιστοσύνης 90% μεταξύ των ανώτερων και κατώτερων ορίων (α και -α ).

Παράδειγμα ενός διαστήματος εμπιστοσύνης 90% μεταξύ των ορίων του άνω (α) και του κατώτερου (-α).

Το διάστημα εμπιστοσύνης είναι μία από τις σημαντικότερες έννοιες των δοκιμασιών υποθέσεων στις στατιστικές, διότι χρησιμοποιείται ως μέτρο αβεβαιότητας. Ο όρος εισήχθη από τον πολωνικό μαθηματικό και στατιστικό Jerzy Neyman το 1937.

Ποια είναι η συνάφεια ενός διαστήματος εμπιστοσύνης;

Το διάστημα εμπιστοσύνης είναι σημαντικό για να υποδείξει το περιθώριο της αβεβαιότητας (ή της ανακριβειότητας) έναντι ενός υπολογισμού. Αυτός ο υπολογισμός χρησιμοποιεί το δείγμα της μελέτης για να υπολογίσει το πραγματικό μέγεθος του αποτελέσματος στον πληθυσμό πηγής.

Ο υπολογισμός ενός διαστήματος εμπιστοσύνης είναι μια στρατηγική που λαμβάνει υπόψη τη δειγματοληψία λάθους. Το μέγεθος της έκβασης της μελέτης σας και το διάστημα εμπιστοσύνης σας χαρακτηρίζουν τις υποτιθέμενες τιμές για τον αρχικό πληθυσμό.

Όσο πιο περιορισμένο είναι το διάστημα εμπιστοσύνης, τόσο μεγαλύτερη είναι η πιθανότητα ότι το ποσοστό του πληθυσμού της μελέτης αντιπροσωπεύει τον πραγματικό αριθμό του πληθυσμού πηγής, δίνοντας μεγαλύτερη βεβαιότητα ως προς το αποτέλεσμα του αντικειμένου της μελέτης.

Πώς να ερμηνεύσετε ένα διάστημα εμπιστοσύνης;

Η ορθή ερμηνεία του διαστήματος εμπιστοσύνης είναι ίσως η πιο δύσκολη πτυχή αυτής της στατιστικής ιδέας. Ένα παράδειγμα της πιο κοινής ερμηνείας της έννοιας είναι τα εξής:

Υπάρχει πιθανότητα 95% ότι στο μέλλον η πραγματική τιμή της παραμέτρου του πληθυσμού (π.χ. μέσος όρος) εμπίπτει στην περιοχή Χ (κάτω όριο) και στο Υ (ανώτερο όριο).

Έτσι, το διάστημα εμπιστοσύνης ερμηνεύεται ως εξής: είναι 95% βέβαιος ότι το διάστημα μεταξύ των Χ (κάτω όριο) και Υ (άνω όριο) περιέχει την πραγματική τιμή της πληθυσμιακής παραμέτρου.

Θα ήταν εντελώς λανθασμένο να δηλώσουμε ότι: υπάρχει μια πιθανότητα 95% ότι το διάστημα μεταξύ Χ (κατώτερο όριο) και Υ (άνω όριο) περιέχει την πραγματική τιμή της παραμέτρου του πληθυσμού.

Η παραπάνω δήλωση είναι η πιο συνηθισμένη εσφαλμένη αντίληψη για το διάστημα εμπιστοσύνης. Αφού υπολογιστεί το στατιστικό εύρος, μπορεί να περιέχει μόνο την πληθυσμιακή παράμετρο ή όχι.

Ωστόσο, τα διαστήματα μπορεί να διαφέρουν μεταξύ των δειγμάτων, ενώ η πραγματική παράμετρος του πληθυσμού είναι η ίδια ανεξάρτητα από το δείγμα.

Επομένως, η δήλωση εμπιστοσύνης διαστήματος εμπιστοσύνης μπορεί να γίνει μόνο στην περίπτωση που τα διαστήματα εμπιστοσύνης υπολογίζονται εκ νέου για τον αριθμό των δειγμάτων.

Τα βήματα υπολογισμού του διαστήματος εμπιστοσύνης

Η περιοχή υπολογίζεται με τα ακόλουθα βήματα:

  • Συγκεντρώστε τα δεδομένα δείγματος: n ;
  • Υπολογίζεται ο μέσος όρος του δείγματος x.
  • Προσδιορίστε εάν η τυπική απόκλιση του πληθυσμού ( σ ) είναι γνωστή ή άγνωστη.
  • Εάν είναι γνωστή η τυπική απόκλιση του πληθυσμού, μπορεί να χρησιμοποιηθεί ένα z- σημείο για το αντίστοιχο επίπεδο εμπιστοσύνης.
  • Εάν η τυπική απόκλιση του πληθυσμού είναι άγνωστη, μπορούμε να χρησιμοποιήσουμε μια στατιστική t για το αντίστοιχο επίπεδο εμπιστοσύνης.
  • Έτσι, το κατώτερο και το ανώτερο όριο του διαστήματος εμπιστοσύνης βρίσκονται χρησιμοποιώντας τους ακόλουθους τύπους:

α) Τυπική απόκλιση γνωστού πληθυσμού :

Τύπος για τον υπολογισμό της τυπικής απόκλισης ενός γνωστού πληθυσμού.

β) Τυπική απόκλιση άγνωστου πληθυσμού :

Τύπος για τον υπολογισμό της τυπικής απόκλισης άγνωστου πληθυσμού.

Πρακτικό παράδειγμα ενός διαστήματος εμπιστοσύνης

Μια κλινική μελέτη αξιολόγησε τη σχέση μεταξύ της παρουσίας άσθματος και του κινδύνου εμφάνισης της αποφρακτικής άπνοιας ύπνου σε ενήλικες.

Κάποιοι ενήλικες προσλήφθηκαν τυχαία από έναν κατάλογο κρατικών αξιωματούχων για τέσσερα χρόνια.

Οι συμμετέχοντες με άσθμα, συγκρινόμενοι με αυτούς χωρίς, είχαν μεγαλύτερο κίνδυνο να αναπτύξουν άπνοια σε τέσσερα χρόνια.

Κατά τη διεξαγωγή κλινικής έρευνας όπως αυτό το παράδειγμα, ένα υποσύνολο του πληθυσμού ενδιαφέροντος συνήθως προσλαμβάνεται για να αυξήσει την αποτελεσματικότητα της μελέτης (μείον το κόστος και λιγότερο χρόνο).

Αυτή η υποομάδα ατόμων, ο πληθυσμός που μελετάται, αποτελείται από άτομα που πληρούν τα κριτήρια ένταξης και συμφωνούν να συμμετάσχουν στη μελέτη, όπως φαίνεται στην παρακάτω εικόνα.

Επεξηγηματικό γραφικό του πληθυσμού που μελετήθηκε στο παράδειγμα.

Στη συνέχεια, η μελέτη ολοκληρώνεται και ένα μέγεθος αποτελέσματος (για παράδειγμα, μια μέση διαφορά ή σχετικός κίνδυνος ) υπολογίζεται για να απαντήσει στην ερευνητική ερώτηση.

Αυτή η διαδικασία, που λέγεται συμπέρασμα, περιλαμβάνει τη χρήση δεδομένων που συλλέγονται από τον πληθυσμό της μελέτης για να εκτιμηθεί το μέγεθος της πραγματικής επίδρασης στον πληθυσμό που ενδιαφέρει, δηλαδή στον πληθυσμό της προέλευσης.

Στο παράδειγμα που δόθηκε, οι ερευνητές στρατολόγησαν ένα τυχαίο δείγμα κρατικών υπαλλήλων (πληθυσμός πηγών) που ήταν επιλέξιμοι και συμφώνησαν να συμμετάσχουν στη μελέτη (πληθυσμός μελέτης) και ανέφεραν ότι το άσθμα αυξάνει τον κίνδυνο ανάπτυξης άπνοιας στον πληθυσμό της μελέτης.

Για να ληφθεί υπόψη ένα σφάλμα δειγματοληψίας λόγω της πρόσληψης μόνο μιας υποομάδας του πληθυσμού ενδιαφέροντος, υπολογίστηκε επίσης ένα διάστημα εμπιστοσύνης 95% (γύρω από την εκτίμηση) 1, 06 - 1, 82, υποδεικνύοντας μια πιθανότητα 95 ότι ο πραγματικός σχετικός κίνδυνος στον πληθυσμό πηγής θα ήταν μεταξύ 1, 06 και 1, 82 .

Διάστημα εμπιστοσύνης για τον μέσο όρο

Όταν κάποιος έχει τις πληροφορίες της τυπικής απόκλισης ενός πληθυσμού, μπορεί κανείς να υπολογίσει ένα διάστημα εμπιστοσύνης για τον μέσο όρο ή το μέσο όρο αυτού του πληθυσμού.

Όταν ένα στατιστικό χαρακτηριστικό που μετράται (όπως το εισόδημα, το IQ, η τιμή, το ύψος, η ποσότητα ή το βάρος) είναι αριθμητικό, στις περισσότερες περιπτώσεις υπολογίζεται ότι βρίσκεται η μέση τιμή για τον πληθυσμό.

Έτσι, προσπαθούμε να βρούμε τον μέσο όρο του πληθυσμού ( μ ) χρησιμοποιώντας ένα μέσο δείγματος ( x ^ ), με ένα περιθώριο σφάλματος. Το αποτέλεσμα αυτού του υπολογισμού ονομάζεται διάστημα εμπιστοσύνης για τον μέσο πληθυσμό .

Όταν η τυπική απόκλιση του πληθυσμού είναι γνωστή, ο τύπος για ένα διάστημα εμπιστοσύνης (CI) για έναν μέσο πληθυσμό είναι:

Πού:

  • είναι ο μέσος όρος του δείγματος.
  • σ είναι η τυπική απόκλιση του πληθυσμού.
  • n είναι το μέγεθος του δείγματος.
  • Ζ * αντιπροσωπεύει την κατάλληλη τιμή της κανονικής κανονικής κατανομής για το επιθυμητό επίπεδο εμπιστοσύνης.

Οι ακόλουθες είναι οι τιμές για τα διάφορα επίπεδα εμπιστοσύνης ( Ζ * ):

Επίπεδο εμπιστοσύνηςΑξία του Z * -
80%1.28
90%1.645 (συμβατικό)
95%1.96
98%2.33
99%2, 58

Ο παραπάνω πίνακας δείχνει τιμές z * για τα παρεχόμενα επίπεδα εμπιστοσύνης. Σημειώστε ότι αυτές οι τιμές λαμβάνονται από την κανονική κανονική κατανομή (Z-).

Η περιοχή μεταξύ κάθε τιμής z * και του αρνητικού της τιμής αυτής είναι το (κατά προσέγγιση) ποσοστό εμπιστοσύνης. Για παράδειγμα, η περιοχή μεταξύ z * = 1, 28 και z = -1, 28 είναι περίπου 0, 80. Επομένως, αυτός ο πίνακας μπορεί επίσης να επεκταθεί σε άλλα ποσοστά εμπιστοσύνης. Ο πίνακας δείχνει μόνο τα πιο συχνά χρησιμοποιούμενα ποσοστά εμπιστοσύνης.

Δείτε επίσης την έννοια της Υπόθεσης.