Γραφική αναπαράσταση σειράς διανομής: πολύγωνο, ιστόγραμμα. Δείκτες του κέντρου κατανομής, μεταβλητότητα ενός σημείου

Ας ληφθεί δείγμα από τον γενικό πληθυσμό, και Χ 1 παρατηρήθηκε Π 1 φορά, Χ 2 - Π 2 φορές, x k - σ προςφορές και είναι το μέγεθος του δείγματος. Παρατηρούμενες τιμές Χ 1 ονομάζονται παραλλαγές και η ακολουθία των παραλλαγών γράφεται με αύξουσα σειρά - σειρά παραλλαγής .

Ο αριθμός των παραλλαγών παρατήρησης ονομάζεται συχνότητα και η σχέση του με το μέγεθος του δείγματος ονομάζεται σχετική συχνότητα.

Ορισμός. Στατιστικός (εμπειρικός) νόμος κατανομής του δείγματος, ή απλά στατιστική κατανομή του δείγματοςονομάστε την ακολουθία των επιλογών και τις αντίστοιχες συχνότητές τους n iή σχετικές συχνότητες.

Η στατιστική κατανομή ενός δείγματος αναπαρίσταται εύκολα με τη μορφή ενός πίνακα κατανομής συχνότητας που ονομάζεται στατιστική διακριτή σειρά κατανομής:

(το άθροισμα όλων των σχετικών συχνοτήτων είναι ίσο με ένα).

Παράδειγμα 1. Κατά τη μέτρηση σε ομοιογενείς ομάδες ατόμων, ελήφθησαν τα ακόλουθα δείγματα: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,74 ( καρδιακός ρυθμός). Με βάση αυτά τα αποτελέσματα, συντάξτε μια στατιστική σειρά κατανομών συχνοτήτων και σχετικών συχνοτήτων.

Λύση. 1) Στατιστική σειρά κατανομής συχνοτήτων:

Έλεγχος: 0,1 + 0,2 + 0,4 + 0,1 + 0,2 = 1.

Πολύγωνο συχνότηταςονομάζεται διακεκομμένη γραμμή, τμήματα που συνδέουν σημεία Για την κατασκευή ενός πολυγώνου συχνότητας, οι επιλογές διατάσσονται στον άξονα της τετμημένης Χ 2, και στην τεταγμένη - οι αντίστοιχες συχνότητες πι .Τα σημεία συνδέονται με τμήματα και προκύπτει ένα πολύγωνο συχνότητας.

Πολύγωνο σχετικών συχνοτήτωνονομάζεται διακεκομμένη γραμμή, τμήματα που συνδέουν σημεία. Για την κατασκευή ενός πολυγώνου σχετικών συχνοτήτων, οι επιλογές σχεδιάζονται στον άξονα της τετμημένης Χ i , και στον άξονα τεταγμένων οι αντίστοιχες συχνότητες wΕγώ. Τα σημεία συνδέονται με τμήματα και προκύπτει ένα πολύγωνο σχετικών συχνοτήτων

Παράδειγμα 2.Κατασκευάστε ένα πολύγωνο συχνότητας και ένα πολύγωνο σχετικής συχνότητας με βάση τα δεδομένα στο Παράδειγμα 1.

Λύση:Χρησιμοποιώντας τη διακριτή στατιστική σειρά κατανομής που συντάχθηκε στο παράδειγμα 1, θα κατασκευάσουμε ένα πολύγωνο συχνότητας και ένα πολύγωνο σχετικής συχνότητας:


2. Στατιστικές σειρές κατανομής διαστημάτων. ραβδόγραμμα.

Μια στατιστική διακριτή σειρά (ή μια εμπειρική συνάρτηση κατανομής) χρησιμοποιείται συνήθως όταν δεν υπάρχουν πάρα πολλές παραλλαγές στο δείγμα που είναι διαφορετικές μεταξύ τους ή όταν η διακριτικότητα για τον έναν ή τον άλλο λόγο είναι σημαντική για τον ερευνητή. Εάν το χαρακτηριστικό του γενικού πληθυσμού Χ που μας ενδιαφέρει κατανέμεται συνεχώς ή η διακριτότητά του είναι πρακτικό (ή αδύνατο) να ληφθεί υπόψη, τότε οι επιλογές ομαδοποιούνται σε διαστήματα.


Η στατιστική κατανομή μπορεί επίσης να καθοριστεί ως μια ακολουθία διαστημάτων και των συχνοτήτων που αντιστοιχούν σε αυτά (το άθροισμα των συχνοτήτων που εμπίπτουν σε αυτό το διάστημα λαμβάνεται ως η συχνότητα που αντιστοιχεί στο διάστημα).

1. R(span) = X max -X ​​min

2. κ-αριθμός ομάδων

3. (φόρμουλα Sturges)

4. a = x min, b = x max

Είναι βολικό να παρουσιάζεται η προκύπτουσα ομαδοποίηση με τη μορφή πίνακα συχνοτήτων, ο οποίος ονομάζεται στατιστικές σειρές κατανομής διαστημάτων:

Διαστήματα παρατάξεις ...
Συχνότητες ...

Ένας ανάλογος πίνακας μπορεί να σχηματιστεί αντικαθιστώντας τις συχνότητες n iσχετικές συχνότητες.

Παρουσιάζονται με τη μορφή σειρών διανομής και παρουσιάζονται στη μορφή.

Μια σειρά διανομής είναι ένας από τους τύπους ομαδοποιήσεων.

Εύρος διανομής— αντιπροσωπεύει μια διατεταγμένη κατανομή των μονάδων του πληθυσμού που μελετάται σε ομάδες σύμφωνα με ένα συγκεκριμένο διαφορετικό χαρακτηριστικό.

Ανάλογα με το χαρακτηριστικό στο οποίο βασίζεται ο σχηματισμός της σειράς διανομής, διακρίνονται αποδοτική και μεταβλητήσειρές διανομής:

  • Προσδιοριστικό- ονομάζονται σειρές διανομής που κατασκευάζονται σύμφωνα με ποιοτικά χαρακτηριστικά.
  • Οι σειρές κατανομής που κατασκευάζονται με αύξουσα ή φθίνουσα σειρά τιμών ενός ποσοτικού χαρακτηριστικού ονομάζονται μεταβλητή.
Η σειρά παραλλαγών της διανομής αποτελείται από δύο στήλες:

Η πρώτη στήλη παρέχει ποσοτικές τιμές του ποικίλου χαρακτηριστικού, οι οποίες ονομάζονται επιλογέςκαι ορίζονται . Διακριτή επιλογή - εκφράζεται ως ακέραιος αριθμός. Η επιλογή διαστήματος κυμαίνεται από και έως. Ανάλογα με τον τύπο των επιλογών, μπορείτε να κατασκευάσετε μια διακριτή ή διαλειμματική σειρά παραλλαγών.
Η δεύτερη στήλη περιέχει αριθμός συγκεκριμένης επιλογής, εκφραζόμενη σε συχνότητες ή συχνότητες:

Συχνότητες- αυτοί είναι απόλυτοι αριθμοί που δείχνουν πόσες φορές μια δεδομένη τιμή ενός χαρακτηριστικού εμφανίζεται συνολικά, που δηλώνουν . Το άθροισμα όλων των συχνοτήτων πρέπει να είναι ίσο με τον αριθμό των μονάδων σε ολόκληρο τον πληθυσμό.

Συχνότητες() είναι οι συχνότητες που εκφράζονται ως ποσοστό του συνόλου. Το άθροισμα όλων των συχνοτήτων εκφρασμένο σε ποσοστά πρέπει να είναι ίσο με 100% σε κλάσματα του ενός.

Γραφική αναπαράσταση σειρών διανομής

Οι σειρές διανομής παρουσιάζονται οπτικά χρησιμοποιώντας γραφικές εικόνες.

Οι σειρές διανομής απεικονίζονται ως εξής:
  • Πολύγωνο
  • Ιστογράμματα
  • Σωρεύεται
  • Ogives

Πολύγωνο

Κατά την κατασκευή ενός πολυγώνου, οι τιμές του μεταβαλλόμενου χαρακτηριστικού απεικονίζονται στον οριζόντιο άξονα (άξονας x) και οι συχνότητες ή οι συχνότητες απεικονίζονται στον κατακόρυφο άξονα (άξονας y).

Το πολύγωνο στο Σχ. Το 6.1 βασίζεται σε στοιχεία από τη μικροαπογραφή του πληθυσμού της Ρωσίας το 1994.

6.1. Κατανομή μεγέθους νοικοκυριού

Κατάσταση: Παρέχονται στοιχεία για την κατανομή 25 εργαζομένων μιας από τις επιχειρήσεις σύμφωνα με τις κατηγορίες τιμολογίων:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Εργο: Κατασκευάστε μια διακριτή σειρά παραλλαγών και απεικονίστε την γραφικά ως πολύγωνο διανομής.
Λύση:
Σε αυτό το παράδειγμα, οι επιλογές είναι ο βαθμός αμοιβής του υπαλλήλου. Για τον προσδιορισμό των συχνοτήτων, είναι απαραίτητο να υπολογιστεί ο αριθμός των εργαζομένων με την αντίστοιχη τιμολογιακή κατηγορία.

Το πολύγωνο χρησιμοποιείται για διακριτές σειρές παραλλαγών.

Για να κατασκευάσουμε ένα πολύγωνο κατανομής (Εικ. 1), σχεδιάζουμε τις ποσοτικές τιμές των μεταβαλλόμενων χαρακτηριστικών - επιλογών - στον άξονα της τετμημένης (Χ) και τις συχνότητες ή τις συχνότητες στον άξονα τεταγμένων.

Εάν οι τιμές ενός χαρακτηριστικού εκφράζονται με τη μορφή διαστημάτων, τότε μια τέτοια σειρά ονομάζεται διάστημα.
Διαλειμματική σειράΟι κατανομές απεικονίζονται γραφικά με τη μορφή ιστογράμματος, αθροίσματος ή συλλογισμού.

Στατιστικός πίνακας

Κατάσταση: Παρέχονται δεδομένα σχετικά με το μέγεθος των καταθέσεων 20 ατόμων σε μία τράπεζα (χιλιάδες ρούβλια) 60. 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Εργο: Κατασκευάστε μια σειρά παραλλαγής διαστήματος με ίσα διαστήματα.
Λύση:

  1. Ο αρχικός πληθυσμός αποτελείται από 20 μονάδες (N = 20).
  2. Χρησιμοποιώντας τον τύπο Sturgess, προσδιορίζουμε τον απαιτούμενο αριθμό ομάδων που χρησιμοποιούνται: n=1+3,322*lg20=5
  3. Ας υπολογίσουμε την τιμή του ίσου διαστήματος: i=(152 - 2) /5 = 30 χιλιάδες ρούβλια
  4. Ας χωρίσουμε τον αρχικό πληθυσμό σε 5 ομάδες με ένα διάστημα 30 χιλιάδων ρούβλια.
  5. Παραθέτουμε τα αποτελέσματα της ομαδοποίησης στον πίνακα:

Με μια τέτοια καταγραφή ενός συνεχούς χαρακτηριστικού, όταν η ίδια τιμή εμφανίζεται δύο φορές (ως το ανώτερο όριο ενός διαστήματος και το κατώτερο όριο ενός άλλου διαστήματος), τότε αυτή η τιμή ανήκει στην ομάδα όπου αυτή η τιμή λειτουργεί ως ανώτατο όριο.

ραβδόγραμμα

Για την κατασκευή ενός ιστογράμματος, οι τιμές των ορίων των διαστημάτων υποδεικνύονται κατά μήκος του άξονα της τετμημένης και, βάσει αυτών, κατασκευάζονται ορθογώνια, το ύψος των οποίων είναι ανάλογο με τις συχνότητες (ή τις συχνότητες).

Στο Σχ. 6.2. δείχνει ένα ιστόγραμμα της κατανομής του ρωσικού πληθυσμού το 1997 ανά ηλικιακή ομάδα.

Ρύζι. 6.2. Κατανομή του ρωσικού πληθυσμού ανά ηλικιακές ομάδες

Κατάσταση: Δίνεται η κατανομή 30 εργαζομένων της εταιρείας κατά μηνιαίο μισθό

Εργο: Εμφανίστε γραφικά τη σειρά μεταβολών διαστήματος με τη μορφή ιστογράμματος και αθροίστε.
Λύση:

  1. Το άγνωστο όριο του ανοιχτού (πρώτου) διαστήματος καθορίζεται από την τιμή του δεύτερου διαστήματος: 7000 - 5000 = 2000 ρούβλια. Με την ίδια τιμή βρίσκουμε το κατώτερο όριο του πρώτου διαστήματος: 5000 - 2000 = 3000 ρούβλια.
  2. Για να κατασκευάσουμε ένα ιστόγραμμα σε ένα ορθογώνιο σύστημα συντεταγμένων, σχεδιάζουμε κατά μήκος του άξονα της τετμημένης τα τμήματα των οποίων οι τιμές αντιστοιχούν στα διαστήματα της σειράς κιρσών.
    Αυτά τα τμήματα χρησιμεύουν ως η κάτω βάση και η αντίστοιχη συχνότητα (συχνότητα) χρησιμεύει ως το ύψος των σχηματισμένων ορθογωνίων.
  3. Ας φτιάξουμε ένα ιστόγραμμα:

Για την κατασκευή αθροιστικών, είναι απαραίτητος ο υπολογισμός των συσσωρευμένων συχνοτήτων (συχνότητες). Καθορίζονται αθροίζοντας διαδοχικά τις συχνότητες (συχνότητες) προηγούμενων διαστημάτων και ονομάζονται S. Οι συσσωρευμένες συχνότητες δείχνουν πόσες μονάδες του πληθυσμού έχουν χαρακτηριστική τιμή όχι μεγαλύτερη από αυτήν που εξετάζουμε.

Σωρεύεται

Η κατανομή ενός χαρακτηριστικού σε μια σειρά παραλλαγών σε συσσωρευμένες συχνότητες (συχνότητες) απεικονίζεται χρησιμοποιώντας μια συσσώρευση.

Σωρεύεταιή μια αθροιστική καμπύλη, σε αντίθεση με ένα πολύγωνο, κατασκευάζεται από συσσωρευμένες συχνότητες ή συχνότητες. Σε αυτή την περίπτωση, οι τιμές του χαρακτηριστικού τοποθετούνται στον άξονα της τετμημένης και οι συσσωρευμένες συχνότητες ή συχνότητες τοποθετούνται στον άξονα τεταγμένων (Εικ. 6.3).

Ρύζι. 6.3. Σωρευτικά κατανομή μεγέθους νοικοκυριού

4. Ας υπολογίσουμε τις συσσωρευμένες συχνότητες:
Η αθροιστική συχνότητα του πρώτου διαστήματος υπολογίζεται ως εξής: 0 + 4 = 4, για το δεύτερο: 4 + 12 = 16. για το τρίτο: 4 + 12 + 8 = 24, κ.λπ.

Κατά την κατασκευή ενός αθροίσματος, η συσσωρευμένη συχνότητα (συχνότητα) του αντίστοιχου διαστήματος εκχωρείται στο ανώτερο όριο του:

Ογκίβα

Ογκίβακατασκευάζεται παρόμοια με μια συσσώρευση με τη μόνη διαφορά ότι οι συσσωρευμένες συχνότητες τοποθετούνται στον άξονα της τετμημένης και οι χαρακτηριστικές τιμές τοποθετούνται στον άξονα τεταγμένων.

Ένας τύπος αθροίσματος είναι μια καμπύλη συγκέντρωσης ή διάγραμμα Lorentz. Για την κατασκευή μιας καμπύλης συγκέντρωσης, μια κλίμακα κλίμακας σε ποσοστά από 0 έως 100 σχεδιάζεται και στους δύο άξονες του ορθογώνιου συστήματος συντεταγμένων. Ταυτόχρονα, οι συσσωρευμένες συχνότητες υποδεικνύονται στον άξονα της τετμημένης και οι συσσωρευμένες τιμές του μεριδίου (σε ποσοστό) κατ' όγκο του χαρακτηριστικού υποδεικνύονται στον άξονα τεταγμένων.

Η ομοιόμορφη κατανομή του χαρακτηριστικού αντιστοιχεί στη διαγώνιο του τετραγώνου στο γράφημα (Εικ. 6.4). Με ανομοιόμορφη κατανομή, το γράφημα αντιπροσωπεύει μια κοίλη καμπύλη ανάλογα με το επίπεδο συγκέντρωσης του χαρακτηριστικού.

6.4. Καμπύλη συγκέντρωσης

Πολύγωνο συχνότητας

Ας μας δοθεί μια σειρά διανομής γραμμένη χρησιμοποιώντας έναν πίνακα:

Εικόνα 1.

Ορισμός 1

Πολύγωνο συχνότητας-- μια διακεκομμένη γραμμή που συνδέει τα σημεία $(x_m,n_m)$ ($m=1,2,\dots ,m)$.

Δηλαδή, για την κατασκευή ενός πολυγώνου συχνότητας, είναι απαραίτητο να σχεδιάσουμε τις παραλλαγές στον άξονα της τετμημένης και τις αντίστοιχες συχνότητες κατά μήκος του άξονα τεταγμένων. Τα σημεία που προκύπτουν συνδέονται με μια διακεκομμένη γραμμή:

Εικόνα 2. Πολύγωνο συχνότητας.

Εκτός από τη συνηθισμένη συχνότητα, υπάρχει και η έννοια της σχετικής συχνότητας.

Λαμβάνουμε τον ακόλουθο πίνακα κατανομής των σχετικών συχνοτήτων:

Εικόνα 3.

Ορισμός 2

Πολύγωνο σχετικής συχνότητας-- μια διακεκομμένη γραμμή που συνδέει τα σημεία $(x_m,W_m)$ ($m=1,2,\dots ,m)$.

Δηλαδή, για την κατασκευή ενός πολυγώνου συχνότητας, είναι απαραίτητο να σχεδιάσουμε τις τιμές παραλλαγής στον άξονα της τετμημένης και τις αντίστοιχες σχετικές συχνότητες κατά μήκος του άξονα τεταγμένων. Τα σημεία που προκύπτουν συνδέονται με μια διακεκομμένη γραμμή:

Σχήμα 4. Πολύγωνο σχετικής συχνότητας.

Ιστόγραμμα συχνότητας

Εκτός από την έννοια του πολυωνύμου για συνεχείς τιμές, υπάρχει και η έννοια του ιστογράμματος.

Σημειώστε ότι το εμβαδόν ενός τέτοιου ορθογωνίου είναι $\frac(n_ih)(h)=n_i$. Επομένως, η περιοχή ολόκληρου του σχήματος είναι ίση με $\sum(n_i)=n$, δηλαδή ίση με τον όγκο του δείγματος.

Ορισμός 4

Ιστόγραμμα σχετικής συχνότητας-- ένα κλιμακωτό σχήμα που αποτελείται από ορθογώνια με βάση -- μερικά διαστήματα μήκους $h$ και ύψη $\frac(W_i)(h)$:

Εικόνα 6. Ιστόγραμμα σχετικής συχνότητας.

Σημειώστε ότι το εμβαδόν ενός τέτοιου ορθογωνίου είναι $\frac(W_ih)(h)=W_i$. Επομένως, το εμβαδόν ολόκληρου του σχήματος είναι $\sum(W_i)=W=1$.

Παραδείγματα προβλημάτων για την κατασκευή πολυγώνου και ιστογράμματος

Παράδειγμα 1

Ας έχει η κατανομή συχνότητας τη μορφή:

Εικόνα 7.

Κατασκευάστε ένα πολύγωνο σχετικών συχνοτήτων.

Ας κατασκευάσουμε πρώτα μια σειρά σχετικών κατανομών συχνότητας χρησιμοποιώντας τον τύπο $W_i=\frac(n_i)(n)$

Ομαδοποίηση- αυτή είναι η διαίρεση ενός πληθυσμού σε ομάδες που είναι ομοιογενείς σύμφωνα με κάποιο χαρακτηριστικό.

Σκοπός της υπηρεσίας. Χρησιμοποιώντας την ηλεκτρονική αριθμομηχανή μπορείτε:

  • δημιουργήστε μια σειρά παραλλαγών, να δημιουργήσετε ένα ιστόγραμμα και ένα πολύγωνο.
  • βρείτε δείκτες διακύμανσης (μέσος όρος, τρόπος λειτουργίας (συμπεριλαμβανομένων γραφικών), διάμεσος, εύρος διακύμανσης, τεταρτημόρια, δεκαδικά, συντελεστής διαφοροποίησης τεταρτημορίου, συντελεστής διακύμανσης και άλλοι δείκτες).

Οδηγίες. Για να ομαδοποιήσετε μια σειρά, πρέπει να επιλέξετε τον τύπο της σειράς παραλλαγής που λαμβάνεται (διακεκριμένη ή μεσοδιαστήματα) και να υποδείξετε τον όγκο των δεδομένων (αριθμός σειρών). Η λύση που προκύπτει αποθηκεύεται σε ένα αρχείο Word (δείτε παράδειγμα ομαδοποίησης στατιστικών δεδομένων).

Εάν η ομαδοποίηση έχει ήδη πραγματοποιηθεί και η σειρά διακριτών παραλλαγώνή σειρές μεσοδιαστημάτων, τότε πρέπει να χρησιμοποιήσετε την ηλεκτρονική αριθμομηχανή Variation Indices. Έλεγχος της υπόθεσης για το είδος της κατανομήςπραγματοποιείται με χρήση της υπηρεσίας Μελετώντας το έντυπο διανομής.

Τύποι στατιστικών ομαδοποιήσεων

Σειρά παραλλαγής. Στην περίπτωση των παρατηρήσεων μιας διακριτής τυχαίας μεταβλητής, η ίδια τιμή μπορεί να συναντηθεί πολλές φορές. Τέτοιες τιμές x i μιας τυχαίας μεταβλητής καταγράφονται υποδεικνύοντας n i πόσες φορές εμφανίζεται σε n παρατηρήσεις, αυτή είναι η συχνότητα αυτής της τιμής.
Στην περίπτωση μιας συνεχούς τυχαίας μεταβλητής, η ομαδοποίηση χρησιμοποιείται στην πράξη.
  1. Τυπολογική ομαδοποίηση- αυτή είναι η διαίρεση του ποιοτικά ετερογενούς πληθυσμού υπό μελέτη σε τάξεις, κοινωνικοοικονομικούς τύπους, ομοιογενείς ομάδες μονάδων. Για να δημιουργήσετε αυτήν την ομαδοποίηση, χρησιμοποιήστε την παράμετρο σειράς διακριτών παραλλαγής.
  2. Μια ομαδοποίηση ονομάζεται δομική, στην οποία ένας ομοιογενής πληθυσμός χωρίζεται σε ομάδες που χαρακτηρίζουν τη δομή του σύμφωνα με κάποιο διαφορετικό χαρακτηριστικό. Για να δημιουργήσετε αυτήν την ομαδοποίηση, χρησιμοποιήστε την παράμετρο Interval series.
  3. Μια ομαδοποίηση που αποκαλύπτει τις σχέσεις μεταξύ των φαινομένων που μελετώνται και των χαρακτηριστικών τους ονομάζεται αναλυτική ομάδα(βλ. αναλυτική ομαδοποίηση σειρών).

Παράδειγμα Νο. 1. Με βάση τα δεδομένα του Πίνακα 2, κατασκευάστε σειρές διανομής για 40 εμπορικές τράπεζες της Ρωσικής Ομοσπονδίας. Χρησιμοποιώντας την προκύπτουσα σειρά διανομής, προσδιορίστε: κέρδος κατά μέσο όρο ανά εμπορική τράπεζα, πιστωτικές επενδύσεις κατά μέσο όρο ανά εμπορική τράπεζα, τροπική και διάμεση αξία κέρδους. τεταρτημόρια, δεκαδικά, εύρος διακύμανσης, μέση γραμμική απόκλιση, τυπική απόκλιση, συντελεστής διακύμανσης.

Λύση:
Στο κεφάλαιο "Είδος στατιστικής σειράς"επιλέξτε Διακριτή σειρά. Κάντε κλικ στην επιλογή Εισαγωγή από το Excel. Αριθμός ομάδων: σύμφωνα με τον τύπο Sturgess

Αρχές κατασκευής στατιστικών ομαδοποιήσεων

Μια σειρά από παρατηρήσεις που ταξινομούνται σε αύξουσα σειρά ονομάζεται σειρά παραλλαγών. Δυνατότητα ομαδοποίησηςείναι ένα χαρακτηριστικό με το οποίο ένας πληθυσμός χωρίζεται σε ξεχωριστές ομάδες. Ονομάζεται η βάση της ομάδας. Η ομαδοποίηση μπορεί να βασίζεται τόσο σε ποσοτικά όσο και σε ποιοτικά χαρακτηριστικά.
Μετά τον καθορισμό της βάσης της ομαδοποίησης, θα πρέπει να αποφασιστεί το ζήτημα του αριθμού των ομάδων στις οποίες θα πρέπει να χωριστεί ο υπό μελέτη πληθυσμός.

Κατά τη χρήση προσωπικών υπολογιστών για την επεξεργασία στατιστικών δεδομένων, η ομαδοποίηση των μονάδων αντικειμένων πραγματοποιείται χρησιμοποιώντας τυπικές διαδικασίες.
Μια τέτοια διαδικασία βασίζεται στη χρήση του τύπου Sturgess για τον προσδιορισμό του βέλτιστου αριθμού ομάδων:

k = 1+3,322*log(N)

Όπου k είναι ο αριθμός των ομάδων, N είναι ο αριθμός των πληθυσμιακών μονάδων.

Το μήκος των μερικών διαστημάτων υπολογίζεται ως h=(x max -x min)/k

Στη συνέχεια μετρώνται οι αριθμοί των παρατηρήσεων που εμπίπτουν σε αυτά τα διαστήματα, οι οποίοι λαμβάνονται ως συχνότητες n i . Λίγες συχνότητες, οι τιμές των οποίων είναι μικρότερες από 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Οι μεσαίες τιμές των διαστημάτων x i =(c i-1 +c i)/2 λαμβάνονται ως νέες τιμές.

Παράδειγμα Νο. 3. Ως αποτέλεσμα ενός τυχαίου δείγματος 5%, προέκυψε η ακόλουθη κατανομή των προϊόντων ανά περιεκτικότητα σε υγρασία. Υπολογίστε: 1) μέσο ποσοστό υγρασίας. 2) δείκτες που χαρακτηρίζουν τις διακυμάνσεις της υγρασίας.
Το διάλυμα ελήφθη χρησιμοποιώντας έναν υπολογιστή: Παράδειγμα Νο. 1

Κατασκευάστε μια σειρά παραλλαγών. Με βάση τη σειρά που βρέθηκε, κατασκευάστε ένα πολύγωνο κατανομής, ιστόγραμμα και αθροίστε. Προσδιορίστε τη λειτουργία και τη διάμεσο.
Λήψη λύσης

Παράδειγμα. Σύμφωνα με τα αποτελέσματα της παρατήρησης του δείγματος (δείγμα Α, Παράρτημα):
α) κάντε μια σειρά παραλλαγής.
β) υπολογίζει τις σχετικές συχνότητες και τις συσσωρευμένες σχετικές συχνότητες.
γ) να φτιάξετε ένα πολύγωνο.
δ) δημιουργία μιας εμπειρικής συνάρτησης διανομής.
ε) σχεδιάστε την εμπειρική συνάρτηση κατανομής.
στ) να υπολογίσετε τα αριθμητικά χαρακτηριστικά: αριθμητικός μέσος όρος, διασπορά, τυπική απόκλιση. Λύση

Με βάση τα δεδομένα που δίνονται στον Πίνακα 4 (Παράρτημα 1) και που αντιστοιχούν στην επιλογή σας, κάντε:

  1. Με βάση τη δομική ομαδοποίηση, κατασκευάστε σειρές μεταβλητής συχνότητας και αθροιστικής κατανομής χρησιμοποιώντας ίσα κλειστά διαστήματα, λαμβάνοντας τον αριθμό των ομάδων ίσο με 6. Παρουσιάστε τα αποτελέσματα σε μορφή πίνακα και εμφανίστε γραφικά.
  2. Αναλύστε τη σειρά παραλλαγών της κατανομής υπολογίζοντας:
    • αριθμητική μέση τιμή του χαρακτηριστικού.
    • κατάσταση λειτουργίας, διάμεσος, 1ο τεταρτημόριο, 1ο και 9ο δεκαδικό.
    • τυπική απόκλιση;
    • ο συντελεστής διακύμανσης.
  3. Βγαζω συμπερασματα.

Απαιτείται: κατάταξη της σειράς, κατασκευή μιας σειράς κατανομής διαστήματος, υπολογισμός της μέσης τιμής, μεταβλητότητας της μέσης τιμής, τρόπου λειτουργίας και διάμεσος για τη σειρά κατάταξης και διαστήματος.

Με βάση τα αρχικά δεδομένα, κατασκευάστε μια διακριτή σειρά παραλλαγών. να το παρουσιάσετε με τη μορφή στατιστικού πίνακα και στατιστικών γραφημάτων. 2). Με βάση τα αρχικά δεδομένα, κατασκευάστε μια σειρά μεταβολών διαστήματος με ίσα διαστήματα. Επιλέξτε μόνοι σας τον αριθμό των διαστημάτων και εξηγήστε αυτήν την επιλογή. Παρουσιάστε τη σειρά παραλλαγών που προκύπτει με τη μορφή στατιστικού πίνακα και στατιστικών γραφημάτων. Αναφέρετε τους τύπους των πινάκων και των γραφημάτων που χρησιμοποιούνται.

Προκειμένου να προσδιοριστεί η μέση διάρκεια εξυπηρέτησης πελατών σε ένα συνταξιοδοτικό ταμείο, ο αριθμός των πελατών του οποίου είναι πολύ μεγάλος, διεξήχθη έρευνα σε 100 πελάτες χρησιμοποιώντας ένα τυχαίο, μη επαναλαμβανόμενο σύστημα δειγματοληψίας. Τα αποτελέσματα της έρευνας παρουσιάζονται στον πίνακα. Εύρημα:
α) τα όρια εντός των οποίων περιλαμβάνεται, με πιθανότητα 0,9946, ο μέσος χρόνος υπηρεσίας για όλους τους πελάτες του συνταξιοδοτικού ταμείου·
β) την πιθανότητα το μερίδιο όλων των πελατών κεφαλαίων με διάρκεια υπηρεσίας μικρότερη από 6 λεπτά να διαφέρει από το μερίδιο αυτών των πελατών στο δείγμα κατά όχι περισσότερο από 10% (σε απόλυτη τιμή).
γ) τον όγκο της επαναλαμβανόμενης δειγματοληψίας, στον οποίο με πιθανότητα 0,9907 μπορεί να δηλωθεί ότι το μερίδιο όλων των πελατών κεφαλαίων με διάρκεια υπηρεσίας μικρότερη από 6 λεπτά διαφέρει από το μερίδιο αυτών των πελατών στο δείγμα κατά όχι περισσότερο από 10 % (σε απόλυτη τιμή).
2. Σύμφωνα με τα δεδομένα της εργασίας 1, χρησιμοποιώντας το κριτήριο Χ 2 του Pearson, σε επίπεδο σημαντικότητας α = 0,05, ελέγξτε την υπόθεση ότι η τυχαία μεταβλητή Χ - χρόνος εξυπηρέτησης πελατών - κατανέμεται σύμφωνα με τον κανονικό νόμο. Κατασκευάστε ένα ιστόγραμμα της εμπειρικής κατανομής και της αντίστοιχης κανονικής καμπύλης σε ένα σχέδιο.
Λήψη λύσης

Δίνεται δείγμα 100 στοιχείων. Απαραίτητη:

  1. Κατασκευάστε μια ταξινομημένη σειρά παραλλαγών.
  2. Βρείτε τους μέγιστους και ελάχιστους όρους της σειράς.
  3. Βρείτε το εύρος διακύμανσης και τον αριθμό των βέλτιστων διαστημάτων για την κατασκευή μιας σειράς διαστημάτων. Βρείτε το μήκος του διαστήματος της σειράς διαστημάτων.
  4. Κατασκευάστε μια σειρά διαστημάτων. Βρείτε τις συχνότητες των δειγματοληπτικών στοιχείων που εμπίπτουν στα σύνθετα διαστήματα. Βρείτε τα μεσαία σημεία κάθε διαστήματος.
  5. Κατασκευάστε ένα ιστόγραμμα και ένα πολύγωνο συχνότητας. Συγκρίνετε με την κανονική κατανομή (αναλυτικά και γραφικά).
  6. Σχεδιάστε τη συνάρτηση εμπειρικής κατανομής.
  7. Υπολογίστε τα αριθμητικά χαρακτηριστικά του δείγματος: μέση τιμή δείγματος και κεντρική ροπή δείγματος.
  8. Υπολογίστε κατά προσέγγιση τιμές τυπικής απόκλισης, λοξότητας και κύρτωσης (χρησιμοποιώντας το πακέτο ανάλυσης MS Excel). Συγκρίνετε τις κατά προσέγγιση υπολογισμένες τιμές με τις ακριβείς (υπολογισμένες χρησιμοποιώντας τύπους MS Excel).
  9. Συγκρίνετε επιλεγμένα γραφικά χαρακτηριστικά με τα αντίστοιχα θεωρητικά.
Λήψη λύσης

Τα ακόλουθα δείγματα δεδομένων είναι διαθέσιμα (10% δείγμα, μηχανικά) σχετικά με την παραγωγή προϊόντος και το ποσό του κέρδους, εκατομμύρια ρούβλια. Σύμφωνα με τα αρχικά στοιχεία:
Εργασία 13.1.
13.1.1. Κατασκευάστε μια στατιστική σειρά κατανομής των επιχειρήσεων κατά το ποσό του κέρδους, σχηματίζοντας πέντε ομάδες με ίσα διαστήματα. Κατασκευάστε γραφήματα σειρών διανομής.
13.1.2. Υπολογίστε τα αριθμητικά χαρακτηριστικά της σειράς διανομής των επιχειρήσεων με το ύψος του κέρδους: αριθμητικός μέσος όρος, τυπική απόκλιση, διασπορά, συντελεστής διακύμανσης V. Εξαγωγή συμπερασμάτων.
Εργασία 13.2.
13.2.1. Προσδιορίστε τα όρια μέσα στα οποία, με πιθανότητα 0,997, βρίσκεται το ποσό του κέρδους μιας επιχείρησης στο γενικό πληθυσμό.
13.2.2. Χρησιμοποιώντας το τεστ x2 του Pearson, στο επίπεδο σημαντικότητας α, ελέγξτε την υπόθεση ότι η τυχαία μεταβλητή Χ - το ποσό του κέρδους - κατανέμεται σύμφωνα με έναν κανονικό νόμο.
Εργασία 13.3.
13.3.1. Προσδιορίστε τους συντελεστές της εξίσωσης παλινδρόμησης του δείγματος.
13.3.2. Καθορίστε την παρουσία και τη φύση της συσχέτισης μεταξύ του κόστους των κατασκευασμένων προϊόντων (Χ) και του ποσού του κέρδους ανά επιχείρηση (Υ). Κατασκευάστε μια γραμμή διασποράς και παλινδρόμησης.
13.3.3. Υπολογίστε τον γραμμικό συντελεστή συσχέτισης. Χρησιμοποιώντας το Student's t-test, ελέγξτε τη σημασία του συντελεστή συσχέτισης. Εξάγετε ένα συμπέρασμα σχετικά με τη στενή σχέση μεταξύ των παραγόντων Χ και Υ χρησιμοποιώντας την κλίμακα Chaddock.
Κατευθυντήριες γραμμές. Η εργασία 13.3 εκτελείται χρησιμοποιώντας αυτήν την υπηρεσία.
Λήψη λύσης

Εργο. Τα ακόλουθα δεδομένα αντιπροσωπεύουν το χρόνο που αφιερώνουν οι πελάτες για τη σύναψη συμβάσεων. Κατασκευάστε μια σειρά διαστημάτων διακύμανσης των παρουσιαζόμενων δεδομένων, ένα ιστόγραμμα, βρείτε μια αμερόληπτη εκτίμηση της μαθηματικής προσδοκίας, μια προκατειλημμένη και αμερόληπτη εκτίμηση της διακύμανσης.

Παράδειγμα. Σύμφωνα με τον Πίνακα 2:
1) Κατασκευάστε σειρά διανομής για 40 εμπορικές τράπεζες της Ρωσικής Ομοσπονδίας:
Α) ως προς το κέρδος?
Β) κατά το ποσό των πιστωτικών επενδύσεων.
2) Χρησιμοποιώντας τη ληφθείσα σειρά διανομής, προσδιορίστε:
Α) μέσο κέρδος ανά εμπορική τράπεζα.
Β) πιστωτικές επενδύσεις κατά μέσο όρο ανά εμπορική τράπεζα.
Γ) τροπική και διάμεση αξία του κέρδους. τεταρτημόρια, δεκαδικά?
Δ) τροπική και διάμεση αξία των πιστωτικών επενδύσεων.
3) Χρησιμοποιώντας τις σειρές διανομής που ελήφθησαν στο βήμα 1, υπολογίστε:
α) εύρος διακύμανσης·
β) μέση γραμμική απόκλιση.
γ) τυπική απόκλιση.
δ) συντελεστής διακύμανσης.
Συμπληρώστε τους απαραίτητους υπολογισμούς σε μορφή πίνακα. Αναλύστε τα αποτελέσματα. Βγαζω συμπερασματα.
Γραφήματα σχεδίασης της προκύπτουσας σειράς διανομής. Προσδιορίστε τη λειτουργία και τη διάμεσο γραφικά.

Λύση:
Για να δημιουργήσουμε μια ομαδοποίηση με ίσα διαστήματα, θα χρησιμοποιήσουμε την υπηρεσία Ομαδοποίηση στατιστικών δεδομένων.

Εικόνα 1 – Εισαγωγή παραμέτρων

Περιγραφή παραμέτρων
Αριθμός γραμμών: αριθμός δεδομένων εισόδου. Εάν το μέγεθος της σειράς είναι μικρό, υποδείξτε την ποσότητα της. Εάν η επιλογή είναι αρκετά μεγάλη, κάντε κλικ στο κουμπί Εισαγωγή από το Excel.
Αριθμός ομάδων: 0 – ο αριθμός των ομάδων θα καθοριστεί από τον τύπο Sturgess.
Εάν έχει καθοριστεί ένας συγκεκριμένος αριθμός ομάδων, καθορίστε τον (για παράδειγμα, 5).
Τύπος σειράς: Διακριτή σειρά.
Επίπεδο σημασίας: για παράδειγμα 0,954 . Αυτή η παράμετρος ρυθμίζεται για τον προσδιορισμό του διαστήματος εμπιστοσύνης του μέσου όρου.
Δείγμα: Για παράδειγμα, πραγματοποιήθηκε μηχανική δειγματοληψία 10%. Δηλώνουμε τον αριθμό 10. Για τα δεδομένα μας αναφέρουμε 100.

Για λόγους σαφήνειας, κατασκευάζονται διάφορα γραφήματα στατιστικής κατανομής, ιδίως ένα πολύγωνο και ένα ιστόγραμμα.

Ορισμός. Πολύγωνοσυχνότητες ονομάζεται διακεκομμένη γραμμή, τα τμήματα της οποίας συνδέουν τα σημεία (x 1, n 1), (x 2, n 2), ..., (x k, n k).

Για την κατασκευή ενός πολυγώνου συχνότητας, οι επιλογές x i σχεδιάζονται στον άξονα της τετμημένης και οι αντίστοιχες συχνότητες n i στον άξονα τεταγμένων. Τα σημεία (x i, n i) συνδέονται με ευθείες γραμμές και προκύπτει ένα πολύγωνο συχνότητας.

Ορισμός. Πολύγωνο σχετικών συχνοτήτωνονομάζεται διακεκομμένη γραμμή, τα τμήματα της οποίας συνδέουν τα σημεία (x 1, w 1), (x 2, w 2), ..., (x k, w k).

Για την κατασκευή ενός πολυγώνου συχνότητας, οι επιλογές x i απεικονίζονται στον άξονα της τετμημένης και το w i στον άξονα τεταγμένων. Τα σημεία (x i, w i) συνδέονται με ευθείες γραμμές και προκύπτει ένα πολύγωνο σχετικών συχνοτήτων.

Το σχήμα δείχνει ένα πολύγωνο σχετικών συχνοτήτων της ακόλουθης κατανομής:

Ρύζι. 6. Πολύγωνο σχετικής συχνότητας.

Στην περίπτωση ενός συνεχούς χαρακτηριστικού, συνιστάται η κατασκευή ενός ιστογράμματος, για το οποίο το διάστημα στο οποίο περιέχονται όλες οι παρατηρούμενες τιμές του χαρακτηριστικού χωρίζεται σε πολλά επιμέρους διαστήματα μήκους h και για κάθε μερικό διάστημα βρίσκεται το n i - το άθροισμα των συχνοτήτων των παραλλαγών που εμπίπτουν στο i-ο διάστημα.

Ορισμός. Ιστόγραμμα συχνότηταςονομάζεται κλιμακωτό σχήμα που αποτελείται από ορθογώνια, οι βάσεις των οποίων είναι μερικά διαστήματα μήκους h και τα ύψη είναι ίσα με τον λόγο (πυκνότητα συχνότητας).

Ρύζι. 7. Ιστόγραμμα συχνότητας.

Για να κατασκευαστεί ένα ιστόγραμμα συχνότητας, επιμέρους διαστήματα τοποθετούνται στον άξονα της τετμημένης και τα τμήματα παράλληλα προς τον άξονα της τετμημένης σχεδιάζονται από πάνω τους σε απόσταση .

Το εμβαδόν του i-ου μερικού ορθογωνίου είναι ίσο με =─ το άθροισμα των συχνοτήτων της παραλλαγής του i-ου διαστήματος. Επομένως, η περιοχή του ιστογράμματος συχνότητας είναι ίση με το άθροισμα όλων των συχνοτήτων, δηλαδή το μέγεθος του δείγματος n.

Το σχήμα 2 δείχνει ένα ιστόγραμμα συχνότητας της κατανομής όγκου n=100 που δίνεται στον Πίνακα 1.

Μερικό διάστημα,

μήκος h=5

Πυκνότητα Συχνότητας

Ορισμός. Ιστόγραμμα σχετικής συχνότηταςονομάζεται κλιμακωτό σχήμα που αποτελείται από ορθογώνια, οι βάσεις των οποίων είναι μερικά διαστήματα μήκους h και τα ύψη είναι ίσα με την αναλογία (σχετική πυκνότητα συχνότητας).

Για να κατασκευαστεί ένα ιστόγραμμα σχετικών συχνοτήτων, σχεδιάζονται μερικά διαστήματα στον άξονα της τετμημένης και πάνω από αυτά σχεδιάζονται τμήματα παράλληλα προς τον άξονα της τετμημένης σε απόσταση. Το εμβαδόν του i-ου μερικού ορθογωνίου είναι ίσο με =─ τη σχετική συχνότητα των παραλλαγών που εμπίπτουν στο i-ο διάστημα. Κατά συνέπεια, η περιοχή του ιστογράμματος των σχετικών συχνοτήτων είναι ίση με το άθροισμα όλων των σχετικών συχνοτήτων, δηλαδή τη μονάδα.

    Ως αποτέλεσμα της δειγματοληψίας προέκυψε ο ακόλουθος πίνακας κατανομής συχνοτήτων.

Κατασκευάστε πολύγωνα συχνοτήτων και σχετικών κατανομών συχνοτήτων.

Αρχικά, ας φτιάξουμε ένα πολύγωνο συχνότητας.

Ρύζι. 8. Εύρος συχνοτήτων.

Για να κατασκευάσουμε ένα πολύγωνο σχετικών συχνοτήτων, θα βρούμε σχετικές συχνότητες διαιρώντας τις συχνότητες με το μέγεθος δείγματος n.

n = 3 + 10 + 7 = 20.

Παίρνουμε

Ας κατασκευάσουμε ένα πολύγωνο σχετικών συχνοτήτων.

Ρύζι. 9. Πολύγωνο σχετικής συχνότητας.

2. Κατασκευάστε ιστογράμματα συχνοτήτων και σχετικών κατανομών συχνοτήτων.

Ας βρούμε την πυκνότητα συχνότητας:

Μερικό διάστημα,

μήκος h = 3

Επιλογή μερικού διαστήματος αθροίσματος συχνοτήτων

Πυκνότητα Συχνότητας

mob_info