cover

aai

Γιάννης Κοντογιάννης

Σταύρος Τουμπής

aai aai aai

ΣΤΟΙΧΕΙΑ ΠΙΘΑΝΟΤΗΤΩΝ

ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΚΑΙ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

aai

aai

aai

aai

aai

Συγγραφείς: Γιάννης Κοντογιάννης, Σταύρος Τουμπής

Γλωσσική επιμέλεια: Θεόφιλος Τραμπούλης

Τεχνική επιμέλεια: Σάββας Γκιτζένης

Κριτικός αναγνώστης: Πέτρος Δελλαπόρτας

aai

aai

Έκδοση: Νοέμβριος 2015

ISBN: 978-960-603-182-3

aai

aai

Το παρόν έργο αδειοδοτείται υπό τους όρους της άδειας Creative Commons Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Παρόμοια Διανομή 3.0

aai

Copyright © ΣΥΝΔΕΣΜΟΣ ΕΛΛΗΝΙΚΩΝ ΑΚΑΔΗΜΑΪΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ – ΣΕΑΒ, 2015

Εθνικό Μετσόβιο Πολυτεχνείο

Ηρώων Πολυτεχνείου 9, 15780 Ζωγράφου

www.kallipos.gr

aai

aai




Περιεχόμενα





Πρόλογος

Η θεωρία πιθανοτήτων και οι εφαρμογές της αποτελούν, εδώ και σχεδόν έναν αιώνα, ακέραιο μέρος των μαθηματικών. Επιπλέον, τις τελευταίες δεκαετίες οι πιθανότητες έχουν αποκτήσει κεντρικό ρόλο σε μια πλειάδα σύγχρονων επιστημονικών και τεχνολογικών περιοχών, από τη γενετική και τα χρηματοοικονομικά μέχρι τη θεμελίωση της στατιστικής, και από τη μαθηματική περιγραφή της έννοιας της πληροφορίας ως τις ψηφιακές επικοινωνίες, την πληροφορική, ακόμη και τη μελέτη του ανθρώπινου εγκεφάλου μέσω της νευροεπιστήμης.

Βασικός σκοπός του βιβλίου αυτού είναι να προσφέρει μια εισαγωγή στα στοιχειώδη εργαλεία της κλασικής θεωρίας πιθανοτήτων, από μια σύγχρονη σκοπιά που να επισημαίνει και να συνδέει τη μαθηματική αυτή θεωρία με ενδιαφέρουσες εφαρμογές της σε διάφορα πεδία. Οι κεντρικές έννοιες των πιθανοτήτων και της τυχαιότητας αναπτύσσονται παράλληλα με τη μαθηματική θεωρία που τις περιβάλλει, με έμφαση σε τρεις βασικούς άξονες:

  1. 1. 

    Μαθηματική περιγραφή: Έχουμε καταβάλει σημαντική προσπάθεια ώστε η θεωρία να παρουσιαστεί μεν με μαθηματικά αυστηρό τρόπο, χωρίς όμως να είναι απαραίτητη η γνώση προχωρημένων και πιο εξειδικευμένων μαθηματικών εργαλείων και τεχνικών.

  2. 2. 

    Σύγχρονα παραδείγματα: Μαζί με τη θεωρητική ανάπτυξη του αντικειμένου, εξίσου σημαντικός στόχος μας είναι η παρουσίαση, έστω και επιγραμματικά, των πρακτικών εφαρμογών της θεωρίας των πιθανοτήτων. Γι’ αυτόν το λόγο, έχουμε συμπεριλάβει ένα πλήθος παραδειγμάτων και ασκήσεων, με σκοπό την ανάδειξη της στενής σχέσης των πιθανοτήτων με σύγχρονες εφαρμογές τους.

  3. 3. 

    Πληροφορική και στατιστική: Αν και έχουμε προσπαθήσει να αναδείξουμε με παραδείγματα τη σχέση των πιθανοτήτων με όλο το φάσμα των εφαρμογών – από κλασικά καθημερινά προβλήματα, όπως η ρίψη ενός νομίσματος ή μια εκλογική δημοσκόπηση, μέχρι την ανάλυση κάποιων εξειδικευμένων σύγχρονων αλγορίθμων στην επιστήμη υπολογιστών – έχει δοθεί μεγαλύτερη έμφαση στην πληροφορική και τη στατιστική. Ελπίζουμε αυτό το βιβλίο να μπορέσει να κεντρίσει το ενδιαφέρον κάποιων από τους αναγνώστες του προς αυτές τις κατευθύνσεις και να αποτελέσει έναν προθάλαμο που θα τους οδηγήσει στη βαθύτερη μελέτη των αντίστοιχων περιοχών.

Ειδικά για το σημείο (1) πρέπει να επισημάνουμε πως έχουμε συνειδητά αποφύγει να αναπτύξουμε εκτενώς τη θεωρία μέτρου, η οποία αποτελεί το φυσικό και θεμελιώδες μαθηματικό πλαίσιο της θεωρίας των πιθανοτήτων. Παρ’ όλα αυτά, στο Κεφάλαιο 3 δίνουμε τον αυστηρό μαθηματικό ορισμό του μέτρου πιθανότητας, και στα Κεφάλαια 5 έως 9 παρουσιάζουμε τη θεωρία των διακριτών τυχαίων μεταβλητών και των ιδιοτήτων τους χωρίς την παραμικρή μαθηματική παράλειψη ή αναφορά στη βαθύτερη θεωρία μέτρου.

Αν και αυτό το βιβλίο προέκυψε από τη διδασκαλία δύο προπτυχιακών μαθημάτων στο τμήμα Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών («Πιθανότητες» και «Εφαρμοσμένες πιθανότητες και προσομοίωση», κατά τη δεκαετία 2005-2015), ευελπιστούμε πως θα μπορέσει να χρησιμοποιηθεί στη διδασκαλία εισαγωγικών μαθημάτων πιθανοτήτων σε οποιοδήποτε τμήμα θετικών επιστημών ή πολυτεχνικών σχολών. Κατά συνέπεια, το κύριο ακροατήριο στο οποίο απευθυνόμαστε είναι προπτυχιακοί φοιτητές τέτοιων τμημάτων, και γι’ αυτόν τον λόγο έχουμε φροντίσει οι μαθηματικές γνώσεις που απαιτούνται να μην ξεπερνούν κατά πολύ την ύλη μαθηματικών του Λυκείου (αν την ξεπερνούν).

Η έμφασή μας στη σχέση των πιθανοτήτων με την πληροφορική και τη στατιστική εξηγείται από τα προσωπικά επιστημονικά ενδιαφέροντα των συγγραφέων, από το γεγονός ότι τα μαθήματα που σε πρώτη φάση μάς οδήγησαν στη συγγραφή του βιβλίου διδάσκονταν σε τμήμα πληροφορικής, αλλά και από την εκτίμησή μας πως οι περιοχές της επιστήμης υπολογιστών και της στατιστικής προσφέρουν σημαντικότατο πεδίο επιστημονικής μελέτης για τα σύγχρονα εφαρμοσμένα μαθηματικά εν γένει.

Η ύλη η οποία περιέχεται σε αυτό το βιβλίο καλύπτει πλήρως το περιεχόμενο του εισαγωγικού μαθήματος «Πιθανότητες» και περίπου το ενα έκτο του πιο προχωρημένου μαθήματος «Εφαρμοσμένες πιθανότητες και προσομοίωση», τα οποία προαναφέραμε. Επιπλέον, κατά τη συγγραφή του βιβλίου ενσωματώσαμε και τα ακόλουθα στοιχεία:

  1. 1. 

    Κάποια πιο προχωρημένα μέρη της ύλης του μαθήματος των «Πιθανοτήτων», τα οποία δεν παρουσιάζονταν στις διαλέξεις κάθε χρόνο ή διδάσκονταν προαιρετικά.

  2. 2. 

    Αποδείξεις κάποιων θεωρημάτων που δεν παρουσιάζονταν στα μαθήματα και παρατίθενται εδώ για λόγους πληρότητας (σημειωμένες με ).

  3. 3. 

    Κάποιες παραγράφους (επίσης σημειωμένες με ) που περιλαμβάνουν προχωρημένο υλικό. Όσοι αναγνώστες θέλουν να εμβαθύνουν στις αντίστοιχες περιοχές θα βρουν αυτές τις παραγράφους τις πιο ενδιαφέρουσες.

  4. 4. 

    Πολλές ασκήσεις μαζί με τις αναλυτικές τους λύσεις στο τέλος του κειμένου, οι πιο δύσκολες εκ των οποίων είναι και αυτές σημειωμένες με .

Υπογραμμίζουμε πως οι ασκήσεις και οι λύσεις τους αποτελούν σημαντικό και ακέραιο μέρος του βιβλίου. Στις ασκήσεις έχουμε συμπεριλάβει και κάποια σημαντικά αποτελέσματα, τα οποία άλλοτε δεν εντάσσονταν φυσικά στη ροή της ύλης του αντίστοιχου κεφαλαίου και άλλοτε κρίναμε πως αφορούσαν ερωτήματα τα οποία θα ήταν πιο χρήσιμο για τον αναγνώστη να έχει την ευκαιρία να τα εξετάσει μόνος του πριν του δοθούν οι απαντήσεις. Επιπλέον, η ίδια η φύση του αντικειμένου απαιτεί συστηματική εξοικείωση – με χαρτί και μολύβι – με τις έννοιες και τις τεχνικές που σταδιακά εισάγονται, και ίσως ο πιο αποτελεσματικός τρόπος να το επιτύχει κανείς αυτό είναι να αναπτύξει τις απαραίτητες δεξιότητες λύνοντας μια σειρά σχετικών ασκήσεων.

Είναι βέβαια μάλλον αυτονόητο, αλλά τονίζουμε πως δεν συνιστάται στους φοιτητές να χρησιμοποιήσουν το παρόν βιβλίο ως υποκατάστατο της παρακολούθησης των διαλέξεων.

Κλείνοντας, έχουμε τη χαρά να ευχαριστήσουμε τις δέκα περίπου «γενιές» φοιτητών που παρακολούθησαν τα μαθήματά μας για τη βοήθειά τους στη διαμόρφωση και την τροποποίηση της ύλης και για τις πολλές και χρήσιμες υποδείξεις τους.

Τέλος, ο πρώτος συγγραφέας αφιερώνει αυτό το βιβλίο στον ομορφότερο άνθρωπο που είχε την τύχη να γνωρίσει ποτέ στη ζωή του, τον γιο του Γιώργο. Ο δεύτερος συγγραφέας το αφιερώνει στην τριφυλλάρα .

Γιάννης Κοντογιάννης, Σταύρος Τουμπής

Αθήνα, Σεπτέμβριος 2015





Κεφάλαιο 1 Εισαγωγή

[Επιστροφή στα περιεχόμενα]

1.1 Οι πιθανότητες ως μέρος των μαθηματικών

Ιστορικά, έχουν υπάρξει δύο βασικές κινητήριες δυνάμεις για την ανάπτυξη νέων μαθηματικών: Η ανθρώπινη πνευματική περιέργεια και η ευρύτερη επιστημονική ή κοινωνική αναγκαιότητα της κάθε εποχής. Για παράδειγμα, οι πρακτικές ανάγκες της μέτρησης εδαφών και αποστάσεων στην αρχαιότητα αποτέλεσαν σημαντικό κίνητρο για την ανάπτυξη της επίπεδης (Ευκλείδειας) γεωμετρίας. Παρομοίως, η ανάγκη για την κατανόηση και την πρόβλεψη της κίνησης των στερεών σωμάτων – όπως, π.χ., των πλανητών ή των βλημάτων που χρησιμοποιούνταν σε πολεμικές μάχες – ήταν ένα απ’ τα βασικότερα κίνητρα για την ανάπτυξη του διαφορικού λογισμού από τον Νεύτωνα και τον Leibniz.

Ένα πιο πρόσφατο, και ίσως πιο οικείο, παράδειγμα είναι η ανάπτυξη μιας νέας μαθηματικής θεωρίας για την περιγραφή και την ακριβή μέτρηση της «πληροφορίας». Στην εποχή μας, η έννοια της πληροφορίας βρίσκεται παντού – από τις πληροφορίες που μεταφέρονται ως δεδομένα μέσω του διαδικτύου και των κινητών τηλεφώνων, μέχρι τη μελέτη των πληροφοριών που είναι αποθηκευμένες στον ανθρώπινο εγκέφαλο και στο DNA. Πώς μετριέται και περιγράφεται η πληροφορία, ως φυσικό μέγεθος, στην καθεμία από τις πιο πάνω περιπτώσεις; Το επιστημονικό πεδίο της θεωρίας πληροφορίας δίνει κάποιες πρώτες απαντήσεις σε αυτά τα ερωτήματα.

Μάλλον το σημαντικότερο (και αρχαιότερο) κίνητρο για την ανάπτυξη των πιθανοτήτων – δηλαδή μιας μαθηματικά αυστηρής θεωρίας για την κατανόηση τυχαίων φαινομένων και, γενικότερα, καταστάσεων στις οποίες υπάρχει ένα σημαντικό μέρος αβεβαιότητας – ήταν το ανθρώπινο πάθος για τον τζόγο. Γύρω στα μέσα και προς τα τέλη του 19ου αιώνα, είχε ωριμάσει αρκετά η συστηματική μελέτη των σχετικά απλών φυσικών φαινομένων, όπως για παράδειγμα η μελέτη της κίνησης δύο απομονωμένων πλανητών κάτω από την επίδραση της αμοιβαίας βαρυτικής τους έλξης, και είχε ξεκινήσει να αναπτύσσεται έντονο επιστημονικό ενδιαφέρον για τη μελέτη «πολύπλοκων» συστημάτων.

Για παράδειγμα, ένα δωμάτιο περιέχει περίπου 1021 μόρια αέρα. Ακόμα κι αν γνωρίζουμε με ακρίβεια τους νόμους που διέπουν την κίνησή τους, είναι πρακτικά αδύνατο να λύσουμε ένα σύστημα 1021 διαφορικών εξισώσεων, ώστε να προβλέψουμε, π.χ., τη θερμοκρασία του αέρα στο δωμάτιο! Μια αποτελεσματικότερη προσέγγιση είναι να θεωρήσουμε τις θέσεις και τις ταχύτητες των μορίων τυχαίες και να αποπειραθούμε να κάνουμε μια στατιστική ανάλυση. Αυτή η προσέγγιση, η οποία αποτέλεσε την αφετηρία της σημαντικής νέας περιοχής της στατιστικής φυσικής, έδωσε την τελική ώθηση που απαιτούνταν ώστε οι πιθανότητες να αναπτυχθούν ως μια πλήρης μαθηματική θεωρία στο πρώτο μισό του 20ού αιώνα.

1.2 Ιστορική ανάπτυξη

Η αφετηρία της συστηματικής μελέτης των Πιθανοτήτων ως επιστημονικού πεδίου τοποθετείται στα μέσα του 17ου αιώνα, και συγκεκριμένα στην αλληλογραφία μεταξύ δύο σημαντικών μαθηματικών της εποχής, του Pascal και του Fermat, με αντικείμενο την κατανόηση ενός τυχερού παιχνιδιού.

Σχήμα 1.1: Ο Blaise Pascal (1623-1662) και ο Pierre de Fermat (1601-1665). [Οι εικόνες
αποτελούν κοινό κτήμα και διέπονται από το καθεστώς υλικού που ανήκει στο public domain.
Τα πρωτότυπα αρχεία βρίσκονται στις τοποθεσίες των συνδέσμων Pascal
και Fermat.]

Μετά τη θεμελίωση των βασικών εννοιών από τους Pascal-Fermat, η σκυτάλη πέρασε σε έναν από τους σημαντικότερους μαθηματικούς όλων των εποχών, τον Gauss. Στα χέρια του Gauss, οι πιθανότητες έπαψαν να αποτελούν ένα συνονθύλευμα μεμονωμένων παραδειγμάτων και απλών τεχνικών. Ο Gauss διατύπωσε και απέδειξε μια σειρά από θεμελιώδη αποτελέσματα, τα οποία αποτελούν τη βάση ολόκληρης της σύγχρονης θεωρίας πιθανοτήτων – αλλά και της στατιστικής – έως και σήμερα. Το σημαντικότερο από αυτά τα αποτελέσματα είναι το Κεντρικό Οριακό Θεώρημα (Κ.Ο.Θ.), του οποίου η μελέτη και η χρήση αποτελούν κεντρικούς στόχους αυτού του βιβλίου.

Σχήμα 1.2: Ο Johann Carl Frederich Gauss (1777-1866). [Οι εικόνα αποτελεί κοινό κτήμα και διέπεται από το καθεστώς υλικού που ανήκει στο public domain. Το πρωτότυπο αρχείο βρίσκεται στην τοποθεσία του συνδέσμου Gauss.]

Με απλά λόγια, το Κ.Ο.Θ. μας λέει δύο πράγματα: Πρώτον, πως μέσα από την πλήρη αταξία μερικές φορές γεννιέται τάξη. Για παράδειγμα, αν στρίψουμε ένα νόμισμα δυο-τρεις φορές, είναι απολύτως αδύνατο να προβλέψουμε τι θα συμβεί· αν, ας πούμε, θα φέρουμε πρώτα Γράμματα και μετά Κορώνα ή το αντίστροφο. Αλλά, αν στρίψουμε το νόμισμα χίλιες ή δέκα χιλιάδες φορές, τότε είναι σχεδόν βέβαιο ότι το ποσοστό των φορών που φέραμε Κορώνα θα είναι μεταξύ 49% και 51%. Επιπλέον, το Κ.Ο.Θ. μάς επιτρέπει να υπολογίσουμε, κατά προσέγγιση, πόσο μικρή είναι η πιθανότητα το ποσοστό από Κορώνες να μην είναι μεταξύ 49% και 51%.

Έτσι, από τις πολλές επαναλήψεις του τυχαίου και απρόβλεπτου, προκύπτει τάξη και προβλεψιμότητα. Όπως θα δούμε σε επόμενα κεφάλαια, η βασική ιδιότητα πάνω στην οποία στηρίζεται αυτή η συμπεριφορά, είναι η ανεξαρτησία, δηλαδή το γεγονός ότι τα αποτελέσματα των διαδοχικών ρίψεων του νομίσματος είναι ανεξάρτητα το ένα από το άλλο.

Ως την εποχή του Gauss και μέχρι μερικές δεκαετίες αργότερα, η μελέτη των πιθανοτήτων βασιζόταν σχεδόν εξολοκλήρου στην υπόθεση της ανεξαρτησίας. Για παράδειγμα, σε μια ιατρική μελέτη, είναι λογικό να υποθέσουμε ότι το πόσο αποτελεσματικά δρα ένα φάρμακο έχει διακυμάνσεις από ασθενή σε ασθενή, αλλά είναι εξίσου λογικό να υποθέσουμε ότι η αποτελεσματικότητα του φαρμάκου είναι ανεξάρτητη από τον εκάστοτε ασθενή. Παρομοίως, αν κάνουμε μια δημοσκόπηση διαλέγοντας τυχαία μέλη ενός πληθυσμού, είναι λογικό να υποθέσουμε πως το να επιλέξουμε έναν συγκεκριμένο άνθρωπο για τη δημοσκόπηση δεν θα επηρεάσει τις πολιτικές προτιμήσεις κάποιου άλλου. Και στις δύο αυτές περιπτώσεις μπορούμε, λοιπόν, να υποθέσουμε πως διαδοχικά δείγματα – μετρήσεις της ανταπόκρισης των ασθενών σε ένα φάρμακο και προτιμήσεις ψηφοφόρων – είναι στατιστικά ανεξάρτητα.

Αλλά σε πιο πολύπλοκα φαινόμενα η υπόθεση της ανεξαρτησίας δεν είναι ρεαλιστική. Για παράδειγμα, ας πούμε πως έχουμε έναν αλγόριθμο επεξεργασίας κειμένου και θέλουμε να αναλύσουμε τη συνήθη συμπεριφορά του. Μια που δεν ξέρουμε εκ των προτέρων πάνω σε ποιο κείμενο θα εφαρμοστεί, λογικά θα καταφύγουμε στο να εξετάσουμε πώς συμπεριφέρεται σε κάποιο «τυχαίο» κείμενο. Αν όμως περιγράψουμε ένα τυχαίο κείμενο ως μια ακολουθία τυχαίων γραμμάτων, τότε σίγουρα δεν μπορούμε να θεωρήσουμε πως τα διαδοχικά γράμματα είναι ανεξάρτητα μεταξύ τους – εκτός κι αν είμαστε προετοιμασμένοι να δεχθούμε ως «κείμενο» μια ακολουθία γραμμάτων όπως η:


ασλδ'Κ αΣλκδν οι θζαίισ .θΔΙοαιξΜ-ΟΙα τρ88 Δλκσαξ λκλ,09οσ ,σαμδ!

3
Σχήμα 1.3: Ο Andrei A. Markov (1856-1922) και ο Andrei N. Kolmogorov (1903-1987). [Οι εικόνες
αποτελούν κοινό κτήμα και διέπονται από το καθεστώς υλικού που ανήκει στο public domain.
Τα πρωτότυπα αρχεία βρίσκονται στις τοποθεσίες των συνδέσμων Markov και Kolmogorov.]

Ο πρώτος ερευνητής που μελέτησε συστηματικά τις τυχαίες ακολουθίες που αποτελούνται από όχι ανεξάρτητα αλλά συσχετισμένα μεταξύ τους δείγματα, ήταν ο Markov. Στην απλούστερη μορφή τους, οι ακολουθίες τέτοιων συσχετισμένων δειγμάτων ονομάζονται «αλυσίδες Markov», και η μελέτη τους αποτελεί κεντρικό μέρος πολλών ερευνητικών περιοχών της σύγχρονης επιστήμης και τεχνολογίας. Είναι αξιοσημείωτο πως ένα από τα βασικά κίνητρα του Markov ήταν η περιγραφή κειμένων φυσικής γλώσσας μέσω των πιθανοτήτων. Ακόμη και στη σημερινή εποχή του Internet, του Google και του YouTube, πολλοί από τους πιο δημοφιλείς αλγορίθμους που χρησιμοποιούνται καθημερινά από εκατομμύρια ανθρώπους καθώς «σερφάρουν» στο διαδίκτυο, είναι βασισμένοι σε μοντέλα που περιγράφουν το περιεχόμενο των σελίδων του WWW μέσω των αλυσίδων Markov.

Ο πιο πρόσφατος μεγάλος σταθμός στην ιστορία των πιθανοτήτων είναι το 1933. Μέχρι τότε, παρά τη μεγάλη ώθηση που είχε πάρει η μελέτη τυχαίων φαινομένων στη φυσική και στο πρωτοεμφανιζόμενο τότε πεδίο της στατιστικής, οι πιθανότητες παρέμεναν μια μαθηματικά κακόφημη επιστημονική περιοχή. Ο λόγος ήταν πως δεν είχαν ακόμα ενταχθεί, με την αυστηρή έννοια, στο κεντρικό κομμάτι των μαθηματικών. Δεν είχαν, δηλαδή, θεμελιωθεί αξιωματικά, όπως η γεωμετρία, η ανάλυση, η θεωρία συνόλων και όλες οι υπόλοιπες βασικές περιοχές των μαθηματικών. Αυτήν τη θεμελίωση κατάφερε το 1933 ο σπουδαίος Ρώσος μαθηματικός A.N. Kolmogorov, του οποίου η τεράστια επιρροή στην επιστημονική εξέλιξη του 20ού αιώνα είναι εξαιρετικά έντονα αισθητή ως τις μέρες μας.

1.3 Πιθανότητες και πληροφορική

Όπως αναφέρουν στην εισαγωγή του πρόσφατου βιβλίου τους Probability and Computing οι Mitzenmacher (Harvard) και Upfal (Brown):

Τις τελευταίες δύο δεκαετίες, η χρήση της θεωρίας πιθανοτήτων στην πληροφορική έχει ενταθεί σε πάρα πολύ μεγάλο βαθμό. Προχωρημένες και πολύπλοκες τεχνικές από τις πιθανότητες αναπτύσσονται και βρίσκουν εφαρμογή σε όλο και πιο ευρείες και δύσκολες περιοχές της επιστήμης υπολογιστών.

Συγκεκριμένα, τεχνικές και βασικές έννοιες των πιθανοτήτων παίζουν κεντρικό ρόλο, μεταξύ άλλων, στις εξής περιοχές:

  • • 

    Περιγραφή και προσομοίωση πολύπλοκων συστημάτων. Π.χ., ένα μεγάλο δίκτυο που αποτελείται από πολλούς υπολογιστές (όπως το internet), ή ένα δίκτυο κινητής τηλεφωνίας, είναι αδύνατον να περιγραφεί με απόλυτη ακρίβεια. Νέοι υπολογιστές προστίθενται στο δίκτυο, κάποιοι αποσυνδέονται, ενώ και η συνδεσμολογία διαρκώς αλλάζει καθώς δημιουργούνται νέες συνδέσεις ή κάποιες υπάρχουσες παύουν να λειτουργούν. Επιπλέον, οι απαιτήσεις για τη μεταφορά δεδομένων αλλάζουν κάθε στιγμή με απρόβλεπτο τρόπο. Έτσι αναγκαστικά καταφεύγουμε σε μια πιθανοκρατική περιγραφή του δικτύου.

  • • 

    Πιθανοκρατική ανάλυση αλγορίθμων. Συχνά παρατηρούμε ένας αλγόριθμος να έχει θεωρητικά απαγορευτικά μεγάλη πολυπλοκότητα, αλλά στην πράξη να είναι πολύ αποτελεσματικός. Αυτό συμβαίνει γιατί, ενώ η παραδοσιακή έννοια της πολυπλοκότητας βασίζεται στην ανάλυση της συμπεριφοράς του αλγορίθμου στη χειρότερη περίπτωση (σύμφωνα με τη λεγόμενη worst case analysis), στη μεγάλη πλειονότητα των περιπτώσεων μπορεί να είναι πολύ αποτελεσματικός. Η λεγόμενη πιθανοκρατική (ή average case) ανάλυση δίνει μια εξήγηση γι’ αυτό το φαινόμενο: Αν θεωρήσουμε τα δεδομένα εισόδου τυχαία, τότε σε πολλές περιπτώσεις μπορούμε να δείξουμε ότι, με πιθανότητα πολύ κοντά στο 100%, η πολυπλοκότητα του αλγορίθμου είναι πολύ σημαντικά μικρότερη από αυτήν της χειρότερης περίπτωσης.

  • • 

    Randomized αλγόριθμοι. Υπάρχει μια κατηγορία αλγορίθμων, οι λεγόμενοι randomized ή τυχαιοκρατικοί αλγόριθμοι, οι οποίοι σε κάποια βήματα κατά την εκτέλεσή τους κάνουν «τυχαίες» επιλογές. Για παράδειγμα, το πρωτόκολλο επικοινωνίας του ethernet χρησιμοποιεί τυχαίους αριθμούς για να αποφασίσει πότε θα ξαναζητήσει πρόσβαση στο δίκτυο. Η χρήση της τυχαιότητας – σε αυτόν και πολλούς άλλους σημαντικούς αλγορίθμους – όχι μόνο απλοποιεί τη δομή του αλγορίθμου, αλλά επιτυγχάνει σημαντικά καλύτερη συμπεριφορά του συστήματος. Το τίμημα που επιφέρει είναι πως πάντα υπάρχει μια μικρή πιθανότητα δυσλειτουργίας. Βάσει σωστού σχεδιασμού και προσεκτικής μαθηματικής ανάλυσης, αυτή η πιθανότητα μπορεί να καταστεί τόσο μικρή, ώστε το κέρδος από την άποψη της πολυπλοκότητας και της ευκολίας να είναι πολύ μεγαλύτερο.

Κλείνοντας, αναφέρουμε πως άλλες περιοχές της πληροφορικής στις οποίες χρησιμοποιούνται συστηματικά μέθοδοι των πιθανοτήτων περιλαμβάνουν, μεταξύ άλλων:

  • • 

    το σχεδιασμό αλγορίθμων επεξεργασίας πολυμεσικών (multimedia) δεδομένων, π.χ., για τη συμπίεση ήχου, βίντεο και εικόνας,

  • • 

    την ανάπτυξη μεθόδων μηχανικής μάθησης και ανάκτησης πληροφοριών,

  • • 

    την κρυπτογραφία,

  • • 

    τη θεωρητική θεμελίωση των βασικών εννοιών πολυπλοκότητας και υπολογισιμότητας (μηχανές Turing, NP-complete και NP-hard προβλήματα, κλπ.).


Κεφάλαιο 2 Χώρος πιθανότητας και ενδεχόμενα

[Επιστροφή στα περιεχόμενα]

2.1 Προκαταρκτικά

Έστω ότι κάποιος μας προτείνει να του δώσουμε δυόμισι ευρώ για να παίξουμε το εξής παιχνίδι: Θα στρίβουμε ένα νόμισμα μέχρι την πρώτη φορά που θα φέρουμε Κορώνα (Κ), κι όσο πιο αργά συμβεί αυτό, δηλαδή όσο πιο πολλές συνεχόμενες φορές φέρουμε Γράμματα (Γ) στην αρχή, τόσο πιο μεγάλο θα είναι το κέρδος μας: Αν το νόμισμα έρθει Κ στην πρώτη ρίψη, θα μας δώσει ένα ευρώ. Αν έρθει Γ και μετά Κ, θα μας δώσει δύο ευρώ. Γενικά, αν έρθει (n-1) φορές Γ και τη φορά n έρθει Κ, θα πάρουμε n ευρώ.

Αμέσως γεννιούνται μερικά προφανή ερωτήματα:

  • • 

    Μας συμφέρει να παίξουμε;

  • • 

    Πόσο πιθανό είναι να κερδίσουμε πιο πολλά χρήματα από όσα δώσαμε για να παίξουμε;

  • • 

    Αν παίξουμε πολλές φορές, τελικά τι είναι πιο πιθανό, να βγούμε κερδισμένοι ή χαμένοι;

  • • 

    Είναι «δίκαιη» η τιμή των 2.5 ευρώ;

  • • 

    Τι θα πει ακριβώς «δίκαιη» τιμή;

Όλα αυτά τα ερωτήματα θα απαντηθούν με συστηματικό τρόπο στα επόμενα κεφάλαια. Προς το παρόν, αυτό που παρατηρούμε είναι η αναγκαιότητα να δώσουμε μια μαθηματική περιγραφή στο πιο πάνω παιχνίδι. Να ορίσουμε, πρώτα από όλα, τι θα πει «πιθανότητα» και να βρούμε τρόπους να υπολογίζουμε ποσοτικά και με ακρίβεια τις απαντήσεις σε ερωτήματα όπως τα πιο πάνω. Αυτό στα μαθηματικά είναι η διαδικασία κατά την οποία περιγράφουμε ένα πραγματικό φαινόμενο μέσω ενός μαθηματικού «μοντέλου». Σε κάποιες περιπτώσεις, αυτή η διαδικασία μάς είναι τόσο οικεία που ούτε καν της δίνουμε σημασία – για παράδειγμα, όταν βλέπουμε σε ένα χάρτη μια ευθεία γραμμή να αναπαριστά ένα δρόμο, δεν σκεφτόμαστε «Α, βέβαια, εδώ επικαλούμαι την προσεγγιστική αναπαράσταση ενός μέρους της επιφάνειας του πλανήτη Γη μέσω του μοντέλου της επίπεδης γεωμετρίας»!

Η μοντελοποίηση φαινομένων που περιέχουν στοιχεία τυχαιότητας, και η εξοικείωση με αυτήν τη διαδικασία αποτελούν δύο από τους κεντρικούς μας στόχους.

Αν και δεν είναι ο μόνος, μάλλον ο πιο συνηθισμένος τρόπος για να προσεγγίσουμε κατ’ αρχήν διαισθητικά την έννοια της πιθανότητας είναι μέσω της έννοιας της «συχνότητας». Π.χ., αν στρίψουμε ένα «δίκαιο» νόμισμα Ν φορές και φέρουμε k φορές Κορώνα (Κ), για μεγάλα Ν συχνά παρατηρούμε ότι,


kΝ=“ποσοστό από Κ”12ή  50%.

Και όσο μεγαλώνει το πλήθος Ν των ρίψεων, αντιστοίχως μεγαλώνει και το πλήθος k των φορών που φέραμε Κ, έτσι ώστε, μακροπρόθεσμα,


kN12,καθώς τοN.

Υπό αυτή την έννοια, λέμε ότι «η πιθανότητα το νόμισμα να έρθει Κ είναι 1/2».

2.2 Σύνολα

Ένα μεγάλο μέρος του μαθηματικού λεξιλογίου που θα χρησιμοποιήσουμε βασίζεται στα βασικά στοιχεία της θεωρίας συνόλων. Ξεκινάμε υπενθυμίζοντας κάποιος γνωστούς ορισμούς:


Ορισμός 2.1 (Πράξεις συνόλων)
  1. 1. 

    Ένα σύνολο είναι μια συλλογή στοιχείων. Για παράδειγμα, τα Α={-1,+1}, Β={3,5,9}, Γ=={,-1,0,1,2,}= οι ακέραιοι αριθμοί, Δ== οι πραγματικοί αριθμοί, Ε={Α,Β,5,{5},} είναι όλα σύνολα.

  2. 2. 

    Όταν κάποιο στοιχείο α ανήκει σε κάποιο σύνολο Α, γράφουμε αA. Αν το α δεν ανήκει στο Α, γράφουμε αA. Π.χ., πιο πάνω έχουμε, 3B, αλλά, 0A.

  3. 3. 

    Το A είναι υποσύνολο του Β αν κάθε στοιχείο του Α ανήκει και στο Β, οπότε γράφουμε ΑB ή AB.

  4. 4. 

    Το κενό σύνολο ή {} έχει την ιδιότητα ότι δεν περιέχει κανένα στοιχείο, δηλαδή α για οποιοδήποτε α.

Στις πιθανότητες, ανάλογα με το πρόβλημα που θα εξετάζουμε, όλα τα σύνολα που μας ενδιαφέρουν θα είναι υποσύνολα ενός βασικού συνόλου, το οποίο συνήθως συμβολίζεται ως Ω.

  • 5. 

    Η ένωση ΑB δύο συνόλων Α,Β είναι το σύνολο που αποτελείται από όλα τα στοιχεία που ανήκουν στο Α ή στο Β (ή και στα δύο). Γενικότερα, η ένωση ενός πεπερασμένου πλήθους συνόλων Α1,Α2,,AN συμβολίζεται ως,


    Α1A2AN=i=1NAi,

    και περιέχει όλα τα στοιχεία του Α1, τα στοιχεία του Α2 κλπ. Βλ. Σχήμα 2.1.

  • 6. 

    Η τομή ΑB δύο συνόλων Α,Β είναι το σύνολο που αποτελείται από όλα τα στοιχεία που ανήκουν και στο Α και στο Β. Γενικότερα, η τομή ενός πεπερασμένου πλήθους συνόλων Α1,Α2,,AN συμβολίζεται ως,


    Α1A2AN=i=1NAi,

    και αποτελείται από τα στοιχεία που περιέχονται σε όλα τα Αi. Βλ. Σχήμα 2.1.

  • 7. 

    Το συμπλήρωμα Α ενός συνόλου Α που είναι υποσύνολο του βασικού συνόλου Ω, αποτελείται από όλα τα στοιχεία του Ω που δεν ανήκουν στο Α. Βλ. Σχήμα 2.1.

Σχήμα 2.1: Γραφική αναπαράσταση της ένωσης, της τομής και του συμπληρώματος συνόλων.
Παράδειγμα 2.1

Έστω Ω το σύνολο όλων των δυνατών αποτελεσμάτων από τη ρίψη δύο νομισμάτων, δηλαδή,


Ω={KK,KΓ,ΓK,ΓΓ}.

Η περίπτωση του να φέρουμε Κ την πρώτη φορά μπορεί να περιγραφεί ως το σύνολο,


Α={Κ την πρώτη φορά}={KK,KΓ},

το οποίο είναι ένα υποσύνολο του Ω. Παρατηρούμε ότι το Α μπορεί και να εκφραστεί ως,


Α={KK}{KΓ}={ΓΓ,ΓK}=AΩ.
Παράδειγμα 2.2

Από 50 φοιτητές που βρίσκονται σε μια αίθουσα, οι 20 έχουν αυτοκίνητο, οι 10 έχουν μοτοσυκλέτα, και οι 25 δεν έχουν κανένα από τα δύο. Επιλέγουμε έναν φοιτητή στην τύχη.

Εδώ μπορούμε να ορίσουμε τα εξής σύνολα. Βλ. Σχήμα 2.2.


Ω = Όλοι οι 50 φοιτητές

A = Όσοι έχουν αυτοκίνητο

M = Όσοι έχουν μοτοσυκλέτα

E = Όσοι έχουν τουλάχιστον το ένα από τα δύο μέσα

Δ = Όσοι έχουν και τα δύο.

Θα απαντήσουμε στα εξής απλά ερωτήματα:

  • (α’)

    Πόσοι φοιτητές είναι στο Ε;

  • (β’)

    Πόσοι φοιτητές είναι στο Δ;

  • (γ’)

    Ποια είναι η πιθανότητα ο επιλεγμένος φοιτητής να έχει αυτοκίνητο;

Σχήμα 2.2: Γραφική αναπαράσταση των συνόλων στο Παράδειγμα 2.2.

Για το (α’), εφόσον είναι 50 συνολικά οι φοιτητές, δηλαδή το πλήθος των στοιχείων του Ω ισούται με 50, #Ω=50, και αφού μας δίνεται ότι 25 φοιτητές δεν έχουν ούτε αυτοκίνητο ούτε μοτοσυκλέτα, εύκολα υπολογίζουμε ότι,


#Ε = #{όσοι έχουν τουλάχιστον το ένα από τα δύο}


= #[{όσοι δεν έχουν κανένα από τα δύο}]=  50-25=  25,

όπου πιο πάνω και σε ολόκληρο το βιβλίο, χρησιμοποιούμε τον συμβολισμό #Α για το πλήθος των στοιχείων ενός οποιουδήποτε συνόλου Α.

Για το (β’), από τη γραφική αναπαράσταση στο Σχήμα 2.2, παρατηρούμε πως,


#(AM)=#A+#M-#Δ,

όπου αφαιρούμε τα στοιχεία του συνόλου Δ για να μη μετρηθούν δύο φορές. Παρατηρούμε επίσης ότι AM=Ε και #Ε=25 από το (α’), ενώ μας δίνεται και ότι #Α=20 και #Μ=10, άρα, #Δ=20+10-25=5.

[Παρένθεση. Αν και δεν έχουμε ακόμα ορίσει την έννοια της πιθανότητας, μπορούμε να προσεγγίσουμε το ερώτημα (γ’) διαισθητικά. Εφόσον η επιλογή του φοιτητή είναι τυχαία, η ζητούμενη πιθανότητα «ο επιλεγμένος φοιτητής να έχει αυτοκίνητο», δηλαδή η πιθανότητα να επιλέξουμε από όλο το Ω έναν φοιτητή που να είναι στο σύνολο Α, λογικά μπορεί να υπολογιστεί ως η πιθανότητα του «ο επιλεγμένος φοιτητής να ανήκει στο Α», δηλαδή, #A#Ω=2050=25=0.4=40%.]

Συμβολισμός. Όπως θα δούμε στην επόμενη ενότητα, οποιαδήποτε ενδεχομένη έκβαση ενός τυχαίου πειράματος – είτε αυτή περιγράφεται περιφραστικά, π.χ., «ο επιλεγμένος φοιτητής να έχει αυτοκίνητο», είτε ως κάποιο υποσύνολο Α του Ω όπως πιο πάνω – συχνά αναφέρεται απλά ως ένα ενδεχόμενο. Η πιθανότητα οποιουδήποτε ενδεχομένου μάς ενδιαφέρει σε κάποιο πρόβλημα συμβολίζεται ως Pr, από το αγγλικό «probability» που σημαίνει πιθανότητα.

Παράδειγμα 2.3

Ρίχνουμε ένα «δίκαιο» νόμισμα 2 φορές. Εδώ το σύνολο όλων των δυνατών αποτελεσμάτων είναι το,


Ω={KK,KΓ,ΓK,ΓΓ}.

Έστω Α το ενδεχόμενο του να έρθει Κ την πρώτη φορά, και Β το ενδεχόμενο να έρθει το ίδιο αποτέλεσμα δύο φορές, δηλαδή,


Α = {KK,KΓ}

B = {KK,ΓΓ}.
Σχήμα 2.3: Σχηματική αναπαράσταση των συνόλων στο Παράδειγμα 2.3.

[Παρένθεση. Και πάλι, αν και δεν έχουμε ακόμα ορίσει την έννοια της πιθανότητας, διαισθητικά μπορούμε να κάνουμε κάποιους απλούς υπολογισμούς. Παρατηρούμε ότι, εφόσον το νόμισμα είναι δίκαιο, είναι λογικό να υποθέσουμε ότι καθένα από τα τέσσερα δυνατά αποτελέσματα (που αντιστοιχούν στα 4 στοιχεία του Ω) έχουν την ίδια πιθανότητα, δηλαδή 1/4. Άρα υπολογίζουμε εύκολα τις πιθανότητες, για παράδειγμα, των εξής ενδεχομένων:


Pr({Κ την 1η φορά}) = Pr(A)=Pr({KK,KΓ})=#A#Ω=2/4=1/2,

Pr({δύο φορές το ίδιο}) = Pr(Β)=Pr({KK,ΓΓ})=#B#Ω=2/4=1/2,

Pr({δύο φορές K})) = Pr({KK})=#{KK}#Ω=1/4,

και παρομοίως, η πιθανότητα να φέρουμε δύο φορές Γ είναι κι αυτή 1/4.]

2.3 Χώρος πιθανότητας και ενδεχόμενα

Ορισμός 2.2

(Χώρος πιθανότητας και ενδεχόμενα)

  1. 1. 

    O χώρος πιθανότητας ή δειγματικός χώρος Ω είναι το σύνολο όλων των δυνατών αποτελεσμάτων ενός τυχαίου πειράματος.

  2. 2. 

    Οποιοδήποτε υποσύνολο ΑΩ του χώρου πιθανότητας Ω ονομάζεται ενδεχόμενο.

  3. 3. 

    Τα ενδεχόμενα που αποτελούνται από ένα μόνο στοιχείο, δηλαδή τα υποσύνολα ΑΩ της μορφής A={ω} για κάποιο ωΩ, λέγονται στοιχειώδη ενδεχόμενα.

  4. 4. 

    Δύο ενδεχόμενα Α,Β είναι ξένα όταν δεν έχουν κανένα κοινό στοιχείο, δηλαδή αν και μόνο αν, ΑB=. Διαισθητικά, τα Α,Β είναι ξένα αν είναι αδύνατον να συμβούν συγχρόνως.


Παρατηρήσεις:
  1. 1. 

    Ο χώρος πιθανότητας μπορεί πάντα να εκφραστεί ως η ένωση τόσων στοιχειωδών ενδεχομένων όσα τα στοιχεία που περιέχει. Π.χ., αν Ω={ω1,ω2,,ωN}, τότε,


    Ω={ω1}{ω2}{ωN}.

    Και γενικότερα, κάθε ενδεχόμενο μπορεί να εκφραστεί ως ένωση τόσων στοιχειωδών ενδεχομένων όσα τα στοιχεία που περιέχει. Επίσης σημειώνουμε πως δύο οποιαδήποτε στοιχειώδη ενδεχόμενα {ω1} και {ω2} είναι ξένα μεταξύ τους – αρκεί, βεβαίως, να μην είναι τα ίδια, δηλαδή το στοιχείο ω1 να είναι διαφορετικό απ’ το ω2.

  2. 2. 

    Στο πιο πάνω παράδειγμα της ρίψης δύο δίκαιων νομισμάτων, ο χώρος πιθανότητας ήταν Ω={KK,KΓ,ΓK,ΓΓ} και εξετάσαμε τα ενδεχόμενα Α={KK,KΓ} και B={KK,ΓΓ}, τα οποία μπορούν να εκφραστούν ως ενώσεις στοιχειωδών ενδεχομένων:


    Α={KK}{KΓ},B={KK}{ΓΓ}.

    Παρατηρούμε ότι έχουμε τις πιθανότητες (όπως υπολογίστηκαν πιο πάνω), Pr(A)=1/2, Pr({KK})=1/4, και (Pr{KΓ})=1/4. Άρα έχουμε τις «παράλληλες» σχέσεις:


    Α={KK}{KΓ}καιPr(A)=Pr({KK})+Pr({KΓ}).

    Αργότερα θα δούμε πως, όταν κάποιο ενδεχόμενο Α μπορεί να εκφραστεί ως ένωση δύο άλλων ενδεχομένων Α=ΒΓ, η μόνη περίπτωση κατά την οποία μπορούμε να είμαστε βέβαιοι ότι θα ισχύει και η αντίστοιχη σχέση για τις πιθανότητες, Pr(A)=Pr(B)+Pr(Γ) είναι όταν τα B,Γ είναι ξένα.

  3. 3. 

    Όταν ένα ενδεχόμενο Α περιγράφει την περίπτωση να συμβεί κάποιο γεγονός που μας ενδιαφέρει (π.χ. αν το Α είναι το ενδεχόμενο του να φέρουμε την πρώτη φορά Κ ρίχνοντας ένα νόμισμα), τότε το συμπλήρωμά του Α περιγράφει το αντίθετο γεγονός, δηλαδή την περίπτωση να μη συμβεί το Α (π.χ, πιο πάνω το Α αντιστοιχεί στο να φέρουμε την πρώτη φορά Γ).

    Παρομοίως, η ένωση ΑB δύο ενδεχομένων A,B είναι το ενδεχόμενο του να συμβεί το Α ή το Β, και η τομή τους ΑB περιγράφει το ενδεχόμενο του να συμβούν και τα δύο.

Τέλος, παραθέτουμε κάποιες βασικές σχέσεις που ικανοποιούν οι πράξεις της ένωσης, της τομής και του συμπληρώματος συνόλων. Για οποιαδήποτε υποσύνολα Α,Β,Γ του Ω, έχουμε:

  1. 1. 

    A

  2. 2. 

    AA=Ω

  3. 3. 

    AA=

  4. 4. 

    A(BΓ)=(AB)(AΓ)

  5. 5. 

    A(BΓ)=(AB)(AΓ)

  6. 6. 

    (AB)=AB

  7. 7. 

    (AB)=AB.

Κλείνουμε αυτό το κεφάλαιο με ένα ενδιαφέρον παράδειγμα το οποίο, αν και απλό, αν δεν το έχετε ξαναδεί, ίσως σας κινήσει ιδιαίτερα το ενδιαφέρον.


Παράδειγμα 2.4 (Παιχνίδι Monty Hall)

Σε ένα τηλεπαιχνίδι ο διαγωνιζόμενος επιλέγει μία από τρεις κουρτίνες, αφού του πουν πως μία από αυτές κρύβει ένα δώρο και οι άλλες δύο δεν κρύβουν τίποτα (χωρίς, φυσικά, να του πουν πού είναι το δώρο). Αφού διαλέξει, ο παρουσιαστής τού ανοίγει μία από τις άλλες δύο κουρτίνες, του δείχνει ότι εκεί δεν υπάρχει τίποτα, και δίνει στον διαγωνιζόμενο τη δυνατότητα να κρατήσει την αρχική του κουρτίνα ή να διαλέξει την άλλη κουρτίνα της οποίας το περιεχόμενο παραμένει κρυφό. Ο διαγωνιζόμενος επιλέγει, και το παιχνίδι τελειώνει, είτε με νίκη του διαγωνιζόμενου (αν το δώρο βρίσκεται πίσω από την κουρτίνα της τελικής του επιλογής), είτε με ήττα του διαγωνιζόμενου (αν το δώρο δεν βρίσκεται πίσω από την κουρτίνα που επέλεξε).

Πώς μπορούμε να περιγράψουμε το χώρο πιθανότητας; Υπάρχουν διάφοροι τρόποι να περιγραφούν όλες οι δυνατές εκβάσεις του παιχνιδιού. Μια επιλογή είναι η ακόλουθη. Έστω πως ονομάζουμε κουρτίνα A την κουρτίνα όπου βρίσκεται το δώρο, και κουρτίνες B,C τις άλλες δύο. Μπορούμε να περιγράψουμε τα αποτελέσματα ως τριάδες της μορφής (X,X,X), όπου τα X παίρνουν τιμές A, B ή C, και το πρώτο στοιχείο δείχνει την επιλογή του διαγωνιζόμενου, το δεύτερο την κουρτίνα που αποκαλύφθηκε, και το τρίτο την κουρτίνα που επέλεξε τελικά ο διαγωνιζόμενος.

Προφανώς υπάρχουν 3 επιλογές για το πρώτο στοιχείο. Αλλά για το δεύτερο στοιχείο υπάρχουν 2 επιλογές αν ο διαγωνιζόμενος έχει αρχικά επιλέξει την κουρτίνα με το δώρο, ενώ υπάρχει μόνο μία αν ο διαγωνιζόμενος έχει επιλέξει κενή κουρτίνα. Για το τρίτο στοιχείο, υπάρχουν πάντα δύο επιλογές. Ο αντίστοιχος χώρος πιθανότητας Ω περιέχει τις 8 δυνατές τριάδες (X,X,X) και έχει σχεδιαστεί στο Σχήμα 2.4.

Σχήμα 2.4: Ο χώρος πιθανότητας του Παραδείγματος 2.4. Στο πρώτο βήμα ο διαγωνιζόμενος επιλέγει μία κουρτίνα, στο δεύτερο ο παρουσιαστής ανοίγει μία από τις άλλες δύο, και στο τρίτο ο διαγωνιζόμενος αλλάζει αν θέλει την επιλογή του. Τα τέσσερα αποτελέσματα που αντιστοιχούν σε «νίκη» είναι σημειωμένα με «*».

Αν θέλουμε τώρα να ορίσουμε, π.χ., το ενδεχόμενο Ν=«ο παίκτης κέρδισε το δώρο», παρατηρούμε πως τα αποτελέσματα που καταλήγουν σε νίκη για τον διαγωνιζόμενο είναι εκείνα που έχουν τελευταίο στοιχείο το A, δηλαδή, Ν={ABA,ACA,BCA,CBA}.

Σημείωση. Αυτό το παιχνίδι ήταν επί χρόνια τηλεπαιχνίδι στην Αμερική, γνωστό με το όνομα «Monty Hall». Τα βασικό ερώτημα, το οποίο θα εξετάσουμε αργότερα, είναι, «Ποια είναι η πιο συμφέρουσα στρατηγική για τον παίκτη – να κρατήσει την αρχική του κουρτίνα ή να αλλάξει;»

2.4 Ασκήσεις

  1. 1. 

    Τυχαία παιδιά. Έστω πως εκτελείται το ακόλουθο πείραμα: Ένα ζευγάρι κάνει n παιδιά, καθένα εκ των οποίων μπορεί να είναι αγόρι ή κορίτσι. Περιγράψτε το χώρο πιθανότητας αυτού του πειράματος.

  2. 2. 

    Κι άλλα τυχαία παιδιά. Έστω πως εκτελείται το ακόλουθο πείραμα: Ένα ζευγάρι κάνει παιδιά επ’ άπειρο, μέχρι να κάνει το πρώτο κορίτσι, και μετά σταματάει. Περιγράψτε το χώρο πιθανότητας αυτού του πειράματος.

  3. 3. 

    Δύο διαδοχικές ζαριές. Ρίχνουμε ένα ζάρι 2 φορές και καταγράφουμε τα δύο αποτελέσματα με τη σειρά που ήρθαν.

    1. (α’) 

      Ποιος είναι ο χώρος πιθανότητας Ω;

    2. (β’) 

      Περιγράψτε τα ακόλουθα ενδεχόμενα ως υποσύνολα του Ω:

      1. i. 

        A=«Ζάρι 1 = Ζάρι 2» (δηλαδή διπλές)

      2. ii. 

        Β=«Άθροισμα 4»

      3. iii. 

        C=«Πρώτο ζάρι 4»

      4. iv. 

        D=«Άθροισμα 7»

      5. v. 

        E=«Δεύτερο ζάρι 5»

  4. 4. 

    Υπάρχουν και περίεργοι χώροι πιθανότητας. Έστω πως ρίχνουμε ένα βελάκι σε ένα στόχο με σχήμα κύκλου, και ακτίνα 20cm. Αν πετύχουμε το στόχο το βελάκι μένει καρφωμένο, και αν αστοχήσουμε το βελάκι πέφτει στο πάτωμα και το κλέβει ο σκύλος μας. Ορίστε το χώρο πιθανότητας Ω ώστε να περιγράφει όλα τα δυνατά αποτελέσματα, δηλαδή όλες τις θέσεις στις οποίες μπορεί να καταλήξει το βελάκι μας, συμπεριλαμβανομένου του στόματος του σκύλου!

  5. 5. 

    Δύο ταυτόχρονες ζαριές. Λύστε την Άσκηση 3, υποθέτοντας πως τα ζάρια ρίχνονται ταυτόχρονα, και δεν είμαστε σε θέση να τα ξεχωρίζουμε μεταξύ τους.

  6. 6. 

    Τρία νομίσματα. Ρίχνουμε τρία νομίσματα. Περιγράψτε το χώρο πιθανότητας Ω του πειράματος και τα ενδεχόμενα A=«τρεις φορές το ίδιο αποτέλεσμα», B=«τις πρώτες δύο φορές Γράμματα», C=«περισσότερες Κορώνες από Γράμματα», ως υποσύνολα του Ω.

  7. 7. 

    Άσπρες και μαύρες μπάλες. Ένα κουτί περιέχει μία άσπρη μπάλα και 3 πανομοιότυπες μαύρες μπάλες.

    1. (α’) 

      Επιλέγουμε μια μπάλα στην τύχη και χωρίς να την ξαναβάλουμε στο κουτί επιλέγουμε άλλη μία (δηλαδή έχουμε επιλογή χωρίς επανατοποθέτηση). Περιγράψτε το χώρο πιθανότητας Ω1 αυτού του πειράματος.

    2. (β’) 

      Αν η επιλογή άσπρης μπάλας μάς δίνει κέρδος 10 ευρώ και η επιλογή μαύρης μπάλας μάς δίνει κέρδος 5 ευρώ, περιγράψτε το ενδεχόμενο συνολικά στις δύο επιλογές να κερδίσουμε 10 ευρώ.

    3. (γ’) 

      Αν, αφού επιλέξουμε την πρώτη μπάλα, την ξαναβάλουμε στο κουτί πριν επιλέξουμε τη δεύτερη, έχουμε επιλογή με επανατοποθέτηση, και προκύπτει ένα διαφορετικό πείραμα. Περιγράψτε το χώρο πιθανότητας Ω2 αυτού του πειράματος, και το ενδεχόμενο συνολικά στις δύο επιλογές να κερδίσουμε 15 ευρώ.

  8. 8. 

    Λειτουργία δικτύου. Έστω τα ενδεχόμενα A=«Σήμερα θα πέσει το δίκτυο», B=«Σήμερα είναι εργάσιμη μέρα», C=«Σήμερα ο τεχνικός είναι στο εργαστήριο». Να εκφραστούν τα πιο κάτω ενδεχόμενα ως σύνολα, συναρτήσει των συνόλων A,B,C:

    1. (α’) 

      D=«Σήμερα θα πέσει το δίκτυο και είναι εργάσιμη μέρα»

    2. (β’) 

      E=«Σήμερα είναι αργία και θα πέσει το δίκτυο»

    3. (γ’) 

      F=«Σήμερα θα πέσει το δίκτυο, είναι εργάσιμη, και ο τεχνικός δεν είναι στο εργαστήριο»

    4. (δ’) 

      G=«Σήμερα ή θα πέσει το δίκτυο και είναι αργία, ή θα πέσει το δίκτυο και ο τεχνικός είναι στο εργαστήριο, ή δεν θα πέσει το δίκτυο»

  9. 9. 

    Απλά διαγράμματα ενδεχομένων. Στα τρία διαγράμματα του Σχήματος 2.5, να σκιαστούν (αντιστοίχως) τα τρία ενδεχόμενα BA, (AB)C, (ABC)D.

    Σχήμα 2.5: Άσκηση 9.
  10. 10. 

    Τρεις ζαριές. Ρίχνουμε ένα ζάρι 3 φορές. Περιγράψτε το χώρο πιθανότητας Ω και τα ενδεχόμενα: A=«Την 1η και 3η φορά ήρθε 6», Β=«την 1η φορά ήρθε 1 και τη 2η και 3η φορά ήρθε το ίδιο αποτέλεσμα» και C=«τρεις φορές ήρθε το ίδιο ζυγό αποτέλεσμα».

  11. 11. 

    Σταθερά και κινητά τηλέφωνα. Ένα δίκτυο τηλεφωνίας αποτελείται από 400 σταθερά τηλέφωνα και 50 κινητά. Επιλέγουμε δύο τηλέφωνα στην τύχη, όπου στην 2η επιλογή δεν επιτρέπουμε να επιλεγεί το ίδιο τηλέφωνο με την 1η:

    Περιγράψτε το χώρο πιθανότητας. Επιπλέον, αν η επιλογή σταθερού τηλεφώνου έχει κόστος 1 ευρώ και η επιλογή κινητού 5 ευρώ, περιγράψτε τα ενδεχόμενα Α =«συνολικά οι 2 επιλογές κόστισαν 6 ευρώ» και B =«συνολικά οι 2 επιλογές κόστισαν 11 ευρώ».

  12. 12. 

    Το πρόβλημα των τριών φυλακισμένων. Σε μια φυλακή, ο διευθυντής αποφασίζει να απονείμει χάρη σε έναν από τους τρεις φυλακισμένους (η φυλακή είναι μικρή!) και να εκτελέσει τους άλλους δύο. Ένας από τους τρεις φυλακισμένους ζητά από τον δεσμοφύλακα να του αποκαλύψει ποιος από τους άλλους δύο κρατούμενους θα εκτελεστεί, με τη λογική ότι υπάρχει πάντοτε κάποιος τέτοιος. Ο δεσμοφύλακας το κάνει, και κατόπιν του παρέχει τη δυνατότητα να αλλάξει θέση με αυτόν του οποίου την τύχη δεν αποκάλυψε. Ο φυλακισμένος έχει την επιλογή να δεχθεί ή να αρνηθεί. Να περιγράψετε το χώρο πιθανότητας αυτού του τυχαίου πειράματος.

  13. 13. 

    Monty Hall 2. Επαναλάβετε το Παράδειγμα 2.4 με την ακόλουθη τροποποίηση: Οι κουρτίνες έχουν πάρει το όνομά τους πριν τοποθετηθεί το δώρο, και έτσι τα αποτελέσματα είναι τετράδες, αντί για τριάδες.

  14. 14. 

    Monty Hall 3. Επαναλάβετε το Παράδειγμα 2.4 με την ακόλουθη τροποποίηση: Ο διαγωνιζόμενος δεν αλλάζει ποτέ κουρτίνα.

  15. 15. 

    Monty Hall 4. Επαναλάβετε το Παράδειγμα 2.4 με την ακόλουθη τροποποίηση: Ο διαγωνιζόμενος αλλάζει πάντα κουρτίνα.



Κεφάλαιο 3 Μέτρο πιθανότητας

[Επιστροφή στα περιεχόμενα]

3.1 Ορισμός, παραδείγματα και ιδιότητες

Σ’ αυτό το σύντομο κεφάλαιο θα δώσουμε, για πρώτη φορά, έναν αυστηρά μαθηματικό ορισμό της έννοιας της πιθανότητας. Αν και, εκ πρώτης όψεως, ο ορισμός φαίνεται δυσνόητος και πολύ απομακρυσμένος από αυτό που διαισθητικά ονομάζουμε «πιθανότητα», όπως θα δούμε στα παραδείγματα που ακολουθούν, στην πράξη είναι πολύ απλός και εύχρηστος.

Ορισμός 3.1 (Μέτρο πιθανότητας)
Έστω ένας χώρος πιθανότητας Ω και έστω το δυναμοσύνολο του
Ω
,
δηλαδή το σύνολο που έχει ως στοιχεία όλα τα ενδεχόμενα ΑΩ (συμπεριλαμβανομένου και του κενού συνόλου ). Ένα μέτρο πιθανότητας είναι μια συνάρτηση :[0,1] η οποία ικανοποιεί τις παρακάτω ιδιότητες:
  1. 1. 

    Για οποιοδήποτε ενδεχόμενο Α έχουμε: (A)0.

  2. 2. 

    Πάντοτε έχουμε: (Ω)=1.

  3. 3. 

    Αν δύο ενδεχόμενα Α,Β είναι ξένα (δηλαδή AB=), τότε,


    (AB)=(A)+(B).

    Και γενικότερα, αν Α1,Α2, είναι μια οποιαδήποτε (πεπερασμένη ή όχι) ακολουθία ξένων ενδεχομένων (δηλαδή ΑiAj= για κάθε ij), τότε,


    (Α1Α2)=(A1)+(A2)+.

Πριν εξετάσουμε τις συνέπειες του ορισμού, ας δούμε πώς ορίζεται το μέτρο πιθανότητας σε ένα πολύ απλό παράδειγμα.


Παράδειγμα 3.1

Ρίχνουμε ένα δίκαιο ζάρι. Όλα τα δυνατά αποτελέσματα περιγράφονται από τα στοιχεία του αντίστοιχου χώρου πιθανότητας Ω={1,2,3,4,5,6}. Ορίζουμε τα ενδεχόμενα,


A = «ζυγό αποτέλεσμα»={2,4,6},

B = «μονό αποτέλεσμα»={1,3,5},

και τα έξι στοιχειώδη ενδεχόμενα Ei={i}, για κάθε i=1,2,3,4,5,6. Εφόσον το ζάρι είναι δίκαιο, απαιτούμε το αντίστοιχο μέτρο πιθανότητας που περιγράφει αυτό το πείραμα να δίνει την ίδια πιθανότητα, δηλαδή 1/6, σε κάθε δυνατό αποτέλεσμα, δηλαδή να ικανοποιεί (Ei)=1/6 για κάθε i=1,2,3,4,5,6.

Για να υπολογίσουμε την πιθανότητα του ενδεχομένου Α (η οποία διαισθητικά είναι προφανώς ίση με 1/2), παρατηρούμε όπως νωρίτερα πως το Α μπορεί να εκφραστεί ως ένωση στοιχειωδών ενδεχομένων, δηλαδή,


Α={2}{4}{6}=E2E4E6,

και πως όλα τα στοιχειώδη ενδεχόμενα είναι ξένα μεταξύ τους. Άρα από την τρίτη ιδιότητα του ορισμού ενός μέτρου πιθανότητας έχουμε,


Pr(A) = (A)=(E2E4E6)=(E2)+(E4)+(E6)


= 1/6+1/6+1/6=1/2.

Παρομοίως υπολογίζουμε την πιθανότητα του μονού αποτελέσματος,


Pr(Β) = (Β)=(E1E3E5)=(E1)+(E3)+(E5)


= 1/6+1/6+1/6=1/2.

Παρατηρήσεις:

  1. 1. 

    Το πιο πάνω παράδειγμα ανήκει σε μια ευρεία κατηγορία προβλημάτων όπου έχουμε ισοπίθανα στοιχειώδη ενδεχόμενα, και η οποία θα εξετασθεί πιο αναλυτικά στο επόμενο κεφάλαιο.

  2. 2. 

    Τα στοιχειώδη ενδεχόμενα είναι πάντα ξένα μεταξύ τους. Κατά συνέπεια, αν το Ω είναι πεπερασμένο, για να οριστεί το μέτρο πιθανότητας για όλα τα ενδεχόμενα αρκεί να οριστεί για τα στοιχειώδη ενδεχόμενα. Ο λόγος είναι απλός. Έστω ένα οποιοδήποτε ενδεχόμενο Α το οποίο αποτελείται από τα στοιχεία ω1,ω2,,ωk. Εκφράζοντας το Α ως την ένωση των ξένων ενδεχομένων,


    Α={ω1}{ω2}{ωk},

    και χρησιμοποιώντας την τρίτη ιδιότητα του ορισμού του μέτρου πιθανότητας, μπορούμε να υπολογίσουμε την πιθανότητα του Α από τις πιθανότητες των στοιχειωδών ενδεχομένων {ωi} ως,


    (Α)=({ω1})+({ω2})++({ωk}).
  3. 3. 

    Όταν δύο ενδεχόμενα A,B δεν είναι ξένα, τότε η πιθανότητα της ένωσής τους γενικά δεν ισούται με το άθροισμα των επιμέρους πιθανοτήτων. Π.χ., στο πιο πάνω παράδειγμα έχουμε ότι το Α={2,4,6}={2,4,6}{2}=AE2, αλλά φυσικά (A)(A)+(E2) αφού 1/21/2+1/6!

Παράδειγμα 3.2

Σε ένα εργαστήριο πληροφορικής λειτουργούν τρία δίκτυα, από τα οποία, κατά τις τελευταίες 200 μέρες:

  • 30% των ημερών, τουλάχιστον ένα δίκτυο δεν λειτουργεί,

  • 10% των ημερών, ακριβώς δύο δεν λειτουργούν,

  • 5% των ημερών, δεν λειτουργεί κανένα δίκτυο.

Εξετάζουμε το τι συμβαίνει μια «τυχαία» μέρα. Έστω Ω το σύνολο όλων των διακοσίων ημερών, και έστω Βi το ενδεχόμενο του να λειτουργούν ακριβώς i από τα τρία δίκτυα, για i=0,1,2,3. Για παράδειγμα, το Β2 είναι το σύνολο των ημερών εκείνων κατά τις οποίες δύο δίκτυα λειτουργούν κι ένα όχι.

Από τις υποθέσεις μας έχουμε ότι Pr(B0)=5%=0.05 και Pr(B1)=10%=0.1. Επιπλέον, η πρώτη υπόθεση μας λέει ότι Pr(B3)=30%=0.3 (γιατί;). Αλλά ποιες είναι οι πιθανότητες των Β2 και Β3;

Για το Β3 παρατηρούμε ότι, εφόσον το «λειτουργούν και τα τρία δίκτυα» είναι το αντίθετο του «τουλάχιστον ένα δεν λειτουργεί», διαισθητικά περιμένουμε να ισχύει ότι,


Pr({λειτουργούν και τα τρία δίκτυα})=1-Pr({τουλάχιστον ένα δεν λειτουργεί}),

δηλαδή ότι,


Pr(B3)=1-Pr(B3)=1-30%=0.7

Πράγματι, αυτή η διαισθητική υπόθεση είναι σωστή, όπως θα δούμε αμέσως μετά το παράδειγμα.

Για το Β2 τώρα, παρατηρούμε ότι το ενδεχόμενο Β3 του να μην λειτουργεί τουλάχιστον ένα δίκτυο μπορεί να εκφραστεί ως ένωση,


Β3=Β0B1B2,

όπου τα Β0,Β1 και Β2 είναι εξ ορισμού ξένα. Άρα,


0.3=Pr(B3)=Pr(B0)+Pr(B1)+Pr(B2)=0.05+0.1+Pr(B2),

οπότε βρίσκουμε πως Pr(B2)=0.15 ή 15%.

Λήμμα 3.1

Για οποιοδήποτε ενδεχόμενο Α και οποιοδήποτε μέτρο πιθανότητας , έχουμε:


(A)=1-(A).
(3.1)
Απόδειξη:

Έστω ότι το Α είναι υποσύνολο του χώρου πιθανότητας Ω, όπου, από τη δεύτερη ιδιότητα του ορισμού ενός μέτρου πιθανότητας, έχουμε (Ω)=1.

Προφανώς μπορούμε να εκφράσουμε το Ω ως την ένωση Ω=AA, όπου εξ ορισμού τα Α και Α είναι ξένα. Άρα, από την τρίτη ιδιότητα του ορισμού του μέτρου πιθανότητας, 1=(Ω)=(A)+(A), που αποδεικνύει τη ζητούμενη σχέση (3.1).


Παράδειγμα 3.3

Ρίχνουμε ένα δίκαιο ζάρι 2 φορές, οπότε ο χώρος πιθανότητας Ω αποτελείται από τα 36 δυνατά αποτελέσματα:


Ω = {11,12,13,14,15,16



  21,22,,26



   



  61,62,,66}.

Όπως και στο Παράδειγμα 3.1, εφόσον το ζάρι είναι δίκαιο, λογικά υποθέτουμε ότι το καθένα από τα 36 στοιχειώδη ενδεχόμενα έχει την ίδια πιθανότητα, δηλαδή 1/36. Θα υπολογίσουμε την πιθανότητα των εξής ενδεχομένων:


A = «ασόδυο»={12,21},

B = «εξάρες»={66},

Γ = «6 την πρώτη φορά»={61,62,63,64,65,66},

Δ = «σύνολο 6»={15,24,33,42,51}.

Για το Α έχουμε, από τις πιο πάνω υποθέσεις,


Pr(A) = Pr({12,21})=Pr({12}{21})=Pr({12})+Pr({21})


= 136+136=1180.0555,

όπου και πάλι χρησιμοποιήσαμε το γεγονός ότι τα στοιχειώδη ενδεχόμενα είναι πάντοτε ξένα μεταξύ τους. Για το Β απλώς έχουμε, Pr(B)=Pr{66}=1/36, άρα υπάρχει διπλάσια πιθανότητα να φέρουμε ασόδυο από το να φέρουμε εξάρες.

Με την ίδια λογική, για το Γ έχουμε,


Pr(Γ) = Pr({61}{62}{63}{64}{65}{66})


= Pr({61})+Pr({62})+Pr({63})+Pr({64})+Pr({65})+Pr({66})


= 6/36=1/6,

δηλαδή μόλις αποδείξαμε το διαισθητικά προφανές – ότι η πιθανότητα του να φέρουμε 6 την πρώτη φορά είναι 1/6. Και ακολουθώντας πάλι την ίδια λογική, εύκολα υπολογίζουμε ότι, εφόσον το Δ αποτελείται από 5 στοιχεία και όλα τα στοιχειώδη ενδεχόμενα είναι ισοπίθανα, Pr(Δ)=5/36. Αυτή η παρατήρηση ισχύει πιο γενικά, όπως διατυπώνεται στο πιο κάτω λήμμα.

Λήμμα 3.2

Αν όλα τα στοιχειώδη ενδεχόμενα ενός (πεπερασμένου) χώρου πιθανότητας Ω είναι ισοπίθανα, τότε η πιθανότητα ενός οποιουδήποτε ενδεχομένου ΑΩ είναι ίση με:


Pr(A)=#A#Ω=πλήθος στοιχείων του Απλήθος στοιχείων του Ω.
Απόδειξη:

Έστω ότι ο χώρος πιθανότητας Ω={ω1,ω2,,ωn} αποτελείται από τα #Ω=n στοιχεία ωi, για i=1,2,,n, έστω το μέτρο πιθανότητας, και έστω p η πιθανότητα ενός οποιουδήποτε στοιχειώδους ενδεχομένου, δηλαδή p=Pr{ωi} για κάθε i. Από τις ιδιότητες του ορισμού του μέτρου πιθανότητας έχουμε,


1=(Ω)=(i=1n{ωi})=i=1n({ωi})=np,

άρα έχουμε p=1/n.

Έστω τώρα ένα οποιοδήποτε ενδεχόμενο Α={α1,α2,,αk} που αποτελείται από #A=k στοιχεία. Τότε έχουμε,


(Α)=(i=1k{αi})=i=1n({αi})=kp=k1n=#A#Ω.

3.2 Πέντε «κανόνες πιθανότητας»

Από τον ορισμό του μέτρου πιθανότητας και τα δύο λήμματα που αποδείξαμε πιο πάνω, προκύπτουν κάποιες βασικές ιδιότητες τις οποίες θα χρησιμοποιούμε συχνά. Για να αναφερόμαστε σε αυτές πιο εύκολα, τις παραθέτουμε περιληπτικά στην επόμενη σελίδα.

Απόδειξη:

Έστω δύο ενδεχόμενα ΑB. Το B μπορεί να εκφραστεί ως Β=ΑB1 όπου το Β1 αποτελείται από τα στοιχεία του B που δεν περιέχονται στο Α. Άρα τα Α και Β1 είναι ξένα, και συνεπώς, από την τρίτη ιδιότητα του ορισμού του μέτρου πιθανότητας, (B)=(A)+(B1), αλλά αφού όλες οι πιθανότητες είναι εξ ορισμού μεγαλύτερες ή ίσες του μηδενός, αυτό συνεπάγεται ότι (B)(A), και μας δίνει την Ιδιότητα 2.



Εφόσον εξ ορισμού τα και Ω είναι ξένα, από τον ορισμό του μέτρου πιθανότητας έχουμε,

1=(Ω)=(Ω)=(Ω)+()=1+(),

άρα ()=0. Και εφόσον A για κάθε A, από την Ιδιότητα 2, (A)()=0. Παρομοίως, οποιοδήποτε Α είναι υποσύνολο του Ω, άρα, (A)(Ω)=1, και έχουμε αποδείξει την Ιδιότητα 1.


Η Ιδιότητα 3 είναι μέρος του ορισμού, και οι Ιδιότητες 4 και 5 προκύπτουν από το Λήμμα 3.1 και το Λήμμα 3.2 αντίστοιχα.
Κανόνες πιθανότητας (1–5)

Για οποιοδήποτε μέτρο πιθανότητας :

  1. 1. 

    ()=0, (Ω)=1, και 0(A)1, για κάθε ενδεχόμενο Α.

  2. 2. 

    Αν AB, τότε (A)(B).

  3. 3. 

    Αν τα ενδεχόμενα Α1,Α2, είναι ξένα (δηλαδή ΑiAj= για κάθε ij), τότε:


    (Α1Α2)=(A1)+(A2)+.
  4. 4. 

    (A)=1-(A), για κάθε ενδεχόμενο Α.

  5. 5. 

    Αν όλα τα στοιχειώδη ενδεχόμενα είναι ισοπίθανα, τότε για κάθε ενδεχόμενο Α:


    Pr(A)=#A#Ω=πλήθος στοιχείων του Απλήθος στοιχείων του Ω.

3.3 Γενικός ορισμός του μέτρου πιθανότητας

Αν ο χώρος πιθανότητας είναι διακριτός (δηλαδή είτε πεπερασμένος είτε άπειρος αλλά αριθμήσιμος), τότε ο ορισμός που δώσαμε για το μέτρο πιθανότητας σε αυτό το κεφάλαιο είναι μαθηματικά πλήρης και απολύτως επαρκής για όλες τις αντίστοιχες εφαρμογές. Αλλά για την περίπτωση άπειρων και μη αριθμήσιμων χώρων πιθανότητας, ο ορισμός αυτός είναι απαραίτητο να τροποποιηθεί. Ο λόγος μπορεί να εξηγηθεί από το εξής παράδειγμα.

Έστω ότι θέλουμε να ορίσουμε την έννοια ενός «τυχαίου πραγματικού αριθμού» στο διάστημα [0,1]. Σε αυτή την περίπτωση κάθε ενδεχόμενο Α είναι ένα υποσύνολο του διαστήματος [0,1], και το Α περιγράφει το ενδεχόμενο ο τυχαίος αυτός αριθμός να ανήκει στο Α. Για παράδειγμα, αν το Α=[0,1/2], λογικά θα θέλαμε να ορίσουμε ένα μέτρο πιθανότητας που να μας λέει ότι η πιθανότητα ένας τυχαίος πραγματικός αριθμός μεταξύ 0 και 1 να είναι μικρότερος ή ίσος με 1/2, ισούται με 1/2. Με άλλα λόγια, να έχει (A)=1/2. Γενικά, θα θέλαμε για κάθε υποδιάστημα Β του [0,1], η τιμή του μέτρου πιθανότητας (Β) να ισούται με το μήκος αυτού του διαστήματος.

Εδώ συμβαίνει κάτι πραγματικά αξιοσημείωτο και μάλλον απροσδόκητο. Μπορεί να αποδειχθεί πως είναι ΑΔΥΝΑΤΟΝ να οριστεί ένα μέτρο πιθανότητας στο Ω=[0,1] το οποίο να ικανοποιεί τις τρεις συνθήκες του ορισμού μας και επίσης να δίνει, για κάθε υποδιάστημα [0,1],


(B)=μήκος τουΒ.

Η βαθύτερη αιτία της δυσκολίας είναι η ύπαρξη κάποιων πολύ πολύπλοκων, κατά κάποιον τρόπο παθολογικών, υποσυνόλων Β του [0,1].

Η λύση σε αυτό το πρόβλημα είναι να περιορίσουμε τα υποσύνολα του χώρου πιθανότητας Ω στα οποία απαιτούμε να ορίζεται το μέτρο πιθανότητας. Αυτή η παρατήρηση αποτελεί την αφετηρία μιας μεγάλης υποπεριοχής της μαθηματικής ανάλυσης, η οποία ονομάζεται θεωρία μέτρου, αλλά με την οποία δεν θα ασχοληθούμε περαιτέρω επί του παρόντος και γενικά σε αυτό το βιβλίο. Αρκεί να θυμάστε πως, όταν ο χώρος πιθανότητας δεν είναι αριθμήσιμος, υπάρχουν κάποια σπανιότατα παθολογικά ενδεχόμενα για τα οποία δεν μπορούμε να ορίσουμε την πιθανότητά τους.

Περισσότερες (πολύ περισσότερες) πληροφορίες γι’ αυτό το ζήτημα και για τη θεωρία μέτρου εν γένει μπορείτε να βρείτε σε πιο προχωρημένα βιβλία μαθηματικής ανάλυσης ή πιθανοτήτων.

3.4 Ασκήσεις

  1. 1. 

    Η πιθανότητα της διαφοράς. Να δείξετε, χρησιμοποιώντας τους κανόνες πιθανότητας αυτού του κεφαλαίου, ότι για οποιαδήποτε δύο ενδεχόμενα E,F:


    Pr(EF)=Pr(E)-Pr(EF).

    Σημείωση. Το σύνολο EF περιλαμβάνει όλα τα στοιχεία του E αν αφαιρέσουμε τα στοιχεία του F, γι’ αυτό συχνά καλείται η διαφορά του E από το F, και συμβολίζεται E-F.

  2. 2. 

    Περίεργα ζάρια. Έστω ένα (όχι απαραίτητα δίκαιο) ζάρι για το οποίο γνωρίζουμε ότι η πιθανότητα να έρθει 1 ή 2 είναι 1/3, ενώ η πιθανότητα να έρθει 2 ή 3 είναι επίσης 1/3. Ποια είναι η μέγιστη δυνατή και η ελάχιστη δυνατή τιμή για την πιθανότητα να έρθει 2; Δώστε από ένα συγκεκριμένο παράδειγμα ενός μέτρου πιθανότητας για την καθεμία από τις ακραίες δυνατές τιμές αυτής της πιθανότητας.

  3. 3. 

    Τυχαία συνάντηση. Ο Σταύρος και ο Γιάννης έχουν ορίσει να συναντηθούν σε ένα μπαρ. Ο Σταύρος έχει έρθει στην ώρα του, αλλά για τον Γιάννη γνωρίζουμε ότι μπορεί να εμφανιστεί οποιαδήποτε στιγμή μέσα στις επόμενες δύο ώρες, χωρίς προτίμηση σε κάποια στιγμή ή διάστημα. Ορίζουμε τα ακόλουθα ενδεχόμενα: Α=«Ο Γιάννης έρχεται εντός της πρώτης ώρας», Β=«Ο Γιάννης έρχεται εντός του τελευταίου μισάωρου», C=«Ο Γιάννης έρχεται με τουλάχιστον μισή ώρα καθυστέρηση».

    1. (α’) 

      Ορίστε έναν κατάλληλο χώρο πιθανότητας και ένα μέτρο πιθανότητας, και υπολογίστε τις πιθανότητες των ενδεχόμενων A,B,C,AB,AC,BC.

    2. (β’) 

      Υπολογίστε τις πιθανότητες των ενδεχόμενων AB, AC, BC.

  4. 4. 

    Ένωση τριών ενδεχόμενων. Να δείξετε ότι, για οποιαδήποτε τρία ενδεχόμενα A,B και C,


    Pr(ABC)=Pr(A)+Pr(AB)+Pr(ABC).
    (3.2)
  5. 5. 

    Ένας χώρος πιθανότητας με 3 στοιχεία. Ένα τυχαίο πείραμα έχει χώρο πιθανότητας το σύνολο Ω={a,b,c}. Έστω πως κάποιο μέτρο πιθανότητας ικανοποιεί τις σχέσεις, ({a,c})=9/16 και ({a,b})=3/4. Χρησιμοποιήστε τους κανόνες πιθανότητας αυτού του κεφαλαίου για να υπολογίσετε τις πιθανότητες όλων των στοιχειωδών ενδεχομένων.

  6. 6. 

    Τι λένε οι πιθανοθεωρίστες στα παιδιά τους. Στην Αττική, το 95% των εγκλημάτων συμβαίνει τη νύχτα, και το 54% συμβαίνει μέσα στην Αθήνα. Αν μόνο 2% των εγκλημάτων συμβαίνουν μέρα στην Αθήνα, τι ποσοστό συμβαίνει νύχτα στην Αθήνα; Τι ποσοστό συμβαίνει νύχτα έξω από την Αθήνα;

  7. 7. 

    Διαιρέτες. Επιλέγουμε έναν τυχαίο αριθμό από το σύνολο Ω={1,2,3,,600}. Ποια η πιθανότητα να:

    1. (α’) 

      διαιρείται με το 2;

    2. (β’) 

      διαιρείται με το 3;

    3. (γ’) 

      διαιρείται και με το 2 και με το 3;

    4. (δ’) 

      διαιρείται με τουλάχιστον ένα από τα δύο;

    5. (ε’) 

      διαιρείται με το 2 αλλά όχι με το 3;

  8. 8. 

    Άλλη μια τυχαία συνάντηση. Ο Σταύρος και ο Γιάννης έχουν δώσει ραντεβού σε ένα μπαρ, και έχουν συμφωνήσει να συναντηθούν εντός μίας συγκεκριμένης ώρας. Καθένας όμως μπορεί να έρθει οποιαδήποτε χρονική στιγμή μέσα σε αυτή την ώρα, χωρίς να δείχνει κάποια προτίμηση σε κάποια στιγμή ή εύρος στιγμών, και χωρίς να επηρεάζεται από το τι θα κάνει ο άλλος. Μοντελοποιήστε το χώρο πιθανότητας αυτού του πειράματος, ορίστε κάποιο μέτρο πιθανότητας που να συμφωνεί με το πραγματικό πρόβλημα, και ακολούθως χρησιμοποιήστε αυτό το μέτρο για να υπολογίσετε ποια είναι η πιθανότητα να μην περιμένει ο πρώτος που θα έρθει τον δεύτερο για περισσότερο από ένα τέταρτο της ώρας. [Υπόδειξη. Μελετήστε το τετράγωνο [0,1]×[0,1]={(x,y):  0x1,  0y1}2.]

  9. 9. 

    Το μέτρο πιθανότητας είναι συνεχής συνάρτηση.

    1. (α’) 

      Έστω μια οποιαδήποτε ακολουθία ενδεχόμενων A1,A2, σε κάποιο χώρο πιθανότητας Ω. Έστω, επιπλέον, ότι τα Ai «μεγαλώνουν», δηλαδή A1A2A3. Ορίζουμε ως Α την (άπειρη) ένωσή τους, δηλαδή το σύνολο που αποτελείται από τα στοιχεία που ανήκουν σε τουλάχιστον ένα από τα Ai. Το A συμβολίζεται ως:


      A=i=1Ai=limiAi.

      Να δείξετε ότι, για οποιοδήποτε μέτρο πιθανότητας ,


      limi(Ai)=(limiAi).
    2. (β’) 

      Έστω μια ακολουθία ενδεχόμενων B1,B2, που μικραίνουν, δηλαδή B1B2B3, και έστω Β η άπειρη τομή τους, δηλαδή το σύνολο Β αποτελείται από όλα τα στοιχεία που ανήκουν σε όλα τα Βi. Το Β συμβολίζεται ως:


      Β=i=1Βi=limiBi.

      Να δείξετε ότι, για οποιοδήποτε μέτρο πιθανότητας ,


      limi(Bi)=(limiBi).

    Παρατηρήστε ότι οι πιο πάνω ιδιότητες δείχνουν ότι το όριο στο αριστερό σκέλος υπάρχει, και ότι μπορούμε να αλλάξουμε τη σειρά του ορίου και της πιθανότητας, εφόσον βέβαια ορίζεται το όριο των συνόλων. Αυτή είναι μια ιδιότητα που χαρακτηρίζει τις συνεχείς συναρτήσεις f: και τα συνήθη όρια, αλλά η έννοια της συνέχειας μπορεί να γενικευτεί στο μέτρο πιθανότητας και τα πιο πάνω αποτελέσματα δείχνουν ότι η συνάρτηση είναι πράγματι «συνεχής».

    Υπόδειξη. Για το πρώτο σκέλος, παρατηρήστε πως,


    A=A1(A2A1)(A3A2),

    δηλαδή το σύνολο A μπορεί να γραφεί σαν την ένωση ξένων μεταξύ τους ενδεχόμενων. Για το δεύτερο σκέλος, χρησιμοποιήστε το πρώτο.



Κεφάλαιο 4 Πιθανότητες και συνδυαστική

[Επιστροφή στα περιεχόμενα]


    Όπως είδαμε σε κάποια παραδείγματα των προηγουμένων κεφαλαίων, συχνά συναντάμε καταστάσεις όπου όλες οι δυνατές εκφάνσεις ενός τυχαίου πειράματος έχουν την ίδια πιθανότητα. Αυτά αποτελούν μια επιμέρους αλλά σημαντική κατηγορία προβλημάτων, και σε αυτό το κεφάλαιο θα δούμε πώς μπορούν να επιλυθούν εύκολα με τη χρήση κάποιων απλών αποτελεσμάτων της συνδυαστικής. Η αφετηρία μας είναι ο κανόνας πιθανότητας #5 τον οποίο είδαμε στο προηγούμενο κεφάλαιο:

Κανόνας πιθανότητας #5
    Αν όλα τα στοιχειώδη ενδεχόμενα είναι ισοπίθανα, τότε, για κάθε ενδεχόμενο Α:

Pr(A)=#A#Ω=πλήθος στοιχείων του Απλήθος στοιχείων του Ω.

Για να εφαρμοστεί αυτός ο κανόνας, προφανώς πρέπει να είμαστε σε θέση να υπολογίσουμε το πλήθος των στοιχείων που περιέχονται σε διάφορα σύνολα – συγκεκριμένα στο χώρο πιθανότητας Ω και στο ενδεχόμενο Α το οποίο μας ενδιαφέρει σε κάθε περίπτωση. Η συνδυαστική είναι ο μαθηματικός τομέας που μας προσφέρει ακριβώς τα εργαλεία που χρειαζόμαστε για αυτούς τους υπολογισμούς. Πιο κάτω θα δούμε μια σειρά από σχετικά απλά αποτελέσματα της συνδυαστικής, και μέσα από παραδείγματα θα δείξουμε με ποιους τρόπους αυτά τα αποτελέσματα χρησιμοποιούνται για την απάντηση ερωτημάτων σε προβλήματα πιθανοτήτων.

4.1 Διατάξεις, συνδυασμοί, επιλογές και πιθανότητες

Ξεκινάμε υπενθυμίζοντας μια πολύ απλή ιδιότητα:

Ιδιότητα 4.1  Όταν συνδυάζονται δύο πειράματα, εκ των οποίον το πρώτο έχει Ν δυνατά αποτελέσματα και το δεύτερο έχει Μ δυνατά αποτελέσματα, τότε το νέο πείραμα έχει Μ×N δυνατά αποτελέσματα. Πιο αυστηρά μαθηματικά μιλώντας, αν το σύνολο A περιγράφει όλα τα δυνατά αποτελέσματα του πρώτου πειράματος και αντίστοιχα το B τα αποτελέσματα του δεύτερου, τότε όλα τα δυνατά αποτελέσματα του συνδυασμού των δύο πειραμάτων περιγράφεται από το καρτεσιανό τους γινόμενο,

A×B={(a,b):aA,bB},

και το πλήθος των στοιχείων του προφανώς ικανοποιεί:


#(A×B)=(#A)(#B).

Παράδειγμα 4.1

(α’) Εφόσον η ρίψη ενός ζαριού έχει 6 δυνατά αποτελέσματα, οι δύο διαδοχικές ρίψεις έχουν 6×6=36 δυνατά αποτελέσματα, οι τρεις διαδοχικές ρίψεις έχουν 6×6×6=216 δυνατά αποτελέσματα, και γενικά οι k διαδοχικές ρίψεις έχουν 6k δυνατά αποτελέσματα.

(β’) Επιλέγουμε έναν από τους 5 υπολογιστές ενός εργαστηρίου (5 δυνατά αποτελέσματα) και αποφασίζουμε να του εγκαταστήσουμε λειτουργικό σύστημα windows ή linux (2 δυνατά αποτελέσματα). Συνολικά υπάρχουν 5×2=10 δυνατά αποτελέσματα.


Παράδειγμα 4.2

Τρία άτομα, ας τους πούμε Α, Β και Γ, τρέχουν σε έναν αγώνα 100 μέτρων. Υποθέτουμε ότι η τελική κατάταξη είναι εντελώς τυχαία. Ποια είναι η πιθανότητα να κερδίσει ο Β;

Κατ’ αρχάς παρατηρούμε ότι ο χώρος πιθανότητας είναι το σύνολο όλων των δυνατών διατάξεων των Α, Β και Γ:


Ω={123,132,213,231,312,321},

όπου, για παράδειγμα, το 132 μας λέει πως ο Α βγήκε πρώτος, ο Β τρίτος και ο Γ δεύτερος. Το ενδεχόμενο που μας ενδιαφέρει, δηλαδή το να κερδίσει ο Β, αντιστοιχεί στο σύνολο {213,312}. Εφόσον «η τελική κατάταξη είναι εντελώς τυχαία», υποθέτουμε ότι όλα τα στοιχειώδη ενδεχόμενα είναι ισοπίθανα, και από τον κανόνα πιθανότητας #5 έχουμε,


Pr(«κέρδισε ο Β»)=Pr({213,312})=#{213,312}#Ω=26=1/3,

όπως είναι και διαισθητικά προφανές.

Εδώ απλώς απαριθμήσαμε όλες τις δυνατές κατατάξεις για τα 3 άτομα. Αλλά αν, αντί για τρεις, συμμετείχαν στον αγώνα 100 άνθρωποι, πόσες δυνατές κατατάξεις θα υπήρχαν; Μπορούμε να σκεφτούμε την τελική κατάταξη ως το αποτέλεσμα του συνδυασμού 100 επιμέρους «πειραμάτων»: Για την πρώτη θέση έχουμε 100 επιλογές. Έχοντας αποφασίσει ποιος είναι πρώτος, για τη δεύτερη θέση έχουμε 99 επιλογές, κ.ο.κ. Έτσι, εφαρμόζοντας διαδοχικά την Ιδιότητα 4.1, για την τελική κατάταξη έχουμε,


100×99×98××3×2×1=100!,

δυνατές κατατάξεις, δηλαδή 100! δυνατούς τρόπους που μπορούν να διαταχθούν 100 άτομα. Με το ίδιο ακριβώς σκεπτικό καταλήγουμε στο εξής συμπέρασμα:

Ιδιότητα 4.2

Υπάρχουν Ν! δυνατές διατάξεις Ν αντικειμένων.


Παρατήρηση:
Θυμίζουμε πως για κάθε ακέραιο αριθμό Ν1 το «Ν παραγοντικό» συμβολίζεται ως Ν! και ορίζεται ως το γινόμενο Ν!=Ν(Ν-1)21. Επίσης, για λόγους ευκολίας ορίζουμε συμβατικά το 0!=1.
Παράδειγμα 4.3

Έστω ότι στις βουλευτικές εκλογές συμμετέχουν 42 κόμματα. Άρα υπάρχουν 42!1051 δυνατές κατατάξεις, αλλά πόσες δυνατές κατατάξεις έχουμε για τα 3 πρώτα κόμματα; Μπορούμε να σκεφτούμε το τελικό αποτέλεσμα ως το συνδυασμό τριών επιμέρους «πειραμάτων»: Για την πρώτη θέση έχουμε 42 επιλογές. Έχοντας αποφασίσει ποιο κόμμα είναι πρώτο, για τη δεύτερη θέση έχουμε 41, και παρομοίως για την τρίτη 40 επιλογές. Εφαρμόζοντας διαδοχικά την Ιδιότητα 4.1, το πλήθος των τελικών κατατάξεων για τα τρία πρώτα κόμματα είναι,


42×41×40=68880.

Γενικά, μπορούμε να ρωτήσουμε πόσες διαφορετικές διατάξεις μπορούμε να πετύχουμε, επιλέγοντας k από N αντικείμενα. Με το ίδιο σκεπτικό, έχουμε Ν επιλογές για το πρώτο, (Ν-1) για το δεύτερο, κ.ο.κ., μέχρι το αντικείμενο k, για το οποίο έχουμε (Ν-k+1) επιλογές. Άρα, από την Ιδιότητα 4.1, βρίσκουμε πως το πλήθος των τελικών διατάξεων είναι:


Ν(Ν-1)(N-k+2)(N-k+1) = Ν(Ν-1)(N-k+1)(N-k)!(N-k)!


= N!(N-k)!.

Έχουμε έτσι αποδείξει το εξής:

Ιδιότητα 4.3  Το πλήθος όλων των δυνατών διατάξεων k αντικειμένων που επιλέγονται από N αντικείμενα ισούται με:

N!(N-k)!.

Παράδειγμα 4.4

Έστω ότι έχουμε μια συνηθισμένη τράπουλα 52 φύλλων. Από την Ιδιότητα 4.2 υπάρχουν 52!8×1067 δυνατές διατάξεις για τα φύλλα της τράπουλας!

Αν επιλέξουμε 3 φύλλα στην τύχη, πόσες δυνατές (διατεταγμένες) τριάδες υπάρχουν; Από την Ιδιότητα 4.3, το πλήθος τους είναι,


52!(52-3)!=52×51×50×49!49!=52×51×50=132600.

Αν υποθέσουμε τώρα ότι η επιλογή των τριών φύλλων είναι εντελώς τυχαία, ποια είναι η πιθανότητα του ενδεχομένου Α να επιλέξουμε τρεις άσους; Εδώ ο χώρος πιθανότητας Ω αποτελείται από όλες τις δυνατές τριάδες φύλλων, που, όπως υπολογίσαμε, είναι #Ω=132600, και εφόσον η επιλογή είναι εντελώς τυχαία υποθέτουμε ότι όλα τα στοιχειώδη ενδεχόμενα είναι ισοπίθανα. Ως υποσύνολο του Ω, το ενδεχόμενο Α αποτελείται από όλες τις δυνατές τριάδες άσων. Η Ιδιότητα 4.3 λοιπόν μας λέει ότι, εφόσον εξετάζουμε τις διατάξεις k=3 φύλλων που μπορούν να επιλεχθούν από N=4 (δηλαδή από τους τέσσερις άσους), έχουμε #Α=4!(4-3)!=4!/1!=24. Άρα, από τον κανόνα πιθανότητας #5 έχουμε,


Pr(«επιλέξαμε 3 άσους»)=Pr(A)=#A#Ω=24132600=155250.02%.

Παράδειγμα 4.5

Αν επιλέξουμε 5 άτομα από μια ομάδα 100 ατόμων, η Ιδιότητα 4.3 μας λέει πως υπάρχουν,


100!(100-5)!διατάξεις δυνατών 5άδων.

Αλλά αν δεν μας ενδιαφέρει η διάταξη, δηλαδή η σειρά με την οποία επιλέγουμε τα 5 άτομα, πόσες διαφορετικές πεντάδες υπάρχουν; Γενικά, πόσες ομάδες k αντικειμένων μπορούν να προκύψουν, όταν αυτά επιλέγονται από N αντικείμενα; Έστω ότι το πλήθος τους είναι x, δηλαδή υπάρχουν x μη διατεταγμένες ομάδες k αντικειμένων. Από την Ιδιότητα 4.2, κάθε τέτοια ομάδα μπορεί να διαταχθεί με k! τρόπους. Άρα, το συνολικό πλήθος των διατεταγμένων ομάδων είναι xk!. Αλλά, από την Ιδιότητα 4.3, αυτό ισούται με Ν!/(Ν-k)!. Άρα έχουμε,


xk!=Ν!(Ν-k)!,δηλαδήx=N!k!(N-k)!.

Έχουμε λοιπόν αποδείξει:

Ιδιότητα 4.4

Το πλήθος όλων των δυνατών συνδυασμώνμη διατεταγμένων επιλογών) k αντικειμένων που επιλέγονται από N αντικείμενα ισούται με,


(Nk)=N!k!(N-k)!,

όπου το (Nk) είναι ο συνήθης διωνυμικός συντελεστής.


Παράδειγμα 4.6

Όπως στο Παράδειγμα 4.5, επιλέγουμε 5 άτομα από 100. Αν δεν μας ενδιαφέρει η σειρά επιλογής, υπάρχουν,


100!5!(100-5)!=100×99×98×96×96×95!5!95!=75287520,

δυνατές πεντάδες που μπορούμε να επιλέξουμε.

Έστω τώρα ότι τα 100 άτομα αποτελούνται από 40 άνδρες και 60 γυναίκες, και ότι η επιλογή μας είναι εντελώς τυχαία. Θα εξετάσουμε τα εξής ερωτήματα:

  • Πόσες πεντάδες μπορούν να σχηματιστούν με 2 άνδρες και 3 γυναίκες;

  • Ποια η πιθανότητα να επιλέξουμε μόνο μία γυναίκα;

  • Ποια η πιθανότητα να μην επιλέξουμε καμία γυναίκα;

Για το πρώτο ερώτημα παρατηρούμε ότι το πείραμα μπορεί να χωριστεί σε δύο μέρη. Βάσει της Ιδιότητας 4.4 μπορούμε να επιλέξουμε 2 άνδρες από τους 40 με (402) τρόπους, και 3 γυναίκες από τις 60 με (603) τρόπους. Άρα, ο συνδυασμός αυτών των δύο επιλογών, βάσει της Ιδιότητας 4.1, έχει,


(402)(603)=40!60!2!38!3!57!=40×39×60×59×582×3×2=26691600,

δυνατά αποτελέσματα.

Για τα άλλα δύο ερωτήματα, ορίζουμε το χώρο πιθανότητας Ω ως το σύνολο όλων των δυνατών (μη διατεταγμένων) επιλογών 5 ατόμων από 100 (εφόσον σε αυτό το πρόβλημα δεν μας απασχολεί η σειρά με την οποία επιλέγονται), οπότε βάσει της Ιδιότητας 4.4 βρίσκουμε όπως παραπάνω ότι #Ω=(1005)=75287520. Ορίζουμε επίσης και τα δύο ενδεχόμενα,


A = {όλες οι πεντάδες που αποτελούνται από 4 άνδρες και μία γυναίκα},

B = {όλες οι πεντάδες που αποτελούνται μόνο από άντρες}.

Με την ίδια συλλογιστική που χρησιμοποιήσαμε για το πρώτο ερώτημα έχουμε, από τις Ιδιότητες 4.4 και 4.1, ότι,


#Α = (404)(601)==5483400,

#B = (405)==658008.

[Παρατηρήστε πως στον υπολογισμό του #Β δεν συμπεριλάβαμε την επιλογή της «καμίας γυναίκας από τις 60», αλλά αυτό δεν επηρεάζει το αποτέλεσμα διότι το πλήθος των τρόπων με τους οποίους μπορεί να γίνει αυτή η επιλογή ισούται με (600)=60!0!60!=1.]

Αφού θεωρούμε ότι η επιλογή γίνεται «εντελώς τυχαία», μπορούμε να εφαρμόσουμε τον πέμπτο κανόνα πιθανότητας, έτσι ώστε,


Pr(«επιλέξαμε μόνο μία γυναίκα») = Pr(A)=#A#Ω=5483400752875200.0728,

Pr(«δεν επιλέξαμε καμία γυναίκα») = Pr(Β)=#Β#Ω=658008752875200.0087.

Παράδειγμα 4.7

Επιλέγουμε τυχαία 3 βιβλία από 10, που αποτελούνται από 5 συγγράμματα μαθημάτων και 5 εγχειρίδια (manual) υπολογιστών. Ποια η πιθανότητα να είναι όλα εγχειρίδια; Να είναι δύο εγχειρίδια κι ένα σύγγραμμα;

Ακριβώς όπως και στο προηγούμενο παράδειγμα, εφόσον δεν μας ενδιαφέρει η σειρά με την οποία επιλέγονται τα βιβλία, ορίζουμε,


Ω = {«όλες οι μη διατεταγμένες τριάδες βιβλίων»},

A = {«οι μη διατεταγμένες τριάδες εγχειριδίων»},

B = {«οι μη διατεταγμένες τριάδες με 2 εγχειρίδια και ένα σύγγραμμα»},

και υπολογίζουμε,


#Ω = (103)=120,

#A = (53)=10,

#B = (52)(51)=50,

οπότε έχουμε τις πιθανότητες,


Pr(«επιλέξαμε 3 manual») = Pr(A)=#A#Ω=10120=112,

Pr(«επιλέξαμε 2 manual και ένα σύγγραμα») = Pr(Β)=#Β#Ω=50120=512.

Παράδειγμα 4.8

Σε κάποιες εκλογές είναι υποψήφιοι 3 φοιτητές και 7 καθηγητές. Εκλέγονται τυχαία τρεις και ζητάμε την πιθανότητα να εκλεγούν τουλάχιστον ένας φοιτητής και τουλάχιστον ένας καθηγητής. Πάλι με την ίδια συλλογιστική όπως στα δύο παραπάνω παραδείγματα, εφόσον δεν μας ενδιαφέρει η διάταξη των τριών ατόμων, υπολογίζουμε τη ζητούμενη πιθανότητα ως,


Pr(«εκλέγονται 1 Φ και 1 Κ»)

=Pr({«εκλέγονται 1 Φ και 2 Κ»}{«εκλέγονται 2 Φ και 1 Κ»})

=Pr(«εκλέγονται 1 Φ και 2 Κ»)+Pr(«εκλέγονται 2 Φ και 1 Κ»),

επειδή τα δύο ενδεχόμενα στη δεύτερη γραμμή παραπάνω είναι ξένα. Άρα, τελικά έχουμε,


Pr(«εκλέγονται 1 Φ και 1 Κ»)=(31)(72)(103)+(32)(71)(103)=2140+740=  0.7.

Ας υποθέσουμε τώρα πως, ανάλογα με τη σειρά εκλογής, αυτοί που εκλέγονται παίρνουν διαφορετικούς ρόλους σε μια επιτροπή – ο πρώτος γίνεται πρόεδρος, ο δεύτερος γραμματέας και ο τρίτος ταμίας. Ποια είναι η πιθανότητα να εκλεγεί φοιτητής πρόεδρος, και καθηγητές γραμματέας και ταμίας; Εφόσον εδώ μας απασχολεί και η σειρά με την οποία επιλέγονται τα «αντικείμενα» (δηλαδή τα μέλη της επιτροπής), υπολογίζουμε αυτή την πιθανότητα βάσει του χώρου πιθανότητας Ω, ο οποίος περιέχει όλες τις διατεταγμένες τριάδες, δηλαδή περιέχει 10!/(10-3)!=720 στοιχεία. Άρα, η πιθανότητα του ενδεχομένου που μας ενδιαφέρει, βάσει της Ιδιότητα 4.3 ισούται με:


3!(3-1)!7!(7-2)!720=7400.175.

Παράδειγμα 4.9

Σε 3 επεξεργαστές πρέπει να κατανεμηθούν 12 διεργασίες, δίνοντας 4 διεργασίες στον κάθε επεξεργαστή. Με πόσους τρόπους μπορεί να γίνει αυτός ο καταμερισμός;

Για να απαντήσουμε, χωρίζουμε το πρόβλημα σε τρία μέρη. Αρχικά επιλέγουμε 4 διεργασίες από τις 12 για τον πρώτο επεξεργαστή, πράγμα που (βάσει της Ιδιότητας 4.4) μπορεί να γίνει με (124) τρόπους. Κατόπιν, επιλέγουμε 4 διεργασίες από τις υπόλοιπες 8 για τον δεύτερο επεξεργαστή, πράγμα που μπορεί να γίνει με (84) τρόπους. Και τέλος οι 4 διεργασίες που απομένουν πηγαίνουν στον τρίτο επεξεργαστή. Χρησιμοποιώντας την Ιδιότητα 4.1, συνολικά αυτός ο καταμερισμός μπορεί να γίνει με:


(124)(84)=12!4!8!8!4!4!=12!4!4!4!τρόπους.

Στη γενική του μορφή, ακριβώς ο ίδιος συλλογισμός μάς δίνει:

Ιδιότητα 4.5

Για να μοιραστούν Ν αντικείμενα σε Μ ομάδες, όπου η πρώτη αποτελείται από k1 αντικείμενα, η δεύτερη από k2 αντικείμενα κ.ο.κ. ως την ομάδα Μ η οποία αποτελείται από kΜ αντικείμενα, υπάρχουν,


(Nk1k2kM)=N!k1!k2!kM!δυνατοί συνδυασμοί,

όπου το (Nk1k2kM) είναι ο πολυωνυμικός συντελεστής. [Δεδομένου φυσικά ότι το άθροισμα k1+k2++kM=Ν].


Παρατήρηση: Αν έχουμε μόνο Μ=2 ομάδες και Ν αντικείμενα, τότε για k1=k αναγκαστικά θα έχουμε k2=N-k και η Ιδιότητα 4.5 λέει πως υπάρχουν N!k!(N-k)! τρόποι να μοιράσουμε Ν αντικείμενα σε δύο ομάδες των k και (N-k), αντίστοιχα. Αυτό είναι ταυτόσημο με το περιεχόμενο της Ιδιότητας 4.4, άρα η Ιδιότητα 4.5 αποτελεί γενίκευση της 4.4.


Παράδειγμα 4.10

Έχουμε 20 υπολογιστές, που αποτελούνται από 10 PC και 10 Apple, και τους μοιράζουμε τυχαία σε τρία clusters, που αποτελούνται από 10, 5 και 5 υπολογιστές αντίστοιχα. Ποιες είναι οι πιθανότητες των ενδεχομένων Α και Β πιο κάτω;


A = {«όλα τα PC στο ίδιο cluster»},

B = {«4 PC στο πρώτο cluster, 3 PC στο δεύτερο και 3 PC στο τρίτο»}.

Ο χώρος πιθανότητας Ω, που περιγράφει αυτό το πείραμα, αποτελείται από όλους τους δυνατούς τρόπους με τους οποίους 20 αντικείμενα μπορούν να χωριστούν σε τρεις ομάδες των 10, 5 και 5 αντικειμένων. Άρα, από την Ιδιότητα 4.5, έχουμε,


#Ω=(2010 5 5)=20!10!  5!  5!.

Επιπλέον, οι υπολογιστές κατατάσσονται σε clusters τυχαία, οπότε υποθέτουμε ότι όλα τα στοιχειώδη ενδεχόμενα είναι ισοπίθανα και θα χρησιμοποιήσουμε και πάλι τον πέμπτο κανόνα πιθανότητας για να υπολογίσουμε την πιθανότητα του Α και του Β.

Για το Α παρατηρούμε πως «όλα τα PC στο ίδιο cluster» είναι ακριβώς ισοδύναμο με το «όλα τα PC στο πρώτο cluster». Άρα, το πλήθος των στοιχείων του Α ισούται με το πλήθος των τρόπων που μπορούν τα 10 Apple να μοιραστούν σε δύο clusters με 5 το καθένα, δηλαδή (105). Συνεπώς,


Pr(A)=Pr(«όλα τα PC στο ίδιο cluster»)=(105)(2010 5 5)=10-6.

Τέλος, για το Β, έχουμε όλους τους δυνατούς τρόπους με τους οποίους τα 10 PC μπορούν να μοιραστούν σε 3 clusters με αναλογία 4-3-3, σε συνδυασμό με όλους τους τρόπους με τους οποίους τα 10 Apple μπορούν να μοιραστούν σε 3 clusters με αναλογία 6-2-2. Άρα:


Pr(Β) = Pr(«4 PC στο πρώτο cluster, 3 PC στο δεύτερο και 3 PC στο τρίτο»)


= #A#Ω=(104 3 3)(106 2 2)(2010 5 5)


= 10!  10!  10!  5!,5!20!  4!  3!  3!  6!  2!  2!=0.195.

4.2 Πέντε «κανόνες αρίθμησης»

Στο κεφάλαιο αυτό ως τώρα διατυπώσαμε κάποιες βασικές ιδιότητες της συνδυαστικής τις οποίες θα χρησιμοποιούμε συχνά. Για να αναφερόμαστε σε αυτές πιο εύκολα, τις παραθέτουμε περιληπτικά πιο κάτω.

Κανόνες αρίθμησης
  1. 1. 

    Αν ένα πείραμα έχει Ν δυνατά αποτελέσματα και ένα άλλο Μ δυνατά αποτελέσματα, τότε ο συνδυασμός τους έχει Μ×N δυνατά αποτελέσματα.

  2. 2. 

    Υπάρχουν Ν! δυνατές διατάξεις Ν αντικειμένων.

  3. 3. 

    Υπάρχουν


    N!(N-k)!

    δυνατές διατάξεις k αντικειμένων που επιλέγονται από N.

  4. 4. 

    Υπάρχουν


    (Nk)=N!k!(N-k)!

    δυνατοί συνδυασμοίμη διατεταγμένες επιλογές) k αντικειμένων που επιλέγονται από N αντικείμενα.

  5. 5. 

    Υπάρχουν


    (Nk1k2kM)=N!k1!k2!kM!

    δυνατοί συνδυασμοί βάσει των οποίων μπορούν να μοιραστούν Ν αντικείμενα σε Μ ομάδες, όπου η πρώτη αποτελείται από k1 αντικείμενα, η δεύτερη από k2 αντικείμενα κ.ο.κ. ως την ομάδα Μ η οποία αποτελείται από kΜ αντικείμενα [για k1+k2++kM=Ν].

4.3 Ασκήσεις

  1. 1. 

    Μέτρημα. Πόσες δυνατές εκδοχές υπάρχουν στο καθένα από τα παρακάτω πειράματα;

    1. (α’) 

      Επιλέγουμε με τη σειρά 3 από 12 αντικείμενα, χωρίς επανατοποθέτηση.

    2. (β’) 

      Στρίβουμε ένα νόμισμα 6 φορές.

    3. (γ’) 

      Επιλέγουμε 20 από 100 άτομα για μια δημοσκόπηση, χωρίς επανατοποθέτηση.

    4. (δ’) 

      Ρίχνουμε ένα ζάρι 7 φορές.

    5. (ε’) 

      Βάζουμε 13 ανθρώπους να κάτσουν σε μια σειρά.

    6. (στ’) 

      Μοιράζουμε με τη σειρά 8 φύλλα από μια συνηθισμένη τράπουλα 52 φύλλων.

    7. (ζ’) 

      Ρίχνουμε ένα νόμισμα 4 φορές και ένα ζάρι 2 φορές.

  2. 2. 

    Επιλογές με επανατοποθέτηση. Ο κανόνας αρίθμησης #4 λέει πως, αν επιλέξουμε k αντικείμενα από n χωρίς επανατοποθέτηση, υπάρχουν (nk) ομάδες k αντικειμένων που μπορούμε να επιλέξουμε. Τι θα γινόταν αν επιλέγαμε k αντικείμενα ανάμεσα σε n, επιτρέποντας την επανατοποθέτηση (και χωρίς να έχει σημασία η σειρά επιλογής); Μερικά παραδείγματα:

    1. (α’) 

      Για να φτιάξουμε μια πίτσα, επιλέγουμε 4 υλικά από 7 διαθέσιμα, χωρίς όμως να μας νοιάζει ποιο θα μπει πρώτο, και επιτρέπεται να βάλουμε πολλές δόσεις από κάτι, μπορούμε, για παράδειγμα, να βάλουμε διπλό τυρί.

    2. (β’) 

      Πρέπει να αγοράσουμε 15 αρκουδάκια επιλέγοντας από 5 διαφορετικά είδη, και μπορούμε να αγοράσουμε πολλές φορές το ίδιο είδος.

  3. 3. 

    1-2-Χ. Η ομάδα μας παίζει στην έδρα της 9 διαδοχικά παιχνίδια με αντίπαλες ομάδες. Με πόσους τρόπους μπορούμε να έχουμε 4 νίκες (δηλαδή «1»), 3 ισοπαλίες (δηλαδή «Χ»), και 2 ήττες (δηλαδή «2»);

  4. 4. 

    Τράπουλα. Μοιράζουμε στην τύχη 10 φύλλα από μια συνηθισμένη τράπουλα 52 φύλλων. Ποια η πιθανότητα να περιέχει η μοιρασιά:

    1. (α’) 

      κανέναν άσο;

    2. (β’) 

      το πολύ τρεις άσους;

  5. 5. 

    Poker. Ένας παίκτης του πόκερ παίρνει 5 φύλλα από μια κανονική τράπουλα 52 φύλλων. Ποια είναι η πιθανότητα να έχει:

    1. (α’) 

      καρέ (δηλαδή 4 ίδια φύλλα, για παράδειγμα 4 άσους ή 4 ντάμες);

    2. (β’) 

      φουλ (δηλαδή ένα ζευγάρι και μία τριάδα, για παράδειγμα 3 άσους και 2 ρηγάδες);

    3. (γ’) 

      χρώμα (δηλαδή όλα κούπες ή όλα σπαθιά ή όλα μπαστούνια ή όλα καρό);

  6. 6. 

    Ξενοδοχείο Ακρόπολις. Έξι φίλοι συμφωνούν να συναντηθούν στο ξενοδοχείο Ακρόπολις των Αθηνών. Συμβαίνει όμως να υπάρχουν 4 ξενοδοχεία με το ίδιο όνομα. Κάθε ένας από τους 6 φίλους διαλέγει στην τύχη να πάει σε ένα από αυτά.

    1. (α’) 

      Ποιος είναι εδώ ο χώρος πιθανότητας; Πόσα στοιχεία περιλαμβάνει;

    2. (β’) 

      Ποια είναι η πιθανότητα να συναντηθούν ανά ζεύγη (εννοείται σε τρία διαφορετικά ξενοδοχεία);

    3. (γ’) 

      Ποια είναι η πιθανότητα να βρεθούν δύο μόνοι τους και άλλοι τέσσερις σε δύο ζεύγη;

  7. 7. 

    Superleague. H Superleague έχει 16 ομάδες και όλες πρέπει να παίξουν με όλες, ακριβώς δύο φορές, μία φορά σε κάθε έδρα. Πόσοι αγώνες πρέπει να γίνουν συνολικά;

  8. 8. 

    Λόττο. Για να κερδίσουμε το Λόττο πρέπει να προβλέψουμε 6 αριθμούς ανάμεσα στους 1,2,3,,49, χωρίς διάταξη και χωρίς επανατοποθέτηση. Ποια είναι η πιθανότητα να κερδίσουμε παίζοντας μόνο μία στήλη;

  9. 9. 

    Εύκολες και δύσκολες ασκήσεις. Σε ένα μάθημα οι φοιτητές χωρίζονται σε τρεις ομάδες, και στην κάθε ομάδα δίνονται 6 ασκήσεις οι οποίες επιλέγονται τυχαία, και χωρίς επανατοποθέτηση, από ένα σύνολο 18 ασκήσεων. Αν, από τις 18 ασκήσεις, οι 3 είναι εύκολες και οι 15 δύσκολες, ποια είναι η πιθανότητα και οι τρεις ομάδες να έχουν από μία εύκολη άσκηση;

  10. 10. 

    Μέτρημα αποτελεσμάτων.

    1. (α’) 

      Πόσοι διαφορετικοί αναγραμματισμοί μπορούν να γίνουν με τα γράμματα της λέξης ΚΥΠΡΟΣ; Αντίστοιχα, πόσοι για τη λέξη ΣΤΑΥΡΟΣ; Για τη λέξη ΣΙΣΙΝΙ; (Οι αναγραμματισμοί δεν χρειάζεται να υπάρχουν στο λεξικό!)

    2. (β’) 

      Μια ομάδα χορού περιλαμβάνει 12 γυναίκες και 7 άντρες. Με πόσους διαφορετικούς τρόπους μπορούμε να σχηματίσουμε 3 ζευγάρια, καθένα αποτελούμενο από μία γυναίκα και έναν άντρα;

    3. (γ’) 

      Με την παραγγελία μιας πίτσας μπορούμε να επιλέξουμε 6 από 20 υλικά. Πόσοι συνδυασμοί υπάρχουν αν τα υλικά μπορούν να επαναλαμβάνονται; Πόσοι συνδυασμοί υπάρχουν αν δεν επαναλαμβάνονται; [Και στις δυο περιπτώσεις, δεν έχει σημασία η σειρά επιλογής των υλικών.]



Κεφάλαιο 5 Ανεξαρτησία και δεσμευμένη πιθανότητα

[Επιστροφή στα περιεχόμενα]


Ας πούμε πως ένας μετεωρολόγος μάς πληροφορεί ότι, με βάση τα ιστορικά στατιστικά στοιχεία του καιρού στην Αθήνα, βρέχει μία στις 9 μέρες. Αν για κάποιο λόγο μάς ενδιαφέρει τι καιρό κάνει τις Κυριακές (γιατί, π.χ., τις Κυριακές κάνουμε πικ-νικ στην Πάρνηθα), λογικά θα υποθέσουμε ότι μία στις 9 Κυριακές βρέχει. Αυτός ο συλλογισμός ισχύει γιατί έχουμε, έμμεσα, υποθέσει πως το αν βρέχει ή όχι σήμερα είναι ανεξάρτητο από το ποια μέρα της εβδομάδας είναι.

Αντίθετα, αν μας ενδιαφέρει ακριβώς τι καιρό κάνει τις μέρες που έχει συννεφιά, θα ήταν λάθος να υποθέσουμε ότι μία στις 9 συννεφιασμένες μέρες βρέχει – το ποσοστό θα είναι προφανώς μεγαλύτερο, γιατί η συννεφιά δεν είναι ανεξάρτητη από τη βροχή.

Το κεντρικό αντικείμενο αυτού του κεφαλαίου είναι η μαθηματική περιγραφή του πότε δύο ενδεχόμενα είναι ανεξάρτητα, και η μελέτη του πώς επηρεάζονται οι πιθανότητες δύο ενδεχομένων από το εάν αυτά είναι ή δεν είναι ανεξάρτητα. Παράλληλα, θα διατυπώσουμε και κάποιους ακόμα κανόνες πιθανότητας, οι οποίοι συμπληρώνουν εκείνους που είδαμε στο Κεφάλαιο 3.

5.1 Ανεξάρτητα ενδεχόμενα και δεσμευμένη πιθανότητα

Παράδειγμα 5.1

Ρίχνουμε ένα δίκαιο ζάρι 2 φορές. Όπως στο Παράδειγμα 3.3, ο χώρος πιθανότητας αποτελείται από τα 36 δυνατά αποτελέσματα των δύο ρίψεων και όλα τα στοιχειώδη ενδεχόμενα είναι ισοπίθανα. Ορίζουμε όπως πριν τα ενδεχόμενα,


Β = «εξάρες»,

Γ = «6 την πρώτη φορά»,

και επιπλέον το ενδεχόμενο Ε=«6 τη δεύτερη φορά», όπου παρατηρούμε ότι το Β μπορεί να εκφραστεί ως Β=ΓE.

Για τις πιθανότητες αυτών των ενδεχομένων, χρησιμοποιώντας τον πέμπτο κανόνα πιθανότητας, εύκολα υπολογίζουμε:


Pr(B)=136καιPr(Γ)=Pr(E)=16.

Από αυτό το αποτέλεσμα προκύπτει η σχέση,


136=Pr(B)=Pr(ΓE)=Pr(Γ)Pr(E)=1616,

δηλαδή Pr(ΓE)=Pr(Γ)Pr(E). Αυτή είναι μια πολύ σημαντική παρατήρηση, αλλά εξίσου σημαντικό είναι να παρατηρήσουμε πως αυτή η σχέση δεν ισχύει για οποιαδήποτε δύο ενδεχόμενα. Για παράδειγμα,


136=Pr(B)=Pr(ΒΓ)Pr(B)Pr(Γ)=16136.
Ορισμός 5.1 (Ανεξάρτητα ενδεχόμενα)

Δύο ενδεχόμενα Α και Β είναι στατιστικά ανεξάρτητα, ή απλά, ανεξάρτητα, αν και μόνο αν:


Pr(AB)=Pr(A)Pr(B).

Ο κάθε κανόνας πιθανότητας και ο κάθε κανόνας αρίθμησης που έχουμε δει ως τώρα αντιστοιχούν σε κάποιο συγκεκριμένο μαθηματικό αποτέλεσμα (και το ίδιο ισχύει για τους κανόνες πιθανότητας #7–10, που θα δούμε στη συνέχεια). Αντίθετα, ο κανόνας πιθανότητας #6, που θα διατυπώσουμε τώρα, μας παρέχει έναν τρόπο για να «μοντελοποιούμε» κάποια προβλήματα, δηλαδή μας δίνει μια γέφυρα μεταξύ της διαισθητικής περιγραφής ενός παραδείγματος και της αντίστοιχης αυστηρά μαθηματικής διατύπωσής του.

Κανόνας Πιθανότητας #6. Όταν δύο ενδεχόμενα Α,Β είναι «λογικά ανεξάρτητα», δηλαδή το εάν συμβεί το ένα δεν επηρεάζει το εάν συμβεί το άλλο, τότε θεωρούμε πως είναι και (στατιστικά) ανεξάρτητα, δηλαδή πως Pr(AB)=Pr(A)Pr(B).

Παράδειγμα 5.2

Ένα δίκτυο κινητής τηλεφωνίας εξυπηρετεί 30 συνδρομητές στο κέντρο μιας πόλης και 20 συνδρομητές στην περιφέρεια. Από τους 30 του κέντρου, οι 3 έχουν συσκευές Nokia και οι 27 Ericsson, ενώ στην περιφέρεια υπάρχουν 15 Nokia και 5 Ericsson. Επιλέγουμε τυχαία έναν συνδρομητή από την κάθε περιοχή, και εξετάζουμε τα ενδεχόμενα:


K = «το τηλ. από το κέντρο είναι Nokia»,

Π = «το τηλ. από την περιφέρεια είναι Nokia».

Εφόσον τα δύο ενδεχόμενα αντιστοιχούν σε δύο διαφορετικές επιλογές, είναι φυσικό να υποθέσουμε πως είναι λογικά ανεξάρτητα. Σε αυτό το απλό παράδειγμα, η ανεξαρτησία τους μπορεί εύκολα και να επιβεβαιωθεί μαθηματικά, χωρίς να χρειαστούμε τον κανόνα πιθανότητας #6.

Μια που οι επιλογές είναι τυχαίες, τα στοιχειώδη ενδεχόμενα που αντιστοιχούν σε αυτά τα δύο «πειράματα» είναι ισοπίθανα, οπότε, από τον κανόνα πιθανότητας #5, έχουμε,


Pr(K)=330=110,Pr(Π)=1520=34.

Αν όμως εξετάσουμε τις δύο επιλογές ως ένα πείραμα, τότε υπάρχουν συνολικά 30×20=600 δυνατές επιλογές, ενώ το ενδεχόμενο KΠ, δηλαδή να επιλέξουμε συσκευή Nokia και τις δύο φορές, περιέχει 3×15=45 στοιχεία. Άρα,


Pr(KΠ)=45600=340=11034=Pr(K)Pr(Π),

και συνεπώς τα K,Π είναι πράγματι ανεξάρτητα.


Παράδειγμα 5.3

Έστω ότι στρίβουμε 4 φορές ένα νόμισμα, το οποίο έρχεται Κορώνα με πιθανότητα p, για κάποιο (γνωστό σε μας) p(0,1). Εδώ ο χώρος πιθανότητας Ω αποτελείται από τα 2×2×2×2=16 δυνατά αποτελέσματα (π.χ., ΚΓΚΚ ή ΓΓΓΚ κ.ο.κ.) των τεσσάρων ρίψεων. Αλλά, αν το νόμισμα δεν είναι δίκαιο (δηλαδή αν το p1/2) τα στοιχειώδη ενδεχόμενα δεν είναι ισοπίθανα, οπότε δεν μπορούμε να χρησιμοποιήσουμε τον κανόνα πιθανότητας #5 για τους υπολογισμούς πιθανοτήτων.

Από την άλλη, λογικά μπορούμε να θεωρήσουμε ότι οι διαδοχικές ρίψεις είναι ανεξάρτητες μεταξύ τους, άρα μπορούμε να υπολογίσουμε την πιθανότητα ενός στοιχειώδους ενδεχομένου, όπως π.χ. του {KΓKK}, εφαρμόζοντας τον κανόνα πιθανότητας #6, ως,


Pr({Κ την πρώτη φορά}{Γ τη 2η}{Κ την 3η}{Κ την 4η})

=Pr({Κ την πρώτη φορά})Pr({Γ τη 2η})Pr({Κ την 3η})Pr({Κ την 4η})

=p(1-p)pp=(1-p)p3,

όπου θεωρούμε ότι τα τέσσερα παραπάνω ενδεχόμενα είναι (λογικά, και συνεπώς στατιστικά) ανεξάρτητα.

Υπενθυμίζουμε την Παρατήρηση 2 που ακολουθούσε το Παράδειγμα 3.1 στην αρχή του Κεφαλαίου 3, βάσει της οποίας (σε έναν διακριτό χώρο πιθανότητας), για να υπολογίσουμε την πιθανότητα οποιουδήποτε ενδεχομένου της μορφής Α={ω1,ω2,,ωk}, αρκεί να γνωρίζουμε την πιθανότητα των στοιχειωδών ενδεχομένων {ωi}, οπότε:


Pr(A)=Pr({ω1})+Pr({ω2})++Pr({ωk}).

Συνδυάζοντας αυτή την παρατήρηση με το γεγονός ότι, στο παράδειγμά μας, η ανεξαρτησία μάς επιτρέπει να υπολογίσουμε την πιθανότητα για κάθε στοιχειώδες ενδεχόμενο, καταλήγουμε στο ότι μπορούμε να υπολογίσουμε την πιθανότητα οποιουδήποτε ενδεχομένου.

Για παράδειγμα, αν Α=«τέσσερις φορές το ίδιο αποτέλεσμα», τότε έχουμε:


Pr(A) = Pr({KKKK,ΓΓΓΓ})


= Pr({KKKK}{ΓΓΓΓ})


= Pr({KKKK})+Pr({ΓΓΓΓ})


= p4+(1-p)4.

Με τον ίδιο τρόπο θα προσεγγίσουμε και το επόμενο παράδειγμα.


Παράδειγμα 5.4

Έστω ότι υπάρχουν τρεις συνδέσεις σε ένα δίκτυο, και η καθεμία ενεργοποιείται, ανεξάρτητα από τις άλλες δύο, με πιθανότητα 1/4. Εξετάζουμε ποιες συνδέσεις είναι ενεργές μία δεδομένη στιγμή, οπότε ο χώρος πιθανότητας Ω αποτελείται από τα 8 στοιχεία που περιγράφουν τις αντίστοιχες 8 δυνατές καταστάσεις. Για παράδειγμα, το στοιχείο ΕΕΑ του Ω περιγράφει την κατάσταση όπου οι δύο πρώτες συνδέσεις είναι ενεργές και η τρίτη ανενεργή.

Ποια είναι η πιθανότητα του ενδεχομένου Β=«ακριβώς μία σύνδεση είναι ενεργή»; Εφόσον τα στοιχειώδη ενδεχόμενα εδώ δεν είναι ισοπίθανα, θα ακολουθήσουμε την ίδια λογική όπως και στο προηγούμενο παράδειγμα:


Pr(B) = Pr({EAA,AEA,AAE})=Pr({EAA}{AEA}{AAE})


= Pr({EAA})+Pr({AEA})+Pr({AAE}).

Και δεδομένου ότι η κάθε σύνδεση είναι ενεργή (με πιθ. 1/4) ή ανενεργή (με πιθ. 3/4) ανεξάρτητα από τις άλλες, έχουμε,


Pr(B)=143434+341434+343414=2764.

Παρατήρηση:
Όταν δύο ενδεχόμενα Α,Β είναι ανεξάρτητα, η ανεξαρτησία τους μας επιτρέπει να εκφράσουμε την πιθανότητα της τομής τους Pr(AB) ως το γινόμενο των επιμέρους πιθανοτήτων τους, Pr(A)Pr(B). Στη γενική περίπτωση όπου τα Α,Β μπορεί να μην είναι ανεξάρτητα, η αντίστοιχη ιδιότητα εκφράζεται με τη χρήση της δεσμευμένης πιθανότητας:
Ορισμός 5.2

(Δεσμευμένη πιθανότητα)

Για οποιαδήποτε δύο ενδεχόμενα Α,B έχουμε,


Pr(AB)=Pr(A)Pr(B|A),

όπου η δεσμευμένη πιθανότητα του 𝚩 δεδομένου του 𝚨 ορίζεται αντιστοίχως ως


Pr(B|A)=Pr(AB)Pr(A),

όποτε το ενδεχόμενο A έχει μη μηδενική πιθανότητα.


Παρατηρήσεις:

  1. 1. 

    Αφού προφανώς Pr(AB)=Pr(BA) για κάθε Α,Β, από τον ορισμό προκύπτει πως πάντοτε έχουμε:


    Pr(AB)=Pr(A)Pr(B|A)=Pr(B)Pr(A|B).
    (5.1)

    Όπως θα δούμε σε αρκετά απ’ τα πιο κάτω παραδείγματα, η σχέση (5.1) θα μας φανεί πολύ συχνά χρήσιμη. Γι’ αυτόν το λόγο καταγράφεται στην περίληψη στο τέλος του κεφαλαίου ως «κανόνας πιθανότητας #7».

  2. 2. 

    Τα ενδεχόμενα Α,Β είναι εξ ορισμού ανεξάρτητα αν και μόνο αν Pr(AB)=Pr(A)Pr(B). Αλλά από τη σχέση (5.1) βλέπουμε πως αυτό ισχύει αν και μόνο Pr(A|B)=Pr(A), ή, ισοδύναμα, αν και μόνο αν Pr(B|A)=Pr(B).

  3. 3. 

    Γενικά Pr(A|B)Pr(B|A), όπως, λόγου χάρη, στο αμέσως επόμενο παράδειγμα.

Παράδειγμα 5.5

Μια εταιρία πληροφορικής απασχολεί 40 Έλληνες και 30 αλλοδαπούς εργαζόμενους, εκ των οποίων κάποιοι είναι τεχνικοί και κάποιοι προγραμματιστές:


Έλληνες αλλοδαποί
τεχνικοί 22 25
προγραμματιστές 18 5

Επιλέγουμε τυχαία έναν από τους 70 εργαζομένους, και εξετάζουμε τα ενδεχόμενα:


T = «επελέγη τεχνικός»,

Ε = «επελέγη Έλληνας».

Εφόσον η επιλογή είναι τυχαία, από τον κανόνα πιθανότητας #5 έχουμε,


Pr(T)=22+2570=4770καιPr(E)=4070=47.

Παρομοίως, η πιθανότητα να επιλέξουμε έναν Έλληνα τεχνικό είναι,


Pr(ET)=2270,

το οποίο προφανώς δεν ισούται με (47/70)×(4/7), άρα τα ενδεχόμενα Ε και Τ δεν είναι ανεξάρτητα.

Έστω τώρα πως γνωρίζουμε ότι το άτομο που επελέγη είναι τεχνικός. Ποια η πιθανότητα να είναι Έλληνας; Από τον ορισμό της δεσμευμένης πιθανότητας, αυτό ισούται με:


Pr(E|T)=Pr(ET)Pr(T)=22/7047/70=2247.

Σε αυτό το παράδειγμα μπορούμε να ελέγξουμε αν το αποτέλεσμα συμφωνεί με τη διαίσθησή μας για το τι θα πει «πιθανότητα ενός ενδεχομένου δεδομένου ενός άλλου» ως εξής: Εφόσον γνωρίζουμε πως το επιλεγμένο άτομο είναι τεχνικός, διαισθητικά το πείραμά μας είναι ισοδύναμο με μια τυχαία επιλογή μεταξύ των 22+25=47 τεχνικών. Και εφόσον από αυτούς τους 47 οι 22 είναι Έλληνες, λογικά θα περιμέναμε η πιθανότητα του να επιλέξουμε έναν Έλληνα να ισούται με 22/47, το οποίο πράγματι επιβεβαιώνεται από τον προηγούμενό μας υπολογισμό, ο οποίος έγινε βάσει του ορισμού.

Τέλος, μπορούμε να εξετάσουμε την «αντίστροφη» περίπτωση: Ποια είναι η πιθανότητα να επιλέξαμε τεχνικό δεδομένου ότι επιλέξαμε κάποιον Έλληνα; Όπως και πριν, από τον ορισμό της δεσμευμένης πιθανότητας βρίσκουμε,


Pr(T|E)=Pr(ET)Pr(T)=22/7040/70=2240=1120.

Στο επόμενο λήμμα καταγράφουμε μια απλή ιδιότητα της δεσμευμένης πιθανότητας, η οποία είναι ανάλογη του κανόνα πιθανότητας #4 για τις απλές πιθανότητες που είδαμε στο Κεφάλαιο 3.

Λήμμα 5.1

Για οποιαδήποτε δύο ενδεχόμενα Α,Β, έχουμε:


Pr(A|B)=1-Pr(A|B).
Απόδειξη:

Ξεκινώντας από τον ορισμό της δεσμευμένης πιθανότητας, βρίσκουμε,


Pr(A|B) = Pr(AB)Pr(B)


= Pr(AB)+Pr(AB)-Pr(AB)Pr(B)


= Pr((AB)(AB))-Pr(AB)Pr(B)


= Pr(B)-Pr(AB)Pr(B)


= 1-Pr(AB)Pr(B)


= 1-Pr(A|B),

όπου στο πρώτο βήμα εφαρμόσαμε τον Ορισμό 5.2, στο τρίτο βήμα χρησιμοποιήσαμε τον κανόνα πιθανότητας #3, στο τελευταίο βήμα εφαρμόσαμε τον Ορισμό 5.2, και στο τέταρτο βήμα χρησιμοποιήσαμε την προφανή ιδιότητα ότι το ενδεχόμενο Β μπορεί να εκφραστεί ως «τα στοιχεία του Β που ανήκουν στο Α μαζί με τα στοιχεία του Β που δεν ανήκουν στο Α», δηλαδή, Β=(AB)(AB), και το γεγονός ότι τα ενδεχόμενα (AB) και (AB) είναι εξ ορισμού ξένα.


Παράδειγμα 5.6
11Στην πρώτη του ανάγνωση, αυτό το παράδειγμα ίσως φαίνεται δυσκολότερο και πιο πολύπλοκο από τα προηγούμενα. Όπως θα δούμε πιο κάτω σε αυτό το κεφάλαιο, αποτελεί ειδική περίπτωση της χρήσης ενός πολύ σημαντικού αποτελέσματος που θα διατυπώσουμε λεπτομερώς στον κανόνα πιθανότητας #10, τον λεγόμενο «κανόνα του Bayes».

Έστω πως, σε έναν πληθυσμό 10 εκατομμυρίων ανθρώπων, 20,000 άτομα είναι φορείς του ιού HIV. Επιλέγεται ένα άτομο τυχαία και του γίνεται μια εξέταση για HIV, η οποία έχει ποσοστό σφάλματος 5%, δηλαδή,


Pr(αποτέλεσμα εξέτασης θετικό|όχι φορέας του HIV)=  0.05,

καιPr(αποτέλεσμα εξέτασης αρνητικό|φορέας του HIV)=  0.05.

H σημαντική ερώτηση εδώ για τον εξεταζόμενο είναι: Αν το αποτέλεσμα της εξέτασης είναι θετικό (δηλαδή υποστηρίζει πως ο εξεταζόμενος είναι φορέας του ιού), ποια είναι η πιθανότητα ο εξεταζόμενος να είναι πράγματι φορέας;

Ίσως φαίνεται εκ πρώτης όψεως «προφανές» πως η απάντηση είναι 95%, αλλά, όπως θα δούμε, η σωστή απάντηση είναι πολύ διαφορετική.

Για να προσεγγίσουμε το πρόβλημα συστηματικά, ορίζουμε τα ενδεχόμενα,


Θ = «αποτέλεσμα εξέτασης θετικό»,

καιΗ = «ο εξεταζόμενος είναι φορέας του HIV»,

και καταγράφουμε τα δεδομένα του προβλήματος:


Pr(H)=2000010000000=21000=0.002,Pr(Θ|H)=Pr(Θ|H)=0.05.
(5.2)

Η ζητούμενη πιθανότητα είναι η Pr(H|Θ).

Ξεκινάμε υπολογίζοντας την πιθανότητα του ενδεχομένου Θ, δηλαδή του να βγει θετικό το αποτέλεσμα της εξέτασης ενός τυχαία επιλεγμένου ατόμου. Εκφράζοντας το Θ ως την ένωση δύο ξένων ενδεχομένων, Θ=(ΘH)(ΘH), έχουμε,


Pr(Θ)=Pr(ΘH)+Pr(ΘH),

και χρησιμοποιώντας τη σχέση (5.1), που προέκυψε από τον ορισμό της δεσμευμένης πιθανότητας,


Pr(Θ) = Pr(Θ|H)Pr(H)+Pr(Θ|H)Pr(H)


= (1-Pr(Θ|H))Pr(H)+Pr(Θ|H)(1-Pr(H)),

όπου στο δεύτερο βήμα χρησιμοποιήσαμε το Λήμμα 5.1 και τον κανόνα πιθανότητας #4. Αντικαθιστώντας τις τιμές των πιθανοτήτων (5.2),


Pr(Θ)=(1-0.05)  0.002+0.05(1-0.002)  0.0518.
(5.3)

Τώρα είμαστε σε θέση να απαντήσουμε το βασικό μας ερώτημα: Δεδομένου ότι η εξέταση βγήκε θετική, ποια η πιθανότητα να είναι φορέας του HIV ο εξεταζόμενος; Από τον ορισμό της δεσμευμένης πιθανότητας και τη σχέση (5.1), με τον ίδιο συλλογισμό όπως προηγουμένως βρίσκουμε:


Pr(H|Θ)=Pr(ΘH)Pr(Θ)=Pr(Θ|H)Pr(H)Pr(Θ)=[1-Pr(Θ|H)]Pr(H)Pr(Θ).

Τέλος, αντικαθιστώντας τις τιμές των πιθανοτήτων από τα δεδομένα (5.2) και τον υπολογισμό (5.3), έχουμε,


Pr(H|Θ)=(1-0.05)  0.0020.05180.0367=3.76%

Βλέπουμε, λοιπόν, πως η πιθανότητα ο εξεταζόμενος να είναι φορέας του HIV δεδομένου πως το αποτέλεσμα της εξέτασης είναι θετικό, είναι σημαντικά μικρότερη από την πρώτη μας διαισθητική απάντηση που ήταν βασισμένη στο σκεπτικό ότι για το 95% των περιπτώσεων η εξέταση δίνει το σωστό αποτέλεσμα! Η διαφορά αυτή προκύπτει από το ότι αρχικά δεν λάβαμε υπόψη μας πως ο εξεταζόμενος επιλέχθηκε τυχαία από έναν πληθυσμό στον οποίο πολύ σπάνια συναντάμε έναν φορέα του HIV. Η αρχική πιθανότητα (2 στους χίλιους) να είναι φορέας φυσικά αυξάνεται (στο 3.76%) λόγω του θετικού αποτελέσματος της εξέτασης, αλλά δεν φτάνει ως το 95% όπως αρχικά φανταζόμασταν.

5.2 Περαιτέρω ιδιότητες

Παράδειγμα 5.7

Σε ένα εργαστήριο υπάρχουν 150 PC, εκ των οποίων τα 120 είναι συνδεδεμένα στο internet, τα 45 είναι συνδεδεμένα με ένα δίκτυο εκτυπωτών, και 30 είναι και στα δύο δίκτυα. Επιλέγουμε ένα PC στην τύχη:

  • (i)

    Αν διαπιστώσουμε ότι είναι συνδεδεμένο με το δίκτυο εκτυπωτών, ποια η πιθανότητα να είναι και στο internet;

  • (ii)

    Ποια η πιθανότητα να είναι συνδεδεμένο σε τουλάχιστον ένα από τα δύο δίκτυα;

Εδώ ο χώρος πιθανότητας Ω αποτελείται από τα 150 PC, και τα ενδεχόμενα που μας ενδιαφέρουν για το πρώτο ερώτημα είναι τα I=«το επιλεγμένο PC είναι στο internet» και Ε=«το επιλεγμένο PC είναι στο δίκτυο εκτυπωτών». Εφόσον η επιλογή είναι τυχαία, εφαρμόζοντας τον κανόνα πιθανότητας #5 βρίσκουμε τις πιθανότητες Pr(I)=120/150=4/5, Pr(E)=45/150=3/10 και Pr(IE)=30/150=1/5.

Για το πρώτο ερώτημα, από τον ορισμό της δεσμευμένης πιθανότητας έχουμε:


Pr(I|E)=Pr(IE)Pr(E)=1/53/10=23.

[Σε αυτό το απλό παράδειγμα, να ελέγξουμε την απάντηση και διαισθητικά: Εφόσον η επιλογή μας γίνεται «δεδομένου ότι το PC έχει εκτυπωτή», είναι σαν να ζητάμε την πιθανότητα να επιλέξουμε, από τα 45 PC που έχουν εκτυπωτή, ένα από εκείνα τα 30 που είναι και στο internet, συνεπώς η ζητούμενη πιθανότητα θα ισούται με 30/45=2/3.]

Για το ερώτημα (ii), έχουμε,


Pr(IE)=#(IE)#Ω.

Για να υπολογίσουμε το πλήθος των στοιχείων του συνόλου IE, παρατηρούμε πως ισχύει ότι,


#Ι+#Ε=#(ΙE)+#(IE),

δηλαδή προσθέτοντας τα στοιχεία του Ι και του Ε έχουμε τα στοιχεία της ένωσής τους, αλλά τα στοιχεία που ανήκουν και στα δύο σύνολα (δηλαδή στην τομή τους) συμπεριλαμβάνονται δύο φορές στο #Ι+#Ε, γι’ αυτόν το λόγο τα προσθέτουμε άλλη μία φορά στο δεξί μέρος της πιο πάνω σχέσης. Άρα έχουμε,


Pr(IE) = #(IE)#Ω


= #I+#E-#(IE)#Ω


= #I#Ω+#E#Ω-#(IE)#Ω


= Pr(I)+Pr(E)-Pr(IE)


= 120150+45150-30150=23.

Παρατηρούμε πως ο πιο πάνω υπολογισμός αποδεικνύει και τη σχέση,


Pr(IE)=Pr(I)+Pr(E)-Pr(IE),

η οποία ισχύει και γενικά:

Κανόνας Πιθανότητας #8. Για οποιαδήποτε ενδεχόμενα Α,Β:

Pr(AB)=Pr(A)+Pr(B)-Pr(AB).
(5.4)
Απόδειξη:

Αρκεί απλά να εφαρμόσουμε δύο φορές τον κανόνα πιθανότητας #3: Η ένωση ΑB μπορεί να εκφραστεί ως η ένωση των δύο ξένων ενδεχομένων A(AB), οπότε,


Pr(AB)+Pr(AB)=Pr(A(AB))+Pr(AB)=Pr(A)+Pr(AB)+Pr(AB),

και αφού εξ ορισμού τα (AB) και (AB) είναι ξένα,


Pr(AB)+Pr(AB)=Pr(A)+Pr((AB)(AB))=Pr(A)+Pr(B),

που μας δίνει την (5.4).


Παρατήρηση: Αν τα ενδεχόμενα Α,Β είναι ξένα, τότε ΑB=, και αφού εξ ορισμού Pr()=0, η σχέση (5.4) γίνεται, Pr(AB)=Pr(A)+Pr(B). Άρα μπορούμε να θεωρήσουμε τον κανόνα πιθανότητας #8 ως μια γενίκευση του κανόνα πιθανότητας #3, τον οποίο είδαμε στο Κεφάλαιο 3.


Παράδειγμα 5.8

Από ένα στοκ 200 routers, μεταξύ των οποίων 3 είναι ελαττωματικοί, επιλέγουμε τυχαία 20 για ένα δίκτυο. Ποια είναι η πιθανότητα να επιλέξαμε ακριβώς έναν ελαττωματικό;

Έστω Α το ενδεχόμενο που περιγράφει την πιο πάνω περίπτωση. Το Α είναι υποσύνολο του χώρου πιθανότητας Ω, ο οποίος αποτελείται από όλες τις (μη διατεταγμένες) εικοσάδες routers τις οποίες μπορούμε να διαλέξουμε από τους 200. Από τον κανόνα αρίθμησης #4 έχουμε #Ω=(20020), και συνδυάζοντας τους κανόνες αρίθμησης #1 και #4 βρίσκουμε #Α=(31)(19719). Όπως στο Κεφάλαιο 4, χρησιμοποιώντας τον κανόνα πιθανότητας #5 και αντικαθιστώντας τις πιο πάνω τιμές, έχουμε,


Pr(A)=#A#Ω=(31)(19719)(20020)=0.245.

Τώρα ας υποθέσουμε ότι παρατηρούμε το δίκτυο να λειτουργεί προβληματικά (άρα έχουμε επιλέξει τουλάχιστον έναν ελαττωματικό router). Ποια είναι η πιθανότητα να έχουμε επιλέξει ακριβώς έναν ελαττωματικό router; Αν ορίσουμε το ενδεχόμενο,


Β=«επιλέξαμε τουλάχιστον έναν ελαττωματικό router»,

τότε η ζητούμενη πιθανότητα είναι,


Pr(A|B)=Pr(AB)Pr(B)=Pr(A)Pr(B),

αφού το ΑB=A (γιατί;). Η Pr(A) υπολογίστηκε πιο πάνω, και παρομοίως έχουμε,


Pr(B) = 1-Pr(B)


= 1-Pr(«δεν επιλέξαμε κανέναν ελαττωματικό router»)


= 1-#B#Ω


= 1-(19720)(20020)


0.2722,

συνεπώς,


Pr(A|B)=Pr(A)Pr(B)0.2450.27220.9=  90%.

Σημείωση. Ο κανόνας πιθανότητας #3 του Κεφαλαίου 3 μάς επιτρέπει να υπολογίσουμε την πιθανότητα Pr(AB) για δύο ξένα ενδεχόμενα Α,Β, και ο κανόνας πιθανότητας #8, που είδαμε πιο πάνω, μάς δίνει ένα γενικότερο αποτέλεσμα που ισχύει και όταν τα Α,Β δεν είναι ξένα. Το επόμενό μας αποτέλεσμα είναι μια σχετική ανισότητα, η οποία είναι πολύ χρήσιμη και επίσης ισχύει γενικά. Για παραδείγματα εφαρμογών του δείτε την Ενότητα 8.3 του Κεφαλαίου 8 και τις αντίστοιχες εκεί ασκήσεις.

Λήμμα 5.2 (Φράγμα ένωσης)

Για οποιαδήποτε ενδεχόμενα Α1,Α2,,AN (είτε είναι ξένα, είτε όχι) ισχύει η ανισότητα:


Pr(A1A2AN) = Pr(i=1NAi)


i=1NPr(Ai)=Pr(A1)+Pr(A2)++Pr(An).
Απόδειξη:

Παρατηρούμε ότι η περίπτωση Ν=2 προκύπτει άμεσα από τον κανόνα πιθανότητας #8: Εφόσον όλες οι πιθανότητες είναι μεγαλύτερες ή ίσες του μηδενός,


Pr(A1A2)=Pr(Α1)+Pr(A2)-Pr(A1A2)Pr(Α1)+Pr(A2).

Για την περίπτωση Ν=3, χρησιμοποιούμε την περίπτωση Ν=2 δύο φορές:


Pr(A1A2A3) = Pr(A1(A2A3))


Pr(A1)+Pr(A2A3)


Pr(Α1)+Pr(A2)+Pr(A3).

Η γενική περίπτωση αποδεικνύεται με τον ίδιο τρόπο, επαγωγικά.


Παράδειγμα 5.9

Έστω ότι έχουμε δύο νομίσματα· ένα δίκαιο με Pr(K)=1/2, και ένα που έχει πιθανότητα 2/3 να έρθει Κορώνα. Επιλέγουμε ένα από τα δύο στην τύχη και το στρίβουμε δύο φορές:

  1. 1.

    Ποια η πιθανότητα να φέρουμε Γ την πρώτη φορά;

  2. 2.

    Ποια η πιθανότητα να φέρουμε ΓΓ;

  3. 3.

    Δεδομένου ότι φέραμε ΓΓ, ποια η πιθανότητα να έχουμε επιλέξει το δίκαιο νόμισμα;

Για το πρώτο ερώτημα, παρατηρούμε ότι δεν μπορεί να υπολογιστεί άμεσα η ζητούμενη πιθανότητα αν δεν γνωρίζουμε ποιο νόμισμα έχει επιλεγεί. Ορίζουμε λοιπόν τα ενδεχόμενα:


A1 = «φέραμε Γ την πρώτη φορά»,

A2 = «φέραμε Γ τη δεύτερη φορά»,

Β = «φέραμε 2 φορές Γ»=Α1A2,

Δ = «επιλέξαμε το δίκαιο νόμισμα».

Από το πρόβλημα μας δίνεται ότι Pr(A1|Δ)=Pr(A2|Δ)=12 και Pr(A1|Δ)=Pr(A2|Δ)=13. Για να υπολογίσουμε τη ζητούμενη πιθανότητα Pr(A1), εκφράζουμε το Α1 ως την ένωση δύο ξένων ενδεχομένων, Α1=(Α1Δ)(A1Δ), οπότε,


Pr(Α1) = Pr(Α1Δ)+Pr(A1Δ)          [καν. πιθ. #3]
(5.5)


= Pr(Α1|Δ)Pr(Δ)+Pr(A1|Δ)Pr(Δ)        [σχέση (5.1)]


= 1212+1312=512.

Με τον ίδιο ακριβώς τρόπο βρίσκουμε πως και Pr(A2)=5/12, και, για το δεύτερο ερώτημα, παρομοίως έχουμε,


Pr(Β) = Pr(ΒΔ)+Pr(ΒΔ)


= Pr(Β|Δ)Pr(Δ)+Pr(Β|Δ)Pr(Δ)


= 121212+131312


= 1372.

[Παρενθετικά αναφέρουμε την εξής ενδιαφέρουσα παρατήρηση: Αν γνωρίζουμε την πιθανότητα p=Pr(K) με την οποία ένα νόμισμα έρχεται Κορώνα, τότε τα αποτελέσματα διαδοχικών ρίψεων είναι ανεξάρτητα. Αλλά αν δεν γνωρίζουμε την p, η ανεξαρτησία δεν ισχύει! Π.χ., με το τυχαία επιλεγμένο νόμισμα αυτού του παραδείγματος, η πιθανότητα να φέρουμε Γράμματα είναι 5/12 αλλά η πιθανότ