A Βασικά μαθηματικά εργαλεία

A.3 Πιθανότητες

Παρουσιάζουμε εδώ βασικές έννοιες πιθανοτήτων, η γνώση των οποίων είναι απαραίτητη για στοχαστικά μοντέλα. Στόχος είναι η μοντελοποίηση μη-ντετερμινιστικών φαινομένων. Αρχικά θα δώσουμε κάποιους βασικούς ορισμούς [16].

A.3.1 Βασικοί Ορισμοί – Ιδιότητες

Ορισμός.

Χώρος Δείγματος (sample space), Ω: Το σύνολο όλων των πιθανών αποτελεσμάτων από ένα πείραμα.

Ορισμός.

Γεγονός (event), A με AΩ: ένα σύνολο αποτελεσμάτων, υποσύνολο του Ω.

Ορισμός.

P(ABΓ): η πιθανότητα ένα τουλάχιστον, εκ των Α,Β,Γ,, γεγονότων να συμβεί.

Ορισμός.

P(ABΓ): η πιθανότητα όλα τα γεγονότα Α,Β,Γ,, να συμβούν.

Επίσης δίνουμε τα παρακάτω αξιώματα:

  • P()=0, η πιθανότητα δηλαδή να συμβεί το κενό σύνολο είναι μηδέν.

  • P(Ω)=1, η πιθανότητα δηλαδή να συμβεί ένα από τα πιθανά αποτελέσματα είναι μονάδα.

  • Αν AΩ τότε P(A)0.

  • Για ασυσχέτιστα (uncorrelated) γεγονότα: P(AiAj)=0 για κάθε ij.

  • Για ανεξάρτητα (independent), A,B, γεγονότα: P(AB)=P(A)P(B)

Τέλος τονίζουμε και τις παρακάτω ιδιότητες:

  • P(AB)=P(A)+P(B)-P(AB)

  • P(AC)=1-P(A), όπου P(AC) είναι η συμπληρωματική πιθανότητα του γεγονότος Α.

Ορισμός.

Υπό συνθήκη πιθανότητα (conditional probability) ορίζεται ως η πιθανότητα να συμβεί ένα γεγονός Α δεδομένου ενός άλλου Β και δίνεται από την

P(A|B)=P(AB)P(B)

A.3.2 Τυχαίες Μεταβλητές

Εδώ παρουσιάζουμε βασικές έννοιες που αφορούν τυχαίες μεταβλητές.

Ορισμός.

Τυχαία Μεταβλητή (random variable): Ως τυχαία μεταβλητή (τ.μ.) ορίζουμε μια αντιστοίχιση (mapping) από το χώρο όλων των πιθανών γεγονότων Ω, στο πραγματικό χώρο .

Παράδειγμα A.10.

Έστω ότι ρίχνουμε ένα κέρμα 10 φορές. Ο αριθμός των φορών που ήρθε γράμματα (ή κορόνα) είναι μια τυχαία μεταβλητή.

Έστω μια τ.μ. X, οι τιμές της οποίας δίνονται ως x.

Ορισμός.

Προσθετική συνάρτηση κατανομής (cumulative distribution function, cdf) είναι η συνάρτηση F(x):

F(x)=P(Xx)

Προσέξτε ότι: F(-)=0, και F()=1.

Ορισμός.

Αναμενόμενη Τιμή (expectation value), E[h(x)], μιας συνάρτησης της τ.μ. x, έστω h(x), ορίζεται ως:

(Α) Αν η X είναι συνεχής τ.μ. και η F(x) παραγωγίσημη μπορεί να οριστεί η συνάρτηση πυκνότητας, f(x), ως: f(x)=dF(x)/dx. Σε αυτή την περίπτωση έχουμε:

E[h(x)]=h(x)dF(x).

(Β) Αν η X είναι διακριτή τ.μ., η οποία μπορεί να πάρει γενικά τιμές xi,i=1,2,, η F(x) είναι μια συνάρτηση βήματος (step function) και:

E[h(x)]=iPih(xi).

Η αναμενόμενη τιμή, περιγράφεται και ως μέση τιμή της τ.μ. E(X).

Θυμηθείτε ότι η διασπορά ορίζεται ως:

Var(X)=E(X2)-E(X)2

Με βάση τη συνάρτηση κατανομής, ή την αντίστοιχη συνάρτηση πυκνότητας για συνεχείς τ.μ., μπορούμε να περιγράψουμε μια κατανομή.

Παράδειγμα A.11.

Η κανονική κατανομή, N(μ,σ2), μιας συνεχούς τ.μ., περιγράφεται από την παρακάτω συνάρτηση πυκνότητας.

f(x)=12πσexp{-(x-μ)22σ2}

όπου μ είναι η μέση τιμή και σ η διασπορά της κατανομής. Για μ=0,σ=1, έχουμε την τυπική κανονική κατανομή.

Παράδειγμα A.12.

Η εκθετική κατανομή, Exp(λ), μιας συνεχούς τ.μ., περιγράφεται από την παρακάτω συνάρτηση πυκνότητας.

f(x)={λexp(-λx),x00,x<0.

Για την εκθετική κατανομή E(X)=λ-1, και Var(X)=λ-2.

Παράδειγμα A.13.

Έστω μια διακριτή τ.μ. η οποία ακολουθεί τη διωνυμική κατανομή (binomial distribution). Παράδειγμα τέτοιας τ.μ. μπορεί να είναι η πιθανότητα να φέρουμε x φορές «γράμματα» σε n ρίψεις μη-αμερόληπτου νομίσματος, το οποίο έχει πιθανότητα θ να τύχουν «γράμματα». Η διωνυμική κατανομή περιγράφεται μέσω της:

P(X=x)=(nx)θx(1-θ)n-x=n!(n-x)!x!

Όπου x=0,1,,n. Για τη διωνυμική κατανομή E(X)=nθ, και Var(X)=nθ(1-θ).

Τα παραπάνω παραδείγματα αφορούν μια τ.μ. Πολύ συχνά όμως το υπό μελέτη σύστημα περιγράφεται με περισσότερες από μία τ.μ.

Ορισμός.

Τυχαίο διάνυσμα (random vector) n τυχαίων μεταβλητών ορίζεται ως ένα διάνυσμα τ.μ. της μορφής 𝑿=(X1,X2,,Xn).

Όπως παραπάνω μπορούμε να ορίσουμε όλες τις ιδιότητες και για το διάνυσμα τ.μ. 𝑿. Παράδειγμα η προσθετική συνάρτηση κατανομής σε n διαστάσεις είναι:

F(𝒙)=P(i=1n{Xixi})

Αν το X είναι συνεχές τυχαίο διάνυσμα (ή διάνυσμα τ.μ.) τότε:

f(x1,x2,,xn)=F(x1,x2,,xn)x1,x2xn

και η αναμενόμενη τιμή

E[h(x)]=h(𝒙)dF(𝒙)=h(𝒙)f(𝒙)dx1dx2dxn

A.3.3 Σύγκλιση Τυχαίων Μεταβλητών

Έστω σειρά τ.μ. X1,X2,,Xn και F(X1),F(X2),,F(Xn). Όσο αφορά τη σύγκληση των τ.μ. είναι πολύ σημαντικά τα παρακάτω δύο θεωρήματα – νόμοι.

Νόμος των μεγάλων αριθμών (law of large numbers): Αν x1,x2,,xn, είναι μια σειρά n ανεξάρτητων τιμών μιας τυχαίας μεταβλητής X, με μέση τιμή μ και διασπορά σ2, τότε η μέση τιμή του δείγματος x¯ συγκλίνει στη μέση τιμή μ:

x¯=x1+x2++xnnμ

σχεδόν σίγουρα (ισχυρός νόμος των μεγάλων αριθμών) ή με πιθανότητα (ασθενής νόμος των μεγάλων αριθμών).

Κεντρικό οριακό θεώρημα (central limit theorem): Αν x1,x2,,xn, είναι μια σειρά n ανεξάρτητων τιμών μιας τυχαίας μεταβλητής X, με μέση τιμή μ και διασπορά σ2 και αν ορίσουμε τη μέση τιμή του δείγματος

x¯=x1+x2++xnn

τότε:

n(x¯-μ)σΝ(0,1).

Δηλαδή πρακτικά η κατανομή των n τιμών της X, όσο το n αυξάνει «πλησιάζει» όλο και περισσότερο την κανονική κατανομή.

Τα παραπάνω δύο θεωρήματα είναι ιδιαίτερα σημαντικά καθώς μας διασφαλίζουν ότι όσο μεγαλώνει η σειρά ανεξάρτητων τιμών μιας τ.μ. η μέση τιμή του δείγματος πλησιάζει την πραγματική μέση τιμή της τ.μ.