Subsections

4.11 Το Θεώρημα του Weierstrass

4.11.1 Γενικά

Το πολύ σημαντικό θεώρημα του Weierstrass στο οποίο αναφερθήκαμε όταν αποδείξαμε το αντίστοιχο για τριγωνομετρικά πολυώνυμα είναι το παρακάτω.

Θεώρημα 4.12 (Weierstrass)   Αν $ a<b$ είναι πραγματικοί αριθμοί και η $ f:[a,b]\to{\mathbb{C}}$ είναι συνεχής τότε υπάρχει ακολουθία πολυωνύμων που συγκλίνει ομοιόμορφα στην $ f$ στο διάστημα $ [a,b]$.

Παρατήρηση 4.2   Ένας διαφορετικός τρόπος να πουμε το ίδιο πράγμα είναι να πούμε ότι υπάρχει ακολουθία πολυωνύμων $ p_n$ τ.ώ. $ {\left\Vert{p_n-f}\right\Vert _\infty}\to 0$, όπου η $ {\left\Vert{\cdot}\right\Vert _\infty}$ είναι αναφορικά με το διάστημα $ [a,b]$, ισχύει δηλαδή

$\displaystyle {\left\Vert{g}\right\Vert _\infty} = \sup_{x\in[a,b]} {\left\vert{g(x)}\right\vert}.
$

Τη δεύτερη αυτή διατύπωση μπορούμε και να την πάρουμε ως τον ορισμό της ομοιόμορφης σύγκλισης.

Ορισμός 4.4   Αν $ f, f_n:K \to {\mathbb{C}}$ είναι συναρτήσεις ορισμένες πάνω σε ένα σύνολο $ K$ λέμε ότι η ακολουθία $ f_n$ συγκλίνει στην $ f$ ομοιόμορφα στο $ K$ αν

$\displaystyle {\left\Vert{f-f_n}\right\Vert _\infty} = \sup_{x\in K}{\left\vert{f(x)-f_n(x)}\right\vert} \to 0,   (n\to\infty).
$

Παρατήρηση 4.3   Υπάρχει λόγος που στο Θεώρημα του Weierstrass περιοριζόμαστε σε συνεχείς συναρτήσεις, δηλ. το ότι η ομοιόμορφη σύγκλιση μιας ακολουθίας συναρτήσεων διατηρεί τη συνέχεια των συγκλινουσών συναρτήσεων στο όριο.

Παρατήρηση 4.4   Έχει σημασία ότι το πεδίο ορισμού της $ f$ είναι ένα κλειστό και φραγμένο διάστημα. Εύκολα μπορούμε να βρούμε συνεχείς συναρτήσεις πάνω σε φραγμένα ανοιχτά διαστήματα ή άφρακτα διαστήματα που δε μπορούν να προσεγγισθούν ομοιόμορφα στο πεδίο ορισμού τους από πολυώνυμα. Για παράδειγμα η συνάρτηση $ f_1(x)=e^x$, με πεδίο ορισμού το $ {\mathbb{R}}$, είναι συνεχής παντού αλλά για κάθε πολυώνυμο $ p(x)$ ισχύει φυσικά

$\displaystyle {\left\vert{f_1(x)-p(x)}\right\vert} \to +\infty,   (x\to+\infty),
$

αφού η εκθετική συνάρτηση αυξάνει πιο γρήγορα από οποιαδήποτε πολυωνυμική συνάρτηση. Ένα άλλο παράδειγμα είναι η συνάρτηση $ f_2(x)=1/x$, με πεδίο ορισμού το $ (0,1)$. Η συνάρτηση αυτή είναι συνεχής στο πεδίο ορισμού της αλλά δεν μπορεί να προσεγγισθεί ομοιόμορφα από πολυώνυμο, μια και οποιοδήποτε πολυώνυμο $ q(x)$ έχει

$\displaystyle \lim_{x\to 0+} q(x) = q(0),
$

ενώ για την $ f_2(x)$ το από δεξιά όριο στο 0 είναι $ +\infty$.

4.11.2 Η απόδειξη του Landau

Η πρώτη απόδειξη του θεωρήματος του Weierstrass που θα δούμε οφείλεται στον Landau.

Έστω $ f:[a,b]\to{\mathbb{C}}$ συνεχής.

4.11.2.1 Περιορισμός στο διάστημα $ [0,1]$.

Κάνουμε κατ' αρχήν την παρατήρηση ότι μπορούμε να υποθέσουμε ότι το $ [a,b]$ είναι όποιο συγκεκριμένο διάστημα μας βολεύει, για παράδειγμα το $ [0,1]$. Ο λόγος γι' αυτό είναι ότι μπορούμε να αντιστοιχίσουμε τα σημεία $ t \in [0,1]$ με τα στοιχεία $ x \in [a,b]$ με μια αφφινική απεικόνιση (μια απεικόνιση δηλ. που είναι της μορφής $ x \to Ax+B$), την

$\displaystyle x=a+t(b-a)
$

της οποίας η αντίστροφη είναι η $ t=\frac{x-a}{b-a}$.

Αν τώρα $ f:[a,b]\to{\mathbb{C}}$ είναι συνεχής τότε και η συνάρτηση

$\displaystyle g(t) = f(a+t(b-a))
$

είναι μια συνεχής συνάρτηση στο $ [0,1]$. Αν υπάρχει πολυώνυμο $ p(t)$ τ.ώ. $ {\left\vert{p(t)-g(t)}\right\vert}\le\epsilon$ για $ t \in [0,1]$ τότε η συνάρτηση

$\displaystyle q(x) = p((x-a)/(b-a))
$

είναι κι αυτή πολυώνυμο και ισχύει φυσικά

$\displaystyle {\left\vert{q(x)-f(x)}\right\vert} = {\left\vert{p(t)-g(t)}\right\vert} \le \epsilon.
$

Από δω και πέρα λοιπόν υποθέτουμε ότι $ f:[0,1]\to{\mathbb{C}}$ είναι συνεχής.

4.11.2.2 Η $ f$ μηδενίζεται στα άκρα του διαστήματος.

Μπορούμε επίσης χωρίς βλάβη της γενικότητας να υποθέσουμε ότι $ f(0)=f(1)=0$. Αυτό συμβαίνει γιατί μπορούμε να αφαιρέσουμε από την $ f$ ένα κατάλληλο πρωτοβάθμιο πολυώνυμο ώστε να πετύχουμε αυτή τη συνθήκη. Ακριβέστερα, αν η $ f:[0,1]\to{\mathbb{C}}$ είναι οποιαδήποτε συνεχής συνάρτηση τότε θέτουμε

$\displaystyle g(x) = f(x) - \ell(x),
$

όπου $ \ell(x) = f(0)+x(f(1)-f(0))$, και παρατηρούμε ότι (α) η $ g$ είναι συνεχής συνάρτηση που μηδενίζεται στα άκρα του διαστήματος και (β) αν μπορούμε να προσεγγίσουμε την $ g$ με ένα πολυώνυμο $ p$

$\displaystyle {\left\Vert{g(x)-p(x)}\right\Vert _\infty} \le \epsilon
$

τότε το πολυώνυμο $ q(x)=p(x)+\ell(x)$ επίσης προσεγγίζει την $ f(x)$

$\displaystyle {\left\Vert{f(x)-q(x)}\right\Vert _\infty} = {\left\Vert{g(x)+\ell(x)-(p(x)+\ell(x))}\right\Vert _\infty} \le \epsilon.
$

Από δω και πέρα λοιπόν υποθέτουμε ότι η συνάρτησή μας, $ f(x)$, μηδενίζεται στα άκρα του διαστήματος. Για ευκολία μας την επεκτείνουμε (με μηδενικές τιμές) στο υπόλοιπο της πραγματικής ευθείας, και η νέα μας συνάρτηση είναι συνεχής σε όλο το $ {\mathbb{R}}$ μια και τα μόνα σημεία στα οποία γεννάται αμφιβολία γι' αυτό είναι τα άκρα του $ [0,1]$, όμως εκεί τα πλευρικά όρια της $ f$ είναι και τα δύο 0.

4.11.2.3 Τα πολυώνυμα προσέγγισης

Ορίζουμε τώρα (θυμόμαστε ότι η $ f$ μηδενίζεται έξω από το διάστημα $ [0,1]$)

$\displaystyle L_n(x) = \int_{-\infty}^{\infty} f(x+t) K_n(t) dt = \int_{-x}^{1-x} f(x+t) K_n(t) dt,
$

όπου

$\displaystyle K_n(t) = \begin{cases}c_n (1-t^2)^n, & {\left\vert{t}\right\vert} \le 1  0, & {\left\vert{t}\right\vert}>1,\end{cases}$

και η σταθερά $ c_n$ επιλέγεται με τρόπο τέτοιο ώστε να ισχύει

$\displaystyle \int_{-\infty}^\infty K_n(t)  dt = 1.
$

Για να δούμε ότι οι συναρτήσεις $ L_n(x)$ είναι όντως πολυώνυμα του $ x$ αν $ x \in [0,1]$ (εύκολα βλέπει κανείς ότι οι συναρτήσεις $ L_n(x)$ έχουν φραγμένο φορέα άρα δεν μπορούν να είναι πολυώνυμα σε ολόκληρο το $ {\mathbb{R}}$, ταυτίζονται όμως με κάποιο πολυώνυμο στο διάστημα $ [0,1]$ που μας ενδιαφέρει) κάνουμε την αλλαγή μεταβλητής $ u=x+t$ και παίρνουμε έτσι την έκφραση

$\displaystyle L_n(x) = \int_0^1 f(u) (1-(u-x)^2)^n du,
$

η οποία εύκολα φαίνεται ότι είναι πολυώνυμο του $ x$, μια και η συνάρτηση $ (1-(u-x)^2)^n$ είναι πολυώνυμο του $ x$ με συντελεστές που εξαρτώνται από το $ u$

$\displaystyle (1-(u-x)^2)^n = \sum_{j=0}^{2n} q_j(u) x^j
$

και άρα

$\displaystyle L_n(x) = \sum_{j=0}^{2n} \left( \int_0^1 f(u) q_j(u) du \right) x^j.
$

4.11.2.4 Προσέγγιση της μονάδας

Η συνάρτηση $ K_n$ (για την ακρίβεια, η ακολουθία συναρτήσεων $ K_n$) είναι αυτό που ονομάζεται προσέγγιση της μονάδας, έχει δηλ. τις παρακάτω ιδιότητες:

  1. Η $ K_n(x)$ είναι κατά τμήματα συνεχής (αρκεί να υποθέσουμε ότι είναι Riemann ολοκληρώσιμη σε κάθε διάστημα),
  2. $ K_n(x)\ge 0$ για κάθε $ x \in {\mathbb{R}}$,
  3. $ \int_{-\infty}^{\infty} K_n(x)  dx = 1$,
  4. Για κάθε $ \delta>0$ ισχύει $ \lim_{n\to\infty} \int_{{\left\vert{t}\right\vert}>\delta} K_n(t) dt = 0$.
(Το ολοκλήρωμα $ \int_{{\left\vert{t}\right\vert}>\delta}$ είναι συντομογραφία του αθροίσματος $ \int_{-\infty}^{-\delta}+\int_{\delta}^{\infty}$.) Η πιο καίρια ιδιότητα μιας προσέγγισης της μονάδας είναι η ιδιότητα 4 παραπάνω. Το νόημα αυτής της ιδιότητας είναι ότι, αφού τα ολοκληρώματα των $ K_n$ δεν αλλάζουν με το $ n$ και αφού το ολοκλήρωμα της $ K_n$ εκτός του διαστήματος $ (-\delta, \delta)$ τείνει στο 0, τότε όλη η «μάζα» κάτω από το γράφημα του $ K_n$ μαζεύεται όλα και κοντύτερα στο 0 όσο το $ n$ μεγαλώνει. Αυτό έχει ως συνέπεια το ακόλουθο.

Θεώρημα 4.13   Έστω $ f:{\mathbb{R}}\to{\mathbb{C}}$ συνεχής και φραγμένη. Τότε για κάθε $ x \in {\mathbb{R}}$ έχουμε

$\displaystyle \int_{-\infty}^{\infty}f(x+t) K_n(t) dt \to f(x).$ (4.36)

Εάν η $ f$ είναι ομοιόμορφα συνεχής στο $ {\mathbb{R}}$ τότε η σύγκλιση στην (4.36) δεν είναι απλά σύγκλιση κατά σημείο αλλά είναι και ομοιόμορφη σύγκλιση σε όλο το $ {\mathbb{R}}$.

Απόδειξη. Γράφουμε $ f(x) = \int_{-\infty}^{\infty}f(x)K_n(t) dt$ (αφού $ \int_{-\infty}^{\infty}K_n(t) dt=1$) και έτσι, αν $ \delta>0$ είναι οποιοδήποτε,

$\displaystyle {\left\vert{f(x)-\int_{-\infty}^{\infty}f(x+t) K_n(t) dt}\right\vert}$ $\displaystyle = {\left\vert{\int_{-\infty}^{\infty}(f(x+t)-f(x))K_n(t) dt}\right\vert}$    
  $\displaystyle \le \int_{-\infty}^{\infty}{\left\vert{f(x+t)-f(x)}\right\vert} K_n(t) dt$    
  $\displaystyle = \int_{-\delta}^{\delta} {\left\vert{f(x+t)-f(x)}\right\vert} K_n(t) dt +$    
  $\displaystyle       \int_{{\left\vert{t}\right\vert}>\delta} {\left\vert{f(x+t)-f(x)}\right\vert} K_n(t) dt$    
  $\displaystyle =I+II.$    

Έστω $ \epsilon>0$. Αρκεί να δείξουμε ότι, για αρκετά μεγάλο $ n$, έχουμε $ I<\epsilon$ και $ II<\epsilon$.

Για τον πρώτο όρο έχουμε λόγω της συνέχειας της $ f$ στο $ x$ ότι υπάρχει $ \delta>0$ ώστε

$\displaystyle {\left\vert{f(x+t)-f(x)}\right\vert} < \epsilon,
$

για $ {\left\vert{t}\right\vert}\le\delta$. Αν η συνάρτηση είναι απλά συνεχής στο $ {\mathbb{R}}$ τότε το $ \delta$ αυτό εξαρτάται από το $ \epsilon$ και το $ x$ ενώ αν η συνάρτηση είναι ομοιόμορφα συνεχής στο $ {\mathbb{R}}$ τότε εξαρτάται μόνο από το $ \epsilon$. Έχουμε λοιπόν

$\displaystyle I \le \int_{-\delta}^{\delta} \epsilon K_n(t) dt \le \epsilon \int_{-\infty}^{\infty}K_n(t) dt = \epsilon.
$

Για το δεύτερο όρο θα χρησιμοποιήσουμε την ιδιότητα 4 της προσέγγισης της μονάδας. Έχουμε

$\displaystyle II \le \int_{{\left\vert{t}\right\vert}>\delta} 2{\left\Vert{f}\r...
...right\Vert _\infty} \int_{{\left\vert{t}\right\vert}>\delta} K_n(t) dt \to 0,
$

και άρα, για αρκετά μεγάλο $ n$, έχουμε επίσης $ II<\epsilon$. Στην παραπάνω ανισότητα χρησιμοποιήσαμε την τριγωνική ανισότητα για να φράξουμε την ποσότητα $ {\left\vert{f(x+t)-f(x)}\right\vert} \le {\left\vert{f(x+t)}\right\vert}+{\left\vert{f(t)}\right\vert} \le 2 {\left\Vert{f}\right\Vert _\infty}$, και η ποσότητα

$\displaystyle {\left\Vert{f}\right\Vert _\infty} = \sup_{x\in{\mathbb{R}}}{\left\vert{f(x)}\right\vert} < +\infty
$

από την υπόθεσή μας ότι η $ f$ είναι φραγμένη.

Στην εκτίμηση του $ II$ ο δείκτης $ n_0$ πέρα από τον οποίο ισχύει $ II<\epsilon$ δεν εξαρτάται από το $ x$ αλλά μόνο από το $ \epsilon$ και το $ \delta$ είτε η $ f$ είναι ομοιόμορφα συνεχής είτε όχι (αφού το μόνο που χρησιμοποιούμε από την $ f$ είναι ότι είναι φραγμένη).

Όμως η επιλογή του $ \delta$ έγινε όταν φράξαμε το $ I$ και εκεί το $ \delta$ εξαρτάται από το $ x$, εκτός αν η συνάρτηση $ f$ υποτεθεί ομοιόμορφα συνεχής οπότε το $ \delta$ εξαρτάται μόνο από το $ \epsilon$. Σε αυτή την περίπτωση έχουμε ταυτόχρονα $ I+II<\epsilon$ για κάθε $ x \in {\mathbb{R}}$ και άρα η σύγκλιση

$\displaystyle \int_{-\infty}^{\infty}f(x+t) K_n(t) dt \to f(x)
$

είναι ομοιόμορφη στο $ {\mathbb{R}}$.

Η απόδειξη του Θεωρήματος του Weierstrass (Θεώρημα 4.12) είναι πλήρης.

Εφαρμόζοντας το Θεώρημα 4.13 παίρνουμε την ομοιόμορφη σύγκλιση των πολυωνύμων $ L_n$ στην $ f$ στο διάστημα $ [0,1]$.

Άσκηση 4.24   Βρείτε όλες τις συναρτήσεις $ f:{\mathbb{R}}\to{\mathbb{R}}$ που είναι ομοιόμορφα (στο $ {\mathbb{R}}$) όρια πολυωνύμων.

Υπόδειξη: Ένα πολυώνυομο $ p(x)$ που είαι φραγμένο στο $ {\mathbb{R}}$ είναι αναγκαστικά σταθερά.

4.11.3 Η απόδειξη του Bernstein

Η δεύτερη απόδειξη του θεωρήματος του Weierstrass (Θεώρημα 4.12) που θα δούμε οφείλεται στον Bernstein και είναι πολύ ενδιαφέρουσα γιατί συνδέει τη θεωρία Πιθανοτήτων με την πολυωνυμική προσέγγιση που θέλουμε να πετύχουμε. Επίσης τα πολυώνυμα που δίνει ως προσέγγιση της $ f$ είναι πολύ απλό να περιγραφούν.

4.11.3.1 Τα πολυώνυμα του Bernstein και η πιθανοθεωρητική τους ερμηνεία

Υποθέτουμε και πάλι ότι η $ f:[0,1]\to{\mathbb{C}}$ είναι συνεχής (δε χρειάζεται αυτή τη φορά να κανονικοποιήσουμε την $ f$ ώστε να μηδενίζεται στα άκρα του διαστήματος). Ορίζουμε τα πολυώνυμα Bernstein της $ f$ να είναι η ακολουθία πολυωνύμων $ B_n(f)$ που δίδεται από

$\displaystyle B_n(f)(x) = \sum_{k=0}^n f(k/n) {n \choose k} x^k (1-x)^{n-k}.$ (4.37)

Θα δείξουμε ότι τα $ B_n(f)(x) \to f(x)$ ομοιόμορφα στο διάστημα $ [0,1]$.

Για την απόδειξη θα χρειαστεί να ερμηνεύσουμε τα πολυώνυμα του Bernstein σε πιθανοθεωρητική γλώσσα.

Ας υποθέσουμε ότι έχουμε ένα νόμισμα το οποίο φέρνει κορώνα με πιθανότητα $ x \in [0,1]$ και το ρίχνουμε $ n$ φορές. Η τυχαία μεταβλητή $ B_{x,n}$ μετράει το πόσες κορώνες φέραμε σε αυτό το πείραμα. Προφανώς ισχύει πάντα $ 0 \le B_{x,n} \le n$ και εύκολα βλέπει κανείς ότι η $ B_{x,n}$ ακολουθεί τη λεγόμενη διωνυμική κατανομή, έχουμε δηλαδή για $ k\in{\mathbb{Z}}$

$\displaystyle {{\bf {Pr}}\left[{B_{x,n} = k}\right]} = \begin{cases}{n \choose ...
...u  0 \le k \le n  0 & \alpha\lambda\lambda\iota\omega\varsigma \end{cases}.
$

Ο λόγος για τον παραπάνω τύπο είναι ότι το να φέρουμε ακριβώς $ k$ κορώνες στο πείραμα μπορεί να συμβεί με ακριβώς $ {n \choose k}$ τρόπους (επιλέγουμε από τις $ n$ ρίψεις σε ποιες $ k$ θα έρθουν οι κορώνες) και κάθε ένας από αυτούς τους τρόπους έχει πιθανότητα $ x^k(1-x)^{n-k}$ να συμβεί.

Κάνουμε επίσης την παρατήρηση ότι, αν γράψουμε $ I_j$ για την δείκτρια τυχαία μεταβλητή που είναι 1 αν φέρουμε κορώνα στην $ j$ ρίψη και 0 αν φέρουμε γράμματα στην $ j$ ρίψη, ισχύει

$\displaystyle B_{x,n} = I_1 + I_2 + \cdots + I_n.
$

Έχουμε $ {{\bf E}\left[{I_j}\right]} = x$ και $ {{\bf Var}\left[{I_j}\right]} = x(1-x)$ με ένα απλό υπολογισμό οπότε συμπεραίνουμε ότι

$\displaystyle {{\bf E}\left[{B_{x,n}}\right]} = {{\bf E}\left[{I_1}\right]}+\cdots+{{\bf E}\left[{I_n}\right]} = nx
$

και από το γεγονός ότι οι $ I_j$ είναι ανεξάρτητες προκύπτει επίσης ότι

$\displaystyle \sigma^2(B_{x,n}) = {{\bf Var}\left[{B_{x,n}}\right]} = {{\bf Var}\left[{I_1}\right]} + \cdots + {{\bf Var}\left[{I_n}\right]} = nx(1-x) \le n.$ (4.38)

Τέλος, θα χρειαστούμε και την ανισότητα του Chebyshev που δίνει ένα άνω φράγμα για την πιθανότητα να αποκλίνει μια τυχαία μεταβλητή από τη μέση τιμή της.

Θεώρημα 4.14 (Chebyshev)   Αν $ X \in {\mathbb{Z}}$ είναι μια τυχαία μεταβλητή με

$\displaystyle {{\bf E}\left[{{\left\vert{X}\right\vert}^2}\right]} < +\infty,
$

και αν $ \mu = {{\bf E}\left[{X}\right]}$ και $ \sigma=\sqrt{{{\bf Var}\left[{X}\right]}}$ τότε

$\displaystyle {{\bf {Pr}}\left[{{\left\vert{X-\mu}\right\vert} \ge \lambda\sigma}\right]} \le \frac{1}{\lambda^2},$ (4.39)

για κάθε $ \lambda>0$.

Άσκηση 4.25   Θα χρειαστούμε επίσης αργότερα και την ανισότητα $ {{\bf E}\left[{{\left\vert{X}\right\vert}}\right]} \le {{\bf E}\left[{{\left\vert{X}\right\vert}^2}\right]}^{1/2}$ για μια διακριτή τυχαία μεταβλητή $ X \in {\mathbb{Z}}$. Αποδείξτε αυτή την ανισότητα.

Υπόδειξη: Οι δύο ποσότητες που μας ενδιαφέρουν είναι οι

$\displaystyle {{\bf E}\left[{{\left\vert{X}\right\vert}}\right]} = \sum_{k\in{\mathbb{Z}}} {\left\vert{k}\right\vert} {{\bf {Pr}}\left[{X=k}\right]}
$

και

$\displaystyle {{\bf E}\left[{{\left\vert{X}\right\vert}^2}\right]} = \sum_{k\in{\mathbb{Z}}} {\left\vert{k}\right\vert}^2 {{\bf {Pr}}\left[{X=k}\right]}.
$

Χρησιμοποιήστε την ανισότητα Cauchy-Schwarz (5.2) για να δείξετε το ζητούμενο. Στην (5.2) η ανισότητα είναι διατυπωμένη για πεπερασμένες ακολουθίες αλλά ισχύει και για ακολουθίες όπου ο δείκτης παίρνει όλες τις ακέραιες τιμές και τα αθροίσματα γίνονται άπειρες σειρές.

Παρατηρούμε τώρα ότι υπάρχει η εξής σχέση ανάμεσα στα πολυώνυμα Bernstein, την τυχαία μεταβλητή $ B_{x,n}$ και τη συνάρτηση $ f$:

$\displaystyle B_n(f)(x) = {{\bf E}\left[{f(B_{x,n}/n)}\right]}.$ (4.40)

Άσκηση 4.26   Βεβαιωθείτε ότι καταλαβαίνετε γιατί ισχύει αυτό. Θυμίζουμε ότι αν $ X \in {\mathbb{Z}}$ είναι μια διακριτή τυχαία μεταβλητή και $ \phi:{\mathbb{Z}}\to{\mathbb{C}}$ μια συνάρτηση τότε έχουμε

$\displaystyle {{\bf E}\left[{\phi(X)}\right]} = \sum_{k \in {\mathbb{Z}}} \phi(k) {{\bf {Pr}}\left[{X=k}\right]},
$

με την προϋπόθεση φυσικά ότι η σειρά συγκλίνει απόλυτα. Στη δικιά μας περίπτωση, όπου $ X=B_{x,n}$ δεν τίθεται θέμα σύγκλισης μια και όλα τα αθροίσματα έχουν πεπερασμένο πλήθος μη μηδενικών όρων αφού $ 0 \le B_{x,n} \le n$.

Από την (4.40) γίνεται τώρα φανερό το γιατί πρέπει να περιμένουμε τη σύγκλιση

$\displaystyle B_n(f)(x) \to f(x)   \gamma\iota\alpha  n\to\infty.
$

Ο λόγος είναι ότι η τυχαία μεταβλητή $ B_{x,n}/n$, η οποία έχει μέση τιμή $ x$ τείνει να συγκεντρώνεται γύρω από τη μέση της τιμή (νόμος των μεγάλων αριθμών). Έτσι λοιπόν, με πολύ μεγάλη πιθανότητα, οι τιμές $ f(B_{x,n}/n)$ είναι πολύ κοντά στην $ f(x)$ λόγω της συνέχειας της $ f$ και άρα είναι αναμενόμενο και η μέση τιμή της μεταβλητής αυτής να είναι κοντά στο $ f(x)$. Αυτό το συλλογισμό ποσοτικοποιούμε παρακάτω στην απόδειξη.

Γράφουμε $ E$ για το ενδεχόμενο

$\displaystyle E = {\left\{{{\left\vert{\frac{B_{x,n}}{n}-x}\right\vert} \ge n^{-1/3}}\right\}},
$

και κάνουμε την παρατήρηση ότι η ανισότητα του Chebyshev μας δίνει το παρακάτω άνω φράγμα για την πιθανότητα του $ E$:

$\displaystyle {{\bf {Pr}}\left[{E}\right]} \le n^{-1/3}.$ (4.41)

Άσκηση 4.27   Αποδείξτε ότι η ανισότητα (4.41) προκύπτει από την ανισότητα Chebyshev (4.39).

Υπόδειξη: Χρησιμοποιήστε το φράγμα $ {{\bf Var}\left[{B_{x,n}}\right]}\le n$ και την τιμή $ \lambda=n^{1/6}$ και εφαρμόστε την ανισότητα (4.39) για το ενδεχόμενο $ E$ γραμμένο στη μορφή

$\displaystyle {\left\vert{B_{x,n}-nx}\right\vert} \le \lambda n^{1/2}.
$

Φράσσουμε τώρα τη διαφορά της συνάρτησής μας και της προσέγγισής της από ένα πολυώνυμο Bernstein:

$\displaystyle {\left\vert{f(x) - {\mathbb{E}}{f(\frac{B_{x,n}}{n})}}\right\vert}$ $\displaystyle = {\left\vert{f(x) - \sum_{k=0}^n f(k/n){{\bf {Pr}}\left[{B_{x,n}=k}\right]}}\right\vert}$    
  $\displaystyle = {\left\vert{\sum_{k=0}^n f(x){{\bf {Pr}}\left[{B_{x,n}=k}\right...
...t}  (\alpha\varphi o \upsilon  \sum_k {{\bf {Pr}}\left[{B_{x,n}=k}\right]}=1)$    
  $\displaystyle = {\left\vert{\sum_{k=0}^n (f(x)-f(k/n)) {{\bf {Pr}}\left[{B_{x,n}=k}\right]}}\right\vert}$    
  $\displaystyle \le \sum_{k=0}^n {\left\vert{f(x)-f(k/n)}\right\vert} \cdot {{\bf {Pr}}\left[{B_{x,n}=k}\right]}  \dagger$    
  $\displaystyle = \sum_{k=0 \atop {\left\vert{x-k/n}\right\vert}\ge n^{-1/3}}^n + \sum_{k=0 \atop {\left\vert{x-k/n}\right\vert} < n^{-1/3}}^n  \ddagger$    
  $\displaystyle = I + II$    

($ \dagger$: τριγωνική ανισότητα, $ \ddagger$: διαχωρίζουμε τα $ k$ σε δύο είδη).

Έστω $ \epsilon>0$. Θα δείξουμε ότι αν το $ n$ είναι αρκετά μεγάλο τότε τα αθροίσματα $ I$ και $ II$ φράσσονται από $ \epsilon$.

Για να φράξουμε το $ I$ χρησιμοποιούμε την ομοιόμορφη συνέχεια της $ f$ (η οποία είναι συνέπεια της συνέχειας της $ f$ σε κλειστό διάστημα, δείτε το Πρόβλημα 4.28): για κάθε $ \epsilon>0$ υπάρχει $ \delta>0$ τ.ώ. αν $ {\left\vert{x-y}\right\vert}<\delta$ να έπεται ότι $ {\left\vert{f(x)-f(y)}\right\vert}<\epsilon$. Αν λοιπόν το $ n$ είναι αρκετά μεγάλο ώστε να ισχύει $ n^{-1/3}<\delta$ τότε στο άθροισμα $ I$ η ποσότητα $ {\left\vert{f(x)-f(k/n)}\right\vert}$ φράσσεται από $ \epsilon$ οπότε ισχύει

$\displaystyle I \le \epsilon \sum_{k=0 \atop {\left\vert{x-k/n}\right\vert}\ge ...
...]} \le \epsilon \sum_{k=0}^n {{\bf {Pr}}\left[{B_{x,n}=k}\right]}
= \epsilon.
$

Για τον όρο $ II$ φράσσουμε την ποσότητα $ {\left\vert{f(x)-f(k/n)}\right\vert}$ από $ 2{\left\Vert{f}\right\Vert _\infty}$ (η συνάρτηση $ f$ είναι φραγμένη αφού είναι συνεχής σε κλειστό διάστημα, οπότε $ {\left\Vert{f}\right\Vert _\infty}<+\infty$) και έχουμε

$\displaystyle II \le 2{\left\Vert{f}\right\Vert _\infty} \sum_{k=0 \atop {\left...
...{{\bf {Pr}}\left[{E}\right]} \le 2{\left\Vert{f}\right\Vert _\infty} n^{-1/3}.
$

Επιλέγοντας και πάλι το $ n$ αρκετά μεγάλο (ώστε να ισχύει $ 2{\left\Vert{f}\right\Vert _\infty} n^{-1/3}<\epsilon$) πετυχαίνουμε να ισχύει και η ανισότητα $ II<\epsilon$. Η απόδειξή μας είναι πλήρης.

Άσκηση 4.28   Μια συνάρτηση $ f:K\to{\mathbb{C}}$ λέγεται ομοιόμορφα συνεχής στο $ K$ αν για κάθε $ \epsilon>0$ υπάρχει $ \delta>0$ τ.ώ.

$\displaystyle {\left\vert{x-y}\right\vert}<\delta \Rightarrow {\left\vert{f(x)-f(y)}\right\vert}<\epsilon.
$

Η διαφορά με την απλή συνέχεια στο σύνολο $ K$ είναι ότι στην περίπτωση της απλής συνέχειας το $ \delta$ εξαρτάται όχι μόνο από το $ \epsilon$ αλλά και από το $ x$. Η $ f$ δηλ. είναι συνεχής στο $ K$ αν

$\displaystyle \forall x\in K  \forall \epsilon>0  \exists \delta>0: {\left\v...
...y}\right\vert}<\delta \Rightarrow {\left\vert{f(x)-f(y)}\right\vert}<\epsilon.
$

Δείξτε ότι αν η συνάρτηση $ f:[a,b]\to{\mathbb{C}}$ είναι συνεχής στο κλειστό και φραγμένο διάστημα $ [a,b]$ τότε είναι και ομοιόμορφα συνεχής εκεί. Βρείτε επίσης μια συνάρτηση $ g:{\mathbb{R}}\to{\mathbb{R}}$ και μια συνάρτηση $ h:(0,1)\to{\mathbb{R}}$ που να είναι συνεχείς αλλά όχι ομοιόμορφα συνεχείς στο πεδίο ορισμού τους.

Υπόδειξη: Για να αποδείξετε την ομοιόμορφη συνέχεια της $ f$ πρέπει να χρησιμοποιήσετε τη συμπάγεια φραγμένου κλειστού διαστήματος $ [a,b]$: κάθε ακολουθία $ x_n \in [a,b]$ έχει υπακολουθία η οποία συγκλίνει (αναγκαστικά σε κάποιο σημείο του $ [a,b]$).

Υποθέστε ότι η $ f$ δεν είναι ομοιόμορφα συνεχής. Αυτό σημαίνει ότι για κάποιο $ \epsilon>0$ υπάρχουν $ x_n, y_n \in [a,b]$ τ.ώ. $ {\left\vert{x_n-y_n}\right\vert} \to 0$ αλλά με

$\displaystyle \inf_n {\left\vert{f(x_n)-f(y_n)}\right\vert} > 0.
$

Βρείτε μια ακολουθία δεικτών $ n_k$ τέτοια ώστε οι δύο ακολουθίες $ x_{n_k}$ και $ y_{n_k}$ να συγκλίνουν για $ k \to \infty$ και χρησιμοποιήστε τη συνέχεια της $ f$ για να καταλήξετε σε άτοπο.

Όσον αφορά τις συναρτήσεις $ g$ και $ h$ που πρέπει να βρείτε μπορείτε να δοκιμάσετε τις $ g(x)=e^x$ και $ h(x)=1/x$.

Άσκηση 4.29   Αν $ f:[1,\infty)\to{\mathbb{C}}$ είναι συνεχής και $ \lim_{x\to +\infty} f(x)$ είναι πραγματικός αριθμός, δείξτε ότι η $ f$ προσεγγίζεται ομοιόμορφα στο διάστημα $ [1,\infty)$ από συναρτήσεις της μορφής $ p(1/x)$, όπου $ p$ πολυώνυμο.

4.11.3.2 Το μέτρο συνέχειας μιας συνάρτησης

Το να πούμε ότι μια συνάρτηση είναι συνεχής σε κάποιο σύνολο είναι μια ποιοτική και όχι ποσοτική δήλωση. Είναι μια ιδιότητα που η συνάρτηση την έχει ή όχι. Κατά κάποιον τρόπο όμως υπάρχουν συναρτήσεις που είναι «πιο συνεχείς» από άλλες, όπως για παράδειγμα η πράσινη συνάρτηση στο Σχήμα 4.9 είναι πιο συνεχής από την κόκκινη συνάρτηση στο ίδιο Σχήμα, μεταβάλλεται δηλ. πιο αργά.

Σχήμα 4.9: Μια συνάρτηση (πράσινη) που είναι «πιο συνεχής» από μια άλλη

Η έννοια του μέτρου συνέχειας μιας συνάρτησης παίζει ακριβώς αυτό το ρόλο της ποσοτικοποίησης του πόσο γρήγορα αλλάζει μια συνάρτηση όταν αλλάζει η μεταβλητή.

Ορισμός 4.5   Αν $ f:K\to{\mathbb{C}}$ τότε το μέτρο συνέχειας της $ f$ στο $ K$ είναι η συνάρτηση

$\displaystyle \omega_f(\delta) = \sup{\left\{{{\left\vert{f(x)-f(y)}\right\vert...
...x,y \in K, {\left\vert{x-y}\right\vert} \le \delta}\right\}},   (\delta>0).$ (4.42)

Η ποσότητα $ \omega_f(\delta)$, με άλλα λόγια, μας λέει πόσο πολύ μπορεί να μεταβληθεί η τιμή της συνάρτησης $ f$ αν η μεταβλητή της αλλάξει το πολύ κατά $ \delta$.

Η συνάρτηση $ \omega_f(\delta)$ μπορεί να μην είναι πεπερασμένη ακόμη κι όταν η συνάρτηση $ f$ είναι συνεχής στο $ K$. Για παράδειγμα, εύκολα μπορεί κανείς να δει ότι αν $ f(x)=e^x$, ορισμένη για $ x \in {\mathbb{R}}$, τότε για κάθε $ \delta>0$ ισχύει $ \omega_f(\delta)=+\infty$. Δείτε όμως το Πρόβλημα 4.30.

Άσκηση 4.30   Δείξτε ότι μια συνάρτηση $ f:K\to{\mathbb{C}}$ είναι ομοιόμορφα συνεχής πάνω στο $ K$ αν και μόνο αν $ \omega_f(\delta) \to 0$ για $ \delta \to 0$.

Άσκηση 4.31   Αν $ f:K\to{\mathbb{C}}$ και $ f = u+iv$, όπου $ u, v$ πραγματικές συναρτήσεις δείξτε τότε ότι

$\displaystyle \omega_f(\delta) \le {\left\vert{\omega_u(\delta) + i \omega_v(\delta)}\right\vert} = \sqrt{\omega_u(\delta)^2 + \omega_v(\delta)^2}.
$

Άσκηση 4.32   Αν η $ f:[a,b] \to {\mathbb{R}}$ είναι παραγωγίσιμη στο $ [a,b]$ (στα άκρα εννοείται ότι υπάρχουν οι πλευρικές παράγωγοι) και $ {\left\vert{f'(x)}\right\vert} \le M$ για $ x \in [a,b]$, δείξτε ότι $ \omega_f(\delta) \le M\delta$, για κάθε $ \delta>0$.

Υπόδειξη: Χρησιμοποιήστε το θεώρημα μέσης τιμής για να φράξετε τη διαφορά $ {\left\vert{f(x)-f(y)}\right\vert}$.

Το μέτρο συνέχειας της $ f$ είναι υποπροσθετική συνάρτηση.

Άσκηση 4.33   Αν $ f:I\to{\mathbb{R}}$, όπου $ I \subseteq {\mathbb{R}}$ διάστημα, τότε $ \omega_f(\delta_1 + \delta_2) \le \omega_f(\delta_1) + \omega_f(\delta_2)$.

Υπόδειξη: Αν $ {\left\vert{x-y}\right\vert} \le \delta_1+\delta_2$ τότε, αν υπάρχει $ z$ ανάμεσα στα $ x$ και $ y$ τ.ώ. $ {\left\vert{x-z}\right\vert}\le\delta_1$ και $ {\left\vert{z-y}\right\vert}\le\delta_2$.

Άσκηση 4.34   Αν $ f:I\to{\mathbb{R}}$, όπου $ I \subseteq {\mathbb{R}}$ διάστημα, και $ \lambda>0$ τότε

$\displaystyle \omega_f(\lambda\delta) \le (1+\lambda)\omega_f(\delta).
$

Υπόδειξη: Χρησιμοποιήστε το Πρόβλημα 4.33.

4.11.3.3 Εκτίμηση του σφάλματος για τα πολυώνυμα Bernstein

Το Θεώρημα του Weierstrass (Θεώρημα 4.12) δε μας δίνει κάποια εκτίμηση για το πόσο μεγάλο μπορεί να είναι το «σφάλμα» $ {\left\Vert{f-p}\right\Vert _\infty} = \sup_{x\in[a,b]} {\left\vert{f(x)-p(x)}\right\vert}$ όταν η $ f(x)$ είναι μια συνεχής συνάρτηση στο διάστημα $ [a,b]$ και το $ p(x)$ είναι πολυώνυμο βαθμού $ \le n$. Σημαντικό ερώτημα είναι το πόσο μικρή μπορεί να γίνει αυτή η ποσότητα αν μας επιτρέπεται να διαλέξουμε κατάλληλα το πολυώυμο $ p(x)$. Με άλλα λόγια μας ενδιαφέρει η ποσότητα

$ E_n(f) = \inf\{{\left\Vert{f-p}\right\Vert _\infty}:$ το $ p(x)$ είναι πολυώνυμο βαθμού το πολύ $ n$ $ \}$.
Όπως αποδείξαμε στα εισαγωγικά μαθήματα, όταν μιλάγαμε για το πρόβλημα της προσέγγισης των στοιχείων ενός διανυσματικού χώρου από στοιχεία ενός υποχώρου, το παραπάνω infimum «πιάνεται» από κάποιο πολυώνυμο $ p(x)$ βαθμού μέχρι $ n$, μια και ο χώρος αυτός των πολυωνύμων έχει πεπερασμένη διάσταση και μάλιστα ίση με $ n+1$ (αφού κάθε τέτοιο πολυώνυμο μπορεί να προσδιορισθεί δίνοντας $ n+1$ παραμέτρους, τους συντελεστές του). Φυσικά μια εκτίμηση για την ποσότητα $ E_n(f)$ θα πρέπει να επηρεάζεται από το πόσο «καλή» είναι η συνάρτηση $ f$. Αυτή η ιδιότητα της $ f$ ποσοτικοποιείται από το μέτρο συνέχειας της $ f$ τη συνάρηση $ \omega_f(\delta)$.

Θεώρημα 4.15   Έστω $ f \in C([a,b])$. Τότε ισχύει

$\displaystyle E_n(f) \le 2 \omega_f(1/\sqrt{n}).
$

Πιο συγκεκριμένα, αν $ B_n(f)$ είναι το $ n$-οστό πολυώνυμο Bernstein της $ f$ τότε $ {\left\Vert{f-B_n(f)}\right\Vert _\infty} \le 2 \omega_f(1/\sqrt{n})$.

Όπως κάναμε και στην απόδειξη του θεωρήματος του Weierstrass μέσω των πολυωνύμων του Bernstein, μπορούμε κι εδώ, χωρίς βλάβη της γενικότητας, να πάρουμε $ [a, b] = [0, 1]$, πράγμα το οποίο απλουστεύει τους υπολογισμούς.

Ξεκινάμε χρησιμοποιώντας της σχέση (4.40).

$\displaystyle {\left\vert{f(x)-B_n(f)(x)}\right\vert}$ $\displaystyle = {\left\vert{f(x)-{{\bf E}\left[{f(B_{x,n}/n)}\right]}}\right\vert}$    
  $\displaystyle = {\left\vert{{{\bf E}\left[{f(x) - f(B_{x,n}/n)}\right]}}\right\vert}$    
  $\displaystyle \le {{\bf E}\left[{{\left\vert{f(x) - f(B_{x,n}/n)}\right\vert}}\right]}    (A1)$    
  $\displaystyle = \sum_{k=0}^n {\left\vert{f(x)-f(k/n)}\right\vert} {{\bf {Pr}}\left[{B_{x,n}=k}\right]}    (A2)$    
  $\displaystyle \le \sum_{k=0}^n \omega_f({\left\vert{x-\frac{k}{n}}\right\vert}) {{\bf {Pr}}\left[{B_{x,n}=k}\right]}$    
  $\displaystyle = \sum_{k=0}^n \omega_f(\lambda\frac{1}{\sqrt{n}}) {{\bf {Pr}}\left[{B_{x,n}=k}\right]}    (A3)$    
  $\displaystyle \le \omega_f(1/\sqrt{n}) \sum_{k=0}^n (1+\sqrt{n}{\left\vert{x-\frac{k}{n}}\right\vert}){{\bf {Pr}}\left[{B_{x,n}=k}\right]}    (A4)$    
  $\displaystyle = \omega_f(1/\sqrt{n}) (1+\sqrt{n}{{\bf E}\left[{x-\frac{B_{x,n}}{n}}\right]})$    
  $\displaystyle = \omega_f(1/\sqrt{n}) (1+\frac{1}{\sqrt{n}}{{\bf E}\left[{B_{x,n}-nx}\right]})$    
  $\displaystyle \le \omega_f(1/\sqrt{n}) (1+\frac{1}{\sqrt{n}} \sigma(B_{x,n}))    (A5)$    
  $\displaystyle \le 2 \omega_f(1/\sqrt{n})    (A6)$    

($ (A1)$: τριγωνική ανισότητα: $ {\left\vert{{{\bf E}\left[{X}\right]}}\right\vert} \le {{\bf E}\left[{{\left\vert{X}\right\vert}}\right]}$,
$ (A2)$: από το $ {{\bf E}\left[{\phi(X)}\right]}=\sum_k \phi(k){{\bf {Pr}}\left[{X=k}\right]}$,
$ (A3)$: με $ \lambda=\sqrt{n}{\left\vert{x-\frac{k}{n}}\right\vert}$,
$ (A4)$: από το Πρόβλημα 4.34,
$ (A5)$: από το Πρόβλημα 4.25,
$ (A6)$: από την (4.38)).
Η απόδειξη του Θεωρήματος 4.15 είναι πλήρης.

Παρατήρηση 4.5   Υπάρχει πολύ καλύτερη εκτίμηση για το σφάλμα $ E_n(f)$ από αυτή του Θεωρήματος 4.15. Το Θεώρημα του Jackson μας λέει ότι $ E_n(f) \le C \omega_f(1/n)$, όπου $ C$ είναι μια απόλυτη σταθερά.

Mihalis Kolountzakis 2015-11-28