Appunti integrativi per il Corso di Metodi Matematici per
Transcript
Appunti integrativi per il Corso di Metodi Matematici per
Appunti integrativi per il Corso di Metodi Matematici per l’Ingegneria A.A. 2015/2016 Marco Bramanti Politecnico di Milano 16 settembre 2015 Indice 1 Elementi di analisi funzionale 1.1 Generalità sugli spazi di funzioni . . . . . . . . . . . . . . . . . . 1.1.1 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Spazi metrici . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.3 Limiti di successioni, continuità di funzioni . . . . . . . . 1.1.4 Successioni di Cauchy e completezza . . . . . . . . . . . . 1.2 Convergenza uniforme per successioni e serie di funzioni . . . . . 1.2.1 Successioni di funzioni: convergenza puntuale e uniforme 1.2.2 Successioni di funzioni e derivazione . . . . . . . . . . . . 1.2.3 Serie di funzioni: convergenza puntuale e uniforme . . . . 1.3 Operatori lineari continui . . . . . . . . . . . . . . . . . . . . . . 1.4 L’integrale di Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Motivazione . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 La misura di Lebesgue . . . . . . . . . . . . . . . . . . . . 1.4.3 Integrale di Lebesgue . . . . . . . . . . . . . . . . . . . . . 1.4.4 Relazione tra integrale di Riemann e integrale di Lebesgue 1.4.5 I teoremi di convergenza per l’integrale di Lebesgue . . . 1.4.6 Derivazione sotto il segno di integrale . . . . . . . . . . . 1.4.7 Spazi Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.8 Integrali doppi in Rn . . . . . . . . . . . . . . . . . . . . . 1.4.9 Convoluzione in Rn . . . . . . . . . . . . . . . . . . . . . 1.5 Richiami sulle serie di Fourier . . . . . . . . . . . . . . . . . . . . 1.5.1 Serie di Fourier in L2 . . . . . . . . . . . . . . . . . . . . 1.5.2 Convergenza puntuale delle serie di Fourier e rapidità di convergenza a zero dei coe¢ cienti . . . . . . . . . . . . . . 1 5 5 5 8 10 11 13 14 21 25 30 32 32 35 40 47 51 55 60 65 67 68 68 70 2 Generalità su equazioni e problemi ai limiti per equazioni a derivate parziali 2.1 Equazioni lineari del second’ordine . . . . . . . . . . . . . . . . . 2.2 Equazioni ellittiche, paraboliche, iperboliche . . . . . . . . . . . . 2.3 Condizioni al contorno . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Equazioni ellittiche. Problemi al contorno . . . . . . . . . 2.3.2 Equazioni paraboliche. Problemi al contorno e ai valori iniziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Equazioni iperboliche. Problemi al contorno e ai valori iniziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Principio di sovrapposizione . . . . . . . . . . . . . . . . . . . . . 2.5 Problemi ben posti . . . . . . . . . . . . . . . . . . . . . . . . . . 75 75 76 79 79 81 83 84 86 3 Metodo di separazione di variabili e sviluppi di Fourier per problemi ai limiti 89 3.1 Equazione di Laplace e di Poisson . . . . . . . . . . . . . . . . . 89 3.1.1 Unicità, principio di massimo, dipendenza continua . . . . 89 3.1.2 L’equazione di Laplace sul cerchio . . . . . . . . . . . . . 95 3.1.3 Equazione di Poisson sul cerchio . . . . . . . . . . . . . . 114 3.2 Equazione di di¤usione . . . . . . . . . . . . . . . . . . . . . . . . 118 3.2.1 Unicità e principio di massimo parabolico . . . . . . . . . 118 3.2.2 Equazione di di¤usione sul segmento . . . . . . . . . . . . 123 3.3 L’equazione della corda vibrante . . . . . . . . . . . . . . . . . . 131 3.3.1 La corda vibrante …ssata agli estremi . . . . . . . . . . . . 131 3.3.2 La corda vibrante illimitata . . . . . . . . . . . . . . . . . 138 3.4 Equazione delle onde in dimensione superiore . . . . . . . . . . . 142 3.4.1 Energia e risultato di unicità . . . . . . . . . . . . . . . . 143 3.4.2 Onde sferiche tridimensionali . . . . . . . . . . . . . . . . 144 3.5 Esercizi sul metodo di separazione di variabili e sviluppi di Fourier145 4 Trasformata di Fourier e problemi ai limiti 149 4.1 La trasformata di Fourier in L1 (Rn ) . . . . . . . . . . . . . . . . 149 4.1.1 De…nizione e proprietà elementari . . . . . . . . . . . . . 149 4.1.2 Approssimazioni dell’identità . . . . . . . . . . . . . . . . 158 4.1.3 Il teorema di inversione . . . . . . . . . . . . . . . . . . . 160 4.2 L’equazione di Laplace nel semipiano . . . . . . . . . . . . . . . . 163 4.3 L’equazione del calore in tutto lo spazio . . . . . . . . . . . . . . 168 4.4 Problemi unidimensionali per l’equazione di di¤usione con trasporto e reazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 4.5 L’equazione di Poisson nello spazio . . . . . . . . . . . . . . . . . 176 4.6 L’equazione delle onde nello spazio . . . . . . . . . . . . . . . . . 180 5 Spazi di Hilbert 185 5.1 Spazi vettoriali con prodotto interno . . . . . . . . . . . . . . . . 185 5.2 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 5.3 Analisi di Fourier in spazi di Hilbert . . . . . . . . . . . . . . . . 195 2 5.4 5.5 5.6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . Il sistema trigonometrico. Serie di Fourier in una o più 5.5.1 Completezza del sistema trigonometrico . . . . 5.5.2 Serie di Fourier in più variabili . . . . . . . . . Base di Haar e wavelets . . . . . . . . . . . . . . . . . . . . . . variabili . . . . . . . . . . . . . . . . . . . . 203 205 205 209 211 6 Applicazioni dei metodi di ortogonalità a problemi di¤erenziali216 6.1 Problemi di Sturm-Liouville e polinomi ortogonali . . . . . . . . 216 6.2 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 6.3 Laplaciano in coordinate sferiche. Polinomi di Legendre e armoniche sferiche . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 6.3.1 Il dato indipendente dalla longitudine. Polinomi di Legendre233 6.3.2 Il caso generale. Funzioni di Legendre associate e armoniche sferiche . . . . . . . . . . . . . . . . . . . . . . . 235 6.3.3 Soluzione del problema di Dirichlet per l’equazione di Laplace sulla sfera . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 6.4 Oscillatore armonico quantistico e polinomi di Hermite . . . . . . 243 6.5 Il problema agli autovalori per il laplaciano (equazione di Helmholz) e le sue applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . 249 6.6 L’equazione di Helmholz sul rettangolo . . . . . . . . . . . . . . . 252 6.6.1 Membrana vibrante rettangolare . . . . . . . . . . . . . . 253 6.6.2 Equazione del calore sul rettangolo . . . . . . . . . . . . . 257 6.7 L’equazione di Helmholz sul cerchio. Funzioni di Bessel di ordine intero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 6.7.1 Equazione di Bessel ed autofunzioni del laplaciano sul cerchio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 6.7.2 La membrana vibrante circolare . . . . . . . . . . . . . . . 263 6.8 Equazione di Helmholz sul cilindro . . . . . . . . . . . . . . . . . 266 6.8.1 L’equazione del calore sul cilindro . . . . . . . . . . . . . 268 6.9 Equazione di Helmholz sulla sfera. Funzioni di Bessel sferiche . . 269 6.9.1 Equazione e funzioni di Bessel di ordine semiintero . . . . 270 6.10 L’equazione di Schrödinger per l’atomo di idrogeno e i polinomi di Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 6.10.1 Equazione e polinomi di Laguerre associati . . . . . . . . 279 6.10.2 Orbitali atomici . . . . . . . . . . . . . . . . . . . . . . . 283 6.10.3 Soluzioni dell’equazione di Schrödinger . . . . . . . . . . . 288 6.10.4 Calcoli dettagliati per la risoluzione dell’equazione radiale 288 3 Nota bene. Questi appunti integrativi sono messi a disposizione degli studenti del corso di Metodi Matematici per l’Ingegneria, A.A. 2015/2016 come materiale complementare. Il programma d’esame, che sarà precisato nell’arco del corso alla pagina web: http://www1.mate.polimi.it/~bramanti/corsi/metodi_2016.htm comprende sia una parte del materiale contenuto nel libro di testo: G. C. Barozzi: Matematica per l’ingegneria dell’informazione. Zanichelli, 2004 sia una parte del materiale contenuto in questa dispensa. Entrambe le fonti (libro di testo e dispensa) sono dunque necessarie per l’esame, anche se ognuna delle due è utilizzata solo in parte. Ho lasciato in questa dispensa (che ha origine dal corso degli anni passati, con un diverso programma) anche parti che certamente non saranno utilizzate, perché potrebbero servire all’approfondimento o alla curiosità dello studente interessato. Questa dispensa va considerata provvisoria, in fase di revisione, e potrà essere sostituita nell’arco del corso da versioni più aggiornate. 4 1 1.1 Elementi di analisi funzionale Generalità sugli spazi di funzioni Cominciamo con l’introdurre o richiamare alcune strutture astratte che si utilizzano per studiare gli spazi di funzioni che sono coinvolti nei problemi analitici che incontreremo. 1.1.1 Spazi vettoriali Iniziamo a ricordare la de…nizione di spazio vettoriale che lo studente ha incontrato nello studio dell’algebra lineare. De…nizione 1.1 (Spazio vettoriale) Uno spazio vettoriale sul campo K (= R o C) è un insieme X su cui sono de…nite: 1. un’operazione + (“somma di vettori”), che associa ad ogni coppia di vettori (x; y) un vettore x + y; l’operazione di somma soddisfa le proprietà (per ogni x; y; z 2 X): -commutativa: x + y = y + x; -associativa: x + (y + z) = (x + y) + z; -esistenza dell’elemento neutro 0; tale che x + 0 = 0 + x = x; -esistenza dell’opposto x di ogni elemento x, tale che x + ( x) = 0: 2. Un’operazione di prodotto tra un vettore e uno scalare, che associa a una coppia ( ; x) con 2 K; x 2 X un vettore x 2 X; l’operazione1 soddisfa le proprietà (per ogni x; y 2 X; ; 2 K): -distribuitva del prodotto per uno scalare rispetto alla somma di vettori: (x + y) = x + y -distribuitva del prodotto per uno scalare rispetto alla somma di scalari: ( + ) x = x + x; -pseudoassociativa: ( x) = ( ) x; -l’elemento neutro del prodotto tra scalari è elemento neutro del prodotto per uno scalare: 1 x = x: Ricordiamo che uno spazio X ha dimensione …nita quando esiste un numero …nito di elementi e1 ; e2 ; :::; en 2 X tali che ogni altro elemento di X è combinazione lineare di questi. Altrimenti si dice che X ha dimensione in…nita. Nel corso di algebra lineare e geometria lo studente ha incontrato soprattutto spazi vettoriali di dimensione …nita, come sono gli spazi Rn e Cn , gli spazi di matrici, gli spazi di polinomi di grado minore o uguale di un n …ssato. In analisi ci interessano spazi vettoriali di funzioni, e questi sono solitamente di dimensione in…nita. De…nizione 1.2 (Spazio di funzioni) Sia F = ff : 1 Come nell’algebra usuale, il simbolo sottointeso. un insieme qualsiasi e sia ! Rg : di prodotto tra vettore e scalare è comunemente 5 (Si potrebbero considerare anche funzioni a valori in Rn o Cn , ma per semplicità limitiamoci ora a questo caso). F è uno spazio vettoriale su R, con le operazioni naturali di somma di funzioni: (f + g) (x) = f (x) + g (x) e prodotto di una funzione per uno scalare: ( f ) (x) = f (x) : La veri…ca delle proprietà delle operazioni richieste dalla de…nizione di spazio vettoriale è immediata, seguendo queste dalle analoghe proprietà delle operazioni su numeri reali. Notiamo che se ad esempio = (a; b) R, F ha dimensione in…nita: non esiste un numero …nito di funzioni di cui tutte le altre siano combinazioni lineari (ad esempio, le funzioni xn per n = 1; 2; 3; ::: sono un esempio di in…nite funzioni di cui nessuna è combinazione lineare di un numero …nito delle altre, e naturalmente esistono funzioni di tipo ancora diverso). Di solito si studiano spazi di funzioni con qualche proprietà aggiuntiva (ad esempio funzioni continue, o integrabili, o derivabili...). Esempio 1.3 C 0 (a; b) = ff : (a; b) ! R : f è continuag è uno spazio vettoriale. Il modo più semplice di dimostrarlo non è veri…care daccapo le proprietà delle operazioni, ma veri…care che questo sottoinsieme di F(a;b) è un sottospazio vettoriale. Questo consiste nel veri…care che la combinazione lineare di due elementi di C 0 (a; b) è ancora un elemento di C 0 (a; b), il che segue per le proprietà note delle funzioni continue. Puntualizziamo quindi il Teorema 1.4 (Criterio di riconoscimento dei sottospazi) Dato uno spazio vettoriale X su K e un sottoinsieme X0 X; X0 risulta un sottospazio vettoriale (cioè uno spazio vettoriale rispetto alle medesime operazioni) se x + y 2 X0 per ogni x; y 2 X0 ; ; 2 K: Esempio 1.5 Applicando il criterio precedente è immediato veri…care che sono spazi vettoriali i seguenti: C 0 [a; b] ; insieme delle funzioni continue su [a; b] C 1 [a; b] ; insieme delle funzioni derivabili con derivata continua su [a; b] L [a; b] ; insieme delle funzioni limitate su [a; b] e analoghi spazi di funzioni de…nite su tutto R oppure su un opportuno insieme Rn . Invece, non è uno spazio vettoriale l’insieme P (R) , insieme delle funzioni periodiche su R, 6 in quanto la somma di due funzioni periodiche non sempre è periodica, come mostra l’esempio f (x) = sin x + sin ( x) . Quando in analisi si parla di “spazio di funzioni” solitamente si intende indicare uno spazio vettoriale, i cui elementi sono funzioni (con qualche proprietà particolare). Nei casi (non così frequenti) in cui ci interessa considerare un insieme di funzioni che non costituisce uno spazio vettoriale, solitamente si utilizzano termini come insieme delle funzioni... o classe delle funzioni..., rinunciando cioè a usare la parola spazio. Come negli spazi Rn esiste il modulo (o norma) di un vettore, così in molti spazi vettoriali esiste una norma che consente di misurare la “grandezza”di un vettore e quindi la distanza tra due vettori: De…nizione 1.6 (Spazio vettoriale normato) Sia X uno spazio vettoriale su K. Si dice norma su X una funzione k k : X ! [0; +1) che ad ogni vettore associa un numero reale non negativo, con le seguenti proprietà (per ogni x; y 2 X; 2 K): -proprietà di annullamento: kxk = 0 () x = 0 -omogeneità: k xk = j j kxk -disuguaglianza triangolare: kx + yk kxk + kyk. In questo caso (X; k k) si dice spazio vettoriale normato. Esempio 1.7 1. In Rn la norma usuale è v u n uX 2 jxi j jxj = t i=1 che veri…ca le proprietà precedenti. Non è l’unica norma naturale in Rn . Sono norme anche: jxj0 = jxj1 = max i=1;2;:::;n n X i=1 jxi j oppure jxi j : Si può dimostrare che queste tre norme sono tutte tra loro equivalenti, il che signi…ca che per certe costanti c1 ; c2 > 0 risulta c1 jxj0 jxj c2 jxj0 e analoghe disuguaglianze permettono di confrontare jxj con jxj1 e jxj0 con jxj1 . 2. In C 0 [a; b] possiamo de…nire: kf kC 0 [a;b] = max jf (x)j , x2[a;b] 7 che risulta …nita per ogni f 2 C 0 [a; b] in base al teorema di Weierstrass. E’ immediato veri…care che valgono le proprietà di norma. Analoga norma si può de…nire più in generale in C 0 (K) dove K è un sottoinsieme chiuso e limitato di Rn . 3. In C 0 [a; b] possiamo de…nire anche2 : kf kL1 [a;b] = Z a b jf (x)j dx. Anche questa risulta una norma su C 0 [a; b], pur essendo sostanzialmente diversa dalla norma kf kC 0 [a;b] . Le norme k kC 0 e k kL1 non sono equivalenti. Vediamo quindi che su uno spazio di funzioni, diversamente che in Rn , possono esistere norme sostanzialmente diverse tra loro. 4. Se provassimo a de…nire la norma kf kC 0 o kf kL1 in C 0 (a; b) (che pure è uno spazio vettoriale), queste norme non risulterebbero …nite per ogni f 2 C 0 (a; b), in quanto C 0 (a; b) contiene anche funzioni illimitate. Quindi su questo spazio queste non sarebbero norme. Vediamo quindi che non in ogni spazio vettoriale esistono norme “naturali”. 1.1.2 Spazi metrici Una diversa struttura astratta utile in analisi è quello di spazio metrico, che ora introduciamo. De…nizione 1.8 (Spazio metrico) Si dice spazio metrico un insieme X dotato di una funzione distanza d:X X ! [0; 1] che soddisfa le seguenti proprietà (per ogni x; y 2 X): -proprietà di annullamento: d (x; y) = 0 () x = y -simmetria: d (x; y) = d (y; x) -disuguaglianza triangolare: d (x; y) d (x; z) + d (z; y). Notiamo subito che ogni spazio vettoriale normato è uno spazio metrico: ponendo d (x; y) = kx yk si ha che d soddisfa le proprietà della distanza. Tuttavia la struttura di spazio metrico non presuppone di per sé quella di spazio vettoriale. Ad esempio è immediata la seguente: Proposizione 1.9 Se (X; d) è uno spazio metrico e X0 sieme qualsiasi, anche (X0 ; d) è uno spazio metrico. X un suo sottoin- 2 L’origine del nome L1 dato a questa norma si chiarirà in un prossimo capitolo, parlando dell’integrale di Lebesgue. Per ora è solo un simbolo come un altro scelto per denotare questa norma integrale. 8 In particolare: qualunque sottoinsieme di uno spazio vettoriale normato è uno spazio metrico, pur non essendo più, in generale, uno spazio vettoriale. Esempio 1.10 1. Sia X un qualunque sottoinsieme di Rn e d (x; y) = jx yj. Questo è uno spazio metrico (e in generale, non è uno spazio vettoriale). 2. X = C 0 [a; b] con d (f; g) = kf gkC 0 è uno spazio metrico, essendo uno spazio vettoriale normato. 3. X = f 2 C 0 [a; b] : kf kC 0 1 con d (f; g) = kf gkC 0 è uno spazio metrico, essendo sottoinsieme di uno spazio vettoriale normato. Non è uno spazio vettoriale (combinazione lineare di funzioni che soddisfano kf kC 0 1 in generale non soddisfa la stessa limitazione). 4. X = ff : R ! R : f periodica e limitatag con d (f; g) = kf gkC 0 è uno spazio metrico. Infatti, anche se la di¤ erenza tra due funzioni periodiche può non essere periodica, quindi X non è uno spazio vettoriale, è comunque vero che la di¤ erenza tra due funzioni periodiche e limitate è limitata, quindi kf gkC 0 risulta …nita. Gli spazi metrici che ci interesseranno nel seguito saranno quasi sempre sottoinsiemi di uno spazio vettoriale normato. In tutti gli spazi metrici, quindi in particolare negli spazi vettoriali normati, si possono introdurre nozioni topologiche in modo analogo a quanto si fa in Rn . Data la somiglianza di questi concetti con quelli che dovrebbero essere già noti in Rn non ci so¤ermeremo nell’esempli…care queste nozioni. De…nizione 1.11 (Intorni sferici) Sia (X; d) uno spazio metrico. Si dice sfera aperta o intorno sferico di centro x0 2 X e raggio r > 0 l’insieme Br (x0 ) = fx 2 X : d (x; x0 ) < rg : De…nizione 1.12 (Tipi di punti di un insieme) Sia (X; d) uno spazio metrico e E X. Un punto x 2 X si dice: interno ad E se esiste un intorno sferico Br (x) E; esterno ad E se esiste un intorno sferico Br (x) E c (il simbolo E c indice il complementare di E; cioè E c = X n E); di frontiera per E se non è né interno né esterno. Esplicitamente: x è di frontiera per E se ogni intorno sferico Br (x) contiene un punto y 2 E e un punto z 2 = E: De…nizione 1.13 (Tipi di insiemi) Sia (X; d) uno spazio metrico e E Si dice che: E è aperto se ogni punto di E è interno ad E; E è chiuso se il complementare di E è aperto. X. Naturalmente un insieme può non essere né aperto né chiuso. De…nizione 1.14 Sia (X; d) uno spazio metrico e E X: Si dice che E è limitato se esiste una sfera (di raggio e centro qualsiasi) Br (x0 ) E. In particolare in uno spazio vettoriale normato si dice che E è limitato se esiste K > 0 tale che kxk < K per ogni x 2 E. 9 1.1.3 Limiti di successioni, continuità di funzioni In ogni spazio metrico, e quindi in particolare negli spazi vettoriali normati, si può de…nire il concetto di limite di successione: De…nizione 1.15 (Limite di successione) Sia (X; d) uno spazio metrico e 1 fxn gn=1 X. Si dice che xn ! x se d (xn ; x) ! 0: Esplicitamente, questo signi…ca che: per ogni " > 0 esiste n0 tale che per ogni n n0 è xn 2 B" (x) : Si noti come la convergenza in X è stata ricondotta, via il concetto di distanza, alla convergenza in R. Questo è del resto ciò che si fa anche per de…nire la convergenza in Rn . Vale naturalmente il teorema di unicità del limite, con “la solita” dimostrazione. Molto importante è la prossima proprietà, che getta un ponte tra il concetto topologico di insieme chiuso e quello di successione convergente: Teorema 1.16 (Caratterizzazione successionale dei chiusi) Sia (X; d) uno spazio metrico e C X: L’insieme C è chiuso se e solo se vale la seguente proprietà: 1 per ogni successione fxn gn=1 C tale che xn ! x per qualche x 2 X si ha che x 2 C: Detto altrimenti: un insieme è chiuso se e solo se contiene i limiti di tutte le proprie successioni convergenti in X. (Si noti che la successione fxn g per ipotesi ha limite in X; il punto è che questo limite appartenga in e¤ etti al sottoinsieme C). La de…nizione di limite consente di de…nire, al solito modo, il concetto di funzione continua su uno spazio metrico, a valori reali o in un altro spazio metrico: De…nizione 1.17 Siano (X; dX ) ; (Y; dY ) due spazi metrici. Una funzione f : X ! Y si dice continua in x 2 X se per ogni successione fxn g X tale che xn ! x in X si ha f (xn ) ! f (x) in Y: Equivalentemente, se per ogni " > 0 esiste > 0 tale che dX (x; x) < =) dY (f (x) ; f (x)) < ": La funzione f si dice continua in X se è continua in ogni punto x 2 X. Si possono formulare i concetti topologici di insieme aperto e chiuso in termini di funzioni continue: Teorema 1.18 (Insiemi aperti e chiusi de…niti mediante funzioni continue) Sia (X; d) metrico e f : X ! R continua. Allora gli insiemi: E1 = fx 2 X : f (x) > 0g E2 = fx 2 X : f (x) < 0g E3 = fx 2 X : f (x) 6= 0g sono aperti; gli insiemi: E4 = fx 2 X : f (x) 0g 10 E5 = fx 2 X : f (x) 0g E6 = fx 2 X : f (x) = 0g sono chiusi. Esempio 1.19 In uno spazio vettoriale normato (X; k k) gli insiemi fx 2 X : kxk = 1g ; fx 2 X : kxk fx 2 X : kxk > 1g è aperto. 1g sono chiusi; Terminiamo con la seguente De…nizione 1.20 Sia (X; d) uno spazio metrico. Un sottoinsieme E X si dice denso in X se E = X. Equivalentemente: E è denso in X se per ogni 1 x 2 X esiste una successione fxn gn=1 E tale che xn ! x: Quindi un sottoinsieme denso, pur possedendo meno elementi di X; consente di approssimare bene quanto vogliamo qualsiasi elemento di X. Ad esempio, Q è denso in R. 1.1.4 Successioni di Cauchy e completezza Introduciamo ora un’importante concetto che riguarda il comportamento delle successioni in uno spazio metrico, in particolare in uno spazio vettoriale normato: la nozione di successione di Cauchy, che servirà a sua volta a evidenziare un’importante proprietà che questi spazi possono avere o non avere: la completezza. De…nizione 1.21 (Successione di Cauchy) Sia (X; d) uno spazio metrico e 1 fxn gn=1 X: Si dice che questa successione è di Cauchy se: 8" > 0 9n0 : 8n; m n0 si ha d (xn ; xm ) < ": Detto in modo meno preciso ma più intuitivo: una successione è di Cauchy se i suoi termini sono sempre più vicini tra loro, o anche: se d (xn ; xm ) ! 0 per n; m ! 1. Per ra¤ronto, si noti che una successione è convergente (a x) se i suoi termini sono sempre più vicini a x. E’facile allora capire che: Proposizione 1.22 Se una successione converge in (X; d) ; allora è di Cauchy in (X; d). Il fatto che una successione sia di Cauchy è quindi una condizione necessaria, in ogni spazio metrico, a¢ nché la successione sia convergente. Il fatto che una successione sia di Cauchy o meno si può veri…care senza sapere preliminarmente quale sia il “candidato limite” x, mentre per provare che fxn g è convergente in base alla de…nizione di limite occorre già avere un’idea su quale sia il limite stesso. Ad ogni modo la condizione necessaria non è in generale su¢ ciente, come mostra il prossimo 11 n Esempio 1.23 Sia xn = 1 + n1 per n = 1; 2; 3; ::: E’ noto che xn ! e per n ! 1, e che e è un numero irrazionale, mentre tutti i numeri xn sono razion1 ali. Dunque la successione fxn gn=1 nello spazio metrico Q non è convergente. Tuttavia la successione in R è convergente, quindi è di Cauchy; ma allora è di Cauchy anche in Q, perché la distanza usata in Q ed R è la stessa (quella euclidea). Abbiamo quindi un esempio, nello spazio metrico Q, di successione di Cauchy ma non convergente. Vale anche la seguente semplice 1 Proposizione 1.24 Se una successione fxn gn=1 è di Cauchy in (X; d), allora è limitata. Diamo ora la seguente De…nizione 1.25 (Spazio metrico completo) Uno spazio metrico (X; d) si dice completo se ogni successione di Cauchy in X è convergente in X. Quindi negli spazi metrici completi la condizione di Cauchy risulta equivalente alla convergenza. In uno spazio completo se veri…chiamo che una successione è di Cauchy (il che, ricordiamolo ancora, non richiede la previa conoscenza del candidato limite) ne segue che esiste un elemento x 2 X a cui la successione converge. La completezza dello spazio è un’ipotesi importante nei teoremi di esistenza dell’analisi matematica. L’Esempio 1.23 mostra che lo spazio metrico Q non è completo. Vale invece il seguente fondamentale Teorema 1.26 Rn è completo. Tornando agli spazi metrici qualsiasi proviamo ora che: Teorema 1.27 Se (X; d) è uno spazio metrico completo e C chiuso. Allora (C; d) è uno spazio metrico completo. X è un insieme Ad esempio, ogni sottoinsieme chiuso di Rn è uno spazio metrico completo. De…nizione 1.28 (Spazio di Banach) Uno spazio vettoriale normato, completo rispetto alla distanza della norma, si dice spazio di Banach. Ad esempio Rn è uno spazio di Banach. Un sottoinsieme chiuso di Rn , invece, è uno spazio metrico completo ma non è uno spazio di Banach perché non è uno spazio vettoriale. La cosa importante per dimostrare teoremi di esistenza per problemi di analisi è trovare spazi di funzioni (quindi in…nito dimensionali) che siano di Banach. 12 Esempio 1.29 Consideriamo lo spazio C 0 [ 1; 1] con la norma integrale: kf kL1 [ 1;1] = Z 1 1 jf (x)j dx: Mostriamo che non è completo. Consideriamo la successione: p n x se x 0 p fn (x) = n x se x 0: La successione è di Cauchy. Infatti per n > m si ha: Z 1 Z kfn fm kL1 [ 1;1] = jfn (x) fm (x)j dx = 2 1 =2 1 1+ 1 p n x p m x dx 0 1 n 1 1 1+ m ! 0 per n; m ! 1: D’altro canto la successione non converge ad alcun elemento dello spazio. Questa a¤ ermazione non è facile da giusti…care rigorosamente a questo livello del corso. In sostanza, tuttavia, il ragionamento è il seguente: la successione converge (con questa norma) alla funzione limite fn (x) = 1 1 se x > 0 se x > 0 che è discontinua, ossia non sta nello spazio considerato. Perciò, in questo spazio, la successione non converge. L’esempio precedente mostra che garantire la completezza di uno spazio di funzioni non è scontato, e in particolare dipende in modo cruciale dalla norma che si considera. Nel seguito ci occuperemo di spazi di funzioni continue e derivabili e mostreremo la loro completezza, nella norma opportuna. Successivamente ci occuperemo di spazi di funzioni integrabili, gli spazi di Lebesgue, e mostreremo come per ottenere spazi di Banach di questo tipo sia stato necessario sviluppare un nuovo tipo di integrale. Questo ci porterà ad accennare alla teoria della misura e dell’integrazione nata all’inizio del 1900, su cui si basa ad esempio lo studio moderno delle equazioni alle derivate parziali, dell’analisi armonica, del calcolo delle variazioni. 1.2 Convergenza uniforme per successioni e serie di funzioni Molti procedimenti risolutivi per i problemi di¤erenziali che studieremo porteranno a rappresentare la soluzione cercata come somma di una serie di funzioni. Per garantire che la funzione così ottenuta abbia le proprietà richieste occorre sapere quando una data serie di funzioni rappresenta una funzione continua, quando rappresenta una funzione derivabile, e come si possono calcolarne le 13 derivate. Un concetto chiave in questa direzione è quello di convergenza uniforme, che ora discuteremo, prima per successioni e poi per serie. Questo sarà anche lo strumento per dimostrare che gli spazi di funzioni C 0 [a; b] ; C k [a; b] ; e i loro analoghi per funzioni di più variabili, sono spazi di Banach. 1.2.1 Successioni di funzioni: convergenza puntuale e uniforme De…nizione 1.30 (Convergenza puntuale) Sia fn : I ! R per n = 1; 2; 3; ::: 1 con I R o in Rn . Si dice che la successione ffn gn=1 converge in x0 2 I se la 1 1 successione reale ffn (x0 )gn=1 è convergente; si dice che la successione ffn gn=1 converge puntualmente in I se converge in x0 per ogni x0 2 I: In questo caso risulta de…nita una nuova funzione f : I ! R, f (x) = limn!1 fn (x), detta 1 limite puntuale della successione ffn gn=1 in I. La nozione di convergenza puntuale è semplice ma anche molto debole. Ci si rende conto facilmente, infatti, che il limite puntuale di una successione di funzioni talvolta non “eredita”le buone proprietà possedute dalle fn . I prossimi esempi vogliono illustrare i tipi di fenomeni che si possono presentare. Esempio 1.31 Sia fn (x) = xn in [0; 1). 8 < 0 se x 2 [0; 1) 1 se x = 1 fn (x) ! : +1 se x > 1: La successione converge puntualmente solo nell’intervallo [0; 1], in cui risulta de…nita la funzione limite puntuale f (x) = 0 se x 2 [0; 1) 1 se x = 1: Osserviamo che in questo caso il limite puntuale è una funzione discontinua, sebbene le fn siano tutte funzioni continue. p Esempio 1.32 Sia fn (x) = n jxjsgn(x) in [ 1; 1]. 8 < 1 se x 2 (0; 1] 0 se x = 0 fn (x) ! : 1 se x 2 [ 1; 0): Anche in questo caso il limite puntuale è una funzione discontinua, sebbene le fn siano tutte funzioni continue. Esempio 1.33 Sia fn : [0; +1) ! R de…nita per n = 1; 2; 3; :::da: fn (x) = 1 x per x 2 [ n1 ; 1) nx per x 2 0; n1 : 14 Si ha: 1 x per x 2 (0; 1) 0 per x = 0: fn (x) ! In questo caso il limite puntuale di una successione di funzioni continue e limitate è una funzione discontinua e illimitata. (Si noti che il limite è …nito in ogni punto). Esempio 1.34 Sappiamo che l’insieme Q\ [0; 1] è numerabile, perciò possiamo 1 elencare i suoi elementi in una successione3 fxn gn=1 . Sia ora: 1 se x = x1 ; x2 ; x3 ; :::; xn 0 altrimenti. fn (x) = Si ha: fn (x) ! 1 se x 2 Q 0 altrimenti. Si noti che ogni funzione fn : [0; 1] ! R è continua tranne che in n punti; in particolare è Riemann integrabile. Invece la funzione limite f [0; 1] ! R è discontinua in tutti i punti e non è Riemann integrabile. Esempio 1.35 Sia fn : R ! R de…nita per n = 1; 2; 3; ::: da 1 1+ n fn (x) = jxj : Si ha: fn (x) ! jxj : 1 Notiamo che ogni fn è derivabile: fn0 (x) = 1 + n1 jxj n sgn(x), in particolare esiste fn0 (0) = 0 e si ha fn 2 C 1 (R), mentre il limite puntuale f non è derivabile in x = 0. Si ha f 2 C 0 (R) n C 1 (R) : La morale di questi esempi è: in generale la convergenza puntuale di una successione di funzioni non permette di a¤ermare che la funzione limite f abbia le “buone proprietà” delle singole fn . Per poter provare dei risultati che permettono di trasferire proprietà delle fn alla f è necessario introdurre e studiare una nozione più forte delle convergenza puntuale: la convergenza uniforme, che ora introduciamo. De…nizione 1.36 (Convergenza uniforme) Sia fn : I ! R per n = 1; 2; 3; ::: 1 con I R o in Rn . Si dice che la successione ffn gn=1 converge uniformemente in I alla funzione f : I ! R se sup jfn (x) x2I f (x)j ! 0 per n ! +1 ossia se 8" > 0 9n0 tale che n n0 =) jfn (x) f (x)j < " 8x 2 I: 3 Non si tratterà di una successione monotona. Ad esempio, i suoi primi termini potrebbero essere: 0; 1; 1=2; 1=3; 2=3; 1=4; 3=4; 1=5; 2=5; ::: 15 A titolo di confronto, notiamo che invece a¤ermare che fn ! f puntualmente in I signi…ca che 8x 2 I; 8" > 0 9n0 tale che n n0 =) jfn (x) f (x)j < ": Dal punto di vista logico, la di¤erenza sta tutta nella posizione del quanti…catore “8x 2 I”; nel caso della convergenza puntuale, a¤ermare che per ogni x e per ogni " esiste n0 tale che..., implicitamente signi…ca che il numero n0 può dipendere anche da x (oltre che da "); nel caso della convergenza uniforme invece l’ordine dei quanti…catori ci dice che n0 non dipende da x. Questo si traduce nel fatto che la distanza tra il gra…co di fn e quello di f diventa uniformemente piccolo; precisamente, tutto il gra…co di fn (x) in I è compreso nella striscia (f (x) "; f (x) + ") non appena n n0 . 1+1=n Esempio 1.37 La successione fn (x) = jxj converge uniformemente in [ 1; 1] a f (x) = jxj. (Questa a¤ ermazione sarà provata in un esempio successivo). Illustriamo il signi…cato geometrico di questa a¤ ermazione. Tracciamo per prima cosa il gra…co di f insieme al gra…co delle prime fn : Ora tracciamo il gra…co di f (x) insieme a quello di f (x) + 0:1 e f (x) 0:1; ottenendo così una striscia in cui devono essere contenuti i gra…ci interi delle 16 funzioni fn ; almeno per n abbastanza grande: f1 non sta nella striscia f2 non sta nella striscia f3 sta nella striscia f4 sta nella striscia, e così via p Esempio 1.38 La successione fn (x) = n jxjsgn(x) converge a 8 < 1 se x 2 (0; 1] 0 se x = 0 f (x) = : 1 se x 2 [ 1; 0): (come già visto nell’Esempio 1.32). Mostriamo che la convergenza non è uniforme. Come sopra, tracciamo per prima cosa il gra…co di f insieme al gra…co delle prime fn : 17 Ora tracciamo il gra…co di f (x) insieme a quello di f (x) + 0:1 e f (x) 0:1, ottenendo così una striscia in cui devono essere contenuti i gra…ci interi delle funzioni fn ; almeno per n abbastanza grande: f1 non sta nella striscia f3 non sta nella striscia f6 non sta nella striscia f10 non sta nella striscia e si capisce che anche aumentando l’indice n non è possibile che il gra…co intero sia contenuto nella striscia. Infatti il gra…co di ogni fn è continuo, perciò non può entrare nei due pezzi di striscia, che sono tra loro discosti. Si noti anche che: fn ! f uniformemente in I () kfn f kC 0 (I) ! 0: In altre parole, la norma C 0 (I) è la norma della convergenza uniforme. Si osservi tuttavia che la nozione di convergenza uniforme si può applicare anche a funzioni discontinue. In altre parole qui stiamo usando la norma di C 0 (I) per calcolare la distanza tra due funzioni qualsiasi de…nite su I (e naturalmente tale distanza non sempre è …nita). Vediamo ora alcuni risultati che mostrano come per una successione di funzioni uniformemente convergente alcune buone proprietà delle fn si trasferiscano al limite f . Teorema 1.39 (Convergenza uniforme e continuità) Siano fn : I ! R, con I Rn , funzioni continue in un certo punto x 2 I per n = 1; 2; 3:::; e supponiamo che fn ! f uniformemente in I. Allora f è continua in x. Se le fn sono continue in tutto I, anche f è continua in I. 18 Dimostrazione. Proviamo che f è continua in x 2 I in cui sono continue tutte le fn . Scriviamo anzitutto jf (x) f (x)j jf (x) fn (x)j + jfn (x) fn (x)j + jfn (x) f (x)j ; con un n che ora sceglieremo. Per " > 0 …ssato, per de…nizione di convergenza uniforme esiste n0 tale che per ogni n n0 si ha jf (x) fn (x)j < ": In particolare allora si ha: jf (x) f (x)j " + jfn0 (x) fn0 (x)j + ": Poiché fn0 è continua in x, …ssato " > 0 esiste > 0 tale che jx jfn0 (x) fn0 (x)j < ": Allora per jx xj < si ha jf (x) f (x)j xj < =) 3"; e f è continua in x. Teorema 1.40 (Convergenza uniforme e limitatezza) Siano fn : I ! R, con I Rn , funzioni limitate per n = 1; 2; 3:::; e supponiamo che fn ! f uniformemente in I. Allora f è limitata in I. Teorema 1.41 (Convergenza uniforme e integrabilità) Siano fn : [a; b] ! R, funzioni limitate e Riemann integrabili per n = 1; 2; 3:::; e supponiamo che fn ! f uniformemente in I. Allora f è (limitata e) Riemann integrabile in [a; b]. Inoltre Z b Z b fn (x) dx ! f (x) dx: a a Dimostrazione. Non dimostriamo la Riemann integrabilità di f (questo potrà essere fatto più facilmente in seguito utilizzando la teoria dell’integrale di Lebesgue), ma mostriamo la convergenza degli integrali. Si ha: Z b Z b Z b fn (x) dx f (x) dx = [fn (x) f (x)] dx a a Z a a b jfn (x) f (x)j dx sup jfn (t) f (t)j (b a) t2(a;b) e per la convergenza uniforme, supt2(a;b) jfn (t) f (t)j ! 0: E’interessante rileggere alla luce di questi teoremi gli esempi presentati in precedenza: negli esempi 1.31 e 1.32 una successione di funzioni continue converge a una funzione discontinua; nell’esempio 1.33 una successione di funzioni limitate converge a una funzione illimitata; nell’esempio 1.34 una successione di funzioni Riemann integrabili converge a una funzione non integrabile. Evidentemente in tutti questi esempi la convergenza non è uniforme. Si invita il lettore a rendersene conto ragionando sul gra…co delle funzioni e sul signi…cato geometrico di convergenza uniforme. Illustriamo ora un criterio che sarà utile a provare la completezza degli spazi di funzioni continue. 19 Teorema 1.42 (Condizione di Cauchy per la convergenza uniforme) Siano fn : I ! R, con I Rn , per n = 1; 2; 3::: e supponiamo che valga la seguente condizione di Cauchy: 8" > 09n0 tale che 8n; m n0 ; 8x 2 I risulta jfn (x) fm (x)j < ": (1.1) Allora la successione fn converge uniformemente in I ad una certa funzione f : I ! R. Viceversa, se fn converge uniformemente in I ad una certa funzione f : I ! R; allora vale la (1.1). L’ipotesi del teorema si chiama appunto condizione di Cauchy per la convergenza uniforme, e si può scrivere anche così: 8" > 09n0 tale che 8n; m n0 ; 8x 2 I risulta kfn fm k1 < ": (1.2) Dimostrazione. Assumiamo che valga la (1.1). Allora per ogni x 2 I …ssato, 1 la successione reale ffn (x)gn=1 risulta di Cauchy. Quindi, per la completezza di R, fn (x) converge a un limite, che chiameremo f (x). Risulta così de…nita una funzione che è limite puntuale delle fn . Dobbiamo provare che è anche limite uniforme. Fissato " > 0 applichiamo l’ipotesi (1.1) e nella disuguaglianza jfn (x) fm (x)j < " passiamo al limite per m ! 1; poiché fm (x) ! f (x), per il teorema di permanenza del segno si ha: jfn (x) f (x)j " 8x 2 I: Quindi …ssato " > 0 esiste n0 tale che per ogni n n0 risulta jfn (x) f (x)j < " per ogni x 2 I, perciò fn ! f uniformemente, che è la tesi. Viceversa, se la successione converge uniformemente, cioè converge nella norma k k1 ; allora è di Cauchy in norma k k1 (stessa dimostrazione vista per provare che in uno spazio metrico una successione convergente è di Cauchy), quindi vale la (1.1). Possiamo ora provare il primo risultato fondamentale di completezza di uno spazio di funzioni: Teorema 1.43 Sia K Rn un insieme chiuso e limitato. Allora lo spazio 0 vettoriale normato C (K) (delle funzioni f : K ! R continue, con la norma k kC 0 (K) ) è completo, cioè è uno spazio di Banach. Dimostrazione. Ricordiamo anzitutto che l’ipotesi K chiuso e limitato serve a garantire che le funzioni in C 0 (K) siano limitate (per il teorema di Weierstrass) e quindi la loro norma k kC 0 (K) sia …nita. 1 Sia ffn gn=1 C 0 (K) una successione di Cauchy in C 0 (K) , e proviamo 0 che converge in C (K). Dire che è di Cauchy nello spazio vettoriale normato C 0 (K) signi…ca dire che vale la (1.2), quindi la (1.1); perciò per il Teorema 1 1.42 ffn gn=1 converge uniformemente, cioè in norma k kC 0 (K) , a una certa f . D’altro canto, essendo limite uniforme di funzioni continue, per il Teorema 1.39 anche f 2 C 0 (K). Quindi fn ! f in C 0 (K), e C 0 (K) è completo. 20 1.2.2 Successioni di funzioni e derivazione Vorremmo ora dimostrare che analoghi spazi di funzioni derivabili sono completi. Ragioniamo sullo spazio C 1 [a; b], che si può vedere come sottospazio vettoriale di C 0 [a; b]. Sappiamo che un sottoinsieme chiuso di uno spazio metrico completo è completo, quindi se mettiamo in C 1 [a; b] la norma k kC 0 [a;b] possiamo vedere C 1 [a; b] ; k kC 0 [a;b] come sottoinsieme dello spazio metrico completo C 0 [a; b] ; k kC 0 [a;b] . Se questo risulta chiuso, allora è completo. Non è così però, come mostra il prossimo 1 1+ n Esempio 1.44 Sia fn (x) = jxj 1; 2; 3; :::; con fn0 (x) = 1+ 1 n in [ 1; 1] : Si ha fn 2 C 1 [ 1; 1] per n = 1 jxj n sgn (x) per x 6= 0; fn0 (0) = 0: Risulta: fn (x) ! f (x) = jxj per x ! 1. Si veri…ca inoltre che questa convergenza è uniforme, infatti: max jfn (x) f (x)j = per simmetria x2[ 1;1] = max x2[0;1] Ora cerchiamo il massimo di g (x) = x g 0 (x) = 1 1+ 1 1 + n1 x max g (x) = g x2[0;1] = 1 n 1 x1+ n . 0 per n 1 1 + n1 1 1 + n1 1 xn 1 x1+ n : x n ! 1 = n 1 + n1 ! 1 n 1 + n1 n 1 1 1+ 1 n ! 1 ! 0: en Pertanto fn ! f uniformemente in C 0 [ 1; 1], ossia fn ! f in norma C 0 [ 1; 1] : Tuttavia il limite f non appartiene a C 1 [ 1; 1] (f (x) = jxj non è derivabile in 0), quindi C 1 [ 1; 1] non è un sottoinsieme chiuso di C 0 [ 1; 1]. Inoltre: poiché fn ! f in norma C 0 [ 1; 1] ; fn è di Cauchy in norma C 0 [ 1; 1] e dunque è di Cauchy anche in C 1 [ 1; 1] ; k kC 0 [ 1;1] , ma non converge in C 1 [ 1; 1] perché f non sta in questo spazio. Pertanto lo spazio completo. 21 C 1 [ 1; 1] ; k kC 0 [ 1;1] non è Si presti attenzione al signi…cato dell’esempio precedente, che mostra due cose distinte: 1. Lo spazio vettoriale normato C 1 [ 1; 1] ; k kC 0 [ 1;1] non è completo. 2. Lo spazio C 1 [ 1; 1] ; k kC 0 [ , visto come sottoinsieme dello spazio 1;1] metrico C 0 [ 1; 1] ; k kC 0 [ 1;1] , non è chiuso. La seconda cosa è in un certo senso la giusti…cazione intuitiva della prima. Una successione di Cauchy in C 1 [ 1; 1] ; k kC 0 [ 1;1] è anche di Cauchy in C 0 [ 1; 1] ; k kC 0 [ 1;1] , pertanto in questo secondo spazio converge per- ché questo spazio è completo; il limite sta in C 0 [ 1; 1] ma non necessariamente in C 1 [ 1; 1]; in quest’ultimo caso abbiamo una successione di Cauchy in C 1 [ 1; 1] ; k kC 0 [ 1;1] ma non convergente in questo spazio. All’origine di questo problema sta il fatto che stiamo mettendo in C 1 [ 1; 1] la norma sbagliata: quella k kC 0 [ 1;1] , che dà un controllo sulla f ma non su f 0 . L’idea è che se vogliamo sperare che uno spazio vettoriale normato di funzioni sia completo, la norma deve controllare le proprietà importanti della funzione che determinano l’appartenenza allo spazio stesso: se stiamo studiando uno spazio di funzioni derivabili, a¢ nché sia completo sarà necessario mettere una norma che controlli anche la derivata; se studiamo uno spazio di funzioni integrabili, a¢ nché sia completo sarà necessario mettere una norma che controlli l’integrale, e così via. Facciamo anche la seguente ulteriore osservazione. Nell’esempio appena considerato, fn ! f uniformemente, ma fn0 (x) = 1+ 1 n 1 jxj n sgn (x) ! sgn (x) (per x 6= 0), e questa convergenza non è certamente uniforme, dal momento che le fn0 sono continue mentre il loro limite è discontinuo. Questo suggerisce che per conservare la derivabilità del limite della successione occorra richiedere la convergenza uniforme delle derivate. E’quanto a¤erma il prossimo teorema: Teorema 1.45 (Convergenza uniforme e derivabilità) Sia fn : [a; b] ! R, fn 2 C 1 [a; b] e supponiamo che: 1. La successione fn0 converge uniformemente in [a; b] a una certa funzione g. 2. La successione fn converge puntualmente in [a; b] a una certa funzione f . Allora: La successione fn converge uniformemente in [a; b] a f 2 C 1 [a; b], e f 0 = g: Schematicamente: se ffn g converge puntualmente e ffn0 g converge uniformemente, allora lim fn n!1 0 = lim fn0 : n!1 22 Dimostrazione. Poiché fn0 ! g uniformemente in [a; b] e le fn0 sono continue, per i teoremi già visti la g è continua e Z x Z x 0 fn (t) dt ! g (t) dt 8x 2 (a; b) a a (se la convergenza è uniforme in [a; b], a maggior ragione lo è in [a; x] per x 2 (a; b)), ossia (per il teorema fondamentale del calcolo integrale) Z x g (t) dt = lim [fn (x) fn (a)] = f (x) f (a) ; n!1 a poiché fn ! f puntualmente. Ma essendo g continua, la funzione integrale Z x g (t) dt a 1 è C (a; b) e vale d (f (x) dx d f (a)) = dx Z x g (t) dt = g (x) a ossia f 0 = g. In particolare, f 2 C 1 [a; b]. In…ne, la convergenza di fn a f è uniforme perché fn (x) f (x) = fn (x) fn (a) + fn (a) f (a) + f (a) Z x = [fn0 (t) f 0 (t)] dt + fn (a) f (a) ; f (x) a quindi jfn (x) f (x)j sup jfn0 (t) f 0 (t)j (x t2(a;b) a) + jfn (a) f (a)j ; e il secondo membro è minore di " > 0 pre…ssato per n abbastanza grande (indipendentemente da x, che a secondo membro non compare). Dal teorema precedente segue il prossimo risultato fondamentale: Teorema 1.46 Lo spazio C 1 [a; b] ; con la norma kf kC 1 [a;b] = kf kC 0 [a;b] + kf 0 kC 0 [a;b] è di Banach. 1 Dimostrazione. Sia ffn gn=1 una successione di Cauchy in C 1 [a; b] : Per 1 1 de…nizione di norma kf kC 1 [a;b] ; questo signi…ca che sia ffn gn=1 che ffn0 gn=1 soddisfano la condizione di Cauchy per la convergenza uniforme; pertanto esistono f; g 2 C 0 [a; b] tali che fn ! f uniformemente e fn0 ! g uniformemente in [a; b] : Per il teorema precedente, questo implica che f 2 C 1 [a; b] e f 0 = g; dunque kfn f kC 0 [a;b] ! 0 e kfn0 f 0 kC 0 [a;b] ! 0; 23 ossia fn ! f in C 1 [a; b]. Questi risultati si possono generalizzare a funzioni di classe C k anche in più variabili. De…niamo quindi con precisione gli spazi vettoriali normati classici di funzioni derivabili: De…nizione 1.47 (Spazi C k ) Sia Rn un aperto limitato. Ricordiamo anzitutto la scrittura a multiindice per le derivate parziali di qualsiasi ordine di una funzione reale di n variabili: = ( 1 ; 2 ; :::; n ) ; dove i sono interi j j = 1 + 2 + ::: + n ; allora @ f (x) = @ 1 x1 0 e poniamo @j jf (x) : @x22 :::@xnn Per k = 1; 2; 3; ::: de…niamo: Ck = f: ! R : f 2 C0 e @ f 2 C0 Poniamo kf kC k ( ) = kf kC 0 ( ) + k X X j=1 j j=j 8 con j j k : k@ f kC 0 ( ) : Osservazione 1.48 (Perché ?) Si noti che mentre lo spazio C 0 (K) è de…nito con K sottoinsieme chiuso e limitato di Rn , perché in base al teorema di Weierstrass questo è su¢ ciente a garantire la …nitezza della norma kf kC 0 (K) ; per calcolare le derivate parziali di f abbiamo bisogno di essere in un insieme aperto; partiamo perciò da un insieme aperto e limitato , la cui chiusura è un insieme chiuso e limitato; f si suppone de…nita e continua in ; le derivate parziali di f esistono in e si suppone si possano prolungare con continuità …no al bordo di ; a questo modo f e le @ f sono continue sul chiuso e limitato ; quindi kf kC k ( ) è …nita. Valgono i seguenti risultati: Teorema 1.49 Gli spazi C k sopra de…niti sono di Banach. Teorema 1.50 (Convergenza uniforme e derivate parziali) Sia fk : ! R, per k = 1; 2; 3; :::; con Rn aperto, supponiamo che per ogni k sia @fk 0 fk ; @xi 2 C per un certo i = 1; 2; :::; n; e supponiamo che: k 1. La successione @f a una certa funzione g. @xi converge uniformemente in 2. La successione fk converge in almeno un punto x0 2 . Allora: La successione fk converge uniformemente in a una certa f 2 C 0 ed @f esiste @x = g: i 24 1.2.3 Serie di funzioni: convergenza puntuale e uniforme La nozione di convergenza uniforme e i teoremi precedenti si possono interpretare in particolare per le serie di funzioni. De…nizione 1.51 (Convergenza di una serie di funzioni) Sia fn : I ! R per n = 1; 2; 3; ::: con I R o in Rn . Si dice che la serie di funzioni 1 X fn (x) n=1 converge in x0 2 I, oppure converge puntualmente in I, oppure converge uniformemente in I se la successione delle somme parziali sn (x) = n X fk (x) k=1 converge in x0 2 I, oppure converge puntualmente in I, oppure converge uniformemente in I, rispettivamente. Si dice che la serie di funzioni 1 X fn (x) n=1 converge assolutamente (in un punto x0 o in un insieme I) se la serie di funzioni 1 X n=1 jfn (x)j converge (in x0 o in I rispettivamente), cioè se la successione delle somme parziali n X Sn (x) = jfk (x)j : k=1 Come per le serie numeriche, se una serie di funzioni converge assolutamente (in x0 o in I) allora converge puntualmente (in x0 o in I). Come per le successioni di funzioni, se una serie converge uniformemente allora converge puntualmente. Una condizione su¢ ciente molto utile talvolta a stabilire la convergenza uniforme di una serie è la convergenza totale: De…nizione 1.52 (Convergenza totale di una serie di funzioni) Sia fn : I ! R per n = 1; 2; 3; ::: con I R o in Rn . Si dice che la serie di funzioni 1 X fn (x) n=1 25 1 converge totalmente in I se esiste una successione fan gn=1 di costanti positive, tale che: 1) jfn (x)j an per ogni n; per ogni x 2 I; 2) 1 X n=1 Esempio 1.53 La serie an < 1: 1 X sin (nx) n2 n=1 converge totalmente in R perché sin (nx) n2 e 1 n2 1 X 1 < 1: n2 n=1 La serie 1 X sin (nx) n n=1 non converge totalmente in R in quanto la più piccola successione numerica an per cui sia vero che sin (nx) n an per ogni x 2 R è an = 1=n (basta porre x = =2n nella disuguaglianza P1 canto n=1 n1 diverge. sin(nx) n an ) e d’altro Si noti che si parla di convergenza totale o di convergenza uniforme in un insieme I (non in un singolo punto x0 ). Vale la Proposizione 1.54 (Criterio della convergenza totale) Se una serie di funzioni converge totalmente in un insieme I, allora converge assolutamente e uniformemente in I. Possiamo ora applicare alle serie di funzioni i teoremi visti per le successioni di funzioni: è su¢ ciente vedere la somma di una serie come limite della successione delle somme parziali per ottenere immediatamente i seguenti teoremi. 26 Teorema 1.55 (Convergenza uniforme e continuità) Siano fn : I ! R, con I Rn , funzioni continue per n = 1; 2; 3:::; e supponiamo che la serie 1 X fn (x) n=1 converga uniformemente in I, con somma f (x). Allora f è continua in I. Teorema 1.56 (Convergenza uniforme e integrabilità) Siano fn : [a; b] ! R, funzioni limitate e Riemann integrabili per n = 1; 2; 3:::; e supponiamo che la serie 1 X fn (x) n=1 converga uniformemente in I, con somma f (x). Allora f è (limitata e) Riemann integrabile in [a; b]. Teorema 1.57 (Convergenza uniforme e derivate parziali) Sia fk : ! R, per k = 1; 2; 3; :::; con Rn aperto, supponiamo che per ogni k sia @fk 0 fk ; @xi 2 C per un certo i = 1; 2; :::; n; e supponiamo che: P1 @fk 1. La serie k=1 @xi converge uniformemente in a una certa funzione g. P1 2. La serie k=1 fk converge in almeno un punto x0 2 . Allora: P 1 ed La serie k=1 fk converge uniformemente in a una certa f 2 C 0 @f esiste @xi = g; continua. 3. Se questo discorso vale ogni i = 1; 2; :::; n; si deduce che f 2 C 1 ( ). Schematicamente: P1 P1 @fk se k=1 fk converge puntualmente e k=1 @xi converge uniformemente, allora ! 1 1 X X @ @fk fk = : @xi @xi k=1 k=1 Esempio 1.58 Consideriamo la serie di funzioni 1 X e n=1 nt sin (nx) n2 de…nita per x 2 [0; ] ; t 2 [0; 1]. Studiamo la continuità e derivabilità di questa serie (cioè: della funzione somma di questa serie, dopo che avremo veri…cato che la serie e¤ ettivamente converge). Le funzioni e nt sin (nx) fn (x; t) = n2 27 sono continue e derivabili in…nite volte nell’insieme Q = [0; ] [0; 1]. Per studiare la convergenza della serie applichiamo il criterio della convergenza totale: e nt sin (nx) 1 per ogni (x; t) 2 [0; ] [0; 1] : 2 n n2 P 1 Poiché n2 converge, la serie di partenza converge totalmente e quindi uniformemente in Q, e poiché le fn sono continue, la somma della serie u (x; t) = 1 X e nt n=1 sin (nx) n2 è una funzione continua in Q (Teorema 1.55). Vediamo se u è derivabile. Consideriamo le serie delle derivate parziali: 1 X @ @x n=1 1 X @ @t n=1 e nt e nt sin (nx) n2 = sin (nx) n2 = 1 X e n=1 1 X nt e cos (nx) n nt n=1 sin (nx) : n In base al teorema visto, potremmo garantire che u è derivabile e che la serie si può derivare termine a termine se sapessimo che queste serie convergono uniformemente. Entrambe le serie però non convergono totalmente in Q; inoltre, la prima serie per x = 0; t = 0 diverge addirittura; la seconda serie per t = 0 diP1 che converge puntualmente per il criterio di Dirichlet4 ma venta n=1 sin(nx) n sembra improbabile che converga uniformemente. Quindi non ci sono speranze di provare che u sia derivabile in tutto l’insieme Q. La situazione cambia drasticamente se ci mettiamo nel sottoinsieme Q = [0; ] [ ; 1] ; cioè se studiamo u per t discosto da zero. Infatti in questo caso l’esponenziale e nt e n aiuta molto la convergenza della serie. Possiamo scrivere che per (x; t) 2 Q si ha: Pe e nt e nt cos (nx) n e sin (nx) n e n n n n n converge, le serie delle derivate parziali prime rispetto a x e e poiché n rispetto a t convergono totalmente, e quindi uniformemente, in Q . Ne segue che, in Q , la u è derivabile, con 1 X @u e (x; t) = @x n=1 4 v. 1 X @u (x; t) = @t n=1 [An2], Proposizione 7.1. p.369. 28 nt e cos (nx) n nt sin (nx) : n Il discorso si può iterare a ogni ordine di derivata. Ad esempio, 1 X @2 @x2 n=1 1 X @2 @x3 n=1 e e nt nt sin (nx) n2 = sin (nx) n2 = 1 X n=1 1 X e ne nt sin (nx) nt cos (nx) n=1 convergono ancora totalmente in Q . Concludiamo che u (x; t) è in…nitamente derivabile in Q . E poiché questo vale per ogni > 0, in realtà u è in…nitamente derivabile nella regione x 2 [0; ] ; t 2 (0; 1] (anche se non in tutto Q). La u è continua …no a t = 0, ma regolare solo per t > 0. Si osservi la diversa logica: la serie delle derivate converge totalmente in Q (per ogni > 0) ma non in Q; la u è derivabile in Q (per ogni > 0) e quindi è derivabile in Q. Il diverso modo di ragionare si deve al fatto che il concetto di convergenza totale è globale, mentre quello di derivabilità è puntuale. Esempio 1.59 Consideriamo la serie di funzioni 1 X sin (nx) cos (nt) n3 n=1 de…nita per (x; t) 2 Q = [0; 2 ] [0; 2 ]. Studiamo la continuità e derivabilità di questa serie. La disuguaglianza sin (nx) cos (nt) 1 3 n n3 mostra che la serie converge totalmente in Q, perciò essendo le fn (x; t) continue, anche la funzione 1 X sin (nx) cos (nt) u (x; t) = n3 n=1 è continua. Le serie delle derivate parziali prime sono: 1 X @ @x n=1 1 X @ @t n=1 1 X cos (nx) cos (nt) = n2 n=1 sin (nx) cos (nt) n3 sin (nx) cos (nt) n3 = 1 X n=1 29 sin (nx) sin (nt) : n2 e convergono totalmente, per analoghe disuguaglianze. Quindi u 2 C 1 (Q) ; con 1 X @u cos (nx) cos (nt) (x; t) = @x n2 n=1 1 X @u (x; t) = @t n=1 sin (nx) sin (nt) : n2 Provando a iterare il discorso, però, ci dobbiamo fermare. Ad esempio: 1 X @ @x n=1 cos (nx) cos (nt) n2 = 1 X n=1 sin (nx) cos (nt) ; n e l’ultima serie non converge totalmente. Questa volta la situazione non migliora mettendosi in un sottoinsieme di Q. Dobbiamo concludere che u 2 C 1 (Q) ma non è possibile a¤ ermare che sia derivabile due volte in Q. (Si noti che queste argomentazioni non permettono di concludere rigorosamente che una certa derivata non esiste; semplicemente, non c’è un modo semplice per a¤ ermare che esiste e verosimilmente non esiste, almeno in qualche punto). 1.3 Operatori lineari continui Diamo qualche cenno, poco più che una terminologia, su questo importante concetto di analisi funzionale. De…nizione 1.60 Siano X; Y due spazi vettoriali normati sul campo K (= R o C). Una funzione T : X ! Y si dice operatore lineare se T ( x + y) = T (x) + T (y) 8x; y 2 X; 8 ; 2 K. Solitamente quando un operatore è lineare si omette la parentesi nell’argomento, e si scrive T x invece che T (x) (ma naturalmente bisogna comunque scrivere T (x + y) se l’argomento è una somma!). Teorema 1.61 Siano X; Y due spazi vettoriali normati e T : X ! Y un operatore lineare. Sono equivalenti le seguenti tre condizioni: (a) T (vista come funzione tra due spazi metrici) è continua in 0. (b) T è continua in ogni punto. (c) vale la seguente condizione di limitatezza: kT xkY < 1: x2X;x6=0 kxkX sup De…nizione 1.62 Un operatore lineare T : X ! Y tra due spazi vettoriali normati X; Y si dice continuo se vale una delle tre condizioni equivalenti espresse dal teorema precedente. In tal caso si de…nisce norma dell’operatore il numero kT k = sup x2X;x6=0 30 kT xkY . kxkX Risulta, per de…nizione kT xkY kT k kxkX 8x 2 X: Se T : X ! Y è un operatore lineare e si mostra che esiste una costante K > 0 per cui vale kT xkY K kxkX 8x 2 X; (1.3) allora T è continuo, e kT k K. Solitamente è così che si dimostra la continuità di un operatore lineare, senza necessariamente riuscire a determinare la norma di T , che è la migliore (cioè la minima) costante per cui vale la (1.3). Esempio 1.63 Sia T : C 2 [a; b] ! C 0 [a; b] T f (x) = (x) f 00 (x) + (x) f 0 (x) + (x) f (x) con ; ; 2 C 0 [a; b] : L’operatore di¤erenziale T è (ovviamente lineare e) continuo perché kT f kC 0 [a;b] = k f 00 + f 0 + f kC 0 [a;b] k f 00 kC 0 [a;b] + k f 0 kC 0 [a;b] + k f kC 0 [a;b] k kC 0 [a;b] kf 00 kC 0 [a;b] + k kC 0 [a;b] kf 0 kC 0 [a;b] + k kC 0 [a;b] kf kC 0 [a;b] o n k kC 0 [a;b] + k kC 0 [a;b] + k kC 0 [a;b] kf kC 2 [a;b] c kf kC 2 [a;b] : Esempi di operatori lineari continui di altro tipo (ad esempio, espressi analiticamente da integrali) si potranno fare più avanti. Si veri…ca facilmente che ogni combinazione lineare di operatori lineari continui tra X e Y è a sua volta un operatore lineare continuo. Si può considerare quindi lo spazio L (X; Y ) di tutti gli operatori lineari continui tra gli spazi vettoriali normati X e Y , che risulta uno spazio vettoriale. Anzi, la norma operatoriale kT xkY kT kL(X;Y ) = sup x2X;x6=0 kxkX risulta e¤ettivamente una norma in questo spazio, quindi: L (X; Y ) è uno spazio vettoriale normato. Vale il seguente teorema, che ci limitiamo a enunciare: Teorema 1.64 Siano X; Y spazio vettoriali normati. Se Y è completo anche anche L (X; Y ) è completo. 31 1.4 1.4.1 L’integrale di Lebesgue Motivazione A partire dagli inizi del 20 secolo la teoria classica dell’integrazione, di Riemann, è stata sostanzialmente sostituita da una nuova teoria, dovuta a Lebesgue, estremamente più generale, ‡essibile e potente, che ha rivoluzionato l’analisi matematica. Noi non ci occuperemo di questioni da cui emerga …no in fondo l’importanza di questa diversa impostazione, ma non possiamo comunque farne a meno, per molti motivi. Vediamo molto sinteticamente alcune questioni5 rispetto alle quali l’integrale di Riemann è inadeguato ed è auspicabile avere un concetto diverso di integrale. 1. Vorremmo un concetto di integrale in cui la possibilità che la funzione integranda sia illimitata e/o che l’insieme di integrazione sia illimitato costituisca la regola e non l’eccezione (come è nella teoria di Riemann, in cui l’integrale viene “generalizzato” solo in un secondo momento per includere queste situazioni). 2. Vorremmo un concetto di integrale in cui, sia in una variabile che in più variabili, l’insieme di integrazione possa essere di tipo molto generale, anche molto irregolare. 3. Vorremmo un concetto di integrale in cui ci l’insieme delle funzioni integrabili sia “stabile” rispetto a un gran numero di operazioni, in particolare rispetto al passaggio al limite di successione. (Per l’integrale di Riemann, invece, una successione di funzioni integrabili può convergere a un limite non integrabile). Questo signi…cherà anche che dovranno essere integrabili anche funzioni “molto discontinue”. 4. Vorremmo un concetto di integrale con cui l’integrazione di successioni e serie di funzioni obbedisca a regole semplici, cioè si possa dimostrare che lo scambio tra limite e integrale è lecito sotto ipotesi piuttosto generali e di facile veri…ca. (Nella teoria di Riemann l’unico criterio semplice di integrazione per successioni richiede la convergenza uniforme, che è un’ipotesi piuttosto forte). 5. Vorremmo che lo spazio (vettoriale) delle funzioni integrabili su un certo dominio, munito della norma dell’integrale, fosse uno spazio di Banach (cioè fosse completo), cosa che non accade per l’integrale di Riemann. Ottenere un integrale con proprietà migliori (dai punti di vista spiegati) signi…ca ovviamente cambiare la de…nizione di integrale, e più precisamente cambiarlo in un senso che renda meno restrittiva la richiesta di integrabilità. Ricordiamo come è stato de…nito l’integrale di Riemann come limite di somme: lim sn = lim n!1 n!1 n X b k=1 a n f (n) k dove al passo n-esimo l’intervallo [a; b] è stato suddiviso in n intervalli uguali (n) (n) (n) (n) mediante i punti a = x0 ; x1 ; x2 ; :::; xn = b e ad ogni passo si sono scelti, 5 Ci limiteremo a segnalare questioni che siano rilevanti per il seguito del nostro discorso, senza con ciò voler a¤ermare che queste siano le motivazioni più importanti per introdurre l’integrale di Lebesgue. 32 h i (n) (n) (n) arbitrariamente, gli n punti k 2 xk 1 ; xk , k = 1; 2; :::; n. La funzione f si dice Riemann-integrabile se il limite esiste …nito e non dipende da come si sono (n) scelti, ad ogni passo, i punti k . Si capisce dalla de…nizione che ciò che “mette a rischio”l’integrabilità è il fatto che f abbia numerosi punti di discontinuità, e quindi nel corso della costruzione succeda “tanteh volte” chei scegliendo il punto (n) (n) (n) in modi diversi all’interno dell’intervallino xk 1 ; xk si ottengano delle k variazioni importanti nel valore di sn . Ad esempio, la funzione di Dirichlet 1 se x è razionale 0 se x è irrazionale d (x) = non è integrabile perché, ad ogni passo della costruzione iterativa, è possibile (n) scegliere i punti k tutti razionali, e allora sn = 1, o tutti irrazionali, e allora sn = 0; perciò certamente successioni di Cauchy-Riemann diverse hanno limiti diversi. Se vogliamo dare una de…nizione di integrale diversa, che risulti meno restrittiva, dobbiamo trovare il modo di neutralizzare, nell’algoritmo di calcolo dell’integrale, gli e¤ etti di instabilità dovuti alle (eventuali) grandi oscillazioni o discontinuità della funzione. Un’idea di questo tipo si trova nella nozione di integrale introdotta da Henri Lebesgue nel 1902 nella sua tesi di dottorato presentata alla Facoltà di Scienze di Parigi. L’idea, apparentemente banale, è: invece di fare una costruzione iterativa suddividendo l’intervallo [a; b] sull’asse x in parti uguali, facciamo una costruzione iterativa suddividendo in parti uguali, sull’asse y, un intervallo che contenga l’insieme dei valori assunti dalla funzione (che per il momento supponiamo limitata). Ad esempio, se la funzione ha valori in [0; 1], al passo n-esimo suddivideremo [0; 1] in parti uguali e considereremo gli insiemi (n) Ek = x 2 [a; b] : k 1 n f (x) < k n , con k = 1; 2; :::; n: Ovviamente un’approssimazione, per difetto o per eccesso, dell’area sotto il gra…co di f si ottiene, rispettivamente, con le somme: sn = s+ n = n X k=1 n X (n) Ek (n) Ek k=1 k 1 n ; k ; n dove jEk j indica la misura dell’insieme Ek , cioè se ad es. è un intervallo la sua lunghezza, se è l’unione di più intervalli la somma delle lunghezze degli itervalli, 33 e così via6 . Una somma di Riemann di passo Una somma di Lebesgue di passo 3 3 della stessa funzione Ciò che dimostra quanto sia buona quest’idea, e quanto sia diversa da quella dell’integrale di Riemann (non ostante l’apparente simmetria: suddividiamo l’asse x / suddividiamo l’asse y) è che per come sono costruite le somme risulta 6 Come vedremo, buona parte del problema da a¤rontare sta in questo semplicistico “e così via”. 34 sempre 0 s+ n sn = n X (n) Ek k=1 1 1 = n n per cui lo scarto tra le approssimazioni per eccesso e per difetto tende necessariamente a zero! Signi…ca che questo algoritmo di approssimazione restituisce “sempre”un limite. Apparentemente, ogni funzione risulta integrabile a questo modo. In realtà, abbiamo in un certo senso spostato il problema: data una (n) funzione f e interi n; k qualsiasi, come sarà fatto l’insieme Ek ? Se f ha molte oscillazioni e discontinuità potrà essere un insieme molto diverso da un intervallo o l’unione di un numero …nito di intervalli. Ad esempio, per la funzione di (n) Dirichlet tra gli insiemi Ek ci saranno fx 2 [0; 1] : x 2 Qg ; fx 2 [0; 1] : x 2 = Qg , che non sono esprimibili come unioni …nite di intervalli. Dunque: per costruire una teoria dell’integrazione di questo nuovo tipo dobbiamo prima impegnarci a costruire una “teoria della misura” che sia in grado di assegnare una “lunghezza” anche a sottoinsiemi molto irregolari della retta. 1.4.2 La misura di Lebesgue Procedendo ora in modo molto schematico, mostriamo come si arriva alla de…nizione di questo nuovo tipo di integrale. Come anticipato, occorre prima de…nire una nozione di misura, e questo richiede un po’di lavoro tecnico. De…nizione 1.65 Sia un insieme. Si dice -algebra (su ) una famiglia M di sottoinsiemi di (cioè7 M P ( )) tale che: 2 M; E 2 M =) E c 2 M (dove E c indica il complementareSdi E in ); 1 1 se fEn gn=1 è una successione di insiemi di M, allora n=1 En 2 M. Gli insiemi di M si dicono insiemi misurabili, ( ; M) si dice spazio misurabile. Ogni insieme ha due -algebre banali: la più piccola è quella costituita solo da e ;; la più grande è tutto P ( ). Dalla de…nizione segue facilmente la: Proposizione 1.66 Se M è una -algebra, M è chiusa anche rispetto alle seguenti operazioni insiemistiche: unione …nita, intersezione …nita o numerabile; di¤ erenza insiemistica8 . 7 dove P ( ) indica l’insieme delle parti di compresi stesso e l’insieme vuoto ; 8 La di¤erenza insiemistica è de…nita così: ; cioè l’insieme di tutti i sottoinsiemi di A n B = A \ Bc: 35 ; De…nizione 1.67 Sia ( ; M) uno spazio misurabile. Si dice misura (su questo spazio) una qualunque funzione (d’insieme) : M ! [0; +1] 1 che sia numerabilmente additiva, ossia tale che per ogni successione fEn gn=1 di insiemi di M a due a due disgiunti, si abbia ! 1 1 [ X En = En . n=1 n=1 (Dove ambo i membri possono essere …niti o in…niti). In tal caso ( ; M; ) si dice spazio di misura. Notiamo esplicitamente che la scrittura : M ! [0; +1] signi…ca che la misura di un insieme può anche essere 0 o +1 (e questo accade anche per insiemi non banali, ad esempio in R la lunghezza di un punto è 0, la lunghezza di una semiretta è +1). Da questa sola richiesta di numerabile additività seguono in realtà molte altre proprietà della misura: Teorema 1.68 Sia ( ; M; ) uno spazio di misura. Allora: 1. (;) = 0; 2. è …nitamente additiva, cioè per ogni famiglia …nita E1 ; E2 ; :::; En di insiemi di M a due a due disgiunti si ha ! n n [ X Ei = Ei ; i=1 i=1 3. è monotona, cioè 8A; B 2 M, A B =) (A) (B) ; 4. è condizionatamente sottrattiva, cioè 8A; B 2 M, A B e (B) < 1 =) (B n A) = (B) (A) ; 1 5. è continua da sotto: se fEn gn=1 S1è una successione di insiemi di M tale che En % E (cioè: En En+1 8n e n=1 En = E) allora (En ) ! (E) ; 1 6. è condizionatamente continua da sopra: se fEn gn=1 èTuna successione 1 di insiemi di M tale che En & E (cioè: En En+1 8n e n=1 En = E) e inoltre (E1 ) < 1, allora (En ) ! (E) ; 1 7. è numerabilmente subadditiva, cioè se fEn gn=1 è una successione di insiemi di M ( non necessariamente a due a due disgiunti), allora ! 1 1 [ X En En . n=1 n=1 Nel seguito, come vedremo, saranno molto importanti gli insiemi di misura nulla. Notiamo che se E; E0 2 M, E0 E e (E) = 0, allora (per la monotonia della misura) anche (E0 ) = 0. Talvolta siamo in una situazione leggermente 36 diversa: abbiamo un insieme E 2 M tale che (E) = 0; e un altro insieme E0 E (di cui a priori non sappiamo che sia misurabile); ci piacerebbe poter comunque concludere che (E0 ) = 0 (cioè: che E0 2 M, e quindi (E0 ) = 0). Questo non è vero per tutte le misure, ma solo per quelle per cui è noto che i sottoinsiemi degli insiemi di misura nulla sono tutti misurabili (e quindi di misura nulla). De…nizione 1.69 Sia ( ; M; ) uno spazio di misura. Si dice che la misura è completa se i sottoinsiemi degli insiemi di misura nulla sono tutti misurabili (e quindi hanno misura nulla). Esempi di misure. Non è così semplice costruire misure signi…cative. Cominciamo a introdurre un paio di esempi semplici (ma comunque importanti). La misura del conteggio. Sia un insieme qualsiasi, M = P ( ) e : M ! [0; +1] tale che (A) = numero di elementi di A, se A è …nito; 1 altrimenti. Si veri…ca che è una misura detta misura del conteggio. Come vedremo, l’integrale rispetto a questa misura risulterà una serie numerica, quindi la teoria astratta dell’integrazione assorbirà al suo interno la teoria delle serie numeriche. La misura atomica o di Dirac. Sia un insieme qualsiasi, x0 2 un suo elemento …ssato, e M = P ( ). De…niamo : M ! [0; +1] tale che (A) = 1 se x0 2 A 0 altrimenti. Si veri…ca che è una misura, detta misura di Dirac concentrata in x0 e indicata talvolta col simbolo x0 . Saltando ora a pié pari il lungo percorso costruttivo e dimostrativo che porta alla de…nizione della misura di Lebesgue, enunciamo i punti di arrivo di questo percorso sotto forma di un risultato astratto di esistenza: Teorema 1.70 (Misura di Lebesgue in Rn ) Esiste una -algebra L di sottoinsiemi di Rn , detta -algebra di Lebesgue (o degli insiemi Lebesgue misurabili), ed esiste una misura su L, detta misura di Lebesgue in Rn 9 , con le seguenti proprietà: 1. La -algebra L contiene tutti gli insiemi aperti, gli insiemi chiusi, gli insiemi ottenuti per intersezione o unione di una successione di insiemi aperti o chiusi10 . 9 Anche se “misura di Lebesgue in Rn ” è il modo in cui comunemente si chiama questa misura, notiamo esplicitamente che questa non è de…nita per ogni sottoinsieme di Rn , ma solo per quelli “misurabili”, cioè appartenenti alla -algebra L. 1 0 In pratica, L contiene qualsiasi insieme si riesca a de…nire in modo esplicito, costruttivo. Per mostrare l’esistenza di insiemi non misurabili occorre utilizzare sottili procedimenti non costruttivi. 37 2. La misura di Lebesgue estende la misura elementare, nel senso che data una n-cella, cioè un insieme del tipo: I = [a1 ; b1 ] [a2 ; b2 ] ::: [an ; bn ] ; con ai ; bi 2 R; risulta11 (I) = jb1 a1 j jb2 a2 j ::: jbn an j : 3. La misura di Lebesgue è invariante per traslazioni. 4. La misura di Lebesgue è completa. Detto in parole povere: la misura di Lebesgue consente di misurare quasi tutti gli insiemi di Rn , anche insiemi molto “irregolari”o “complicati”; al tempo stesso, se consideriamo un insieme di cui la geometria elementare insegni a calcolare la misura (cioè il volume se siamo in R3 , l’area se siamo in R2 , la lunghezza se siamo in R, la misura di Lebesgue restituisce lo stesso valore che ci aspetteremmo. Il “guadagno”dell’avere a disposizione la misura di Lebesgue non è solo nel fatto che riusciamo a misurare anche insiemi molto complicati, ma anche che per il fatto di essere una misura, soddisfa tutte le proprietà delle misure (v. teorema 1.68) e inoltre è completa (v. de…nizione 1.69). Esempio 1.71 Per visualizzare meglio come agisce la de…nizione di misura di Lebesgue, facciamo qualche esempio. 1. Poiché la misura di Lebesgue estende la misura elementare, un punto ha misura nulla (in Rn ; qualunque sia n). 2. D’altro canto la misura è numerabilmente additiva perciò, ogni insieme numerabile (è misurabile e) ha misura nulla. 3. In R quanto appena a¤ ermato è particolarmente signi…cativo, perché mostra che Q è un sottoinsieme di R misurabile e di misura nulla, non ostante il fatto che Q sia denso in R. Si capisce che la valutazione di quanto sia “grande” un insieme dal punto di vista della teoria della misura e dal punto di vista della topologia può essere molto diverso. La misurabilità dell’insieme Q è un fatto che deve far ri‡ettere sulla potenza della teoria: utilizzando le nozioni elementari di misura dei segmenti, un insieme come Q sarebbe “intrattabile”. 4. Si ri‡etta sul fatto che, ad esempio, una retta (o una curva regolare) nel piano o nello spazio ha misura nulla, così come un piano (o una super…cie regolare) nello spazio ha misura nulla. Questo si può vedere applicando le proprietà generali delle misure e il fatto che la misura di Lebesgue estenda la misura elementare. A titolo di esempio, mostriamo che una retta, ad esempio l’asse x, ha misura nulla nel piano. Per cominciare sia E il semiasse x 0; y = 0 nel piano, e proviamo che (E) = 0. Possiamo coprire E con l’unione delle 2-celle (cioè rettangoli) così fatte: E 1 [ h [k; k + 1] k=0 " "i ; 2k 2k E" : 1 1 e questo fatto, unito alle proprietà di cui gode per il fatto di essere una misura, implica che per qualsiasi insieme di cui la geometria elementare insegni a calcolare la misura, questa coincide col valore assegnato dalla misura di Lebesgue. 38 Poiché la misura è monotona, sarà (E) (E" ) : Calcoliamo ora (E" ): poiché la misura di Lebsegue di un rettangolo è semplicemente la sua area (cioè la misura elementare) e d’altro canto la misura è numerabilmente additiva, (E" ) = 1 X k=0 [k; k + 1] h X " "i ; k = 1 k 2 2 1 k=0 2" = 4": 2k Perciò (E) < " per ogni " > 0, perciò (E) = 0: Analogamente si prova che il semiasse x 0 ha misura nulla, da cui essendo unione di due insiemi di misura nulla l’asse x ha misura nulla in R2 . Naturalmente, in R l’asse x avrebbe invece misura in…nita. Osservazione 1.72 Esiste una buona misura rispetto a cui tutti gli insiemi sono misurabili? Abbiamo visto che è possibile de…nire una “buona” misura (la misura di Lebesgue, che ha le buone proprietà già ricordate) de…nita su una certa -algebra di sottoinsiemi di Rn che è e¤ ettivamente molto ampia, il che signi…ca che rispetto alla misura di Lebesgue, “quasi tutti” gli insiemi sono misurabili. Chiediamoci se non è possibile fare di meglio: esiste una misura in Rn che, oltre a soddisfare la de…nizione astratta di misura, estenda la misura elementare, sia invariante per traslazioni, e inoltre si possa a¤ ermare che tutti i sottoinsiemi di Rn sono misurabili? (Se fosse così, potremmo anche fare a meno di introdurre la nozione di -algebra). La risposta però è negativa, e questo è un risultato profondo di teoria degli insiemi. Se si vuole una buona teoria della misura, nei sensi già spiegati, non si può scegliere una strada più semplice di quella descritta; in particolare non si può rinunciare al concetto di -algebra. Osservazione 1.73 (Misura di Lebesgue su un insieme ) Abbiamo costruito la misura di Lebesgue su Rn . Naturalmente in molte questioni non consideriamo lo spazio intero, ma un sottoinsieme di Rn , e vorremmo avere una misura sui sottoinsiemi di . Questo passaggio è molto semplice. La restrizione della misura di Lebesgue a un sottoinsieme misurabile di Rn è la stessa misura di Lebesgue, calcolata sui sottoinsiemi misurabili di , che sono tutti e soli gli insiemi del tipo E \ con E sottoinsieme misurabile di Rn . Detto in modo più preciso e generale: Teorema 1.74 (Restrizione di una misura) Sia ( ; M; ) uno spazio di misura astratto (qualsiasi), e sia 0 ; 0 2 M (cioè 0 è un sottoinsieme misurabile di ). Allora: (a) La famiglia di insiemi M0 = fE0 = E \ 0 : E 2 Mg è una -algebra di sottoinsiemi di 0 . (b) La funzione d’insieme ristretta a M0 è una misura su ( 0 ; M0 ), quindi dà luogo ad un nuovo spazio di misura ( 0 ; M0 ; 0 ) dove 0 = =M0 è detta restrizione della misura a 0 . 39 La costruzione precedente è signi…cativa quando ( 0 ) > 0; altrimenti la misura restrizione è identicamente nulla. In particolare, in Rn , dato un qualsiasi sottoinsieme misurabile 0 di misura positiva, parleremo della misura di Lebesgue in 0 per indicare la restrizione di a 0. 1.4.3 Integrale di Lebesgue Torniamo ora alla teoria generale astratta della misura. Supponiamo di avere uno spazio di misura qualsiasi ( ; M; ) e supponiamo inoltre che la misura sia completa (come accade per la misura di Lebsegue); vogliamo de…nire l’integrale rispetto a questa misura. Ricordando quanto spiegato nell’introduzione, ci attende ancora un passo preliminare, quello di de…nire cosa sono le funzioni misurabili, che saranno quelle per cui la costruzione dell’integrale di Lebesgue è possibile. Cominciamo dal seguente semplice Teorema 1.75 Sia ( ; M) uno spazio misurabile qualsiasi e sia f : Sono equivalenti le seguenti 4 condizioni: 1. fx 2 : f (x) > ag 2 M per ogni a 2 R; 2. fx 2 : f (x) ag 2 M per ogni a 2 R; 3. fx 2 : f (x) < ag 2 M per ogni a 2 R; 4. fx 2 : f (x) ag 2 M per ogni a 2 R. ! R. De…nizione 1.76 Sia ( ; M) uno spazio misurabile qualsiasi e sia f : ! R. Si dice che f è misurabile (su ( ; M)) se vale una delle condizioni equivalenti espresse dal teorema precedente. Esempio 1.77 Sia ( ; M) uno spazio misurabile qualsiasi ed E : De…niamo la funzione caratteristica dell’insieme E (un concetto che ci servirà spesso in seguito), 1 se x 2 E E (x) = 0 se x 2 = E: Allora si vede facilmente che la funzione E è misurabile se e solo se l’insieme E è misurabile. Quindi costruire esempi di funzioni non misurabili è tanto di¢ cile quanto costruire esempi di insiemi non misurabili. Questo suggerisce che la richiesta di misurabilità di una funzione sia una richiesta generalmente molto debole. Esempio 1.78 Consideriamo Rn con la -algebra degli insiemi Lebesgue misurabili. Allora: se f : Rn ! R è continua, f è misurabile. Infatti, per una funzione continua, gli insiemi ai punti 1 e 3 del teorema sopra sono aperti, mentre gli insiemi ai punti 2 e 4 del teorema sono chiusi; in tutti e 4 i casi, sono insiemi Lebesgue misurabili. La completezza della misura implica la prossima utile proprietà: 40 Proposizione 1.79 Siano f; g : ! R con f misurabile e g = f tranne che su un insieme di misura nulla. Allora g è misurabile. In particolare il teorema precedente implica che nel seguito della teoria possiamo considerare funzioni de…nite in salvo al più un insieme di misura nulla o, come si dice comunemente, de…nite quasi ovunque (abbreviato in q.o.). Se f è de…nita q.o. in , possiamo pensare di de…nirla in un qualsiasi modo anche nell’insieme di misura nulla residuo, e la sua misurabilità o meno in non dipende da come l’abbiamo de…nita (quindi, in de…nitiva, possiamo non de…nirla proprio). Teorema 1.80 (Operazioni sulle funzioni misurabili) Siano f; g : ! R misurabili. Allora: f g è misurabile; f g è misurabile; cf è misurabile (se c è una costante reale); f =g è misurabile purché l’insieme in cui g si annulla abbia misura nulla; f + = max (f; 0) ; f = min (f; 0) ; jf j sono misurabili; se : R ! R è continua, (f ) è misurabile; se : R2 ! R è continua, (f; g) è misurabile. Il teorema precedente mostra sostanzialmente che ogni sequenza …nita di operazioni su funzioni misurabili produce funzioni misurabili. Ci interessano però anche operazioni in…nite, prima fra tutte il passaggio al limite. Si può dimostrare quanto segue: Teorema 1.81 Sia fn : ! [ 1; +1] (per n = 1; 2; 3:::) una successione di funzioni, ciascuna de…nita q.o. in e misurabile, e supponiamo che esista per q.o. x 2 la funzione f (x) = lim fn (x) : n!1 Allora f è misurabile. Abbiamo ora tutti gli ingredienti per de…nire l’integrale rispetto ad una misura (astratta) qualsiasi. L’integrale di una qualsiasi funzione (misurabile) f sarà de…nito come estremo superiore o limite di opportune “somme di Lebesgue di f ”(anziché somme di Cauchy-Riemann), dove queste somme (la cui costruzione è stata anticipata intuitivamente nell’introduzione) si possono vedere come integrali di opportune funzioni approssimanti, le funzioni semplici, che ora introduciamo. De…nizione 1.82 Si dice che una funzione s : bile e assume un numero …nito di valori. ! R è semplice se è misura- Una funzione semplice si può sempre scrivere nella forma s (x) = n X cj j=1 41 Ej (x) con E1 ; E2 ; :::; En insiemi misurabili e c1 ; c2 ; :::; cn 2 R. (Ricordare che Ej è la funzione caratteristica di Ej , che vale 1 in Ej e 0 altrove). Gli insiemi si possono scegliere a due a due disgiunti (e allora i numeri cj sono esattamente i possibili valori assunti da s (x)) ma se anche non lo sono la funzione rimane semplice. E’ naturale de…nire l’integrale di s rispetto alla misura come Z n X cj (Ej ) s (x) d (x) = j=1 (pensare al caso della misura di Lebesgue sulla retta; se gli insiemi Ej sono intervalli l’integrale risulta l’area sotto il gra…co della poligonale s (x); naturalmente la teoria è stata fatta proprio per poter considerare le situazioni in cui gli insiemi Ej non sono intervalli ma insiemi molto complicati). L’idea è allora de…nire l’integrale di una funzione misurabile e positiva, per cominciare, come l’estremo superiore degli integrali delle funzioni semplici s (x) f (x). Il problema è se c’è un modo standard di de…nire funzioni semplici che approssimano tanto bene quanto si vuole la funzione f . Questa è esattamente l’idea, che è stata anticipata nell’introduzione, di suddividere in parti uguali l’insieme dei valori assunti da f , anziché il dominio di f . La costruzione è contenuta nel prossimo Teorema 1.83 (Approssimazione con funzioni semplici) Sia f : ! [0; +1] misurabile. Esiste una successione monotona crescente di funzioni semplici sk che converge puntualmente a f in : Se inoltre f è limitata la convergenza è uniforme. Dimostrazione. Fissato un intero k = 1; 2; 3:::; sia Ek = x 2 : f (x) > 2k Ekj = : x2 j 1 2k e siano < f (x) Poniamo j 2k per j = 1; 2; ::::; 22k . 2k sk (x) = 2 k Ek (x) + 2 X j j=1 1 2k Ekj (x) : Si veri…ca che le sk hanno le proprietà richieste. Si osservi in particolare che il fatto che la successione sia monotona crescente dipende dal fatto che ad ogni passo il numero di suddivisioni dell’intervallo 0; 2k (sull’asse y) viene raddoppiato. Si può ora dare la seguente De…nizione 1.84 (Integrale di una funzione positiva) Sia f : ! [0; +1] misurabile. Si pone Z Z f (x) d (x) = sup s (x) d (x) : s semplice, s (x) f (x) (dove l’estremo superiore può essere …nito o +1). 42 Ci si convince facilmente che questo estremo superiore si può realizzare in particolare mediante le sk costruite nel teorema precedente, perciò si può anche scrivere 0 1 Z 22k X j 1 j k f (x) d (x) = lim @2 (Ek ) + Ek A k!1 2k j=1 vedendo quindi l’integrale come un limite di somme “alla Lebesgue”: Dunque per ogni funzione misurabile e non negativa è ben de…nito (…nito o +1) l’integrale di Lebesgue. Si noti in particolare che in questa teoria il caso in cui la funzione o il dominio sono illimitati vengono trattati direttamente e non, come accadeva per la teoria di Riemann, in un secondo tempo facendo il limite di integrali di funzioni limitate su domini limitati. Per comprendere meglio il signi…cato geometrico della costruzione dell’integrale di Lebesgue, consideriamo il caso particolare in cui f è misurabile, positiva e limitata, 0 f (x) M . La costruzione del teorema precedente si può allora ritoccare ponendo Ekj = x2 : j 1 2k j M 2k M < f (x) per j = 1; 2; ::::; 2k k sk (x) = M 2 X j j=1 Z 0 1 f (x) d (x) = lim @M k!1 Ekj 2k (x) k 2 X j j=1 1 2k e si ha, per ogni k, k M 2 X j j=1 1 2k Ekj Z 1 Ekj A k f (x) d (x) 43 M 2 X j k 2 j=1 Ekj ; dove lo scarto tra l’approssimazione per eccesso e per difetto al passo k non supera, se ha misura …nita, k 2 X 1 M k 2 j=1 k Ekj 2 1 X M k 2 j=1 Ekj = M ( ) 2k e quindi può essere resa piccola a piacere. In particolare l’integrale in questo caso è certamente …nito. Per esempio, in un intervallo di R, la funzione di Dirichlet (che non è Riemann integrabile), f (x) = 1 per x 2 Q 0 per x 2 =Q è misurabile, q.o. nulla, quindi è Lebesgue integrabile con integrale nullo. Nella teoria di Lebesgue dunque, in particolare, tutte le funzioni misurabili e limitate hanno integrale …nito sugli insiemi di misura …nita. Arriviamo ora alla de…nizione di integrale di Lebesgue per una funzione di segno qualsiasi. De…nizione 1.85 Sia f : ! [ 1; +1] misurabile. Si dice che f è Lebesgue integrabile, o sommabile, se Z jf (x)j d (x) < 1 e in tal caso si pone Z Z f (x) d (x) = f + (x) d (x) e risulta ovviamente Z f (x) d (x) Z Z f (x) d (x) jf (x)j d (x) < 1: Notare che se f è misurabile allora anche jf j lo è (questa è una delle proprietà delle funzioni misurabili che abbiamo elencato), ma il viceversa non è vero: se E è un insieme non misurabile e de…niamo f (x) = 1 per x 2 E 1 per x 2 =E allora f non è misurabile, mentre jf j (funzione costante uguale a 1!) ovviamente lo è. Quindi nella de…nizione precedente è necessario richiedere la misurabilità di f e la …nitezza dell’integrale di jf j, non è possibile esprimere le ipotesi unicamente su jf j. Si confrontino le due de…nizioni di integrale introdotte (per funzioni positive o di segno qualsiasi): per una funzione misurabile e positiva l’integrale è sempre de…nito (…nito o +1) mentre per dar senso all’integrale di una funzione di segno variabile richiediamo la …nitezza dell’integrale del modulo, che implica quella della parte positiva e negativa. 44 De…nizione 1.86 Indichiamo con L1 ( ; M; ) ; o più brevemente con L1 ( ) quando M e si possono sottointendere, l’insieme delle funzioni sommabili nel senso della de…nizione precedente. Si veri…ca facilmente che L1 ( ; M; ) è uno spazio vettoriale. Ci interessa mettere in questo spazio la norma dell’integrale, e vederlo quindi come spazio vettoriale normato. Questo però richiede una precisazione importante. Se de…niamo in L1 ( ; M; ) Z kf kL1 ( ;M; ) = jf (x)j d (x) questa risulta soddisfare le proprietà della norma, tranne quella di annullamento. Infatti, come vedremo nel Teorema 1.88, kf kL1 ( ;M; ) = 0 =) f (x) = 0 q.o. in : Per ottenere una norma è quindi necessario identi…care funzioni uguali q.o. tra loro, ossia introdurre in L1 la relazione di equivalenza f g se f = g q.o. e considerare lo spazio delle classi di equivalenza di funzioni, che può essere reso uno spazio vettoriale normato a questo modo. Questa operazione è coerente anche perché la misura è completa, perciò se f è misurabile e g = f q.o., anche g è misurabile. Naturalmente sul piano intuitivo continueremo a pensare gli elementi di L1 come funzioni, che sono tra loro indistinguibili quando sono uguali quasi ovunque; sul piano formale, invece, gli elementi di L1 sono classi d’equivalenza di funzioni. Nel seguito lasceremo sempre sottointesa questa osservazione. Sottolineiamo che abbiamo de…nito l’integrale di Lebesgue in un generico spazio astratto di misura (completa). Se in particolare stiamo considerando la misura di Lebesgue su un sottoinsieme Rn Lebesgue misurabile, avremo de…nito un integrale, che chiamiamo ancora “integrale di Lebesgue”, che è quello che principalmente ci interesserà nel seguito, e che ci aspettiamo generalizzi il classico integrale di Riemann (anche se le relazioni tra questo integrale e quello di Riemann andranno approfondite). In questo scriveremo più semplicemente Z Z f (x) dx per indicare f (x) d (x) : Occorre naturalmente provare che l’integrale di Lebesgue soddisfa “le solite” proprietà elementari dell’integrale. Premettiamo la seguente de…nizione, che ci serve per dar senso all’integrale di una funzione su un sottoinsieme (misurabile) di : De…nizione 1.87 Se E 2 M; poniamo Z Z f (x) d (x) = (f E ) (x) d (x) E se f è una funzione misurabile in oppure è una funzione misurabile in E e noi la de…niamo zero (o qualunque altro valore!) fuori da E. La de…nizione va intesa 45 nel senso che se f E 2 L1 ( ; M; ) allora diciamo che f 2 L1 E; M=E ; e questa uguaglianza ne assegna l’integrale. =E Teorema 1.88 Siano f; g 2 L1 ( ; M; ) allora 1. Linearità dell’integrale: per ogni c1 ; c2 2 R, Z Z Z [c1 f (x) + c2 g (x)] d (x) = c1 f (x) d (x) + c2 g (x) d (x) ; 2. Monotonia dell’integrale f (x) g (x) q.o. in E; F 2 M; E F; f =) 0 =) Z Z f (x) d (x) f (x) d (x) E Z g (x) d (x) ; Z f (x) d (x) F 3. Proprietà di annullamento se (E) = 0 allora Z f (x) d (x) = 0; ZE se f (x) = 0 q.o. in allora f (x) d (x) = 0; Z se jf (x)j d (x) = 0 allora f (x) = 0 q.o. in : Il teorema precedente si dimostra abbastanza facilmente in base alla de…nizione di integrale, riconducendosi al caso delle funzioni semplici. La proprietà di additività rispetto all’insieme di integrazione, che non è compresa nel teorema precedente, vale in una forma più forte di quella che conosciamo per l’integrale di Riemann; precisamente, vale una numerabile additività, che però enunciamo solo per funzioni positive: 1 Teorema 1.89 Sia f : ! [0; +1] misurabile e fEn gn=1 una successione di sottoinsiemi misurabili di a due a due essenzialmente disgiunti12 . Allora Z 1 Z X f (x) d (x) = f (x) d (x) : [1 n=1 En n=1 En Misura con peso Si osservi che il teorema precedente si può rileggere anche dicendo che una funzione misurabile f : ! [0; +1] induce una nuova misura f su ( ; M) ; de…nita da Z (E) = f (x) d (x) : (1.4) f E Si dice che f è la densità di f (rispetto alla misura originaria ). Questo tipo di misura si dice misura densità o anche misura con peso e si indica anche col 1 2 Due insiemi misurabili si dicono essenzialmente disgiunti se la loro intersezione ha misura nulla. In particolare, due insiemi disgiunti sono anche essenzialmente disgiunti. 46 simbolo d f = f (x) d (x) o d f = f (x) dx quando la misura originaria è la misura di Lebsegue su un sottoinsieme di Rn . Cosa sarà l’integrale rispetto a questa nuova misura? Si dimostra (come ci si può aspettare) che Z Z g (x) d f (x) = g (x) f (x) dx: E E Si dice che l’integrale di g è stato fatto rispetto al peso f . Lo spazio delle funzioni integrabili rispetto a questa misura si indica con L1 ( ; f (x) dx) : Serie numeriche come integrali Un’altra applicazione utile della teoria dell’integrazione rispetto a una misura astratta è la seguente. Consideriamo lo spazio di misura ( ; M; ) dove = N, 1 M = P (N), è la misura del conteggio. Qualsiasi successione fan gn=1 a valori reali P1 si può quindi vedere come una funzione misurabile a (n) su ; se la serie n=1 an risulta assolutamente convergente, la funzione a sarà sommabile e si avrà Z 1 X a (n) d (n) = an : n=1 In altre parole, le serie sono particolari integrali astratti. Nella teoria di Lebesgue quindi l’analisi del discreto e del continuo non hanno più solamente “certe analogie”, ma possono vedersi formalmente come due diverse applicazioni concrete della medesima teoria astratta. Questo è fondamentale ad esempio nelle applicazioni al Calcolo delle Probabilità, che difatti nella sua formulazione moderna, dovuta a Kolmogorov, anni 1930, è fondata sulla teoria astratta della misura, uni…cando così, ad esempi, i concetti di variabili aleatorie discrete e continue. 1.4.4 Relazione tra integrale di Riemann e integrale di Lebesgue Come già accennato, è naturale arrivati a questo punto confrontare il “nuovo” integrale con il “vecchio”integrale di Riemann, nella situazione in cui entrambi sono de…niti. Particolarizziamo quindi ora la de…nizione di integrale astratto al caso della misura di Lebesgue sulla retta R. In questo contesto possiamo ora confrontare le nozioni di integrale di Riemann e integrale di Lebesgue. Per poter e¤ettuare il confronto, mettiamoci nell’insieme delle funzioni limitate de…nite su un intervallo [a; b]. Tra queste, le funzioni sommabili secondo Lebesgue sono tutte e solo le funzioni misurabili. Per confronto, si può dimostrare il seguente Teorema 1.90 Sia f : [a; b] ! R una funzione limitata. Allora f è Riemannintegrabile se e solo se è continua quasi ovunque (dove l’espressione “quasi ovunque” ha il solito signi…cato, quindi signi…ca che l’insieme dei punti di discontinuità ha misura di Lebesgue nulla), e in questo caso il valore dell’integrale di Riemann coincide con quello dell’integrale di Lebesgue. 47 Poiché si può dimostrare che tutte le funzioni continue quasi ovunque sono misurabili, ne segue che tutte le funzioni Riemann integrabili 13 sono anche Lebesgue integrabili. L’integrale che abbiamo costruito è quindi e¤ettivamente più generale di quello che conoscevamo dalla teoria classica. Per esempio, come sappiamo la funzione di Dirichlet (uguale a 1 sui razionali e 0 sugli irrazionali) non è Riemann integrabile, e difatti è discontinua ovunque. Dal punto di vista della teoria di Lebesgue la funzione di Dirichlet è indistinguibile dalla funzione identicamente nulla, ovviamente integrabile. Per poter calcolare e¤ettivamente l’integrale di Lebesgue in casi semplici ma signi…cativi è indispensabile capire anche la relazione tra integrale di Lebesgue e integrale di Riemann generalizzato. Consideriamo prima il caso dell’integrale di Riemann generalizzato di una funzione limitata su un intervallo illimitato. Ricordiamo la seguente: De…nizione 1.91 Sia f : (a; +1) ! R una funzione limitata, con la proprietà di essere Riemann integrabile su ogni intervallo (a; k) (per k > a). Se esiste …nito Z k lim f (x) dx = l k!+1 a allora si dice che l’integrale di Riemann generalizzato Z +1 f (x) dx a converge, ed è uguale a l. Si può dimostrare il seguente Teorema 1.92 Nelle ipotesi della de…nizione precedente, si supponga inoltre che per qualche k a si abbia f (x) 0 per ogni x k (oppure f (x) 0 per ogni x k). Allora se l’integrale di Riemann generalizzato di f converge, la funzione f è anche sommabile secondo Lebesgue, e il suo integrale di Lebesgue su (a; +1) è uguale all’integrale generalizzato. In pratica, l’ipotesi richiede che la funzione f non cambi di segno in…nite volte per x ! +1. Un discorso analogo vale ovviamente per l’integrale generalizzato su ( 1; 0). Qualche esempio chiarirà i modi in cui solitamente si ragiona. Esempio 1.93 Si consideri Z 0 1 1 x sin dx: 4 1+x x Si osservi che la funzione è continua e limitata in (0; +1) (in particolare tende a zero per x ! 0+ ), quindi è Riemann integrabile su ogni intervallo (0; k). 1 3 In senso proprio, non generalizzato. Della relazione tra integrale di Lebesgue e integrale di Riemann generalizzato diremo qualcosa tra breve. 48 Inoltre, f cambia di segno in…nite volte vicino all’origine, ma è positiva per ogni x > 1= . Quindi il teorema è applicabile. Controlliamo se l’integrale generalizzato di f converge. x 1 sin 4 1+x x x 1 + x4 1 per x ! +1, x3 perciò l’integrale generalizzato converge assolutamente, e quindi converge. Ne segue che f è sommabile secondo Lebesgue. Si poteva in realtà anche tralasciare la veri…ca sui cambi di segno di f ragionando direttamente su jf j, così: la funzione jf j è continua e limitata su (0; +1), non negativa, integrabile in senso generalizzato, quindi jf j è Lebsegue sommabile; poiché f è ovviamente misurabile, anche f è Lebsegue sommabile. Esempio 1.94 Si consideri: Z +1 1 sin x dx: x2 La funzione cambia di segno in…nite volte per x ! 1, perciò non si può applicare il teorema direttamente a f , ma lo si può applicare a jf j: poiché jf j è continua, limitata, non negativa, e 1 jf (x)j ; x2 jf j è integrabile in senso generalizzato perciò è anche Lebesgue sommabile; d’altro canto f è misurabile perché continua, quindi anche f è Lebsegue sommabile. Esempio 1.95 Si consideri: Z 1 +1 sin x dx: x La funzione cambia di segno in…nite volte per x ! 1, perciò non si può applicare il teorema direttamente a f . D’altro canto ragionando su jf (x)j non si riesce a concludere la convergenza dell’integrale generalizzato. Il teorema non è quindi in questo caso di alcuna utilità per stabilire l’esistenza o la non esistenza dell’integrale di Lebesgue. Si può dimostrare che: 1. L’integrale generalizzato di f converge, ma: 2. la funzione f non è Lebesgue sommabile, in quanto l’integrale di Lebesgue di jf (x)j diverge. Questo esempio mostra quindi un tipo di situazione in cui l’integrabilità secondo Lebesgue risulta una condizione più esigente dell’integrabilità in senso generalizzato secondo Riemann. L’idea geometrica soggiacente è la seguente: nell’integrale generalizzato di una funzione che cambia di segno in…nite volte si possono avere compensazioni tra le aree con segno delle porzioni del gra…co di f che stanno ora sopra ora sotto l’asse delle x; l’integrale di Lebesgue richiede invece di calcolare prima il contributo totale della parte di gra…co sopra l’asse delle x, poi quello della parte sotto l’asse delle x, e poi sottrarre: se entrambi 49 questi numeri sono in…niti, l’integrale perde signi…cato, non consentendo quindi le compensazioni parziali che avvenivano calcolando l’integrale su (0; k) e facendo poi tendere k a +1. Un discorso completamente analogo si può fare per l’integrale di Riemann generalizzato per una funzione illimitata su un intervallo illimitato: De…nizione 1.96 Sia f : (a; b] ! R una funzione con la proprietà di essere limitata e Riemann integrabile su ogni intervallo [a + "; b] (per " > 0). Se esiste …nito Z b lim f (x) dx = l "!0+ a+" allora si dice che l’integrale di Riemann generalizzato Z b f (x) dx a converge, ed è uguale a l. Si può dimostrare il seguente Teorema 1.97 Nelle ipotesi della de…nizione precedente, si supponga inoltre che per qualche "0 > 0 si abbia f (x) 0 per ogni x 2 (a; a + "0 ) (oppure f (x) 0 per ogni x 2 (a; a + "0 )). Allora se l’integrale di Riemann generalizzato di f converge, la funzione f è anche sommabile secondo Lebesgue, e il suo integrale di Lebesgue su (a; b) è uguale all’integrale generalizzato. In questo caso ciò che va escluso è che la funzione cambi di segno in…nite volte in ogni intorno del punto a in cui la funzione è illimitata. Se la funzione non ha in…niti cambi di segno, la convergenza dell’integrale di Riemann generalizzato implica la Lebesgue sommabilità della funzione; se invece la funzione ha in…niti cambi di segno, si può provare la Lebesgue sommabilità mostrando la convergenza dell’integrale generalizzato del modulo di f . Rimane la possibilità, però, che una funzione con in…niti cambi di segno in un intorno di un punto in cui è illimitata abbia integrale di Riemann generalizzato convergente e tuttavia non sia Lebesgue sommabile. Esempio 1.98 Consideriamo Z 0 1 1 1 p sin dx: x x La funzione è continua e limitata (quindi Riemann integrabile) in ogni intervallo ["; 1] per " > 0. Poiché 1 1 1 p sin p ; x x x per i criteri di integrabilità l’integrale di Riemann generalizzato di jf j converge, quindi (essendo ovviamente f misurabile), f è Lebesgue sommabile. 50 Esempio 1.99 Consideriamo Z 0 1 1 1 sin dx: x x In questo caso la maggiorazione 1 1 sin x x 1 x è inconcludente, perché l’integrale generalizzato di 1=x diverge; d’altro canto la funzione cambia di segno in…nite volte in (0; 1), perciò il teorema precedente non è di aiuto a stabilire se la funzione è Lebesgue sommabile oppure no. Si può dimostrare che non lo è, e che tuttavia l’integrale generalizzato di Riemann converge. Infatti il cambio di variabili: Z 1 1 1 sin dx = 1=x = t; dx = 1=t2 dt x x 0 Z +1 sin t = dt t 1 riconduce l’integrale a quello dell’Esempio 1.95. 1.4.5 I teoremi di convergenza per l’integrale di Lebesgue Finora abbiamo costruito l’integrale di Lebesgue, ne abbiamo elencato le proprietà di base, abbiamo constatato (ultimo paragrafo) che le funzioni Lebesgue integrabili sono più di quelle Riemann integrabili, ma non abbiamo realmente illustrato i vantaggi di questo integrale rispetto a quello classico. Cominciamo ora proprio a illustrare questi vantaggi, che consistono anzitutto in alcuni importanti teoremi sulle relazioni tra l’integrale di Lebesgue e le operazioni di limite di successione di funzioni, e di serie di funzioni. Torniamo ancora nel contesto astratto di un qualsiasi spazio di misura ( ; M; ), in cui supponiamo come in precedenza che la misura sia anche completa. Teorema 1.100 (della convergenza monotona) Sia fn : ! [0; +1] una successione di funzioni misurabili, monotona crescente, cioè fn (x) fn+1 (x) per ogni intero n e x 2 . Allora Z Z lim fn (x) d (x) = lim fn (x) d (x) n!+1 n!+1 dove i due membri dell’uguaglianza possono essere …niti o in…niti. (L’esistenza dei due limiti è parte della tesi). Il teorema precedente riguarda una successione di funzioni misurabili e positive, e considera integrali …niti o in…niti. Il prossimo teorema invece considera successioni di funzioni di segno qualsiasi, ma sommabili. Questo è probabilmente il più importante teorema della teoria di Lebesgue: 51 Teorema 1.101 (della convergenza dominata, o “teorema di Lebesgue”) Sia fn : ! [ 1; +1] una successione di funzioni misurabili, convergente puntualmente (quasi ovunque) a una certa funzione f . Supponiamo che esista una funzione g sommabile in tale che per ogni intero n sia jfn (x)j Allora In particolare, Z jfn (x) lim n!1 g (x) per q.o. x 2 : f (x)j d (x) ! 0 per n ! 1: Z fn (x) d = cioè il limite si scambia con l’integrale. Z f (x) d La funzione g che compare nell’ipotesi del teorema si chiama funzione dominante integrabile (perché domina, cioè maggiora, il modulo delle fn ), da cui il nome del teorema. Vediamo ora qualche esempio pratico di passaggio al limite sotto il segno di integrale per l’integrale di Lebesgue, a confronto con quanto si può dire nella teoria dell’integrale di Riemann. Nella teoria di Riemann, se ffn g è una successione di funzioni fn : [a; b] ! R limitate e Riemann integrabili e inoltre fn ! f uniformemente in [a; b], si può Rb Rb garantire che a fn (x) dx ! a f (x) dx. Supponiamo di sapere soltanto che le funzioni fn sono misurabili, jfn (x)j c per ogni x 2 [a; b] e per ogni n, e inoltre fn ! f puntualmente quasi ovunque in [a; b]. Per il teorema di Lebesgue della Rb Rb convergenza dominata risulterà a fn (x) dx ! a f (x) dx, sotto ipotesi che quindi sono molto più deboli della convergenza uniforme. Esempio 1.102 Sia 1=n fn (x) = jxj in [ 1; 1] : Si ha fn (x) ! 1 q.o. ma non uniformemente (poiché fn (0) = 1 si ha kfn 1k1 = 1). Perciò la teoria di Riemann non è applicabile. In base al teorema della convergenza dominata, invece, essendo jfn (x)j 1 (e la costante è integrabile in [ 1; 1]) risulta Z 1 Z 1 fn (x) dx ! 1dx = 2: 1 1 Esempio 1.103 Sia fn (x) = sin nx in [0; +1): nx3=2 Controlliamo anzitutto che ciascuna fn 2 L1 . Per x ! 0 è fn (x) 1 nx = 1=2 ; 3=2 nx x 52 integrabile in un intorno di 0. D’altro canto jfn (x)j = sin nx nx3=2 1 ; nx3=2 integrabile in un intorno di 1. Perciò fn 2 L1 [0; +1): Per n ! 1; fn (x) ! 0 puntualmente ovunque. Cerchiamo una dominante integrabile su [0; +1). Per trovarla è più semplice ragionare separatamente sugli intervalli [0; 1] e [1; +1). Si ha: per x 2 [0; 1] ; nx 1 = 1=2 2 L1 [0; 1] jfn (x)j nx3=2 x (abbiamo usato la disuguaglianza jsin tj jtj); per x 2 [1; +1); jfn (x)j 1 2 L1 [1; +1) x3=2 1 nx3=2 (abbiamo usato le disuguaglianze jsin tj Dunque jfn (x)j g (x) = 1 x1=2 1 x3=2 1 e 1=n per x 2 [0; 1] per x 2 [1; +1) 1). con g 2 L1 [1; +1); perciò il teorema di Lebesgue è applicabile, e Z +1 Z +1 fn (x) dx ! 0dx = 0: 0 0 Si osservi che, diversamente dall’esempio precedente, questa volta la maggiorante integrabile è una funzione illimitata. Si poteva anche, del resto, valutare direttamente l’integrale: Z +1 Z +1 dt sin t dt sin nx dx = nx = t; dx = = 3=2 3=2 n n nx 0 0 n nt Z +1 1 sin t c p dt = p ! 0 per n ! 1 = n 0 n t3=2 R +1 sin t perché c = 0 dt è una costante (abbiamo dimostrato all’inizio che ogni t3=2 fn è L1 , questa integranda è f1 ). L’altro risultato fondamentale che ha a che fare con la relazione tra integrale e limite di successioni è il seguente: Teorema 1.104 Lo spazio vettoriale normato L1 ( ; M; ) (de…nito indenti…cando funzioni uguali q.o.) è completo. 53 Ricordiamo che questo signi…ca, esplicitamente, che se ffn g è una successione di funzioni in L1 ( ; M; ) che è di Cauchy, cioè tale che Z j(fn fm ) (x)j dx ! 0 per n; m ! 1; allora esiste una funzione f 2 L1 ( ) tale che Z j(fn f ) (x)j dx ! 0 per n ! 1; e in particolare Z fn (x) dx ! Z f (x) dx per n ! 1: Dalle proprietà dell’integrale di Lebesgue in relazione all’operazione di limite di successione di funzioni, si possono dedurre le sue proprietà in relazione all’operazione di serie di funzioni. La domanda che ci poniamo è: sotto quali ipotesi si può a¤ermare che Z X 1 1 Z X fn (x) dx = fn (x) dx? n=1 n=1 Rispondono i prossimi due teoremi. Teorema 1.105 Siano fn : ! R misurabili e non negative. Allora è sempre vero che Z X 1 1 Z X fn (x) dx = fn (x) dx n=1 n=1 dove entrambi i membri possono essere …niti o +1. In particolare, questo signi…ca che se fn : ! R sono misurabili e di segno qualsiasi, allora è sempre vero che Z X 1 Z 1 X jfn (x)j dx jfn (x)j dx = n=1 n=1 dove entrambi i membri possono essere …niti o +1. E’utile anche il seguente Teorema 1.106 Siano fn : ! R appartenenti a L1 ( ). Se 1 Z X jfn (x)j dx < 1; n=1 P1 allora la serie di funzioni n=1 fn converge in L1 e puntualmente q,o. a una funzione f 2 L1 ( ) ; e risulta Z Z X 1 1 Z X f (x) dx = fn (x) dx = fn (x) dx: n=1 n=1 54 1.4.6 Derivazione sotto il segno di integrale Nel risolvere problemi di¤erenziali, talvolta stabiliremo delle formule di rappresentazione della soluzione in cui questa è assegnata da un opportuno integrale, con una formula del tipo: Z u (x) = k (x; y) f (y) dy dove u è la soluzione cercata, f un dato o termine noto, k un nucleo che dipende dall’operatore di¤erenziale e dal tipo di problema, ma non da dati o termini noti; in questa formula ciascuna delle variabili x; y può essere scalare o vettoriale. Si tratta di veri…care che la u così de…nita risolve esplicitamente l’equazione di¤erenziale assegnata; perciò bisogna saper calcolare le derivate di u rispetto a x (o le derivate parziali di u rispetto alle variabili xi ). Ora, nell’integrale che assegna la u la variabile di integrazione è la y, mentre la x dal punto di vista dell’integrale è un parametro. Il problema matematico che ci interessa è quindi: derivare un integrale dipendente da un parametro, rispetto a quel parametro. Supponiamo, ad esempio, che sia x che y siano variabili bidimensionali ossia scriviamo, più esplicitamente, Z Z u (x1 ; x2 ) = k (x1 ; x2 ; y1 ; y2 ) f (y1 ; y2 ) dy1 dy2 : @u (x1 ; x2 ). In questo caso y1 ; y2 sono le variabili di Proponiamoci di calcolare @x 1 integrazione, x1 il parametro rispetto a cui si deriva (quindi bisognerà pensarlo come variabile), mentre x2 non gioca alcun ruolo, in altre parole è un parametro @u che si può ritenere …ssato. Quando vorremo calcolare @x (x1 ; x2 ) diventerà 2 importante il ruolo di x2 mentre sarà la x1 a svolgere il ruolo di parametro …ssato. In ogni caso, nel discutere il problema teorico della derivazione dell’integrale dipendente da un parametro (eventualmente vettoriale), …ssiamo l’attenzione su un parametro (scalare) alla volta, quindi tanto vale studiare direttamente questa situazione, ossia: Z u (x) = k (x; y) f (y) dy con y eventualmente vettoriale, ma x scalare. Inoltre, nella trattazione generale possiamo inglobare la funzione f nel nucleo k, e considerare una scrittura Z u (x) = k (x; y) dy con x 2 (a; b) ; y 2 Rn : Vogliamo calcolare d du (x) = dx dx Z k (x; y) dy: (Notare che x è variabile scalare, la u è una funzione da R a R, quindi usiamo d per la u, non quello di derivata parziale). il simbolo di derivata dx 55 Se la derivata si potesse portare sotto il segno di integrale, si avrebbe: Z du @k (x) = (x; y) dy: (1.5) dx @x (Si noti che il nucleo k dipende dalle variabili x e y, quindi la derivata di k rispetto a x è una derivata parziale, diversamente da quella di u). Ci chiediamo sotto quali ipotesi si può a¤ermare che la (1.5) vale. Utilizzeremo a questo scopo il teorema di Lebesgue della convergenza dominata. Cominciamo a considerare: Z u (x) = k (x; y) dy: Perché la scrittura abbia senso, dovremo chiedere anzitutto che sia: k : (a; b) !R con Rn misurabile; k (x; ) 2 L1 ( ) per ogni x 2 (a; b). Ora vogliamo calcolare du dx (x0 ) in un certo punto x0 2 (a; b). Consideriamo una successione hn ! 0 di numeri reali, e studiamo il rapporto incrementale: Z u (x0 + hn ) u (x0 ) k (x0 + hn ; y) k (x0 ; y) = dy: hn hn Poniamo fn (y) = k (x0 + hn ; y) hn k (x0 ; y) : A questo modo il problema è ricondotto al calcolo del limite dell’integrale di una successione. Infatti: du u (x0 + hn ) u (x0 ) (x0 ) = lim n!1 dx hn Z k (x0 + hn ; y) k (x0 ; y) = lim n!1 hn Z = lim fn (y) dy dy n!1 e se vale il passaggio al limite sotto il segno di integrale questo è uguale a Z k (x0 + hn ; y) k (x0 ; y) lim dy n!1 hn Z @k = (x0 ; y) dy: @x Il punto è quindi giusti…care il passaggio al limite sotto il segno di integrale. Applichiamo il teorema di Lebesgue, richiedendo la validità delle ipotesi necessarie. Ci serve sapere: 56 1. che esista per q.o. y 2 k (x0 + hn ; y) hn lim n!1 k (x0 ; y) = @k (x0 ; y) ; @x 2. che sia, per ogni n e per q.o. y 2 ; k (x0 + hn ; y) hn k (x0 ; y) g (y) 2 L1 ( ) : @k Questa è l’ipotesi più delicata. Supponiamo che @x (x; y) esista non solo per x = x0 ma per ogni x in un certo intorno di x0 ;del tipo (x0 ; x0 + ) (e per q.o. y). Allora applicando il teorema di Lagrange rispetto alla x possiamo scrivere k (x0 + hn ; y) k (x0 ; y) @k = (x0 + h hn ; y) hn @x con j n j < 1. Dunque il punto x0 + h hn appartiene allo stesso intorno (x0 ; x0 + ). Ricaviamo quindi la seguente informazione: se esistono una funzione g 2 L1 ( ) e un intorno (x0 ; x0 + ) tali che @k (x; y) @x g (y) per q.o. y 2 e per ogni x 2 (x0 ; x0 + ), allora si può applicare il teorema di Lebesgue e passare al limite sotto il segno di integrale. Raccogliamo la discussione precedente nel seguente: Teorema 1.107 (Derivazione sotto il segno di integrale) Sia k : (a; b) !R con Rn misurabile; k (x; ) 2 L1 ( ) per ogni x 2 (a; b). Supponiamo che esistano un intervallo (x0 ; x0 + ) (a; b) a una funzione g 2 L1 ( ) a tali che per q.o. y 2 e per ogni x 2 (x0 ; x0 + ) esiste @k (x; y) e @x @k (x; y) @x g (y) : Allora per ogni x 2 (x0 ; x0 + ) esiste Z Z d @k k (x; y) dy = (x; y) dy: dx @x Il teorema è già completamente dimostrato, con un’unica osservazione. Dalla discussione precedente sembrerebbe di poter concludere che la formula di derivazione valga nel punto x0 . Poiché però le ipotesi valgono in un intorno di x0 (che si può vedere come un intorno di qualsiasi altro suo punto), anche la conclusione vale in quest’intorno. Si osservi che per concludere la tesi nel solo punto x0 non sarebbe possibile assumere meno di così, come è emerso dalla dimostrazione. 57 Esempio 1.108 Sia u (x) = Z e (x y)2 R f (y) dy; per x 2 R. Supponiamo che f sia misurabile e limitata, e proviamo che per ogni x 2 R esiste Z Z 2 @ 0 (x y)2 u (x) = e f (y) dy = 2 (x y) e (x y) f (y) dy: @x R R La derivata @ e @x (x y)2 f (y) = 2 (x y) e (x y)2 f (y) 2 esiste per ogni x; y 2 R. Consideriamo la funzione 2 (x y) e (x y) . Per ogni x 2 R …ssato, come funzione di y questa è integrabile. Rappresentiamone un gra…co: 2 Di conseguenza, essendo f (y) misurabile e limitata, la funzione 2 (x y) e (x y) f (y) sarà integrabile. Ma noi dobbiamo trovare una maggiorante indipendente da x, valida per ogni x in un intorno di un …ssato x0 . Consideriamo allora l’in2 sieme dei gra…ci delle funzioni 2 (x y) e (x y) ; per x variabile in un piccolo intorno di x0 : 58 Non è di¢ cile de…nire una funzione integrabile che sia maggiore in modulo di tutte queste funzioni e tenda a zero ancora in modo esponenziale: (si potrebbe scrivere facilmente l’espressione analitica di questa funzione, disegnata col tratto più spesso nel gra…co precedente, ma ci accontentiamo del gra…co). Indicando con h (y) questa funzione, si ha 2 (x y) e (x y)2 f (y) g (y) 2 L1 (R) h (y) jf (y)j in quanto h è integrabile e f limitata. Se avessimo saputo a priori che f era integrabile, sarebbe stato su¢ ciente trovare h limitata, e la maggiorazione sarebbe stata più immediata: 2 (x perché la funzione di una variabile 2 (x y) e (x y)2 (x y)2 y) e t2 2te f (y) c è limitata in tutto R, e quindi c jf (y)j g (y) 2 L1 (R) : Perciò, per f integrabile o per f limitata, è comunque vera la conclusione. Esempio 1.109 Sia u (x; t) = Z R e (x y)2 t f (y) dy; per x 2 R. Supponiamo che f sia misurabile e limitata, oppure sia integrabile in R. Allora per ogni x 2 R e t > 0 esiste Z Z (x y)2 @u @ (x y) (x y)2 t t (x; t) = e f (y) dy = 2 e f (y) dy: @x t R @x R 59 E’sostanzialmente lo stesso esempio di prima, dove ora t > 0 si può vedere come un parametro …ssato. Questo è un esempio del modo in cui e¤ ettivamente utilizzeremo il teorema: avremo una funzione di più variabili, espressa come integrale dipendente da più parametri; poiché però la deriviamo rispetto a una variabile alla volta, concettualmente il problema si può vedere come derivazione di un integrale dipendente da un parametro scalare. Ci siamo posti il problema di calcolare le derivate di una funzione u assegnata mediante un integrale. Concettualmente, un passo prima di questo problema c’è quello di garantire che la u sia una funzione continua del parametro. Enunciamo un teorema che risponde a tale problema. Teorema 1.110 (Continuità di un integrale dipendente da un parametro) Sia k:I !R con I R intervallo e Rn misurabile; k (x; ) 2 L1 ( ) per ogni x 2 (a; b). Supponiamo che esistano un intervallo (x0 ; x0 + ) I a una funzione g 2 L1 ( ) a tali che 1. per q.o. y 2 sia k ( ; y) continua in x0 e 2. per q.o. y 2 e per ogni x 2 (x0 ; x0 + ) sia jk (x; y)j Allora la funzione u (x) = Z g (y) : k (x; y) dy è continua in x0 . Se le ipotesi valgono per ogni x 2 I, la funzione u è continua in tutto I: La dimostrazione, che si lascia per esercizio essendo simile a quella del teorema precedente, si basa ancora sul teorema della convergenza dominata, il che è la ragione dell’ipotesi 2 di controllo valido per ogni x in un intorno di x0 (e non solo in x0 ). Esempio 1.111 La funzione u (x) = Z e jx yj f (y) dy R è continua in tutto R se f 2 L1 (R), o se f è misurabile e limitata. dimostrazione di questo fatto si lascia per esercizio. 1.4.7 La Spazi Lp Sia ( ; M; ) uno spazio di misura, con misura completa. Oltre allo spazio L1 ( ) delle funzioni sommabili, è utile in molte questioni introdurre spazi di funzioni misurabili una cui opportuna potenza è sommabile. Diamo anzitutto la seguente 60 De…nizione 1.112 Per p 2 [1; 1); poniamo Z p Lp ( ) = f : ! R misurabile : jf (x)j d (x) < 1 : Per p = 1 ritroviamo lo spazio L1 ( ) già introdotto, delle funzioni Lebesguesommabili. p Chiediamoci: la richiesta che risulti jf j sommabile per qualche p > 1 è più forte o più debole rispetto a jf j sommabile? In generale le due richieste non sono confrontabili: Esempio 1.113 La funzione f (x) = 1=x sta in Lp (1; +1) per p > 1 ma non per p = 1; invece f (x) = 1=x log2 x sta in L1 (0; 1=2) ma non sta in Lp (0; 1=2) per nessun p > 1. Dunque questi spazi non soddisfano reciproche inclusioni banali, in generale. Gli spazi Lp ( ) sono vettoriali anche per p > 1 (per p = 1 lo sappiamo già). Infatti la combinazione lineare di funzioni misurabili è misurabile, e vale la disuguaglianza p p p jf + gj 2p 1 (jf j + jgj ) ; perciò se f; g 2 Lp ( ) anche f + g 2 Lp ; con Z Z Z p p p jf + gj d 2p 1 jf j d + jgj d < 1: (1.6) Vorremmo renderli spazi vettoriali normati. E’chiaro che la norma naturale è (se vogliamo soddisfare l’omogeneità): kf kLp ( ) Z = 1=p p jf j d . (Nel seguito scriveremo spesso kf kp per indicare kf kLp ( ) , quando non c’è pericolo di confusioni). Questa “candidata norma”soddisfa la proprietà di positività (pur di identi…care come di consueto funzioni tra loro uguali quasi ovunque) e quella di omogeneità della norma. La disuguaglianza triangolare non è però immediata da dimostrare, perché dalla (1.6) segue Z 1=p p jf + gj d 21 1=p 1 1=p 2 Z p " Z jf j d + Z 1=p p jgj d 1=p p jf j d + Z 1=p p jgj d # ; col che avremmo ottenuto una disuguaglianza di tipo triangolare ma con una costante 21 1=p > 1 a secondo membro, che non è quello che vogliamo. Per dimostrare una disuguaglianza triangolare “pulita” occorre un argomento più ra¢ nato. Si può e¤ettivamente dimostrare il seguente 61 Teorema 1.114 (Disuguaglianza di Minkowski) Per ogni p 2 [1; +1); f; g 2 Lp ( ) vale la disuguaglianza kf + gkp kf kp + kgkp : Dunque Lp ( ) è uno spazio vettoriale normato per tutti i p 2 [1; 1): Ci si può chiedere se esista una ragione particolare per cui gli spazi Lp non sono stati de…niti anche per 0 < p < 1. In e¤etti si può provare che per 0 < p < 1 la “candidata norma” kf kp non soddisfa la disuguaglianza triangolare. Vale anche la seguente disuguaglianza, che mette in relazione spazi Lp di esponenti diversi, e ha molte applicazioni: Teorema 1.115 (Disuguaglianza di Hölder) Siano p; q 2 (1; 1) tali che 1 1 + =1 p q (due numeri con queste proprietà si dicono esponenti coniugati). Se f 2 Lp ( ) e g 2 Lq ( ) ; allora f g 2 L1 ( ) e vale la disuguaglianza (di Hölder) Z jf gj d kf kp kgkq : Prima di proseguire, prendiamo con…denza col concetto di esponenti coniugati. A¢ nché valga la relazione p1 + 1q = 1; più grande è p più piccolo dev’essere q; in particolare, 2 è il coniugato di se stesso; se 1 < p < 2 il suo coniugato q soddisfa 2 < q < 1. Ad esempio, il coniugato di p = 3 > 2 è q = 23 < 2: Per p ! 1+ ; q ! +1. Dalla relazione 1q = 1 p1 ricaviamo: q= p p 1 e anche pq = p + q: p Tra tutti gli spazi L lo spazio L2 ha proprietà particolari (vedremo in seguito che questo è uno “spazio di Hilbert”). Scriviamo esplicitamente cosa diventa la disuguaglianza di Hölder per p = 2 (e quindi, come visto, q = 2): Z jf gj d kf kL2 ( ) kgkL2 ( ) : Questa prende il nome di disuguaglianza di Schwartz, ed è un analogo in…nito dimensionale della proprietà del prodotto scalare elementare jhx; yij kxk kyk : Torneremo sull’argomento nel contesto degli spazi di Hilbert. Introduciamo ora uno spazio che in qualche senso completa la scala degli spazi Lp . 62 De…nizione 1.116 Poniamo: L1 ( ) = ff : ! R misurabile : 9K > 0 per cui è jf (x)j K per q.o. x 2 g : Le funzioni di questo spazio si dicono anche essenzialmente limitate. Esse sono limitate salvo un insieme di misura nulla. Se f 2 L1 ( ) si de…nisce kf kL1 ( ) = inf fK > 0 : jf (x)j K per q.o. x 2 g . Quindi in particolare risulta jf (x)j kf kL1 ( ) per q.o. x 2 : Si presti attenzione a non equivocare la de…nizione di “limitatezza essenziale”. I prossimi esempi dovrebbero chiarire le idee. Esempio 1.117 1. Se f è limitata in in particolare è essenzialmente limitata. 2. La funzione 1=x non è essenzialmente limitata in R. Attenzione: f non 1 K per ogni è “limitata per x 6= 0”, in quanto per nessun K > 0 è vero che jxj x 6= 0; o per ogni x appartenente a qualche altro insieme di misura nulla. 3. Un esempio di funzione essenzialmente limitata senza essere limitata è: f (x) = sin x per x 2 R n Q x per x 2 Q E’ chiaro infatti che jf (x)j 1 per q.o. x 2 R; in quanto Q è un insieme di misura nulla. D’altro canto ovviamente f è illimitata D’altro canto ovviamente f è illimitata. 4. f è essenzialmente limitata se e solo se f è uguale quasi ovunque ad una funzione limitata. Ad esempio, la f dell’esempio precedente è uguale quasi ovunque a sin x. 5. La funzione f (x) = log x appartiene in Lp (0; 1) per ogni p 2 [1; 1) ma non appartiene a L1 (0; 1); la funzione f (x) = sin x appartiene a L1 (R) ma non appartiene a Lp (R) per nessun p 2 [1; 1), quindi non c’è in generale alcuna inclusione banale tra lo spazio L1 e gli altri spazi Lp . Si veri…ca facilmente che L1 ( ) è uno spazio vettoriale normato (con la solita identi…cazione tra funzioni uguali quasi ovunque). Inoltre: Vale anche il prossimo fondamentale risultato: Teorema 1.118 Gli spazi Lp ( ) per 1 spazi di Banach. p 1 sono completi. Quindi sono Notiamo che il concetto di coppia di esponenti coniugati e la disuguaglianza di Hölder si estendono a comprendere anche lo spazio L1 , al seguente modo: 63 De…nizione 1.119 Diciamo che l’esponente coniugato di p = 1 è q = 1; e l’esponente coniugato di p = 1 è q = 1. Ora, se f 2 L1 ( ) e g 2 L1 ( ) si ha, essendo jg (x)j kgkL1 ( ) per q.o. x2 ; Z Z jf g (x)j d (x) kgkL1 ( ) jf (x)j d (x) = kgkL1 ( ) kf kL1 ( ) : Perciò la disuguaglianza di Hölder si estende anche ai casi estremi in cui p = 1 o 1. Un’applicazione elementare della disuguaglianza di Hölder è il seguente risultato di inclusione tra spazi Lp su un dominio di misura …nita: Teorema 1.120 Sia ( ; M; ) uno spazio di misura (con misura completa), di misura …nita, cioè ( ) < 1. Se 1 p < r 1 allora Lr ( ) Lp ( ) e vale la disuguaglianza: 1 kf kp ( )p 1 r kf kr per ogni f 2 Lr ( ) 1 dove nel caso r = 1 a secondo membro abbiamo ( ) p kf k1 . Dimostrazione. Supponiamo prima r < 1: Applichiamo la disuguaglianza di Hölder, scrivendo: Z p p kf kp = jf (x)j 1d (x) p e osservando che se f 2 Lr ( ) ; allora jf j 2 Lr=p ( ) e la costante 1 appartiene allo spazio Ls ( ) con s coniugato di r=p; quindi 1=s = 1 p=r: Perciò: p kf kp Z p jf (x)j r p p r d (x) Z 1 s p r 1 d p 1 p=r = kf kr ( ) ed elevando ambo i membri alla 1=p si ha la tesi. Nel caso r = 1 si ha subito Z p 1 p jf (x)j d (x) kf k1 Z 1 p 1d (x) = 1 ( ) p kf k1 : E’utile a volte sapere che le funzioni Lp si possono approssimare bene quanto si vuole, in norma Lp , con funzioni regolari. Vale il seguente Teorema 1.121 Lo spazio C 1 è denso in Lp ( ) per ogni p 2 [1; 1): Esplicitamente, la densità signi…ca che per ogni f 2 Lp ( ) con p 2 [1; 1) 1 esiste una successione f'n gn=1 C 1 tale che k'n f kp ! 0 per n ! 1. A maggior ragione, quindi, ogni funzione Lp ( ) con p 2 [1; 1) può essere approssimata bene quanto vogliamo in norma Lp mediante funzioni continue in . 64 1.4.8 Integrali doppi in Rn Lavorando con l’integrale di Lebesgue in Rn , e in particolare quando si studiano operatori integrali de…niti su spazi di funzioni integrabili, si possono incontrare integrali del tipo: Z Z f (x; y) dy dx Rn Rn dove sia x che y rappresentano variabili in Rn . Le domande che si pongono naturalmente sono: 1. E’lecito scambiare l’ordine di integrazione, scrivendo Z Z Z Z f (x; y) dy dx = f (x; y) dx dy ? (1.7) Rn Rn Rn Rn 2. L’integrale iterato calcolato nella formula precedente, coicide con l’integrale doppio Z f (x; y) dxdy (1.8) R2n che si otterrebbe vedendo f (x; y) come funzione di 2n variabili e calcolandone l’integrale di Lebesgue in R2n ? La risposta a queste domande è contenuta nel prossimo teorema. In sostanza, se almeno uno dei 3 integrali che compaiono nelle (1.7)-(1.8) converge assolutamente (cioè quando si sostituisca f con jf j), allora tutti e tre gli integrali convergono ed entrambe le domande hanno risposta a¤ermativa. Teorema 1.122 (di Fubini-Tonelli) Sia f : R2n ! R misurabile. 1. Se f 0; allora l’uguaglianza (1.7) è sempre vera, dove i due membri possono essere entrambi …niti o entrambi in…niti. 2. Se f ha segno qualsiasi ma almeno uno degli integrali iterati che compaiono in (1.7) converge assolutamente (cioè converge uno degli integrali iterati di jf j) allora la (1.7) vale, con entrambi i membri …niti. In particolare le funzioni di una variabile Z Z g (x) = f (x; y) dy e h (y) = f (x; y) dx Rn Rn risultano Lebesgue integrabili in Rn , e in particolare …nite quasi ovunque. Inoltre in questo caso f 2 L1 R2n e l’integrale doppio (1.8) di f coincide con gli integrali iterati in (1.7). 3. Se è noto a priori che f 2 L1 R2n allora valgono tutte le conclusioni del punto precedente. Dal punto di vista operativo i punti più utili del teorema sono i primi due: raramente si sa a priori che f 2 L1 R2n ; più spesso questa conclusione viene conquistata grazie al fatto che uno degli integrali iterati converge assolutamente. Spesso accade che l’integrale che nasce dal problema in esame sia uno dei due integrali iterati, ma quello che si riesce a calcolare esplicitamente sia l’altro 65 integrale iterato. Risulta quindi utile sapere a priori che vale l’uguaglianza (1.7). Questo è vero se l’integrale iterato che si sa più facilmente calcolare o almeno stimare, converge assolutamente. Esempio 1.123 1. Calcolare l’integrale di Lebesgue: Z 1 se 0 < x < 1 x+y 2 f (x; y) dxdy con f (x; y) = 0 altrimenti. 2 R L’integranda è non negativa, quindi è lecito calcolare l’integrale doppio come integrale iterato in qualsiasi ordine. Calcoliamo: Z Z 1 Z 1 dy dx = f (x; y) dxdy = x + y2 2 R 0 R ! Z 1 +1 1 y = 2 p arctan p dx x x 0 0 Z 1 p 1 p dx = 2 x 0 = 2 : = x 0 Si osservi in particolare che la funzione de…nita dall’integrale interno, Z g (x) = f (x; y) dy = p x R è …nita per quasi ogni x (ma non per ogni x). 2. Stabilire se f 2 L1 R2 , con f (x; y) = e x2 y 2 sin (xy) : La funzione ha segno variabile, ma jf (x; y)j e x2 y 2 : Maggioriamo l’integrale iterato di f con l’integrale iterato di g (x; y) = e Z Z Z Z 2 2 jf (x; y)j dy dx e x y dy dx R R R R Z Z 2 2 = e x dx e y dy < 1: R R p 2 (E’ noto che R e x dx = , confronto, l’integrale iterato di calcolo precedente non fornisce 3. Stabilire se f 2 L1 R2 , x2 y 2 : R ma il valore esatto qui non è importante). Per jf j converge, quindi f 2 L1 R2 . Si noti che il il valore dell’integrale doppio di f . con f (x; y) = e 66 jxyj : La funzione è positiva, calcoliamo l’integrale doppio come integrale iterato: Z Z +1 Z +1 f (x; y) dxdy = 2 2 e xy dy dx R2 0 0 ! Z +1 +1 e xy =4 dx x 0 0 Z +1 dx =4 = +1; x 0 pertanto f 2 = L1 R2 . 1.4.9 Convoluzione in Rn Un’operazione che riguarda gli spazi Lp (Rn ) è la convoluzione, di cui ci limitiamo a segnalare la de…nizione e un paio di proprietà. Teorema 1.124 Se f; g 2 L1 (Rn ) ; allora l’integrale di convoluzione Z (f g) (x) = f (x y) g (y) dy Rn è ben de…nito per q.o. x 2 Rn , e risulta: kf gkL1 (Rn ) kf kL1 (Rn ) kgkL1 (Rn ) : Dimostrazione. Tralasciamo di dimostrare il fatto che la funzione di due variabili f (x y) g (y) è misurabile. Posto questo, proviamo la disuguaglianza delle norme, da cui in particolare segue che la convoluzione è de…nita per quasi ogni x. Z Z Z Z kf gkL1 (Rn ) = f (x y) g (y) dy dx jf (x y) g (y)j dydx Rn Rn Rn Rn scambiando l’ordine di integrazione nell’integrale iterato (operazione lecita per il teorema di Fubini-Tonelli in quanto l’integranda è presa in valore assoluto) Z Z = jg (y)j jf (x y)j dx dy: Rn Ora l’integrale interno è Z jf (x Rn y)j dx = (traslando x y = t) Z = jf (t)j dt = kf kL1 (Rn ) ; Rn Rn perciò kf gkL1 (Rn ) Z Rn jg (y)j kf kL1 (Rn ) dy = kf kL1 (Rn ) kgkL1 (Rn ) : 67 Qualche osservazione. Si noti anzitutto che la de…nizione di convoluzione ha senso tra due funzioni de…nite su tutto lo spazio Rn . Si veri…ca con un cambio di variabile che la convoluzione è commutativa, ossia (f g) = (g f ). Si noti che l’integranda f (x y) g (y), per ogni x …ssato si può vedere come una funzione di y che è il prodotto di due funzioni L1 , quindi in generale non è L1 . Tuttavia il teorema appena dimostrato a¤erma che per quasi ogni x in e¤etti è L1 . Ad esempio, se 1 f (x) = p ( 1;1) (x) ; jxj la funzione f 2 L1 (R) ; quindi f f 2 L1 (R) e in particolare l’integrale Z 1 1 p (f f ) (x) = y) p ( 1;1) (y) dy ( 1;1) (x jyj jx yj R è …nito per q.o. x. Però per x = 0 si ha Z 1 1 p (f f ) (0) = ( 1;1) ( y) p jyj jyj R ( 1;1) (y) dy = Z 1 1 dy = 1: jyj E’facile veri…care direttamente che per ogni x 6= 0 invece l’integrale converge. Vale anche la seguente estensione del teorema precedente, che ci sarà utile: Teorema 1.125 (Disuguaglianza di Young) Siano f 2 L1 (Rn ) e g 2 Lp (Rn ) per qualche p 2 [1; 1] : Allora è ben de…nita per q.o. x la convoluzione f g e si ha: kf gkLp (Rn ) kf kL1 (Rn ) kgkLp (Rn ) : 1.5 Richiami sulle serie di Fourier In analisi 2 si sono studiati i primi elementi della teoria delle serie di Fourier. Richiamiamo velocemente alcuni fatti noti, puntualizzando qualche aspetto che in analisi 2 probabilmente non è stato toccato: 1.5.1 Serie di Fourier in L2 Dal punto di vista moderno, basato cioè sulla teoria della misura e dell’integrazione di Lebesgue (e che si potrà inquadrare in modo naturale nella teoria degli spazi di Hilbert di cui parleremo in seguito), la teoria delle serie di Fourier “funziona bene” nello spazio L2 . Sia f : [0; L] ! R, f 2 L2 (0; L) : Risultano allora ben de…niti (come integrali di Lebesgue) i coe¢ cienti di Fourier di f , Z 2 L ak = f (x) cos (k!x) dx per k = 0; 1; 2; 3; :::: L 0 Z 2 L bk = f (x) sin (k!x) dx per k = 1; 2; 3; ::: L 0 68 con ! = 2L . Infatti, notiamo che se f 2 L2 (0; L), a maggior ragione f 2 L1 (0; L) e quindi anche f (x) cos (k!x) e f (x) sin (k!x) sono integrabili, perciò i coe¢ cienti di Fourier sono ben de…niti. Vale il seguente Teorema 1.126 Per ogni f 2 L2 (0; L) la serie di Fourier 1 a0 X + fak cos (k!x) + bk sin (k!x)g 2 k=1 converge a f in norma L2 (0; T ), il che signi…ca, esplicitamente, che detta n a0 X + fak cos (k!x) + bk sin (k!x)g 2 sn (x) = k=1 la somma parziale n-esima della serie di Fourier di f , risulta ksn f kL2 (0;T ) ! 0 per n ! 1: Valgono inoltre le seguenti proprietà: 1. Uguaglianza di Perceval: ( ) 1 L a20 X 2 2 2 kf kL2 (0;T ) = + ak + bk ; 2 2 k=1 2. Lemma di Riemann-Lebesgue: ak ! 0 e bk ! 0 per k ! 1: Rispetto a quanto lo studente ha probabilmente studiato in analisi 2, si noti che la tesi del teorema vale per qualsiasi funzione L2 (0; T ), in particolare anche per funzioni illimitate o così discontinue da risultare non integrabili secondo Riemann. Si osservi tuttavia che il teorema non dice nulla sull’eventuale convergenza puntuale della serie di Fourier. Per il calcolo e¤ettivo dei coe¢ cienti di Fourier, valgono le solite osservazioni sulle eventuali simmetrie di f : L L se f : 2 ; 2 ! R è una funzione pari, allora bk = 0 per ogni k e 4 ak = L se f : L L 2; 2 Z L 2 f (x) cos (k!x) dx per k = 0; 1; 2; 3; :::: 0 ! R è una funzione dispari, allora ak = 0 per ogni k e bk = 4 L Z L 2 f (x) sin (k!x) dx per k = 1; 2; 3; :::: 0 69 1.5.2 Convergenza puntuale delle serie di Fourier e rapidità di convergenza a zero dei coe¢ cienti Ricordiamo anzitutto il teorema di convergenza puntuale delle serie di Fourier che lo studente ha probabilmente studiato in analisi 2. De…nizione 1.127 Una funzione f : [0; L] ! R si dice regolare a tratti se f è limitata in [0; L] e l’intervallo [0; L] si può suddividere in un numero …nito di intervallini [ k ; k ] tali che: f è derivabile in ( k ; k ) ed esistono …niti lim f (x) e x! k+ lim f 0 (x) e x! lim f (x) ; x! k+ k lim f 0 (x) : x! k Ad esempio, la f può avere un certo numero di punti di discontinuità a salto e di punti angolosi, ma non asintoti verticali né punti a tangente verticale. Si noti che una funzione regolare a tratti è automaticamente limitata e Riemann integrabile, a maggior ragione appartiene a L2 (0; L) : Vale il Teorema 1.128 (di convergenza puntuale delle serie di Fourier) Sia f : [0; L] ! R una funzione regolare a tratti. Allora la serie di Fourier di f converge puntualmente per ogni x0 2 (0; L) alla somma f x+ 0 + f x0 ; 2 mentre nei due estremi 0; L converge puntualmente a f (0+ ) + f (L ) : 2 In particolare, la serie di Fourier converge puntualmente a f per ogni x 2 [0; L] se (oltre ad essere regolare a tratti) la funzione è continua in [0; L] e soddisfa la condizione di raccordo f (0) = f (L). Si osservi che le ultime due ipotesi (grazie alle quali la convergenza puntuale è alla funzione f (x) in ogni punto) si possono sintetizzare dicendo che la periodizzata di f (cioè la funzione de…nita su tutto R, periodica di periodo L, che coincide con f in [0; L]) è continua in R. Un’altra informazione che ci sarà spesso utile è la conoscenza della velocità con cui tendono a zero i coe¢ cienti di Fourier di f . L’idea è che più regolare è f , più velocemente tendono a zero i suoi coe¢ cienti di Fourier. Occorre prestare attenzione però al fatto che è importante in questo contesto la regolarità della periodizzata di f , proprietà che richiede anche le opportune condizioni di raccordo agli estremi dell’intervallo. 70 Per capire la situazione, consideriamo una funzione f 2 C 1 ([0; L]). Indichiamo con ak ; bk i coe¢ cienti di Fourier di f e con k ; k i coe¢ cienti di Fourier di f 0 ; cerchiamo di esprimere k ; k in funzione di ak ; bk . Si ha (per k 1): ( ) Z Z L 2 L 0 2 L f (x) cos (k!x) dx = [f (x) cos (k!x)]0 + k! f (x) sin (k!x) dx k = L 0 L 0 Z 2 2 L = (f (L) f (0)) + k! f (x) sin (k!x) dx: L L 0 Se supponiamo che f soddis… le condizioni di raccordo f (L) = f (0) otteniamo la relazione semplice k = k!bk : Analogamente si trova k = k!ak : Notiamo anche la relazione Z 2 2 L 0 f (x) dx = (f (L) = 0 L 0 L f (0)) = 0: Possiamo sintetizzare queste relazioni nell’identità j kj +j kj = k! (jak j + jbk j) per k = 1; 2; 3:::: (e 0 = 0) Chiediamoci ora se questa relazione continua a valere chiedendo qualcosa meno che f 2 C 1 ([0; L]). La dimostrazione è basata sulla formula di integrazione per parti. Si può dimostrare facilmente la seguente Proposizione 1.129 La formula di integrazione per parti Z Z L 0 f g = f g (L) f g (0) 0 L f g0 0 vale se g 2 C 1 ([0; L]) e f soddisfa le ipotesi più deboli: f 2 C 0 ([0; L]) ; f possiede derivata prima continua, ad eccezione di un numero …nito di punti in cui comunque la derivata prima ha limiti destro e sinistro …niti. In pratica, la g può anche avere un numero …nito di punti angolosi. Dimostrazione. Proviamo la tesi supponendo che f 0 non esista in un unico punto c 2 (0; L), con f 0 (c+ ) ; f 0 (c ) …niti, il discorso si estende a un numero …nito qualsiasi di punti. Si ha: Z 0 L f 0g = Z c f 0g + 0 Z c 71 L f 0 g: Ora su ciascun intervallo [0; c] ; [c; L] la f è C 1 e si può integrare per parti, quindi si ha: Z L Z c Z L f 0 g = (f g) (c) (f g) (0) f g 0 + (f g) (L) (f g) (c) f g0 0 0 = (f g) (L) (f g) (0) Z c L f g0 : 0 Otteniamo così il seguente: Teorema 1.130 (di convergenza totale) Sia f : [0; L] ! R una funzione: a. continua in [0; L] e soddisfacente la condizione di raccordo f (0) = f (L); b. derivabile e con derivata continua in [0; L], salvo al più un numero …nito di punti di [0; L] nei quali comunque esistono …niti i limiti destro e sinistro di f 0. Allora la serie 1 X (jak j + jbk j) k=1 converge, ossia la serie di Fourier di f converge totalmente, quindi assolutamente e uniformemente. Le ipotesi del teorema sono veri…cate in particolare se f : R ! R è una funzione T -periodica e C 1 (R). Dimostrazione. Nelle ipotesi del teorema vale la relazione j kj +j kj = k! (jak j + jbk j) per k = 1; 2; 3:::: (1.9) tra i coe¢ cienti di Fourier ak ; bk di f e i coe¢ cienti k ; k di f 0 . Inoltre, la funzione f 0 è limitata e continua a tratti, perciò certamente L2 ; il che implica per l’uguaglianza di Perceval che 1 X 2 k 2 k + k=1 <1 ossia, per le (1.9), 1 X k=1 k 2 a2k + b2k < 1: (1.10) Possiamo allora scrivere (applicando la disuguaglianza di Swchartz per le serie) 1 X k=1 jak j = 1 X k=1 1 X 1 k jak j k k 2 a2k k=1 !1=2 1 X 1 k2 k=1 e analogamente 1 X k=1 jbk j 1 X k=1 k 2 b2k !1=2 72 1 X 1 k2 k=1 !1=2 : !1=2 P1 Poiché k=1 k12 < 1; la (1.10) implica la tesi. L’argomentazione precedente può essere ora iterata alle derivate successive. Teorema 1.131 (Velocità di convergenza a zero dei coe¢ cienti) Sia f una funzione tale che: a. f 2 C s 1 (R) e L-periodica (cioè C s 1 ([0; L]) e soddisfacente la condizione di raccordo f (0) = f (L), f 0 (0) = f 0 (L),...,f (s 1) (0) = f (s 1) (L)). b. f (s 1) è derivabile e con derivata continua in [0; L], salvo al più un numero …nito di punti di [0; L] nei quali comunque esistono …niti i limiti destro e sinistro di f (s 1) . (Queste ipotesi sono veri…cate in particolare se f 2 C s (R) e L-periodica, o se f 2 C s ([0; L]) e soddisfa le condizioni raccordo su f; f 0 ; ::; f (s 1) , non necessariamente su f (s) ). Allora: i) vale la relazione j kj +j kj s = (k!) (jak j + jbk j) per k = 1; 2; 3:::: tra i coe¢ cienti di Fourier ak ; bk di f e i coe¢ cienti ii) 1 X k 2s a2k + b2k < 1; k; k (1.11) di f (s) ; (1.12) k=1 da cui segue che ak ; bk = o 1 ks per k ! 1 e anche (informazione più precisa) che 1 X k=1 (Si noti che se k (jak j + jbk j) < 1 per ogni <s 1 : 2 è un intero la relazione precedente signi…ca s 1). Dimostrazione. Il punto i) si ottiene applicando iterativamente il ragionamento visto nel teorema precedente. Ancora, poiché f (s 1) è regolare a tratti, in particolare è limitata e integrabile, quindi anche L2 (0; L) e, per l’uguaglianza di Perceval, 1 X 2 2 (1.13) k + k < 1; k=1 dalla (1.11) segue la (1.12), che a sua volta implica che k 2s a2k + b2k ! 0; quindi k s (jak j + jbk j) ! 0, quindi ak ; bk = o k1s per k ! 1. Ancora con la disuguaglianza di Schwartz possiamo dimostrare l’ultima parte della tesi (ragioniamo 73 solo su ak , analogamente si tratta bk ): 1 X k=1 k jak j = 1 X k=1 k s jak j k 1 X k 2s a2k k=1 s !1=2 1 X k 2( s) k=1 !1=2 : Ora la prima serie converge per (1.12), la seconda converge purché sia 2( s) < cioè <s 1; 1 . 2 Ad esempio, per s = 2 il teorema dice che se f : [0; L] ! R, f 2 C 1 [0; L] con f (0) = f (L) ; f 0 (0) = f 0 (L) e inoltre f 0 è regolare a tratti (il che accade se ad es. è f 2 C 2 [0; L] e soddisfa le condizioni di raccordo scritte), allora 1 X k=1 ad esempio, per k (jak j + jbk j) < 1 per ogni < 3 ; 2 = 1, leggiamo che 1 X k=1 k (jak j + jbk j) < 1; a¤ermazione più forte rispetto a ak ; bk = o k12 ; da cui seguirebbe solo k (jak j + jbk j) = o k1 , il che non implica la convergenza della serie. 74 2 2.1 Generalità su equazioni e problemi ai limiti per equazioni a derivate parziali Equazioni lineari del second’ordine Le equazioni alle derivate parziali di cui ci occuperemo nel seguito, ossia quelle di cui abbiamo discusso nel §2 il signi…cato modellistico, condividono diverse importanti proprietà: -sono tutte del second’ordine (occasionalmente si possono ridurre a equazioni del prim’ordine); -sono tutte lineari; -sono (quasi) tutte a coe¢ cienti costanti. Per …ssare le idee, scriviamo nuovamente qualcuna di queste equazioni, a titolo d’esempio: uxx + uyy = f (2.1) (equazione di Poisson in 2 variabili spaziali); ut Duxx + bux cu = f (2.2) (equazione di di¤usione in una variabile spaziale, con termini di trasporto e reazione); utt c2 uxx + but = f (2.3) (equazione della corda vibrante smorzata). Facciamo qualche osservazione sulla linearità dell’operatore. Dire che un’equazione alle derivate parziali è lineare signi…ca che ha la forma Lu = f dove u è la funzione incognita, f un termine noto (se è zero diciamo che l’equazione è omogenea) e L è un operatore di¤ erenziale lineare, ossia tale che, se u1 ; u2 sono funzioni per cui Lu1 e Lu2 sono ben de…nite e se c1 ; c2 sono costanti, L (c1 u1 + c2 u2 ) = c1 Lu1 + c2 Lu2 : Il più generale operatore di¤erenziale lineare del second’ordine in n variabili14 si può scrivere così: Lu (x) = n X aij (x) uxi xj (x) + i;j=1 n X bk (x) uxk (x) + c (x) u (x) (2.4) k=1 (con x 2 Rn ). Si dice parte principale dell’operatore l’insieme dei termini nelle derivate seconde, cioè l’operatore n X aij (x) uxi xj (x) ; i;j=1 1 4 Si osservi il linguaggio: L è un operatore di¤erenziale lineare del second’ordine; Lu = f è un’equazione di¤erenziale lineare del second’ordine. 75 mentre n X bk (x) uxk (x) + c (x) u (x) k=1 si dicono termini di ordine inferiore. Naturalmente occorre precisare uno spazio di funzioni su cui si considera agire l’operatore L. Ad esempio, l’operatore L in (2.4), se i coe¢ cienti aij ; bk ; c sono funzioni continue su un dominio Rn , si può vedere come operatore lineare tra i seguenti spazi vettoriali: L : C2 ! C0 : Tra questi spazi, muniti delle rispettive norme, L risulta anche continuo, in quanto kLukC 0 ( ) n X aij uxi xj i;j=1 0 @ C0( n X )+ k=1 n X i;j=1 kaij kC 0 ( ) + n X k=1 c kukC 2 ( ) : kbk uxk kC 0 ( ) + kcukC 0 ( ) 1 kbk kC 0 ( ) + kckC 0 ( ) A kukC 2 ( ) La linearità dell’equazione ha una serie di conseguenze, che lo studente ha già incontrato nel corso dell’algebra lineare e dello studio delle equazioni di¤erenziali ordinarie. Per cominciare: -la generica soluzione dell’equazione completa si può ottenere sommando la generica soluzione dell’equazione omogenea e una particolare soluzione dell’equazione completa; -la totalità delle soluzioni dell’equazione omogenea è uno spazio vettoriale (nelle ipotesi fatte sopra, un sottospazio di C 2 . Altre proprietà conseguenze della linearità saranno illustrate in seguito in relazione alle condizioni al contorno. 2.2 Equazioni ellittiche, paraboliche, iperboliche Le equazioni a derivate parziali lineari del second’ordine possono presentare proprietà matematiche molto diverse le une dalle altre, coerentemente al signi…cato …sico molto diverso che hanno le equazioni incontrate …n qui. La proprietà matematica che discrimina queste situazioni è espressa dalla seguente de…nizione. De…nizione 2.1 (Equazioni ellittiche, paraboliche, iperboliche) Sia Lu (x) = n X aij (x) uxi xj (x) + i;j=1 n X k=1 76 bk (x) uxk (x) + c (x) u (x) un’equazione alle derivate parziali, lineare del second’ordine de…nita per x 2 Rn , e consideriamo, per un certo x0 2 …ssato, la forma quadratica; q : Rn ! R n X q : h 7! aij (x0 ) hi hj i;j=1 (si può sempre supporre che la matrice aij sia simmetrica). Si dice che: l’operatore L è ellittico (in x0 ) se la forma quadratica q è de…nita (positiva o negativa); l’operatore L è iperbolico (in x0 ) se la forma quadratica q è inde…nita; l’operatore L è parabolico (in x0 ) se la forma quadratica q è semide…nita (positiva o negativa). Diremo che l’operatore L è ellittico, o iperbolico, o parabolico in se lo è in ogni punto di : Analoga terminologia si usa per l’equazione Lu = f , cioè: qualunque sia il termine noto f , diremo che l’equazione è ellittica, parabolica, iperbolica (in un punto o in un dominio), se lo è l’operatore L. Osservazione 2.2 Se L in particolare è a coe¢ cienti costanti, l’operatore è di uno stesso tipo in tutto Rn ; se l’operatore ha coe¢ cienti variabili, può anche essere di tipo diverso in punti diversi dello spazio, come vedremo con gli esempi. Si noti che la de…nizione di operatore ellittico, parabolico, iperbolico dipende solo dalla parte principale dell’operatore di¤ erenziale, cioè dai termini nelle derivate seconde15 . Esempio 2.3 (a). L’operatore di Laplace in Rn ; u= n X uxi xi i=1 ha forma quadratica q (h) = n X i=1 2 h2i = jhj ; che è de…nita positiva. Perciò è un operatore ellittico in Rn . (b) Di conseguenza sono operatori ellittici in Rn anche gli operatori Lu = u+ n X bk (x) uxk + c (x) u k=1 in quanto, come già osservato, il tipo di operatore dipende solo dalla parte principale, cioè del second’ordine. 1 5 Ma su questo preciseremo qualcosa più avanti per quanto riguarda le equazioni paraboliche. 77 (c) L’operatore delle onde in n variabili spaziali (detto anche operatore di D’Alembert o Dalembertiano e indicato con ) u = utt c2 u con laplaciano in Rn ha forma quadratica (in Rn+1 ; chiamando xn+1 la variabile t) n X q (h) = h2n+1 c2 h2i i=1 inde…nita, quindi è un operatore iperbolico in tutto Rn+1 . (d) L’operatore del calore in n variabili spaziali Hu = ut D u (con D > 0 e laplaciano in Rn ) ha forma quadratica (in Rn+1 ; chiamando xn+1 la variabile t) n X q (h) = D h2i i=1 n+1 semide…nita negativa in R (si ricordi che la forma quadratica q “non si accorge” dai termini del prim’ordine, in questo caso di ut ), quindi H è parabolico. (e) L’operatore di Tricomi in R2 T u = yuxx + uyy è ellittico nel semipiano y > 0, iperbolico nel semipiano y < 0, parabolico sulla retta y = 0. Ecco un esempio signi…cativo di operatore che cambia tipo da punto a punto (si dice “operatore di tipo misto”).16 Osservazione 2.4 Con riferimento all’esempio (d), osserviamo che solitamente si riserva il nome di operatore parabolico, in n + 1 variabili, a un operatore che si possa scrivere nella forma: uxn+1 + Eu con E operatore ellittico nelle prime n variabili. In altre parole, la forma quadratica è semide…nita in Rn+1 ma è de…nita in Rn , e l’operatore di¤ erenziale contiene la derivata prima nella variabile che manca nella parte del second’ordine. L’operatore di Laplace è il prototipo di operatore ellittico; questi operatori dal punto di vista …sico si possono vedere come operatori stazionari che 1 6 Quest’equazione è stata studiata, per primo, da Tricomi nel 1923, e interviene nello studio dei ‡uidi transonici. Nello studio dell’aerodinamica, la regione ellittica corrisponde ad un ‡usso subsonico, la regione parabolica alla barriera del suono e la regione iperbolica alla propagazione supersonica delle onde di shocks. 78 esprimono, tipicamente, lo stato di un sistema …sico in equilibrio, in qualche senso. L’operatore del calore è il prototipo di operatore parabolico; gli operatori parabolici17 dal punto di vista …sico si possono vedere come operatori di evoluzione che esprimono, tipicamente, un fenomeno di di¤usuione (eventualmente accompagnato da fenomeni di trasporto e / o reazione). L’operatore delle onde è il prototipo di operatore iperbolico; sono operatori iperbolici quegli operatori d’evoluzione che, dal punto di vista …sico, esprimono un fenomeno ondulatorio o vibratorio. 2.3 Condizioni al contorno Ogni modello di¤erenziale che traduce un problema …sico speci…co, normalmente a¢ anca all’equazione alle derivate parziali che esprime le leggi …siche che governano il sistema anche certe condizioni, inziali o al contorno, che contengono dati del problema, ma esprimono anche certe ipotesi sul sistema stesso. Non è mai l’equazione a derivate parziali da sola a determinare un’unica soluzione; piuttosto possiamo sperare che una e una sola soluzione esista per il problema costituito da equazione + condizioni. Che tipo di condizioni si possono a¢ ancare a una certa equazione di¤erenziale? Questo dipende naturalmente dal signi…cato …sico del problema ma, come al solito, la matematica aiuta a mettere ordine nella casistica: a un certo tipo di equazione (ellittica, parabolica, iperbolica) corrispondono certi tipi naturali di condizioni. Facciamo una prima panoramica su questi tipi di condizioni, che ritroveremo poi caso per caso studiando nel seguito i vari problemi. 2.3.1 Equazioni ellittiche. Problemi al contorno Consideriamo, come esempio di equazione ellittica, l’equazione di Poisson in R3 : u uxx + uyy + uzz = f in R3 . Immaginiamo di studiare il campo elettrostatico in una certa regione dello spazio in cui sono posti alcuni corpi conduttori, su ciascuno dei quali è posta una certa distribuzione di carica; inoltre nello spazio è assegnata una distribuzione volumica di carica. Se è la regione dello spazio tra i conduttori, possiamo immaginare che sia noto il potenziale elettrostatico sulla super…cie di ciascun conduttore (cioè sul bordo di ), e a partire da questo e dalla distribuzione di carica f nello spazio vogliamo determinare il potenziale in tutto la regione : Siamo così condotti al problema: u = f in u = g su @ : (2.5) Oppure, supponiamo che u sia la temperatura di un corpo tridimensionale , omogeneo, sogggetto a sorgenti di calore interno (ad es. per irraggiamento) 17 o più precisamente, quelli che soddisfano le ipotesi descritte nell’Osservazione precedente. 79 espresse dal termine di sorgente f , nell’ipotesi che il sistema abbia raggiunto uno stato di equilibrio termico, ossia che la temperatura non cambi più nel tempo (stato stazionario). Possiamo pensare di misurare la temperatura di u sul bordo di (o anche di imporre una determinata temperatura sul bordo di , termostatandolo), e a partire da queste informazioni possiamo pensare che risulti determinata la temperatura in tutto il corpo. La u soddisferà ancora un problema (2.5). Più in generale: De…nizione 2.5 Si dice problema di Dirichlet per un’equazione Lu = f in Rn un problema del tipo Lu = f in u = g su @ : (2.6) con g dato al bordo assegnato. Se g = 0 si dice problema di Dirichlet omogeneo. Il problema di Dirichlet ha senso quando ha un bordo, quando cioè l’equazione non si studia sullo spazio intero. In quest’ultimo caso, l’analogo del problema di Dirichlet consiste nell’imporre che u soddis… una certa condizione all’in…nito, ad esempio: u = f in R3 u (x) ! 0 per x ! 1: Torniamo all’interpretazione di u = f come equazione di di¤usione del calore in stato stazionario. Invece di imporre una certa temperatura al bordo, potremmo sapere che il corpo è termicamente isolato al contorno, cioè che non c’è ‡usso di calore al bordo. Poiché la densità di ‡usso di calore è proporzionale al gradiente della temperatura, l’assenza di ‡usso attraverso il bordo di si descrive con l’annullarsi della derivata di u nella direzione normale: u = f in = 0 su @ @u @ dove @u = ru e , @ si dice derivata normale, e e è il versore normale uscente dalla super…cie. Più in generale potremmo assegnare il ‡usso di calore (diverso da zero) uscente dalla super…cie, imponendo: u = f in @u @ = g su @ : Il ‡usso sarà punto per punto uscente o entrante a seconda che sia g < 0 o g > 0. (Ricordare che il gradiente della temperatura ha verso opposto al ‡usso di calore). 80 De…nizione 2.6 Si dice problema di Neumann per un’equazione Lu = f in Rn un problema del tipo Lu = f in @u @ = g su @ : (2.7) con g dato al bordo assegnato. Se g = 0 si dice problema di Neumann omogeneo. Continuando l’esempio della di¤usione del calore, un corpo potrebbe essere lasciato libero di scambiare calore con l’ambiente esterno: in questo caso il ‡usso di calore sarà proporzionale al salto di temperatura, ossia, supponendo che l’ambiente esterno abbia costante u0 , varrà @u = k (u0 @ u) con k > 0 (costante o variabile da punto a punto). L’equazione esprime il fatto che c’è un ‡usso di calore entrante (quindi @u @ > 0) se l’ambiente esterno è più caldo del corpo, cioè se u0 > u. In generale: De…nizione 2.7 Si dice problema di Robin per un’equazione Lu = f in un problema del tipo Lu = f in (2.8) @u @ + ku = g su @ : con g dato al bordo assegnato, k > 0. Se g = 0 si dice problema di Robin omogeneo. In…ne: De…nizione 2.8 Si dice problema misto per un’equazione Lu = f in problema del tipo 8 < Lu = f in u = g su 1 : @u 2 @ = h su dove @ = 1 [ 2; 1 \ 2 un = ?, con f; g assegnate. In altre parole, un problema misto è un problema in cui si assegna una condizione di tipo Dirichlet su una parte del bordo del dominio, e una condizione di tipo Neumann su un’altra parte del bordo del dominio. 2.3.2 Equazioni paraboliche. Problemi al contorno e ai valori iniziali Consideriamo, come esempio di equazione parabolica, l’equazione del calore in R3 : ut (t; x) D u (t; x) ut D (uxx + uyy + uzz ) = f (t; x) per x 2 R3 ; t > 0: Supponiamo quindi che u sia la temperatura di un corpo tridimensionale , omogeneo, sogggetto a sorgenti di calore interno espresse dal termine di 81 sorgente f , eventualmente dipendente anche dal tempo, e ora non supponiamo che il sistema abbia già raggiunto l’equilibrio (come nel caso dell’equazione di Poisson). Come nel caso stazionario, possiamo pensare di imporre (o misurare) la temperatura al bordo del dominio, oppure di imporre (o misurare) un certo ‡usso termico attraverso il bordo del dominio. In ogni caso, trattandosi di un problema di evoluzione, per determinare la temperatura a qualunque istante t > 0 dovremo anche conoscere la temperatura iniziale. Problemi sensati sono quindi i seguenti: De…nizione 2.9 Si dice problema di Cauchy-Dirichlet per un’equazione ut Lu = f (con L operatore ellittico in Rn ; del tipo L = D +termini di ordine inferiore) in un dominio ft > 0g un problema del tipo 8 < ut Lu = f per x 2 ; t > 0 u (t; x) = g (t; x) per x 2 @ ; t > 0 (2.9) : u (0; x) = h (x) per x 2 : con g dato al bordo assegnato, h condizione iniziale assegnata. Se g = 0 o h = 0 si dice problema di Cauchy-Dirichlet con condizioni di Dirichlet (o di Cauchy, rispettivamente) omogenee. De…nizione 2.10 Si dice problema di Cauchy-Neumann per un’equazione ut Lu = f (con L operatore ellittico in Rn , del tipo L = D +termini di ordine inferiore in x) in un dominio ft > 0g un problema del tipo 8 < ut Lu = f per x 2 ; t > 0 @u (2.10) (t; x) = g (t; x) per x 2 @ ; t > 0 : @ u (0; x) = h (x) per x 2 : con g dato al bordo assegnato, h condizione iniziale assegnata. Se g = 0 o h = 0 si dice problema di Cauchy-Neumann con condizioni di Neumann (o di Cauchy, rispettivamente) omogenee. Analogamente si può de…nire un problema di Cauchy-Robin o un problema di Cauchy con condizioni miste di Dirichlet-Neumann. Qualche osservazione. Se per la natura del problema la regione spaziale è tutto lo spazio, si può studiare il problema di Cauchy: ut Lu = f per x 2 Rn ; t > 0 u (0; x) = h (x) per x 2 Rn : In tutti i problemi precedenti, l’intervallo t > 0 può essere sostituito dall’intervallo t 2 (0; T ) : Un dominio di Rn+1 del tipo (0; 1) o (0; T ) si dice dominio cilindrico. Si noti che in un problema di Cauchy-Dirichlet o di Cauchy-Neumann su un cilindro QT = (0; T ), complessivamente i dati sono assegnati sull’insieme f(x; 0) : x 2 g [ f(x; t) : x 2 @ ; t 2 [0; T ]g : 82 Questo insieme prende il nome di frontiera parabolica del cilindro QT , e talvolta indicato con @P QT . Si noti che la frontiera parabolica del cilindro è una parte della frontiera del cilindro, precisamente è la sua frontiera privata del “coperchio” del cilindro f(x; T ) : x 2 g : 2.3.3 Equazioni iperboliche. Problemi al contorno e ai valori iniziali Consideriamo, come esempio di equazione iperbolica, l’equazione delle onde in due variabili spaziali: utt c2 u = utt c2 (uxx + uyy ) = f in R2 che, come già discusso, si può vedere come l’equazione della membrana vibrante (per piccole vibrazioni). Fissare la membrana al contorno signi…ca imporre il valore di u, quindi una condizione di Dirichlet. Per determinare il moto della membrana dovremo conoscere però anche le condizioni iniziali, ossia la posizione e la velocità della membrana (trattandosi di un’equazione del second’ordine in t, a di¤erenza dell’equazione del calore). Quindi: De…nizione 2.11 Si dice problema di Cauchy-Dirichlet per un’equazione iperbolica utt Lu = f (con L operatore del tipo L = c2 +termini di ordine inferiore in x e t; per x 2 Rn ; t > 0) un problema del tipo 8 utt Lu = f per x 2 ; t > 0 > > < u (t; x) = g (t; x) per x 2 @ ; t > 0 (2.11) u (0; x) = u0 (x) per x 2 > > : ut (0; x) = v0 (x) per x 2 con g dato al bordo assegnato, u0 ; v0 condizioni iniziali assegnata. Se g = 0 oppure (u0 = 0 e v0 = 0) si dice problema di Cauchy-Dirichlet con condizioni di Dirichlet (o di Cauchy, rispettivamente) omogenee. Una condizione al contorno del tipo @u @ = 0, nel modello della membrana vibrante (o, più realisticamente, nel modello della corda vibrante, in una sola variabile spaziale) ha il signi…cato di richiedere che la membrana al bordo sia …ssata in modo da poter scorrere verticalmente senza attrito su una guida. Diamo comunque una de…nizione generale: De…nizione 2.12 Si dice problema di Cauchy-Neumann per un’equazione iperbolica utt Lu = f (con L operatore del tipo L = c2 +termini di ordine inferiore in x e t; per x 2 Rn ; t > 0) un problema del tipo 8 utt Lu = f per x 2 ; t > 0 > > < @u @ (t; x) = g (t; x) per x 2 @ ; t > 0 (2.12) u (0; x) = u0 (x) per x 2 > > : ut (0; x) = v0 (x) per x 2 con g dato al bordo assegnato, u0 ; v0 condizioni iniziali assegnata. Se g = 0 oppure (u0 = 0 e v0 = 0) si dice problema di Cauchy-Neumann con condizioni di Neumann (o di Cauchy, rispettivamente) omogenee. 83 Come per il problema parabolico, se per la natura del problema la regione spaziale è tutto lo spazio, si può studiare anche il problema di Cauchy puro: 8 < ut Lu = f per x 2 Rn ; t > 0 u (0; x) = u0 (x) per x 2 Rn : ut (0; x) = v0 (x) per x 2 Rn Ancora, in tutti i problemi precedenti, l’intervallo t > 0 può essere sostituito dall’intervallo t 2 (0; T ) : 2.4 Principio di sovrapposizione Osserviamo ora che tutte le condizioni al contorno e ai valori iniziali che abbiamo descritto nel paragrafo precedente sono anch’esse di tipo lineare. Questo signi…ca che ciascuna condizione (di Cauchy, Dirichlet, Neumann...) è espressa da un’equazione del tipo Bu = f con u funzione incognita, f dato assegnato, B operatore lineare tra opportuni spazi di funzioni. Ad esempio, il problema (2.11), si può scrivere astrattamente in questa forma 8 Lu = f per x 2 ; t > 0 > > < B1 u (t; x) = g (t; x) per x 2 @ ; t > 0 B2 u (0; x) = u0 (x) per x 2 > > : B3 u (0; x) = v0 (x) per x 2 dove, se la funzione incognita si cerca nello spazio X = C2 ( [0; 1) \ C 1 ( (0; 1)) \ C 0 [0; 1)) (ossia: chiediamo due derivate continue all’interno del dominio, dov’è soddisfatta la condizione; chiediamo che la u sia continua …no al bordo del dominio spaziale, per assumere il dato al bordo di Dirichlet, e chiediamo che sia C 1 …no a t = 0 per poter assumere il dato di Cauchy) avremo: L : X ! C0 ( (0; 1)) L : u 7! utt Lu B1 : X ! C 0 (@ B1 : u 7! u=@ [0; 1)) B2 : X ! C 1 ( ) B2 : u 7! u (0; ) B3 : X ! C 0 ( ) B3 : u 7! ut (0; ) 84 dove L; B1 ; B2 ; B3 sono operatori lineari tra gli spazi vettoriali indicati18 . Questo ha un’utile conseguenza, che prende il nome di principio di sovrapposizione. Invece di darne subito un’enunciazione astratta, lo spieghiamo prima sull’esempio precedente. Esempio 2.13 Supponiamo di voler risolvere il problema 8 Lu = f per x 2 ; t > 0 > > < B1 u (t; x) = g (t; x) per x 2 @ ; t > 0 (P ) : B2 u (0; x) = u0 (x) per x 2 > > : B3 u (0; x) = v0 (x) per x 2 : Consideriamo i 4 problemi, simili ma più semplici (ognuno ha 3 dati nulli su 4): 8 Lu1 = f per x 2 ; t > 0 > > < B1 u1 (t; x) = 0 per x 2 @ ; t > 0 (P 1) : B2 u1 (0; x) = 0 per x 2 > > : B3 u1 (0; x) = 0 per x 2 : 8 Lu2 = 0 per x 2 ; t > 0 > > < B1 u2 (t; x) = g (t; x) per x 2 @ ; t > 0 (P 2) : B2 u2 (0; x) = 0 per x 2 > > : B3 u2 (0; x) = 0 per x 2 : 8 per x 2 ; t > 0 > > Lu3 = 0 < B1 u3 (t; x) = 0 per x 2 @ ; t > 0 (P 3) : B u (0; x) = u (x) per x 2 > 2 3 0 > : B3 u3 (0; x) = 0 per x 2 : 8 Lu4 = 0 per x 2 ; t > 0 > > < B1 u4 (t; x) = 0 per x 2 @ ; t > 0 (P 4) : B u (0; x) = 0 per x 2 > 2 4 > : B3 u4 (0; x) = v0 (x) per x 2 : Supponiamo che u1 ; u2 ; u3 ; u4 siano rispettivamente soluzioni di (P 1), (P 2), (P 3), (P 4) : Allora u = u1 + u2 + u3 + u4 è soluzione di (P ). Questo fatto è un’ovvia conseguenza della linearità di tutti gli operatori coinvolti. L’a¤ermazione appena fatta sull’esempio speci…co costituisce appunto il principio di sovrapposizione (che vale per un problema del tipo di cui stiamo parlando, ossia per un’equazione linerare, con condizioni iniziali e al contorno lineari): La soluzione di un problema avente più dati non nulli (intendendo per “dati” sia il termine noto dell’equazione che le condizioni iniziali e il dato al bordo) si può ottenere per sovrapposizione delle soluzioni di più problemi, ciascuno avente un solo dato non nullo. 1 8 Sono anche operatori lineari continui, come lo studente può facilmente controllare; tuttavia in questo momento l’informazione che ci interessa è solo la linearità. 85 Questo è utile sia dal punto di vista pratico (spezzare la soluzione di un problema complesso nella soluzione di più sottoproblemi semplici) sia dal punto di vista teorico (spezzare la dimostrazione di teoremi di esistenza per la soluzione di un problema in sottoteoremi più semplici). A volte, inoltre, la soluzione di qualcuno dei sottoproblemi più semplici si può indovinare facilmente: Esempio 2.14 Si vuole risolvere: u = f in u = 1 su @ : La soluzione si può ottenere nella forma u = u1 + u2 dove u1 = f in u1 = 0 su @ (2.13) u2 = 0 in u2 = 1 su @ : Ma la soluzione di quest’ultimo problema è u2 1 (la funzione costante = 1 ha laplaciano nullo e soddisfa la condizione al contorno 1), quindi u (x) = u1 (x) + 1; con u1 soluzione del problema di Dirichlet omogeneo (2.13). Questo è il sottoproblema interessante da risolvere, mentre il secondo era banale. 2.5 Problemi ben posti Discutendo i tipi di problemi iniziali e al contorno ci siamo appellati soprattutto al signi…cato …sico dei problemi. Dal punto di vista matematico, può restare la domanda se questi problemi siano formulati in modo tale che sia ragionevole poi poter ottenere una soluzione, e una sola. Perché, ad esempio, per l’equazione della corda vibrante dobbiamo prescrivere sia il valore iniziale di u che il valore iniziale di ut mentre per l’equazione del calore prescriviamo solo il valore di u? Non sarà “chiedere troppo” la prima richiesta (e così magari cade l’esistenza di soluzione), oppure “chiedere troppo poco”la seconda (e così magari cade l’unicità)? Come accennato, quale sia il tipo giusto di condizioni al contorno dipende dalle proprietà matematiche di un’equazione. C’è poi un’altra questione importante. Ci piacerebbe che, assegnati i dati in certi spazi di funzioni, non solo la soluzione corrispondente esistesse e fosse unica, ma variasse di poco se qualcuno dei dati varia di poco (“dipendenza continua dai dati”). Infatti nelle applicazioni …siche i dati sono sempre conosciuti con una certa approssimazione, quindi se non sappiamo che un piccolo errore nei dati porta un piccolo errore nella soluzione, questo rende di scarso interesse pratico il calcolo della soluzione. Quest’insieme di “proprietà desiderabili” per un problema di¤erenziale è sintetizzato in una de…nizione ben precisa: 86 De…nizione 2.15 (Problema ben posto) Si dice che un problema 8 Lu = f > > < B1 u = g1 ::: > > : Bk u = gk (2.14) (dove L è l’operatore di¤ erenziale, f il termine noto, g1 ; :::; gk i dati iniziali e / o al bordo) è ben posto quando sono de…niti: uno spazio vettoriale normato S in cui cerchiamo la soluzione, spazi vettoriali D0 ; D1 ; D2 ; :::; Dk in cui assegnamo, rispettivamente, il termine noto f e i dati g1 ; :::; gk , e si ha che: 1. Per ogni scelta di f 2 D0 ; g1 2 D1 ; :::; gk 2 Dk esiste u 2 S soluzione del problema; 2. tale soluzione è unica; 3. tale soluzione dipende con continuità dai dati, il che signi…ca che l’operatore lineare che ai dati associa la soluzione è continuo, ossia esiste una costante c > 0 tale che per ogni scelta di f 2 D0 ; g1 2 D1 ; :::; gk 2 Dk la soluzione corrispondente u soddisfa: kukS c kf kD0 + kg1 kD1 + ::: + kgk kDk : Notiamo che l’ultima disuguaglianza, normalmente detta “stima a priori sulla soluzione” o “stima di stabilità” garantisce e¤ettivamente che un piccolo errore sui dati porti un piccolo errore sulla soluzione, per la linearità dell’operatore. Supponiamo che u1 ; u2 siano, rispettivamente, le soluzioni dei problemi relativi (1) (1) (2) (2) ai dati f (1) ; g1 ; :::; gk e f (2) ; g1 ; :::; gk : Allora per la linearità del problema (1) (2) (1) (2) u1 u2 è soluzione del problema relativo ai dati f (1) f (2) ; g1 g1 ; :::; gk gk e per la stima di stabilità ku1 u2 kS c f (1) f (2) (1) D0 + g1 (1) (2) g1 D1 + ::: + gk (2) gk Dk : Il secondo membro è piccolo se lo scarto tra i due insiemi di dati è piccolo (piccolo errore nei dati), quindi sarà piccolo (o comunque controllato) il primo membro, ossia l’errore nella soluzione. Facciamo ora qualche osservazione in più sulla questione dell’unicità. 1. Dimostrare l’unicità della soluzione di un problema signi…ca dimostrare che due eventuali soluzioni u1 ; u2 dello stesso problema devono coincidere. Ma per la linearità del problema, se u1 ; u2 risolvono entrambe il problema (2.14), la di¤erenza u = u1 u2 soddisferà l’analogo problema con dati omogenei, ossia: 8 Lu = 0 > > < B1 u = 0 (2.15) ::: > > : Bk u = 0 Questo allora detta la strategia tipica per dimostrare l’unicità della soluzione: si suppone che u risolva il corrispondente problema con termine noto e dati tutti 87 nulli, e si mostra che questa u necessariamente è la funzione identicamente nulla. Lo faremo varie volte in seguito. 2. Un teorema di unicità ha una grande utilità pratica, contrariamente a quanto si potrebbe credere. Nel risolvere un problema per equazioni a derivate parziali, quasi mai si riesce, come per le equazioni di¤erenziali ordinarie, a determinare in un primo tempo l’integrale generale per poi imporre le condizioni. Di solito si cerca a priori una soluzione di qualche forma speciale che: (a) è più semplice, consentendo calcoli espliciti; (b) tiene già conto di qualcuna delle condizioni, ad esempio l’annullarsi al bordo. Se procedendo così si arriva a determinare una soluzione, come possiamo essere certi di non aver “perso per strada” qualche altra soluzione? Dopo tutto il nostro procedimento risolutivo non è stato sistematico, ma ha fatto a priori l’ipotesi che la soluzione si potesse scrivere in un certo modo. Se ci fossero soluzioni di altro tipo? Ma se sappiamo che vale un teorema di unicità, sappiamo di non aver perso nulla: se (con qualunque procedimento) abbiamo trovato una soluzione, certamente altre non ce ne sono. Questa è un’informazione molto utile, quindi. Solitamente noi procederemo così. 1. Prima si stabilisce, con la strategia detta, l’unicità per il problema. Questo si saprà fare spesso sotto ipotesi piuttosto generali. 2. Poi a¤ronteremo il problema in situazioni speci…che: tipicamente, su domini di forma piuttosto semplice ed esplicitamente noti, e con condizioni al contorno o iniziali di tipo semplice. In queste condizioni, cercheremo di ottenere esplicitamente una soluzione, con metodi di separazione delle variabili, serie di Fourier, trasformate, funzioni speciali... 3. A partire dalla formula di rappresentazione esplicita ottenuta per la soluzione, cercheremo di provare sotto quali ipotesi precise sui dati il risultato ottenuto è valido; quindi il quadro di spazi funzionali sarà in parte precisato a posteriori. 4. Sempre dalla formula di rappresentazione trovata, talvolta dedurremo una stima di stabilità per la soluzione. Riguardo al punto 2, notiamo che le tecniche di risoluzione esplicita di un problema di¤erenziale in geometria semplice rappresentano la prima strada che storicamente si è seguita. Naturalmente, quando il dominio ha una forma complicata (o non nota esplicitamente), o quando l’equazione contiene termini con coe¢ cienti variabili (generici), questo approccio esplicito non può essere seguito. Sono stati messi a punto quindi strumenti teorici molto astratti e so…sticati per dimostrare ancora la buona posizione del problema, e poi per mettere a punto strumenti di risoluzione numerica approssimata dei problemi stessi. In questo corso però non ci occuperemo di questi aspetti, che richiederebbero un investimento ben superiore nello studio di teorie astratte. 88 3 3.1 Metodo di separazione di variabili e sviluppi di Fourier per problemi ai limiti Equazione di Laplace e di Poisson Abbiamo già incontrato (§2) l’equazione di Poisson u=f (detta equazione di Laplace quando f = 0), dove il laplaciano di¤erenziale = è l’operatore @2 @2 @2 + + (o l’analogo in solo una o due dimensioni), @x2 @y 2 @z 2 e abbiamo descritto alcuni dei suoi signi…cati …sici: 1. u potenziale elettrostatico (o gravitazionale) generato da un campo dovuto a una distribuzione continua di cariche (rispettivamente, di masse) di densità f (rispettivamente, f ); 2. u temperatura in un corpo omogeneo, in stato stazionario, in regime di sola di¤usione, in presenza di sorgenti o pozzi di calore di densità f ; 3. u concentrazione di una sostanza disciolta in soluzione, in stato stazionario, in regime di sola di¤usione, in presenza di sorgenti o pozzi (di questa sostanza) di densità f ; 4. (per n = 2) altezza di una membrana in equilibrio. Abbiamo anche discusso (§4.3.1) alcuni tipici problemi ai limiti che si affrontano per quest’equazione, e visto il signi…cato …sico delle varie condizioni (di Dirichlet, Neumann, Robin o miste). Vediamo ora di stabilire alcuni risultati molto generali per questi problemi, utili ad inquadrare i problemi ai limiti che poi studieremo. Successivamente a¤ronteremo esplicitamente alcuni di questi problemi ai limiti, su domini di geometria semplice. 3.1.1 Unicità, principio di massimo, dipendenza continua Risultati di unicità per problemi ai limiti In tutta questa sezione ci limitiamo a trattare problemi ai limiti nel caso tridimensionale (che contiene come casi particolari quelli bi e mono dimensionali), ma tutta questa discussione si potrebbe fare per il laplaciano in n dimensioni, con n qualsiasi. Sia R3 un dominio (cioè un insieme aperto e connesso) limitato, dalla frontiera regolare a pezzi (quanto basta perché si possa applicare su il teorema della divergenza). Consideriamo un problema al contorno per l’equazione di Poisson u = f in , con condizione al contorno di uno dei tipi visti nel §4.3.1, quindi: condizione di Dirichlet u = f su @ , oppure condizione di Neumann @u @ = f su @ , oppure 89 condizione di Robin @u (con k > 0), @ + ku = f su @ o eventualmente condizioni miste (cioè su due parti della frontiera sono assegnate due diverse condizioni di questi tipi). Vogliamo dimostrare che per un problema di questi tipi la soluzione, se esiste, è unica (con un’importante precisazione nel caso della condizione di Neumann). Un enunciato preciso è il seguente: Teorema 3.1 (di unicità) Sia R3 un dominio come sopra speci…cato. La 2 1 funzione u 2 C ( ) \ C che risolve il problema di Dirichlet u = f in u = g su @ con f 2 C 0 ( ) ; g 2 C 0 (@ ) assegnate, se esiste è unica. Lo stesso vale nel caso di una condizione al contorno di Robin. Per la condizione al contorno di Neumann, la soluzione, se esiste, è unica a meno di costante additiva. L’unicità vale anche per i problemi misti. Osservazione 3.2 Notiamo che l’ipotesi u 2 C 1 (cioè C 1 …no al bordo dell’insieme) è naturale per le condizioni di Neumann e di Robin, che coinvolgono la derivata di u sul bordo, mentre è un po’ troppo forte per il problema di Dirichlet, per cui ci aspetteremmo u 2 C 0 (oltre ovviamente alla condizione u 2 C 2 ( ), se vogliamo che u risolva all’interno di l’equazione di¤ erenziale). Vedremo poi come nel caso del problema di Dirichlet si possa e¤ ettivamente migliorare questo risultato stabilendo l’unicità nella classe C 2 ( ) \ C 0 . Dimostrazione. Come abbiamo visto nel §4.5, dimostrare l’unicità equivale a provare il seguente enunciato: se u 2 C 2 ( ) \ C 1 risolve l’equazione omogenea u = 0 in con condizione di Dirichlet (o degli altri tipi) nulla, allora u è identicamente nulla in : Utilizziamo la prima identità di Green (v. §1.2) ZZZ ZZZ ZZ @g f gdxdydz + rf rgdxdydz = f dS @n e @ valida per ogni coppia di funzioni: f 2 C1 ( ) \ C ; g 2 C2 ( ) \ C1 : Applichiamola a f = g = u e abbiamo ZZZ ZZZ ZZ 2 u udxdydz + jruj dxdydz = @ che, essendo u = 0; dà ZZZ 2 jruj dxdydz = 90 ZZ @ u @u dS: @ne u @u dS @ne Ora: se u soddisfa una condizione di Dirichlet o di Neumann nulla, su @ @u u = 0 o @n = 0; in ogni caso l’integrale a secondo membro è nullo, quindi e ZZZ è 2 jruj dxdydz = 0: 2 Questo implica che jruj = 0 in cioè u =costante in . Se vale la condizione di Dirichlet, essendo u zero al bordo la u è identicamente nulla; se vale la condizione di Neumann possiamo concludere solo che u è costante, cioè la soluzione del problema di partenza è determinata a meno di costante arbitraria additiva. Se poi vale la condizione di Robin omogenea, cioè @u + ku = 0 su @ @ deduciamo da cui di nuovo ZZZ 2 jruj dxdydz = ZZZ (con k > 0) ZZ ku2 dS 0; @ 2 jruj dxdydz = 0 e la condizione di Robin implica e u costante. Di conseguenza @u @ = 0 su @ perciò u = 0 su @ , e perciò u identicamente nulla in . Dai ragionamenti precedenti si ottiene anche l’unicità per i problemi misti (Dirichlet / Neumann o Robin / Dirichlet o Numann / Robin). Osservazioni sul problema di Neumann Il fatto che la soluzione di un problema di Neumann sia determinata a meno di costante additiva si capisce se si ri‡ette sul fatto che in un problema u = f in = g su @ @u @ (3.1) la u compare solo mediante le sue derivate, quindi è chiaro che se u (x) è soluzione anche u (x) + c lo è. Il problema di Neumann ha anche un’altra particolarità19 . Non solo la soluzione, se esiste, non è unica, ma la la soluzione non può esistere se i dati 1 9 Si ri‡etta sulla seguente analogia con l’algebra lineare. Per un sistema lineare di n equazioni in n incognite possono capitare due situazioni diverse. O il determinante della matrice è diverso da zero, e allora (teorema di Cramer) per ogni scelta dei termini noti c’è soluzione, e la soluzione è unica. Oppure il determinante della matrice è uguale a zero, e allora la soluzione esiste solo per certi termini noti (teorema di Rouché-Capelli) e se esiste non è unica, ma ne esistono in…nite. I problemi di Dirichlet e di Neumann sono problemi lineari in cui nel primo caso c’è esistenza e unicità per ogni scelta del dato, nel secondo caso non c’è esistenza per ogni dato, e quando c’è non c’è unicità. L’analogia non è casuale ma ha le sue radici nella teoria degli operatori lineari tra spazi di Banach (teorema dell’alternativa di Fredholm ), di cui però in questo corso non ci occupiamo. 91 non soddisfano un’opportuna condizione di compatibilità. Per capire questo fatto, sia u soluzione del problema di Neumann (3.1); integriamo ambo i membri dell’equazione in e applichiamo il teorema della divergenza: ZZZ ZZZ ZZ ZZ @u f dxdydz = udxdydz = dS = gdS: @ @ @ L’uguaglianza ottenuta ZZZ f dxdydz = ZZ gdS @ coinvolge solo i dati del problema, non la soluzione che cerchiamo: assegnati i dati, si può veri…care se è soddisfatta oppure no; se non è soddisfatta, certamente non potrà esistere soluzione del problema. Un’interpretazione …sica facilmente comprensibile di questa condizione si ha quando g 0; interpretando l’equazione come equazione del calore in stato stazionario, signi…ca che il corpo è termicamente isolato. La condizione di compatibilità richiede che ZZZ f dxdydz = 0; il che signi…ca che il bilancio complessivo di pozzi e sorgenti di calore interni al corpo è nullo: una condizione ragionevole, se vogliamo che la temperatura possa stabilizzarsi su un equilibrio, rimanendo il corpo isolato (se ad esempio il corpo è isolato e f > 0 in , la temperatura non può che salire nel tempo). Se poi RR g 6= 0, il corpo non è isolato ma il ‡usso entrante o uscente di calore (cioè gdS) è comunque assegnato, quindi è naturale che questoRRR debba uguagliare @ il bilancio totale di pozzi e soregenti di calore interni (cioè f dxdydz): se all’interno, ad esempio, complessivamente si fornisce più calore di quanto il corpo ne cede all’ambiente attraverso il ‡usso termico dal bordo, complessivamente la temperatura interna salirà, e non potrà soddisfare un’equazione di¤erenziale stazionaria. Principio di massimo e dipendenza continua della soluzione dai dati Si può migliorare l’informazione contenuta nel teorema di unicità, arrivando a stabilire la dipendenza continua della (eventuale) soluzione dai dati, almeno per il problema di Dirichlet. Questa è una conseguenza del seguente principio di massimo, che ha anche un interesse indipendente: Teorema 3.3 (Principio di massimo per il laplaciano) Sia R3 un 2 0 aperto connesso e limitato, e u 2 C ( ) \ C soluzione dell’equazione u = f in Allora: i) Se f 0 in : ; allora il massimo di u è assunto su @ ; ossia max u (x) x2 max u (x) : x2@ 92 ii) Se f 0 in (cioè u è armonica), allora u assume massimi e minimi su @ , e vale la disuguaglianza max ju (x)j x2 max ju (x)j : x2@ Osservazione 3.4 Interpretazione bidimensionale del teorema precedente: si ricordi che l’equazione di una membrana in equilibrio sotto l’azione di una forza f nella direzione dell’asse z è u = f. Il punto i) dice quindi che se f 0; cioè non agisce nessuna forza verso l’alto, la membrana in equilibrio non avere punti più in alto del suo bordo. Se poi non agisce alcuna forza, non possono esserci punti né più in alto né più in basso dei massimi e minimi sul bordo. Dimostrazione. Notiamo che poiché u 2 C 0 , per il teorema di Weierstrass u avrà massimo e minimo nell’insieme chiuso e limitato . Il punto è dimostrare che punti di massimo assoluto (nel caso i ) e punti di massimo e minimo assoluto (nel caso ii ) stanno sul bordo. i ) Facciamo prima l’ipotesi più forte che sia f > 0 in , e supponiamo per assurdo che x0 2 sia un punto di massimo interno. Allora, essendo u 2 C 2 ( ) 2 si ha @@xu2 (x0 ) 0 per ogni i = 1; 2; 3, come si capisce ragionando sulla funzione i di una variabile g (t) = u (x0 + tei ) che deve avere un punto di massimo relativo per t = 0, quindi dalla formula di 2 Taylor con resto secondo Peano si legge g 00 (0) 0, da cui @@xu2 (x0 ) è 0. Ne i segue u (x0 ) 0, che contraddice f (x0 ) > 0. Giusti…chiamo l’a¤ermazione g 00 (0) 0. Sia per assurdo g 00 (0) > 0; allora dalla formula di Taylor (ricordando g 0 (0) = 0) 1 00 g (t) g (0) = t2 g (0) + o (1) 2 si deduce g (t) g (0) < 0 per jtj abbastanza piccolo, da cui t = 0 sarebbe punto di minimo relativo stretto, non di massimo relativo. Consideriamo ora il caso più generale in cui f 0 in , e proviamo che il massimo di u è ancora assunto solo su @ . Sia 2 v (x) = u (x) + " jxj (x 2 R3 ) con " > 0 che sceglieremo. v= u + 2n" = f + 2n" > 0. Allora applicando il punto precedente (caso f > 0) alla funzione v otteniamo che v assume il massimo su @ ; cioè, per ogni y 2 ; scegliendo una sfera BR (0) contenente , 2 u (y) + " jyj = v (y) 2 max u (x) + " jxj x2@ 93 max u (x) + "R2 : x2@ Facendo tendere a zero " e prendendo poi maxy2 otteniamo max u (y) y2 max u (x) ; x2@ che dice appunto che il massimo è assunto sul bordo. ii ) Se u = 0 in ; allora possiamo applicare il punto i a u e poi a ottenendo che u assume massimo e minimo su @ e max ju (x)j x2 u, max ju (x)j : x2@ Osservazione 3.5 Questo principio di massimo consente di migliorare il risultato di unicità dimostrato per il problema di Dirichlet (come preannunciato nell’osservazione dopo il teorema di unicità). In base al principio di massimo, infatti, se u 2 C 2 ( ) \ C 0 è soluzione di u = 0 in u = 0 su @ ne segue che u 0. Perciò l’unicità della soluzione del problema di Dirichlet vale nella classe “naturale” C 2 ( ) \ C 0 e non solo nella più ristretta classe in cui lo si era stabilito in precedenza. C2 ( ) \ C1 Osservazione 3.6 Vale in realtà anche un principio di massimo più forte, che non dimostreremo, e stabilisce che una funzione armonica non solo assume massimi e minimi sul bordo, ma non può assumere massimi e minimi anche in punti interni, a meno che sia costante. Ad esempio, una membrana in equilibrio non può formare “gobbe verso l’alto” o il basso all’interno. Deduciamo dal principio di massimo dimostrato anche il prossimo Teorema 3.7 (Dipendenza continua dai dati per il problema di Dirichlet) Sia un dominio limitato di Rn (n 3) e sia u 2 C 2 ( ) \ C 0 soluzione del problema di Dirichlet u = f in u = g su @ : Allora R2 max jf j @ 2n dove R è il raggio di una sfera BR (0) contenente : max juj max jgj + Si noti che questa è una stima a priori di dipendenza continua della soluzione u di un problema di Dirichlet dai dati f; g. Dimostrazione. La funzione 2 v (x) = u (x) + 94 jxj max jf j 2n soddisfa v (x) = u (x) + max jf j = f (x) + max jf j 0 perciò per il principio di massimo (punto i ) assume il suo massimo su @ ; ossia, per ogni x 2 ; 2 2 u (x) u (x) + jxj max jf j 2n max u + @ jxj max jf j 2n max g + @ R2 max jf j 2n cioè R2 max jf j : @ 2n Ora applichiamo lo stesso ragionamento a u che è soluzione di max u max g + ( u) = f in u = g su @ e otteniamo max ( u) max ( g) + @ R2 max jf j 2n che unita alla precedente dà max juj 3.1.2 max jgj + @ R2 max jf j : 2n L’equazione di Laplace sul cerchio Considereremo il problema di Dirichlet per l’equazione di Laplace sul cerchio; la risoluzione esplicita di questo problema è un punto di partenza fondamentale per la teoria del potenziale (in due variabili). Essendo il primo problema che trattiamo, lo svilupperemo in dettaglio, utilizzandolo come esempio guida anche per situazioni diverse. Per risolvere l’equazione di Laplace sul cerchio, la prima cosa è riscriverla in coordinate polari ( ; #). Si trova20 , per l’equazione sul cerchio di centro (0; 0) e raggio r0 ; con dato al bordo f assegnato: 8 2 1 @2u < @ u 1 @u + + 2 2 = 0 per 2 [0; r0 ); # 2 [0; 2 ] 2 (3.2) @ @ @# : u (r0 ; #) = f (#) per # 2 [0; 2 ] : Cerchiamo soluzioni a variabili separate, del tipo: u ( ; #) = R ( ) 2 0 v. [An2, Cap.4, §5.2] 95 (#) : Sostituendo nell’equazione si ha R00 ( ) 1 (#) + R0 ( ) 1 (#) + R0 ( ) R00 ( ) + = R( ) R( ) 2 00 R( ) (#) = 0 00 2 (#) : (#) L’ultima uguaglianza scritta è un’identità tra una funzione della sola e una funzione della sola #, che quindi forza ciascun membro ad essere costante21 . Quindi per qualche 2 R dev’essere: R0 ( ) R00 ( ) + = R( ) R( ) 00 2 (#) (#) = ossia: 2 R00 ( ) + R0 ( ) = R ( ) per 2 (0; r0 ) 00 (#) = (#) per # 2 [0; 2 ] : Bisogna anche richiedere che sia 2 periodica: per il signi…cato geometrico delle coordinate polari, se non è così la funzione u ( ; #) = R ( ) (#) risulterebbe discontinua. Questo impone = n2 e n (#) = an cos (n#) + bn sin (n#) per n = 0; 1; 2; 3; ::: Con ciò l’equazione in R diventa 2 R00 ( ) + R0 ( ) n2 R ( ) = 0 per 2 [0; r0 ] : Per n 6= 0 è un’equazione di Eulero22 ; si possono quindi cercare soluzioni del tipo R ( ) = ; con da determinarsi: 2 ( 1) 2 1 + ( n2 =0 2 1) + n =0 = n; che dà Rn ( ) = c1 2 1 Si n + c2 n ; ri‡etta su questo ragionamento, che useremo altre volte: se f ( ) = g (#) per ogni ; # in certi intervalli, in particolare …ssando un valore # = #0 si legge che il primo membro è costante al variare di ; …ssando invece un valore = 0 si legge che il secondo membro è costante al variare di #. 2 2 v. [EsAn2], §1.2.D. Si dice equazione di Eulero un’equazione del tipo ax2 y 00 (x) + bxy 0 (x) + cy (x) = 0 per a; b; c costanti. Di quest’equazione si possono cercare due soluzioni del tipo y (x) = x con da determinarsi. Se esistono due numeri 1 ; 2 reali distinti per cui l’equazione di¤erenziale è soddisfatta, l’integrale generale di quest’equazione sarà c1 x 1 + c2 x 2 : 96 ma poiché vogliamo soluzioni regolari in [0; r0 ] dobbiamo escludere le soluzioni c2 n , illimitate nell’origine. Per n = 0 l’equazione 2 è di Eulero in R0 ( ) = R00 ( ) + R0 ( ) = 0 ; 2 1 + =0 +1 ( + 1) =0 = 1 1 R0 ( ) = R ( ) = d1 + d2 log : Escludendo ancora le soluzioni d2 log …nitiva Rn ( ) = c R0 ( ) = d n illimitate nell’origine, otteniamo in deper n = 1; 2; 3; ::: Si trovano in de…nitiva le soluzioni a variabili separate: un ( ; #) = n [an cos (n#) + bn sin (n#)] u0 ( ; #) = d: Per linearità, qualsiasi somma …nita di queste soluzioni soddisfa ancora l’equazione di¤erenziale. L’idea è scrivere una soluzione che soddis… anche la condizione al contorno sommando le in…nite soluzioni a variabili separate: u ( ; #) = d + 1 X n [an cos (n#) + bn sin (n#)] : n=1 Imporre la condizione al contorno signi…ca quindi scrivere: u (r0 ; #) = d + 1 X r0n [an cos (n#) + bn sin (n#)] = f (#) n=1 il che signi…ca che quello scritto dev’essere lo sviluppo di Fourier di f (#) in [0; 2 ], quindi posto 1 A0 X + [An cos (n#) + Bn sin (n#)] , ossia 2 n=1 Z Z 1 2 1 2 An = f (#) cos (n#) d#; Bn = f (#) sin (n#) d# f (#) = 0 0 97 (3.3) si ha A0 ; r0n an = An ; r0n bn = Bn . 2 In conclusione la soluzione del problema (3.2) è assegnata dalla formula: d= u ( ; #) = 1 A0 X + 2 n=1 n [An cos (n#) + Bn sin (n#)] r0 (3.4) con An ; Bn assegnati dalle (3.3). Naturalmente in questo procedimento abbiamo fatto vari passaggi senza giusti…cazione rigorosa, dovremo ora dimostrare che sotto opportune ipotesi la u ha la regolarità richiesta e soddisfa e¤ettivamente equazione di¤erenziale e condizioni al contorno. Una formula risolutiva esplicita è comunque sempre un buon punto di partenza per la discussione successiva. Prima di giusti…care teoricamente la formula (3.4) cominciamo comunque a prendere con…denza con essa e il suo utilizzo. Osservazione 3.8 (Armoniche elementari) Notiamo che la soluzione ottenuta è una sovrapposizione delle in…nite funzioni n cos (n#) ; n sin (n#) ; dette armoniche elementari. E’interessante osservare che scrivendo, nel campo complesso z = (cos # + i sin #) z = n (cos (n#) + i sin (n#)) n (formule di De Moivre), le armoniche elementari si possono vedere come le parti reali e immaginarie delle potenze z n : n cos (n#) = Re ( n cos (n#) = Im ( n (cos (n#) + i sin (n#))) = Re (z n ) n (cos (n#) + i sin (n#))) = Im (z n ) e questo fatto23 può essere utile per riscrivere in coordinate cartesiane queste funzioni. Ad esempio: 3 = x3 2 = 2xy 3 cos (3#) = Re z 3 = Re (x + iy) 2 sin (2#) = Im z 2 = Im (x + iy) 3xy 2 ecc. In particolare, da queste relazioni leggiamo che le armoniche elementari n cos (n#), n sin (n#) sono polinomi omogenei di grado (complessivo) n in x; y. 2 3 che non è casuale, ma una semplice conseguenza della teoria delle funzioni derivabili di variabile complessa (“la parte reale o immaginaria di una funzione olomorfa è una funzione armonica”), di cui però in questo corso non ci occupiamo. 98 Qualche gra…co delle armoniche elementari mostra la loro caratteristica tipica di funzioni dotate di “selle” ma non di punti di massimo e minimo locale, come prescritto dal principio di massimo che abbiamo dimostrato. 3 4 3 cos 3# = Re (x + iy) 4 cos 4# = Re (x + iy) 99 = x3 = x4 3xy 2 6x2 y 2 + y 4 7 7 sin 7# = Im (x + iy) = 7x6 y 35x4 y 3 + 21x2 y 5 y7 Esempio 3.9 Risolviamo: u = 0 per < 1 u (1; #) = cos2 #: Da identità trigonometriche abbiamo cos2 # = 1 1 + cos 2#; 2 2 che è lo sviluppo di Fourier del dato al bordo. Quindi la formula di rappresentazione dà: 1 1 u ( ; #) = + 2 cos 2# 2 2 in coordinate cartesiane, calcolando = 2 2 cos 2# = Re (x + iy) 1 1 + x2 2 y2 : Esempio 3.10 Risolviamo: u = 0 per x2 + y 2 < 4 u (x; y) = x4 per x2 + y 2 = 4 Per = 2; 4 x4 = (2 cos #) = 16 cos4 # 100 , Da identità trigonometriche abbiamo 16 cos4 # = 6 + 8 cos 2# + 2 cos 4#; che è lo sviluppo di Fourier del dato al bordo. Quindi la formula di rappresentazione dà: 2 4 u ( ; #) = 6 + 8 cos 2# + 2 cos 4# 2 2 2 in coordinate cartesiane, calcolando 2 cos 2# = Re (x + iy) 4 , cos 4# = 4 Re (x + iy) = 6 + 2 x2 y2 + 1 4 x 8 6x2 y 2 + y 4 : Discussione delle formula di rappresentazione trovata - regolarità all’interno Come preannunciato, dobbiamo ora discutere sotto quali ipotesi la formula risolutiva (3.4) assegna e¤ettivamente una soluzione del problema. Dimostriamo anzitutto il seguente: Teorema 3.11 Nella sola ipotesi che i coe¢ cienti An ; Bn nella (3.4) siano successioni limitate, ossia per qualche costante c > 0 sia jAn j + jBn j c per ogni n; la funzione u assegnata dalla (3.4): a) è derivabile in…nite volte termine a termine in ogni cerchio < r0 ; b) è derivabile in…nite volte nel cerchio < r0 ; c) soddisfa l’equazione di Laplace (in polari) nel cerchio < r0 . Dimostrazione. Fissiamo < r0 e consideriamo il cerchio cerchio la serie (3.4) converge totalmente, infatti: con . In questo n r0 [An cos (n#) + Bn sin (n#)] n r0 e la serie numerica n (jAn j + jBn j) X c r0 ; n c r0 è una serie geometrica convergente perché e u è continua nel cerchio . 101 < r0 , quindi c’è convergenza totale Consideriamo la serie delle derivate prime rispetto a : n @ @ n 1 n = [An cos (n#) + Bn sin (n#)] r0 [An cos (n#) + Bn sin (n#)] r0n n 1 n r0 1 (jAn j + jBn j) r0 c n r0 n 1 r0 e la serie numerica n 1 X c n r0 r0 è una serie convergente perché < r0 , quindi c’è convergenza totale della serie ed è calcolabile derivando termine a termine. delle derivate, perciò esiste @u @ Si capisce che il ragionamento si può iterare alla derivata di qualunque ordine rispetto a . Per la serie delle derivate rispetto a # si ha: @ @# n [An cos (n#) + Bn sin (n#)] r0 n = r0 [ nAn sin (n#) + nBn sin (n#)] n n e la serie numerica r0 n (jAn j + jBn j) X cn r0 n cn r0 è ancora una serie convergente perché < r0 , quindi c’è convergenza totale @u ed è calcolabile derivando termine a della serie delle derivate, perciò esiste @# termine. Si capisce che il ragionamento si può iterare alla derivata di ordine qualsiasi rispetto a #; ed anche a derivate miste rispetto a e #. Si conclude che u è in…nitamente derivabile in ogni cerchio con < r0 , e quindi nel cerchio aperto < r0 . Inoltre, poiché ogni addendo della serie risolve l’equazione di Laplace (la serie è stata costruita proprio a quel modo, sovrapponendo soluzioni a variabili separate), in ogni cerchio con < r0 , in cui u è derivabile termine a termine, si ha: ! 1 n @2 1 @ 1 @2 A0 X u= + + 2 2 + [An cos (n#) + Bn sin (n#)] @ 2 @ @# 2 r0 n=1 = = 1 X n=1 1 X @2 1 @ 1 @2 + 2 2 + 2 @ @ @# n r0 0 = 0: n=1 102 [An cos (n#) + Bn sin (n#)] L’equazione perciò è soddisfatta in ogni cerchio cerchio aperto < r0 . con < r0 e quindi nel Il teorema precedente contiene un’a¤ermazione molto forte: supponiamo che f sia una qualsiasi funzione L2 (0; 2 ), allora per il Lemma di Riemann-Lebesgue le successioni An ; Bn tendono a zero, in particolare sono limitate, e si applica la conclusione del teorema precedente: non solo la u risolve l’equazione u = 0 nel cerchio, ma è in…nitamente derivabile. Discussione della formula di rappresentazione trovata - condizione al bordo classica Vogliamo mostrare che, sotto opportune ipotesi sul dato al bordo f , la u assegnata dalla (3.4) assume il dato al bordo. Occorre capire qual è il problema. E’ chiaro che se sostituiamo = r0 nella (3.4) otteniamo (proprio per come abbiamo costruito la soluzione) la serie di Fourier di f che rappresenta f , ad sotto le seguenti ipotesi: f continua, regolare a tratti, f (0) = f (2 ) (l’ultima condizione è ovvia, se vogliamo che f sia una funzione continua sul bordo del cerchio). Tuttavia, noi vogliamo anche sapere che la u è continua sul cerchio chiuso r0 , in modo da sapere che quando ci avviciniamo a un punto del bordo del cerchio provenendo dall’interno, la u tende proprio al dato al bordo o, come si dice solitamente, “il dato al bordo è assunto con continuità”. Con questa premessa, dimostriamo il Teorema 3.12 (condizione al contorno classica) Supponiamo che f soddis… delle ipotesi sotto cui la sua serie di Fourier converge totalmente (teorema 1.130): f è continua e soddisfa la condizione di raccordo f (0) = f (2 ); inoltre f è derivabile e con derivata continua in [0; 2 ], salvo al più un numero …nito di punti di [0; 2 ] nei quali comunque esistono …niti i limiti destro e sinistro di f 0. Allora la u de…nita dalla (3.4) è continua …no al bordo del cerchio, in particolare lim ( ;#)!(r0 ;#0 ) u ( ; #) = f (#0 ) per ogni #0 2 [0; 2 ] . Dimostrazione. Dimostriamo che la serie (3.4) converge uniformemente nel cerchio r0 ; # 2 [0; 2 ], da cui seguirà la continuità di u in tutto il cerchio (Teorema 3.55, §3.2.3). Per far questo, scriviamo: k r0 [Ak cos (n#) + Bk sin (n#)] j[Ak cos (n#) + Bk sin (n#)]j Poiché sotto le nostre ipotesi, in base al teorema 1.130 si ha 1 X k=1 (jAk j + jBk j) < 1; 103 jAk j+jBk j : la serie che assegna la u ( ; #) converge totalmente nel cerchio r0 ; # 2 [0; 2 ] e quindi (criterio della convergenza totale, Proposizione 1.54) converge uniformenente nel cerchio. Ora che sappiamo che la u assegnata dalla formula (3.4) assume con continuità il dato al bordo, quindi è l’unica soluzione del problema di Dirichlet, possiamo trarre dal risultato precedente di regolarità all’interno della funzione assegnata da (3.4) un’importante conseguenza: Corollario 3.13 (Regolarità delle funzioni armoniche in due variabili) Sia R2 un aperto e u 2 C 2 ( ) soluzione di u = 0 in : Allora u 2 1 C ( ). Dimostrazione. Sia u 2 C 2 ( ) soluzione di u = 0 in e …ssiamo un cerchio Br (x0 ) : Per ogni < r la funzione u si può vedere come soluzione (l’unica soluzione) del problema di Dirichlet u = 0 in B (x0 ) u = u su @B (x0 ) e quindi u si rappresenta con la formula (3.4) con i coe¢ cienti An ; Bn calcolati a partire da u; in particolare limitati perché u è limitata e integrabile in @B (x0 ) ; essendo continua. Per la discussione precedente, allora, u è in…nitamente derivabile nel cerchio B (x0 ) ; e quindi nel cerchio Br (x0 ). Poiché questo si può ripetere per ogni cerchio Br (x0 ) , u 2 C1 ( ) : Osservazione 3.14 Segnaliamo che la proprietà di regolarità delle funzioni armoniche è vera in dimensione n qualsiasi, con un’altra dimostrazione. Dai fatti precedenti possiamo in particolare raccogliere il seguente Teorema 3.15 Detto Br0 (0) il cerchio di centro l’origine e raggio r0 , se f 2 C 1 (@Br0 (0)) esiste una e una sola u 2 C 2 (Br0 (0)) \ C 0 Br0 (0) soluzione del problema di Dirichlet u = 0 in Br0 (0) u = f su @Br0 (0) ; assegnata dalla (3.4). La u assume il dato al bordo con continuità, e all’interno del cerchio è in…nitamente derivabile. Inoltre il principio di massimo max juj Br0 (0) max jf j @Br0 (0) è in questo caso una stima di dipendenza continua della soluzione dal dato. Quindi il problema è ben posto. 104 Osservazione 3.16 Notare che la richiesta f 2 C 1 (@Br0 (0)) signi…ca che, pensata come funzione f (#), non solo f 2 C 1 ([0; 2 ]), ma f e f 0 soddisfano le condizioni di raccordo tra 0 e 2 . L’ipotesi f 2 C 1 (@Br0 (0)) può sembrare un po’ troppo forte, visto che vogliamo ottenere una u continua …no al bordo (e non più regolare di così). Questo in parte è un “difetto” della tecnica dimostrativa utilizzata: la teoria classica, passando attraverso la nozione di convergenza uniforme delle serie di Fourier, richiede ipotesi un po’ sovrabbondanti. Con una tecnica dimostrativa più ra¢ nata si può provare che il problema di Dirichlet sul cerchio è risolubile in senso classico per ogni dato al bordo continuo; torneremo poi su questo problema. Discussione della formula di rappresentazione trovata - dato al bordo L2 Proviamo ora un diverso risultato che garantisce che il dato al bordo possa essere assunto in un senso più debole sotto ipotesi molto più generali sul dato: Teorema 3.17 Supponiamo che f 2 L2 [0; 2 ], allora la u assegnata dalla (3.4) assume il dato al bordo in senso L2 ; il che signi…ca che ku ( ; ) f kL2 (0;2 ! 0 per ) ! r0 : Dimostrazione. Poiché f 2 L2 [0; 2 ] ; sappiamo che (uguaglianza di Perceval, v. §3.5.1). Ora dalle identità: u ( ; #) = f (#) = 1 A0 X + 2 n=1 P1 n=1 A2n + Bn2 < 1 n [An cos (n#) + Bn sin (n#)] r0 1 A0 X + [An cos (n#) + Bn sin (n#)] 2 n=1 abbiamo f (#) u ( ; #) = 1 X n 1 [An cos (n#) + Bn sin (n#)] ; r0 n=1 e per l’uguaglianza di Perceval ku ( ; ) 2 f kL2 (0;2 ) = 1 X n=1 n 2 1 r0 A2n + Bn2 : h n i2 Osserviamo la serie a secondo membro. Per ! r0 si ha 1 ! 0; tutr0 tavia questa convergenza è sempre più lenta quanto più grande è n (che rimpicn ciolisce il quoziente r0 , rallentando la sua convergenza a 1). Per passare al 105 h n i2 limite bisogna allora spezzare la serie. Utilizziamo il fatto che 1 <1 r0 perciò la serie è totalemente convergente in 2 [0; r0 ] ; e …ssato " > 0 esiste n0 tale che 1 n 2 X 1 A2n + Bn2 < " r 0 n=n +1 0 mentre n0 X n=1 n 2 1 n0 2 A2n + Bn2 r0 1 r0 per A2n + Bn2 n=1 n0 2 1 n0 X r0 2 kf kL2 (0;2 ) <" abbastanza vicino a r0 . Perciò ku ( ; ) 2 f kL2 (0;2 ) < 2" per abbastanza vicino a r0 , ossia ku ( ; ) f kL2 (0;2 ) ! 0 per ! r0 : Notiamo che l’ipotesi f 2 L2 [0; 2 ] consente a f di essere discontinua, addirittura illimitata, eppure è su¢ ciente a garantire che il dato al bordo sia assunto in questo senso debole; inoltre poiché le successioni An ; Bn sono in…nitesime e quindi limitate, vale anche il teorema di regolarità all’interno della u; che risolve l’equazione. Formula del valor medio La formula (3.4) mette in evidenza anche un’altra proprietà delle soluzioni dell’equazione di Laplace (funzioni armoniche): sostituendo = 0 si trova A0 1 = u (0; #) = 2 2 Z 2 f (#) d#; (3.5) 0 da cui si deduce il seguente Teorema 3.18 (Proprietà di media delle funzioni armoniche) Sia R2 un aperto e u una funzione armonica in : Per ogni cerchio Br (x0 ; y0 ) la cui chiusura è contenuta in valgono le seguenti proprietà di media: Z 2 1 u (x0 ; y0 ) = u (x0 + r cos #; y0 + r sin #) d# (3.6) 2 0 Z 1 u (x0 ; y0 ) = u (x; y) ds (3.7) 2 r @Br (x0 ;y0 ) Z 1 u (x0 ; y0 ) = 2 u (x; y) dxdy: (3.8) r Br (x0 ;y0 ) 106 Notare che la seconda uguaglianza dice che il valore di u nel centro del cerchio è la media integrale dei valori di u sul bordo del cerchio (in questo caso l’integrale è un integrale di linea); la terza uguaglianza dice che il valore di u nel centro del cerchio è la media integrale dei valori di u sul cerchio (in questo caso l’integrale è un integrale doppio). Segnaliamo che anche la proprietà di media delle funzioni armoniche, con una diversa dimostrazione, si può stabilire in dimensione n 3 qualunque. , u si può vedere Dimostrazione. Poiché u è armonica in e Br (x0 ; y0 ) come soluzione del problema di Dirichlet avente come dato assegnato sul bordo del cerchio la u stessa. Quindi la (3.5), dopo averla traslata nel cerchio di centro (x0 ; y0 ), si può riscrivere nella forma (3.6). D’altro canto il secondo membro della (3.7) è un integrale di linea che, parametrizzando la circonferenza come x = x0 + r cos # # 2 [0; 2 ] y = y0 + r sin # ds = rd# dà 1 2 r Z @Br (x0 ;y0 ) u (x; y) ds = 1 Z 2 u (x0 + r cos #; y0 + r sin #) rd# 2 r 0 Z 2 1 u (x0 + r cos #; y0 + r sin #) d# = u (x0 ; y0 ) = 2 0 perciò dalla (3.6) segue la (3.7). In…ne, riscriviamo il secondo membro della (3.8) calcolando l’integrale in coordinate polari: Z Z r Z 2 1 1 u (x; y) dxdy = u (x0 + r cos #; y0 + r sin #) d# d r2 Br (x0 ;y0 ) r2 0 0 utilizzando nell’integrale interno la (3.6) Z r 1 1 r2 = 2 2 u (x0 ; y0 ) d = 2 u (x0 ; y0 ) 2 = u (x0 ; y0 ) r 0 r 2 e anche la (3.8) è dimostrata. Osservazione 3.19 La proprietà di media approfondisce la descrizione della geometria del gra…co delle funzioni armoniche, di cui il principio di massimo era un primo elemento. Si noti che entrambe le proprietà corrispondono all’intuizione …sica, se interpretiamo la funzione u; armonica in due variabili, per uno dei signi…cati …sici che può avere, ad esempio membrana in equilibrio o temperatura di una piastra in equilibrio termico. Dalla proprietà di media segue facilmente una dimostrazione, nel caso bidimensionale, del principio di massimo forte per le funzioni armoniche che abbiamo solo enunciato in precedenza: 107 Teorema 3.20 (Principio di massimo forte) Se u = 0 in aperto connesso del piano, allora u non può avere in punti di massimo o minimo assoluti interni senza essere costante in . Si osservi che questo enunciato non dice solo che massimi e minimi sono assunti sul bordo del dominio (se u è continua …no al bordo) ma sono assunti solo sul bordo, tranne nel caso banale in cui u è costante. Questa proprietà non era contenuta nel principio di massimo dimostrato in precedenza in dimensione qualunque. Dimostrazione. Infatti, se (x0 ; y0 ) fosse un punto (ad es.) di massimo assoluto per u; scegliendo un cerchio Br (x0 ; y0 ) , si avrebbe: Z 1 u (x; y) dxdy max u = u (x0 ; y0 ) = 2 r Br (x0 ;y0 ) Z 1 max u dxdy = u (x0 ; y0 ) = max u , r2 Br (x0 ;y0 ) dove l’uguaglianza può valere solo se in tutto il cerchio Br (x0 ; y0 ) è u (x; y) = u (x0 ; y0 ). Poiché è un aperto connesso, allora, ripetendo il discorso iterativamente a partire da un punto (x1 ; y1 ) qualsiasi di questo cerchio, possiamo per passi successivi invadere tutto con cerchi in cui è u (x; y) = u (x0 ; y0 ), perciò u è costante in . Analogo discorso per i punti di minimo assoluti. La formula integrale di Poisson Ci interessa ora trasformare la formula risolutiva “per serie” in una formula di rappresentazione “integrale”, da cui si potranno leggere altre informazioni. Sostituendo nella (3.4) le espressioni per i coe¢ cienti (conviene cambiare nome alla variabile di integrazione) Z Z 1 2 1 2 An = f (s) cos (ns) ds; Bn = f (s) sin (ns) ds 0 0 108 si ha Z 2 1 u ( ; #) = f (s) ds+ 2 0 Z Z 1 n X 1 2 1 2 f (s) cos (ns) ds cos (n#) + f (s) sin (ns) ds sin (n#) + r0 0 0 n=1 = Z 2 f (s) 0 ( 1 1X 1 + 2 n=1 ) n [cos (ns) cos (n#) + sin (ns) sin (n#)] ds: r0 Vediamo di sommare esplicitamente il nucleo integrale f:::g. Anzitutto le formule di addizione e quelle di Eulero danno: cos (ns) cos (n#) + sin (ns) sin (n#) = cos n (# s) = ein(# s) +e 2 in(# s) ; quindi ci si può ricondurre a sommare delle serie geometriche: 1 n 1X 1 + [cos (ns) cos (n#) + sin (ns) sin (n#)] 2 r0 n=1 ( ) 1 n n 1 1 1X in(# s) in(# s) = + e + e 2 2 n=1 r0 r0 ( ) 1 1 n n X X 1 = 1+ ei(# s) + e n(# s) 2 2 r0 r0 n=0 n=0 ( ) 1 1 1 = + 1 2 1 r0 ei(# s) 1 r0 e i(# s) e qualche calcolo coi numeri complessi dà = 1 2 1 = 2 = 1 2 ( r0 cos (# 2r0 [r0 [r0 r02 cos (# r0 s) i sin (# cos (# 2 s)] + 2 r02 2r0 cos (# s) + s) + r0 s)] 2 sin2 (# 2 s) ) cos (# r0 s) + i sin (# s) 1 : Abbiamo ottenuto una formula di rappresentazione della soluzione del problema mediante un integrale: Z 2 2 1 r02 u ( ; #) = f (s) ds: (3.9) 2 0 r02 2r0 cos (# s) + 2 Il nucleo integrale trovato si chiama nucleo di Poisson, e la formula ottenuta, detta formula integrale di Poisson, è molto importante, per vari motivi. 109 1 1. Anzitutto, spesso è più comodo calcolare la soluzione a partire dal dato al bordo, in modo esatto o approssimato, direttamente con questo integrale anziché con il doppio passaggio che consiste nel calcolare gli in…niti coe¢ cienti di Fourier di f e poi sommare la serie (3.4). 2. In secondo luogo, formule di rappresentazione mediante operatori integrali sono più adatte a mettere in evidenza le ipotesi minime sul dato f che garantiscono opportune proprietà della soluzione. Cominciamo ad osservare che per ogni < r0 e per ogni # il denominatore è discosto da zero, il che signi…ca che stando strettamente all’interno del cerchio < r0 si può derivare in…nite volte sotto il segno di integrale. Quindi (come già avevamo osservato) la soluzione dell’equazione di Laplace è in…nitamente derivabile all’interno del cerchio. Ma questa formula consente anche di provare risultati precisi di convergenza di u ( ; #) al dato f (#) avvicindandosi al bordo. Precisamente, si può dimostrare il seguente: Teorema 3.21 Se f è continua sul bordo del cerchio, la u de…nita da (3.9) assume il dato al bordo con continuità, cioè lim (r;#)!(R;#0 ) u (r; #) = f (#0 ) quindi è soluzione classica del problema di Dirichlet, che pertanto è risolubile sotto la sola ipotesi di continuità del dato. Dimostrazione. Per sempli…care leggermente la dimostrazione ci limiteremo a provare che lim u (r; #0 ) = f (#0 ) r!R (il che equivale a far tendere il punto alla circonferenza lungo un raggio). La dimostrazione generale è simile, con una piccola complicazione tecnica24 . Cominciamo a osservare che, poiché la soluzione del problema di Dirichlet con dato al bordo f 1 è la funzione costante 1, si ha: Z 2 2 r02 1 ds = 1: 2 0 r02 2r0 cos (# s) + 2 Notiamo anche che il nucleo di Poisson è positivo, perché r02 cerchio e r02 2r0 cos (# s) + Possiamo allora scrivere: Z 2 1 u (r; #0 ) f (#0 ) = (f (s) 2 0 2 4 Si 2 r02 f (#0 )) può trovare in [Weinberger pp.105-6]. 110 2r0 + r02 2 2r0 = (r0 2 r02 cos (#0 2 > 0 nel 2 ) : s) + 2 ds: Per un numero somma: u (r; #0 ) > 0 da …ssarsi poi, spezziamo l’integrale precedente nella f (#0 ) = 1 2 Z (:::) ds + s2(0;2 );js #0 j< 1 2 Z (:::) ds s2(0;2 );js #0 j =A +B : Poiché f è continua in #0 , …ssato " > 0 esiste un js Per questa scelta di e ha integrale 1) jA j =) jf (#) f (#0 )j < ": si ha allora (ricordando che il nucleo di Poisson è positivo 1 " 2 " #0 j < > 0 tale che 1 2 Z s2(0;2 );js #0 j< Z s2(0;2 ) r02 2 r02 2r0 cos (# s) + r02 r02 ds 2 2 2r0 cos (# s) + ds = ": 2 D’altro canto js #0 j =) cos (# s) cos e quindi r02 2r0 1 cos (#0 s) + 1 2r0 cos + r02 2 (cioè è una funzione limitata), perciò Z 1 jf (s) jB j 2 s2(0;2 );js #0 j 2 c (r0 ; ) f (#0 )j c (r0 ; ) r02 2 max jf (s)j c (r0 ; ) r02 2 s2(0;2 ) 2 ds <" purché r0 sia abbastanza piccolo. Perciò per ogni " > 0; se r0 piccolo si ha ju (r; #0 ) f (#0 )j < 2"; è abbastanza il che prova la tesi. 3. Notiamo che sostituendo = 0 nella (3.9) si trova u (0; #) = 1 2 Z 2 f (s) ds; 0 ossia ritroviamo la formula di valor medio, già discussa. Le osservazioni fatte riguardo alla formula integrale di Poisson sono solo un assaggio dei metodi della teoria del potenziale, con cui a partire da una formula 111 di rappresentazione semplice ed esplicita si dimostrano proprietà generali delle funzioni armoniche. Alla luce della formula …nale ottenuta, il procedimento di separazione di variabili appare un procedimento elaborato il cui ruolo …nale è quello di permetterci di ottenere una formula di rappresentazione integrale utile. Ogni volta che, con opportuni scambi tra serie numeriche e integrali che assegnano coe¢ cienti di Fourier, è possibile scrivere esplicitamente una formula di rappresentazione integrale, può essere interessante farlo. Non sempre però è agevole. Problema di Neumann sul cerchio Consideriamo ora il problema di Neumann per l’equazione di Laplace sul cerchio: 8 2 1 @2u < @ u 1 @u + + 2 2 = 0 per 2 [0; r0 ); # 2 [0; 2 ] 2 (3.10) @ @ @# : @u (r ; #) = f (#) per # 2 [0; 2 ] : @ 0 (Notare che sul bordo del cerchio la derivata normale uscente è semplicemente @ @ ). Cerchiamo soluzioni a variabili separate, del tipo: u ( ; #) = R ( ) (#) : Si possono utilizzare parte delle conclusioni del ragionamento fatto per il problema di Dirichlet. Cerchiamo di imporre la condizione al contorno alla soluzione: u ( ; #) = d + 1 X n [an cos (n#) + bn sin (n#)] : n=1 Imporre la condizione al contorno signi…ca quindi scrivere: 1 X @u (r0 ; #) = nr0n @ n=1 1 [an cos (n#) + bn sin (n#)] = f (#) il che signi…ca che quello scritto dev’essere lo sviluppo di Fourier di f (#) in [0; 2 ], quindi posto 1 A0 X + [An cos (n#) + Bn sin (n#)] , ossia 2 n=1 Z Z 1 2 1 2 An = f (#) cos (n#) d#; Bn = f (#) sin (n#) d# f (#) = 0 0 si ha nr0n 1 an = An ; nr0n 1 bn = B n inoltre (coerentemente a quanto osservato sul problema di Neumann nel §5.1.1) A0 dev’essere nullo (condizione di compatibilità del dato): Z 2 f (#) d# = 0 0 112 mentre d è indeterminato (la soluzione è determinata a meno di costante additiva). In conclusione la soluzione del problema (3.10), nell’ipotesi A0 = 0, è assegnata dalla formula: u ( ; #) = 1 X n=1 n nr0n 1 [An cos (n#) + Bn sin (n#)] + d: (3.11) con An ; Bn assegnati dalle (3.3). Si tratta ora, come nel caso della formula di rappresentazione ottenuta per la soluzione del problema di Dirichlet, di dimostrare che sotto opportune ipotesi su f essa fornisce una soluzione e¤ettiva del problema. Procediamo più sinteticamente di quanto fatto in precedenza: 1. La u assegnata dalla (3.11) è ancora in…nitamente derivabile all’interno del cerchio, e risolve all’interno del cerchio l’equazione di Laplace, non appena i coe¢ cienti An ; Bn siano limitati. 2. A¤ermare che il dato al bordo è assunto con continuità signi…ca a¤ermare che la funzione (a priori de…nita per < r0 ) 1 X @u ( ; #) = @ n=1 in e¤etti è continua per n 1 r0 [An cos (n#) + Bn sin (n#)] r0 . D’altro canto, n 1 r0 [An cos (n#) + Bn sin (n#)] jAn j + jBn j perciò se la serie di Fourier del dato al bordo converge totalmente, il che accade ad esempio se f 2 C 1 [0; 2 ], con f (0) = f (2 ) (Teorema 1.130), anche la serie che assegna @u @ ( ; #) all’interno del cerchio, in e¤etti converge totalmente in tutto il cerchio. Perciò converge ivi uniformemente, e @u @ è continua …no al bordo del cerchio. Come nel caso del problema di Dirichlet, l’ipotesi sul dato è un po’forte, non è certo quella ottimale. Esercizio 3.22 Risolvere il seguente problema di Dirichlet per il laplaciano sulla corona circolare: 8 2 @ u 1 @u 1 @2u > > < + + = 0 per 2 (1; r0 ) ; # 2 [0; 2 ] 2 @#2 @ 2 @ u (1; #) = 0 per # 2 [0; 2 ] > > : u (r0 ; #) = f (#) per # 2 [0; 2 ] Suggerimento: utilizzare i passaggi di partenza del metodo di separazione delle variabili sul cerchio. Attenzione però al fatto che ora le soluzioni R ( ) illimitate per ! 0 non vanno più scartate, perché lavoriamo sull’intervallo 2 (1; r0 ). 113 3.1.3 Equazione di Poisson sul cerchio Abbiamo considerato …nora l’equazione omogenea, u = 0. Se il termine noto non è zero, cioè u = f; il metodo di separazione delle variabili non è più applicabile. Un’idea che talvolta si utilizza per a¤rontare un’equazione non omogenea, suggerita da certe procedure che si seguono per risolvere equazioni differenziali ordinarie non omogenee, è quella di cercare una soluzione la cui espressione analitica sia formalmente simile a quella della corrispondente equazione omogenea, con certe costanti sostituite da coe¢ cienti variabili, che si cerca di determinare in modo da soddisfare l’equazione. Illustriamo quest’idea nel caso dell’equaizone di Poisson sul cerchio: 8 2 1 @2u < @ u 1 @u + + 2 2 = F ( ; #) per 2 [0; r0 ); # 2 [0; 2 ] 2 @ @ @# : u (r0 ; #) = 0 per # 2 [0; 2 ] Notiamo che, in base al principio di sovrapposizione (§4.4), possiamo supporre che il dato al bordo ora sia nullo: se non lo fosse, la soluzione che cerchiamo si potrebbe ottenere sommando la soluzione di un problema come questo e un problema di Dirichlet per l’equazione omogenea (che già sappiamo risolvere). Partiamo dalla formula che assegna le soluzioni dell’equazione omogenea u ( ; #) = a0 + 1 X n [an cos (n#) + bn sin (n#)] n=1 e sostituiamo nella formula, alle particolari funzioni di delle generiche funzioni (incognite) di : date da an 1 a0 ( ) X + [an ( ) cos (n#) + bn ( ) sin (n#)] : u ( ; #) = 2 n=1 n ; bn n , (3.12) Quest’idea è suggerita anche dal fatto che il termine noto F ( ; #) in e¤etti si può sviluppare in questa forma: è su¢ ciente, per ogni 2 [0; r0 ) …ssato, sviluppare in serie di Fourier la funzione # 7! F ( ; #) : Si ha: F ( ; #) = con 1 A0 ( ) X + 2 n=1 An ( ) = 1 n Z [An ( ) cos (n#) + Bn ( ) sin (n#)] 2 F ( ; #) cos (n#) d# 0 Bn ( ) = 1 Z 2 F ( ; #) sin (n#) d#: 0 114 Calcoliamo quindi, formalmente25 l’operatore laplaciano in coordinate polari sulla serie (3.12): u ( ; #) 1 @ 1 @2 @2 + + 2 @#2 @ 2 @ = = + 1 2 1 ! 1 a0 ( ) X + [an ( ) cos (n#) + bn ( ) sin (n#)] 2 n=1 X 1 a000 ( ) + a00 ( ) + 1 a00n ( ) + a0n ( ) n2 2 an ( ) cos (n#) n=1 1 b00n ( ) + a0n ( ) n2 2 an ( ) sin (n#) : Ora, quest’espressione coincide con lo sviluppo di F ( ; #) se valgono le seguenti identità: 1 a000 ( ) + a00 ( ) = A0 ( ) 1 a00n ( ) + a0n ( ) n2 1 b00n ( ) + a0n ( ) n2 2 2 an ( ) = An ( ) an ( ) = Bn ( ) per n = 1; 2; 3; :::: Si tratta di un sistema di in…nite equazioni di¤erenziali ordinarie nelle funzioni incognite an ( ) ; bn ( ), lineari del second’ordine non omogenee (le funzioni An ( ) ; Bn ( ) sono termini noti, si calcolano dal termine noto F dell’equazione di Poisson). Per essere più precisi, è qualcosa di più semplice di un sistema in quanto ogni funzione incognita compare in un’equazione sola: si possono quindi risolvere simultaneamente, in parallelo, tutte le equazioni. Prima di risolvere le equazioni, osserviamo che la condizione u (r0 ; #) = 0 risulta soddisfatta se imponiamo an (r0 ) = bn (r0 ) = 0 per ogni n. Veniamo alla risoluzione delle equazioni. L’equazione n2 1 a00n ( ) + a0n ( ) 2 an ( ) = An ( ) è lineare del second’ordine non omogenea. L’omogenea associata non è a coe¢ cienti costanti ma è un’equazione di Eulero: 1 a00n ( ) + a0n ( ) n2 2 an ( ) = 0 2 5 Questo “formalmente” signi…ca: calcoliamo le derivate della serie derivando termine a termine, senza preoccuparci per il momento di formulare delle ipotesi precise sotto cui quest’operazione sia lecita. 115 di cui possiamo cercare soluzioni del tipo an ( ) = e si trova, a conti fatti, che ha integrale generale an ( ) = cn n n + dn : Ora una soluzione particolare dell’equazione non omogenea si può cercare, col metodo di variazione delle costanti 26 , nella forma an ( ) = cn ( ) n n + dn ( ) : Il metodo prescrive di risolvere il seguente sistema lineare nelle derivate c0n ( ) ; d0n ( ): c0n n + d0n n = 0 nc0n n 1 nd0n n Risolvendo si trova: ( c0n = d0n = 1 = An ( ) : An ( ) 2n n 1 An ( ) n+1 2n e integrando (con una scelta degli estremi che renda gli integrali certamente convergenti) abbiamo ( R An (s) cn ( ) = r0 2ns n 1 ds R An (s)sn+1 dn ( ) = ds 2n 0 e quindi an ( ) = n Z r0 An (s) ds 2nsn 1 n Z 0 An (s) sn+1 ds 2n è una soluzione particolare dell’omogenea, mentre l’integrale generale è Z Z An (s) An (s) sn+1 n n n n an ( ) = cn + dn + ds ds: n 1 2n r0 2ns 0 2 6 v. [An2, pp.32-4]. Ricapitoliamo il metodo. Supponiamo di voler trovare una soluzione particolare dell’equazione di¤erenziale lineare del second’ordine completa y 00 (t) + a (t) y 0 (t) + b (t) y (t) = f (t) conoscendo già, però, due soluzioni linearmente indipendenti y1 (t) ; y2 (t) dell’equazione omogenea. Il metodo consiste nel cercare una soluzione dell’equazione completa della forma y (t) = c1 (t) y1 (t) + c2 (t) y2 (t) dove i coe¢ cienti c1 (t) ; c2 (t) incogniti si determinando risolvendo prima il seguente sistema lineare nelle incognite c01 (t) ; c02 (t) c01 (t) y1 (t) + c02 (t) y2 (t) = 0 c01 (t) y10 (t) + c02 (t) y20 (t) = f (t) e poi calcolando le primitive c1 (t) ; c2 (t) e sostituendole nell’espressione di y (t). 116 La funzione deve mantenersi limitata per ! 0; il che implica la scelta dn = 0, mentre la condizione an (r0 ) = 0 dà Z r0 An (s) sn+1 0 = cn r0n r0 n ds: 2n 0 quindi cn = r0 2n Z r0 An (s) sn+1 ds 2n 0 e an ( ) = 1 2n n r0 2n Z r0 An (s) sn+1 ds + Z n 0 An (s) s1 n ds n r0 Z An (s) sn+1 ds : 0 (3.13) Analogamente 1 bn ( ) = 2n n r0 2n Z r0 n+1 Bn (s) s ds + 0 n Z 1 n Bn (s) s ds r0 n Z Bn (s) sn+1 ds : 0 (3.14) Rimane l’equazione in a0 ( ) ; 1 a000 ( ) + a00 ( ) = A0 ( ) che ponendo a00 = v dà 1 v 0 ( ) + v ( ) = A0 ( ) ; equazione lineare del prim’ordine che si integra così: Z 1 c sA0 (s) ds v( ) = + 0 Z Z 1 t sA0 (s) ds dt; a0 ( ) = c log + d + t 0 r0 imponendo a0 (r0 ) = 0; 0 = c log r0 + d d = c log r0 e quindi a0 ( ) = c log r0 + Z r0 1 t Z t sA0 (s) ds dt 0 e imponendo che a0 ( ) sia limitata in 0; c = 0; da cui Z Z 1 t a0 ( ) = sA0 (s) ds dt t 0 r0 117 (3.15) La funzione u assegnata dalla (3.12) con i coe¢ cienti a0 ( ) ; an ( ) ; bn ( ) assegnati dalle (3.13), (3.14), (3.14) è la soluzione cercata. Il tutto, naturalmente, andrebbe ora giusti…cato rigorosamente, cosa che ora non faremo. Se poi nella (3.12) si sostituiscono le espressioni dei coe¢ cienti a0 ( ) ; an ( ) ; bn ( ) e, a loro volta, al posto dei coe¢ cienti An ; Bn si sostituiscono gli integrali che li de…niscono, calcoli laboriosi permettono di riscrivere la formula di rappresentazione sotto forma di integrale del termine noto F contro un opportuno nucleo, formula più indicata per discutere le ipotesi sotto le quali il procedimento è lecito. La tecnica che abbiamo visto all’opera in questo esempio è nota come metodo degli sviluppi di Fourier, per indicare che si sviluppa termine noto e funzione in uno sviluppo che imita quello di Fourier, con coe¢ cienti però variabili anziché costanti. Z Z 1 t 1 u ( ; #) = sA0 (s) ds dt 2 r0 t 0 Z r0 Z Z 1 1 X n n + r0 2n An (s) sn+1 ds + n An (s) s1 n ds An (s) sn+1 ds cos (n#) 2n n=1 0 r0 0 Z r0 Z Z n n + r0 2n Bn (s) sn+1 ds + n Bn (s) s1 n ds Bn (s) sn+1 ds sin (n#) : 0 3.2 r0 0 Equazione di di¤usione Consideriamo ora l’equazione di di¤usione ut D u=f con laplaciano in n variabili (sarà n = 1; 2; 3), D costante positiva, f termine noto (sorgente). Abbiamo visto tra i suoi signi…cati …sici: 1. u temperatura in un corpo (variabile nel tempo), in regime di sola di¤usione; f indica le sorgenti o i pozzi di calore interni al corpo. 2. u concentrazione (variabile nel tempo) di una sostanza in soluzione, in regime di sola di¤usione; f indica le sorgenti o i pozzi di quella sostanza interni al corpo. Abbiamo discusso (§4.3.2) alcuni tipici problemi ai limiti che si a¤rontano per quest’equazione, e visto il signi…cato …sico delle varie condizioni (di CauchyDirichlet, Cauchy-Neumann, Cauchy-Robin). Anche per questa equazione, vediamo prima di stabilire alcuni risultati molto generali per questi problemi, utili ad inquadrare i problemi ai limiti che poi studieremo. Successivamente a¤ronteremo esplicitamente alcuni di questi problemi ai limiti, su domini di geometria semplice. 3.2.1 Unicità e principio di massimo parabolico Per la linearità del problema, anche in questo caso stabilire un risultato di unicità per un problema di Cauchy-Dirichlet o di Cauchy-Neumann per l’equazione di 118 di¤usione equivale a stabilire che ogni eventuale soluzione dell’equazione omogenea con condizioni di Cauchy-Dirichlet o di Cauchy-Neumann nulle è la funzione identicamente nulla. Sia R3 un aperto connesso limitato e, per un certo T > 0; sia QT = (0; T ). Diciamo che u 2 C 1;2 (QT ) se è C 1 nel tempo e C 2 nelle variabili spaziali. Teorema 3.23 (di unicità) Supponiamo che u 2 C 1;2 (QT )\C 0 QT \C 1 sia soluzione del problema di Cauchy-Dirichlet 8 < ut D u = f per x 2 ; t 2 (0; T ) u (x; t) = g (x; t) per x 2 @ ; t 2 (0; T ) : u (x; 0) = h (x) per x 2 : o del problema di Cauchy-Neumann 8 < ut D u = f per x 2 ; t 2 (0; T ) @u (x; t) = g (x; t) per x 2 @ ; t 2 (0; T ) : @ u (x; 0) = h (x) per x 2 o di Cauchy-Robin 8 < ut D u = f per x 2 ; t 2 (0; T ) @u (x; t) + ku (x; t) = g (x; t) per x 2 @ ; t 2 (0; T ) : @ u (x; 0) = h (x) per x 2 con k > 0. Allora u è identicamente nulla in QT . Osservazione 3.24 L’ipotesi u 2 C 1 (0; T ) è naturale per il problema di Cauchy-Neumann e Cauchy-Robin, ma non per il problema di Dirichlet. Anche in questo caso come per l’equazione di Laplace, mostreremo in seguito come un opportuno principio di massimo consenta di rimuovere quest’ipotesi. Si noti che la soluzione del problema di Cauchy-Neumann è unica e non, come nel caso del problema di Neumann per il laplaciano, determinata solo a meno di costanti additive. Infatti in questo caso una funzione costante non zero soddisfa il problema con f = 0 e g = 0, ma non con h = 0: è la condizione iniziale a dare un controllo sulla u e non solo sulle sue derivate. Dimostrazione. Per il principio di sovrapposizione, mostrare l’unicità per i problemi scritti equivale a mostrare che se u risolve i problemi con f; g; h nulli allora u è identicamente nulla in QT . Supponiamo quindi che u soddis… quest’ipotesi, moltiplichiamo per u l’equazione e integriamo in QT : Z T Z 0= (u ut D (u u)) (x; t) dx dt 0 ! Z Z Z T Z 1 T d 2 = u (x; t) dt dx D u udx dt 2 0 dt 0 119 (0; T ) perciò D Z T 0 Z u udx dt = Z 1 2 Z T 0 ! Z d 2 1 u (x; t) dt dx = dt 2 u2 (x; T ) u2 (x; 0) dx e poiché u soddisfa condizione iniziale nulla, Z T Z Z 1 D u udx dt = u2 (x; T ) dx 2 0 Poiché (per la prima identità di Green, v. §1.2) Z Z Z 2 u udx + jruj dx = u @ si ha Z @ u @u dS @ Z 2 jruj dx = 1 2 Z @u dS; @ u2 (x; T ) dx: (3.16) Ora, se u soddisfa condizioni di Dirichlet o di Neumann nulle si ha Z @u u dS = 0 @ @ perciò D Z 0 T Z 1 jruj dxdt = 2 2 Z u2 (x; T ) dx che (per i segni dei due membri) implica che entrambi i membri sono nulli. L’annullarsi del primo membro implica che u è costante in QT ; e poiché si annulla per t = 0 è identicamente nulla. Se invece u soddisfa la condizione di Robin nulla, @u @ + ku = 0 si ha Z Z @u ku2 dS 0 u dS = @ @ @ e il primo membro nella (3.16) è ancora 0, per cui si conclude come in precedenza. Nello studio dei principi di massimo per un’equazione parabolica su un dominio di tipo cilindrico, è importante la nozione di frontiera parabolica: De…nizione 3.25 Si dice frontiera parabolica del dominio QT = per (0; T ) Rn dominio limitato e T 2 (0; +1], l’insieme @p QT = @ (0; T ) [ f0g : In altre parole, la frontiera parabolica di un cilindro è costituita dalla sua super…cie laterale e dalla base inferiore, ma non dalla base superiore. Veniamo ora al seguente: 120 Teorema 3.26 (Principio di massimo parabolico) Sia u 2 C 1;2 (QT )\C 0 QT soluzione di ut D u = f in QT . Allora: i) Se f 0, u assume il suo massimo sulla frontiera parabolica di QT , cioè max u (x; t) max u (x; t) : QT @p QT ii) Se f 0, allora u assume il suo massimo e il suo minimo sulla frontiera parabolica di QT , e in particolare max ju (x; t)j max ju (x; t)j : QT @p QT Il signi…cato …sico del principio di massimo è piuttosto trasparente: se f 0, cioè il calore viene eventualmente sottratto al corpo ma mai fornito ad esso, la temperatura in ogni punto e istante non può superare quella che aveva all’inizio o ha sul suo bordo: non può esserci a un istante positivo un punto di massimo stretto della temperatura, all’interno del dominio. Se poi f 0, siamo in assenza di pozzi e sorgenti di calore; il calore di¤onderà semplicemente, il che signi…ca che nel tempo il gra…co della temperatura tende a “appiattirsi”sempre più, con massimi e minimi assunti all’istante iniziale o al bordo. Il diverso ruolo che hanno l’istante t = 0 e l’istante t = T nelle proprietà della soluzione ri‡ettono la freccia del tempo nell’interpretazione …sica del modello: il calore passa (al passare del tempo) dal corpo più caldo al corpo più freddo, il che dà alla variabile tempo, nell’equazione, un verso privilegiato: non c’è simmetria quindi tra lo scorrere in avanti o all’indietro del tempo. Dimostrazione. Il secondo punto segue dal primo (come nel caso del principio di massimo per il laplaciano), applicando il primo punto a u. Per provare il primo punto, consideriamo un cilindro QT " (con " > T ), in modo che anche sulla sua base superiore fT "g la u sia regolare, e poniamo w (x; t) = u (x; t) "t: Si ha: wt D w=f " < 0 in QT : Proviamo che questa w, che è continua in QT " quindi ha massimo su quest’insieme, assume il suo massimo sulla frontiera parabolica di QT " . Per assurdo, abbia un massimo in (x0 ; t0 ) 2 (0; T "]: In questo punto di massimo risulta certamente w (x0 ; t0 ) 0 (come visto nella dimostrazione del principio di massimo per il laplaciano; è qui che ci serve il fatto di essere su un cilindro più corto QT " ; altrimenti, nel caso fosse t0 = T non potremmo garantire l’esistenza di w (x0 ; t0 )). Quanto al valore di wt (x0 ; t0 ), 121 dobbiamo distinguere due casi. Se t0 < T " allora il massimo è interno a QT " e per il teorema di Fermat wt (x0 ; t0 ) = 0: Se invece t0 = T " la derivata può non essere nulla ma (ragionare sulla geometria del dominio: il punto (x0 ; t0 ) sta sulla base superiore del cilindro) wt (x0 ; t0 ) 0. In ogni caso si avrebbe (wt D w) (x0 ; t0 ) contro il fatto che già sappiamo che wt Abbiamo quindi provato che max w QT quindi max u QT " ! "T D w < 0 in QT . max w @p QT " max (u QT 0; " "t) = max w QT " " max u @p QT " e per " ! 0 (essendo u 2 C 0 QT ) si ha max u max u: @p QT QT Osservazione 3.27 Come preannunciato, il principio di massimo migliora l’enunciato del teorema di unicità per il problema di Cauchy-Dirichlet: la soluzione è unica nella classe naturale C 1;2 (QT ) \ C 0 QT e non solo in quella, più ristretta, C 1;2 (QT ) \ C 0 QT \ C 1 (0; T ) in cui l’abbiamo inizialmente dimostrata. Il principio di massimo consente di provare una stima di stabilità per il problema di Cauchy-Dirichlet su un dominio cilindrico: Corollario 3.28 Sia QT = (0; T ) con Rn dominio limitato e T > 0; e 1;2 0 sia u 2 C (QT ) \ C QT soluzione di 8 < ut D u = f in QT u = g su @ (0; T ) : u (x; 0) = h (x) in : Allora max juj QT @ max jgj + max jhj + (0;T ) dove R > 0 è un numero per cui si ha R2 max jf j 2nD QT BR (0) : Dimostrazione. Sia 2 w (x; t) = u (x; t) + 122 jxj max jf j : 2nD QT Allora 2 wt D w = ut D u D max jf j QT =f max jf j jxj 2nD ! 0 in QT ; QT quindi per il principio di massimo parabolico si ha max w QT max w @p QT e quindi 2 max u QT max w max w QT @p QT max u + max @p QT @p QT jxj max jf j 2nD QT 2 R max jf j : 2nD QT max u + @p QT Ora si applica lo stesso argomento a max juj QT max juj + @p QT @ 3.2.2 u e si conclude che R2 max jf j 2nD QT max jgj + max jhj + (0;T ) R2 max jf j : 2nD QT Equazione di di¤usione sul segmento Consideriamo una sbarra omogenea, rappresentata dal segmento [0; L], la cui temperatura al punto x e all’istante t è u (x; t). Se la temperatura iniziale ha un pro…lo noto u0 (x), la sbarra è termicamente isolata sulla sua super…cie laterale, non ci sono sorgenti o pozzi di calore interni, e la temperatura agli estremi è tenuta costante uguale a zero, ci aspettiamo che la temperatura nel tempo raggiungerà ovunque la temperatura costante zero. Studiamo come avviene nel tempo questo fenomeno. Come abbiamo visto nel § 2.2.1, in questo caso u soddisfa l’equazione del calore omogenea 8 < ut = cuxx per 0 < x < L; t > 0 u (0; t) = u (L; t) = 0 (3.17) : u (x; 0) = u0 (x) (dove c > 0, costante, è il coe¢ ciente di di¤usione27 ) che abbiamo accompagnato con le condizioni ai limiti e iniziali (problema di Cauchy-Dirichlet per l’equazione del calore omogenea unidimensionale). 2 7 in precedenza indicato con D. 123 Veniamo ora alla soluzione e¤ettiva di questo problema. Il metodo di separazione delle variabili è ancora applicabile. Cerchiamo soluzioni a variabili separate: U (x; t) = X (x) T (t) : Sostituendo nell’equazione di¤erenziale si ha: X (x) T 0 (t) = cX 00 (x) T (t) T 0 (t) X 00 (x) = : X (x) cT (t) Questa uguaglianza dev’essere identicamente veri…cata per 0 < x < L; t > 0. D’altro canto il primo membro è una funzione della sola x, il secondo membro è una funzione della sola t, quindi l’unica possibilità perché l’identità sussista è che ciascun membro sia costante. Si ha quindi, per qualche 2 R, X 00 (x) = X (x) T 0 (t) = cT (t) per 0 < x < L per t > 0: (3.18) Ricordiamo ora che devono valere le condizioni ai contorno u (0; t) = u (L; t) = 0 che si traducono in X (0) = X (L) = 0. Dunque l’equazione in X e quella in T assumono un ruolo asimmetrico, perché la prima (e solo la prima) è corredata di condizioni al contorno: X 00 (x) = X (x) per 0 < x < L X (0) = X (L) = 0: (3.19) Con ciò abbiamo ottenuto un problema agli autovalori per l’operatore di¤erend2 ziale dx 2 R (autovalori) e soluzioni X (x) non identica2 : si cercano numeri mente nulle (autofunzioni) del problema (3.19). Si ri‡etta sul fatto che per ogni possiamo scrivere l’integrale generale dell’equazione di¤erenziale, dipendente da due costanti arbitrarie, ma non per ogni è possibile determinare le costanti di integrazione in modo da soddisfare le condizioni nulle agli estremi: se = 0; X (x) = c1 x +pc2 si annulla in x = 0; x = L solo per c1 = c2 = 0; p x x se > 0; X (x) = c1 e + c2 e si annulla in x = 0; x = L solo per c1 = c2 = 0; p p se < 0; X (x) = c1 cos x + c2 sin x si annulla in x = 0; x = L p 2 2 per c1 = 0 e per qualsiasi c2 purché sia sin L = 0; cioè = nL2 , con n = 1; 2; 3; ::: Abbiamo dunque ricavato autovalori e autofunzioni del problema (3.19): = n2 2 n x ; Xn (x) = cn sin , per n = 1; 2; 3; ::: L2 L 124 (cn costante arbitraria). Possiamo ora risolvere l’equazione (3.18) per questi valori di : T 0 (t) = n2 2 c T (t) L2 Tn (t) = cn e n2 2 c t L2 e in de…nitiva le soluzioni a variabili separate dell’equazione a derivate parziali e delle condizioni al contorno: n2 2 c n x un (x; t) = Xn (x) Tn (t) = cn sin e L2 t : L Nessuna di queste soluzioni in generale soddisferà anche la condizione iniziale, perché un (x; 0) = cn sin (n x). L’idea allora è la seguente: essendo l’equazione di¤erenziale lineare e omogenea, con condizioni agli estremi omogenee, ogni combinazione lineare …nita delle un soddisferà ancora equazione e condizioni al contorno. Possiamo cercare una serie in…nita di queste soluzioni che per un’opportuna scelta dei coe¢ cienti cn converga ed assuma anche la condizione iniziale. Scriviamo dunque u (x; t) = 1 X cn sin n=1 n x e L n2 2 c t L2 (3.20) e imponiamo la condizione iniziale: u (x; 0) = 1 X n=1 cn sin n x = u0 (x) per 0 < x < L L Si tratta dunque di scegliere i coe¢ cienti cn come i coe¢ cienti di Fourier dello sviluppo di u0 in serie di soli seni in (0; L). Ricapitoliamo come si fa. 1. Considerata u0 (x) de…nita in [0; L], si de…nisce u e0 : [ L; L] ! R ottenuta da u prolungandola in [ L; 0] in modo che risulti una funzione dispari: u e0 (x) = u0 (x) u0 ( x) per x 2 [0; L] per x 2 [ L; 0] : Notiamo che se u0 è continua in [0; L] e u0 (0) = u0 (L) = 0 (ipotesi ragionevole visto che questa è la temperatura iniziale, e noi vogliamo che a tutti gli istanti t > 0 la temperatura sia nulla agli estremi), la u e0 sarà continua in [ L; L] e soddsferà la condizione di raccordo u e0 ( L) = u e0 (L) (= 0). 2. Ora scriviamo lo sviluppo di Fourier di u e0 (x) in [ L; L]; il sistema trigonometrico adattato a quest’intervallo è n n x n x o cos ; sin ; L L d’altro canto u e0 (x) è una funzione dispari, quindi avrà coe¢ cienti an nulli e Z Z 1 L n x 2 L n x bn = u e0 (x) sin dx = u e0 (x) sin dx: L L L L 0 L 125 Poiché d’altro canto in [0; L] è u e0 (x) = u0 (x), si avrà (supponendo anche u0 regolare a tratti) u0 (x) = 1 X bn sin n=1 2 bn = L Z n x L L u0 (y) sin 0 per x 2 [0; L] ; con n y dy: L Se quindi nella (3.20) scegliamo i coe¢ cienti cn uguali a questi coe¢ cienti bn dovremmo avere una soluzione del problema di Cauchy-Dirichlet. Al solito, si tratta ora di provare che sotto opportune ipotesi su u0 il tutto è rigoroso. Discussione delle proprietà della soluzione ottenuta Vedremo che la situazione in questo caso ha forti analogie con quanto accade per il problema di Dirichlet per il laplaciano sul cerchio. Infatti, notiamo anzitutto che sin n x e L n2 2 c t L2 e n2 2 c t L2 ; dove l’ultima espressione scritta, per qualunque t > 0 (…ssato) e per ogni x 2 [0; L] tende a zero esponenzialmente al tendere di n a in…nito. Perciò, non appena la successione fcn g dei coe¢ cienti è limitata (il che accade non appena u0 è integrabile in [0; L]), non solo la serie (3.20) converge, ma anche la sua serie derivata rispetto a x o t (qualunque numero di volte) continua a convergere. Più precisamente: 1. Se la successione fcn g dei coe¢ cienti è limitata, allora in ogni dominio Qt0 = f(x; t) : x 2 [0; L] ; t t0 g (per t0 > 0 …ssato), la serie che assegna u e quelle che si ottengono da questa derivando un numero qualsiasi di volte rispetto a t o a x risultano convergenti totalmente e quindi uniformemente. In particolare, la serie rappresenta una funzione u che è derivabile in…nite volte in ogni insieme Qt0 e quindi in de…nitiva per ogni t > 0. Non è, …nora, garantita, la regolarità della soluzione …no a t = 0. In altre parole, la funzione rappresentata dalla (3.20) è in…nitamente derivabile per t > 0. L’equazione del calore, dunque, è fortemente regolarizzante, come l’equazione di Laplace. 2. Poiché le derivate di u si possono calcolare derivando la serie termine a termine, e poiché ogni termine della serie soddisfa l’equazione di¤erenziale (proprio per come è stata ottenuta: è una soluzione a variabili separate), anche la u rappresentata dalla (3.20) soddisfa l’equazione di¤erenziale. 3. Poiché, per il punto 1, in particolare, la funzione u è continua in Qt0 , per x ! 0 e x ! L (e t t0 > 0) la u tende al suo valore negli estremi, che è zero: quindi le condizioni agli estremi sono assunte con continuità, per ogni t > 0. 4. Chiediamoci ora in che senso è assunto il dato iniziale. Anche in questo caso si può distinguere il quadro “classico”da quello L2 . Proviamo due risultati. 126 Teorema 3.29 (condizione iniziale classica) Supponiamo che u0 soddis… delle ipotesi sotto cui la sua serie di Fourier28 converge totalmente, ad es. (v. §3.5.2), u0 2 C 1 ([0; L]) e soddisfa la condizione di raccordo u0 (0) = u0 (L) = 0: Allora la u de…nita dalla ( 3.20) è continua in [0; L] lim (x;t)!(x0 ;0) [0; 1), in particolare u (x; t) = u0 (x0 ) per ogni x0 2 [0; L] . Dimostrazione. Nelle ipotesi fatte su u0 , la funzione u e0 (ri‡essa dispari di u0 su [ L; L], come sopra) soddisfa le ipotesi della convergenza totale della serie di Fourier di u e0 , ossia 1 X jck j < 1: k=1 Poiché d’altro canto per (x; t) 2 [0; L] k x L ck sin [0; 1) si ha e k2 2 c t L2 jck j ; la serie che assegna u (x; t) converge totalmente in [0; L] formemente, perciò u è continua in questo dominio. [0; 1), quindi uni- Teorema 3.30 (Condizione iniziale L2 ) Se u0 2 L2 (0; L), allora il dato iniziale è assunto in senso L2 , ossia u0 kL2 (0;L) ! 0 per t ! 0+ : ku ( ; t) Dimostrazione. Sappiamo che per ogni t > 0 è u (x; t) u0 (x) = 1 X cn sin n=1 n x L e n2 2 c t L2 1 e quindi, per l’uguaglianza di Perceval, ku ( ; t) 2 u0 kL2 (0;L) = 1 X L 2 c e 2 n n=1 n2 2 c t L2 2 1 : P1 Ora ragioniamo così: poiché la serie n=1 c2n converge, per ogni " > 0 esiste n0 tale che L X 2 c < "; 2 n>n n 0 28 o meglio il suo sviluppo di Fourier in serie di soli seni, quindi lo sviluppo di Fourier standard della funzione u e0 ri‡essa dispari di u. 127 quindi ku ( ; t) 2 u0 kL2 (0;L) n0 X L 2 = c e 2 n n=1 = e e 2c n2 0 t L2 1 e 2c n2 0 t L2 1 e 1 + X L c2 e 2 n n>n n2 2 c t L2 2 1 0 2c n2 0 t L2 Ora, essendo n0 e " …ssati, esiste 2 n2 2 c t L2 1 n0 2X X L L 2 cn + c2n 2 2 n>n n=1 0 1 2X L 2 c +" 2 n n=1 2 2 ku0 kL2 (0;L) + ": > 0 tale che per 0 < t < risulta 2 2c n2 0 t L2 1 <" e quindi ku ( ; t) 2 2 u0 kL2 (0;L) < " ku0 kL2 (0;L) + 1 per 0 < t < ; da cui la convergenza voluta. In particolare grazie al teorema sull’assunzione della condizione iniziale in senso classico possiamo a¤ermare il seguente Teorema 3.31 Sia u0 2 C 1 ([0; L]) soddisfacente le condizioni u0 (0) = u0 (L) = 0: Allora, detto Q = (0; L) (0; 1) esiste una e una sola funzione u 2 C 1;2 (Q) \ C 0 Q soluzione del problema di Cauchy-Dirichlet 8 < ut = cuxx per 0 < x < L; t > 0 u (0; t) = u (L; t) = 0 : u (x; 0) = u0 (x) in senso classico (ossia con condizioni iniziali e agli estremi assunte con continuità). Questa soluzione è assegnata dalla ( 3.20) e soddisfa inoltre il principio di massimo parabolico max ju (x; t)j (x;t)2Q max ju0 (x)j ; x2[0;L] che è in questo caso una stima di dipendenza continua della soluzione dalla condizione iniziale. 128 Nucleo del calore sul segmento Consideriamo ancora la formula di rappresentazione della soluzione e, utilizzando l’espressione esplicita dei coe¢ cienti cn che in essa compaiono, trasformiamola in una formula di rappresentazione integrale: u (x; t) = 1 X cn sin n=1 2 cn = L Z n x e L L u0 (y) sin 0 n2 2 c t L2 n y dy: L Allora, ! Z L 1 X n2 2 c n y n x 2 u0 (y) sin dy sin e L2 t u (x; t) = L L L 0 n=1 ! Z L 1 n2 2 c 2 X n y n x t = u0 (y) sin sin e L2 dy L n=1 L L 0 Z L = u0 (y) K (x; y; t) dy 0 con K (x; y; t) = 1 n y n x 2 X sin sin e L n=1 L L n2 2 c t L2 , espressione che de…nisce una funzione molto regolare per ogni t > 0, ma perde signi…cato per t = 0. Anche se questa serie non si può facilmente sommare (ottenendo un’espressione più esplicita del nucleo K), utilizzando quest’espressione è ancora possibile, analogamente a quanto accade per il nucleo di Poisson sul cerchio (v. § 5.1.3) dimostrare il seguente risultato: Teorema 3.32 Supponiamo che la funzione u0 sia continua in [0; L] e soddis… la condizione u0 (0) = u0 (L) = 0. Allora la soluzione u (x; t) de…nita come sopra assume con continuità la condizione iniziale, ossia: lim (x;t)!(x0 ;0) u (x; t) = u0 (x0 ) per ogni x0 2 [0; L] . (Se u0 non soddisfa la condizione u0 (0) = u0 (L) = 0 la conclusione precedente vale comunque per ogni x0 2 (0; L)). Pertanto, il problema di Cauchy-Dirichlet (3.17) può essere risolto in senso classico per ogni dato iniziale continuo. Per la dimostrazione, si rimanda a [Weinberger, pp.108-110]. Esercizio 3.33 Risolvere per separazione di variabili il problema di CauchyNeumann 8 < ut = cuxx per 0 < x < L; t > 0 ux (0; t) = ux (L; t) = 0 : u (x; 0) = u0 (x) : 129 Signi…cato …sico: una sbarra è termicamente isolata, priva di sorgenti o pozzi di calore interni, ed è nota la temperatura iniziale. Studiare l’andamento nel tempo (ci aspettiamo che la temperatura tenda a una costante non zero). Discutere quindi la validità della formula risolutiva trovata, analogamente a quanto fatto nel caso di Cauchy-Dirichlet. L’equazione del calore retrograda. Un esempio di problema mal posto Le funzioni n x n2 22 c t 1 sin e L n L (per n = 1; 2; 3; :::) soddisfano i problemi di Cauchy-Dirichlet 8 < ut + cuxx = 0 per 0 < x < L; t > 0 u (0; t) = u (L; t) = 0 (Pn ) : : u (x; 0) = n1 sin nLx un (x; t) = (cioè: per ogni n, un soddisfa (Pn )). Si osservi che abbiamo cambiato il segno davanti al termine cuxx , rispetto all’equazione del calore. Quest’equazione si chiama equazione del calore retrograda, o all’indietro, o backward. Notiamo la particolarità di questa situazione: per una stessa equazione di¤erenziale, con condizioni agli estremi nulli, abbiamo una successione di condizioni iniziali vn (x) = 1 n x sin n L che tende uniformemente a zero in [0; L]. Invece la famiglia delle corrispondenti soluzioni un , per (x; t) …ssati non tende a¤atto a zero, ma oscilla con ampiezza illimitata, in quanto 1 n2 22 c t e L ! 1 per n ! 0 e t > 0: n I gra…ci delle soluzioni un (x; t)per n = 1; 2; 3.Come si vede, per t = 0 (condizione iniziale) il gra…co è via via più piccolo, mentre per t > 0 oscilla sempre più al crescere di n: la soluzione è instabile rispetto ai dati. 130 Il problema è quindi mal posto, in quanto viene a cadere la dipendenza continua della soluzione dalla condizione iniziale. Intepretazione …sica: è un’equazione del calore retrograda, quindi il problema con condizione iniziale assegnata equivale a un problema con condizione …nale assegnata per l’equazione standard del calore. La morale è che, nello studio della di¤usione del calore, dallo stato presente del sistema non si può risalire con precisione al suo passato. L’evoluzione del sistema “liscia”rapidamente le eventuali oscillazioni della condizione iniziale, cancellando le informazioni, che non si riescono più a ricostruire. 3.3 3.3.1 L’equazione della corda vibrante La corda vibrante …ssata agli estremi Come abbiamo visto nel §2.3.1, una corda elastica omogenea …ssata ai due estremi, pizzicata in modo da eseguire piccole oscillazioni rispetto all’equilibrio, e soggetta eventualmente a una forza di carico f , soddisfa l’equazione di¤erenziale utt c2 uxx = f dove u (x; t) rappresenta l’altezza al tempo t del punto della corda che a riposo si trova nel punto x, e c è una costante positiva con le dimensioni di una velocità; precisamente, 0 c2 = 0 dove 0 è la tensione della corda a riposo e 0 la densità della corda a riposo, supposte entrambe costanti. Se la corda è …ssata agli estremi e sono note la sua con…gurazione iniziale u0 (x) e la sua velocità iniziale v0 (x), la u (x; t) soddisferà il problema di CauchyDirichlet: 8 utt c2 uxx = f per 0 < x < L; t > 0 > > < u (0; t) = u (L; t) = 0 per t > 0 (3.21) u (x; 0) = u0 (x) per 0 < x < L > > : ut (x; 0) = v0 (x) per 0 < x < L: Invece delle condizioni di Dirichlet u (0; t) = u (L; t) = 0 si potrebbero assegnare condizioni di Neumann omogenee ux (0; t) = ux (L; t) = 0; il cui signi…cato …sico è: ciascun estremo della corda non è …sso, ma può scorrere verticalmente senza attrito su una guida verticale. Cominciamo a stabilire un risultato di unicità, poi a¤ronteremo la risoluzione del problema. Energia e risultati di unicità Calcoliamo l’energia meccanica totale della corda al tempo t nelle ipotesi precedenti. 131 Per l’energia cinetica si ha: Ecin = 1 2 Z L u2t dm = 0 1 2 Z L 2 0 ut dx: 0 Per l’energia potenziale dovuta alle forze di tensione, iniziamo a considerare il contributo di un tratto di lunghezza x. L’allungamento di questo tratto quando non è a riposo sarà: Z x+ x p Z x+ x Z x+ x p 1 2 1 2 2 1 + ux dx x= 1 + ux 1 dx ' ux dx ' u2x x 2 2 x x x e il lavoro elementare delle forze elastiche per produrre questo allungamento sarà 1 dW = 0 u2x x: 2 L’energia potenziale totale è l’integrale di questo lavoro elementare su tutto il segmento di corda, quindi Z 1 L 2 Epot = 0 ux dx 2 0 e in de…nitiva l’energia totale all’istante t è Z Z Z 1 L 1 L 1 L 2 2 E (t) = 0 ut dx + 0 ux dx = 2 0 2 0 2 0 2 0 ut + 2 0 ux dx: (3.22) Calcoliamo ora la variazione di energia nel tempo. Derivando sotto il segno di integrale si ha (sempre supponendo 0 ; 0 costanti) E 0 (t) = Z L ( 0 ut utt + 0 ux uxt ) dx: 0 Integriamo per parti il secondo addendo: Z L ux (0; t) ut (0; t)] 0 ux uxt dx = 0 [ux (L; t) ut (L; t) 0 Z L 0 uxx ut dx 0 perciò, usando anche l’equazione di¤erenziale soddisfatta da u; Z L 0 E (t) = 0 [ux (L; t) ut (L; t) ux (0; t) ut (0; t)] + ( 0 utt 0 uxx ) ut dx 0 = 0 [ux (L; t) ut (L; t) ux (0; t) ut (0; t)] + Z L ( 0 f ) ut dx (3.23) 0 La relazione trovata permette ora di dimostrare facilmente il seguente Teorema 3.34 (di unicità) Il problema di Cauchy-Dirichlet (3.21), o l’analogo problema di Cauchy-Neumann, ha al più una soluzione regolare. 132 Dimostrazione. Come già sappiamo, provare l’unicità signi…ca, per la linearità del problema, provare che l’analogo problema con termine noto f = 0 e condizioni iniziali u0 ; v0 = 0 ha solo la soluzione identicamente nulla. Applichiamo a questa situazione la relazione (3.23). Poiché f = 0 avremo E 0 (t) = 0 [ux (L; t) ut (L; t) ux (0; t) ut (0; t)] : Ora nel caso del problema di Neumann si ha ux (0; t) = ux (L; t) = 0 e quindi E 0 (t) = 0; nel caso del problema di Dirichlet, dal fatto che u (0; t) = u (L; t) = 0 per ogni t > 0 deduciamo anche, derivando rispetto a t, che ut (0; t) = ut (L; t) = 0, quindi ancora E 0 (t) = 0: In ogni caso quindi l’energia totale è costante, quindi per ogni t > 0 è: E (t) = E (0) = = 1 2 Z L 1 2 Z L 2 0 ut (x; 0) + 2 0 ux (x; 0) dx 0 2 0 v0 2 (x) + 0 0 (u0 )x (x) dx = 0; cioè l’energia è identicamente nulla, ossia per ogni t > 0 Z L 2 0 ut + 2 0 ux dx = 0: 0 Questo implica che per ogni t è ux (x; t) nulla agli estremi, u (x; t) 0. 0, quindi u ( ; t) costante, ed essendo Risoluzione del problema di Cauchy-Dirichlet per l’equazione omogenea Consideriamo ora il problema (con termine noto nullo) 8 utt c2 uxx = 0 per 0 < x < L; t > 0 > > < u (0; t) = u (L; t) = 0 per t > 0 (3.24) per 0 < x < L > u (x; 0) = u0 (x) > : ut (x; 0) = v0 (x) per 0 < x < L: Anche questo si può a¤rontare per separazione delle variabili: si cerca u (x; t) = X (x) T (t) e questo con un ragionamento analogo ai precedenti porta come sottoproblemi: X 00 (x) = X (x) per 0 < x < L X (0) = X (L) = 0 (dove si è già tenuto conto delle condizioni agli estremi), e T 00 (t) = c2 T (t) : 133 Il primo problema è lo stesso che abbiamo incontrato risolvendo l’equazione del calore sulla sbarra, perciò avrà le stesse soluzioni: Xn (x) = sin n Sostituendo = n = n x L n 2 : L nell’equazione in t si ha 2 n L T 00 (t) = c2 T (t) e quindi n ct L Tn (t) = an cos + bn sin n ct L : Le soluzioni a variabili separate sono perciò n x L un (x; t) = sin n ct L an cos + bn sin n ct L : Ciascuna di queste un soddisfa l’equazione di¤erenziale e le condizioni agli estremi, ma non, in generale, le condizioni iniziali. Per soddisfare le condizioni iniziali cerchiamo una u (x; t) data dalla serie (combinazione lineare) delle in…nite un : u (x; t) = 1 X n=1 sin n x L an cos n ct L n ct L + bn sin : (3.25) Imponendo la condizione u (x; 0) = u0 (x) si ha u0 (x) = 1 X an sin n=1 n x L ossia i coe¢ cienti an devono essere quelli che danno lo sviluppo di Fourier in serie di soli seni della funzione u0 sull’intervallo [0; L], ossia (come già visto nel caso del calore) Z 2 L n y an = u0 (y) sin dy: (3.26) L 0 L Per imporre la condizione iniziale sulla derivata ut calcoliamo prima (derivando formalmente termine a termine la serie) 1 @u (x; t) X n x = sin @t L n=1 = 1 X n=1 sin n x L @ an cos @t an n ct L n c sin L 134 + bn sin n ct L n ct L + bn n c cos L n ct L quindi 1 n c n x @u (x; 0) X = bn sin = v0 (x) @t L L n=1 quindi l’ultima serie scritta dev’essere lo sviluppo in serie di soli seni del dato v0 (x) ; da cui Z 2 L n y n c = v0 (y) sin dy; bn L L 0 L e in de…nitiva bn = 2 n c Z L v0 (y) sin 0 n y dy: L (3.27) Perciò: la funzione (3.25), con i coe¢ cienti an ; bn assegnati dalle (3.26) (3.27), rappresenta la soluzione del problema di Cauchy-Dirichlet (3.21). Discussione delle proprietà della soluzione ottenuta Tutto ciò è per ora puramente formale: occorre capire sotto quali condizioni la serie (3.26) converge ed è derivabile termine a termine quanto occorre per veri…care che soddisfa l’equazione di¤erenziale. Le funzioni di t che compaiono nella serie, cos n Lct , a di¤ erenza dell’esempio dell’equazione del calore, (in cui erano gli esponenziali rapidamente decrescenti exp n2 2 ct =L2 ) in questo caso non aiutano la convergenza della serie stessa per t > 0. Precisamente: poiché derivando due volte rispetto a x o rispetto a t compare un coe¢ ciente n2 , se vogliamo che la serie delle derivate seconde converga uniformemente, e quindi la derivazione termine a termine sia lecita, dobbiamo assicurarci che sia 1 X n=1 n2 (jan j + jbn j) < 1: Questo, in base ai risultati sulla velocità a zero dei coe¢ cienti di Fourier discussi nel § 3.5.2 (Teorema 1.131), si traduce nelle seguenti richieste sui dati iniziali: u0 2 C 3 (0; L) ; con u0 (0) = u0 (L), u00 (0) = u00 (L), u000 (0) = u000 (L); v0 2 C 2 (0; L) ; con v0 (0) = v0 (L), v00 (0) = v00 (L). Si osservi che i coe¢ cienti bn sono i coe¢ cienti di Fourier di v0 divisi per n; questa è la ragione per cui le richieste su v0 sono meno forti (di un grado di derivabilità) rispetto a quelle per u0 . Sotto queste ipotesi in particolare le serie che assegnano sia u che ut sono uniformemente convergenti per t 0, quindi le condizioni iniziali sono assunte con continuità. L’analisi precedente mostra che, a di¤erenza dell’equazione del calore e di Laplace, l’equazione delle onde non è regolarizzante: la soluzione per t > 0 non diventa automaticamente molto regolare (all’interno del dominio cilindrico) indipendentemente dalla regolarità dei dati iniziali (come accadeva per l’equazione del calore o -sostituendo “dato iniziale” con “dato al bordo”- per l’equazione di Laplace). Questo si può interpretare dicendo che l’equazione “non ci regala 135 nulla”: se vogliamo che sia C 2 per t > 0; dovrà essere C 2 anche per t = 0; il che signi…ca che le ipotesi minime sotto cui possiamo sperare ci sia soluzione sono: u0 2 C 2 (0; L) e v0 2 C 1 (0; L) (perché v0 è una derivata di u). Rispetto a queste ipotesi, quelle che abbiamo dovuto fare sono più pesanti, richiedendo sostanzialmente un grado di derivabilità in più rispetto a ciò che ci si poteva aspettare. Evidentemente la strada degli sviluppi di Fourier non è quella migliore per ottenere sotto ipotesi minime un risultato di esistenza per il problema di Cauchy-Dirichlet. E’comunque signi…cativo il fatto che il procedimento precedente, sia pur sotto ipotesi un po’ forti, si possa rendere totalmente rigoroso. Abbiamo infatti dimostrato il seguente Teorema 3.35 Supponiamo assegnate le funzioni u0 ; v0 soddisfacenti le condizioni: u0 2 C 3 (0; L) ; con u0 (0) = u0 (L), u00 (0) = u00 (L), u000 (0) = u000 (L); v0 2 C 2 (0; L) ; con v0 (0) = v0 (L), v00 (0) = v00 (L). Allora esiste una e una sola u (x; t) 2 C 2 ([0; L] [0; +1)) soluzione del problema (3.24). Discussione delle proprietà della soluzioni stazionarie Ci interessa ora esaminare le proprietà delle singole funzioni un (x; t). Ognuna di esse rappresenta un possibile moto di vibrazione della corda, particolarmente semplice, detta vibrazione stazionaria: ogni punto della corda descrive un moto periodico (nel tempo) di tipo armonico, avente pulsazione n c L periodo 2L nc frequenza c n 2L in particolare la frequenza di un è n volte la frequenza di u1 , detta frequenza fondamentale di vibrazione della corda. Immaginiamo che la corda vibrante sia una corda di chitarra. Dal punto di vista musicale, la frequenza fondamentale di vibrazione della corda rappresenta l’altezza della nota che noi percepiamo; le frequenze doppia, tripla, ecc. rappresentano le armoniche superiori, e un si dice perciò n-esima armonica. Se ad esempio la frequenza fondamentale rappresenta la nota do di una certa ottava che chiamiamo convenzionalmente ottava 1, le armoniche successive rappresenteranno: n=1 do1 2 do2 3 sol2 4 do3 5 mi3 6 sol3 7 sib3 8 do4 (dove l’indice indica l’ottava), e così via. In particolare: ogni raddoppio di frequenza equivale a un salto di ottava. Assegnata una condizione iniziale, il moto reale della corda è sovrapposizione di un numero teoricamente in…nito di vibrazioni stazionarie, ma (poiché i coe¢ cienti di Fourier tendono a zero) è 136 ben approssimata dalla somma di un numero …nito di vibrazioni stazionarie. Questo signi…ca che una corda pizzicata vibra emettendo un suono dato da una certa frequenza fondamentale, che però è arricchito dalla presenza di un certo numero di armoniche successive (generalmente di ampiezza molto inferiore), che compelssivamente formano quello che chiamiamo il timbro di quel suono, o di quello strumento musicale. Torniamo ad una singola vibrazione stazionaria. Ad ogni istante la funzione un (x; t) ha un gra…co che è multiplo di un (x; 0) = sin n x L quindi ha la stessa “forma” di questo gra…co: la corda vibra “su e giù” mantenendo immobili in ogni istante i punti in cui un (x; 0) = 0, cioè i due estremi, più (n 1) nodi interni. Ad esempio, per n = 3 le vibrazioni hanno la forma: con due nodi interni, oltre ai due estremi …ssati. In generale, un ha (n 1) nodi interni, e (n + 1) nodi complessivi (considerando anche gli estremi). Come vedremo più avanti, alcune caratteristiche …siche del moto della corda vibrante si ritrovano per le membrane vibranti (cioè in dimensione due) mentre altre sono di¤erenti. Esercizio 3.36 Si risolva, analogamente a quanto fatto per la corda vibrante …ssata agli estremi, il caso della corda che vibra soggetta ad attrito: 8 utt c2 uxx + aut = 0 per 0 < x < L; t > 0 > > < u (0; t) = u (L; t) = 0 per t > 0 u (x; 0) = u0 (x) per 0 < x < L > > : ut (x; 0) = 0 per 0 < x < L: per qualche a > 0 (costante, per semplicità; abbiamo anche supposto, per semplicità, la velocità iniziale nulla). Ci aspettiamo vibrazioni smorzate nel tempo. Per la trattazione, v. [Weinberger] pp.112-4. 137 3.3.2 La corda vibrante illimitata Consideriamo ora l’equazione della corda vibrante su tutto R, ossia una “corda vibrante illimitata”. E’ ovviamente un’idealizzazione matematica, ma è interessante perché il problema viene da un certo punto di vista sempli…cato, permettendo di determinare direttamente l’integrale generale dell’equazione (cosa abbastanza unica, tra le equazioni a derivate parziali) e imporre solo dopo le condizioni iniziali; il tutto, anzi, si riesce a fare anche per l’equazione non omogenea (cioè in presenza di una forza esterna di carico che agisce sulla corda), caso che …nora non avevamo trattato. La formula trovata, dovuta a D’Alembert, intorno al 1750, mette in evidenza alcune caratteristiche importanti dell’equazione della corda vibrante (e più in generale, dell’equazione delle onde anche in dimensione maggiore) che la soluzione per separazione di variabili nascondeva un po’. Il problema è quindi: 8 < utt c2 uxx = f per x 2 R; t > 0 u (x; 0) = u0 (x) per x 2 R (3.28) : ut (x; 0) = v0 (x) per x 2 R: La formula di D’Alembert per l’equazione omogenea. sizione del problema di Cauchy-Dirichlet Trattiamo prima il caso omogeneo: Buona po- c2 uxx = 0 utt con c costante. Si consideri ora la trasformazione di coordinate nel piano: = x + ct = x ct: Vogliamo esprimere in funzione di ; gli operatori di¤erenziali @x ; @t ; @xx ; @tt e riscrivere quindi l’equazione della corda vibrante rispetto alle variabili ; . Per il teorema di di¤erenziazione delle funzioni composte si ha: @ =u +u @x @ ut = u = cu cu @x @ @ @ uxx = (u + u ) = ( + )(u + u ) = u + 2u @x @ @ @ @ @ utt = (cu cu ) = c2 ( )(u u ) = c2 (u @t @ @ ux = u @ +u @x @ +u @t +u 2u +u ): 4u : Di conseguenza: utt c2 uxx = c2 (u 2u +u ) 138 c2 (u + 2u +u )= Perciò l’equazione della corda vibrante nelle nuove variabili ; u si scrive: = 0: Quest’equazione può essere risolta facilmente. Infatti @ @ signi…ca che @u @ @u @ =0 non dipende da , cioè è una funzione di soltanto: @u = f1 ( ) @ con f1 funzione arbitraria. Integrando rispetto a si trova: u = f ( ) + g( ) dove f ( ) è una primitiva di f1 ( ) (perciò, essendo f1 arbitraria, è una funzione arbitraria) e g( ) è la “costante di integrazione”, che non dipende da , perciò è funzione (arbitraria) di . Sostituendo in…ne ad ; le loro espressioni in funzione di x; t si trova: u(x; t) = f (x ct) + g(x + ct): Questa rappresenta l’integrale generale dell’equazione della corda vibrante, con f; g arbitrarie funzioni di una sola variabile, due volte derivabili. La u così ottenuta è dunque la sovrapposizione di due onde che viaggiano a velocità c in versi opposti, un’onda progressiva e un’onda regressiva. Imponiamo ora le condizioni iniziali: u0 (x) = u (x; 0) = f (x) + g(x) v0 (x) = ut (x; 0) = cf 0 (x) + cg 0 (x): Quello che abbiamo ottenuto si può vedere come un sistema di due equazioni in due funzioni incognite, f; g; che però solo nella seconda equazione compaiono derivate. Se deriviamo anche la prima equazione otteniamo un sistema lineare di due equazioni in due incognite: f 0 (x) + g 0 (x) = u00 (x) f 0 (x) + g 0 (x) = v0c(x) che si risolve subito in f 0 ; g 0 : 1 2 1 g 0 (x) = 2 f 0 (x) = v0 (x) c v0 (x) u00 (x) + c u00 (x) 139 da cui per integrazione Z 1 x v0 (s) ds + c1 c 0 Z 1 x u0 (x) + v0 (s) ds + c2 c 0 1 2 1 g (x) = 2 f (x) = u0 (x) e quindi u(x; t) = f (x = = 1 2 ct) + g(x + ct): Z 1 x u0 (x ct) c 0 1 (u0 (x + ct) + u0 (x 2 ct v0 (s) ds + c1 + ct)) + 1 2c Z 1 2 u0 (x + ct) + x+ct 1 c Z x+ct v0 (s) ds + c2 0 v0 (s) ds + c: x ct La costante c, somma delle due costanti arbitrarie, si elimina risostituendo t = 0 nell’identità precedente, che diventa u (x; 0) = u0 (x) + c; dunque c = 0 e la soluzione del problema di Cauchy-Dirichlet è: Z x+ct 1 1 v0 (s) ds; u(x; t) = (u0 (x + ct) + u0 (x ct)) + 2 2c x ct (3.29) nota come formula di D’Alembert. Non deve sfuggire la particolarità di questo procedimento rispetto a quelli seguiti …n qui per altri problemi: senza bisogno di alcuna teoria-quadro preesistente (ad esempio, un teorema di unicità), lavorando direttamente sull’equazione di¤erenziale abbiamo determinato che ogni eventuale soluzione ha effettivamente questa forma (unicità). Infatti, a di¤erenza dei metodi di soluzione per separazione delle variabili, qui non abbiamo supposto a priori che la u avesse una particolare forma. D’altro canto sotto ipotesi ragionevoli sui dati iniziali la formula (3.29) fornisce e¤ettivamente la soluzione del problema di Cauchy-Dirichlet; abbiamo cioè il seguente: Teorema 3.37 Per ogni u0 2 C 2 (R) e v0 2 C 1 (R) la funzione u (x; t) assegnata da (3.29) è soluzione (unica) del problema (3.28) con f = 0. Vale inoltre la seguente stima di dipendenza continua (per tempi …niti): per ogni T > 0 si ha: max ju (x; t)j max ju0 (y)j + T max jv0 (y)j x2R;t2[0;T ] y2R y2R Dimostrazione. E’immediato veri…care che se u0 2 C 2 (R) e v0 2 C 1 (R) la funzione u (x; t) assegnata da (3.29) è C 2 R2 . Vale forse solo la pena osservare 140 come si calcolano le derivate prime della funzione integrale che compare in (3.29): Z x+ct @ v0 (s) ds = v0 (x + ct) v0 (x ct) @x x ct Z x+ct @ v0 (s) ds = cv0 (x + ct) + cv0 (x ct) : @t x ct Che questa u soddis… l’equazione di¤erenziale e le condizioni iniziali si può veri…care, ma segue dal procedimento stesso con cui l’abbiamo determinata, così come dal procedimento seguito segue l’unicità della soluzione. Quanto alla stima di dipendenza continua, dalla (3.29) possiamo maggiorare: Z x+ct 1 1 (ju0 (x + ct)j + ju0 (x ct)j) + jv0 (s)j ds ju(x; t)j 2 2c x ct 1 1 2 max ju0 j + max jv0 j 2ct R 2 2c R = max ju0 j + t max jv0 j R R da cui prendendo il massimo per x 2 R; t 2 [0; T ] si ha la tesi. Si noti che la stima di dipendenza continua controlla (uniformemente) solo la u e non le sue derivate; inoltre vale per tempi …niti (il massimo di u per t > 0 qualsiasi non è controllato). La formula di D’Alembert per l’equazione non omogenea Il procedimento precedente si adatta anche al caso non omogeneo utt c2 uxx = f; solo con qualche calcolo più pesante. Il risultato che si ottiene è: 1 (u0 (x + ct) + u0 (x ct)) 2 Z x+ct Z t Z x+c(t 1 1 + v0 (s) ds + 2c x ct 2c 0 x c(t (3.30) u(x; t) = ! ) F (s; ) ds d : ) Per i passaggi si rimanda a [Weinberger], pp. 24-26. Dalla formula precedente (e dal fatto che questa sia stabilita con un procedimento simile a quello già visto, che quindi fornisce l’unicità della soluzione) si ricava facilmente il seguente 0 Teorema 3.38 Per ogni u0 2 C 2 (R), v0 2 C 1 (R), F; @F R2 la fun@x 2 C zione u (x; t) assegnata da (3.29) è soluzione (unica) del problema (3.28). Vale inoltre la seguente stima di dipendenza continua (per tempi …niti): per ogni T > 0 si ha: max x2R;t2[0;T ] ju (x; t)j max ju0 (y)j + T max jv0 (y)j + T 2 y2R y2R 141 max s2R; 2[0;T ] jF (s; )j Dimostrazione. La dimostrazione è analoga alla precedente. Mostriamo come si calcolano le derivate della funzione integrale29 che coinvolge F , e come si stima quel termine per ottenere la stima di dipendenza continua. ! ! Z ! Z t Z x+c(t ) Z x+c(t ) t @ @ F (s; ) ds d = F (s; ) ds d @x 0 x c(t ) 0 @x x c(t ) Z t = (F (x + c (t ) ; ) F (x + c (t ) ; )) d 0 ! ! Z t Z x+c(t ) Z t @F @F @2 F (s; ) ds d = (x + c (t ); ) (x + c (t ); ) d @x2 @x @x 0 x c(t ) 0 ! ! Z ! Z t Z x+c(t ) Z x+c(t ) t @ @ F (s; ) ds d = F (s; ) ds d @t 0 x c(t ) 0 @t x c(t ) Z @2 @t2 1 2c Z t 0 Z 0 t x+c(t F (s; ) ds d x c(t Z x+c(t x c(t ! ) ) ) ! ! 0 1 2c = 3.4 2 =c 1 2c F (s; ) ds d ) = 2cF (x; t) Z t + (cF (x + c (t Z t @F (x + c (t @x 0 Z t 0 Z 0 Z x+c(t x c(t T ) ; ) + cF (x Z x+c(T x c(T ); ) @F (x @x ! ) ) c (t jF (s; )j ds d ) max ) s2R; 2[0;T ] ) ; )) d c (t ); ) d ! jF (s; )j ds d 1 max jF (s; )j 2cT 2 = T 2 max jF (s; )j 2c s2R; 2[0;T ] s2R; 2[0;T ] Equazione delle onde in dimensione superiore Qualche risultato generale di unicità che abbiamo dimostrato per l’equazione della corda vibrante si estende all’equazione delle onde in dimensione spaziale n > 1, utt c2 u = f (3.31) 2 9 Forse vale la pena ricordare la formula per il calcolo della derivata di una funzione integrale in cui la variabile rispetto a cui si deriva compaia sia nell’integranda che negli estremi di integrazione: ! Z b(x) d f (x; t) dt = f (x; b (x)) b0 (x) f (x; a (x)) a0 (x) dx a(x) Z b(x) @f + (x; t) dt: a(x) @x 142 che si può studiare in Rn+1 o in un dominio cilindrico QT = (0; T ) con Rn dominio limitato (v. §4.3.3 per la descrizione dei problemi iniziali e al contorno che è interessante studiare, e i loro signi…cati …sici). 3.4.1 Energia e risultato di unicità Anche in questo caso si può calcolare l’energia meccanica totale del sistema, che è proporzionale a: Z 1 2 E (t) = u2t + c2 jruj dx: 2 Apriamo una parentesi. Si potrebbe obiettare: non abbiamo neppure precisato se stiamo studiando l’equazione pensando a una membrana vibrante (n = 2), a onde sonore nell’aria (n = 3) o a un altro fenomeno: come possiamo a¤ermare che “l’energia del sistema è data da questa espressione”? Di quale sistema …sico si parla? In realtà, come vedremo in seguito, dal punto di vista del rigore del ragionamento che seguirà, questo non ha alcuna importanza: E (t) è semplicemente una funzione matematica, lavorando sulla quale con opportuni passaggi dimostreremo un risultato di unicità per i problemi iniziali e al contorno per l’equazione delle onde. E’istruttivo però il fatto che l’intuizione …sica di quale sia una quantità rilevante per il problema in esame (in almeno qualcuna delle possibili interpretazioni …siche) suggerisce quale sia la funzione matematica su cui lavorare. Calcoliamo ora la derivata rispetto al tempo Z 0 E (t) = ut utt + c2 ru rut dx = applicando la prima identità di Green al secondo integrale Z Z Z @u ut dS = ut utt dx c2 ( u) ut dx + c2 @ @ Z Z @u = ut f dx + c2 ut dS: @ @ Possiamo ora provare il seguente: Teorema 3.39 Consideriamo un problema di Cauchy-Dirichlet o NeumannDirichlet per l’equazione (3.31) su un dominio QT = (0; T ) con Rn su¢ cientemente regolare da potervi applicare il teorema della divergenza. La soluzione regolare di tale problema, se esiste, è unica. Dimostrazione. Come al solito, si tratta di provare che la soluzione di un analogo problema con termine noto f , condizioni iniziali u (x; 0) ; ut (x; 0) e condizioni al contorno tutte nulle, è identicamente nulla. Partiamo dall’identità Z Z @u E 0 (t) = ut f dx + c2 ut dS = 0 @ @ 143 perché f = 0 e, nel secondo integrale, se il problema è di Neumann @u = 0 @ mentre se è di Dirichlet u ( ; t) = 0 su @ per ogni t; da cui t-derivando è anche ut ( ; t) = 0 su @ . Dunque E 0 (t) = 0; quindi Z 1 2 u2t (x; 0) + c2 jru (x; 0)j dx = 0 E (t) = E (0) = 2 per le condizioni iniziali nulle. Ne segue Z 2 u2t + c2 jruj dx = 0 per ogni t; da cui u =cost.= 0, con i soliti ragionamenti. 3.4.2 Onde sferiche tridimensionali Ci occuperemo in seguito, un po’ alla volta, di vari problemi ai limiti per l’equazione delle onde in dimensione spaziale 2 o 3. Vediamo adesso un solo caso particolare, perché come vedremo la sua risoluzione si riconduce a quella dell’equazione della corda vibrante illimitata, che abbiamo appena studiato. Cerchiamo di determinare le onde sferiche, cioè le soluzioni dell’equazione delle onde in 3 dimensioni spaziali, in tutto lo spazio, aventi simmetria radiale. Per mettere meglio in evidenza la particolarità del caso tridimensionale, iniziamo il nostro discorso in dimensione spaziale n qualsiasi. E’noto che se u (x) = f (jxj) è una funzione radiale, u (x) = f 00 ( ) + (n 1) f0 ( ) ; quindi per un’onda radiale u (x; t) = w ( ; t) si ha wtt c2 w + (n 1) w =0 che si può riscrivere 2 wtt c2 2 w + (n 1) w =0 e, osservando che ( w) = ( w + w) = w + 2w ; notiamo che, solo per n = 3, si può riscrivere l’equazione nella forma ( w)tt c2 ( w) =0 cioè w in queso caso è soluzione dell’equazione della corda vibrante illimitata, pertanto la più generale soluzione radiale (nello spazio) dell’equazione delle onde tridimensionale in tutto lo spazio è: w ( ; t) = f ( + ct) + g ( 144 ct) ; (3.32) ossia è la sovrapposizione di un’onda che si allontana dall’origine e una che si avvicina, entrambe smorzate dal fattore 1 . Si noti che, non ostante la presenza del fattore 1 , l’onda non è necessariamente singolare nell’origine, ad esempio: w ( ; t) = sin ( + ct) + sin ( ct) = 2 sin cos (ct) ! 2 cos (ct) per ! 0: Più in generale, si può dimostrare che se nella (3.32) si sceglie f = g con f funzione dispari e regolare, si ha che per ! 0 w ( ; t) = f ( + ct) + f ( ct) Se invece f = g con f funzione pari, allora per w ( ; t) = 3.5 f ( + ct) + f ( ct) ! 2f 0 (ct) : !0 2f (ct) ! 1: Esercizi sul metodo di separazione di variabili e sviluppi di Fourier Esercizio 3.40 Risolvere col metodo di separazione delle variabili il seguente problema di Cauchy-Dirichlet per l’equazione del calore omogenea sul segmento: 8 < ut = 3uxx per 0 < x < 1; t > 0 u (0; t) = u (1; t) = 0 : u (x; 0) = sin3 ( x) Esercizio 3.41 Risolvere col metodo di separazione delle variabili il seguente problema di Cauchy-Dirichlet per l’equazione della corda vibrante: 8 utt = 4uxx per 0 < x < ; t > 0 > > < u (0; t) = u ( ; t) = 0 u (x; 0) = sin 2x cos 3x > > : ut (x; 0) = 0: Esercizio 3.42 Risolvere col metodo di separazione delle variabili il seguente problema di Dirichlet per l’equazione di Laplace sul cerchio: 8 2 1 @2u < @ u 1 @u + + 2 2 = 0 per 2 [0; 1); # 2 [0; 2 ] 2 @ @ @# : u (R; #) = # (2 #) per # 2 [0; 2 ] : Esercizio 3.43 Risolvere col metodo di separazione delle variabili il seguente problema di Dirichlet per l’equazione di Laplace sulla corona circolare: 8 2 @ u 1 @u 1 @2u > > < + + 2 2 = 0 per 2 (1; 2) ; # 2 [0; 2 ] 2 @ @ @# u (1; #) = 1 per # 2 [0; 2 ] > > : u (2; #) = 3 per # 2 [0; 2 ] 145 Esercizio 3.44 Si risolva, col metodo di separazione delle variabili, il seguente problema di Dirichlet per l’equazione di Laplace sul rettangolo: 8 < uxx + uyy = 0 per x 2 (0; A) ; y 2 (0; B) u (x; 0) = u (x; B) = u (A; y) = 0 : u (0; y) = f (y) : In altre parole, il dato al contorno assegnato sul bordo del rettangolo è diverso da zero solo su uno dei 4 lati (per semplicità). Suggerimento: cercare soluzioni a variabili separate u (x; y) = X (x) Y (y) coi metodi visti sopra. Il problema agli autovalori è quello nella Y (y) ; che deve annullarsi a entrambi gli estremi. Scrivere la formula risolutiva nel modo più semplice e compatto. Si trova: u (x; y) = 1 X bn n=1 bn = 2 B Z Sh [n (A x)] n y sin , con Sh (n A) B B f (s) sin 0 n s ds: B Esercizio 3.45 Risolvere col metodo di separazione delle variabili il problema di Dirichlet per l’equazione di Laplace sul rettangolo: 8 < uxx + uyy = 0 per x 2 (0; 1) ; y 2 (0; 2) u (x; 0) = u (x; 2) = u (1; y) = 0 : u (0; y) = sin y cos 2 y: Esercizio 3.46 Risolvere col metodo di separazione delle variabili il seguente problema agli autovalori per il Laplaciano sul rettangolo: 8 0 x 1; 0 y 2 < uxx + uyy + u = 0 u (0; y) = u (1; y) = 0 0 y 2 : u (x; 0) = u (x; 2) = 0 0 x 1: Esercizio 3.47 Risolvere esplicitamente mediante separazione di variabili il seguente problema di Cauchy-Dirichlet per un’equazione di di¤ usione e trasporto sul segmento: 8 < ut = uxx + 2ux per x 2 [0; L] ; t > 0 u (0; t) = u (L; t) = 0 per t > 0 : u (x; 0) = 2e x sin 3Lx per x 2 [0; L] : Esercizio 3.48 Risolvere mediante separazione di variabili il seguente problema di Dirichlet per il laplaciano su una corona circolare (il problema è già scritto in coordinate polari): 8 1 1 < u + u + 2 u## = 0 per 1 < < 2; # 2 [0; 2 ] u (1; #) = 0 : u (2; #) = 1 + sin # + 3 cos 2#: 146 Esercizio 3.49 Risolvere esplicitamente, mediante separazione di variabili il seguente problema di Dirichlet per un’equazione di Laplace con termine di ordine zero, sul quadrato Q = [0; 1] [0; 1]: 8 uxx uyy + u = 0 per (x; y) 2 [0; 1] [0; 1] > > < u (0; y) = u (1; y) = 0 per y 2 [0; 1] u (x; 1) = 0 per x 2 [0; 1] > > : u (x; 0) = sin (5 x) per x 2 [0; 1] : Soluzioni di alcuni esercizi Soluzione Es. 3.47. Cerchiamo u (x; t) = X (x) T (t) : L’equazione diventa: T 0 X = T X 00 + 2T X 0 T0 X 00 + 2X 0 (t) = (x) T X da cui per qualche T0 X 00 + 2X 0 = = T X costante. Si deve avere quindi: X 00 (x) + 2X 0 (x) = X (x) per x 2 (0; L) X (0) = X (L) = 0 T 0 (t) = T (t) per t > 0: Risolviamo: X 00 + 2X 0 X = 0 in (0; L) X (0) = X (L) = 0 che porta: + 1 < 0; x X (x) = e p j1 + jx sin con p j1 + jL = n e quindi un (x; t) = cn e h 2 ( nL ) 2 n L = i +1 t e 1 x sin n x : L Cerchiamo ora la soluzione u (x; t) = 1 X n=1 cn e h 2 ( nL ) 147 i +1 t e x sin n x L x che soddis… u (x; 0) = 2e 2e x 3 x L sin sin : A¢ nché sia: 3 x L 1 X = cn e x n x L sin n=1 si dovrà avere: c3 = 2; cn = 0 per n 6= 3; e in de…nitiva la soluzione cercata è: h 2 ( 3L ) u (x; t) = 2e i +1 t e x sin 3 x : L Soluzione Es. 3.49. Cercando u (x; y) = X (x) Y (y) si trova: Y 00 = Y X 00 =1 X = cost. Le condizioni u (0; y) = u (1; y) = 0 portano al problema agli autovalori: X 00 = X X (0) = X (1) = 0 che dà Xn (x) = sin (n x) n = n2 2 ; n = 1; 2; 3; ::: Quindi si ha: Y 00 = 1 + n2 2 Y che ha integrale generale p Yn (y) = an e 1+n2 2y + bn e p 1+n2 2y : Imponendo anche la condizione Yn (1) = 0 si trova (dopo qualche calcolo) p Sh 1 + n2 2 (1 y) p Yn (y) = cn Sh 1 + n2 2 quindi u (x; y) = 1 X n=1 cn Sh p 1 + n2 2 (1 y) p sin (n x) Sh 1 + n2 2 e imponendo u (x; 0) = sin (5 x) si ha c5 = 1; gli altri coe¢ cienti nulli. Perciò: p Sh 1 + 25 2 (1 y) p u (x; y) = sin (5 x) : Sh 1 + 25 2 148 4 4.1 4.1.1 Trasformata di Fourier e problemi ai limiti La trasformata di Fourier in L1 (Rn ) De…nizione e proprietà elementari Per motivare la de…nizione di trasformata di Fourier, consideriamo una funzione T T f: 2 ; 2 ! R che sia sviluppabile in serie di Fourier, e scriviamo, utilizzando ora la notazione complessa delle serie di Fourier30 : f (x) = +1 X n= 1 con 1 fb(n) = T Z fb(n) ein!x T =2 f (y) e in!y dy e ! = T =2 2 : T A partire da queste identità, vogliamo immaginare un modo per rappresentare una funzione f che sia de…nita su tutta la retta R anziché su un segmento. Ci chiediamo quindi cosa diventano le relazioni precedenti quando T ! 1 e perciò ! ! 0. I prossimi passaggi hanno il semplice scopo di suggerire una de…nizione appropriata. Non serve quindi esplicitare delle ipotesi precise sotto cui sono corretti. Cominciamo con lo scrivere lo sviluppo di f sostituendo a fb(n) la sua espressione analitica: ! Z +1 X 1 T =2 in!y f (y) e dy ein!x : f (x) = T T =2 n= 1 Se ora de…niamo la funzione g( ) = Z T =2 f (y) e T =2 i y ! dy ei x ; la precedente identità si può riscrivere nella forma: ! Z +1 X 1 T =2 1 in!y f (x) = f (y) e dy ein!x = T 2 T =2 n= 1 +1 X !g (n!) : n= 1 Immaginando di suddividere l’asse delle P x, mediante i punti n! (per n 2 Z), +1 in in…niti intervallini di ampiezza !, la serie n= 1 !g (n!) si può vedere come una sorta di somma integrale di Riemann (su tutta la retta, però) che, al tendere di ! a zero, dà l’integrale Z g( )d : R 3 0 v. [An2], cap.7 §3.5. 149 Tuttavia, al tendere di ! a zero si ha T ! 1; quindi nella de…nizione di g ( ) R T =2 R l’integrale T =2 va sostituito con R . Arriviamo così all’identità f (x) = 1 2 Z R Z f (y) e i y dy ei x d : R In…ne ci liberiamo del fattore 21 davanti agli integrali eseguendo, nell’integrale esterno, in d , il cambio di variabile = 2 . Si ottiene Z Z f (x) = f (y) e i2 y dy ei2 x d : R R Questo signi…ca che se, per una funzione f : R ! R, de…niamo la trasformata integrale di f (che si chiamerà trasformata di Fourier) Z fb( ) = f (y) e i2 y dy; R (dovrà essere ovviamente f 2 L1 (R)) è plausibile che si possa poi dimostrare la formula (inversa, in un certo senso) Z f (x) = fb( ) ei2 x d ; R che ricostruisce f dalla sua trasformata. Tutto ciò ha …nora poco di rigoroso; è un ragionamento euristico, che suggerisce la seguente de…nizione, che generalizza il discorso precedente al contesto di Rn : De…nizione 4.1 Per f 2 L1 (Rn ) poniamo Z b f( )= f (y) e 2 i y dy per ogni Rn con di f . y= Pn j=1 j yj . 2 Rn , La funzione fb : Rn ! C si dice trasformata di Fourier Quando la funzione da trasformare ha un’espressione analitica “lunga”scriverd emo anche F (:::) invece che (:::): Si noti che Z b f (0) = f (y) dy; Rn una relazione che talvolta ci sarà utile. Osservazione 4.2 (La trasformata è ben de…nita per f 2 L1 (Rn )) Poiché la teoria dell’integrale di Lebesgue è stata sviluppata per funzioni a valori reali, è necessaria qualche precisazione. Nella de…nizione precedente, l’integranda è 150 una funzione a valori complessi. Per de…nizione, se g : Rn ! C con g = g1 +ig2 e g1 ; g2 a valori reali, si pone Z 1 n g 2 L (R ) () g1 ; g2 misurabili e jg (y)j dy < 1 Rn e in tal caso si pone Z Z g (y) dy = Rn g1 (y) dy + i Rn Se f 2 L1 (Rn ), f (y) e 2 i y Z g2 (y) dy: Rn = jf (y)j 2 L1 (Rn ) perciò la trasformata di Fourier è ben de…nita per ogni 2 Rn . Osservazione 4.3 (Valori reali o complessi della trasformata di Fourier) Nella de…nizione di trasformata di Fourier di f , la funzione f può avere valori reali o complessi; in ogni caso la sua trasformata in generale ha valori complessi. Nel caso particolare n = 1 e f a valori reali, cioè f : R ! R, si ha Z Z fb( ) = f (y) cos (2 y ) dy + i f (y) sin (2 y ) dy; Rn Rn da cui leggiamo in particolare che: se f è pari, allora fb è reale e pari; se f è dispari, allora fb è immaginaria pura e dispari. Teorema 4.4 (Proprietà della trasformata di Fourier) Sia f 2 L1 (Rn ). Allora: i) fb 2 C 0 (Rn ), con fb kf kL1 (Rn ) ; C 0 (Rn ) in particolare, l’operatore trasformata di Fourier, F : L1 (Rn ) ! C 0 (Rn ) F : f 7! fb è lineare continuo. ii) se anche g 2 L1 (Rn ) allora \ (f g) = fb gb: iii) se per un intero k 1 è x f 2 L1 (Rn ) per ogni multiindice31 j j k; allora fb 2 C k (Rn ) e 3 1 Signi…ca: =( 1; 2 ; :::; @ fb = F (( 2 ix) f ) : n) con j 2 N, j j = 1 + n x = x1 1 x2 2 :::xa n @ f = @j jf n @x1 1 @x2 2 :::@xa n 151 2 + ::: + n; con iv) se f 2 C k (Rn ) ; @ f 2 L1 (Rn ) per j j k e @ f 2 C0 (Rn )32 per j j k 1, allora \ (@ f ) ( ) = (2 i ) fb( ) : v) fb 2 C0 (Rn ) : vi) Posto, per " > 0, f " (x) = f ("x) f" (x) = " n x ; " f si ha, per ogni f 2 L1 (Rn ) e " > 0; d " ) ( ) = fb (f d b (f ") ( ) = f vii) Se anche g 2 L1 (Rn ), allora Z Z f gb = Rn viii) Per ogni Rn 2 Rn …ssato si ha: F f (x) e2 " " ix ( ) ( ): fbg: ( ) = fb( ) Osservazione 4.5 Osserviamo le iii) e iv). A parte i dettagli delle ipotesi, in sostanza la iii) ci dice che: più velocemente la f tende a zero all’in…nito (condizione espressa dall’integrabilità di x f ), più regolare è fb; viceversa, la iv) ci dice che: più regolare è f , più velocemente fb tende a zero all’in…nito (condizione espressa dal fatto che (2 i ) fb; essendo una trasformata (di @ f ) per il punto i) è limitata e anzi per il punto v) tende a zero all’in…nito. La iv) (unito alla linearità) dice anche che la trasformata di Fourier trasforma un operatore di¤ erenziale lineare a coe¢ cienti costanti nell’operatore di moltiplicazione per un polinomio, una proprietà che la rende preziosa nel risolvere equazioni di¤ erenziali su tutto Rn . La ii) dice che la trasformata di Fourier trasforma il prodotto di convoluzione in un prodotto puntuale, una proprietà che come vedremo sarà utile nel ricavare formule di rappresentazione integrali di soluzioni di problemi di¤ erenziali. Dimostrazione. i) La continuità di fb è un’applicazione immediata del teorema di continuità degli integrali dipendenti da un parametro (v. §3.4.6), infatti per y …ssato la funzione 7! f (y) e 2 i y è continua, e f (y) e 3 2 Diciamo 2 i y jf (y)j 2 L1 (Rn ) , che f 2 C0 (Rn ) se f 2 C 0 (Rn ) e f (x) ! 0 per jxj ! 1: 152 perciò fb 2 C 0 (Rn ). La disuguaglianza fb 1 C 0 (Rn ) n kf kL1 (Rn ) è allora ovvia. ii) Se f; g 2 L (R ) sappiamo già che f g 2 L1 (Rn ), quindi possiamo calcolare Z \ (f g) ( ) = (f g) (y) e 2 i y dy Rn Z Z = f (y z) g (z) dz e 2 i y dy Rn Rn scambiando l’ordine di integrazione, passaggio che si giusti…ca in base al teorema di Fubini-Tonelli pensando che l’integrale iterato dei valori assoluti converge Z Z = g (z) f (y z) e 2 i y dy dz Rn Rn con traslazione nell’integrale interno Z Z = g (z) f (y) e 2 i n n R R Z Z = g (z) e 2 i z dz Rn (y+z) dy dz f (y) e 2 i y Rn dy = fb( ) gb ( ) : iii) Derivando (per ora formalmente) sotto il segno di integrale si ha: Z Z @ fb( ) = @ f (y) e 2 i y dy = @ f (y) e 2 i y dy Rn Rn Z = f (y) ( 2 iy) e 2 i y dy Rn = F (( 2 ix) f ) ( ) ; che è la tesi. Per giusti…care la derivazione, osserviamo che f (y) ( 2 iy) e 2 i y j j = (2 ) jf (y) y j ; perciò sotto l’ipotesi y f (y) 2 L1 (Rn ) il teorema di derivazione sotto il segno di integrale (v. §3.4.6) è applicabile. iv) Procediamo iterativamente. Per k = 1: supponiamo f 2 C 1 (Rn ) ; @xi f 2 1 L (Rn ) per i = 1; 2; :::; n e calcoliamo (per semplicità di notazione supponiamo i = 1 e poniamo y 0 = (y2 ; :::; yn )) Z Z Z 2 i y 2 i 0 y0 \ (@x1 f ) ( ) = @y1 f (y) e dy = e @y1 f (y) e 2 i 1 y1 dy1 dy 0 Rn Rn 1 R integrando per parti in y1 nell’integrale interno, supponendo che f (y) tenda a 153 zero all’in…nito, = Z e Rn = Z =2 i 1 y0 1 0 2 i y0 1 Z Z f (y) @y1 e 2 i 1 y1 dy1 dy 0 R e Rn 0 2 i Z 2 i 1 f (y) e 2 i 1 y1 dy1 dy 0 R 2 i y f (y) e Rn dy = (2 i 1 ) fb( ) : Il discorso si può ora iterare. Ad ogni derivata @xj che agisce su f e noi trasformiamo, corrisponde un fattore del tipo 2 i j nel risultato …nale; il passaggio di integrazione per parti richiede, per l’annullamento del termine all’in…nito, che tenda a zero all’in…nito la funzione che viene derivata, quindi, complessivamente, che tendano a zero all’in…nito tutte le derivate …no all’ordine k 1. v) Sappiamo già che fb 2 C 0 (Rn ), si tratta di dimostrare che fb( ) ! 0 per j j ! 1. Utilizziamo il risultato del punto iv). Supponiamo prima che sia f 2 C 1 (Rn ) ; @xj f 2 L1 (Rn ) per j = 1; 2; :::; n, allora \ @xj f ( ) = (2 i j ) fb( ) [) ( ) = (2 i ) fb( ) (rf fb( ) = [) ( ) (rf 2 j j : Poiché @xj f 2 L1 (Rn ) ; per il punto i) la sua trasformata di Fourier è limitata quindi c fb( ) ! 0 per j j ! 1: 2 j j 1 Sia ora f 2 L1 (Rn ) qualsiasi. Esiste una successione ffk gk=1 di funzioni C (Rn ), ognuna nulla fuori da un insieme limitato (quindi per le quali @xj fk 2 L1 (Rn ) e pertanto si può applicare la conclusione precedente), che approssima f in norma L1 ; cioè tali che33 1 kf fk kL1 ! 0 per k ! 1. D’altro canto per il punto i), fb fbk C 0 (Rn ) kf fk kL1 (Rn ) ! 0: In altre parole, fb( ) è approssimata uniformemente in Rn da fbk ( ). Fissato " > 0; esiste allora k0 tale che fb fbk0 C 0 (Rn ) < ": 3 3 Questo è un teorema di approssimazione di funzioni integrabili con funzioni regolari (un risultato di questo tipo è detto teorema di densità ), che non abbiamo dimostrato ma si può dimostrare, nella teoria di Lebesgue. 154 Fissata questa fbk0 , che sappiamo tendere a zero all’in…nito (per la prima parte della dimostrazione), esiste R tale che per j j > R è fbk0 ( ) < ". Ma allora per j j > R si avrà fb( ) fbk0 ( ) + fb fbk0 ( ) < 2" e questo dimostra che fb( ) ! 0 per j j ! 1. vi) Calcoliamo Z d ") ( ) = (f f ("y) e 2 i y dy Rn col cambio di variabili "y = z, dy = " n dz Z = f (z) e 2 i z=" " n dz = fb Rn " ( ): L’altra relazione si veri…ca in modo analogo. vii) Ciascuno dei due integrali Z Z f gb; fbg; Rn Rn scrivendo esplicitamente la trasformata, uguaglia (per il teorema di FubiniTonelli) l’integrale doppio Z Z f (x) g ( ) e 2 ix dxd Rn Rn che è convergente perché f; g 2 L1 (Rn ). Perciò i due integrali sono uguali tra loro. viii) Per ogni 2 Rn …ssato si ha: Z F f (x) e2 ix ( ) = f (y) e2 iy e 2 iy dy Rn Z = f (y) e 2 iy ( ) dy Rn = fb( ) Calcolo di alcune trasformate di Fourier notevoli Nel seguito del discorso ci servirà calcolare la trasformata di Fourier di poche funzioni. Ci procuriamo quindi queste speci…che trasformate, come esercizio sulla de…nizione e le proprietà, ma anche come prerequisito per quanto seguirà. Esempio 4.6 Calcoliamo la trasformata di f (x) = e 155 jxj con x 2 R. fb( ) = Z jyj e e 2 i y dy: R Il calcolo si può fare con metodi di analisi 1: Z Z Z jyj 2 i y jyj e e dy = e cos (2 y) dy + i e R R per le simmetrie =2 jyj sin (2 y) dy R Z +1 y e cos (2 y) dy 0 con due integrazioni per parti si trova = 2 : 1 + 4 2 y2 Oppure si può fare, con un procedimento più spiccio34 Z Z +1 Z 0 e jyj e 2 i y dy = e y e 2 i y dy + ey e R y(1+2 i ) 2 i y 1 0 +1 ey(1 2 i ) (1 + 2 i ) 0 (1 2 i ) 1 1 2 = + = : 1+2 i 1 2 i 1+4 2 2 e = dy 0 + 1 Esempio 4.7 Utilizzando il calcolo precedente e la proprietà vi) del teorema, calcoliamo ora, per a > 0, la trasformata di f (x) = e ajxj : Si ha: ajxj ( ) = e\ 2 1+4 2 2 1 a ( )= a 2 1+4 2 2 = 2a a2 + 4 2 2 : a Esempio 4.8 Calcoliamo la trasformata di f (x) = e x2 per x 2 R. Un modo semplice consiste nell’osservare che f 0 (x) = 2xe x2 ; cioè f soddisfa l’equazione di¤ erenziale f 0 (x) = 2xf (x) : 3 4 che si può giusti…care rigorosamente se si conosce la teoria delle funzioni olomorfe (funzioni derivabili di variabile complessa), altrimenti sembra puramente formale. 156 Trasformando ambo i membri mediante le proprietà iii) e iv) si ha (2 i ) fb( ) = 2 0 fb ( ) = 2 2 0 1 fb ( ) 2 i fb( ) ; equazione di¤ erenziale simile a quella soddisfatta da f , risolta da fb( ) = ce con c = fb(0) = Quindi Z e 2 2 x2 dx = p . R p fb( ) = 2 2 e : Esempio 4.9 Utilizzando il calcolo precedente e la vi), calcoliamo la trasformata di 2 f (x) = e ax per x 2 R, a > 0: Si ha: p F e ( 2 ax) ( )= p 2 2 e p a ( )= r 2 2 a e a : Esempio 4.10 Generalizziamo il calcolo della trasformata della gaussiana al caso multidimensionale. Calcoliamo cioè la trasformata di f (x) = e jxj2 , con x 2 Rn . Usando le proprietà degli esponenziali, l’integrale multidimensionale si fattorizza in e¤ etti nel prodotto di n integrali unidimensionali: scriviamo Z 2 fb( ) = e jxj e 2 ix dx n ZR 2 2 2 = e x1 e x2 :::e xn e 2 ix1 1 e 2 ix1 1 :::e 2 ix1 1 dx1 dx2 :::dxn Rn Z Z Z 2 x21 2 ix1 1 x22 2 ix2 2 = e e dx1 e e dx2 ::: e xn e 2 ixn n dxn R R R che è il prodotto delle trasformate di Fourier unidimensionali calcolate in precedenza, perciò: = p e 2 2 1 p e 2 2 2 ::: p e 2 2 2 = n=2 e In de…nitiva: jxj2 ( ) = e\ n=2 e 157 2 j j2 per x; 2 Rn : 2 j j2 : Si ha anche, quindi, per a > 0: ajxj2 ( ) = e\ In particolare, per a = n=2 e 2 j j2 n=2 p a = a e 2 j j2 a : si ha: jxj2 ( ) = e e\ j j2 ; ossia troviamo una particolare gaussiana che è trasformata di Fourier di se stessa. Si ha anche Z 2 jxj2 (0) = 1: e jxj dx = e\ Rn Si osservi che il metodo dell’ultimo esempio non si potrebbe utilizzare invece per calcolare la trasformata di e jxj per x 2 Rn : l’esponenziale p 2 2 e x1 +:::+xn non si fattorizza. 4.1.2 Approssimazioni dell’identità Apriamo ora una parentesi che ci servirà sia a dimostrare la formula di inversione della trasformata di Fourier, sia in seguito a trattare i problemi ai limiti per equazioni a derivate parziali. De…nizione 4.11 (Approssimazione dell’identità) Sia funzione non negativa e integrabile, con Z (x) dx = 1 : Rn ! R una Rn e poniamo, per ogni " > 0, " (x) = " La funzione (famiglia di funzioni) f n " g">0 (x=") : si dice approssimazione dell’identità. Anche se questo non è esplicitamente richiesto dalla de…nizione, intuitivamente conviene immaginare come una funzione con un gra…co a campana, avente il suo unico massimo in x = 0 e tendente a zero per jxj ! 0: Ad esempio (v. Esempio 4.10): 2 (x) = e jxj per x 2 Rn ; oppure (x) = c per x 2 R 1 + x2 158 con c > 0 scelto in modo da avere integrale 1 (in e¤etti, c = 1= ). Questi sono due esempi che ci serviranno in seguito. Le corrispondenti famiglie di funzioni " si chiamano, rispettivamente, nuclei di Gauss e nuclei di Poisson. Osserviamo che Z Z " n (x=") dx " (x) dx = Rn Rn con cambio di variabile x=" = y Z Z n n = " (y) " dy = Rn (y) dy = 1: Rn Quindi le funzioni " hanno tutte lo stesso integrale ma, se è una funzione a campana come negli esempi fatti, le " saranno sempre più “concentrate”: Gra…ci di " (x) per (x) = e x2 e " = 1; " = 0:8; " = 0:5; " = 0:3 Vale il seguente: Teorema 4.12 Sia f " g">0 un’approssimazione dell’identità e consideriamo, per una certa f : Rn ! R, la convoluzione Z Z x y ( " f ) (x) = y) f (y) dy = " n f (y) dy: " (x " n n R R Allora: 1. Se f 2 Lp (Rn ) per qualche p 2 [1; 1), allora " f 2 Lp (Rn ) per ogni ">0e p n + " f ! f in L (R ) , per " ! 0 . 2. Se f è limitata e uniformemente continua, allora " " f ! f uniformemente, per " ! 0+ . 159 f è continua e Non dimostriamo il teorema (si basa comunque su tecniche standard della teoria di Lebesgue, più un risultato di approssimazione di funzioni integrabili con funzioni continue). Diamo un’idea intuitiva del perché il teorema è vero. Poiché " è non negativa e ha integrale 1, la convoluzione ( " f ) (x) si può vedere come una media pesata dei valori di f , che, quanto più piccolo è ", tanto più esalta solo i valori di f vicini a x: infatti se la funzione madre ha un gra…co a campana con un massimo in x = 0, la funzione y 7! " n x y " ha un picco in y = x ed è trascurabile appena ci si sposta un po’da x. Quindi ci aspettiamo che la convoluzione " f sia sempre più vicina alla f di partenza, come il teorema a¤erma in modo preciso. In questo senso " si dice approssimazione dell’identità. 4.1.3 Il teorema di inversione L’utilità della trasformata di Fourier dipende ovviamente anche dalla possibilità di ricostruire f dalla sua trasformata, come anticipato nella discussione con cui abbiamo aperto il paragrafo. Vale il seguente risultato: Teorema 4.13 (di inversione) Sia f 2 L1 (Rn ) : Se anche fb 2 L1 (Rn ) si ha: Z f (x) = fb( ) e2 i x d per q.o.x 2 Rn . Rn In simboli: d f (x) = fb ( x) per q.o.x 2 Rn . Prima di presentare la dimostrazione vera e propria, cerchiamo di capire dov’è il problema. d Se scriviamo esplicitamente l’integrale iterato che rappresenta fb ( x) e formalmente scambiamo l’ordine di integrazione, otteniamo Z Z Z 2 i x b f ( )e d = f (y) e 2 i y dy e2 i x d Rn Rn Rn Z Z = f (y) e2 i (x y) d dy Rn Rn dove l’integrale interno è ovviamente divergente (l’integranda ha modulo 1!). Per riuscire a trattare l’integranda bisogna in qualche modo “smussarla” con una funzione rapidamente decrescente all’in…nito. Utilizzeremo per questo un nucleo regolarizzante opportuno. 160 Dimostrazione. Consideriamo, per t > 0 …ssato e x 2 Rn , l’integrale Z 2 2 F (t; x) = fb( ) e2 i x e t j j d : (4.1) Rn 2 2 (Abbiamo introdotto la gaussiana e t j j che “smussa” all’in…nito l’esponenziale complesso in ). Per t ! 0 l’integranda tende a fb( ) e2 i x ; d’altro canto 2 2 fb( ) 2 L1 (Rn ) ; fb( ) e2 i x e t j j quindi per il teorema di Lebesgue, per t ! 0 Z d F (t; x) ! fb( ) e2 i x d = fb ( x) Rn 1 n dove la convergenza è in L (R ) (vedendo ogni integrale come funzione di x). Mostreremo ora che, per un altro motivo, F (t; ) ! f in L1 (Rn ), per t ! 0, d da cui seguirà l’uguaglianza fb ( x) = f (x) in L1 e quindi puntualmente quasi ovunque. Sia 2 2 ( ) = e2 i x e t j j e consideriamo la catena di uguaglianze: Z F (t; x) = fb( ) ( ) d Rn per il punto vii) del teorema 4.4 = Z Rn f ( ) b( ) d per il punto viii) del teorema 4.4 (applicato a ) Z 2 2 = f ( )F e t j j ( x) d Rn 2 2 2 2 2 d t) = g ponendo g ( ) = e j j , quindi e t j j = g t ( ) e F e t j j = (g bt (per il punto vi) del teorema 4.4), e ricordando che (v. Esempio 4.10), gb ( ) = 2 e j j = g( ) Z Z = f ( ) gt ( x) d = f ( ) gt (x )d : Rn Rn Come osservato nel paragrafo precedente, la famiglia di funzioni gt è un’approssimazione dell’identità. Perciò, per il teorema 4.12, si ha Z f ( ) gt (x ) d ! f (x) in L1 (Rn ) , per t ! 0; Rn e la tesi è dimostrata. 161 Esempio 4.14 Dalle trasformate di Fourier che abbiamo calcolato segue anche la seguente, per il teorema di inversione: F a2 2a + 4 2 x2 ( )=e aj j e quindi ad esempio (per a = 2 ) F 1 1 + x2 ( )= e 2 j j : Corollario 4.15 (Iniettività della trasformata di Fourier) Se f 2 L1 (Rn ) e fb( ) 0; allora f (x) = 0 per q.o. x. Quindi, si ha anche, per ogni f; g 2 L1 (Rn ) fb( ) = gb ( ) =) f (x) = g (x) q.o. E’una conseguenza ovvia del teorema precedente, perché la funzione fb( ) 0 è L1 e quindi possiamo applicare la formula di inversione scrivendo (per q.o.x 2 Rn ) Z 0 e2 f (x) = i x d = 0. Rn Il corollario ci garantisce che la trasformata di Fourier cattura tutta l’informazione presente nella funzione: due funzioni diverse non possono avere la stessa trasformata. Utilizzeremo questo principio nella risoluzione di problemi di¤erenziali: trasformando il problema, otterremo che la trasformata u b della soluzione è uguale a una certa gb, e ne dedurremo che u = g. Osservazione 4.16 (Limiti del teorema di inversione) Sappiamo che per ogni f 2 L1 (Rn ) la trasformata fb è continua e tende a zero all’in…nito. Questo non implica però che fb sia integrabile, ipotesi sotto cui vale il teorema di inversione. Quindi non è detto che ogni funzione integrabile si possa ricostruire dalla sua trasformata mediante l’identità d f (x) = fb ( x) : Approfondendo l’osservazione, notiamo che quando vale questa identità signi…ca che f è la trasformata di una funzione L1 , dunque f è certamente continua. d Perciò se f è L1 (Rn ) ma discontinua, certamente l’identità f (x) = fb ( x) non potrà valere, e fb non sarà integrabile. Quindi: non tutte le funzioni integrabili si possono ottenere dalla loro trasformata di Fourier mediante la formula di inversione; non è facile caratterizzare l’insieme delle funzioni che sono la trasformata di qualche funzione integrabile. 162 Esempio 4.17 Calcoliamo la trasformata di Fourier in R della seguente funzione: e x se x > 0 f (x) = 0 se x 0: Si ha: fb( ) = Z +1 e x e 2 ix e dx = (1 + 2 i ) 0 1 = 1+4 2 2 2 1+4 Notiamo che 2 2 x(1+2 i ) 1+4 = 0 1 1+2 i i: 1 fb( ) = p +1 2 2 2 = L1 (Rn ) ; questo è quindi un esempio di funzione a cui non si può applicare il teorema di inversione. Osservazione 4.18 (Trasformata di Fourier di funzioni non L1 ) In questo paragrafo si è trattata rapidamente la teoria della trasformata di Fourier sullo spazio L1 (Rn ), su¢ ciente per gli scopi di questo corso. La teoria non si ferma certo qui, ci sono buoni motivi per estenderla allo spazio L2 (Rn ) e a opportuni spazi di distribuzioni. Queste estensioni della teoria permettono, in particolare, di dare senso alla trasformata di Fourier anche di certe funzioni non integrabili (come ad esempio la costante 1, la funzione sin !x, ecc.). La de…nizione di trasformata, però, in queste teorie più generali è diversa. Non si può a¤ermare contemporaneamente che esiste fb( ) anche per una certa f 2 = L1 (Rn ), e R 2 i x fb( ) = Rn f (x) e dx: Lo studente ne tenga conto, se e quando in altri contesti troverà cenni alla trasformata di Fourier di oggetti diversi da una funzione integrabile. 4.2 L’equazione di Laplace nel semipiano Consideriamo il problema di Dirichlet per l’equazione di Laplace in due variabili nel semipiano S = f(x; y) : x 2 R; y > 0g: u = 0 per x 2 R; y > 0 u (x; 0) = f (x) per x 2 R. Il signi…cato …sico può essere: temperatura in una lastra illimitata (semipiano) priva di sorgenti di calore; potenziale elettrostatico in un semipiano (o in un semispazio, se supponiamo che il dato f sia indipendente dalla variabile z). La “condizione al bordo” del semipiano S, oltre a consistere nell’assegnare il valore di u sulla retta y = 0, dovrà imporre qualche condizione all’in…nito: …sicamente, ad esempio, potremmo richiedere che il potenziale u sia nullo all’in…nito; matematicamente, il modo operativamente più “comodo” per richiedere una sorta di annullamento all’in…nito sarà chiedere che la soluzione sia L1 (S). 163 Supponiamo quindi che u 2 L1 (S) risolva il problema e applichiamo la trasformata di Fourier rispetto alla sola variabile x: Ponendo u b ( ; y) = F [u ( ; y)] ( ) avremo L’equazione 2 (2 i ) u b+u byy = 0 per 2 R; y > 0 b u b ( ; 0) = f ( ) per 2 R. u byy = 4 2 2 u b si può vedere come un’equazione di¤erenziale ordinaria (nella variabile y) contenente il parametro . Integrale generale: u b ( ; y) = c1 ( ) e2 y + c2 ( ) e 2 y per Come funzione di , u b ( ; y) deve tendere a zero per L’unica possibilità perché questo accada è che sia c1 ( ) = 0 per c2 ( ) = 0 per 2 R; y > 0: ! 1 per ogni y > 0. >0e < 0; cioè u b ( ; y) = c ( ) e 2 j jy per 2 R; y > 0; che imponendo la condizione u b ( ; 0) = fb( ) dà c ( ) = fb( ) u b ( ; y) = fb( ) e 2 j jy : Ora la strategia è: 1. Cercare k (x; y) tale che e 2 j jy = F [k ( ; y)] ( ) ; 2. Riscrivere quindi u b ( ; y) = fb( ) F [k ( ; y)] ( ) e ricordando la formula per la trasformata della convoluzione (teorema 4.4, punto ii ) F (f g) = fbgb; scrivere u b ( ; y) = F [f 164 k ( ; y)] ( ) e quindi, identi…cando le funzioni che hanno uguale trasformata (v. Corollario 4.15) Z u (x; y) = [f k ( ; y)] (x) = k (x z; y) f (z) dz: R 3. Ricordiamo ora che, per ogni a > 0, è F e ajxj ( )= 2a a2 + 4 2 2 ; funzione L1 (R), perciò per la formula di inversione F 2a a2 + 4 2 x2 ( )=e da cui e 2 j jy =F 4 4 y +4 2 y2 aj j 2 x2 ; ( ) perciò k (x; y) = 1 y2 y + x2 e la formula di rappresentazione cercata per la soluzione del problema è Z y f (z) u (x; y) = 2 dz per x 2 R; y > 0: 2 z) R y + (x L’integrale scritto ha senso per ogni y > 0 e f 2 L1 (R) (oppure f 2 L1 (R)). Al solito si tratta ora di mostrare che quella assegnata dalla formula è una funzione su¢ cientemente regolare, risolve e¤ettivamente l’equazione e assume il dato al bordo in qualche senso. Discussione della soluzione ottenuta La funzione k (x; y) si chiama nucleo di Poisson per il semispazio. Un calcolo diretto mostra che Z 1 y dx = 1 per ogni y > 0; (4.2) 2 y + x2 R in particolare k ( ; y) 2 L1 (R) per ogni y > 0 perciò per il teorema di Young (v. §3.4.9), f 2 Lp (R) =) u 2 Lp (R) per p 2 [1; 1): Mostriamo che si può derivare u sotto il segno di integrale: 0 ! Z Z y y @ f (z) 2 (x z) B dz = @ 2 2 @x 2 y + (x z) R R y 2 + (x z) 165 2f 1 C (z)A dz: La funzione 2t g (t) = (y 2 2 + t2 ) è limitata, quindi 2 (x y2 z) 2 + (x 2f jf (z)j 2 L1 (R) (z) z) e per il criterio di derivabilità visto nel §3.4.6 la derivazione sotto il segno di integrale è lecita. Si capisce anzi che per ogni y > 0; le derivate della funzione integranda rispetto a x di qualsiasi ordine sono limitate, perciò il discorso si può ripetere. Lo stesso vale in e¤etti per la derivazione rispetto ad y. Troviamo perciò un risultato analogo a quello visto per l’equazione di Laplace nel cerchio: all’interno del dominio, la soluzione è C 1 . Una volta garantito che si può e¤ettivamente derivare sotto il segno di integrale, la veri…ca del fatto che la u soddis… l’equazione dipende dal fatto che 1 y2 y + x2 = 0 per (x; y) 6= (0; 0) ; cosa che si può controllare con il calcolo diretto35 . La veri…ca diretta che u assume il dato al bordo sarebbe più delicata (come nel caso del cerchio). Invece che fare calcoli speci…ci per questa situazione, vale la pena inquadrarla in una situazione generale che ci servirà ancora in seguito, ossia riconoscere che il nucleo di Poisson si può vedere come una famiglia (al variare di y) di funzioni (in x) approssimazioni dell’identità. Infatti, ponendo 1 1 1 + x2 11 1 " (x) = " 1+ x (x) = 2 = 1 " " "2 + x2 si riconosce che il nucleo di Poisson (4.2) è un’approssimazione dell’identità: k (x; y) = ky (x) con k (x) = 1 1 : 1 + x2 Possiamo quindi trarre le nostre conclusioni: 3 5 Forse la veri…ca che dà calcoli meno laboriosi consiste nel riconoscere che in coordinate polari è y sin # = ; y 2 + x2 un’espressione di cui è semplice calcolare il laplaciano in coordinate polari: y y 2 + x2 = @2 + 1 @ + 166 1 2 2 @## sin # =0 Teorema 4.19 Sia f 2 L1 (R). La funzione Z y f (z) u (x; y) = 2 dz per x 2 R; y > 0 2 z) R y + (x è in…nitamente derivabile nel semipiano y > 0, risolve l’equazione di Laplace nel semipiano e assume il dato al bordo in senso L1 : ku ( ; y) f kL1 (R) ! 0 per y ! 0+ : Se inoltre f è uniformemente continua, allora ku ( ; y) f kC 0 (R) ! 0 per y ! 0+ : In questo caso si può dire che u è soluzione classica del problema di Dirichlet. Vale inoltre la stima di dipendenza continua: sup ku ( ; y)kL1 (R) y>0 kf kL1 (R) : Dimostrazione. Abbiamo già dimostrato la regolarità di u e il fatto che risolva l’equazione; le a¤ermazioni sul modo in cui è assunto il dato al bordo discendono dal teorema sulle approssimazioni dell’identità, in base alla discussione precedente al teorema. La stima di dipendenza continua discende dal teorema di Young: u (x; y) = (ky f ) (x) ku ( ; y)kL1 (R) kky kL1 (R) kf kL1 (R) = kf kL1 (R) e passando al sup per y > 0 si ha la tesi. Esempio 4.20 Gra…ci delle soluzioni dei problemi di Dirichlet con dato al bordo: f (x) = e x2 ; f (x) = 1 se jxj < 1 ; 0 altrimenti 167 f (x) = sin x se jxj < 0 altrimenti ; Come può suggerire il secondo esempio, se il dato iniziale ha qualche punto di discontinuità, nei punti in cui è continuo, la soluzione assume ancora il dato con continuità. In e¤etti, con una dimostrazione più diretta si potrebbe ra¢ nare il secondo punto del teorema precedente, provando che: Se f 2 L1 (R) \ L1 (R), in ogni punto x in cui f è continua si ha f " (x) ! f (x) per " ! 0+ . Osservazione 4.21 Cosa si può dire sull’unicità della soluzione? Il metodo risolutivo suppone a priori che u (oltre ad essere derivabile quanto basta da soddisfare l’equazione) soddis… la condizione u ( ; y) 2 L1 (R) per ogni y > 0: Infatti, se così non fosse non potremmo calcolarne la trasformata rispetto a x. Si consideri la funzione: u (x; y) = ex sin y che soddisfa u = 0 per x 2 R; y > 0 u (x; 0) = 0 per x 2 R eppure non è la funzione identicamente nulla. Questa funzione per y > 0 …ssato non è integrabile in x e il procedimento risolutivo “non la trova”. D’altro canto, come notato all’inizio della discussione di questo problema, trovandoci su un dominio illimitato, qualche condizione all’in…nito dovremo porla per completare le condizioni al contorno. 4.3 L’equazione del calore in tutto lo spazio Consideriamo il problema di Cauchy per l’equazione del calore (omogenea) in tutto lo spazio Rn . Come vedremo, il metodo della trasformata di Fourier consente di risolvere il problema per qualsiasi n, senza incontrare maggiori di¢ coltà se n > 1. Consideriamo quindi il problema: ut D u = 0 per x 2 Rn ; t > 0 u (0; x) = f (x) per x 2 Rn : (4.3) e, supponendo che la soluzione u (t; x) che cerchiamo sia, per ogni t …ssato, integrabile in Rn , applichiamo la trasformata di Fourier in Rn all’equazione. Ponendo u b ( ; t) = F (u ( ; t)) ( ) e ricordando che (punto iv del teorema 4.4) \ (@ f ) ( ) = (2 i ) fb( ) ; 168 possiamo calcolare ([ u) ( ; t) = n X n X 2 @\ xi xi u ( ; t) = j=1 = j=1 2 2 4 j j u b ( ; t) : 2 (2 i i ) u b ( ; t) Si ha anche (sotto opportune ipotesi che consentano di derivare rispetto al parametro t l’integrale che de…nisce u b ( ; t)) d (u bt ( ; t) t ) ( ; t) = u perciò 2 u bt ( ; t) + D4 2 j j u b ( ; t) = 0 equazione di¤erenziale ordinaria in t (ora è a vedersi come parametro) che si integra come 2 2 u b ( ; t) = c ( ) e 4D j j t e trasformando anche la condizione iniziale u (x; 0) = f (x) si ha u b ( ; 0) = fb( ) che imposta come condizione iniziale all’integrale generale precedente dà u b ( ; t) = fb( ) e 2 4D j j2 t : (4.4) Si tratta ora di riconoscere il nucleo gaussiano come la trasformata di Fourier di un’opportuna funzione. Questo è facile, ricordando che (v. Esempio 4.10): n=2 ajxj2 ( ) = e\ 2 j j2 a e a : Uguagliando gli esponenti 4D 2 2 2 j j t= ricaviamo a= 2 j j a 1 4Dt e quindi \ jxj2 n=2 e 4Dt ( ) = (4D t) e e F 1 n=2 (4D t) jxj2 4Dt e ! 2 4D ( )=e 4D De…niamo quindi il nucleo del calore k (x; t) = 1 n=2 (4D t) 169 e jxj2 4Dt : j j2 t 2 j j2 t : (4.5) Possiamo così riscrivere la (4.4) (indicando con b k ( ; t) la trasformata di k (x; t) rispetto ad x) come u b ( ; t) = fb( ) b k ( ; t) e utilizzando la regola di trasformazione della convoluzione, u b ( ; t) = F (f k ( ; t)) ( ) e in…ne (per l’iniettività della trasformata, Corollario 4.15) u (x; t) = (f cioè 1 Z k ( ; t)) (x) ; jx yj2 4Dt f (y) dy; per x 2 Rn ; t > 0 (4.6) Rn (4D t) formula di rappresentazione integrale che “dovrebbe”assegnare la soluzione del problema di Cauchy (4.3). u (x; t) = n=2 e Discussione della formula di rappresentazione ottenuta Al solito, anziché giusti…care i passaggi che ci hanno portato alla (4.6), conviene mostrare direttamente che la u assegnata da tale formula risolve e¤ettivamente il problema. E’ facile mostrare che, per f 2 L1 (Rn ) e per ogni t > 0, si può derivare sotto il segno di integrale un numero qualsiasi di volte, applicando il risultato visto nel §3.4.6. La funzione u è quindi in…nitamente regolare per ogni t > 0. Il fatto che u risolva l’equazione discende dalla derivazione sotto il segno di integrale e dal fatto che il nucleo del calore la soddisfa, come si può veri…care con calcolo diretto: ponendo per semplicità = jxj e considerando t > 0; ! 2 jxj2 n 1 n=2 1 4Dt @t (k (x; t)) = e t + n=2 n=2 4Dt2 2 (4D ) (4D t) 2 n + 2t 4Dt2 = k (x; t) (k (x; t)) = 1 2 e n=2 (4D t) : 4Dt Ricordando che per una funzione radiale u (x) = g (jxj) si ha n u = g 00 ( ) + 1 g0 ( ) e calcolando quest’espressione per 2 g( ) = e g0 ( ) = 00 g ( )=e 4Dt 2 2Dt e 4Dt 2 2 4Dt 2Dt 170 1 2Dt si ha 2 (k (x; t)) = k (x; t) 2Dt 2 = k (x; t) 1 2Dt n 1 2Dt n 2Dt 4D2 t2 e quindi (@t D ) (k (x; t)) = k (x; t) 2 n + 2t 4Dt2 2 D n 2Dt 4D2 t2 =0 per ogni t > 0: La prima conclusione quindi è: per ogni f 2 L1 (Rn ) assegnata, la u data dalla formula (4.6) è in…nitamente derivabile e risolve l’equazione del calore in Rn (0; +1) : Come già accadeva nel caso dell’equazione del calore sul segmento, anche in più dimensioni e in tutto lo spazio l’equazione del calore mostra di avere un forte e¤etto regolarizzante. Quanto alla condizione iniziale, osserviamo che, posto k (x) = 1 e n=2 (4D ) jxj2 4D ; risulta per ogni t > 0 k (x; t) = kpt (x) : Poiché k (x) > 0 e dalla (4.5) per t = 1 leggiamo ! jxj2 1 F e 4D ( ) = e n=2 (4D ) 4D 2 j j2 e quindi Z Rn 1 n=2 (4D ) e jxj2 4D dx = F la famiglia di funzioni kpt (x) amo concludere il seguente: 1 n=2 (4D ) t>0 e jxj2 4D ! (0) = e 4D 2 j j2 (0) = 1; è un’approssimazione dell’identità, e possi- Teorema 4.22 Per ogni f 2 L1 (Rn ), la u assegnata da (4.6) assume la condizione iniziale in senso L1 , ossia ku ( ; t) f kL1 (Rn ) ! 0 per t ! 0+ . 171 Vale inoltre la stima di dipendenza continua sup ku ( ; t)kL1 (Rn ) kf kL1 (Rn ) : t>0 Se inoltre f è limitata e uniformemente continua, allora ku ( ; t) f kC 0 (Rn ) ! 0 per t ! 0 " f è continua e + (convergenza uniforme). Vale in tal caso il principio di massimo sup x2Rn ;t>0 ju (x; t)j max jf (x)j : x2Rn Dimostrazione. I due risultati di convergenza seguono dal teorema 4.12 perché k (x; t) è un’approssimazione dell’identità. La disuguaglianza di dipendenza continua è una conseguenza della proprietà della convoluzione: u ( ; t) = k ( ; t) f ku ( ; t)kL1 (Rn ) kk ( ; t)kL1 (Rn ) kf kL1 (Rn ) = kf kL1 (Rn ) da cui prendendo il sup per t > 0 si ha la tesi. In…ne, il principio di massimo si dimostra come nel caso di un dominio limitato (§5.2.1). Esempio 4.23 Rappresentiamo la soluzione del problema di Cauchy (in dimensione spaziale 1) ut uxx = 0 per x 2 R; t > 0 u (0; x) = f (x) per x 2 R con 1 se jxj < 1 f (x) = 0 altrimenti. Si ha, per x 2 R; t > 0: u (x; t) = 1 1=2 (4 t) Z che ha il seguente gra…co: 172 1 e 1 (x y)2 4t dy; Si osserva l’e¤ etto regolarizzante dell’equazione per t > 0. Equazione non omogenea Mediante la trasformata di Fourier possiamo risolvere anche un problema di Cauchy per l’equazione del calore non omogenea. Consideriamo il problema: ut D u = F (x; t) per x 2 Rn ; t > 0 u (0; x) = 0 per x 2 Rn . (4.7) Non è restrittivo supporre la condizione iniziale nulla; se non lo fosse, per il principio di sovrapposizione potremmo sommare le soluzioni del problema (4.3) e (4.7). Trasformando e procedendo come in precedenza si ha: u bt ( ; t) + D4 u b ( ; 0) = 0 2 2 j j u b ( ; t) = Fb ( ; t) che è un problema di Cauchy per un’equazione di¤erenziale ordinaria del prim’ordine in t, lineare e non omogenea. Si integra così: Z t 2 2 4D 2 j j2 t c( ) + e4D j j Fb ( ; ) d u b ( ; t) = e 0 e imponendo la condizione iniziale, Z t Z t 2 2 2 2 u b ( ; t) = e 4D j j t e4D j j Fb ( ; ) d = e 0 4D 2 j j2 (t 0 ) Fb ( ; ) d : Sfruttando ora il calcolo già fatto in precedenza, l’integranda si può vedere come la trasformata di una convoluzione in x, Z t u b ( ; t) = F (k ( ; t ) F ( ; )) ( ) d 0 e scambiando la trasformata in x con l’integrazione in t, Z t u (x; t) = k( ;t ) F ( ; ) (x) d 0 Z t Z = k (x y; t ) F (y; ) dy d Rn 0 o, esplicitamente: u (x; t) = Z 0 t 1 (4D (t n=2 )) Z Rn e jx yj2 4D(t ) ! F (y; ) dy d : (4.8) Si confrontino le formule (4.6) e (4.8), costruite con lo stesso nucleo del calore, ma diversa struttura degli integrali. 173 Discutere le ipotesi sotto cui la (4.8) assegna e¤ettivamente la soluzione del problema di Cauchy non è così semplce. E’chiaro che, non appena F è una funzione limitata almeno per tempi …niti, cioè sup jF (x; t)j MT < 1 x2Rn ;t2(0;T ) si può scrivere, per ogni t ju (x; t)j MT T Z t (4D (t 0 = MT Z 1 t n=2 )) Z e jx yj2 4D(t ) ! dy d Rn 1d = tMT 0 da cui sup ju (x; t)j ! 0 per t ! 0+ : x2Rn La condizione iniziale è dunque assunta con continuità sotto la sola ipotesi di limitatezza di F per tempi …niti. Il problema questa volta è calcolare le derivate di u dalla formula di rappresentazione. Come in altri problemi per un’equazione non omogenea, questo porta a “integrali singolari”. Lo studente provi a ri‡ettere su cosa succede cercando di calcolare ! ! Z t Z jx yj2 1 e 4D(t ) F (y; ) dy d : @t n=2 0 Rn (4D (t )) Ci limitiamo a segnalare che per F su¢ cientemente regolare (ad es., C 2 ) il procedimento è giusti…cato. 4.4 Problemi unidimensionali per l’equazione di di¤usione con trasporto e reazione Consideriamo, in una sola variabile spaziale, l’equazione di di¤usione per la concentrazione u di una sostanza in soluzione, con termini di trasporto e reazione (v. § 2.2 per il signi…cato …sico): ut Duxx + vux + u = 0 per x 2 R; t > 0 u (x; 0) = f (x) per x 2 R dove D; v; sono costanti, D; > 0 per il loro signi…cato …sico, mentre il segno di v non ha importanza. Possiamo con un cambio di variabile ricondurci all’equazione di di¤usione pura, di cui conosciamo la soluzione. Poniamo: u (x; t) = eax+bt w (x; t) 174 con a; b costanti da determinarsi e w nuova funzione incognita. Calcoliamo: ut = eax+bt fbw + wt g ux = eax+bt faw + wx g uxx = eax+bt 2awx + wxx + a2 w e sostituendo nell’equazione otteniamo: eax+bt (bw + wt ) wt D 2awx + wxx + a2 w + v (aw + wx ) + w = 0 Da2 + av + Dwxx + w b + wx (v 2Da) = 0: Scegliamo ora a; b in modo che sia Da2 + av + 2Da = 0 b v =0 cioè a= v 2D b = Da2 av = e in de…nitiva v2 4D + v u (x; t) = e 2D x e v2 4D t w (x; t) con wt Dwxx = 0 e imponendo la condizione iniziale v f (x) = u (x; 0) = e 2D x w (x; 0) otteniamo che w risolve il problema di Cauchy wt Dwxx = 0 per x 2 R; t > 0 v w (x; 0) = f (x) e 2D x per x 2 R e quindi per la (4.6) w (x; t) = p 1 4D t Z e jx yj2 4Dt f (y) e v 2D y dy Rn e u (x; t) = e =e v2 4D + v2 4D + Z jx yj2 v 1 e e 4Dt f (y) e 2D y dy n 4D t R Z jx yj2 v 1 t p e 4Dt e 2D (x y) f (y) dy: 4D t Rn t v 2D x p 175 Troviamo quindi una formula di rappresentazione con una struttura simile alla precedente, dove però: il nucleo del calore che compare nell’integrale è sostituito da uno modi…cato che tiene conto del trasporto; il tutto è moltiplicato per un esponenziale decrescente nel tempo, che modellizza la reazione chimica (o decomposizione) che nel tempo tende a consumare la sostanza. 4.5 L’equazione di Poisson nello spazio Consideriamo l’equazione di Poisson in tutto lo spazio R3 : u=f e proponiamoci di risolverla con la trasformata di Fourier. Sia ha: 4 da cui 2 2 j j u b ( ) = fb( ) u b( ) = 4 fb( ) 2 2: j j Ovviamente questa scrittura vale indi¤erentemente qualunque sia la dimensione n dello spazio ambiente, tuttavia come vedremo nel seguito, nella risoluzione giocherà un ruolo cruciale il fatto di supporre di trovarci in R3 . Notiamo subito che, a di¤erenza di quanto abbiamo visto nell’applicare la trasformata di Fourier all’equazione del calore o all’equazione di Laplace sul semipiano, non possiamo pensare di antitrasformare la funzione m( ) = 1 4 2 2 j j =b k( ) per poi ottenere una formula di rappresentazione della soluzione del tipo u = f k, in quanto la funzione m ( ) è discontinua nell’origine e quindi certamente non è la trasformata di Fourier di una funzione L1 R3 . Dovremo invece b antitrasformare direttamente il prodotto 4 f2(j )j2 . Scriviamo, per ora un po’ formalmente Z Z Z e2 i x fb( ) 2 i x e d = f (y) e 2 i y dy d u (x) = 2 2 2 2 3 3 3 j j j j R 4 R 4 R ! Z Z 2 i (x y) e = f (y) dy (4.9) 2 d 3 3 4 2j j R R e studiamo anzitutto l’integrale interno, che riscriviamo (con x Z e2 i d : k ( ) = lim L!1 j j<L 4 2 j j2 176 y = ) come L’integranda in ha denominatore radiale, mentre a numeratore compare la scrittura z; tenendo anche conto del fatto che l’integrale è esteso a una sfera, viene l’idea di usare le coordinate sferiche ( ; ; ), orientando l’asse z verso la variabile , in modo che risulti d = 2 sin d d d = j j cos : Perciò Z e2 j j<L 4 i 2 2d j j = Z Z 2 0 = Z 0 Z L 0 = Z = 1 2 Z Z 2 e2 i 2 2 L 4 i j j cos 0 L e2 j j cos 2i i j j i2 0 L i j j cos e2 0 e2 0 = Z L 1 2 jzj e 2 j j 2 2 sin d sin d ! 2 d ! d d d 0 i j j d sin (2 j j) d j j (t = 2 j j) Z 2 Lj j sin t 1 = dt 2 2 j j 0 t 0 2 2 e utilizzando l’integrale generalizzato notevole (che si può dimostrare con tecniche di variabile complessa) Z R sin t dt = lim R!1 0 t 2 otteniamo k ( ) = lim L!1 1 2 2 j j Z 0 2 Lj j sin t 1 dt = t 2 2j j 2 = 1 : 4 j j In…ne, utilizzando quest’espressione di k ( ) nella (4.9) otteniamo Z f (y) u (x) = dy = (f k) (x) ; yj R3 4 jx (4.10) formula che può avere senso se ad esempio f è nulla fuori da un insieme limitato (si osservi che il nucleo k non è integrabile all’in…nito, quindi per una generica funzione f 2 L1 R3 lintegrale può non esistere). Si osservi che la funzione k ( ) è una soluzione radiale dell’equazione di Laplace in R3 nf0g ; ossia è il potenziale generato da una carica puntiforme posta 177 nell’origine. Quindi l’integrale che de…nisce u si può vedere come la sovrapposizione degli in…niti potenziali generati da cariche puntiformi poste nel generico punto x, di intensità pari alla densità di carica f . Al solito, si tratta ora di dimostrare che sotto opportune ipotesi la funzione u assegnata dalla (4.10) risolve l’equazione di Poisson. Tale soluzione evidentemente non può essere unica: sommando a u una qualsiasi funzione armonica in tutto lo spazio, si trova un’altra soluzione dell’equazione di Poisson. Prima di enunciare un teorema, cerchiamo di capire qual è il problema. Se potessimo calcolare u (x) derivando sotto il segno di integrale a partire dalla formula così come è scritta, otterremmo Z 1 f (y) dy: u (x)? =? 4 jx yj 3 R Questa formula però non può essere vera per due ragioni: 1. Se fosse vera, poiché sappiamo che la funzione 1= jyj è armonica, otter1 remmo = 0 e quindi u = 0 e non, come vogliamo, u = 4 jx yj f. 2. D’altro canto se pensiamo ai singoli addendi che compongono il laplaciano di 1= jyj ; cioè @2 1 2 @xi 4 jx yj 3 troviamo una funzione che in x va a in…nito come 1= jx yj , quindi non integrabile. Perciò la derivazione sotto il segno di integrale non è giusti…cabile. Per calcolare correttamente il laplaciano di u occorrerà riscrivere opportunamente l’integrale. Notando che Z Z f (y) f (x y) dy = dy; 4 jx yj 4 jyj R3 R3 il secondo integrale può essere derivato, portando le derivate sotto il segno di integrale, “scaricando la derivata” sulla funzione f anziché sul nucleo 1= jyj. Occorrerà però richiedere che la f sia derivabile due volte. A questo punto però il problema è capire a cosa è uguale Z f (x y) u (x) = dy: 4 jyj 3 R Per questo ci vorrà qualche altra astuzia... Teorema 4.24 Per ogni f 2 C02 R3 (cioè C 2 e nulle fuori da un insieme limitato), la u de…nita da (4.10) è C 2 R3 e soddisfa l’equazione u = f in R3 . Dimostrazione. Consideriamo Z Z f (y) f (x y) u (x) = dy = dy 4 jx yj 4 jyj 3 3 R R 178 e calcoliamo u (x) = Z f (x y) dy 4 jyj Z f (x y) dy + 4 jyj jyj R3 = Z jyj>r r f (x y) dy 4 jyj Ir (x) + Jr (x) per un certo numero r > 0 che poi faremo tendere a zero. Notare che la funzione 1= jyj è integrabile in un intorno dell’origine, in R3 (passando in coordinate sferiche la funzione 1= viene moltiplicata per il fattore 2 proveniente dalla jacobiana), mentre la funzione f (x y), per x …ssato, è continua in y e nulla fuori da un insieme limitato. Perciò gli integrali convergono. Ricordiamo anche che la funzione 1= jyj è armonica (fuori dall’origine) e radiale, perciò nella regione fjyj > rg è (1= jyj) = 0. Applichiamo allora a Ir la seconda identità di Green ZZZ ZZ @g @f [f g g f ] dxdydz = f g dS, @ne @ne @ 1 calcolando, per = fjyj > rg e @ = fjyj = rg, @@ jyj = r12 (derivata rispetto a r, cambiata di segno perché la normale è uscente dalla regione fjyj > rg) Z Z y) y) x f (x y f (x dy = dy Ir (x) = 4 jyj 4 jyj jyj>r jyj>r Z Z 1 1 @f = f (x y) dS (x y) dS 4 r2 jyj=r 4 r@ jyj=r = Ir1 (x) + Ir2 (x) : Ora Ir1 (x) = mentre Ir2 (x) 1 j@Br (x)j Z @Br (x) f (y) dS ! f (x) per r ! 0 1 sup jrf j j@Br (x)j = r sup jrf j ! 0 per r ! 0; 4 r perciò Ir (x) ! f (x) per r ! 0. D’altro canto Z f (x y) jJr (x)j = dy 4 jyj jyj r Z 1 sup j f j dy 4 jyj jyj r in coordinate sferiche = sup j f j 4 Quindi u = f. Z 0 r 1 4 2 d = sup j f j 179 r2 ! 0 per r ! 0: 2 4.6 L’equazione delle onde nello spazio Consideriamo il problema di Cauchy per l’equazione delle onde omogenea nello spazio R3 : 8 < utt c2 u = 0 per x 2 R3 ; t > 0 u (0; x) = g (x) per x 2 R3 (4.11) : ut (0; x) = h (x) per x 2 R3 . Notiamo anzitutto che la soluzione di questo problema si può sempre ricondurre a quella di un problema analogo, ma con g = 0. Si può dimostrare infatti: Proposizione 4.25 Per f : R3 ! R assegnata, sia wf la soluzione del problema 8 < utt c2 u = 0 per x 2 R3 ; t > 0 u (0; x) = 0 per x 2 R3 (4.12) : ut (0; x) = f (x) per x 2 R3 . Allora la soluzione di (4.11) è data da u = @t wg + wh : Il problema (4.12) si può a¤rontare con la trasformata di Fourier in R3 . Trasformando l’equazione e le condizioni iniziali si ha (analogamente al caso dell’equazione del calore nello spazio) 8 2 btt ( ; t) + 4 2 c2 j j u b ( ; t) = 0 < u u b ( ; 0) = 0 : u bt ( ; 0) = fb( ) che si può vedere come problema di Cauchy per un’equazione di¤erenziale ordinaria in t (con come parametro), lineare del second’ordine a coe¢ cienti costanti, omogenea. La soluzione è: sin (2 c j j t) u b ( ; t) = fb( ) : 2 cj j Diversamente da quanto abbiamo fatto con l’equazione di Laplace nel semipiano e l’equazione del calore nello spazio, questa volta non si riesce a determinare un’espressione analitica semplice della funzione la cui trasformata di Fourier sia sin (2 c j j t) ; 2 cj j quindi non otterremo una formula di rappresentazione della soluzione con la struttura u ( ; t) = k ( ; t) f: Scriviamo allora, applicando formalmente il teorema di inversione Z sin (2 c j j t) 2 i x u (x; t) = fb( ) e d 2 cj j 3 R 180 introducendo, prudentemente, un passaggio al limite per avere integrali convergenti all’in…nito Z sin (2 c j j t) 2 i x = lim fb( ) e d L!1 j j<L 2 cj j ed esprimendo la trasformata di f esplicitamente come integrale Z Z sin (2 c j j t) 2 i x e d = lim f (y) e 2 i y dy L!1 j j<L 2 cj j 3 R scambiando l’ordine di integrazione Z Z sin (2 c j j t) 2 e = lim f (y) L!1 R3 2 cj j j j<L i (x y) d ! dy: Ora lavoriamo sull’integrale interno. E’ un integrale triplo ( = ( 1 ; 2 ; 3 )), sulla sfera di centro l’origine e raggio L. Se non ci fosse l’esponenziale complesso, l’integranda sarebbe radiale; nella speranza di sfruttare al meglio le simmetrie, utilizziamo delle coordinate sferiche orientate in modo che il vettore (x y) punti verso il polo nord, cioè 8 < 1 = cos 2 = sin cos : 3 = sin sin con =j je (x y) = jx yj cos : Ricordiamo che, per la formula del cambio di variabili nell’integrale triplo in coordinate sferiche, d 1 d 2 d 3 = 2 sin d d d : Si ha, ponendo anche, per semplicità jx yj = r, Z sin (2 c j j t) 2 i (x y) e d 2 cj j j j<L Z L Z 2 Z sin (2 c t) = e2 i r cos sin d 2 c 0 0 0 Z L Z sin (2 c t) = e2 i r cos sin d d c 0 0 Z L sin (2 c t) e2 i r cos = d c 2 i r 0 0 Z L sin (2 c t) e2 i r e 2 i r = d c 2 i r 0 Z L sin (2 c t) e2 i r e 2 i r = d cr 2i 0 Z L 1 = sin (2 c t) sin (2 r) d : cr 0 181 d 2 d Otteniamo quindi la formula: Z u (x; t) = lim L!1 f (y) c jx yj R3 Z L sin (2 c t) sin (2 jx 0 yj) d ! dy: Per calcolare l’integrale in dy trasformiamo anche questo in coordinate sferiche, scegliendo l’origine in x, in modo che, ancora con jx yj = r, si abbia 8 < y1 x1 = r cos y2 x2 = r sin cos : y3 x3 = r sin sin : Quindi, lasciando scritto per ora f (y) anziché f (x1 + r cos ; x2 + r sin cos ; x3 + r sin sin ) ; si ha u (x; t) = lim L!1 = lim L!1 Z Z +1 0 1 c Z 2 0 Z 0 L sin (2 c t) 0 f (y) cr Z +1 Z L sin (2 c t) sin (2 r) d 0 sin (2 r) 0 Z Z 2 0 ! sin d f (y) sin d ! d d 0 Riconosciamo ora il signi…cato geometrico dell’integrale interno nelle variabili ; : è multiplo dell’integrale di super…cie, sulla super…cie della sfera di centro x e raggio r, di f . Precisamente, essendo, sulla super…cie della sfera di raggio r; dS = r2 sin d d si ha g (r) r Z 0 2 Z f (y) sin d 0 1 d = r Z Z f dS @S(x;r) così che la formula precedente si riscrive Z L Z +1 1 u (x; t) = lim sin (2 c t) sin (2 L!1 c 0 0 r) g (r) dr d : Si tratta ora di riconoscere la struttura di questo integrale. La funzione g è de…nita solo per r 0. Immaginiamo di prolungarla dispari per r < 0. Allora la sua trasformata di Fourier in R è Z Z +1 gb ( ) = g (r) e 2 ir dr = 2i g (r) sin (2 r) dr R ossia Z L Z +1 1 sin (2 c t) sin (2 c 0 0 0 r) g (r) dr d = 182 1 2 ic Z 0 L sin (2 c t) gb ( ) d : ! r2 dr rdr d : D’altro canto la trasformata di Fourier gb ( ) di una funzione reale e dispari è una funzione immaginaria pura e dispari, quindi Z Z +1 c (b g ) ( s) = gb ( ) e2 i s d = 2i gb ( ) sin (2 s) d R 0 da cui leggiamo, per il teorema di inversione, Z L 1 1 c lim sin (2 c t) gb ( ) d = (b g ) ( ct) = g (ct) L!1 0 2i 2i e in…ne u (x; t) = 1 1 1 g (ct) = 2 ic 2i 4 c2 t Z Z f dS @S(x;ct) Abbiamo così ottenuto la formula di Kirchho¤ : Z Z 1 f dS; u (x; t) = 4 c2 t @S(x;ct) che esprime il fatto che la soluzione u (x; t) è proporzionale a 1=t volte l’integrale di super…cie del dato f sulla sfera @S (x; ct). Poiché l’area di tale sfera vale 4 c2 t2 , si può anche esprimere la stessa formula come Z Z 1 u (x; t) = t f dS; j@S (x; ct)j @S(x;ct) e dire che u (x; t) è uguale t volte la media integrale di f sul bordo della sfera. Tenendo conto anche della Proposizione 4.25 abbiamo il seguente risultato preciso: Teorema 4.26 (Formula di Kirchho¤) Per g 2 C 3 R3 e h 2 C 2 R3 assegnate, l’unica soluzione del problema (4.11) è assegnata dalla formula ! Z Z Z Z 1 1 u (x; t) = @t gdS + hdS: 4 c2 t 4 c2 t @S(x;ct) @S(x;ct) Non dimostriamo questo teorema (occorrerebbe provare che nelle ipotesi enunciate la formula precedente si può e¤ettivamente derivare due volte e assegna la soluzione del problema di Cauchy), accontentandoci di commentare la formula …nale ottenuta. Le onde tridimensionali si propagano secondo questa legge: il valore di u nel punto x all’istante t dipende solo dai valori dei dati iniziali g; h sulla super…cie della sfera di centro x e raggio ct. Questa super…cie costituisce quindi il dominio di dipendenza di u (x; t). Ad esempio: una perturbazione puntiforme nei dati, concentrata nel punto x0 all’istante t = 0, sarà visibile nel punto x solo all’istante t0 = jx x0 j =c. Questo signi…ca che in tre dimensioni una sorgente puntiforme produce segnali istantanei. 183 Per contro, abbiamo visto che per un’onda unidimensionale la formula di D’Alembert dà: Z x+ct 1 1 u(x; t) = (u0 (x + ct) + u0 (x ct)) + v0 (s) ds; 2 2c x ct da cui leggiamo che il valore u (x; t) dipende dai valori che il dato v0 assume in tutto l’intervallo (x ct; x + ct); questo signi…ca anche che una perturbazione puntiforme nei dati, concentrata nel punto x0 all’istante t = 0, sarà visibile in un punto x per ogni tempo t > jx x0 j =c. La propagazione ondosa in una dimensione o in tre dimensioni ha quindi un comportamento ben diverso. Non ci occuperemo qui dell’equazione delle onde in dimensione spaziale due, ma segnaliamo a titolo di confronto che dal punto di vista di cui stiamo discutendo il caso bidimensionale assomiglia a quello unidimensionale e non a quello tridimensionale: il dominio di dipendenza di u (x; t) è costituito in due variabili dal cerchio pieno di centro x e raggio ct. In due variabili quindi (come in una) una perturbazione istantanea produce un’onda teoricamente perenne, mentre in tre variabili ne produce una istantanea. Si pensi al fenomeno di un sasso lanciato nell’acqua, che possiamo vedere sia dal punto di vista delle onde meccaniche approssimativamente bidimensionali prodotte nell’acqua (i “cerchi nell’acqua”), sia delle onde sonore tridimensionali (rumore): a fronte di un unico fenomeno approssimativamente “istantaneo e puntiforme” del sasso che cade, l’e¤etto sonoro (tridimensionale) è istantaneo mentre l’e¤etto meccanico (onde d’acqua) produce un “treno” di cerchi che si allargano, virtualmente senza termine (se non ci fosse attrito). A titolo di confronto si ri‡etta sul fatto che, nello studio dell’equazione del calore, non abbiamo incontrato di¤erenze qualitativamente rilevanti al variare della dimensione spaziale. E’una caratteristica dell’equazione delle onde e dei fenomeni ondulatori quella di presentare rilevanti di¤erenze al variare della dimensione spaziale. 184 5 Spazi di Hilbert Gli spazi vettoriali dotati di un prodotto scalare sono ambienti astratti in cui si può de…nire un concetto di ortogonalità analogo a quello euclideo in Rn . Questo mette a disposizione un sistema di riferimento privilegiato in cui i calcoli sono particolarmente comodi e semplici, un concetto di proiezione ortogonale che diventa strumento per approssimare un elemento generico di uno spazio vettoriale (che nelle applicazioni all’analisi è una funzione) mediante elementi di un particolare sottospazio (che nelle applicazioni sono funzioni di qualche tipo particolarmente semplice). In dimensione in…nita, come abitualmente si è in analisi, l’ortogonalità da sola non basterebbe però a garantire il “buon funzionamento” di questo tipo di teoria: la validità della proprietà di completezza (nel senso degli spazi di Banach) è essenziale a¢ nché si possano dimostrare teoremi signi…cativamente simili a quelli che valgono in Rn . Da questa sintesi di idee nasce il concetto di spazio di Hilbert, uno spazio di Banach in cui c’è un prodotto scalare e quindi un concetto di ortogonalità. L’esempio più naturale di spazio di Hilbert utile in analisi, in un certo senso prototipo di tutti gli altri, è lo spazio L2 ( ) delle funzioni a quadrato sommabile in qualche dominio di Rn . Perciò la teoria degli spazi di Hilbert, pur essendo di per sé una teoria astratta che utilizza solo i concetti propri degli spazi vettoriali normati, nelle sue applicazioni interessanti ha bisogno della teoria della misura e dell’integrazione di Lebesgue. E’ una teoria che nasce quindi dall’incontro tra gli sviluppi dell’analisi funzionale astratta con la teoria della misura moderna. A sua volta, l’applicazione della teoria astratta degli spazi di Hilbert al contesto concreto dello spazio L2 ( ) richiede, come vedremo, la conoscenza di particolari “sistemi ortonormali completi”di funzioni. Il sistema trigonometrico fsin nx; cos nxg comunemente usato nell’analisi di Fourier è il primo fondamentale esempio di sistemi di questo tipo. A seconda del problema in esame (problemi di approssimazione di funzioni in analisi armonica, problemi ai limiti per equazioni differenziali ordinarie o alle derivate parziali), occorre a volte cercare altri tipi di sistemi ortonormali completi di funzioni speciali, adattati in qualche senso al problema in esame. 5.1 Spazi vettoriali con prodotto interno De…nizione 5.1 Sia V uno spazio vettoriale sul campo K (= R o C). Si dice che V è uno spazio vettoriale dotato di prodotto interno, o di prodotto scalare, o anche che V è uno spazio pre-Hilbertiano, se (oltre alle due operazioni proprie dello spazio vettoriale, cioè la somma di vettori e il prodotto tra un vettore e uno scalare) è de…nita una (terza) operazione, che chiamiamo prodotto scalare o prodotto interno, (; ):V V !K con le seguenti proprietà: 1. lineare sulla prima componente: ( x + y; z) = (x; z) + (y; z) 185 8x; y; z 2 V; ; 2 K; 2.a. se K = R (caso che maggiormente considereremo in seguito): commutativo (x; y) = (y; x) 8x; y 2 V ; 2.b. se K = C: (x; y) = (y; x) 8x; y 2 V dove indica il coniugato nel campo complesso. Si noti che se K = R dalla commutatività segue anche la linearità sulla seconda componente, per cui in tal caso diciamo semplicemente che il prodotto scalare è bilineare; se invece K = C da 1 e 2.b segue (z; x + y) = (z; x) + (z; y) 8x; y; z 2 V; ; 2C e si dice che il prodotto scalare complesso è sesquilineare. Notiamo anche che nel caso complesso essendo (x; x) = (x; x), risulta (x; x) reale per ogni x 2 V , il che dà senso alla prossima richiesta. 3. Positività: (x; x) 0 8x 2 V e (x; x) = 0 () x = 0: Esempio 5.2 Sono spazi vettoriali con prodotto interno i seguenti: 1. Lo spazio Rn col prodotto scalare (x; y) = n X xj yj : j=1 2. Lo spazio Cn (su C) col prodotto scalare (x; y) = n X xj yj : j=1 3. Lo spazio Rn col prodotto scalare n X (x; y) = aij xj yj i;j=1 n dove A = (aij )i;j=1 è una qualsiasi matrice simmetrica e de…nita positiva. 4. Lo spazio C [a; b] (funzioni a valori reali) con (f; g) = Z b f (t) g (t) dt: a 5. Lo spazio C [a; b] (funzioni a valori complessi) con (f; g) = Z b f (t) g (t)dt: a 186 6. Lo spazio L2 ( ) (funzioni a valori reali o complessi), misurabile di Rn con Z (f; g) = f (x) g (x)dx: sottoinsieme Questo sarà l’esempio più importante nel seguito. Se le funzioni hanno valori reali ovviamente non c’è bisogno di mettere il coniugato sopra g. 1 7. Lo spazio `2 delle successioni x = fxn gn=1 a valori reali o complessi per le quali si abbia 1 X 2 jxj j < 1; j=1 col prodotto scalare (x; y) = 1 X xj y j . j=1 Questo è in un certo senso l’analogo discreto dell’esempio precedente. Si noti l’analogia con il prodotto scalare usuale di Rn . In tutto il seguito, per sempli…care le notazioni e le dimostrazioni, tratteremo sempre spazi vettoriali su R. Quello che diremo vale comunque anche per spazi complessi, con qualche modi…ca di notazione o nelle dimostrazioni. Teorema 5.3 Sia V uno spazio pre-Hilbertiano. Allora: 1. Vale la disuguaglianza di Cauchy-Schwarz: p p j(x; y)j (x; x) (y; y) 8x; y 2 V: 2. Ponendo kxk = p (x; x) si ottiene che k k è una norma, che si dice “norma del prodotto interno”. Si noti che la disuguaglianza di Cauchy-Schwarz si riscrive quindi j(x; y)j kxk kyk 8x; y 2 V: (5.1) 3. La norma del prodotto interno soddisfa l’uguaglianza del parallelogramma: 2 2 2 2 kx + yk + kx yk = 2 kxk + kyk 8x; y 2 V: Dimostrazione. Dimostriamo il teorema lavorando per semplicità con uno spazio pre-Hilbertiano reale. La dimostrazione di tutti i punti si basa sulle proprietà assiomatiche del prodotto interno. 1. Per ogni 2 R possiamo scrivere: per la positività del prodotto scalare: 0 ( x + y; x + y) = 187 per la bilinearità del prodotto scalare 2 = (x; x) + 2 (x; y) + (y; y) = per de…nizione di norma del prodotto scalare = 2 2 2 kxk + 2 (x; y) + kyk : Dunque abbiamo 2 2 kxk + 2 (x; y) + kyk 2 0 8 2 R, il che implica che il discriminante del trinomio di secondo grado in ossia 2 2 2 (x; y) kxk kyk 0 sia 0, da cui (5.1). p 2. Ponendo kxk = (x; x) si ha, per la positività del prodotto scalare, la proprietà di positività della norma. Vale l’omogeneità perché p p p 2 (x; x) = j j k xk = ( x; x) = (x; x) = j j kxk : Vale la disuguaglianza triangolare perché per de…nizione di norma e bilinearità del prodotto scalare 2 2 2 kx + yk = (x + y; x + y) = (x; x) + 2 (x; y) + (y; y) = kxk + 2 (x; y) + kyk per la (5.1) 2 2 2 kxk + 2 kxk kyk + kyk = (kxk + kyk) da cui kx + yk kxk + kyk. 3. Per de…nizione di norma e bilinearità del prodotto scalare si ha: 2 kx + yk + kx 2 yk = (x + y; x + y) + (x y; x y) = (x; x) + 2 (x; y) + (y; y) + (x; x) 2 2 (x; y) + 2 (y; y) 2 = 2 [(x; x) + (y; y)] = 2 kxk + kyk : Ogni spazio pre-Hilbertiano è dunque uno spazio vettoriale normato, la cui norma “proviene da un prodotto scalare” e soddisfa l’uguaglianza del parallelogramma. Viceversa, potremmo avere uno spazio vettoriale normato (qualsiasi) e chiederci se esista un prodotto scalare che induca quella norma. Da questo punto di vista, il fatto che valga l’uguaglianza del parallelogramma risulta una condizione necessaria, come mostra il prossimo Esempio 5.4 Dimostriamo che la norma di L1 [a; b] non proviene da un prodotto scalare. Si faccia attenzione: è chiaro che il prodotto scalare Z b (f; g) = f (t) g (t) dt a 188 non induce la norma L1 (perché induce la norma L2 ); noi stiamo a¤ ermando però che non esiste alcun prodotto scalare (f; g) per cui si abbia !2 Z b (f; f ) = a jf (t)j dt : Se un tale prodotto scalare esistesse, la norma L1 dovrebbe soddisfare l’uguaglianza del parallelogramma, cosa che non accade, come ora mostriamo. Consideriamo, in L1 [0; 2]: f (t) = [0;1] (t) ; g (t) = [1;2] (t) : Poiché j(f g) (t)j = 1 in [0; 2], si ha: Z 2 2 2 kf + gkL1 + kf gkL1 = dt 2 + 0 2 2 Z 2 2 dt = 4 + 4 = 8; 0 2 kf kL1 + kgkL1 = 2 (1 + 1) = 4 e l’uguaglianza non vale. Pertanto L1 non è uno spazio pre-Hilbertiano. Si può dimostrare (v. Esercizio 5.21) che se V è uno spazio vettoriale normato la cui norma soddisfa l’uguaglianza del parallelogramma, allora il prodotto i 1h 2 2 2 (x; y) = kx + yk kxk kyk 2 è e¤ettivamente un prodotto scalare, che induce la norma k k. Di conseguenza l’uguaglianza del parallelogramma caratterizza le norme degli spazi pre-hilbertiani. Questo fa capire che tutta la geometria degli spazi con prodotto scalare è scritta, implicitamente, nella semplice uguaglianza del parallelogramma. Difatti, come vedremo, quest’uguaglianza giocherà un ruolo centrale nella dimostrazione di un risultato fondamentale. Una conseguenza della disuguaglianza di Cauchy-Schwarz che ci sarà utile talvolta è la seguente: Teorema 5.5 Sia V uno spazio vettoriale pre-hilbertiano. Allora il prodotto 1 1 scalare è continuo, cioè se x; y 2 V e fxn gn=1 ; fyn gn=1 V , si ha: yn ! y =) (x; yn ) ! (x; y) ; xn ! x; yn ! y =) (xn ; yn ) ! (x; y) : Dimostrazione. j(x; yn ) (x; y)j = j(x; yn y)j kxk kyn yk ! 0 per yn ! y, che mostra la prima relazione. Per la seconda, scriviamo j(xn ; yn ) (x; y)j = j(xn ; yn ) (xn ; y) + (xn ; y) (x; y)j = j(xn ; yn y) + (xn x; y)j j(xn ; yn y)j + j(xn x; y)j kxn k kyn yk + kyk kxn xk 189 e l’ultima espressione scritta tende a zero poiché kyn yk ; kxn xk tendono a zero, mentre la successione xn essendo convergente è limitata, perciò esiste c tale che kxn k c per ogni n. In uno spazio vettoriale con prodotto interno si può de…nire in maniera naturale un concetto di ortogonalità: De…nizione 5.6 Si dice che x; y 2 V sono ortogonali tra loro, e si scrive x ? y, se (x; y) = 0: Vale allora il seguente Teorema 5.7 (di Pitagora) Siano x1 ; x2 ; :::; xn 2 V elementi a due a due ortogonali. Allora n X 2 xj j=1 = n X j=1 2 kxj k : Dimostrazione. Si ha, per de…nizione di norma e bilinearità del prodotto scalare: 0 1 2 n n n n X X X X xj = @ xj ; xi A = (xi ; xj ) j=1 j=1 i;j=1 i=1 poiché i vettori sono a due a due ortogonali (xi ; xj ) = 0 per i 6= j, perciò = n X (xj ; xj ) = j=1 n X j=1 2 kxj k : De…nizione 5.8 Sia S V un insieme qualsiasi di vettori. Si dice complemento ortogonale di S, e si indica con S ? , l’insieme S ? = fx 2 V : (x; s) = 0 8s 2 Sg : Teorema 5.9 L’insieme S ? è un sottospazio vettoriale chiuso di V (anche se S non è un sottospazio). Dimostrazione. Che sia un sottospazio segue dalla bilinearità del prodotto scalare: se x; y 2 S ? e ; 2 R si ha, per ogni s 2 S; ( x + y; s) = (x; s) + (y; s) = 0+ 0 = 0: Che sia chiuso segue dalla continuità del prodotto scalare (Teorema 5.5). Infatti 1 sia fxn gn=1 S ? tale che xn ! x 2 V; e proviamo che x 2 S ? . Infatti per ogni s 2 S si ha (x; s) = lim (xn ; s) = lim 0 = 0; n!1 quindi x 2 S ? eS ? n!1 è chiuso. 190 5.2 Spazi di Hilbert De…nizione 5.10 Si dice spazio di Hilbert uno spazio pre-Hilbertiano completo (rispetto alla norma del prodotto scalare). Quindi uno spazio di Hilbert è uno spazio di Banach la cui norma proviene da un prodotto interno. Esempio 5.11 Passiamo in rassegna agli Esempi 5.2 di spazi vettoriali con prodotto interno e vediamo quali di essi sono spazi di Hilbert. Gli esempi 1, 2, 3, 4 sono …nito dimensionali. Questi sono tutti spazi di Hilbert, per la completezza di Rn . Gli esempi 4-5 (funzioni continue, prodotto scalare integrale) danno spazi non completi (sappiamo già che le norme integrali non rendono completo uno spazio di funzioni continue), quindi non di Hilbert. L’esempio 6 è L2 ( ), con il prodotto scalare integrale. Questo è di Hilbert (completezza degli spazi Lp ), ed è l’esempio più importante per il seguito del discorso. Si noti che stiamo parlando di L2 su un qualsiasi spazio di misura astratto ( ; M; ), non solo un dominio di Rn con la misura di Lebesgue. L’esempio 7 è un caso particolare del precedente quando la misura è quella del conteggio su N. Si ottiene lo spazio `2 di successioni, col prodotto scalare che generalizza quello usuale di Rn al caso in…nito dimensionale. In un certo senso lo spazio `2 si può pensare come una sorta di “spazio R1 ”, dove però la successione delle coordinate è soggetta a un vincolo preciso, la convergenza della P 2 serie jxn j . Nota storica. La teoria astratta degli spazi di Hilbert fu formulata da von Neumann alla …ne degli anni 1920, come strumentazione matematica per la meccanica quantistica. In questa sua applicazione, è la teoria degli spazi di Hilbert complessi quella che serve; questo è il motivo per cui abbiamo dato almeno le de…nizioni iniziali nel caso complesso. Nel seguito del discorso, per semplicità, considereremo quasi sempre spazi reali, soprattutto nelle dimostrazioni. Hilbert fu il primo a introdurre lo spazio `2 , nei primi anni del 1900, e a gettare le basi per l’interesse per questi tipi di spazi vettoriali in…nito dimensionali. Ricordiamo che la teoria degli spazi di Banach (di cui quelli di Hilbert sono un caso particolare) ebbe il suo importante avvio con il lavoro di Banach del 1932 “Teoria degli operatori lineari”, quindi fu successiva alla teoria degli spazi di Hilbert. Segnaliamo anche che gli sviluppi più signi…cativi della teoria degli spazi di Hilbert (così come quella degli spazi di Banach, che non trattiamo) riguardano la teoria degli operatori lineari de…niti su questi spazi, di cui noi non ci occuperemo per nulla. Lo studente curioso dell’applicazione della teoria degli spazi di Hilbert alla meccanica quantistica può leggere, per cominciare, il paragrafo molto elementare [Saxe, Chap. 6, §6.7]., che rimanda a testi più approfonditi. Avvertiamo comunque che la teoria degli spazi di Hilbert necessaria per comprenderne le applicazioni alla meccanica quantistica è molto più ampia di quella qui sviluppata. 191 Negli spazi di Hilbert il teorema di Pitagora dimostrato in precedenza si estende a somme in…nite, al modo seguente: 1 Teorema 5.12 (di Pitagora, 2a versione) Se fxj gj=1 è una successione di elementi di spazio di Hilbert H a due a due Puno P1ortogonali e tali che la serie 1 2 numerica j=1 kxj k converge, allora la serie j=1 xj converge in H e vale la 1 X 2 xj = j=1 1 X j=1 2 kxj k : Dimostrazione. Possiamo anzitutto applicare il teorema di Pitagora in versione …nita ad ogni somma parziale della serie, e scrivere m X 2 xj = j=n m X j=n 2 kxj k : (5.2) P1 2 Poiché la serie numerica j=1 kxj k converge, le sue somme parziali sono una Pm 2 successione di Cauchy, quindi j=n kxj k ! 0 per n; m ! 1: Per l’uguaglianza Pm (5.2) le somme parziali di j=n xj sono allora una successione di Cauchy in H, ed essendo lo spazio completo la serie converge. Dunque esiste x 2 H tale che n X j=1 n X xj ! x; perciò 2 2 xj ! kxk : j=1 D’altro canto Pn j=1 2 xj = Pn 2 j=1 n X j=1 (5.3) kxj k ; perciò 2 2 kxj k ! kxk . (5.4) Da (5.3) e (5.4) segue 1 X j=1 2 kxj k = 1 X 2 xj : j=1 Il risultato fondamentale sulla geometria degli spazi di Hilbert è il seguente: Teorema 5.13 (Distanza da un sottospazio chiuso, o Teorema della proiezione). Sia H uno spazio di Hilbert e V un suo sottospazio vettoriale 192 chiuso. Allora per ogni x 2 H esiste un unico v 2 V di minima distanza da x, ossia tale che kx vk = inf kx vk : v2V Inoltre x v è ortogonale a V . L’elemento v si dice proiezione di x su V . Dimostrazione. Proviamo l’esistenza. Se x 2 V basta porre v = x, perciò supponiamo x 2 = V . Sia d = inf v2V kx vk. (Questo inf esiste perché V non 1 è vuoto e kx vk 0). Sia fxn gn=1 V una successione minimizzante, ossia tale che kx xn k ! d: (Tale successione esiste per de…nizione di estremo inferiore). Proviamo che questa successione è di Cauchy. Si utilizza a questo scopo l’uguaglianza del parallelogramma: kxn 2 xm k = k(xn x) + (x = x) k(xn 2 xm )k (x 2 2 xm )k + 2 kxn 2 xk + kx xm k : Ora, per n; m ! 1 si ha: 2 xk ! d2 ; kxn k(xn x) (x kx 2 xm k ! d2 ; 2 xm )k = kxn + xm 2 2xk = 4 xn + xm 2 perché, essendo V un sottospazio vettoriale, xn ; xm 2 V =) segue che 2 lim kxn xm k 4d2 + 2 d2 + d2 = 0; 2 x xn +xm 2 4d2 2 V: Ne n;m!1 1 cioè kxn xm k ! 0, ossia fxn gn=1 è di Cauchy. Poiché H è completo, esiste allora v 2 H tale che xn ! v; inoltre, poiché V è un sottospazio chiuso di H, v 2 V . In…ne, poiché kxn kxn xk ! kv xk ! d; xk e si ha kv xk = d. Questo completa la dimostrazione dell’esistenza dell’elemento di V di minima distanza da x. Proviamo ora l’unicità. Siano dunque v1 ; v2 due elementi di V tali che kvi xk = d per i = 1; 2 193 e proviamo che allora v1 = v2 . Si usa ancora l’uguaglianza del parallelogramma, in modo simile a quello già visto: kv1 2 2 v2 k = k(v1 x) + (x v2 )k = k(v1 x) (x = 4 v1 + v2 2 x 2 2 v2 )k + 2 kv1 xk + kx v2 k 2 2 + 2 d2 + d2 4d2 + 4d2 = 0 2 2 2 V ) v1 +v x d: Dunque kv1 v2 k = 0, in quanto v1 ; v2 2 V ) v1 +v 2 2 ossia v1 = v2 : Prima di dimostrare l’ultimo punto del teorema (ortogonalità di x v a V ) ragioniamo sul signi…cato geometrico di questa proprietà, lasciandoci guidare dall’analogia con il caso …nito dimensionale. Se V è un sottospazio (chiuso) di H e x è un elemento di H che non appartiene a V , dal punto di vista geometrico chi sarà l’elemento v 2 V di minima distanza da x? Sarà la proiezione ortogonale di x su V . Questo signi…ca appunto che x v è ortogonale a tutti gli elementi di V . Dimostriamolo. Sia w = x v, v 2 V qualsiasi, e proviamo che (w; v) = 0. Per ogni 2 R, scriviamo (essendo v + v 2 V e kwk = d =distanza di V da x) 2 kwk 2 kx (v + v)k = k(x = (w v; w 2 = kwk v) = (w; w) 2 (v; w) + 2 kvk da cui 2 (v; w) Ponendo v) 2 kvk 2 2 vk = kw 2 (v; w) + 2 vk 2 2 8 2 R: = tsgn(v; w) con t > 0 la precedente si riscrive così 2t j(v; w)j t2 kvk 194 2 8t > 0; (v; v) da cui dividendo per t e facendo tendere t a zero si ottiene (v; w) = 0, che è la tesi. Corollario 5.14 (Decomposizione ortogonale di H rispetto a un suo sottospazio chiuso). Se H è uno spazio di Hilbert e V un suo sottospazio chiuso si ha: H = V V ?; dove si legge “ somma diretta” e signi…ca quanto segue: ogni elemento x 2 H si può scrivere come somma di un elemento v 2 V e un elemento v 0 2 V ? , inoltre V \ V ? = f0g. Le due cose insieme implicano che la scrittura x = v + v 0 con v 2 V e v 0 2 V ? è unica. Dimostrazione. Sia V un sottospazio chiuso di H. Se V = H allora V ? = f0g e la tesi è ovvia. Altrimenti, preso un x 2 H, per il Teorema della proiezione possiamo scrivere x = v + (x v) con v 2 V e (x v) 2 V ? . E’ poi ovvio che V \ V ? = f0g in quanto se x 2 V \ V ? si ha (x; x) = 0 e quindi x = 0. Mostriamo anche che la scrittura di un elemento x 2 H nella forma x = v + v 0 con v 2 V e v 0 2 V ? è unica. Supponiamo che esistano due scritture x = v1 + v10 = v2 + v20 con v1 ; v2 2 V; v10 ; v20 2 V ? . Allora si ha: v1 v2 = v20 v10 : Il primo membro è un elemento di V , il secondo membro è un elemento di V ? , allora poiché V \ V ? = f0g si ha v1 v2 = 0 = v20 v10 da cui v1 = v2 , v10 = v20 ossia la scrittura è unica. 5.3 Analisi di Fourier in spazi di Hilbert Andremo ora più a fondo del concetto di ortogonalità, vedendo come opportuni sistemi di vettori ortogonali possano costituire, in uno spazio di Hilbert astratto così come avveniva in Rn , un buon “sistema di riferimento”. n 1 De…nizione 5.15 Un insieme …nito fej gj=1 o numerabile fej gj=1 di elementi di H si dice sistema ortonormale se (ei ; ej ) = 0 se i 6= j 1 se i = j: In altre parole, i vettori sono a due a due ortogonali, e ciascuno ha norma unitaria. Notazione. In questo paragrafo considereremo spesso combinazioni lineari di vettori, ed è importante distinguere a colpo d’occhio i vettori dalle costanti che li 195 moltiplicano. Cambiando leggermente notazioni quindi, scriveremo ad esempio n ej j=1 per indicare i vettori e n X cj ej j=1 per indicare una loro combinazione lineare, dove le cj sono costanti. Cominciamo con l’illustrare alcuni procedimenti e idee che riguardano i sottospazi di dimensione …nita di uno spazio di Hilbert. Ricordiamo anzitutto che in base al teorema di Pitagora in spazi di Hilbert si può scrivere: n X 2 cj ej = j=1 n X cj ej 2 j=1 = n X j=1 2 jcj j : (5.5) Quest’uguaglianza in particolare implica che vettori che costituiscono un sistema ortonormale …nito sono sempre linearmente indipendenti. Infatti se n X cj ej = 0 j=1 per certe costanti c1 ; c2 ; :::; cn , in base a (5.5) si ha n X j=1 2 jcj j = 0 e quindi cj = 0 per j = 1; 2; :::; n; perciò i vettori sono indipendenti. Un sistema ortonormale …nito costituisce quindi una base dello spazio vettoriale da essi generato. Viceversa, se V0 è un sottospazio …nito dimensionale di n H, data una qualsiasi base uj j=1 di V0 è sempre possibile a partire da questa generarne un’altra che sia costituita da vettori ortonormali. E’su¢ ciente adoperare il procedimento di ortonormalizzazione di Gram-Schmidt, che illustriamo iterativamente così: e1 = vers (u1 ) (dove, qui e nel seguito, indichiamo vers (u) = e2 = vers (u2 u kuk ); (u2 ; e1 ) e1 ) (spiegazione: dopo aver normalizzato il primo vettore, consideriamo il secondo e gli sottraiamo la sua componente nella direzione del primo; così u2 (u2 ; e1 ) e1 risulta ortogonale a e1 ; ora lo normalizziamo e abbiamo e2 ); e3 = vers (u3 (u3 ; e1 ) e1 (u3 ; e2 ) e2 ) e così via …no a ottenere una base ortonormale ej 196 n j=1 di V0 . Esplicitamente, l’algoritmo ricorsivo che de…nisce en è: e1 = vers (u1 ) en = vers un n X1 (un ; ek ) ek k=1 ! : Supponiamo ora che V0 , sottospazio …nito dimensionale di H, sia dotato n di una base ortonormale ej j=1 (cosa che, come appena visto, si può sempre supporre). Dato un elemento x2 H; il suo elemento di minima distanza da V0 (che sappiamo già esistere in base al teorema delle proiezioni) non è altro che: PV0 x = n X x; ej ej : j=1 Infatti PV0 x 2 V0 e si veri…ca facilmente che x PV0 x 2 V0? . E’ su¢ ciente calcolare per k = 1; 2; :::; n il prodotto scalare (x PV0 x; ek ) = (x; ek ) n X x; ej ej ; ek = (x; ek ) (x; ek ) = 0: j=1 Quindi la scrittura x = PV0 x + (x PV0 x) mostra, in base al teorema delle proiezioni, che l’elemento di minima distanza di x da V0 è proprio PV0 x: Ecco quindi che la conoscenza di una base ortonormale in V0 dà un algoritmo semplice ed esplicito per calcolare l’elemento di minima distanza di un vettore qualunque da V0 ; mediante la sua proiezione ortogonale. Prima di proseguire sarà utile illustrare queste idee con un esempio concreto: Esempio 5.16 Determinare il polinomio di grado 2 che approssima meglio la funzione f (x) = sin ( x) in L2 (0; 1) : Ragioniamo così: sia V0 lo spazio vettoriale dei polinomi di grado 2 su [0; 1]. E’ uno spazio vettoriale di dimensione …nita (3), quindi chiuso; è un sottospazio di L2 (0; 1) : Il polinomio di grado 2 che approssima meglio la funzione f in L2 (0; 1) è la proiezione di f su V0 . Per calcolarla, dobbiamo prima costruire una base ortonormale in V0 . Per farlo, partiamo da una base qualunque di V0 , sceglieremo quella più semplice, costituita da 1; x; x2 , e la 197 ortonormalizziamo in L2 (0; 1) mediante il procedimento di Gram-Schmidt: 1 e1 = vers (1) = R1 0 Z 1 x 0 e2 = vers (x (x; e1 ) e1 ) ; Z 1 1 (x; 1) = xdx = ; 2 0 !1=2 r 2 1 1 1 dx = = p ; 2 12 2 3 p 1 e2 = 2 3 x ; 2 e3 = vers x2 x2 ; 1 = Z x2 ; e1 e1 1 x2 dx = 0 x2 ; e2 = Z 1 1 ; 3 x2 ; e1 e1 x2 ; e2 e2 L2 0 Z @ = 1 1 3 x2 0 = Z 1 1 x+ 6 2 x 0 p e3 = 6 5 x2 x+ x2 ; e2 e2 ; p 1 3 dx = ; 2 6 p 3 p 2 3 x 6 p x2 2 3 x 0 x2 = 1: 1=2 12 dx 1 6 2 !1=2 dx =p : Ricapitoliamo: una base ortonormale di V0 è costituita dai 3 vettori: e1 = 1; p e2 = 2 3 x p e3 = 6 5 x2 1 2 ; x+ 1 6 : Ora bisogna calcolare la proiezione di f su V0 ; cioè: PV0 f = (f; e1 ) e1 + (f; e2 ) e2 + (f; e3 ) e3 : 198 1 2 !2 11=2 dxA 1 1 = p ; 180 6 5 Calcoliamo dunque: Z 1 2 (f; e1 ) = sin ( x) dx = ; 0 (f; e2 ) = Z 1 p sin ( x) 2 3 x 1 2 0 (f; e3 ) = Z 1 p sin ( x) 6 5 x2 1 x+ 6 0 Perciò PV0 f = = 2 + 60 p 2 5 2 12 3 2 12 x2 3 dx = 0; dx = p 6 5 x2 x + 12 p 2 5 2 3 x+ 2 : 1 6 120 3 12 : Rappresentiamo la funzione f insieme alla sua approssimante: Supponiamo ora di avere a disposizione (e vedremo in seguito che sarà pro1 prio così in molti esempi interessanti) una successione ej j=1 di vettori che costituiscono un sistema ortonormale. I procedimenti illustrati precedentemente si possono applicare iterativamente ai primi n vettori di questa successione, per n crescente. Si ottiene allora il seguente importante risultato: 1 Teorema 5.17 (Disuguaglianza di Bessel) Se ej j=1 è un sistema ortonormale in uno spazio di Hilbert H; per ogni x2 H vale la disuguaglianza (di Bessel): 1 X 2 2 x; ej kxk : j=1 In particolare, la serie a primo membro converge. Inoltre: x n X j=1 2 x; ej ej = kxk 199 2 n X j=1 x; ej 2 : (5.6) Dimostrazione. Applichiamo il teorema delle proiezioni e quanto sopra ossern vato al sottospazio V0 generato dai primi n vettori ej j=1 . Si ha: n X x; ej 2 j=1 = kPV0 xk 2 2 kxk per n = 1; 2; 3; ::: Passando al limite per n ! 1 si ha la tesi (ricordiamo che una serie numerica a termini positivi con somme parziali superiormente limitate è convergente). D’altro canto la scomposizione x = PV0 x + (x PV0 x) dà, per l’ortogonalità, 2 2 kxk = kPV0 xk + kx PV0 xk 2 e quindi x n X j=1 2 x; ej ej = kx 2 PV0 xk = kxk 2 2 kPV0 xk = kxk 2 n X x; ej 2 : j=1 L’idea dell’analisi di Fourier in spazi di Hilbert è approssimare un elemento x di H mediante la sua proiezione su opportuni sottospazi …nito dimensionali. Pn 2 Poiché al crescere di n la somma j=1 x; ej aumenta, dalla (5.6) del teore2 ma precedente leggiamo che la distanza kx PV0 xk diminuisce. Ci piacerebbe poter a¤ermare che questa distanza non solo diminuisce ma tende a zero. Signi…cherebbe che abbiamo un metodo per approssimare bene quanto vogliamo un generico elemento di uno spazio di Hilbert, mediante combinazioni lineari di elementi del sistema ortonormale …ssato. D’altro canto a¢ nché questo accada è 1 necessario che il sistema ortonormale ej j=1 sia su¢ cientemente ricco da “catturare tutte le direzioni di H”: se ad esempio in R3 considerassimo un sistema ortonormale costituito da soli due vettori, certamente non potremmo approssimare bene quanto vogliamo un generico elemento di R3 con combinazioni lineari di questi due vettori. Questo porta alla seguente De…nizione 5.18 Sia H uno spazio di Hilbert. Un sistema ortonormale ej in H si dice completo se per ogni x2 H, x; ej = 0 8j 1 j=1 =) x = 0: Si usa spesso l’abbreviazione s.o.n.c. per “sistema ortonormale completo”. Si osservi che nella de…nizione che abbiamo dato (e che non è l’unica che si trova in letteratura), un s.o.n.c. è necessariamente numerabile, cioè consiste 200 in una successione di elementi (e non una famiglia in…nita più numerosa). Non è ovvio che in uno spazio di Hilbert un s.o.n.c. esista. La cosa interessante, tuttavia, non è dimostrare risultati astratti di esistenza di s.o.n.c., quanto esibire concretamente dei s.o.n.c. utili al problema in esame. Ad esempio, come vedremo, in L2 [a; b] il classico sistema trigonometrico è l’esempio più noto di sistema ortonormale completo. Nel seguito, incontreremo un certo numero di s.o.n.c. espliciti. Il prossimo teorema condensa i risultati fondamentali di analisi di Fourier in spazi di Hilbert: Teorema 5.19 (Serie e trasformata di Fourier in spazi di Hilbert) Sia H 1 uno spazio di Hilbert e ej j=1 un sistema ortonormale completo. Per ogni x2 H; poniamo x bj = x; ej per j = 1; 2; 3; ::: Allora 1. La serie di Fourier di x converge in H ad x, cioè: x= 1 X j=1 2. L’operatore x bj ej 1 F : x 7! fb xj gj=1 detto trasformata di Fourier su H, è lineare e continuo a valori nello spazio di successioni `2 ; più precisamente, F è una isometria tra spazi di Hilbert, cioè è biunivoca e conserva il prodotto scalare e la norma, ossia: x; y = 1 X j=1 x bj ybj 8x; y 2 H (uguaglianza di Plancherel) (il coniugato ybj è necessario se H è uno spazio di Hilbert complesso); 2 kxk = 1 X j=1 2 jb xj j 8x; y 2 H (uguaglianza di Perceval). Osservazione 5.20 Il termine “trasformata di Fourier”in questo contesto può confondere le idee. La trasformata di cui si parla qui è l’analogo astratto dell’operatore F : L2 ( con F : f 7! fb 1 fb(n) = 2 Z ; ) ! `2 f (y) e 201 iny dy con n 2 Z (e che de…nisce i coe¢ cienti che entrano nelle serie di Fourier) e non dell’operatore con fb( ) = F : L1 (R) ! C0 (R) F : f 7! fb Z f (y) e i2 y dy con R 2 R. Questi operatori possono essere chiamati, rispettivamente, “trasformata di Fourier sulla circonferenza” e “trasformata di Fourier su R”. La trasformata di Fourier in spazi di Hilbert è quindi l’analogo astratto della trasformata di Fourier sulla circonferenza. Dimostrazione. L’operatore F è evidentemente lineare; per la disuguaglianza P1 2 2 1 di Bessel, j=1 jb xj j kxk ; in particolare fb xj gj=1 2 `2 . 1 Mostriamo che F è suriettiva. Data una successione fcj gj=1 2 `2 ; cioè tale P1 P1 2 che j=1 jcj j < 1; per il Teorema di Pitagora 5.12 la serie j=1 cj ej converge in H ad un certo elemento x; calcoliamo ora: ! 1 X x bj = x; ej = ck ek ; ej = k=1 per linearità e continuità del prodotto scalare = 1 X ck ek ; ej k=1 per l’ortonormalità del sistema = cj . 1 1 Dunque abbiamo costruito un elemento x2 H tale che fb xj gj=1 = fcj gj=1 ; perciò F è suriettiva. 1 L’iniettività di F segue dalla completezza del sistema ej j=1 : se x bj = 0 8j ossia x; ej = 0 8j; allora x= 0; per de…nizione di sistema ortonormale completo. Dunque F è lineare e biunivoca tra H e `2 . Mostriamo ora che la serie di Fourier di x converge proprio a x. Segue ancora dalla completezza del sistema, infatti: ! 1 X x (x; ek ) ek ; ej = (5.7) k=1 per la linearità e la continuità del prodotto scalare = x; ej 1 X k=1 (x; ek ) ek ; ej = x bj 202 1 X k=1 x bk ek ; ej per l’ortonormalità del sistema =x bj x bj = 0: Dunque essendo il prodotto scalare (5.7) nullo per ogni j, per la completezza del sistema segue che 1 X x (x; ek ) ek = 0; ossia k=1 x= 1 X k=1 x bk ek , che è la convergenza della serie di Fourier. Sapendo questo, l’uguaglianza di Plancherel segue dalla bilinearità e continuità del prodotto scalare: 0 1 1 1 1 X 1 X X X x; y = @ x bk ek ; ybj ej A = x bk ybj ek ; ej = k=1 j=1 e per l’ortonormalità = k=1 j=1 1 X j=1 x bk ybj : In…ne, l’uguaglianza di Perceval segue dall’uguaglianza di Plancherel per y= x: Come si vede, gli spazi di Hilbert dotati di un s.o.n.c. sono un ambiente estremamente naturale per l’analisi di Fourier: i risultati del teorema precedente sono infatti esaurienti e “puliti”: la serie di Fourier di qualsiasi elemento x converge ad x, e la trasformata di Fourier è un’isometria tra spazi di Hilbert, il che signi…ca che tutta l’informazione che identi…ca l’elemento x è codi…cata 1 nella successione numerica fb xj gj=1 . Si ri‡etta anche sul fatto che qualsiasi spazio di Hilbert dotato di un s.o.n.c. risulta identi…cato, tramite la trasformata di Fourier, con lo spazio `2 ; dal punto di vista della struttura astratta esiste quindi un solo spazio di Hilbert dotato di s.o.n.c.! 5.4 Esercizi Spazi di Hilbert Esercizio 5.21 Sia X uno spazio vettoriale normato la cui norma soddisfa l’uguaglianza del parallelogramma 2 kx + yk + kx 2 2 yk = 2 kxk + kyk 2 8x; y 2 X: (NON si sta supponendo a priori che tale norma provenga da un prodotto scalare). 203 a. Provare che allora vale l’uguaglianza del parallelepipedo: 2 2 2 2 kx1 + x2 + x3 k = kx1 + x2 k + kx1 + x3 k + kx2 + x3 k 2 2 8x1 ; x2 ; x3 2 X: (Perché si chiama così? Visualizzare il signi…cato geometrico in R3 ). b. Provare che se si de…nisce i 1h 2 2 2 (x; y) = kx + yk kxk + kyk ; (5.8) 2 questo “prodotto scalare” soddisfa e¤ ettivamente la proprietà (u + v; w) = (u; w) + (v; w) : c. Dal risultato del punto precedente dedurre, successivamente, le seguenti proprietà ( u; v) = (u; v) (nu; w) = n (u; w) per n = 1; 2; 3; ::: 1 u; w n = ( u; v) = 1 (u; v) per n = 1; 2; 3; ::: n (u; v) per ogni 2Q d. Dalla de…nizione (5.8) dedurre la proprietà di continuità: Se xn ! x in X; allora (xn ; y) ! (x; y) per ogni y 2 X: e. Sfruttando il punto d e l’ultima proprietà del punto c, provare che: ( u; v) = (u; v) per ogni 2 R: Risulta così completamente dimostrato che: se in uno spazio vettoriale normato la norma soddisfa l’uguaglianza del parallelogramma, allora necessariamente tale norma deriva da un prodotto scalare. Esercizio 5.22 In L2 ( 1; 1) ; si consideri il sottospazio V generato dalle funzioni: 1; x; x2 ; x3 : Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo di ortonormalizzazione di Gram-Schmidt. [Osservazione: iterando questo metodo …no a una potenza n qualunque si costruiscono i polinomi di Legendre, che studieremo in seguito]. 2 Esercizio 5.23 In R si metta la misura Gaussiana d = e x dx: Si consideri lo spazio di Hilbert H = L2 (R; d ), cioè lo spazio delle funzioni per cui si ha: kf kL2 (R;d ) = Z e x2 R 204 1=2 2 f (x) dx < 1: 2 kx1 k + kx2 k + kx3 k Si consideri ora il sottospazio V generato dalle funzioni: 1; x; x2 ; x3 : Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo di ortonormalizzazione di Gram-Schmidt. [Osservazione: iterando questo metodo …no a una potenza n qualunque si costruiscono i polinomi di Hermite, che studieremo in seguito]. Esercizio 5.24 In R+ = (0; +1) si metta la misura d = e x dx: Si consideri lo spazio di Hilbert H = L2 (R+ ; d ), cioè lo spazio delle funzioni per cui si ha: kf kL2 (R+ ;d ) = Z 1=2 +1 e x 2 f (x) dx 0 < 1: Si consideri ora il sottospazio V generato dalle funzioni: 1; x; x2 ; x3 : Costruire una base ortonormale di V , applicando a queste 4 funzioni il metodo di ortonormalizzazione di Gram-Schmidt. [Osservazione: iterando questo metodo …no a una potenza n qualunque si costruiscono i polinomi di Laguerre, che studieremo in seguito]. Esercizio 5.25 Si supponga di eseguire i due procedimenti seguenti: a. Nello spazio L2 (0; 1) si ortonormalizzano le funzioni 1; x; x2 ; x3 (in quest’ordine). b. Nello spazio L2 (0; 1) si ortonormalizzano le funzioni x3 ; x2 ; x; 1; (in quest’ordine). Allora: Si trovano gli stessi due insiemi di vettori. Vero o falso? Si trovano due sistemi di vettori che generano lo stesso spazio vettoriale. Vero o falso? Esercizio 5.26 Esibire un sistema ortonormale completo nello spazio `2 delle successioni reali a serie dei quadrati convergente. Esercizio 5.27 Nello spazio di Hilbert H = L2 ((0; +1) ; e x dx), sia V0 il sottospazio chiuso dei polinomi di grado 2. Dopo aver costruito una base ortonormale di V0 , calcolare la proiezione su V0 della funzione f (t) = sin t. 5.5 5.5.1 Il sistema trigonometrico. Serie di Fourier in una o più variabili Completezza del sistema trigonometrico Possiamo ora rivisitare con più consapevolezza alcuni concetti visti a suo tempo nello studio delle serie di Fourier, inquadrandoli nel contesto naturale degli spazi di Hilbert. 205 Teorema 5.28 Nello spazio L2 [ ; ], il sistema trigonometrico 1 cos nx sin nx p ; p ; p per n = 1; 2; 3; ::: 2 (5.9) è ortonormale completo. Questo teorema completa quindi la dimostrazione del fatto, enunciato nel §3.5.1, che la serie di Fourier di una funzione L2 converge alla funzione stessa in norma L2 , un fatto che è già stato usato varie volte. Ricordiamo che la risoluzione di problemi ai limiti studiati nel §5 si è basata sulla possibilità di sviluppare in serie di Fourier una funzione L2 (o più regolare). In un modo o nell’altro, questi procedimenti sfruttavano tutti la completezza del sistema trigonometrico. Dimostrazione. L’ortonormalità si veri…ca elementarmente calcolando opportuni integrali (questo è stato fatto in Analisi 2). Proviamo la completezza. Si tratta di dimostrare che se f 2 L2 [ ; ] è ortogonale a tutti gli elementi del sistema trigonometrico (5.9) (il che è come dire: se f ha i coe¢ cienti di Fourier tutti nulli) allora f è uguale a zero quasi ovunque in [ ; ] (cioè è l’elemento nullo di L2 [ ; ]). La dimostrazione procede in due passi. 1. Prima si prova la tesi supponendo che f sia anche continua. Notiamo anzitutto che se f è ortogonale a tutti gli elementi del sistema trigonometrico, per linearità è ortogonale a tutte le combinazioni lineari …nite di questi elementi, ossia: per ogni polinomio trigonometrico p (x) si ha: Z f (x) p (x) dx = 0: (5.10) Mostriamo che sotto quest’ipotesi f è identicamente nulla. Per assurdo, non lo sia, e sia ad esempio f (x0 ) > 0 (se è < 0 il ragionamento è analogo). Per il teorema di permanenza del segno esiste un > 0 tale che f (x0 ) 8x 2 (x0 2 Consideriamo ora il polinomio trigonometrico f (x) > t (x) = 1 + cos (x ; x0 + ) : x0 ) cos : Si veri…ca che t (x) > 1 per jx jt (x)j 1 per jx x0 j < x0 j : n Inoltre se t (x) è un polinomio trigonometrico, anche t (x) lo è, per n = 1; 2; 3; :::. Perciò si ha: Z n 0= f (x) t (x) dx Z Z n n = f (x) t (x) dx + f (x) t (x) dx; [ ; ]\jx x0 j< [ 206 ; ]\jx x0 j ossia Z [ n f (x) t (x) dx = ; ]\jx x0 j Z [ n f (x) t (x) dx: ; ]\jx x0 j< Ora, il primo membro dell’uguaglianza rimane limitato al crescere di n, perché: Z Z n n f (x) t (x) dx jf (x)j jt (x)j dx [ ; ]\jx x0 j [ ; ]\jx x0 j [ ; ]\jx x0 j Z jf (x)j dx; Mostriamo invece che il secondo membro tende a 1 per n ! 1 (da cui l’assurdo). Scegliamo un intervallo [a; b] contenuto nell’insieme [ ; ] \ jx x0 j < ; su [a; b] la funzione t (x) avrà minimo m > 1, perciò Z Z f (x0 ) n n t (x) dx f (x) t (x) dx 2 [ ; ]\jx x0 j< [ ; ]\jx x0 j< Z Z b f (x0 ) b f (x ) f (x0 ) 0 n t (x) dx mn dx = (b a) mn ! 1 per n ! 1: 2 2 2 a a Questo dimostra il teorema nel caso f continua. 2. Sia ora f 2 L2 [ ; ] tale che per ogni polinomio trigonometrico p (x) vale (5.10). De…niamo Z x F (x) = f (t) dt: Per il Teorema fondamentale del calcolo integrale per l’integrale di Lebesgue (di cui non abbiamo parlato in precedenza) la funzione F risulta essere continua, derivabile quasi ovunque, con F 0 (x) = f (x) quasi ovunque; inoltre, un integrale Rb F g 0 si può calcolare per parti, se g 2 C 1 (a; b). Calcoliamo allora i coe¢ cienti a di Fourier di F . Z Z sin (nx) sin (nx) F (x) f (x) dx = 0 F (x) cos (nx) dx = n n perché il primo addendo è nullo in quanto sin ( n ) = 0; il secondo è nullo perché f ha coe¢ cienti di Fourier nulli. Z Z cos (nx) cos (nx) F (x) sin (nx) dx = + F (x) f (x) dx = n n poiché f ha coe¢ cienti di Fourier nulli = perché: F ( cos (n ) cos (n ) F ( )+ F( n n )=0 ) = 0 per de…nizione di F come funzione integrale, e Z a0 F( )= f (t) dt = = 0: 2 207 In de…nitiva, la funzione F ha nulli i coe¢ cienti di Fourier Ak Re Bk per k 1, mentre non è necessariamente vero che sia A0 = 0; cioè che sia F (t) dt = 0. Consideriamo però la funzione Z 1 A0 = F (x) F (t) dt: F (x) 2 2 Questa funzione per de…nizione ha integrale nullo su [ ; ], e d’altro canto continua ad avere gli altri coe¢ cienti di Fourier nulli. Ne segue che F (x) A20 ha tutti i coe¢ cienti di Fourier nulli, ed è una funzione continua; per la prima parte della dimostrazione, allora, F (x) A20 è identicamente nulla. Ne segue che 0 A0 f (x) = F (x) = 0 quasi ovunque, 2 che è la tesi. In base al teorema precedente e al Teorema 5.19, possiamo concludere il risultato di convergenza in L2 [ ; ] delle serie di Fourier: Teorema 5.29 Sia f 2 L2 [ ; ] ; de…niamo Z 1 ak = f (x) cos nxdx per n = 0; 1; 2; 3::: 2 Z 1 bk = f (x) sin nxdx per n = 1; 2; 3; :: 2 Allora la serie di Fourier di f 1 a0 X + (an cos nx + bn sin nx) 2 n=1 converge ad f in L2 [ ; ] : Esplicitamente, questo signi…ca che: " #2 Z n a0 X f (x) + (ak cos kx + bk sin kx) dx ! 0 per n ! 1: 2 k=1 Naturalmente serie e coe¢ cienti di Fourier si possono adattare ad un intervallo [a; b] qualsiasi (v. [An2, Cap. 7, §3.4]). La teoria degli spazi di Hilbert fornisce un risultato semplice e generale sulla convergenza delle serie di Fourier in L2 . Naturalmente è anche interessante sapere se la serie di Fourier converge puntualmente (cosa che non segue dalla convergenza in L2 ). In realtà, il problema della convergenza puntuale è il primo che si è posto, storicamente, col sorgere stesso della teoria delle serie di Fourier (1822, Fourier, trattato “Teoria analitica del calore”). Il primo studio rigoroso sulla convergenza puntuale delle serie di Fourier è dovuto a Dirichlet nel 1829. Si tratta di un problema fondamentale per l’analisi armonica, di cui abbiamo detto qualcosa nei richiami del §3.5. Per qualche dettaglio sullo studio della convergenza puntuale delle serie di Fourier si rimanda a [An2, Cap. 7, §3.6] o a [Fo, Chap.8, §8.5]. 208 5.5.2 Serie di Fourier in più variabili n Si possono anche de…nire le serie di Fourier in n variabili, sull’insieme [ ; ] (e quindi, riscalando il sistema trigonometrico, su qualunque “n-parallelepipedo”). 2 Ad esempio, in due variabili si può sviluppare una funzione f (x; y) 2 L2 [ ; ] in serie di Fourier doppia. Vediamo prima il seguente risultato astratto: 1 Teorema 5.30 Sia fen (x)gn=1 un sistema ortonormale completo in L2 [ 1 Allora fen (x) em (y)gn;n=1 è un sistema ortonormale completo in L2 [ ; ]: 2 ; ] . Dimostrazione. L’ortonormalità si veri…ca facilmente: per (n; m) 6= (n1 ; m1 ) risulta Z Z (en (x) em (y) en1 (x) em1 (y)) dxdy Z Z = en (x) en1 (x) dx em (y) em1 (y) dy = 0 perché almeno uno dei due integrali è zero, essendo n 6= m o n1 6= m1 ; mentre Z Z Z Z 2 2 jen (x) em (y)j dxdy = jen (x)j dx jem (y)j dy = 1 1 = 1: Quanto alla completezza, sia f 2 L2 [ Z Z 2 ; ] e supponiamo che sia f (x; y) en (x) em (y) dxdy = 0 per ogni n; m: Fissiamo m e consideriamo la funzione Z gm (x) = f (x; y) em (y) dy: Questa funzione sta in L2 [ Z 2 ; ] ; perché jgm (x)j dx = Z Z 2 f (x; y) em (y) dy dx applicando nell’integrale interno la disuguaglianza di Cauchy-Schwarz Z Z Z 2 2 jf (x; y)j dy jem (y)j dy dx Z Z 2 2 = jf (x; y)j dydx = kf kL2 ([ ; ]2 ) < 1: Inoltre gm ha tutti i coe¢ cienti di Fourier nulli rispetto al sistema fen (x)g, dunque gm (x) = 0 quasi ovunque. Questo, per de…nizione di gm ; signi…ca che 209 per quasi ogni x …ssato la funzione y 7! f (x; y) ha tutti i coe¢ cienti di Fourier nulli rispetto al sistema fem (y)g ; dunque per q.o. x e per q.o. y è f (x; y) = 0. Questo prova la completezza del sistema. La scrittura esplicita del sistema trigonometrico in due variabili è resa complicata dal fatto che occorre moltiplicare ognuna delle tre funzioni 1 cos nx sin nx p ; p ; p 2 per ognuna delle tre funzioni 1 cos my sin my p ; p ; p ; 2 mentre viene molto più semplice usando la scrittura complessa einx p 2 n2Z e quindi, in due variabili, ei(nx+my) 2 2 In questo caso si pone, per f 2 L2 [ fbn;m = 1 2 (2 ) Z Z : n;m2Z ; ] f (x; y) e i(nx+my) dxdy per n; m 2 Z e si ha quindi f (x; y) = +1 X n;m= 1 fbn;m ei(nx+my) 2 con convergenza della serie in L2 [ ; ] . Più esplicitamente, una nozione di convergenza di una serie de…nita da due indici interi relativi richiede una de…nizione precisa di somma parziale. Tale de…nizione non è univoca; ad esempio è corretto a¤ermare che, se de…niamo X sN (x; y) = fbn;m ei(nx+my) per N = 0; 1; 2; ::: jnj+jmj N allora risulta kf sN kL2 ([ ; ]2 ) ! 0 per N ! +1: Una delle possibili applicazioni delle serie di Fourier in due variabili è alla compressione delle immagini. Un’immagine in scala di grigi si può vedere come una funzione f (x; y) de…nita in un rettangolo a valori in [0; 1], dove il valore f (x; y) rappresenta l’intensità di grigio nel punto (pixel) (x; y), quindi f = 0 210 vuol dire punto bianco e f = 1 punto nero. Una somma di Fourier parziale di f immagazzina (in modo approssimato) l’informazione dell’immagine in un numero limitato di coe¢ cienti di Fourier. Tutto questo si generalizza a funzioni di n variabili in modo naturale: n se f 2 L2 ([ ; ] ) possiamo de…nire, per ogni k = (k1 ; k2 ; :::; kn ) 2 Zn i coe¢ cienti di Fourier Z b fk = f (y) e ik y dy [ ossia, esplicitamente, Z b f(k1 ;k2 ;:::;kn ) = ; ]n [ ; ]n f (y1 ; :::; yn ) e i(k1 y1 +k2 y2 +:::+kn yn ) La serie di Fourier di f sarà la serie (in n indici da +1 X k1 ;k2 ;:::;kn = 1 dy1 :::dyn : 1 a +1) fb(k1 ;k2 ;:::;kn ) eik y che converge in norma L2 a f nel seguente senso. Posto: X fb(k1 ;k2 ;:::;kn ) eik x sN (x) = jk1 j+jk2 j+:::+jkn j<N risulta ksN 5.6 f kL2 ([ ; ]n ) ! 0 per N ! 1: Base di Haar e wavelets Nell’utilizzo dell’analisi di Fourier per approssimare un segnale periodico, il sistema trigonometrico ha, insieme a tanti pregi, un paio di difetti. 1. I polinomi trigonometrici sono funzioni continue e regolari, perciò una serie di Fourier approssima male una funzione discontinua. L’approssimazione in L2 rimane, ma non possiamo certamente aspettarci una buona approssimazione puntuale vicino a un punto di discontinuità. 2. L’approssimazione con polinomi trigonometrici ha una natura globale: supponiamo di voler approssimare una funzione f 2 L2 [ ; ] che ha un gra…co “semplice e liscio”in [ ; 0] e piuttosto frastagliato in [0; ]. A¢ nché la somma parziale di Fourier segua bene il gra…co di f in [0; ] noi dovremo aumentare il numero di termini, i cui coe¢ cienti sono stati calcolati in base al comportamento di f su tutto [ ; ]; questo signi…ca che l’unico modo di migliorare i dettagli dell’approssimazione in [0; ] è quello di aumentare i dettagli in tutto [ ; ]; non possiamo ra¢ nare l’approssimazione su una sola parte dell’intervallo. Per ovviare a questi due difetti, e in particolare al secondo, si possono utilizzare altri tipi di sistemi ortonormali completi di L2 [ ; ], che hanno la proprietà di permettere un’analisi su scale diverse in parti diverse dell’intervallo, o 211 come si dice, fare una “analisi multirisoluzione”. Sistemi di questo tipo sono le wavelets. Ce ne sono di molti tipi, presentiamo qui il più semplice. Rimandiamo a [HN, §7.6] per qualche dettaglio in più su quanto spiegato qui di seguito, e a [BN] per una trattazione più approfondita. Ci mettiamo ora nell’intervallo [0; 1]. De…niamo la “funzione madre” 8 per 0 x < 12 < 1 1 per 12 x < 1 (x) = : 0 altrimenti e la seguente famiglia di funzioni ottenute traslando e riscalando la funzione madre: n;k (x) = 2n=2 (2n x k) per k = 0; 1; 2; :::; 2n 1; n = 0; 1; 2; 3; ::: Visualizziamo i gra…ci di alcune di queste funzioni. Ad esempio per n = 2 e quindi k = 0; 1; 2; 3 si ha: Confrontiamo invece tra loro funzioni 212 n;k per diversi valori di n. I gra…ci di n;k per i valori n = 1; 2; 3; 4; sono: Notiamo che per tutte le funzioni n;k si ha Z 1 Z 1 2 n;k (x) dx = 0 e n;k (x) dx = 1: 0 0 E’ facile rendersi conto che il prodotto tra due funzioni diverse tra le n;k o è identicamente nullo oppure è una delle due moltiplicata per una costante; perciò queste funzioni sono anche a due a due ortogonali. Poiché tutte queste funzioni hanno media nulla, se vogliamo sperare di avere un sistema ortonormale completo è necessario aggiungere almeno una funzione che non abbia media nulla: la costante 1 va bene. Vale il seguente Teorema 5.31 Il sistema di funzioni f1; n;k gk=0;1;2;:::;2n 1;n=0;1;2;3::: è ortonormale completo in L2 [0; 1] : Dimostrazione. L’ortonormalità è stata sostanzialmente dimostrata. Per la completezza, ci limitiamo a segnalare che si può dimostrare che questo sistema di funzioni è denso nell’insieme delle funzioni semplici (cioè misurabili e che assumono un numero …nito di valori), che a sua volta è denso in L2 [0; 1]. Dalla completezza del sistema precedente segue: Teorema 5.32 Per f 2 L2 [0; 1] de…niamo: Z 1 fb0 = f (x) dx 0 fbn;k = Z 1 f (x) n;k (x) dx per n = 0; 1; 2; 3::: e k = 0; 1; 2; :::; 2n 0 213 1; allora la serie n converge a f in L2 [0; 1]. fb0 + 1 2X1 X n=0 k=0 fbn;k n;k (x) Poiché le n;k ; e quindi ogni loro somma parziale, è una funzione discontinua, ci aspettiamo che questo tipo di serie possa approssimare bene anche funzioni con discontinuità; l’altra faccia della medaglia è che la somma parziale sarà sempre discontinua, anche quando la funzione da approssimare è continua. Soprattutto però il pregio di questa approssimazione è la sua localizzabilità: ogni n;k è diversa da zero solo su un intervallino, perciò scegliendo opportunamente i termini n;k possiamo aumentare il dettaglio dell’approssimazione di f in un tratto speci…co dell’intervallo [0; 1]. Esempio 5.33 Sia f (x) = per x 2 0; 14 per x 2 ( 14 ; 1]: 1 x2 log x Allora il gra…co di f insieme a quello della sua somma parziale n fb0 + 3 2X1 X n=0 k=0 fbn;k n;k (x) (che in tutto ha 16 termini) è il seguente: Si osserva che nel “gradino” di f l’approssimante segue il salto senza problemi. D’altro canto l’approssimante è “a gradini” anche nei tratti continui di f . A titolo di confronto il gra…co di f insieme alla sua somma parziale di Fourier 8 a0 X + (an cos (2 nx) + bn sin (2 nx)) 2 n=0 214 (che ha in tutto 17 termini) è il seguente: Un esempio signi…cativo di problema di compressione delle immagini in cui si è rivelato utile l’uso di wavelets in due variabili è la digitalizzazione dell’archivio di impronte digitali compiuto dall’FBI negli anni 1990. Una lettura interessante in tal senso è il saggio [OY]. 215 6 Applicazioni dei metodi di ortogonalità a problemi di¤erenziali 6.1 Problemi di Sturm-Liouville e polinomi ortogonali Come sottoproblema di due problemi ai limiti risolti per separazione di variabili nel §5 (equazione del calore sul segmento, equazione della corda vibrante …ssata agli estremi), ci siamo trovati di fronte ad un problema agli autovalori del tipo36 : y 00 (x) + y (x) = 0 per x 2 [0; L] y (0) = 0 = y (L) dove a priori sono incogniti sia la funzione y (x) che il numero . Si trova che necessariamente dev’essere: n2 2 per n = 1; 2; 3; ::: L2 n x yn (x) = sin : L n = Il problema agli autovalori ha quindi: 1 1) una successione di autovalori positivi f n gn=1 che tende a +1; 2) una successione di yn corrispondenti, che risultano formare un sistema ortogonale completo di L2 [0; L]. Quest’a¤ermazione ci è familiare in quanto si tratta del “solito” sistema trigonometrico. Ma ora è interessante vedere questo fenomeno sotto una luce diversa: queste funzioni sono un sistema ortogonale completo proprio perché sono il sistema delle autofunzioni di un problema di¤erenziale ai limiti di un certo tipo. Esiste cioè una teoria generale di problemi agli autovalori per equazioni di¤erenziali ordinarie, di cui l’esempio appena discusso è un caso particolare, che porta a fabbricare sistemi ortonormali completi di L2 [a; b] costituiti da sistemi di autofunzioni. Daremo ora qualche cenno di questa teoria. De…nizione 6.1 (Problema di Sturm-Liouville) Si consideri il problema agli autovalori, detto di Sturm-Liouville: d dx p (x) du q (x) u + dx u (a) = u (b) = 0 (x) u = 0 per x 2 (a; b) (6.1) dove a; b 2 R e le funzioni p; q; sono coe¢ cienti assegnati soddisfacenti le ipotesi: p 2 C 1 (a; b) ; p (x) > 0 in [a; b] ; q 2 C 0 (a; b) ; q (x) 0 in [a; b] ; 2 C 0 (a; b) ; (x) > 0 in [a; b]. Sotto queste ipotesi il problema di Sturm-Liouville si dice regolare. Vale in proposito il seguente 3 6 Nel caso del Laplaciano sul cerchio invece la stessa equazione valeva su [0; 2 ] ; con condizione di periodicità y (0) = y (2 ). 216 Teorema 6.2 Dato un problema di Sturm-Liouville regolare (6.1) esistono: 1 1) una successione di autovalori f n gn=1 tutti positivi, successione crescente e tendente a +1; 1 2) una successione di autofunzioni fun gn=1 corrispondenti, che costituiscono un sistema ortonormale completo dello spazio di Hilbert L2 ((a; b) ; (x) dx). Esplicitamente, questo signi…ca che la misura è la misura pesata d (x) dx; quindi ortogonalità signi…ca che Z b = 0 per n 6= m 1 per n = m: un (x) um (x) (x) dx = a Dimostriamo solo le più semplici delle a¤ermazioni fatte: (i) gli autovalori sono tutti positivi; (ii) due autofunzioni relative a due autovalori distinti sono tra loro ortogonali. Per provare (i), sia (u; ) una coppia autofunzione-autovalore; moltiplichiamo l’equazione 0 (pu0 ) qu + u = 0 per u e integriamo in (a; b). Si ha: Z a b h 0 (pu0 ) u qu2 + Z b i u2 dx = 0 u2 dx = a Z b 0 (pu0 ) udx + a Z b qu2 dx a e calcolando per parti il primo integrale a secondo membro: Z b Z b Z b b 2 0 0 0 0 0 (pu ) udx = [ (pu ) u]a + (pu ) u dx = p (u0 ) dx a a a perché u (b) = u (a) = 0. Ne segue: = Rb a Rb 2 p (u0 ) dx + a qu2 dx >0 Rb u2 dx a essendo per ipotesi p e positive in [a; b], q 0 e u non identicamente nulla. (ii) Supponiamo che (u; ) ; (v; ) siano due coppie autofunzione-autovalore, e proviamo che u; v sono ortogonali in L2 ((a; b) ; (x) dx). Scriviamo perciò: 0 (pu0 ) 0 (pv 0 ) qu + qv + u=0 v = 0: Moltiplichiamo la prima equazione per v, la seconda per u e sottraiamo membro a membro. Otteniamo: 0 (pu0 ) v 0 (pv 0 ) u + ( ) uv = 0 in (a; b) ; 217 da cui ( ) Z b uv dx = a integrando per parti = [pv 0 u Z h b a Z b pu0 v]a 0 (pv 0 ) u i 0 (pu0 ) v dx = b [pu0 v 0 pv 0 u0 ] dx = 0 a perché l’integrale ha integranda identicamente nulla e [pv 0 u condizioni agli estremi su u e v. Quindi si ottiene ( ) Z b pu0 v]a = 0 per le b uv dx = 0; a ed essendo per ipotesi 6= si ha Rb a uv dx = 0; che è l’ortogonalità voluta. Il problema dell’esempio iniziale rientra evidentemente in questo caso, con p = = 1; q = 0. Ci sono altri esempi di problemi di Sturm-Liouville che si incontrano nelle applicazioni (ad esempio, ma non solo, risolvendo per separazione di variabili dei problemi ai limiti per equazioni a derivate parziali). Il Teorema 6.2 descrive in un certo senso la “situazione ideale”. Purtroppo spesso i problemi di Sturm-Liouville che nascono dalle applicazioni per un motivo o per l’altro non soddisfano tutte le ipotesi di quel teorema (e si dicono allora problemi di Sturm-Liouville singolari ); in vari casi signi…cativi, comunque, si riesce ancora a dimostrare, con tecniche ad hoc, che gli stessi risultati valgono ancora. Presentiamo tre problemi di Sturm-Liouville singolari che hanno applicazioni importanti. 1. Equazione di Legendre E’l’equazione 1 x2 y 00 2xy 0 + y = 0 per x 2 ( 1; 1) (6.2) che si può riscrivere nella forma 1 x2 y 0 0 + y = 0. Si tratta di un problema di Sturm-Liouville su [ 1; 1] con p (x) = 1 x2 ; q (x) = 0; (x) = 1. Il problema è reso singolare dal fatto che il coe¢ ciente p (x) si annulla negli estremi del segmento. La funzione peso è 1, quindi lo spazio di Hilbert da considerare è L2 ( 1; 1) (con la misura di Lebesgue dx). Rivisitando la dimostrazione precedente di ortogonalità si osserva che in questo caso non occorre imporre le condizioni y ( 1) = 0 = y (1) per ottenere l’ortogonalità di autofunzioni relative ad autovalori diversi. Infatti il termine di integrazione 1 [pu0 v pv 0 u] 1 è nullo a grazie a p (x). Si dimostra il seguente teorema: 218 Teorema 6.3 L’equazione di Legendre ha soluzioni C 2 [ 1; 1] solo in corrispondenza di una successione di autovalori n = n (n + 1) per n = 0; 1; 2; 3; :::; detta Pn (x) l’autofunzione corrispondente a n , normalizzata in L2 [ 1; 1], si ha che: Pn (x) è un polinomio di grado n; 1 il sistema fPn (x)gn=0 è ortonormale completo in L2 ( 1; 1). Dimostrazione. Cerchiamo soluzioni dell’equazione in forma di serie di potenze (metodo di Frobenius): y (x) = y 0 (x) = y 00 (x) = 1 X n=0 1 X n=1 1 X cn xn ncn xn 1 1) cn xn n (n 2 n=2 e sostituiamo nell’equazione: 0 = 1 x2 y 00 2xy 0 + y 1 1 X X n 2 = n (n 1) cn x n (n = n=2 1 X n 1) cn x n=2 (n + 2) (n + 1) cn+2 xn 2 1 X n ncn x + n=1 1 X n (n 1) cn xn cn xn n=0 2 1 X ncn xn + n=1 n=2 n=0 1 X n 1 X cn xn : n=0 Uguagliando a zero il coe¢ ciente di x per ciascun n si ottengono le seguenti (il modo in cui gli indici variano nelle diverse serie costringe a distinguere i casi n = 0, n = 1, n 2): (n + 2) (n + 1) cn+2 ossia cn+2 = n (n 2c2 + c0 = 0 6c3 2c1 + c1 = 0 1) cn 2ncn + cn = 0 [n (n + 1) ] cn per n = 0; 1; 2; ::: (n + 2) (n + 1) (6.3) Questo mostra che possiamo scegliere liberamente i coe¢ cienti c0 ; c1 , dopo di che la soluzione risulta determinata. Dunque per ciascun …ssato si può scrivere l’integrale generale dell’equazione, dipendente da due costanti arbitrarie. Le due soluzioni indipendenti saranno, rispettivamente, una serie di potenze dispari e una serie di potenze pari. Occorre però controllare che le serie di potenze che assegnano la soluzione in e¤etti convergano. Poiché cn+2 [n (n + 1) ] = ! 1; cn (n + 2) (n + 1) 219 leggiamo due cose: le serie di potenze hanno raggio 1, quindi in e¤etti si è scritto l’integrale generale in ( 1; 1); d’altro canto per x ! 1 in generale sarà y (x) illimitata. Il nostro problema agli autovalori, invece, per sua natura ci richiede di determinare soluzioni che siano regolari in tutto [ 1; 1] (come vedremo, è questo quello che serve quando l’equazione di Legendre nasce nel risolvere un problema di¤erenziale più complesso). Osservando ancora la formula (6.3) che assegna i coe¢ cienti si vede che la serie termina se = n (n + 1). In questo caso si trova una sola soluzione limitata, polinomio di grado n: il polinomio di Legendre Pn (x). Si può dimostrare che, se la serie non termina, la funzione y (x) e¤ettivamente risulta illimitata (e quindi non accettabile come soluzione) per x ! 1. Abbiamo così determinato autovalori e autosoluzioni; l’ortogonalità segue dalla dimostrazione generale già fatta per un problema di Sturm-Liouville regolare. La completezza segue dal seguente argomento. E’ noto che lo spazio dei polinomi è denso nello spazio C 0 [ 1; 1] (teorema di Stone-Weierstrass); è anche noto che lo spazio C 0 [ 1; 1] è denso in L2 [ 1; 1]; ne segue che lo spazio dei polinomi è denso in L2 [ 1; 1]; dunque ogni funzione L2 [ 1; 1] può essere approssimato bene quanto vogliamo mediante polinomi, e quindi combinazioni lineari di polinomi di Legendre. Perciò il sistema dei polinomi di Legendre è completo. Sappiamo dunque che: 1 0 x2 Pn0 (x) + n (n + 1) Pn (x) = 0. Sapendo che Pn sono polinomi e sono ortonormali in L2 ( 1; 1) possiamo anche determinare esplicitamente questi polinomi, con una procedura iterativa, ortonormalizzando il sistema di polinomi 1; x; x2 ; x3 ; ::: . Si trova: 1 P0 (x) = p ; 2 r 3 P1 (x) = x; 2 r 1 5 P2 (x) = 3x2 1 ; 2 2 r 7 3 5 P3 (x) = x + x3 ; 2 2 2 ::: Si può dimostrare anche la seguente formula generale: q n + 12 dn n x2 1 : Pn (x) = 2n n! dxn 220 I polinomi di Legendre, come molte altre funzioni speciali, si trovano implementati in software di calcolo scienti…co oltre che riportati e tabulati su molti testi. Di seguito i gra…ci dei primi 6 polinomi Pn (x) (n = 0; 1; 2; 3; 4; 5). Si noti che Pn (x) ha n zeri in [ 1; 1]. Il fatto di conoscere un sistema ortonormale completo in L2 [ 1; 1] costituito da polinomi o¤re un metodo per approssimare una generica funzione L2 [ 1; 1] mediante polinomi di grado n. Anche se l’approssimazione è in L2 [ 1; 1], quando la funzione da approssimare è continua o regolare ci aspettiamo una buona approssimazione anche puntuale, che sarà di tipo globale sull’intervallo [ 1; 1], anziché di tipo locale come ad esempio l’approssimazione mediante il polinomio di Taylor. I polinomi di Legendre sono quindi importanti nella teoria dell’approssimazione di funzioni, oltre al fatto che l’equazione di Legendre compare come sottoproblema nella risoluzione di certi problemi ai limiti per equazioni a derivate parziali mediante separazione di variabili. Data una funzione f 2 L2 [ 1; 1] ; i suoi coe¢ cienti di Fourier rispetto al 1 sistema fPn (x)gn=0 sono de…niti da: cn = Z 1 f (y) Pn (y) dy 1 221 e portano allo sviluppo f (x) = 1 X cn Pn (x) : n=0 Esempio 6.4 Sia f (x) = ex sin x: Calcoliamo la somma parziale n = 4 della serie di f (x) in polinomi di Legendre. Si trova: Il ra¤ ronto tra i gra…ci di f e P4 n=0 cn Pn (x) è il seguente: 2. Equazione di Laguerre E’l’equazione xy 00 + (1 x) y 0 + y = 0 per x 2 (0; +1) che si può riscrivere nella forma xe x 0 0 y + e x y = 0 per x 2 (0; +1) : Si tratta di un problema di Sturm-Liouville su (0; +1) con p (x) = (xe x ) ; q (x) = 0; (x) = e x . Il problema è reso singolare dal fatto che l’equazione non è su un segmento ma su una semiretta e il coe¢ ciente p (x) si annulla in 0 e a +1. La funzione peso è e x , quindi lo spazio di Hilbert da considerare è L2 ((0; +1) ; e x dx). Anche in questo caso non occorre imporre condizioni agli estremi per ottenere l’ortogonalità di autofunzioni relative ad autovalori diversi. Si dimostra il seguente teorema: Teorema 6.5 L’equazione di Laguerre ha soluzioni in L2 ((0; +1) ; e x dx) (cioè: che all’in…nito non vanno +1 troppo rapidamente) solo in corrispondenza di una successione di autovalori n = n per n = 0; 1; 2; 3; ::: La soluzione Ln (x) dell’equazione di Laguerre corrispondente a n = n è un polinomio di grado n; 1 il sistema fLn (x)gn=0 è ortonormale completo in L2 ((0; +1) ; e x dx). 222 Dimostrazione (traccia). La tecnica della dimostrazione, nella sua parte costruttiva, è simile a quella vista per l’equazione di Legendre: si cerca una soluzione per serie, si ottiene una legge ricorsiva sui coe¢ cienti, in questo caso: cn+1 = Poiché n 2 cn : (n + 1) cn+1 cn 1 ! 0; n la serie di potenze converge in tutto R, ossia una soluzione regolare su tutto 1 1 (0; +1) si trova per ogni ; però la stima cn+1 cn n porta cn n! e quindi una x 2 soluzione con crescita del tipo e , che pertanto non sarebbe L ((0; +1) ; e x dx); per ottenere l’appartenenza a questo spazio è necessario che la serie termini, il che accade per = n intero non negativo. In questo caso la soluzione è un polinomio di grado n. La dimostrazione già vista prova l’ortogonalità. Non discutiamo del modo in cui si dimostra la completezza. Esplicitamente, il teorema a¤erma che: x xe con Z 0 L0n (x) + ne x Ln (x) = 0 per x 2 (0; +1) +1 Ln (x) Lm (x) e x 1 se n = m 0 se n 6= m. dx = 0 Anche in questo caso è possibile scrivere i primi polinomi di Laguerre ortonormalizzando le funzioni 1; x; x2 ; x3 ; ::: nello spazio L2 ((0; +1) ; e x dx). Si trova: L0 (x) = 1 L1 (x) = 1 x; L2 (x) = 1 2x + x2 ; 2 3 3x + x2 2 L3 (x) = 1 x3 ; 6 ::: Si dimostra anche la seguente formula esplicita: Ln (x) = ex dn e n! dxn Data una funzione f 2 L2 ((0; +1) ; e 1 al sistema fLn (x)gn=0 sono dati da cn = Z x x n x . dx) ; i suoi coe¢ cienti di Fourier rispetto +1 f (x) Ln (x) e 0 223 x dx e portano allo sviluppo f (x) = 1 X cn Ln (x) n=0 Si ri‡etta sul fatto che quando una funzione f viene approssimata in L2 ((0; +1) ; e con la somma parziale Sn della sua serie di polinomi di Laguerre, ciò che viene reso piccolo è l’integrale: Z +1 2 jf (x) Sn (x)j e x dx 0 perciò dal punto di vista visivo è meglio confrontare il gra…co di f (x) e x=2 con quello di Sn (x) e x=2 (il quadrato di questa di¤erenza è piccola). Le funzioni (non polinomiali) Ln (x) e x=2 si dicono funzioni di Laguerre. I loro gra…ci per i primi valori di n sono i seguenti. Si osservi che Ln (x) ha n zeri in (0; +1): Esempio 6.6 Sia f (x) = x sin x: Calcoliamo la somma parziale n = 10 della serie di f in polinomi di Laguerre. Il ra¤ ronto tra il gra…co di f (x) e x=2 e 224 x dx) P10 n=0 cn Ln (x) e x=2 è il seguente: 3. Equazione di Hermite E’l’equazione: y 00 2xy 0 + y = 0 per x 2 R che si può riscrivere nella forma e x2 0 y 0 + e x2 y=0 2 Si tratta di un problema di Sturm-Liouville su R con p (x) = e x ; (x) = e reso singolare dal fatto che l’equazione non è sul segmento ma sulla retta. x2 , 2 Teorema 6.7 L’equazione di Hermite ha soluzioni in L2 R; e x dx (cioè: che all’in…nito non vanno a +1 troppo rapidamente) solo in corrispondenza di una successione di autovalori n = 2n per n = 0; 1; 2; 3; ::: La soluzione Hn (x) dell’equazione di Hermite corrispondente a n = 2n, normalizzata in 2 1 L2 R; e x dx , è un polinomio di grado n; il sistema fHn (x)gn=0 è ortonormale completo in L2 R; e x2 dx . Dimostrazione (traccia). La tecnica della dimostrazione è ancora simile: si cercano soluzioni per serie di potenze, si arriva alla seguente legge ricorsiva sui coe¢ cienti: (2n ) cn+2 = cn . (n + 2) (n + 1) Poiché cn+2 (2n ) = ! 0; cn (n + 2) (n + 1) per il criterio del rapporto la serie di potenze converge su tutto R. Quindi per ogni esistono due soluzioni linearmente indipendenti de…nite su tutto R. Se 225 = 2n per n intero non negativo, allora la serie termina e diventa un polinomio di grado k. Se la serie non termina, un’analisi dell’ordine di grandezza dei coe¢ cienti mostra che la soluzione all’in…nito crescerebbe più velocemente di 2 2 ex =2 , quindi non apparterrebbe a L2 R; e x dx . Le uniche soluzioni in questo spazio sono quindi quelle polinomiali corrispondenti a = 2n: L’ortogonalità segue come nell’argomento generale, sfruttando il fatto che il coe¢ ciente p (x) si annulla a 1. Non discutiamo la dimostrazione di completezza. Esplicitamente, il teorema a¤erma che: e con Z x2 0 Hn0 (x) + 2ne +1 x2 Hn (x) Hm (x) e x2 Hn (x) = 0 dx = 1 1 se n = m 0 se n 6= m. Anche in questo caso è possibile scrivere i primi polinomi di Hermite ortonor2 malizzando le funzioni 1; x; x2 ; x3 ; ::: nello spazio L2 R; e x dx . Si trova: 1 H0 (x) = H1 (x) = 1=4 p 2 1=4 x; 2 + 4x2 p ; 2 2 1=4 12x + 8x3 p H3 (x) = ; 4 3 1=4 ::: H2 (x) = Si dimostra anche la seguente formula esplicita: n n 2 d ( 1) Hn (x) = pp ex e dxn 2n n! Data una funzione f 2 L2 R; e sistema 1 fHn (x)gn=0 x2 x2 dx ; i suoi coe¢ cienti di Fourier rispetto al sono dati da cn = Z . +1 f (x) Hn (x) e 1 e portano allo sviluppo f (x) = 1 X cn Hn (x) n=0 226 x2 dx 2 Ancora, quando una funzione f viene approssimata in L2 R; e x dx con la somma parziale Sn della sua serie di polinomi di Hermite, ciò che viene reso piccolo è l’integrale: Z +1 1 jf (x) 2 Sn (x)j e x2 dx 2 perciò dal punto di vista visivo è meglio confrontare il gra…co di f (x) e x =2 con 2 quello di Sn (x) e x =2 (il quadrato di questa di¤erenza è piccola). Le funzioni (non polinomiali) 2 Hn (x) e x =2 si dicono funzioni di Hermite. I loro gra…ci per i primi valori di n sono i seguenti. Si osservi che Hn (x) ha n zeri in R. Esempio 6.8 Sia f (x) = ex sin x. Calcoliamo la somma parziale Sn (x) per n = 5 della serie di f (x) in polinomi di Hermite. Il ra¤ ronto tra i gra…ci di 227 f (x) e 6.2 x2 =2 e Sn (x) e x2 =2 è il seguente: Esercizi Polinomi ortogonali e problemi di Sturm-Liouville Esercizio 6.9 Determinare il polinomio di grado 3 che meglio approssima sin x in L2 ( 1; 1). Suggerimento: usare i polinomi di Legendre, calcolandoli dalla formula q n+ Pn (x) = 2n n! 1 2 dn x2 dxn 1 n : Esercizio 6.10 Dimostrare l’ortogonalità delle autosoluzioni relative ad autovalori distinti per l’equazione di Laguerre: xe x 0 0 y + e x y = 0 per x 2 (0; +1) : Esercizio 6.11 Risolvere il seguente problema di Sturm-Liouville regolare, determinando autovalori e autofunzioni: 0 (xy 0 ) + xy = 0 per x 2 (1; 2) y (1) = y (2) = 0: Suggerimento: per prima cosa scrivere per esteso l’equazione di¤ erenziale e determinare il suo integrale generale in funzione di . (E’un’equazione di Eulero... Ricordare che per reale è xi = ei log x = cos ( log x)+i sin ( log x)). Quindi imporre le condizioni agli estremi. Esercizio 6.12 Nello spazio di Hilbert L2 (0; 1), ortonormalizzare le funzioni x2 ; x; 1 (in quest’ordine). 228 Esercizio 6.13 I primi polinomi di Legendre sono: q P0 (x) = p12 ; P1 (x) = 32 x; q q P2 (x) = 12 52 3x2 1 ; P3 (x) = 72 3 2x + 52 x3 : Tenendo presente questo, determinare il polinomio di grado approssima in L2 [ 1; 1] la funzione f (x) = cos ( x) : 2 che meglio Esercizio 6.14 I primi polinomi di Laguerre sono: L0 (x) = 1; L2 (x) = 1 2x + Calcolare il polinomio di grado ex=4 nello spazio L2 ((0; +1) ; e x L1 (x) = 1 ::: x2 2 ; x; 2 che meglio approssima la funzione f (x) = dx). Soluzione di alcuni esercizi Soluzione Es. 6.14. Calcoliamo anzitutto: Z +1 f (x) xn e x dx per n = 0; 1; 2: 0 Z Z +1 ex=4 e x dx = 0 +1 Z +1 4 e 3 dx = 0 x=4 e xe x dx = 0 Z +1 3x=4 xe +1 x=4 2 e x e x dx = 0 Z 2 4 3 dx = +1 x e 0 =0+ 8 3 Z = 0 4 3 +1 3x=4 + Z 3x=4 4 2 x e 3 dx = +1 3x=4 xe dx = 0 +1 0 0 16 9 = 2 +1 3x=4 4 xe 3 0 =0+ Z 3x=4 e +1 3x=4 + Z +1 0 0 8 16 : 3 9 4 e 3 3x=4 4 2xe 3 Quindi: hf; L0 i = hf; L1 i = hf; L2 i = = 4 3 Z +1 e 3x=4 e 3x=4 dx 0 Z +1 xe 3x=4 dx = 0 +1 0 4 3 Z dx 2 Z +1 xe 0 2 4 3 16 1 8 16 4 + = 9 2 3 9 27 229 3x=4 dx + 1 2 Z 16 = 9 0 4 9 +1 x2 e 3x=4 dx dx 3x=4 dx e la proiezione richiesta è: P f (x) = hf; L0 i L0 + hf; L1 i L1 + hf; L2 i L2 4 4 (1 x) + 1 9 27 4 4 4 4 = + +x 3 9 27 9 28 4 2 = + x + x2 : 27 27 27 = Gra…co di f (x) e 6.3 x=2 4 3 e P f (x) e x=2 2x + x2 2 8 27 + 2 2 x 27 : Laplaciano in coordinate sferiche. Polinomi di Legendre e armoniche sferiche Consideriamo il problema di Dirichlet per l’equazione di Laplace su una sfera tridimensionale: u uxx + uyy + uzz = 0 per x2 + y 2 + z 2 < r2 u (x; y; z) = f (x; y; z) per x2 + y 2 + z 2 = r2 : Tra i signi…cati …sici di quest’equazione: u può essere il potenziale (elettrostatico o gravitazionale) all’interno della sfera, …ssato il suo valore sul bordo, in una situazione stazionaria in cui all’interno della sfera non ci sono pozzi o sorgenti del campo (cioè cariche o masse, rispettivamente); oppure u può essere la temperatura, in stato stazionario, all’interno della sfera, nota la temperatura al bordo, in assenza di sorgenti o pozzi di calore interni. Data la geometria sferica, è naturale riscrivere l’operatore di¤erenziale in coordinate sferiche ( ; #; ') e cercare poi soluzioni a variabili separate nelle coordinate sferiche. Il laplaciano in coordinate sferiche 8 < x = sin # cos ' y = sin # sin ' : z = cos # 230 assume la forma: 8 > > 1 @ > @ 2 u 2 @u > + + 2 < 2 @ @ sin # @# > > > > : u (r; #; ') = f (#; ') sin # @u @# 1 @2u =0 2 sin2 # @' + Dopo aver riscritto l’equazione (moltiplicando per 2@ 2 u 2 @ +2 @u 1 @ + @ sin # @# sin # @u @# + 2 per 0 < < r; 0<#< ; 0<'<2 per 0 < # < ; 0<'<2 : ) nella forma 1 @2u = 0; sin2 # @' a¤rontiamo il problema per separazione delle variabili. In vista degli sviluppi futuri, cominciamo a separare dalle variabili angolari, scrivendo u ( ; #; ') = R ( ) S (#; ') e ponendo (#;') = 1 @ sin # @# sin # @ @# 1 @2 : sin2 # @' + Si ha: 2 2 R00 ( ) + 2 R0 ( ) S (#; ') + R ( ) 00 0 R ( )+2 R ( ) = R( ) (#; ') = 0 (#;') S (#; ') S (#; ') da cui ricaviamo che per qualche costante 2 (#;') S R00 ( ) + 2 R0 ( ) = R( ) si ha = (#;') S (#; ') : S (#; ') Abbiamo messo in evidenza l’operatore (#;') (che si può vedere come operatore di Laplace sulla super…cie della sfera) perché lo incontreremo ancora in seguito. La prima equazione si riscrive 2 R00 + 2 R0 R=0 (6.4) ed è un’equazione di Eulero, di cui si può determinare in corrispondenza di ciascun l’integrale generale, cercando soluzioni del tipo R ( ) = con da determinarsi (v. [EsAn2, Cap.1, §1.2.D]); lo faremo dopo aver determinato . Per risolvere la seconda equazione, cioè (#;') S (#; ') = S (#; ') procediamo ad un’ulteriore separazione di variabili, cercando S (#; ') = 231 (#) (') quindi 1 1 0 (sin # 0 (#)) (') + (#) 00 (') = sin # sin2 # sin # (sin # 00 (#) + cos # 0 (#)) + sin2 # = (#) (#) (') 00 (') (') che dà, per qualche costante ; 00 sin # (sin # (#) + cos # (#) 0 (#)) + sin2 # = = 00 (') : (') La seconda equazione dà 00 che, dovendo essere m = 1; 2; 3; ::: e (') = (') (') 2 -periodica (' è la longitudine), dà = m2 per (') = a cos (m') + b sin (m') : Invece, la prima equazione diventa sin # 00 (#) + cos # 0 (#) + sin # m2 sin # (#) = 0 per # 2 [0; ] : (6.5) Si ricordi che l’angolo # ha il signi…cato di colatitudine. La (#) non deve soddisfare condizioni di periodicità, ma dev’essere regolare su tutto [0; ] (in particolare, limitata anche agli estremi). L’equazione (6.5) si può riscrivere in una forma più familiare eseguendo il cambio di variabili: (#) = P (cos #) ; cos # = t: Si ha infatti: 0 00 (#) = sin #P 0 (cos #) (#) = sin2 #P 00 (cos #) cos #P 0 (cos #) e sostituendo nella (6.5) sin # sin2 #P 00 (cos #) cos #P 0 (cos #) + m2 P (cos #) = 0 sin # m2 sin3 #P 00 (cos #) 2 sin # cos #P 0 (cos #) + sin # P (cos #) = 0 sin # m2 sin2 #P 00 (cos #) 2 cos #P 0 (cos #) + P (cos #) = 0 sin2 # m2 1 t2 P 00 (t) 2tP (t) + P (t) = 0: 1 t2 + cos # [ sin #P 0 (cos #)] + 232 sin # Per m = 0 si tratta dell’equazione di Legendre su [ 1; 1] (si ricordi che t = cos # 2 [ 1; 1]), che già conosciamo. Per gli altri valori di m è un’equazione più complicata. Questo suggerisce di trattare prima il caso particolare m = 0. Leggendo a ritroso nei nostri passaggi, si vede che questo corrisponde a supporre che la funzione (') sia costante, ossia la soluzione a variabili separate sia in realtà indipendente dalla longitudine. Questo è un caso particolare che può avere un suo interesse: se ad esempio il dato al bordo è indipendente da ', ci aspettiamo che il problema abbia una soluzione indipendente da '. Comunque, per i motivi di gradualità già spiegati, trattiamo prima questo caso. 6.3.1 Il dato indipendente dalla longitudine. Polinomi di Legendre Consideriamo dunque la situazione sempli…cata in cui il dato al bordo f non dipende dalla longitudine ' ma solo dalla colatitudine #. Conseguentemente, ci aspettiamo che la soluzione u sia pure indipendente da '. Il problema precedente si riscrive quindi nella seguente forma sempli…cata: 8 2 1 @ @u < @ u 2 @u + + 2 sin # = 0 per 0 < < r; 0 < # < 2 @ @ sin # @# @# : u (r; #) = f (#) per 0 < # < : (6.6) In base all’analisi già fatta, abbiamo soluzioni a variabili separate del tipo u ( ; #) = R ( ) (#) con R ( ) soddisfacente (6.4) e (#) = P (cos #) dove P (t) soddisfa l’equazione di Legendre 1 t2 P 00 (t) 2tP (t) + P (t) = 0 su ( 1; 1). Poiché vogliamo soluzioni limitate su tutto [ 1; 1] è necessario che sia: = n (n + 1) ; n = 0; 1; 2; ::: P (t) = Pn (t) ; n-esimo polinomio di Legendre. Quindi abbiamo le soluzioni: n (#) = Pn (cos #) : Risolviamo ora l’equazione di Eulero (6.4) per 2 Cerchiamo R ( ) = 2 ( 1) R00 + 2 R0 = n (n + 1): n (n + 1) R = 0: . 2 +2 ( 1 n (n + 1) =0 1) + 2 n (n + 1) = 0 ( + 1) n (n + 1) = 0 = n; 233 = (n + 1) che dà soluzioni n R( ) = ;R( ) = (n+1) per n = 0; 1; 2; 3::: Escludendo le soluzioni R ( ) = (n+1) illimitate nell’origine si ottengono in de…nitiva le seguenti soluzioni regolari a variabili separate dell’equazione di Laplace indipendente dalla longitudine: un ( ; #) = cn n Pn (cos #) ; per n = 0; 1; 2; 3::: Si tratta ora, al solito, di formare una soluzione data da una serie in…nita di queste soluzioni e cercare di imporre il dato al bordo scegliendo opportunamente i coe¢ cienti: u ( ; #) = u (r; #) = 1 X n=0 1 X n=0 cn n Pn (cos #) cn rn Pn (cos #) = f (#) per # 2 [0; ] . Si tratta di sviluppare il dato f (#) in serie di Legendre a questo modo. C’è di mezzo un cambio di variabile. Osserviamo infatti che: Z 1 Z Pn (t) Pm (t) dt = [t = cos #] = Pn (cos #) Pm (cos #) sin #d#; 1 0 da cui leggiamo che: 1 il sistema fPn (cos #)gn=0 è ortonormale completo in L2 ([0; ] ; sin #d#) : Quindi possiamo porre: Z Cn = f (s) Pn (cos s) sin sds per n = 0; 1; 2; 3::: f (#) = 0 1 X Cn Pn (cos #) = n=0 1 X cn rn Pn (cos #) per cn = n=0 (6.7) Cn . rn In de…nitiva, la soluzione del problema (6.6) è data da: u ( ; #) = 1 X n=0 n Cn r Pn (cos #) con Cn dati da (6.7). Non ci occupiamo per il momento delle necessarie veri…che della validità della formula trovata. Torneremo più avanti sull’argomento. Invece, vediamo un esempio concreto. Esempio 6.15 Risolviamo il problema (6.6) con f (#) = sin2 #. Poiché ponendo t = cos # si ha: r 2 2 2p 2 2P0 (t) P2 (t) ; f (t) = 1 t = 3 5 3 234 si ha r 2 2 2 2p u ( ; #) = 2P0 P2 (cos #) 3 3 5 r 2 2 2 1 3 = + cos2 # : 3 3 r 2 2 6.3.2 Il caso generale. Funzioni di Legendre associate e armoniche sferiche Abbiamo trattato …nora l’equazione di Laplace in coordinate sferiche supponendo per semplicità che la soluzione non dipenda dalla longitudine. Nel caso generale l’integrazione del problema agli autovalori porta ad un sistema a due indici di autofunzioni, dette funzioni di Legendre, e imparentate con i polinomi di Legendre. Ricordiamo che in questo caso fobbiamo risolvere per ogni intero m = 1; 2; 3; ::: assegnato il problema agli autovalori 1 t2 P 00 (t) m 2tP (t) + P (t) t2 1 = 0 t 2 ( 1; 1) ; (6.8) (l’autovalore, per ora incognito, è ). Si tratta di un’equazione più generale dell’equazione di Legendre (si riduce a quella per m = 0). Riscrivendola nella forma m 0 1 t2 P 0 (t) P (t) + P (t) = 0 t 2 ( 1; 1) 1 t2 si riconosce che si tratta di un altro problema di Sturm-Liouville singolare: con le notazioni del §8.2, p (t) = 1 t2 m q (t) = 1 t2 (t) = 1 La solita dimostrazione prova che se esistono autovalori e autofunzioni, gli autovalori sono positivi e autofunzioni relative a autovalori diversi sono ortogonali tra loro in L2 ( 1; 1). Per risolvere l’equazione (6.8) si può dimostrare il seguente Teorema 6.16 Se P (t) risolve per un certo (cioè (6.8) con m = 0), allora la funzione Q (t) = 1 t2 m=2 l’equazione di Legendre originale P [m] (t) dove P [m] (t) indica la derivata m-esima di P (t), risolve l’equazione (6.8) per quell’intero m = 1; 2; ::: 235 Si dimostra poi che le uniche soluzioni di (6.8) limitate in ( 1; 1) sono quelle costruite in questo modo e che provengono da soluzioni P (t) dell’equazione di Legendre limitate in ( 1; 1). Ma allora: si parte dal polinomio di Legendre Pn (t) che risolve (6.8) con m = 0 e = n (n + 1); si calcola P [m] (t), e per trovare una funzione non identicamente nulla è necessario che sia m = 1; 2; :::; n; si costruiscono quindi le funzioni Pnm (t) = 1 t2 m=2 Pn[m] (t) per m = 1; 2; :::; n (per m = 0 possiamo porre Pn0 (t) = Pn (t)) che risolve (6.8) per e il corrispondente m. = n (n + 1) De…nizione 6.17 Le funzioni fPnm (t)gn=0;:::;1 m=0;:::;n si dicono funzioni di Legendre associate, e sono quindi le uniche autofunzioni limitate in ( 1; 1) del problema agli autovalori (6.8). Si può dimostrare il seguente: Teorema 6.18 Per ogni m = 0; 1; 2; :::: …ssato, le funzioni 1 fPnm (t)gm=n sono un sistema ortogonale in L2 ( 1; 1). I coe¢ cienti di normalizzazione valgono: Z 1 (n + m)! 2 jPnm (t)j dt = per m n. (n m)! 1 Normalizzate, sono un sistema ortonormale completo in L2 ( 1; 1). Quindi per ogni m = 0; 1; 2; :::: …ssato, le funzioni (normalizzate) 1 fPnm (cos #)gn=m sono un sistema ortonormale completo in L2 ((0; ) ; sin #d#) : Poiché gli autovalori trovati sono gli stessi del caso indipendente da ', l’equazione di Eulero in R ( ) ha le stesse soluzioni del caso precedente. In de…nitiva, le soluzioni dell’equazione di Helmholz sulla sfera a variabili separate sono: n Pn (cos #) Pnm (cos #) cos (m') per m = 1; 2; :::; n n m Pn (cos #) sin (m') per m = 1; 2; :::; n n 236 e m = 0; 1; 2; ::: Il fatto che (r 2 cos (m') sin (m') ; p ; p )1 m=1 2 sia un s.o.n.c. in L (0; 2 ) e, per ogni m = 1; 2; 3; ::: 1 fPnm (cos #)gm=n siano un sistema ortonormale completo in L2 ((0; ) ; sin #d#) ; implica che il sistema a due indici ) (r cos (m') m sin (m') 2 m Pn (cos #) ; Pn (cos #) p ; Pn (cos #) p n=0;:::;1 m=1;:::;n è un s.o.n.c. in L2 ((0; ) (0; 2 ) ; sin #d#d') 2 ossia in L della super…cie della sfera unitaria. Questo fatto segue da un criterio generale, ma lo illustriamo schematicamente in questo caso concreto al seguente modo. Sia f 2 L2 ((0; ) (0; 2 ) ; sin #d#d'); per # …ssato, sviluppiamo f (#; ) in serie di Fourier in '; scrivendo 1 a0 (#) X + fam (#) cos (m') + bm (#) sin (m')g f (#; ') = 2 m=1 ora sviluppiamo a0 (#) am (#) e bm (#) rispetto al s.o.n.c. rispetto al s.o.n.c. 1 fPn (cos #)gn=0 1 fPnm (cos #)gn=m e otteniamo così f (#; ') = + 1 X m=1 ( 1 1X an Pn (cos #) 2 n=0 1 X n=m am;n Pnm ! (cos #) cos (m') + 1 X bm;n Pnm n=m ! ) (cos #) sin (m') che prova la completezza del s.o.n.c. in due variabili. Vediamo ora di capire meglio la struttura delle funzioni Pnm (t) e quindi quella delle soluzioni a variabili separate appena scritte. 237 Esempio 6.19 Calcoliamo in base alla de…nizione le funzioni Pnm (t) per n = 0; 1; 2; 3 e 0 m n. Ricordiamo l’espressione dei primi polinomi di Legendre: 1 P0 (t) = p ; 2 r 3 P1 (t) = t; 2 r 1 5 P2 (t) = 3t2 1 ; 2 2 r 7 3 5 P3 (t) = t + t3 : 2 2 2 Quindi calcoliamo: 1 P00 (t) = P0 (t) = p 2 r 3 P10 (t) = P1 (t) = t 2 P11 (t) = 1 P20 (t) = P2 (t) = P21 P22 (t) = 1 (t) = 1 P30 t t t 1 2 2 1=2 r P10 5 3t2 2 2 1=2 P20 2 2=2 P200 P32 (t) = 1 P33 (t) = 1 t r 3 t 2 !0 = r 3 1 2 t2 1=2 1 (t) = 1 (t) = 1 r t 2 1=2 t 1 2 2 1 2 r r 5 3t2 2 5 3t2 2 1 1 !0 !00 = =3 r r 5 3t 1 2 5 1 2 t2 1=2 t2 7 2 3 5 t + t3 2 2 r 7 3 15 2 1=2 1=2 0 t2 P3 (t) = 1 t2 + t 2 2 2 r 7 2=2 00 t2 P3 (t) = 1 t2 15t 2 r 7 3=2 2 3=2 000 15 1 t2 t P3 (t) = 2 (t) = P3 (t) = P31 (t) = 1 (t) = 1 2 1=2 Osserviamo che ponendo t = cos # si ha 1 t2 m=2 m = (sin #) : Vale anche la prossima importante caratterizzazione delle soluzioni a variabili separate dell’equazione di Laplace: 238 Teorema 6.20 Per ogni n = 0; 1; 2; :::; le funzioni n Pn (cos #) Pnm (cos #) cos (m') per m = 1; 2; :::; n n m Pn (cos #) sin (m') per m = 1; 2; :::; n n espresse in coordinate cartesiane sono polinomi omogenei di grado n in x; y; z; sono anche funzioni armoniche in tutto R3 . Queste funzioni sono dunque polinomi omogenei ed armonici in tutto lo spazio; sono detti armoniche sferiche solide, mentre si dicono armoniche sferiche le loro restrizioni alla super…cie della sfera unitaria, cioè le funzioni che espresse in funzioni di (#; ') si scrivono Pn (cos #) Pnm (cos #) cos (m') per m = 1; 2; :::; n Pnm (cos #) sin (m') per m = 1; 2; :::; n e che, come abbiamo già detto, costituiscono un s.o.n.c. in L2 della super…cie sferica. Queste funzioni hanno un’importanza che va oltre la risoluzione del problema di Dirichlet per il laplaciano, difatti le ritroveremo in seguito. Esempio 6.21 Scriviamo in coordinate cartesiane alcune armoniche sferiche. Cominciamo a riscrivere in funzione di cos # le espressioni di Pnm (t) ; sempli…m=2 candole mediante l’identità 1 t2 = sinm #. Si ha: 1 P00 (cos #) = p 2 r 3 P10 (cos #) = cos # 2 r 3 P11 (cos #) = sin # 2 r 1 5 3 cos2 # 1 (cos #) = 2 2 r 5 1 3 cos # sin # P2 (cos #) = 2 r 5 sin2 # P22 (cos #) = 3 2 P20 239 P30 P31 (t) = (t) = r r r 7 2 3 5 cos # + cos3 # 2 2 7 sin # 2 3 15 + cos2 # 2 2 7 15 sin2 # cos # 2 r 7 3 P3 (t) = 15 sin3 # 2 P32 (t) = Ora, ricordando le espressioni delle coordinate sferiche 8 < x = sin # cos ' y = sin # sin ' : z = cos # riscriviamo le armoniche sferiche in coordinate cartesiane, così: n Pn (cos #) Pnm (cos #) cos (m') per m = 1; 2; :::; n n m Pn (cos #) sin (m') per m = 1; 2; :::; n n 1 P00 (cos #) = p 2 r r 3 3 0 P1 (cos #) = cos # = z 2 2 r r 3 3 1 P1 (cos #) cos ' = sin # cos ' = x 2 2 r r 3 3 P11 (cos #) sin ' = sin # sin ' = y 2 2 r 1 5 (cos #) = 2 2 r 5 2 1 P2 (cos #) cos ' = 3 2 r 5 2 1 P2 (cos #) sin ' = 3 2 r 5 2 2 P2 (cos #) cos 2' = 3 2 r 5 2 2 P2 (cos #) sin 2' = 3 2 2 P20 2 3 cos # 240 1 1 = 2 r 5 2z 2 x2 2 r 5 2 cos # sin # cos ' = 3 xz 2 r 5 2 cos # sin # sin ' = 3 yz 2 r 5 2 2 x y2 sin2 # cos 2' = 3 2 r 5 2 xy sin2 # sin 2' = 6 2 2 y2 Esercizio 6.22 Proseguendo come sopra, calcolare in coordinate cartesiane le seguenti armoniche sferiche: r 7 3 3 5 3 0 cos # + cos3 # = ::: P3 (t) = 2 2 2 r 7 3 3 15 3 1 P3 (t) cos ' = sin # + cos2 # cos ' = 2 2 2 r 7 3 3 15 3 1 P3 (t) sin ' = sin # + cos2 # sin ' = 2 2 2 r 7 15 2 r 7 3 2 P3 (t) sin 2' = 15 2 r 7 3 3 15 P3 (t) cos 3' = 2 r 7 3 3 15 P3 (t) sin 3' = 2 3 6.3.3 P32 (t) cos 2' = 3 sin2 # cos # cos 2' = 3 sin2 # cos # sin 2' = 3 sin3 # cos 3' = 3 sin3 # sin 3' = Soluzione del problema di Dirichlet per l’equazione di Laplace sulla sfera Arriviamo ora in fondo al percorso logico con cui siamo partiti e mostriamo come mediante le armoniche sferiche si possa scrivere la soluzione del problema di Dirichlet per il laplaciano sulla sfera. Al solito, per imporre la condizione al bordo consideriamo una generica serie delle soluzioni a variabili separate, e poi cerchiamo di determinare i coe¢ cienti a¢ nché questa assuma il dato al bordo. Sia: 1 1X an n Pn (cos #) 2 n=0 ( 1 ! 1 X X n m + am;n Pn (cos #) cos (m') u ( ; #; ') = + m=1 1 X n=m bm;n n ! ) Pnm (cos #) sin (m') n=m Imponendo la condizione u (r; #; ') = f (#; ') 241 si trova 1 1X an rn Pn (cos #) 2 n=0 f (#; ') = ( 1 X + m=1 1 X + 1 X am;n rn Pnm (cos #) cos (m') n=m bm;n r ! n Pnm ! ) (cos #) sin (m') n=m da cui, sviluppando 1 1X An Pn (cos #) 2 n=0 ( 1 ! 1 X X m + Am;n Pn (cos #) cos (m') + f (#; ') = n=m m=1 1 X Bm;n Pnm ! ) (cos #) sin (m') n=m con An = 1 Z 0 Am;n = Bm;n 2 Z 0 (n m)! 1 (n + m)! (n m)! 1 = (n + m)! f (#; ') Pn (cos #) sin #d# d' Z Z 2 0 Z f (#; ') Pnm (cos #) sin #d# cos (m') d' 0 Z 2 0 f (#; ') Pnm (cos #) sin #d# sin (m') d' 0 si trova che la soluzione è assegnata da u ( ; #; ') = + 1 1X An 2 n=0 r ( 1 1 X X m=1 n=m n Pn (cos #) n Am;n r Pnm ! (cos #) cos (m') + 1 X n=m n Bm;n r Pnm Si tratterebbe ora di dimostrare che sotto opportune ipotesi su f la formula è e¤ettivamente derivabile due volte e assegna la soluzione del problema. Non facciamo questa veri…ca, ma ci limitiamo a segnalare come, analogamente a quanto accadeva in due variabili per il laplaciano sul cerchio, si può trasformare la formula di rappresentazione per serie in una formula di rappresentazione integrale, estremamente più semplice37 . Vale il seguente: 3 7 Il risultato …nale del calcolo è semplice, il calcolo stesso è laborioso e non lo presentiamo; si rimanda per i passaggi a [Weinberger p.196] 242 ! ) (cos #) sin (m') : Teorema 6.23 La formula di rappresentazione per serie precedente si può riscrivere in forma integrale come segue: ! Z 2 Z 2 r r2 f #; ' sin # u ( ; #; ') = d# d' 3=2 4 0 0 (r 2 + 2 2r cos ) con cos = cos # cos # + sin # sin # cos (' ') Questa formula è detta formula integrale di Poisson in 3 variabili, ed è l’analoga di quella che abbiamo visto valere in due variabili sul cerchio. Per ogni dato f continuo, questa formula integrale assegna la soluzione del problema di Dirichlet, che all’interno della sfera risulta in…nitamente derivabile. Notiamo anche che ponendo = 0 nella formula integrale di Poisson si ha: ! Z Z Z 2 Z f #; ' sin # r3 2 1 u (0; #; ') = d# d' = f #; ' sin #d# d' 4 0 r3 4 0 0 0 Z 2 Z Z Z 1 1 2 f #; ' r sin #d# d' = f dS; = 4 r2 0 4 r2 @S(0;r) 0 che signi…ca: il valore di una funzione armonica nel centro di una sfera è uguale alla media integrale dei valori del dato sul bordo della sfera. Con ragionamenti analoghi a quelli visti nel caso bidimensionale, da questo fatto si deduce anche nel caso tridimensionale la formula di media per le funzioni armoniche: una funzione armonica in un dominio tridimensionale, in ogni punto ha come valore la media integrale dei valori assunti su una qualsiasi sferetta centrata in quel punto e contenuta nel dominio. La proprietà è vera sia facendo medie integrali su sfere piene, sia facendo medie integrali su super…ci sferiche. 6.4 Oscillatore armonico quantistico e polinomi di Hermite In meccanica quantistica una particella di massa m in moto lungo una retta è descritta da una funzione di stato (x; t), nota la quale si può calcolare la probabilità che la particella si trovi all’istante t nell’intervallo (a; b) come l’integrale Z b 2 j (x; t)j dx: a Per il suo signi…cato di probabilità, (x; t) deve soddisfare la condizione di normalizzazione Z 2 j (x; t)j dx = 1 per ogni t: R La funzione (x; t) soddisfa l’equazione di Schrödinger che, nel caso la particella di massa m sia soggetta ad un campo di forze di potenziale V (x), è: i~ @ (x; t) = @t ~2 @ 2 (x; t) + V (x) 2m @x2 243 (x; t) per x 2 R; t 2 R (dove ~ = h=2 separate: e h è la costante di Planck). Cerchiamo soluzioni a variabili (x; t) = X (x) T (t) i~XT 0 = i~ T0 = T ~2 00 X T + V (x) XT 2m ~2 X 00 + V (x) 2m X da cui dev’essere i~ T0 = E = cost. T ~2 X 00 + V (x) = E = cost. 2m X per qualche costante E 2 R; che dimensionalmente ha il signi…cato di energia. L’equazione in T si risolve direttamente T (t) = ce iE ~ t : Poiché jT (t)j = c, la condizione di normalizzazione si traduce in Z 2 jX (x)j dx = cost. R Ci interessa quindi determinare le autosoluzioni L2 (R) dell’equazione: X 00 + 2m (E ~2 V (x)) X = 0 in R. Sottolineiamo il fatto che l’appartenenza a L2 (R) della soluzione X (x) che stiamo cercando è una condizione necessaria per la sensatezza …sica del problema così impostato. Consideriamo ora il caso particolare dell’oscillatore armonico (quantistico, unidimensionale), per il quale V (x) = 1 m! 2 x2 : 2 Il modello dell’oscillatore armonico quantistico si applica ad esempio al moto di agitazione termica degli atomi formanti un reticolo cristallino. Più in generale, il modello descrive in prima approssimazione le oscillazioni di un sistema vicino a un punto di equilibrio stabile; si tratta perciò di un modello molto studiato. L’equazione diventa: X 00 (x) + 2m E ~2 m2 ! 2 2 x X (x) = 0: ~2 (6.9) Per risolverla, l’idea è ricondursi all’equazione di Hermite. Si procede in due passi. 244 1. Per prima cosa vogliamo fare un cambio di variabile che renda uguale a 1 il coe¢ ciente di x2 . Sia X (x) = Z ( x) con da determinarsi, allora 2 Z 00 ( x) + 2m E ~2 m2 ! 2 2 x Z ( x) = 0: ~2 2m E ~2 m2 ! 2 2 y Z (y) = 0: 2 ~2 Poniamo x = y e abbiamo 2 Z 00 (y) + Ora vogliamo che sia 2 4 m2 ! 2 2 ~2 m2 ! 2 = 2 r~ m! : = ~ = Perciò r m! x ~ risolve l’equazione (6.9) se e solo se Z (y) risolve l’equazione: X (x) = Z m! 00 Z (y) + ~ 2m E ~2 Z 00 (y) + m! 2 y Z (y) = 0 ~ 2 E !~ y 2 Z (y) = 0: (6.10) 2. Ora trasformiamo questa equazione in quella di Hermite ponendo: Z (y) = e Z 0 (y) = e Z 00 (t) = e e y2 2 y2 Y y2 2 y2 2 y2 2 2yY 0 Y (y) : ( yY + Y 0 ) y2 Y yY 0 Y yY 0 + Y 00 2 E y2 Y = 0 !~ 2 2yY 0 + E 1 Y = 0: !~ Y + Y 00 + Y 00 (6.11) Dunque Z (y) risolve (6.10) se e solo se Y (y) risolve (6.11). La condizione di normalizzazione su Y si legge al modo seguente: dev’essere …nito l’integrale r r Z Z Z 2 ~ m! 2 2 jZ (y)j dy = jX (x)j dx = Z x dx = m! R ~ R R r Z 2 ~ 2 = e y jY (y)j dy: m! R 245 Quindi siamo interessati a individuare autosoluzioni Y e autovalori di Hermite Y 00 2yY 0 + Y = 0 per cui si abbia Z e y2 R dell’equazione 2 jY (y)j dy < 1: Abbiamo visto (Teorema 6.7) che questa condizione può essere soddisfatta solo per = 2n e Y (y) = Hn (y) ; n-esimo polinomio di Hermite. Questo signi…ca che i possibili valori dell’energia sono: 2 E !~ 1 = 2n En = n+ 1 2 !~ con n = 0; 1; 2; 3; ::: e le autosoluzioni corrispondenti sono Yn (y) = Hn (y) ; corrispondenti a Zn (y) = e y2 2 Hn (y) ; e quindi per l’equazione iniziale: Xn (x) = e m!x2 2~ Hn r m! x : ~ Se i polinomi di Hermite Hn sono quelli normalizzati in modo da avere norma 2 1 in L2 R; e y dy , allora l’autofunzione normalizzata sarà: Xn (x) = r 4 m! e ~ m!x2 2~ Hn r m! x ~ per n = 0; 1; 2; ::: Si trova quindi che l’oscillatore possiede una successione di possibili livelli energetici En e corrispondenti stati stazionari Xn (x), che vanno dallo stato fondamentale n = 0; r !~ m! m!x2 E0 = ; X0 (x) = 4 e 2~ 2 ~ ai successivi “stati eccitati” per n 1, ad esempio p 2 m! 3=4 3 xe E1 = !~; X1 (x) = 1=4 ~ 2 m!x2 2~ : 2 E’signi…cativo osservare anche i gra…ci delle funzioni jXn (x)j , che rappresentano le densità di probabilità del sistema nei vari stati stazionari: 246 E’interessante osservare queste densità di probabilità tenendo presente l’equazione che gli stati Xn risolvono: Xn00 + 2m ~2 En 1 m! 2 x2 Xn = 0 in R. 2 Classicamente, un oscillatore armonico compie oscillazioni la cui ampiezza è determinata dall’energia del sistema: le oscillazioni sono “con…nate”. Analogamente nell’equazione precedente, nella regione spaziale in cui il termine En 12 m! 2 x2 è positivo Xn soddisfa un’equazione del tipo Xn00 + c2 (x) Xn = 0 che ha l’aspetto dell’equazione classica del moto armonico e quindi tende a con…nare il moto nella regione stessa. Fissato un livello energetico En ; le condizioni En 1 m! 2 x2 2 jxj 0, cioè r 2En = m! 2 s 2 n + 12 !~ = m! 2 r (2n + 1) ~ m! si dicono “limiti classici” del sistema. Nel caso quantistico, tuttavia, …ssato un livello energetico En , nessuno impedisce che la quantità En 12 m! 2 x2 diventi negativa. Il gra…co della densità di probabilità si estende oltre tali limiti, a signi…care che l’oscillatore armonico quantistico può superare i limiti classici. Le prossime …gure mostrano i gra…ci delle densità di probabilità dei primi 1 2 2 4 stati (n = 0; 1; 2; 3), con sovrapposta la parabola y = En 2 m! x le cui intersezioni con l’asse x segnano i limiti classici. L’area in grigio sotto la curva della densità probabilità indica la probabilità che il sistema si trovi in uno stato 247 classicamente proibito. Tornando all’equazione di Schrödinger, l’equazione in t è risolta da 1 T (t) = ce i(n+ 2 )!t : L’equazione in (x; t) ha quindi soluzioni a variabili separate r r m! m!x2 m! i(n+ 12 )!t 2~ e Hn x n (x; t) = e ~ ~ e la soluzione dell’equazione di Schrödinger con dato iniziale 0 (x) è data allora da una serie: r r 1 X 1 m! m!x2 m! (x; t) = cn e i(n+ 2 )!t e 2~ Hn x ~ ~ n=0 con 0 (x) = cn = 1 X cn n=0 Z +1 1 r r m! m!x2 m! e 2~ Hn x , quindi ~ ~ r r m! m!z2 m! 2~ H (z) e z dz: n 0 ~ ~ 248 6.5 Il problema agli autovalori per il laplaciano (equazione di Helmholz) e le sue applicazioni Supponiamo di voler studiare l’equazione della di¤usione del calore, in assenza di sorgenti, in una regione limitata del piano o dello spazio. Come già discusso, questo può condurre a un problema di Cauchy-Dirichlet per l’equazione del calore: 8 per x 2 ; t > 0 < ut = k u u (x; t) = 0 per x 2 @ ; t > 0 (6.12) : u (x; 0) = u0 (x) per x 2 oppure di problema di Cauchy-Neumann per l’equazione del calore: 8 per x 2 ; t > 0 < ut = k u @u (x; t) = 0 per x 2 @ ;t > 0 : @ u (x; 0) = u0 (x) per x 2 : (6.13) Problemi analoghi si possono considerare per l’equazione delle onde in due o tre variabili. In due variabili l’equazione rappresenta le vibrazioni di una membrana elastica, mentre in tre variabili potrebbe rappresentare le vibrazioni sonore nell’aria, o simili. Stando, per …ssare le idee, sull’interpretazione bidimensionale come membrana vibrante, se la membrana è …ssata al bordo e sono note posizione e velocità iniziali avremo un problema di Cauchy-Dirichlet per l’equazione delle onde: 8 utt = c2 u per x 2 ; t > 0 > > < u (x; t) = 0 per x 2 @ ; t > 0 (6.14) u (x; 0) = u (x) per x 2 > 0 > : ut (x; 0) = v0 (x) per x 2 : I problemi (6.12), (6.13), (6.14) hanno alcune caratteristiche matematiche comuni: l’equazione di¤erenziale è lineare omogenea e le condizioni al contorno sono omogenee, quindi sovrapposizione di soluzioni di equazione+condizioni al bordo risolve ancora entrambe; inoltre, le variabili spazio e tempo si possono assumere variabili in domini separati: x 2 ; t > 0. Tutto ciò suggerisce che si possono cercare soluzioni a variabili separate in spazio e tempo, cioè del tipo: u (x; t) = X (x) T (t) : Sostituendo ad esempio in (6.12) si trova: XT 0 = kT X T0 X (t) = (x) kT X da cui ogni membro dev’essere costante. Abbiamo allora: T0 = kT per t > 0 X + X = 0 in ; X = 0 su @ : 249 Vediamo cioè che il problema (6.12) si spezza in un problema agli autovalori X (x) + X (x) = 0 X (x) = 0 x2 x2@ (6.15) e un’equazione in T; T 0 (t) = k T (t) , elementarmente integrabile una volta noto (6.13) porta al problema agli autovalori . In modo analogo, il problema X (x) + X (x) = 0 (x) = 0 @X @ x2 x2@ (6.16) e alla stessa equazione in T , e il problema (6.14) porta ancora al problema agli autovalori (6.15), e questa volta all’equazione in T T 00 (t) = c2 T (t) . In conclusione: problemi di Cauchy-Dirichlet o di Cauchy-Neumann per l’equazione del calore o delle onde portano, impostandone la risoluzione per separazione di variabili, a studiare come sottoproblema un problema agli autovalori per l’equazione di Laplace, su un dominio del piano o dello spazio, con condizioni al contorno di tipo Dirichlet o di tipo Neumann, cioè (6.15) o (6.16). Vale la pena quindi dedicare un po’ di attenzione a questo problema agli autovalori di per sé, che si può vedere come un analogo in più variabili di quello che in una sola variabile sono i problemi di Sturm-Liouville che abbiamo considerato in precedenza. Si noti che per ora non abbiamo detto niente sul dominio (dimensioni, forma, regolarità...), tuttavia alcune proprietà di base si possono stabilire molto in generale. Teorema 6.24 Sia un dominio limitato del piano o dello spazio, regolare quanto basta perché ci si possa applicare il teorema della divergenza. Supponiamo che (X; ) e (Y; ) siano due coppie autofunzione-autovalore (X; Y non identicamente nulle e C 2 ) che risolvono il problema (6.15) oppure il problema (6.16). Allora: Z 6= =) X (x) Y (x) dx = 0: cioè: autofunzioni relative ad autovalori distinti sono tra loro ortogonali in L2 ( ). Inoltre gli autovalori sono positivi. Dimostrazione. Consideriamo le identità X (x) + X (x) = 0 Y (x) + Y (x) = 0: 250 Moltiplichiamo la prima per Y; la seconda per X, sottraiamo e integriamo in Z Z ( ) X (x) Y (x) dx = (Y X X Y ) dx: : Ora trasformiamo l’ultimo integrale mediante la seconda identità di Green (v. (??), §1.2) e otteniamo: Z Z @X @Y ( ) X (x) Y (x) dx = Y X d =0 @ @ @ perché, a seconda delle condizioni al contorno che sto considerando, o X e Y @Y (problema sono nulle su @ (problema di Dirichlet) o @X @ ; @ sono nulle su @ di Neumann). Ne segue, essendo 6= ; che Z X (x) Y (x) dx = 0: Proviamo la positività degli autovalori. Moltiplichiamo l’equazione X (x) + X (x) = 0 per X e integriamo in : Z Z Z Z 2 2 X (x) dx = X X (x) dx = jrX (x)j dx r (XrX) dx Z Z Z @X 2 2 = jrX (x)j dx X d = jrX (x)j dx @ @ di nuovo per le condizioni al contorno, che comportano l’annullarsi dell’integrale di bordo. Quindi: R 2 jrX (x)j dx = R > 0: 2 X (x) dx I risultati appena visti e l’analogia con quanto accade per i problemi di Sturm-Liouville suggeriscono che ci si possa aspettare, almeno per domini “buoni”, l’esistenza di una successione di autovalori e una famiglia di autofunzioni corrispondenti, che risultino formare un sistema ortonormale completo di L2 ( ). Se e quando così accade, il problema (6.12), ad esempio, avrà soluzioni a variabili separate del tipo: un (x; t) = Xn (x) e k nt e quindi potremo cercare una soluzione u (x; t) = 1 X cn Xn (x) e k n=0 imponendo u0 (x) = 1 X n=0 251 cn Xn (x) nt (6.17) ossia pur di saper sviluppare u0 in serie di autofunzioni del laplaciano. Analoghi procedimenti valgono per l’equazione delle onde: il problema (6.14) avrà soluzioni a variabili separate del tipo: h i p p un (x; t) = Xn (x) an cos c t + b sin c t (6.18) n n n e quindi potremo cercare una soluzione u (x; t) = X0 (x) + 1 X n=1 h p Xn (x) an cos c nt p + bn sin c nt i imponendo u0 (x) = X0 (x) + 1 X an Xn (x) n=1 v0 (x) = 1 X n=1 p bn c n Xn (x) ossia pur di saper sviluppare u0 e v0 in serie di autofunzioni del laplaciano. Tutta la discussione precedente mostra quindi che è utile studiare il problema agli autovalori per il laplaciano su vari domini del piano e dello spazio e stabilire se e quando questo possiede un sistema ortonormale completo di autosoluzioni. Quando la geometria di è semplice, il problema agli autovalori può essere a sua volta impostato mediante separazione di variabili. In un piccolo numero di geometrie semplici questi problemi sono stati sviscerati classicamente: se è un rettangolo, un cerchio, una sfera, un cilindro, di questi problemi si sa tutto; le autofunzioni sono scritte esplicitamente in termini di opportune funzioni speciali, gli autovalori sono noti. Per domini più generali ciò che è possibile fare è da una parte dimostrare teoremi di esistenza sotto opportune ipotesi, d’altro canto sviluppare metodi di calcolo numerico approssimato di autofunzioni e autovalori. Nel seguito di questo paragrafo tratteremo le due situazioni geometricamente più semplici: rettangolo e cerchio. 6.6 L’equazione di Helmholz sul rettangolo L’equazione u+ u=0 è detta anche equazione di Helmholz. Studiamola sul rettangolo, con condizione al contorno di Dirichlet nulla: 8 0 x a; 0 y b < uxx + uyy + u = 0 u (0; y) = u (a; y) = 0 0 y b : u (x; 0) = u (x; b) = 0 0 x a: 252 Impostiamo il problema per separazione delle variabili, cercando u (x; y) = X (x) Y (y) : Si trova: X 00 Y + XY 00 + XY = 0 X 00 = X + Y 00 Y e ciascuno dei due membri dev’essere costante, poiché il primo è funzione di x e il secondo di y. Quindi per qualche reale si ha, tenendo conto anche delle condizioni al contorno: X 00 = X X (0) = X (a) = 0 Y 00 = ( + )Y Y (0) = Y (b) = 0: Si tratta di due problemi agli autovalori, distinti e simili. Il primo, in X; come soluzioni: Xn (x) = sin n x ; a = n a ha 2 , n = 1; 2; 3; ::: Il secondo, in Y; , ha come soluzioni Ym (x) = sin m y ; b = m b 2 il che porta in de…nitiva a una successione a due indici di autovalori e autofunzioni: m y n x sin a b n 2 m 2 = + = a b un;m (x; y) = sin n;m 2 n2 m2 + 2 2 a b . Si noti che abbiamo e¤ettivamente ottenuto una successione di autofunzioni che costituisce un sistema ortonormale completo di L2 ([0; a] [0; b]) con una successione di autovalori che tende a +1. Per risolvere il problema di Cauchy-Dirichlet occorrerà sviluppare il dato iniziale in serie di Fourier in due variabili. 6.6.1 Membrana vibrante rettangolare Se ad esempio stessimo risolvendo questo problema per risolvere poi il problema di Cauchy-Dirichlet (6.14) per l’equazione delle onde (membrana vibrante 253 rettangolare) avremmo, in base alla discussione fatta in precedenza e alla (6.18) 1 X n x m y sin a b n;m=1 " ! !# r r n2 m2 n2 m2 an;m cos c + 2 t + bn;m sin c + 2t ; a2 b a2 b u (x; y; t) = sin nella quale potremmo determinare i coe¢ cienti an;m ; bn;m per soddisfare le condizioni iniziali. Se imponiamo che la velocità iniziale sia nulla troviamo ancora bn;m = 0 e 1 X u (x; y; t) = cn;m un;m (x; y; t) n;m=1 con m y n x sin cos c un;m (x; y; t) = sin a b r n2 m2 + 2t 2 a b ! e i coe¢ cienti cn;m si determinano sviluppando il dato iniziale in serie di Fourier (sviluppo in serie di soli seni) in due variabili: n x m y u0 (x; y) = cn;m sin sin a b Z Z 4 n x m y cn;m = u0 (x; y) sin sin dxdy ab a b [0;a] [0;b] Ci sono interessanti analogie e di¤erenze tra la membrana vibrante e la corda vibrante …ssata agli estremi, studiata nel § 5.3.1. Anche qui la generica vibrazione è sovrapposizione di in…nite vibrazioni stazionarie: in ogni vibrazione stazionaria un;m (x; y; t) ogni punto della membrana oscilla su e giù di moto armonico. Tutti i punti della membrana in cui sin n x m y sin a b =0 sono immobili in ogni istante. Questi punti costituiscono le linee nodali, che sono (oltre ai lati del rettangolo) gli (n 1) + (m 1) segmenti interni al rettangolo dati da: k a con k = 1; 2; :::; n 1 n h y = b con h = 1; 2; :::; m 1: m x= Ad esempio, per n = 2; m = 3 la vibrazione avviene come suggerito da questa 254 sequenza di immagini per istanti successivi: Notiamo che per la membrana vibrante rettangolare, diversamente dalla corda vibrante …ssata agli estremi, le frequenze della vibrazioni stazionarie non sono multiple intere della frequenza fondamentale, in quanto i numeri r m2 c n2 + 2 2 b 2 a non sono in generale multipli interi di r c 1 1 + 2: 2 2 a b Dal punto di vista musicale, le frequenze più alte non sono “armoniche”rispetto alla frequenza fondamentale. Questo è il motivo per cui di¢ cilmente il suono emesso da un tamburo viene percepito come una nota ben de…nita. Il caso della membrana quadrata (a = b) ha una particolarità interessante. Consideriamo due interi positivi n; m diversi tra loro, e consideriamo le due 255 vibrazioni stazionarie n x m y c p 2 sin cos n + m2 t a a a m y c p 2 m x sin cos n + m2 t : um;n (x; y; t) = sin a a a p Si noti che la parte temporale è la stessa: cos ca n2 + m2 t ; in particolare, le due funzioni hanno la stessa frequenza, lo stesso periodo, e ogni loro combinazione lineare ha di conseguenza lo stesso periodo. Ciò signi…ca che anche le funzioni c1 un;m (x; y; t) + c2 um;n (x; y; t) un;m (x; y; t) = sin sono vibrazioni periodiche (stazionarie). Tuttavia, queste possono avere forme molto complicate, come si capisce ad esempio chiedendosi quali sono le loro linee nodali, che sono le linee interne al rettangolo, soluzioni dell’equazione: m y m x m y n x c1 sin sin + c2 sin sin = 0: a a a a Questo è il fenomeno della degenerazione della membrana quadrata, consistente nell’esistenza di vibrazioni stazionarie complicate. Ad esempio, rappresentiamo (per a = 1) le funzioni c1 u2;3 (x; y; 0) + c2 u3;2 (x; y; 0) = c1 sin (2 x) sin (3 y) + c2 sin (3 x) sin (2 y) e le loro linee di livello per alcune scelte dei coe¢ cienti c1 ; c2 : Per c1 = 0:1; c2 = 0:9 gra…co e linee di livello sono: Per c1 = 0:3; c2 = 0:7 gra…co e linee di livello sono: 256 Per c1 = 0:5; c2 = 0:5 gra…co e linee di livello sono: 6.6.2 Equazione del calore sul rettangolo Segnaliamo anche che se stessimo risolvendo il problema agli autovalori per risolvere poi il problema di Cauchy-Dirichlet (6.12) per l’equazione del calore avremmo, in base alla discussione fatta in precedenza e alla (6.17) u (x; y; t) = 1 X n;m=1 cn;m sin m y n x sin e a b k 2 n2 a2 2 +m b2 t ; nella quale potremmo determinare i coe¢ cienti cn;m per soddisfare la condizione iniziale. 6.7 L’equazione di Helmholz sul cerchio. Funzioni di Bessel di ordine intero Studiamo ora l’equazione di Helmholz sul cerchio unitario, con condizione al contorno di Dirichlet nulla. Scrivendo il laplaciano in coordinate polari si ha: 8 2 1 @2u < @ u 1 @u + + 2 + u = 0 0 < < 1; 0 # 2 2 (6.19) @ @ @# : u (1; #) = 0 0 # 2 : Si noti che abbiamo posto, per semplicità, il raggio del cerchio r = 1. Infatti se u risolve u + u = 0 per < 1 u = 0 per = 1 la funzione v ( ; #) = u r ;# risolverà v + r2 v = 0 per v = 0 per = r 257 <r quindi l’equazione di Helmholz sul cerchio di raggio qualsiasi si risolve prendendo le opportune dilatazioni di autofunzioni e autovalori del laplaciano sul cerchio unitario. Per risolvere il problema (6.19), separiamo le variabili cercando u ( ; #) = R ( ) 1 + R0 R00 + 2 1 2 00 R (#) : + R R0 R00 + + R R =0 2 = 00 che porta a: 00 2 00 0 R + R + 2 = R = 0: La prima equazione, unita alla condizione di periodicità su n ; porta a (#) = an cos (n#) + bn sin (n#) = n2 ; n = 0; 1; 2; ::: e la seconda diventa 2 R00 + R0 + 2 n2 R = 0; problema agli autovalori in da risolversi per dizione al contorno nulla), e R (0) …nita. 6.7.1 (6.20) 2 [0; 1], con R (1) = 0 (con- Equazione di Bessel ed autofunzioni del laplaciano sul cerchio Riscrivendo l’equazione (6.20) nella forma n2 R00 + R0 + R=0 e quindi 0 ( R0 ) + n2 R = 0 per 2 (0; 1) , si vede che si tratta di un problema di Sturm-Liouville singolare (il coe¢ ciente p ( ) = si annulla in 0). Da questa forma dell’equazione si legge che per autosoluzioni relative ad autovalori distinti sono ortogonali in L2 ((0; 1) ; d ). Si osservi che in questa equazione l’intero n = 0; 1; 2; ::: è …ssato (cioè: per ogni n stiamo studiando una diversa equazione); il numero che cerchiamo è senz’altro positivo perché per come è stato impostato il problema è un autovalore del Laplaciano. Siamo interessati a determinare le soluzioni R ( ) dell’equazione in (0; 1) che siano limitate in 0 e si annullino in 1. 258 Si procede così: poniamo ponendo = ! 2 ed eseguiamo il cambio di variabili ! = x, R( ) = R x ! = X (x) ; 1 0 x 1 R = R0 ( ) ! ! ! 1 X 00 (x) = 2 R00 ( ) ! X 0 (x) = si ha: 2 ! 2 R00 + !R0 + ! 2 2 x2 R00 + xR0 + x2 n2 R = 0; n2 R = 0 per x 2 (0; !) , con R (!) = 0; R (0) limitata. L’equazione x2 R00 + xR0 + x2 n2 R = 0 per x 2 (0; +1) (6.21) si dice equazione di Bessel di ordine n = 0; 1; 2; 3; ::: A noi interessa risolverla in (0; !) imponendo la condizione R (!) = 0 (e la limitatezza in 0), ma poiché ! è ancora incognita, diciamo che ci interessa risolverla in (0; +1). Enunciamo senza dimostrazione una serie di proprietà che riguardano l’equazione di Bessel. 1. L’integrale generale dell’equazione di Bessel di ordine n = 0; 1; 2; ::: ha la forma c1 Jn (x) + c2 Yn (x) dove Jn (x), detta funzione di Bessel di prima specie di ordine n = 0; 1; 2; :::; è regolare in [0; +1), mentre Yn (x), detta funzione di Bessel di seconda specie di ordine n = 0; 1; 2; :::; è regolare in (0; +1) ma illimitata in 0. Quindi la soluzione che ci interessa della (6.21) è R (x) = Jn (x). 2. L’espressione analitica di Jn (x), che si può ricavare col metodo di Frobenius, cercando una soluzione dell’equazione (6.21) in forma di serie di potenze (come abbiamo fatto per l’equazione di Legendre), ricavandone una relazione di ricorrenza sui coe¢ cienti e quindi risalendo all’espressione esplicita dei coe¢ cienti stessi, è la seguente: Jn (x) = 1 X k=0 k ( 1) k! (n + k)! x 2 2k+n ; da cui in particolare si legge che per x ! 0 è Jn (x) cxn . 3. La funzione Jn (x) ha in…nite oscillazioni in (0; +1) ; in particolare ha 1 una successione di zeri fkn;m gm=1 che tende a in…nito. 259 Gra…ci delle funzioni Jn (x) per n da 0 a 5 1 2 3 4 Jn (x) ; n ! kn;m ; m # 0 1 2 3 4 5 2:405 5:520 8:654 11:792 3:832 7:016 10:173 13:324 5:136 8:417 11:620 14:796 6:380 9:761 13:015 16:223 7:588 11:065 14:372 17:616 8:771 12:339 15:700 18:980 Valori di alcuni zeri delle funzioni di Bessel Poiché vogliamo R (!) = 0 dovrà essere ! = kn;m per qualche m; 2 kn;m . ossia = Quindi, per ogni intero n = 0; 1; 2; :::; l’equazione (6.20) ha 1 2 soluzioni solo se è uno dei valori kn;m , e in tal caso la soluzione è m=1 R ( ) = Jn (kn;m ) . 260 Gra…ci di J0 (k0;m x) per m = 1; 2; 3; 4: Gra…ci di J1 (k1;m x) per m = 1; 2; 3; 4: Gra…ci di J2 (k2;m x) per m = 1; 2; 3; 4: 261 1 Per ciascun n …ssato il sistema (a un solo indice) fJn (kn;m )gm=1 è ortogonale completo in L2 ([0; 1] ; d ). L’ortogonalità è già stata dimostrata. Non dimostriamo la completezza. 4. Si hanno quindi le seguenti autosoluzioni a variabili separate di (6.19): Jn (kn;m ) cos (n#) per n = 1; 2; 3; ::: m = 1; 2; 3; ::: Jn (kn;m ) sin (n#) per n = 1; 2; 3; ::: m = 1; 2; 3; ::: J0 (k0;m ) per m = 1; 2; 3; ::: (6.22) 1 2 corrispondenti alla successione a due indici di autovalori kn;m . n=0;1;2;:::m=1;2;::: Gli autovalori sono i quadrati di tutti gli zeri di tutte le funzioni di Bessel di prima specie. Le autofunzioni (6.22) costituiscono un sistema ortogonale completo in L2 ([0; 1] [0; 2 ] ; d d#) ossia, passando in coordinate cartesiane, in L2 del cerchio unitario. Questo discende dal seguente argomento generale. 1 Sappiamo già che per ogni n …ssato fJn (kn;m )gm=1 è ortogonale completo 2 in L ([0; 1] ; d ); 1 sappiamo che fcos (n#) ; sin (n#) ; 1gn=1 è ortogonale completo in L2 ([0; 2 ] ; d#); 2 allora presa una funzione f 2 L ([0; 1] [0; 2 ] ; d d#) possiamo: 1. per …ssato sviluppare f in serie di Fourier rispetto a #: f ( ; #) = 1 A0 ( ) X + fAn ( ) cos (n#) + Bn ( ) sin (n#)g ; 2 n=1 1 ora per ogni n sviluppiamo An e Bn in serie rispetto al sistema fJn (kn;m )gm=1 , 1 e sviluppiamo A0 in serie rispetto al sistema fJ0 (k0;m )gm=1 . Otteniamo: 1 1 X a0;m J0 (k0;m ) + (6.23) 2 m=1 ( 1 ) 1 1 X X X + an;m Jn (kn;m ) cos (n#) + bn;m Jn (kn;m ) sin (n#) f ( ; #) = n=1 m=1 m=1 che è esattamente uno sviluppo rispetto al sistema (6.22), che pertanto risulta completo. Le funzioni (6.22) sono ortogonali complete ma non normalizzate. calcolare i coe¢ cienti di normalizzazione occorre sapere che: Z 1 1 2 2 Jn (kn;m ) d = Jn+1 (kn;m ) : 2 0 262 Per Tenuto conto di questo, i coe¢ cienti dello sviluppo (6.23) si calcolano così: Z 2 Z 1 2 an;m = cos (n#) f ( ; #) Jn (kn;m ) d d# 2 Jn+1 (kn;m ) 0 0 per n = 0; 1; 2; :::; m = 1; 2; ::: Z 2 Z 1 2 sin (n#) f ( ; #) Jn (kn;m ) d d# bn;m = 2 Jn+1 (kn;m ) 0 0 per n = 1; 2; :::; m = 1; 2; ::: Si possono ora trarre conseguenze sulla soluzione di un problema di CauchyDirichlet per l’equazione del calore o delle onde sul cerchio. 6.7.2 La membrana vibrante circolare Per la membrana vibrante circolare con velocità iniziale nulla e posizione iniziale f ( ; #) si troverà soluzione: 1 1 X a0;m J0 (k0;m ) cos (k0;m ct) u (t; ; #) = 2 m=1 + 1 X n=1 Jn (kn;m ) 1 X [an;m cos (n#) + bn;m sin (n#)] cos (kn;m ct) : m=1 Si può dimostrare che questa formula assegna e¤ettivamente una funzione due volte derivabile e soluzione del problema di Cauchy-Dirichlet se si suppone che la condizione iniziale f ( ; #) è C 4 e sia f che f + 1 f si annullano sul bordo. Per questa discussione si rimanda a [Weinberger p.184]. Le soluzioni stazionarie sono le seguenti: J0 (k0;m ) cos (k0;m ct) Jn (kn;m ) cos (n#) cos (kn;m ct) Jn (kn;m ) sin (n#) cos (kn;m ct) In particolare, le frequenze proprie di vibrazione della membrana circolare (di raggio unitario) …ssata al bordo risultano essere kn;m c 2 e, come nel caso del rettangolo, non sono multiple intere della frequenza fondamentale (un tamburo circolare non è in generale più musicale di un tamburo quadrato). Ricordando la discussione fatta all’inizio del paragrafo, se invece di essere sul cerchio di raggio 1 fossimo sul cerchio di raggio r gli autovalori andrebbero divisi per r2 , ossia 2 kn;m = n;m r2 263 e quindi le frequenze risulterebbero: n;m = kn;m c : 2 r Dal punto di vista musicale: un tamburo più grande ha una frequenza fondamentale corrispondente a una nota più grave, a parità di altre condizioni; per raddoppiare la frequenza occorre dimezzare il raggio del tamburo. Le linee nodali delle soluzioni stazionarie sono: -le circonferenze interne al cerchio, lungo cui si ha Jn (kn;m ) = 0, ossia kn;j = kn;m per j = 1; 2; :::; m 1 (sono m 1 circonferenze interne, più il bordo del cerchio); -i raggi lungo cui si ha cos (n#) = 0 oppure sin (n#) = 0, ad es. per sin sono # = nk ; con k = 0; 1; :::; 2n 1: (Sono 2n raggi, cioè n diametri; per J0 queste linee nodali non compaiono). Mostriamo qualche gra…co delle funzioni J0 (k0;m ) (m = 1; 2; 3; 4): Qualche gra…co delle funzioni Jn (kn;m ) cos (n#) ; con le relative linee di livello (tra cui si vedono i raggi e le circonferenze che costituiscono le linee 264 nodali): J1 (k1;1 ) cos (#) J1 (k1;2 ) cos (#) 265 J2 (k2;1 ) cos (2#) J2 (k2;2 ) cos (2#) Un caso particolarmente semplice ma interessante è quando la condizione iniziale è di tipo radiale. Si ha in tal caso: u (t; ; #) = 1 1 X a0;m J0 (k0;m ) cos (k0;m ct) 2 m=1 dove f( )= 6.8 1 1 X a0;m J0 (k0;m ) : 2 m=1 Equazione di Helmholz sul cilindro Consideriamo l’equazione di Helmholz sul cilindro di raggio 1 e altezza l, con condizioni di Dirichlet nulle sul bordo. In coordinate cilindriche ( ; #; z) il problema agli autovalori si scrive: 8 u + 1 u + 12 u## + uzz + u = 0 per 2 (0; 1) ; # 2 (0; 2 ) ; z 2 (0; l) > > < u (r; #; z) = 0 > u ( ; #; 0) = 0 > : u ( ; #; l) = 0: 266 Se il raggio del cilindro non è 1 ma r, come nel caso del cerchio le autofunzioni si ottengono da queste per cambiamento di scala v ( ; #; z) = u r ; #; z , e gli autovalori vanno divisi per r2 . Impostando il problema per separazione di variabili, u ( ; #; z) = R ( ) si trova R00 R0 1 + + 2 R R 00 (#) Z (z) + Z 00 + Z =0 e ragionando al solito modo, tenuto conto anche delle condizioni al bordo e della periodicità di si ha: Z 00 = Z Z (0) = Z (l) = 0 da cui Z (z) = sin k z l ; 2 k l = ; 00 = 2 -periodica da cui (#) = a cos (n#) + b sin (n#) ; = n2 e quindi 2 R00 R0 1 k n2 2 + + R R l ( 0 n2 k R00 + R 2 R + l R (1) = 0; R (0) limitata =0 2 R=0 che è un’equazione di Bessel di ordine n; le cui soluzioni sono quindi, per ogni n …ssato, R ( ) = Jn (kn;m ) con autovalori k l 2 kn;m = 2 da cui ricaviamo che gli autovalori del problema iniziale sono la successione a tre indici interi 2 k 2 n;m;k = kn;m + l per n = 0; 1; 2; ; m = 1; 2; :::; k = 1; 2; ::: 267 Le soluzioni a variabili separate sono quindi: k z l k z l u ( ; #; z) = Jn (kn;m ) sin u ( ; #; z) = Jn (kn;m ) sin cos (n#) sin (n#) mediante le quali possiamo poi esprimere la soluzione di un problema di CauchyDirichlet per l’equazione del calore o delle onde sul cilindro. Ad esempio: 6.8.1 L’equazione del calore sul cilindro La soluzione del problema di Cauchy-Dirichlet per l’equazione del calore sul cilindro: 8 > ut D u + 1 u + 12 u## + uzz = 0 per 2 (0; 1) ; # 2 (0; 2 ) ; z 2 (0; l) > > > > < u (t; r; #; z) = 0 u (t; ; #; 0) = 0 > > > u (t; ; #; l) = 0 > > : u (0; ; #; z) = f ( ; #; z) si può esprimere mediante la serie u (t; ; #; z) = 1 X 1 X a0;m;k e 2 D k0;m +( kl 2 ) t J0 (k0;m ) sin m=1 k=1 + 1 X 1 X 1 X e 2 2 D kn;m +( kl ) t Jn (kn;m ) sin n=1 m=1 k=1 k z l k z l fan;m;k cos (n#) + bn;m;k sin (n#)g dove i coe¢ cienti an;m;k ; bn;m;k sono quelli dello sviluppo del dato iniziale f in serie di funzioni ortonormali: f ( ; #; z) = 1 X 1 X k z l a0;m;k J0 (k0;m ) sin m=1 k=1 + 1 X 1 X 1 X k z l Jn (kn;m ) sin n=1 m=1 k=1 fan;m;k cos (n#) + bn;m;k sin (n#)g e di conseguenza hanno queste espressioni an;m;k bn;m;k 2 = 2 Jn+1 (kn;m ) 2 = 2 Jn+1 (kn;m ) Z 1 0 Z 0 1 2 l 2 l Z l 1 0 Z 0 Z 2 f ( ; #; z) cos (n#) d# sin k z l f ( ; #; z) sin (n#) d# sin k z l 0 l 1 Z 2 0 268 dz dz ! ! Jn (kn;m ) d Jn (kn;m ) d 6.9 Equazione di Helmholz sulla sfera. Funzioni di Bessel sferiche Consideriamo l’equazione di Helmholz sulla sfera di raggio unitario, che in coordinate sferiche 8 < x = sin # cos ' y = sin # sin ' : z = cos # assume la forma: 8 > > @ 2 u 2 @u > > + + < @ 2 @ > > > > : u (1; #; ') = 0 1 @ 2 sin # @# sin # @u @# + 1 @2u + u=0 2 sin2 # @' per 0 < < 1; 0<#< ; 0<'<2 per 0 < # < ; 0<'<2 : Analogamente a quanto visto nel caso del cerchio o del cilindro, se la sfera avesse raggio r ci si riconduce a questo caso col cambiamento di scala v ( ; #; ') = u r ; #; ' e dividendo per r3 gli autovalori che troveremo per la sfera di raggio unitario. Cercando soluzioni a variabili separate u ( ; #; ') = R ( ) S (#; ') ; ponendo (#;') = 1 @ sin # @# sin # @ @# + 1 @2 sin2 # @' e sfruttando i calcoli già fatti nello studio del laplaciano sulla sfera (v. §8.3.1) si ha: 2 2 R00 ( ) + 2 R0 ( ) S (#; ') + R ( ) 00 0 R ( )+2 R ( )+ R( ) 2 R( ) (#;') S = R00 ( ) + 2 R0 ( ) + R( ) 2 R ( ) S (#; ') = 0 (#;') S (#; ') S (#; ') da cui ricaviamo che per qualche costante 2 (#; ') + 2 R( ) si ha = = (#;') S (#; ') : S (#; ') Ora il problema agli autovalori (#;') S (#; ') + S (#; ') = 0 è già stato risolto e porta alle armoniche sferiche; precisamente si ha (v. §8.3.1) = n (n + 1) Sn;m (#; ') = Pnm (cos #) (a cos m' + b sin m') 269 per n = 0; :::; 1, m = 0; :::; n: L’equazione radiale diventa allora R00 ( ) + 2 R0 ( ) + R (1) = 0; 2 2 n (n + 1) R ( ) = 0 equazione che assomiglia all’equazione di Bessel (v. §8.4.3) 2 R00 + R0 + 2 n2 R = 0 ma non lo è per via del termine 2R0 anziche R0 . Per riportarla a un’equazione di Bessel si esegue il cambio di variabile 1=2 R( ) = S ( ): I soliti calcoli noiosi portano in de…nitiva all’equazione ( 2 2 00 2 S ( ) + S0 ( ) + n + 21 S( )=0 S (1) = 0 che è un’equazione di Bessel di ordine n + 12 , cioè non intero ma semiintero (il doppio di n + 21 è un intero, dispari). O meglio, come nel caso dell’equazione di p Bessel studiata nel §8.4.3, ponendo = x si trasforma nell’equazione 8 2 < x2 S 00 (x) + xS 0 (x) + x2 S (x) = 0 n + 12 p : S =0 Apriamo allora una parentesi su quest’equazione. 6.9.1 Equazione e funzioni di Bessel di ordine semiintero Consideriamo l’equazione di¤erenziale x2 y 00 (x) + xy 0 (x) + x2 2 y (x) = 0 per x > 0 e > 0 assegnato. Si dice equazione di Bessel di ordine : Se = n + 12 , l’unica soluzione dell’equazione che sia limitata in x = 0 è (a meno di costante moltiplicativa) la funzione di Bessel di ordine semiintero (detta anche funzione di Bessel sferica): x 2 Jn+ 12 (x) = dove (t) = R +1 0 tx 1 1 n+ 12 X k=0 k k! ( 1) n+k+1+ 1 2 x 2 2k ; e t dt è la funzione Gamma di Eulero e 1 2 (2 (n + k) + 1)!! p ; con 2n+k (2r + 1)!! = (2r + 1) (2r 1) (2r 3) (2r n+k+1+ = 270 5) :::5 3 L’autovalore corrispondente è uno della successione n;h 2 = kn+ 1 ;h ; 2 dove kn+ 21 ;h è l’h-esimo zero della funzione Jn+ 21 (x) e la successione kn+ 12 ;h tende a in…nito. Vale anche la seguente formula Jn+ 21 n+ 12 (2x) p (x) = ( 1) n dn n d (x2 ) sin x x n dove la bizzarra scrittura d(xd 2 )n sinx x ha il seguente signi…cato. Dopo aver scritto (in base allo sviluppo di Taylor di sin x) 1 sin x X x2k k = ( 1) x (2k + 1)! k=0 si deriva formalmente questa serie rispetto alla variabile x2 , cioè si deriva n volte rispetto a t la serie 1 X tk k ( 1) (2k + 1)! k=0 2 e si pone t = x nel risultato. Esempio 6.25 Si ha: J1=2 (x) = J3=2 (x) = r 2 sin x x r 2 cos x x sin x x : Si dimostra che per ogni n = 0; 1; 2; ::: le funzioni n o1 Jn+ 12 kn+ 12 ;m m=1 (opportunamente normalizzate) sono un s.o.n.c. in L2 ((0; 1) ; d ) : Per il calcolo dei coe¢ cienti di normalizzazione, vale ancora la formula: Z 1 2 1 2 Jn+ 12 kn+ 12 ;m d = Jn+1+ kn+ 12 ;m : 1 2 2 0 Riportiamo qualche informazione quantitativa sulle prime funzioni di Bessel di ordine semiintero. 271 r 2 sin x x r 2 sin x J3=2 (x) = cos x x x r 2 cos x 3 sin x J5=2 (x) = 3 sin x + x x x2 r 2 15 cos x 15 sin x sin x J7=2 (x) = cos x + 6 x x2 x3 x r 105 cos x 10 cos x 105 sin x 2 + + sin x + J9=2 (x) = x x3 x x4 J1=2 (x) = kn+1=2;h n=0 n=1 n=2 n=3 n=4 h=1 3:14159 4:49341 5:76346 6:98793 8:18256 h=2 6:28319 7:72525 9:09501 10:4171 11:7049 h=3 9:42478 10:9041 12:3229 13:698 15:0397 h=4 12:5664 14:0662 15:5146 16:9236 18:3013 h=5 15:708 17:2208 18:689 20:1218 21:5254 Zeri delle funzioni di Bessel di ordine semiintero Gra…ci delle funzioni di Bessel Jn+ 21 (x) per n = 0; 1; 2; 3; 4: 272 45 sin x x2 273 5 Gra…ci delle funzioni J 12 k 12 ;h Gra…ci delle funzioni J 32 k 32 ;h per h = 1; 2; 3; 4; 5 per h = 1; 2; 3; 4; 5 Tornando alla nostra equazione radiale, la soluzione è quindi R( ) = con 1=2 S( )= 1=2 Jn+ 12 kn+ 12 ;h 2 = kn+ 1 ;h ; h = 1; 2; 3:::: 2 n+1=2 n Poiché per ! 0 è Jn+ 12 ( ) si ha R ( ) : In de…nitiva, le soluzioni a variabili separate dell’equazione di Helmholz sulla sfera sono un;m;h ( ; #; ') = 1=2 Jn+ 12 kn+ 12 ;h Pnm (cos #) cos m' u0n;m;h ( ; #; ') = 1=2 Jn+ 12 kn+ 12 ;h Pnm (cos #) sin m'; 274 con autovalori n;h 2 = kn+ 1 ;h 2 dove n = 0; 1; 2; :::; h = 1; 2; :::; m = 0; 1; :::; n: Per un ragionamento già visto più volte, il sistema a tre indici un;m;h ( ; #; ') ; u0n;m;h ( ; #; ') n=0;1;2;:::;h=1;2;:::;m=0;1;:::;n è ortogonale e, se normalizzato, ortonormale completo, nello spazio L2 prodotto. Precisamante, poiché sappiamo già che il sistema fPnm (cos #) cos m'; Pnm (cos #) sin m'gn=0;1;2;:::;m=0;1;:::;n è ortogonale completo in L2 ((0; ) (0; 2 ) ; sin #d#d') e per ogni n = 0; 1; 2; :: il sistema n Jn+ 12 kn+ 12 ;h o h=1;2;::: è ortogonale completo in L2 ((0; 1) ; d ) ; ne segue che il sistema un;m;h ( ; #; ') ; u0n;m;h ( ; #; ') n=0;1;2;:::;h=1;2;:::;m=0;1;:::;n è ortogonale completo in L2 (0; 1) (0; ) (0; 2 ) ; 2 sin #d d#d' : Si faccia attenzione al termine 2 anziché , che compare grazie alla presenza dei termini 1=2 nella de…nizione di un;m;h . D’altro canto, con cambio di variabili sferiche, si vede che la misura 2 sin #d d#d' non è altro che la misura di volume dxdydz in coordinate cartesiane. Quindi le soluzioni a variabili separate sono un s.o.n.c. in L2 della sfera. 6.10 L’equazione di Schrödinger per l’atomo di idrogeno e i polinomi di Laguerre Consideriamo un atomo di idrogeno, costituito da un elettrone di massa me e carica elettrica e che ruota attorno al nucleo di carica e che supponiamo posto nell’origine. Vogliamo studiare il modello con cui la meccanica quantistica prevede dove si troverà l’elettrone. L’energia potenziale elettrostatica dell’elettrone è data da e2 V ( )= ; 4 "0 275 dove "0 è la costante di permettività del vuoto38 , e l’equazione di Schrödinger per la funzione d’onda (x; y; z; t) dell’elettrone è i} @ = @t ~2 2me +V : Cercando soluzioni a variabili separate in spazio e tempo come abbiamo fatto per l’equazione delle onde o del calore nell §8.5.1 (e come abbiamo già fatto per l’equazione di Schrödinger nel caso unidimensionale studiato nel §8.4.2) (x; y; z; t) = troviamo (x; y; z) T (t) ~2 2me T0 i} (t) = T +V (x; y; z) da cui ogni membro dev’essere costante, chiamiamo E questa costante (che dimensionalmente è un’energia). L’equazione in T (t) è allora banale, T 0 (t) = i E T (t) } iE }t T (t) = ce mentre l’equazione signi…cativa è ~2 2me +V =E ; che a¤rontiamo ancora per separazione di variabili, dopo averla riscritta in coordinate sferiche. Utilizzando le notazioni introdotte nello studio del laplaciano in coordinate sferiche (§ 8.4.1, le conclusioni di quella discussione ci saranno utili), conviene porre, in coordinate sferiche 8 < x = sin # cos ' y = sin # sin ' : z = cos #; così che l’equazione diventa ~2 2m @ 2 u 2 @u 1 + + 2 @ 2 @ (#;') +V ( ) =E e cercando ( ; '; #) = R ( ) Y ('; #) si ha 2 3 8 In e R00 + 2 R0 + 2m ~2 R 2 (V ( ) E) R altre parole, k = 1=4 "0 è la costante di Coulomb. 276 ( )= (#;') Y Y ('; #) da cui ogni membro è costante, uguale a (#;') Y . L’equazione in Y; ('; #) = Y ('; #) è la stessa che abbiamo incontrato risolvendo per separazione di variabili il laplaciano in coordinate sferiche, quindi possiamo trarre le stesse conclusioni. Si avrà39 = l (l + 1) , per l = 0; 1; 2::: Y ('; #) = fYl;m ('; #)gl=0;:::;1 m=0;:::;l Yl;0 ('; #) = Pl (cos #) Yl;m ('; #) = Plm (cos #) (a cos m' + b sin m') cioè la parte angolare della soluzione è costituita dalle armoniche sferiche. Consideriamo ora l’equazione radiale: 2 R00 + 2 R0 + 2me ~2 2 e2 + E R = l (l + 1) R, per 4 "0 > 0: Per sempli…carla si fanno vari passi, che qui mostriamo schematicamente. I calcoli dettagliati si trovano in fondo al paragrafo. 1. Eseguiamo anzitutto il cambio di variabili u( ) = R( ) che trasforma l’equazione in u00 ( ) = l (l + 1) e2 +E 4 "0 2me ~2 2 u: 2. Quindi si de…niscono le costanti 2 e2 4 "0 ~ 4 "0 ~2 a0 = = raggio di Bohr me e2 E W = Eh Eh = me e si esegue la sostituzione sulla variabile indipendente: y= a0 3 9 Per adeguarci alle notazioni standard sull’argomento cambiamo le lettere con cui denotavamo gli indici interi. 277 Questo dà: 1 00 u (y) + 2 1 l (l + 1) 2 y2 1 y u (y) = W u (y) : 3. Ora bisogna distinguere il segno di W . Nel seguito trattiamo solo il caso W < 0; che dà soluzioni L2 . Supponendo W < 0; de…niamo p =2 2W e riscaliamo la soluzione, ponendo x = y: Si trova: d2 u l (l + 1) 2 1 (x) + + u (x) = 0: 2 2 dx x x 4 4. Ora si vuole fare una sostituzione opportuna che trasformi l’equazione in una integrabile. Si ragiona così. Per x ! 1 l’equazione è approssimata da d2 u (x) dx2 1 u (x) = 0; 4 la cui soluzione esatta è u (x) = c1 e x=2 + c2 ex=2 ; di cui la soluzione accettabile è u (x) = c1 e x=2 : Per x ! 0 l’equazione è approssimata da l (l + 1) d2 u (x) u (x) = 0; 2 dx x2 equazione di Eulero, il cui integrale generale è u (x) = c1 xl+1 + c2 x l ; di cui la soluzione accettabile è u (x) = c1 xl+1 : Si fa allora una sostituzione suggerita da queste due soluzioni approssimate per x piccolo e x grande: u (x) = xl+1 e x=2 f (x) : Con ciò l’equazione diventa xf 00 + (2l + 2 x) f 0 + ( l 1) f = 0 con =p 1 : 2W 5. Quest’equazione assomiglia all’equazione di Laguerre: xy 00 + (1 x) y 0 + y = 0 per x 2 (0; +1) ; è in e¤etti un’equazione di Laguerre associata. Apriamo una parentesi. 278 6.10.1 Equazione e polinomi di Laguerre associati Sappiamo che l’equazione di Laguerre xy 00 + (1 x) y 0 + y = 0 per x 2 (0; +1) si può riscrivere nella forma xe x 0 0 y + e x y = 0 per x 2 (0; +1) : E’un problema di Sturm-Liouville singolare, che ha come autovalori = k (k + 1) e autofunzioni, L2 ((0; +1) ; e x dx) i polinomi di Laguerre Lk (x). Si dice equazione di Laguerre associata l’equazione (per qualche > 0) xy 00 + ( + 1 x) y 0 + y = 0 per x 2 (0; +1) che si può riscrivere nella forma x +1 e x 0 0 y + x e x y = 0 per x 2 (0; +1) : E’un problema di Sturm-Liouville singolare, le autofunzioni sono ortogonali in L2 ((0; +1) ; x e x dx) : Si dimostra il seguente: Teorema 6.26 Gli autovalori dell’equazione di Laguerre associata sono gli stessi che per l’equazione di Laguerre, = n con n = 0; 1; 2; ::: Per ogni n, se Ln (x) è il polinomio di Laguerre che soddisfa l’equazione xy 00 + (1 x) y 0 + ny = 0 per x 2 (0; +1) ; allora ex dn x n! dxn soddisfa l’equazione di Laguerre associata L(n ) (x) = xy 00 + ( + 1 x +n e x x) y 0 + ny = 0 per x 2 (0; +1) . ( ) Le funzioni Ln (x) sono polinomi diogrado n, detti polinomi di Legendre asson 1 ( ) ciati, e per ogni il sistema Ln (x) costituisce un s.o.n.c. in L2 ((0; +1) ; x e n=0 Inoltre, per ogni n = 1; 2; 3::: il polinomio in (0; +1). ( ) Ln (x) ha esattamente n zeri distinti ( ) Nel seguito ci serviranno i polinomi di Legendre associati Ln (x) con intero dispari; facciamo perciò qualche esempio di questo tipo. n o1 ( ) Esempio 6.27 I primi polinomi Ln (x) sono n=0 L(n ) (x) = x ex dn x n! dxn 279 +n e x x dx). cioè: ( ) L0 (x) = x ex x e x =1 ex d ( ) L1 (x) = x +1 e x = x + a + 1 1 dx x ex d2 1 2 ( ) L2 (x) = x +2 e x = x 2x (2 + ) + 2 + 3 + 2 2 dx2 2 x ex d3 x3 ( + 3) x2 ( + 2) ( + 3) x ( + 1) ( + 2) ( + 3) ( ) +3 x L3 (x) = x e = + + 3 2 dx 6 2 2 6 x Ad esempio, per =1 (1) L0 (x) = 1 (1) L1 (x) = x+2 1 2 x 3x + 3 2 x3 (1) L3 (x) = + 2x2 6x + 4 6 5 3 x4 (1) L4 (x) = x + 5x2 10x + 5 24 6 (1) L2 (x) = Per =3 (3) L0 (x) = 1 (3) L1 (x) = 4 (3) L2 (x) = (3) L3 (x) = x 2 x 2 5x + 10 3 x + 3x2 6 280 15x + 20 6. Tiriamo allora le conclusioni sull’equazione radiale che proviene dall’equazione di Schrödinger per l’elettrone dell’atomo di idrogeno. L’equazione xf 00 + (2l + 2 x) f 0 + ( l è un’equazione di Laguerre associata con ( l =p 1) f = 0 con 1 2W = 2l + 1; ha autovalori 1) = k e autofunzioni (2l+1) Lk (x) = x2l+1 ex dk x k! dxk (2l+1)+k e x La prima relazione signi…ca che =p W = 1 =l+1+k 2W 1 2 2 (l + k + 1) E = W Eh = 1 2 me 2 (l + k + 1) e2 4 "0 ~ 2 : Invece di usare come indici interi l; k = 0; 1; 2; :::: è comodo, per sempli…care certe formule, porre ora n = l + 1 + k; quindi ora i due indici che usiamo sono l = 0; 1; 2; :::: n = l + 1; l + 2; :::: 281 o viceversa n = 1; 2; 3; ::: l = 0; 1; :::; n 1: Con queste notazioni i livelli energetici possibili sono: 2 e2 4 "0 ~ 1 me 2n2 En = Il livello minimo è 2 1 e2 me : 2 4 "0 ~ Per scrivere le soluzioni radiali ora procediamo a ritroso; poiché E1 = u( ) = R( ) y= a0 4 "0 ~ 2 a0 = me e2 x= y p =2 2W u (x) = xl+1 e f (x) = x=2 (2l+1) Ln l 1 f (x) (x) si ha: R( ) = u( ) u (x) = xl+1 e x= y= Rn;l ( ) = x=2 (2l+1) l 1 Ln (x) p =2 2W a0 a0 l 2 na0 e na0 (2l+1) l 1 Ln con n = 1; 2; 3; :::; l = 0; 1; :::; n = 2 na0 2 na0 1 2 a0 = 4 "0 ~ : me e2 In…ne, funzioni d’onda stazionarie sono ( ; '; #) = Rn;l ( ) Pl (cos #) m n;l;m ( ; '; #) = Rn;l ( ) Pl (cos #) cos (m') m n;l;m ( ; '; #) = Rn;l ( ) Pl (cos #) sin (m') con n = 1; 2; 3; :::; l = 0; 1; :::; n 1; m = 0; 1; 2; :::; l n;l;0 che vanno poi normalizzate. 282 6.10.2 Orbitali atomici Le funzioni d’onda che abbiamo scritto si dicono orbitali atomici. Ricordiamo che l’integrale del loro modulo al quadrato su una regione dello spazio rappresenta la probabilità che l’elettrone si trovi in quella regione dello spazio. Gli indici b; l; m hanno il seguente signi…cato …sico. Il numero n si dice numero quantico principale. De…nisce l’energia dell’elettrone, che vale 2 e2 1 m : En = e 2n2 4 "0 ~ Il numero l si dice p numero quantico del momento angolare, e il momento angolare orbitale vale l (l + 1)~, in particolare è nullo se l = 0, e in questo caso la funzione d’onda ha simmetria radiale (è indipendente da #; '). Il numero m si dice numero quantico magnetico. Gli orbitali vengono indicati con il primo numero quantico seguito da una lettera che indica il secondo numero quantico, secondo lo schema: l= 0 s 1 p 2 d 3 f 4 g 5 h ::: ::: Ad esempio orbitale 2p signi…ca che n = 2 e l = 1: Esaminiamo prima il signi…cato della componente radiale degli orbitali. Esempio 6.28 Scriviamo esplicitamente le prime funzioni radiali. R1;0 ( ) = e a0 R2;0 ( ) = e 2a0 R2;1 ( ) = R3;0 ( ) = e 2 a0 (1) L0 a0 3a0 R3;1 ( ) = 2 3a0 R3;2 ( ) = 2 3a0 =e (1) L1 =e a0 e 2a0 (1) L2 e 2a0 (3) L0 2 3a0 3a0 =e (3) L1 3a0 = a0 2 e a0 (5) L0 a0 a0 1 2 3a0 2 3a0 2 3a0 e = = +2 2a0 2 2 3a0 2 3a0 2 3a0 2 3a0 3 e 3a0 4 ! +3 2 3a0 2 e 3a0 La densità di probabilità che l’elettrone si trovi a distanza dal nucleo (in2 dipendentemente dalla direzione) è proporzionale a 2 Rn;l ( ) . Perciò può essere signi…cativo visualizzare i gra…ci di queste funzioni. Rappresentiamole, 283 ponendo per semplicità a0 = 1 2 2 e 2 2 e 2 4 e 2 2 e 2 R1;0 ( ) = 2 R2;0 ( ) = 2 R2;1 ( ) = 2 R3;0 ( ) = 2 2 R3;1 ( ) = 2 R3;2 ( ) = 4 9 2 + 2) 2 3 e 2 2 9 2 3 4 2 3 2 ( 4 4 6 2 e 2 +3 2 3 2 2 3 Gra…co della densità di probabilità di trovare l’elettrone a distanza nucleo nei primi orbitali: 1s 3s 2s dal 2p 3p 3d Esaminiamo ora il signi…cato della componente angolare degli orbitali. Esempio 6.29 Scriviamo esplicitamente le prime funzioni angolari. Si tratta in realtà delle armoniche sferiche che già conosciamo. Per n = 1, cioè l’orbitale 1s, la funzione angolare è costante: funzione d’onda a simmetria sferica. Per n = 2 si può avere: l = 0; m = 0 (orbitale 2s), che ha ancora funzione angolare costante, oppure 284 l = 1; m = 0; l = 1; m = 1 (orbitali 2p): r 3 cos # 2 r 3 P11 (cos #) cos ' = sin # cos ' 2 r 3 P11 (cos #) sin ' = sin # sin ' 2 P1 (cos #) = (quindi gli orbitali 2p sono di tre tipi). Gli orbitali 2p sono perciò i più semplici ad avere una parte angolare signi…cativa. Il quadrato di questa funzione è proporzionale alla densità di probabilità di trovare l’elettrone (non importa a quale distanza dal nucleo ma) nella direzione individuata dagli angoli (#; '). Una visualizzazione di una funzione f (#; ') può essere ottenuta con un diagramma sferico, che cioè rappresenta la super…cie = f (#; ') ; ossia la super…cie di equazioni parametriche 8 < x = f (#; ') sin # cos ' y = f (#; ') sin # sin ' : z = f (#; ') cos #: Si tratta di un concetto analogo a quello di curva in forma polare nel piano. La super…cie visualizza la funzione nel senso che i punti della super…cie più o meno lontani dall’origine rappresentano le direzioni in cui la funzione è maggiore o minore. I diagrammi sferici degli orbitali 2p sono perciò: (e simili gli altri due, orientati ciascuno secondo un asse). Per n = 3 si può avere: 285 l = 0; m = 0 (orbitale 3s), che ha ancora funzione angolare costante, oppure l = 1; m = 0; m = 1 (orbitali 3p); l = 2; m = 0; m = 1; m = 2 (orbitali 3d): r 1 5 P2 (cos #) = 3 cos2 # 1 2 2 r 5 1 P2 (cos #) cos ' = 3 cos # sin # cos ' 2 r 5 P21 (cos #) sin ' = 3 cos # sin # sin ' 2 r 5 sin2 # cos 2' P22 (cos #) cos 2' = 3 2 r 3 2 P2 (cos #) sin 2' = sin2 # sin 2' 2 I gra…ci sferici degli orbitali 3d sono i seguenti e gli altri 3 sono simili al secondo, diversamente orientati. 286 Orbitali f si hanno ad esempio per n = 4; l = 3; m = 0; 1; 2; 3: r 7 3 5 0 P3 (cos #) = cos # + cos3 # 2 2 2 r 7 3 15 P31 (cos #) cos ' = sin # + cos2 # cos ' 2 2 2 r 7 3 15 P31 (cos #) sin ' = sin # + cos2 # sin ' 2 2 2 r 7 2 P3 (cos #) cos 2' = 15 sin2 # cos # cos 2' 2 r 7 2 P3 (cos #) sin 2' = 15 sin2 # cos # sin 2' 2 r 7 3 P3 (cos #) cos 3' = 15 sin3 # cos 3' 2 r 7 3 P3 (cos #) sin 3' = 15 sin3 # sin 3' 2 Il gra…co sferico della prima di queste funzioni è il seguente Di seguito raccogliamo le espressioni esplicite dei primi orbitali, comprensive 287 della corretta costante di normalizzazione. 6.10.3 Soluzioni dell’equazione di Schrödinger Ricordiamo anche che le soluzione a variabili separate dell’equazione di Schrödinger si ottengono moltiplicando le precedenti per il fattore e i E}n t con En energia corrispondente al livello n corrispondente. Ad esempio, la soluzione dell’equazione di Schrödinger a variabili separate corrispondente al livello energetico minimo n = 1 è (trascurando la costante di normalizzazione): i (t; ; '; #) = e 2~ 6.10.4 me e2 4 "0 ~ 2 t e a0 : Calcoli dettagliati per la risoluzione dell’equazione radiale Riportiamo i passaggi di calcolo che giusti…cano le conclusioni citate in precedenza nella deduzione delle soluzioni dell’equazione radiale. 288 Passo 1. Calcoli: R( ) = R0 = R00 = u( ) u0 ( ) u( ) 2 00 2u0 ( ) u ( ) 2 + 2u ( ) 3 che sostituendo danno u00 ( ) 2 2u0 ( ) 2 + 2me ~2 2 u00 ( ) + 2u ( ) +2 3 u0 ( ) u( ) 2 2 e u( ) u( ) +E = l (l + 1) 4 "0 u( ) 2u ( ) 2u0 ( ) + + 2u0 ( ) 2 e2 u( ) + E u ( ) = l (l + 1) 4 "0 2m e2 u( ) e + E u ( ) = l (l + 1) 2 : u00 ( ) + 2 ~ 4 "0 + 2me ~2 u00 ( ) = l (l + 1) 2 2me ~2 e2 +E 4 "0 u: Passo 2. Calcoli: u00 ( ) = l (l + 1) u00 ( ) = l (l + 1) 00 u ( )= 00 u ( )= 2 2 l (l + 1) 2 l (l + 1) 2 2me e2 +E u ~2 4 "0 2 me e2 2me E u 2 4 "0 ~ ~2 2 1 a0 2 1 a0 2 2 289 e2 4 "0 ~ me e2 4 "0 ~ 2 2 1 2 W u a0 a20 du du dy du 1 ( )= (a0 y) = (a0 y) d dy d dy a0 d2 u d2 u 1 ( ) = 2 (a0 y) 2 d 2 dy a0 u00 ( ) = l (l + 1) 2me me ~2 2 W 2 W ! u ! u 1 00 u (a0 y) = a20 l (l + 1) 2 1 2 W a0 a20 a20 l (l + 1) 2a0 2W 2 2 u00 (a0 y) = l (l + 1) 2 y2 y 1 l (l + 1) 2 y2 u00 (a0 y) = 1 00 u (a0 y) = 2 1 00 u e (y) + 2 1 l (l + 1) 2 y2 1 y d = dy d dx Passo 3. Calcoli: 2W 2 y u (a0 y) u (a0 y) u (a0 y) 2W u (a0 y) u e (y) = W u e (y) : 1 l (l + 1) 1 1 00 u (y) + u (y) = W u (y) 2 2 y2 y 1 2 d2 u 1 2 l (l + 1) (x) + u (x) = W u (x) 2 dx2 2 y2 y d2 u l (l + 1) 2 2W (x) + + u (x) = u (x) 2 dx2 x2 x d2 u l (l + 1) 2 1 u (x) = 0 (x) + + dx2 x2 x 4 Passo 4. Calcoli: u (x) = xl+1 e x=2 f (x) x=2 xl+1 f 0 + (l + 1) xl f u00 (x) = e x=2 xl+1 f 00 + 2 (l + 1) xl f 0 + (l + 1) lxl 1 (l + 1) xl f 2 d2 u (x) + dx2 e x=2 1 l+1 x f 2 u0 (x) = e xl+1 f 00 + 2 (l + 1) xl 1 2 1 4 290 1 l+1 0 x f 2 u (x) = 0 1 (l + 1) xl + xl+1 f 4 l (l + 1) 2 1 + xl+1 e x=2 f (x) = 0 x2 x 4 xl+1 f 0 + (l + 1) lxl + f 1 l+1 x f 2 xl+1 f 0 + (l + 1) xl f l (l + 1) 2 + x2 x 1 1 xl + 1 x2 f 00 + 2 (l + 1) x x2 f 0 + [(l + 1) l l (l + 1) 2 + x2 x x2 f x2 f 00 + 2 (l + 1) x + (l + 1) l =0 x2 f 0 1 (l + 1) x + x2 4 x2 f 00 + 2 (l + 1) x xf 00 + (2l + 2 1 4 1 (l + 1) x + x2 4 l (l + 1) + x2 f 0 + x) f 0 + ma =2 p 2 (l + 1) x + l 2W ; 2x 2x 1 2 x f =0 4 f =0 1 f =0 =p 1 2 = 2W perciò xf 00 + (2l + 2 x) f 0 + ( 291 l 1) f = 0: Bibliogra…a [BN] A. Boggess, F. J. Narcowich: A First Course in Wavelets with Fourier Analysis. Jouhn Wiley & Sons, 2009. [B] Bramanti: Dispensa del corso di Metodi matematici per l’ingegneria, a.a. 2013/2104. [EsAn2] Bramanti: Esercitazioni di Analisi 2. Esculapio. 2012. [B3] Bramanti: Esercitazioni di Analisi 3. Cusl, 2001. [An2] Bramanti, Pagani, Salsa: Analisi matematica 2. Zanichelli, 2009. [F] Farlow. Partial Di¤erential Equations for scientists and engineers. Dover, 1993. [Fo] Folland: Real Analysis. Modern applications and techniques. Wiley, 1984. [HN] J. H. Hunter, B. Nachtergaele: Applied Analysis. World Scienti…c, 2001. [OY] R. Onyshczak, A.Youssef: Fingerprint Image Compression and the Wavelet Scalar Quantization Speci…cation, Chap. 19 in N. Ratha, R. Bolle, Editors: Automatic Fingerprint Recognition System, Springer 2004. [PS2]. Pagani, Salsa. Analisi Matematica 2. Masson 1993. [Pe] Persico. Introduzione alla …sica matematica. Zanichelli. [Saxe] Saxe. Beginning functional analysis. Springer 2010 [SVZZ] Salsa, Vegni, Zaretti, Zunino: Invito alle equazioni a derivate parziali. Springer 2009. [W] Weinberger: A …rst course in PDEs. Dover, 1965. 292
Documenti analoghi
l`equazione di schrӧdinger
Si definisca ora “ potenziale del vettore velocità v” la funzione
Ф = v ( v è ovviamente un
vettore benché ciò non venga evidenziato con apposito simbolo di sovrasegnatura per
semplicità grafica).
...