Sintesi - Dipartimento di Matematica

Transcript

Sintesi - Dipartimento di Matematica
Università degli Studi Roma Tre
Facoltà di Scienze Matematiche Fisiche e Naturali
Sintesi
Modelli statistici multivariati per la selezione
di un portafoglio azionario
Candidata
Elena Turetta
Relatrice
Prof.ssa Alessia Naccarato
matricola: 277651
Anno Accademico 2011/2012
MSC AMS: 62M10
keywords: Serie storiche, modelli autoregressivi vettoriali, LR-Test
1
Sintesi
La tesi si occupa di confrontare due modelli statistici per l’analisi delle serie
storiche al fine di individuare il modello migliore per prevedere l’andamento
di titoli azionari, ovvero effettuare la selezione di un portafoglio azionario.
Nell’ambito dell’analisi delle serie storiche si distinguono due tipi fondamentali di approccio volti alla creazione di un modello per queste serie:
l’approccio classico e l’approccio moderno.
L’approccio classico si basa su un’analisi di tipo descrittivo e considera
la serie storica come una composizione di una componente deterministica e
di una componente residuale di minore interesse.
L’impostazione moderna, la cui nascita può essere fatta risalire agli anni
che vanno dalla metà degli anni venti del secolo scorso fino alla fine della
seconda guerra mondiale, si basa sull’assunzione che esista un determinato
processo casuale generatore dei dati. Tale processo è detto processo stocastico. Il più semplice esempio di processo stocastico è apparso alcuni anni
prima, quando nel 1907 A. A. Markov introdusse la nozione di catena. Una
catena è un processo tale che, se si conosce la distribuzione di probabilità al
tempo presente, allora si conosce anche la distribuzione per il futuro, e tutto
il passato non ha alcun effetto su di esso.
Tuttavia i più grandi sviluppi per l’analisi delle serie storiche ci sono stati
Sintesi
2
solo negli anni ’20, ad opera dello statistico inglese George Udny Yule. Per la
precisione, nel 1921 Yule propose uno schema a media mobile, mentre nel
1927, in uno studio sulla periodicità delle macchie solari, introdusse per la
prima volta un modello innovativo oggi chiamato schema autoregressivo.
Nel 1931 il fisico e statistico inglese Gilbert Thomas Walker generalizzò lo
schema di Yule definendo un modello autoregressivo nella forma attualmente
usata e, sette anni più tardi, introdusse il modello ARMA, ovvero un processo che combinava insieme le caratteristiche del modello autoregressivo (Auto
Regressive model, AR) e quelle del modello a media mobile (Mobile Average
model, MA).
I processi stocastici di tipo autoregressivo negli anni successivi risultarono
fondamentali anche per l’analisi delle serie storiche multivariate. Il loro studio, infatti, può essere fatto risalire alla metà del secolo scorso, quando la
Cowles Commission, fondazione di ricerca econometrica, effettuò le prime
ricerche sistematiche sulla stima dei parametri di equazioni simultanee. Nel
1980 l’economista statunitense Christopher Albert Sims introdusse il modello
autoregressivo vettoriale (VAR) per lo studio simultaneo di più di una serie
storica.
I due modelli che prenderemo in considerazione nella tesi sono quelli di
tipo autoregressivo, nel caso univariato e nel caso multivariato. In particolare, nel nostro lavoro, considereremo cinque serie storiche appartenenti allo
stesso settore industriale, quello bancario, effettueremo un’opportuna trasformazione in modo tale da rendere i dati trattabili e metteremo a confronto
due casi: il caso in cui le cinque serie siano state generate da un modello di
tipo VAR e il caso in cui, invece, ogni serie sia stata generata da un modello
Sintesi
3
AR. Cercheremo di capire quale sia il caso più verosimile sulla base dei valori
ottenuti per le funzioni di log-verosimiglianza, in modo da riuscire a valutare
quale tipo di modello permette una migliore rappresentazione della realtà e
quindi la selezione di un portafoglio azionario maggiormente conveniente in
termini di rendimento.
Nel dettaglio la tesi è così strutturata.
Nel primo capitolo si presentano i concetti fondamentali da cui parte
il presente lavoro, come il processo stocastico univariato: se indichiamo
con Ω lo spazio campionario e con Z un insieme al più numerabile possiamo
definire un processo stocastico come un’applicazione y : Z × Ω −→ R tale
che per ogni t ∈ Z fissato, y(t, ω) è una variabile casuale.
Quando non sarà fondamentale indicare l’evento ω, denoteremo la variabile y(t, ω) semplicemente con yt .
Successivamente si introduce una proprietà fondamentale per lo studio
dei processi stocastici, cioè la stazionarietà in covarianza, detta anche
stazionarietà debole, definita nel modo seguente:
Definizione. Un processo stocastico {yt } è detto stazionario in covarianza se valgono le seguenti condizioni:
E(yt ) = µ
V ar(yt ) = σ 2
Cov(yt , yt−s ) = γ(s)
dove l’ultima condizione indica che la covarianza dipende dalla distanza fra
yt e yt−s ma non dal riferimento temporale t.
Sintesi
4
Al termine di questa prima parte, viene introdotto un tipo particolare
di processo stocastico, il processo white noise. Questo è il più semplice
processo stocastico che si può immaginare, infatti possiede momenti (almeno)
fino al secondo ordine costanti nel tempo.
Tuttavia si possono dare diverse definizioni di processo white noise, alcune più
deboli altre più restrittive; nel nostro lavoro abbiamo preso in considerazione
la seguente definizione:
Definizione. Un processo white noise {yt } è un processo stocastico in cui
le variabili casuali yt sono indipendenti e identicamente distribuite con media
nulla e varianza σ 2 , ovvero yt ∼ i.i.d.(0, σ 2 ).
Notiamo che le variabili che costituiscono tale processo non solo risultano
essere incorrelate, ma anche indipendenti. Un processo white noise particolare, che useremo nei prossimi capitoli di questa tesi, è il white noise
gaussiano, definito come:
Definizione. Un processo white noise gaussiano {yt } è un processo white
noise in cui le variabili casuali yt sono indipendenti e identicamente distribuite come una normale di media 0 e varianza σ 2 , ovvero:
yt ∼ N (0, σ 2 )
I processi white noise sono sicuramente processi che godono di particolari
proprietà ma che, proprio per questo, il più delle volte, non possono essere
scelti come modello generatore delle osservazioni che si hanno a disposizione.
Abbiamo pertanto bisogno di un modello che meglio si adatti a questo scopo.
Nella seconda parte del primo capitolo introduciamo, quindi, il processo
autoregressivo, il cui nome deriva dal fatto che esso ha la forma di un
Sintesi
5
modello di regressione in cui le variabili esplicative sono i valori passati della
variabile dipendente. Il numero di valori passati presi in considerazione indica
l’ordine del modello.
Abbiamo inizialmente considerato i modelli autoregressivi più semplici,
ovvero quelli di ordine 1:
Definizione. Un processo stocastico si dice autoregressivo di ordine 1
(in breve AR(1)) se il valore assunto dalla variabile yt risulta legato al suo
stesso valore al tempo precedente dalla relazione lineare:
yt = φyt−1 + ut
dove il parametro φ costituisce il coefficiente di regressione lineare e il white
noise ut rappresenta il termine di errore.
A seconda del valore assunto da φ si distinguono tre casi:
• φ = 1 il processo è random walk;
• |φ| > 1 il processo è esplosivo;
• |φ| < 1 il processo è stazionario.
Un altro modo di verificare la stazionarietà del processo è quello di analizzare le soluzioni dell’equazione caratteristica.
φ(z) = 0 con z ∈ C
dove φ(L) = (1 − φL) con L operatore di ritardo che verifica
Lyt = yt−1
Sintesi
6
Se la soluzione dell’equazione caratteristica risulta avere modulo maggiore
di uno il processo è stazionario.
Successivamente estendiamo questo concetto al caso più generale in cui
l’ordine del modello sia un generico p ≥ 1.
Definizione. Un processo stocastico si dice autoregressivo di ordine p
(in breve AR(p)) se il valore assunto dalla variabile yt risulta legato ai suoi
stessi valori passati dalla relazione lineare:
yt = φ1 yt−1 + φ2 yt−2 + · · · + φp yt−p + ut
dove i parametri φ1 , φ2 , . . . , φp costituiscono i coefficienti di regressione lineare e il termine di errore ut è white noise.
In questo caso φ(L) = 1 −
Pp
i=1
φi Li .
Nella pratica per poter utilizzare tali processi per descrivere le serie
storiche che si hanno a disposizione si ha la necessità di stimare i parametri.
Il capitolo si chiude, infatti, con una trattazione sulla stima utilizzata nei
capitoli successivi della tesi, quella di Massima Verosimiglianza.
Sotto l’ipotesi che ut non solo è white noise, ma white noise gaussiano, si
ha che anche yt , in quanto esprimibile come combinazione lineare degli ut , è
normalmente distribuito.
La funzione di log-verosimiglianza ha, nel caso di ordine 1, la seguente forma
T
1 X
T −1
2
ln(2πσ ) − 2
(yt − φyt−1 )2
ln l(θ, σ ) = −
2
2σ t=2
2
mentre nel caso di ordine p è
ln l(θ, σ 2 ) = −
T
T −p
1 X
ln(2πσ 2 ) − 2
(yt − φ1 yt−1 − . . . − φp yt−p )2
2
2σ t=p+1
Sintesi
7
Il secondo capitolo è dedicato alla descrizione dei processi autoregressivi
di tipo multivariato, ed in particolare ai processi VAR.
Definizione. Un processo stocastico multivariato di dimensione K è
un’applicazione y : Z × Ω −→ RK tale che per ogni t ∈ Z fissato, con
Z insieme al più numerabile, y(t, ω) è una variabile casuale multivariata,
denotata spesso con yt .
Come nel caso univariato, anche in più dimensioni il processo stocastico
più “semplice” è quello white noise
Definizione. Un processo stocastico multivariato {yt } si dice white noise
se valgono le seguenti condizioni
E(yt ) = 0
E(yt yt0 ) = Σy
E(yt , ys ) = 0 se s 6= t
con la matrice di covarianza Σy che si assume definita positiva.
Un particolare processo multivariato è il processo VAR (Vector AutoRegressive).
Definizione. Un processo autoregressivo vettoriale di ordine p è un
modello della forma:
yt = ν + A1 yt−1 + A2 yt−2 + · · · + Ap yt−p + ut
(1)
Sintesi
8
dove yt = (y1t , . . . , yKt )0 , ν = (ν1 , . . . , νK )0 è un vettore di K costanti, ut =
(u1t , . . . , uKt )0 è un vettore di K errori white noise, mentre



···
..
.
 α11,i

 .
Ai =  ..

α1K,i 
.. 

. 

αK1,i · · · αKK,i
i = 1, . . . , p

è una matrice K × K.
Un risultato che useremo più avanti nel nostro lavoro è il seguente:
Proposizione. Ogni processo VAR(p) può essere scritto in forma VAR(1),
precisamente nella forma
Yt = ν + AYt−1 + Ut
dove






Yt = 





yt





,




yt−1
..
.
(2)









ν=




ν 





Ut = 




ut 
yt−p+1
0
..
.




,




0
0
..
.









0
sono vettori di dimensione (Kp × 1) e


A1


IK



A=0

 .
 .
 .


0
A2 · · · Ap−1 Ap 

0
0
0

..
.
0
..
.
0
..
.
...
IK
0
IK
0

...









è una matrice di dimensione (Kp × Kp).
Concludiamo il capitolo definendo il concetto di stabilità per processi
VAR e dimostrando un importante risultato su questo argomento.
Sintesi
9
Definizione. Il processo VAR(p) della forma (2) si dice stabile se
det(IKp − Az) 6= 0
per |z| ≤ 1
il che equivale a dire che il processo VAR(p) in forma (1) è stabile se il suo
polinomio caratteristico non ha radici sul o nel cerchio unitario
det(IK − A1 z − · · · − Ap z p ) 6= 0
per |z| ≤ 1
Proposizione. Se un VAR(p) è stabile allora è stazionario in covarianza.
Nel terzo capitolo si illustra la procedura che ci consente di calcolare
l’ordine di ritardo temporale dei modelli che confronteremo. In particolare si
cercherà il valore ottimale di p, p̂, per evitare che, ad esempio, scegliendo un
valore troppo grande si abbia una perdita di precisione nella previsione del
modello.
La strategia che utilizzeremo sarà quella di effettuare una serie di test
d’ipotesi del rapporto di verosimiglianza.
Chiameremo M il limite superiore per p, ovvero l’ordine massimo che il
modello VAR potrà assumere. Considereremo la prima coppia di ipotesi:
(1)
- Ipotesi nulla: H0 : AM = 0
(1)
- Ipotesi alternativa: H1 : AM 6= 0
Se l’ipotesi nulla verrà rigettata l’ordine del modello sarà M , altrimenti si
procederà sottoponendo al test una nuova coppia di ipotesi:
(2)
- Ipotesi nulla: H0 : AM −1 = 0
(2)
- Ipotesi alternativa: H1 : AM −1 6= 0|AM = 0
Sintesi
10
se anche in questo caso l’ipotesi nulla non verrà rigettata si procederà ancora
nella stessa maniera, finchè dopo i − 1 volte che non avremo rigettato H0 le
ipotesi da sottoporre al test saranno
(i)
- Ipotesi nulla: H0 : AM −i+1 = 0
(i)
- Ipotesi alternativa: H1 : AM −i+1 6= 0|AM , AM −1 , . . . , AM −i+2 = 0
rigettando H0 avremo p̂ = M − i + 1.
Per poter effettuare i test descritti è necessario conoscere la forma della
statistica test, ovvero:
h
i
λLR = 2 ln l(β̃, Σ̃u ) − ln l(β̃ r , Σ̃ru )
dove β̃ e β̃ r sono rispettivamente lo stimatore di massima verosimiglianza
non vincolato e vincolato di β (β = vec(ν, A1 , . . . , Ap )) ed hanno la seguente
forma
β̃ =
(ZZ 0 )−1 Z ⊗ IK y
h
β̃ r = β̃ + (ZZ 0 )−1 ⊗ Σu C 0 C((ZZ 0 )−1 ⊗ Σu )C 0
i−1
(c − C β̃)
mentre Σ̃u e Σ̃ru rappresentano gli stimatori non vincolati e vincolati di
massima verosimiglianza di Σu ed hanno la seguente forma
1
(Y − B̃Z)(Y − B̃Z)0
T
1
=
(Y − B̃r Z)(Y − B̃r Z)0
T
Σ̃u =
Σ̃ru
Tale statistica test si distribuisce come una χ2 (K 2 ).
Proposizione. Sia yt un processo VAR(p) stabile e stazionario della forma (1) dove ut sono errori standard white noise. Supponiamo che il vettore β soddisfi la condizione Cβ = c, dove C è una matrice di dimensione
Sintesi
11
K 2 × (K 2 p + K) e c è un vettore di K 2 elementi. Sia inoltre ln l la funzione di log-verosimiglianza e siano β̃ r , Σ̃ru , β̃ e Σ̃u gli stimatori di massima
verosimiglianza vincolati e non vincolati. Allora
h
i
λLR = 2 ln l(β̃, Σ̃u ) − ln l(β̃ r , Σ̃ru )
h
= (C β̃ − c)0 C((ZZ 0 )−1 ⊗ Σ̃ru )C 0
i−1
(C β̃ − c) + op (1) −→ χ2 (K 2 )
Nel quarto capitolo effettuiamo una breve analisi descrittiva delle cinque
serie storiche, riportando dei grafici che evidenziano le differenze tra le distribuzioni prima e dopo la trasformazione in rendimenti (composti).
Le cinque serie storiche che prendiamo in considerazione appartengono
al settore bancario e rappresentano le quotazioni mensili di cinque banche
diverse riferite al periodo Gennaio 1986–Settembre 2011.
Rappresentiamo l’i-esima serie storica con la seguente notazione,
(i)
(i)
(i)
x(i) = x1 , x2 , . . . , x309
(i)
dove ogni xj rappresenta la media dei prezzi di chiusura giornalieri. I dati,
in questa forma, risultano, però, poco trattabili cioè multimodali e fortemente non normali il che è in contrasto con le ipotesi di base formulate per
il modello ed è per questo che si è deciso di trasformarli in rendimenti (composti). A tal proposito, per ciascuna delle cinque serie effettuiamo la seguente
trasformazione
(i)
(i)
(i)
(i)
(i)
(i)
x(i) = ln x2 − ln x1 , ln x3 − ln x2 , . . . , ln x309 − ln x308
Implementando la serie di test d’ipotesi descritti precedentemente otteniamo il valore ottimale di p, p̂ = 7 per cui i due modelli da confrontare, quello
Sintesi
12
di tipo AR e quello di tipo VAR, avranno la seguente forma
(i)
yt
(i) (i)
(i) (i)
(i)
= ν (i) + φ1 yt−1 + · · · + φ7 yt−7 + ut
i = 1, . . . , 5
y t = ν + A1 y t−1 + · · · + A7 y t−7 + ut
Una volta individuato tale ordine effettueremo una stima dei parametri. A
questo punto il calcolo e il confronto delle funzioni di log-verosimiglianza dei
modelli ci permetterà di concludere quale tra i modelli AR e VAR descrive
meglio il comportamento delle nostre serie bancarie.
Le seguenti tabelle riportano i valori dei parametri e il valore della funzione
di log-verosimiglianza.
0.0053867
0.0075506
0.0066209
0.0063405
x3
x4
x5
σ2
x2
0.0020317
x5
0.0068012
LLF
1.7708e-05
x4
x1
0.20592
-0.0014423
x3
342.3358
335.6655
315.4313
367.4357
331.5278
0.35729
0.23548
0.29708
-0.003248
x2
0.37554
-0.00015171
φ1
x1
ν
0.12406
0.13114
φ3
0.13776
0.22885
-0.059942
-0.16377
φ6
0.12623
-0.16687
-0.021188 -0.016049
0.049921
0.019856
φ5
0.10431
0.033649
0.038055
0.041428
φ7
-0.081976 -0.038851 -0.034484 -0.027068
-0.078635
0.073558
-0.010348
0.050062
φ4
Tabella 1: Valori stimati nel caso dei 5 modelli AR(7)
-0.09796
-0.16291
-0.025315 0.053637
-0.21207
-0.079305
φ2
Sintesi
13
Sintesi
14
Tabella 2: Valori stimati nel caso del modello VAR(7)
0.000395833
-0.00312015
ν
-0.000858416
0.00192807
0.00194054
A1
A2
A3
0.614278
-0.0851779
-0.0721112
0.0073981
-0.200967
0.186432
0.243289
-0.0700177
0.0429291
-0.123834
0.0873307
0.138337
0.177033
0.0684758
-0.133726
0.247847
0.0099275
-0.0190107
0.304067
-0.214199
0.18278
0.0736116
0.0203022
-4.68143e-05
-0.00722686
-0.0191388
0.0843629
-0.0283294
-0.000659178
-0.147572
0.0276587
-0.0934909
0.0570254
-0.00546372
-0.224966
0.134789
0.107646
-0.0366139
-0.121786
-0.0742529
0.0674165
0.0649167
-0.0150649
-0.160219
-0.125576
0.167514
0.0109627
-0.0224348
-0.0291275
-0.198641
-0.0501798
0.149682
-0.0557162
0.184879
0.011238
-0.0674269
0.063714
0.0391371
0.0679449
0.0522313
-0.20465
0.132526
-0.0803357
0.201772
0.207421
0.0355852
0.133002
-0.0107004
0.157187
-0.0535318
-0.114134
0.0241815
0.0640202
0.0761872
0.12367
0.158484
-0.0604769
0.129848
-0.0831839
-0.133475
0.106578
0.106578
0.098396
0.0147498
-0.0412226
(Continua alla pagina successiva)
Sintesi
15
(Continua dalla pagina precedente)
A4
A5
A6
A7
Q
0.267162
-0.174106
0.149667
-0.173233
-0.112127
0.0691904
-0.0208099
0.181985
-0.157153
-0.0966864
0.109923
-0.0977101
0.0752846
-0.0892131
-0.101648
-0.0906277
0.0555395
0.0178477
0.0173748
0.0565546
0.107603
0.0608365
0.103103
0.00510596
-0.0602882
-0.0481593
-0.0393406
0.0127687
0.0477575
0.036206
0.0965608
-0.0411729
-0.100269
0.115885
0.0208714
0.0471088
-0.0629082
0.00249251
-0.0903936
-0.0980787
-0.166349
-0.132504
-0.0708221
0.02875
-0.0504867
-0.207162
-0.0409101
-0.153396
-0.0517121
-0.1381
0.0833955
0.0258531
-0.0167927
-0.0903975
0.0203648
-0.0937762
0.0198083
-0.0524609
-0.234721
0.0245255
0.117333
-0.0180356
0.141258
0.138684
-0.00852041
0.129337
0.0994285
0.0865937
0.085119
0.0603089
0.0760828
0.00853164
-0.0462562
-0.0212234
-0.00872944
-0.097487
-0.0494136
0.0699073
0.0723712
-0.0676429
0.156709
0.116363
0.101426
0.163127
0.138119
-0.224723
-0.163361
-0.167686
-0.276921
-0.138718
0.00574716
0.00321374
0.00357571
0.00391564
0.00395106
0.00321374
0.00477057
0.002538
0.00274207
0.00276328
0.00357571
0.002538
0.00640171
0.00320729
0.00356003
0.00391564
0.00274207
0.00320729
0.00586841
0.00354615
0.00395106
0.00276328
0.00356003
0.00354615
0.00575294
(Continua alla pagina successiva)
Sintesi
16
(Continua dalla pagina precedente)
LLF
2.1661e+03
Tabella 2: Valori stimati nel caso del modello VAR(7)
Osservando i valori della funzione di log-verosimiglianza (LLF, log-likelihood function) notiamo che il modello VAR è quello in cui la funzione
di log-verosimiglianza assume valore maggiore, per cui deduciamo che tale
modello descrive meglio dei cinque processi AR il comportamente delle serie
storiche prese in considerazione.
Bibliografia
17
Bibliografia
[1] Adelchi Azzalini.
Inferenza Statistica, una presentazione basata sul
concetto di verosimiglianza. Springer, seconda edizione, 2000.
[2] Engle R.F. Bollerslev T. e Nelson D.B. ARCH model. Handbook of
Econometrics, IV:2959–3038, 1994.
[3] Giampiero M. Gallo e Barbara Pacini. Metodi quantitativi per i mercati
finanziari. Carocci editore, 2012 edizione, prima edizione 2002.
[4] Hamilton J.D. Time Series Analysis. Princeton University Press.
[5] Magnus J.R. e Neudecker H.
Matrix differential calculus with
applications in statistics and econometrics. 2001.
[6] Brown K. e Reilly F. Investment Analysis and Portfolio Management.
South-Western College Publishing, 2008.
[7] Helmut Lütkepohl.
Introduction to Multiple Time Series Analysis.
Springer-Verlag, 1993.
[8] Alexander M. Mood, Franklin A. Graybill, e Duane C. Boes.
Introduzione alla statistica. McGraw-Hill, 1991.
Bibliografia
18
[9] Brandt M.W., Goyal A., Santa-Clara P., e Stroud H.R. A simulation
approach to dynamic portfolio choice with an application to learning
about return predictability. The Review of Financial Studies, 18(3):831–
873, 2005.
[10] Domenico Piccolo. Analisi moderna delle serie storiche. In Atti del
Convegno nazionale Napoli, 19-22 maggio 1981. Franco Angeli Editore,
1983.
[11] Luciano Pieraccini. Fondamenti di inferenza statistica. Giappichelli, 2
edizione, 2007.
[12] Johansen S.
Likelihood-Based Inference in Cointegrated Vector
Autoregressive models. Oxford University Press, 1995.
[13] Christopher A Sims.
Macroeconomics and reality.
48(1):1–48, January 1980.
Econometrica,