il dilemma del prigioniero

Transcript

il dilemma del prigioniero
IL DILEMMA DEL PRIGIONIERO
Il dilemma del prigioniero viene utilizzato nella teoria dei giochi ed illustra una differenza fondamentale,
quella tra equilibrio di Nash e ottimo paretiano. Considerato un gioco con n giocatori le due definizioni sono
le seguenti.
EQUILIBRIO DI NASH
Il gioco si trova all’ equilibrio di Nash quando tutti gli attori perseguono la propria politica ottima
indipendentemente da quello che faranno gli altri. La condizione di equilibrio si raggiunge quando se uno
dei giocatori singolarmente decide di cambiare la propria posizione e gli atri restano fermi questo va a suo
discapito.
OTTIMO PARIETIANO
Un gioco è in una situazione di ottimo paretano quando non è possibile per uno dei partecipanti incrementare
il proprio profitto se non a discapito di uno o più degli altri.
Il dilemma del prigioniero è un esempio di come i due concetti non sempre coincidano.
Formulazione
A e B sono due prigionieri in celle non comunicanti. Possono tacere o confessare. Occorre tenere presente
che
Se uno confessa e l’ altro no colui che confessa è libero e l’ altro si fa 7 anni.
Se entrambi confessano ognuno si fa 6 anni.
Se nessuno confessa entrambi fanno 1 anno.
Abbiamo allora 4 possibili strategie. In tabella mettiamo gli anni di galera con il segno negativo .
Scelta di A
Confessa (c)
Confessa (c)
Non confessa (n)
Non confessa (n)
Scelta di B
Confessa (c)
Non confessa (n)
Confessa (c)
Non confessa (n)
Pena di A
-6
0
-7
-1
Esaminiamo le varie strategie con una tabella
Pena di B
-6
-7
0
-1
In essa le possibili strategie sono evidenziate in giallo. Sotto di esse sono indicati i 3 casi, quello nel quale il
prigioniero A cambia strategia, quello in cui B cambia strategia e quello in cui i sue cambiano entrambi
strategia.
scelta A scelta B
C
C
A CAMBIA
B CAMBIA
A e B CAMBIANO
C
N
A CAMBIA
B CAMBIA
A e B CAMBIANO
N
C
A CAMBIA
B CAMBIA
A e B CAMBIANO
N
N
A CAMBIA
B CAMBIA
A e B CAMBIANO
pena A
pena B
6
7
0
1
0
1
6
7
7
6
1
0
1
0
7
6
6
0
7
1
7
1
6
0
0
6
1
7
1
7
0
6
I guadagni rispetto alla strategia di riferimento sono evidenziati in verde mentre le perdite sono evidenziate
in verde. Si vede subito che le strategie (C,N) , (N,C) e (N,N) sono degli ottimi paretani. Infatti non è
possibile fare una variazione senza causare una perdita ad uno dei prigionieri (cioè senza colorare almeno un
numero di rosso). La strategia (C,C) non è un ottimo paretano dal momento che cambiando entrambi
strategie i due prigionieri ci guadagnerebbero entrambi. Tuttavia (C,C) rappresenta l’ equilibrio di Nash.
Infatti in tale situazione entrambi dei prigionieri persegue la strategie che gli può portare un maggior
vantaggio ovvero essere liberati. In questa ipotesi nessuno dei due ha interesse a discostarsi da questa
strategia dal momento che ciò comporterebbe un anno di carcere aggiuntivo.
In generale quando un equilibrio di Nash non coincide con un ottimo paretano significa che vi sono delle
cattive gestione delle risorse.
L’ ALLOCAZIONE DELLE RISORSE
L’ allocazione delle risorse è un problema di programmazione lineare (PPL) che si risolve con l’ algoritmo
del simplesso (disponibile nel componente aggiuntivo risolutore di excel). Facciamo conto di dovere
produrre 3 oggetti destinati alla vendita che chiamiamo a,b e c. Il tre oggetti sono venduti rispettivamente a 1
euro, 2 euro e 3 euro al pezzo. I tre pezzi richiedono la lavorazione su 3 macchinari M A MB MC . Ogni pezzo
richiede su ciascun macchinario il tempo di lavorazione riportato nella tabella (in minuti).
pezzo MA min. MB min. MC min.
a
5
3
4
b
6
5
1
c
3
3
4
In totale ogni macchinario lavora 600 minuti al giorno
Nel problema di allocazione delle risorse si definiscono
massimizzare è il ricavato dalla vendita cioè in questo caso
i pezzi prodotti. Ciò che si vuole
I vincoli sono dai tempi di lavorazione. Il tempo totale per produrre i vari pezzi non può superare i 600
minuti.
Quindi
La soluzione ottima data è la seguente
Come si vede non risulta conveniente produrre il pezzo a. I macchinari MA e Mc sono sfruttati per tutto il loro
tempo mentre il macchinario MB solo per 571 minuti. Supponiamo che il vincolo dei 600 minuti sia
tassativo e che quindi le due soluzioni vadano approssimate all’ estremo inferiore. In sostanza la politica
ottima è produrre 28 pezzi b e 142 pezzi pezzi b che venduti danno 485 euro. Per inquadrare il problema all’
interno della teoria dei giochi supponiamo che i 3 macchinari appartengano a 3 fratelli Aldo,Bruno e Carlo
rispettivamente e che a loro spetti il ricavato della vendita di pezzi a,b e c rispettivamente. Quello trovato è
un ottimo paretiano. Se uno dei tre fratelli cambiasse politica, per esempio Aldo volesse utilizzare il suo
macchinario MA per produrre anche pezzi a guadagnerebbe dalla vendita ma nel complesso diminuirebbe il
ricavato totale della vendita dei pezzi inquanto ci si troverebbe in una situazione sub ottima. Arrivando meno
denaro in famiglia e con Aldo che ci guadagna è evidente che o Bruno o Carlo oppure entrambi
peggiorerebbero la loro condizione. L’ equilibrio di Nash invece si raggiunge quando ciascuno dei 3 fratelli
pensa a produrre quanti più pezzi possibili senza preoccuparsi degli altri. Per trovare il numero dei pezzi
basta dividere i 600 minuti per il tempo di lavorazione maggiore del singolo pezzo.
Quindi Aldo può produrre 600/5=120 pezzi a , Bruno 600/5=120 pezzi b e Carlo 600/4=150 pezzi c.
L’ equilibrio di Nash è irrealizzabile in questo caso. Con 120 pezzi da produrre Aldo terrebbe impegnata da
solo la propria macchina e così lo stesso per Bruno e Carlo. In pratica ognuno produrrebbe il numero
massimo di semilavorati con la propria macchina ma non potrebbe rifinirli con le altre 2 macchine.
IL DILEMMA DEL PRIGIONIERO E LA GUERRA FREDDA
Il dilemma del prigioniero trova analogie con quanto succedeva al tempo della guerra fredda. In questo caso i
due prigionieri erano le due superpotenze USA e URSS. Le due superpotenze perseguivano entrambe la
massima espansione della propria zona di influenza e ciò a prezzo di forti investimenti in armamenti. La
situazione alla quale si pervenne fu un equilibrio di Nash inquanto nessuna delle due parti in causa poteva
cambiare la propria posizione, giungendo ad un disarmo unilaterale, senza restringere la propria zona di
influenza. L’ ottimo paretiano invece coincideva con il disarmo bilaterale. In questa situazione ognuno
avrebbe mantenuto le proprie posizioni senza spese in armamenti ma un eventuale cambio di posizione da
parte di una delle due parti in causa sarebbe andata a discapito dell’ altra.