05 miroiu 2007 b - dilema prizonierului (rac)

14
RATIONALITATE SI ACT/UNE COLECTIVA 19 nu detineau toate informatiile despre capacitatile militare sau economice ale adversarului. Vom discuta despre astfel de jocuri mai tarziu, dupa trasarea principalelor cadre conceptuale. (Sa ne aducem de asemenea amime, din primul volum al Fundamentelor politicii, sectiunea 9.1, ca uneori actorii accepta in mod intentionat sa nu posede informatii complete; ei sunt ignoranIi in mod rational.) locurile pot fi clasificate in funqie de masura in care scopllrile jUcCl- tori/or sunt opuse sau coincid (vezi Schelling: 2000; Lewis: 1969). In unele cazuri, scopurile coincid: eu eu tine dorim amandoi sa ne intalnim, iar faptul ca nu ne produce pierderi. In alte cazuri scopurile sunt total opuse. La un meci de fotbal de ealifieare, 0 singura eehipa se poate califica; la fel, dintre doi candidati la postul de primar sau de numai unul poate la un joe de pocher un jucator numai daca altul pierde. Aceste jocuri se numesc cu suma nuta: cand, de exemplu, avem doar doi jucatori, ceea ce un jucator este exact ceea ce pierde ceialait. De obicei insa scopurile jucatorilor nu sunt nici total opuse, nici total coincidente. Avem jocuri cu motive mixte. Aici suma nu mai este zero : e po sibil ca toti jucatorii sa sau toti sa piarda (iar pentru analiza, cum yom vedea, sunt foarte interesante jocurile in care toti jucatorii pierd, ar putea sa cu totii ! ). Chiar daca partidele la putere cele din opozitie au conflicte opuse, de obicei ele considera ca lipsa conflictelor sociale este benefica pentru toate; chiar daca un partid majoritatea in P'arlament poate forma guvernul, celalalt nu este total invins, fiindca el formeaza opozitia, care in regimurile democratice are un rol important in viata politica. Cum aleg juditorii ? Sa luam un exemplu. Sa presupunem ca in campania electoraUi 0 problema sociala devine prioritara (educatia, sanatatea, sustinerea agriculturii sau pro- teclia sociala, de exemplu). Simplificand de dragul exemplului, presupunem ca de felul in care cele doua part ide aflate in competitie se vor raporta la aceasta va depinde procentul voturilor pe care fiecare Ie va obtine in ale- geri. (Evident, cum am admis ca doar doua partide sunt III competitie, suma procentelor va fi intotdeauna - adica pentru orice disula a matricei de mai jos - egala cu 100.) Fiecare partid are la dispozitie trei strategii de actiune : sa propuna marirea bugetului pentru sustinerea politicilor in domeniul res- pectiv; sa propuna reducerea bugetului respectiv; sau sa propuna mentinerea statu-quo-ului. Matricea de mai jos descrie jocul nostru in forma Ilormala :

Upload: mertic-diana

Post on 24-Dec-2015

64 views

Category:

Documents


2 download

DESCRIPTION

Dilema Prizonierului

TRANSCRIPT

Page 1: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

RATIONALITATE SI ACT/UNE COLECTIVA 19

nu detineau toate informatiile despre capacitatile militare sau economice ale adversarului. Vom discuta despre astfel de jocuri mai tarziu, dupa trasarea principalelor cadre conceptuale. (Sa ne aducem de asemenea amime, din primul volum al Fundamentelor politicii, sectiunea 9.1, ca uneori actorii accepta in mod intentionat sa nu posede informatii complete; ei sunt ignoranIi in mod rational.)

locurile pot fi clasificate ~i in funqie de masura in care scopllrile jUcCl­

tori/or sunt opuse sau coincid (vezi Schelling: 2000; Lewis: 1969). In unele cazuri, scopurile coincid: eu ~i eu tine dorim amandoi sa ne intalnim, iar faptul ca nu reu~im ne produce pierderi. In alte cazuri scopurile sunt total opuse. La un meci de fotbal de ealifieare, 0 singura eehipa se poate califica; la fel, dintre doi candidati la postul de primar sau de pre~edinte, numai unul poate ca~tiga; la un joe de pocher un jucator ca~tiga numai daca altul pierde. Aceste jocuri se numesc cu suma nuta: cand, de exemplu, avem doar doi jucatori, ceea ce ca~tiga un jucator este exact ceea ce pierde ceialait. De obicei insa scopurile jucatorilor nu sunt nici total opuse, nici total coincidente. Avem jocuri a~a-numite cu motive mixte. Aici suma ca~tigurilor nu mai este zero : e po sibil ca toti jucatorii sa ca~tige sau toti sa piarda (iar pentru analiza, cum yom vedea, sunt foarte interesante jocurile in care toti jucatorii pierd, de~i ar putea sa ca~tige cu totii ! ). Chiar daca partidele la putere ~i cele din opozitie au conflicte opuse, de obicei ele totu~i considera ca lipsa conflictelor sociale este benefica pentru toate; chiar daca un partid ca~tiga majoritatea in P'arlament ~i poate forma guvernul, celalalt nu este total invins, fiindca el formeaza opozitia, care in regimurile democratice are un rol important in viata politica.

Cum aleg juditorii ?

Sa luam un exemplu. Sa presupunem ca in campania electoraUi 0 problema sociala devine prioritara (educatia, sanatatea, sustinerea agriculturii sau pro­teclia sociala, de exemplu). Simplificand de dragul exemplului, presupunem ca de felul in care cele doua part ide aflate in competitie se vor raporta la aceasta va depinde ~i procentul voturilor pe care fiecare Ie va obtine in ale­geri. (Evident, cum am admis ca doar doua partide sunt III competitie, suma procentelor va fi intotdeauna - adica pentru orice disula a matricei de mai jos - egala cu 100.) Fiecare partid are la dispozitie trei strategii de actiune : sa propuna marirea bugetului pentru sustinerea politicilor in domeniul res­pectiv; sa propuna reducerea bugetului respectiv; sau sa propuna mentinerea statu-quo-ului. Matricea de mai jos descrie jocul nostru in forma Ilormala :

Page 2: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

FliNDAMENTELE POLITICII

Partidul B: Partidul B: Partidul B:

cre~terea bugetului sciiderea bugetului mentinerea statu-quo-ului

Partidul A: 40 20 55 Cre~terea bugetului 60 80 45

I Partidul A: 65 55 65 I Sciiderea bugetului 35 45 35

! Partidul A: 55 60 55 I Mentinerea 45 40 45 i statu-quo-ului

Procedura de tip maximin de alegere consta in urmatoarele: mai intai,

pentm fiecare partid determinam care este cel mai prost ca~tig pe care it poate

obtine la urmatoarele alegeri daca joaca 0 anumita strategie. Pentru partidul

A obtinem trei minime : 45, 35 ~i 40, dupa cum va sustine cre~terea, scaderea

bugetului, respectiv mentinerea lui la nivelul existent. Pentru partidul B cele

trei minime sunt, respectiv, 40, 20 ~i 55. In al doilea rand, fiecare jucator (partid) determina maximulintre aceste ca~tiguri. Pentru A, maximul este 45,

iar pentru partidul B maximul este 55. A~adar, partidul A alege sa propuna

cre§terea bugetului, iar partidul B - mentinerea statu-quo-ului. Rezultatul jocului va fi deci perechea de strategii (cre~terea bugetului, mentinerea statu­

-quo-ului), iar partidul A va obtine 45 % din voturi, in timp ce B va obtine

doar 55%.

Concepte de baza

Pentru a simplifica, sa admitem ca jocul se desfa~oara doar intre doi jucatori,

1 ~i 2. Sa notam cu Xi (i = 1, ... , m) strategiile disponibile pentru 1 ~i cu Yj

(j = 1. . .. , k) strategiile disponibile pentru 2. Atunci un rezultat este 0

pereche (x" y), iar functiile de utilitate u 1 ~i U2 iau ca argumente astfel de perechi. Pentru a face lucrurile mai intuitive, strategiile disponibile pentru juca­

toml 1 vor fi notate cu x, X I etc., iar strategiile disponibile pentru jucatorul 2

vor fi notate cu y, Y I etc. Adeseori vor fi folosite urmatoarele concepte :

- X este cea mai buna strategie pentru y daca ~i numai daca, oricare ar fi x I,

avem u 1 (x, y) = U 1 (x I, y).

x este 0 strategie dominanta daca §i numai daca x este cea mal buna strategie pentru orice y.

Gabi
Highlight
Page 3: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

RA TIONALITATE SI ACTIUNE COLECTIV A 21

Analog, vom avea (pentru juditorul 2) Si:

- y este cea mai buna strategie pentru x daca Si numai daca, oricare ar fi \ avem u2(x, y) = u2(x, y').

y este 0 strategie dominanta daca Si numai daca y este cea mai buna strategie pentru orice x.

Acum sa definim conceptele de echilibru Nash Si superioritate Pareto

o pereche (x, y) de strategii este un echilibru Nash daca ~i numai daca x este cea mai buna strategie pentru y ~i y este cea mai buna strategie pentru x.

Evident, fntr-un echilibru Nash nimenl nu are vreun stimulent sa schimbe unilateral strategla pe care 0 joaca.

o pereche (x, y) de strategii este superioara Pareto perechii de strategii (x', y') daca Si numai daca x ;::: x' Si y ;::: y '.

o pereche (x, y) de strategii este optima Pareto daca Si numai daca nu exista 0 pereche (x', y') care sa fie superioara Pareto perechii (x, y) 1 .

in unele jocuri e po sibil ca jucatorii sa nu aiM la dispozitie 0 strategie dominanta. Sa ne amintim jocul care consta in punerea la cale a inUUnirii dintre mine Si tine in Bucuresti :

Tu: I Tn: I Universitate Gara de Nord

Eu:

l -51

Universitate 4

Eu: 4

Gara de Nord -5 -5

4

Nici eu Si nici tu nu avem 0 strategie dominanta; dar exista doua echilibre Nash, cele in care amandoi ale gem sa ne intalnim in acelasi loc. Uneori exista illsa un singur echilibru Nash, cum se vede din urmatorul exemplu :

1. Sa notam ca relaIia "a fi superior Pareto" nu este campI eta : exista perce hi de strategii (x, y) ~i (x', y') cu proprietatea ca nici una dintre ele nu e superioara celeilalte: de piIda, cand avem x > x', dar y' > y. De aici se poate deduce CLl

u~urinIa ca pot exista mai muite perechi de strategii care sunt optime Pareto.

Page 4: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

22 FUNDAMENTELE POLlTICII

";Jucltortll'2: .. ' . .':' ' .... luc~torull:·1::>·: ,. . '." .. .•. . ~trategiaI .' : "' .. / .·.·strategia U ',' '\ .:, .

Juditol'ull: 4 3

strategia I ..

7 '1 .. JucAtorull: 2 1

strategia U '. 3 1

Pentru ambii jucatori, alternativa 1 este dominanta, iar perechea de strategii (I, I) este singurul echilibru Nash al jocului. In general, daca intr-un joe fiecare jucator are 0 strategie dominanta, atunci combinarea acestora repre­zinta echilibrul jocului (singurul echilibru al jocului).

Alte joeuri nu au insa nici un echilibru Nash, a§a cum se vede din urmatorul exemplu (la care vom reveni mai jos, fiindca jocul este de tipul dilemei pri­zonierului) :

Jucatorul2: Jucatorul 2: strategia I II

i Jucatorull: 3 4

strategia I 3 1

Juciitorull: I 2

strategia II 4 2

Intr-adevar, oricare ar fi perechea de strategii, un jucator are de ca~tigat daca ar schimba unilateral strategia jucata. De asemenea, sa notam aiei ca perechea de strategii (l, I) este optima Pareto, fiindca nu exista 0 alta strategie care sa permita unui jucator sa ca§tige Tara sa piarda celalalt. In particular, ea este superioara Pareto perechii de strategii (II, II); dar nu este nici superioara, nici inferioara Pareto perechilor de strategii (I, II) §i (II, I).

De multe ori jocul se repeta; atunci un jucator poate sa-§i construiasca urmatorul tip de strategie de joe: el va juca fiecare alternativa cu 0 anumita probabilitate p. In acest caz, vom spune ca juclltorul face apella strategii mixte.

SoluIia Nash (*)

o problema importanta este urmatoarea: data fiind 0 agenda pentru membrii grupului (iar situatia initiaIa este una dintre optiunile aflate pe agenda! ), care vor fi strategiile (mixte) pe care e rational sa Ie adopte fiecare membru al grupuJui? Solutia cea mai cunoscuta este cea formulata de J. Nash (1950) : potrivit acesteia, strategiile pe care e rational sa Ie joace membrii grupului

Gabi
Cross-Out
Page 5: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

38 FUNDAMENTELE POLITICH

posibile toate acestea? lata unul dintre subiectele pe care Ie vom cerceta pe larg in aceastli lucrare.

In general, 0 conventie este un echilibru stabil intr-unjoc necooperativ, repetat in mod indefinit. Intr-adevar, atunci e in interesul fiecarui jucator sa urmeze o anumita strategie daca toti ceilaiti (sau aproape toti ceilalti) urmeaza ace a strategie. Atentie insa: intr-o asemenea situatie spunem ca avem de-a face cu o conventie doar daca credem ca un comportament de tipul celui adoptat de jucatori nu se impune ca fiind constrangator (deci dnd acest echilibru nu e considerat de ace~tia ca fiind singurul posibil). La stopuri ne putem imagina ca se adopta conventia sa travers am dnd apare culoarea ro~ie - chiar daca in realitate exista 0 alta conventie. Conventiile se intalnesc peste tot in societate. Limbajul e probabil una dintre cele mai importante conventii umane, 0 con­ventie asupra intelesului diferitelor cuvinte. Dar conventiile se gasesc ~i in alte sfere ale actiunii noastre: utilizarea banilor se bazeaza pe multe conventii, la fel ~i reglementarile legale ori drepturile de proprietate etc.

11.3. Structura §i semnificatia dilemei prizonierului

Pe continuumul dintre conflictul pur ~i identitatea scopurilor jucatorilor, cele mai multe jocuri se bazeaza pe "un conflict, precum ~i pe 0 identitate a intereselor" (Gauthier: 1986, p. 126). Avem ceea ce Schelling (2000, p. 105) numea jocuri cu motive mixte.

in ~tiinta politica s-au discutat (chiar obsedant de mUlt) patru jocuri de acest tip. Primele trei au ceva foarte important in comun cu unele dintre jocurile conflictuale ~i de coordonare mentionate mai sus: au mai mult de un echilibru Nash. eel de-al patrulea - dilema prizonierului - e diferit, fiindca nu are nici un echilibru Nash.

Trei joeuri eu motive mixte

Ele poartli nume simple, care trimit la situatii mai mult sau mai putin obi~nuite din viata fiecaruia dintre noi: Liderul, La~ii, Batalia sexelor.

Liderul. Sa presupunem ca in fala unui pod ingust ajung cu automobilul in acela§i timp cu un alt automobilist, care vine din partea opusa. Podul nu are

Gabi
Cross-Out
Gabi
Cross-Out
Gabi
Cross-Out
Page 6: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

RA TIONALITATE SI ACTIUNE COLECTIV A 39

niei un semn de circulatie care sa indice cine are prioritate. Ce fac? Ineerc sa intru primul sau il las pe celalalt sa intre pe pod?

Cea mai proastii strategie este ea amandoi sa fortam intrarea pe pod, fiindca atunci unul dintre noi va trebui sa dea inapoi, iar timpul pierdut este eel mai mare. Daca insa amandoi ne oprim, a~teptand sa intre eelalalt pe pod, amandoi pier~em iara~i timp. Cel mai bine ar fi ca unul dintre noi - unul singur! - sa il a~tepte pe celalalt. Evident, jocul are ceva in eomun cu jocurile de coordonare discutate mai devreme: caci, chiar daca sunt doua posibilitati simetrice, trebuie sa ale gem amandoi la feI.

Sa observam ca, in cazul in care cei doi jucatori fac apel la procedura maximin, atunci amandoi vor alege sa cedeze intrarea pe pod: aceastii varianta maximizeaza pentru amandoi cel mai prost rezultat posibil. Ca urmare, se intra in situatia descrisa in casuta din dreapta-jos a matricei jocului, cand fiecare obtine doua unitiiti de utilitate. Dar existii 0 problema: situatiile descrise de casuta din stanga-jos ~i din dreapta-sus sunt superioare Pareto eelei la care se ajunge. prin aplicarea procedurii maximin. In fapt, cele doua casute exprima cele doua eehilibre Nash ale jocului. A~adar problema este ca, daea jueatorii sunt ralionali ~i jae apel la proeedura maximin. rezultatul joeului nu este Pareto-optim: exista fntotdeauna un rezultat care e prejerat aeestuia de tOli jueatorii.

La$ii. Numele joculuil trimite la comportamentul teribilist al adolescen­til or texani din anii '50, cand pe 0 ~osea lipsitii de trafic ei se a~ezau la 0

anumita distanta fala in fata la volanul unui automobil. Fiecare pornea in viteza spre eelalalt, iar daca mergeau drept, se ciocneau frontal. Cel care incerca primul sa evite ciocnirea, deviind intr-o parte, pierdea. Desigur, com­portamentul "la~ului" era penalizat in cadrul grupului, insa ciocnirea intre automobile era un rezultat ~i mai prost decat acesta. Matricea unui astfel de joc e redata mai jos :

1. In engleza: chicken.

Page 7: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

40 FCNDAMENTELE POLITICII

Dadi analizam matricea de mai sus, observam ea, aplidind proeedura maximin, ambii jueatori vor alege strategia de a evita, iar rezultatul joeului este deseris de easula din dreapta-jos. Dar jocul are doua eehilibre Nash l

, in care unul dintre jucatori evita, iar eeUilalt nu deviaza de la direqia de mers ; eaci, daca unul singur schimba strategia, nu ca~tiga astfel.

E interesant ca in teoria relaliilor internalionale acest joe a fost invoeat pentru a deserie unele situatii foarte eunoseute. Un exemplu in aeest sens este eriza raehetelor din Cuba din anul 1962. In eriza eubaneza, SUA aveau doua optiuni (sa menlina presiunea pentru retragerea raehetelor sau sa slabeasea aeeasta presiune2

), iar URSS avea la randul ei doua optiuni (sa retraga sau sa mentina rachetele).

2 4

4 3 2 3

Chiar daea in aeest joe eele doua puteri au interese diferite, jocul nu este unul eu suma nula: ea e a~a se vede imediat ee analizam rezultatul foarte

1. Dadi admitem strategii mixte, atunci exista trei echilibre Nash, al treilea fiind cel in care fiecare jucator joaca fiecare strategie cu 0 anumita probabilitate (cunoscuta), care il face pe ceIalalt sa aleaga la randul sau cu 0 anumita probabilitate intre cele doua strategii. Strategiile mixte capteaza ideea lui Schelling (2000, partea a III-a) ca probabilitatea acceptata de ajuca fiecare alternativa face credibila strategia ame­ninlarii nucleare.

2. In unele prezentari ale aplicatiei acestui joc la criza cubaneza cele doua alternative sunt construite altfel: menlinerea presiunii este redata prin alternativa unui atac aerian pentru a distruge rachetele sovietice deja instalate; strategia de slabire a presiunii e redata de alternativa blocadei navale asupra Cubei, pentru a preveni aducerea de noi rachete (de exemplu, in Brams: 2004, pp. 39-50).

Page 8: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

RATIONALITATE SI ACTIUNE COLECTIV A 41

prost obtinut de ambele puteri dad! ele aleg strategia ferma - SUA sa mentina presiunea, iar URSS sa nu retraga rachetele. E important sa notam aici inca un lucru: rationamentul nu este unul cardinal, ci ordinal. EI nu presupune ca putem cuantifica pierderile ~i ca~tigurile celor doua puteri; trebuie doar sa putem detecta care este ordinea lor de preferinta, iar numerele din fiecare -::asuta au acest rol, de a indica rezultatul eel mai bun (notat cu 4) pe care l-ar

obtine unjuditor, pana la eel mai prost (notat eu 1) pe care l-ar obtine fieeare. Jocul ne arata ea, adoptand 0 procedura de joe maximin, se ajunge la rezultatul -:a SUA slabesc presiunea, iar URSS accepta retragerea raehetelor, care pentru fiecare reprezinta nu eea mai buna situatie posibila, ci a doua ca preferintal. Dar, atentie, acest rezultat nu este un eehilibru Nash: daea 0 singudi putere schimba strategia, atunci obtine un rezultat mai bun pentru ea (Bennett: 1995; Brams: 1994; Stone: 2001)2.

Biitiilia sexelor. Numele aeestui joe, remarea Hollis (2001, p. 124), are -:onotatii psihanalitice sau umoristice3 . Jocul este oareeum similar eu Liderul.

Autorii care scriu in engleza mentioneaza second-best solutions, care sunt rezul­tatele unor astfel de jocuri.

~ Un alt joe interesant - la care se face de multe ori apel - este eel al garanliei (assurance game). Numele vine din faptul ca 0 persoana va dori sa coopereze daca are garantia ca ~i cealalta va face la fel. Matricea jocului e redata mai jos (cifrele desemneaza unitali de utilitate) :

Daca ne uitam la structura jocului, vedem ca situalia in care ambii jucatori coopereaza este una Pareto-optima; dar aceasta nu e ~i dominanta: daca unul dintre jucatori defecteaza, atunci eel mai bine pentru celalalt este sa defecteze ~i el. Daca aClioneaza rational, jucatorii vor alege sa nu coopereze, iar rezultatulla care se ajunge nu este unul Pareto-optim: (1, 1). A~adar jocul prezinta 0 problema foarte importanta: el nu prescrie jucatorilor sa coopereze. Jocul garantiei nu este foarte mult studiat, de~i pesemne ca descrie uneori mai bine dedit dilema prizo­nierului anumite situatii de cooperare sociala.

3. Hollis se refera la James Grover Thurber (1894-1961), cunoscut ca umorist ~i

caricaturist.

Page 9: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

42 FUNDAMENTELE POLITICII

Sa presupunem ca doi soti vor sa petreaca seara in ora~. Ei ar prefera sa fie mai degraba impreuna dedit singuri. Dar sotul vrea sa mearga la un meci de fotbal, in timp ce sotia vrea la concert. Iara~i sunt doua echilibre Nash - dar, daca aceste doua persoane aleg prin aplicarea procedurii maximin, vor petrece seara singure in ora~: una la meci, iar cealalta la concert.

Dilema prizonierului

Cu aceasta, ajungem la cel de-al patrulea joc, dilema prizonierului. Sa 0

formulam mai intai analog celorlalte trei jocuri. Cifrele din fiecare casuta a matricei de mai jos au, de asemenea, un sens ordinal: ele indica ordinea preferintelor fiecarui jucator intre rezultatele posibile ale jocului. Avem:

Jocul nu are nici un echilibru Nash: in orice situatie, unjucator ar ca~tiga daca ar schimba unilateral strategia. Daca ambii jucatori sunt rationali - adica aplica procedura maximin -, rezultatul jocului este (2, 2). Fiecare obtine a~adar un rezultat prost (al treilea in ordinea preferintelor fiecaruia!). Si, un lucru important, acest rezultat nu este Pareto-optim: caci, daca fiecare jucator ar juca alternativa sa I, rezultatul jocului va fi (3, 3), iar acesta este superior Pareto celui la care se ajunge daca se aplica procedura maximin.

o ilustrare simpla (poate chiar simplista) a jocului prive~te din nou compor­tamentul marilor puteri in timpul "razboiului rece" (vezi iara~i Schelling: 2000, pentru 0 tratare mai sofisticata a problemei). Fiecare dintre ele - SUA ~i URSS - avea la dispozitie doua solutii: sa se inarmeze sau sa nu se inarmeze. Teoria jocurilor face predictia ca, daca se procedeaza rational (adica aplicand procedura maximin), cursa inarmarilor continua.

Page 10: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

RA T10NALITATE SI ACT1UNE COLECTIV A 43

Structura dilemei prizonierului

Situatii care ne intriga, de tipul dilemei prizonierului, au fost inventate la inceputul anilor '50; Merrill Flood ~i Melvin Dresher, considerati parintii acestei dileme, lucrau la Rand Corporation in domeniul teoriei jocurilor (privita ca promitatoare pentru aplicatiile ei in domeniul strategiei inarmarii nuc1eare). Numele jocului i se datoreaza lui Albert Tucker, care a incercat sa-l faca mai accesibil in cadrul unor prelegeri in fata unui grup de psihologi de la Universitatea Stanford. Flood ~i Dresher nu ~i-au public at ei in~i~i rezultatele, dar jocul inventat de ei a devenit celebru.

in varianta sa populara, jocul e urmatorul: doua persoane - jucatorii 1 ~i 2 - au fost arestate sub invinuirea unui delict major. Ele au fost puse in celule separate l (pentru a nu comunica ~i, deci, pentru a nu formula 0 strategie comuna de actiune). Presupunem ca fiecare dintre cei doi jucatori este ratio­nal: dore~te sa obtina cel mai bun rezultat pentru el ~i este indiferent in ceea ce i1 prive~te pe celalalt jucator. De asemenea, presupunem ca fiecare dintre cei doi jucatori prefera mai curand sa fie liber decat sa stea in inchisoare. Acum, un procuror inteligent expune fiecarui jucator situatia: nu exista destule probe pentru a-i condamna pentru un delict major (de exemplu, voiau sa jefuiasca 0 banca); dar exista indeajuns de multe probe pentru a-i condamna pentru mai multe delicte marunte (port ilegal de arma, accident de circulatie etc.). Procurorul face fiecaruia 0 oferta: jucatorii au doua optiuni - sa taca sau sa marturiseasca delictul major. Daca unul dintre jucatori marturise~te, dar celalalt tace, atunci cel care a marturisit e liber, iar celalalt prime~te 0

pedeapsa foarte mare; daca ambii marturisesc, fiecare prime~te 0 pedeapsa moderata; iar daca amandoi tac, vor primi 0 pedeapsa mica, pentru delicte minore. Si inca un lucru: procurorul 11 informeaza pe fiecare jucator ca ~i

1. De fapt, eerinta aeeasta nu este esentiala pentru structura jocului, fiindca nimic nu garanteaza ca, odata ajunse la un acord eomun, cele doua persoane 11 vor ~i

respecta in confruntarea eu procurorii. Dar eerinta simplifiea argumentarea.

Page 11: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

FUNDAMENTELE POLITICII

celiHalt juditor a primit aceea~i oferta (altfel spus, fie care jucator cunoa~te jocul ~i, de asemenea, jocul este 0 cunoa~tere comuna a celor doi jucatori).

Pe scurt, jocul poate fi indicat in forma normala astfel :

Jucato(uI2: Jucato(ul 2: ma(turise~te

Jucito(ull: -5 -8 ... marturise~te -5 0

Jncatorull: 0 -1 ...••..• llu.ma 8 1

Cifrele din fiecare casuta descriu marimea pedepsei (in ani de inchisoare ; cum am admis ca ambii jucatori prefera libertatea vietii in inchisoare, anii sunt desemnati cu numere negative). Jucatorul 1 va rationa astfel: daca marturisesc, atunci, in functie de ceea ce va face jucatorul 2, cel mai prost rezultat pe care 11 voi putea obtine este sa primesc cinci ani de inchisoare ; daca nu marturisesc, atunci, in functie de ce va face jucatorul 2, cel mai prost rezultat la care rna pot a~tepta este sa primesc opt ani de inchisoare. Cel mai putin prost rezultat este sa primesc cinci ani de inchisoare - a~a incat voi marturisi. Jucatorul 2 va rationa analog ~i va conchide, de asemenea, ca pentru el strategia cea mai buna este sa marturiseasca. Ca urmare, rezultatul jocului va fi descris de casuta din stanga-sus: fiecare dintre cei doi jucatori va primi cate cinci ani de inchisoare.

A~adar, pentru fiecare jucator e mai bine sa marturiseasca de cat sa taca. Dar e u~or sa observam ca aceasta conc1uzie contrariaza, fiindca ambii juca­tori ar fi putut obtine un rezultat mai bun (deci rezultatul nu e Pareto-optim !).

intr-adevar, daca ambii ar fi tacut, fiecare ar fi primit nu cinci ani, ci doar un an de inchisoare. Interpretarea standard a problemei puse de dilema prizo­nierului este aceea ca ea ilustreaza un conflict fntre ra/ionalitatea individuaLa

~i cea de grup. Caci, daca membrii unui grup ac/ioneaza ra/lonal, ei vor

ajunge la un rezultat mai prost decat cella care s-ar ajunge daca nu s-ar

comporta ra/ional. in general, daca membrii unui grup urmaresc anumite scopuri, atunci ne putem a~tepta ca ei sa reu~easca sa Ie atinga mai degraba daca nu ~i le-ar urmari individual in mod rational.

Parfit (1984, pp. 12-13) da urmatorul exemplu in acest sens. Sa presupunem ca un bandit vine la mine in casa ~i imi cere sa-i dau toti banii pe care ii am. Chiar daca am sunat la politie, aceasta nu va putea ajunge in mai putin de un sfert de ora. Banditul rna ameninta ca, daca nu-i dau banii, dupa cinci minute

Page 12: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

RATIONALlTATE SI ACTIUNE COLECTIV A 45

ii va impu~ca pe copii, unul dupa altul. Ce sa fac? Cum politia nu va veni la limp, trebuie sa decid. Pare irational sa nu-i dau banii, fiindca atunci ii va impu~ca pe copii; dar pare de asemenea irational sa-i dau banii, fiindca banditul va Mnui ca fie eu, fie copiii mei yom da politiei sernnalmentele sale, vom spune ce automobil avea - ~i atunci, in mod rational, ma pot a§tepta sa ne omoare chiar daca ii dau banii. In ambele situatii, este extrem de probabil ca §i eu, §i copiii mei sa fim uci~L Dar am in casa un drog care, odata luat, ma face irational un interval de timp. ~i, cum paharul in care e drogul e chiar [anga mine, inghit substanta. Acum, odata devenit irational, ma comport altfel. La randul sau, banditul ma vede band drogul ~i (un lucru foarte important!) ~tie ca de aici incolo eu ma voi comporta irational. Ii spun banditului: "Vrei sa ma omori? Cu placere, chiar te rog! Vrei sa imi omori copiii? Ii iubesc, a§a ca te rog, ucide-i! Vrei sa ma torturezi sa spun unde sunt banii? Imi place sa fiu torturat, te rog, continua! ". In acest caz, banditul e lipsit de orice putere pentru a ma face sa-i dau banii, fiindca nici amenintarile, nici tortura nu il ajuta. Ba chiar e probabil ca, vazandu-ma irational, sa considere ca nu voi fi in stare sa Ii dau politiei semnalmentele ori numarul automobilului sau - §i sa nu ne ucida. (Desigur, dupa ce banditul pleaca, exista riscul ca eu, irational fiind, sa imi vatam copiii pana cand vine polilia; dar sa presupunem ca nu sunt inarmat ~i ca riscul acesta e mic.) A~adar, daca devin irational, am ales cea mai buna solutie pentru situatia in care ma aflu. Este ralional sa ma comport irafional.

Aceasta concluzie deconcertanta e cu atat mai importanta cu cat situatii precum cele descrise de jocul nostru nu sunt deloc rare; dimpotriva, yom vedea ca ele exista pretutindeni atunci cand oamenii interactioneaza cu alti oamenL De aceea, dilema este centrala pentru ~tiinta politica.

Sa mai observam cateva lucruri privind structura dilemei. Mai intai, cele doua alternative de actiune ale jucatorilor sunt construite de obicei ca expri­mand colaborarea sau lipsa de colaborare cu celalalt. Daca jucatorul 1 tace, el colaboreaza cujucatorul2. Dacii, dimpotriva, marturise~te, el nu colaboreaza cu 2: in limba romana a inceput sa se incetateneasca drept termen tehnic calchierea cuvantului englezesc deJect: spunem cajucatorul nostru deJecteaza

in acest caz. ~i la fel pentru 2. in al doilea rand, cifrele pe care Ie-am folosit pentru a 0 descrie nu sunt

Mtute in cuie (intr-o interpretare, am vazut ca ele pot avea 0 semnificatie ordi­nala, iar nu cardinala). in general insa, cifrele acestea trebuie conexate intr-un anumit tel. Daca ambii jucatori coopereaza (adopta alternativa C), atunci fiecare prime~te un ca~tig pe care il notam cu R (de la "recompensa"). Daca

Page 13: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

46 FUNDAMENTELE POLITICII

amandoi defecteaza, fiecare prime~te un ca~tig pe care it notam cu P ("pedeapsa"). Ca~tigul pe care unjucator it prime~te daca numai el defecteaza (daca adopta alternativa D) va fi notat cu T (de la "tentatie"); iar ca~tigul pe care un jucator it prime~te daca numai el coopereaza va fi notat cu F (de la "fraier"). In forma normala, dilema prizonierului va fi acum descrisa de matricea:

F T

T R R

Ca sa avem 0 dilema a prizonierului, intre cele patru numere trebuie sa existe urmatoarea relatie :

T>R>P>F

Se observa ca pentru fiecare dintre cei doi jucatori strategia D este dominanta: orice ar face oponentul sau, pentru fiecare jucator este mai bine sa aleaga D decat strategia de a coopera C. Acesta este motivul pentru care doi jucatori rationali vor defecta, in timp ce doi jucatori irationali (deci doi jucatori care nu adopta procedura maximin de alegere) vor coopera. Pentru jucatorul 1, cele patru rezultate ale jocului sunt preferate in ordinea urma­toare: (D, C) > (C, C) > (D, D) > (C, D); pentrujucatoruI2, ordinea celor patru rezultate posibile alejocului este: (C, D) > (C, C) > (D, D) > (D, C). Rezultatulia care se ajunge daca ambii jucatori sunt rationali este (D, D), eel care e plasat doar al treilea in ordinea preferintelor fiecaruia.

Dilema pe care am prezentat-o aici este simetrica: ca~tigurile celor doi jucatori sunt acelea~i. Dar nu este deloc obligatoriu ca Iucrurile sa se petreaca a~a de fiecare data: uneori ca~tigurile pe care Ie obtin cei doi jucatori daca defecteaza sau coopereaza sunt diferite. De pilda, am putea avea:

Page 14: 05 Miroiu 2007 b - Dilema Prizonierului (RAC)

, RA TIONALITATE SI ACTIUNE COLECTIV A 47

In acestjoc, ca~tigurile celor doijuditori, dadl defecteaza sau coopereaza, sunt diferite, dar pentru fiecare jucator strategia dominanta va fi din nou D. Motivul este ca pentru fiecare se pastreaza relatiile dintre cele patru numere care exprima ca~tigurile sale. Intr-o dilema nesimetrica a prizonierului trebuie doar ca pentru fiecare jucator i (i = 1, 2) sa avem 1

:

T > R. > P. > F. I I I I

De asemenea, sa notam ca numarul de doua strategii de actiune disponibile pentru fiecare juditor nu este esenlial; dilema se reproduce ~i daca jucatorii au la dispozitie mai mult de doua strategii. De exemplu, sa presupunem ca, alaturi de strategia de a coopera ~i de a defecta, fiecare judltor mai poate sa procedeze ~i altfel (sa nu faca nimic - strategia N). Am putea acum sa construim urmatorul joc (Kuhn: 2006):

Interesant este ca acum strategia D, de a defecta, nu mai e dominanta, tiindca pentru fiecare jucator este mai bine sa aleaga C cand celalalt alege alternativa N; dar ~i acum rezultatul jocului este descris de perechea de strategii (D, D), care din nou nu este Pareto-optima (in particular, perechea de strategii [C, C] ii este Pareto-superioara).

In forma sa cea mai simplii, dilema implica doi jucatori. Dar cele mai interesante cazuri sunt cele in care numarul jucatorilor este mai mare (avem o dilema cu n jucatori). In sectiunea urmatoare yom discuta problemele noi care apar dnd sunt mai multi jucatori. Aici sa ne rezumam doar la situalii1e

1. Interesant este ca dilema se reproduce §i in conditii mai slabe. Cititorul poate verifica acest lucru in cazul urmator :

TI > RI §i PI > FI T2 > R2 §i P2 > F2 RI > PI §i R2 > P2

Atentie: §i acum comparatiile sunt doar Intre numerele ata§ate unui singur jucator; nu exista comparatii interpersonale.