decizii în conditii de incertitudine - photography and … în condiţii de incertitudine estimarea...

Teoria deciziei

Dezvoltări şi cazuri problematice

Decizii în condiţii de incertitudine

Decizii în condiţii de incertitudine

estimarea probabilităţilor de apariţie a evenimentelor este imposibilă sau extrem de limitată, datorită lipsei de regularitate a „loteriei naturale” (incertitudine exogenă) sau lipsei de informaţie (incertitudine endogenă)

poate fi făcută o estimare subiectivă a probabilităţilor, pe baza inferenţelor făcute în urma observării acţiunilor oamenilor pe o perioadă lungă de timp

dată fiind imposibilitatea estimării probabilităţilor, modelele de decizie propuse caută să identifice beneficiile şi pierderile minime şi maxime şi să aleagă strategiile care par să garanteze obţinerea primelor şi evitarea celor din urmă.

Modele de decizie Minimax presupune identificarea beneficiului minim pentru fiecare

alternativă şi selectarea celei mai mari dintre minimele obţinute. (nu ajută în situaţiile în care beneficiile minime sunt egale în cazul mai

multor alternative)

Maximax presupune identificarea beneficiului maxim pentru fiecare alternativă şi selectarea celui mai mare dintre beneficiile maxime

Minimax regret - se construieşte un tabel al posibilelor pierderi de oportunităţi (diferenţele dintre beneficiul estimat şi beneficiul maxim posibil pentru o anumit rezultat) şi se alege alternativa care minimizează “regretul maxim posibil” (pierderea de oportunitate maximă)

Principiul “raţiunii insuficiente” - alternativele sunt tratate ca şi cum ar avea grade de probabilitate egale; ca atare, se selectează alternativa cu cea mai mare medie a beneficiului estimat.

Exemplu Licitaţie pentru instalarea unui nou sistem informatic de

management financiar în cadrul unei corporaţii. Mai mulţi furnizori depun oferte (fiecare dintre ei propune una sau mai multe variante de sistem şi costul fiecăreia).

Unul dintre furnizori oferă trei variante : instalarea unui sistem fiabil şi verificat, însă cu funcţionalitate redusă, instalarea unui sistem avansat, cu funcţionalitate ridicată însă mai

puţin testat, o soluţie de compromis între cele două.

Conducerea corporaţiei studiază propunerile primite şi poate alege:

să respingă în totalitate oferta, să accepte unul din sistemele propuse, să solicite negocieri suplimentare (în vederea scăderii preţului).

Tabelul beneficiilor

Respins Aprobat Negociere

1 Sigur 0 20 11

2 Avansat 0 10 8

3 Mediu 0 15 12

Minimax şi maximax


1 Sigur 0 20 11

2 Avansat 0 10 8

3 Mediu 0 15 12

Minimax regret


1 Sigur 0 0 1

2 Avansat 0 10 4

3 Mediu 0 5 0

Raţiune insuficientă


1 Sigur 0 20 11

2 Avansat 0 10 8

3 Mediu 0 15 12

“Pariul lui Pascal”

Raţiunea nu poate determina cu certitudine existenţa sau inexistenţa lui Dumnezeu.

Cu toate acestea, putem alege să pariem pe existenţa sa şi să trăim ca şi cum Dumnezeu există, pentru că posibilul câştig este infinit, iar posibila pierdere nulă.

Structura argumentului

Raţiunea nu poate oferi un răspuns cert

Ca atare, putem încerca să selectăm o opțiune pe baza beneficiului pe care l-am obţine dacă am presupune că este adevărată Dacă alegem D-, nu avem nimic de câştigat, în

ambele situaţii

Dacă alegem D+ şi se dovedeşte că D+, avem un câştig infinit (oricât de mică ar fi probabilitatea D+, valoarea sa estimată e infinită)

Beneficii

D+ D-

Trăiesc ca şi cum D+

Viaţă eternă Nimic

Trăiesc ca şi cum D-

Iad Nimic

Valoarea estimată a beneficiului nu este infinită decât dacă presupunem deja D+

Ce anume preţuieşte D? Onestitatea argumentelor proprii sau credinţa motivată de câştig?

Comparaţi cu:

Raţiunea nu poate determina cu certitudine existenţa sau inexistenţa lui Moş Crăciun (pot exista multe dovezi care par să sprijine ideea că nu există, însă ele nu pot elimina complet posibilitatea existenţei sale).

Putem alege să pariem pe existenţa lui Moş Crăciun şi să ne comportăm ca şi cum el există. Dacă el într-adevăr există, nu avem decât de câştigat. Dacă nu, nu avem nimic de pierdut.

Really?

Valoare estimată

Probabilitate x valoare estimată a beneficiului

“Legea numerelor mari” descrie rezultatul repetării unui experiment de un număr mare de ori; media rezultatelor obținute aproximează valoarea estimată, iar gradul de aproximare crește odată cu numărul repetărilor

De exemplu, o aruncare cu zarul poate produce valorile 1,

2, 3, 4, 5 sau 6 cu probabilitate egală; valoarea estimată a unei singure aruncări este

{1+2+3+4+5+6}/6 = 3.5

Cu cât numărul de aruncări creşte, media rezultatelor se apropie tot mai mult de 3.5.

Paradoxul Sf. Petersburg

Se dă cu banul, cele două rezultate posibile fiind “cap” şi “pajură”. Câştigul jucătorului este cu atât mai mare cu cât reuşeşte să obţină “cap” după un număr mai mare de încercări.

Câştigul la prima încercare este 1 şi se dublează cu fiecare încercare suplimentară în care NU apare “cap”: 1, 2, 4, 8, 16…; în general, dacă rezultatul e “cap” după n încercări, câştigul va fi de 2n.

Valoarea estimată a jocului în ansamblu este

adică iar probabilitatea obţinerii sale de 1/2n.

Din moment ce beneficiul estimat este infinit, teoria valorii

estimate spune că ar trebui să fim dispuşi să investim oricât de mult în şansa de a juca acest joc.

Valoare vs. utilitate Cadrul teoretic standard pentru analiza deciziilor în condiţii de

incertitudine este oferit de teoria utilităţii estimate. Formulată în linii mari de către Daniel Bernoulli în prima jumătate a sec. al XVIII-lea, teoria a revenit în prim-plan odată cu axiomatizarea propusă de John von Neumann şi Oskar Morgenstern în 1944 .

Valoarea estimată (de exemplu, câştigul financiar posibil înmulţit cu probabilitatea obţinerii sale) este înlocuită cu utilitatea estimată. În cazul său, estimarea beneficiilor cuantificabile trebuie să ia în calcul nu doar probabilităţile de apariţie, ci şi modul în care decidenţii interpretează potenţialele beneficii, prin raportare la propriile înzestrări, preferințe și obiective.

În particular, se presupune că deciziile:

vor avea în vedere poziţionarea pe o scală a utilităţii marginale descrescătoare

vor viza cu prioritate minimizarea riscurilor în raport cu maximizarea beneficiilor.

Efecte de reprezentare

efectul de certitudine - presupune faptul că agenţii tind să subevalueze consecinţele probabile în comparaţie cu cele percepute drept sigure; ca atare, în multe situaţii ei pot ajunge să aleagă, contrar predicţiilor ipotezei utilităţii estimate, un rezultat cu o probabilitate mai mare, însă cu o utilitate estimată mai mică.

Acest lucru poate determina un comportament marcat de aversiune faţă de risc în situaţii care implică câştiguri sigure, şi de căutare a riscului în situaţii care implică pierderi sigure.

efectul de posesie (endowment effect) - determină o supraevaluare a utilităţii acelor bunuri care se află deja în posesia agentului, în comparaţie cu bunurile (identice sau echivalente) care nu se află în posesia sa.

Efecte de reprezentare

preferinţa pentru status quo (rezistenţa la schimbare) implică faptul că subiecţii vor opta în mod preferenţial pentru acele alternative care tind să păstreze neschimbată situaţia prezentă, chiar dacă oferă o utilitate estimată mai mică.

caracterul referenţial al funcţiilor de utilitate - indivizii nu se raportează exclusiv la utilitatea potenţială care le poate reveni, ci şi la utilitatea care le revine celorlalţi.

Valoarea determinată a utilităţii individuale este stabilită referenţial – de exemplu, în condiţiile în care toţi membrii unui grup au avut beneficii comparabile, diferenţa de utilitate primită de un membru al grupului este considerată mai puţin importantă decât ar fi fost în condiţiile unor diferenţe semnificative de distribuire a beneficiilor.

Agregarea preferinţelor individuale

Agregarea preferinţelor

RCT – individualism metodologic

Putem vorbi de preferinţe şi intenţii colective în sensul în care vorbim de preferinţe şi intenţii individuale?

Divergenţa de opinii, preferinţe şi gusturi este regula, nu excepţia

Există posibilitatea de a agrega preferinţe individuale, obţinând un rezultat care să ofere o reprezentare corectă a acestora la nivel colectiv?

Paradoxul lui Condorcet

Să presupunem că la nivelul unui consiliu municipal se discută modul de distribuire a finanţării pentru trei proiecte: construirea unor laboratoare de informatică în şcoli (x), repararea străzilor (y) şi modernizarea pieţelor agroalimentare (z).

Consilierii votează, pentru a stabili priorităţile de finanţare. Presupunând că fiecare consilier are preferinţe stricte, am putea determina preferinţa socială pentru una din cele trei opţiuni prin compararea succesivă a opţiunilor, două câte două, pe baza regulii majorităţii.

În măsura în care există o anumită opţiune care, comparată cu fiecare opţiune alternativă, este preferată de mai multe persoane, ea reprezintă un învingător Condorcet.


Însă există situaţii în care nu există un astfel de opţiune. De exemplu, distribuţia preferinţelor la nivelul celor 30 de consilieri municipali este următoarea:

10 îl preferă pe x lui y şi pe y lui z,

10 îl preferă pe z lui x şi pe x lui y,

10 îl preferă pe y lui z şi pe z lui x.

La nivelul întregului grup, constatăm că 20 de consilieri îl preferă pe x lui y, alţi 20 îl preferă pe y lui z, iar alţi 20 îl preferă pe z lui x. Dincolo de faptul că nu putem selecta o opţiune pe baza evaluărilor binare, observăm că preferinţele lor colective sunt intranzitive.


Evident, explicaţia ţine de faptul că aceste ordonări ciclice ale preferinţelor aparţin unor majorităţi distincte.

Problema agregării ”corecte” a preferinţelor individuale în preferinţe colective este irelevantă în acest caz, unde avem o majoritate variabilă cu preferinţe intranzitive.

Caracterul intranzitiv al preferinţelor majorităţii este perfect compatibil cu presupunerea că ordonarea preferinţelor individuale este tranzitivă în cazul fiecărui membru al grupului.

Teorema lui Arrow

Kenneth Arrow a oferit însă o demonstraţie care vizează orice posibil sistem de agregare a preferinţelor individuale (implicit, orice sistem de vot) în preferinţe colective.

Teorema de imposibilitate sau paradoxul lui Arrow demonstrează imposibilitatea ajungerii la un model de decizie colectivă care să respecte un set minimal de criterii de adecvare raţională.

Problema constă în a găsi o funcţie a alegerii sociale (social choice function) care transformă setul de ierarhizări individuale ale preferinţelor într-o ierarhizare globală.

Teorema lui Arrow Această funcţie ar trebui să aibă următoarele proprietăţi:

Ordonare – funcţia presupune o ordonare unică a alternativelor bazată pe ordonările (ierarhizările) individuale; orice ierarhizare globală a preferinţelor trebuie să fie realizabilă pe baza unui set de ierarhizări individuale

Domeniu nerestrictiv - funcţia trebuie să ia în calcul toate seturile posibile de ierarhizări individuale ale preferinţelor

Eficienţă Pareto – dacă un individ preferă x lui y şi toţi ceilalţi indivizi preferă x lui y sau sunt indiferenţi între x şi y, atunci funcţia exprimă o preferinţă a lui x asupra lui y

Absenţa dictaturii – funcţia nu trebuie să se bazeze pe o generalizare bazată ordonarea preferinţelor unui singur individ

Independenţa alternativelor irelevante – ordonarea socială a alternativelor x şi y este doar o funcţie a ordonărilor individuale ale lui x şi y independent de ordonările alternativelor irelevante (ale lui x şi z, de exemplu).

Teorema lui Arrow

Teorema lui Arrow afirmă că, pentru situaţii care includ cel puţin trei membri şi cel puţin trei alternative, este imposibil de definit o funcţie a alegerii sociale care să îndeplinească simultan toate condiţiile de mai sus.

Aparent, nu există nicio formulă de agregare a unor preferinţe individuale tranzitive în preferinţe colective tranzitive. Demonstraţia lui Arrow arată că, în măsura în care putem construi o funcţie a alegerii sociale care respectă condiţiile 1, 2, 3 şi 5, atunci există cel puţin o ordonare a preferinţelor determinată de un „dictator” (nu este respectată condiţia 4).

Teorema lui Arrow

În măsura în care acceptăm necesitatea celor 5 criterii - nu există o metodă infailibilă de agregare a preferinţelor (regula majorităţii sau oricare alta) cu aplicabilitate generală.

Metoda respectivă nu poate oferi garanţia asigurării unei reprezentări colective adecvate a tuturor ordonărilor individuale ale preferinţelor.

Acest rezultat poate fi interpretat drept un obstacol insurmontabil în construirea oricărui sistem de reprezentare socială a intereselor şi urmărire a unor beneficii comune – de la sisteme electorale la administraţii locale.

decizii în conditii de incertitudine - photography and … în condiţii de incertitudine estimarea...

Documents