decizii în conditii de incertitudine - photography and … în condiţii de incertitudine estimarea...
TRANSCRIPT
Teoria deciziei
Dezvoltări şi cazuri problematice
Decizii în condiţii de incertitudine
Decizii în condiţii de incertitudine
estimarea probabilităţilor de apariţie a evenimentelor este imposibilă sau extrem de limitată, datorită lipsei de regularitate a „loteriei naturale” (incertitudine exogenă) sau lipsei de informaţie (incertitudine endogenă)
poate fi făcută o estimare subiectivă a probabilităţilor, pe baza inferenţelor făcute în urma observării acţiunilor oamenilor pe o perioadă lungă de timp
dată fiind imposibilitatea estimării probabilităţilor, modelele de decizie propuse caută să identifice beneficiile şi pierderile minime şi maxime şi să aleagă strategiile care par să garanteze obţinerea primelor şi evitarea celor din urmă.
Modele de decizie Minimax presupune identificarea beneficiului minim pentru fiecare
alternativă şi selectarea celei mai mari dintre minimele obţinute. (nu ajută în situaţiile în care beneficiile minime sunt egale în cazul mai
multor alternative)
Maximax presupune identificarea beneficiului maxim pentru fiecare alternativă şi selectarea celui mai mare dintre beneficiile maxime
Minimax regret - se construieşte un tabel al posibilelor pierderi de oportunităţi (diferenţele dintre beneficiul estimat şi beneficiul maxim posibil pentru o anumit rezultat) şi se alege alternativa care minimizează “regretul maxim posibil” (pierderea de oportunitate maximă)
Principiul “raţiunii insuficiente” - alternativele sunt tratate ca şi cum ar avea grade de probabilitate egale; ca atare, se selectează alternativa cu cea mai mare medie a beneficiului estimat.
Exemplu Licitaţie pentru instalarea unui nou sistem informatic de
management financiar în cadrul unei corporaţii. Mai mulţi furnizori depun oferte (fiecare dintre ei propune una sau mai multe variante de sistem şi costul fiecăreia).
Unul dintre furnizori oferă trei variante : instalarea unui sistem fiabil şi verificat, însă cu funcţionalitate redusă, instalarea unui sistem avansat, cu funcţionalitate ridicată însă mai
puţin testat, o soluţie de compromis între cele două.
Conducerea corporaţiei studiază propunerile primite şi poate alege:
să respingă în totalitate oferta, să accepte unul din sistemele propuse, să solicite negocieri suplimentare (în vederea scăderii preţului).
Tabelul beneficiilor
Respins Aprobat Negociere
1 Sigur 0 20 11
2 Avansat 0 10 8
3 Mediu 0 15 12
Minimax şi maximax
Respins Aprobat Negociere
1 Sigur 0 20 11
2 Avansat 0 10 8
3 Mediu 0 15 12
Minimax regret
Respins Aprobat Negociere
1 Sigur 0 0 1
2 Avansat 0 10 4
3 Mediu 0 5 0
Raţiune insuficientă
Respins Aprobat Negociere
1 Sigur 0 20 11
2 Avansat 0 10 8
3 Mediu 0 15 12
“Pariul lui Pascal”
Raţiunea nu poate determina cu certitudine existenţa sau inexistenţa lui Dumnezeu.
Cu toate acestea, putem alege să pariem pe existenţa sa şi să trăim ca şi cum Dumnezeu există, pentru că posibilul câştig este infinit, iar posibila pierdere nulă.
Structura argumentului
Raţiunea nu poate oferi un răspuns cert
Ca atare, putem încerca să selectăm o opțiune pe baza beneficiului pe care l-am obţine dacă am presupune că este adevărată Dacă alegem D-, nu avem nimic de câştigat, în
ambele situaţii
Dacă alegem D+ şi se dovedeşte că D+, avem un câştig infinit (oricât de mică ar fi probabilitatea D+, valoarea sa estimată e infinită)
Beneficii
D+ D-
Trăiesc ca şi cum D+
Viaţă eternă Nimic
Trăiesc ca şi cum D-
Iad Nimic
Valoarea estimată a beneficiului nu este infinită decât dacă presupunem deja D+
Ce anume preţuieşte D? Onestitatea argumentelor proprii sau credinţa motivată de câştig?
Comparaţi cu:
Raţiunea nu poate determina cu certitudine existenţa sau inexistenţa lui Moş Crăciun (pot exista multe dovezi care par să sprijine ideea că nu există, însă ele nu pot elimina complet posibilitatea existenţei sale).
Putem alege să pariem pe existenţa lui Moş Crăciun şi să ne comportăm ca şi cum el există. Dacă el într-adevăr există, nu avem decât de câştigat. Dacă nu, nu avem nimic de pierdut.
Really?
Valoare estimată
Probabilitate x valoare estimată a beneficiului
“Legea numerelor mari” descrie rezultatul repetării unui experiment de un număr mare de ori; media rezultatelor obținute aproximează valoarea estimată, iar gradul de aproximare crește odată cu numărul repetărilor
De exemplu, o aruncare cu zarul poate produce valorile 1,
2, 3, 4, 5 sau 6 cu probabilitate egală; valoarea estimată a unei singure aruncări este
{1+2+3+4+5+6}/6 = 3.5
Cu cât numărul de aruncări creşte, media rezultatelor se apropie tot mai mult de 3.5.
Paradoxul Sf. Petersburg
Se dă cu banul, cele două rezultate posibile fiind “cap” şi “pajură”. Câştigul jucătorului este cu atât mai mare cu cât reuşeşte să obţină “cap” după un număr mai mare de încercări.
Câştigul la prima încercare este 1 şi se dublează cu fiecare încercare suplimentară în care NU apare “cap”: 1, 2, 4, 8, 16…; în general, dacă rezultatul e “cap” după n încercări, câştigul va fi de 2n.
Valoarea estimată a jocului în ansamblu este
adică iar probabilitatea obţinerii sale de 1/2n.
Din moment ce beneficiul estimat este infinit, teoria valorii
estimate spune că ar trebui să fim dispuşi să investim oricât de mult în şansa de a juca acest joc.
Valoare vs. utilitate Cadrul teoretic standard pentru analiza deciziilor în condiţii de
incertitudine este oferit de teoria utilităţii estimate. Formulată în linii mari de către Daniel Bernoulli în prima jumătate a sec. al XVIII-lea, teoria a revenit în prim-plan odată cu axiomatizarea propusă de John von Neumann şi Oskar Morgenstern în 1944 .
Valoarea estimată (de exemplu, câştigul financiar posibil înmulţit cu probabilitatea obţinerii sale) este înlocuită cu utilitatea estimată. În cazul său, estimarea beneficiilor cuantificabile trebuie să ia în calcul nu doar probabilităţile de apariţie, ci şi modul în care decidenţii interpretează potenţialele beneficii, prin raportare la propriile înzestrări, preferințe și obiective.
În particular, se presupune că deciziile:
vor avea în vedere poziţionarea pe o scală a utilităţii marginale descrescătoare
vor viza cu prioritate minimizarea riscurilor în raport cu maximizarea beneficiilor.
Efecte de reprezentare
efectul de certitudine - presupune faptul că agenţii tind să subevalueze consecinţele probabile în comparaţie cu cele percepute drept sigure; ca atare, în multe situaţii ei pot ajunge să aleagă, contrar predicţiilor ipotezei utilităţii estimate, un rezultat cu o probabilitate mai mare, însă cu o utilitate estimată mai mică.
Acest lucru poate determina un comportament marcat de aversiune faţă de risc în situaţii care implică câştiguri sigure, şi de căutare a riscului în situaţii care implică pierderi sigure.
efectul de posesie (endowment effect) - determină o supraevaluare a utilităţii acelor bunuri care se află deja în posesia agentului, în comparaţie cu bunurile (identice sau echivalente) care nu se află în posesia sa.
Efecte de reprezentare
preferinţa pentru status quo (rezistenţa la schimbare) implică faptul că subiecţii vor opta în mod preferenţial pentru acele alternative care tind să păstreze neschimbată situaţia prezentă, chiar dacă oferă o utilitate estimată mai mică.
caracterul referenţial al funcţiilor de utilitate - indivizii nu se raportează exclusiv la utilitatea potenţială care le poate reveni, ci şi la utilitatea care le revine celorlalţi.
Valoarea determinată a utilităţii individuale este stabilită referenţial – de exemplu, în condiţiile în care toţi membrii unui grup au avut beneficii comparabile, diferenţa de utilitate primită de un membru al grupului este considerată mai puţin importantă decât ar fi fost în condiţiile unor diferenţe semnificative de distribuire a beneficiilor.
Agregarea preferinţelor individuale
Agregarea preferinţelor
RCT – individualism metodologic
Putem vorbi de preferinţe şi intenţii colective în sensul în care vorbim de preferinţe şi intenţii individuale?
Divergenţa de opinii, preferinţe şi gusturi este regula, nu excepţia
Există posibilitatea de a agrega preferinţe individuale, obţinând un rezultat care să ofere o reprezentare corectă a acestora la nivel colectiv?
Paradoxul lui Condorcet
Să presupunem că la nivelul unui consiliu municipal se discută modul de distribuire a finanţării pentru trei proiecte: construirea unor laboratoare de informatică în şcoli (x), repararea străzilor (y) şi modernizarea pieţelor agroalimentare (z).
Consilierii votează, pentru a stabili priorităţile de finanţare. Presupunând că fiecare consilier are preferinţe stricte, am putea determina preferinţa socială pentru una din cele trei opţiuni prin compararea succesivă a opţiunilor, două câte două, pe baza regulii majorităţii.
În măsura în care există o anumită opţiune care, comparată cu fiecare opţiune alternativă, este preferată de mai multe persoane, ea reprezintă un învingător Condorcet.
Paradoxul lui Condorcet
Însă există situaţii în care nu există un astfel de opţiune. De exemplu, distribuţia preferinţelor la nivelul celor 30 de consilieri municipali este următoarea:
10 îl preferă pe x lui y şi pe y lui z,
10 îl preferă pe z lui x şi pe x lui y,
10 îl preferă pe y lui z şi pe z lui x.
La nivelul întregului grup, constatăm că 20 de consilieri îl preferă pe x lui y, alţi 20 îl preferă pe y lui z, iar alţi 20 îl preferă pe z lui x. Dincolo de faptul că nu putem selecta o opţiune pe baza evaluărilor binare, observăm că preferinţele lor colective sunt intranzitive.
Paradoxul lui Condorcet
Evident, explicaţia ţine de faptul că aceste ordonări ciclice ale preferinţelor aparţin unor majorităţi distincte.
Problema agregării ”corecte” a preferinţelor individuale în preferinţe colective este irelevantă în acest caz, unde avem o majoritate variabilă cu preferinţe intranzitive.
Caracterul intranzitiv al preferinţelor majorităţii este perfect compatibil cu presupunerea că ordonarea preferinţelor individuale este tranzitivă în cazul fiecărui membru al grupului.
Teorema lui Arrow
Kenneth Arrow a oferit însă o demonstraţie care vizează orice posibil sistem de agregare a preferinţelor individuale (implicit, orice sistem de vot) în preferinţe colective.
Teorema de imposibilitate sau paradoxul lui Arrow demonstrează imposibilitatea ajungerii la un model de decizie colectivă care să respecte un set minimal de criterii de adecvare raţională.
Problema constă în a găsi o funcţie a alegerii sociale (social choice function) care transformă setul de ierarhizări individuale ale preferinţelor într-o ierarhizare globală.
Teorema lui Arrow Această funcţie ar trebui să aibă următoarele proprietăţi:
Ordonare – funcţia presupune o ordonare unică a alternativelor bazată pe ordonările (ierarhizările) individuale; orice ierarhizare globală a preferinţelor trebuie să fie realizabilă pe baza unui set de ierarhizări individuale
Domeniu nerestrictiv - funcţia trebuie să ia în calcul toate seturile posibile de ierarhizări individuale ale preferinţelor
Eficienţă Pareto – dacă un individ preferă x lui y şi toţi ceilalţi indivizi preferă x lui y sau sunt indiferenţi între x şi y, atunci funcţia exprimă o preferinţă a lui x asupra lui y
Absenţa dictaturii – funcţia nu trebuie să se bazeze pe o generalizare bazată ordonarea preferinţelor unui singur individ
Independenţa alternativelor irelevante – ordonarea socială a alternativelor x şi y este doar o funcţie a ordonărilor individuale ale lui x şi y independent de ordonările alternativelor irelevante (ale lui x şi z, de exemplu).
Teorema lui Arrow
Teorema lui Arrow afirmă că, pentru situaţii care includ cel puţin trei membri şi cel puţin trei alternative, este imposibil de definit o funcţie a alegerii sociale care să îndeplinească simultan toate condiţiile de mai sus.
Aparent, nu există nicio formulă de agregare a unor preferinţe individuale tranzitive în preferinţe colective tranzitive. Demonstraţia lui Arrow arată că, în măsura în care putem construi o funcţie a alegerii sociale care respectă condiţiile 1, 2, 3 şi 5, atunci există cel puţin o ordonare a preferinţelor determinată de un „dictator” (nu este respectată condiţia 4).
Teorema lui Arrow
În măsura în care acceptăm necesitatea celor 5 criterii - nu există o metodă infailibilă de agregare a preferinţelor (regula majorităţii sau oricare alta) cu aplicabilitate generală.
Metoda respectivă nu poate oferi garanţia asigurării unei reprezentări colective adecvate a tuturor ordonărilor individuale ale preferinţelor.
Acest rezultat poate fi interpretat drept un obstacol insurmontabil în construirea oricărui sistem de reprezentare socială a intereselor şi urmărire a unor beneficii comune – de la sisteme electorale la administraţii locale.