Inhoudsopgave:
- Normatieve theorieën van rationele keuze: verwacht nut
- 1. Definiëren van verwacht hulpprogramma
- 2. Argumenten voor verwachte gebruikstheorie
- 3. Obstructies voor verwachte gebruikstheorie
- 4. Toepassingen
- Bibliografie
- Academische hulpmiddelen
- Andere internetbronnen

Video: Normatieve Theorieën Van Rationele Keuze: Verwacht Nut

2023 Auteur: Noah Black | [email protected]. Laatst gewijzigd: 2023-06-03 13:32
Toegang navigatie
- Inhoud van het item
- Bibliografie
- Academische hulpmiddelen
- Vrienden PDF-voorbeeld
- Info over auteur en citaat
- Terug naar boven
Normatieve theorieën van rationele keuze: verwacht nut
Voor het eerst gepubliceerd op 8 augustus 2014; inhoudelijke herziening do 15 aug.2019
We moeten vaak beslissingen nemen onder onzekere omstandigheden. Het volgen van een diploma in de biologie kan leiden tot lucratieve werkgelegenheid, of tot werkloosheid en verpletterende schulden. Een afspraak met een arts kan leiden tot het vroegtijdig opsporen en behandelen van een ziekte, of het kan geldverspilling zijn. De verwachte utiliteitstheorie is een verslag van hoe je rationeel kunt kiezen als je niet zeker weet welke uitkomst jouw handelingen zullen opleveren. De basisslogan is: kies de handeling met de hoogste verwachte bruikbaarheid.
Dit artikel bespreekt de verwachte gebruikstheorie als een normatieve theorie, dat wil zeggen een theorie over hoe mensen beslissingen moeten nemen. In de klassieke economie wordt de verwachte gebruikstheorie vaak gebruikt als een beschrijvende theorie - dat wil zeggen een theorie over hoe mensen beslissingen nemen - of als een voorspellende theorie - dat wil zeggen, een theorie die, hoewel het de psychologische mechanismen van besluitvorming, voorspelt de keuzes van mensen correct. De verwachte gebruikstheorie maakt verkeerde voorspellingen over de beslissingen van mensen in veel reële keuzesituaties (zie Kahneman & Tversky 1982); dit geeft echter geen uitsluitsel of mensen beslissingen moeten nemen op basis van verwachte overwegingen van nut.
Het verwachte nut van een handeling is een gewogen gemiddelde van de nutsvoorzieningen van elk van de mogelijke uitkomsten, waarbij het nut van een uitkomst meet in hoeverre die uitkomst de voorkeur heeft of de voorkeur verdient boven de alternatieven. Het nut van elke uitkomst wordt gewogen naar de waarschijnlijkheid dat de handeling tot die uitkomst zal leiden. Hoofdstuk 1 vult deze basisdefinitie van het verwachte nut in striktere termen aan en bespreekt de relatie met de keuze. Hoofdstuk 2 bespreekt twee soorten argumenten voor de verwachte gebruikstheorie: representatiestellingen en statistische langetermijnargumenten. Paragraaf 3 gaat in op bezwaren tegen de verwachte utiliteitstheorie; sectie 4 bespreekt haar toepassingen in de filosofie van religie, economie, ethiek en epistemologie.
-
1. Definiëren van verwacht hulpprogramma
- 1.1 Voorwaardelijke kansen
- 1.2 Resultaatprogramma's
-
2. Argumenten voor verwachte gebruikstheorie
- 2.1 Langlopende argumenten
- 2.2 Representatiestellingen
-
3. Bezwaren tegen de verwachte theorie van het nut
- 3.1 Het maximaliseren van het verwachte hulpprogramma is onmogelijk
- 3.2 Het maximaliseren van het verwachte hulpprogramma is irrationeel
-
4. Toepassingen
- 4.1 Economie en openbaar beleid
- 4.2 Ethiek
- 4.3 Epistemologie
- 4.4 Wet
- Bibliografie
- Academische hulpmiddelen
- Andere internetbronnen
- Gerelateerde vermeldingen
1. Definiëren van verwacht hulpprogramma
Het concept van het verwachte nut wordt het best geïllustreerd door een voorbeeld. Stel, ik ben van plan een lange wandeling te maken en moet beslissen of ik mijn paraplu meeneem. Ik draag de paraplu liever niet op een zonnige dag, maar ik heb liever regen met de paraplu dan zonder. Er staan mij twee acts ter beschikking: mijn paraplu meenemen en thuislaten. Welke van deze acts moet ik kiezen?
Deze informele probleembeschrijving kan iets formeler worden herschikt in drie soorten entiteiten. Ten eerste zijn er uitkomsten -voorwerpen van niet-instrumentele voorkeuren. In het voorbeeld zouden we drie uitkomsten kunnen onderscheiden: ofwel eindig ik droog en onbezwaard; Ik word droog en bezwaard door een logge paraplu; of ik word nat. Ten tweede zijn er toestanden buiten de controle van de beslisser die de uitkomst van de beslissing beïnvloeden. In het voorbeeld zijn er twee toestanden: het regent of niet. Ten slotte zijn er handelingen - objecten van de instrumentele voorkeuren van de beslisser en in zekere zin dingen die ze kan doen. In het voorbeeld zijn er twee handelingen: ik mag ofwel de paraplu meenemen; of laat het thuis. De verwachte gebruikstheorie biedt een manier om de acts te rangschikken op hoe kieskeurig ze zijn:hoe hoger het verwachte nut, hoe beter het is om de handeling te kiezen. (Het is daarom het beste om de handeling te kiezen met de hoogste verwachte bruikbaarheid - of een ervan, in het geval dat meerdere handelingen met elkaar in verband staan.)
Volgens de algemene conventie zal ik de volgende aannames doen over de relaties tussen handelingen, staten en resultaten.
- Toestanden, handelingen en resultaten zijn voorstellen, dat wil zeggen reeksen mogelijkheden. Er is een maximale set mogelijkheden, (Omega), waarvan elke staat, handeling of uitkomst een subset is.
- De reeks handelingen, de reeks staten en de reeks resultaten zijn allemaal partities op (Omega). Met andere woorden, handelingen en toestanden zijn geïndividualiseerd, zodat elke mogelijkheid in (Omega) er een is waar precies één staat verkrijgt, de agent precies één handeling uitvoert en er precies één resultaat volgt.
- Handelingen en staten zijn logisch onafhankelijk, zodat geen enkele staat de uitvoering van een handeling uitsluit.
- Ik ga er voorlopig van uit dat elke handeling, gegeven een toestand in de wereld, precies één mogelijke uitkomst heeft. (Paragraaf 1.1 bespreekt kort hoe men deze veronderstelling zou kunnen verzwakken.)
Het voorbeeld van de paraplu kan dus worden weergegeven in de volgende matrix, waarbij elke kolom overeenkomt met een toestand van de wereld; elke rij komt overeen met een handeling; en elke vermelding komt overeen met de uitkomst die resulteert wanneer de handeling wordt uitgevoerd in de staat van de wereld.
staten | |||
het regent | het regent niet | ||
handelingen | neem paraplu | bezwaard, droog | bezwaard, droog |
paraplu achterlaten | nat | gratis, droog |
Nu ik het basiskader heb opgezet, kan ik het verwachte nut nu nauwkeurig definiëren. Het verwachte nut van een act (A) (bijvoorbeeld mijn paraplu nemen) hangt af van twee kenmerken van het probleem:
- De waarde van elke uitkomst, gemeten door een reëel getal dat een hulpprogramma wordt genoemd.
- De waarschijnlijkheid van elke uitkomst is afhankelijk van (A).
Gezien deze drie stukjes informatie, wordt het verwachte hulpprogramma van (A) gedefinieerd als:
[EU (A) = \ sum_ {o \ in O} P_ {A} (o) U (o))
waar (O) is de reeks resultaten, (P_ {A} (o)) is de kans op uitkomst (o) afhankelijk van (A), en (U (o)) is het hulpprogramma van (o).
In de volgende twee subparagrafen worden de voorwaardelijke waarschijnlijkheidsfunctie (P_A) en de hulpprogramma-functie (U) uitgepakt.
1.1 Voorwaardelijke kansen
De term (P_ {A} (o)) vertegenwoordigt de waarschijnlijkheid van (o) gegeven (A) - ruwweg, hoe waarschijnlijk is het dat de uitkomst (o) zal optreden, in de veronderstelling dat de agent kiest act (A). (Zie voor de axioma's van waarschijnlijkheid het artikel over interpretaties van waarschijnlijkheid.) Om te begrijpen wat dit betekent, moeten we twee vragen beantwoorden. Ten eerste, welke interpretatie van waarschijnlijkheid is geschikt? En ten tweede, wat betekent het om een waarschijnlijkheid toe te kennen in de veronderstelling dat de agent voor act (A) kiest?
Verwachte utiliteitstheoretici interpreteren waarschijnlijkheid vaak als het meten van de individuele mate van geloof, zodat een propositie (E) waarschijnlijk (voor een agent) zo groot is dat die agent vertrouwen heeft in (E) (zie bijvoorbeeld Ramsey 1926, Savage 1972, Jeffrey 1983). Maar niets in het formalisme van de verwachte utiliteitstheorie dwingt ons deze interpretatie. We zouden in plaats daarvan waarschijnlijkheden kunnen interpreteren als objectieve kansen (zoals in von Neumann en Morgenstern 1944), of als de mate van overtuiging die door het bewijs wordt gerechtvaardigd, als we dachten dat dit een betere gids was voor rationeel handelen. (Zie de vermelding over interpretaties van waarschijnlijkheid voor bespreking van deze en andere opties.)
Hoe groot is de kans dat de agent kiest voor (A)? Hier zijn er twee basistypen van antwoord, die overeenkomen met bewijstheorie en causale beslissingstheorie.
Volgens de bewijstheorie van de theorie, onderschreven door Jeffrey (1983), is de relevante veronderstellingskans (P_ {A} (o)) de voorwaardelijke kans (P (o \ mid A)), gedefinieerd als de verhouding van twee onvoorwaardelijke kansen: (P (A \ amp o) / P (A)).
Tegen Jeffrey's definitie van verwachte bruikbaarheid, beweren Spohn (1977) en Levi (1991) dat een beslisser geen waarschijnlijkheden mag toekennen aan de handelingen in overleg: wanneer je vrij beslist om een handeling uit te voeren (A), zou je dat niet moeten doen ' Houd geen rekening met uw overtuiging of u gaat presteren (A). Als Spohn en Levi gelijk hebben, is de verhouding van Jeffrey ongedefinieerd (aangezien de noemer niet gedefinieerd is).
Nozick (1969) werpt nog een bezwaar op: Jeffrey's definitie geeft vreemde resultaten in het Newcomb-probleem. Een voorspeller geeft u een gesloten doos met $ 0 of $ 1 miljoen en biedt u een open box met $ 1.000 extra. U kunt de open doos ("één doos") weigeren of de open doos ("twee dozen") nemen. Maar er is een addertje onder het gras: de voorspeller heeft uw keuze vooraf voorspeld en al haar voorspellingen zijn 90% nauwkeurig. Met andere woorden, de kans dat u één box heeft, aangezien ze u één box voorspelt, is 90%, en de kans dat u twee boxen krijgt, aangezien zij u twee boxen voorspelt, is 90%. Ten slotte hangt de inhoud van de gesloten doos af van de voorspelling: als de voorspeller dacht dat je twee dozen zou doen, stopte ze niets in de gesloten doos, terwijl als ze dacht dat je één doos zou doen, ze $ 1 miljoen in de gesloten doos stopte. De matrix voor uw beslissing ziet er als volgt uit:
staten | |||
$ 1 miljoen in gesloten doos | $ 0 in gesloten doos | ||
handelingen | een doos | $ 1.000.000 | $ 0 |
twee-box | $ 1.001.000 | $ 1.000 |
Twee-boksen domineert één-boksen: in elke staat levert twee-boksen een beter resultaat op. Maar volgens Jeffrey's definitie van voorwaardelijke waarschijnlijkheid heeft one-boxing een hogere verwachte bruikbaarheid dan two-boxing. Er is een hoge voorwaardelijke kans om $ 1 miljoen te vinden in de gesloten doos, aangezien je één box hebt, dus one-boxing heeft een hoge verwachte bruikbaarheid. Evenzo is er een hoge voorwaardelijke kans om niets in de gesloten doos te vinden, aangezien je twee boxen hebt, dus twee boxen heeft een laag verwacht nut.
De causale beslistheorie is een alternatief voorstel dat deze problemen omzeilt. Het vereist geen (maar staat nog steeds toe) handelingen om kansen te hebben, en het raadt two-boxing aan in het Newcomb-probleem.
Causale beslissingstheorie is er in vele varianten, maar ik zal een representatieve versie overwegen die is voorgesteld door Savage (1972), die (P_ {A} (o)) berekent door de waarschijnlijkheden op te tellen van staten die, in combinatie met de handeling (A), leid naar de uitkomst (o). Laten (f_ {A, s} (o)) een uitkomst zijn, die (o) tot 1 koppelt als (o) resultaten oplevert van het uitvoeren van (A) in de staat s, maps (o) anders op 0. Vervolgens
[P_ {A} (o) = \ sum_ {s \ in S} P (s) f_ {A, s} (o))
Op voorstel van Savage komt two-boxing met een hoger verwacht nut dan one-boxing. Dit resultaat geldt ongeacht welke kansen u aan de staten toewijst voorafgaand aan uw beslissing. Laat (x) de kans zijn die u toewijst aan de staat dat de gesloten doos $ 1 miljoen bevat. Volgens Savage zijn de verwachte hulpprogramma's van respectievelijk one-boxing en two-boxing:
[x { cdot} U ({$ 1.000.000}) + (1 - x) { cdot} U ($ 0))
en
[x { cdot} U ({$ 1.001.000}) + (1 - x) { cdot} U ({$ 1.000}))
Zolang de grotere geldbedragen strikt grotere nutsbedrijven toegewezen krijgen, is de tweede som (het nut van two-boxing) gegarandeerd groter dan het eerste (het nut van one-boxing).
Savage gaat ervan uit dat elke handeling en staat voldoende zijn om een uitkomst uniek te bepalen. Maar er zijn gevallen waarin deze veronderstelling niet klopt. Stel dat u aanbiedt mij de volgende gok te verkopen: u gooit een munt; als de munt de kop opsteekt, win ik $ 100; en als de munt staarten raakt, verlies ik $ 100. Maar ik weiger de gok en de munt wordt nooit weggegooid. Er zou geen uitkomst zijn als de munt was weggegooid - ik had misschien $ 100 gewonnen en ik had misschien $ 100 verloren.
We kunnen het voorstel van Savage generaliseren door (f_ {A, s}) een waarschijnlijkheidsfunctie te laten zijn die de resultaten toewijst aan reële getallen in het ([0, 1]) interval. Lewis (1981), Skyrms (1980) en Sobel (1994) stellen (f_ {A, s}) gelijk aan de objectieve kans dat (o) de uitkomst zou zijn als state (s) zou worden verkregen en de agent heeft actie (A) gekozen.
In sommige gevallen - het meest bekende probleem van Newcomb - vallen de Jeffrey-definitie en de Savage-definitie van het verwachte nut uit elkaar. Maar wanneer aan de volgende twee voorwaarden is voldaan, gaan ze akkoord.
- Handelingen zijn probabilistisch onafhankelijk van staten. Formeel gesproken, voor alle handelingen (A) en staten (s), [P (s) = P (s \ mid A) = \ frac {P (s \ amp A)} {P (A)}.) (Dit is de voorwaarde die wordt geschonden in het Newcomb-probleem.)
- Voor alle uitkomsten is (o), handelingen (A) en staten (s), (f_ {A, s} (o)) gelijk aan de voorwaardelijke waarschijnlijkheid van (o) gegeven (A) en (s); in formele termen, [f_ {A, s} (o) = P (o \ mid A \ amp s) = \ frac {P (o \ amp A \ amp s)} {P (A \ amp s)}.) (De behoefte aan deze voorwaarde ontstaat wanneer handelingen en staten niet op unieke wijze een uitkomst bepalen; zie Lewis 1981.)
1.2 Resultaatprogramma's
De term (U (o)) vertegenwoordigt het nut van de uitkomst (o) - ongeveer hoe waardevol (o) is. Formeel is (U) een functie die aan elk van de resultaten een reëel getal toekent. (De eenheden die zijn gekoppeld aan (U) worden doorgaans utiles genoemd, dus als (U (o) = 2) zeggen we dat (o) 2 utiles waard is.) Hoe groter het hulpprogramma, hoe meer waardevol de uitkomst.
Wat voor waarde wordt gemeten in gebruiksdoelen? Utiliteiten worden doorgaans niet beschouwd als valuta-eenheden, zoals dollars, ponden of yen. Bernoulli (1738) betoogde dat geld en andere goederen een marginaal nut hebben: naarmate een agent rijker wordt, is elke opeenvolgende dollar (of gouden horloge of appel) voor haar minder waard dan de vorige. Hij geeft het volgende voorbeeld: Het is logisch voor een rijke man, maar niet voor een arme, om 9.000 dukaten te betalen in ruil voor een loterijticket dat 50% kans geeft op 20.000 dukaten en 50% kans op niets. Aangezien de loterij de twee mannen dezelfde kans geeft op elke geldprijs, moeten de prijzen verschillende waarden hebben, afhankelijk van of de speler arm of rijk is.
Klassieke utilitaristen zoals Bentham (1789), Mill (1861) en Sidgwick (1907) interpreteerden nut als een maatstaf voor plezier of geluk. Zeggen dat (A) meer nut heeft dan (B) (voor een agent of een groep agenten), betekent dat (A) meer plezier of geluk oplevert dan (B) (voor die agent of groep agenten).
Een bezwaar tegen deze interpretatie van bruikbaarheid is dat er misschien niet één enkel goed (of zelfs maar enig goed) is dat rationaliteit vereist dat we zoeken. Maar als we 'nut' ruim genoeg begrijpen om alle potentieel wenselijke doelen, plezier, kennis, vriendschap, gezondheid enzovoort op te nemen, is het niet duidelijk dat er een unieke juiste manier is om de afwegingen tussen verschillende goederen te maken, zodat elke uitkomst een nut. Het kan zijn dat er geen goed antwoord is op de vraag of het leven van een asceetische monnik meer of minder goed is dan het leven van een gelukkige libertijn, maar het toekennen van nut aan deze opties dwingt ons om ze te vergelijken.
Hedendaagse beslissingstheoretici interpreteren het nut doorgaans als een maatstaf van voorkeur, dus om te zeggen dat (A) een grotere bruikbaarheid heeft dan (B) (voor een agent), betekent simpelweg dat de agent de voorkeur geeft aan (A) aan (B). Het is cruciaal voor deze benadering dat voorkeuren niet alleen gelden tussen resultaten (zoals hoeveelheden plezier, of combinaties van plezier en kennis), maar ook tussen onzekere vooruitzichten (zoals een loterij die $ 1 miljoen dollar betaalt als een bepaalde munt landt, en resulteert in een uur pijnlijke elektrische schokken als de munt staarten landt). Hoofdstuk 2 van dit artikel gaat in detail in op de formele relatie tussen voorkeur en keuze.
Verwachte utiliteitstheorie vereist niet dat voorkeuren egoïstisch of eigenbelang zijn. Iemand kan er de voorkeur aan geven geld aan een goed doel te geven dan het geld uit te geven aan weelderige diners, of er de voorkeur aan geven zijn eigen leven op te offeren in plaats van zijn kind te laten sterven. Sen (1977) suggereert dat de psychologie van elke persoon het beste wordt weergegeven met behulp van drie classificaties: één die het bekrompen eigenbelang van de persoon vertegenwoordigt, een tweede die het eigenbelang van de persoon vertegenwoordigt, die in bredere zin wordt opgevat om gevoelens van sympathie te verklaren (bijvoorbeeld lijden bij het kijken naar een andere persoon lijden), en een derde die de verbintenissen van de persoon vertegenwoordigt, waardoor zij mogelijk moet handelen tegen haar eigenbelang in brede zin.
Broome (1991) interpreteert hulpprogramma's als het meten van vergelijkingen van objectieve bitterheid en verslechtering, in plaats van persoonlijke voorkeuren: om te zeggen dat (A) een grotere bruikbaarheid heeft dan (B), wil dat zeggen dat (A) objectief beter is dan (B), of dat een rationeel persoon de voorkeur geeft aan (A) boven (B). Net zoals er niets in het formalisme van de waarschijnlijkheidstheorie is dat ons vereist om subjectieve in plaats van objectieve waarschijnlijkheden te gebruiken, zo is er niets in het formalisme van de verwachte utiliteitstheorie dat ons vereist om subjectieve in plaats van objectieve waarden te gebruiken.
Degenen die hulpprogramma's interpreteren in termen van persoonlijke voorkeur staan voor een speciale uitdaging: het zogenaamde probleem van interpersoonlijke hulpprogramma-vergelijkingen. Bij het nemen van beslissingen over de verdeling van gedeelde bronnen willen we vaak weten of Alice door onze daden beter af is dan Bob - en zo ja, hoeveel beter af. Maar als nut een maatstaf is voor individuele voorkeur, is er geen duidelijke, zinvolle manier om deze vergelijkingen te maken. De hulpprogramma's van Alice worden gevormd door de voorkeuren van Alice, de hulpprogramma's van Bob worden gevormd door de voorkeuren van Bob en er zijn geen voorkeuren voor Alice en Bob. We kunnen niet aannemen dat Alice's hulpprogramma 10 gelijk is aan Bob's hulpprogramma 10, net zo min als we kunnen aannemen dat het behalen van een A-cijfer in differentiaalvergelijkingen gelijk is aan het behalen van een A-cijfer bij het weven van mandjes.
Dit is een goed moment om na te gaan welke functies van de hulpprogramma-functie zinvolle informatie bevatten. Vergelijkingen zijn informatief: als (U (o_1) gt U (o_2)) (voor een persoon), dan is (o_1) beter dan (of liever dan) (o_2). Maar het zijn niet alleen vergelijkingen die informatief zijn - de nutsfunctie moet andere informatie bevatten, als de verwachte utiliteitstheorie zinvolle resultaten moet opleveren.
Bekijk het overkoepelende voorbeeld opnieuw om te zien waarom. Deze keer heb ik een waarschijnlijkheid voor elke staat ingevuld en een hulpprogramma voor elke uitkomst.
staten | |||
het regent ((P = 0.6)) | het regent niet ((P = 0.4)) | ||
handelingen | neem paraplu | bezwaard, droog ((U = 5)) | bezwaard, droog ((U = 5)) |
paraplu achterlaten | nat ((U = 0)) | gratis, droog ((U = 10)) |
Het verwachte nut van het nemen van de paraplu is
(begin {align} EU (take) & = P _ { take} (bezwaard, \ dry) cdot 5 \& \ quad + P _ { take} (wet) cdot 0 \& \ quad + P _ { take} (gratis, droog) cdot 10 \& = 5 \ end {align})
terwijl het verwachte nut van het verlaten van de paraplu is
(begin {align} EU (leave) & = P _ { leave} (bezwaard, \ dry) cdot 5 \& \ quad + P _ { leave} (wet) cdot 0 \& \ quad + P _ { leave} (vrij, droog) cdot 10 \& = 4 \ end {align})
Sinds (EU (take) gt EU (leave)), vertelt de verwachte gebruikstheorie me dat het beter is om de paraplu te nemen dan hem te verlaten.
Maar stel nu dat we de hulpprogramma's van de resultaten wijzigen: in plaats van (U) te gebruiken, gebruiken we (U ').
staten | |||
het regent ((P = 0.6)) | het regent niet ((P = 0.4)) | ||
handelingen | neem paraplu | bezwaard, droog ((U '= 4)) | bezwaard, droog ((U '= 4)) |
paraplu achterlaten | nat ((U '= 2)) | gratis, droog ((U '= 8)) |
Het nieuwe verwachte nut van het nemen van de paraplu is
(begin {align} EU '(take) & = P _ { take} (bezwaard, \ dry) cdot 4 \& \ quad + P _ { take} (wet) cdot 2 \& \ quad + P _ { take} (gratis, droog) cdot 8 \& = 4 \ end {align})
terwijl het nieuwe verwachte nut van het verlaten van de paraplu is
(begin {align} EU '(leave) & = P _ { leave} (bezwaard, \ dry) cdot 4 \& \ quad + P _ { leave} (wet) cdot 2 \& \ quad + P _ { leave} (vrij, droog) cdot 8 \& = 4.4 \ end {align})
Sinds (EU '(take) lt EU' (leave)), vertelt de verwachte gebruikstheorie me dat het beter is om de paraplu te verlaten dan deze te nemen.
De hulpprogramma-functies (U) en (U ') rangschikken de resultaten op precies dezelfde manier: gratis, droog is het beste; bezwaarde, droge rijen in het midden; en nat is het ergst. Maar de verwachte utiliteitstheorie geeft verschillende adviezen in de twee versies van het probleem. Er moet dus een wezenlijk verschil zijn tussen voorkeuren die correct zijn beschreven door (U) en voorkeuren die correct zijn beschreven door (U '). Anders is de verwachte gebruikstheorie wispelturig en kan deze haar advies veranderen wanneer ze verschillende beschrijvingen van hetzelfde probleem krijgt.
Wanneer vertegenwoordigen twee nutsfuncties dezelfde basistoestand? De meettheorie beantwoordt de vraag door de toegestane transformaties van een utiliteitsfunctie te karakteriseren - manieren om deze te veranderen waardoor al zijn betekenisvolle kenmerken intact blijven. Als we de toegestane transformaties van een nutsfunctie karakteriseren, hebben we daarbij gespecificeerd welke van zijn kenmerken zinvol zijn.
Verdedigers van de verwachte utiliteitstheorie vereisen doorgaans dat het nut wordt gemeten door een lineaire schaal, waarbij de toegestane transformaties alle zijn en alleen de positieve lineaire transformaties, dat wil zeggen functies (f) van de vorm
[f (U (o)) = x { cdot} U (o) + y)
voor echte nummers (x \ gt 0) en (y).
Positieve lineaire transformaties van uitkomsthulpprogramma's zullen nooit de uitspraken van de verwachte utiliteitstheorie beïnvloeden: als (A) een groter verwachte bruikbaarheid heeft dan (B) waar nut wordt gemeten door functie (U), dan (A) zal ook een grotere verwachte bruikbaarheid hebben dan (B) waar de bruikbaarheid wordt gemeten door een positieve lineaire transformatie van (U).
2. Argumenten voor verwachte gebruikstheorie
Waarom voor handelingen kiezen die het verwachte nut maximaliseren? Een mogelijk antwoord is dat de verwachte utiliteitstheorie rationeel fundament is, dat wil zeggen dat het doel en de rationaliteit in wezen het maximaliseren van het verwachte nut inhouden. Voor degenen die dit antwoord niet bevredigend vinden, zijn er nog twee andere bronnen van rechtvaardiging. Ten eerste zijn er langetermijnargumenten, die gebaseerd zijn op bewijs dat verwachte maximalisatie van nutsbedrijven op de lange termijn een winstgevend beleid is. Ten tweede zijn er argumenten die gebaseerd zijn op representatiestellingen, die suggereren dat bepaalde rationele beperkingen op voorkeur ertoe leiden dat alle rationele middelen het verwachte nut maximaliseren.
2.1 Langlopende argumenten
Een reden om het verwachte nut te maximaliseren, is dat het op de lange termijn een goed beleid oplevert. Feller (1968) geeft een versie van dit argument. Hij baseert zich op twee wiskundige feiten over waarschijnlijkheden: de sterke en zwakke wetten van grote aantallen. Beide feiten hebben betrekking op reeksen onafhankelijke, identiek verdeelde proeven - het soort opstelling dat het gevolg is van herhaaldelijk op dezelfde manier wedden op een reeks roulette-spins of craps-spellen. Zowel de zwakke als de sterke wetten van grote aantallen zeggen grofweg dat op de lange termijn de gemiddelde hoeveelheid gewonnen nut per proef overweldigend waarschijnlijk dicht in de buurt komt van de verwachte waarde van een individuele proef.
De zwakke wet van grote aantallen stelt dat waar elke proef een verwachte waarde heeft van (mu), voor willekeurig kleine reële getallen (epsilon \ gt 0) en (delta \ gt 0), er is een eindig aantal proeven (n), zodat voor alle (m) groter dan of gelijk aan (n), met waarschijnlijkheid ten minste (1- \ delta), de gemiddelde winst van de gokker voor de eerste (m) proeven vallen binnen (epsilon) van (mu). Met andere woorden, bij een lange periode van gelijkaardige gok is het zeer waarschijnlijk dat de gemiddelde winst per proef binnen een beperkte tijd willekeurig willekeurig in de buurt komt van de verwachte waarde van de gok. Dus op de eindige lange termijn zal de gemiddelde waarde van een gok overweldigend waarschijnlijk dicht bij de verwachte waarde liggen.
De sterke wet van grote aantallen stelt dat waar elke proef een verwachte waarde heeft van (mu), voor een willekeurig klein reëel getal (epsilon \ gt 0), naarmate het aantal proeven toeneemt, de kans dat de De gemiddelde winst van een gokker per proef valt binnen (epsilon) van (mu) en komt overeen met 1. Met andere woorden, naarmate het aantal herhalingen van een gok oneindig nadert, zal de gemiddelde winst per proef willekeurig dicht bij de verwachte waarde van gok met waarschijnlijkheid 1. Op de lange termijn zal de gemiddelde waarde die aan een gok is gekoppeld dus vrijwel zeker gelijk zijn aan de verwachte waarde.
Er zijn verschillende bezwaren tegen deze langetermijnargumenten. Ten eerste kunnen veel beslissingen niet voor onbepaalde tijd op veel vergelijkbare beproevingen worden herhaald. Beslissingen over welke carrière moeten worden nagestreefd, met wie te trouwen en waar te wonen, worden bijvoorbeeld op zijn best een klein eindig aantal keren genomen. Bovendien, wanneer deze beslissingen meer dan eens worden genomen, hebben verschillende onderzoeken verschillende mogelijke uitkomsten met verschillende waarschijnlijkheden. Het is niet duidelijk waarom langetermijnoverwegingen over herhaalde gokken van invloed zouden moeten zijn op deze individuele casuskeuzes.
Ten tweede beroept het argument zich op twee aannames over onafhankelijkheid, waarvan er één of beide kunnen mislukken. Een veronderstelling is dat de kansen van de verschillende onderzoeken onafhankelijk zijn. Dit geldt voor casinogokken, maar niet voor andere keuzes waarbij we de beslissingstheorie willen gebruiken, bijvoorbeeld keuzes over medische behandeling. Door ziek te blijven na een antibioticakuur, is de kans groter dat ik na de volgende kuur ziek blijf, omdat het de kans vergroot dat antibioticaresistente bacteriën zich door mijn lichaam verspreiden. Het argument vereist ook dat de hulpprogramma's van verschillende proeven onafhankelijk zijn, zodat het winnen van een prijs voor één proef dezelfde bijdrage levert aan het algemene nut van de beslisser, ongeacht wat ze wint bij andere proeven. Maar deze veronderstelling wordt in veel praktijkgevallen geschonden. Vanwege het afnemende marginale nut van geld is het winnen van $ 10 miljoen op tien roulettespellen niet tien keer zoveel waard als $ 1 miljoen winnen op één roulettespel.
Een derde probleem is dat de sterke en zwakke wetten van grote aantallen modaal zwak zijn. Geen van beide wetten houdt in dat als een gok voor onbepaalde tijd zou worden herhaald (onder de juiste veronderstellingen), de gemiddelde winst per test in de buurt van het verwachte nut van het spel zou liggen. Ze stellen alleen vast dat de gemiddelde winst per test met een hoge waarschijnlijkheid dicht bij het verwachte nut van de game ligt. Maar hoge waarschijnlijkheid - zelfs waarschijnlijkheid 1 - is geen zekerheid. (De standaardwaarschijnlijkheidstheorie verwerpt het Cournot-principe, dat zegt dat gebeurtenissen met een lage of nulkans niet zullen gebeuren. Maar zie Shafer (2005) voor een verdediging van het Cournot-principe.) Voor elke reeks onafhankelijke, identiek verdeelde proeven is het mogelijk voor de gemiddelde uitbetaling van nut per proef om willekeurig af te wijken van het verwachte nut van een individuele proef.
2.2 Representatiestellingen
Een tweede type argument voor de verwachte utiliteitstheorie berust op zogenaamde representatiestellingen. We volgen Zynda's (2000) formulering van dit argument - enigszins aangepast om de rol van zowel nutsbedrijven als waarschijnlijkheden weer te geven. Het argument heeft drie premissen:
De rationaliteitsvoorwaarde.
De axioma's van de verwachte gebruikstheorie zijn de axioma's van rationele voorkeur.
Representabiliteit.
Als iemands voorkeuren voldoen aan de axioma's van de verwachte utiliteitstheorie, kan ze worden voorgesteld als iemand die gelooft dat ze de wetten van de waarschijnlijkheidsrekening gehoorzamen [en een utiliteitsfunctie zodat ze de voorkeur geeft aan handelingen met een hogere verwachte bruikbaarheid].
De realiteitsconditie.
Als een persoon kan worden weergegeven als iemand met een bepaalde mate van overtuiging die de waarschijnlijkheidsrekening gehoorzaamt [en een nuttige functie zodat hij de voorkeur geeft aan handelingen met een hogere verwachte bruikbaarheid], dan heeft de persoon echt een mate van overtuiging die de wetten van de waarschijnlijkheidsrekening volgt [en geeft echt de voorkeur aan handelingen met een hoger verwacht nut].
Deze premissen brengen de volgende conclusie met zich mee.
Als een persoon [nalaat handelingen met een hoger verwacht nut te gebruiken], dan schendt die persoon ten minste één van de axioma's van rationele voorkeur.
Als de premissen waar zijn, laat het argument zien dat er iets mis is met mensen wier voorkeuren in strijd zijn met de verwachte utiliteitstheorie - ze schenden de axioma's van rationele voorkeur. Laten we elk van de gebouwen nader bekijken, te beginnen met het belangrijkste uitgangspunt, representatie.
Een waarschijnlijkheidsfunctie en een utiliteitsfunctie vertegenwoordigen samen een reeks voorkeuren voor het geval de volgende formule geldt voor alle waarden van (A) en (B) in het domein van de voorkeursrelatie
[EU (A) gt EU (B) text {als en alleen als} A \ text {de voorkeur heeft boven} B.)
Wiskundige bewijzen van representabiliteit worden representatiestellingen genoemd. Paragraaf 2.1 onderzoekt drie van de meest invloedrijke representatiestellingen, die elk berusten op een andere set axioma's.
Ongeacht welke set axioma's we gebruiken, de Rationality Condition is controversieel. In sommige gevallen schenden voorkeuren die rationeel toelaatbaar lijken - misschien zelfs rationeel vereist - de axioma's van de verwachte utiliteitstheorie. Hoofdstuk 3 bespreekt dergelijke gevallen in detail.
De Reality Condition is ook controversieel. Hampton (1994), Zynda (2000) en Meacham en Weisberg (2011) wijzen er allemaal op dat representatief zijn met een waarschijnlijkheids- en utiliteitsfunctie niet een waarschijnlijkheids- en nutsfunctie heeft. Immers, een agent die kan worden weergegeven als een verwachte utiliteitsmaximalisator met geloofsgraden die de waarschijnlijkheidsrekening gehoorzamen, kan ook worden voorgesteld als iemand die het verwachte nut niet maximaliseert met geloofsgraden die de waarschijnlijkheidsrekening schenden. Waarom zou u denken dat de verwachte representatie van het hulpprogramma de juiste is?
Er zijn verschillende mogelijkheden. Misschien kan de verdediger van representatiestellingen stellen dat wat het is om een bepaalde mate van geloof en nut te hebben, alleen is om de overeenkomstige voorkeuren te hebben. De belangrijkste uitdaging voor verdedigers van dit antwoord is om uit te leggen waarom representaties in termen van verwachte bruikbaarheid verklarend nuttig zijn en waarom ze beter zijn dan alternatieve representaties. Of misschien zijn waarschijnlijkheden en nutsbedrijven een goede opgeruimde theoretische vervanging voor onze volksopvattingen over geloof en voor verlangens nauwkeurige wetenschappelijke vervangingen voor onze volksconcepten. Meacham en Weisberg betwisten deze reactie, met het argument dat waarschijnlijkheden en hulpprogramma's slechte stand-ins zijn voor onze volksopvattingen. Een derde mogelijkheid, gesuggereerd door Zynda, is dat feiten over geloofsovertuigingen waar worden gemaakt onafhankelijk van de voorkeuren van de agent,en bieden een principiële manier om het bereik van acceptabele weergaven te beperken. De uitdaging voor verdedigers van dit type reactie is om te specificeren wat deze aanvullende feiten zijn.
Ik kijk nu naar drie invloedrijke representatiestellingen. Deze representatiestellingen verschillen op drie van filosofisch belangrijke manieren van elkaar.
Ten eerste zijn verschillende representatiestellingen het niet eens over de objecten van voorkeur en nut. Zijn ze herhaalbaar? Moeten ze volledig onder de controle van de agent vallen
Ten tweede verschillen representatiestellingen in hun behandeling van waarschijnlijkheid. Ze zijn het oneens over welke entiteiten waarschijnlijkheden hebben en of dezelfde objecten zowel waarschijnlijkheden als hulpprogramma's kunnen hebben.
Ten derde, terwijl elke representatiestelling bewijst dat er voor een geschikte voorkeursvolgorde een kans- en utiliteitsfunctie bestaat die de voorkeursvolgorde vertegenwoordigt, verschillen ze hoe uniek deze waarschijnlijkheid en utiliteitsfunctie zijn. Met andere woorden, ze verschillen wat betreft de transformaties van de waarschijnlijkheids- en nutsfuncties.
2.2.1 Ramsey
Het idee van een representatiestelling voor het verwachte nut gaat terug tot Ramsey (1926). (Zijn schets van een representatiestelling wordt vervolgens ingevuld door Bradley (2004) en Elliott (2017).) Ramsey gaat ervan uit dat voorkeuren worden gedefinieerd over een domein van gokken, die één prijs opleveren op voorwaarde dat een voorstel (P) is waar, en een andere prijs op voorwaarde dat (P) niet waar is. (Voorbeelden van gokken: u ontvangt een onesie als u anders een baby krijgt en een fles whisky; u ontvangt twintig dollar als Bojack de Kentucky Derby wint en anders een dollar verliest.)
Ramsey noemt een voorstel ethisch neutraal wanneer 'twee mogelijke werelden die alleen verschillen wat betreft [de waarheid] altijd van gelijke waarde zijn'. Voor een ethisch neutrale propositie kan waarschijnlijkheid 1/2 worden gedefinieerd in termen van voorkeur: zo'n propositie heeft waarschijnlijkheid 1/2 voor het geval je onverschillig bent aan welke kant je inzet. (Dus als Bojack de Kentucky Derby wint, is dit een ethisch neutrale propositie, het heeft waarschijnlijkheid 1/2 voor het geval je onverschillig bent tussen het winnen van twintig dollar als het waar is en anders het verliezen van een dollar, en het winnen van twintig dollar als het niet waar is en het verliezen van een dollar) anders.)
Door een ethisch neutrale propositie met waarschijnlijkheid 1/2 te stellen, samen met een rijke prijzenpot, definieert Ramsey numerieke hulpprogramma's voor prijzen. (Het ruwe idee is dat als je onverschillig bent tussen het ontvangen van een middelmatige prijs (m) zeker, en een gok die een betere prijs oplevert (b) als de ethisch neutrale propositie waar is en een slechtere prijs (w) als het valt, dan bevindt het hulpprogramma van (m) zich halverwege tussen de hulpprogramma's van (b) en (w).) Met behulp van deze numerieke hulpprogramma's gebruikt hij vervolgens de definitie van het verwachte hulpprogramma om te definiëren kansen voor alle andere stellingen.
Het ruwe idee is om de rijkdom van de prijzenruimte te benutten, wat ervoor zorgt dat voor elke gok (g) die een betere prijs oplevert (b) als (E) waar is en een slechtere prijs (w) als (E) onwaar is, is de agent onverschillig tussen (g) en een middelmatige prijs (m). Dit betekent dat (EU (g) = EU (m)). Met behulp van wat algebra, plus het feit dat (EU (g) = P (E) U (b) + (1-P (E)) U (w)), laat Ramsey zien dat
[P (E) = \ frac {(1 - U (m)} {(U (b) - U (w))})
2.2.2 Von Neumann en Morgenstern
Von Neumann en Morgenstern (1944) beweren dat voorkeuren zijn gedefinieerd over een domein van loterijen. Sommige van deze loterijen zijn constant en leveren met zekerheid één prijs op. (Prijzen kunnen bestaan uit een banaan, een miljoen dollar, een miljoen dollar aan schulden, overlijden of een nieuwe auto.) Loterijen kunnen ook andere loterijen als prijzen hebben, zodat men een loterij kan hebben met een kans van 40% op opbrengst een banaan, en een kans van 60% om een gok van 50-50 op te leveren tussen een miljoen dollar en de dood.) Het domein van loterijen wordt gesloten door een mengoperatie, zodat als (L) en (L ') loterijen en (x) is een reëel getal in het ([0, 1]) interval, dan is er een loterij (x L + (1-x) L ') die (L) oplevert met kans (x) en (L ') met kans (1-x). Ze laten zien dat elke voorkeursrelatie die aan bepaalde axioma's gehoorzaamt, kan worden weergegeven door de waarschijnlijkheden die worden gebruikt om de loterijen te definiëren, samen met een nutsfunctie die uniek is tot positieve lineaire transformatie.
2.2.3 Wilde
In plaats van kansen als vanzelfsprekend te beschouwen, zoals von Neumann en Morgenstern doen, definieert Savage (1972) ze in termen van voorkeuren boven handelingen. Savage heeft drie afzonderlijke domeinen. Waarschijnlijkheid hecht aan gebeurtenissen, die we kunnen beschouwen als disjuncties van staten, terwijl nut en intrinsieke voorkeur aan resultaten hechten. Verwacht nut en niet-intrinsieke voorkeur hangen samen met handelingen.
Voor Savage moeten handelingen, staten en resultaten voldoen aan bepaalde beperkingen. Handelingen moeten volledig onder de controle van de agent staan (dus het publiceren van mijn paper in Mind is geen handeling, omdat het gedeeltelijk afhangt van de beslissing van de redacteur, waarover ik geen controle heb). Resultaten moeten hetzelfde nut hebben, ongeacht welke staat wordt verkregen (dus "Ik win een mooie auto" is geen uitkomst, aangezien het nut van de luxe auto groter zal zijn in staten waar de persoon die ik het meest indruk wil maken, wenst dat ik zin had auto, en minder in staten waar ik mijn rijbewijs verlies). Geen enkele staat kan de uitvoering van een handeling uitsluiten, en een handeling en een staat moeten samen met zekerheid een uitkomst bepalen. Voor elke uitkomst (o) is er een constante handeling die (o) in elke staat oplevert. (Dus als wereldvrede een uitkomst is, is er een handeling die resulteert in wereldvrede,ongeacht de toestand van de wereld.) Ten slotte gaat hij ervan uit dat voor elke twee acts (A) en (B) en elke gebeurtenis (E), er een gemengde act (A_E \ amp B_ { sim E}) die hetzelfde resultaat oplevert als (A) als (E) waar is, en anders hetzelfde resultaat als (B). (Dus als wereldvrede en het einde van de wereld beide uitkomsten zijn, dan is er een gemengde daad die resulteert in wereldvrede als een bepaalde munt landt en anders het einde van de wereld.)))
Savage postuleert een voorkeursrelatie boven handelingen en geeft axioma's die die voorkeursrelatie beheersen. Vervolgens definieert hij subjectieve kansen of graden van geloof in termen van voorkeuren. De belangrijkste stap is het definiëren van een "minstens zo waarschijnlijk als" relatie tussen gebeurtenissen; Ik parafraseer hier.
Stel dat (A) en (B) constante handelingen zijn, zodat (A) de voorkeur heeft boven (B). Dan is (E) minstens zo waarschijnlijk als (F) voor het geval de agent de voorkeur geeft aan (A_E \ amp B _ { sim E}) (de handeling die (A) oplevert als (E) verkrijgt, en (B) anders) naar (A_F \ amp B _ { sim F}) (de handeling die (A) oplevert als (F) verkrijgt, en (B) anders), of anders is onverschillig tussen (A_E \ amp B _ { sim E}) en (A_F \ amp B _ { sim F}).
De gedachte achter de definitie is dat de agent (E) minstens zo waarschijnlijk acht als (F) voor het geval ze liever niet op (F) dan op (E) gokt.
Savage geeft dan axioma's die de rationele voorkeur beperken, en laat zien dat elke set van voorkeuren die aan die axioma's voldoen, een 'minstens zo waarschijnlijke' relatie oplevert die uniek kan worden weergegeven door een waarschijnlijkheidsfunctie. Met andere woorden, er is slechts één waarschijnlijkheidsfunctie (P) zodat voor alle (E) en (F), (P (E) ge P (F)) als en slechts als (E) minstens zo waarschijnlijk is als (F). Elke voorkeursrelatie die de axioma's van Savage gehoorzaamt, wordt vertegenwoordigd door deze waarschijnlijkheidsfunctie (P), samen met een nutsfunctie die uniek is tot positieve lineaire transformatie.
De representatiestelling van Savage geeft sterke resultaten: te beginnen met alleen een voorkeursvolgorde, kunnen we een enkele waarschijnlijkheidsfunctie vinden, en een beperkte klasse van nutsfuncties, die die voorkeursvolgorde vertegenwoordigen. Het nadeel is echter dat Savage ongeloofwaardig sterke aannames moet bouwen over het domein van de handelingen.
Luce en Suppes (1965) wijzen erop dat Savage's constante daden onwaarschijnlijk zijn. (Bedenk dat constante handelingen in elke staat dezelfde uitkomst en dezelfde hoeveelheid waarde opleveren.) Neem een zeer goede uitkomst - totale gelukzaligheid voor iedereen. Is er werkelijk een constante handeling die deze uitkomst in alle mogelijke toestanden heeft, ook in staten waar de mensheid door een meteoor wordt weggevaagd? Savage's afhankelijkheid van een rijke ruimte van gemengde acts is ook problematisch. Savage heeft moeten aannemen dat elke twee uitkomsten en elke gebeurtenis, er een gemengde handeling is die de eerste uitkomst oplevert als de gebeurtenis plaatsvindt, en anders de tweede uitkomst? Is er echt een daad die totale gelukzaligheid oplevert als iedereen wordt gedood door een antibioticaresistente plaag, en anders totale ellende? Luce en Krantz (1971) suggereren manieren om Savage te herformuleren 's representatiestelling die deze aannames verzwakt, maar Joyce (1999) stelt dat zelfs op de verzwakte aannames het domein van de handelingen onwaarschijnlijk rijk blijft.
2.2.4 Bolker en Jeffrey
Bolker (1966) bewijst een algemene representatiestelling over wiskundige verwachtingen, die Jeffrey (1983) gebruikt als basis voor een filosofisch verslag van de verwachte gebruikstheorie. De stelling van Bolker gaat uit van een enkel domein van proposities, die zowel objecten van voorkeur, bruikbaarheid als waarschijnlijkheid zijn. De stelling dat het vandaag gaat regenen heeft dus zowel een nut als een waarschijnlijkheid. Jeffrey interpreteert dit hulpprogramma als de nieuwswaarde van de propositie - een maatstaf voor hoe blij of teleurgesteld ik zou zijn om te horen dat de propositie waar was. Volgens afspraak stelt hij de waarde van de noodzakelijke propositie op 0 - de noodzakelijke propositie is helemaal geen nieuws! Evenzo heeft de stelling dat ik mijn paraplu meeneem naar het werk, wat een handeling is, zowel een waarschijnlijkheid als een nut. Jeffrey interpreteert dit als dat ik een zekere overtuiging heb over wat ik zal doen.
Bolker geeft axioma's een beperkende voorkeur en laat zien dat alle voorkeuren die aan zijn axioma's voldoen, kunnen worden weergegeven door een waarschijnlijkheidsmaatregel (P) en een utiliteitsmaatregel (U). Bolker's axioma's zorgen er echter niet voor dat (P) uniek is, of dat (U) uniek is tot positieve lineaire transformatie. Ze laten ons ook niet toe om vergelijkende waarschijnlijkheid te definiëren in termen van voorkeur. Waar (P) en (U) samen een voorkeursvolgorde vertegenwoordigen, laat Bolker zien dat het paar (langle P, U \ rangle) uniek is tot een fractionele lineaire transformatie.
In technische termen, waar (U) een genormaliseerde nutsfunctie is, zodat (U (Omega) = 0), (inf) de grootste ondergrens is van de waarden die zijn toegewezen door (U), (sup) is de laagste bovengrens van de waarden die zijn toegewezen door (U), en (lambda) is een parameter die valt tussen (- 1 / inf) en (- 1 / sup), de fractionele lineaire transformatie (langle P _ { lambda}, U _ { lambda} rangle) van (langle P, U \ rangle) die overeenkomt met (lambda) wordt gegeven door:
(begin {align} P _ { lambda} & = P (x) (1 + \ lambda U (x)) \ U _ { lambda} & = U (x) ((1+ \ lambda) / (1 + \ lambda U (x)) end {align})
Merk op dat fractionele lineaire transformaties van een waarschijnlijkheid-nutspaar het niet eens kunnen zijn met het oorspronkelijke paar over welke proposities waarschijnlijker zijn dan welke andere.
Joyce (1999) laat zien dat met aanvullende middelen de stelling van Bolker kan worden gewijzigd om een unieke (P) en een (U) vast te pinnen die uniek is tot positieve lineaire transformatie. We hoeven de voorkeursvolgorde alleen aan te vullen met een primitieve "waarschijnlijker dan" -relatie, die wordt beheerst door zijn eigen set axioma's, en door verschillende aanvullende axioma's wordt gekoppeld aan geloof. Joyce past het resultaat van Bolker aan om aan te tonen dat, gezien deze extra axioma's, de "waarschijnlijker dan" -relatie wordt vertegenwoordigd door een unieke (P), en de voorkeursvolgorde wordt weergegeven door (P) samen met een hulpprogramma-functie die uniek is tot positieve lineaire transformatie.
2.2.5 Samenvatting
Samen kunnen deze vier representatiestellingen hierboven worden samengevat in de volgende tabel.
Stelling |
Voorwerpen van voorkeur |
Orde van de bouw |
Toegestane transformaties: waarschijnlijkheid |
Toegestane transformaties: hulpprogramma |
Ramsey | gokken | voorkeur → hulpprogramma → waarschijnlijkheid | identiteit | positief lineair |
von Neumann / Morgenstern |
loterijen | (voorkeur & waarschijnlijkheid) → nut | N.v.t. | positief lineair |
Wilde | handelingen | voorkeur → waarschijnlijkheid → nut | identiteit | positief lineair |
Jeffrey / Bolker | stellingen | voorkeur → (waarschijnlijkheid & nut) | - fractioneel lineair - |
Merk op dat de volgorde van constructie verschilt tussen stellingen: Ramsey construeert een representatie van waarschijnlijkheid met gebruik van nut, terwijl von Neumann en Morgenstern beginnen met waarschijnlijkheden en een representatie van nut construeren. Dus hoewel de pijlen een wiskundige representatierelatie vertegenwoordigen, kunnen ze geen metafysische aardingsrelatie vertegenwoordigen. De realiteitsvoorwaarde moet onafhankelijk van elke representatiestelling worden gerechtvaardigd.
Geschikt gestructureerde ordinale kansen (de relaties die zijn uitgekozen door 'minstens zo waarschijnlijk als', 'waarschijnlijker dan' en 'even waarschijnlijk') staan in één-op-één-correspondentie met de kardinale waarschijnlijkheidsfuncties. Ten slotte geeft de grijze lijn van voorkeuren naar ordinale waarschijnlijkheden aan dat elke waarschijnlijkheidsfunctie die voldoet aan de axioma's van Savage wordt vertegenwoordigd door een unieke hoofdwaarschijnlijkheid, maar dit resultaat geldt niet voor Jeffrey's axioma's.
Merk op dat het vaak mogelijk is om de pijlen in cirkels te volgen - van voorkeur tot ordinale waarschijnlijkheid, van ordinale waarschijnlijkheid tot kardinale waarschijnlijkheid, van kardinale waarschijnlijkheid en voorkeur tot verwachte bruikbaarheid, en van verwachte bruikbaarheid terug naar voorkeur. Dus hoewel de pijlen een wiskundige representatierelatie vertegenwoordigen, vertegenwoordigen ze geen metafysische aardingsrelatie. Dit feit onderstreept het belang van het onafhankelijk rechtvaardigen van de Reality Condition-representatiestellingen, die de verwachte utiliteitstheorie niet kunnen rechtvaardigen zonder aanvullende aannames.
3. Obstructies voor verwachte gebruikstheorie
3.1 Het maximaliseren van het verwachte hulpprogramma is onmogelijk
Alles zou kunnen, maar is het menselijk mogelijk om het verwachte nut te maximaliseren? March en Simon (1958) wijzen erop dat een agent, om de verwachte hulpprogramma's te berekenen, een ontzettend complex begrip van de beschikbare handelingen, de mogelijke resultaten en de waarden van die resultaten nodig heeft, en dat het kiezen van de beste handeling veel veeleisender is dan een act kiezen die gewoon goed genoeg is. Vergelijkbare punten komen naar voren in Lindblom (1959), Feldman (2006) en Smith (2010).
McGee (1991) stelt dat het maximaliseren van het verwachte nut wiskundig niet mogelijk is, zelfs niet voor een ideale computer met onbeperkt geheugen. Om de verwachte bruikbaarheid te maximaliseren, zouden we elke weddenschap die ons werd aangeboden op de waarheden van rekenkunde moeten accepteren en elke weddenschap die we kregen aangeboden op valse zinnen in de taal van de rekenkunde moeten afwijzen. Maar rekenen is onbeslisbaar, dus geen Turing-machine kan bepalen of een gegeven rekenkundige zin waar of onwaar is.
Een antwoord op deze moeilijkheden is de bounded rationality-benadering, die tot doel heeft de verwachte utiliteitstheorie te vervangen door enkele beter hanteerbare regels. Een andere redenering is te beweren dat de eisen van de verwachte utiliteitstheorie beter te overzien zijn dan ze lijken (Burch-Brown 2014; zie ook Greaves 2016), of dat het relevante "zou moeten kunnen" -principe onjuist is (Srinivasan 2015).
3.2 Het maximaliseren van het verwachte hulpprogramma is irrationeel
Verschillende auteurs hebben voorbeelden gegeven waarin de verwachte gebruikstheorie de verkeerde voorschriften lijkt te geven. Paragrafen 3.2.1 en 3.2.2 bespreken voorbeelden waar rationaliteit voorkeuren lijkt toe te staan die niet in overeenstemming zijn met de verwachte utiliteitstheorie. Deze voorbeelden suggereren dat het maximaliseren van het verwachte nut niet nodig is voor rationaliteit. Paragraaf 3.2.3 bespreekt voorbeelden waar de verwachte utiliteitstheorie voorkeuren toelaat die irrationeel lijken. Deze voorbeelden suggereren dat het maximaliseren van het verwachte nut niet voldoende is voor rationaliteit. Paragraaf 3.2.4 bespreekt een voorbeeld waarbij de verwachte utiliteitstheorie voorkeuren vereist die rationeel verboden lijken - een uitdaging voor zowel de noodzaak als de toereikendheid van het verwachte nut voor rationaliteit.
3.2.1 Tegenvoorbeelden die betrekking hebben op transitiviteit en volledigheid
De verwachte utiliteitstheorie houdt in dat de structuur van voorkeuren de structuur weerspiegelt van de groter dan relatie tussen reële getallen. Dus, volgens de verwachte utiliteitstheorie, moeten voorkeuren transitief zijn: Als (A) de voorkeur heeft boven (B) (zodat (U (A) gt U (B))), en (B) heeft de voorkeur boven (C) (zodat (U (B) gt U (C))), dan moet (A) de voorkeur hebben boven (C) (aangezien het moet zijn dat (U (A) gt U (C))). Evenzo moeten voorkeuren volledig zijn: voor elke twee opties moet de ene de voorkeur hebben boven de andere, of de agent moet onverschillig zijn tussen hen (vanwege hun twee hulpprogramma's moet de ene groter zijn of moeten de twee gelijk zijn). Maar er zijn gevallen waarin rationaliteit het falen van de transitiviteit en het falen van de volledigheid lijkt toe te staan (of misschien zelfs vereist).
Een voorbeeld van voorkeuren die niet transitief zijn, maar desalniettemin rationeel toelaatbaar lijken, is Quinns puzzel van de zelf-martelaar (1990). De zelf-folteraar is aangesloten op een machine met een wijzerplaat met instellingen gelabeld 0 tot 1.000, waarbij instelling 0 niets doet, en elke opeenvolgende instelling levert een iets krachtigere elektrische schok op. Instelling 0 is pijnloos, terwijl instelling 1000 ondraaglijke pijn veroorzaakt, maar het verschil tussen twee aangrenzende instellingen is zo klein dat het niet waarneembaar is. De wijzerplaat is voorzien van een ratel, zodat deze omhoog maar nooit omlaag kan worden gedraaid. Stel dat aan elke zelf-martelaar $ 10.000 wordt aangeboden om naar de volgende te gaan, zodat hij voor het tolereren van setting (n) een uitbetaling ontvangt van (n { cdot} {$ 10.000}). Het is toegestaan voor de zelf-folteraar om de voorkeur te geven aan het instellen van (n + 1) voor het instellen van (n) voor elke (n) tussen 0 en 999 (aangezien het verschil in pijn niet waarneembaar is, terwijl het verschil in geld uitbetalingen zijn aanzienlijk), maar niet om de voorkeur te geven aan 1000 op 0 (aangezien de pijn van het instellen van 1.000 zo ondraaglijk kan zijn dat geen enkele hoeveelheid geld dit goed zal maken).
Het lijkt ook rationeel toegestaan om onvolledige voorkeuren te hebben. Voor sommige paren acties heeft een agent mogelijk geen weloverwogen mening over wat ze het liefste doet. Overweeg Jane, een elektricien die er nooit over heeft nagedacht om een professionele zanger of een professionele astronaut te worden. (Misschien zijn beide opties onhaalbaar, of misschien vindt ze ze allebei veel erger dan haar vaste baan als elektricien). Het is vals dat Jane liever zangeres wordt dan astronaut, en het is vals dat ze liever astronaut wordt dan zangeres. Maar het is ook onjuist dat ze onverschillig is tussen zangeres worden en astronaut worden. Ze geeft er de voorkeur aan zangeres te worden en een bonus van $ 100 te krijgen dan zangeres te worden, en als ze onverschillig was tussen zangeres en astronaut worden,ze zou rationeel gedwongen zijn om liever zangeres te zijn en een bonus van $ 100 te ontvangen dan astronaut te worden.
Er is één belangrijk verschil tussen de twee hierboven besproken voorbeelden. De voorkeuren van Jane kunnen worden uitgebreid door nieuwe voorkeuren toe te voegen zonder de voorkeuren die ze heeft te verwijderen, op een manier die ons in staat stelt haar te vertegenwoordigen als een verwachte utility-maximizer. Aan de andere kant is er geen manier om de voorkeuren van de zelf-folteraar uit te breiden, zodat hij kan worden weergegeven als een verwachte nutsmaximalisator. Sommige van zijn voorkeuren zouden moeten worden gewijzigd. Een populaire reactie op onvolledige voorkeuren is te beweren dat, hoewel rationele voorkeuren niet hoeven te voldoen aan de axioma's van een gegeven representatiestelling (zie paragraaf 2.2), het mogelijk moet zijn om ze uit te breiden zodat ze aan de axioma's voldoen. Uit deze zwakkere vereiste voor voorkeuren - dat ze kunnen worden uitgebreid tot een volgorde van voorkeuren die aan de relevante axioma's voldoet - kan men het bestaan van helften van de relevante representatiestellingen bewijzen. Men kan echter niet meer vaststellen dat elke voorkeursvolgorde een representatie heeft die uniek is tot toelaatbare transformaties.
Een dergelijke reactie is niet beschikbaar in het geval van de zelf-folteraar, wiens voorkeuren niet kunnen worden uitgebreid om te voldoen aan de axioma's van de verwachte utiliteitstheorie. Zie het artikel over voorkeuren voor een uitgebreidere bespreking van de zaak van zelf-foltering.
3.2.2 Tegenvoorbeelden met betrekking tot onafhankelijkheid
Allais (1953) en Ellsberg (1961) stellen voorbeelden van voorkeuren voor die niet kunnen worden weergegeven door een verwachte nutsfunctie, maar die toch rationeel lijken. Beide voorbeelden hebben betrekking op schendingen van het axioma van de onafhankelijkheid van Savage:
Onafhankelijkheid. Stel dat (A) en (A ^ *) twee handelingen zijn die dezelfde resultaten opleveren in het geval dat (E) niet waar is. Dan moet je voor elke handeling (B) hebben
- (A) heeft de voorkeur boven (A ^ *) als en alleen als (A_E \ amp B _ { sim E}) de voorkeur heeft boven (A ^ * _ E \ amp B _ { sim E})
- De agent is onverschillig tussen (A) en (A ^ *) als en alleen als ze onverschillig is tussen (A_E \ amp B _ { sim E}) en (A ^ * _ E \ amp B_ { sim E})
Met andere woorden, als twee handelingen dezelfde gevolgen hebben wanneer (E) onwaar is, dan mogen de voorkeuren van de agent tussen die twee handelingen alleen afhangen van hun gevolgen wanneer (E) waar is. Volgens Savage's definitie van verwachte bruikbaarheid houdt de verwachte gebruikstheorie onafhankelijkheid in. En volgens Jeffrey's definitie houdt de verwachte gebruikstheorie onafhankelijkheid in, in de veronderstelling dat de staten probabilistisch onafhankelijk zijn van de handelingen.
Het eerste tegenvoorbeeld, de Allais Paradox, omvat twee afzonderlijke beslissingsproblemen waarbij een kaartje met een nummer tussen 1 en 100 willekeurig wordt getrokken. Bij het eerste probleem moet de agent kiezen tussen deze twee loterijen:
- Loterij (A)
- • 100 miljoen dollar met zekerheid
- Loterij (B)
- • $ 500 miljoen als een van de tickets 1-10 wordt getrokken
- • $ 100 miljoen als een van de tickets 12–100 wordt getrokken
- • Niets als ticket 11 is getrokken
Bij het tweede beslissingsprobleem moet de agent kiezen tussen deze twee loterijen:
- Loterij (C)
- • $ 100 miljoen als een van de tickets 1-11 wordt getrokken
- • Niets anders
- Loterij (D)
- • $ 500 miljoen als een van de tickets 1-10 wordt getrokken
- • Niets anders
Het lijkt redelijk om (A) (die zeker $ 100 miljoen biedt) te verkiezen boven (B) (waarbij de toegevoegde kans van 10% op $ 500 miljoen meer dan gecompenseerd wordt door het risico niets te krijgen). Het lijkt ook redelijk om (D) (een kans van 10% op een prijs van $ 500 miljoen) te verkiezen boven (C) (een iets grotere kans van 11% op een veel kleinere prijs van $ 100 miljoen). Maar samen schenden deze voorkeuren (noem ze de Allais-voorkeuren) de Onafhankelijkheid. Loterijen (A) en (C) brengen dezelfde prijs van $ 100 miljoen op voor tickets 12–100. Ze kunnen worden omgezet in loterijen (B) en (D) door deze prijs van $ 100 miljoen te vervangen door $ 0.
Omdat ze de onafhankelijkheid schenden, zijn de voorkeuren van Allais niet compatibel met de verwachte utiliteitstheorie. Deze incompatibiliteit vereist geen veronderstellingen over de relatieve hulpprogramma's van $ 0, $ 100 miljoen en $ 500 miljoen. Waar $ 500 miljoen utility (x) heeft, $ 100 miljoen utility (y) en $ 0 utility (z), zijn de verwachte utilities van de loterijen als volgt.
(begin {align} EU (A) & = 0.11y + 0.89y \\ EU (B) & = 0.10x + 0.01z + 0.89y \\ EU (C) & = 0.11y + 0.89z \\ EU (D) & = 0,10x + 0,01z + 0,89z \ end {align})
Het is gemakkelijk te zien dat de voorwaarde waaronder (EU (A) gt EU (B)) precies hetzelfde is als de voorwaarde waaronder (EU (C) gt EU (D)): beide ongelijkheden verkrijgen voor het geval (0.11y \ gt 0.10x + 0.01z)
De Ellsberg-paradox brengt ook twee beslissingsproblemen met zich mee die een schending van het zekerheidsprincipe opleveren. In elk van hen wordt een bal getrokken uit een urn met 30 rode ballen en 60 ballen die wit of geel zijn in onbekende verhoudingen. Bij het eerste beslissingsprobleem moet de agent kiezen tussen de volgende loterijen:
- Loterij (R)
- • Win $ 100 als er een rode bal wordt getrokken
- • Anders $ 100 verliezen
- Loterij (W)
- • Win $ 100 als er een witte bal wordt getrokken
- • Anders $ 100 verliezen
Bij het tweede beslissingsprobleem moet de agent kiezen tussen de volgende loterijen:
- Loterij (RY)
- • Win $ 100 als er een rode of gele bal wordt getrokken
- • Anders $ 100 verliezen
- Loterij (WY)
- • Win $ 100 als er een witte of gele bal wordt getrokken
- • Anders $ 100 verliezen
Het lijkt redelijk om (R) te verkiezen boven (W), maar verkies tegelijkertijd (WY) boven (RY). (Noem deze combinatie van voorkeuren de Ellsberg-voorkeuren.) Net als de Allais-voorkeuren schenden de Ellsberg-voorkeuren Onafhankelijkheid. Loterijen (W) en (R) leveren $ 100 verlies op als een gele bal wordt getrokken; ze kunnen worden omgezet in loterijen (RY) en (WY) door dit verlies van $ 100 te vervangen door een winst van $ 100.
Omdat ze de onafhankelijkheid schenden, zijn de voorkeuren van Ellsberg niet compatibel met de verwachte utiliteitstheorie. Nogmaals, deze incompatibiliteit vereist geen aannames over de relatieve nut van $ 100 winnen en $ 100 verliezen. We hebben ook geen aannames nodig over waar tussen 0 en 1/3 de kans op het trekken van een gele bal valt. Waar het winnen van $ 100 utility (w) heeft en het verliezen van $ 100 utility (l) heeft, (begin {align} EU (R) & = \ tfrac {1} {3} w + P (W) l + P (Y) l \\ EU (W) & = \ tfrac {1} {3} l + P (W) w + P (Y) l \\ EU (RY) & = \ tfrac {1} {3} w + P (W) l + P (Y) w \\ EU (WY) & = \ tfrac {1} {3} l + P (W) w + P (Y) w \ end {align})
Het is gemakkelijk te zien dat de toestand waarin (EU (R) gt EU (W)) precies hetzelfde is als de voorwaarde waaronder (EU (RY) gt EU (WY)): beide ongelijkheden verkrijgen voor het geval (1/3 \, w + P (W) l \ gt 1/3 \, l + P (W) w).
Er zijn drie opmerkelijke reacties op de paradoxen van Allais en Ellsberg. Ten eerste zou men Savage (101 ev) en Raiffa (1968, 80–86) kunnen volgen en de verwachte gebruikstheorie kunnen verdedigen omdat de voorkeuren van Allais en Ellsberg irrationeel zijn.
Ten tweede zou men Buchak (2013) kunnen volgen en beweren dat de voorkeuren van Allais en Ellsberg rationeel toelaatbaar zijn, zodat de verwachte gebruikstheorie faalt als een normatieve rationaliteitstheorie. Buchak ontwikkelt een meer tolerante theorie van rationaliteit, met een extra parameter die de houding van de beslisser ten opzichte van risico vertegenwoordigt. Deze risicoparameter heeft een wisselwerking met de hulpprogramma's van uitkomsten en hun voorwaardelijke kansen op handelingen om de waarden van handelingen te bepalen. Eén instelling van de risicoparameter levert de verwachte utiliteitstheorie op als een speciaal geval, maar andere 'risico-averse' instellingen rationaliseren de Allais-voorkeuren.
Ten derde zou men Loomes en Sugden (1986), Weirich (1986) en Pope (1995) kunnen volgen en beweren dat de uitkomsten in de Allais- en Ellsberg-paradoxen opnieuw kunnen worden beschreven om tegemoet te komen aan de voorkeuren van Allais en Ellsberg. Het vermeende conflict tussen de voorkeuren van Allais en Ellsberg enerzijds en de verwachte utiliteitstheorie anderzijds, was gebaseerd op de veronderstelling dat een bepaald geldbedrag hetzelfde nut heeft, ongeacht hoe het wordt verkregen. Sommige auteurs betwisten deze veronderstelling. Loomes en Sugden suggereren dat de uitkomsten van de gokken, naast geldbedragen, gevoelens van teleurstelling (of opgetogenheid) bevatten om minder (of meer) te worden dan verwacht. Pope onderscheidt gevoelens van opgetogenheid of teleurstelling na afloop van opwinding, angst, verveling of veiligheid.en wijst erop dat beide de uitkomsthulpprogramma's kunnen beïnvloeden. Weirich suggereert dat de waarde van een geldsom gedeeltelijk afhangt van de risico's die eraan zijn verbonden, ongeacht de gevoelens van de gokker, zodat (bijvoorbeeld) $ 100 miljoen als resultaat van een zekere weddenschap meer dan $ 100 miljoen is van een gok die had misschien niets betaald.
Broome (1991) maakt zich zorgen over deze oplossing voor een nieuwe beschrijving. Eventuele voorkeuren kunnen worden gerechtvaardigd door de ruimte van resultaten opnieuw te beschrijven, waardoor de axioma's van de verwachte utiliteitstheorie inhoudsloos worden. Broome weerlegt dit bezwaar door een extra beperking op voorkeur voor te stellen: als (A) de voorkeur heeft boven (B), dan moeten (A) en (B) op een of andere manier verschillen, wat de voorkeur aan de één rechtvaardigt. andere. Een verwachte nutstheoreticus kan dan de voorkeuren van Allais en Ellsberg als rationeel beschouwen als, en alleen als, er een niet-monetair verschil is dat het rechtvaardigt om uitkomsten van gelijke geldwaarde op verschillende plaatsen in iemands voorkeursvolgorde te plaatsen.
3.2.3 Tegenvoorbeelden waarbij kans 0-gebeurtenissen betrokken zijn
Hierboven hebben we vermeende voorbeelden gezien van rationele voorkeuren die in strijd zijn met de verwachte gebruikstheorie. Er zijn ook vermeende voorbeelden van irrationele voorkeuren die voldoen aan de verwachte utiliteitstheorie.
Volgens een typisch begrip van de verwachte utiliteitstheorie, moeten agenten onverschillig zijn als ze twee handelingen met elkaar verbinden omdat ze het hoogst verwachte nut hebben. Skyrms (1980, p. 74) wijst erop dat we met deze zienswijze vreemde conclusies kunnen trekken over gebeurtenissen met waarschijnlijkheid 0. Stel bijvoorbeeld dat u op het punt staat een puntpijltje naar een rond dartbord te gooien. Klassieke kansrekening theorie situaties waarin de dart kans 0 om een bepaald punt te raken. Je biedt me de volgende belabberde deal aan: als de pijl precies in het midden van het bord valt, dan betaal je me $ 100; anders zal er geen geld van eigenaar wisselen. Mijn beslissingsprobleem kan worden vastgelegd met de volgende matrix:
staten | |||
raak midden ((P = 0)) | miss center ((P = 1)) | ||
handelingen | accepteer deal | (- 100) | (0) |
deal weigeren | (0) | (0) |
De verwachte utiliteitstheorie zegt dat het voor mij is toegestaan om te accepteren dat de dealacceptatie het verwachte nut van 0 heeft. (Dit geldt zowel voor de Jeffrey-definitie als voor de Savage-definitie, als we aannemen dat de manier waarop de dart landt waarschijnlijk onafhankelijk is van hoe je weddenschap.) Maar gezond verstand zegt dat het niet is toegestaan om de deal te accepteren. Zwakke weigering domineert het accepteren: het levert in sommige staten een beter resultaat op, en in geen enkele staat een slechter resultaat.
Skyrms stelt voor om de wetten van de klassieke waarschijnlijkheid uit te breiden met een extra vereiste dat alleen onmogelijkheden waarschijnlijkheid 0 worden toegekend. Easwaran (2014) stelt dat we in plaats daarvan de opvatting moeten verwerpen dat de verwachte gebruikstheorie onverschilligheid afdwingt tussen handelingen met dezelfde verwachte bruikbaarheid. In plaats daarvan is de verwachte gebruikstheorie geen volledige theorie van rationaliteit: wanneer twee handelingen dezelfde verwachte bruikbaarheid hebben, vertelt het ons niet welke voorkeur we moeten hebben. We kunnen niet-verwachte utiliteitsoverwegingen zoals zwakke dominantie als tiebreakers gebruiken.
3.2.4 Tegenvoorbeelden waarbij onbegrensd hulpprogramma betrokken is
Een utiliteitsfunctie (U) wordt hierboven begrensd als er een limiet is aan hoe goed dingen kunnen zijn volgens (U), of formeler, als er een minst natuurlijk getal (sup) is dat voor elke (A) in het domein van (U), (U (A) le sup). Evenzo is (U) hieronder begrensd als er een limiet is aan hoe slecht de dingen kunnen zijn volgens (U), of formeler, als er een of ander natuurlijk getal (inf) is dat voor elke (A) in (U) 's domein, (U (A) ge inf). De verwachte gebruikstheorie kan in de problemen komen als de functies van het hulpprogramma niet worden begrensd boven, onder of beide.
Een problematisch voorbeeld is het spel St. Petersburg, oorspronkelijk uitgegeven door Bernoulli. Stel dat een munt wordt weggegooid totdat hij voor het eerst met staarten landt. Als het bij de eerste worp staarten krijgt, win je $ 2; als het staarten belandt bij de tweede worp, win je $ 4; als het staarten belandt bij de derde worp, win je $ 8, en als het staarten belandt bij de (n) e worp, win je $ (2 ^ n). Ervan uitgaande dat elke dollar één nut waard is, is de verwachte waarde van het spel in St. Petersburg
[(tfrac {1} {2} cdot 2) + (tfrac {1} {4} cdot 4) + (tfrac {1} {8} cdot 8) + \ cdots + (tfrac {1} {2 ^ n} cdot 2 ^ n) + \ cdots) of [1 + 1 + 1 + \ cdots = \ infty)
Het blijkt dat dit bedrag afwijkt; het spel van St. Petersburg heeft oneindig veel verwachte bruikbaarheid. Dus, volgens de verwachte utiliteitstheorie, zou je de kans moeten hebben om het spel St. Petersburg te spelen boven een eindig bedrag, hoe groot ook. Bovendien, aangezien een oneindig verwacht nut vermenigvuldigd met een kans die niet nul is, nog steeds oneindig is, heeft alles wat een positieve kans heeft om het spel Sint-Petersburg op te leveren, een oneindig verwacht nut. Dus, volgens de verwachte utiliteitstheorie, zou je elke kans om het spel Sint-Petersburg te spelen, hoe klein ook, moeten verkiezen boven elk eindig geldbedrag, hoe groot ook.
Nover en Hájek (2004) stellen dat er naast het spel St. Petersburg, dat een oneindig verwachte bruikbaarheid heeft, er ook andere oneindige spellen zijn waarvan de verwachte bruikbaarheid niet gedefinieerd is, hoewel rationaliteit bepaalde voorkeuren onder hen verplicht stelt.
Een reactie op deze problematische oneindige spellen is te beweren dat de beslissingsproblemen zelf slecht zijn (Jeffrey (1983, 154); een andere is om een gewijzigde versie van de verwachte utiliteitstheorie aan te nemen die overeenkomt met de uitspraken in het gewone geval, maar geeft op intuïtief redelijke uitspraken over de oneindige spelen (Thalos en Richardson 2013) (Fine 2008) (Colyvan 2006, 2008) (Easwaran 2008).
4. Toepassingen
4.1 Economie en openbaar beleid
In de jaren veertig en vijftig kreeg de verwachte utiliteitstheorie in de Verenigde Staten de overhand vanwege het potentieel om een mechanisme te bieden dat het gedrag van macro-economische variabelen zou kunnen verklaren. Toen duidelijk werd dat de verwachte gebruikstheorie het gedrag van echte mensen niet nauwkeurig voorspelde, gaven de voorstanders in plaats daarvan de indruk dat het in plaats daarvan zou kunnen dienen als een theorie over hoe rationele mensen zouden moeten reageren op onzekerheid (zie Herfeld 2017).
De verwachte gebruikstheorie heeft verschillende toepassingen in het openbare beleid. In de welvaartseconomie redeneert Harsanyi (1953) van de verwachte utiliteitstheorie tot de bewering dat de meest sociaal rechtvaardige regeling er een is die de totale welvaart verdeeld over een samenlevingsmaatschappij maximaliseert. De theorie van het verwachte nut heeft ook meer directe toepassingen. Howard (1980) introduceert het concept van een micromort, of een kans op overlijden van één op een miljoen, en gebruikt verwachte berekeningen van nutsvoorzieningen om te beoordelen welke sterftekansen acceptabel zijn. In gezondheidsbeleid zijn voor kwaliteit gecorrigeerde levensjaren, of QALY's, maatstaven voor het verwachte nut van verschillende gezondheidsinterventies die worden gebruikt om het gezondheidsbeleid te sturen (zie Weinstein et al 2009). McAskill (2015) gebruikt de verwachte gebruikstheorie om de centrale vraag van effectief altruïsme aan te pakken:'Hoe kan ik het beste doen?' (Benodigdheden in deze toepassingen worden het meest natuurlijk geïnterpreteerd als het meten van zoiets als geluk of welzijn, in plaats van subjectieve voorkeurstevredenheid voor een individuele agent.)
Een ander gebied waarop de verwachte utiliteitstheorie toepassingen vindt, is de verkoop van verzekeringen. Net als casino's nemen verzekeringsmaatschappijen berekende risico's met het oog op financieel gewin op lange termijn en moeten ze rekening houden met de kans dat ze op korte termijn failliet gaan.
4.2 Ethiek
Utilitaristen, samen met hun afstammelingen, hedendaagse consequentialisten, zijn van mening dat de juistheid of onjuistheid van een handeling wordt bepaald door de morele goedheid of slechtheid van de gevolgen ervan. Sommige consequentialisten, zoals (Railton 1984), interpreteren dit als dat we moeten doen wat in feite de beste gevolgen zal hebben. Maar het is moeilijk - misschien zelfs onmogelijk - om de langetermijngevolgen van onze handelingen te kennen (Lenman 2000, Howard-Snyder 2007). In het licht van deze observatie stelt Jackson (1991) dat de juiste daad degene is met de hoogste verwachte morele waarde, en niet degene die in feite de beste gevolgen zal hebben.
Zoals Jackson opmerkt, hangt de verwachte morele waarde van een handeling af van de waarschijnlijkheidsfunctie waarmee we werken. Jackson stelt dat, hoewel elke waarschijnlijkheidsfunctie geassocieerd is met een 'ought', de 'ought' die het belangrijkst is voor actie, degene is die geassocieerd wordt met de mate van geloof van de beslisser op het moment van actie. Andere auteurs claimen voorrang voor andere 'dingen': Mason (2013) is voorstander van de waarschijnlijkheidsfunctie die het meest redelijk is voor de agent om te reageren op haar bewijsmateriaal, gezien haar epistemische beperkingen, terwijl Oddie en Menzies (1992) de voorkeur geven aan de objectieve kansfunctie als maatstaf voor objectieve juistheid. (Ze doen een beroep op een meer gecompliceerde kansfunctie om een idee van 'subjectieve juistheid' te definiëren voor besluitvormers die de objectieve kansen niet kennen.)
Weer anderen (Smart 1973, Timmons 2002) stellen dat zelfs als we dat zouden moeten doen wat de beste gevolgen heeft, de verwachte utiliteitstheorie de rol kan spelen van een besluitvormingsprocedure wanneer we niet zeker weten welke gevolgen onze daden zullen hebben. Feldman (2006) stelt dat de berekeningen van nutsvoorzieningen vreselijk onpraktisch zijn. Bij de meeste beslissingen in het echte leven liggen de stappen die nodig zijn om de verwachte hulpprogramma's te berekenen buiten ons bereik: de mogelijke resultaten van onze handelingen opsommen, elke uitkomst een hulpprogramma en een voorwaardelijke waarschijnlijkheid geven voor elke handeling, en de rekenkundige bewerkingen uitvoeren die nodig zijn voor de verwachte hulpprogramma-berekeningen.
De versie van consequentialisme die de verwachte bruikbaarheid maximaliseert, is strikt genomen geen theorie van rationele keuze. Het is een theorie van morele keuze, maar of rationaliteit vereist dat we doen wat moreel het beste is, staat ter discussie.
4.3 Epistemologie
De verwachte gebruikstheorie kan worden gebruikt om praktische vragen in de epistemologie aan te pakken. Een van die vragen is wanneer een hypothese moet worden geaccepteerd. In typische gevallen is het bewijs logisch compatibel met meerdere hypothesen, inclusief hypothesen waar het weinig inductieve ondersteuning aan geeft. Bovendien accepteren wetenschappers doorgaans niet alleen die hypothesen die het meest waarschijnlijk zijn gezien hun gegevens. Wanneer is een hypothese waarschijnlijk genoeg om geaccepteerd te worden?
Bayesianen, zoals Maher (1993), stellen voor om deze beslissing te nemen op basis van verwachte nutsgronden. Of een hypothese moet worden geaccepteerd, is een beslissingsprobleem, met acceptatie en afwijzing als handelingen. Het kan worden vastgelegd door de volgende beslissingsmatrix:
staten | |||
hypothese is waar | hypothese is onjuist | ||
handelingen | aanvaarden | correct accepteren | ten onrechte accepteren |
afwijzen | ten onrechte afwijzen | correct afwijzen |
Volgens de definitie van Savage wordt het verwachte nut van het accepteren van de hypothese bepaald door de waarschijnlijkheid van de hypothese, samen met de hulpprogramma's van elk van de vier uitkomsten. (We kunnen verwachten dat Jeffrey's definitie het eens is met die van Savage, op grond van de aannemelijke veronderstelling dat de hypothese, gezien het bewijs in ons bezit, waarschijnlijk onafhankelijk is van het feit of we het accepteren of verwerpen.) Hier kunnen de hulpprogramma's worden begrepen als puur epistemische waarden, aangezien het is epistemisch waardevol om interessante waarheden te geloven en onwaarheden te verwerpen.
Critici van de Bayesiaanse benadering, zoals Mayo (1996), stellen dat wetenschappelijke hypothesen niet aannemelijk kunnen worden gemaakt. Mayo stelt dat we, om een nuttige waarschijnlijkheid aan een gebeurtenis toe te kennen, statistische gegevens nodig hebben over de frequenties van vergelijkbare gebeurtenissen. Maar wetenschappelijke hypothesen zijn voor eens of altijd waar, of voor eens en altijd onjuist - er is geen populatie van werelden zoals de onze waaruit we betekenisvolle statistieken kunnen putten. We kunnen ook geen subjectieve waarschijnlijkheden gebruiken voor wetenschappelijke doeleinden, aangezien dit onaanvaardbaar willekeurig zou zijn. Daarom zijn de verwachte hulpprogramma's voor acceptatie en afwijzing ongedefinieerd en zouden we de methoden van traditionele statistieken moeten gebruiken, die afhankelijk zijn van het vergelijken van de waarschijnlijkheid van ons bewijs afhankelijk van elk van de hypothesen.
De verwachte gebruikstheorie geeft ook richtlijnen over wanneer bewijs moet worden verzameld. Good (1967) stelt op basis van verwachte nutsredenen dat het altijd rationeel is om bewijs te verzamelen alvorens te handelen, op voorwaarde dat het bewijs kosteloos is. De handeling met de hoogste verwachte bruikbaarheid nadat het extra bewijs is geleverd, zal altijd altijd minstens zo goed zijn als de handeling met de hoogste verwachte bruikbaarheid vooraf.
In de epistemische beslissingstheorie worden verwachte hulpprogramma's gebruikt om geloofsstaten als rationeel of irrationeel te beoordelen. Als we geloofsvorming beschouwen als een mentale handeling, feiten over de inhoud van de overtuigingen van de agent als gebeurtenissen en nabijheid tot de waarheid als een wenselijk kenmerk van uitkomsten, dan kunnen we de verwachte gebruikstheorie gebruiken om de mate van geloof te evalueren in termen van hun verwachte dicht bij de waarheid. De vermelding over epistemische nutargumenten voor probabilisme bevat een overzicht van verwachte nutargumenten voor een verscheidenheid aan epistemische normen, waaronder conditionalisatie en het hoofdprincipe.
4.4 Wet
Kaplan (1968) stelt dat verwachte overwegingen van nut kunnen worden gebruikt om een bewijsstandaard vast te stellen in juridische processen. Een jury die besluit om vrij te spreken of te veroordelen, wordt geconfronteerd met het volgende beslissingsprobleem:
staten | |||
schuldig | onschuldig | ||
handelingen | veroordelen | ware overtuiging | valse overtuiging |
vrijspreken | valse vrijspraak | ware vrijspraak |
Kaplan laat zien dat (EU (veroordeelde)> EU (vrijspreken)) altijd
[P (guilty)> \ frac {1} {1+ \ frac {U (mathrm {true ~ conviction}) - U (mathrm {false ~ vrijspraak})} {U (mathrm {true ~ vrijspraak}) -U (mathrm {false ~ conviction})}})
Kwalitatief betekent dit dat de bewijsstandaard toeneemt naarmate de onbekwaamheid om een onschuldige persoon te veroordelen ((U (mathrm {true ~ conviction}) - U (mathrm {false ~ vrijspraak}))) toeneemt, of naarmate de de onbekwaamheid om een schuldige vrij te spreken ((U (mathrm {true ~ vrijspraak}) - U (mathrm {false ~ overtuiging}))) neemt af.
Critici van deze beslissingstheoretische benadering, zoals Laudan (2006), stellen dat het moeilijk of onmogelijk is om de kloof te overbruggen tussen het voor de rechtbank toelaatbare bewijsmateriaal en de reële waarschijnlijkheid van de schuld van de verdachte. De kansschuld hangt af van drie factoren: de verdeling van schijnbare schuld onder de oprechte schuldigen, de verdeling van schijnbare schuld onder de oprecht onschuldige en de verhouding van oprecht schuldige tot oprecht onschuldige gedaagden die terechtstaan (zie Bell 1987). Obstakels voor het berekenen van een van deze factoren zullen de gevolgtrekking blokkeren van de perceptie van een rechter of jury van schijnbare schuld tot een echte kans op schuld.
Bibliografie
- Allais M., 1953, 'Le Comportement de l'Homme Rationnel devant le Risque: Critique des Postulats et Axiomes de l'École Americaine', Econometrica, 21: 503–546.
- Bell, R., 1987, "Beslissingstheorie en eerlijk proces: een kritiek op de wetgeving van het Hooggerechtshof voor de bewijslast", Journal of Criminal Law and Criminology, 78: 557-585.
- Bentham, J., 1961. An Introduction to the Principles of Morals and Legislation, Garden City: Doubleday. Oorspronkelijk gepubliceerd in 1789.
- Bernoulli, D., 1738, "Specimen theoriae novae de mensura sortis", Commentarii Academiae Scientiarum Imperialis Petropolitanae 5. Vertaald door Louise Somer en herdrukt als "Exposition of a New Theory on the Measurement of Risk" 1954, Econometrica, 22: 23– 36.
- Bolker, E., 1966, "Functies die lijken op quotiënten van maten", Transactions of the American Mathematical Society, 2: 292–312.
- Bradley, R., 2004, "Ramsey's representatiestelling", Dialectica, 58: 483-497.
- Burch-Brown, JM, 2014, "Clues for Consequentialists", Utilitas, 26: 105-119.
- Buchak, L., 2013, Risk and Rationality, Oxford: Oxford University Press.
- Colyvan, M., 2006, "No Expectations", Mind, 116: 695–702.
- Colyvan, M., 2008, 'Relative Expectation Theory', Journal of Philosophy, 105: 37–44.
- Easwaran, K., 2014, 'Regularity and Hyperreal Credences', The Philosophical Review, 123: 1–41.
- Easwaran, K., 2008, 'Sterke en zwakke verwachtingen', Mind, 117: 633–641.
- Elliott, E., 2017, "Ramsey zonder ethische neutraliteit: een nieuwe representatiestelling", Mind, 126: 1-51.
- Ellsberg, D., 1961, "Risk, Ambiguity, and the Savage Axioms", Quarterly Journal of Economics, 75: 643–669.
- Feldman, F. 2006, "Feitelijk nut, het bezwaar van onpraktischheid en de overgang naar verwacht nut", Philosophical Studies, 129: 49–79.
- Fine, T., 2008, "Evaluating the Pasadena, Altadena, and St. Petersburg Gambles", Mind, 117: 613–632.
- Good, IJ, 1967, 'On the Principle of Total Evidence', The British Journal for the Philosophy of Science, 17: 319–321
- Greaves, H. 2016, "Cluelessness", Proceedings of the Aristotelian Society, 116: 311-339.
- Hampton, J., “The Failure of Expected-Utility Theory as a Theory of Reason”, Economics and Philosophy, 10: 195–242.
- Harsanyi, JC, 1953, "Kardinaal nut in de welvaartseconomie en in de theorie van het nemen van risico's", Journal of Political Economy, 61: 434–435.
- Herfeld, C., "From Theories of Human Behavior to Rules of Rational Choice: Tracing a Normative Turn at the Cowles Commission, 1943-1954", History of Political Economy, 50: 1-48.
- Howard, RA, 1980, "Over het nemen van beslissingen over leven en dood", in RC Schwing en WA Albers, Maatschappelijke risicobeoordeling: hoe veilig is veilig genoeg?, New York: Plenum Press.
- Howard-Snyder, F., 1997, 'The Rejection of Objective Consequentialism', Utilitas, 9: 241–248.
- Jackson, F., 1991, "Beslissingstheoretisch consequentialisme en het naaste en dierbaarste bezwaar", Ethics, 101: 461–482.
- Jeffrey, R., 1983, The Logic of Decision, 2e editie, Chicago: University of Chicago Press.
- Jevons, WS, 1866, "A General Mathematical Theory of Political Economy", Journal of the Royal Statistical Society, 29: 282–287.
- Joyce, J., 1999, The Foundations of Causal Decision Theory, Cambridge: Cambridge University Press.
- Kahneman, D. & Tversky A., Judgement Under Uncertainty: Heuristics and Biases, New York: Cambridge University Press.
- Kaplan, J., 1968, "Beslissingstheorie en het onderzoeksproces", Stanford Law Review, 20: 1065-1092.
- Kolmogorov, AN, 1933, Grundbegriffe der Wahrscheinlichkeitrechnung, Ergebnisse Der Mathematik; vertaald als Foundations of Probability, New York: Chelsea Publishing Company, 1950.
- Laudan, L., 2006, Truth, Error, and Criminal Law, Cambridge: Cambridge University Press.
- Lenman, J., 2000. 'Consequentialism and cluelessness', Philosophy and Public Affairs, 29 (4): 342–370.
- Lewis, D., 1981, "Causal Decision Theory", Australasian Journal of Philosophy, 59: 5–30.
- Levi, I., 1991, "Consequentialism and Sequential Choice", in M. Bacharach en S. Hurley (red.), Foundations of Decision Theory, Oxford: Basil Blackwell Ltd, 92–12.
- Lindblom, CE, 1959, 'The Science of' Muddling Through '', Public Administration Review, 19: 79–88.
- Loomes, G. en Sugden, R., 1986, "Teleurstelling en dynamische consistentie bij keuze onder onzekerheid", The Review of Economic Studies, 53 (2): 271–282.
- Maher, P., 1993, Betting on Theories, Cambridge: Cambridge University Press.
- March, JG en Simon, H., 1958, Organizations, New York: Wiley.
- Mason, E., 2013, "Objectivism and Prospectivism About Rightness", Journal of Ethics and Social Philosophy, 7: 1–21.
- Mayo, D., 1996, Error and the Growth of Experimental Knowledge, Chicago: University of Chicago Press.
- McAskill, W., 2015, Doing Good Better, New York: Gotham Books.
- McGee, V., 1991, "We Turing Machines are Expected-Utility Maximizers (Zelfs Idealiter)", Philosophical Studies, 64: 115-123.
- Meacham, C. en Weisberg, J., 2011, "Representation Theorems and the Foundations of Decision Theory", Australasian Journal of Philosophy, 89: 641–663.
- Menger, K., 1871, Grundsätze der Volkswirtschaftslehre, vertaald door James Dingwall en Bert F. Hoselitz als Principles of Economics, New York: New York University Press, 1976; online herdrukt, Ludwig von Mises Institute, 2007.
- Mill, JS, 1861. Utilitarisme. Bewerkt met een inleiding door Roger Crisp. New York: Oxford University Press, 1998.
- von Neumann, J., en Morgenstern, O., 1944, Theory of Games and Economic Behavior, Princeton: Princeton University Press.
- Nover, H. & Hájek, A., 2004, 'Lastige verwachtingen', Mind, 113: 237–249.
- Nozick, R., 1969, "Newcomb's Problem and Two Principles of Choice", in Nicholas Rescher (red.), Essays ter ere van Carl G. Hempel, Dordrecht: Reidel, 114–115.
- Oliver, A., 2003, "Een kwantitatieve en kwalitatieve test van de Allais-paradox met behulp van gezondheidsresultaten", Journal of Economic Psychology, 24: 35–48.
- Pope, R., 1995, "Naar een preciezer beslissingskader: een scheiding van het negatieve nut van toeval van het verminderen van marginaal nut en de voorkeur voor veiligheid", Theory and Decision, 39: 241–265.
- Raiffa, H., 1968, Beslissingsanalyse: inleidende lezingen over keuzes onder onzekerheid, Reading, MA: Addison-Wesley.
- Ramsey, FP, 1926, 'Truth and Probability', in Foundations of Mathematics en andere Essays, RB Braithwaite (red.), London: Kegan, Paul, Trench, Trubner, & Co., 1931, 156–198; herdrukt in Studies in Subjective Probability, HE Kyburg, Jr. en HE Smokler (red.), 2e editie, New York: RE Krieger Publishing Company, 1980, 23–52; herdrukt in Philosophical Papers, DH Mellor (red.), Cambridge: Cambridge University Press, 1990.
- Savage, LJ, 1972, The Foundations of Statistics, 2e editie, New York: Dover Publications, Inc.
- Sen, A., 1977, 'Rational Fools: A Critique of the Behavioral Foundations of Economic Theory', Philosophy and Public Affairs, 6: 317–344.
- Shafer, G., 2007, "From Cournot's principle to market efficiency", in Augustin Cournot: Modeling Economics, Jean-Philippe Touffut (red.), Cheltenham: Edward Elgar, 55-95.
- Sidgwick, H., 1907. The Methods of Ethics, Seventh Edition. Londen: Macmillan; eerste editie, 1874.
- Simon, H., 1956, 'A Behavioral Model of Rational Choice', The Quarterly Journal of Economics, 69: 99–118.
- Skyrms, B., 1980. Causale noodzaak: een pragmatisch onderzoek naar de noodzaak van wetten, New Haven, CT: Yale University Press.
- Smith, HM, "Subjective Rightness", sociale en politieke filosofie, 27: 64-110.
- Sobel, JH, 1994, Taking Chances: Essays on Rational Choice, Cambridge: Cambridge University Press.
- Spohn, W., 1977, "Waar Luce en Krantz het beslissingsmodel van Savage werkelijk veralgemenen", Erkenntnis, 11: 113–134.
- Srinivasan, A., 2015, "Normativiteit zonder Cartesisch privilege", Noûs, 25: 273-299.
- Suppes, P., 2002, Representation and Invariance of Scientific Structures, Stanford: CSLI Publications.
- Thalos, M. en Richardson, O., 2013, "Capitalisation in the St. Petersburg game: Why statistische distributions matter", Politics, Philosophy & Economics, 13: 292-313.
- Weinstein, MC, Torrence, G. en McGuire, A., 2009 "QALYs: the basics", Value in Health, 12: S5-S9.
- Weirich, P., 1986, "Expected Utility and Risk", British Journal for the Philosophy of Science, 37: 419–442.
- Zynda, L., 2000, 'Representatiestellingen en realisme over graden van geloof', Wetenschapsfilosofie, 67: 45–69.
Academische hulpmiddelen
![]() |
Hoe deze vermelding te citeren. |
![]() |
Bekijk een voorbeeld van de PDF-versie van dit item bij de Vrienden van de SEP Society. |
![]() |
Zoek dit itemonderwerp op bij het Internet Philosophy Ontology Project (InPhO). |
![]() |
Verbeterde bibliografie voor dit item op PhilPapers, met links naar de database. |
Andere internetbronnen
- Beslissingen, Games en Rational Choice, materialen voor een cursus die in het voorjaar van 2008 werd gegeven door Robert Stalnaker, MIT OpenCourseWare.
- Micro-economische theorie III, materiaal voor een cursus die in het voorjaar van 2010 werd gegeven door Muhamet Yildiz, MIT OpenCourseWare.
- Keuze onder onzekerheid, aantekeningen bij de colleges van Jonathan Levin.
- Expected Utility Theory, door Philippe Mongin, inzending voor The Handbook of Economic Methodology.
- The Origins of Expected Utility Theory, essay door Yvan Lengwiler.