Causale Beslissingstheorie

Inhoudsopgave:

Causale Beslissingstheorie
Causale Beslissingstheorie

Video: Causale Beslissingstheorie

Video: Causale Beslissingstheorie
Video: Aristotle & Virtue Theory: Crash Course Philosophy #38 2023, Juni-
Anonim

Toegang navigatie

  • Inhoud van het item
  • Bibliografie
  • Academische hulpmiddelen
  • Vrienden PDF-voorbeeld
  • Info over auteur en citaat
  • Terug naar boven

Causale beslissingstheorie

Voor het eerst gepubliceerd op za 25 oktober 2008; inhoudelijke herziening di 15 nov 2016

De causale beslissingstheorie hanteert principes van rationele keuze die de gevolgen van een handeling in de hand werken. Het stelt dat een verklaring van rationele keuze causaliteit moet gebruiken om de overwegingen te identificeren die een keuze rationeel maken.

Gegeven een reeks opties die een beslissingsprobleem vormen, beveelt de beslistheorie een optie aan die het nut maximaliseert, dat wil zeggen een optie waarvan het nut gelijk is aan of groter is dan het nut van elke andere optie. Het evalueert het nut van een optie door het verwachte nut van de optie te berekenen. Het gebruikt waarschijnlijkheden en hulpprogramma's van de mogelijke uitkomsten van een optie om het verwachte nut van een optie te definiëren. De kansen zijn afhankelijk van de optie. De causale beslissingstheorie neemt de afhankelijkheid eerder als causaal dan als louter bewijskracht.

Dit essay legt de causale beslistheorie uit, geeft een overzicht van de geschiedenis ervan, beschrijft huidig onderzoek in de causale beslistheorie en onderzoekt de filosofische grondslagen van de theorie. De literatuur over causale beslissingstheorie is enorm en dit essay behandelt slechts een deel ervan.

  • 1. Verwacht hulpprogramma
  • 2. Geschiedenis

    • 2.1 Newcomb's probleem
    • 2.2 Stalnaker's oplossing
    • 2.3 Varianten
    • 2.4 Representatiestellingen
    • 2.5 Bezwaren
  • 3. Huidige problemen

    • 3.1 Waarschijnlijkheid en nut
    • 3.2 Partitie-invariantie
    • 3.3 Resultaten
    • 3.4 Handelingen
    • 3.5 Verwacht hulpprogramma generaliseren
    • 3.6 Bekrachtiging
  • 4. Verwante onderwerpen en slotopmerkingen
  • Bibliografie
  • Academische hulpmiddelen
  • Andere internetbronnen
  • Gerelateerde vermeldingen

1. Verwacht hulpprogramma

Stel dat een student overweegt om voor een examen te gaan studeren. Hij redeneert dat als hij het examen haalt, studeren een verspilde moeite is. En als hij het examen niet haalt, is studeren verspilde moeite. Hij concludeert dat studeren, wat er ook gebeurt, verspilde moeite is, het beter is om niet te studeren. Deze redenering vergist zich omdat studeren de kans op slagen voor het examen vergroot. Bij de beraadslagingen moet rekening worden gehouden met de invloed van een handeling op de waarschijnlijkheid van de mogelijke resultaten.

Het verwachte nut van een handeling is een waarschijnlijkheidsgewogen gemiddelde van de mogelijke resultaten van de resultaten. Mogelijke toestanden van de wereld die elkaar uitsluiten en gezamenlijk uitputtend zijn, en dus een afscheiding vormen, genereren de mogelijke resultaten van een handeling. Een act-state-paar specificeert een uitkomst. In het voorbeeld vormen de handeling van studeren en de staat van slagen een uitkomst die de inspanning van studeren en het voordeel van slagen omvat. Het verwachte nut van studeren is de slaagkans als men studeert en het nut van studeren en slagen plus de kans dat men niet slaagt als men het nut van studeren bestudeert en niet slaagt. In compacte notatie, (textit {EU} (S) = P (P \ mbox {if} S) util (S \ amp P) + P ({ sim} P \ mbox {if} S) util (S \ amp { sim} P).)

Elk product specificeert de waarschijnlijkheid en bruikbaarheid van een mogelijke uitkomst. De som is een waarschijnlijkheidsgewogen gemiddelde van de hulpprogramma's van de mogelijke uitkomsten.

Hoe moet de beslissingstheorie de waarschijnlijkheid van een toestand (S) interpreteren als men een handeling (A) uitvoert, dat wil zeggen (P (S \ mbox {if} A))? Waarschijnlijkheidstheorie biedt een handige suggestie. Het heeft een overzicht van voorwaardelijke waarschijnlijkheden die de beslissingstheorie kan aannemen. Beslissingstheorie kan (P (S \ mbox {if} A)) nemen als de waarschijnlijkheid dat de staat afhankelijk is van de handeling. Dan is (P (S \ mbox {if} A)) gelijk aan (P (S \ mid A)), welke waarschijnlijkheidstheorie definieert als (P (S \ amp A) / P (A)) wanneer (P (A) ne 0). Sommige theoretici noemen het verwachte nut berekend met voorwaardelijke waarschijnlijkheden voorwaardelijk verwacht nut. Ik noem het verwachte nutsbedrijf omdat de formule met voorwaardelijke waarschijnlijkheden een eenvoudiger formule genereert voor verwachte bruikbaarheid die gebruik maakt van niet-voorwaardelijke kansen van staten. Ook,sommige theoretici noemen het verwachte nut van een handeling het nut ervan, omdat het verwachte nut van een handeling de handeling beoordeelt en in ideale gevallen de bruikbaarheid van de handeling oplevert. Ik noem het verwachte bruikbaarheid omdat een persoon per ongeluk meer of minder nut aan een weddenschap kan hechten dan het verwachte nut rechtvaardigt. De gelijkheid van het nut van een handeling en het verwachte nut ervan is eerder normatief dan definitief.

Verwachte hulpprogramma's verkregen uit voorwaardelijke waarschijnlijkheden sturen het overleg van de student in de goede richting.

(textit {EU} (S) = P (P \ mid S) util (S \ amp P) + P ({ sim} P \ mid S) util (S \ amp { sim} P),)

en

(textit {EU} ({ sim} S) = P (P \ mid { sim} S) util ({ sim} S \ amp P) + P ({ sim} P \ mid { sim} S) util ({ sim} S \ amp { sim} P).)

Vanwege het effect van studie op de slaagkans, (P (P \ mid S) gt P (P \ mid { sim} S)) en (P ({ sim} P \ mid S) lt P ({ sim} P \ mid { sim} S)). Dus (textit {EU} (S) gt \ textit {EU} ({ sim} S)), ervan uitgaande dat de toename van de slaagkans van studeren de leerinspanning compenseert. Maximalisatie van het verwachte nut beveelt aan om te studeren.

De handige interpretatie van de waarschijnlijkheid van een toestand als iemand een handeling verricht, is echter niet helemaal bevredigend. Stel dat iemand een munt met een onbekende vooringenomenheid gooit en koppen krijgt. Dit resultaat is een bewijs dat de volgende worp koppen zal opleveren, hoewel het niet causaal het resultaat van de volgende worp beïnvloedt. De waarschijnlijkheid van een gebeurtenis afhankelijk van een andere gebeurtenis geeft het bewijs aan dat de tweede gebeurtenis de eerste oplevert. Als de twee gebeurtenissen met elkaar in verband staan, kan de tweede een bewijs leveren voor de eerste zonder deze oorzakelijk te beïnvloeden. Oorzaak houdt correlatie in, maar correlatie houdt geen oorzaak in. Bij beraadslagingen moet worden gekeken naar de causale invloed van een handeling op een staat en niet op het bewijs van een handeling voor een staat. Een goede beslissing heeft tot doel een goede uitkomst te produceren in plaats van het bewijs van een goede uitkomst. Het streeft naar het goede en niet alleen naar tekenen van het goede. Vaak gaan werkzaamheid en voorspoed hand in hand. Als ze uit elkaar vallen, moet een agent een daadkrachtige daad verrichten in plaats van een gunstige daad.

Overweeg het gevangendilemma, een voorbeeld van speltheorie. Twee van elkaar geïsoleerde mensen kunnen elk samenwerken of niet meewerken. Ze doen het allemaal beter als ze samenwerken, dan als ze niet meewerken. Ieder doet het echter beter als hij niet meewerkt, wat de ander ook doet. Coöperatief handelen domineert coöperatief handelen. Stel bovendien dat de twee spelers een psychologische tweeling zijn. Elk denkt zoals de ander denkt. Bovendien weten ze dit feit van zichzelf. Als een speler vervolgens coöperatief handelt, concludeert hij dat zijn tegenhanger ook coöperatief handelt. Zijn coöperatief optreden is een goed bewijs dat zijn tegenhanger hetzelfde doet. Desalniettemin zorgt zijn coöperatief optreden er niet voor dat zijn tegenhanger coöperatief optreedt. Hij heeft geen contact met zijn tegenhanger. Omdat hij er beter aan doet niet mee te werken, wat zijn tegenhanger ook doet, is niet meewerken de betere weg. Coöperatief handelen is gunstig maar niet doeltreffend.

Om de verwachte effectiviteit van nutsbedrijven eerder dan gunstig te maken, interpreteert de causale beslissingstheorie de waarschijnlijkheid van een toestand als men een handeling uitvoert als een soort causale waarschijnlijkheid in plaats van als een standaard voorwaardelijke waarschijnlijkheid. Overweeg in het Gevangenisdilemma met een tweeling de waarschijnlijkheid dat een speler samenwerkt, gezien het feit dat de andere speler dat doet. Deze voorwaardelijke kans is hoog. Overweeg vervolgens de causale waarschijnlijkheid dat een speler samenwerkt als de andere speler dat doet. Omdat de spelers geïsoleerd zijn, is deze kans gelijk aan de kans dat de eerste speler coöperatief handelt. Het is laag als die speler dominantie volgt. Gebruikmakend van voorwaardelijke kansen overtreft het verwachte nut van coöperatief handelen het verwachte nut van niet-coöperatief handelen. Gebruikmakend van causale waarschijnlijkheden,het verwachte nut van niet-coöperatief handelen overtreft het verwachte nut van coöperatief handelen. Overschakelen van voorwaardelijke naar causale kansen zorgt ervoor dat de maximale opbrengst van het verwachte nut niet meewerkt.

2. Geschiedenis

Deze sectie behandelt de geschiedenis van de causale beslissingstheorie en presenteert onderweg verschillende formuleringen van de theorie.

2.1 Newcomb's probleem

Robert Nozick (1969) presenteerde een dilemma voor de beslissingstheorie. Hij construeerde een voorbeeld waarin het standaardprincipe van dominantie in strijd is met het standaardprincipe van verwachte nutsmaximalisatie. Nozick noemde het voorbeeld Newcomb's Problem naar de natuurkundige William Newcomb, die het probleem voor het eerst formuleerde.

In Newcomb's Problem kan een agent ervoor kiezen om een ondoorzichtige doos te nemen of om zowel de ondoorzichtige doos als een transparante doos te nemen. De transparante doos bevat duizend dollar die de agent duidelijk ziet. De ondoorzichtige doos bevat niets of een miljoen dollar, afhankelijk van een reeds gemaakte voorspelling. De voorspelling ging over de keuze van de agent. Als de voorspelling was dat de agent beide dozen zal nemen, dan is de ondoorzichtige doos leeg. Aan de andere kant, als de voorspelling was dat de agent alleen de ondoorzichtige doos zou nemen, dan bevat de ondoorzichtige doos een miljoen dollar. De voorspelling is betrouwbaar. De agent kent al deze kenmerken van zijn beslissingsprobleem.

Figuur 1 toont de opties van de agent en hun resultaten. Een rij vertegenwoordigt een optie, een kolom een toestand van de wereld en een cel de uitkomst van een optie in een toestand van de wereld.

Voorspelling

one-boxing

Voorspelling

twee-boksen

Neem een doos ($ M) ($ 0)
Neem twee dozen ($ M + \ $ T) ($ T)

Figuur 1. Het probleem van Newcomb

Omdat de uitkomst van twee-boksen bij elke voorspelling beter is dan ($ T) dan de uitkomst van één-boksen, domineert twee-boksen één-boksen. Two-boxing is de rationele keuze volgens het principe van dominantie. Omdat de voorspelling betrouwbaar is, heeft een voorspelling van one-boxing een grote kans bij one-boxing. Evenzo heeft een voorspelling van twee-boksen een hoge waarschijnlijkheid gegeven twee-boksen. Dus, met voorwaardelijke kansen om verwachte hulpprogramma's te berekenen, overtreft het verwachte hulpprogramma van één boxing het verwachte hulpprogramma van twee boxen. One-boxing is de rationele keuze volgens het principe van maximalisatie van het verwachte nut.

De beslissingstheorie moet alle mogelijke beslissingsproblemen aanpakken en niet alleen realistische beslissingsproblemen. Als het probleem van Newcomb echter onrustwekkend lijkt, omdat er onrealistische, realistische versies van het probleem in overvloed zijn. Het essentiële kenmerk van het probleem van Newcomb is de correlatie van een inferieure handeling met een goede toestand die het niet causaal bevordert. In realistische, medische Newcomb-problemen hebben een medische aandoening en een gedragssymptoom een gemeenschappelijke oorzaak en zijn gecorreleerd, hoewel geen van beide de andere veroorzaakt. Als het gedrag aantrekkelijk is, beveelt dominantie het aan, hoewel de verwachte maximalisatie van het nut dit verbiedt. Allan Gibbard en William Harper (1978: Sec. 12) en David Lewis (1979) stellen ook vast dat een Prisoner's Dilemma met psychologische tweelingen voor elke speler een Newcomb-probleem vormt. Voor elke speler,de handeling van de andere speler is een toestand die de uitkomst beïnvloedt. Coöperatief handelen is een teken, maar geen oorzaak, van coöperatief handelen van de andere speler. Dominance raadt aan om niet coöperatief te handelen, terwijl het verwachte nut berekend met voorwaardelijke waarschijnlijkheden coöperatief optreden aanbeveelt. In sommige realistische gevallen van het Gevangenisdilemma zorgt de verwachte gelijkenis van denken van de spelers voor een conflict tussen het dominantieprincipe en het principe van verwachte nutsmaximalisatie.de verwachte gelijkenis van denken van de spelers creëert een conflict tussen het dominantieprincipe en het principe van verwachte nutsmaximalisatie.de verwachte gelijkenis van denken van de spelers creëert een conflict tussen het dominantieprincipe en het principe van verwachte nutsmaximalisatie.

2.2 Stalnaker's oplossing

Robert Stalnaker (1968) presenteerde waarheidscondities voor conjunctieve conditionals. Een subjunctieve voorwaardelijke is waar als en alleen als in de dichtstbijzijnde antecedent-wereld, de consequentie waar is. (Deze analyse is zo opgevat dat een conjunctief-conditioneel waar is als het antecedent waar is in geen enkele wereld.) Stalnaker gebruikte analyse van conjunctieve conditionals om hun rol te baseren in de beslissingstheorie en in een oplossing van Newcomb's probleem.

In een brief aan Lewis stelde Stalnaker (1972) een manier voor om besluitvormingsprincipes in Newcomb's probleem te verzoenen. Hij stelde voor om het verwachte nut van een handeling te berekenen aan de hand van waarschijnlijkheden van conditionals in plaats van conditionele waarschijnlijkheden. Overeenkomstig, (textit {EU} (A) = \ sum_i P (A \ gt S_i) util (A \ amp S_i),)

waarbij (A \ gt S_i) staat voor de voorwaarde dat als (A) zou worden uitgevoerd, (S_i) zou worden verkregen. Dus in plaats van de waarschijnlijkheid van een voorspelling van one-boxing bij one-boxing te gebruiken, zou men de waarschijnlijkheid van de voorwaardelijke moeten gebruiken dat als de agent slechts één box zou kiezen, de voorspelling one-boxing zou zijn geweest. Omdat de handeling van de agent de voorspelling niet veroorzaakt, is de waarschijnlijkheid van het voorwaardelijke gelijk aan de waarschijnlijkheid dat de voorspelling one-boxing is. Overweeg ook de voorwaardelijke voorwaarde dat als de agent beide dozen zou kiezen, de voorspelling one-boxing zou zijn geweest. De kans is op dezelfde manier gelijk aan de kans dat de voorspelling one-boxing is. De handeling die de agent uitvoert heeft geen invloed op de waarschijnlijkheid van een voorspelling omdat de voorspelling plaatsvindt voorafgaand aan de handeling. Bijgevolg,Door de waarschijnlijkheid van conditionals te gebruiken om het verwachte nut te berekenen, is het verwachte nut van twee boxen groter dan het verwachte nut van één box. Daarom doet het principe van maximalisatie van het verwachte nut dezelfde aanbeveling als het principe van dominantie.

Gibbard en Harper (1978) werkten Stalnaker's oplossing voor het probleem van Newcomb uit en maakten deze openbaar. Ze maakten een onderscheid tussen de causale beslissingstheorie, die waarschijnlijkheden van conjunctieve conditionals gebruikt, van de bewijstheorie, die gebruik maakt van conditionele waarschijnlijkheden. Omdat bij beslissingsproblemen waarschijnlijkheden van conjunctieve conditionals causale relaties volgen, maakt het gebruik van deze om het verwachte nut van een optie te berekenen de causale theorie van de beslissing causaal.

Gibbard en Harper maakten onderscheid tussen twee soorten verwachte bruikbaarheid. Eén type noemden ze waarde en vertegenwoordigd met (V). Het duidt op nieuwswaarde of veelbelovend. Het andere type noemden ze utility en vertegenwoordigd met (U). Het geeft de werkzaamheid aan bij het bereiken van doelen. Een berekening van de verwachte waarde van een handeling maakt gebruik van voorwaardelijke kansen en een berekening van het verwachte nut maakt gebruik van waarschijnlijkheden van voorwaardelijke factoren. Ze voerden aan dat het verwachte nut, berekend met waarschijnlijkheden van conditionals, een echt verwacht nut oplevert.

Zoals Gibbard en Harper introduceren (V) en (U), beide berusten op een beoordeling (D) (voor wenselijkheid) van maximaal specifieke uitkomsten. In plaats van een formule voor verwachte bruikbaarheid aan te nemen die een beoordeling van uitkomsten neutraal gebruikt met betrekking tot bewijskrachtige en causale beslistheorie, volgt dit essay Stalnaker (1972) bij het aannemen van een formule die gebruik maakt van bruikbaarheid om uitkomsten te evalueren.

2.3 Varianten

Overweeg een voorwaardelijke bewering dat als een optie zou worden aangenomen, een bepaalde staat zou verkrijgen. Gibbard en Harper veronderstellen, om de belangrijkste ideeën van de causale beslissingstheorie te illustreren, dat het voorwaardelijke een waarheidswaarde heeft en dat de staat, gezien de onwaarheid ervan, de optie niet zou verkrijgen als deze optie zou worden aangenomen. Deze aanname kan ongegrond zijn als de optie een munt opgooit en de relevante staat koppen wint. Het kan onjuist (of onbepaald) zijn dat als de agent de munt zou omdraaien, hij koppen zou krijgen. Evenzo kan de overeenkomstige voorwaarde voor het verkrijgen van staarten vals (of onbepaald) zijn. Dan zijn waarschijnlijkheden van conditionals niet geschikt om het verwachte nut van de optie te berekenen. De relevante kansen tellen niet op tot één (of bestaan niet eens). Om dergelijke impasses te omzeilen,sommige theoretici berekenen causaal gevoelige verwachte hulpprogramma's zonder waarschijnlijkheid van conjunctieve conditionals. Causale beslissingstheorie heeft veel formuleringen.

Brian Skyrms (1980: Sec IIC; 1982) presenteerde een versie van de causale beslissingstheorie die de waarschijnlijkheid van conjunctieve conditionals achterwege laat. Zijn theorie scheidt factoren die de handeling van de agent kunnen beïnvloeden van factoren die de handeling van de agent mogelijk niet beïnvloedt. Het laat (K_i) staan voor een mogelijke volledige specificatie van factoren die een agent mogelijk niet beïnvloedt en laat (C_j) staan voor een mogelijke (maar niet noodzakelijk volledige) specificatie van factoren die de agent kan beïnvloeden. De set (K_i) vormt een partitie en de set (C_j) vormt een partitie. De formule voor het verwachte nut van een handeling berekent eerst het verwachte nut met behulp van factoren die de agent kan beïnvloeden, met betrekking tot elke mogelijke combinatie van factoren buiten de invloed van de agent. Vervolgens berekent het een waarschijnlijkheidsgewogen gemiddelde van die voorwaardelijke verwachte hulpprogramma's. Het verwachte nut van een handeling dat op deze manier wordt berekend, is de (K) - verwachting van de handeling, (textit {EU} _k (A)). Volgens de definitie van Skyrms,

(textit {EU} _k (A) = \ sum_i P (K_i) sum_j P (C_j \ mid K_i \ amp A) util (C_j \ amp K_i \ amp A). )

Skyrms is van mening dat een agent een handeling moet selecteren die de verwachting maximaliseert.

Lewis (1981) presenteerde een versie van de causale beslissingstheorie die het verwachte nut berekent aan de hand van kansen op afhankelijkheidshypothesen in plaats van kansen op conjunctieve conditionals. Een afhankelijkheidshypothese voor een agent tegelijk is een maximaal specifieke stelling over hoe de dingen waar de agent om geeft, wel en niet causaal afhankelijk zijn van zijn huidige daden. Het verwachte hulpprogramma van een optie is het waarschijnlijkheidsgewogen gemiddelde hulpprogramma met betrekking tot een partitie van afhankelijkheidshypothesen (K_i). Lewis definieert het verwachte nut van een optie (A) als

(textit {EU} (A) = \ sum_i P (K_i) util (K_i \ amp A))

en stelt dat rationeel handelen een optie is die het verwachte nut maximaliseert. Zijn formule voor het verwachte nut van een optie is dezelfde als die van Skyrms, ervan uitgaande dat (U (K_i \ amp A)) kan worden uitgebreid met betrekking tot een verdeling van factoren die de agent kan beïnvloeden, met behulp van de formule

[U (K_i \ amp A) = \ sum_j P (C_j \ mid K_i \ amp A) util (C_j \ amp K_i \ amp A).)

De berekeningen van Skyrms en Lewis van het verwachte nut schrappen de causale waarschijnlijkheden. Ze bouwen causaliteit op in staten van de wereld zodat causale waarschijnlijkheden niet nodig zijn. In gevallen zoals het probleem van Newcomb, leveren hun berekeningen dezelfde aanbevelingen op als berekeningen van het verwachte nut waarbij gebruik wordt gemaakt van waarschijnlijkheden van conjunctieve conditionals. De verschillende versies van de causale beslissingstheorie doen gelijkwaardige aanbevelingen wanneer gevallen aan hun achtergrondveronderstellingen voldoen.

2.4 Representatiestellingen

Beslissingstheorie introduceert vaak waarschijnlijkheid en bruikbaarheid met representatiestellingen. Deze stellingen tonen aan dat als voorkeuren tussen handelingen voldoen aan bepaalde beperkingen, zoals transitiviteit, er een waarschijnlijkheidsfunctie en een nutsfunctie bestaan (gegeven een schaalkeuze) die verwachte hulpprogramma's genereren die overeenstemmen met voorkeuren. David Krantz, R. Duncan Luce, Patrick Suppes en Amos Tversky (1971) bieden een goede, algemene introductie tot de doeleinden en methoden voor het construeren van representatiestellingen. In paragraaf 3.1 bespreek ik de functie van de stellingen in de beslissingstheorie.

Richard Jeffrey ([1965] 1983) presenteerde een representatiestelling voor de bewijstheorie, met behulp van de formule voor verwachte bruikbaarheid. Brad Armendt (1986, 1988a) presenteerde een representatiestelling voor de causale beslissingstheorie, gebruik makend van de formule voor verwachte bruikbaarheid. James Joyce (1999) construeerde een zeer algemene representatiestelling die een causale of bewijskrachtige beslissingstheorie oplevert, afhankelijk van de interpretatie van de waarschijnlijkheid die de formule voor het verwachte nut aanneemt.

2.5 Bezwaren

Het meest voorkomende bezwaar tegen de causale beslissingstheorie is dat deze de verkeerde keuze oplevert in het probleem van Newcomb. Het levert twee boksen op, terwijl één boksen correct is. Terry Horgan (1981 [1985]) en Paul Horwich (1987: hoofdstuk 11) promoten bijvoorbeeld one-boxing. De belangrijkste reden voor one-boxing is dat one-boxers het beter doen dan two-boxers. Causale beslissingstheoretici antwoorden dat het probleem van Newcomb een ongebruikelijk geval is dat irrationaliteit beloont. One-boxing is irrationeel, zelfs als one-boxers floreren.

Sommige theoretici zijn van mening dat one-boxing duidelijk rationeel is als de voorspelling volledig betrouwbaar is. Ze beweren dat als de voorspelling zeker klopt, de keuze beperkt wordt tot het nemen van ($ M) of het nemen van ($ T). Deze opvatting is te simpel. Als een agent one-boxen is, levert die handeling zeker ($ M) op. De agent had het echter nog steeds beter gedaan door beide dozen te pakken. Dominance beveelt nog steeds twee-boksen aan. Het zeker stellen van de voorspelling verandert niets aan het karakter van het probleem. Werkzaamheid overtreft nog steeds veelbelovend, zoals Howard Sobel (1994: hoofdstuk 5) betoogt.

Een manier om de twee kanten van het debat over het probleem van Newcomb met elkaar te verzoenen, erkent dat een rationeel persoon zich op het probleem moet voorbereiden door een aanleg voor één vak te cultiveren. Wanneer het probleem zich dan voordoet, zal de dispositie een voorspelling van one-boxing en daarna de handeling van one-boxing (nog steeds vrij gekozen) oproepen. De causale beslistheorie kan de waarde van dit preparaat erkennen. Het kan concluderen dat het cultiveren van een dispositie tot one-box rationeel is, hoewel one-boxing zelf irrationeel is. Dus als in Newcomb's probleem een agent twee dozen is, kan de causale beslissingstheorie toegeven dat de agent zich niet rationeel heeft voorbereid op het probleem. Niettemin stelt het dat twee-boksen zelf rationeel is. Hoewel twee-boksen niet de handeling is van een maximaal rationele agent, is het rationeel gezien de omstandigheden van het probleem van Newcomb.

De causale beslissingstheorie kan ook verklaren dat het een claim over de evaluatie van een handeling naar voren brengt, gezien de omstandigheden van de agent in Newcomb's probleem. Het bevestigt de voorwaardelijke rationaliteit van twee boksen. Voorwaardelijke en onvoorwaardelijke rationaliteit behandelen fouten anders. In tegenstelling tot voorwaardelijke rationaliteit, levert niet-voorwaardelijke rationaliteit geen fouten uit het verleden op. Het evalueert een handeling waarbij rekening wordt gehouden met de invloed van fouten uit het verleden. Voorwaardelijke rationaliteit accepteert de huidige omstandigheden echter zoals ze zijn en brengt een handeling niet in diskrediet omdat deze voortkomt uit fouten uit het verleden. Causale beslissingstheorie stelt dat two-boxing rationeel is, de omstandigheden van de agent toestaat en dus alle fouten negeert die tot die omstandigheden leiden, zoals irrationele voorbereiding op het probleem van Newcomb.

Een ander bezwaar tegen de causale beslissingstheorie geeft toe dat two-boxing de rationele keuze is in Newcomb's probleem, maar verwerpt causale principes van keuze die two-boxing opleveren. Er wordt gezocht naar niet-causale principes die twee boksen opleveren. Positivisme is een bron van afkeer van beslissingsprincipes waarin causaliteit is verwerkt. Sommige besluitvormingstheoretici mijden oorzakelijk verband omdat geen enkel positivistisch verslag de aard ervan specificeert. Zonder een definitie van oorzakelijk verband in termen van waarneembare verschijnselen, geven ze er de voorkeur aan dat de beslissingstheorie oorzakelijk verband vermijdt. De reactie van de causale beslissingstheorie op dit bezwaar is zowel om positivisme in diskrediet te brengen als om oorzakelijk verband te verduidelijken, zodat puzzels die erop betrekking hebben, de beslistheorie geen reden meer geven om het te vermijden.

De bewijstheorie heeft zwakkere metafysische veronderstellingen dan de causale beslistheorie, zelfs als causaliteit onberispelijke metafysische referenties heeft. Sommige beslissingstheoretici laten causaliteit niet weg vanwege metafysische scrupules, maar vanwege de conceptuele economie. Jeffrey ([1965] 1983, 2004) formuleert ter wille van de spaarzaamheid beslissingsprincipes die niet berusten op causale verbanden.

Ellery Eells (1981, 1982) stelt dat de bewijstheorie van het bewijs de aanbevelingen van de causale beslissingstheorie oplevert, maar, economischer, zonder te vertrouwen op een causaal apparaat. In het bijzonder levert de bewijstheorie op het gebied van de beslissende theorie twee keer boksen op in Newcomb's probleem. De reflectie van een agent op zijn bewijsmateriaal maakt dat voorwaardelijke kansen twee boksen ondersteunen.

Een niet-consequente uitwerking van het probleem van Newcomb stelt dat de keuze en de voorspelling van de agent een gemeenschappelijke oorzaak hebben. De keuze van de agent is een bewijs van de gemeenschappelijke oorzaak en een bewijs van de voorspelling van de keuze. Zodra een agent de waarschijnlijkheid van de gemeenschappelijke oorzaak verwerft, kan hij het bewijs dat zijn keuze voor de voorspelling oplevert opzij zetten. Dat bewijs is overbodig. Gezien de waarschijnlijkheid van de gemeenschappelijke oorzaak, is de kans op een voorspelling van one-boxing constant met betrekking tot zijn opties. Evenzo is de kans op een voorspelling van twee-boksen constant met betrekking tot zijn opties. Omdat de waarschijnlijkheid van een voorspelling voor beide opties hetzelfde is, overtreft het verwachte nut van twee-boksen het verwachte nut van één-boksen volgens de bewijstheorie. Horgan (1981 [1985]) en Huw Price (1986) maken soortgelijke punten.

Stel dat een gebeurtenis (S) een teken is van een oorzaak (C) die een effect (E) veroorzaakt. Voor de waarschijnlijkheid van (E), weten of (C) geldt, maakt het overbodig om te weten of (S) geldt. Observatie van (C) schermt het bewijs af dat (S) voorziet in (E). Dat wil zeggen (P (E \ mid C \ amp S) = P (E \ mid C)). In het probleem van Newcomb, ervan uitgaande dat de agent rationeel is, zijn zijn overtuigingen en verlangens een veelvoorkomende oorzaak van zijn keuze en voorspelling. Zijn keuze is dus een teken van de inhoud van de voorspelling. Voor de waarschijnlijkheid van een voorspelling van one-boxing, is het kennen van iemands overtuigingen en verlangens overbodig om de keuze te kennen die ze opleveren. Kennis van de gemeenschappelijke oorzaak schermt het bewijs af dat de keuze over de voorspelling geeft. Daarom is de waarschijnlijkheid van een voorspelling van one-boxing constant met betrekking tot iemands keuze,en maximalisatie van bewijskrachtig nut komt overeen met het principe van dominantie. Deze verdediging van de bewijstheorie wordt de kietelbescherming genoemd omdat ze ervan uitgaat dat een introspectieve toestand de correlatie tussen keuze en voorspelling afschermt.

Eells verdediging van bewijstheorie veronderstelt dat een agent kiest volgens overtuigingen en verlangens en zijn overtuigingen en verlangens kent. Sommige agents kiezen mogelijk niet op deze manier en beschikken mogelijk niet over deze kennis. Beslissingstheorie zou dergelijke middelen een rationele keuze moeten voorschrijven, en bewijskrachtige beslissingstheorie doet dat misschien niet correct, zoals Lewis (1981: 10–11) en John Pollock (2010) beweren. Armendt (1988b: 326–329) en David Papineau (2001: 252–255) zijn het erover eens dat het fenomeen van afscherming er niet in alle gevallen toe leidt dat de evolutieve beslissingstheorie de resultaten oplevert van de causale beslissingstheorie.

Horwich (1987: hoofdstuk 11) verwerpt het argument van Eells omdat, zelfs als een agent weet dat haar keuze voortkomt uit haar overtuigingen en verlangens, ze zich misschien niet bewust is van het mechanisme waardoor haar overtuigingen en verlangens haar keuze voortbrengen. De agent twijfelt misschien aan haar keuze door het verwachte nut te maximaliseren. Dan kan haar keuze in Newcomb's probleem relevant bewijs bieden over de voorspelling. Eells (1984a) construeert een dynamische versie van de kietelverdediging om aan dit bezwaar tegemoet te komen. Sobel (1994: hoofdstuk 2) bespreekt die versie van de verdediging. Hij stelt dat het niet de overeenstemming van de causale beslissingstheorie met bewijstheorie oplevert in alle beslissingsproblemen waarin een handeling bewijs levert over de toestand van de wereld. Bovendien stelt het niet vast dat een bewijstheorie van rationeel verlangen overeenkomt met een causale theorie van rationeel verlangen. Hij concludeert dat zelfs in gevallen waarin de theorie van bewijskrachtige beslissingen de juiste aanbeveling oplevert, deze niet om de juiste redenen wordt opgeleverd.

Price (2012) stelt een combinatie voor van bewijstheorie en causale beslissingstheorie en motiveert deze met een analyse van gevallen waarin een agent voorkennis heeft van een toevallige gebeurtenis. Causale besluitvormingstheorie is op zichzelf geschikt voor dergelijke gevallen, stelt Adam Bales (2016). Arif Ahmed (2014) is voorstander van de bewijstheorie voor bewijskracht en heeft verschillende bezwaren tegen de causale beslissingstheorie. Zijn bezwaren gaan uit van enkele controversiële punten over rationele keuze, waaronder een controversieel principe voor sequenties van keuzes.

Een gemeenschappelijke visie onderscheidt principes voor het evalueren van keuzes van principes voor het evalueren van sequenties van keuzes. Het principe van nutsmaximalisatie evalueert de keuze van een agent als oplossing van een beslissingsprobleem alleen als de agent directe controle heeft over elke optie in het beslissingsprobleem, dat wil zeggen, alleen als de agent onmiddellijk een optie in het beslissingsprobleem kan overnemen. Het principe evalueert niet de volgorde van meerdere keuzes van een agent, omdat de agent geen directe controle heeft over een dergelijke sequentie. Ze realiseert een reeks van meerdere keuzes alleen door elke keuze in de reeks op het moment ervoor te maken; ze kan niet onmiddellijk de hele reeks realiseren. Rationaliteit evalueert een optie in de directe controle van een agent door deze te vergelijken met alternatieven, maar evalueert een sequentie in de indirecte controle van een agent door de direct gecontroleerde opties in de sequentie te evalueren; een reeks keuzes is rationeel als de keuzes in de reeks rationeel zijn. Het aannemen van deze gemeenschappelijke methode om sequenties van keuzes te evalueren, weerlegt bezwaren tegen causale beslistheorie die uitgaan van rivaliserende methoden.

3. Huidige problemen

Beslissingstheorie is een actief onderzoeksgebied. Het huidige werk pakt een aantal problemen aan. De benadering van de causale beslissingstheorie voor die problemen vloeit voort uit haar niet-positivistische methodologie en haar aandacht voor oorzakelijk verband. Deze sectie noemt enkele onderwerpen op de agenda van de causale beslissingstheorie.

3.1 Waarschijnlijkheid en nut

Principes van de causale beslissingstheorie gebruiken waarschijnlijkheden en hulpprogramma's. De interpretatie van waarschijnlijkheden en nutsvoorzieningen is een kwestie van discussie. Een traditie definieert ze in termen van functies die representatiestellingen introduceren om voorkeuren weer te geven. De representatiestellingen laten zien dat als voorkeuren voldoen aan bepaalde structurele axioma's, en als ze ook voldoen aan bepaalde normatieve axioma's, ze zijn alsof ze het verwachte nut volgen. Dat wil zeggen, voorkeuren volgen het verwachte nut berekend met gebruikmaking van waarschijnlijkheid en nutsfuncties die zodanig zijn geconstrueerd dat de voorkeuren het verwachte nut volgen. Het verwachte nut dat op deze manier wordt berekend, verschilt van het verwachte nut dat wordt berekend met waarschijnlijkheid en toewijzingen van nutsvoorzieningen die zijn gebaseerd op attitudes ten opzichte van mogelijke resultaten. Bijvoorbeeld,een persoon die in de war is over weddenschappen met betrekking tot een toss met munten kan voorkeuren hebben bij weddenschappen die zijn alsof hij waarschijnlijk 60% aan heads toewijst, terwijl in feite het bewijs van eerdere worpen ertoe leidt dat hij waarschijnlijkheid 40% aan heads toewijst. Dientengevolge, wanneer voorkeuren voldoen aan de structurele axioma's van een representatiestelling, rechtvaardigen de normatieve axioma's van de stelling alleen conformiteit met het verwachte nut dat is gefabriceerd om met voorkeuren overeen te komen en rechtvaardigen zij niet conformiteit met het verwachte nut in traditionele zin. Het definiëren van waarschijnlijkheid en bruikbaarheid met behulp van de representatiestellingen, verzwakt dus het traditionele principe van verwachte bruikbaarheid. Het wordt slechts een principe van coherentie tussen voorkeuren.wanneer voorkeuren voldoen aan de structurele axioma's van een representatiestelling, rechtvaardigen de normatieve axioma's van de stelling alleen conformiteit met het verwachte nut dat is verzonnen om voorkeuren overeen te komen en rechtvaardigen zij geen conformiteit met het verwachte nut in traditionele zin. Het definiëren van waarschijnlijkheid en bruikbaarheid met behulp van de representatiestellingen, verzwakt dus het traditionele principe van verwachte bruikbaarheid. Het wordt slechts een principe van coherentie tussen voorkeuren.wanneer voorkeuren voldoen aan de structurele axioma's van een representatiestelling, rechtvaardigen de normatieve axioma's van de stelling alleen conformiteit met het verwachte nut dat is verzonnen om voorkeuren overeen te komen en rechtvaardigen zij geen conformiteit met het verwachte nut in traditionele zin. Het definiëren van waarschijnlijkheid en bruikbaarheid met behulp van de representatiestellingen, verzwakt dus het traditionele principe van verwachte bruikbaarheid. Het wordt slechts een principe van coherentie tussen voorkeuren. Het wordt slechts een principe van coherentie tussen voorkeuren. Het wordt slechts een principe van coherentie tussen voorkeuren.

In plaats van de representatiestellingen te gebruiken om waarschijnlijkheden en hulpprogramma's te definiëren, kan de beslistheorie ze gebruiken om de meetbaarheid van waarschijnlijkheden en hulpprogramma's vast te stellen wanneer voorkeuren voldoen aan structurele en normatieve axioma's. Deze toepassing van de representatiestellingen stelt de beslistheorie in staat het traditionele principe van verwachte bruikbaarheid te bevorderen en daardoor de behandeling van rationele beslissingen te verrijken. Beslissingstheorie kan dat traditionele principe rechtvaardigen door het af te leiden uit algemene evaluatieprincipes, zoals in Weirich (2001).

Een breed overzicht van waarschijnlijkheden en nutsbedrijven brengt hen ertoe om attitudes ten opzichte van proposities aan te geven. Het zijn respectievelijk rationele graden van geloof en rationele niveaus van verlangen. Dit overzicht van waarschijnlijkheden en nutsbedrijven erkent hun bestaan in gevallen waarin ze niet kunnen worden afgeleid van voorkeuren of hun andere effecten, maar in plaats daarvan worden afgeleid van hun oorzaken, zoals de informatie van een agent over objectieve kansen, of helemaal niet worden afgeleid (behalve misschien door introspectie). Het verslag beroept zich op argumenten dat graden van overtuiging en graden van verlangen, indien rationeel, voldoen aan standaardprincipes van waarschijnlijkheid en bruikbaarheid. Het versterken van deze argumenten is werk voor de theorie van causale beslissingen.

Naast het verduidelijken van de algemene interpretatie van waarschijnlijkheid en bruikbaarheid, zoekt de causale beslissingstheorie naar de specifieke waarschijnlijkheden en hulpprogramma's die de beste versie van zijn principe opleveren om het verwachte nut te maximaliseren. De causale waarschijnlijkheden in de formule voor verwachte bruikbaarheid kunnen waarschijnlijkheden zijn van conjunctieve conditionals of verschillende substituten. Versies die waarschijnlijkheden van conjunctieve conditionals gebruiken, moeten genoegen nemen met een analyse van die conditionals. Lewis (1973: hoofdstuk 1) past de analyse van Stalnaker aan om een conjunctief voorwaardelijk waar te tellen als en alleen als als de antecedente werelden steeds dichter bij de werkelijke wereld komen, er een punt is waarboven de consequentie in alle werelden waar is tenminste dat dichtbij. Joyce (1999: 161–180) bevordert waarschijnlijkheidsbeelden, zoals Lewis (1976) ze introduceert,als vervanging voor kansen op conjunctieve conditionals. Het waarschijnlijkheidsbeeld van een toestand (S) onder aanvoegende wijs van een handeling (A) is de waarschijnlijkheid van (S) volgens een opdracht die de waarschijnlijkheid van ({ sim} A) verschuift - werelden naar nabijgelegen (A) - werelden. Causale relaties tussen een handeling en mogelijke toestanden bepalen de herverdeling van de waarschijnlijkheid.

Een algemene formule voor het verwachte nut van een handeling is dat het nut van een act-state-paar, het nut van de uitkomst van de act in de staat, het nut is van de handeling en de conjunctie van de staat:

(textit {EU} (A) = \ sum_i P (A \ gt S_i) util (A \ amp S_i).)

Heeft de causale beslissingstheorie een alternatief, meer causaal gevoelig nut nodig voor een act-state pair? Weirich (1980) beweert van wel. Een persoon die een weddenschap overweegt dat de hoofdstad van Missouri Jefferson City is, heeft de gevolgen als hij de weddenschap zou aangaan, aangezien St. Louis de hoofdstad van Missouri is. Een rationele deliberator veronderstelt ondergeschikt een handeling die aandacht besteedt aan causale relaties en veronderstelt indicatief een staat die zich bezighoudt met bewijsbetrekkingen, maar kan de samenstand van een handeling en een staat slechts op één manier veronderstellen. Bovendien voorkomt het gebruik van de bruikbaarheid van een handeling en de voeg van een staat dat het verwachte nut van een handeling partitie-invariant is. In de volgende paragraaf wordt dit punt nader uitgewerkt.

3.2 Partitie-invariantie

Het verwachte hulpprogramma van een handeling is partitie-invariant als en alleen als het hetzelfde is onder alle partities van staten. Partitie-invariantie is een essentiële eigenschap van het verwachte nut van een handeling. Als de verwachte hulpprogramma's van acts deze eigenschap niet hebben, mag de besluitvormingstheorie alleen verwachte hulpprogramma's gebruiken die zijn berekend op basis van geselecteerde partities. De partitie-invariantie van het verwachte hulpprogramma maakt het verwachte hulpprogramma van een handeling onafhankelijk van de selectie van een partitie van staten en vergroot daardoor de verklarende kracht van het verwachte hulpprogramma.

Partitie-invariantie zorgt ervoor dat verschillende weergaven van hetzelfde beslissingsprobleem oplossingen opleveren die het daarmee eens zijn. Neem Newcomb's probleem met de weergave van figuur 2.

Juiste voorspelling Verkeerde voorspelling
Neem maar één doos ($ M) $ 0
Neem twee dozen ($ T) ($ M + \ $ T)

Figuur 2. Nieuwe staten voor het probleem van Newcomb

Dominantie is niet van toepassing op deze vertegenwoordiging. Het lost echter de oplossing van het probleem op, omdat het van toepassing is op een beslissingsprobleem als het van toepassing is op een nauwkeurige weergave van het probleem, zoals de weergave van het probleem in figuur 1. Als verwachte hulpprogramma's partitiegevoelig zijn, zijn handelingen die het verwachte hulpprogramma maximaliseren mogelijk partitiegevoelig. Het principe van het verwachte nut levert echter niet de oplossing van een beslissingsprobleem op als de handelingen van het maximale verwachte nut van de ene partitie naar de andere veranderen. In dat geval is een handeling geen oplossing voor een beslissingsprobleem, simpelweg omdat het de verwachte bruikbaarheid maximaliseert onder een nauwkeurige weergave van het probleem. Te veel handelingen hebben dezelfde referentie.

Het verwachte nutsprincipe, gebruikmakend van waarschijnlijkheden van conditionals, is van toepassing op figuur 2's weergave van het probleem van Newcomb. Laat (P1) staan voor een voorspelling van one-boxing en (P2) staan voor een voorspelling van two-boxing, de verwachte hulpprogramma's van de handelingen zijn:

(begin {align} textit {EU} (1) & = P (1 \ gt R) util ($ M) + P (1 \ gt W) 0 \& = P (P1) util ($ M) \ \ textit {EU} (2) & = P (2 \ gt R) util ($ T) + P (2 \ gt W) util ($ M + \ $ T) & = P (P2) util ($ T) + P (P1) util ($ M + \ $ T) \ \ end {align})

Vandaar (textit {EU} (1) lt EU (2)). Dit resultaat komt overeen met het oordeel van de causale beslissingstheorie, gegeven andere nauwkeurige representaties van het probleem. Mits de causale beslissingstheorie een partitie-invariante formule gebruikt voor het verwachte nut, zijn de aanbevelingen onafhankelijk van de representatie van een beslissingsprobleem.

Lewis (1981: 12–13) merkt op dat de formule

[EU (A) = \ sum_i P (S_i) util (A \ amp S_i))

is niet partitie-invariant. De resultaten zijn afhankelijk van de verdeling van staten. Als een staat een verzameling werelden is met gelijke voorzieningen, dan heeft elke handeling met betrekking tot een verdeling van dergelijke staten hetzelfde verwachte nut. Een element (S_i) van de partitie verduistert de effecten van (A) die het nut van een uitkomst zou moeten evalueren. Lewis lost dit probleem op door alleen partities van afhankelijkheidshypothesen te gebruiken. De causale beslissingstheorie kan echter een partitie-invariante formule voor het verwachte nut creëren door een vervanging voor (U (A \ amp S_i)) te gebruiken.

Sobel (1994: hoofdstuk 9) onderzoekt partitie-invariantie. Door zijn werk in de notatie van dit essay te plaatsen, gaat hij als volgt te werk. Eerst neemt hij een canonieke berekening van het verwachte nut van een optie om werelden als staten te gebruiken. Zijn basisformule is

(textit {EU} (A) = \ sum_i P (A \ gt W_i) util (W_i).)

Een wereld (W_i) absorbeert een handeling die erin wordt uitgevoerd. Alleen de werelden waarin (A) bezit, dragen positieve waarschijnlijkheden bij en beïnvloeden dus de som. Vervolgens zoekt Sobel met behulp van grofkorrelige toestanden naar andere berekeningen die equivalent zijn aan de canonieke berekening. Een geschikte specificatie van hulpprogramma's bereikt partitie-invariantie, gegeven zijn aannames. Volgens een stelling bewijst hij (1994: 185), [U (A) = \ sum_i P (S_i) util (A \ mbox {gegeven} S_i))

voor elke partitie van staten.

Joyce (2000: S11) formuleert ook voor causale beslistheorie een partitie-invariante formule voor het verwachte nut van een handeling. Hij bereikt partitie-invariantie, ervan uitgaande dat

(textit {EU} (A) = \ sum_i P (A \ gt S_i) util (A \ amp S_i),)

door te bepalen dat (U (A \ amp S_i)) gelijk is aan

(sum_ {ij} P ^ A (W_j \ mid S_i) util (W_j),)

waar (W_j) een wereld is en (P ^ A) staat voor het waarschijnlijkheidsbeeld van (A). Weirich (2001: Secs. 3.2, 4.2.2) vervangt, zoals Sobel doet, (U (A \ mbox {gegeven} S_i)) door (U (A \ amp S_i)) in de formule voor verwachte bruikbaarheid en interpreteert (U (A \ mbox {gegeven} S_i)) als het nut van de uitkomst die de realisatie van (A) zou opleveren als (S) zou worden verkregen. Dienovereenkomstig reageert (U (A \ mbox {gegeven} S_i)) op de causale gevolgen van (A) in werelden waar (S_i) geldt. Dan de formule

(textit {EU} (A) = \ sum_i P (S_i) util (A \ mbox {gegeven} S_i))

is onveranderlijk met betrekking tot partities waarin staten probabilistisch onafhankelijk zijn van de handeling. Een complexere formule, (textit {EU} (A) = \ sum_i P (S_i \ mbox {if} A) util (A \ mbox {gegeven} (S_i \ mbox {if} A)),)

uitgaande van een causale interpretatie van zijn waarschijnlijkheden, versoepelt alle beperking op partities. (U (A \ mbox {gegeven} (S_i \ mbox {if} A))) is het nut van de uitkomst als (A) zou worden gerealiseerd, aangezien het zo is dat (S_i) zou verkrijgen als (A) zijn gerealiseerd.

3.3 Resultaten

Een probleem met de resultaten is hun volledigheid. Zijn de uitkomsten van een handeling mogelijke werelden, tijdelijke nasleep of oorzakelijke gevolgen? Gibbard en Harper ([1978] 1981: 166–168) noemen de mogelijkheid om uitkomsten te beperken tot causale gevolgen, zoals praktische toepasbaarheid bepleit. De vernauwing moet echter verstandig zijn, omdat het verwachte nutsprincipe vereist dat uitkomsten alle relevante overwegingen bevatten. Als een agent bijvoorbeeld wars is van risico's, moet elk van de mogelijke uitkomsten van een risicovolle handeling het risico omvatten dat de handeling genereert. De opname heeft de neiging het nut van elk mogelijk resultaat te verminderen.

In de canonieke formule van Sobel voor verwachte bruikbaarheid, (textit {EU} (A) = \ sum_i P (A \ gt W_i) util (W_i).)

De formule laat vanuit één perspectief staten van de wereld weg omdat de resultaten zelf een partitie vormen. Het onderscheid tussen staten en uitkomsten verdwijnt omdat werelden de rol spelen van zowel staten als uitkomsten. Staten zijn onmisbare middelen om exclusieve en uitputtende resultaten te genereren. Volgens een basisprincipe is het verwachte nut van een handeling een waarschijnlijkheidsgewogen gemiddelde van mogelijke uitkomsten die exclusief en uitputtend zijn, zoals de werelden waartoe de handeling kan leiden.

Stel dat het nut van een wereld voortkomt uit het besef van fundamentele intrinsieke verlangens en afkeer. Ervan uitgaande dat de hulpprogramma's van hun realisaties additief zijn, is het nut van een wereld een optelsom van de hulpprogramma's van hun realisaties. Behalve dat het een waarschijnlijkheidsgewogen gemiddelde is van de hulpprogramma's van werelden waartoe het kan leiden, is het verwachte nut van een optie ook een waarschijnlijkheidsgewogen gemiddelde van de realisaties van fundamentele intrinsieke verlangens en afkeer. In deze formule spelen staten voor hun verwachte nut geen expliciete rol:

(textit {EU} (A) = \ sum_i P (A \ gt B_i) util (B_i),)

waar (B_i) zich uitstrekt over mogelijke realisaties van fundamentele intrinsieke verlangens en aversies. De formule beschouwt voor elke fundamentele wens en afkeer het vooruitzicht van de realisatie ervan als de handeling zou worden uitgevoerd. Het neemt het verwachte nut van de handeling als de som van de nutsvoorzieningen van de prospects. De formule geeft een economische weergave van het verwachte nut van een handeling. Het elimineert toestanden en verkrijgt het verwachte nut direct uit de resultaten die worden genomen als realisaties van basiswensen en aversies.

Stel, om de berekening van het verwachte nut van een handeling te illustreren met behulp van basale intrinsieke verlangens en afkeer, dat een agent geen basis intrinsieke afkeer heeft en slechts twee basis intrinsieke verlangens, één voor gezondheid en de andere voor wijsheid. Het nut van gezondheid is 4 en het nut van wijsheid is 8. In de formule voor het verwachte nut omvat een wereld alleen zaken waar de agent om geeft. In het voorbeeld is een wereld een voorstel dat aangeeft of de agent gezondheid heeft en of hij wijsheid heeft. Er zijn dus vier werelden: (begin {align} H \ amp W, \\ H \ amp { sim} W, \{ sim} H \ amp W, \{ sim} H \ amp { sim} W. \\ \ end {align}) Stel dat (A) even waarschijnlijk een wereld zal genereren. Gebruik werelden, (begin {align} textit {EU} (A) & = P (A \ gt (H \ amp W)) util (H \ amp W) & \ qquad + P (A \ gt (H \ amp { sim} W)) util (H \ amp { sim} W) &\ qquad + P (A \ gt ({ sim} H \ amp W)) util ({ sim} H \ amp W) & \ qquad + P (A \ gt ({ sim} H \ amp { sim} W)) util ({ sim} H \ amp { sim} W) & = (0.25) (12) + (0.25) (4) + (0.25) (8) + (0.25) (0) & = 6. \\ \ end {align}) Gebruik makend van basis intrinsieke attitudes, (begin {align} textit {EU} (A) & = P (A \ gt H) util (H) + P (A \ gt W) util (W) & = (0,5) (4) + (0,5) (8) & = 6. \ end {align}) De twee methoden van het berekenen van het nut van een optie is equivalent, aangezien, onder de veronderstelling van de realisatie van een handeling, de waarschijnlijkheid van de realisatie van een fundamentele intrinsieke wens of afkeer de som is van de waarschijnlijkheden van de werelden die het beseffen.\\ \ end {align}) Gebruik makend van basis intrinsieke attitudes, (begin {align} textit {EU} (A) & = P (A \ gt H) util (H) + P (A \ gt W) util (W) & = (0,5) (4) + (0,5) (8) & = 6. \ end {align}) De twee methoden voor het berekenen van het hulpprogramma van een optie zijn equivalent, aangezien onder veronderstelling van de realisatie van een handeling, is de waarschijnlijkheid van de realisatie van een fundamenteel intrinsiek verlangen of afkeer de som van de waarschijnlijkheden van de werelden die het beseffen.\\ \ end {align}) Gebruik makend van basis intrinsieke attitudes, (begin {align} textit {EU} (A) & = P (A \ gt H) util (H) + P (A \ gt W) util (W) & = (0,5) (4) + (0,5) (8) & = 6. \ end {align}) De twee methoden voor het berekenen van het hulpprogramma van een optie zijn equivalent, aangezien onder veronderstelling van de realisatie van een handeling, is de waarschijnlijkheid van de realisatie van een fundamenteel intrinsiek verlangen of afkeer de som van de waarschijnlijkheden van de werelden die het beseffen.de waarschijnlijkheid van de realisatie van een fundamenteel intrinsiek verlangen of afkeer is de som van de waarschijnlijkheden van de werelden die het beseffen.de waarschijnlijkheid van de realisatie van een fundamenteel intrinsiek verlangen of afkeer is de som van de waarschijnlijkheden van de werelden die het beseffen.

3.4 Handelingen

Bij beraadslagingen vertegenwoordigt een first-person actievoorstel een handeling. De propositie heeft een subject-predikaatstructuur en verwijst rechtstreeks naar de agent, het onderwerp ervan, zonder tussenkomst van een concept van de agent. Een gecentreerde wereld vertegenwoordigt de propositie. Zo'n wereld specificeert niet alleen individuen en hun eigenschappen en relaties, maar specificeert ook welk individu de agent is en waar en wanneer zijn beslissingsprobleem zich voordoet. Realisatie van de handeling is de realisatie van een wereld met in het midden de agent op het moment en de plaats van zijn beslissingsprobleem.

Isaac Levi (2000) maakt bezwaar tegen elke beslissingstheorie die kansen aan handelingen koppelt. Hij meent dat beraadslaging de voorspelling verdringt. Tijdens een beraadslaging heeft een agent geen overtuigingen of graden van overtuiging over de handeling die zij zal verrichten. Levi is van mening dat het probleem van Newcomb, en de bewijstheorie en de causale beslissing die daarop betrekking hebben, betrekking heeft op verkeerde toewijzingen van waarschijnlijkheden aan de handelingen van een agent. Hij verwerpt zowel Jeffrey's ([1965] 1983) bewijstheorie en Joyce's (1999) causale beslissingstheorie omdat ze een agent in staat stellen tijdens haar beraadslagingen waarschijnlijkheden toe te kennen aan haar daden.

In tegenstelling tot Levi's opvattingen stelt Joyce (2002) dat (1) de causale beslissingstheorie niet hoeft tegemoet te komen aan de toewijzing van waarschijnlijkheden door een agent aan haar daden, maar (2) een opzettelijke agent legitieme waarschijnlijkheden aan haar daden mag toewijzen. De bewijstheorie voor de berekening berekent het verwachte nut van een handeling op basis van de waarschijnlijkheid van een toestand, gegeven de handeling (P (S \ mid A)), gedefinieerd als (P (S \ amp A) / P (A)). De noemer van de breuk kent een waarschijnlijkheid toe aan een handeling. De causale beslistheorie vervangt (P (S \ mid A)) door (P (A \ gt S)) of een vergelijkbare causale waarschijnlijkheid. Het hoeft geen waarschijnlijkheid toe te kennen aan een handeling.

Mag een agent die beraadslaagt, waarschijnlijkheden toewijzen aan haar mogelijke daden? Ja, een deliberator kan verstandig waarschijnlijkheden toekennen aan gebeurtenissen, inclusief haar daden. De causale beslistheorie kan dergelijke kansen accommoderen door af te zien van hun meting met wedquotiënten. Volgens die meetmethode duidt de bereidheid om in te zetten op waarschijnlijkheden. Stel dat een persoon bereid is om een van beide kanten te nemen van een weddenschap waarbij de inzet voor het evenement (x) is en de inzet voor het evenement (y). Dan is de kans die de persoon aan het evenement toewijst het wedden quotiënt (x / (x + y)). Deze meetmethode kan mislukken als de gebeurtenis de eigen toekomstige handeling van een agent is. Een weddenschap op de realisatie van een handeling kan de waarschijnlijkheid van de handeling beïnvloeden, aangezien de temperatuur van een thermometer de temperatuur van een vloeistof die hij meet kan beïnvloeden.

Joyce (2007: 552–561) overweegt of Newcomb-problemen echte beslissingsproblemen zijn, ondanks sterke correlaties tussen staten en daden. Hij concludeert dat, ja, ondanks die correlaties, een agent haar beslissing kan beschouwen als de oorzaak van haar daad. De beslissing van een agent ondersteunt een overtuiging over haar handelen, onafhankelijk van eerdere correlaties tussen staten en haar handelen. Volgens een principe van bewijsautonomie (2007: 557),

Een weloverwogen agent die zichzelf als vrij beschouwt, hoeft haar overtuigingen over haar eigen daden niet te evenaren met het antecedente bewijs dat ze heeft om te denken dat ze ze zal uitvoeren.

Ze moet haar overtuigingen evenredig maken met haar totale bewijs, inclusief haar zelfvoorzienende overtuigingen over haar eigen daden. Die overtuigingen leveren nieuw relevant bewijs over haar daden.

Hoe moet een agent die over een handeling beraadslaagt de achtergrond van haar daad begrijpen? Ze mag niet terughoudend denken over haar daad. Als ze op de rand van een klif staat, mag ze niet aannemen dat als ze zou springen, ze een parachute zou hebben om haar val te breken. Ook mag ze zich geen gratuite veranderingen in haar basiswensen voorstellen. Ze zou zich niet moeten voorstellen dat als ze chocolade in plaats van vanille zou kiezen, ondanks dat ze momenteel vanille verkiest, ze dan de voorkeur zou geven aan chocolade. Ze moet zich voorstellen dat haar basiswensen constant zijn, aangezien ze zich de verschillende handelingen voorstelt die ze zou kunnen uitvoeren, en bovendien tijdens beraadslagingen de pretentie zou aannemen dat ze haar daad zal genereren, onafhankelijk van haar basiswensen en afkeer.

Christopher Hitchcock (1996) is van mening dat een agent moet doen alsof haar daad geen oorzakelijke invloed heeft. Hierdoor komen partities van staten die waarschijnlijkheden opleveren voor besluit overeen met partities van staten die waarschijnlijkheden opleveren die de causale relevantie definiëren. Hierdoor kunnen waarschijnlijkheden in de causale beslistheorie een basis vormen voor waarschijnlijkheden in de probabilistische causatietheorie. Causale beslissingstheorie, in het bijzonder de versie die gebruik maakt van afhankelijkheidshypothesen, beroept theorieën over probabilistische causaliteit.

3.5 Verwacht hulpprogramma generaliseren

Problemen zoals de weddenschap van Pascal en de paradox van Sint-Petersburg suggereren dat de beslissingstheorie een middel nodig heeft om met oneindige hulpprogramma's en verwachte hulpprogramma's om te gaan. Stel dat de mogelijke resultaten van een optie allemaal eindige hulpprogramma's hebben. Niettemin, als die hulpprogramma's oneindig veel en onbeperkt zijn, kan het verwachte hulpprogramma van de optie oneindig zijn. Alan Hájek en Harris Nover (2006) laten ook zien dat de optie mogelijk niet het verwachte nut heeft. De volgorde van mogelijke uitkomsten, die willekeurig is, kan van invloed zijn op de convergentie van het waarschijnlijkheidsgewogen gemiddelde van hun nutsbedrijven en de waarde waarnaar het gemiddelde convergeert als het convergeert. De causale beslissingstheorie zou haar principe van verwachte nutsmaximalisatie moeten generaliseren om dergelijke gevallen aan te pakken.

Ook bevorderen gemeenschappelijke principes van de causale beslissingstheorie rationaliteitsnormen die te veeleisend zijn om op mensen toe te passen. Het zijn standaarden voor ideale agenten in ideale omstandigheden (een nauwkeurige formulering van de idealisaties kan van theoreticus tot theoreticus verschillen). Om de causale beslissingstheorie realistisch te maken, zijn ontspannende idealisaties nodig die in de principes ervan worden aangenomen. Een veralgemening van het principe van maximalisatie van het verwachte nut kan bijvoorbeeld idealisaties versoepelen om rekening te houden met beperkte cognitieve vaardigheden. Weirich (2004) en Pollock (2006) zetten stappen in deze richting. Passende generalisaties maken onderscheid tussen het maximaliseren van het verwachte nut als een procedure voor het nemen van een beslissing en het als standaard nemen voor het evalueren van een beslissing, zelfs nadat de beslissing is genomen.

3.6 Bekrachtiging

Gibbard en Harper (1978: Sec. 11) stellen een probleem voor de causale beslissingstheorie aan de hand van een voorbeeld uit de literatuur. Een man in Damascus weet dat hij om middernacht een afspraak met Death heeft. Hij zal aan de dood ontsnappen als het hem om middernacht lukt niet op de plaats van zijn afspraak te zijn. Hij kan om middernacht in Damascus of Aleppo zijn. Zoals de man weet, is de dood een goede voorspeller van zijn verblijfplaats. Als hij in Damascus blijft, heeft hij daarmee het bewijs dat de Dood hem in Damascus zal zoeken. Als hij echter naar Aleppo gaat, heeft hij daarmee het bewijs dat de Dood hem in Aleppo zal zoeken. Waar hij ook besluit om middernacht te zijn, hij heeft bewijzen dat hij op de andere plaats beter af zou zijn. Geen enkele beslissing is stabiel. Instabiliteit van de beslissing ontstaat in gevallen waarin een keuze bewijs levert voor de uitkomst ervan,en elke keuze levert het bewijs dat een andere keuze beter zou zijn geweest. Reed Richter (1984, 1986) gebruikt gevallen van beslissingsinstabiliteit om te argumenteren tegen de causale beslistheorie. De theorie heeft een oplossing nodig voor het probleem van besluitinstabiliteit.

Een algemene analyse van het probleem classificeert opties als zelf-bekrachtigend of niet-zelf-bekrachtigend. Jeffrey ([1965] 1983) introduceerde ratificatie als een onderdeel van de bewijstheorie. Zijn versie van de theorie evalueert een beslissing op basis van het verwachte nut van de geselecteerde handeling. Het onderscheid tussen een handeling en een besluit om de handeling uit te voeren, rechtvaardigt zijn definitie van de zelfbekrachtiging van een optie en zijn beginsel om zelf bekrachtigende of bekrachtige besluiten te nemen. Volgens zijn definitie ([1965] 1983: 16),

Een bekrachtig besluit is een besluit om een handeling uit te voeren met een maximale geschatte wenselijkheid in verhouding tot de waarschijnlijkheidsmatrix die de agent denkt te hebben als hij uiteindelijk zou besluiten die handeling uit te voeren.

De geschatte wenselijkheid is het verwachte nut. De waarschijnlijkheidsmatrix van een agent is een reeks rijen en kolommen voor respectievelijk handelingen en toestanden, waarbij elke cel wordt gevormd door het snijpunt van de rij van een handeling en een kolom van een staat die de waarschijnlijkheid van de staat bevat, aangezien de agent op het punt staat de handeling uit te voeren. Alvorens een handeling uit te voeren, kan een agent de handeling beoordelen in het licht van een besluit om deze uit te voeren. Informatie die het besluit bevat, kan van invloed zijn op het verwachte nut van de handeling en de rangorde ervan ten opzichte van andere handelingen.

Jeffrey gebruikte ratificatie als middel om ervoor te zorgen dat de bewijstheorie dezelfde aanbevelingen geeft als de causale beslistheorie. In het probleem van Newcomb is bijvoorbeeld twee-boksen de enige optie die zichzelf bekrachtigt. Jeffrey (2004: 113n) geeft echter toe dat het feit dat de bewijstheorie afhankelijk is van bekrachtiging niet in alle gevallen in overeenstemming is met de causale beslistheorie. Bovendien stelt Joyce (2007) dat de motivatie voor ratificatie een beroep doet op causale verbanden, zodat het, zelfs als het correcte aanbevelingen oplevert met Jeffrey's formule voor verwachte bruikbaarheid, nog steeds geen puur bewijskrachtige beslissingstheorie oplevert.

Het relaas van de zelfratificatie van de causale beslissingstheorie kan Jeffrey's methode om een beslissing te evalueren opzij zetten door de handeling die ze selecteert te evalueren. Omdat de beslissing en de handeling verschillen, kunnen ze verschillende gevolgen hebben. Het kan bijvoorbeeld zijn dat een besluit de door hem geselecteerde handeling niet genereert. Daarom kan het verwachte nut van de beslissing verschillen van het verwachte nut van de handeling. Rijden door een overstroomd gedeelte van de snelweg kan een hoge verwachte bruikbaarheid hebben omdat het de reistijd naar de bestemming minimaliseert. De beslissing om door het overstroomde gedeelte te rijden kan echter een laag verwacht nut hebben, omdat het water voor zover bekend diep genoeg kan zijn om de auto te overspoelen. Het gebruik van het verwachte nut van een handeling om een beslissing om de handeling uit te voeren te beoordelen, leidt tot onjuiste beoordelingen van besluiten. Het is beter om een beslissing te evalueren door het verwachte nut ervan te vergelijken met het verwachte nut van concurrerende beslissingen. Het verwachte nut van een beslissing hangt af van de waarschijnlijkheid van de uitvoering ervan en van de verwachte gevolgen van de handeling die hij selecteert.

Weirich (1985) en Harper (1986) definiëren ratificatie in termen van het verwachte nut van een optie, gezien de realisatie ervan in plaats van de beslissing om het te realiseren. Een optie bekrachtigt zichzelf als en alleen als het de verwachte bruikbaarheid maximaliseert, gezien de realisatie ervan. Dit ratificatierapport biedt ruimte aan gevallen waarin een optie en een besluit om dit te realiseren verschillende verwachte nutsbedrijven hebben. Weirich en Harper gaan ook uit van de formule van de causale beslissingstheorie voor het verwachte nut. In het geval van Death in Damascus concludeert de theorie van de causale beslissing dat de bedreigde man geen zelfbekrachtigende optie heeft. Een zelfbekrachtigende optie komt echter naar voren als de man een munt mag omdraaien om zijn beslissing te nemen. Het aannemen van de kansverdeling voor locaties wordt een gemengde strategie genoemd, terwijl locatiekeuzes pure strategieën worden genoemd. Ervan uitgaande dat de dood de uitkomst van de munt niet kan voorspellen, is de gemengde strategie zelf bekrachtigend.

Tijdens beraadslagingen om een beslissingsprobleem op te lossen, kan een agent de waarschijnlijkheden die zij aan zuivere strategieën toewijst, herzien in het licht van berekeningen van hun verwachte hulpprogramma's met behulp van eerdere waarschijnlijkheidsopdrachten. Het herzieningsproces kan uitmonden in een stabiele waarschijnlijkheidstoewijzing die een gemengde strategie vertegenwoordigt. Skyrms (1982, 1990) en Eells (1984b) onderzoeken deze dynamiek van deliberatie. Enkele openstaande vraagstukken zijn of het aannemen van een gemengde strategie een beslissingsprobleem oplost en of een pure strategie die voortkomt uit een gemengde strategie die een evenwicht vormt van beraadslagingen, rationeel is als de pure strategie zelf niet zichzelf bekrachtigt.

Andy Egan (2007) stelt dat de causale beslistheorie de verkeerde aanbeveling geeft bij beslissingsproblemen met een optie die bewijs levert voor de uitkomst ervan. Hij vermaakt zich met het geval van een huurmoordenaar die beraadslaagt om de trekker over te halen, wetende dat de realisatie van de optie bewijs levert van een hersenletsel dat zijn doel verpest. Egan stelt dat de causale beslissingstheorie ten onrechte het bewijs negeert dat de optie biedt. Echter, versies van de causale beslissingstheorie die ratificatie bevatten, zijn onschuldig aan de beschuldigingen. Bekrachtiging houdt rekening met het bewijs dat een optie biedt met betrekking tot het resultaat.

Elke versie van het verwachte nutsprincipe, of het nu gaat om voorwaardelijke kansen of waarschijnlijkheden van voorwaarden, moet de informatie specificeren die de toewijzingen van kansen en hulpprogramma's begeleidt. De principes van onvoorwaardelijke verwachte utilisatie-maximalisatie gebruiken dezelfde informatie voor alle opties en sluiten dus informatie uit over de realisatie van een optie. Het principe van bekrachtiging gebruikt voor elke optie-informatie die de realisatie van de optie omvat. Het is een principe van voorwaardelijke maximalisatie van het verwachte nut. De gevallen van Egan tellen mee voor de onvoorwaardelijke maximalisatie van het verwachte nut en niet voor de causale beslissingstheorie. Voorwaardelijke maximalisatie van het verwachte nut met behulp van de formule van de causale beslissingstheorie voor het verwachte nut pakt de gevallen aan die hij presenteert.

Egan's voorbeelden weerleggen de causale beslistheorie niet, maar vormen er wel een uitdaging voor. Stel dat er bij een beslissingsprobleem geen zelf-ratificerende optie bestaat, of dat er meerdere zelf-ratificerende opties bestaan. Hoe moet een rationele agent te werk gaan, met dien verstande dat een beslissingsprincipe rekening moet houden met de informatie die een optie biedt? Dit is een open probleem in de causale beslissingstheorie (en in elke beslissingstheorie die erkent dat de realisatie van een optie bewijs kan vormen met betrekking tot de uitkomst ervan). Ratificatie analyseert instabiliteit van beslissingen, maar is geen volledig antwoord daarop.

In reactie op Egan stellen Frank Arntzenius (2008) en Joyce (2012) dat bij sommige beslissingsproblemen de rationele beraadslagingen van een agent met behulp van vrij beschikbare informatie niet genoegen nemen met één enkele optie, maar met een waarschijnlijkheidsverdeling over opties. Ze erkennen dat de agent de optie die uit deze beraadslagingen voortvloeit, kan betreuren, maar verschillen over de betekenis van de spijt. Arntzenius is van mening dat de spijt de rationaliteit van de optie meetelt, terwijl Joyce dit ontkent. Ahmed (2012) en Ralph Wedgwood (2013) verwerpen de antwoorden van Arntzenius en Joyce op Egan omdat ze van mening zijn dat beraadslagingen een oplossing zouden moeten vinden. Wedgwood introduceert een nieuw beslissingsprincipe om tegemoet te komen aan de beslissingsproblemen van Egan. Ahmed stelt dat Egan's analyse van deze beslissingsproblemen een tekortkoming heeft, omdat het, wanneer het wordt uitgebreid tot enkele andere beslissingsproblemen, elke optie irrationeel verklaart.

Punten over bekrachtiging in beslissingsproblemen verduidelijken punten over evenwicht in de speltheorie, omdat in de strategiegames de keuze van een speler vaak bewijs levert over de keuzes van andere spelers. Beslissingstheorie ligt ten grondslag aan de speltheorie omdat de oplossing van een spel rationele keuzes identificeert in de beslissingsproblemen die het spel voor de spelers creëert. Oplossingen voor games onderscheiden correlatie en oorzakelijk verband, evenals beslissingsprincipes. Omdat bij gelijktijdige verplaatsing de strategieën van twee agenten kunnen worden gecorreleerd maar niet gerelateerd zijn aan oorzaak en gevolg, hebben oplossingen voor dergelijke spellen niet dezelfde eigenschappen als oplossingen voor opeenvolgende spellen. De causale beslissingsleer onderscheidt zich van welke oplossingen voor games afhangen. Het ondersteunt het verhaal van de speltheorie over interactieve beslissingen.

Het bestaan van zelf-bekrachtigende gemengde strategieën bij beslissingsproblemen zoals Death in Damascus suggereert dat bekrachtiging, zoals causale beslistheorie het uitlegt, deelname aan een Nash-evenwicht van een spel ondersteunt. Zo'n evenwicht wijst elke speler een strategie toe, zodat elke strategie in de opdracht het beste antwoord geeft op de andere. Stel dat twee mensen Matching Pennies spelen. Elk toont tegelijkertijd een cent. De ene speler probeert de zijkanten te laten matchen en de andere speler probeert een wedstrijd te voorkomen. Als de eerste speler slaagt, krijgt hij beide centen. Anders krijgt de tweede speler beide centen. Stel dat elke speler de andere speler goed kan voorspellen, en elke speler weet dit. Als de eerste speler dan koppen laat zien, heeft hij reden om te denken dat de tweede speler staarten laat zien. Ook,als de eerste speler staarten laat zien, heeft hij reden om te denken dat de tweede speler hoofden laat zien. Omdat Matching Pennies een spel met gelijktijdige beweging is, heeft de strategie van geen van beide spelers invloed op de strategie van de andere speler, maar de strategie van elke speler is een bewijs van de strategie van de andere speler. Gemengde strategieën helpen in dit geval besluitinstabiliteit op te lossen. Als de eerste speler zijn cent omdraait om de kant te laten zien die wordt weergegeven, dan bekrachtigt zijn gemengde strategie zichzelf. De situatie van de tweede speler is vergelijkbaar en ze bereikt ook een zelf-bekrachtigende strategie door haar cent om te draaien. De combinatie van zelf-bekrachtigende strategieën is een Nash-evenwicht in het spel. Joyce en Gibbard (1998) beschrijven de rol van bekrachtiging in de speltheorie.de strategie van geen van beide spelers beïnvloedt de strategie van de andere speler, maar de strategie van elke speler is een bewijs van de strategie van de andere speler. Gemengde strategieën helpen in dit geval besluitinstabiliteit op te lossen. Als de eerste speler zijn cent omdraait om de kant te laten zien die wordt weergegeven, dan bekrachtigt zijn gemengde strategie zichzelf. De situatie van de tweede speler is vergelijkbaar en ze bereikt ook een zelf-bekrachtigende strategie door haar cent om te draaien. De combinatie van zelf-bekrachtigende strategieën is een Nash-evenwicht in het spel. Joyce en Gibbard (1998) beschrijven de rol van bekrachtiging in de speltheorie.de strategie van geen van beide spelers beïnvloedt de strategie van de andere speler, maar de strategie van elke speler is een bewijs van de strategie van de andere speler. Gemengde strategieën helpen in dit geval besluitinstabiliteit op te lossen. Als de eerste speler zijn cent omdraait om de kant te laten zien die wordt weergegeven, dan bekrachtigt zijn gemengde strategie zichzelf. De situatie van de tweede speler is vergelijkbaar en ze bereikt ook een zelf-bekrachtigende strategie door haar cent om te draaien. De combinatie van zelf-bekrachtigende strategieën is een Nash-evenwicht in het spel. Joyce en Gibbard (1998) beschrijven de rol van bekrachtiging in de speltheorie.dan bekrachtigt zijn gemengde strategie zichzelf. De situatie van de tweede speler is vergelijkbaar en ze bereikt ook een zelf-bekrachtigende strategie door haar cent om te draaien. De combinatie van zelf-bekrachtigende strategieën is een Nash-evenwicht in het spel. Joyce en Gibbard (1998) beschrijven de rol van bekrachtiging in de speltheorie.dan bekrachtigt zijn gemengde strategie zichzelf. De situatie van de tweede speler is vergelijkbaar en ze bereikt ook een zelf-bekrachtigende strategie door haar cent om te draaien. De combinatie van zelf-bekrachtigende strategieën is een Nash-evenwicht in het spel. Joyce en Gibbard (1998) beschrijven de rol van bekrachtiging in de speltheorie.

Weirich (2004: hoofdstuk 9) presenteert een methode om te kiezen uit meerdere zelfratificerende strategieën, en dus een methode waarmee een groep spelers kan coördineren om een bepaald Nash-evenwicht te realiseren wanneer er meerdere bestaan. Hoewel instabiliteit van beslissingen een open probleem is, heeft de causale beslissingstheorie middelen om dit aan te pakken. De uiteindelijke oplossing van het probleem door de theorie zal de speltheorie een rechtvaardiging bieden voor deelname aan een Nash-evenwicht van een spel.

4. Verwante onderwerpen en slotopmerkingen

De causale beslistheorie heeft grondslagen op verschillende gebieden van de filosofie. Het berust bijvoorbeeld op de metafysica om oorzakelijk verband te verklaren. Het beroept zich ook op inductieve logica voor het afleiden van gevolgtrekkingen met betrekking tot oorzakelijk verband. Een uitgebreide causale beslissingstheorie behandelt niet alleen de causale waarschijnlijkheid van 'generatie van opties' verwachte nutsbedrijven, maar ook de generatie van causale waarschijnlijkheid van bewijs.

Onderzoek naar causaliteit draagt bij aan de metafysische grondslagen van causale beslistheorie. Nancy Cartwright (1979) put bijvoorbeeld uit ideeën over causaliteit om details van de causale beslissingstheorie uit te werken. Sommige soorten oorzakelijk verband maken ook onderscheid tussen soorten oorzaken. Zowel zuurstof als een vlam zijn metafysische oorzaken van de verbranding van tondel. Alleen de vlam is echter oorzakelijk verantwoordelijk voor en dus een normatieve oorzaak van de verbranding. De causale verantwoordelijkheid voor een gebeurtenis komt toe aan alleen de meest opvallende metafysische oorzaken van de gebeurtenis. De causale beslistheorie is niet alleen geïnteresseerd in gebeurtenissen waarvoor een handeling causaal verantwoordelijk is, maar ook in andere gebeurtenissen waarvoor een handeling een metafysische oorzaak is. Verwachte hulpprogramma's die beslissingen begeleiden, zijn uitgebreid.

Judea Pearl (2000) en ook Peter Spirtes, Clark Glymour en Richard Scheines (2000) presenteren methoden voor het afleiden van causale relaties uit statistische gegevens. Ze gebruiken gerichte acyclische grafieken en bijbehorende kansverdelingen om causale modellen te construeren. Bij een beslissingsprobleem levert een causaal model een manier op om het effect van een handeling te berekenen. Een causale grafiek en de waarschijnlijkheidsverdeling geven een afhankelijkheidshypothese weer en leveren de causale invloed van elke handeling op, gegeven die hypothese. Ze specificeren de causale waarschijnlijkheid van een staat onder veronderstelling van een handeling. Het verwachte nut van een handeling is een waarschijnlijkheidsgewogen gemiddelde van het verwachte nut volgens de afhankelijkheidshypothesen die kandidaat-causale modellen vertegenwoordigen, zoals Weirich (2015: 225–236) uitlegt.

De gerichte grafiek en kansverdeling van een causaal model geven causale relaties aan tussen gebeurtenistypen. As Pearl (2000: 30) en Sprites et al. (2000: 11) uitleggen, een causaal model voldoet aan de causale Markov-voorwaarde als en alleen als met betrekking tot de kansverdeling elk gebeurtenistype in zijn gerichte grafiek onafhankelijk is van alle niet-nakomelingen van het gebeurtenistype, gezien zijn ouders. Gegeven een model dat aan de voorwaarde voldoet, maakt kennis van alle directe oorzaken van een gebeurtenis andere informatie statistisch niet relevant voor de gebeurtenis van de gebeurtenis, behalve informatie over de gebeurtenis en de effecten ervan. Kennis van de directe oorzaken van een gebeurtenis schermt bewijs af van indirecte oorzaken en onafhankelijke effecten van de oorzaken. Gegeven een typisch causaal model voor het probleem van Newcomb,kennis van de gemeenschappelijke oorzaak van een beslissing en een voorspelling schermt de correlatie tussen de beslissing en de voorspelling af.

Gerichte acyclische grafieken geven de causale structuur duidelijk weer en verduidelijken zo in de beslissingstheorie punten die afhangen van de causale structuur. Eells (2000) merkt bijvoorbeeld op dat keuze niet echt is, tenzij een besluit de correlatie van een handeling met staten afschermt. Joyce (2007: 546) gebruikt een causale grafiek om weer te geven hoe dit kan gebeuren in een Newcomb-probleem dat zich voordoet in een Prisoner's Dilemma met een psychologische tweeling. Hij laat zien dat het Newcomb-probleem een echte keuze is, ondanks de correlatie van handelingen en staten, omdat een besluit die correlatie afschermt. Wolfgang Spohn (2012) construeert voor het probleem van Newcomb een causaal model dat een beslissing en de uitvoering ervan onderscheidt en stelt dat gegeven het model causale beslissingstheorie one-boxing aanbeveelt. Een handeling in een beslissingsprobleem kan een interventie vormen in het causale model voor het beslissingsprobleem,zoals Meek en Glamour (1994) uitleggen. Hitchcock (2016) stelt dat het behandelen van een handeling als interventie de causale beslissingstheorie verrijkt.

Timothy Williamson (2007: hoofdstuk 5) bestudeert de epistemologie van contrafeitelijke of conjunctieve conditionals. Hij wijst op hun rol bij noodplanning en besluitvorming. Volgens zijn verslag leert men een conjunctief voorwaardelijk als men de consequentie ervan krachtig verkrijgt wanneer hij zich het antecedent voorstelt. Ervaar disciplines verbeelding. De ervaring die leidt tot een oordeel dat een conjunctief voorwaardelijk geldt, is mogelijk niet strikt mogelijk noch strikt bewijsbaar, zodat kennis van het voorwaardelijke niet puur a priori noch puur a posteriori is. Williamson beweert dat kennis van conjunctieve conditionals fundamenteel is, zodat de beslissingstheorie de kennis van de acteerkeus in kennis van dergelijke conditionals op de juiste manier onderbouwt.

De meeste teksten over de beslissingstheorie komen overeen met de causale beslissingstheorie. Velen behandelen de speciale gevallen, zoals het probleem van Newcomb, niet die een onderscheid motiveren tussen causale en bewijstheorie. Leonard Savage (1954) analyseert bijvoorbeeld alleen beslissingsproblemen waarbij opties de kansen van staten niet beïnvloeden, zoals zijn nutsverklaring duidelijk maakt (1954: 73). Causale en bewijskrachtige beslissingstheorieën komen bij deze problemen tot dezelfde aanbevelingen. Causale beslistheorie is de heersende vorm van beslistheorie onder degenen die causale en bewijstheorie onderscheiden.

Bibliografie

  • Ahmed, Arif, 2012, "Push the Button", Wetenschapsfilosofie, 79: 386–395.
  • –––, 2014, Evidence, Decision and Causality, Cambridge: Cambridge University Press.
  • Armendt, Brad, 1986, "A Foundation for Causal Decision Theory", Topoi, 5 (1): 3–19. doi: 10.1007 / BF00137825
  • –––, 1988a, "Conditional Preference and Causal Expected Utility", in William Harper en Brian Skyrms (eds), Causation in Decision, Belief Change, en Statistics, Vol. II, pp. 3–24, Dordrecht: Kluwer.
  • –––, 1988b, "Onpartijdigheid en causale beslistheorie", in Arthur Fine en Jarrett Leplin (eds), PSA: Proceedings of Biennial Meeting of the Philosophy of Science Association 1988, Volume I, pp. 326–336, East Lansing, MI: Philosophy of Science Association.
  • Arntzenius, Frank, 2008, "No Regrets, or: Edith Piaf Revamps Decision Theory", Erkenntnis, 68 (2): 277–297. doi: 10.1007 / s10670-007-9084-8
  • Bales, Adam, 2016, "The Pauper's Problem: Chance, Foreknowledge and Causal Decision Theory", Philosophical Studies, 173 (6): 1497-1516. doi: 10.1007 / s11098-015-0560-8
  • Cartwright, Nancy, 1979, "Causale wetten en effectieve strategieën", Noûs, 13 (4): 419–437. doi: 10.2307 / 2215337
  • Eells, Ellery, 1981, "Causaliteit, bruikbaarheid en besluit", Synthese, 48 (2): 295–329. doi: 10.1007 / BF01063891
  • –––, 1982, Rational Decision and Causality, Cambridge: Cambridge University Press.
  • –––, 1984a, “Newcomb's Many Solutions”, Theory and Decision, 16 (1): 59–105. doi: 10.1007 / BF00141675
  • –––, 1984b, “Metatickles and the Dynamics of Deliberation”, Theory and Decision, 17 (1): 71–95. doi: 10.1007 / BF00140057
  • –––, 2000, "Review: The Foundations of Causal Decision Theory, door James Joyce", British Journal for the Philosophy of Science, 51 (4): 893–900. doi: 10.1093 / bjps / 51.4.893
  • Egan, Andy, 2007, 'Enkele tegenvoorbeelden van causale beslistheorie', Philosophical Review, 116 (1): 93–114. 10.1215 / 00318108-2006-023
  • Gibbard, Allan en William Harper, 1978 [1981], "Counterfactuals and Two Kinds of Expected Utility", in Clifford Alan Hooker, James L. Leach en Edward Francis McClennan (eds), Foundations and Applications of Decision Theory (University of Western Ontario Series in Philosophy of Science, 13a), Dordrecht: D. Reidel, pp. 125–162. doi: 10.1007 / 978-94-009-9789-9_5 Herdrukt in Harper, Stalnaker en Pearce 1981: 153–190. doi: 10.1007 / 978-94-009-9117-0_8
  • Hájek, Alan en Harris Nover, 2006, 'Perplexing Expectations', Mind, 115 (459): 703–720. 10.1093 / mind / fzl703
  • Harper, William, 1986, "Mixed Strategies and Ratifiability in Causal Decision Theory", Erkenntnis, 24 (1): 25–36. doi: 10.1007 / BF00183199
  • Harper, William, Robert Stalnaker en Glenn Pearce (eds), 1981 Ifs: Conditionals, Belief, Decision, Chance, and Time (University of Western Ontario Series in Philosophy of Science, 15), Dordrecht: Reidel.
  • Hitchcock, Christopher Read, 1996, "Causale beslissingstheorie en beslissingstheoretische oorzaak", Noûs, 30 (4): 508–526. doi: 10.2307 / 2216116
  • –––, 2016, “Conditionering, tussenkomst en besluit”, Synthese, 193 (4): 1157–1176. doi: 10.1007 / s11229-015-0710-8
  • Horgan, Terry, 1981 [1985], "Counterfactuals and Newcomb's Problem", The Journal of Philosophy, 78 (6): 331–356. doi: 10.2307 / 2026128 Herdrukt in Richmond Campbell en Lanning Sowden (eds), 1985, Paradoxes of Rationality and Cooperation: Prisoner's Dilemma and Newcomb's Problem, Vancouver: University of British Columbia Press, pp. 159–182.
  • Horwich, Paul, 1987, Asymmetries in Time, Cambridge, MA: MIT Press.
  • Jeffrey, Richard C., [1965] 1983, The Logic of Decision, tweede editie, Chicago: University of Chicago Press. [De paperback-editie van 1990 bevat enkele herzieningen.]
  • –––, 2004, Subjectieve waarschijnlijkheid: The Real Thing, Cambridge: Cambridge University Press.
  • Joyce, James M., 1999, The Foundations of Causal Decision Theory, Cambridge: Cambridge University Press.
  • –––, 2000, “Why We Still Need the Logic of Decision”, Philosophy of Science, 67: S1 – S13. doi: 10.1086 / 392804
  • –––, 2002, “Levi on Causal Decision Theory and the Mogability of Predicting Own's Own Actions”, Philosophical Studies, 110 (1): 69–102. doi: 10.1023 / A: 1019839429878
  • –––, 2007: "Zijn Newcomb-problemen echt beslissingen?" Synthese, 156 (3): 537-562. doi: 10.1007 / s11229-006-9137-6
  • –––, 2012, “Spijt en instabiliteit in de theorie van causale beslissingen”, Synthese, 187 (1): 123–145. doi: 10.1007 / s11229-011-0022-6
  • Joyce, James en Allan Gibbard, 1998, "Causal Decision Theory", in Salvador Barbera, Peter Hammond en Christian Seidl (eds), Handbook of Utility Theory (Volume 1: Principles), pp. 627–666, Dordrecht: Kluwer Academic Uitgevers.
  • Krantz, David, R., Duncan Luce, Patrick Suppes en Amos Tversky, 1971, The Foundations of Measurement (Volume 1: Additive and Polynomial Representations), New York: Academic Press.
  • Levi, Isaac, 2000, 'Review Essay on The Foundations of Causal Decision Theory, by James Joyce', Journal of Philosophy, 97 (7): 387–402. doi: 10.2307 / 2678411
  • Lewis, David, 1973, Counterfactuals, Cambridge, MA: Harvard University Press.
  • –––, 1976, “Kansen op voorwaardelijke en voorwaardelijke kansen”, Philosophical Review, 85 (3): 297–315. doi: 10.2307 / 2184045
  • –––, 1979, "Prisoner's Dilemma is a Newcomb Problem", Philosophy and Public Affairs, 8 (3): 235–240.
  • –––, 1981, "Causal Decision Theory", Australasian Journal of Philosophy, 59 (1): 5–30. doi: 10.1080 / 00048408112340011
  • Meek, Christopher en Clark Glymour, 1994, "Conditioning and Intervening", British Journal for the Philosophy of Science, 45 (4): 1001-1021. doi: 10.1093 / bjps / 45.4.1001
  • Nozick, Robert, 1969, "Newcomb's Problem and Two Principles of Choice", in Nicholas Rescher (red.), Essays ter ere van Carl G. Hempel, pp. 114–146, Dordrecht: Reidel.
  • Papineau, David, 2001, "Evolutionisme heroverwogen", Noûs, 35 (2): 239–259.
  • Pearl, Judea, 2000, Causaliteit: modellen, redeneren en gevolgtrekking, Cambridge: Cambridge University Press. [Tweede editie, 2009]
  • Pollock, John, 2006, Thinking about Acting: Logical Foundations for Rational Decision Making, New York: Oxford University Press.
  • –––, 2010, “A Resource-Bounded Agent adresseert het Newcomb-probleem”, Synthese, 176 (1): 57–82. doi: 10.1007 / s11229-009-9484-1
  • Price, Huw, 1986, "Against Causal Decision Theory", Synthese, 67 (2): 195–212. doi: 10.1007 / BF00540068
  • –––, 2012, "Oorzaak, kans en de rationele betekenis van bovennatuurlijk bewijs", Philosophical Review, 121 (4): 483–538. doi: 10.1215 / 00318108-1630912
  • Richter, Reed, 1984, "Rationality Revisited", Australasian Journal of Philosophy, 62 (4): 392–403. doi: 10.1080 / 00048408412341601
  • –––, 1986, "Further Comments on Decision Instability", Australasian Journal of Philosophy, 64 (3): 345–349. doi: 10.1080 / 00048408612342571
  • Savage, Leonard, 1954, The Foundations of Statistics, New York: Wiley.
  • Skyrms, Brian, 1980, Causale noodzaak: een pragmatisch onderzoek naar de noodzaak van wetten, New Haven, CT: Yale University Press.
  • –––, 1982, "Causal Decision Theory", Journal of Philosophy, 79 (11): 695–711. doi: 10.2307 / 2026547
  • –––, 1990, The Dynamics of Rational Deliberation, Cambridge, MA: Harvard University Press.
  • Sobel, Jordan Howard, 1994, Taking Chances: Essays on Rational Choice, Cambridge: Cambridge University Press.
  • Spirtes, Peter, Clark Glymour en Richard Scheines, 2000, Causation, Prediction and Search, Second Edition, Cambridge, MA: MIT Press.
  • Spohn, Wolfgang, 2012, 'Omkering van 30 jaar discussie: waarom theoretische causale beslissingstheoristen zouden moeten kiezen', Synthese, 187 (1): 95–122. doi: 10.1007 / s11229-011-0023-5
  • Stalnaker, Robert C., 1968, 'A Theory of Conditionals', in Studies in Logical Theory (American Philosphical Quarterly Monograph series, 2), Oxford: Blackwell, 98–112. Herdrukt in Harper, Stalnaker en Pearce 1981: 41–56. doi: 10.1007 / 978-94-009-9117-0_2
  • –––, 1972 [1981], "Brief aan David Lewis", 21 mei. Gedrukt in Harper, Stalnaker en Pearce 1981: 151–152. doi: 10.1007 / 978-94-009-9117-0_7
  • Wedgwood, Ralph, 2013, "Gandalf's oplossing voor het nieuwekamprobleem", Synthese, 190 (14): 2643–2675. doi: 10.1007 / s11229-011-9900-1
  • Weirich, Paul, 1980, "Voorwaardelijk nut en zijn plaats in de beslissingstheorie", Journal of Philosophy, 77 (11): 702–715.
  • –––, 1985, “Decision Instability”, Australasian Journal of Philosophy, 63 (4): 465–472. doi: 10.1080 / 00048408512342061
  • –––, 2001, Decision Space: Multidimensional Utility Analysis, Cambridge: Cambridge University Press.
  • –––, 2004, Realistische besluitvormingstheorie: regels voor niet-agenten in niet-ideologische omstandigheden, New York: Oxford University Press.
  • –––, 2015, Models of Decision-Making: Simplifying Choices, Cambridge: Cambridge University Press.
  • Williamson, Timothy, 2007, The Philosophy of Philosophy, Malden, MA: Blackwell.

Academische hulpmiddelen

sep man pictogram
sep man pictogram
Hoe deze vermelding te citeren.
sep man pictogram
sep man pictogram
Bekijk een voorbeeld van de PDF-versie van dit item bij de Vrienden van de SEP Society.
inpho icoon
inpho icoon
Zoek dit itemonderwerp op bij het Internet Philosophy Ontology Project (InPhO).
phil papieren pictogram
phil papieren pictogram
Verbeterde bibliografie voor dit item op PhilPapers, met links naar de database.

Andere internetbronnen

  • MIT Course on Decision Theory, aangeboden door Robert Stalnaker.
  • Beslissingstheorie, vanaf dit schrijven (3 oktober 2016) heeft de Wikipedia-site een goede algemene introductie tot de beslissingstheorie en een lijst met referenties.

Populair per onderwerp