Formele Leertheorie

Inhoudsopgave:

Formele Leertheorie
Formele Leertheorie
Anonim

Toegang navigatie

  • Inhoud van het item
  • Bibliografie
  • Academische hulpmiddelen
  • Vrienden PDF-voorbeeld
  • Info over auteur en citaat
  • Terug naar boven

Formele leertheorie

Voor het eerst gepubliceerd op 2 februari 2002; inhoudelijke herziening vr 17 februari 2017

Formele leertheorie is de wiskundige belichaming van een normatieve epistemologie. Het behandelt de vraag hoe een agent observaties over haar omgeving moet gebruiken om tot correcte en informatieve conclusies te komen. Filosofen zoals Putnam, Glymour en Kelly hebben de leertheorie ontwikkeld als normatief kader voor wetenschappelijk redeneren en inductieve gevolgtrekking.

Terminologie. Cognitieve wetenschap en aanverwante gebieden gebruiken doorgaans de term "leren" voor het verkrijgen van informatie door observatie, vandaar de naam "leertheorie". Voor de meeste cognitieve wetenschappers suggereert de term 'leertheorie' de empirische studie van het leren van mensen en dieren die voortkomt uit het behavioristische paradigma in de psychologie. Het bijnaam 'formeel' onderscheidt het onderwerp van deze inzending van de behavioristische leertheorie. Filosofische termen voor leertheoretische epistemologie zijn onder meer 'logische betrouwbaarheid' (Kelly [1996], Glymour [1991]) en 'middelzware epistemologie' (Schulte [1999]).

Omdat veel ontwikkelingen in en toepassingen van formele leertheorie afkomstig zijn uit de informatica, komt de term 'computationele leertheorie' ook vaak voor. Veel resultaten op het gebied van leertheorie in de informatica hebben betrekking op Valiant's en Vapnik's notie van het leren van generalisaties die waarschijnlijk ongeveer correct zijn (PAC-leren) (Valiant [1984]). Dit idee van empirisch succes werd door filosofen geïntroduceerd door Gilbert Harmann in zijn Nicode-lezingen en uitgewerkt in een volgend boek [2007]. Valiant zelf geeft in een recent boek (Valiant [2013, Ch. 5]) een toegankelijk verslag van PAC-leren en zijn relatie tot het probleem van inductie. Dit artikel beschrijft een niet-statistische traditie van leertheorie die voortvloeit uit het baanbrekende werk van Hilary Putnam [1963] en Mark E. Gold [1967].

Filosofische kenmerken. In tegenstelling tot andere filosofische benaderingen van inductieve gevolgtrekking, is de leertheorie niet bedoeld om een ​​universele inductieve methode te beschrijven of algemene axioma's van inductieve rationaliteit te verklaren. De leertheorie streeft veeleer een contextafhankelijke analyse van het doel van het doel na: wat is de beste methode om de doelen te bereiken voor een bepaald empirisch probleem en een reeks cognitieve doelen? Het merendeel van de leertheorie onderzoekt welke onderzoeksstrategieën betrouwbaar en efficiënt leiden tot correcte overtuigingen over de wereld.

Artikeloverzicht. Vergeleken met traditionele filosofische discussies over inductieve gevolgtrekking, biedt de leertheorie een radicaal nieuwe manier van denken over inductie en wetenschappelijke methode. Het belangrijkste doel van dit artikel is het uitleggen van de belangrijkste concepten van de theorie door middel van voorbeelden. Lopende voorbeelden worden tijdens de inzending herhaald; Tegelijkertijd moeten de secties zo onafhankelijk mogelijk van elkaar zijn. We gebruiken de voorbeelden om enkele stellingen van filosofisch belang te illustreren en om de belangrijkste filosofische ideeën en inzichten achter de leertheorie te belichten.

Lezers die geïnteresseerd zijn in de wiskundige inhoud van de leertheorie zullen enkele referenties vinden in de bibliografie en een samenvatting van de basisdefinities in het aanvullende document. Een tekst van Jain et al. verzamelt veel van de belangrijkste definities en stellingen [1999]. Nieuwe resultaten verschijnen tijdens jaarlijkse congressen, zoals de Conferences on Learning Theory (COLT) en de Algorithmic Learning Theory (ALT). De filosofische kwesties en motivatie met betrekking tot leertheoretische epistemologie worden uitgebreid besproken in de werken van filosofen als Putnam, Glymour en Kelly (Putnam [1963], Glymour [1991], Glymour en Kelly [1992], Kelly [1996]).

  • 1. Convergentie met de waarheid en niets dan de waarheid

    • 1.1 Eenvoudige universele generalisatie
    • 1.2 Het nieuwe raadsel van inductie
    • 1.3 Discussie
    • 1.4 Generalisaties met uitzonderingen en falsificatie
  • 2. Case Studies uit de wetenschappelijke praktijk

    • 2.1 Behoudswetten in deeltjesfysica
    • 2.2 Causale verbindingen
    • 2.3 Modellen van cognitieve architectuur
    • 2.4 Discussie
  • 3. De grenzen van onderzoek en de complexiteit van empirische problemen
  • 4. De lange termijn op de korte termijn: betrouwbare en stabiele overtuigingen

    • 4.1 Voorbeeld: het nieuwe raadsel van inductie
    • 4.2 Meer voorbeelden
  • 5. Eenvoud, stabiel geloof en het scheermes van Ockham

    • 5.1 Eenvoud definiëren
    • 5.2 Voorbeelden
    • 5.3 Stabiel geloof en eenvoud: een stelling van Ockham
  • 6. Andere benaderingen: categorische vs. hypothetische imperatieven
  • Aanvullend document: basis formele definities
  • Bibliografie
  • Academische hulpmiddelen
  • Andere internetbronnen
  • Gerelateerde vermeldingen

1. Convergentie met de waarheid en niets dan de waarheid

Leertheoretische analyse beoordeelt disposities voor het vormen van overtuigingen. Verschillende termen voor geloofverwervingsprocessen worden algemeen gebruikt in de filosofie; Ik zal 'inductieve strategie', 'inferentiemethode' en meestal 'inductieve methode' gebruiken om hetzelfde te betekenen. De beste manier om te begrijpen hoe de leertheorie inductieve methoden evalueert, is door enkele voorbeelden te doorlopen. De volgende presentatie begint met een aantal zeer eenvoudige inductieve problemen en gaat verder naar meer gecompliceerde en meer realistische instellingen.

1.1 Eenvoudige universele generalisatie

Laten we de klassieke vraag opnieuw bekijken of alle raven zwart zijn. Stel je een ornitholoog voor die dit probleem aanpakt door de ene raaf na de andere te onderzoeken. Er is precies één observatie-volgorde waarin alleen zwarte raven worden gevonden; alle andere hebben ten minste één niet-zwarte raaf. Onderstaande figuur illustreert de mogelijke observatiesequenties. Stippen in de figuur geven punten aan waarop een waarneming kan worden gedaan. Een zwarte vogel links van een stip geeft aan dat in dit stadium een ​​zwarte raaf wordt waargenomen. Evenzo geeft een witte vogel rechts van een stip aan dat er een niet-zwarte raaf wordt waargenomen. Gegeven een volledige reeks observaties, zijn ofwel alle waargenomen raven zwart of niet-zwart; de figuur labelt complete observatiesequenties met de bewering die voor hen geldt. De grijze waaier geeft aan dat na de observatie van een witte raaf,de bewering dat niet alle raven zwart zijn, geldt voor alle observatiesequenties die het gevolg zijn van verdere observaties.

raven gegevens
raven gegevens

Als de wereld zo is dat er alleen zwarte raven worden gevonden, willen we dat de ornitholoog genoegen neemt met deze generalisatie. (Het is mogelijk dat sommige niet-zwarte raven voor altijd verborgen blijven, maar zelfs dan geeft de veralgemening "alle raven zijn zwart" tenminste de waarnemingen goed.) Als de wereld zo is dat uiteindelijk een niet-zwarte raaf wordt gevonden, dan zouden we dat doen zoals de ornitholoog om tot de conclusie te komen dat niet alle raven zwart zijn. Dit specificeert een reeks onderzoeksdoelen. Voor elke inductieve methode die de ornitholoog zou kunnen voorstellen om vermoedens aan te nemen in het licht van het bewijs, kunnen we ons afvragen of die methode al dan niet voldoet aan deze doelen. Er zijn oneindig veel mogelijke methoden om te overwegen; we zullen er slechts twee bekijken, een sceptische en een die moedig generaliseert.De gewaagde methode vermoedt dat alle raven zwart zijn nadat ze hebben gezien dat de eerste raaf zwart is. Het houdt vast aan dit vermoeden, tenzij er een niet-zwarte raaf verschijnt. De sceptische methode gaat niet verder dan wat het bewijs met zich meebrengt. Dus als een niet-zwarte raaf wordt gevonden, concludeert de sceptische methode dat niet alle raven zwart zijn, maar anders maakt de methode op de een of andere manier geen vermoeden. De onderstaande afbeelding illustreert zowel de vetgedrukte als de sceptische methode.De onderstaande afbeelding illustreert zowel de vetgedrukte als de sceptische methode.De onderstaande afbeelding illustreert zowel de vetgedrukte als de sceptische methode.

raven
raven

Bereiken deze methoden de doelen die we hebben uiteengezet? Overweeg de gewaagde methode. Er zijn twee mogelijkheden: ofwel zijn alle waargenomen raven zwart, ofwel wordt er een niet-zwarte raaf gevonden. In het eerste geval vermoedt de methode dat alle raven zwart zijn en laat dit vermoeden nooit varen. In het tweede geval concludeert de methode dat niet alle raven zwart zijn zodra de eerste niet-zwarte raaf wordt gevonden. Dus ongeacht hoe het bewijs binnenkomt, uiteindelijk geeft de methode het juiste antwoord of alle raven zwart zijn en blijft bij dit antwoord. Lerende theoretici noemen dergelijke methoden betrouwbaar omdat ze genoegen nemen met het juiste antwoord, ongeacht wat de wereld biedt.

De sceptische methode meet niet zo goed. Als er een niet-zwarte raaf verschijnt, komt de methode wel tot de juiste conclusie dat niet alle raven zwart zijn. Maar als alle raven zwart zijn, neemt de scepticus nooit een 'inductieve sprong' om deze generalisatie over te nemen. Dus in dat geval geeft de scepticus geen goed antwoord op de vraag of alle raven zwart zijn.

Dit illustreert hoe middel-doelanalyse methoden kan evalueren: de vetgedrukte methode voldoet aan het doel om op betrouwbare wijze tot het juiste antwoord te komen, terwijl de sceptische methode dat niet doet. Let op het karakter van dit argument tegen de scepticus: het probleem is in deze visie niet dat de scepticus een of andere canon van rationaliteit schendt of de 'uniformiteit van de natuur' niet waardeert. De leertheoretische analyse geeft de scepticus toe dat het niet uitmaakt hoeveel zwarte raven in het verleden zijn waargenomen, de volgende kan wit zijn. Het probleem is dat als alle waargenomen raven inderdaad zwart zijn, de scepticus nooit de vraag beantwoordt "zijn alle raven zwart?". Om het juiste antwoord op die vraag te krijgen, moet je generaliseren vanuit het bewijs, ook al kan de generalisatie verkeerd zijn.

Wat betreft de gedurfde methode, het is belangrijk om duidelijk te zijn over wat het wel en niet bereikt. De methode zal uiteindelijk tot een goed antwoord komen, maar het is (of wij) misschien nooit zeker dat dit is gebeurd. Zoals William James het uitdrukte: "geen klokken luidt" wanneer de wetenschap het juiste antwoord heeft gevonden. We zijn er zeker van dat de methode uiteindelijk tot het juiste antwoord zal komen; maar we weten misschien nooit zeker of het huidige antwoord het juiste is. Dit is een subtiel punt; het volgende voorbeeld illustreert het verder.

1.2 Het nieuwe raadsel van inductie

Nelson Goodman stelde een beroemde puzzel voor over inductieve gevolgtrekking, bekend als het (nieuwe) raadsel van inductie ([Goodman 1983]). Ons volgende voorbeeld is geïnspireerd op zijn puzzel. Goodman overwoog generalisaties over smaragden, met de bekende kleuren groen en blauw, evenals enkele ongebruikelijke kleuren:

Stel dat alle smaragden die voor een bepaalde tijd zijn onderzocht, groen zijn … Onze beweringen stellen dat smaragd a groen is, dat smaragd b groen is, enzovoort.

Laten we nu een ander predikaat introduceren dat minder bekend is dan "groen". Het is het predicaat "grue" en het is van toepassing op alle dingen die eerder zijn onderzocht voor het geval ze groen zijn, maar voor andere dingen voor het geval ze blauw zijn. Dan hebben we op het moment t, voor elke bewering die beweert dat een bepaalde smaragd groen is, een parallelle bewijsverklaring die beweert dat smaragd vals is. De vraag is of we moeten vermoeden dat alle smaragden groen zijn in plaats van dat alle smaragden gruw zijn als we een monster van groene smaragden krijgen dat voor tijd t is onderzocht, en zo ja, waarom.

Het is duidelijk dat we een familie van grove predikaten hebben in dit probleem, één voor elke verschillende "kritieke tijd" t; laten we grue (t) schrijven om deze grue-predikaten aan te duiden. Laten we, na Goodman, naar methoden verwijzen als projectieregels bij het bespreken van dit voorbeeld. Een projectieregel slaagt in een wereld voor het geval hij genoegen neemt met een generalisatie die juist is in die wereld. Dus in een wereld waarin alle onderzochte smaragden groen blijken te zijn, willen we dat onze projectieregel convergeert met de stelling dat alle smaragden groen zijn. Als alle onderzochte smaragden grue (t) zijn, willen we dat onze projectieregel convergeert met de stelling dat alle smaragden grue (t) zijn. Merk op dat deze bepaling groen en gruw predikaten volledig op gelijke voet behandelt, zonder vooringenomenheid voor beide. Laten we, zoals eerder, twee regels beschouwen:de natuurlijke projectieregel die veronderstelt dat alle smaragden groen zijn zolang er alleen groene smaragden worden gevonden, en de gruwelijke regel die het volgende grue-predikaat blijft projecteren in overeenstemming met het beschikbare bewijs. Uitgedrukt in het groenblauwe vocabulaire, vermoedt de gruwelijke projectieregel dat na het observeren van een aantal n groene smaragden, alle toekomstige blauw zullen zijn. De onderstaande figuren illustreren de mogelijke observatiereeksen, de natuurlijke projectieregel en de gruwelijke projectieregel.De onderstaande figuren illustreren de mogelijke observatiereeksen, de natuurlijke projectieregel en de gruwelijke projectieregel.De onderstaande figuren illustreren de mogelijke observatiereeksen, de natuurlijke projectieregel en de gruwelijke projectieregel.

natuurlijk
natuurlijk

De volgende afbeelding toont de gruwelijke projectieregel.

gruwelijk
gruwelijk

Hoe passen deze regels bij het doel om tot een echte generalisatie te komen? Veronderstel omwille van het voorbeeld dat de enige serieuze mogelijkheden die worden overwogen zijn: (1) Of alle smaragden zijn groen of (2) alle smaragden zijn grue (t) voor een kritieke tijd t. Dan gaat de regel voor natuurlijke projectie uit van de juiste generalisatie, ongeacht wat de juiste generalisatie is. Want als alle smaragden groen zijn, bevestigt de natuurlijke projectieregel dit feit vanaf het begin. En stel dat alle smaragden voor een kritieke tijd t grue (t) zijn. Dan zal op het tijdstip t een blauwe smaragd worden waargenomen. Op dit punt beslist de natuurlijke projectieregel over het vermoeden dat alle smaragden gruw (t) zijn, wat correct moet zijn gezien onze veronderstelling over de mogelijke observatiesequenties.Dus ongeacht welk bewijs wordt verkregen tijdens het onderzoek - in overeenstemming met onze achtergrondaannames - de natuurlijke projectie-regel zal uiteindelijk genoegen nemen met een correcte generalisatie over de kleur van smaragden.

De gruwelijke regel doet het niet zo goed. Want als alle smaragden groen zijn, zal de regel dit feit nooit in twijfel trekken, omdat het steeds gruwelijke predikaten projecteert. Er is dus een mogelijke observatiesequentie - namelijk die waarop alle smaragden groen zijn - waarop de gruwelijke regel niet convergeert naar de juiste generalisatie. Een analyse van het doel betekent dus de natuurlijke projectieregel boven de gruwelijke regel.

1.3 Discussie

De middel-doelanalyse van het raadsel van inductie illustreert een aantal filosofisch belangrijke punten die gelden voor leertheoretische analyse in het algemeen.

  1. Gelijke behandeling van alle hypothesen. Net als in het vorige voorbeeld hangt niets van dit argument af van argumenten dat bepaalde mogelijkheden niet a priori serieus moeten worden genomen. In het bijzonder zegt niets in het argument dat generalisaties met gruwpredikaten slecht gevormd, onrechtmatig of op een andere manier a priori inferieur zijn aan 'alle smaragden zijn groen'.

  2. Taalinvariantie. De analyse is niet afhankelijk van de woordenschat waarin het bewijs en de generalisaties zijn ingekaderd. Voor het gemak van expositie heb ik meestal het groen-blauwe referentiekader gebruikt. Sprekende blanken zouden het er echter mee eens zijn dat het doel om op betrouwbare wijze een correcte veralgemening tot stand te brengen, de natuurlijke projectieregel vereist in plaats van de gruwelijke, zelfs als ze de vermoedens van de natuurlijke regel liever in hun gruwelijke taal willen uitdrukken dan de blauwgroene taal die we tot nu toe hebben gebruikt.
  3. Afhankelijkheid van context. Hoewel de analyse niet afhankelijk is van taal, hangt het wel af van aannames over wat de mogelijke observatiesequenties zijn. Het voorbeeld zoals hierboven beschreven lijkt de mogelijkheden te omvatten die overeenkomen met de kleurpredikaten die Goodman zelf heeft besproken. Maar middel-doelanalyse is net zo goed van toepassing op andere sets van mogelijke predikaten. Schulte [1999] en Chart [2000] bespreken een aantal andere versies van het raadsel van inductie, waarvan sommige een middelmatige analyse ten goede komen, waarbij wordt geprojecteerd dat alle smaragden gruw zijn op een staal van alle groene smaragden.

1.4 Falsificationisme en generalisaties met uitzonderingen

Onze eerste twee voorbeelden bevatten eenvoudige universele generalisaties. Sommige subtiele aspecten van het concept van betrouwbaarheid op lange termijn, met name de relatie met falsificatie, worden duidelijk als we kijken naar generalisaties die uitzonderingen toestaan. Laten we ter illustratie terugkeren naar de wereld van de raven. Deze keer is de ornithologische gemeenschap meer op haar hoede in haar generalisaties betreffende de kleur van raven. Twee concurrerende hypothesen worden onderzocht.

  1. Dat eigenlijk alle raven zwart zijn, maar er kunnen een eindig aantal uitzonderingen zijn op die regel.
  2. Dat eigenlijk alle raven wit zijn, maar er kunnen een eindig aantal uitzonderingen op die regel zijn.

Ervan uitgaande dat de ene of de andere van deze hypothesen juist is, is er dan een inductieve methode die betrouwbaar de juiste kiest? Wat dit probleem moeilijker maakt dan onze eerste twee, is dat elke onderzochte hypothese consistent is met elke eindige hoeveelheid bewijs. Als er 100 witte raven en 50 zwarte raven worden gevonden, kunnen de 50 zwarte raven of de 100 witte raven de uitzondering op de regel zijn. In termen die bekend zijn gemaakt door het werk van Karl Popper, kunnen we zeggen dat geen van beide hypothesen te falsificeren is. Als gevolg hiervan zal de inductieve strategie van de vorige twee voorbeelden hier niet werken. Deze strategie was in feite om een ​​'gewaagde' universele veralgemening aan te nemen, zoals 'alle raven zijn zwart' of 'alle smaragden zijn groen', en om dit vermoeden vast te houden zolang het 'doorgaat'. Echter,wanneer regels met mogelijke uitzonderingen worden onderzocht, is deze strategie onbetrouwbaar. Stel bijvoorbeeld dat een onderzoeker eerst de hypothese overneemt dat 'vrijwel alle raven wit zijn'. Het kan zijn dat er vanaf dat moment alleen nog maar zwarte raven worden gevonden. Maar elk van deze ogenschijnlijke tegenmaatregelen kan als uitzondering worden 'weg verklaard'. Als de onderzoeker het principe van vasthouden aan haar vermoeden volgt totdat het bewijs logisch niet in overeenstemming is met de veronderstelling, zal zij nooit haar valse overtuiging opgeven dat bijna alle raven wit zijn, laat staan ​​tot de juiste overtuiging dat bijna alle raven zijn zwart.Het kan zijn dat er vanaf dat moment alleen nog maar zwarte raven worden gevonden. Maar elk van deze ogenschijnlijke tegenmaatregelen kan als uitzondering worden 'weg verklaard'. Als de onderzoeker het principe van vasthouden aan haar vermoeden volgt totdat het bewijs logisch niet in overeenstemming is met de veronderstelling, zal zij nooit haar valse overtuiging opgeven dat bijna alle raven wit zijn, laat staan ​​tot de juiste overtuiging dat bijna alle raven zijn zwart.Het kan zijn dat er vanaf dat moment alleen nog maar zwarte raven worden gevonden. Maar elk van deze ogenschijnlijke tegenmaatregelen kan als uitzondering worden 'weg verklaard'. Als de onderzoeker het principe van vasthouden aan haar vermoeden volgt totdat het bewijs logisch niet in overeenstemming is met de veronderstelling, zal zij nooit haar valse overtuiging opgeven dat bijna alle raven wit zijn, laat staan ​​tot de juiste overtuiging dat bijna alle raven zijn zwart.veel minder komen tot de juiste overtuiging dat bijna alle raven zwart zijn.veel minder komen tot de juiste overtuiging dat bijna alle raven zwart zijn.

Betrouwbaar onderzoek vereist een meer subtiele onderzoeksstrategie. Hier is er een (van de vele). Begin het onderzoek met een van beide concurrerende hypothesen, zeg "bijna alle raven zijn zwart". Kies een cut-off ratio om een ​​"duidelijke meerderheid" te vertegenwoordigen; voor zekerheid, laten we zeggen 70%. Als het huidige vermoeden is dat bijna alle raven zwart zijn, bedenk je dan dat bijna alle raven wit zijn, voor het geval dat meer dan 70% van de waargenomen raven in feite wit is. Ga ook te werk als het huidige vermoeden is dat bijna alle raven wit zijn, terwijl meer dan 70% van de waargenomen raven in feite zwart is.

Een beetje nadenken toont aan dat deze regel op lange termijn de juiste hypothese betrouwbaar identificeert, ongeacht welke van de twee concurrerende hypothesen correct is. Want als bijna alle raven zwart zijn, zullen uiteindelijk de niet-zwarte uitzonderingen op de regel uitgeput zijn en zal een willekeurig grote meerderheid van de waargenomen raven zwart zijn. Evenzo als bijna alle raven wit zijn.

Generalisaties met uitzonderingen illustreren de relatie tussen Popperiaans falsificationisme en het leertheoretische idee van betrouwbare convergentie naar de waarheid. In sommige onderzoekssituaties, met name die met universele generalisaties, levert een naïef Popperiaanse 'veronderstellingen-en-weerleggingen'-benadering van vasthouden aan vermoedens totdat het bewijs hen vervalst, een betrouwbare inductieve methode op. Bij andere problemen, zoals het huidige voorbeeld, is dat niet het geval. Over het algemeen vereisen problemen met niet-verifieerbare hypotheses iets anders dan het recept voor veronderstellingen en weerleggingen voor betrouwbare methoden (deze bewering hangt af van wat precies wordt bedoeld met "falsificeerbare hypothese"; zie paragraaf 3 (De limieten van onderzoek en de complexiteit van empirische problemen) De moraal is dat vertrouwen op vervalsingen soms, maar niet altijd,de beste manier om het onderzoek voort te zetten.

2. Case Studies uit de wetenschappelijke praktijk

Deze sectie biedt verdere voorbeelden om leertheoretische analyse te illustreren. De voorbeelden in deze sectie zijn realistischer en gaan in op methodologische problemen die zich in de wetenschappelijke praktijk voordoen. De ruimtebeperkingen van het encyclopedieformaat laten slechts een overzicht van de volledige analyse toe; er zijn verwijzingen naar meer gedetailleerde discussies hieronder. Meer casestudy's zijn te vinden in [Kelly 1996, Ch. 7.7, Harrell 2000]. Lezers die willen doorgaan met de verdere ontwikkeling van de theorie en filosofie van de epistemologie van het doel en de middelen, kunnen deze sectie overslaan zonder verlies van continuïteit.

2.1 Behoudswetten in deeltjesfysica

Een van de kenmerken van de elementaire deeltjesfysica is de ontdekking van nieuwe behoudswetten die alleen van toepassing zijn op het subatomaire rijk [Ford 1963, Ne'eman en Kirsh 1983, Feynman 1965]. (Feynman groepeert een van hen, de instandhouding van Baryon-getal, met de andere 'grote instandhoudingswetten' van energie, lading en momentum.) De conserveringsprincipes vereenvoudigen enigszins en verklaren waarom bepaalde processen met elementaire deeltjes niet plaatsvinden: de verklaring is dat een of ander conserveringsprincipe werd geschonden (vgl. Omnes [1971, Ch.2] en Ford [1963]). Het doel van deeltjesonderzoek is dus om een ​​reeks conserveringsprincipes te vinden zodat voor elk proces dat mogelijk is volgens de (reeds bekende) natuurkundige wetten, maar experimenteel niet wordt nageleefd, er een conserveringsprincipe is dat dat proces uitsluit.En als er inderdaad een proces wordt waargenomen, dan moet het voldoen aan alle instandhoudingswetten die we hebben ingevoerd.

Dit vormt een gevolgtrekkingsprobleem waarop we middel-doelanalyse kunnen toepassen. Een gevolgtrekkingsmethode levert een reeks conserveringsprincipes op als reactie op rapporten van waargenomen processen. Middelenanalyse vraagt ​​welke methoden gegarandeerd instaan ​​voor instandhoudingsprincipes die alle waarnemingen verantwoorden, dat wil zeggen dat niet-geobserveerde processen worden uitgesloten en geobserveerde processen worden toegestaan. Schulte [2008] beschrijft een inductieve methode die dit doel bereikt. Informeel kan de methode als volgt worden beschreven.

  • Stel dat we een reeks reacties tussen elementaire deeltjes hebben waargenomen.
  • Veronderstel een reeks behoudswetten die de waargenomen reacties mogelijk maken en zoveel mogelijk niet-waargenomen reacties uitsluiten.

De logica van de instandhoudingswetten is zodanig dat het waarnemen van sommige reacties de mogelijkheid met zich meebrengt van andere niet-waargenomen. De leertheoretische methode sluit alle reacties uit die niet met zich meebrengen. Het blijkt dat de instandhoudingsprincipes die deze methode op het huidige beschikbare bewijs zou stellen, empirisch gelijkwaardig zijn aan de principes die natuurkundigen hebben geïntroduceerd. In het bijzonder komen hun voorspellingen precies overeen met het behoud van lading, baryon-nummer, muon-nummer, tau-nummer en Lepton-nummer dat deel uitmaakt van het standaardmodel van de deeltjesfysica.

Voor sommige fysische processen is de enige manier om empirisch adequate instandhoudingsprincipes te krijgen, door te stellen dat sommige verborgen deeltjes onopgemerkt zijn gebleven. Schulte [2009] breidt de analyse zodanig uit dat een inductieve methode niet alleen instandhoudingswetten kan introduceren, maar ook ongeziene deeltjes kan positiveren. Het basisprincipe is opnieuw om onzichtbare deeltjes zo te plaatsen dat we zoveel mogelijk niet-waargenomen reacties uitsluiten. Wanneer deze methode wordt toegepast op de bekende deeltjesgegevens, herontdekt deze het bestaan ​​van een antineutrino-elektron. Dit is een van de belangrijkste zorgen in de huidige deeltjesfysica.

2.2 Causale verbindingen

Er is inhoudelijk veel onderzoek gedaan naar het leren van causale relaties zoals weergegeven in een causale grafiek [Spirtes et al. 2000]. Kelly suggereerde een leertheoretische analyse van het afleiden van causaliteit waarbij het bewijs wordt geleverd in de vorm van waargenomen significante correlaties tussen interessante variabelen (een moderne versie van Hume's 'constante conjuncties'). De volgende inductieve methode zal gegarandeerd convergeren naar een empirisch adequate causale grafiek, aangezien er steeds meer correlaties worden waargenomen [Schulte, Luo en Greiner 2007].

  • Stel dat we een reeks correlaties of associaties hebben waargenomen tussen een reeks interessante variabelen.
  • Selecteer een causale grafiek die de waargenomen correlaties verklaart met een minimum aan directe causale verbanden.

2.3 Modellen van cognitieve architectuur

Sommige denkers van de geest hebben betoogd dat de geest is samengesteld uit vrij onafhankelijke modules. Elke module heeft zijn eigen "input" van andere modules en stuurt "output" naar andere modules. Een module voor "auditief analysesysteem" kan bijvoorbeeld als invoer een gehoord woord nemen en een fonetische analyse naar een "auditief invoerlexicon" sturen. Het idee van modulaire organisatie roept de empirische vraag op welke mentale modules er zijn en hoe ze met elkaar zijn verbonden. Een prominente traditie van onderzoek in de cognitieve neurowetenschappen heeft getracht een model van mentale architectuur langs deze lijnen te ontwikkelen door de reacties van normale en abnormale personen op verschillende stimuli te bestuderen. Het idee is om normale reacties te vergelijken met abnormale reacties - vaak veroorzaakt door hersenbeschadiging - om conclusies te trekken over welke mentale capaciteiten van elkaar afhankelijk zijn en hoe.

Glymour [1994] stelde de betrouwbaarheidsvraag of er inferentiemethoden zijn die gegarandeerd uiteindelijk uitkomen op een echte theorie van mentale organisatie, met uitputtend bewijs over normale en abnormale capaciteiten en reacties. Hij betoogde dat voor sommige mogelijke mentale architecturen geen enkele hoeveelheid bewijs van het soort stimulusreactie onderscheid kan maken. Aangezien het beschikbare bewijsmateriaal de vermoedens van een inductieve methode bepaalt, volgt daaruit niet dat er een garantie is dat een methode tot overeenstemming zal komen met het ware model van cognitieve architectuur.

In verdere discussie toonde Bub [1994] aan dat als we bepaalde restrictieve aannames over hoe mentale modules met elkaar verbonden zijn, een neuropsycholoog een complete set gedragsobservaties zou toelaten om de modulestructuur van een (normale) geest vast te stellen. Onder de veronderstellingen van Bub is er zelfs een betrouwbare methode om de modulaire structuur te identificeren. Glymour heeft ook onderzocht in hoeverre rijkere soorten bewijs de onderdefinitie van mentale architectuur zouden oplossen. (Een voorbeeld van rijker bewijs zijn dubbele disassocaties. Een voorbeeld van een dubbele dissocatie is een paar patiënten, een die een normaal vermogen heeft om gesproken woorden te begrijpen, maar die schriftelijke niet begrijpt, en een ander die geschreven woorden begrijpt maar niet spreekt) degenen.)

2.4 Discussie

Deze studies illustreren enkele algemene kenmerken van de leertheorie:

1. Algemeenheid. De basisbegrippen van de theorie zijn erg algemeen. In wezen is de theorie van toepassing wanneer iemand een vraag heeft die aanleiding geeft tot onderzoek, een aantal kandidaat-antwoorden en enig bewijs om te beslissen tussen de antwoorden. Middelenanalyse kan dus worden toegepast in elke discipline die gericht is op empirische kennis, bijvoorbeeld natuurkunde of psychologie.

2. Contextafhankelijkheid. De leertheorie is pure normatieve a priori epistemologie in die zin dat het handelt over standaarden voor het beoordelen van methoden in mogelijke onderzoeksomgevingen. Maar de aanpak is niet gericht op universele, contextvrije methodologische stelregels. De methodologische aanbevelingen zijn afhankelijk van voorwaardelijke factoren, zoals de operatieve methodologische normen, de onderzochte vragen, de achtergrondveronderstellingen die de agent aan onderzoek doet, de observatiemiddelen waarover zij beschikt, haar cognitieve capaciteiten en haar epistemische doelen. Bijgevolg moet men, om specifieke methoden in een bepaald domein te evalueren, zoals in de genoemde casestudy's, de details van de casus in kwestie bestuderen. De analyse van het doel van het doel beloont deze studie vaak door erop te wijzen wat de cruciale methodologische kenmerken van een bepaalde wetenschappelijke onderneming zijn,en door precies uit te leggen waarom en hoe deze kenmerken verband houden met het succes van de onderneming bij het bereiken van haar epistemische doelstellingen.

3. Afwegingen. In het perspectief van de epistemologie van het doel, betekent onderzoek een voortdurende strijd met moeilijke keuzes, in plaats van de uitvoering van een universele "wetenschappelijke methode". De vragensteller moet tegenstrijdige waarden in evenwicht brengen en kan verschillende strategieën overwegen, zoals het accepteren van moeilijkheden op korte termijn, in de hoop deze op lange termijn op te lossen. Zo kunnen er bijvoorbeeld bij het probleem van de instandhoudingswet conflicten zijn tussen theoretische spaarzaamheid, dat wil zeggen minder instandhoudingswetten, en ontologische spaarzaamheid, dat wil zeggen minder verborgen deeltjes introduceren. Voor een ander voorbeeld kan een deeltjestheoreticus accepteren dat hij niet-gedetecteerde deeltjes plaatst in de hoop dat ze uiteindelijk zullen worden waargenomen naarmate de wetenschap vordert. De voortdurende zoektocht naar het Higgs-deeltje illustreert deze strategie.Een belangrijk leertheoretisch project is om te onderzoeken wanneer dergelijke afwegingen optreden en wat de opties zijn om ze op te lossen. Hoofdstuk 4 breidt de leertheoretische analyse uit om naast de betrouwbaarheid op lange termijn ook rekening te houden met doelen.

3. De grenzen van onderzoek en de complexiteit van empirische problemen

Na het zien van een aantal voorbeelden zoals hierboven beschreven, begint men zich af te vragen wat het patroon is. Waar gaat het over een empirische vraag waarmee het onderzoek betrouwbaar tot het juiste antwoord kan komen? Welke algemene inzichten kunnen we krijgen over hoe betrouwbare methoden hypothesen testen? Lerende theoretici beantwoorden deze vragen met karakterisatiestellingen. Karakteriseringsstellingen zijn in het algemeen van de vorm "het is mogelijk om deze standaard van empirisch succes te bereiken in een bepaald inductief probleem als en alleen als het inductieve probleem aan de volgende voorwaarden voldoet".

Een fundamenteel resultaat beschrijft de omstandigheden waaronder een methode op betrouwbare wijze de juiste hypothese kan vinden tussen een telbaar oneindig of eindig getal H 1, H 2, …, H n,…. van elkaar uitsluitende hypothesen die gezamenlijk alle mogelijkheden bestrijken die consistent zijn met de achtergrondaannames van de onderzoeker. Dit is mogelijk voor het geval elk van de hypothesen een telbare disjunctie is van weerlegbare empirische claims. Met 'weerlegbaar' bedoel ik dat als de bewering onwaar is, het bewijs in combinatie met de achtergrondaannames van de onderzoeker uiteindelijk dat disjunct binnen de hypothese definitief zal vervalsen (zie Kelly [1996, Ch. 3.3]). Laten we ter illustratie terugkeren naar het ornithologische voorbeeld met twee alternatieve hypothesen: (1) bijna alle zwanen zijn wit en (2) bijna alle zwanen zijn zwart. Zoals we hebben gezien, is het op de lange termijn mogelijk om betrouwbaar vast te stellen welke van deze twee hypothesen juist is. Vandaar door de karakteriseringsstelling,elk van de twee hypothesen moet een disjunctie zijn van weerlegbare empirische claims. Om te zien dat dit inderdaad zo is, moet u constateren dat "bijna alle zwanen wit zijn" logisch gelijkwaardig is aan de disjunctie

hoogstens 1 zwaan is zwart of hoogstens 2 zwanen zijn zwart … of hoogstens n zwanen zijn zwart … of …,

en hetzelfde geldt voor "bijna alle zwanen zijn zwart". Elk van de claims in de disjunctie is weerlegbaar, in de zin dat ze uiteindelijk vervalst worden wanneer ze onwaar zijn. Neem bijvoorbeeld de bewering dat "maximaal 3 zwanen zwart zijn". Als dit niet waar is, worden er meer dan 3 zwarte zwanen gevonden, waarna de claim definitief wordt vervalst.

Een recente karakteriseringsstelling vanwege Baltag, Gierasimczuk en Smets benadrukt het topologische concept van scheidbaarheid [Baltag et al. 2015]. In epistemische termen betekent topologische scheiding (gebrek aan) onderbepaling door bewijs. Het klassieke eerste axioma van scheiding vereist bijvoorbeeld dat er voor elke twee mogelijke toestanden van de wereld twee mogelijke observatiesequenties zijn, elk consistent met de ene toestand van de wereld maar niet met de andere. Het eerste separatie-axioma houdt dus in dat een volledige waarnemingsequentie een unieke toestand van de wereld bepaalt. Baltag et al. een topologische notie definiëren van wat het voor bewijs betekent om concurrerende hypothesen in een inductief probleem te scheiden, en bewijzen dat dit concept van inductieve scheidbaarheid kenmerkt welke inductieve problemen betrouwbaar leren mogelijk maken.

Een paar punten zullen helpen het belang van karakterisatiestellingen te verklaren.

1. Structuur van betrouwbare methoden. Karakterisatiestellingen vertellen ons hoe de structuur van betrouwbare methoden is afgestemd op de structuur van de onderzochte hypothesen. De genoemde stelling legt bijvoorbeeld een verband tussen falsificeerbaarheid en testbaarheid, maar is meer verzwakt dan de naïeve Popperiaanse voorstellingen: het is niet nodig dat de geteste hypothesen direct falsifieerbaar zijn; veeleer moeten er manieren zijn om elke hypothese te versterken die een telbaar aantal weerlegbare 'subhypothesen' oplevert. We kunnen deze weerlegbare subhypothesen zien als verschillende manieren waarop de hoofdhypothese waar kan zijn. (Bijvoorbeeld, een manier waarop "bijna alle raven wit zijn" is waar, is als er maximaal 10 zwarte raven zijn; een andere is als er maximaal 100 zwarte raven zijn, enz.)

2. Import van achtergrondaannames. Het karakteriseringsresultaat trekt een grens tussen de oplosbare en onoplosbare problemen. Achtergrondkennis vermindert de inductieve complexiteit van een probleem; met voldoende achtergrondkennis overschrijdt het probleem de drempel tussen het onoplosbare en het oplosbare. In veel domeinen van empirisch onderzoek zijn de cruciale achtergrondveronderstellingen die welke betrouwbaar onderzoek mogelijk maken. (Kuhn [1970] maakt soortgelijke opmerkingen over het belang van achtergrondveronderstellingen belichaamd in een "paradigma").

3. Taalinvariantie. Leer-theoretische karakterisatiestellingen gaan over wat Kelly de "temporele verstrengeling" van verschillende observatiesequenties noemt [Kelly 2000]. Uiteindelijk berusten ze op de relaties tussen de gegeven bewijzen, achtergrondveronderstellingen en empirische claims. Aangezien logische gevolgtrekking niet afhangt van de taal die we gebruiken om bewijs en hypothesen te kaderen, is de inductieve complexiteit van een empirisch probleem zoals bepaald door de karakterisatiestellingen, taalinvariant.

4. De lange termijn op de korte termijn: betrouwbare en stabiele overtuigingen

Een al lang bestaande kritiek op convergentie naar de waarheid als onderzoeksdoel is dat dit doel, hoewel het op zichzelf prima is, consistent is met gek gedrag op korte termijn [Salmon 1991]. We zagen bijvoorbeeld in het New Riddle of Induction dat een betrouwbare projectieregel kan veronderstellen dat de volgende smaragd blauw zal zijn, ongeacht hoeveel groene smaragden er zijn gevonden - zolang de regel uiteindelijk projecteert "alle smaragden zijn groen". Een antwoord is dat als middel-doelanalyse naast andere convergentie op lange termijn ook rekening houdt met andere epistemische doelen, het een sterke leidraad kan zijn voor wat op de korte termijn moet worden vermoed.

Laten we, om dit punt te illustreren, terugkeren naar het Goodmanian Riddle of Induction. Sinds Plato hebben filosofen het idee overwogen dat stabiel waarachtig geloof beter is dan onstabiel waar geloof, en epistemologen zoals Sklar [1975] hebben soortgelijke principes van 'epistemisch conservatisme' bepleit. Kuhn vertelt ons dat een belangrijke reden voor conservatisme in paradigma-debatten de kosten zijn van het veranderen van wetenschappelijke overtuigingen [Kuhn 1970]. In deze geest hebben lerende theoretici methoden onderzocht die het aantal keren dat ze hun theorieën veranderen tot een minimum beperken voordat ze tot een definitief vermoeden komen [Putnam 1965, Kelly 1996, Jain 1999]. Dergelijke methoden zouden veranderingen in de geest tot een minimum beperken.

4.1 Voorbeeld: het nieuwe raadsel van inductie

The New Riddle of Induction blijkt een mooie illustratie van dit idee te zijn. Overweeg de natuurlijke projectieregel (vermoed dat alle smaragden groen zijn op een steekproef van groene smaragden). Als alle smaragden groen zijn, verandert deze regel nooit het vermoeden ervan. En als alle smaragden gedurende een kritieke tijd t grue (t) zijn, dan laat de natuurlijke projectieregel zijn vermoeden "alle smaragden zijn groen" op het moment t -een mentale verandering - los en projecteert vervolgens correct "alle smaragden zijn grue (t)". Het is opmerkelijk dat regels die gruwelijk zijn in plaats van groen niet zo goed zijn. Overweeg bijvoorbeeld een regel die veronderstelt dat alle smaragden gruw zijn (3) na het observeren van één groene smaragd. Als er nog twee groene smaragden worden waargenomen, is het vermoeden van de regel vervalst en moet deze uiteindelijk van gedachten veranderen,vermoeden dat alle smaragden groen zijn (ervan uitgaande dat er nog steeds groene smaragden worden gevonden). Maar dan kan er op dat moment een blauwe smaragd verschijnen, die een tweede gedachtenwisseling dwingt. Dit argument kan worden gegeneraliseerd om aan te tonen dat het doel van het minimaliseren van geestveranderingen alleen toelaat om het groene predikaat te projecteren op een steekproef van alle groene smaragden [Schulte 1999]. We zagen in paragraaf 1.2 hierboven hoe de natuurlijke projectieregel hoogstens één keer van gedachten verandert; de onderstaande afbeelding illustreert in een typisch geval hoe een onnatuurlijke projectieregel mogelijk twee of meer van gedachten moet veranderen.Dit argument kan worden gegeneraliseerd om aan te tonen dat het doel van het minimaliseren van geestveranderingen alleen toelaat om het groene predikaat te projecteren op een steekproef van alle groene smaragden [Schulte 1999]. We zagen in paragraaf 1.2 hierboven hoe de natuurlijke projectieregel hoogstens één keer van gedachten verandert; de onderstaande afbeelding illustreert in een typisch geval hoe een onnatuurlijke projectieregel mogelijk twee of meer van gedachten moet veranderen.Dit argument kan worden gegeneraliseerd om aan te tonen dat het doel van het minimaliseren van geestveranderingen alleen toelaat om het groene predikaat te projecteren op een steekproef van alle groene smaragden [Schulte 1999]. We zagen in paragraaf 1.2 hierboven hoe de natuurlijke projectieregel hoogstens één keer van gedachten verandert; de onderstaande afbeelding illustreert in een typisch geval hoe een onnatuurlijke projectieregel mogelijk twee of meer van gedachten moet veranderen.

onnatuurlijk
onnatuurlijk

4.2 Meer voorbeelden

Dezelfde redenering geldt voor de vraag of alle raven zwart zijn. De gewaagde generalisator die vermoedt dat alle raven zwart zijn na het observeren van monsters van alleen zwarte raven, slaagt met hooguit één mentale verandering: als inderdaad alle raven zwart zijn, verandert de generalisator nooit van gedachten. En als er een niet-zwarte raaf is, veroorzaakt de weerlegging een verandering van geest, maar daarna wordt de vraag beantwoord.

Vergelijk dit met de tegengestelde methode die stelt dat er een niet-zwarte raaf is na het observeren van een steekproef van alle zwarte. Als alleen zwarte raven worden waargenomen, moet de tegenovergestelde methode uiteindelijk van gedachten veranderen en beweren dat "alle raven zwart zijn", anders komt het niet tot de juiste generalisatie. Maar dan kan er op dat moment een niet-zwarte raaf verschijnen, die een tweede mentaliteitsverandering dwingt. Het doel van stabiele overtuiging legt dus sterke beperkingen op wat een methode op korte termijn voor dit probleem kan vermoeden: bij het observeren van alleen zwarte raven zijn de opties "alle raven zijn zwart" of "nog geen mening", maar niet "er is een niet-zwarte raaf”.

In het probleem van de instandhoudingswet is de restrictieve methode die wordt beschreven in paragraaf 2.1 de enige methode die gedachtenveranderingen minimaliseert. Bedenk dat de beperkende methode een reeks beschermingswetten aanneemt die zoveel mogelijk niet-geobserveerde reacties uitsluiten. Aangetoond kan worden dat als er geen bekende elementaire deeltjes zijn waarvan de reacties worden waargenomen, deze methode hoogstens n geestveranderingen vereist. (Het aantal elementaire deeltjes in het standaardmodel ligt rond n = 200).

Om causale grafieken te leren, minimaliseert de volgende variant van de methode beschreven in paragraaf 2.2 het aantal geestveranderingen.

  • Stel dat we een reeks correlaties of associaties hebben waargenomen tussen een reeks interessante variabelen.
  • Selecteer deze grafiek als er een unieke causale grafiek is die de waargenomen correlaties verklaart met een minimaal aantal directe causale verbanden.
  • Als er meer dan één causale grafiek is die de waargenomen correlaties verklaart met een minimum aan directe causale verbanden, voer dan "nog geen mening" uit (of vermoed de disjunctie van de minimale randgrafieken).

Dit voorbeeld illustreert dat het minimaliseren van gedachtenveranderingen soms het achterhouden van overtuigingen vereist. Intuïtief gebeurt dit wanneer er twee of meer even eenvoudige verklaringen van de gegevens zijn en de aanvrager moet wachten tot verdere observaties tussen deze mogelijkheden beslissen. Springen naar een van de simpele conclusies kan leiden tot een onnodige mentale verandering in het geval dat een alternatieve, even eenvoudige verklaring juist blijkt te zijn. In dergelijke gevallen is er een afweging tussen enerzijds het bereiken van een stabiel geloof en anderzijds het snel vestigen van een waar geloof [Schulte 1999]. We bespreken het verband tussen eenvoud en stabiel geloof in de volgende sectie.

5. Eenvoud, stabiel geloof en het scheermes van Ockham

Een sterke intuïtie over inductieve gevolgtrekking en wetenschappelijke methode is dat we de voorkeur moeten geven aan eenvoudiger hypothesen dan aan complexe. zie de vermelding over eenvoud. Statistici, informatici en andere onderzoekers die zich bezighouden met het leren van waarnemingen, hebben uitgebreid gebruik gemaakt van een voorkeur voor eenvoud om praktische inductieve problemen op te lossen [Domingos 1999]. Vanuit fundamenteel oogpunt is eenvoud om ten minste twee redenen problematisch.

  1. Het rechtvaardigingsprobleem: waarom eenvoudige hypothesen aannemen? Een voor de hand liggend antwoord is dat de wereld eenvoudig is en dat daarom een ​​complexe theorie onjuist is. De apriori beweren echter dat de wereld eenvoudig is, is zeer controversieel - zie de vermelding over eenvoud. Vanuit een leertheoretisch perspectief schaadt het verwerpen van complexe hypothesen de betrouwbaarheid van inductieve methoden. In Kelly's metafoor is een vaste bias als een stopwatch: we gebruiken het horloge misschien wanneer het op het juiste moment wijst, maar het horloge is geen betrouwbaar instrument om de tijd te vertellen [Kelly 2007a, 2010].
  2. Het probleem met de beschrijving: Epistemologen zijn bang dat eenvoud geen objectief kenmerk is van een hypothese, maar eerder 'hangt af van de manier van presenteren', zoals Nozick het uitdrukt. Goodman's Riddle illustreert dit punt. Als generalisaties in blauwgroene termen worden weergegeven, lijkt 'alle smaragden groen' eenvoudiger dan 'alle smaragden zijn eerst groen en vervolgens blauw'. Maar in een grue-bleen-taal lijkt 'alle smaragden grue' eenvoudiger dan 'alle smaragden zijn eerst grue en dan bleen'.

Leertheoretici hebben zich recentelijk beziggehouden met het toepassen van epistemologie van de eindtermen om een ​​theorie te ontwikkelen over het verband tussen eenvoud en inductie die deze zorgen aanpakt [Kelly 2010, Harmann en Kulkarni 2007, Luo en Schulte 2006, Steel 2009]. Het blijkt dat het een vruchtbaar perspectief is om de relatie tussen de structuur van een hypotheseruimte en de complexiteit van de geestverandering van het corresponderende inductieve probleem te onderzoeken. Het fundamentele idee is dat, hoewel eenvoud niet a priori verband houdt met waarheid, het kiezen van eenvoudige hypothesen een onderzoeker kan helpen de waarheid efficiënter te vinden, in de zin dat hij geestveranderingen vermijdt. Kelly's wegmetafoor illustreert het idee. Overweeg twee routes naar de bestemming, één via een rechte snelweg, de andere via achterafwegen. Beide routes leiden uiteindelijk naar hetzelfde punt,maar de secundaire wegen brengen meer wendingen met zich mee [Kelly 2007a, 2010].

Een formalisering van dit idee heeft de vorm van een Ockham-stelling: een stelling die aantoont (onder gepaste beperkingen) dat een inductieve methode de waarheid zo efficiënt mogelijk vindt voor een bepaald probleem, en alleen als de methode de Ockham-methode is, dat wil zeggen selecteert het de eenvoudigste hypothese die consistent is met de gegevens. Een stelling van Ockham geeft een rechtvaardiging voor het inductieve scheermes van Ockham als middel om epistemische doelen te bereiken.

Of een stelling van Ockham waar is, hangt af van de beschrijving van de Ockham-methode, dat wil zeggen van de exacte definitie van eenvoud voor een reeks hypothesen. Er is een groot aantal wiskundige resultaten die de stellingen van Ockham vaststellen met behulp van een taalinvariante eenvoudsmaat, die we hierna uitleggen.

5.1 Eenvoud definiëren

Stel dat een hypothese H uit een achtergrondset van mogelijke hypothesen H verifieerbaar is als er een bewijsreeks is zodat H de enige hypothese van H is die consistent is met de bewijsreeks. In het probleem van de zwarte raaf hierboven is bijvoorbeeld de hypothese "er is een niet-zwarte raaf" verifieerbaar omdat deze gepaard gaat met een observatie van een niet-zwarte raaf. De hypothese "alle raven zijn zwart" is niet verifieerbaar, aangezien er geen eindige bewijsreeks aan is verbonden. De volgende procedure kent aan elke hypothese H een eenvoudigheidsrang toe uit een reeks hypothesen H [Apsitis 1994, Luo en Schulte 2006].

  1. Wijs alle verifieerbare hypothesen toe eenvoud rang 0.
  2. Verwijder de verifieerbare hypothesen uit de hypotheseruimte om een ​​nieuwe hypotheseruimte H 1 te vormen.
  3. Wijs eenvoud rang 1 toe aan de hypothesen die verifieerbaar zijn gegeven H 1.
  4. Verwijder de nieuw verifieerbare hypothesen met eenvoud rang 1 uit de hypotheseruimte om een ​​nieuwe hypotheseruimte H 2 te vormen.
  5. Ga door met het verwijderen van hypothesen totdat er geen nieuwe hypothesen meer verifieerbaar zijn gezien de huidige hypotheseruimte.
  6. De eenvoudigheidsrang van elke hypothese H is het eerste stadium waarin deze door deze procedure wordt verwijderd. Met andere woorden, het is de index van de eerste beperkte hypotheseruimte die H verifieerbaar maakt.

Hypothesen met een hogere eenvoudrang worden als eenvoudiger beschouwd dan die met lagere rangen. Eenvoud gelederen zijn gedefinieerd in termen van logische relaties, en zijn dus taalinvariant. Eenvoud zoals gedefinieerd kan worden gezien als mate van falsificeerbaarheid in de volgende zin. Beschouw een hypothese van eenvoud rang 1. Een dergelijke hypothese is falsifieerbaar omdat een bewijsreeks die een alternatieve hypothese van rang 0 verifieert, deze vervalst. Bovendien is een hypothese van eenvoud rang 1 aanhoudend falsifieerbaar in die zin dat het falsifieerbaar blijft, ongeacht welke bewijsvolgorde ermee in overeenstemming is. Een hypothese van eenvoud rang n +1 is voortdurend falsifieerbaar door hypothesen van rang n. Laten we de definitie illustreren in onze lopende voorbeelden.

5.2 Voorbeelden

  • In het raadsel van inductie zijn de verifieerbare hypothesen de grue-hypothesen met kritische tijd t: elke opeenvolging van t groene smaragden gevolgd door blauwe brengt de corresponderende grue (t) generalisatie met zich mee. Dus de grue-hypothesen krijgen eenvoud rang 0. Nadat de grue-hypothesen zijn geëlimineerd, is de enige resterende hypothese "alle smaragden zijn groen". Aangezien het de enige mogelijkheid is in de beperkte hypotheseruimte, wordt "alle smaragden groen" veroorzaakt door elke opeenvolging van groene smaragden. Daarom heeft "alle smaragden zijn groen" eenvoud rang 1. Na het verwijderen van de volledig groene hypothese blijven er geen hypothesen over.
  • In het kleurprobleem van een raaf is de verifieerbare hypothese "een niet-zwarte raaf zal worden waargenomen", die de eenvoud van rang 0 krijgt. Na het verwijderen van de hypothese dat een niet-zwarte raaf zal worden waargenomen, is de enige resterende mogelijkheid dat alleen zwarte raven worden waargenomen, vandaar dat deze hypothese verifieerbaar is in de beperkte hypotheseruimte en eenvoudrang 1 krijgt.
  • De eenvoudsscore van een causale grafiek wordt gegeven door het aantal directe links dat niet in de grafiek is opgenomen. Hoe minder directe verbanden er worden gelegd door het causale model, hoe hoger de rangorde van eenvoud.
  • De eenvoudigheidsrang van een reeks beschermingswetten wordt bepaald door het aantal onafhankelijke wetten. (Onafhankelijkheid in de zin van lineaire algebra.) Daarom, hoe meer niet-overtollige wetten door een theorie worden geïntroduceerd, hoe hoger de rangorde van eenvoud. Elke wet sluit enkele reacties uit, dus het maximaliseren van het aantal onafhankelijke wetten, gegeven de waargenomen reacties, komt overeen met het uitsluiten van zoveel mogelijk niet-waargenomen reacties.

5.3 Stabiel geloof en eenvoud: een stelling van Ockham

De volgende stelling toont het verband tussen de geestveranderende complexiteit van een inductief probleem en de eenvoudsclassificatie zoals gedefinieerd.

Stelling. Laat H een verzameling empirische hypothesen zijn. Dan is er een methode die op betrouwbare wijze een correcte hypothese van H in de limiet identificeert met hoogstens n geestveranderingen, al dan niet als de eliminatieprocedure die hierboven is gedefinieerd eindigt met een lege set hypothesen na n stadia.

Dus om een ​​inductief probleem op te lossen met ten hoogste n gedachtenveranderingen, is de maximale eenvoud van elke mogelijke hypothese n. In het Riddle of Induction is de maximale rang van eenvoud 1, en daarom kan dit probleem worden opgelost met maximaal 1 mentaliteitsverandering. Het volgende resultaat biedt een stelling van Ockham die eenvoud en geestveranderende prestaties verbindt.

Ockham Theorem. Laat H een verzameling empirische hypothesen zijn met een optimale mentaliteitsverandering gebonden n. Dan is een inductieve methode de mentale verandering optimaal als en alleen als het aan de volgende voorwaarden voldoet.

  1. Telkens wanneer de methode een van de hypothesen van H overneemt, is deze hypothese de uniek eenvoudigste die consistent is met het bewijs.
  2. Als de methode van mening verandert op onderzoekstijd t +1, wordt de uniek eenvoudigste hypothese op tijdstip t vervalst op tijdstip t +1.

Deze stelling zegt dat een optimale methode voor het veranderen van de geest een vermoeden kan onthouden zoals een scepticus dat zou doen, maar als het een definitieve hypothese aanneemt, moet de hypothese de eenvoudigste zijn, in de zin van de maximale eenvoud. De optimale methoden voor het veranderen van de geest die in sectie 4 worden besproken, zijn dus allemaal Ockham-methoden die de eenvoudigste hypothese gebruiken die consistent is met de gegevens. De stelling van Ockham toont een opmerkelijke omkering van het al lang bestaande bezwaar dat betrouwbaarheid op lange termijn te weinig beperkingen oplegt aan vermoedens op korte termijn: als we aan de waarheid op lange termijn convergentie toevoegen, is het doel van het bereiken van een stabiel geloof, in feite daar is een unieke inductieve methode die dit doel bereikt in een bepaald empirisch probleem. Zo schakelt de methodologische analyse over van het aanbieden van geen kortlopende voorschriften naar het aanbieden van een volledig recept.

Hoewel deze resultaten een vruchtbaar verband tussen eenvoud en optimaliteit van geest veranderen, is een beperking van de benadering dat het vereist dat sommige hypothesen onomstotelijk door een bewijsvolgorde moeten worden bepaald. Dit is typisch niet het geval voor statistische modellen, waarbij de kans op een hypothese willekeurig klein kan worden, maar meestal niet 0. Denk bijvoorbeeld aan een probleem met het omdraaien van munten en de hypothese "de kans op heads is 90%". Als we een miljoen staarten waarnemen, is de waarschijnlijkheid van de hypothese inderdaad erg klein, maar niet 0, omdat een willekeurig aantal staarten logisch consistent is met een hoge waarschijnlijkheid van hoofden. Kevin Kelly heeft een idee van eenvoud ontwikkeld dat geschikt is voor statistische modellen en bewees Ockham-stellingen voor deze instelling (zie Andere internetbronnen).

6. Andere benaderingen: categorische vs. hypothetische imperatieven

Kant maakte onderscheid tussen categorische imperatieven die men zou moeten volgen, ongeacht iemands persoonlijke doel en omstandigheden, en hypothetische imperatieven die ons ertoe aanzetten onze middelen te gebruiken voor ons gekozen doel. Een manier om te denken aan leertheorie is als de studie van hypothetische imperatieven voor empirisch onderzoek. Veel epistemologen hebben verschillende categorische imperatieven voorgesteld voor inductief onderzoek, bijvoorbeeld in de vorm van een 'inductieve logica' of normen van 'epistemische rationaliteit'. Er zijn in principe drie mogelijke relaties tussen hypothetische en categorische imperatieven voor empirisch onderzoek.

1. De categorische imperatief zal een onderzoeker ertoe brengen zijn cognitieve doelen te bereiken. In dat geval bevestigt een analyse van het doel van het doel de categorische imperatief. Wanneer we bijvoorbeeld werden geconfronteerd met een eenvoudige universele generalisatie zoals "alle raven zijn zwart", zagen we hierboven dat het volgen van het Popperiaanse recept om de vervalste generalisatie over te nemen en eraan vast te houden totdat een tegenvoorbeeld verschijnt, tot een betrouwbare methode leidt.

2. De categorische imperatief kan een onderzoeker ervan weerhouden zijn doelen te bereiken. In dat geval beperkt de categorische imperatief de reikwijdte van het onderzoek. Bijvoorbeeld, in het geval van de twee alternatieve generalisaties met uitzonderingen, leidt het principe van het handhaven van een universele generalisatie totdat deze wordt vervalst tot een onbetrouwbare methode (vgl. [Kelly 1996, Ch. 9.4]).

3. Sommige methoden voldoen aan zowel de categorische imperatief als de onderzoeksdoelen, en andere niet. Dan kunnen we het beste van twee werelden nemen en die methoden kiezen die de onderzoeksdoelen bereiken en voldoen aan categorische vereisten. (Zie de verdere discussie in deze sectie.)

Voor een voorgestelde onderzoeksnorm kunnen we middel-doelanalyse toepassen om te vragen of de norm de onderzoeksdoelen helpt of belemmert. Dit was de geest van Putnam's kritiek op de bevestigingsfuncties van Carnap [Putnam 1963]: de strekking van zijn essay was dat de methoden van Carnap niet zo betrouwbaar waren in het detecteren van algemene patronen als andere methoden zouden zijn. Meer recentelijk hebben lerende theoretici de kracht van Bayesiaanse conditionering onderzocht (zie het artikel over Bayesiaanse epistemologie). John Earman heeft verondersteld dat als er een betrouwbare methode is voor een bepaald probleem, er een betrouwbare methode is die doorgaat met Bayesiaanse updates [Earman 1992, Ch.9, Sec.6]. Cory Juhl [1997] gaf een gedeeltelijke bevestiging van het vermoeden van Earman: hij bewees dat het van toepassing is wanneer er slechts twee mogelijke bewijsstukken zijn (bijv. "Smaragd is groen" versus "smaragd is blauw").De algemene zaak is nog steeds open.

Epistemisch conservatisme is een methodologische norm die in de filosofie althans prominent aanwezig is sinds Quine's idee van 'minimale verminking' van onze overtuigingen [1951]. Een versie van epistemisch conservatisme, zoals we hierboven zagen, is van mening dat onderzoek naar stabiel geloof moet streven. Een andere formulering, dichter bij die van Quine, is het algemene uitgangspunt dat geloofsveranderingen in het licht van nieuw bewijs minimaal moeten zijn. Vrij recent werk in de filosofische logica heeft een aantal criteria voorgesteld voor minimale geloofsverandering die bekend staan ​​als de AGM-axioma's [Gärdenfors 1988]. Lerende theoretici hebben aangetoond dat wanneer er een betrouwbare methode is om een ​​empirische vraag te onderzoeken, er een is die verloopt via minimale veranderingen (zoals gedefinieerd door de AGM-postulaten). De eigenschappen van betrouwbaar onderzoek met minimale geloofsveranderingen worden onderzocht in [Martin and Osherson 1998, Kelly 1999,Baltag et al. 2015].

Veel van de computationele leertheorie richt zich op onderzoekers met begrensde rationaliteit, dat wil zeggen agenten met cognitieve beperkingen zoals een eindig geheugen of begrensde rekencapaciteiten. Veel categorische normen die het empirisch succes van logisch alwetende agenten niet verstoren, beperken niettemin de reikwijdte van cognitief begrensde agenten. Overweeg bijvoorbeeld de norm van consistentie: geloof dat een hypothese onjuist is zodra het bewijs er logischerwijs niet mee in overeenstemming is. Het consistentieprincipe maakt deel uit van zowel de Bayesiaanse bevestigingstheorie als de geloofsherziening van de AGM. Kelly en Schulte [1995] laten zien dat consistentie verhindert dat zelfs agenten met oneindig onberekenbare cognitieve vermogens bepaalde hypothesen betrouwbaar kunnen beoordelen. De moraal is dat als een theorie voldoende complex is,agenten die niet logisch alwetend zijn, zijn mogelijk niet in staat onmiddellijk te bepalen of een bepaald bewijsmateriaal in overeenstemming is met de theorie en moeten meer gegevens verzamelen om de inconsistentie op te sporen. Maar het consistentieprincipe - en a fortiori, Bayesiaanse actualisering en AGM-geloofsherziening - erkennen het nut van 'afwachten en meer zien' niet als een wetenschappelijke strategie.

Meer reflectie over deze en andere filosofische kwesties in de epistemologie van de eindtermen is te vinden in bronnen als [Glymour 1991], [Kelly 1996, Chs. 2,3], [Glymour en Kelly 1992], [Kelly et al. 1997], [Glymour 1994], [Bub 1994]. Van bijzonder belang voor de wetenschapsfilosofie kunnen leertheoretische modellen zijn die historistische en relativistische opvattingen over onderzoek accommoderen, voornamelijk door het idee van een inductieve methode uit te breiden, zodat methoden actief paradigma's voor onderzoek kunnen selecteren; voor meer informatie over dit onderwerp, zie [Kelly 2000, Kelly 1996, Ch.13]. De inleidingen van de boeklengte bij de wiskunde van de leertheorie zijn [Kelly 1996, Martin en Osherson 1998, Jain et al. 1999]. "Inductie, algoritmische leertheorie en filosofie" is een recente verzameling geschriften over leertheorie [Friend et al. 2007].Bijdragen omvatten inleidende artikelen (Harizanov, Schulte), wiskundige vooruitgang (Martin, Sharma, Stephan, Kalantari), filosofische reflecties over de sterke punten en implicaties van leertheorie (Glymour, Larvor, Friend), toepassingen van de theorie op filosofische problemen (Kelly), en een bespreking van leertheoretisch denken in de geschiedenis van de filosofie (Goethe).

Aanvullend document: basis formele definities

Bibliografie

  • Apsitis, K., 1994. "Afgeleide sets en inductieve gevolgtrekking", in Proceedings of the 5th International Work on Algorithmic Learning Theory, S. Arikawa, KP Jantke (red.), Berlijn, Heidelberg: Springer, pp. 26–39.
  • Baltag, A., Gierasimczuk, N. & Smets, S., 2015. 'On the Solvability of Inductive Problems: A Study in Epistemic Topology.', Proceedings of the 15th Conference on Theoretical Aspects of Rationality and Knowledge (TARK 2015), R. Ramanujam (red.), Chennai: Institute of Mathematical Sciences, pp. 65–74, online beschikbaar.
  • Bub, J., 1994. 'Testing of Cognition Through the Analysis of Brain-Damaged Performance', British Journal for the Philosophy of Science, 45: 837–55.
  • Chart, D., 2000. 'Schulte en Goodman's Riddle', British Journal for the Philosophy of Science, 51: 837–55.
  • Domingos, P., 1999. 'The role of Occam's razor in knowledge discovery', Data mining en Knowledge discovery, 3 (4): 409–425.
  • Earman, J., 1992. Bayes of buste?, Cambridge, Mass.: MIT Press.
  • Feynman, R., 1965. The Character of Physical Law, Cambridge, Mass.: MIT Press; 19e editie, 1990.
  • Friend, M. en N. Goethe en V. Harazinov (red.), 2007. Inductie, algoritmische leertheorie en filosofie, Dordrecht: Springer, pp. 111–144.
  • Ford, K., 1963. The World of Elementary Particles, New York: Blaisdell Publishing.
  • Gärdenfors, P., 1988. Knowledge In Flux: modellering van de dynamiek van epistemische staten, Cambridge, Mass.: MIT Press.
  • Glymour, C., 1991. 'De hiërarchieën van kennis en de wiskunde van ontdekking', Minds and Machines, 1: 75–95.
  • –––, 1994. 'On the Methods of Cognitive Neuropsychology', British Journal for the Philosophy of Science, 45: 815–35.
  • Glymour, C. en Kelly, K., 1992. 'Thoroughly Modern Meno', in Inference, Explanation and Other Frustrations, John Earman (red.), University of California Press.
  • Gold, E., 1967. 'Language Identification in the Limit', Information and Control, 10: 447–474.
  • Goodman, N., 1983. Fact, Fiction and Forecast, Cambridge, MA: Harvard University Press.
  • Harrell, M., 2000. Chaos and Reliable Knowledge, Ph.D. Scriptie, University of California in San Diego.
  • Harman, G. en Kulkarni, S., 2007. Betrouwbare redenering: inductie en statistische leertheorie, Cambridge, MA: The MIT Press.
  • Jain, S., et al., 1999. Systems That Learn, 2e editie, Cambridge, MA: MIT Press.
  • James, W., 1982. 'The Will To Believe', in Pragmatism, HS Thayer (red.), Indianapolis: Hackett.
  • Juhl, C., 1997. 'Objectief betrouwbare subjectieve waarschijnlijkheden', Synthese, 109: 293–309.
  • Kelly, K., 1996. The Logic of Reliable Inquiry, Oxford: Oxford University Press.
  • –––, 1999. 'Herhaling van geloof, betrouwbaarheid en inductief geheugenverlies', Erkenntnis, 50: 11–58.
  • –––, 2000. 'The Logic of Success', British Journal for the Philosophy of Science, 51 (4): 639–660.
  • –––, 2007a. 'Hoe eenvoud je helpt de waarheid te vinden zonder erop te wijzen', in Induction, Algorithmic Learning Theory, and Philosophy, M. Friend, N. Goethe en V. Harazinov (red.), Dordrecht: Springer, pp. 111–144.
  • –––, 2007b. 'Ockham's Razor, Truth, and Information', in n Handbook of the Philosophy of Information, J. van Behthem en P. Adriaans (red.), Dordrecht: Elsevier, 2008.
  • –––, 2010. “Eenvoud, waarheid en waarschijnlijkheid”, in Handbook for the Philosophy of Statistics, Prasanta S. Bandyopadhyay en Malcolm Forster (red.), Dordrecht: Elsevier.
  • Kelly, K., en Schulte, O., 1995. 'The Computable Testability of Theories Making Uncomputable Predictions', Erkenntnis, 43: 29–66.
  • Kelly, K., Schulte, O. en Juhl, C., 1997. 'Learning Theory and the Philosophy of Science', Philosophy of Science, 64: 245–67.
  • Kuhn, T., 1970. De structuur van wetenschappelijke revoluties. Chicago: University of Chicago Press.
  • Luo, W. en Schulte O., 2006. "Mind Change Efficient Learning", in Logic and Computation, 204: 989–1011.
  • Martin, E. en Osherson, D., 1998. Elementen van wetenschappelijk onderzoek, Cambridge, MA: MIT Press.
  • Ne'eman, Y. en Kirsh, Y., 1983. The Particle Hunters, Cambridge: Cambridge University Press.
  • Omnes, R., 1971. Inleiding tot deeltjesfysica, Londen, New York: Wiley Interscience.
  • Putnam, H., 1963. "Mate van bevestiging en inductieve logica", in The Philosophy of Rudolf Carnap, PA Schilpp (red.), La Salle, Ill: Open Court.
  • Putnam, H., 1965. "Predikaten met vallen en opstaan ​​en de oplossing voor een probleem van Mostowski", Journal of Symbolische logica, 30 (1): 49–57.
  • Quine, W., 1951. 'Two Dogmas of Empiricism', Philosophical Review, 60: 20–43.
  • Salmon, W., 1991. 'Hans Reichenbachs rechtvaardiging van inductie', Erkenntnis, 35: 99–122.
  • Schulte, O., 1999. 'Means-Ends Epistemology', The British Journal for the Philosophy of Science, 50: 1-31.
  • –––, 2008. 'The Co-Discovery of Conservation Laws and Particle Families', Studies in History and Philosophy of Modern Physics, 39 (2): 288–314.
  • –––, 2009. “Gelijktijdige ontdekking van behoudswetten en verborgen deeltjes met Smith Matrix-afbraak”, in Proceedings of the Twenty-First International Joint Conference on Artificial Intelligence (IJCAI-09), Palo Alto: AAAI Press pp. 1481-1487.
  • Schulte, O., Luo, W., en Greiner, R., 2007. 'Mind Change Optimal Learning of Bayes Net Structure', in Proceedings of the 20th Annual Conference on Learning Theory (COLT'07, San Diego, CA, juni 12–15), N. Bshouti en C. Gentile (red.), Berlijn, Heidelberg: Springer, pp. 187–202.
  • Sklar, L., 1975. 'Methodological Conservatism', Philosophical Review, 84: 374–400.
  • Spirtes, P., Glymour, C., Scheines, R., 2000. Oorzaak, voorspelling en zoeken, Cambridge, MA: MIT Press.
  • Steel, D., 2009. "Testbaarheid en Ockham's Razor: hoe formele en statistische leertheorie samenkomen in het nieuwe raadsel van inductie", Journal of Philosophical Logic, 38: 471–489.
  • Valiant, LG, 1984. "A theory of the learnable", Proceedings of the Sixteenth Annual ACM Symposium on Theory of Computing (STOC 84), New York: ACM Press, pp. 436–445.

Academische hulpmiddelen

sep man pictogram
sep man pictogram
Hoe deze vermelding te citeren.
sep man pictogram
sep man pictogram
Bekijk een voorbeeld van de PDF-versie van dit item bij de Vrienden van de SEP Society.
inpho icoon
inpho icoon
Zoek dit itemonderwerp op bij het Internet Philosophy Ontology Project (InPhO).
phil papieren pictogram
phil papieren pictogram
Verbeterde bibliografie voor dit item op PhilPapers, met links naar de database.

Andere internetbronnen

  • Papers van Kevin Kelly op Ockham's Razor:

    • Efficiënte convergentie impliceert het scheermes van Ockham.
    • Een close shave met realisme: Ockham's Razor is afgeleid van efficiënte convergentie
    • Rechtvaardiging als waarheidsvinding: hoe het scheermes van Ockham werkt
    • Ockham's Razor, Empirical Complexity, and Truth-finding Efficiency
    • Ockham's Razor, Truth, and Information
  • Leertheorie in de informatica
  • Inductieve logische website over theorie van formeel leren en herziening van overtuigingen

Populair per onderwerp