Conditionering
Thorndike en Pavlov stonden samen aan de basis van de moderne leerpsychologie, de leertheoretische benadering. Thorndike onderzocht het probleemoplossend vermogen van katten door ze op te sluiten in een kist waaruit ze konden ontsnappen door via een specifiek mechanisme de deur te openen. Daarna werden ze beloond met eten. De katten kregen de deur steeds sneller open (=acquisitie, verweven van nieuw gedrag)
Wet van het effect → gedrag met een aangenaam gevolg neemt toe, gedrag met een onaangenaam gevolg leidt, neemt af → instrumentele conditionering/operante conditionering
Pavlov ontdekte dat honden eerst alleen speeksel afscheiden als zij voedsel kregen, maar al snel ook bij andere prikkels waarbij voedsel gepresenteerd werd, Pavlov gebruikte een zoemer. De honden bleken al snel ook speeksel af te scheiden als zij alleen de zoemer hoorden.
Wetmatigheid → wanneer een prikkel (vlees), die een natuurlijke reactie uitlokt (speeksel), herhaaldelijk gepresenteerd wordt met een neutrale prikkel (zoemer), zal de neutrale prikkel (zoemer) op den duur dezelfde reactie (speeksel) uitlokken → klassieke conditionering.
Verschillen tussen Thorndike en Pavlov:
- Pavlov: het dier is passief, Thorndike: het leereffect is afhankelijk van de activiteit van het dier
- Pavlov: het dier leert een associatie tussen twee prikkels, maar geen nieuw gedrag. Het leert alleen om met hetzelfde gedrag op een nieuwe prikkel te reageren. Thorndike: het dier leer wel nieuw gedrag, namelijk de relatie tussen een handeling en een prikkel. Het leert zich zo te gedragen dat het een gewenste prikkel ontvangt.
Skinner werkte de instrumentele conditionering verder uit, deze werd synonoem met operante conditionering. Skinner had bezwaar tegen de kunstmatige proefopstelling en ontwierp de Skinner-box waarmee het natuurlijke gedragsverloop van het proefdier geobserveerd wordt.
Termen instrumentele conditionering:
- Discriminatieve prikkel of situatie (S)
- Handeling of respons (R)
- Uitkomst of outcome (O)
De kat trek in de kooi (S) aan het touw (R) en krijgt voedsel (O).
Termen klassieke conditionering:
- Onvoorwaardelijke prikkel (OP) = ongeconditioneerde prikkel
- Onvoorwaardelijke reactie/respons (OR) = ongeconditioneerde respons
- Voorwaardelijke prikkel (VP) = geconditioneerde prikkel
- Voorwaardelijke reactie/respons (VR) = geconditioneerde respons
Het voedsel in de van de hond (OP) lokt automatisch een speekselreactie (OR). Onder bepaalde voorwaarden kan ook de zoemer (VP) de speekselreactie uitlokken (VR).
Leren: het wat en het hoe
Definitie leren: gedragsveranderingen van een organisme die het resultaat zijn van regelmatigheden in de omgeving. Regelmatigheden → alles wat meer inhoudt dan de aanwezigheid van een stimulus op een uniek moment in de tijd. Het individu kan zich door leren, aanpassen aan de omegving tijdens de levensloop (ontogenetische adaptatie)
Verklaringen voor conditionering
Associatieve theorieën
Leren vindt plaats door associatievorming in het geheugen.
Associatie: een hypothetisch construct waarlangs activatie van de ene mentale representatie naar de andere kan stromen.
- Stimulus-respons leren (S-R) zoals bij klassieke conditionering: leggen van een directe verbinding tussen de VP en VR.
- Stimulus-stimulus leren (S-S) leren. De reactie op de VP wordt aangedreven door het verwachten van OP. De ene stimulus prikkelt de verwachting van een andere stimulus. De speekselafscheiding bij Pavlov's hond als reactie op de zoemer ontstaat omdat de hond voedsel verwacht.
Propositionele-theorie
De propositionele theorie is meer dan een associatietheorie. Leren (conditonering) vindt plaats door het opslaan van een hypothese (propositie) in het geheugen en de mate van vertrouwen in de hypothese. Er is geen blinde associatie tussen zoemer en voedsel maar een propositie → als ik een bel hoor zal ik voedsel krijgen.
Een associatie verbindt alleen gebeurtenissen met elkaar: een propositie doet ook een uitspraak over de aard van het verband. Het associatief perspectief is nu de dominante stroming.
Appetitieve conditionering
Bij appetitieve conditionering is er sprake van een aangename prikkel.
- Klassieke conditionering → voedsel werkt een speekselreflex op waarna omgevingsfactoren dezelfde reflex gaan opwekken.
- Instrumentele conditionering → appetitieve conditionering treedt op als gedrag bekrachtigd wordt met een aangename prikkel.
Het principe van appetitieve conditionering helpt om verslaving of obesitas te begrijpen. Verslaving en verstoord eetgedrag worden gekenmerkt door craving (hunkering) en preoccupatie met het product.
Appetitive conditionering staat onder controle van
- Doelgericht gedrag: gedrag dat gebaseerd is op associatie tussen responsen en uitkomsten.
- Gewoontegedrag: gedrag dat gebaseerd is op associatie tussen stimuli en responsen, maar de uitkomst van het gedrag heeft geen mediërende rol.
Pavloviaans-instrumentele transfer (PIT) → er ontstaat een interactie tussen klassieke en instrumentele conditionering.
Aversieve conditionering
Watson, grondlegger behaviorisme bestudeerde uitsluitend objectief waarneembare prikkels. Met het experiment met little Albert toonde hij aan dat angst kan ontstaan via klassieke conditionering: neutrale conditionering die gespaard gaan met een akelig/gevaarlijke gebeurtenis zullen angst uitlokken. Acquisitie treedt dus ook op als een VP (konijn) wordt opgevolgd door een aversie OP (herrie).
Kritiek:
- Niet iedereen met een angststoornis heeft een relevante geschiedenis van aversieve conditionering
- Nier iedereen die een trauma meemaakt, ontwikkelt een angststoornis.
Ook aversieve prikkels kunnen tot conditionering leiden:
- Klassieke conditionering → een prikkel waar we van nature een afkeer (bv slangen) van hebben, roept een aversieve reactie. Omgevingsfactoren (bv. bos) kunnen dezelfde aversieve reactie oproepen zodat we die prikkels gaan vermijden.
- Instrumentele conditionering: gedrag wordt gecorrigeerd met een onaangename prikkel.
Aversieve conditionering treedt vooral op bij zaken die van nature angst of afkeer oproepen. Angststoornissen en specifieke fobieën kunnen verklaard worden door het principe van aversieve conditionering → vermijdingsgedrag
Tweefactorentheorie
Factor I: klassieke conditionering wekt angst op
Factor II: instrumentele conditionering speelt een rol bij vermijdingsgedrag. Vermijdingsgedrag wordt bekrachtigd door de daling van de angst en wordt binnen de theorie opgevat als het ontsnappen aan geconditioneerde angstreacties.
Latente inhibitie: de conditionering verloop trager als de VP (zoemer) vooraf enkele keren zonder OP (eten) wordt aangeboden.
Sensitisatie-experiment: het risico op het ontwikkelen van angst voor een situatie kan door voorafgaande ervaringen ook groter worden.
Experiment: ratten kregen in een bepaalde kooi 1 milde elektrische prikkel en vertonen een matige angstreactie. Maar hebben ze in een ander kooi reeks elektrische prikkels gekregen, dan vertonen ze na die ene milde elektrische prikkel toch een sterke angstreactie → matige aversieve gebeurtenis kan toch tot serieuze angstklachten leiden.
Aangeleerde hulpeloosheid: aversieve prikkel waartegen je niks kunt doen. Wanneer je wel iets kunt doen aan de prikkel, dan is dit gedrag moeilijk aan te leren. Dit mechanisme kan een rol spelen bij het ontstaan van depressie en langdurige angstklachten.
Inflatie-effect: ervaringen die mensen hebben na een aversieve conditioneringsgebeurtenis kunnen effect hebben op de mate van de angst. Bv. iemand die een lichte paniekaanval tijdens het rijden krijgt, kan een sterker rijangst ontwikkelen door heviger paniekaanvallen die pas na het rijden optraden.
Generalisatie: aangeleerde angst in een bepaalde situatie verspreidt zich ook naar andere. gerelateerde situaties.
Psychotherapie als leerproces
Extinctie en terugval
Conditionering lijkt sterk betrokken bij het leren van oorzakelijke verbanden. Klassieke conditionering → sommige prikkels kunnen de komst van andere prikkels voorspellen. Instrumentele conditionering → sommige gedrag kan tot sommige resultaten leiden. We hebben goede voorspellers nodig om ons staande te houden in de wereld.
Verrassingshypothese
Een plotselinge verandering in OP, namelijk de afwezigheid ervan, zorgt voor een verrassing. Zolang een gewenste prikkel onvoldoende voorspeld wordt door bijkomende prikkels. blijft ons leersysteem zoeken naar betere voorspellers zijn. Dit door de persoon herhaaldelijk te confronteren met geconditioneerde prikkel, terwijl de ongeconditioneerde prikkel uitblijft. De voorspellende waarde van de geconditioneerde prikkel neemt af: exposure therapie → gevolg: extinctie (uitdoving van de pathologische associatie door klassieke conditionering.
Extinctie: een extreem voorbeeld van de verrassingshypothese
Extinctieleren: leren dat een bepaalde gebeurtenis afwezig is
Acquistieleren: leren dan een bepaalde gebeurtenis aanwezig is.
→ Extinctieleren is dus het tegenovergestelde van acquisitieleren
→ Algemene wetmatigheid: gedragsverandering bij extinctie is contextafhankelijk
De effecten van extinctie zijn zelden blijvend. Waarschijnlijk komt dit doordat in therapie wel een nieuwe gezonde associatie sterk contextafhankelijk is. Daarom moet contextafhankelijkheid voorkomen worden door de exposure in verschillende omgeving te doen. De gezonde associatie generaliseert dan gemakkelijker.
Ook kan een geheugensteuntje helpen. Bv. bij extinctie telkens dezelfde armband dragen waardoor de gezonde associatie ook aan de armband gekoppeld raakt. Op kwetsbare momenten kan de armband helpen om de gezonde associatie op te roepen.
Een andere benadering is het leren tijdens de extinctie te versterken mbv de verassingshypothese. Twee VPs apart conditioneren met dezelfde OP. Tijdens de extinctie worden beide VPs aangeboden zonder OP. De afwezigheid van de OP is zo nog verrassender.
Partiële bekrachtiging
Tijdens acquisitie (aanleren van gedrag) vertraagt het extinctieproces. Men leert namelijk dat de bekrachtiging niet altijd optreedt. Geconditioneerd gedrag is duurzamer en heeft meer weerstand tegen uitdoving wanneer het minder vaak bekrachtigd is geweest. Gokverslaving is dan ook het meest hardnekkig bij wie het minst gewonnen heeft oftewel het gedrag het minst bekrachtigd is geweest: soms wel, soms niet. Bv. Kinderen iets afleren lukt het minst goed wanneer zij soms wel/ soms niet de afgesproken straf krijgen.
Spontaanherstel
De voorwaardelijke reactie treedt weer op nadat zij eerst volledig uitgedoofd was (bv. angst voor slang treedt weer op nadat deze weg was)
Ontdekt door Pavlov, bewijst dat uitdoving een voorbijgaand fenomeen is. De VP-OP associatie is nog in het geheugen aanwezig. De huidige consensus is dat extinctie nieuw leren inhoudt: de VP wordt niet gevolgd door de OP zonder dat de VP-OP- associatie verdwijnt.
Terugval
Een blijvend risico op terugval bestaat bij:
- Leren dat bepaalde prikkels het optreden van de OP (paniekaanval) verhinderen (niet naar buiten gaan). Er is sprake van vermijding.
- Leren dat de VP (naar buiten gaan) gespaard kan gaan met zowel de aan- als afwezigheid van de OP (paniekaanval). Er is sprake van veiligheidsgedrag maar leert niet om uit te gaan van zijn eigen kracht. Het effect is dus afwezig als de therapeut niet mee gaat.
Blokkeringseffect
Leren gebeurt alleen als een prikkel voorafgaat aan een verrassende gebeurtenis. Dit is afhankelijk van een voorspellingsfout.
Vb. Iemand dit steeds erg moet plassen van thee en daarna thee en bier drinkt, is niet verrast dat hij moet plassen (dat komt immers van de thee) maar blokkeert dat dit ook wel eens zou kunnen komen van het bier. Hier treedt dus geen leereffect van op.
Neurobiologie van extinctie
De amygdala is cruciaal voor angstconditionering, met verbindingen naar hippocampus en prefrontale cortex. De prefontale cortex heeft een regulerende werking over de amygdala. De amygdala wordt aangestuurd door de hippocampus voor het onthouden van complexe prikkels.
Bij extinctie geeft de hippocampus een signaal aan de prefrontale cortex die de amygdala inhibeert om een angstreactie te onderdrukken
Differential reinforcement of other behaviors (DRO)
Ongewenste instrumenteel gedrag verminderen door ander, meer gewenst gedrag te bekrachtigen. Je kunt geen twee gedragingen tegelijk vertonen zodat het ongewenst gedrag kan afnemen.
Wordt vaak gecombineerd met kort bestraffen van het ongewenste gedrag en het belonen van het gewenste gedrag. In sommige verslavingsklinieken kunnen patiënten privileges verdienen als zij clean blijven.