Reinforcement Learning (RL) jutalmak és büntetések rendszerében részesül. A megerősített tanulás szélesebb körű, mint a megfigyelt vagy felügyelet nélküli tanulás, hogy elérjünk egy célt, vagy csak nyerjünk a környezeti érintkezésből származó ösztönzőkből és büntetésekből.
Milyen típusú jutalmakban és büntetésekben adnak visszajelzést?
Az első az értékelő visszacsatolás megerősítésként, ahol jutalmakat és büntetéseket használnak a tanulók viselkedésének formálására a megerősítő tanulási mechanizmusokon keresztül.
Melyek a jutalom és büntetés típusai?
Most vegyük össze ezt a négy kifejezést: pozitív megerősítés, negatív megerősítés, pozitív büntetés és negatív büntetés (1. táblázat). Valami hozzáadódik, hogy növelje a viselkedés valószínűségét. Valami hozzáadódik, hogy csökkentse a viselkedés valószínűségét.
Milyen típusú tanulás alapszik a jutalom és büntetés megközelítésén?
Implicit módon, tudatos feldolgozás nélkül, az egyének megismerik az egyes összefüggések és tevékenységek jutalmazási és büntetési értékét. Ezek az asszociatív tanulási folyamatok viszont befolyásolják annak valószínűségét, hogy az egyének újra bekapcsolódnak az ilyen tevékenységekbe, vagy megkeresik azt a kontextust.
Hogyan befolyásolja a jutalmazás és a büntetés a tanulást?
Összességében azt láttuk, hogy a jutalmazásnak csekély hatása van sem a tanulásra, sem a megtartásra. A büntetés nem volt hatással a képességek megtartására, de jelentős,feladatfüggő hatások a tanulásra. Az SRTT büntetésben javított sebesség minimális hatással a pontosságra. Ezzel szemben a büntetés rontotta az FTT teljesítését.