Teigiami žmonės geriau mokosi iš teigiamos patirties negu neigiami • Aleksandras Markovas • Mokslo naujienos "Elementai" • Psichologija, neurobiologija

Paaugliai iš pozityviosios patirties geriau mokosi nei neigiami.

Pav. 1. Eksperimento planas. A – pasirinkimai B – įvykių seka vieno mokymosi metu. Tema buvo rodoma atsitiktine tvarka iš keturių abstrakčių simbolių porų, iš kurių reikėjo pasirinkti vieną. Kiekviena pora buvo rodoma iš viso 20 kartų, atsitiktinai pakeičiant simbolių padėtį ekrane. Kiekviena ženklų pora atitiko vieną iš keturių "kontekstų" mokymo. Pirmajame (atlygis / dalinis) atveju vienas iš simbolių atnešė žaidėjui 1 tašką su tikimybe 75%, o kita – tikimybe 25%; priėmęs sprendimą, subjektas gavo informaciją apie jo laimėjimus, bet ne apie tai, ką jis būtų gavęs pasirinkęs kitą simbolį (B, viršutinė eilutė vaizdai). Antrame (atlygis / užpildytas) atvejis viskas buvo tas pats, išskyrus tai, kad subjektas taip pat buvo informuotas apie tai, koks būtų rezultatas, jei būtų priimtas alternatyvus sprendimas (B, apatinė eilutė) Trečiame ir ketvirtajame kontekstuose vietoj atlygio buvo naudojamas bausmė: "teisingu" pasirinkimu objektas prarado 1 tašką su tikimybe 25%, o "neteisingas" pasirinkimas – su tikimybe 75%. Paveikslėlis iš aptariamo straipsnioPLoS skaičiavimo biologija

Yra žinoma, kad paaugliai greičiausiai priims rizikingus sprendimus nei suaugusieji.Remiantis viena hipoteze, tai gali būti dėl to, kad paaugliams naudojami kiti (paprastesni) algoritmai informacijos apdorojimui apie jų veiksmų rezultatus. Britanijos ir italų psichologų ir neuroekonomistų atliktas eksperimentas patvirtino šią hipotezę. Paaiškėjo, kad paaugliai nėra blogesni, nei suaugusieji mokosi iš teigiamos patirties, tačiau jie yra gerokai atpalaiduojantys jų gebėjimo mokytis iš neigiamo. Be to, suaugusieji efektyviai naudoja turimą informaciją apie tai, koks rezultatas būtų alternatyvus sprendimas, o paaugliams atsižvelgiama tik į tikrus jų veiksmų rezultatus. Galbūt šie skirtumai atsiranda dėl to, kad smegenų regionai, atsakingi už mokymąsi iš teigiamos patirties, brendžiasi anksčiau nei tie, kurie teikia sudėtingesnius mokymosi algoritmus.

Neurologijos požiūriu, mokymasis iš teigiamos ir neigiamos patirties yra visiškai kitoks. Pirmajame "emociniame" podkortinėse struktūrose (pvz., Branduolio akumbenose) vaidina pagrindinį vaidmenį, o pastaroji nėra visiškai užbaigta be sąveikos su sąmoningai kontroliuojamomis korticalo sekcijomis (priekinės smegenų žievės, salelių ir dorsolateralinės sritys, taip pat rostralinės kūgio kampo dalies).

Žvelgiant į algoritmus, kuriais grindžiamas mokymas, vaizdas yra panašus: lengviau mokytis iš teigiamos patirties. Paprasčiausias mokymosi algoritmas su sustiprinimu – vadinamasis Q-learning (Q-learning) – įvertina sprendimų, priimamų pagal vieną skalę, rezultatą, priklausomai nuo palankių rezultatų. Šis algoritmas nereikalauja situacijos supratimo: jį naudoti nereikia sukurti realybės modelio ir atsižvelgti į kontekstą, kuriame sprendimas priimamas. Dėl savo paprastumo šis algoritmas suteikia mokymąsi iš teigiamos patirties efektyviau nei iš neigiamo. Jis negali "suvokti", kad vienoje situacijoje norint gauti nulinius taškus taip pat gerai, kaip kitoje situacijoje, norint gauti vieną tašką (pavyzdžiui, jei pirmojo atvejo taškų nuostoliai yra alternatyva, o antrasis – nulis taškų) . Rezultatas vertinamas absoliučiu mastu, kurio vienetas visada yra geresnis už nulį, todėl sprendimai, kurie suteikia tašką, yra daug patikimesni nei sprendimai, leidžiantys jums neprarasti taško.

Norint efektyviai išmokti išvengti bėdų, mums reikia sudėtingesnių sąnaudų. Čia jau pageidautina suprasti užduoties kontekstą ir įvertinti gautą rezultatą ne "apskritai", bet dėl ​​tokas atsitiks šioje konkrečioje situacijoje, jei bus priimtas alternatyvus sprendimas.

Žurnale paskelbta britų ir italų psichologų ir neuroekonomistų grupė PLoS skaičiavimo biologija nuoširdaus eksperimento, kuriame vaikai ir suaugusieji supranta mokymosi mechanizmus, rezultatai. Autorių išbandyta hipotezė buvo ta, kad paauglių polinkis imtis rizikingo elgesio paaiškinama vėlesniu tų smegenų dalių, kurios reikalingos sudėtingiems mokymosi algoritmams, plėtrai, todėl paauglys dažniausiai remiasi labiau primityvu, bet ankstyvuoju formavimo algoritmu, artima Q – mokymasis.

Eksperimente dalyvavo 18 paauglių (kurie buvo laikomi 12-17 metų asmenimis) ir 20 suaugusių (nuo 18 iki 32 metų amžiaus). Eksperimento schema parodyta 1 paveiksle. Kiekvienam dalyviui buvo parodyta pora simbolių, iš kurių viena turėjo pasirinkti vieną. Buvo tik 8 simboliai ir poros – atitinkamai 4. Kiekvienoje poroje vienas simbolis atnešė sėkmę su tikimybe 75%, o kita – 25% tikimybe. Kiekviena simbolių pora atitiko vieną iš keturių "kontekstų", kurie skiriasi pagal sustiprinimo pobūdį (atlygį ar bausmę) ir papildomos informacijos apie tai, kokį rezultatą galėtų sukelti alternatyvus pasirinkimas.Mokymo efektyvumas buvo įvertintas dažnumu, kuriuo po mokymų dalyviai pasirinko "teisingus" simbolius.

Rezultatai patvirtino tyrėjų lūkesčius. Suaugusiųjų dalyviai parodė tokį patį mokymosi teigiamą ir neigiamą patirtį. Po mokymo jie savanoriškai pageidavo simbolio, kuris atnešė vieną tašką, simbolį, kuris su juo susiejė nulinius taškus, ir taip pat patikimai parinko simbolį, kuris atnešė nulinius taškus, jei buvo simbolis, kuris kartu su juo užfiksuotų tašką. Paauglių mokymosi rezultatai šiose situacijose buvo skirtingi. Pirmuoju atveju, kai buvo pasirinkta nuo 1 iki 0, paauglys išmoko teisingą pasirinkimą padaryti ne blogiau nei suaugusieji, o antroje, kai reikėjo pasirinkti nuo 0 iki -1, paauglių mokymosi efektyvumas buvo žymiai mažesnis.

Be to, suaugusieji pasinaudojo papildoma informacija apie alternatyvaus sprendimo rezultatą: papildomoje informacijoje pateiktuose variantuose mokymas buvo sėkmingesnis. Paaugliai negalėjo naudotis šia informacija: jų mokymų efektyvumas pasirodė esąs tas pats variantų, kurių pilna ir neišsami informacija (2 pav.).

Pav. 2 Padidėjęs "teisingų" sprendimų dažnumas treniruočių metu. Išilgai horizontalios ašies – bandymo serijos numeris (nuo 1 iki 20, nes kiekviena simbolių pora buvo rodoma 20 kartų). Vertikali ašis – teisingų sprendimų dalis. Kairėje paaugliai (paaugliai), dešinėje Suaugusiesiems. Įvairios spalvos nurodomi keturi "kontekstai"; spalvų pavadinimai yra tokie patys, kaip fig. 1 (žalia: teigiamas sustiprinimas, nebaigta informacija; ruda: neigiama armatūra, neišsami informacija; mėlyna žalia: teigiamas sustiprinimas, visa informacija; raudona: neigiamas sutvirtinimas, išsami informacija). Kietos linijos su tamsesnėmis vietomis – eksperimentiniai duomenys – standartinė klaida; linijos su pasikliautiniais intervalais – modeliavimo rezultatai. Norint imti paauglių mokymą, buvo naudojamas paprastas 1 modelis (žr. 3 pav.), Suaugusiems tai buvo sudėtingesnis modelis 3. Aptariamo straipsnio skaičius PLoS skaičiavimo biologija

Autoriai bandė interpretuoti rezultatus, gautus pagal idėjas apie mokymosi algoritmus. Norėdami tai padaryti, jie sukūrė tris kompiuterinius modelius (3 pav.). Pirmasis modelis atitinka paprastą Q-learning. Antrame taip pat gali būti atsižvelgiama į papildomą informaciją apie alternatyvių (neišrinktų) sprendimų rezultatus, siekiant paaiškinti idėjas apie šio sprendimo "vertę".Trečiasis modelis, be pirmųjų dviejų galimybių, naudoja abiejų sprendimų rezultatų duomenis, kad gautų naudą atitinkamame kontekste. Ši procedūra leidžia algoritmui "suprasti", kad susidūrus su nuliniais taškais situacijoje, kai jums gresia tam tikras nuostolis, tokia pat ta pati kaip ir 1 taškas, kai alternatyva gali būti nulinis taškas.

Pav. 3 Trys mokymosi modeliai, su kuriais buvo lyginami rezultatai. Modeliai susideda iš trijų modulių. Pirmasis iš jų (faktinis modulis) atitinka paprastą mokymosi algoritmą su sustiprinimu – Q-learning. Jis keičia Q reikšmę (s, c) – pasirinkto sprendimo "vertė" arba "sėkmė" c situacijoje s – priklausomai nuo gauto rezultato R (c) Antrasis modulis (Counterfactual modulis) naudoja duomenis apie alternatyviojo (neišrinkto) sprendimo rezultatus. tu siekiant išaiškinti Q (s, tu) Trečiame modulyje (kontekstinio modulio) naudojami duomenys apie abu sprendimų rezultatus (c) ir nepasirinkta (tu), kad gautą naudą gautų tinkamame kontekste, susiejant ją su tuo, kas iš esmės galėtų būti pasiekta šioje situacijoje s (V (s) – vidutinė konteksto vertė arba vidutinė sprendimų vertė c ir tu)Trečiojo modulio naudojimas pakeičia absoliutų santykinio pelno įvertinimo skalę. Iš šių trijų modulių buvo pagaminti trys modeliai. Pirmasis modelis apima tik modulį 1, antrąjį modulį 1 ir 2, trečią – visus tris modulius. Paveikslėlis iš aptariamo straipsnio PLoS skaičiavimo biologija

Šie trys modeliai atliko tokį patį "mokymo" seansą kaip gyvi eksperimento dalyviai. Paaiškėjo, kad paauglių mokymo kursą ir galutinį rezultatą tiksliausiai apibūdina paprasčiausias pirmasis modelis (Q-learning). Kalbant apie suaugusiuosius, jų mokymai tiksliausiai atkuriami pagal sudėtingiausią 3 modelį.

Taigi gauti rezultatai atitinka prielaidą, kad paauglys naudoja paprasčiausią sustiprinimo mokymosi algoritmą, kuris yra artimas Q-learning. Tai paaiškina, kodėl paaugliai blogiau mokosi iš neigiamo sustiprinimo, nei iš teigiamo sustiprinimo. Suaugę vartotojai naudoja sudėtingesnį mokymosi algoritmą, kuris apima papildomus modulius. Tai leidžia, pirma, naudoti papildomą informaciją apie pasirinkto sprendimo vertę ir, antra, interpretuoti gaunamą naudą tinkamoje aplinkoje, vertinant ją ne "apskritai", bet atsižvelgiant į tai, kas iš esmės gali būti gauta šioje situacijoje.Dėl to suaugusieji mokosi iš neigiamos patirties taip pat efektyviai, kaip ir teigiami.

Supaprastintas mokymosi algoritmas, būdingas paaugliams, atitinka duomenis apie vėlesnį smegenų regionų brendimą, būtiną sudėtingesnių ir efektyvesnių algoritmų įgyvendinimui. Kita vertus, šis paprastas algoritmas, kurį naudoja vaikai ir paaugliai, gali turėti svarbią prisitaikančią reikšmę. Viena jaunoji mama labai tiksliai komentavo straipsnį, kurį mano dienoraštyje aptaria, pažymėdamas, kad jei jos vaikas nedelsdamas sustotųsi visko, ką jis įžengė į kumščius, jis netgi net negalėtų mokytis vaikščioti.

Šaltinis: Stefano Palminteri, Emma J. Kilford, Giorgio Coricelli, Sarah-Jayne Blakemore. Kompiuterizuoto ugdymo ugdymas paauglystėje // PLoS skaičiavimo biologija. V. 12. P. e1004953.

Taip pat žiūrėkite:
1) Tendencija priklausomybei ir azartiniams žaidimams yra susijusi su nesugebėjimu mokytis iš jų klaidų, "Elements", 2007.12.10.
2) Dopamino neuronai reikalingi muses, kad išmoktų iš klaidų, "Elements", 2012.09.09.
3) "Apdovanojimo sistemoje" rasta neuronų, kurie jaudina gerą išmintį, "Elements", 2012/02/10.
4) Mutantinės pelės nėra priklausomos, "Elements", 2008/05/26.

Aleksandras Markovas


Like this post? Please share to your friends:
Parašykite komentarą

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: