Én ezt csináltam meg számítógépre jelenleg. Csak sokkal összetettebb műveletsort kell végeznie a mesterséges lénynek. Ez már működik tökéletesen.
http://www.helemf.freeweb.hu/
"A megerõsítéselmélet a 20. század elsõ felének kondicionálással kapcsolatos felfedezésein alapul. Pavlov kezdett el az emberi és állati viselkedés objektív vizsgálatával és manipulálásával foglalkozni. A késõbbiekben Skinner kifejlesztette az operáns kondicionálás néven ismertté vált eljárást, melyben a véletlenszerû választ vette alapul a komplex viselkedések betanításához. Kísérletében egy éhes állatot (például galambot) helyezett egy dobozba, melynek belseje teljesen csupasz, kivéve egy kiálló pedált, mely alatt egy etetõtál van. A pedál felett egy kis fény kapcsolható be a kísérletvezetõ által. Egyedül hagyva a dobozban, a galamb körbejár, kémlel. Esetleg megnézi a pedált és megnyomja. A pedálnyomás gyakoriságának alapszintje a kezdeti pedálnyomási gyakoriság. Miután megállapította az alapszintet, a kísérletvezetõ bekapcsolta a dobozon kívül elhelyezet ételadagolót. Ettõl kezdve ahányszor csak a galamb megnyomta a pedált, egy kis ételgalacsin hullt a tálba.
A galamb megette az ételt, majd hamarosan ismét megnyomta a pedált; az étel megerõsítette a pedálnyomást, és a nyomkodás gyakorisága drámaian megnõtt."
Mostanában ezt fejlesztem úgy, hogy sok neuronhálós többszintű modell legyen, amiben a motiváció nem a táplálék, hanem a magasabb "érdekességi ráta" elérése.