Een AI bot die zichzelf leert lopen, zónder dataset en/of visuele voorbeelden: dat is Albert. En hoe zoiets gaat, dat zie je in deze leuke video.
In de video, die sinds twee weken op YouTube staat, zie je Albert. Albert is een AI robot die leert om te lopen. Dat doet ‘ie door uit vijf kamers, een soort ‘escaperooms’, te komen. Maar er is iets bijzonders aan dit proces. In de meeste gevallen leert een AI robot lopen met behulp van een dataset en/of beelden van iemand die loopt. In dit geval heeft de maker van Albert, waarvan de naam mij trouwens niet bekend is, ervoor gekozen om het helemaal van scratch af aan te programmeren.
Deep Reinforcement Learning
Albert en de ‘leeromgeving’ is gemaakt door middel van Deep Reinforcement Learning, een methode van Machine Learning waarbij Albert wordt beloond voor het correct uitvoeren van acties en gestraft wordt voor het verkeerd uitvoeren ervan. Voor elke poging die Albert onderneemt, wordt een score berekend voor hoe ‘goed’ het was en worden kleine, berekende aanpassingen gemaakt aan zijn brein om gedragingen te stimuleren die leiden tot een hogere score.
Albert wordt aangestuurd door een kunstmatig brein (neuraal netwerk) dat uit vijf lagen bestaat. De eerste laag bestaat uit de inputs (de informatie die hij krijgt voordat hij actie onderneemt, zoals de positie en snelheid van zijn ledematen) en de laatste laag vertelt hem welke acties hij moet uitvoeren. In de middelste drie lagen worden de berekeningen uitgevoerd om de inputs om te zetten in acties. Na elke poging die Albert doet wordt het dus bijgewerkt.
Go, AI Albert, go!
Zo leert Albert uiteindelijk te lopen, obstakels en uitdagingen te overwinnen en te draaien. Bekijk de video vooral, want het is een grappig en bijzonder proces om te zien!
Lees ook: