How to: IBM Watson Machine Learning

Artificial Intelligence, Machine Learning en Deep Learning: vorige week heb je geleerd wat de overeenkomsten en verschillen zijn. De grote vragen zijn nu natuurlijk: waar zet je het voor in en hoe gebruik je Machine Learning zelf in de praktijk? We leggen het uit in tekst én beeld.

Waar gebruik je Machine Learning voor?

Machine Learning is een onderdeel van kunstmatige intelligentie, dat zich bezighoudt met de ontwikkeling van algoritmes en technieken waarmee computers kunnen leren. Dat kan gaan over tekst, maar ook over beeld. Machine Learning omvat technieken zoals gesuperviseerd (gecontroleerd) leren en onbewaakt leren. Bij gesuperviseerd leren, leren machines resultaten te voorspellen met behulp van Data Science. Bij onbewaakt leren, leren machines resultaten te voorspellen door patronen in de invoergegevens te herkennen.

Toepassingsvormen:

  • Om ziektes te herkennen door bijvoorbeeld een moedervlek te beoordelen op verschillende eigenschappen.
  • In een zelfrijdende auto kan Machine Learning gebruikt worden om het verschil te herkennen tussen een voetganger en een fietser. En ook verkeerslichten en –borden kunnen ermee herkent worden.
  • Om te voorspellen wanneer je thuiskomt en de thermostaat weer omhoog gezet moet worden.
  • Machine Learning kan online aanbiedingen te verbeteren. Stel iemand heeft gezocht op een automerk met eigenschappen, maar de klant is nog niet overtuigd, dan zou je Machine Learning kunnen inzetten om een soortgelijke aanbieding automatisch te genereren op basis van eerder verzamelde data.
  • Om je slimme chatbot teksten nog beter te laten interpreteren.

Stap 1: zo start je

Je hebt een IBM Cloud account nodig voor je verder kunt. Heb je die al? Ga dan direct door naar het volgende kopje ‘Over Knowledge Studio’.

  • Je gaat naar de IBM Cloud
  • Je vult je gegevens in
  • Wacht op de bevestigingsmail
  • Log in en je komt direct in My IBM terecht
  • Je ziet een vakje met IBM Cloud. Klik op Launch!

Over Knowlegde Studio

De Knowlegde Studio is er om Watson services te trainen, het is een gebruikersvorm van Machine Learning. Door specifieke woorden te labelen, leert de service om de betekenis van zinnen te begrijpen.

Ter voorbeeld: “Ik zit op de bank.”
Dat zou kunnen betekenen dat ik op mijn sofa zit, maar je zou ‘bank’ ook kunnen interpreteren als de ING of Rabobank. Hoe leert het systeem nou welke betekenis er aan een woord gegeven moet worden?

Stap 2: Knowledge Studio inrichten

Ga in de IBM Catalog op zoek naar de tegel Knowledge Studio. Kies voor het Lite Plan als je wilt oefenen. Heb je meer werkruimte nodig, dan kies je een betaalde versie. Het Lite Plan kun je onbeperkt gratis gebruiken.

  • Creëer een Workspace voor je Knowledge Studio
  • In Entity Types maak je een categoriserend label aan, waar je meerdere items onder kunt scharen. Het label automerk zou dus items als Ford, Audi en Seat kunnen bevatten.
  • In Relation Types leg je vast dat verschillende Entity Types gerelateerd zijn aan elkaar. Stel dat je Entity Type automerk en Type autotype hebt aangemaakt, dan zit daar natuurlijk een verband in. In Relation Type leg je dat vast.
  • In ‘Documents’ upload je het bestand (in .csv of .zip) dat jouw website-inhoud representeert.
  • Je kunt ‘Pre-annotators’ gebruiken om bepaalde content automatisch (en dus sneller) te labelen. Bijvoorbeeld door de kennis van een woordenboek toe te voegen.
  • In ‘Documents’ vind je ook een knop met ‘Create Annotation Sets’. Hiermee kun je verschillende Annotations groeperen. Via ‘Tasks’ kun je meerdere werksets bij elkaar bundelen en aan anderen toewijzen (collega’s bijvoorbeeld)

Stap 3: Knowlegde Studio gebruiken

Om de Watson service te trainen, open je een document en label je alle woorden die onder een noemer te categoriseren zijn. In de video hieronder wordt dat het beste uitgelegd:

De service leert wat goed is en wat foute interpretaties zijn van woorden. Je traint het model op basis van goedgekeurde geannoteerde (aka gelabelde) documenten via de knop ‘Train & Evaluate’. In de statistieken zie je welke Entity Types verzadigd zijn en welke nog niet genoeg bekend zijn. Of wat de meest voorkomende Relations zijn bijvoorbeeld.

Knowlegde Studio valt of staat bij het werk van de annotator. Hoe precies worden labels opgevoerd? Ontbreken er merken? Of worden er verkeerde toegevoegd? Dat maakt of breekt het succes van jouw service.

Zelf enthousiast geworden?

Maak dan nu een gratis account aan op de IBM Cloud. Bij vragen weet je mij te vinden!

Zeen is a next generation WordPress theme. It’s powerful, beautifully designed and comes with everything you need to engage your visitors and increase conversions.