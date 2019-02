Veel bedrijven hebben een verkeerd beeld van Artificial Intelligence (AI), en Machine Learning in het bijzonder. Men schrijft bijna menselijke gaven toe aan deze algoritmes, of denkt dat meer data aan een model voeden gelijk staat aan betere inzichten. Deze brute-force benadering blijkt vaak geen enkele zin te hebben. AI benadert nog lang geen menselijke intelligentie. Er is juist veel logisch voor- en nawerk van mensen nodig om tot de juiste conclusies te komen.

Er is een soort AI-wapenwedloop gaande tussen grote techpartijen zoals Google, Microsoft en IBM. Via de cloud bieden ze zeer krachtige AI-systemen aan, die elk op bepaalde gebieden uitblinken. Denk bijvoorbeeld aan kant-en-klare beeld- en tekstherkenning of speech-to-text engines. Voor dit soort gebruiksscenario's zijn deze standaard oplossingen vaak de beste keuze. Ze bieden betaalbaar toegang tot continue innovatie en worden dagelijks getraind met een praktisch eindeloze hoeveelheid data. Daar kunnen de meeste bedrijven niet tegenop ontwikkelen. Het wordt anders als je AI wilt inzetten voor een veel specifieker gebruiksdoel. Dan werken deze standaardalgoritmes niet meer, en ze trainen met nog meer data is dan ook geen oplossing. In zo'n situatie is een belangrijke menselijke vaardigheid nodig: het vertalen van een complex samengesteld probleem naar specifieke deeltaken.

Minder efficiënt dan zoogdieren

Artificial Intelligence-algoritmen herkennen op een effectieve manier patronen in gegevens. Door ze bijvoorbeeld te trainen met grote hoeveelheden afbeeldingen kunnen ze onder andere met vrij hoge precisie mensen, objecten of tekst herkennen. Dat doen die algoritmen echter op een totaal andere manier dan mensen, waardoor de patronen die ze vinden voor ons vaak ongrijpbaar zijn. Daardoor kan het ook faliekant misgaan, zoals aangetoond met de adversarial examples van LabSix. Deze voorbeelden zetten Google's AI volledig op het verkeerde been, waardoor een houten schildpad ten onrechte wordt herkend als een geweer! Een kind daarentegen hoeft maar een paar keer een schildpad en een geweer te zien, om vervolgens nooit meer een dergelijke fout te maken. Het menselijk brein is daarmee indrukwekkend veel efficiënter dan de huidige AI-algoritmen. Wellicht doordat de mens juist minder belang hecht aan de gedetailleerde informatie die een AI zo 'in de war' kan brengen. En niet alleen de mens, maar ook andere zoogdieren, en zelfs reptielen, hebben weinig moeite met dit soort opgaven.

Het brein nabootsen

De huidige AI-modellen vinden hun werking veelal in zeer krachtige algoritmen en enorme hoeveelheden training data. Een bekend probleem daarbij is dat van 'overfitting', waarbij de algoritmen zo krachtig zijn dat ook alle ruis in de data feilloos wordt meegenomen, wat vervolgens leidt tot ongewenste voorspellingen. Een eenvoudig voorbeeld van een 'overfit' is hieronder afgebeeld, waarbij het meest krachtige algoritme (afbeelding rechts) dus niet het beste model geeft, en slechter zal presteren op nieuwe data dan de ideale fit (middelste afbeelding).

Bron: The Shape of Data

De oplossing voor het creëren van betere voorspellingen is dan ook niet om een nog krachtiger algoritme te gebruiken, of deze met nog meer data te trainen. Deze ligt juist in het eenvoudiger maken van het algoritme, indien mogelijk door het probleem in kleinere deelproblemen te splitsen. Daarbij kunnen we nog veel inspiratie ontlenen aan het echte brein.

Logisch redeneren

Dieren zoals reptielen kunnen prima overleven met de beperkte mogelijkheden van hun 'lizard brain', dat ongeveer 500 miljoen jaar geleden zijn intrede deed. Het functioneren in de menselijke wereld is echter doorspekt met denken in abstracties, logisch redeneren en natuurlijke taal. Deze vaardigheden zijn mogelijk dankzij onze neocortex, die alleen bij zoogdieren voorkomt.

Bron: Mindlab

Voor de huidige stand van AI zijn deze vaardigheden nog een brug te ver. Het razendsnel omzetten van waarneming naar talloze abstracte ideeën, dit combineren met context uit het geheugen, en vervolgens middels logisch redeneren tot conclusies komen, is dan ook voorlopig puur voorbehouden aan het menselijke intellect. Laten we dit illustreren aan de hand van een voorbeeld. Een standaard algoritme kan uitstekend auto's in afbeeldingen herkennen, maar wat gebeurt er als een verzekeraar op basis van foto's het autoschadebedrag wil inschatten? Dan zijn er ineens tal van variabelen, waaronder de verschillende typen schade, maar ook de vele manieren waarop de schade in beeld wordt gebracht. Cruciale informatie (zoals onzichtbare stalen balken achter de schade, zodat je er niet bij kan) staat direct in het hoofd van de automonteur paraat, maar een Vision AI kan dit op basis van alleen foto's nooit inschatten. Een standaard algoritme zou volledig van slag raken door de exponentiële complexiteit van zijn taak, met een instabiel proces met een hoge foutmarge als gevolg.

Logisch structureren

Om autoschade effectief te kunnen herkennen is een logisch proces nodig. De taak moet in stukjes opgehakt worden, waarmee de slagingskans stapsgewijs verbeterd wordt. Dat begint met het bepalen waar de auto zich bevindt op de foto. Hiermee kun je de niet-relevante objecten om de auto heen uitsluiten. Vervolgens wil je weten of er veel zon of schaduw is, omdat dit kan zorgen voor onder- of overbelichting en reflecties. Ook wil je weten waar de ramen van de auto zijn, omdat daar door reflectie ten onrechte schade herkend kan worden. Door al dit voorwerk wordt de informatie in een foto beter en efficiënter in kaart gebracht, waardoor in het proces uiteindelijk sneller en met een veel lagere foutmarge de daadwerkelijke autoschade kan worden herkend. Het algoritme profiteert hier dus van logisch redeneren en de context die aan een foto wordt toegevoegd, vergelijkbaar met de manier waarop een mens dat zou doen.

De menselijke factor

De moraal van dit verhaal is dat AI en machine learning specialistische tools zijn, waar geen menselijke prestaties van mogen worden verwacht. Standaard cloud-algoritmes van Google, Microsoft en IBM voldoen vaak prima voor algemene taken, maar in specifiekere gevallen is er meer nodig. Er moet een logische structuur aan het proces worden toegevoegd, waarbij het oorspronkelijke vraagstuk in verschillende, aan elkaar gekoppelde, stappen verdeeld wordt.

Door middel van logisch redeneren wordt het vraagstuk na elke stap minder complex. Dit verlaagt de kans op fouten. Bovendien is het mogelijk om bij elke stap verschillende gespecialiseerde algoritmes te gebruiken, waaronder die van de bekende techreuzen. Dit organiserende werk bovenop AI blijkt in de praktijk zeer effectief, waarbij de resultaten heel nadrukkelijk te danken zijn aan mensenwerk. In die zin hoeven we ons voorlopig nog geen zorgen te maken dat AI's menselijke intelligentie benaderen en massaal ons werk overnemen.