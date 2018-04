Natural language processing (NLP), oftewel de vaardigheid van een computerprogramma om de menselijke taal te begrijpen, krijgt steeds meer aandacht, vooral in relatie met zijn grote rol in de doorlopende ontwikkeling van nog geavanceerde kunstmatige intelligentie, ofwel AI.

Dat heeft een reden: historisch gezien is de menselijke taal een bijna onoverkoombare hindernis voor computers. Maar de ontwikkelingen in NLP veranderen dat, hoewel er meningsverschillen zijn in welke mate dat is. Computers zijn nog nooit zo ver geweest in het effectief begrijpen en om te gaan met de menselijke taal als nu.

Waartoe dit uiteindelijk zal leiden zijn computers die in staat zijn niet alleen gestructureerde data in de vorm van programmeertaal te begrijpen, maar ook data te begrijpen in de vorm van menselijke taal - zowel gestructureerd als ongestructureerd. Het is juist deze impact op AI die het meest revolutionair is.

Het data-informatie-kennis-wijsheid-model

De betekenis van het huidige ontwikkelingen in NLP - vooral in relatie met ongestructureerde data - wordt duidelijk in het licht van het DIKW-model, dat ik in een eerder artikel heb behandeld. Het model laat onder meer zien hoe data en informatie leidt tot kennis, en hoe kennis (als het goed wordt behandeld) leidt tot organisatorische wijsheid.

Wat ik aardig vind aan het model is dat het tevens de belangrijkste relaties en fenomenen visualiseert, waaronder een specifiek fenomeen wat ik het 'kennisfalen' noem. Dat zijn missers in het efficiënt en effectief managen van kennis om zo tot organisatorische wijsheid te komen.

Overproductie van kennis is kennisfalen

'Kennisoverproductie', een van die soorten missers, wordt gedefinieerd als "de ontwikkeling van meer kennis dan nodig is om de optimaal de organisatorische wijsheid te maximaliseren". Gerelateerd hieraan is dat de uitdaging voor elke organisatie niet ligt in het altijd meer moeten weten, maar in het genoeg moeten weten.

Dat is vanwege de nadelen van meer kennisproductie dan nodig is. Ik heb eerder uitgelegd wat de nadelen van die overproductie is: meest in het oog springend is de verspilde moeite in het verklaren van zaken (ik ben fan van de visuele referentie die David Shenk hierover heeft gemaakt, 'data smog'). Maar tevens in de verspilde moeite die is gedaan in het ontwikkelen van kennis, in het delen, verwerken en management van data en informatie, want van daar uit wordt immers die kennis ontwikkeld.

Maar met de huidige ontwikkelingen in NLP is de manier waarop kennisoverproductie tot kennisfalen leidt aan het veranderen.

Kennisoverproductie en NLP

Het te verwachten vermogen van computerprogramma's om niet alleen programmeertalen maar ook de menselijke taal te begrijpen geeft kennismanagement een fundamentele kwalitatieve duw in de rug. De overweldigende aantallen data en informatie in de wereld valt immers in het spectrum van menselijke taal. En daar ligt het grote potentieel van NLP.

Vergis je niet. Computing heeft al krachtige mogelijkheden gegeven in kennismanagement. Dat is vooral zo op het fundamentele niveau van computing zelf. Maar van oudsher wordt het effectief en efficiënt managen van kennis beperkt door de individuele mens in dat spel. Maar de mate waarop dat krachtenspel verschuift door NLP is enorm.

Wat NLP mogelijk maakt is het effectief en efficiënt managen van ongeordende data en informatie, ver voorbij hetgeen mogelijk is door de mens. En dat zou voor elk doeleinde vrijwel zonder moeite gaan.

Kennisoverproductie: een kans

Wat gebeurt er als een niet-menselijke entiteit de menselijke taal voldoende begrijpt om efficiënt, effectief en haast zonder moeite onbegrensde kennis te managen?

Een andere blik op het maximaliseren van het transformatieproces kennis>wijsheid is niet te kijken naar kennisfalen maar naar kenniskansen. In tegenstelling tot kennisfalen zijn dit kansen om meer efficiënt en effectief kennis te managen om organisatorische wijsheid te creëren. Met zijn vermogen om ongestructureerde data te managen op potentieel ongelimiteerde schaal draagt NLP (naast secundaire factoren als digitalisatie en big data) bij tot de grootste kenniskans van deze generatie.

Als een professional in de zorg geef ik een voorbeeld van de interactie met ongestructureerde data in die zin dat specialisten klinische documenten op regelmatige basis nalopen. Vaak is dat ongestructureerde data en een mens bekijkt het met een bepaald afgekaderd doel. En dat gebeurt niet alleen in ziekenhuizen, maar ook in apotheken en andere zorginstellingen. Wat als een dergelijke organisatie razendsnel zijn vinger op de pols van opeengestapelde en samengevoegde data kan leggen en tot in de kleinste detail richting kan vinden naar hoe de patiënt zich op de langere termijn zal ontwikkelen? En dat is nog maar een klein deel van de markt.

Denk je eens aan al die data in het huidige tijdperk van big data: e-mails, rapporten, publicaties, tekstbestanden...de lijst is eindeloos omdat technologie meedogenloos de grenzen verlegt in het produceren, opslaan en delen van kennis. En zie dat dan gebeuren in alle marktsegmenten - financiële sector, energiesector, informatietechnologie, sociale diensten..overal en met enorme kosten in de productie en verfijning. En natuurlijk in het gebruik en analyse.

Denk dan aan AI, met natural language understanding (NPU), die radicaal de grondslagen van de mogelijkheden en de kostenstructuur van het doorlichten van ongestructureerde data verandert. NLP heeft het vermogen om de manier waarop wij kennis tot organisatorische wijsheid radicaal te veranderen. Uiteindelijk kan NLP ons alle menselijke taal in alle digitale systemen opleveren, met vrijwel moeiteloze kennismanagement.