Deze tekst is een bewerking van het artikel op Emerce door Stefan van Duin Carmen Wolvius en Sjors Broersen
In dit derde hoofdstuk van de serie over kunstmatige intelligentie (artificial intelligence of AI) lichten we vijf toepassingen van AI nader toe, namelijk beeldherkenning, spraakherkenning, automatische vertaling, Q&A (vraag & antwoord) en games.
De toegenomen nauwkeurigheid, beschikbaarheid en het gemak waarmee methodes van kunstmatige intelligentie geïmplementeerd kunnen worden, creëren mogelijkheden voor bedrijven om deze methodes toe te passen in hun bedrijf. Verzekeringsmaatschappijen kunnen AI bijvoorbeeld gebruiken om claims van hun klanten te lezen, begrijpen of de claim moeilijk of eenvoudig is en suggesties ontvangen over de manier waarop de claim afgehandeld kan worden. De werknemer hoeft deze suggestie dan alleen nog maar te controleren voordat deze in werking gesteld kan worden. Hierdoor kunnen bedrijven veel tijd besparen en de kwaliteit van het werk verhogen.
Dit is slechts één voorbeeld. In de rest van dit artikel zullen we vijf toepassingen bespreken die in de komende jaren grote ontwikkelingen zullen doormaken:
Deze ontwikkelingen zullen toepassingen goedkoper en nauwkeuriger maken, waardoor de drempel voor bedrijven om deze toepassingen te gebruiken kleiner wordt.
Het herkennen van beelden is voor de meesten van ons een eenvoudige taak. We hebben er geen moeite mee om een auto van een tijger te onderscheiden of dat een auto nog steeds een auto is als je hem bekijkt vanuit een ander perspectief. Deze vaardigheid is een stuk moeilijker voor computers, maar recente ontwikkelingen op het gebied van nauwkeurigheid in beeldherkenning hebben geleid tot interessante toepassingen. Omdat verschillende leveranciers zoals Google en IBM hun voorgeprogrammeerde algoritmen als open source aanbieden en softwarebibliotheken zoals Tensorflow het mogelijk maken om eigen algoritmes te maken, is visuele herkenning een stuk toegankelijker geworden. (Iets voor een PWS!)
Voorbeelden van toepassingen van beeldherkenning zijn het herkennen van ziekten uit MRI-beelden, microscopische beelden en gezichtsherkenningssoftware waar beveiligingscamera’s van gebruikmaken. Dergelijke toepassingen gebruiken beeldherkenning al dagelijks. Ieder dag komen er weer toepassingen bij. IBM Watson, het AI platform dat het spel Jeopardy won van mensen, is daar ondermeer actief in.
IBM Research heeft gewerkt aan deep learning technieken voor computervisie die gebruikt kunnen worden om huidziekten zoals melanoom te herkennen. IBM Watson creëerde een geheel aan methodes die huidlaesies kunnen segmenteren en heeft tevens methodes ontwikkeld die het gebied en het omringende weefsel kunnen detecteren op melanoom. Deze methodes testten ze op een grote dataset die publiekelijk toegankelijk is en waarvan de bevindingen worden besproken in dit artikel. De visie van IBM is dat op een bepaald punt medisch personeel een afbeelding van huidafwijkingen naar Watson kan sturen zoals ook bloedmonsters naar het laboratorium worden verstuurd.
Beeldherkenning kennen we hoofdzakelijk van beveiligingscamera’s, maar deze toepassing wordt ook ontwikkeld op andere gebieden. Een enquête uit 2015 die werd afgenomen door Computer Services Corporation onder 150 leidinggevenden in de detailhandel in het Verenigd Koninkrijk, suggereert dat 25% van alle Britse winkels gezichtsherkenningssoftware gebruikt. Deze software wordt gebruikt voor beveiliging, maar ook om klanten te volgen. Zo kan men het effect van productdisplays op het gedrag van klanten observeren of kijken naar de stroom van klanten in de winkel. Dit is een bekend concept in webshops waar A/B-testen worden gebruikt om te zien welke websitedisplays de meeste winst opleveren. Dit voorbeeld suggereert echter dat gezichtsherkenning gebruikt kan worden om deze testen rechtstreeks in een winkel uit te voeren.
Verschillende softwareontwikkelingsbedrijven bieden gezichtsherkenningssoftware aan detailhandelaren aan (enkele voorbeelden zijn ScienceSoft en FaceFirst). Deze bedrijven passen specifieke algoritmen toe die gezichtsherkenningspunten gebruiken om gezichten te herkennen en onderscheiden. Deze algoritmen kunnen worden opgeslagen en op een later tijdstip aan elkaar worden gekoppeld om de klantervaring te verbeteren en een persoonlijke service aan te bieden.
Spraakherkenning is een toepassing van AI die spraak herkent en gesproken woorden in getypte tekst kan omzetten. Deze techniek wordt bijna nooit individueel gebruikt, maar hoofdzakelijk als toevoeging aan chatbots, virtuele agenten en mobiele toepassingen. Bekende voorbeelden zijn Siri van Apple, Google Home en Alexa van Amazon. De beginselen van spraakherkenning vonden al in 1952 plaats met ‘Audrey’. Audrey kon cijfers herkennen die door één stem werden uitgesproken. Dit is erg indrukwekkend als je bedenkt waar computers toentertijd toe in staat waren. Vandaag de dag hebben we toepassingen op onze telefoon en in onze auto die kunnen reageren op onze stem.
Niet alleen de hoeveelheid toepassingen met spraakherkenningsvermogen is gestegen, ook de nauwkeurigheid van het omzetten van gesproken tekst naar geschreven tekst is de laatste jaren significant verbeterd volgens het KPCB.
Een van de zakelijke toepassingen waar veel vooruitgang is geboekt, is het gebruik van spraakherkenning in de gezondheidszorg. Veel artsen werken met een elektronisch patiëntendossier (EPD) om patiëntinformatie vast te leggen, hoewel men zegt dat dit consulten vertraagt en de patiënt beperkt wordt in het doen van zijn of haar verhaal. Door gebruik te maken van spraakherkenning kan patiëntdocumentatie worden vastgelegd op een flexibele en snelle manier, zodat de arts meer tijd kan besteden aan de patiënt. Deze oplossing wordt al aangeboden door verschillende leveranciers zoals Nuance en M*Modal.
De snelle verbeteringen die worden doorgevoerd bij spraakherkenning bieden veel mogelijkheden voor de nabije toekomst. Dat al onze software en hardware wordt uitgerust met spraakherkenning kan misschien al sneller gebeuren dan vele mensen denken.
Automatische vertaling is een ander onderwerp dat grote zakelijke gevolgen heeft. Dit onderwerp kan worden gedefinieerd als het proces waarbij tekst in de ene taal door middel van software wordt omgezet naar een andere taal. Traditioneel gezien werden teksten vertaald door elk woord te vervangen met het best mogelijke equivalent in de andere taal. Deze methode werkt redelijk goed voor losse woorden, maar dit proces is al moeilijker te handhaven voor een groep woorden of zinnen, omdat de relaties tussen woorden belangrijk zijn voor de betekenis van een zin. Deze nuances kunnen niet worden vastgelegd wanneer elk woord afzonderlijk wordt geanalyseerd.
Deep learning heeft een grote impact gehad op de kwaliteit van machinevertalingen door het paradigma volledig te verschuiven. In plaats van te werken met regelgebaseerde methodes die aangestuurd worden door menselijke beslissingen, zijn vertalingen die tot stand komen door middel van een neuraal netwerk grotendeels gebaseerd op wiskunde. Bij relatieve algemene teksten komen GNMT-systemen (Google Neural Machine Translation) in de buurt van de kwaliteit van menselijke vertalingen. Een experiment liet zelfs zien dat wanneer je een tekst vertaalt van het Engels naar het Koreaans en vervolgens van het Engels naar het Japans, het model ook redelijkerwijs in staat is om van het Koreaans naar het Japans te vertalen zonder dat er een training aan voorafging die aandacht schonk aan het formele verband tussen de twee talen. Eén artikel stelde zelfs de volgende vraag: “hebben computers hun eigen interne taal uitgevonden?”
De impact van kwaliteitsvertalingen in een globale economie zijn enorm. Voorheen werden zakelijke vertalingen voornamelijk gedaan in Europese talen, maar er is een groeiende vraag naar Chinese, Japanse en Koreaanse vertalers. Een eenvoudig voorbeeld hiervan is Uber die onderzocht of automatische vertaling plaats kon vinden tussen een toerist die gebruik wilt maken van de Uber-diensten in zijn vakantieland en de Uber-chauffeur die alleen in zijn eigen taal kan communiceren.
Q&A-agenten of chatbots zijn een ander voorbeeld waarbij AI wordt toegepast op taal. Wanneer er wordt gesproken over de mogelijkheid van het voeren van gesprekken, wordt er onderscheid gemaakt in het domein en de manier waarop een antwoord van de agent wordt gegenereerd. Een chatbot kan gericht zijn op het beantwoorden van vragen in een open of gesloten domein. Wanneer een chatbot werkzaam is in een open domein is het in staat om algemene vragen te beantwoorden die over elk soort onderwerp kunnen gaan (bijvoorbeeld cleverbot. Zie ook de de inleiding ). Dit is over het algemeen moeilijker dan een gesloten domein dat zich richt op een beperkt aantal onderwerpen. Gesloten domeinen zijn echter uitermate geschikt als zakelijke toepassing, zoals het beantwoorden van vragen bij helpdesks. Een aantal jaren geleden vond er een doorbraak plaats in de interesse van vraag-antwoordsystemen toen IBM Watson menselijke tegenstanders versloeg in het spel Jeopardy, een bekend Amerikaans quizprogramma. Google was verantwoordelijk voor een andere, meer recente doorbraak toen zij erin slaagden chatbots een korttermijngeheugen te geven. Hierdoor kunnen chatbots gesprekken uit het echte leven realistischer nabootsen, door het verband te leggen met iets dat een paar zinnen eerder is gezegd.
Het vermogen van machines om de intentie (of het doel) van een vraag te herkennen en deze te beantwoorden op verschillende manieren, is iets wat we vaker zien in vele zakelijke toepassingen. Nadat de intentie is afgeleid uit het bevel van de gebruiker wordt het gekoppeld aan een specifieke vervolgactie. Deze actie kan variëren van het stellen van een vervolgvraag tot het verzamelen van informatie op het internet. Op het gebied van klantenservice worden chatbots al snel de norm. Een voorbeeld hiervan is Amelia van IPsoft. Standaard zoekopdrachten worden al automatisch afgehandeld, terwijl de moeilijkere opdrachten doorgestuurd worden naar mensen. Vraag-antwoordsystemen hebben ook al hun intrede gedaan op rechtsgebied. Advocaten kunnen vragen over juridische zaken in natuurlijke taal stellen aan een intelligente assistent. De assistent kan deze vragen vervolgens beantwoorden door de juiste passage over te nemen uit kwalitatief hoogstaande juridische documentatie
Een van de meest spannende toepassingen van AI vindt plaats in het spelen van games. Om een spel goed te kunnen spelen, moet je niet alleen weten wat de regels zijn, maar ook rekening houden met de stappen die je tegenstander kan zetten. Tot slot moet je een zorgvuldige beslissing nemen welke zet je de hoogste kans geeft om te winnen. Als computers spellen net zo goed kunnen spelen als mensen, zijn er geen redenen om aan te nemen dat zij geen andere moeilijke vaardigheden kunnen leren die mensen uitvoeren tijdens hun dagelijkse werkzaamheden.
Onlangs werd er een belangrijke stap voorwaarts gezet op het gebied van games toen de wereldkampioen Go voor het eerst verslagen werd door een computer. Go is een spel dat niet door middel van brute force berekend kan worden, aangezien het aantal mogelijke zetten hoger is dan het aantal sterren in het universum. De beste Go-spelers ter wereld vertrouwen voor een groot deel op hun intuïtie bij het maken van hun beste zetten. AlphaGo van Google (Go-software gebaseerd op een neuraal netwerk) heeft echter geleerd hoe het als een van de beste menselijke spelers moet spelen door miljoenen menselijke spellen te bestuderen. Het werd vervolgens zelfs nog sterker door miljoenen keren tegen een andere versie van zichzelf te spelen, waardoor het uiteindelijk in staat was om de wereldkampioen te verslaan. Hetzelfde platform leerde zichzelf binnen 24 uur beter te schaken dan de beste schaakcomputer tot nu toe. Als computers mensen kunnen verslaan in de meest ingewikkelde spellen van vandaag de dag, waar houden de mogelijkheden voor AI dan op?
Een groot voordeel dat mensen nog altijd hebben ten opzichte van computers, is dat we onze kennis en training die we hebben opgedaan in het ene gebied, kunnen toepassen op een nieuwe taak of gebied. Goede Go-spelers kunnen bijvoorbeeld hun manier van denken gebruiken om dagelijkse problemen op te lossen die zij tegenkomen op hun werk. AlphaGo kan dit niet doen: het is enkel goed in het spelen van Go, meer niet. Onlangs werd er echter een eerste stap genomen om dit probleem te verhelpen: neurale netwerken kunnen nu de belangrijkste kennis van het ene spel onthouden en tegelijkertijd een nieuw spel leren (koppeling). Google Deepmind schreef een nieuw algoritme waardoor een neuraal netwerk in staat was tien Atari games tegelijkertijd te leren en deze games op menselijk niveau te spelen.
Zodra dit gebied meer ontwikkeld is, kunnen computers een reeks aan moeilijke vaardigheden uitvoeren die momenteel alleen nog door mensen gedaan kunnen worden. Google gebruikt het om de energiekosten te verlagen van een van hun grote datacenters. De kunstmatige intelligentie beheert meer dan 120 variabelen in de datacenters van Google, zoals ramen, ventilatoren en koelsystemen. Hierdoor wordt het energiegebruik geoptimaliseerd en wordt tegelijkertijd de computerprestaties op peil gehouden. Deze optimalisatie verlaagt over een periode van meerdere jaren de energiekosten van Google met mogelijk honderden miljoenen. Een andere toepassing ligt in de gezondheidszorg: een app van Deepmind bespaart verplegers meer dan twee uur per dag door een waarschuwing te geven over aankomend acuut leverfalen. Dit zijn twee toepassingen, maar aangezien dit een nieuw ontwikkeld gebied is, bestaat er een groot potentieel voor meer. Denk bijvoorbeeld aan het voorspellen van aandelenprijzen en het optimaliseren van de layout van distributiecenters. De grens wordt vastgesteld door onze verbeelding en beschikbare data.
We hebben een aantal toepassingen van AI besproken die de komende jaren geavanceerder zullen worden en die wij waarschijnlijk steeds vaker zullen gebruiken in ons dagelijks leven. In de reeks AI-blogs hebben we geprobeerd de toepassingen van AI, waarmee iedereen ooit te maken, nader toe te lichten en hebben we een aantal voorbeelden gegeven waar deze toepassingen misschien toe zullen leiden in de nabije toekomst. In het volgende hoofdstuk gaan we het hebben over vijf trends die grote sprongen hebben gemaakt bij het toepassen van AI.