In deze nieuwe guestblog ga ik je meer uitleggen over beeldherkenning, ook wel computer vision genoemd. Computer vision maakt het mogelijk om op basis van video objecten te herkennen, te tracken en in combinatie met AI te voorspellen wat er gaat gebeuren. Denk hierbij bijvoorbeeld aan de zelfrijdende auto. Maar er is veel meer mogelijk. Er kunnen zelfs compleet nieuwe business modellen rondom dit concept gebouwd worden. Welke dit zijn, leg ik in deze nieuwe guestblog graag aan je uit.
Computer vision: de basis
Om computer vision toe te kunnen passen, heb je een aantal essentials nodig. Je hebt er in ieder geval altijd een camera voor nodig die iets registreert. Denk aan camera’s in de stad, onder een drone, je webcam of een camera met een specifiek doel zoals de achteruitrijcamera in je auto. Vervolgens moeten die beelden geanalyseerd worden en moet hieruit nieuwe informatie gegenereerd worden. Daar komt in veel gevallen Artifical Intelligence bij kijken.
Toepassingen hiervan kennen we waarschijnlijk wel uit films en van TV. Neem bijvoorbeeld de door mijzelf bekroonde TV serie Person of Interest. Op basis van camerabeelden (en geluid) analyseert een supercomputer (The Machine) of er binnenkort een moord plaats gaat vinden en wie daar bij betrokken is. Deze informatie wordt gedeeld met een speciaal team dat de moord moet zien te voorkomen. Helaas weet The Machine niet van te voren of die persoon de moordenaar is of juist vermoord gaat worden. Prachtig ingrediënt voor een spannende serie, maar veel interessanter is de ontwikkeling die de AI van The Machine doormaakt. Hij begint als een domme machine en geeft in het begin vaak de verkeerde resultaten, wat weer grote gevolgen kan hebben. Daarom wordt er vaak opnieuw gestart met het programmeren van de AI, net zo lang tot de resultaten daadwerkelijk kloppen.
Je moet dus veel tijd stoppen in het trainen van de AI. Hieronder zie je een plaatje van mezelf waarin hij mij als een persoon en het object dat ik vast heb als een boek herkent. De getallen erachter geven de zekerheidsmarge weer.
Dit objectherkenningsprogramma is getraind om deze en nog vele andere objecten te herkennen. Stel dat je zelf een applicatie met object herkenning wil bouwen, dan zijn daar ondertussen veel bedrijven voor die dat eenvoudig voor je aanbieden met kant en klare objecten er in. Daarnaast kun je via het Internet ook complete databases met bestaande objecten gebruiken.
Computer vision in de praktijk
Laten we beginnen met drie leuke computer vision toepassingen die nu al in het bedrijfsleven terug te vinden zijn. Twee ervan zijn voorbeelden uit de auto-industrie en eentje wordt door de brandweer ingezet.
Omgevingsbewuste auto’s
Moderne auto’s zijn in staat om botsingen te voorkomen door op tijd af te remmen als een voorganger plotseling op de rem trapt of er een voetganger oversteekt. De “traditionele” software in een auto is vooral gebaseerd op radartechnologie die continu de afstand tussen de voorganger en jezelf meet. Met computer vision kun je de omgeving in de gaten houden, zoals fietsers, wandelaars en verkeerslichten. Op basis hiervan kan het gedrag van je voorligger voorspellen. Daarnaast stelt computer vision de auto in staat om naar de bestuurder te kijken en te detecteren of hij/zij moe is of op zijn telefoon bezig is. Hiermee wordt extra veiligheid gecreëerd. Als de auto vervolgens ook in staat is in te grijpen, zou deelnemen aan het verkeer nog veel veiliger worden. Deze oplossing is relevant voor autofabrikanten, maar je kunt het natuurlijk ook in fietsen of andere voertuigen toepassen.
Autoschade registreren én herstellen
Vroeger moest je bij autoschade een heel formulier invullen en je innerlijke Picasso los laten om de situatie te schetsen. Tegenwoordig vinden we het al heel hip als je alleen nog maar foto’s hoeft te uploaden in een app. De volgende stap is dat je met AI niet alleen de schade op de foto herkent en direct een inschatting maakt van de kosten om het te herstellen, maar ook direct suggesties krijgt over wat de beste methode is om het te herstellen. Dit zou wellicht ook toepasbaar kunnen zijn op aardbevingsschade of op forensisch bewijs bij een misdaad.
Rook detecterende drones
Op onze mooie Veluwe kan wel eens een brand ontstaan. Vroeger moest de brandweer op wachttorens staan om rook te kunnen signaleren. Later zijn ze dit met vliegtuigen gaan doen. En tegenwoordig worden steeds vaker drones ingezet. Deze drones kunnen met hun camera’s op grote afstanden detecteren of er ergens rookontwikkeling ontstaat. En vervolgens kunnen ze de brandweer informeren over de exacte locatie van die brand.
Bovenstaande drie voorbeelden zijn allemaal incrementele verbeteringen van bestaande processen. Hetzelfde zagen we al eerder bij de voice assistenten, verbeteringen die de volgende stap zijn in een lange rij van innovaties. Wat hier wel opvalt is dat de ontwikkelaars van deze technologie nieuwe leveranciers zijn voor hun afnemers en daarmee vooral disruptief werken op hun traditionele leveranciers.
Wat kan ik hier als ondernemer nu mee?
Wat betekent deze ontwikkeling nu voor jouw onderneming? Hoe kun je dit toepassen in je eigen organisatie? Ik weet zeker dat er voor elk bedrijf, in elke sector wel een toepassing voor computer vision te verzinnen valt. Het kan menselijk werk aan de lopende band overnemen. Bijvoorbeeld bij de detectie van verkeerd gelegde pennywafels. Of het egaliseren van de bodem, voordat de straatmaker robot de klinkers er in legt. Of in het magazijn waar automatisch de voorraad geteld kan worden.
Wat betekent het voor je eigen dienstverlening naar je klanten? Je moet als ondernemer nadenken over hoe je jouw product of dienst met computer vision kunt verbeteren. Laat ik eens binnen de context van Odido kijken.
Inspecterende drones
Een belangrijk onderdeel van onze dienstverlening is natuurlijk ons mobiele netwerk. De antennes hangen op grote hoogte in masten en staan boven op gebouwen. Onderhoud en inspectie is daarmee gevaarlijk werk – we zetten hier vaak alpinisten voor in. Met een drone die automatisch afwijkingen constateert en doorgeeft, zou het leven van onze onderhoudsleverancier een stuk eenvoudiger zijn. Dit kun je dan ook eenvoudig toepassen op alle inspectietaken op hoogte, op zee of andere moeilijk te bereiken locaties. Het enige wat je moet doen is de AI goed trainen op afwijkingen die vervolgens automatisch herkent worden.
Lijntechnologie: van het voetbalveld naar de snelweg
Odido is de trotse hoofdsponsor van FC Utrecht en sport is natuurlijk een mooie bron van data-analyse. Je kent de voorbeelden van de lijntechnologie uit het tennis of voetbal. Die kan bepalen of een bal op, voor of over de lijn is. Maar je kunt er ook supersnel data mee visualiseren, zoals hoe hard een schot was of hoeveel afstand de bal heeft afgelegd. Als je dat zou toepassen in het verkeer, kun je snelheid van auto’s eenvoudig meten of afstand tussen auto’s of een combinatie van die twee. Daarmee kun je snel onveilig gedrag opsporen, maar je kunt ook automatisch de snelwegborden inzetten. In de tuinbouw zou je in rozensorteermachines kunnen bepalen wat de maximale sorteersnelheid is, zonder dat de bloem afbreekt.
Zonder scannen je boodschappen doen
Wij verkopen onze producten niet alleen online, maar je kunt ook nog fysieke winkels bezoeken. We verkopen geen pindakaas of flesjes cola, maar met computer vision is het mogelijk om bezoekers zonder scanner hun boodschappen te laten doen. Doordat alle artikelen in de supermarkt herkent worden en ze een bekende plek hebben, herkent de computer dat jij de boodschappen in je karretje stopt en stuurt het een update naar het lijstje in je supermarkt app. Bij de kassa kun je eenvoudig je telefoon scannen en afrekenen. Als je dit concept verder zou toepassen bij de klassieke automatiek, dan kun je een frikandel of eierbal in elk laatje leggen, de computer herkent immers wat de klant daadwerkelijk pakt. Ook werkt dit niet alleen in supermarkten, maar in alle zelfbedieningsretail zoals bouwmarkten en tuincentra. Buiten de retail zou het kunnen werken in buffet restaurants om te kijken hoeveel je nou eigenlijk op eet. Een andere toepassing kan zijn op een afvalsorteercentrum, waarbij je afval herkend wordt, het gewicht ervan in schat en je op basis daarvan moet afrekenen.
De gevaren van computer vision
Met computer vision kun je dus eenvoudig objecten herkennen, maar er is nog meer mogelijk. Je kunt ook mensen herkennen en zelfs hun gedrag ermee vaststellen! Je slimme deurbel herkent tegenwoordig wie er voor de deur staat en of dat iemand is die je kent of dat het toch die man van de DHL is. Je kunt bewegingen tracken, maar je kunt ook afwijkingen van bepaald gedrag detecteren. De mogelijkheden zijn eindeloos en daar ligt ook een deel van het gevaar. Net als bij elke andere AI, bepaalt de ontwikkelaar initieel de parameters waar naar gekeken wordt. Vervolgens is het aan de gebruiker hoe hij met die informatie omgaat.
Zo hingen er bij de universiteit van Leiden camera’s die de studenten telden die binnenkwamen en die zich in een collegezaal bevonden. Echter dachten de studenten dat de camera’s tot meer in staat waren, namelijk het herkennen van het geslacht en of iemand wel of niet een mondkapje droeg. In principe zou de achterliggende AI dat kunnen, maar het is aan de gebruiker om te bepalen wat hij daadwerkelijk inzet. Maar wanneer je er personen mee gaat bekijken, speelt privacy een enorme rol en is het heel lastig om uit een conflict te blijven.
Hoewel veel toepassingen in deze technologie gaan over gezichtsherkenning, heb ik het in deze blog niet over het herkennen van mensen of menselijk gedrag gehad, maar over objecten. Die zijn over het algemeen neutraal in hun mening en kennen een lagere ethische standaard.
Conclusie
Computer vision maakt het dus mogelijk om op basis van video objecten te herkennen, te tracken en in combinatie met AI te voorspellen wat er gaat gebeuren. Veel van deze oplossing zullen als eerste worden ingezet om bestaande processen zoals schade afhandeling of automatisch remmen verder te verbeteren. Als bestaande leverancier van dit soort oplossingen moet je alert zijn op disruptie door andere partijen of er zelf mee aan de slag gaan. Hetzelfde patroon zagen we al eerder bij de voice assistenten en is eigenlijk van toepassing op alle nieuwe technologische innovaties.
Het maakt ook nieuwe businessmodellen mogelijk zoals echte onbemande retail, hybride verticale businessmodellen zoals een drone inclusief herkenning van: rook, verkeersdrukte of magazijnvoorraad.
Je zou kunnen zeggen dat een camera met computer vision eigenlijk een hele sterke programmeerbare flexible sensor is. En net als met andere sensoren kun je er heel veel informatie en inzichten mee verzamelen. Het wordt pas echt interessant als je die informatie omzet tot actie. Dus een drone die ook kan blussen, een auto die automatsch kan remmen of een doelpunt dat automatisch wordt afgekeurd als de bal toch echt over de zijlijn is geweest. Om snel dat soort besluiten te kunnen nemen moeten die camera’s wel ergens een snelle verbinding hebben met een cloud. Laten wij daar bij Odido nou toevallig een mooi 5G netwerk voor hebben om dat mogelijk te maken.