Artificial Intelligence | Slim algoritme zoekt en verwijdert ID-bewijzen

Bron: C-team op 04 okt '19
Categorie: CorpoNet

Herinner je het nog, die golf van blijdschap die door jouw corporatie ging, toen na maanden van eindeloos scannen en indexeren, eindelijk alle verhuurdossiers een plekje hadden in het digitale archief? En al die ontelbare papiercontainers die afgevoerd werden? Wat ruimde dat lekker op hè? Huurovereenkomsten, overnameformulieren, inkomensgegevens en ID-bewijzen; alle verzamelde informatie op te vragen vanaf elke werkplek en alles keurig overzichtelijk in één PDF-bestand.

Veel corporaties bouwden daarna jarenlang een gigantisch digitaal archief op. Geen vuiltje aan de lucht. Totdat op 25 mei 2018 de nieuwe Algemene Verordening Gegevensbescherming (AVG) roet in het eten gooide en er strengere regels kwamen voor het bewaren van klantgegevens.

Tja, wat doe je dan als corporatie? Een deel van je archief hermetisch vergrendelen -wat feitelijk volgens de wet niet eens mag- en hopen dat er geen datalek ontstaat? De mouwen opstropen, een paar keer diep zuchten en duizenden dossiers handmatig doorlopen om data verwijderen? Of ga je investeren in Artificial Intelligence (AI)? Volkshuisvesting Arnhem en Mooiland kozen voor dat laatste.

Samen met een Nederlandse startup, die AI inzet om met behulp van deze technologie bedrijfsvraagstukken op te lossen, werd een algoritme ontwikkeld. Volkshuisvesting Arnhem startte met het project. Daar werd gedurende een paar maanden een aantal stappen doorlopen. Eerst werd een passend algoritme gezocht dat in staat was om op basis van pixels beelden te herkennen. Daarna werd in een testomgeving het algoritme getraind op het herkennen van ID-bewijzen. Eerst aan de hand van een set waarvan bekend was op welke pagina’s ID-bewijzen waren opgenomen. Door resultaten steeds opnieuw aan te bieden, werd het algoritme stukje bij beetje slimmer. Aansluitend werden grotere batches aangeboden, waarbij alleen de pagina’s waar het algoritme niet helemaal zeker over was, door mensenogen werden nagekeken. De resultaten daarvan werden weer gebruikt om het algoritme verder te verbeteren. Zo werd uiteindelijk een percentage van 98% herkenning gehaald. Een voor Volkshuisvesting Arnhem acceptabel percentage. “Als corporatie moet je altijd de afweging maken hoeveel je investeert in dergelijke projecten”, aldus Michel van Dalen, informatiemanager bij Volkshuisvesting Arnhem.

Met een aantal technische verbeteringen werd ook bij Mooiland een begin gemaakt met een vergelijkbare proef. Een snellere computer met meer rekenkracht scande de documenten met een hogere resolutie, waardoor er meer ID-bewijzen werden gevonden. Inmiddels is ook bij Mooiland het daadwerkelijk opschonen van een gigantisch archief begonnen. Wel kozen zij voor een iets andere aanpak. AI-techniek wordt daar gecombineerd met gerichte menselijke controle op de output van het algoritme. Alle pagina’s waar het algoritme één of meer ID-bewijzen herkent, worden nagekeken om zo 100% zeker te zijn dat er geen pagina’s worden verwijderd waar toch geen ID-bewijs op staat.

De samenwerking tussen Volkshuisvesting Arnhem, Mooiland en de softwareleverancier én tussen menselijk brein en moderne techniek was er eentje van de lange adem, maar leverde uiteindelijk goede, bevredigende eindresultaten op. De vele uren die gestoken zijn in het trainen van het algoritme vallen in het niet bij de uren die nodig geweest zouden zijn voor een handmatige controle en opschoning.

Gebruikmaken van AI biedt kansen om dit soort ‘ondoenlijke’ klussen toch uit te voeren. Het algoritme is nu ontwikkeld en kan ID-bewijzen herkennen en verwijderen. Hoe mooi zou het zijn als in de toekomst de kracht van het CorpoNet-netwerk nog meer wordt benut? Om bijvoorbeeld met hetzelfde algoritme niet alleen ID-bewijzen te kunnen verwijderen, maar ook BSN-nummers en andere AVG gevoelige informatie? Meer corporaties die samen investeren in projecten en bijbehorende risico’s met elkaar delen!

Wil je meer weten over dit project?

Neem dan contact op met Michel van Dalen (m.v.dalen@volkshuisvesting) of Linda van Rosmalen (lvanrosmalen@mooiland.nl). Zij delen hun kennis graag!