Tim Ottens

Senior Data Scientist bij PostNL

INSIGHT STORY - "Bij PostNL kunnen we een gedeelte van onze tijd besteden aan innovatieve projecten."

De uitgifte van een door kunstmatige intelligentie ontworpen serie postzegels is meer dan een opvallend nieuwsfeit. Het illustreert hoe serieus PostNL omgaat met data science: niet alleen erover praten, maar er echt mee aan de slag gaan. Experimenteren, leren en zo mogelijk toepassen binnen het logistieke proces. Senior data scientist Tim Ottens legt uit hoe zijn idee aansluit op de data-ambities van PostNL.

Artificiële intelligentie (AI) is een term die bedrijven en hun managers graag gebruiken. Het klinkt goed en de mogelijkheden zijn enorm, maar initiatieven blijven helaas vaak steken op het niveau van data-analyse en dashboards. Bij PostNL brengen we AI daadwerkelijk in de praktijk. Dat maakt het voor dataspecialisten een geweldig bedrijf om voor te werken.

Bij PostNL kunnen we een gedeelte van onze tijd besteden aan innovatieve projecten. De uitkomst van deze ‘hacking time’ hoeft niet direct in lijn te zijn met de businessdoelstellingen. Het gaat er vooral om dat je door experimenteren nieuwe technologieën en mogelijkheden ontdekt. Dat dit op termijn kan leiden tot nieuwe zakelijke toepassingen is meegenomen.

Digi art

Ik kwam op het idee voor AI-postzegels toen ik hoorde dat een door de computer ontworpen kunstwerk voor 400.000 dollar was verkocht. Ik realiseerde me toen dat postzegels eigenlijk ook kunstwerken zijn. Samen met data engineer Ying Yu ging ik aan de slag. Zij zorgde onder andere voor het data- en softwareplatform, terwijl ik me voornamelijk richtte op de ontwerp-algoritmes. Voor de meeste data-activiteiten binnen PostNL gebruiken we de cloudomgeving van AWS.

Ons ontwerpmodel bestaat uit een genererend en een discriminerend algoritme. Het eerste kan op basis van bestaande ‘data’ zoals afbeeldingen, tekst, tijdreeksen of chemische verbindingen iets nieuws creëren met enigszins vergelijkbare kenmerken. Het discriminerende algoritme stelt vast of het kunstmatig gegenereerde item goed genoeg is om voor ‘echt’ door te gaan.

Hier leidde het model tot door de computer verzonnen en goedgekeurde postzegels die allemaal verschillend waren, maar wel homogeen. Het verschil met een menselijk ontwerpproces is dat mensen veel sneller in staat zijn om zaken te classificeren – bijvoorbeeld als portret, landschap of een specifiek voorwerp. We weten na een of twee voorbeelden genoeg, terwijl een algoritme er duizenden nodig heeft.

Heel veel data

We hadden dus heel veel data nodig: duizenden plaatjes van postzegels. Allemaal minimaal honderd jaar oud voor een niet te grote onderlinge afwijking en genoeg diversiteit. Nieuwere postzegels zijn zodanig verschillend, dat ze niet geschikt zijn voor ons doel.

We liepen tegen uitdagingen aan die je als data scientist wel vaker tegenkomt: je moet genoeg data van de juiste kwaliteit hebben en ook ruim de tijd hebben om het genererende algoritme te kunnen trainen. Tegelijk heeft het traject ons veel nieuwe dingen geleerd over visuele herkenning, wat we bijvoorbeeld in onze sorteercentra zeker kunnen toepassen.

Expertise-afdeling

Toen onze CIO Marcel Krom hoorde van ons experiment kwam hij met het idee om de zegels echt uit te brengen. Een andere ambassadeur was Frank Ferro, onze Director Insights – de unit die inzichten levert op de diverse processen binnen PostNL. Ook de marketeers van de postzegelverzamelafdeling waren enthousiast. Uiteindelijk is het opgepakt als een normaal businessproject. De postzegels zijn vanaf 28 oktober (2021) te koop. Ontzettend gaaf natuurlijk!

Er zijn overigens meer voorbeelden van hacking time die uiteindelijk echte business wordt. Heel interessant is het ‘phishing classification model’, waarbij verdachte e-mails uit naam van PostNL automatisch op schadelijkheid worden beoordeeld. Dankzij machine learning is handmatige classificatie als ‘wel of geen phishing’ door onze security-specialisten niet langer nodig.

Daarnaast werken we als dataspecialisten continu aan de verdere verbetering en verduurzaming van het logistieke proces. We zijn een echte expertise-afdeling die werkt voor de gehele organisatie. Als individuele data scientists focussen we ons daarbij op specifieke domeinen, zoals de website of PostNL-app. Bijvoorbeeld gericht op de ‘next best action’, waarmee optimaal kan worden ingespeeld op de wensen en behoeftes van de consument.

Kennisdeling

We delen volop kennis en ervaringen, onder andere tijdens workshops. Net als bij de hacking time kom je zo samen verder. Bijvoorbeeld rond te hanteren standaarden, nieuwe technieken en de waarde van algoritmes in nooit geziene omstandigheden zoals een pandemie en lockdown. Je ontdekt samen nieuwe implicaties en eventuele beperkingen van de gehanteerde modellen. Dat is enorm leuk en leerzaam.

Data science en data engineering worden in de toekomst nog belangrijker. We kunnen processen en mensen steeds efficiënter en effectiever maken, waardoor we waarde leveren voor PostNL en onze klanten. Zo blijven we de concurrentie voor.