Data Science, data-analyses, algoritmen en artificiรซle intelligentie. Tot een paar jaar geleden begrepen veel van mijn vrienden, kennissen en familieleden niet echt waar ik mij dagelijks mee bezig houdt. Dat is nu toch wel heel anders. Een simpele verwijzing naar de zelfrijdende auto, of de algoritmen van sociale media platformen, is in de huidige tijdsgeest meestal al voldoende om snel en makkelijk mijn werkzaamheden te duiden.
Dit geeft heel mooi weer hoe onze leefwereld de afgelopen jaren sterk veranderd is. Data verzameling, verwerking en opslag, data science, en allerhande vormen van artificiรซle intelligentie, sijpelen steeds verder door in onze samenleving. In steeds meer producten en diensten worden algoritmes toegepast, al dan niet zichtbaar of bekend bij de gebruikers.
Op zichzelf is dit niets nieuw. De technieken van de artificiรซle intelligentie worden bijvoorbeeld in de maakindustrie en de kapitaalmarkten al jaren ingezet. Maar ook onze eigen management branche, passen wij via credit scoring al verschillende decennia algoritmen toe.
Toch bleef dit alles wat meer achter de schermen. Door de democratisering van data science gedurende de afgelopen jaren, zijn er echter meerdere in het oog springende toepassingen hiervan gekomen, die maatschappelijk een hele mooie impact hebben. In de gezondheidszorg bijvoorbeeld, maar ook bij het efficiรซnter maken van sommige bedrijfsprocessen, waardoor de werkdruk op de werknemers kan verminderd worden.
Toepassing en ethiek
De combinatie van AI en data science heeft echter niet louter positieve ontwikkelingen opgeleverd. Zo heeft een bekend bedrijf in de VS een toepassing van AI voor rekrutering moeten stopzetten. Onlangs hebben twee grote bedrijven ook een reeks rechtszaken opgelopen, omdat hun algoritme voor het toekennen van kredietlimieten, op een bepaalde manier discrimineerde. Of de recente stap van IBM, de verkoop van Watson, omdat de ontwikkeling van een relevant en performant AI-systeem toch moeilijker leek dan gedacht. Bovendien is er bij veel bedrijven in de VS, die een aantal jaar geleden heel enthousiast data science teams zijn gaan uitbreiden, de realiteit ingezonken dat het ontwikkelen van hoogwaardige, kwalitatieve, bedrijfsrelevante, eerlijke en ethische algoritmes, toch helemaal niet zo eenvoudig is als gedacht.
In die optiek is het dan ook niet vreemd is dat verschillende overheden zich verdiept hebben in data science en artificiรซle intelligentie, in al zijn vormen en toepassingen. Zo zijn bv. de UNESCO(1), ISO(2), de Wereldbank(3), en de Europese Commissie(4) druk in de weer met het opstellen van richtlijnen en/of regelgeving voor het gebruik en toepassingen van AI.
In de meeste gevallen wordt hierbij het belang en de nuttige toepassingen van AI duidelijk benadrukt, echter wel met de insteek dat de AI โfairโ, โethicalโ, โinclusiveโ en โnon-discriminatoryโ moet zijn. Bovendien, dat omwille van het โback boxโ -karakter van sommige technieken van data science, de uitlegbaarheid (โExplainable AIโ of kortweg โxAIโ) en transparantie, van groot belang is.
Directieve van de Europese Commissie
Het belangrijkste initiatief voor ons als ingezetenen, is de directieve die de Europese Commissie in 2021 in een eerste versie naar buiten bracht. Later dit jaar wordt deze wellicht gefinaliseerd, waarna de directieve kan worden omgezet in nationale wetgeving.
De EU heeft bij het uitwerken van de directieve, duidelijk gekozen voor een classificatie van AI-systemen op basis van hun risicoprofiel. Zo valt โsocial scoringโ of het gebruik van biometrische toepassingen in de categorie โonacceptabelโ. De tweede categorie is de zogenoemde โhigh risk AIโ, waarvoor in het voorstel duidelijke regels โ en ook boetes – zijn bepaald. De derde groep is die van het โbeperktโ risico. Hieronder vallen bv. chatbots. Ook daarvoor worden er bepaalde transparantieregels voorgesteld. De vierde en minst risicovolle groep omvat dan bv. computerspelletjes en spam filters.
Credit Scoring valt als techniek volgens de EU onder de groep โhigh riskโ, omdat het potentieel hele groepen van mensen zou kunnen uitsluiten van verschillende vormen van kredietverstrekking. Naast enkele uitzondering voor MKB-bedrijven, die AI-gedreven credit scoring voor eigen gebruik zouden gebruiken, geldt dus dat elk credit scoring systeem, aan de regels voor de โhigh riskโ AI moet voldoen.
Voeding voor Credit Scoring
Op het eerste gezicht lijkt het er dus op dat de EU het gebruik van credit scoring strikt aan banden legt, tot op het punt dat de inzet ervan niet meer mogelijk zou zijn. Niets is echter minder waar.
De EU verbiedt namelijk niet het gebruik van data science voor de ontwikkeling van credit scoring. Wel wordt er een duidelijk regelgevend kader geschetst, waarbinnen het gebruik van AI voor kredietwaardigheidsbeoordeling moet plaatsvinden.
De regels die opgelegd worden concentreren zich, net zoals bij andere nationale en supranationale instellingen en overheden, voornamelijk rond de concepten van eerlijkheid (โfairnessโ), ethiek, de menselijke controle over het systeem, transparantie en uitlegbaarheid van het systeem, en het vermijden van discriminatie. Overigens gelden deze regels niet alleen voor het inzetten van de data science techniek, maar ook over de data zelf die gebruikt wordt om dergelijke AI-systemen te ontwikkelen en te voeden in het dagelijks gebruik.
Gedurende de vele jaren dat ik nu al actief ben binnen de credit scoring, passen wij de principes die de EU nu in het wetgevend kader wil opnemen, al actief toe. En dit zowel voor de B2B als B2C oplossingen die wij over heel Europa (en ook in andere delen van de wereld), gebouwd hebben. Ik heb zelf ook de effecten kunnen vaststellen (en moeten corrigeren) van โfoutieveโ modellen. Enerzijds omdat de dataset kwalitatief mankementen vertoonde, anderzijds omdat de data scientist niet de juiste keuzes maakte tijdens het uitwerken van de analyses op de data. De principes en concepten die de EU naar voren schuift, zijn daarom logisch en correct. Ook de extensie van de regelgeving naar de data toe, is in die optiek correct en essentieel.
Net zoals de voorbeelden boven aangegeven, is het gebruik van data science ook in creditmanagement, niet zo eenvoudig als het op het eerste gezicht lijkt. Kennis, kunde, ervaring, en voornamelijk ook de realiteitszin van de data scientist(s), zijn kernpunten waar niet zomaar aan voorbij gegaan mag worden. Wat mij betreft mag die zelfs nog wat verder gaan. En dan met name rond het uitwerken van een goede verklaarbaarheid van de โblack-boxโ AI-systemen. Hier wordt door bedrijven en academici momenteel heel wat onderzoek naar gedaan, maar tot het echt transparant maken van die systemen is het nog niet gekomen. Bovendien gaat het niet enkel over xAI, maar zeker ook over โcontrollable AIโ. Want pas als je het โblack boxโ systeem echt kunt controleren, zal je het succesvol kunnen inzetten.
Wij hebben als Altares Dun & Bradstreet hier de laatste jaren echt stappen gemaakt, en zijn inmiddels een heel eind gekomen voor een grondige โexplainabilityโ. Ook hebben wij nu de kennis over hoe wij die โblack boxโ systemen echt kunnen controleren, eerder dan dat de computer ons zou controleren.
Onze ervaring leert dat het zeker niet onmogelijk is om een goed, performant AI-systeem voor credit scoring te bouwen wat eerlijk, ethisch, transparant, uitlegbaar is, en de toets aan de regelgeving kan doorstaan. Wel is het zo dat dit de nodige tijd, aandacht en investering vraagt. De cruciale factoren zijn hier wederom kennis en kunde, ervaring en realiteitszin. Maar het vraagt ook om een multidisciplinaire aanpak, te vermijden valt een aanpak waarbij de data scientist gevraagd wordt een model te bouwen in de spreekwoordelijke ivoren toren.
Een evolutie die de branche versterkt
De EU heeft als onderdeel van de voorbereidingen voor de directieve, ook inschattingen gemaakt van de investeringen die gepaard zouden gaan met de uitwerking van een โhigh riskโ AI-systeem. Op het eerste gezicht lijken dat behoorlijke bedragen. Echter, kijkend naar wat een goed uitgewerkt AI-systeem jaar na jaar, continu als toegevoegde waarde brengt, is het zeker de moeite waard. Als je net start met het toepassen van data science, kan het allemaal wat overweldigend overkomen. Belangrijk hier is dat om van de voordelen van AI in creditmanagement te kunnen genieten, kleinere stappen vaak al tot mooie resultaten kunnen leiden. De droom en het doel van het hele complexe, allesomvattende en zelf-onderhoudende systeem kan zeker aan de horizon blijven staan. Maar zoals altijd is het dan een kwestie van stap voor stap hiernaar toe te werken.
Door als creditmanagement branche hier -met inachtname van de wet- en regelgeving- innovatief en correct AI te gebruiken, zullen we de maatschappij een grote dienst kunnen bewijzen. Kredietverstrekking is en blijft namelijk de noodzakelijk olie om de economie draaiende te houden. En het zou teleurstellend zijn mocht dit streven tenietgedaan worden door het toepassen van onachtzaam ontwikkelde AI-systemen.
Kijkend naar de hele evolutie rond data science en AI, verwacht ik zelf dat we dit jaar niet alleen de verder uitgewerkte directieve van de EU zullen krijgen, maar dat ook andere overheden en instellingen, stappen gaan maken met de uitwerking van wet- en regelgeving. Verder zullen de controlerende organen zich ook gaan organiseren om hun taak uit te voeren. Dat hoeft voor ons de pret echter niet te drukken. En zal er eveneens voor zorgen dat de spreekwoordelijk โcowboysโ niet onrechtmatig, de spelers die de regels wรฉl volgen, de kaas van het brood eten.
Referenties:
- (1) UNESCO, Recommendations on the Ethics of Artificial Intelligence, November 24, 2021. https://unesdoc.unesco.org/ark:/48223/pf0000380455
- (2) ISO, Artificial Intelligence Standards, https://www.iso.org/committee/6794475/x/catalogue/
- (3) The World bank, Credit Scoring Approaches Guidelines, https://thedocs.worldbank.org/en/doc/935891585869698451-0130022020/CREDIT-SCORING-APPROACHES-GUIDELINES-FINAL-WEB
- (4) European Commission, April 2021, Regulatory Framework Proposal on Artificial Intelligence, https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai