In het geval van data collectie (van die belastingdienst) kan het soms zeer pijnlijk aflopen. In 2018 had Amazon dit gedrag al gemerkt. Dit was gebaseerd op vrouwen hier.
Amazon.com Inc's <AMZN.O> machine-learning specialists uncovered a big problem: their new recruiting engine did not like women.
www.reuters.com
Hoe ga je er dan mee om. De kans dat er discriminerende algoritmes komen is reëel. Voor de ene een vorm van profiling voor de andere platte vorm van discriminatie.
Tevens ook hypothetische stelling. Stel dat het data algoritme leert aan de hand van bepaalde andere data. Bijvoorbeeld de kans dat er een groter percentage is dat iemand wonende in Borgerhout of Sint Joost ten Node niet belasting geregistreerde activiteiten kent en dus de moeite waard is om eens te controleren. (bij wijze van voorbeeld geen idee of dit nu effectief is)
Ik vind het allesinds technisch zeer boeiend. Stel dat we één dataset hebben waar vrouw/man in staat. En deze leert dat vrouwen geen goede kandidaat zijn voor de job lasser. En we bieden een tweede dataset aan waar we alle data uit halen die een basis kunnen vormen voor discriminatie. Stel dat het algoritme hier leert dat Peter en Jan goede potentiële kandidaten zijn maar Sarah niet.