Interview | BrainCreators: data is de succesfactor voor ieder Artificial Intelligence project

Redactie WINMAG Pro
Er zijn erg veel beweringen over Artificial Intelligence (AI) en er zijn inmiddels honderden scenario’s verzonnen die beweren dat AI de wereld gaat overnemen. Maar welke verhalen kloppen nu? Is AI écht de nieuwe industriële revolutie? Wat we inmiddels wel weten is dat het een enorme impact zal hebben en dat zowel grote als middelgrote bedrijven er vroeg of laat mee te maken zullen krijgen. Geen wonder dat veel organisaties een start willen maken met deze technologie. Maar hoe kun je nu succesvol zijn als bedrijf met AI? Wij vroegen het aan Jasper Wognum, CEO en mede-oprichter van AI-specialist BrainCreators.

Volgens Wognum is data de succesfactor voor ieder AI-project. ‘Met een goede dataset kun je voorspellingen doen waarmee je concurrentievoordeel kunt opbouwen. Hoewel data zelf niet zoveel waarde heeft, kan het in combinatie met voorspellingsalgoritmes enorm veel macht geven. Een voorspellingsmodel is erg eenvoudig op te schalen als het eenmaal werkt. Een goed werkend voorspellingsmodel zorgt voor een constante stroom aan feedback data, die je vervolgens kunt gebruiken om je model continu op te schalen en te verbeteren. Dus hoe meer feedback data je krijgt des te beter het model wordt, waardoor je steeds meer concurrentievoordeel kunt opbouwen. De waarde van data door de waarde die je met een nauwkeurig model kan creëren.’

ML

Dat steeds meer bedrijven machine learning of andere vormen van AI toepassen, komt bij Jasper Wognum niet als een verrassing. Hij geeft tijdens ons gesprek aan dat dit voornamelijk te maken heeft met de snelle technologische ontwikkelingen. Het ontwikkelen van een AI-toepassing wordt steeds toegankelijker en je hoeft tegenwoordig geen specialist meer te zijn om data te trainen. Wognum: ‘Toen ik studeerde aan de universiteit moesten we onze eigen kunstmatige neuronen programmeren om een klein neuraal netwerk op te bouwen. Tegenwoordig kan iedereen de meest geavanceerde en krachtige AI-frameworks, zoals Tensorflow of PyTorch, gratis downloaden. Hiermee kun je een eigen model bouwen en trainen zonder al te veel codeerwerk. AI wordt hierdoor langzaam een ‘commodity’, dus zul je als bedrijf je moeten onderscheiden met solide data als je succesvol wil zijn met AI.’

Maar hoe leren machines dan van data? Wognum vervolgt: ‘Stel je voor dat je een machine wilt trainen om een kat of hond te herkennen die zichtbaar is in een afbeelding. Voorheen probeerde wetenschappers dit op te lossen door regels te schrijven die de visuele kenmerken van katten en honden beschrijven. Echter mislukten deze pogingen omdat regels niet alle uitzonderingen en uitschieters kunnen dekken. Middels deep learning kun je dit probleem met data oplossen. Om deep learning te realiseren heb je heel veel foto’s van katten en honden nodig die je kunt gebruiken als trainingsdata. Deze foto’s worden vervolgens gelabeld om aan het systeem te laten weten of de foto een hond of kat bevat. Deze data haal je vervolgens door het trainingsalgoritme heen en via een wiskundig proces kan het neurale netwerk automatisch de functies extraheren die een kat van een hond onderscheiden.’

Data

De kwaliteit van data is daarom cruciaal volgens Wognum. ‘Een dataset moet altijd gestructureerd en gebalanceerd zijn. Met gestructureerd bedoelen we dat data consistent moet worden geannoteerd met labels die de gegevens beschrijven. Hoe meer labels je toevoegt aan de data, des te meer opties je hebt om in de toekomst modellen voor specifieke oplossingen te trainen. Een foto van een kat kan eenvoudig worden gelabeld als ‘kat, of meer specifiek als ‘kat’, ‘dier’, ‘Siamees’ etc. Daarnaast moet een kwalitatieve dataset goed in balans zijn. Het hebben van duizend voorbeelden van katten en slechts één of twee andere dieren is alleen goed voor het herkennen van katten. De andere dieren zal het model niet herkennen. Kortom, met een onevenwichtige set die ‘bias’ bevat naar een specifieke groep mensen kun je snel in de problemen komen.’

Volgens Wognum hoef je voor het ontwikkelen van een gestructureerde en goed uitgebalanceerde dataset geen data-expert te zijn. Sterker nog, je kunt beter een specialist zijn in een bepaald domein zodat je de data goed kunt herkennen. Bijvoorbeeld een dierenarts zal beter dieren herkennen dan een data-specialist. Om het labelen van data voor domein experts zo gemakkelijk mogelijk te maken ontwikkelde BrainCreators BrainMatter. Het eerste ‘enterprise ready‘ platform ter wereld waarmee organisaties eenvoudig zelf data kunnen labelen.

BrainMatter

‘Het BrainMatter platform is uniek omdat het zelflerend is,’ aldus Wognum. ‘Zodra een bepaalde hoeveelheid data is gelabeld, zal het systeem vervolgens labels adviseren en gebruikers helpen om de overige data snel en correct te labelen. Met elke iteratie maakt het model betere voorspellingen, waardoor de gebruiker efficiënter kan werken. Verder kunnen teams via BrainMatter worden aangestuurd en beleidsregels worden ingesteld, die ervoor zorgen dat labels op de juiste manier aan de data worden toegewezen.’

Tot slot stelt Wognum dat het niet alleen bij een betrouwbare dataset blijft als je succesvol wil zijn. Maar dat ook het menselijke aspect niet mag ontbreken. ‘Medewerkers moeten begrijpen hoe AI technologie wordt toegepast en dat AI een ontwikkeling is die langzaamaan onze samenleving binnentreedt. Vaak beseffen medewerkers niet altijd wat machine learning inhoudt, waardoor ze geen rekening houden met het toekomstige gebruik van data. Ook kan hun beeld van machine learning negatief zijn, denk bijvoorbeeld aan doemscenario’s van intelligente robots die de mensheid en de banenmotor bedreigen. Dit kan de innovatie en een verantwoorde ontwikkeling van AI binnen het bedrijf bemoeilijken. Bedrijven doen er daarom goed aan aan om medewerkers een workshop te laten volgen voordat ze starten met AI. Om succesvol te zijn in machine learning zul je naast een goede dataset ook altijd een data-centrische cultuur moeten realiseren.‘

Fashionbrain

FashionBrain, een initiatief van BrainCreators, is ontwikkeld voor professionals en helpt bij het identificeren en analyseren van foto’s op het gebied van mode en enterainment. Eén van de vele oplossingen van BrainCreators, maar bij uitstek een goed voorbeeld om aan te tonen wát Wognum en zijn team de wereld in helpen. Het platform bestaat uit een combinatie van deep learning-modellen (neurale netwerken) en wijst automatisch tags toe aan foto’s. Hierdoor kunnen professionals razendsnel eigenschappen van foto’s filteren op basis van bijvoorbeeld kleur van de kleding, haarkleur, sieraden en het type kledingstuk. Om specifieke details op een afbeelding te herkennen worden de AI-modellen getraind met behulp van datasets van Runway Manhatta, het contentbureau dat het initiatief mede voerde.

De database van Runway Manhattan bevat meer dan 500.000 foto’s, waar BrainCreators meer dan 30.000 keywords aan heeft gekoppeld. De datavoorbereiding, modeltraining en re-training worden uitgevoerd volgens de lean AI methode op het door BrainCreators ontwikkelde platform Brainmatter. E-commerce bedrijven kunnen het platform bijvoorbeeld gebruiken om snel geschikte foto’s te zoeken voor hun webshop, terwijl marketeers het platform kunnen benutten voor onderzoek rondom de nieuwste modetrends.

‘Eén van de grootste uitdagingen binnen de fashionindustrie is het beheren en analyseren van de grote hoeveelheid foto’s die iedere dag binnenkomen’, vertelt Markus Mueller, medeoprichter van Runway Manhattan. ‘Doordat onze metadata is gekoppeld aan het BrainMatter platform kunnen modemerken, uitgevers, bloggers en retailers, sneller en efficiënter foto’s analyseren en publiceren.’

afbeelding van Redactie WINMAG Pro

Redactie WINMAG Pro | Redacteur

Bekijk alle artikelen van Redactie