Computerprogramma als menselijk oog /reageer

Diepere structuur

Ook het algoritme dat de onderzoekster ontwikkelde is toepasbaar op elke schaal. Het gaat niet uit van pixels, maar zoekt de belangrijkste punten in het beeld die zelden veranderen ten opzichte van elkaar: niet als het beeld wordt uitvergroot en ook niet als het van positie verandert. Met elkaar vormen die kritische punten de diepere structuur van het beeld.

Vergrootglas

Het driedimensionale landschap van kritische punten.<br />
Beeld: CursorHoe die punten worden vastgesteld, is uit te leggen middels de metafoor van een vergrootglas. Door het vergrootglas op een bepaalde hoogte boven een foto te houden, is de afbeelding scherp te zien. Houd het vergrootglas iets hoger, en het beeld vertroebelt. Bepaalde structuren zijn nog zichtbaar, andere nauwelijks.
Hoe hoger het vergrootglas komt, des te minder structuur er zichtbaar is. De hoogte en de plaats waarop een structuur ‘verdwijnt’, krijgen een punt. Zo ontstaat een driedimensionaal landschap van punten. Een blauwdruk die uniek is voor het plaatje, maar onafhankelijk is van schaal of positie. Het algoritme van Balmashnova werkt op vergelijkbare wijze.

Verkreukeld vel

Het algoritme herkent het Océ-logo op grond van de kritische punten die binnen de cirkels vallen. Het gekreukelde logo herkent het niet.<br />
Beeld: CursorDe industriële partner bij het onderzoek was Océ Technologies. Het bedrijf wil een scanner maken die in staat is om bedrijfslogo’s te herkennen in complexe documenten.
Het algoritme dat Balmashnova ontwikkelde, voldoet ruimschoots aan die eis: zelfs de voorkant van een tijdschrift dat half verdwijnt onder enkele andere tijdschriften, blijkt nog traceerbaar. Maar een Océ-logo op een verkreukeld vel papier blijkt dat weer niet te zijn. “In dat geval is sprake van een lokale transformatie”, zegt de onderzoekster. “Wanneer er sprake is van een te grote lokale vervorming, werkt het algoritme niet.”

Variatie

Het programma is dus bij lange na nog niet geschikt om, bijvoorbeeld, tumoren te herkennen op röntgenfoto’s. De variatie in de vorm van tumoren is daarvoor te groot.
Een belangrijke volgende stap in het onderzoek is dan ook het toevoegen van specifieke kennis aan het model, zegt prof.dr.ir. Bart Ter Haar Romeny, hoogleraar bij de onderzoeksgroep. “We willen een computerprogramma ontwikkelen dat beelden kan leren herkennen. Nieren zijn bijvoorbeeld allemaal anders van vorm, maar die variatie is niet eindeloos. Het computerprogramma zou structuur in die variatie moeten leren vinden.”

Doorbraak

Voordat het zover is, zullen volgens de hoogleraar nog heel wat jaren verstrijken. Een door de computer ondersteunde diagnostiek laat dus nog wel even op zich wachten. “Mij wordt vaak gevraagd of de computer de arts ooit zal vervangen”, zegt Ter Haar Romeny glimlachend. “Nou, ik ga het in elk geval niet meemaken!”

Toch is het onderzoek van Balmashnova wel degelijk een doorbraak, benadrukt Ter Haar Romeny. “Wij proberen de wiskunde van het zien te doorgronden en die te modelleren. Dat is een betrekkelijk nieuw vakgebied, wij behoren echt tot de pioniers. Terwijl iedereen nog kijkt naar pixels, stappen wij er vanaf. Dat is echt vernieuwend.”

Dit artikel verscheen eerder in Cursor, informatie- en opinieblad van de TU/e

Reageren via Facebook

Reacties

Over Enith Vlooswijk

Enith Vlooswijk is freelance wetenschapsjournaliste. Haar bedrijf heet AllesZins Journalistiek & Tekst. Ze maakt bovendien muzikale theatervoorstellingen met Kindertheater Vanillewijs.



SYNC is het innovatieblog van
← Terug naar MT