Computers kunnen slimmer zoeken op het web
/1 reactie
Reagan for president
Geleijnse begon zijn onderzoek in het kennisdomein van de historische personen. “We hebben een heel lange lijst met beroemde figuren gevonden. Het aardige daaraan is dat we hebben geleerd hoe mensen die teksten invoeren op het web die beroemdheden omschrijven en waar ze die mee relateren.” Wie is eigenlijk het beroemdst? Ronald Reagan bleek het vaakst genoemd op het web en het opmerkelijke was dat dat overeenkwam met de verkiezing van ‘the greatest American’ die via de televisie door Discovery Channel werd georganiseerd in 2005.
Geleijnses systeem kan van grote betekenis zijn voor een instituut als Beeld en Geluid in Hilversum. Dit multimedia instituut heeft haar honderdduizenden documenten gecatalogiseerd met achtduizend trefwoorden. Documentalisten die een bepaald fragment zoeken, kennen die trefwoorden niet altijd. Geleijnse: “Stel je wilt iets zien over de grasparkiet. Dat is geen trefwoord. Ik heb mijn systeem aangepast voor ‘Beeld en Geluid’ zodat het trefwoorden kan zoeken die qua betekenis dicht bij de zoekterm grasparkiet liggen. Via vogel, huisdier en tropisch kan de slimmere computer het document wel vinden.”
Geleijnse is trots op zijn algoritme maar beseft tegelijkertijd dat het niet op korte termijn terug te zien zal zijn in een commercieel product. “Philips is geen bedrijf dat zoekmachines maakt”, verklaart hij. “Ik heb een wetenschappelijke bijdrage geleverd waar nu op voortgeborduurd kan worden maar waar nog wel veel werk aan is om het interessant te maken voor gebruikers.”
Gijs Geleijnse verdedigt op 8 december om 16.00 u zijn proefschrift “Information Extraction from the Web using a Search Engine”.
Dit artikel verscheen eerder in Cursor.













Reacties