Eye-tracking: innovaties in opkomst /2 reacties

Eye-tracking: innovaties in opkomst

De laatste jaren is steeds meer aandacht ontstaan voor alternatieve vormen van mens-computerinteractie. Voorbeelden zijn de opkomst van touchscreens, stemherkenning, Ambient intelligence en bewegingsgevoelige controllers zoals die van de Wii spelcomputer.

Ook eye-tracking wordt steeds vaker in dit rijtje genoemd. Deze techniek, waarbij het bewegen van de ogen wordt gemeten, is tot nu toe veel toegepast als onderzoeksmethode. Denk bijvoorbeeld aan usability-onderzoek, onderzoek naar consumentengedrag of cognitieve studies naar leesgedrag. Een andere eye-trackingtoepassing is gaze-based interfacing.

Gaze-based interfacing

Gaze-based interfacing is een methode om door middel van eye-tracking input te leveren aan een systeem. Hierbij kunnen twee categorieën van mens-computerinteractie worden onderscheiden.
De eerste categorie is interface-besturing, waarbij de interactie plaatsvindt doordat er met de ogen direct invloed kan worden uitgeoefend op de computer. Er kan bijvoorbeeld getypt worden.

De andere categorie is ambient intelligence. De interactie vindt daarbij plaats doordat de computer detecteert of er gedurende langere tijd (een aantal seconden of meerdere bezoeken) al dan niet naar een bepaalde plaats wordt gekeken. Op basis daarvan (dus indirect) volgt een actie. Bij deze laatste categorie wordt de gebruiker dus niet direct geconfronteerd met zijn kijkgedrag, maar heeft het indirect gevolgen op de interface.

3 technieken

Er zijn drie verschillende technieken voor eye-tracking. Bij de eerste categorie wordt een speciale lens of sensor aan het oog bevestigd.
Daarnaast is er de categorie waarbij electroden rondom de ogen worden geplaatst om de positie van die ogen te meten.
Bij de derde categorie wordt geen fysiek contact gemaakt met de ogen of het gezicht. Hierbij wordt (vaak infrarood) licht gereflecteerd door het oog en opgevangen door bijvoorbeeld een videocamera. Deze populaire vorm van eye-tracking leent zich het best voor gaze-based interfacing, door de relatief lage kosten en doordat geen apparatuur aan het oog of hoofd hoeft te worden bevestigd.
Mytobii is een voorbeeld van een recent ontwikkelde computer met ingebouwde optische sensoren (video). Hoewel de prijs nog erg hoog is (zo’n 16.000 euro), kan deze stap naar de consument als zeer positief worden beschouwd. Het is slechts een kwestie van tijd voordat dergelijke systemen beter betaalbaar worden. Tot die tijd zullen ook andere mogelijkheden binnen deze categorie worden doorontwikkeld. Bijvoorbeeld het gebruik van webcams.

Tekst

Dubbed Dasher (Open Source) is een voorbeeld van interface-besturing die het mogelijk maakt tekst in te voeren door middel van eye-tracking. De software, ontwikkeld door de universiteit van Cambridge, is volgens onderzoeker David J.C. McKay het best te vergelijken met een parachutesprong in een wereld vol letters. Iedere letter heeft zijn eigen gekleurde veld en op het moment dat men naar zo’n veld kijkt, wordt deze groter en verschijnen erbinnen weer kleinere velden met de volgende letter van het te formeren woord. De meest waarschijnlijke volgende letters van het woord worden hierbij het grootst getoond, waardoor een nieuwe gebruiker na een uur oefenen ongeveer 25 woorden per minuut kan invoeren. (video)

Deze technologie zou een goede bijdrage kunnen leveren aan tekstinvoer op handheld computers of voor het invoeren van tekst door mensen met een handicap. Ook de Japanse markt zou goed kunnen profiteren van een dergelijke applicatie, omdat het daar veel gebruikte QWERTY toetsenbord zich niet goed leent voor hun 46 karakters tellende alfabet. De technologie kan, gecombineerd met spraakherkenning, een sterk alternatief bieden voor het toetsenbord.

Selecteren

Een ander interessant voorbeeld van interface-besturing door eye-tracking is het kunnen selecteren van vensters en menu’s. Op die manier kan het gebruik van de muis worden omzeild en kan de gebruiker zijn handen op het toetsenbord houden. EyeWindows is een dergelijke toepassing, waarbij verschillende schermen naast elkaar in beeld staan. Op het moment dat de gebruiker een van de schermen bekijkt, vergroot dit scherm en worden de overige schermen kleiner gemaakt.