Nwe taaldatabank zkt 20.000 sms'jes
/reageer
-
door: Rob van Leeuwen over: internet, marketing, communicatie op: 27 september 2011 Nederlandse universiteiten zoeken 20.000 sms'jes voor taaldatabank.
“Wie een boodschap in weinig woorden over kan brengen, heeft goud in handen”
Ff sms’en over aand8 kan je niet vergelijken met het schrijven van een uitgebreide scriptie over het gebrek aan aandachtsspanne onder jongeren. Om de verschillen in taaluitingen te onderzoeken en nieuwe taaltechnieken te ontwikkelen, stellen Nederlandse universiteiten onder de naam SoNaR een 500 miljoen woorden tellende databank samen.
Sms’jes crowdsourcen
De databank zal worden beheerd door de Nederlandse Taalunie. Hij wordt in principe voor iedere onderzoeker toegankelijk en gaat alle denkbare soorten Nederlandse tekstuitingen bevatten. Dus niet alleen teksten uit boeken en tijdschriften, ook sms’jes, chats, tweets, scripties, ondertiteling, teletekst, Wikipediahoofdstukken en beleidsstukken zullen in de databank terug te vinden zijn.
Bij de verzameling van sms’jes wordt de hulp van het publiek ingeroepen. Tot 1 december wil SoNaR 20.000 sms’jes verzamelen. Iedereen kan een bijdrage leveren, bijvoorbeeld door sms’jes anoniem met behulp van een Android-applicatie naar SoNaR te versturen.
Alles moet korter
Het is niet voor niets dat specifiek om sms’jes wordt gevraagd, zegt Maaske Treurniet van de Radboud Universiteit Nijmegen: “In tegenstelling tot tweets zijn sms’jes vaker privé en niet openbaar beschikbaar, dus moeten mensen echt overgehaald worden om te doneren.”
Sms’jes zijn interessant als onderzoeksonderwerp, want je wordt beperkt in aantal woorden, daarnaast moet je betalen voor elke sms. Dat beïnvloedt het taalgebruik: iemand die een sms verstuurt, wil dat zo efficiënt mogelijk doen. Treurniet: “Daarnaast moet tegenwoordig alles korter. Wie een boodschap in weinig woorden kan overbrengen, heeft dus goud in handen.” Van gulle gevers wordt ook geslacht, leeftijd en woonplaats vastgelegd.
Google Translate,T9 en Swype
De databank zal jarenlang als bron gebruikt worden voor wetenschappelijke onderzoek, zegt Treurniet. “Dit wordt het meest gebruikte materiaal voor vragen uit de samenleving en het bedrijfsleven naar taalgebruik. Wat is de invloed van nieuwe communicatiemiddelen op spelling onder de jeugd? Kan je de leeftijd van iemand inschatten op basis van een sms? Dat levert ook interessante inzichten op voor het bedrijfsleven, bijvoorbeeld voor marketeers.”
Resultaten kunnen niet alleen interessant zijn voor marketingdoeleinden, ook voor de ontwikkeling van nieuwe technieken is onderzoek naar taalgebruik noodzakelijk. SoNaR noemt bekende toepassingen als Google Translate, T9 en Swype, waarvoor kennis van taalgebruik noodzakelijk was, maar geeft ook hulpmiddelen voor mensen met dyslexie als voorbeeld. Wie een bijdrage wil leveren aan de database, kan voor meer informatie terecht op de website van SoNaR.
Reacties
- Er zijn nog geen reacties.
- Reageer zelf
Reageren via Facebook