Ook wetenschappelijke informatie wil vrij zijn /reageer

Ook wetenschappelijke informatie wil vrij zijn

Een DNA-onderzoeker kan van een taalwetenschapper leren hoe je op een slimme manier grote hoeveelheden gegevens bekijkt. Deze en andere voorbeelden werden op 9 februari besproken tijdens de SURF Onderzoeksdag, een dag die vooral ging over data-samenwerking.

Delen was het sleutelwoord tijdens de door SURF en het Netherlands eScience Center georganiseerde onderzoeksdag. Een voorbeeld van samenwerking presenteerde de Leidse biomedicus Jan Bot. Tegenwoordig kun je met standaardapparatuur het genoom van levende wezens snel in kaart brengen. De verwerking van deze ruwe gegevens vergt echter veel computerkracht. Daarom doen de Nederlandse biomedici dat nu samen met het Life Science Grid.

Privésnelwegen

Dat bestaat uit zo’n 10.000 CPU-kernen en petabytes aan opslagruimte, verspreid over vijftien Nederlandse instituten. Voor de gebruikers werkt het grid als één computer, maar wel een bijzonder snelle. Bot: “In drie weken hebben we 15 miljoen jobs gedraaid: dat kost meer dan een eeuw computertijd op een pc.”

De volgende stap voor Bot en zijn vakgenoten is het gebruik van lichtpaden: privésnelwegen op het netwerk, waarlangs enorme hoeveelheden gegevens bliksemsnel verplaatst kunnen worden, zonder ooit ander verkeer tegen te komen. Ze zijn sneller, betrouwbaarder en veiliger dan de huidige methode: het versturen van massa’s harde schijven per post.

Vogeltrekvoorspelling

Op Schiphol alleen al botsen dagelijks twee vogels met vliegtuigen. Soms leidt dit tot een vliegramp. De Koninklijke Luchtmacht worstelde met dat probleem. Voor een oplossing kwam ze bij de ecologen van de UvA, zo vertelde hoogleraar Willem Bouten in zijn presentatie. “We zijn toen alle informatiebronnen over vogelwaarnemingen gaan bundelen in één beslissingssysteem. Ook internationale bronnen: allerlei radars, modellen, weerberichten en noem maar op.”

Dat was een forse uitdaging voor de betrokken informatici. Met de Luchtmacht-radar kun je een individuele gans op 150 kilometer aan zien komen, dus het laat zich raden wat voor datastromen er verwerkt moesten worden. Maar het is gelukt. Bouten: “Bij de voorbereiding van een militaire nachtvlucht zijn overdag liefst tweehonderd mensen betrokken. Dus als zo’n vlucht door een onverwachte vogelzwerm moet worden afgelast gaat er heel veel werk verloren. Maar nu kunnen we drie dagen van tevoren vertellen of de vlucht door kan gaan.”

Bovendien is deze dienst een openbare service geworden: op public.flysafe.sara.nl kan iedereen de vogeltrekvoorspelling raadplegen.

De vogeltrekvoorspelling in kaart gebracht

Gratis onderzoeksgegevens

Om data-intensieve samenwerking te stimuleren, hebben SURF en NWO het Netherlands eScience Center opgericht, zo legde SURF-directeur Wim Liebrand uit. De kleine e staat voor ‘enhanced’, omdat ICT wordt ingezet om kloven tussen verschillende vakgebieden te overbruggen. Op die manier willen de beide organisaties wetenschappelijke doorbraken mogelijk maken.

Het Tilburgse CentERdata laat nu al zien hoe dat zou kunnen. Elke maand zet dit instituut onderzoeksenquêtes uit bij zijn representatieve bestand van 5.000 Nederlandse huishoudens. De uitkomsten komen automatisch in een database die iedereen gratis via internet kan raadplegen. Hoe meer daar in komt, hoe meer je eruit kunt halen, ook om geheel nieuwe verbanden te ontdekken.

Internetweegschaal

Zo is CentERdata tevens medische gegevens gaan verzamelen, onder meer via weegschalen met een eigen internetverbinding. Daaruit bleek bijvoorbeeld dat het gemiddelde gewicht van de respondenten in de loop van de week daalt, om in het weekend snel te stijgen.

CentERdata sluit met zijn open toegang tot meetresultaten goed aan bij het standpunt van NWO, de organisatie die namens de overheid onderzoeksgelden verdeelt. “Gegevens die met publieke middelen zijn verzameld, moeten binnen kortere of langere tijd ook voor andere onderzoekers beschikbaar komen,” zo vatte NWO-voorzitter Jos Engelen het in zijn toespraak samen.

Frictie wegnemen

Waarom het delen van wetenschappelijke informatie zo belangrijk is, werd helder uit de doeken gedaan door de Britse onderzoeker Cameron Neylon (zie foto onder). Hij liet zien dat er in het huidige systeem, met dure wetenschappelijke tijdschriften, veel te veel frictie zit: voor té veel mensen wordt het te moeilijk gemaakt om kennis te nemen van wat er bedacht en gevonden wordt. Hoe meer mensen erbij kunnen, hoe groter de kans dat iemand er iets mee doet wat niemand had verwacht.

De kwantiteit van het internet leidt volgens Neylon tot kwalitatief andere mogelijkheden. Als voorbeeld haalde hij een blog-item aan van Timothy Gowers. Deze gelauwerde wiskundige testte de mogelijkheden van massale samenwerking via internet door zijn lezers een theorie voor te leggen waarvoor hij zelf het bewijs niet rond kreeg. Tot zijn verrassing kwam de (verrassende) oplossing al na een maand, nadat er zo’n duizend commentaren binnen waren gestroomd.

Cameron Neylon. Foto door Monique Kooijmans.

Zonder de vrije uitwisseling van digitale informatie was zo’n snel resultaat ondenkbaar geweest. Frictie wordt nu vooral veroorzaakt door dure tijdschriften. Neylon onderschrijft de boycot-actie van wetenschappers hiertegen. Desondanks ziet hij wel degelijk een rol voor uitgevers: die zijn immers goed in het aanwijzen van de beste artikelen voor specifieke vakgebieden.

Maar de informatie zelf moet vrij toegankelijk zijn. Dat is uiteindelijk in ieders belang: van de auteurs die er maximale aandacht voor willen; van de ‘funders’ die willen dat hun investering zo veel mogelijk vrucht draagt; en van de maatschappij die de vruchten kan plukken.

AppStore voor wetenschappers

Een goede manier om onderzoeksgegevens te delen is via ‘verrijkte publicaties’: dat zijn wetenschappelijke artikelen waar onder meer links bij zitten naar de gebruikte databestanden, zodat geïnteresseerde lezers de onderbouwing kunnen navolgen. Een voorbeeld is de verrijkte publicatie van Jan Gutteling over risicocommunicatie door de ogen van de burger. Guttelings publicatie werd door SURF in het zonnetje gezet als verrijkte publicatie van het jaar.

Voor Nederlandse onderzoekers is het nu gemakkelijk gemaakt publicaties en data veilig op te slaan en deze vervolgens in samenhang te presenteren op internet in een verrijkte publicatie. Dat gaat even eenvoudig als het kopen van een beker koffie bij Starbucks, zo demonstreerde de Utrechtse socioloog Richard Zijdeman.

Het gaat via myResearch Portal, een website waar onderzoekers allerlei handige tools kunnen vinden – een AppStore voor wetenschappers volgens Zijdeman. De portal is nu nog een demonstratiemodel en wordt ontwikkeld door SURF in samenwerking met DANS.

Zijdeman benadrukte dat onderzoekers ‘incentives’ nodig hebben om hun data online te zetten. Het is immers extra werk en “datasets mailen niet over problemen met opdrachten, studenten wel,” zo constateerde hij.

Zichtbaarheid als onderzoeker

MyResearch Portal biedt zulke incentives. Niet alleen in de vorm van de handige tools, maar ook doordat je er gemakkelijk je zichtbaarheid als onderzoeker kunt vergroten via de ‘digital author identifier’ ofwel DAI. Elke wetenschapper krijgt een unieke code en daarmee is er geen verwarring met naamgenoten.

In NARCIS heeft een wetenschapper daarmee een eigen pagina waar zijn contactgegevens zijn gekoppeld, evenals keywords voor zijn vakgebied(en) en zijn publicaties en andere prestaties. Zo kunnen collega’s die je bijvoorbeeld tijdens een internationaal congres hebt ontmoet jou en je werk snel vinden.

De presentatie van de portal paste dus goed bij het centrale thema van de SURF Onderzoeksdag: onderzoekers elkaar laten inspireren bij ICT-gebruik in hun onderzoek. “Kruisbestuiving helpen veroorzaken,” zoals SURF-directeur Wim Liebrand het samenvatte.

Ook interessant:

De ICT-storm in onderwijsland

Reageren via Facebook

Reacties

Over Aad van de Wijngaart