Soms mogen databases, afbeeldingen, of andere data door iedereen worden gekopieerd en hergebruikt. In andere gevallen is het auteursrecht strenger, en mag je een afbeelding bijvoorbeeld alleen bekijken. Deze voorwaarden waaronder data beschikbaar zijn, worden beschreven in licenties en gebruikersvoorwaarden.
Bij Open Data zijn die voorwaarden zo beperkt mogelijk. Deze datasets worden met een open licentie beschikbaar gesteld. Dat betekent dat toegang, maar ook hergebruik mogelijk is zonder dat er beperkingen zijn. Daardoor wordt het delen en gebruiken van data gestimuleerd. Bijvoorbeeld om transparantie te vergroten of om de data gemakkelijker voor economische of innovatieve doelen te kunnen gebruiken. Ook kunnen de rechtenvrije datasets gebruikt worden voor onderzoek.
Vaak wordt ook onder open data verstaan dat deze ‘machine readable’ moet zijn: de data moet opgeslagen zijn in een vorm die computers kunnen begrijpen. In principe hoeft dat niet: ingescande tekstocumenten kunnen ook in jpg als open data beschikbaar worden gesteld. Maar het doel van open data, hergebruik van de informatie, wordt dan wel lastiger. Aan een pdf kan je bijvoorbeeld moeilijker vragen stellen dan aan een database.
Daarnaast moet de data het liefst beschikbaar zijn in een open format. Dat betekent dat er geen dure software nodig is, maar gratis open source programma’s gebruikt kunnen worden om de data te lezen. Want ook dat zou het hergebruik van de data belemmeren. Veelgebruikte open uitwisselingsformats zijn csv en xml.
Open data betekent daarom: een open licentie, machine readable, en een open formaat. [2]
[1] Een dataset is een verzameling van gegevens/data.
[2] Folmer, E. 2013 : Pilot Linked Open Data Nederland, Amersfoort