Big Data is booming business, je hoort het steeds vaker. Big Data is een term voor een enorme verzameling gegevens die via allerlei platformen kan worden verzameld. Denk aan zoektermen, locatiegegevens, likes en clicks. Het is een logisch gevolg van de digitalisering van de maatschappij: met een enorme en steeds maar groeiende verscheidenheid aan bronnen wordt steeds meer data gegenereerd en opgeslagen. Bij het simpelweg inloggen in de Facebook-app op je telefoon wordt bijvoorbeeld al je locatie opgeslagen, het feit dat je op dat moment hebt ingelogd, met welk apparaat je dit hebt gedaan en welke versie van de app en het besturingssysteem je apparaat gebruikt. Even de bus pakken naar tentamen? Met het in- en uitchecken worden je haltes opgeslagen door de vervoerder. Vele internetdiensten die ‘gratis’ zijn, betaal je eigenlijk met je gegevens. Tegenwoordig wordt zo goed als alles dat je op internet doet opgeslagen, geanalyseerd en gebruikt om ‘de markt’ beter te begrijpen en te kunnen bedienen.

Al die gegevens die verzameld worden door een onderneming zijn gegevens van jou en mij, maar het is voor mij niet per se inzichtelijk welke gegevens die onderneming nu precies van mij heeft. Als het goed is wordt al die data geanonimiseerd en samengevoegd met die van anderen (geaggregeerd). Het privacy-issue daarbij laat ik hier nu achterwege, maar hoe zit dat met de eigendom van die data. Is dat niet mijn data? Of is dat de data van die onderneming? Wanneer de data geaggregeerd is kun je beargumenteren dat die data vermengd is, en derhalve nu aan de onderneming toebehoort. Anderzijds kun je ook stellen dat je nu aandeelhouder van de grote hoeveelheid data bent, maar kun je dan ook met z’n allen als aandeelhouders optreden?

Die geaggregeerde data is omvangrijk en groeit steeds sneller. Het is voor jou en mij onmogelijk om deze door te spitten op bruikbare gegevens, laat staan om ook nog eens verbanden te gaan leggen. Gelukkig zijn computers geschikter voor het doornemen van grote hoeveelheden data. Om dat echter op een efficiënte wijze te doen, én met een output waar men wat mee kan, dienen er algoritmes te worden bedacht welke verbanden kunnen maken. Begrijpelijk is dat wanneer men een goed algoritme heeft, hele waardevolle informatie geabstraheerd kan worden uit al die gegevens. Die informatie kan een onderneming ‘business intelligence’ opleveren die bijvoorbeeld een marketingafdeling kan helpen beter te ‘targeten’. Het zal voor de onderneming dan ook van groot belang zijn een dergelijk algoritme te beschermen, maar wat zijn de mogelijkheden daartoe?

Een algoritme is in essentie een reeks instructies, een soort stappenplan dat wordt toegepast op gegevens om een bepaalde uitkomst te genereren. Om een dergelijk stappenplan te kunnen beschermen zal het auteursrecht weinig soelaas bieden, nu het erg lastig is om te spreken van een oorspronkelijk karakter of persoonlijk stempel bij een stel instructies die je gelijk kunt stellen aan een wiskundige formule. Een technisch effect ligt misschien meer voor de hand, dus kan een octrooi uitkomst bieden? Het criterium van de industriële toepasbaarheid lijkt op een algoritme niet per se van toepassing, maar wederom is het de wiskundige formule die niet octrooieerbaar is.

Hetgeen resteert is het bedrijfsgeheim. Dit biedt een brede toepasbaarheid welke ook bescherming kan bieden aan een algoritme. Een non-disclosure agreement voor medewerkers en eventuele partners kan een goede optie zijn. Tevens lijkt een concurrentiebeding onmisbaar, zodat de briljante bedenker van het algoritme zijn kennis niet tevens bij een eventuele concurrent kan inzetten.

Wanneer het algoritme de geaggregeerde data heeft verwerkt leidt dat tot een output, een nieuwe dataset. Deze data kan zeer waardevol zijn voor een onderneming, omdat zij haar bedrijfsvoering op deze nieuwe informatie kan aanpassen en zo mogelijk meer omzet of marktaandeel kan behalen. Hoe zit het echter met de bescherming van deze output?

Deze vraag lijkt eenvoudig te beantwoorden door middel van het databankenrecht. Door methodische ordening van data ontstaat een verzameling van gegevens welke is verkregen door een algoritme. Dit algoritme is de substantiële investering, omdat een dergelijk algoritme niet bepaald eenvoudig te maken is, getuige het feit dat er inmiddels opleidingen worden opgezet om hiermee om te leren gaan.

Ik hoop dat jullie iets meer te weten zijn gekomen over de ‘achterkant’ van Big Data, daar waar grote investeringen en risico’s voor de onderneming zitten.

 

Namens de redactiecommissie,

 

Ruben Verweij

Bron