Når åbne data bliver alvor
- Nyheder
Af Nikolai Bülow Tronche, Kontorchef i Digitaliseringsstyrelsen og del af Open Data DKs bestyrelse
Åbne offentlige data kan skabe større gennemsigtighed og effektivitet i den offentlige forvaltning, udgøre grundlaget for nye forretningsmodeller og danne grobunden for innovative grønne løsninger. Der er mange gode grunde til, at offentlige myndigheder stiller data til rådighed for omverden. Det beror imidlertid altid på en konkret politisk, økonomisk, etisk og juridisk vurdering, hvilke data der skal gøres helt åbne, og hvilke der må pålægges visse adgangsbegrænsninger. Både historien og vores samtid giver eksempler på, hvordan snittet er blevet lagt forskelligt ud fra, hvilken kontekst data indgår i.
Efterspørgslen efter flere og bedre data kommer mange steder fra. I 2021 gav Digitaliseringspartnerskabet[1] sine Visioner og anbefalinger til Danmark som et digitalt foregangsland, der bl.a. talte anbefalinger om dataforbedringer på en række specifikke områder og et tværgående overblik over offentlige data. I Digitaliseringsstyrelsen arbejder vi med AI-signaturprojekter og initiativet sprogteknologi.dk, der begge peger på gode og tilgængelige data som nøglen til udvikling af effektiv og ansvarlig kunstig intelligens i Danmark. Og fra Europa kommer der stadig flere krav om – og muligheder ved – at dele offentlige data.
Et europæisk indre marked for data
I Danmark, Europa og resten af verden investerer offentlige og private aktører i disse år store summer i indsamling af nye data, kvalitetsforbedringer af eksisterende data, infrastruktur til at dele data og slutprodukter, der gør brug af alle disse data.
I EU-regi sker de væsentligste offentlige investeringer gennem Digital Europe-programmet, som er investeringsbenet i den europæiske datastrategi. Med et samlet budget på ca. 50 mia. kr. har programmet til formål at bane vejen for et europæisk indre marked for data og digitale tjenester, der skal gøre det nemmere for virksomheder at udvide deres forretning til andre europæiske lande og for borgere at flytte deres tilværelse fra ét land til et andet uden al for stor møje. Et af midlerne til dette er gode offentlige data.
Man kan fx forestille sig en dansk virksomhed, som har specialiseret sig i geodata og gerne vil sælge sine produkter i Ungarn med brug af ungarske geodata eller en spanier, som gerne vil kende udbuddet af folkeskoler, inden teltpælene rykkes op, og familien flytter til Tyskland.
I Danmark er der igennem en årrække blevet investeret i offentlige data, bl.a. gennem statslige og fællesoffentlige digitaliseringsstrategier samt grunddataprogrammet. De danske og europæiske indsatser har begge – meget groft tegnet op – to overordnede delmål der skal indfries på vejen mod en levende dataøkonomi:
- Overblik: Det skal være nemt for brugerne at finde og vurdere de data, de leder efter.
- Adgang: Det skal være nemt for brugere at få adgang til de data, de efterspørger – naturligvis med de nødvendige begrænsninger, hvis der er tale om følsomme data.
Punkt 1 er baggrunden for Datavejviser, som du kan læse mere om her. Punkt 2 forudsætter de overvejelser, der ligger til grund for en beslutning om, hvordan man som myndighed skal stille sine data til rådighed. Er der grunde til,at de skal være tilgængelige for andre end skaberne i det hele taget, fx lovkrav eller efterspørgsel fra eksterne brugere? Og er der grunde, fx databeskyttelsesmæssige, til at de ikke skal være helt åbne for alle og enhver?
I Danmark er der nemlig ikke tradition for tværgående regulering, der stiller krav til, at offentlige data som udgangspunkt skal gøres åbne. Det vil sige, at Danmark ikke følger det, man kunne kalde et ”open by default”-princip. Den enkelte myndigheds forpligtelse til at stille data til rådighed findes i stedet i sektorspecifik lovgivning såsom CPR-loven, CVR-loven og lov om Danmarks Statistik.
Myndigheder har dog også mulighed for at stille yderligere data til rådighed end dem, de i streng juridisk forstand er forpligtet til, ud fra det man kan kalde et formålsbestemt princip for tilgængeliggørelse af data. Det kan fx være, hvis data er væsentlige for offentligheden at kende til, eller hvis de rummer et økonomisk eller miljømæssigt potentiale.
Den danske lov om videreanvendelse af den offentlige sektors informationer – i daglig tale PSI-loven – stiller primært krav om, hvordan myndigheder skal gøre, når de stiller deres data til rådighed for videreanvendelse, fx at anvendere af samme type – det kunne være to forskellige private virksomheder – skal have adgang til data på samme vilkår og ikke gennem ene- eller særaftaler.
De seneste år er der dog sket en bevægelse i retning af, at særligt europæisk regulering i højere grad end tidligere stiller krav til, hvilke data medlemsstaterne skal gøre tilgængelige for videreanvendelse. PSI-loven er den danske implementering af det europæiske åbne data-direktiv, som udpeger såkaldte datasæt af høj værdi, som offentlige myndigheder skal stille frit til rådighed. Der er tale om data, som i Danmark stort set alle var tilgængelige i forvejen[2], men sådan er det bestemt ikke i de øvrige europæiske lande, som i visse tilfælde står over for et større indsamlings- og tilgængeliggørelsesarbejde. Med til historien hører også, at denne gennemførselsretsakt er den første af forventelig flere, som i fremtiden kan stille krav om offentliggørelse af data, som ikke allerede er tilgængelige i Danmark.[3]
Som al anden europæisk regulering er udpegningen af datasæt af høj værdi resultatet af betydelige kompromiser. Her skal man forlige 27 landes divergerende kulturelle og politiske opfattelser af, hvad der på den ene side henhører til privatlivet eller til statens interne anliggender, og hvad der på den anden side kan stilles frit til skue. Det komplicerer det kun yderligere, at disse grænser heller ikke er stabile over tid. Det skal vi se nærmere på i det følgende.
Åben eller ej?
Det nemmeste for brugerne af offentlige data, og i nogle tilfælde også for ejerne af dem, er selvfølgelig, at data gøres åbne. Der er mange parametre, som data kan være mere eller mindre åbne på (juridiske, tekniske, økonomiske m.fl.), men ud fra en minimumsdefinition er data først åbne, når de er gratis at anvende og behæftet med få eller uvæsentlige begrænsninger for videreanvendelse. En sådan begrænsning kan fx være, at videreanvendelse sker med kreditering af den oprindelige kilde til data.
Inden de danske geodata i 2013 blev frikøbt som led i grunddataprogrammet, administrerede Geodatastyrelsen ca. 400 aftaler med borgere og virksomheder om betalt adgang til og brug af geodata.[4] Dette udgjorde ikke alene en betydelig forvaltningsopgave for myndighederne; det var samtidig en barriere for brugerne, særligt for små virksomheder, at skulle betale for data og sætte sig ind i vilkårene for at indgå en aftale.
De fleste kan til gengæld også blive enige om, at ikke alle data bør være åbne. Både historien og vores samtid rummer eksempler på, hvordan der hersker forskellige opfattelser om, hvilke data det er fornuftigt at gøre åbne for enhver, og hvordan disse grænser kan rykke sig, når data pludselig findes i en ny kontekst:
Det første eksempel stammer fra danmarkshistorien. I 1770 sad præsten J.D.W. Westenholz i Gjerlev Sogn lidt nord for Randers og funderede over et spørgsmål, som det såkaldte Generallandvæsenskollegium havde stillet. Kollegiet, datidens svar på et ministerium, var blevet oprettet i 1768 for at styrke enevældens reformer på landbrugsområdet.
I den forbindelse udskrev de en såkaldt prisopgave – datidens svar på at sende en analyseopgave i udbud. Spørgsmålene, som kollegiet gerne ville have svar på, var: Hvorfor er befolkningstilvæksten så lav blandt de danske bønder, og hvilke lovændringer eller øvrige initiativer kan enevælden gennemføre for at gøre noget ved det?
Som enhver god videnskabsmand måtte Westenholz have de grundlæggende fakta på plads, inden han kunne påbegynde sin analyse: For at give bud på, hvordan folketallet kan forøges, må man først kende folketallet. Det var dog ingen helt simpel sag i 1770, hvor der endnu ikke var noget centralt personregister, hvor fødsler, dødsfald, til- og fraflytninger kunne registreres. Men hvad der er endnu vigtigere i denne kontekst: Det var heller ikke helt ukontroversielt eller ufarligt at kende, eller rettere, offentliggøre folketallet.
For, som Westenholz skriver:
“Jeg tror, man kunne billig [med rimelighed] spørge, om det er mere tilladeligt for en lærd mand at angive i sine skrifter, hvor mange folk et land haver, end at angive, hvor mange kanoner der findes i en grænsefæstning“[5]
I dag er situationen selvfølgelig en helt anden, hvor man så nemt som ingenting kan forvisse sig om Danmarks befolkningstal ved et opslag på Danmarks Statistiks hjemmeside. Tanken om, at netop denne oplysning skulle være fortrolig og noget, der kan falde i uvedkommendes hænder, forekommer os fremmed. Til gengæld byder også nutiden på eksempler, hvor data i lyset af en ny kontekst får en helt anden betydning end den tilsigtede.
Westenholz påpegede et klassisk dilemma: De mest værdifulde data vil ofte også være de mest interessante for fjendtligt indstillede aktører at få fat i. At det også forholder sig sådan i dag, vidner krigen i Ukraine om. Også i Ukraine driver man som i Danmark en indsats for at tilgængeliggøre de offentlige data, hvor summen af argumenterne for og imod at gøre det bon’er positivt ud.
Her er gennemsigtighed en vigtig dagsorden, fx gennemsigtighed i, hvor udenlandsk økonomisk støtte kanaliseres hen, for på den måde at minimere risikoen for korruption. En anden type gennemsigtighed i den offentlige forvaltning er grundlæggende oplysninger om, hvem der er offentligt ansat, og hvor de arbejder. At offentliggøre den slags har imidlertid den uheldige konsekvens, at det giver den russiske hær en idé om, hvor den skal målrette sine angreb for at gøre mest mulig skade på statsapparatet.
Vær reflekteret, ikke frygtsom
Pointen med de ovenstående eksempler er, at det er svært én gang for alle at trække en streg i sandet og afgøre, hvilke data der skal være åbne, og hvilke der ikke skal. Det kræver en løbende vurdering og governance for at sikre, at data fortsat er værdiskabende og ikke udgør nogen risiko at have offentliggjort.
I mange tilfælde vil der helt givet være en meget lille eller ingen juridisk eller sikkerhedsmæssig risiko forbundet med at offentliggøre bestemte data som åbne data. Her er det i stedet organisatoriske og tekniske barrierer og spørgsmålet om det værdiskabende potentiale, der sætter grænser. Derfor er vi i Digitaliseringsstyrelsen glade for samarbejdet med Open Data DK, som hjælper kommuner, regioner og andre, som måske skal tackle disse spørgsmål for første gang.
Den danske og for så vidt også den europæiske tilgang er som nævnt ikke, at offentlige data partout skal være åbne, men at det skal være så nemt som muligt – og så besværligt som nødvendigt – for brugere at få adgang til de data, de efterspørger. Det betyder, at data har et passende niveau af åbenhed.
En fællesbetegnelse for mange af de indsatser for datadeling, der i disse år finder sted i EU-regi, er ”data spaces”. I disse data spaces skal data kunne handles på et marked, hvor køber og sælger i princippet kan være ukendte for hinanden forud for indgåelse af en aftale. Det kræver, at man kan gøre det klart, til hvad og af hvem de data, man sælger, kan bruges.
Derfor bliver et af svendestykkerne for Europa-Kommissionen i forbindelse med data space-arbejdet at opstille gennemskuelige betegnelser for, nøjagtig hvor åbne de data, som hverken er helt åbne eller helt lukkede, egentlig er. For de helt åbne data er der nemlig efterhånden europæisk konsensus om, hvordan man skal angive brugsbetingelser. Den tidligere nævnte gennemførselsretsakt for datasæt af høj værdi anbefaler klart brug af Creative Commons-licenser til åbne data, og Digitaliseringsstyrelsen anbefaler danske myndigheder at gøre det samme.
Ser vi omvendt på de helt lukkede data, er der her selvfølgelig ikke meget at være i tvivl om, når det gælder anvendelsesvilkår. Selvom disse kan være relevante for brugere og offentligheden at kende til eksistensen, er der ikke brug for nuancer i beskrivelsen af vilkårene for adgang og anvendelse.
Nuancer er der til gengæld brug for i de fleste andre tilfælde, og det er det, der gør arbejdet med offentlige data både fascinerende og til tider hjernevridende. Som de gennemgåede eksempler viser, afhænger disse nuancer af den historiske og kulturelle kontekst, som data indgår i. Sikkert er det, at data kommer til at spille en stadig større rolle i den europæiske økonomi, og i Digitaliseringsstyrelsen vil vi gøre vores til, at danske borgere, myndigheder og virksomheder er bedst muligt i stand til at gribe de muligheder, det giver.
Det fællesoffentlige åben data-samarbejde
- Den fællesoffentlige digitaliseringsstrategi 2022–2025 indeholder et initiativ med fokus på at øge adgangen til offentlige data. Initiativet løftes af Digitaliseringsstyrelsen, KL og Open Data DK.
Fodnoter:
[1] Et udvalg nedsat af regeringen bestående af eksperter fra arbejdsgiver- og lønmodtagerorganisationer, erhvervsorganisationer, offentlige myndigheder, universiteter mm.
[2] Såsom geospatiale og meteorologiske data, forskellige typer statistik og et register over virksomhedsejerskab. Den fulde liste kan ses her: https://eur-lex.europa.eu/legal-content/DA/TXT/HTML/?uri=CELEX:32023R0138&from=EN
[3] Derudover kommer den såkaldte dataforordning (data act) til at stille krav om, at private data i ekstraordinære situationer (såsom naturkatastrofer) kan kræves udleveret til offentlige aktører. Læs mere her: https://ec.europa.eu/commission/presscorner/detail/en/ip_23_3491
[4] Mads Bjørn-Møldrup og Tina Svan Colding: “Data er sluppet løs – frie geografiske data” i Geoforum Perspektiv 23-2013.
[5] J.D.W. Westenholz: Priisskrift om Folkemængden i Bondestanden, København 1772, s. 18.
Foto: Marcin Jozwiak fra unsplash.com
Artiklen er oprindelig bragt i magasinet Åbne offentlige data i september 2023