Bericht

De Databoekhouding: Metadata als fundament voor fatsoenlijk Data Management

Iedere organisatie voert een boekhouding op basis waarvan er winst- en verliesrekeningen, de staat van baten en lasten en prognoses wordt opgesteld. Deze boekhouding geeft inzicht in de financiële stand van zaken van een organisatie. Enerzijds omdat de wet compliance vereist, anderzijds omdat een organisatie een rapportage- of verantwoordingsplicht kent richting de overheid (bijvoorbeeld de Belastingdienst), Raad van Bestuur, toezichthouders en natuurlijk de aandeelhouders. En natuurlijk is een organisatie hierdoor in staat om op basis van de financiële feiten de organisatie te besturen en waar nodig bij te sturen.

Dat organisaties een nauwgezette boekhouding voeren vinden we een normale gang van zaken. De afgelopen decennia zijn bijna alle bedrijfsvoeringen in meer of mindere mate geïnformatiseerd. Met het gevolg dat de bedrijfsvoering anno 2024 een sterke afhankelijkheid heeft gecreëerd van het (bij)product van deze informatisering in de vorm van data. Organisaties spreken steeds vaker de ambitie uit dat ze datagedreven willen werken, waarbij data de basis vormt om tot besluitvorming te komen.

Maar hoe compliant en transparant zijn organisaties als het gaat om het gebruik van data? Denk hierbij aan het toepassen van de Europese verordeningen zoals GDPR en de AI Act. Hoe is het gesteld met de data-ethiek? Is er zicht op de doelbinding, dus waarom ergens data voor wordt gebruikt? En kunnen organisaties transparantie bieden als het gaat om de gegevens van de burgers en bedrijven waarmee zij werken? Is er wel genoeg vertrouwen in de data die de basis vormt voor veel strategische beslissingen?

De databoekhouding: metadata

Om grip te krijgen op de data in de organisatie, is het nodig een goede administratie te voeren over het datagebruik binnen de organisatie. Deze administratie noemen we metadata. Op basis van deze metadata, ofwel databoekhouding, kun je verantwoording afleggen over de beschikbare data en het gebruik van deze data in de organisatie. Voor de gebruikers van de gegevens, zodat zij begrijpen wat de betekenis van de data is en dat de data rechtmatig en ethisch wordt gebruikt. Voor de toezichthouders en zeker ook richting de burgers, klanten en bedrijven waarvan de data wordt verwerkt.

De 5 W’s + H van de DATA

Om de informatiebehoefte van een organisatie in kaart te brengen worden geaccepteerde methodieken gebruikt. Voor een goede databoekhouding geldt hetzelfde. Welke gegevens over het datagebruik horen thuis is deze boekhouding? En hoe komt metadata tot stand?
Metadata is informatie over de data, dus dezelfde methodieken om de informatiebehoefte te bepalen zijn hier van toepassing . Een van deze methodieken is bekend onder de naam De 5W’s + 1H en komt voort uit de informatievergaring zoals die bijvoorbeeld in de journalistiek en bij informatieanalyse wordt gebruikt.

5W + 1H staat voor “wie, wat, waar, wanneer, waarom en hoe”. Dit zijn de fundamentele vragen die als hulpmiddel gebruikt worden om duidelijkheid te creëren over de context rondom een feitelijke situatie.

  • Wie: De “Wie” vraag richt zich op het subject of vanuit welke rol het subject handelt.
  • Wat: Met de “Wat” vraag gaan we op zoek naar de onderwerpen, dus de objecten en gebeurtenissen, waarover we gegevens verzamelen.
  • Waar: De “Waar” vraag gaat op zoek naar de fysieke of logische locatie van het object of subject. Een logische locatie is bijvoorbeeld een verwijzing naar een locatie in de digitale wereld.
  • Wanneer: Wanneer gaat over de tijdsaanduiding. Afhankelijk van de behoefte aan nauwkeurigheid kan deze tijdaanduiding grofmazig (bijvoorbeeld jaar, maand) of fijnmazig (seconde, milliseconde) zijn.
  • Waarom: Deze vraag zoekt naar de redenen of oorzaken. Waarom is iets relevant? Waarom is iets gebeurd?
  • Hoe: Het “Hoe” gaat in op de handeling(en) die verricht worden of zijn verricht met als doel iets voor te schrijven, te verklaren of te verantwoorden.

Context van de Data levenscyclus

Deze 5W’s + 1H vragen kunnen we stellen in de context van de fasen in de Data levencyclus: Plan, Design & Enable, Create/Obtain, Store/Maintain, Use/Share, Enhance, Dispose of. Hieronder wordt een aantal voorbeelden van metavragen gegeven:

  • Design: Wat is de betekenis van een zeker gegeven? Wat is de structuur van de data – het datamodel? Welke methodiek wordt gebruikt?
  • Create: Wat is de bron van de data? Wie heeft de data gecreëerd? Wanneer is de data gecreëerd?
  • Use/Share: Hoe is de toegang tot de data georganiseerd? Welke procedures worden gehanteerd? Hoe is de beveiliging geregeld? Met welk doel wordt de data verwerkt of gedeeld met (externe) gegevenspartners?
  • Store: Op welke locatie wordt de data opgeslagen?
  • Dispose : Welke bewaartermijnen zijn van toepassing op de data, hoe worden deze gehandhaafd ?

Integrale aanpak

Metadata is dus data in de context van data. Er bestaat een groeiend besef dat een data management initiatief minimaal één administratief component moet bevatten om het initiatief succesvol laten zijn. Ondertussen zijn er talloze tools beschikbaar die het voeren van een databoekhouding ondersteunen. Denk hierbij aan applicaties waarmee een business glossay, een datamodel of gegevenstoegangbeheer wordt opgesteld of beheerd. Dit zijn vaak losse oplossingen met eigen administraties (repositories) met als resultaat een versnipperd metadatalandschap met de nodige redundantie. Verschillende plaatsen waar de nodige metadata-kwaliteit en metadata-integratie vraagstukken zullen ontstaan als we willen toewerken naar een integrale databoekhouding.
Dit pleit voor een integrale metadata aanpak, bij voorkeur op een geïntegreerd platform waar de data en de metadata zo dicht mogelijk bij elkaar integraal beschikbaar, bevraagbaar en toepasbaar zijn. 

Van data naar metadata

Het bijhouden van een databoekhouding is net zo vanzelfsprekend als het voeren van een financiële administratie. Alleen zo kun je verantwoording afleggen over het gebruik en de kwaliteit van data. Metadata vormt daarbij het fundament voor een toekomstbestendige aanpak van Data Management en Data Governance.

Van de data professional-van-de-toekomst zullen er steeds vaker skills op het metavlak en minder op het technische vlak worden gevraagd. Mijn advies aan alle “data-professionals-van-nu” is daarom: Weest voorbereid!

Denny de Jonge

Data Architect