Wat is een Data Steward?

Leestijd 3 minuten

Wat is een data steward?

De data steward is de beheerder van de datakwaliteit en communicatie. Door het inzetten van data stewards, geef je data de aandacht die het verdient. Eigenlijk kun je de data steward zien als de manager van data: de schakel  tussen data en de business. Je hebt met zijn allen één doel: de datakwaliteit naar een hoger niveau brengen en daar houden.

Tegenwoordig staan vacaturebanken vol met vacatures voor data stewards. Veel organisaties zijn bezig om een datagedreven werkomgeving in te richten. Ze zoeken medewerkers en gooien als het ware met vacatures in de hoop de juiste kandidaat te vinden. Helaas zie je veel verschillen tussen deze vacatures. Er is nog geen eenduidig beeld over wat een data steward moet doen. Sommigen zien het als een op zichzelf staande functie, terwijl anderen het zien als een taak binnen een functie.

Wat betekent data steward?

De term data is bij ons bekend. Bij de term steward denk je al snel aan een beveiliger op een evenement of een stewardess bij een vliegmaatschappij. Deze stewards zorgen voor jouw veiligheid en leiden alles in goede banen. Deze omschrijving kun je ook gebruiken voor een data steward. De data steward zorgt er namelijk voor dat de beschikbare data volledig, betrouwbaar en correct is.

Waarom moet data volledig, betrouwbaar en correct zijn? Zoals we al eerder uitlegden in onze blog 'Wat is big data?', wordt data op verschillende manieren gecreëerd, opgeslagen en verwerkt. Elk systeem heeft zijn eigen manier om met data om te gaan. Hierdoor kun je verschillende documenten niet snel met elkaar vergelijken. Om data uiteindelijk voor data science te kunnen gebruiken, moet er een standaard zijn, zodat je de informatie makkelijk kunt vergelijken of eventueel aanvullen. Hier komt de data steward in beeld.

Data Governance wheel, Novalinq, Data steward
Data Governance wheel van Novalinq

Wat doet een data steward?

Een data steward zorgt voor de standaarden, processen en structuren die ervoor moeten zorgen dat de kwaliteit van de data behouden blijft. Je zou kunnen zeggen dat een data steward de overkoepelende beheerder van alle data is. Daarnaast komen er nog andere aspecten zoals persoonsgevoelige data en security bij kijken.

De standaarden die de data steward creëert, moeten er ook voor zorgen dat er geen gevoelige informatie in voorkomt. Mocht die informatie er wel inzitten, dan moet je die zo beveiligen dat er niks mee kan gebeuren, of het niet duidelijk herleidbaar is.

We hebben nu duidelijk wat een data steward doet met betrekking tot de data, maar er zijn nog veel meer taken. Als data steward ben je ook de contactpersoon tussen stakeholders.

Jij bent als het ware de vertaler tussen alle afdelingen.

Als een data scientist een fout tegenkomt en daardoor niet verder kan werken, ben jij de persoon die op zoek gaat naar degene die het probleem kan oplossen.

Om dit te doen heb je als data steward kennis nodig van de bedrijfsprocessen en structuren van de organisatie. Daarnaast heb je kennis nodig over hoe en waar jullie de data opslaan, bewerken en gebruiken.

Je kennis hoeft niet diepgaand te zijn, jij bent namelijk niet de persoon die daadwerkelijk met de data werkt. Met de kennis van de processen en structuren kun jij snel de juiste persoon aansturen.


Kort samengevat; als data steward ben jij de beheerder van de datakwaliteit en communicatie. Door het inzetten van data stewards, geef je data de aandacht die het verdient. Eigenlijk kun je de data steward zien als de manager van data: de vertaler  tussen data en de business. Je hebt met zijn allen één doel: de datakwaliteit naar een hoger niveau brengen en daar houden.

Deze blog is geschreven door:

Dewi de Baat

Mede-eigenaar & data architect

Het is zijn passie om zijn kennis op een eenvoudige en positieve manier te doceren aan zijn studenten.

Interesse?

Of je nu al een hele datastrategie hebt staan, of dat je nog moet starten, wij denken graag met je mee in het realiseren van een datagedreven organisatie. Laat je naam en telefoonnummer achter en wij nemen snel contact met je op.
Bedankt voor het invullen! We bellen je zo spoedig mogelijk terug.
Oops! Something went wrong while submitting the form.

Alle trainingen en opleidingen

Data Science opleidingen in Python en R voor beginners tot aan expert, data engineering met Azure en Spark en data visualisatie in PowerBI.