De data steward is de beheerder van de datakwaliteit en communicatie. Door het inzetten van data stewards, geef je data de aandacht die het verdient. Eigenlijk kun je de data steward zien als de manager van data: de schakel tussen data en de business. Je hebt met zijn allen één doel: de datakwaliteit naar een hoger niveau brengen en daar houden.
Tegenwoordig staan vacaturebanken vol met vacatures voor data stewards. Veel organisaties zijn bezig om een datagedreven werkomgeving in te richten. Ze zoeken medewerkers en gooien als het ware met vacatures in de hoop de juiste kandidaat te vinden. Helaas zie je veel verschillen tussen deze vacatures. Er is nog geen eenduidig beeld over wat een data steward moet doen. Sommigen zien het als een op zichzelf staande functie, terwijl anderen het zien als een taak binnen een functie.
De term data is bij ons bekend. Bij de term steward denk je al snel aan een beveiliger op een evenement of een stewardess bij een vliegmaatschappij. Deze stewards zorgen voor jouw veiligheid en leiden alles in goede banen. Deze omschrijving kun je ook gebruiken voor een data steward. De data steward zorgt er namelijk voor dat de beschikbare data volledig, betrouwbaar en correct is.
Waarom moet data volledig, betrouwbaar en correct zijn? Zoals we al eerder uitlegden in onze blog 'Wat is big data?', wordt data op verschillende manieren gecreëerd, opgeslagen en verwerkt. Elk systeem heeft zijn eigen manier om met data om te gaan. Hierdoor kun je verschillende documenten niet snel met elkaar vergelijken. Om data uiteindelijk voor data science te kunnen gebruiken, moet er een standaard zijn, zodat je de informatie makkelijk kunt vergelijken of eventueel aanvullen. Hier komt de data steward in beeld.
Een data steward zorgt voor de standaarden, processen en structuren die ervoor moeten zorgen dat de kwaliteit van de data behouden blijft. Je zou kunnen zeggen dat een data steward de overkoepelende beheerder van alle data is. Daarnaast komen er nog andere aspecten zoals persoonsgevoelige data en security bij kijken.
De standaarden die de data steward creëert, moeten er ook voor zorgen dat er geen gevoelige informatie in voorkomt. Mocht die informatie er wel inzitten, dan moet je die zo beveiligen dat er niks mee kan gebeuren, of het niet duidelijk herleidbaar is.
We hebben nu duidelijk wat een data steward doet met betrekking tot de data, maar er zijn nog veel meer taken. Als data steward ben je ook de contactpersoon tussen stakeholders.
Jij bent als het ware de vertaler tussen alle afdelingen.
Als een data scientist een fout tegenkomt en daardoor niet verder kan werken, ben jij de persoon die op zoek gaat naar degene die het probleem kan oplossen.
Om dit te doen heb je als data steward kennis nodig van de bedrijfsprocessen en structuren van de organisatie. Daarnaast heb je kennis nodig over hoe en waar jullie de data opslaan, bewerken en gebruiken.
Je kennis hoeft niet diepgaand te zijn, jij bent namelijk niet de persoon die daadwerkelijk met de data werkt. Met de kennis van de processen en structuren kun jij snel de juiste persoon aansturen.
Kort samengevat; als data steward ben jij de beheerder van de datakwaliteit en communicatie. Door het inzetten van data stewards, geef je data de aandacht die het verdient. Eigenlijk kun je de data steward zien als de manager van data: de vertaler tussen data en de business. Je hebt met zijn allen één doel: de datakwaliteit naar een hoger niveau brengen en daar houden.
Het is zijn passie om zijn kennis op een eenvoudige en positieve manier te doceren aan zijn studenten.