De zes meest gebruikte datakwaliteit dimensies

De zes meest gebruikte datakwaliteit dimensies

Er zijn verschillende dimensies die kunnen bijdragen aan het meten van de datakwaliteit. Welke dimensies voor je organisatie relevant zijn, hangt af van de context waarin de data worden gebruikt en waarvoor de organisatie ze wilt gebruiken. Organisaties kiezen vaak de meest relevante dimensies om de datakwaliteit op te meten.  

Hieronder worden enkele van de meest gebruikte dimensies van datakwaliteit uitgelegd: 

  1. Nauwkeurigheid: Nauwkeurigheid verwijst naar de juistheid van de data. Data wordt als nauwkeurig beschouwd als het de werkelijke waarden of kenmerken weergeeft dat geacht wordt weer te geven. Onnauwkeurige data kan leiden tot onjuiste conclusies en beslissingen. Een bron met verouderde data over de leeftijd van klanten is bijvoorbeeld niet nauwkeurig.  
  2. Compleetheid: Compleetheid beoordeelt de aanwezigheid van alle vereiste data-elementen in de dataset, zonder ontbrekende of weggelaten waarden. Data moet volledig zijn en alle informatie bevatten die nodig is voor het beoogde gebruik. Incomplete data kan leiden tot een belemmering van het effectief gebruik en analyses.  
  3. Consistentie: Consistentie gaat over de afwezigheid van tegenstellingen of verschillen tussen verschillende data-elementen, ofwel tussen verschillende datasets of binnen de dataset. Data moeten consistent zijn, zowel binnen zichzelf als met ander gerelateerde data. Inconsistenties kunnen leiden tot verwarring en tegenstrijdige resultaten. Als bijvoorbeeld het adres van een klant in de data van de verkoopafdeling anders is dan het adres in de data van de financiële afdeling, dan is de data niet consistent.  
  4. Actualiteit: Actualiteit heeft betrekking op de relevantie en actualiteit van data en zorgt ervoor dat deze up-to-date en goed voor de besluitvorming zijn. Actuele data is up-to-date en relevant voor de specifieke use case. Verouderde data kan misleidend zijn en leiden tot slechte besluitvorming. Actuele data is bijvoorbeeld erg belangrijk voor de handel.  
  5. Validiteit: Validiteit zorgt ervoor dat data voldoet aan regels of normen, wat bevestigt dat het geschikt is voor het beoogde doel. De regels kunnen gaan over structuur, zoals de juiste codering voor diagnoses en behandelingen in de geneeskunde.  
  6. Uniekheid: Uniekheid beoordeelt hoe vrij een dataset is van dubbele gegevens. Hierbij wordt herhaalde of overbodige informatie geïdentificeerd en geëlimineerd, dit zorgt er dat elke data-invoer afzonderlijk is. Het behoud van uniekheid is cruciaal voor nauwkeurige analyse, besluitvorming en data-integratie, waardoor de algehele betrouwbaarheid en efficiëntie van de dataset wordt verbeterd. 

Het is belangrijk op te merken dat niet alle dimensies even relevant zijn binnen je organisatie, dit verschilt per data-element, dataset en zelfs eindgebruiker. In een financiële context kan actualiteit bijvoorbeeld heel belangrijk zijn, terwijl in de gezondheidszorg consistentie als prioriteit kan worden gesteld.  

Benieuwd hoe je controles op datakwaliteit kunt implementeren binnen je organisatie? Bekijk deze pagina of neem contact met ons op! 

Veelgestelde vragen:

Datakwaliteit verwijst naar de nauwkeurigheid, volledigheid, consistentie, actualiteit, validiteit en uniekheid van de data binnen een dataset.

De zes dimensies van datakwaliteit zijn: nauwkeurigheid, volledigheid, consistentie, actualiteit, validiteit en uniekheid.