Arbetssätt - Mäta - Samband och förhållandet mellan olika kvalitetskategorier

Datakvalitetsstandarden ISO 19157 innehåller fem kategorier av datakvalitetsegenskaper förutom användbarhet. Flera av kvalitetskategorierna är relaterade till varandra och i vissa fall kan det vara svårt att avgöra till vilken kategori avvikelserna eller felen tillhör och var de skall redovisas.

För ytterligare information se ISO 19157:2013, Bilaga I.

Exempel på samband mellan fullständighet och ”aktualitet”

En datainsamlingsprocess kan fungera mer eller mindre bra och detta kan leda till brist på objekt i en viss objekttyp. Alla objekt som finns i verkligheten finns inte representerade i databasen. Det kan t.ex. beror på att ajourhållningen inte sker tillräckligt snabbt efter att en förändring i verkligheten har skett (ett aktualitetsproblem), eller att insamlingsprocessen har brister så att vissa förändringar inte rapporteras in och därmed kan ajourhållas.

Exempel på samband mellan fullständighet och tematisk noggrannhet

Saknade (ej ifyllda) obligatoriska attributvärden skall redovisa som fullständighet - brist. Om de istället räknas som tematiska fel kommer redovisningen för tematisk noggrannhet att bli sämre än vad den i verkligheten är.

Vid uppdatering kan data av misstag registreras som fel typ av objekt. Denna objekttyp får då en övertalighet samtidigt som den rätta (avsedda) objekttypen kommer att uppvisa en brist. Orsaken till att sådana misstag kan vara tematiska klassificeringsfel, antingen av misstag eller för att klasserna är otillräckligt beskrivna så att fel uppstår.

Vid utvärdering av klassificeringsnoggrannhet är det viktigt att veta till vilken klass felklassificeringen blivit. Det har stor betydelse om felet resulterat i en näraliggande klass eller något helt annorlunda, exempelvis om barrskog felaktigt klassats till den näraliggande klassen blandskog eller till vatten. För att kunna separera olika typer av fel kan man använda en förväxlingsmatris, vilken finns både som en absolut och en relativ version (antal resp. andel).

Tematisk noggrannhet kvalitativa attribut omfattar felaktigheter i attributvärden som kan finnas utöver bristande format- och domänkonsistens. Med andra ord ska värdena vara giltiga, men felaktiga för att rapporteras i denna datakvalitetsegenskap.

Exempel på samband mellan lägesnoggrannhet och tematisk noggrannhet

Om två vägsträckor efter varandra med olika värden för hastighetsgräns byter värde vid en viss punkt som ligger fel så är det ett lägesfel och inte ett tematiskt fel. T.ex. på en sträcka har man hastigheten 50km/h som växlar till 70km/h efter 300m. I verkligheten är hastighetsförändringen efter 200m vilket betyder att läget för förändringen är felaktigt.

Figur: Exempel på skillnaden mellan lägesnoggrannhet och tematisk noggrannhet

Exempel på samband mellan fullständighet och lägesnoggrannhet

Om ett objekt i datamängden och motsvarande företeelse i verkligheten är samma objekt men de skiljer i läge så är det en avvikelse i lägesnoggrannhet. Däremot om ett objekt i datamängden som tros motsvara en företeelse i verkligheten inte gör det, är det objekt som finns i datamängden övertaligt. Men om företeelsen som finns i verkligheten saknas i databasen så är det en brist.

Om träd D i verkligheten motsvaras av träd D i databasen så har träd D ett lägesfel i databasen. Om träd E i databasen inte motsvaras av träd F i verkligheten så är träd E i databasen övertaligt och träd F är en brist i databasen då den saknas.