Hva er Test Data Management (TDM)?
TDM er et begrep som omfavner prosessen ved å ha riktige testdata til rett tid.  TDM er en viktig dimensjon/komponent i prosessen for å kunne utføre effektiv testing, enten de er manuelle eller automatiserte. TDM grenser til test-automatisering, service virtualisering, personvern og kan være viktig for å bidra til å automatisere bygg  og release.

 
Foto: CA technologies

 Hvorfor er det blitt mer aktuelt nå enn tidligere?

1) Det er kommet pålegg fra styresmaktene at sensitive persondata, som for eksempel paragraf 7 og 8. (hemmelige adresser etc) skal maskeres.
Den nye loenv vedtatt av EU trer i kraft i midten av 2018. Her er det klare regler for hvordan sensitive data må håndteres. Dette er et ganske strengt regelverk som blir kraftig bøtelagt ved overtredelser.

2) For å bidra til kortere gjennomløpstid (devops/agile på sterioder) gjennom å sørge for at test data er tilgjengelig til:

- riktig tidspunkt (ved hvert bygg, ved opprettelse av nytt testmiljø etc.)
- riktig sammensetning (ihht. strategi/test-teknikk, personvern, «kompliance» etc.)
- riktig mengde (ytelsestest, sikkerhetstest etc.)

3) Tradisjonelt har en benyttet produksjonsdata til test. Det er bare blitt kopiert prod. data til det ulike testmiljø med ulike "status på dataene"

- "Alle" tester på prod data fordi en tror at det er enklest. I noen tilfeller er det også det….

4) Test data har tradisjonelt vært ett «vanskelig» og utfordrende område både mhp. Planlegging og gjennomføring (flaskehals). 

5) Hvert prosjekt har hatt sine eget system for å håndtere test data, det er tidkrevende og dyrt.

6) Kravene til kvalitet og mengde på test dataene er høye, det kan være en utfordrende oppgave å generere gode test data uten å bruke verktøy eller å ha en god prosess rundt dette. (ref. at alt skal skje så fort og samtidig skal det være høy kvalitet).

7) Forventning og trender mot å ha kortere gjennomløpstider og kontinuerlig testing krever at godt system for å håndtere test data.

Hvordan er TDM «prosessen» bygd opp?

-Definere data: Bygge en database/datavarehus fra de ulike datakildene

-Sortere data: Oppdage mulig sensitiv informasjon (mot for eksempel. GDPR)

-Lage datasett: Lage riktige mengder av test data (trenger ikke kopiere alt fra produksjon)

-Maskere data: Lage realistiske data i dev/test/stage uten å bryte personvern og/eller sikkerhetskrav

-Validere data: Sjekk opp mot krav til datapresisjon og kompliance

-Gjenbruke data: Lagre datasett slik at de lett kan gjenbrukes eller vhja. Selvbetjeningsløsning.

Kjente fordeler med TDM

-Redusere kraftig bruk av test data prosessen (rundt 90% er nevnt)

-Mindre ventetid for testmiljø og testdata (rundt 35% er nevnt)

-Jobben med å lage datasett og maskere data blir enklere

-Riktig skalering av miljøer og datakilder/databaser

-Levere test data til riktig tid

-Mindre infrastruktur kost

-Riktig sammensetning av data (strategi og scenarioer)

-Ikke ødelegge hverandres test data.

Hvem er kjente aktører innenfor domenet TDM?

IML Informatica, IBM Optim, SAP TDMS, CA TDM (Datamaker), Actifio, Compuware, Oracle, Solix, Tricentis, Datprof, Infosys.

Det er fullt mulig å lage en egenutviklet løsning for å håndtere test data, da tenker jeg på å dekke enkle elementære behov.