Spesso occorre condividere i propri dati personali all’interno dei database, soprattutto nello sviluppo di processi aziendali e amministrativi ma questo ovviamente aumenta il rischio di data breach. Una soluzione efficace però potrebbe essere il data masking, una misura tecnica per l’offuscamento dei dati.
Il data masking consiste nel “mascherare” i dati sensibili originali con dei dati fittizi generati con anonimizzazione e varie procedure di offuscamento in modo che non siano poi correlabili con l’identità originaria dell’interessato, mantenendo la garanzia di poter fruire delle informazioni.
Per capirne meglio il meccanismo basti pensare che le imprese nelle sviluppo di procedimenti amministrativi o aziendali devono molto frequentemente condividere grandi quantità di dati personali con utenti esterni o interni all’azienda ma non con le medesime specifiche.
Tra questi troviamo anche organizzazioni che eseguono manutenzione, applicazioni varie, marketing e ricerca. Si tratta per l’appunto di attività che anche se strettamente necessarie aumentano l’esposizione dei dati personali, con il conseguente rischio di data breach e che, potrebbero avere un rilevante impatto anche sulla reputazione dell’azienda e della fiducia che i clienti ripongono i essa.
Diventa dunque di fondamentale importanza capire come ridurre al minimo le possibilità di data breach. Quali sono le possibili soluzioni?
La misura tecnica del data masking
L’anonimizzazione e la pseudonimizzazione comportano l’offuscamento dei dati e viene dunque impedita una chiave di decifratura, mentre tramite il mascheramento dei dati personali con dati fittizi è ancora possibile trovare il modo di decifrare i dati nel caso ce ne fosse il bisogno.
Questo risultato si può ottenere con il data masking I.E., un processo che permette il mascheramento dei dati sostituendo permanentemente i dati personali con dati fittizi che non sono reali, ma sono comunque realistici e possono mantenere l’integrità referenziale e quindi l’aspetto funzionale delle azioni aziendali. In questo modo si ha la possibilità di eseguire in modo affidabile analisi, test ricerche e sviluppo.
Il data masking è ormai una misura tecnica già diffusa in modo globale da molto prima dell’emanazione del GDPR con lo scopo di proteggere tutte le seguenti tipologie di dati sensibili esposti.
- PII (Personally Identifiable Information)
- PHI (Protected Health Information)
- PCI/DSS (Payment Card Industry Data Security Standard)
Tipologie di data masking
Per le operazioni di data masking ci si può avvalere di diversi tools, anche open source che funzionano tramite due modalità. Una statica ed una dinamica.
In quella statica si crea una vera e propria replica dell’intero database identica all’originale tranne per i capi che devono essere mascherati. In questo modo i dati verranno mascherati in modo permanente e non reversibile.
Nel caso della modalità dinamica invece i dati originali vengono conservati nel repository e sono accessibili da un’applicazione che, autorizzata dal sistema agisce sui dati oscurandoli e solo dunque gli utenti autorizzati possono vedere i dati reali.
Tecniche di mascheramento dati
Le tecniche di data masking vanno sempre adattate alle particolari esigenze organizzative e produttive dell’azienda.
Sostituzione: i dati originali vengono sostituiti agli originali con dati casuali estrapolati da un set preimpostato.
Rimescolamento: tecnica simile alla sostituzione che mescola i valori tra le righe in modo da sembrare autentico ma senza rivelare nessuna informazione privata reale.
Variazione: vengono variati i numeri e le date al fine di offuscarli in un intervallo di tempo prestabilito esempio 120 giorni.
Crittografia: in questo caso è un algoritmo di crittografia a mascherare i dati. ( tecnica poco usata perché comporta la perdita di integrità referenziale e dati non utilizzabili per test ed analisi).
Cancellazione: con questa tecnica i dati vengono eliminati e sostituiti con valori nulli e anche in questo caso la tecnica non è adatta all’esecuzione di test.
Mascheratura: con la mascheratura viene mascherata solo una parte di dati originali. Comporta gli stessi effetti dell’annullamento poiché non è efficace per test e analisi.
Processo di data masking
Il processo di data masking dei dati personali sia dinamico che statico viene disegnato seguendo un modello ciclico che comporta le seguenti fasi
- Individuazione dei dati da mascherare: il database deve individuare i dati personali da mascherare e le relazioni potenziali che vanno salvaguardate e conservate fino al termine del processo per poter rendere possibili test ed analisi.
- Esame della situazione: si svolge un esame per verificare la posizione dei dati e poter scegliere la tecnica di mascheramento più adatta alle esigenze dell’azienda.
- Implementazione del mascheramento: Si svolge il mascheramento vero e proprio scegliendo tra le diverse tecniche.
- Risultato del mascheramento: al termine del mascheramento ci si dovrà assicurare che i dati mascherati siano irreversibili e dunque non sia facile risalire ai dati originali e che conservino l’integrità relazionale cosi da risultare realistici e veritieri. Inoltre come ultimo step bisogna effettuare una verifica della applicazioni che devono comunque continuare a scorrere in modo corretto e fluido.