Classificatori personalizzati

Importante

Questa funzionalità è in versione beta. Gli amministratori dell'area di lavoro possono controllare l'accesso a questa funzionalità dalla pagina Anteprime . Vedere Gestire le anteprime di Azure Databricks.

Questa pagina descrive come creare e gestire classificatori personalizzati per la classificazione dei dati di Databricks in Unity Catalog. I classificatori personalizzati estendono il sistema di classificazione predefinito in modo da poter rilevare dati sensibili specifici dell'organizzazione, ad esempio ID dipendenti interni, codici di prodotto proprietari, identificatori fornitore o numeri di account partner.

Per creare un classificatore personalizzato, selezionare un tag regolamentato e fornire colonne di esempio contenenti valori rappresentativi per la classe . La classificazione dei dati rileva quindi questa classe durante le analisi regolari.

Usando classificatori personalizzati, è possibile:

  • Etichettare i dati specifici della tua organizzazione: rileva e configura l'applicazione automatica di tag per i tipi di dati univoci della tua organizzazione, ad esempio ID dei dipendenti, codici partner o numeri di account interni.
  • Estendere i controlli di governance: applicare maschere ABAC a livello di colonna ai dati sensibili.

Annotazioni

La configurazione del classificatore personalizzato e i metadati di rilevamento che Databricks genera a partire dalle colonne di esempio sono crittografati a riposo. È possibile usare una chiave gestita dal cliente (CMK) nel catalogo di sistema per gestire la chiave di crittografia. La configurazione di una CMK nel catalogo di sistema crittografa tutti i dati nel catalogo di sistema, non solo i dati del classificatore personalizzato.

Configurare una chiave gestita dal cliente nel catalogo di sistema in Esplora cataloghi.

Requirements

  • La classificazione dei dati deve essere abilitata in almeno un catalogo nel metastore. Vedere Usare la classificazione dei dati.
  • L'area di lavoro deve disporre di risorse di calcolo serverless (abilitate per impostazione predefinita nelle aree di lavoro con il catalogo Unity).
  • Per creare, modificare o eliminare un classificatore personalizzato, è necessario essere un amministratore del metastore.
  • Per creare o modificare un classificatore personalizzato, è necessario disporre ASSIGN dei privilegi per il tag regolamentato usato dal classificatore. Vedere Gestire le autorizzazioni per i tag regolamentati.
  • Per selezionare una colonna per il classificatore, è necessario avere SELECT sulla tabella che la contiene.

Creare un classificatore personalizzato

  1. Nella pagina Risultati classificazione dati fare clic su Gestisci classificatori personalizzati.

    Pulsante per gestire i classificatori personalizzati nella pagina dei risultati della classificazione dei dati.

  2. Nel pannello laterale Gestisci classificatori personalizzati fare clic su Crea classificatore personalizzato.

  3. Selezionare un tag. Scegliere un tag regolamentato esistente oppure fare clic su Crea nuovo tag per definirne uno inline. Se il tag ha valori consentiti, scegliere il valore specifico da rilevare.

    Creare la procedura guidata del classificatore personalizzato passaggio 1: selezionare un tag regolamentato.

  4. Selezionare le colonne di esempio. Esplorare l'albero del catalogo e selezionare le colonne che contengono valori rappresentativi per la classe . Scegliere le colonne i cui valori sono tipici di ciò che si vuole rilevare: esempi più ampi e diversi producono regole di rilevamento più accurate.

    Creare la procedura guidata del classificatore personalizzato passaggio 2: selezionare colonne di esempio.

  5. Clicca su Crea.

I rilevamenti del classificatore personalizzato vengono in genere visualizzati nella pagina dei risultati entro poche ore.

Annotazioni

Un classificatore personalizzato si applica a tutti i cataloghi nel metastore in cui è abilitata la classificazione dei dati. La definizione dell'ambito per catalogo o per schema non è supportata.

Gestire classificatori personalizzati

Il pannello laterale Gestisci classificatori personalizzati elenca tutti i classificatori personalizzati configurati per il metastore. In questo pannello è possibile cercare in base al nome del tag, modificare le colonne di esempio di un classificatore esistente o eliminare un classificatore.

Elenco di classificatori personalizzati nel pannello laterale Gestisci classificatori personalizzati.

Modificare un classificatore personalizzato

Per aggiornare le colonne di esempio per un classificatore personalizzato esistente:

  1. Nel pannello laterale Gestisci classificatori personalizzati selezionare il classificatore personalizzato da modificare.
  2. Fare clic su Modifica accanto all'elenco delle colonne di esempio.
  3. Aggiungere o rimuovere colonne. Il limite di colonne di esempio viene comunque applicato.
  4. Fai clic su Salva.

Gli aggiornamenti diventano effettivi entro poche ore. I rilevamenti esistenti della configurazione precedente rimangono attivi.

Non è possibile modificare il tag gestito e il relativo valore dopo la creazione di un classificatore personalizzato. Per passare a un tag diverso, eliminare il classificatore personalizzato e crearne uno nuovo.

Eliminare un classificatore personalizzato

  1. Nel pannello laterale Gestisci classificatori personalizzati selezionare il classificatore personalizzato da eliminare.
  2. Fai clic su Elimina.
  3. Conferma l'eliminazione.
  4. Verificare che il classificatore sia stato rimosso dal pannello laterale Gestisci classificatori personalizzati .

Quando si elimina un classificatore personalizzato:

  • Non vengono generati nuovi rilevamenti per tale classificatore.
  • I rilevamenti esistenti vengono rimossi dalla pagina Risultati classificazione dati.
  • I tag già applicati automaticamente alle colonne non vengono rimossi automaticamente.

Classificatori personalizzati sospesi

Se la generazione o la convalida delle regole non riesce, Azure Databricks sospende il classificatore personalizzato e visualizza un avviso nella pagina Risultati classificazione dati. Un classificatore personalizzato sospeso non produce nuovi rilevamenti.

Avviso che mostra che uno o più classificatori personalizzati sono sospesi.

Per risolvere una sospensione, modificare il classificatore personalizzato e sostituire le colonne di esempio inaccessibili o non abbastanza rappresentative. Se il tag regolamentato o il relativo valore non è più valido, eliminare il classificatore personalizzato e crearne uno nuovo con un tag regolamentato valido.

Visualizzare rilevamenti di classificatori personalizzati

Per visualizzare i rilevamenti di classificatori personalizzati, seguire la stessa procedura di per le classificazioni predefinite. Vedere Visualizzare i risultati della classificazione.

Limitations

  • È possibile creare un massimo di 50 classificatori personalizzati per metastore.
  • Ogni classificatore personalizzato deve fare riferimento tra 1 e 10 colonne di esempio per fornire dati sufficienti per la classificazione.
  • La denominazione dei tag regolamentata è soggetta alle regole dei criteri tag.
  • I classificatori personalizzati si applicano a tutti i cataloghi abilitati per la classificazione dei dati nel metastore. La definizione dell'ambito per catalogo o per schema non è supportata.
  • Il tag regolato utilizzato da un classificatore personalizzato non può essere modificato dopo la creazione. Per usare un tag diverso, eliminare e ricreare il classificatore personalizzato.
  • I classificatori personalizzati nuovi e aggiornati si applicano solo alle analisi di classificazione dei dati successive. I risultati dell'analisi esistenti non vengono riclassificati automaticamente, quindi i rilevamenti per i dati analizzati in precedenza vengono visualizzati al termine dell'analisi successiva.
  • Tutte le limitazioni della classificazione dei dati si applicano anche ai classificatori personalizzati, inclusi i tipi di tabella supportati. Vedere Limitazioni.

Risoluzione dei problemi

Gli argomenti seguenti consentono di risolvere i problemi comuni relativi ai classificatori personalizzati.

Un classificatore personalizzato è sospeso

Le cause più comuni includono:

  • Una o più colonne di esempio fanno riferimento a tabelle che sono state eliminate o rinominate dopo la creazione del classificatore.
  • Le colonne di esempio non sono sufficientemente rappresentative per il sistema per apprendere un rilevamento stabile.
  • Il tag regolamentato non è più un tag regolamentato o il valore del tag non è più valido.

Per risolvere il problema, modificare il classificatore personalizzato con un set diverso di colonne di esempio e attendere l'analisi successiva. Se la sospensione è causata da un valore di tag o tag regolamentato non valido, eliminare il classificatore personalizzato e crearne uno nuovo con un tag valido.

Autorizzazione negata durante la creazione o l'elenco di classificatori personalizzati

È necessario essere un amministratore del metastore. La creazione o la modifica di un classificatore personalizzato richiedono ASSIGN inoltre privilegi per il tag regolamentato. Vedere Requisiti.

Impossibile selezionare una colonna di esempio

È necessario avere SELECT nella tabella che contiene la colonna. Se nella tabella non è presente SELECT , chiedere al proprietario della tabella di concederla o scegliere una colonna di esempio diversa.

Risorse aggiuntive