Was ist Unity Catalog?

Unity Catalog ist die einheitliche Governance-Ebene für Daten und KI, die in Azure Databricks integriert sind. Wenn Unity Catalog für einen Arbeitsbereich aktiviert ist, läuft es automatisch im Hintergrund jeder Daten- und KI-Interaktion in Ihrem Arbeitsbereich: Es erzwingt die Zugriffssteuerung, wenn Sie eine Tabelle abfragen oder ein Modell aufrufen, verfolgt die Herkunft von Daten- und KI-Ressourcen bei deren Nutzung nach, protokolliert Aktivitäten für Audit-Zwecke und vieles mehr. Sie arbeiten mit den Objekten, die von Unity Catalog über Catalog Explorer, SQL, die Azure Databricks CLI und REST-APIs verwaltet werden.

Unity Catalog ist automatisch für alle Azure Databricks Arbeitsbereiche aktiviert, die nach dem 9. November 2023 erstellt wurden.

Unity Catalog ist auch als Open Source-Implementierung verfügbar. Weitere Informationen finden Sie im Ankündigungsblog sowie im öffentlichen GitHub-Repository für Unity Catalog.

Objektmodell von Unity Catalog

Jedes Objekt, das Sie im Unity-Katalog steuern, wird als sicherungsfähiges Objekt modelliert, einem Objekt, für das Sie Benutzern, Dienstprinzipalen oder Gruppen Berechtigungen erteilen können. Daten- und KI-Ressourcen wie Tabellen, Ansichten, Volumes, Funktionen, Modelle und Dienste (Modelldienste und MCP-Dienste) folgen einem Namespace auf drei Ebenen (catalog.schema.object). Tabellen und Volumes können verwaltet sein, wobei Unity Catalog sowohl die Governance als auch den Lebenszyklus des zugrunde liegenden Dateispeichers übernimmt, oder extern, wobei Unity Catalog nur die Governance übernimmt. Andere Objekte, z. B. Speicheranmeldeinformationen, externe Speicherorte, Verbindungen und Freigaben, befinden sich direkt unter dem Metastore.

Objektmodell-Diagramm von Unity Catalog

Auf den folgenden Seiten werden die Kernkonzepte und Workflows im Unity-Katalog ausführlicher erläutert.

Thema Description
Sicherungsobjekte Erfahren Sie mehr über jeden Objekttyp in der Unity-Kataloghierarchie und wie Berechtigungen darauf angewendet werden.
Verwaltete und externe Ressourcen Verstehen Sie den Unterschied zwischen verwalteten und externen Tabellen und Volumes, und wann sie jeweils verwendet werden sollen.
Anforderungen und Einschränkungen Überprüfen Sie Computeanforderungen, unterstützte Dateiformate, Benennungseinschränkungen und bekannte Einschränkungen.

Unity-Katalogfunktionen

Unity Catalog bietet integrierte Tools für jede Dimension Ihrer Daten- und KI-Umgebung. In den folgenden Themen werden die wichtigsten Funktionsbereiche behandelt.

Thema Description
Zugriffssteuerung Verwalten Sie, wer worauf zugreifen kann, mithilfe von Berechtigungen, attributbasierten Richtlinien, Zeilen- und Spaltenfiltern und Arbeitsbereichsbindungen.
Entdeckung Interagieren Sie mit sicherungsfähigen Objekten mithilfe des Katalog-Explorers, der Azure Databricks-Benutzeroberfläche zum Ermitteln und Verwalten von Daten und KI-Ressourcen, die im Unity-Katalog registriert sind.
Lineage Verfolgen Sie automatisch, wie Daten und KI-Ressourcen fließen und verbinden, von Quelldaten über Modelle, Dienste und Dashboards.
Überwachung Verwalten Sie einen vollständigen Datensatz aller Datenzugriffs- und Systemaktivitäten mithilfe der Überwachungsprotokollsystemtabelle.
Datenklassifizierung Automatisches Klassifizieren und Kategorisieren vertraulicher Daten in Ihrem Katalog.
Datenqualitätsüberwachung Überwachen Sie die Datenqualität proaktiv mit integriertem Profiling und Warnmeldungen, die Anomalien erkennen, bevor sie nachgelagerte Systeme erreichen.
Datenfreigabe Sicheres Freigeben von Livedaten und KI-Ressourcen in Organisationen und Clouds mithilfe des open OpenSharing-Protokolls.
KI-Steuerung Steuern Sie KI-Ressourcen und KI-Datenverkehr mithilfe des Unity-Katalogs und des AI-Gateways.

Get started

Die folgenden Ressourcen helfen Ihnen bei den ersten Schritten mit Dem Unity-Katalog. Wenn Ihr Arbeitsbereich nach dem 9. November 2023 erstellt wurde, wird er automatisch mit Unity Catalog aktiviert.

Thema Description
Erste Schritte mit Unity-Katalog Überprüfen Sie, ob Der Unity-Katalog bereits für Ihren Arbeitsbereich aktiviert ist, und konfigurieren Sie Ihre ersten Katalog-, Schema- und Datenzugriffssteuerelemente.
Upgrade auf Unity Catalog Erfahren Sie, wie Sie einen Arbeitsbereich aktualisieren, der noch keinen Unity-Katalog verwendet.
Erste Schritte mit KI-Governance Richten Sie Governance für Ihre KI-Ressourcen, KI-Datenverkehr und KI-Dienstverhalten ein.

Weitere Ressourcen