Lernprogramm: Konfigurieren von gespiegelten Microsoft Fabric-Datenbanken aus Snowflake

In diesem Tutorial konfigurieren Sie eine gespiegelte Datenbank in Fabric aus Snowflake.

In diesem Beispiel erfahren Sie, wie Sie eine sichere Verbindung zu Ihrer Snowflake-Datenquelle bzw. Ihren Snowflake-Datenquellen konfigurieren. Außerdem erhalten Sie weitere hilfreiche Informationen, damit Sie sich mit den Konzepten des Mirroring in Microsoft Fabric vertraut machen und diese sicher anwenden können.

Hinweis

Während dieses Beispiel für Snowflake spezifisch ist, finden Sie detaillierte Schritte zum Konfigurieren der Spiegelung für andere Datenquellen, z. B. Azure SQL-Datenbank oder Azure Cosmos DB. Weitere Informationen finden Sie unter Was ist Spiegelung in Microsoft Fabric?

Voraussetzungen

  • Erstellen oder verwenden Sie ein vorhandenes Snowflake-Lager. Sie können eine Verbindung mit einer beliebigen Version der Snowflake-Instanz in einer beliebigen Cloud herstellen, einschließlich Microsoft Azure.
  • Sie benötigen eine vorhandene Fabric-Kapazität. Falls dies nicht der Fall ist, können Sie eine Fabric-Testversion starten.
  • Sie benötigen Benutzerberechtigungen für Ihre Snowflake-Datenbank, die die folgenden Berechtigungen enthält. Weitere Informationen finden Sie in der Snowflake-Dokumentation zu Zugriffssteuerungsberechtigungen für Streamingtabellen und erforderlichen Berechtigungen für Streams.
    • CREATE STREAM
    • SELECT table
    • SHOW tables
    • DESCRIBE tables
  • Der Benutzer muss mindestens eine Rolle zugewiesen haben, die den Zugriff auf die Snowflake-Instanz ermöglicht.
  • Überprüfen Sie die Netzwerkanforderungen für den Zugriff auf Ihre Snowflake-Datenquelle. Wenn Ihre Snowflake-Datenquelle nicht öffentlich zugänglich ist und sich in einem privaten Netzwerk befindet, erstellen Sie ein Gateway für virtuelle Netzwerkedaten , oder installieren Sie ein lokales Datengateway , um die Daten zu spiegeln. Das virtuelle Azure-Netzwerk oder das Netzwerk des Gatewaycomputers muss über einen privaten Endpunkt eine Verbindung mit der Snowflake-Instanz herstellen oder von der Firewallregel zugelassen werden.

Erstellen einer gespiegelten Datenbank

In diesem Abschnitt erhalten Sie einen kurzen Überblick darüber, wie Sie eine neue gespiegelte Datenbank für die Verwendung mit Ihrer gespiegelten Snowflake-Datenquelle erstellen.

Sie können einen vorhandenen Arbeitsbereich (nicht "Mein Arbeitsbereich") verwenden oder einen neuen Arbeitsbereich erstellen.

  1. Navigieren Sie in Ihrem Arbeitsbereich zum Create Hub.
  2. Nachdem Sie den Arbeitsbereich ausgewählt haben, den Sie verwenden möchten, wählen Sie "Erstellen" aus.
  3. Scrollen Sie nach unten, und wählen Sie die Gespiegelte Snowflake-Karte aus.
  4. Geben Sie den Namen für die neue Datenbank ein.
  5. Wählen Sie "Erstellen" aus.

Herstellen einer Verbindung mit Ihrer Snowflake-Instanz in einer beliebigen Cloud

Hinweis

Möglicherweise müssen Sie die Firewall-Cloud ändern, damit Mirroring eine Verbindung mit der Snowflake-Instanz herstellen kann.

  1. Wählen Sie "Snowflake " unter "Neue Verbindung" aus, oder wählen Sie eine vorhandene Verbindung aus.

  2. Wenn Sie "Neue Verbindung" ausgewählt haben, geben Sie die Verbindungsdetails in die Snowflake-Datenbank ein.

    Verbindungseinstellung Description
    Server Sie finden Ihren Servernamen, indem Sie zu den Konten im Ressourcenmenü in Snowflake navigieren. Zeigen Sie mit der Maus auf den Kontonamen, und Sie können den Servernamen in die Zwischenablage kopieren. Entfernen Sie den https:// Servernamen, und verwenden Sie alle Kleinbuchstaben.
    Warehouse Wählen Sie im Abschnitt "Lagerhäuser " im Ressourcenmenü in Snowflake die Option "Lagerhäuser" aus. Das Lagerhaus ist das Snowflake Warehouse (Compute) und nicht die Datenbank.
    Verbindung Neue Verbindung erstellen.
    Verbindungsname Sollte automatisch ausgefüllt werden. Ändern Sie ihn in einen Namen, den Sie verwenden möchten.
    Datengateway Wählen Sie die Standardeinstellung (Keine) oder den Namen des virtuellen Netzwerkdatengateways oder des lokalen Datengateways gemäß Ihrem Szenario aus.
    Authentifizierungsart Wählen Sie die Authentifizierungsmethode für Ihre Snowflake-Verbindung aus. Unterstützte Optionen: Snowflake (Benutzername und Kennwort), Microsoft Entra ID (einmaliges Anmelden über Entra ID) oder Key Pair (RSA-Schlüsselpaarauthentifizierung für Dienstkontoszenarien).
    Benutzername Ihr Snowflake-Benutzername, den Sie erstellt haben, um sich bei Snowflake.com anzumelden.
    Kennwort Ihr Snowflake-Kennwort, das Sie beim Erstellen Ihrer Anmeldeinformationen in Snowflake.com erstellt haben.

    Von Bedeutung

    Bei allen Snowflake-Bezeichnern – einschließlich Servername, Lagername, Datenbankname, Schemaname, Tabellennamen und Ansichtsnamen – wird die Groß-/Kleinschreibung beachtet. Die von Ihnen in den Fabric-Verbindungseinstellungen verwendete Groß-/Kleinschreibung muss exakt der in Snowflake konfigurierten Schreibweise entsprechen. Wenn Ihr Snowflake-Lager beispielsweise ANALYTICS_WH heißt, müssen Sie ANALYTICS_WH eingeben (nicht analytics_wh oder Analytics_Wh). Eine nicht übereinstimmende Groß-/Kleinschreibung führt zu Verbindungsfehlern oder Replikationsfehlern, ohne dass eine beschreibende Fehlermeldung angezeigt wird.

  3. Wählen Sie die Datenbank aus der Dropdownliste aus.

Spiegelungsvorgang starten

  1. Auf dem Bildschirm " Spiegelung konfigurieren" können Sie standardmäßig alle Daten in der Datenbank spiegeln.

    • Spiegelung aller Daten bedeutet, dass alle neuen Tabellen, die nach dem Starten der Spiegelung erstellt wurden, gespiegelt werden. Sie können auswählen, dass alle verwalteten und Iceberg-Tabellen oder nur alle verwalteten Tabellen gespiegelt werden (alle neuen Iceberg-Tabellen werden übersprungen).
    • Sie können optional auch nur bestimmte Objekte für die Spiegelung wählen. Deaktivieren Sie die Option "Alle Daten spiegeln ", und wählen Sie dann einzelne Tabellen aus Ihrer Datenbank aus.

    Hinweis

    Wenn Sie eisbergische Tabellen spiegeln möchten, müssen Sie eine Speicherverbindung mit dem zugrunde liegenden Speicher bereitstellen, der die Iceberg-Tabellendaten enthält. Beachten Sie folgende Punkte:

    1. Eine Speicherverbindung pro gespiegelter Datenbank: Alle von Ihnen ausgewählten Iceberg-Tabellen müssen über dieselbe Speicherverbindung erreichbar sein. Wenn Ihre Iceberg-Tabellen mehrere Speicherkonten umfassen, benötigen Sie separate gespiegelte Datenbanken.
    2. Speicherort ermitteln: Führen Sie in Snowflake die Systemfunktion SYSTEM$GET_ICEBERG_TABLE_INFORMATION aus, um den Speicher zu finden, der einer Iceberg-Tabelle in Snowflake zugeordnet ist.
    3. Mischen von Tabellentypen: Sie können wählen, ob alle verwalteten und Iceberg-Tabellen oder nur alle verwalteten Tabellen gespiegelt werden sollen (alle neuen Iceberg-Tabellen werden übersprungen). Verwenden Sie die Umschaltfläche "Alle Daten spiegeln ", um dieses Verhalten zu steuern.

    In dieser Anleitung wählen wir die Option "Alle Daten spiegeln" aus.

  2. Wählen Sie Verbinden aus. Wenn Sie sich für die Spiegelung von Iceberg-Tabellen entschieden haben, geben Sie die Verbindungsinformationen für den Speicher ein, der Ihre Iceberg-Tabellen enthält.

  3. Benennen Sie Die gespiegelte Datenbank, und wählen Sie dann "Gespiegelte Datenbank erstellen" aus. Die Spiegelung beginnt.

    Screenshot aus dem Fabric-Portal, der zeigt, dass gespiegeltes Snowflake läuft. Die Schaltfläche „Spiegelung überwachen“ ist sichtbar.

  4. Warten Sie 2-5 Minuten. Wählen Sie dann "Replikation überwachen" aus, um den Status anzuzeigen.

  5. Nach ein paar Minuten sollte sich der Status in " Ausführen" ändern, was bedeutet, dass die Tabellen synchronisiert werden.

    Wenn die Tabellen und der entsprechende Replikationsstatus nicht angezeigt werden, warten Sie einige Sekunden, und aktualisieren Sie dann den Bereich.

  6. Wenn sie das anfängliche Kopieren der Tabellen abgeschlossen haben, wird ein Datum in der Spalte "Letzte Aktualisierung " angezeigt.

  7. Da Ihre Daten nun einsatzbereit sind, stehen in der gesamten Fabric-Plattform verschiedene Analyseszenarien zur Verfügung.

Von Bedeutung

Detaillierte Sicherheitseinstellungen in der Quelldatenbank müssen in der gespiegelten Datenbank in Microsoft Fabric neu konfiguriert werden.

Fabric-Spiegelung überwachen

Nachdem die Spiegelung konfiguriert wurde, werden Sie zur Seite "Spiegelungsstatus " weitergeleitet. Hier können Sie den aktuellen Replikationsstatus überwachen.

Weitere Informationen und Details zu den Replikationszuständen finden Sie unter Überwachen der Replikation von gespiegelten Datenbanken in Fabric.

Von Bedeutung

Wenn in den Quelltabellen keine Aktualisierungen vorliegen, beginnt das Replikationsmodul, die Wartezeit exponentiell zu erhöhen – bis auf maximal eine Stunde. Das Replikatmodul setzt die regelmäßige Abfrage automatisch fort, nachdem aktualisierte Daten erkannt wurden.