Usare un flusso di dati in una pipeline

In questo tutorial, si crea una pipeline per spostare OData da un'origine Northwind a una destinazione Lakehouse e si invia una notifica tramite posta elettronica al termine della pipeline.

Prerequisiti

Per iniziare, è necessario soddisfare i prerequisiti seguenti:

Crea un lakehouse

Per iniziare, è prima necessario creare un lakehouse. Un lakehouse è un data lake ottimizzato per l'analisi. In questa esercitazione viene creato un lakehouse usato come destinazione per il flusso di dati.

  1. Vai all'area di lavoro abilitata per Fabric.

    Schermata dell'area di lavoro con Fabric abilitato evidenziata.

  2. Selezionare Lakehouse nel menu Crea.

    Screenshot del menu di creazione con Create Lakehouse sottolineato.

  3. Immettere un nome per il lakehouse.

  4. Seleziona Crea.

A questo punto è stato creato un lakehouse ed è ora possibile configurare il flusso di dati.

Creazione di un flusso di dati

Un flusso di dati è una trasformazione dei dati riutilizzabile che è possibile usare in una pipeline. In questa esercitazione viene creato un flusso di dati che recupera i dati da un'origine OData e scrive i dati in una destinazione lakehouse.

  1. Passa all'area di lavoro abilitata per Fabric.

    Screenshot dell'area di lavoro abilitata per Fabric.

  2. Selezionare Flusso di dati Gen2 nel menu Crea.

    Screenshot della selezione Dataflow Gen2 nel nuovo menu.

  3. Inserire i dati dall'origine OData.

    1. Selezionare Recupera dati e quindi selezionare Altro.

      Screenshot del menu Recupera dati con Altro evidenziato.

    2. In Scegli origine dati cercare OData e quindi selezionare il connettore OData.

      Schermata del menu Recupera dati con OData evidenziato.

    3. Immettere l'URL dell'origine OData. Per questa esercitazione, usare il servizio di esempio OData.

    4. Selezionare Avanti.

    5. Seleziona l'entità che si vuole inserire. In questa esercitazione usare l'entità Orders .

      Schermata dell'anteprima di OData.

    6. Seleziona Crea.

Ora che hai acquisito i dati dalla fonte OData, puoi configurare la destinazione lakehouse.

Per inserire i dati nella destinazione lakehouse:

  1. Seleziona Aggiungi destinazione dati.

  2. Selezionare Lakehouse.

    Schermata del menu Aggiungi destinazione di output con il lakehouse evidenziato.

  3. Configurare la connessione da usare per connettersi al lakehouse. Le impostazioni predefinite vanno bene.

  4. Selezionare Avanti.

  5. Passa all'area di lavoro in cui hai creato il lakehouse.

  6. Seleziona il lakehouse che hai creato nei passaggi precedenti.

    Schermata del lakehouse selezionato.

  7. Confermare il nome della tabella.

  8. Selezionare Avanti.

  9. Confermare il metodo di aggiornamento e selezionare Salva impostazioni.

    Schermata dei metodi di aggiornamento, con l’opzione «Sostituisci» selezionata.

  10. Pubblicare il flusso di dati.

    Importante

    Quando si crea il primo Dataflow Gen2 in un'area di lavoro, viene eseguito il provisioning degli elementi Lakehouse e Warehouse insieme ai relativi modelli semantici ed endpoint di analisi SQL correlati. Questi elementi sono condivisi da tutti i flussi di dati nell'area di lavoro e sono necessari per il funzionamento di Dataflow Gen2, non devono essere eliminati e non devono essere usati direttamente dagli utenti. Gli elementi sono un dettaglio di implementazione di Dataflow Gen2. Gli elementi non sono visibili nell'area di lavoro, ma potrebbero essere accessibili in altre esperienze, ad esempio le esperienze Notebook, SQL-endpoint, Lakehouse e Warehouse. È possibile riconoscere gli elementi in base al prefisso nel nome. Il prefisso degli elementi è "DataflowsStaging".

Dopo aver inserito i dati nella destinazione Lakehouse, puoi impostare la tua pipeline.

Creare un flusso di lavoro

Una pipeline è un flusso di lavoro che può essere usato per automatizzare l'elaborazione dei dati. In questa esercitazione viene creata una pipeline che esegue Dataflow Gen2 creata nella procedura precedente.

  1. Tornare alla pagina di panoramica dell'area di lavoro e selezionare Pipeline nel menu Crea.

    Screenshot della selezione della pipeline.

  2. Specificare un nome per la pipeline.

  3. Selezionare l'attività Flusso di dati.

    Schermata con l'attività del flusso di dati evidenziata.

  4. Selezionare il flusso di dati creato nella procedura precedente nell'elenco a discesa Flusso di dati in Impostazioni.

    Schermata dell'elenco a discesa del flusso di dati.

  5. Aggiungi un’attività di Office 365 Outlook.

    Screenshot che evidenzia come selezionare un'attività di Office 365 Outlook.

  6. Configurare l'attività di Office 365 Outlook per l'invio di notifiche tramite posta elettronica.

    1. Eseguire l'autenticazione con l'account di Office 365.

    2. Selezionare l'indirizzo e-mail a cui si desidera inviare la notifica.

    3. Immettere un oggetto del messaggio di posta elettronica.

    4. Inserisci un Corpo per il messaggio email.

      Screenshot che mostra le impostazioni dell'attività di Office 365 Outlook.

Eseguire e programmare la pipeline

In questa sezione viene eseguita e pianificata la pipeline.

  1. Passa all'area di lavoro.

  2. Aprire il menu a discesa della pipeline creata nella procedura precedente e quindi selezionare Pianifica.

    Schermata del menu della pipeline con pianificazione evidenziata.

  3. In Esecuzione pianificata, selezionare Attivato.

    Schermata dell'esecuzione programmata impostata su Attivato.

  4. Specificare la pianificazione da usare per eseguire la pipeline.

    1. Ripetere, ad esempio, ogni giorno o ogni minuto.
    2. Se selezionata Ogni giorno, è anche possibile selezionare l'ora.
    3. Inizia in una data specifica.
    4. Finisci in una data specifica.
    5. Selezionare il fuso orario.
  5. Selezionare Applica per applicare le modifiche.

A questo punto è stata creata una pipeline che viene eseguita in base a una pianificazione, aggiorna i dati nel lakehouse e invia una notifica tramite posta elettronica. È possibile controllare lo stato della pipeline passando all'hub di monitoraggio. È anche possibile controllare lo stato della pipeline passando a Pipeline e selezionando la scheda Cronologia di esecuzione nel menu a discesa.