Affidabilità in Esplora dati di Azure

Esplora dati di Azure è un servizio di analisi per l'inserimento, l'archiviazione e l'esecuzione di query su grandi volumi di dati con bassa latenza. Viene comunemente usato per analisi dei log, telemetria e carichi di lavoro di serie temporali che richiedono query rapide su grandi set di dati.

Quando si usa Azure, l'affidabilità è una responsabilità condivisa. Microsoft offre una gamma di funzionalità per supportare la resilienza e il ripristino. L'utente è responsabile della comprensione del funzionamento di tali funzionalità all'interno di tutti i servizi usati e della selezione delle funzionalità necessarie per soddisfare gli obiettivi aziendali e gli obiettivi di tempo di attività.

Questo articolo descrive come rendere Esplora dati di Azure resiliente a varie potenziali interruzioni e problemi, tra cui errori temporanei, errori della zona di disponibilità e errori a livello di area. Descrive anche le opzioni di backup e ripristino e la resilienza per la manutenzione del servizio ed evidenzia le informazioni chiave sul contratto di servizio di Esplora dati di Azure.

Raccomandazioni per la distribuzione di produzione per l'affidabilità

Per i carichi di lavoro di produzione, è consigliabile seguire questa procedura per migliorare l'affidabilità del cluster di Esplora dati di Azure:

  • Distribuire un cluster completo. Esplora dati di Azure offre cluster gratuiti a scopo di valutazione. Per i carichi di lavoro di produzione, distribuire un cluster completo.

  • Abilitare il supporto della zona di disponibilità. Esplora dati di Azure supporta le zone di disponibilità. Quando si abilita il supporto della zona di disponibilità, il servizio distribuisce i nodi di calcolo tra più zone di disponibilità e archivia i dati usando l'archiviazione con ridondanza della zona.When you enable availability zone support, the service distributes compute nodes across multiple availability zones and stores data by using zone-redundant storage (ZRS). Questa configurazione migliora la resilienza agli errori della zona di disponibilità.

Panoramica dell'architettura di affidabilità

Questa sezione descrive alcuni degli aspetti importanti del funzionamento del servizio più rilevanti dal punto di vista dell'affidabilità. La sezione presenta l'architettura logica, che include alcune delle risorse e delle funzionalità distribuite e usate. Illustra anche l'architettura fisica, che fornisce informazioni dettagliate sul funzionamento del servizio sotto le quinte.

Architettura logica

La risorsa primaria distribuita è un cluster, che rappresenta l'infrastruttura necessaria per inserire, archiviare ed eseguire query sui dati. Con un cluster si creano database e tali database contengono tabelle.

Diagramma di un cluster che contiene due database, ognuno con un set di tabelle.

Diagramma che mostra un cluster Esplora dati di Azure che contiene due sezioni di database affiancate. A sinistra c’è una casella con l’etichetta “database” e al suo interno ci sono tre caselle distinte, disposte verticalmente una sopra l’altra, ciascuna con l’etichetta “table”. Sulla destra c’è una seconda casella etichettata “database” e, al suo interno, ci sono due caselle etichettate “table”, disposte verticalmente una sopra l’altra. Il diagramma mostra una gerarchia in cui il cluster è il contenitore di primo livello, ogni database è un contenitore figlio all'interno del cluster e le tabelle sono oggetti figlio all'interno di ogni database. I database sinistro e destro sono peer paralleli nello stesso cluster e possono contenere diversi numeri di tabelle.

I cluster eseguono l'inserimento per recuperare dati da altre origini dati e caricarli in una tabella nel cluster. È quindi possibile eseguire query sui dati usando la sintassi KQL (Kusto Query Language). I cluster dispongono anche di un set di operazioni di gestione che è possibile eseguire.

Architettura fisica

Un cluster di Esplora dati di Azure ha due livelli principali applicabili alla configurazione dell'affidabilità:

  • Livello di calcolo: Esplora dati di Azure è una piattaforma di elaborazione distribuita e può avere da due a molti nodi di macchina virtuale (VM), a seconda della scala e del tipo di ruolo del nodo. I nodi gestiscono l'inserimento dei dati e il lavoro di elaborazione delle query. Le macchine virtuali del nodo non vengono visualizzate o gestite direttamente. La piattaforma gestisce automaticamente la creazione dell'istanza, il monitoraggio dell'integrità e la sostituzione di nodi non integri. Quando si configura il cluster per l'uso di più zone di disponibilità, i nodi vengono distribuiti tra data center diversi.

  • Livello di archiviazione: Esplora dati di Azure utilizza Archiviazione di Azure come livello di persistenza durevole. L'archiviazione offre automaticamente la tolleranza ai guasti, con l'impostazione predefinita che fornisce l'archiviazione con ridondanza locale (LRS) all'interno di un data center. Vengono mantenute tre repliche. Se una replica viene persa durante l'uso, un'altra viene distribuita senza interruzioni. Quando si configura il cluster per l'uso di più zone di disponibilità, le repliche vengono distribuite tra data center diversi.

Diagram che mostra un cluster Esplora dati di Azure con un'architettura logica di due livelli.

Diagramma che mostra un cluster Esplora dati di Azure con un'architettura logica di due livelli. Nel livello superiore, etichettato livello di calcolo, due caselle dei nodi sono disposte side-by-side per indicare che il lavoro di calcolo viene distribuito tra più nodi all'interno del cluster. Il livello inferiore è denominato "livello di archiviazione" (a ridondanza di zona), con tre riquadri delle copie di archiviazione disposti da sinistra a destra ed etichettati come Copia 1, Copia 2 e Copia 3. Il diagramma presenta una relazione stratificata: il livello computazionale elabora le operazioni di acquisizione e di query.

Per altre informazioni, vedere Funzionamento di Esplora dati di Azure.

Resilienza a errori temporanei

Gli errori temporanei sono errori brevi e intermittenti nei componenti. Si verificano spesso in un ambiente distribuito come il cloud e fanno parte delle normali operazioni. Gli errori temporanei si correggono dopo un breve periodo di tempo. È importante che le applicazioni possano gestire gli errori temporanei, in genere ritentando le richieste interessate.

Tutte le applicazioni ospitate nel cloud devono seguire le indicazioni sulla gestione degli errori temporanei di Azure quando comunicano con qualsiasi API, database e altri componenti ospitati nel cloud. Per altre informazioni, vedere Raccomandazioni per la gestione degli errori temporanei.

Per creare resilienza a errori temporanei quando si usa Esplora dati di Azure, seguire queste procedure:

Resilienza ai guasti delle zone di disponibilità

Le zone di disponibilità sono gruppi di data center separati fisicamente all'interno di un'area di Azure. In caso di guasto in una zona, i servizi possono passare a una delle zone restanti.

Esplora dati di Azure supporta due tipi di configurazione della zona di disponibilità:

  • Ridondanza della zona (scelta consigliata): Quando si abilitano le zone di disponibilità nel cluster, i nodi del cluster vengono distribuiti in più zone. Microsoft gestisce la distribuzione dei nodi tra le zone di disponibilità selezionate e gestisce il rilevamento e la risposta agli errori della zona di disponibilità. Un cluster a ridondanza di zona è resiliente a un guasto della zona di disponibilità.

    Quando si configura il cluster come con ridondanza della zona, Storage ZRS replica in modo sincrono almeno tre copie dei dati tra più zone di disponibilità.

    Diagramma di un cluster Esplora dati di Azure, con nodi di calcolo e archiviazione distribuiti in più zone.

    Diagramma che mostra un cluster Esplora dati di Azure che usa più zone di disponibilità. Tre colonne verticali sono etichettate come zona di disponibilità 1, zona di disponibilità 2 e zona di disponibilità 3. Una casella grande con etichetta Esplora dati di Azure cluster si estende su tutte e tre le colonne. La scatola è divisa orizzontalmente in due livelli. La metà superiore è il livello di elaborazione. Un nodo si trova nella zona di disponibilità 1 e l'altro nodo si trova nella zona di disponibilità 2. La metà in basso è il livello di archiviazione a ridondanza di zona. Tre repliche di archiviazione vengono visualizzate come copia 1 a sinistra, copia 2 al centro e copia 3 a destra, ognuna allineata a una zona di disponibilità diversa. Un singolo cluster Esplora dati di Azure si estende tra più zone, con capacità di calcolo distribuita tra zone e dati replicati in tre copie separate da zona.

  • Zonale: Facoltativamente, è possibile selezionare una singola zona quando si abilitano le zone di disponibilità nel cluster. Microsoft inserisce tutti i nodi di calcolo in tale zona. Questa configurazione è un cluster zonale (a zona singola). Un cluster a livello di zona può ridurre la latenza per carichi di lavoro insolitamente sensibili alla latenza perché tutti i nodi di calcolo vengono eseguiti nella stessa zona, ma non forniscono resilienza alle interruzioni della zona.

    Importante

    Si consiglia di limitarsi a una singola zona di disponibilità solo quando la latenza inter-zona è troppo elevata per le proprie esigenze e dopo aver verificato che la latenza effettivamente non soddisfi i requisiti. Di per sé, una risorsa di zona non fornisce resilienza a un'interruzione della zona di disponibilità. Per migliorare la resilienza di una risorsa di zona, è necessario distribuire in modo esplicito risorse separate in più zone di disponibilità e configurare il routing e il failover del traffico. Per altre informazioni, vedere Risorse di zona e resilienza della zona.

    La selezione della zona si applica solo ai nodi di calcolo. Per un cluster a livello di zona, i dati di archiviazione continuano a usare l'archiviazione con ridondanza locale e potrebbero essere archiviati in una zona diversa rispetto ai nodi di calcolo.

    Diagram che mostra un cluster Esplora dati di Azure che usa una singola zona di disponibilità.

    Diagramma che mostra un cluster Esplora dati di Azure che usa una singola zona di disponibilità. Tre colonne verticali sono etichettate come zona di disponibilità 1, zona di disponibilità 2 e zona di disponibilità 3. Un grande riquadro etichettato «Esplora dati di Azure cluster» occupa una sola colonna. La scatola è divisa orizzontalmente in due livelli. La metà superiore è il livello di calcolo: entrambi i nodi si trovano nella zona di disponibilità 1. Nella parte inferiore si trova il livello di archiviazione (con ridondanza locale), con tre repliche dei dati nella stessa zona di disponibilità. Un singolo cluster Esplora dati di Azure è limitato a una zona, con risorse di calcolo e archiviazione che si trovano in tale zona.

Se non si abilitano le zone di disponibilità, il cluster è non a livello di zona, ovvero Azure seleziona la zona di disponibilità per ogni nodo e i dati. Se una zona di disponibilità nell'area ha un'interruzione, potrebbe influire sui nodi, i dati o entrambi i nodi del cluster. Non è consigliabile una configurazione non di zona perché non fornisce protezione dalle interruzioni della zona di disponibilità.

Requisiti

  • Supporto per l'area: Il supporto della zona di disponibilità è disponibile nelle aree di Azure che supportano le zone di disponibilità.

    Tuttavia, alcuni tipi di nodo di calcolo e dimensioni sono disponibili solo in aree specifiche o in zone specifiche all'interno di un'area.

  • Cluster completi: Il supporto della zona di disponibilità è disponibile con cluster completi. Non è disponibile con cluster gratuiti.

Considerazioni

Selezione zona: Per i nodi di calcolo, è possibile scegliere le zone di disponibilità da usare. Microsoft gestisce il posizionamento della zona di archiviazione e le repliche di archiviazione possono trovarsi in zone diverse dai nodi di calcolo.

Cost

L'abilitazione del supporto per le zone di disponibilità comporta costi aggiuntivi per ZRS, che viene fatturato a una tariffa superiore rispetto a LRS. Per altre informazioni, vedere Prezzi di Archiviazione di Azure.

I nodi di calcolo vengono addebitati alla stessa tariffa, indipendentemente dal fatto che si usi o meno il supporto della zona di disponibilità. Per ulteriori informazioni, consulta Prezzi di Esplora dati di Azure.

Configurare il supporto delle zone di disponibilità

  • Creare un nuovo cluster con supporto per la zona di disponibilità. È possibile abilitare il supporto della zona di disponibilità quando si crea un nuovo cluster Esplora dati di Azure. Per altre informazioni, vedere Creare un cluster e un database.

    Quando si crea un cluster con supporto per le zone di disponibilità tramite il portale di Azure, questo è automaticamente ridondante a livello di zona e Microsoft seleziona le zone.

    Per selezionare manualmente le zone o per creare un cluster a livello di zona, usare un altro approccio di distribuzione, ad esempio le API di Azure Resource Manager o Bicep. Nella maggior parte dei casi, crea un cluster con ridondanza tra zone e usa tutte le zone della regione.

    Annotazioni

    Quando si selezionano le zone di disponibilità da usare, si seleziona effettivamente la zona di disponibilità logica. Se si distribuiscono altri componenti del carico di lavoro in una sottoscrizione di Azure diversa, è possibile usare un numero di zona di disponibilità logico diverso per accedere alla stessa zona di disponibilità fisica. Per altre informazioni, vedere Zone di disponibilità fisiche e logiche.

  • Abilitare le zone di disponibilità in un cluster esistente (anteprima). È possibile eseguire la migrazione di un cluster non di zona esistente per usare le zone di disponibilità. Questa funzionalità è disponibile in anteprima. Per altre informazioni, vedere Eseguire la migrazione del cluster per supportare più zone di disponibilità.

  • Riconfigurare le zone di disponibilità in un cluster esistente (anteprima). È possibile modificare le zone usate per un cluster. Questa funzionalità è disponibile in anteprima. Per altre informazioni, vedere Eseguire la migrazione del cluster per supportare più zone di disponibilità.

  • Disabilitare il supporto della zona di disponibilità in un cluster esistente. Dopo aver configurato un cluster con le zone di disponibilità, non è possibile modificare il cluster in modo da non usare le zone di disponibilità.

  • Verificare la configurazione della zona di disponibilità per i cluster. Usare la proprietà relativa allo stato della zona del cluster (la zoneStatus proprietà nell'API REST) per verificare la configurazione della zona di disponibilità di un cluster. Un valore di Zonal indica che il cluster utilizza le zone di disponibilità, ma non significa che il cluster sia eseguito in una singola zona.

    Per determinare se un cluster è a livello di zona o con ridondanza della zona, usare la zones proprietà . Se nell'elenco delle zone è elencata una zona, il cluster è zonale (singola zona). Se sono indicate più zone, dispone di ridondanza di zona.

Pianificazione e gestione della capacità

Quando una zona di disponibilità non è disponibile, i nodi in tale zona potrebbero essere temporaneamente non disponibili, riducendo così la capacità di calcolo del cluster fino al ripristino della zona.

Se il tuo cluster non può tollerare la perdita di capacità, prendi in considerazione il sovradimensionamento del cluster. Questo approccio consente alla soluzione di tollerare alcune perdite di capacità e continuare a funzionare senza riduzione delle prestazioni. Tuttavia, quando si sovradimensiona il cluster, questo potrebbe avere un numero sbilanciato di nodi tra le varie zone.

Distribuzione di istanze tra zone

Il livello di calcolo del cluster usa un approccio ottimale per distribuire uniformemente le istanze tra le zone selezionate.

Comportamento quando tutte le zone sono integre

Questa sezione descrive cosa aspettarsi quando si configura un cluster per il supporto della zona di disponibilità e tutte le zone sono operative.

  • Operazione tra zone: Durante il normale funzionamento, Esplora dati di Azure usa tutti i nodi di calcolo disponibili per l'inserimento, l'elaborazione di query e altre operazioni. Il lavoro viene distribuito tra i nodi indipendentemente dalla propria zona di disponibilità.

  • Replica dei dati tra zone: Il comportamento di replica dei dati tra zone dipende dalla configurazione della zona di disponibilità usata dal cluster.

    • Con ridondanza della zona: I dati vengono replicati in modo sincrono tra le zone di disponibilità usando Archiviazione con ridondanza della zona (ZRS), che offre un elevato livello di coerenza dei dati e riduce al minimo il rischio di perdita di dati in caso di errore di una zona.

    • Zonale: I dati vengono archiviati tramite Archiviazione con ridondanza locale (LRS), il che significa che tutte e tre le copie potrebbero trovarsi all'interno di un'unica zona di disponibilità.

Comportamento durante un errore di zona

Questa sezione descrive cosa aspettarsi quando si configura un cluster per il supporto della zona di disponibilità e si verifica un'interruzione in una delle zone.

  • Rilevamento e risposta: La responsabilità del rilevamento e della risposta dipende dalla configurazione della zona di disponibilità usata dal cluster.

    • Ridondante a livello di zona: Microsoft rileva i guasti nelle zone di disponibilità e gestisce la risposta per Esplora dati di Azure. Non è necessario eseguire alcuna operazione per avviare un failover di zona.

    • Zonale: Sei responsabile del rilevamento dei guasti nelle zone di disponibilità utilizzate dal cluster. Si è anche responsabili delle risposte che si decide di avviare, ad esempio il passaggio a un secondo cluster creato in precedenza in una zona di disponibilità diversa.

  • Notifica: Microsoft non invia automaticamente una notifica quando una zona è inattiva. È tuttavia possibile usare Integrità dei servizi di Azure per comprendere l'integrità complessiva del servizio, inclusi eventuali errori di zona, ed è possibile configurare gli avvisi di integrità dei servizi per notificare eventuali problemi.
  • Richieste attive: Le richieste attive che si basano su risorse di calcolo o di archiviazione nella zona non riuscita potrebbero essere terminate e devono essere ritentate dal client. Assicurarsi che le applicazioni vengano preparate seguendo le indicazioni sulla gestione degli errori temporanei.

  • Perdita di dati prevista: La perdita di dati prevista dipende dalla configurazione della zona di disponibilità usata dal cluster.

    • Ridondanza della zona: Non è prevista alcuna perdita di dati durante un'interruzione della zona di disponibilità perché i dati vengono replicati in modo sincrono tra zone.

    • Zonale: I dati non sono disponibili fino al ripristino della zona. Nel caso improbabile di una perdita permanente di una zona che contiene tutte le repliche di archiviazione, i dati potrebbero andare persi definitivamente.

  • Tempo di inattività previsto: Il tempo di inattività previsto dipende dalla configurazione della zona di disponibilità usata dal cluster.

    • Zona ridondante: Potrebbe verificarsi una breve interruzione del servizio mentre il traffico viene reindirizzato alle zone di disponibilità operative. Assicurarsi che le applicazioni vengano preparate seguendo le indicazioni sulla gestione degli errori temporanei.

    • Zonale: I nodi di calcolo del cluster non saranno disponibili fino al ripristino della zona di disponibilità. Potrebbe anche non essere possibile accedere ai dati del cluster durante un errore di zona.

  • Ridistribuzione: Il comportamento di reindirizzamento del traffico dipende dalla configurazione della zona di disponibilità usata dal cluster.

    • Zone-ridondante: Esplora dati di Azure instrada le nuove richieste alle risorse di calcolo e archiviazione nelle zone sane rimanenti.

    • Zonale: Il cluster sarà indisponibile fino a quando la zona di disponibilità non sarà ripristinata.

Ripristino della zona

Quando la zona di disponibilità non riuscita viene ripristinata, Microsoft ricrea i nodi del cluster e le repliche di archiviazione in tale zona e ripristina la normale distribuzione del traffico in tutte le zone. Non è necessario eseguire alcuna azione.

Verifica dei guasti di zona

Le opzioni per il test degli errori di zona dipendono dalla configurazione della zona di disponibilità usata dal cluster.

  • Zone-redundant: Microsoft gestisce completamente il failover e il ripristino della zona di disponibilità per Esplora dati di Azure. Non è necessario avviare o verificare le procedure di failover della zona di disponibilità.

  • Zonale: Per simulare parzialmente la perdita di tutti i nodi di calcolo durante un guasto nell'area, è possibile arrestare il cluster. Usa questo approccio per convalidare parti dei tuoi processi di rilevamento dell'indisponibilità di una zona e di failover.

Resilienza agli errori a livello di area

Un cluster di Esplora dati di Azure viene distribuito in una singola area di Azure. Se tale area non è più disponibile, il cluster e i relativi dati non sono disponibili.

Soluzioni di multiregione personalizzate per la resilienza

Per ridurre al minimo l'impatto aziendale di un'interruzione dell'area, distribuire cluster di Esplora dati di Azure separati in più aree. Ogni cluster è indipendente. Sei responsabile della gestione di ciascun cluster e del coordinamento della replica dei dati, del routing del traffico e del failover tra regioni.

È possibile decidere tra diversi tipi di configurazioni di cluster multiregion, che supportano livelli diversi di tempo di ripristino, potenziale perdita di dati, sforzo e costo. Selezionare le aree di Azure per ogni cluster che soddisfano i requisiti di latenza e residenza dei dati. Per altre informazioni sulle configurazioni e i modelli del cluster multiregion che è possibile seguire, vedere Panoramica della continuità aziendale e del ripristino di emergenza.

Backup e ripristino

Per la maggior parte delle soluzioni, non è consigliabile basarsi esclusivamente sui backup. Usare invece le altre funzionalità descritte in questa guida per supportare i requisiti di resilienza. Tuttavia, i backup proteggono da alcuni rischi che altri approcci non comportano. Per altre informazioni, vedere Che cosa sono ridondanza, replica e backup?.

Esplora dati di Azure non offre una funzionalità di backup e ripristino nativa. Se è necessario eseguire il backup dei dati, considerare gli approcci seguenti:

  • L'esportazione continua esporta periodicamente i dati nell'archiviazione esterna e fornisce l'esportazione esattamente una sola volta per i tipi di dati supportati.

  • L'esportazione dei dati nell'archiviazione cloud supporta l'esportazione manuale dei dati in un archivio esterno.

  • Inserire dati non elaborati in Esplora dati di Azure da un'origine upstream, ad esempio un data lake, di cui è possibile eseguire il backup separatamente.

Resilienza all'eliminazione accidentale

Esplora dati di Azure include diversi meccanismi che consentono di proteggersi dall'eliminazione accidentale di cluster, database, tabelle e tabelle esterne:

  • Eliminazione accidentale del cluster o del database: L'eliminazione accidentale del cluster o del database è un'azione irreversibile. Evitare la perdita di dati abilitando un blocco di eliminazione nella risorsa del cluster o del database.

  • Eliminazione accidentale della tabella: Gli utenti con autorizzazioni di amministratore tabella o superiori possono eliminare le tabelle. Se uno di questi utenti elimina accidentalmente una tabella, è possibile recuperarla utilizzando il comando undo drop table. Affinché questo comando abbia esito positivo, è prima necessario abilitare la proprietà di ripristinabilità nei criteri di conservazione.

  • Eliminazione accidentale di tabelle esterne:le tabelle esterne sono entità dello schema di query Kusto che fanno riferimento ai dati archiviati all'esterno del database. L'eliminazione di una tabella esterna elimina solo i metadati della tabella. È possibile recuperarlo eseguendo di nuovo il comando di creazione della tabella.

    Per Archiviazione BLOB di Azure e le tabelle esterne di Azure Data Lake, utilizzare la funzionalità di eliminazione reversibile per proteggersi dall'eliminazione o sovrascrittura accidentale di un blob per un periodo configurabile dall'utente.

Resilienza alla manutenzione del servizio

Esplora dati di Azure applica regolarmente gli aggiornamenti del servizio ed esegue la manutenzione di routine. La piattaforma Azure gestisce automaticamente queste attività pur rimanendo entro i livelli di disponibilità specificati nel contratto di servizio. Assicurarsi che le applicazioni siano preparate per la perdita occasionale della connettività durante la manutenzione del servizio seguendo le indicazioni sulla gestione degli errori temporanei.

Per informazioni sulla manutenzione pianificata imminente, usare integrità dei servizi di Azure.

Contratto di servizio

Il contratto di servizio per i servizi di Azure descrive la disponibilità prevista di ogni servizio e le condizioni che la soluzione deve soddisfare per raggiungere tale aspettativa di disponibilità. Per altre informazioni, vedere SLA per servizi online.

Per essere idoneo per il contratto di servizio di disponibilità di Esplora dati di Azure, l'applicazione deve gestire gli errori temporanei ritentando le richieste non riuscite.