Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Lakebase si basa su un set di funzionalità che consentono di sviluppare, testare e ridimensionare le applicazioni di database in modo efficiente. Questa sezione presenta i concetti di base che differenziano Lakebase dai sistemi di database tradizionali.
Progetti
Un progetto Lakebase è il contenitore di primo livello per tutte le risorse del database. Ogni progetto appartiene a un'area di lavoro Azure Databricks e contiene uno o più rami, ognuno con i propri database e calcolo.
Project
└── Branch (e.g., production)
├── Compute (read-write)
└── Database (e.g., databricks_postgres)
Altre informazioni: Gestire progetti |
Autoscaling
Lakebase regola automaticamente le risorse di calcolo in base alle esigenze del carico di lavoro. Man mano che il traffico dell'applicazione aumenta o diminuisce, le risorse di calcolo aumentano o diminuiscono all'interno dell'intervallo configurato senza interventi manuali o tempi di inattività.
Vantaggi principali:
- Regolazione automatica: Ridimensionamento delle risorse in base alla domanda effettiva.
- Nessun tempo di inattività: Il ridimensionamento all'interno dell'intervallo configurato avviene senza interrompere le connessioni. Tuttavia, la modifica della configurazione minima o massima del cu può causare una breve interruzione.
- Ottimizzazione dei costi: Pagare solo le risorse effettivamente usate.
- Coerenza delle prestazioni: Mantenere le prestazioni reattive durante i picchi di traffico.
Altre informazioni:Configurare la | scalabilitàautomatica
Scala a zero
Quando il database è inattivo, Lakebase può ridimensionare automaticamente le risorse di calcolo fino a zero, eliminando i costi per la capacità inutilizzata. Quando l'attività riprende, le risorse di calcolo si ridimensionano automaticamente in pochi secondi.
Vantaggi principali:
- Nessun costo inattivo: Nessun costo di elaborazione computazionale quando il database è inattivo.
- Ripresa immediata: I database si riattivano automaticamente quando si accede.
- Adatto allo sviluppo: Ideale per ambienti di sviluppo e staging con utilizzo intermittente.
- Gestione automatica: Non è necessario alcun intervento manuale.
Altre informazioni: Ridimensionare fino a zero | Configurare la scalabilità a zero
Rami di database
I rami di database in Lakebase funzionano in modo analogo ai rami Git per il codice. È possibile creare rami istantanei, isolati per lo sviluppo, il test o la sperimentazione senza duplicare i dati o influire sull'ambiente di produzione.
Vantaggi principali:
- Creazione immediata: I rami vengono creati in secondi usando la tecnologia copy-on-write.
- Conveniente: Solo i dati modificati vengono archiviati separatamente, riducendo al minimo i costi di archiviazione.
- Ambienti isolati: Testare le modifiche in modo sicuro senza influire sul database primario.
- Collaborazione: I membri del team possono lavorare contemporaneamente su rami separati.
Per saperne di più: Rami del database | Gestisci rami
Risorse di calcolo ed endpoint
Un endpoint Lakebase è il punto di connessione stabile usato dall'applicazione per raggiungere un database. Dietro ogni endpoint, una o più istanze di calcolo gestiscono l'elaborazione delle query. Il stringa di connessione rimane invariato anche quando si ridimensionano le risorse di calcolo o si aggiunge una disponibilità elevata.
Un branch ha in genere un endpoint di lettura/scrittura (l'istanza di calcolo primaria) e, facoltativamente, uno o più endpoint di sola lettura (repliche di lettura).
Scopri di più: Risorse di calcolo ed endpoint | Gestire le risorse di calcolo
Architettura di archiviazione
Lakebase archivia i dati in un livello di archiviazione distribuito separato dal calcolo. L'archiviazione è ridondata tra zone e rimane disponibile indipendentemente dallo stato delle risorse di calcolo, sia che siano in esecuzione, in pausa o in fase di failover. Questa separazione dell'archiviazione consente rami istantanei, repliche in lettura e scalabilità a zero senza duplicazione dei dati.
Vantaggi principali:
- Archiviazione a disponibilità elevata: Azure Databricks gestisce l'archiviazione a disponibilità elevata indipendentemente dall'impostazione di calcolo a disponibilità elevata.
- Persiste nonostante le modifiche alle risorse di calcolo: Lo storage rimane disponibile in caso di guasti, pause o modifiche della configurazione.
- Base per rami e repliche: La creazione immediata dei rami e le repliche in lettura si basano su più istanze di calcolo che condividono lo stesso livello di archiviazione.
Altre informazioni: Architettura di archiviazione
Disponibilità elevata
La disponibilità elevata associa un calcolo primario di lettura/scrittura con una o più istanze di calcolo secondarie distribuite tra zone di disponibilità. Quando il database primario diventa non disponibile, Lakebase promuove automaticamente un database secondario e l'applicazione continua dall'ultima transazione sottoposta a commit. La stringa di connessione rimane invariata per tutta la durata. L'archiviazione è già ad alta disponibilità. L'abilitazione dell'alta disponibilità aggiunge ridondanza a livello di risorse di calcolo per il failover automatico.
Vantaggi principali:
- Failover automatico: Lakebase promuove un'istanza di calcolo secondaria senza intervento manuale.
- Nessuna perdita di dati: Il failover mantiene tutte le transazioni di cui è stato eseguito il commit.
- Stringhe di connessione stabili: L'applicazione non deve modificare la configurazione della connessione dopo un failover.
Altre informazioni:Disponibilità elevata Gestire la disponibilità elevata |
Repliche in lettura
Le repliche di lettura sono calcoli di sola lettura indipendenti che eseguono operazioni di lettura sugli stessi dati del calcolo di lettura/scrittura primario. A differenza delle repliche tradizionali, le repliche in lettura di Lakebase non duplicano i dati, ma leggono dallo stesso livello di archiviazione, consentendo la creazione immediata ed eliminando costi di archiviazione aggiuntivi.
Vantaggi principali:
- Ridimensionamento orizzontale: Distribuire le richieste di lettura tra più repliche.
- Nessuna duplicazione dei dati: Tutte le repliche leggono dalla stessa risorsa di archiviazione.
- Creazione immediata: Disponibile in secondi senza copia dei dati.
- Economico: Senza costi di archiviazione aggiuntivi, oltre al supporto di scalabilità automatizzata e scalabilità fino a zero.
Altre informazioni: Repliche di lettura | Gestire le repliche di lettura
Come interagiscono
Questi concetti di base interagiscono per creare una piattaforma di database potente e flessibile:
- I progetti organizzano tutte le risorse del database e appartengono a Un'area di lavoro Azure Databricks.
- La scalabilità automatica garantisce che ogni ramo abbia la giusta quantità di calcolo in base alla richiesta.
- La scalabilità a zero riduce i costi dei rami inattive sospendendo il calcolo quando non è in uso.
- I rami di database consentono di creare ambienti isolati per lo sviluppo e il test senza duplicare i dati.
- Le risorse di calcolo e gli endpoint forniscono punti di connessione stabili quando si espande o si riconfigura l'infrastruttura.
- L'architettura di archiviazione mantiene la ridondanza della zona dati e la disponibilità elevata, indipendentemente dallo stato di calcolo.
- La disponibilità elevata aggiunge ridondanza a livello di calcolo e failover automatico tra le zone di disponibilità per i carichi di lavoro di produzione.
- Le repliche di lettura distribuiscono il traffico di lettura tra istanze di calcolo aggiuntive.
Questa architettura consente di creare e ridimensionare applicazioni di database con maggiore flessibilità, costi inferiori e un sovraccarico operativo inferiore rispetto ai sistemi di database tradizionali.