Bemærk
Adgang til denne side kræver godkendelse. Du kan prøve at logge på eller ændre mapper.
Adgang til denne side kræver godkendelse. Du kan prøve at ændre mapper.
Microsoft OneLake er en samlet datalake for hele din organisation. Hver Microsoft Fabric-lejer inkluderer automatisk OneLake, og det er det eneste sted for alle dine analysedata. Det er et centralt arkiv, hvor du kan lagre, administrere og styre alle dine data til analyse- og AI-arbejdsbelastninger på tværs af organisationen.
OneLake er bygget på Azure Data Lake Storage og gemmer tabeller i Delta Parquet- eller Iceberg-format, to åbne standarder, som ethvert værktøj kan læse. Denne tilgang betyder, at dine data ikke er låst til proprietære formater.
OneLake tilbyder:
- Samlet datalagring for hele organisationen med indbygget styring og sikkerhed
- En kopi af data til brug med flere analytiske motorer uden duplikation
- Fleksibel forbindelse via filudforsker, ADLS Gen2 API'er og Azure-serviceintegrationer
- Databeskyttelse og overvågning med indbygget redundans, katastrofeberedskab og adgangsdiagnostik
Samlet datalagring
Før OneLake oprettede organisationer ofte flere søer for forskellige forretningsgrupper, hvilket medførte ekstra omkostninger ved at administrere flere ressourcer. Denne siloede tilgang gjorde det vanskeligt at samarbejde på tværs af teams, sænkede hastigheden af dataprojekter og øgede risikoen for duplikation.
OneLake løser disse udfordringer ved at give dig et centralt dataadgangspunkt for hele organisationen. Hver Fabric-lejer leveres med en enkelt OneLake-instans. Du kan ikke slette OneLake eller oprette flere OneLakes, og der er ingen infrastruktur til at provisionere eller administrere. Afdelinger, teams og projekter kan gemme eller forbinde deres data i denne samlede sø og organisere dem ved hjælp af Fabric-domæner, underdomæner og arbejdsområder – hver med deres egen administrator. Denne model opretholder dataejerskab og muliggør fødereret styring, samtidig med at autoriserede brugere stadig kan opdage og bruge data uden friktion.
Centralt styret med distribueret ejerskab
Fabric-data findes i følgende hierarki for organisation og styring:
- Lejer: Lejerniveau-politikker beskytter automatisk alle data, der lander i OneLake, for sikkerhed, compliance og datastyring.
- Arbejdsområde: Du kan oprette et vilkårligt antal arbejdsområder i din lejer for at organisere dine data. Arbejdsområder gør det muligt for forskellige dele af organisationen at distribuere ejerskabs- og adgangspolitikker. Hvert arbejdsområde er en del af en kapacitet, der er knyttet til en specifik region og faktureres separat.
- Dataelementer: Arbejdsområder indeholder dataelementer som søhuse, lagre, eventhouses og KQL-databaser. Hver opgavetype er specialbygget til specifikke arbejdsbelastninger som Spark-baseret analyse, T-SQL-forespørgsler, realtidsstreaming og mere.
Du kan få flere oplysninger under Arbejdsområder.
Opdag og administrer med OneLake-kataloget
OneLake-kataloget er det eneste sted, hvor dataprofessionelle og erhvervsbrugere kan opdage, administrere og styre de data, de ejer og kan få adgang til på tværs af OneLake.
Brugere kan filtrere efter domæne, arbejdsområde, artikeltype, anbefalinger og mere for at finde præcis det, de har brug for, hvor hvert dataelement beriges med metadata såsom beskrivelser, ejere, skema, afstamning og brugsmålinger.
Dataejere kan få indsigt og anbefalede tiltag for at forbedre datakvalitet og overholdelse, herunder indsigt i dækning af følsomhedsetiketter, mærkning, godkendelser og dataplacering.
For mere information, se OneLake-kataloget.
Sikkerhed
OneLakes sikkerhedsmodel lader dig dele data bredt uden at eksponere følsomme oplysninger. Ved at bruge OneLake-sikkerhedsroller kan du definere granulære tilladelser på dataelementer, helt ned til specifikke mapper, tabeller eller endda rækker og kolonner. For eksempel kunne du dele et salgsdatasæt med et team, men begrænse adgangen til kolonnen Cost , eller du kunne lade en partner kun se rækker, hvor Region = "US". OneLake gemmer disse roller og håndhæver dem automatisk på tværs af alle analyseoplevelser. Så hvis en bruger kun har adgang til en del af et datasæt, gælder den regel, uanset om de forespørger via SQL, kører en Spark-notebook eller ser en Power BI-rapport. OneLake sikrer, at de kun ser det, de har lov til at se.
Denne samlede tilgang til sikkerhed betyder, at brugerne ikke behøver at opretholde separate tilladelser på tværs af forskellige motorer. Det betyder også, at de oprindelige dataejere altid har kontrol over, hvem der kan få adgang til datakilden, selv hvis dataene sendes til et søhus eller arbejdsområde ejet af en anden.
Du kan anvende følsomhedsetiketter på OneLake-elementer, ligesom du ville på et dokument, og disse etiketter håndhæver krypterings- eller adgangsbegrænsninger, selvom dataene eksporteres til Excel eller et andet værktøj. Ligeledes kan datatabsforebyggelse (DLP)-politikker opdage følsomme datauploads eller -downloads fra OneLake og forhindre eller advare om potentielle datalækager.
For mere information, se Begynd at sikre dine data i OneLake.
Én kopi af data
Alle Fabric-analysemotorer arbejder direkte med data i OneLake. Du behøver ikke kopiere data for at bruge dem med en anden engine eller analysere data fra flere kilder.
Shortcuts
En genvej er en reference til data, der er gemt på andre filplaceringer. Disse filplaceringer kan være inden for samme arbejdsområde, et andet arbejdsområde i OneLake eller eksternt i forhold til OneLake. Du kan bruge genveje til OneLake, Azure Data Lake Storage, Azure Blob storage, Amazon S3- og S3-kompatible kilder, Iceberg-kompatible kilder, Microsoft Dataverse, on-premises kilder og mere. Uanset placeringen får genveje filer og mapper til at se ud, som om de er gemt lokalt.
Genveje gør det muligt for din organisation at samle data på tværs af clouds og domæner uden at kopiere dem. Teams kan arbejde uafhængigt i separate arbejdsområder og bruge genveje til at dele data med hinanden i stedet for at duplikere dem. For eksempel kan et team oprette en genvej til et datasæt i et andet teams arbejdsområde eller til en ekstern S3-bucket og derefter kombinere disse data med deres egne i OneLake. Genvejen peger på kilden, så når kildedataene opdateres, er ændringerne straks synlige gennem OneLake. På denne måde kan du skabe virtuelle produkter eller visninger, der samler data fra flere forretningsgrupper for at opfylde et specifikt behov, uden at flytte eller duplikere dataene. Ved at bruge genvejstransformationer kan du endda anvende automatiske ændringer på dataene, såsom at konvertere dataformatet eller fjerne personligt identificerbare oplysninger (PII).
Du kan få flere oplysninger om, hvordan du bruger genveje, under OneLake-genveje.
Mirroring
Mirroring in Fabric er en lavpris, lav-latenstid, der kontinuerligt replikerer data fra forskellige systemer til OneLake. Du kan sikkert forbinde til en ekstern datakilde og automatisk spejle (kopiere) udvalgte databaser eller tabeller ind i OneLakes åbne format, så de forbliver synkroniserede næsten i realtid. De spejlede data gemmes som Delta Parquet i OneLake, så de er straks klar til analyse af enhver Fabric-motor.
Spejling understøtter kilder som Azure SQL Database, Azure Cosmos DB, Azure Database for PostgreSQL, Azure Databricks (Unity Catalog), Snowflake og flere. Ændringer i kildekoden bliver kontinuerligt videreført, så din OneLake-kopi forbliver up-to-dato uden manuelle ETL-jobs. Du kan køre analyse-, AI- eller Power BI-rapporter på friske data uden direkte at forespørge produktionskilden.
For mere information, se Hvad er mirroring i Fabric?
Samarbejd i flere analytiske motorer
Fabric analytiske motorer (T-SQL, Apache Spark, Analysis Services og andre) gemmer alle data i OneLake i det åbne Delta Parquet-format. Denne standardisering gør det muligt at bruge de samme data på tværs af flere motorer. Du behøver ikke kopiere data bare for at bruge dem med en anden motor eller føle dig fanget med at bruge en bestemt motor, fordi det er der, dine data er.
For eksempel bygger et team af SQL-ingeniører et fuldt transaktionelt datalager. De bruger T-SQL-motoren til at oprette tabeller, transformere data og indlæse dataene i tabeller. Hvis en data scientist ønsker at bruge disse data, kan de vedhæfte en Spark-notesbog til OneLake og læse disse tabeller direkte. Fordi OneLake gemmer tabellerne i Delta-format, kan Spark indlæse dem uden særlige connectors eller dataeksporter. Både SQL-forespørgslerne og Spark-jobbene kører på én kopi af dataene i OneLake.
Derudover kan erhvervsbrugere bygge Power BI-rapporter oven på OneLake ved at bruge Direct Lake-tilstanden i Analysis Services-motoren. Direct Lake-tilstand er en dataadgangstilstand, der indlæser og opdaterer store mængder data hurtigt uden at lave en kopi. Du kan finde flere oplysninger under Oversigt over Direct Lake.
Interoperabilitet i åbne tabellformater
OneLake understøtter både Delta Lake- og Apache Iceberg-tabelformater gennem metadatavirtualisering. Denne funktion genererer automatisk virtuelle metadata, så Iceberg-tabeller kan læses som Delta Lake-tabeller på tværs af Fabric-arbejdsbelastninger, og Delta Lake-tabeller kan læses af eksterne Iceberg-læsere. Du kan skrive Iceberg-tabeller direkte til OneLake eller oprette genveje til Iceberg-tabeller, der er gemt eksternt, og OneLake gør dem tilgængelige for alle Fabric-motorer uden manuel konvertering. På samme måde kan enhver Delta Lake-tabel i OneLake tilgås via Iceberg-kompatible tjenester som Snowflake.
Du kan få flere oplysninger under Brug Iceberg-tabeller med OneLake.
Forbind til OneLake
Du kan få adgang til OneLake-data fra Fabric-portalen, Windows, eksisterende Azure-værktøjer eller enhver applikation, der understøtter ADLS Gen2 API'er.
OneLake-stifinder til Windows
Du kan udforske OneLake-data fra Windows ved at bruge OneLake-stifinder til Windows. Du kan navigere i alle dine arbejdsområder og dataelementer, nemt uploade, downloade eller redigere filer på samme måde som i Office. OneLake filudforskeren forenkler arbejdet med datalakes, så selv ikke-tekniske erhvervsbrugere kan bruge dem.
Du kan få flere oplysninger i OneLake-stifinder.
ADLS Gen2 API'er og SDK'er
OneLake understøtter Azure Data Lake Storage (ADLS) Gen2 API'er og SDK'er, så du kan bruge eksisterende ADLS Gen2-applikationer. Hvert arbejdsområde vises som en container, og dataelementer vises som mapper inden for disse containere. Du kan finde flere oplysninger under OneLake-adgang og API'er.
Fordi OneLake er kompatibel med ADLS Gen2-applikationer, kan du forbinde til OneLake fra Azure-tjenester. Eksempel:
Databeskyttelse og overvågning
OneLake inkluderer indbyggede funktioner til at holde dine data sikre og give dig indsigt i, hvordan de bliver brugt.
Katastrofeberedskab og databeskyttelse
OneLake beskytter automatisk dine data med indbygget redundans. I regioner, der understøtter tilgængelighedszoner, bruger OneLake zone-redundant lagring (ZRS) til at replikere data på tværs af flere datacentre. I andre regioner bruger den lokalt redundant lagring (LRS). For yderligere beskyttelse mod regionsomfattende nedbrud kan du aktivere forretningskontinuitet og katastrofegendannelse (BCDR) på en kapacitet til at geo-replikere dine data til en parret Azure-region. OneLake understøtter også soft delete, som gemmer slettede filer i syv dage, så du kan gendanne fra utilsigtede sletninger.
For mere information, se Disaster recovery and data protection for OneLake.
Diagnosticering
OneLake-diagnostik giver indsigt i, hvordan data tilgås og bruges på tværs af dit Fabric-miljø. Når du aktiverer diagnostik på arbejdsområdeniveau, streamer den dataadgangshændelser som logfiler ind i et lakehouse. Du kan spore, hvem der har tilgået hvilke data, hvornår og hvordan. Denne logning dækker brugerhandlinger i Fabric UI, programmatisk adgang via API'er og analysemotorer samt adgang på tværs af arbejdsområder via genveje.
Du kan finde flere oplysninger under OneLake-diagnosticering.