cache

Persists the DataFrame with the default storage level (MEMORY_AND_DISK_DESER).

Syntax

cache()

Rückkehr

DataFrame: Zwischengespeichertes DataFrame.

Hinweise

Die Standardspeicherebene wurde in MEMORY_AND_DISK_DESER 3.0 geändert.

Zwischengespeicherte Daten werden für alle Spark-Sitzungen im Cluster freigegeben.

Beispiele

:::note Serverless-Kompatibilität

Databricks empfiehlt, von DataFrame.cache() abzurücken, da DataFrame.cache() nicht mit der serverlosen Compute-Architektur von Databricks kompatibel ist. Materialisieren Sie stattdessen Zwischenergebnisse in einer Delta-Tabelle.

:::

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...