V2EX  ›  英汉词典

Delta Lake

定义 Definition

Delta Lake(德尔塔湖)是一种开源的数据湖存储层/表格式技术,常与 Apache Spark 配合使用,为数据湖提供 ACID 事务版本管理(时间旅行)统一批流处理模式约束与演进 等能力,通常基于云对象存储(如 S3、ADLS、GCS)上的 Parquet 文件实现。

发音 Pronunciation

/ˈdɛltə leɪk/

例句 Examples

Delta Lake adds ACID transactions to a data lake.
Delta Lake 为数据湖增加了 ACID 事务能力。

By using Delta Lake, the team can run batch and streaming jobs on the same tables while tracking every change over time.
通过使用 Delta Lake,团队可以在同一套表上同时运行批处理与流处理作业,并随时间追踪每一次数据变更。

词源 Etymology

“Delta”源自希腊字母 Δ(delta),常用来表示“变化/增量”(在数学、科学与工程语境中很常见);“Lake”在数据工程中指“数据湖”(以低成本存放海量原始数据的存储体系)。组合起来,“Delta Lake”强调在数据湖之上引入对“变化”和“可靠管理”的能力(如事务、日志与版本)。

相关词 Related Words

文学与著作出现 Works

  • Learning Spark, 2nd Edition(Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee)——在现代 Spark 数据工程语境中讨论 Delta Lake/湖仓相关实践。
  • Streaming Systems(Tyler Akidau 等)——虽不以 Delta Lake 为核心,但常被用于理解其批流一体与一致性需求的背景。
  • Databricks 官方文档与白皮书(如 Delta Lake Documentation)——最常见、最权威的技术写作出处。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   707 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 19:47 · PVG 03:47 · LAX 11:47 · JFK 14:47
♥ Do have faith in what you're doing.