V2EX  ›  英汉词典

Exploratory Data Analysis

定义 (Definition)

探索性数据分析:在正式建模或假设检验之前,通过可视化、汇总统计、分组比较、异常值检查等方式,先“摸清”数据的结构、分布、模式与潜在问题(如缺失、偏差、离群点),以帮助提出更合理的问题与后续分析方向。常简称 EDA

发音 (Pronunciation, IPA)

/ɪkˈsplɔːrətɔːri ˈdeɪtə əˈnæləsɪs/

例句 (Examples)

I did exploratory data analysis to understand the dataset.
我做了探索性数据分析来理解这个数据集。

Before building the model, the team used exploratory data analysis to check the distribution, missing values, and potential outliers, then adjusted the data-cleaning plan.
在建立模型之前,团队用探索性数据分析检查分布、缺失值和潜在离群点,然后调整了数据清洗方案。

词源 (Etymology)

exploratory 来自 explore(探索),表示“用于探索的”;data analysis 指“数据分析”。作为一个统计与数据科学中的常用术语,EDA 在现代意义上常与统计学家 John W. Tukey(约翰·图基)在 20 世纪对“先探索、后建模”的方法论倡导密切相关。

相关词 (Related Words)

文献与作品示例 (Notable Works)

  • John W. Tukey, Exploratory Data Analysis(1977)
  • Hadley Wickham & Garrett Grolemund, R for Data Science(2017;讨论 EDA 工作流)
  • Trevor Hastie, Robert Tibshirani & Jerome Friedman, The Elements of Statistical Learning(多处涉及在建模前理解数据特征的实践思想)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2043 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 12:50 · PVG 20:50 · LAX 04:50 · JFK 07:50
♥ Do have faith in what you're doing.