EDA.md 1.1 KB

探索性数据分析(Exploratory Data Analysis, EDA)

探索性数据分析是根据数据寻找规律、发现问题的过程。面对数据,实现并没有一个确定的目标,也没有确定的分析方法。对于数据中包含的信息事先是不知道的。探索性数据分析是数据驱动的,数据本身蕴含的规律是不知道的。探索性数据分析是发散的,没有一个固定的目标。探索性数据分析使用的方法主要有数据变换、数据可视化、数据建模。通过这些过程观察数据的特征,提出问题。探索性数据分析所使用的方法是已知的,试探性的,枚举的。根据这些方法产生具体的方法,再去验证。有些想法可能成功,有些会失败。 探索性数据分析的任务是理解数据。一个事物的变化,从内部演化的角度看,是辩证逻辑的推演过程,从外部环境来看,是一定的变异因素作用的结果。由于这些因素的自身变化,表现在观测变量上数值的变异。科研的对象常常是后者。