ETL 和 ELT 差异

ETL 和 ELT 都是数据处理的模式,但是两者在逻辑和应用场景下是具有较大差异的。两者的英文单字都是相同的意思:

  • Extract,数据抽取,从数据源中提取数据
  • Ttransform,数据转换,包括了数据清理以及规范化处理,以及其他相关的操作
  • Load,数据加载,可以看作是将当前数据结果交付,应用于下游任务
阅读更多
[统计学习]第三章 K 邻近法

[统计学习]第三章 K 邻近法

K-Nearest Neighbour 即 K 邻近算法,是可用于解决分类和回归问题的算法。在用于解决分类问题的思路是在已知的数据实例上,对于新的实例根据 $k$ 个最邻近的已知训练实例通过多数表决的方案进行预测,因此 $k$ 邻近算法不是一个显式学习过程。$k$ 邻近算法模型要素是通过 $k$ 选择,距离度量以及分类决策规则确认。

阅读更多