🎊 什么是 ETL?

什么是 ETL?

在数据转换中,提取、转换、加载(ETL)工具将转换和整合暂存区域中的原始数据,为目标数据仓库做好准备。数据转换阶段可能涉及以下类型的数据更改。

基本数据转换

基本转换通过消除错误、清空数据字段或简化数据来提高数据质量。这些转换的示例如下。

数据清理

数据清理可消除错误并将源数据映射到目标数据格式。例如,您可以将空数据字段映射到数字 0,将数据值“Parent”映射到“P”,或将“Child”映射到“C”。

数据去重复

数据清理中的去重复将识别并删除重复记录。

数据格式修订

格式修订会将字符集、测量单位和日期/时间值等数据转换为一致的格式。例如,一家食品公司可能有不同的配方数据库,其成分以千克和磅为单位。ETL 会将所有单位转换为磅。

高级数据转换

高级转换使用业务规则来优化数据以便于分析。这些转换的示例如下。

推导

推导将业务规则应用于您的数据,以根据现有值计算新值。例如,您可以通过减去费用或通过将每件商品的价格乘以订购的商品数量来计算购买的总成本来将收入转换为利润。

联结

在数据准备中,联结将链接来自不同数据来源的相同数据。例如,您可以通过将不同供应商的采购价值相加,并仅将最终总计存储在目标系统中来找出某件物品的总采购成本。

拆分

您可以在目标系统中将列或数据属性划分为多个列。例如,如果数据来源将客户名称保存为“Jane John Doe”,您可以将其拆分为名字、中间名和姓氏。

汇总

汇总通过将大量数据值减少到较小的数据集中来提高数据质量。例如,客户订单发票值可以有许多不同的小金额。您可以通过将给定时间段内的数据相加来汇总数据,以构建客户生命周期价值(CLV)指标。

加密

您可以通过在数据流到目标数据库之前添加加密来保护敏感数据,以遵守数据法律或数据隐私。

🎯 相关推荐

锥字的成语有哪些
365bet提款审核

锥字的成语有哪些

📅 09-01 👀 5845
Windows XP分盘攻略:轻松实现硬盘分区,提升电脑性能全攻略
女人为什么在后腰纹身(女人后腰纹身叫什么)
office365企业邮箱设置

女人为什么在后腰纹身(女人后腰纹身叫什么)

📅 10-23 👀 2782
《DNF》110版本不用疲劳的图一览
365bet提款审核

《DNF》110版本不用疲劳的图一览

📅 07-12 👀 4078
Windows 10中关闭系统自动更新的多种方法
office365企业邮箱设置

Windows 10中关闭系统自动更新的多种方法

📅 12-19 👀 1862
瑞士男足:排名与辉煌历程
office365企业邮箱设置

瑞士男足:排名与辉煌历程

📅 09-27 👀 2341
欢乐斗地主怎么兑换手机话费:欢乐斗地主快速获得手机话费的操作攻略
C罗绝平+点球,41岁冲世界杯,他能打破梅西8金球纪录吗?
假水性漆与真水性漆的区别是什么?如何辨别?   近日关于“水性漆”,“假水性漆”热议整个涂料行业。尤其愤怒“假水性漆”。为什么在业界如此高度关注“假水性漆”呢?为什...