技术知识库/技术文档/数据/ETL工具DataX与DataX-Web的安装部署.md updated

This commit is contained in:
gaojia 2024-03-03 21:13:43 +08:00
parent 652ed3a57e
commit faae5a261c

View File

@ -1,8 +1,28 @@
auth: 高佳、韩健
**(一) 术语介绍**
DataX是一个开源的数据同步工具而DataX-Web是构建在DataX之上的分布式数据同步工具提供了可视化的操作界面。具体来说
- **DataX**DataX的主要作用是实现不同数据源之间的离线数据同步它支持包括关系型数据库例如MySQL、Oracle等、HDFS、Hive、ODPS、HBase、FTP等多种异构数据源之间的稳定高效的数据迁移工作。DataX通过提供命令行工具和JSON配置文件的方式来执行数据同步任务但这种方式在管理和多任务处理上存在一定的局限性。
- **DataX-Web**为了解决DataX在使用过程中的配置复杂性以及管理上的不便捷DataX-Web应运而生。DataX-Web提供了一个简单易用的操作界面降低了用户使用DataX的学习成本并缩短了任务配置时间。此外它还避免了配置过程中可能出现的错误并支持远程分布式调用DataX的功能使得多节点之间的协作变得更加容易控制。
总的来说DataX适用于需要进行大规模数据迁移的场景而DataX-Web则更适合需要简化操作流程和提升任务管理效率的用户。两者结合使用可以有效提升数据处理的效率和便捷性。
**(二)工具安装**
一、下载tar包
github地址https://github.com/alibaba/DataX
下载tar包地址http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
二、上传tar包解压并安装
上传至服务器/opt/下并解压
tar -xzvf datax.tar.gz
**(三) 实际应用**
<!--stackedit_data:
eyJoaXN0b3J5IjpbMTgxMzk5MTQxMl19
eyJoaXN0b3J5IjpbMTgwMTMwOTM5NF19
-->