2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > Kettle 与 Talend Open Studio 的 ETL 比较以及其它ETL工具(网络收集)

Kettle 与 Talend Open Studio 的 ETL 比较以及其它ETL工具(网络收集)

时间:2022-08-14 07:41:47

相关推荐

Kettle 与 Talend Open Studio 的 ETL 比较以及其它ETL工具(网络收集)

Kettle 与 Talend Open Studio 的 ETL 比较

Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。

Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。

两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码。

学习曲线、易用性以及文档

Pentaho Kettle 和 Talend Open Studio 都是用户友好型工具。它们都拥有优秀的数据和数据库管理背景(JDBC,SQL,文件格式化,编程基础,等等),成为高产能的工具指日可待。

Kettle 和 Talend 都提供图形化工具使工作更加简便快捷。这些工具可以帮助您迅速设计并测试出可靠的 ETL 流程。

Pentaho Kettle 学起来十分简单,但与 Talend 的产品相比功能略少。Talend Open Studio 更难掌握,但是一旦您熟悉的它的 IDE,您就可以享受到这个工具强大的灵活与效力。使用 Talend Open Studio 的一个要求是正确定义您要处理的数据的 schema,在这个工程中,它的 IDE 大有助益。而在这一点上,Kettle 限制更少,因此您可以更快地建立起流程来。而且定义元数据对 Talend 来说是一个重要的功能,因为这会帮助您在生产环境中做出更可靠的流程。

Talend Open Studio 和 Pentaho Kettle 都是用户友好型,拥有丰富文档和强大社区支持的产品。只不过 Talend Open Studio 需要您投入稍大的精力来熟悉。但是,一旦您入门了,您就可以享受到这个工具的强大和潜力。

可靠、成熟、技术支持

Talend 和 Pentaho 都有强大的社区支持,而且都是强大、知名的的企业。开源商务智能是不断发展,而实际使用中的应用程序正变得越来越相同。

在这个背景下,Talend 和 Pentaho 都提供了它们的开源 ETL 工具,并得到了广泛地使用。它们在实际使用中发展,同商用软件一样以任务为功能实现的核心。

Talend 更专注于数据集成和数据管理解决方案(当然,现在还要加上 SOA),然而 Pentaho 主要集中于商务智能。Talend Open Studio 得到了 Talend 非常活跃地开发,而且该公司已经建立了一个丰富的数据集成生态系统,而 Kettle 是 Pentaho 的一个重要项目,只是比起 Talend 的产品,开发与扩展方面还稍逊一筹。

Pentaho 和 Talend 的解决方案都非常可靠,成熟,而且发展迅速。实际运用中两者实现的功能有所趋同。经由订阅您可以获得支持服务,也可以按照需求取得直接的咨询服务。

组件、技术与功能

Talend Open Studio 是基于 Eclipse 的 Java 工具。您在图形化编辑器中设计的流程可以使用 Java 语言编译。此时,您可以轻松地使用 Java 全部的生态系统

Talend Open Studio 的组件种类和具有的功能非常丰富,既有通用工具,也有专用工具。在通用工具中,Talend 配备了一套 RDBMS 组件,通过它们您很快就可以掌握某个特定 DB 厂商的高级功能。您可以将用到的定义储存在多个不同的存储库(repository)中,从而在项目发展中使用这些定义。

Pentaho Data Integration (Kettle) 使用 Java (Swing)开发。Kettle 作为编译器对 XML 格式书写的流程进行编译。这些功能和组件比起 Talend 在丰富性方面稍逊一些,但是您建立复杂 ETL 流程需要的一切元素。Kettle 的 JavaScript 引擎(和 Java 引擎)可以深层地控制对数据的处理。

Talend 功能更加丰富,比起 Kettle 拥有更加灵活的技术特点。通过 Talend,您可以轻松地使用完整的 Java 生态和一些DB厂商提供的专用的DB功能。Kettle 工具也很优秀,同时更加专注于 ETL 功能。

其它ETL工具

1、KETL

KETL™是首屈一指的,开源的ETL工具。数据集成平台是建立与便携式,基于Java的体系结构和开放的,基于XML的配置和工作语言。KETL™功能可以成功地与主要商业产品竞争今日。

· 授权协议:LGPL/GPL

· 开发语言:Java

· 操作系统: 跨平台

2、Palo ETL Server

Palo ETL Server是一个Java的工具用来对数据进行抽取、转换和加载到Palo OLAP Server中,该项目已经整合到Palo BI Suite中,并且不再更新。

· 授权协议: 未知

· 开发语言:Java

· 操作系统: 跨平台

3、Scriptella

Scriptella是一个开源的ETL(抽取-转换-加载)工具和一个脚本执行工具,采用Java开发。

任务配置示例

<!DOCTYPE etl SYSTEM "/dtd/etl.dtd">

<etl>

<connection driver="$driver" url="$url" user="$user" password="$password"/>

<script>

<include href="PATH_TO_YOUR_SCRIPT.sql"/>

-- And/or directly insert SQL statements here

</script>

</etl>

授权协议:Apache

开发语言:Java

操作系统: 跨平台

4、Enhydra Octopus

Enhydra Octopus是一个基于Java开发的数据ETL(抽取、转换和加载)工具,可以连接到兼容JDBC的数据库并根据XML定义文件对数据进行抽取和处理。

· 授权协议:GPL

· 开发语言:Java

· 操作系统: 跨平台

5、Apatar

Apatar是一个开源的数据抽取、转换、 装载(ETL)项目。模块化的架构。提供可视化的Job设计器与映射工具,支持所有主流数据源,提供灵活的基于GUI、服务器和嵌入式的部署选项。

· 授权协议:GPL

· 开发语言:Java

· 操作系统: 跨平台

6、Talend (踏蓝)

Talend (踏蓝)是第一家针对的数据集成工具市场的ETL(数据的提取Extract、传输Transform、载入Load)开源软件供应商。

Talend以它的技术和商业双重模式为ETL服务提供了一个全新的远景。它打破了传统的独有封闭服务,提供了一个针对所有规模的公司的公开的,创新的,强大的灵活的软件解决方案。最终,由于Talend的出现,数据整合方案不再是被大公司所独享。

· 授权协议: GPL

· 开发语言: Java

· 操作系统: 跨平台

7、CloverETL

ETL是一切数据仓库应用的基础。CloverETL是一个基于Java的开源的ETL框架,同时还包含了一个ETL设计器——CloverETL Designer。核心的算法就是一个数据流网络。

一ETL工具

【国外】

1.datastage

点评:最专业的ETL工具,价格不菲,使用难度一般

下载地址:ftp://ftp./Pub/Develop...taStage.v7.5.1A-iSO

BT种子下载:/share/link?shareid=172289&uk=67437475

---------------------------------------

2.informatica

点评:专业程度如Datastage旗鼓相当,价格似乎比Datastage便宜。

InformaticaPowerCenter8.6.1forWin32Bit

服务端下载:/share/link?shareid=183214&uk=67437475

客户端下载:/share/link?shareid=183217&uk=67437475

InformaticaPowerCenter8.6.0forWin32Bit

BT种子下载:/share/link?shareid=172290&uk=67437475

InformaticaPowerCenter8.1.1forWin32Bit

安装包下载:/share/link?shareid=183201&uk=67437475

---------------------------------------

3.kettle

点评:业界最有名的开源ETL工具。开源当然就免费,免费的有些东西使用就不是很方便。

下载地址:/

---------------------------------------

4.ODI

点评:oracle数据库厂商提供的工具,有局限性,与oracle数据库耦合太深。

下载地址:/technetwork/cn/testcontent/index-091026-zhs.html

---------------------------------------

5.Cognos

下载地址:/developerworks/cn/downloads/im/cognosbi/

CognosBI8.3

BT种子下载:/share/link?shareid=172287&uk=67437475

CognosBI8.4

BT种子下载:/share/link?shareid=172288&uk=67437475

------------------------------------------

【国内】

6.beeload

点评:最好的国产ETL工具,但产品化程度还有一定距离。

下载地址:

---------------------------------------

二专业调度工具

有人说:ETL是BI的基础,而调度是ETL的灵魂,可见调度的重要性!

调度原本是ETL技术的一个分支,但这些年,调度越来似乎有走独立工具的趋势。虽然在ETL工具有调度功能,但与独立调度工具相比,ETL工具的调度就显得很弱了。

【国外】

1.Control-M

点评:你当了大哥太多年,确实有点寂寞。不论是你的规模、价格、使用难度,都很伟大,但我一界平民,你对我只是传说。

官网地址:

--------------------------------------

【国内】

2.taskctl

点评:调度新秀。专业,而且设计独特、体验友好。易安装、易使用,看好其前景。

下载地址:/html/...8b57714a50a15a.html

--------------------------------------

3.ETS

点评:专业化有待提升

官网地址:/

--------------------------------------

4.Moia

点评:产品与项目是有区别的,不要总是在产品化与客户化之间徘徊。

官网地址:/_d271218319.htm

--------------------------------------

5.ETL-Plus

点评:功能全,遗憾的是东南倒塌。

下载地址:[无]

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。