开源和商业ETL工具
在infobright 看到一个关于ETL工具选择的一个投票, 结果如下
- Kettle 75 votes
18.99%
- PHP 64 votes
16.2%
- Perl 48 votes
12.15%
- Other Language 38 votes
9.62%
- Python 35 votes
8.86%
- Ruby 27 votes
6.84%
- C/C++/C# 24 votes
6.08%
- Talend 24 votes
6.08%
- Other Commercial ETL Tool 18 votes
4.56%
- Other Open Source ETL Tool 13 votes
3.29%
- Informatica 13 votes
3.29%
- DataStage 9 votes
2.28%
- Ab Initio 7 votes
1.77%
Total Votes: 395
同时我们也看一下gartner 在2008年12月发布的Data Integration 工具的一个调查报告.
总结上面两份资料, 可以看出Informatica 和IBM 的DataStage 仍然都是ETL界的老大, 而且很难有撼动的趋势,尤其是电信,金融,银行,基本都是选用这种工具, 而其他的商业ETL提供商都是各有长短, 尤其是有自己商业产品线的公司如Microsoft ,Oracle ,SAS, SAP 都是能够很好的与自己的产品线补充,
而在开源ETL产品中也不缺乏好的产品支持, 最有名的两个就是Kettle 和Talend 了,基本上都是各有千秋, 而且最总要的两点就是:社区和商业支持, 看看其他成功的开源产品如mysql ,linux , 都是在这两点上做的非常成功,才能成为开源界的典范, 其他也有一些不错的开源ETL 产品虽然在社区和商业支持上没有前两个有名,比如xaware, 在infoq 上也有几次他的报道.
国内也有一个开源的ETL工具dengues (http://code.google.com/p/dengues/) ,由国人开发, 基本上还在起步阶段, 可以作为开源ETL爱好者的一个学习项目.
参考资料
http://mediaproducts.gartner.com/reprints/sas/vol5/article4/article4.html
一些可以用于生产环境的ETL工具:
您好:
,能告诉我您的邮箱地址吗? 不胜感激。
由于现在要做一些ETL方面的项目,但是关于ETL一点都不懂,公司也没有相应的积累只能在网上找资料,看到您的文章后能否向您请教一些问题