kettle 3.1 发布
Pentaho Data Integration (Kettle) 3.1 已经发布了,你可以在下列地址下载
- Binary zip file (60 MB)
- Wiki documentation export (105 MB)
- Source zip file (72 MB)
- Javadoc zip file (7 MB)
- OSX dmg image (52 MB)
- Windows Installer : under construction
3.1 版中把文档分离出来,放在了pentaho的wiki上来,这次一共有562 个bug 修复和新功能.
新功能的介绍在http://wiki.pentaho.com/display/EAI/What%27s+new+in+PDI+version+3.1 上.
简单来说主要有一下一些改进:
1. 界面上的改进(增强易用性)
现在吧输出结果放在单独的面板里用tab分隔.
2. 性能图形
这个算是最大的一个改进,对性能输出增加了一个图形显示
3. 新的数据库连接对话框
以前那个对话框有很多不必要的东西,而且显示的UI 也太复杂,新的数据库连接对话框简化了一点.
4. Zoom
现在对于设计面板里面的东西都可以放大和缩小。
5. Snap to Grid
就是为了放大缩小而设定的格子的大小. 大概意思是一个格式多大吧.
6. 新的欢迎界面
新的欢迎界面多了一个教新手怎么开始的文档了 ,在 http://wiki.pentaho.com/display/EAI/Getting+Started
剩下的就是一些新的Step 和Job ,然后就是增加了几个冷门数据库的支持.可以在上面的what’s new in kettle 3.1 中找到,它每一个step ,job 都有文档的,大多数也有一个实例,还是在它的samples 目录下,个人觉得比较有用的几个step 是
SQL File Output 把结果输出成sql形式,然后后面又可以执行这个文件.
Add a checksum 在做type2 的缓慢维的时候可能有的人喜欢这种方式,不过不知性能会不会很慢.
Data validator 配合Error Handling 一起来验证数据的.(虽然我个人比较喜欢像OWB 那样把这种验证工作单独做成 一种validate , clean , transform 的形式, 这种数据清理的工作和转换的工作分开.)
job 里面增加了一个shell 还蛮有用的,windows 下可以执行cmd 里的命令,linux 下更不用说了.