存档

‘BI’ 分类的存档

最权威调研机构对所有主流BI 平台调研报告

2009年3月8日 没有评论

如果你看到标题以为这是一篇标题党的文章,那你就要错过重要内容了.

收到olapreport 的一封邮件,说全世界最大的独立BI 调研机构Nigel Pendse 已经发表了它第8份针对全世界最大BI 平台的调研报告. Nigel Pendse 做BI 市场调研已经很多年了,最早的第一份BI 市场调研报告发表于2001年,现在已经是第8份了,世界500强超过一半都接受了调研,这次一共调研了2079个公司(这个数字够有说服力了吧),比去年略少79个,去年有2150个公司接受了调研,全世界最主流的23 款BI 平台都覆盖到了,并且它调研的最主要特点就是技术和用户第一。

它有非常详尽的各种技术比较,全部用客观数据说话,无任何主观论断. 新的报告引入了一种Customer Dashboard 的方式,对BI 平台的26个主要方面KPI 和8个聚合KPI 做全面分析,每一个BI 平台都覆盖到, 让你对每一个技术细节都全面了解 . 全文报告489页,已经放在www.bi-survey.com 上供用户购买,它提供一个8页的预览版可以免费下载,如果你对BI 很有兴趣的话,可以去看看这个报告.

在这8页的预览版中也提供了一些非常有技术含量的数据.

bi-survey-overview

总的用户满意度,一共2071个公司接受调研,分别为已经在使用,六个月内会使用,1年内会使用,2年内会使用,最终会使用和绝不会使用划分. 其中总的使用率只有16.4% ,意思是公司已经购买并建设好data warehouse了,但是在公司内部大范围使用率还是只有16.4%.

其中调研人数最多和使用人数最多的是microstrategy ,一共56个公司(248×22.6%) , microstrategy 的产品一向以易用性闻名,这也在很大程度上符合了这个说法,BI  产品还是要符合用户习惯,做到平民化,很显然microstrategy 深深的了解这一点.

而其他几个大的BI 平台的数据都表现可以, Cognos Reporting, BO , Crystal Reports , OBIEE/BISEO 都在部分领域各有所长.

但最让人惊喜的是Actuate 平台以56.4% 的满意率高居第一,在六个月内打算部署Actuate 的客户数甚至达到了64.1% , 比第二的InformationBuilder 公司的WebFocus 的33.7% 高出了一半,比其他大厂商SAP 的BO,IBM 的 Cognos,Oracle 的OBIEE , Microsoft 的Microsoft AS 高出了2.5倍-4倍,这足以证明Actuate 在易用性和各项技术比拼中拥有无可争议的压倒性优势.

 

如果说上面只是一个大体的统计表格,数据很显然不能让每个人信服,下面就是每一项技术指标的综合

bi-survey-overview2

这就是第八版的customer dashboard , 将所有用户的数据按照26个主KPI 和8个聚合KPI 进行统计, 主KPI 的技术标准包括:用户需求复杂度,满足用户需求满意度,竞争性,购买更多产品意愿,没有持续使用率,员工使用率,部署数,用户使用数,数据容量,管理员数,成功实施时间,产品可靠性,产品质量,性能,随容量增加的性能,随数据增长而产生的延迟等等,8个聚合KPI 技术标准包括:商业目标达成KPI , 费用,可伸缩性,质量和产品支持,性能,忠诚度,WEB 界面,所有KPI 汇总.

相信以如此详细的技术指标,如此大范围的调研,其专业性足可保证, 任何个人或公司想要反对都要拿出足够的数据.

而在上图中的汇总中,我们惊喜看到Actuate 在各项技术指标中,再一次以惊人的技术压倒性优势远远超过各方挑战者,Actuate 的3.44甚至快达到第二名的WebFocus 1.85的两倍了 , 而其他各大厂商的表现则只能够用及格来表达了, Cognos Report的1.23(它另外两款产品Cognos Analysis , TM1 Server 甚至没及格), Microstrategy 1.38 甚至还没有名气远不如它的Panorama NovaView 的1.49(没听过这个产品) , OBIEE 则只是刚刚及格的1.02. BO 的两款产品BO 和Crystal Report 分别得到1.22和1.06 (可惜这两款产品完全是不同的产品线)

Actuate 平台能够取得如此好的成绩,要有一半的功劳归功于其Open Source 的birt , 有四分之一功劳归功于Actuate BIRT Viewer,Report Studio,BIRT Designer Pro.  其纯Java 的架构,完全基于Web 的功能,简单易用而又功能丰富,清晰明确的API 等优势完全俘获了开发人员和最终用户, 难怪各大厂商纷纷都愿意与Actuate 合作,IBM ,Cisco , Zend 都在其商业产品中添加了birt 的报表功能,更加不用提开源界对birt 的广泛使用. 以前一直没有足够证据或说出来难免会让人认为是厂商自己的宣传. 现在以如此细的技术指标评价所有主流厂商, 相信是可以让每个人都信服的.

 

其他报告细节

另外报告中还提到了一些不是泛泛而谈的经验,用户的使用BI趋势,像是用户评估多个BI 产品会得到更好的成功率,大BI 提供商的服务比小的提供商要差很多, BI 的使用率其实还并不是很高,员工长期使用BI 工具并能够得到信息的并不多(8.3%), 软件费用不再是限制企业采用BI 的重要因素, 其中有很多可能是你在其他报告中都没有听到过的.

 

 

gartner 2008 bi platform

对比一下gartner 的调研报告,gartner 调研报告主要以公司的收入,合作伙伴和渠道商完成满意度占主体部分,数据更加抽象一些,强调的更多的是公司,而不是产品,Nigel Pendse  的调研报告则完全以产品为出发,以用户满意度为主.

 

社区

产品的发展,推广,在一定程度上都需要一个或以上的社区来支持,喜欢oracle 的人都知道oracle 在全世界有各种各样的社区,官方的社区otn 只是一部分程度上领导社区成员进行活动, 所以大家都喜欢学习oracle , 你能够在各种社区中得到资料和帮助, 像是国内的itpub , cnoug ,都是热闹的不得了. 而相对于各BI 厂商来说,社区的发展还很落后,民间的组织都是一些小的论坛,都没有聚集足够的人气,

Actuate 在birt-exchange 上已经在慢慢组织它的社区,各种技术资料都免费提供下载,论坛的提问也能够迅速的回答. eclipsecon , WJAX 等各种技术大会上也经常能够看到birt 的身影, 其社区的发展还是非常迅速的. 但是不得不批评一下其中国Actuatechina 的社区发展,垃圾留言没有人管理,简单的提问不回答或是要求其购买商业技术支持服务,这绝对不应该在一个世界级技术性BI领导公司看到,当然actuatechina 还是为open source 作出了很多贡献的,birt 的大部分开发工作, eclipse 在大陆地区唯一的下载服务器镜像点, 希望其今后能够更好的领导社区的发展. 作出世界级BI 领导公司的架势, 而不要入乡随俗的跟国内二三流公司一样.

 

如果哪个公司购买了这份报告,记得借我瞄一眼!!!!!!

参考资料

http://www.bi-survey.com/

Nigel Pendse  的主页,要下载其预览版报告需要注册

 

http://www.olapreport.com/

一个独立的BI 调研机构

分类: BI 标签: , ,

Oracle 软件售价

2009年2月26日 没有评论

看到oracle 网站上公布的软件售价,不得不说好贵,oracle 的东西好是好,但是如果真的不是”企业级”要用, 还真的不一定买得起.

Oracle Database Enterprise Edition    47.5k 美元/每处理器. (不知道一服务器多CPU怎么算). 按照6.9 的汇率就是32万多人民币 ,

RAC                            23k

Active Data Guard        5.8k

Partitioning                  11.5k      ( 无语)

Advanced Compression 11.5k     (  同样无语)

Data Profiling and Quality    17.5k    这个是指OWB 的data profiling and quality 组件的售价,不包括OWB.

Diagostics Pack              3.5k

Tunnig Pack                   3.5k

Weblogic Server Standard Edition     10k

Weblogic Server Enterprise Edition    25k

 

Data Integrator Enterprise Edition    23k   

Data Quality for Data Integration (最大1亿条记录)    70k    (无语,Data Integration 不包括这个)

Data Integration Suite     70k.    新的售价策略中OWB 和Oracle Data Integration ( ODI ) 已经整合了, 估计要买一般就是买最大的这个. 如果你要买connector (for sap 或e-business suite 的) 还要单独购买.OWB 和ODI 都是如此.

 

Oracle Business Intelligence Standard Edition                  23k

Oracle Business Intelligence Standard Edition One          

Oracle Business Intelligence Enterprise Edition Plus (新的OBIEE , 详细组件见下面)   295k   ( 真正的无语了, 200万人民币就这样没了).

 

Standard Edition   只包括:Oracle BI Discoverer , BI Spreadsheet Add-in , Oracle BI Beans , Oracle Report Services ( 这是没服务器版的, 只是一些基础组建)

Standard Edition  One 包括Oracle BI Server , Oracle BI Server Administrator , Oracle BI Answers , Oracle BI Interactive Dashboards, Oracle BI Publisher , Oracle Database Standard Edition One , OWB. (这个没直接售价,按用户数卖的)

Oracle BI Enterprise Edition Plus 包括:Oracle Business Intelligence Server , Oracle Business Intelligence Dashboards , Oracle Business Intelligence Answers , Oracle Business Intelligence Delivers , Oracle Business Intelligence Disconnected Analytics , Oracle Business Intelligence Publisher , Oracle Business Intelligence Briefing Books , Hyperion Interactive Reporting , Hyperion SQR Production Reporting , Hyperion Financial Reporting, Hyperion Web Analysis . 最贵的软件也的确是包含了最多的BI 组件. 后面几个都是从收购Hyperion 得来的.

 

Server Enterprise Edition        51.8k    (这个估计是Oracle Business Intelligence Server)

Suite Enterprise Edition Plus Upgrade Only      34.5k    (连升级都不便宜)

另外单独的几个BI 组件的售价

Business Intelligence Publisher       46k

Interactive Dashboard                  86.5k

Delivers                                      51.8k

Answers                                     86.5k

Office Plug-in                               34.5k

Reporting and Publishing               70k

Hyperion Interactive Reporting       69k

Hyperion SQR Production Reporting     23k

Hyperion Financial Reporting                40.5k

Hyperion Web Analysis                        40.5k

 

Essbase Plus                   184k    (这个估计是essbase server , 也是超贵, 不过考虑到essbase 世界闻名的OLAP 分析功能, 还是可以接受的).

Essbase Visual Explorer    86k     (essbase client)

 

 

要不是oracle 提供developer license 供学习使用,估计很多东西一辈子都看不到一眼 ,像是OBI EE plus 和essbase , 想着自己一台普通电脑上装着超过几百万人民币的软件(至少600万) , 还真不知道哦说什么……………

 

 

参考资料

http://www.oracle.com/corporate/pricing/technology-price-list.pdf

oracle 网站上的售价表

 

http://www.oracle.com/technology/products/bi/enterprise-edition-platform-components.html

详细解释Oracle BI 的所有组件.

分类: BI 标签:

Hyperion Interactive Report 报表动态性简介

2009年2月23日 1 条评论

前两篇文章介绍了BIRT Open Source 版的报表动态性和基于BIRT 的商业版Actuate Interactive View 的报表动态性, 这篇则介绍hyperion 的interactive report 的报表动态性, 从名字就看出这个工具主要的功能就是制作交互性的报表, 不过它跟hyperion 的报表工具SQL Production Report 不是使用同一基础结构,有点可惜. 使用起来还是蛮方便的, 通过ODBC 连接数据.

    Hyperion Interactive Report 可以创建6种格式的内容,query , result , table , pivot , report 和dashboard.  其中pivot 就是交叉报表,

 

1.query   

hyperion_ir_query1

query 内容就是一个图形化创建数据的操作,你只用从Elements 区域(左下) 拖出你需要的table , 然后选择你想要的字段, 你可以执行过滤操作.

 

sshot-3

另外一个小细节是当你使用的是Oracle数据库, 它在聚合函数里面可以使用oracle 的高级分析函数 + partition by ,order by 的语法, oracle 高级分析函数的确是很实用的, 估计其他数据库可能不会有同等的功能, 不知道它是不是也支持SQL MODEL 语法. 这对于交叉报表还是非常有用的. 而且oracle 高级分析函数的速度非常快 (计算方式不一样) , 算是hyperion interactive view 一个非常实用的功能.

 

2.result

byqir1

result 区域代表你从query 区域取出的数据, 你可以点击表头, 然后就可以执行标准的动态操作了, 其中支持的就有Filter , Sort , Add Computed Item ,Group, Break Total, Hide Column 和Format , 它Format 就是上图中显示的Number , Alignment ,Font, Border and Background. 唯一操作不太习惯的就是它不是真的报表,而显示的方式更像是一个数据库查看器. 不过功能上基本上该有的都有了.

 

3.Pivot

hyperion interactive report 的pivot 功能相对还是比较原始的. 从Result 里面得到的数据当作pivot 里面的Row Label ,Column Label 或者Fact , 但是很多交叉报表应该有的高级功能都没有.过滤它有了(是在query 里面过滤的,不是pivot 里面操作的), sort 有点击右上方的sort 按钮才有(操作上不很方便),不过象是条件性隐藏 , 条件性输出, 条件性高亮, subtotal 和grand total 都没有. 操作模式基本上跟Business Objects 企业版的那个交叉报表差不多, 功能上还有待加强.

sshot-4

 

4. chart

hyperion_ir_chart4

图表的操作也算是比较标准的, 通过在result 里面拖出字段放在Fact , X Axis, 组成图表, 同样支持选择性聚组 (就是上图中的Depth) , 显示提示,下转, 隐藏, 添加趋势线和平均线, 另外你点击X Axis , Y Axis, 数据区,边界区, Legend 区(最右边) , 都会有相应的操作,  唯一操作不太习惯的就是你要点击到它的元素上它才会弹出相应的属性和操作,而不是通过一个集中的界面显示所有的操作和属性, 这对于那些对图表不熟的新手来说非常不方便, 而且很容易就忘掉了一些属性的设置.

 

5. Report

report 就不说了, 操作上对于我不是很习惯.

 

6. Dashboard

    hyperion interactive report 里面能够支持使用Dashboard 来展现各种数据算是其最大的一个特色, hyperion 有一个专门的Dashboard Studio 来进行Dashboard 和设计和运行, 里面就可以使用前面制作了Interactive Report , 而其中最有用的一个特性就是script. 在报表生成的各种生命周期内, 动态的改变报表的行为.

sshot-6

总结

总的来说hyperion interactive report 的功能比较丰富, 细节方面的功能还需要再加强, 不过由于其不是跟它的报表产品SQL Production Report 基于同一产品线, 算是学习和操作上又要花费一些时间. 它不是基于Web 的操作,每个使用的人都需要安装客户端比较麻烦,而且操作起来的方式不算很简单(易用性不算很高), 很多操作有些让人费解. 它处理SQL 的方式使用ODBC 连接数据库, 而且是一次性取得所有数据保存起来, 对于大数据量非常的慢, 尤其是进行交叉报表的计算工作可能经常会卡死, 使用的时候还是要注意优化.

希望连续三篇的介绍报表动态交互性的文章能够给需要交互式分析数据的朋友们一些有用的资料. 更多的资料还是要查看官方的一些文档.

 

参考资料:

1. http://www.oracle.com/technology/products/bi/performance-management/index.html

hyperion 主页,你可以下载文档或学习示例

分析型数据仓库选型

2009年2月5日 没有评论

分析型数据仓库的选择不同于普通的数据库选型, 它可能需要更多的综合考虑, 而不仅仅是数据库软件本身的选择, 硬件,软件,储存,用户需求, 而其中最大的挑战就是 性能 , 在其他硬件cpu , 内存都循着摩尔定律提升的时候,硬盘却没有明显的速度上的进步, 而大型分析型数据仓库往往又是大容量的同义词,所以性能比功能,管理性等等其他的都要重要.

    现在总的来说有18个比较有名的供应商可以应对生产环境的挑战, 其中既有私有软件与硬件的组合 ,也有开放式软件+普通硬件的组合

    总体架构上有4种, 普通的OLTP 型的 , MPP row-based型的 (mpp 是大规模并行处理), 列选择型的, MOLAP型的.

    每一种都有典型代表, 基本上没有谁有特别的架构上的优势,

    用户需求则是决定数据仓库选型的第一条件 , 总体容量,并发用户,数据刷新频率等等, 尤其重要的是在购买前一定要有足够的POC (PROOF OF CONCEPT) , 最还是能有真实环境完完全全的测一遍, 分清楚你一定要有的功能如果有更好的功能 , 价格上的限制,特定供应商的限制,私有硬件的容忍度,管理难度和将来可扩展的要求,

    调查清楚你的用户将来会如何使用数据库也是重点之一,

Reports , Dashboards and alerts ,  Ad-hoc , OLAP , data mining , 每一个分析领域的并发用户,使用频率,

    记住一定至少要有三个以上的供应商供选择, 让他们辅助你测试,而不是辅助你选型.

    调查清楚用户需求可能是最难的,千万不要想当然 , 最好能让各部门都调查清楚自己的需求,然后再汇总, 并且一定一定要真实测试.

可以参考一下下面的PPT 文档, 文章是dbms2 的编辑写的.

 

参考资料

http://www.dbms2.com/2009/02/04/draft-slides-on-how-to-select-an-analytic-dbms/

分类: BI 标签:

Gartner 2008年商业智能魔力象限

2009年1月24日 没有评论

2009年1月16 gartner 又发布了2008年的商业智能魔力象限的调查报告, 不像数据仓库提供商有很明确的领跑者跟挑战者, 商业智能平台方面没有很大的差距, 尤其是跟2007年相比, 除了原先商业智能方面的3巨头被收购以外, 使原本的差距缩的更小, 传统的四大软件供应商IBM ,Oracle , Microsoft , SAP (BO) 以及专注于数据挖掘的SAS . 个人还是比较欣赏Actuate 的, 不过今年的执行度和愿景完整性还比去年下降了. 不多说了,看图吧

163529_0001

2008年的魔力四象限

 

 

154227_0001

2007年的魔力四象限

 

参考资料

http://www.dbms2.com/2009/01/22/gartners-2009-magic-quadrant-for-business-intelligence/

http://mediaproducts.gartner.com/reprints/sas/vol5/article8/article8.html

http://mediaproducts.gartner.com/reprints/microsoft/vol7/article3/article3.html

分类: BI 标签:

到底有多少面向BI的数据库

2009年1月1日 1 条评论

BI作为一个方兴未艾的领域, 在我们还没来得及数清到底有多少BI 工具提供商的时候, 大大小小的专门面向BI的数据仓库解决方案已经进入竞争激烈的市场, 其中不乏传统的数据库大鳄,更有不少新兴的创业公司,当然也少不了开源数据库厂商的参与.

 

除开传统的商业智能方面数据库四大天王:teradata , oracle,ibm, microsoft 之外, 也有不少后期之秀不断挑战,像是我们熟知的"以列为导向的"Sybase IQ . 除开我们众所周知的明星之外, 下面介绍一些大家不太熟悉的有潜力的挑战者, 让我们开始这场选秀活动吧(Rock and Roll) :!

bidatabasequadrant

                    Garnter 的数据库魔力四象限

我们看到最接近Sybase IQ 的Netezza 公司是非常有实力的挑战者之一 , 它的主要特点就是面向商业智能并且专注于商业智能领域的应用,其主要产品为Netezza Performance Server系列数据仓库专用设备,为了能够分析商业数据,其数据仓库专用设备中整合了数据库、服务器和存储等各项功能, 你可能对这家公司不太熟悉,但是这家成立于2000年的公司早已经是中高端市场的老大了, 早已经是混的风声水起,即使是Oracle Open World 大会上,oracle 与hp 推出了硬件和软件组合的两款Exadata Programmable Storage Server 和HP Oracle Database Machine , Netezza 一样毫不含糊, 立刻展开针对这个组合的宣传,Netezza is fast, Netezza has more processing power, Netezza handles analytics inside the box,netezza is integrated in one box,from one vendor, netezza needs no tunning or indexing, 甚至打出了连圣诞老人都想要netazza 的广告, 专门针对oracle 销售策略,俨然一副我是老大,就算你是oracle 和hp 跟我抢食也要看你有几分斤两.

公司网址:http://www.netezza.com/

 

Greenplum 也是非常耀眼的新星之一 , 其首要目标就是直指PB 级别的超大型数据仓库, 其shared-nothing 的架构更是不像Teradata 和netezza 一样需要专属高端硬件配合, 任何Intel , AMD 芯片的普通服务器都能很容易的搭建集群环境, SQL Parallel Process + MapReduce 技术优势更是其宣传的最大卖点,Teredata 共有5家客户达到PB 级别,其中ebay 和walmart 的级别更是2PB 和 1.1 PB , Greenplum 这个运行在普通PC Server 上通过集群的高性能数据库相信在不久的将来也会很快有真正的PB 级别的案例产生. 在获得Sun ,SAP 等公司的风投后共获得4200万美元资金,更在中国建立合作伙伴关系开发国内市场,SUN 更是直言不讳的想通过Greenplum 的优势杀入商业智能市场,带动其服务器,储存和Solaris 的销售, 国内的淘宝团队也开始考虑使用greenplum + hadoop 的技术构建商业智能平台, 它不仅支持SQL、MapReduce、R、Pythons 等编程语言,新的3.2 功能还增加了GUI , 性能管理器的功能. 如果你嫌Teredata 和 Oracle RAC 太昂贵的话, Greenplum 一定在你构建超大型数据仓库的考虑范围之内. 注意它虽然构建在Postgresql 之上,但是数据库本身是闭源的商业产品, 因为Postgresql 是BSD license 的.

首页: http://www.greenplum.com

http://rdc.taobao.com/blog/dw/archives/category/greenplum

淘宝的一些greenplum 研究.

 

DATAllegro  是一家已经被microsoft 收购的公司,为了补充SQL Server 在商业智能方面的应用. 它同时也提供专属的硬件,microsoft 收购之后已经着手进行整合,产品的最终版本可能要到2010年上半年才能面世. 数据库的规模大概在百T左右.

http://www.datallegro.com/

 

Kognitio是一家提供数据仓库主机托管解决方案提供商(APS),第一次进入Gartner , 主要市场针对UK.

http://www.kognitio.com

 

Sand Technology 是一家加拿大的公司,主要市场在UK,Germany , US. 也是基于列的数据库, 主要强调用廉价的低速磁盘获得可接受的查询性能.

http://www.sand.com/

http://www.dbms2.com/2008/12/16/introduction-to-sand-technology/

 

除了能够上Garnter 的一些厂商之外,还有很多商业产品都各自有其技术优势: 像是Clearpace   比较强调数据归档和压缩,查询性能也能够与Oracle 匹敌(当然没有Netezza 那么肯定的强调) .

还有vertica , 也是强调基于列和网格的数据库,也能进行高性能的分析查询.运行于普通的硬件上,大客户包括JP Morgan Chase 等,Vmware 上还有一个装好的vertica analytic database 虚拟机给你玩, 它的ETL 性能测试还刷新的新的ETL记录,一小时转载了5.4TB 的数据.

http://www.vmware.com/appliances/directory/1266

vmware 虚拟机的下载地址.

 

kickfire 一家基于mysql 数据库,但是面向商业智能的基于列的数据库提供商.

还有太多就不一一列举了

http://www.paraccel.com

http://db.cs.yale.edu/hstore/

http://www.asterdata.com

http://www.exasol.com/

http://pyrrhodb.msroot.paisley.ac.uk/org/

每个都是各有强调重点, 技术特长不一.

 

就像OLTP 数据库中众多的厂商也没有阻止开源数据库的脚步,data warehouse 数据库中自然也不乏开源的身影.

比较有名的像是Infobright (http://www.infobright.org) , 这是一个基于mysql 的储存引擎, 同样也是基于列计算, 其最大的宣传重点在于高压缩比率和知识网络, 宣传的压缩比率经常在10:1 – 40:1 之间, 其知识网格技术可以不使用索引也能够进行高效率的查询运算.另外还有高速的数据装载工具, 当然还有一些技术上的限制比如缺乏国际支持, 并发性不高, 不能利用多核,没得到Windows或Solaris支持,没有ALTER TABLE有关的支持等, 详情可以查看

http://tech.it168.com/a2008/1024/209/000000209206.shtml

 

Bizgres(http://bizgres.org) , 是一个多厂商合作的,主要由greenplum 领导,基于postgresql 的商业智能数据库, 它最大的强调重点就是和其他开源的商业智能工具和平台提供商有很好的合作,像是JasperSoft reporting tools 和Kinetic Networks ETL tools

 

enterprisedb (http://www.enterprisedb.com) , 在基于postgresql 的基础上构建了OLTP 的数据库,主要走商业路线, 在商业智能领域则是另外一款产品grid sql , 或者说postgresql plus , 听名字就知道强调网格计算, 使运行在普通PC Server 上的数据库可以轻松进行并行计算完成复杂查询,再加上postgresql 本来就有的不少高级特性(物化视图,bitmap index 和分区) , 使得在中小型数据仓库中也值得一试.

 

MonetDB (http://monetdb.cwi.nl/) , 强调其在数据挖掘上的应用,OLAP , GIS, XML Query , 文本和多媒体查询. 有windows 和linux 两个版本, 如果你有特殊的商业智能应用,或者科研机构之类的可以研究一下.

 

LucidDB (http://www.luciddb.org/) 将是今天最后一个介绍的数据库, 它强调自己是第一个也是唯一一个只为数据仓库目的建造的数据库,同样也有 列储存,bitmap indexing , hash join/aggregation 等常见数据仓库技术, 新版中强调在线热备份和基于时间点的快照功能, 另外一个最大的特色就是和开源的商业智能厂商之间有很好的合作, 像是开源ETL工具中的kettle 和talend 都有其插件帮助装载数据, 还有pentaho 最有名的产品,开源OLAP 中的实际标准mondrian 的支持:automatic Mondrian aggregate table designer add-onMondrian source replication . (注: mondrian aggregate 是pentaho 2.0 新功能之一, 查看我写的pentaho 2.0 新功能一览(http://www.gemini5201314.net/?p=108) )

它同时是Eigenbase 项目的一部分,主要也是强调商业智能和数据仓库这一块的一个项目,和一个商业的中间件sqlstream 可以很好的组合( stream processing ,the SQLstream continuous query engine , 实现实时数据仓库的一个中间件,主要做CDC change data capture, mondrian 的主开发者很喜欢这个东西, 他已经写了两篇介绍这个玩意

http://julianhyde.blogspot.com/2008/12/streaming-analytics-over-content-feeds.html

http://julianhyde.blogspot.com/2008/12/streaming-content-feeds-part-2-forging.html

 

好吧,今天就到这里吧,Until next time.

分类: BI, Database 标签: