﻿<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Alex的个人Blog &#187; BI</title>
	<atom:link href="http://www.gemini5201314.net/category/bi/feed" rel="self" type="application/rss+xml" />
	<link>http://www.gemini5201314.net</link>
	<description>关注数据仓库,商业智能和八卦</description>
	<lastBuildDate>Mon, 28 Nov 2011 12:04:22 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>列数据库与压缩算法</title>
		<link>http://www.gemini5201314.net/bi/%e5%88%97%e6%95%b0%e6%8d%ae%e5%ba%93%e4%b8%8e%e5%8e%8b%e7%bc%a9%e7%ae%97%e6%b3%95.html</link>
		<comments>http://www.gemini5201314.net/bi/%e5%88%97%e6%95%b0%e6%8d%ae%e5%ba%93%e4%b8%8e%e5%8e%8b%e7%bc%a9%e7%ae%97%e6%b3%95.html#comments</comments>
		<pubDate>Tue, 08 Nov 2011 13:15:51 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>
		<category><![CDATA[列式数据库]]></category>
		<category><![CDATA[columnar database]]></category>
		<category><![CDATA[compression]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/%e5%88%97%e6%95%b0%e6%8d%ae%e5%ba%93%e4%b8%8e%e5%8e%8b%e7%bc%a9%e7%ae%97%e6%b3%95.html</guid>
		<description><![CDATA[传统的行数据库使用的基本都是数据字典算法(Data Dictionary) 算法，或者叫标记化(tokenization)算法, 将Block 里面经常出现的相同值写在Block的头部，在实际储存值的地方用1,2,3,A,B 这种符号代替.这种算法将不同的列放在一起，所以出现相同值的概率非常低. 而行式数据库在每一列分开储存，可以针对每一列的特征使用不同的算法. 这篇文章就是介绍列数据库常用的压缩算法. 最早的列式数据库Sybase IQ&#160; 使用的是一种Decomposed 模型, 简单的将每一列分开，然后用rowid 来标记每一行的位置. 如下所示 age rowid &#160; region &#160; &#160; customer &#160; &#160; 18 1 &#160; region1 1 &#160; customer1 1 &#160; 19 2 &#160; region1 2 &#160; customer6 2 &#160; 29 3 &#160; region1 3 &#160; customer109 3 &#160; 29 4 &#160; region6 [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e5%88%97%e6%95%b0%e6%8d%ae%e5%ba%93%e4%b8%8e%e5%8e%8b%e7%bc%a9%e7%ae%97%e6%b3%95.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>列数据库特点</title>
		<link>http://www.gemini5201314.net/bi/%e5%88%97%e6%95%b0%e6%8d%ae%e5%ba%93%e7%89%b9%e7%82%b9.html</link>
		<comments>http://www.gemini5201314.net/bi/%e5%88%97%e6%95%b0%e6%8d%ae%e5%ba%93%e7%89%b9%e7%82%b9.html#comments</comments>
		<pubDate>Mon, 07 Nov 2011 14:46:00 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[Analytic Platform]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[Data Warehouse]]></category>
		<category><![CDATA[列式数据库]]></category>
		<category><![CDATA[columnar database]]></category>
		<category><![CDATA[compression]]></category>
		<category><![CDATA[sybase iq]]></category>
		<category><![CDATA[vertica]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/%e5%88%97%e6%95%b0%e6%8d%ae%e5%ba%93%e7%89%b9%e7%82%b9.html</guid>
		<description><![CDATA[最早的商业列式数据库是在1995年发布的Sybase IQ , 但是一直到1999年左右才慢慢稳定到能够投入生产环境. 现在的大多数分析型数据库都是在2003-2005年从Postgresql 分支出来的. 其中尤其是Vertica 为代表的列数据库已经在大规模数据仓库环境中证明其特别为数据仓库环境设计的思路在一些领域具有竞争优势. 这篇文章解释介绍列式数据库的几大特点.]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e5%88%97%e6%95%b0%e6%8d%ae%e5%ba%93%e7%89%b9%e7%82%b9.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Hadoop 和DBMS 的互补性</title>
		<link>http://www.gemini5201314.net/bi/hadoop-%e5%92%8cdbms-%e7%9a%84%e4%ba%92%e8%a1%a5%e6%80%a7.html</link>
		<comments>http://www.gemini5201314.net/bi/hadoop-%e5%92%8cdbms-%e7%9a%84%e4%ba%92%e8%a1%a5%e6%80%a7.html#comments</comments>
		<pubDate>Sun, 23 Oct 2011 12:54:11 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[Architecture]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[hadoop]]></category>
		<category><![CDATA[mpp]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/hadoop-%e5%92%8cdbms-%e7%9a%84%e4%ba%92%e8%a1%a5%e6%80%a7.html</guid>
		<description><![CDATA[随着Microsoft 也加入Hadoop 阵营，Hadoop 已经完全变成了DBMS 的好朋友了 , 2年之前的SIGMOD组织提出的“A Comparison of Approaches to Large-Scale Data Analysis”引发了关于并行数据库和MapReduce模型的讨论， 双方唇枪舌剑之后发现两个系统根本就是各有所长, DBMS 目前有些处理好的领域和商业支持，Hadoop 也有自己的优势和使用案例.]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/hadoop-%e5%92%8cdbms-%e7%9a%84%e4%ba%92%e8%a1%a5%e6%80%a7.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>大数据量分析</title>
		<link>http://www.gemini5201314.net/bi/%e5%a4%a7%e6%95%b0%e6%8d%ae%e9%87%8f%e5%88%86%e6%9e%90.html</link>
		<comments>http://www.gemini5201314.net/bi/%e5%a4%a7%e6%95%b0%e6%8d%ae%e9%87%8f%e5%88%86%e6%9e%90.html#comments</comments>
		<pubDate>Thu, 20 Oct 2011 16:37:50 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>
		<category><![CDATA[Big Data]]></category>
		<category><![CDATA[big data]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/%e5%a4%a7%e6%95%b0%e6%8d%ae%e9%87%8f%e5%88%86%e6%9e%90.html</guid>
		<description><![CDATA[&#160;&#160;&#160; 前段时间TDWI 的一篇文章”big data analytics” 对现在流行的大数据量分析技术做了一些基础的背景说明，现状，机会和工具的分类，我觉得很有用，比很多单独的文章没有背景支撑讲的清楚很多. 下面摘录一些有用的信息 &#160; TDWI : Big Data Analytics &#160;&#160;&#160; 调查范围: IT 咨询，财务公司，软件和互联网的用户占了40%，其他各行业占60%. （顺便说一句，国外大中型公司做信息化的时候都是有自己的懂行业的团队或者先找咨询公司的，不像国内的都是先找实施商). &#160; &#160;&#160;&#160; 背景介绍: 大数据量以前其实是个技术问题.现在由于硬件条件成熟和软件基础架构的变革已经可以更细的分析更多的数据并得到更多更准确更细节的信息, 从而为业务带来好处. &#160;&#160;&#160; 大数据分析的前身是高级分析，这在2009年就开始显露端倪，07年三大收购案结束后，大厂商已经具备一个通用的平台提供Gartner 提到的13条BI技术标准. 尤其是一些相关的技术开始成熟， 高级分析一般可以认为包括一系列的工具和技术，比如预测分析，数据挖掘，统计分析，复杂SQL,数据可视化 ,人工智能，自然语言处理，数据库支持的分析功能(In-Database Analysis ),，OLAP, MapReduce , 内存数据库，列数据库 , 等等. &#160;&#160;&#160; 另外一个更好的描述可能是“探索式发现”(discovery analytics or exploratory analytics) ， 数据如此之多，你在没看到数据之前根本不知道自己要找什么，或者你只能专注于几个最紧急的问题. 因此你需要使用大量数据，包括各种技术, 比如SQL , 数据挖掘，统计，快速分类，特征发现，数据可视化等等. &#160;&#160;&#160; 大数据的定义: 三个V, 大容量(Volumn) , 多类型( Variety [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e5%a4%a7%e6%95%b0%e6%8d%ae%e9%87%8f%e5%88%86%e6%9e%90.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>数据仓库技术中的MPP</title>
		<link>http://www.gemini5201314.net/bi/%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e6%8a%80%e6%9c%af%e4%b8%ad%e7%9a%84mpp.html</link>
		<comments>http://www.gemini5201314.net/bi/%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e6%8a%80%e6%9c%af%e4%b8%ad%e7%9a%84mpp.html#comments</comments>
		<pubDate>Sat, 15 Oct 2011 10:38:07 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[Analytic Platform]]></category>
		<category><![CDATA[Architecture]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[exadata]]></category>
		<category><![CDATA[mpp]]></category>
		<category><![CDATA[netezza]]></category>
		<category><![CDATA[teredata]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e6%8a%80%e6%9c%af%e4%b8%ad%e7%9a%84mpp.html</guid>
		<description><![CDATA[数据仓库世界里面的massively parallel processing 大概定义： MPP 是将任务并行的分散到多个服务器和节点上，在每个节点上计算完成后，将各自部分的结果汇总在一起得到最终的结果. 首先MPP 必须消除手工切分数据的工作量. 这是MySQL 在互联网应用中的主要局限性 另外MPP 的切分必须在任何时候都是平均的 , 不然某些节点处理的时间就明显多于另外一些节点. 对于工作负载是不是要平均分布有同种和异种之分，同种就是所有节点在数据装载的时候都同时转载，异种就是可以指定部分节点专门用来装载数据(逻辑上的不是物理上) ， 而其他所有节点用来负责查询. Aster Data 和Greenplum 都属于这种. 两者之间并没有明显的优势科研，同种的工作负载情况下，需要软件提供商保证所有节点的负载是平衡的. 而异种的工作负载可以在你觉得数据装载很慢的情况下手工指定更多节点装载数据 . 区别其实就是自动化和手工控制，看个人喜好而已. 另外一个问题是查询如何被初始化的. 比如要查询销售最好的10件商品，每个节点都要先计算出自己的最好的10件商品，然后向上汇总，汇总的过程，肯定有些节点做的工作比其他节点要多. 上面只是一个简单的单表查询，如果是两个表的连接查询，可能还会涉及到节点之间计算的中间过程如何传递的问题. 是将大表和小表都平均分布，然后节点计算的时候将得到的结果汇总（可能要两次汇总），还是将大表平均分布，小表的数据传输给每个节点，这样汇总就只需要一次. （其中一个特例可以参考后面给出的Oracle Partition Wise Join) .&#160; 两种执行计划很难说谁好谁坏，数据量的大小可能会产生不同的影响. 有些特定的厂商专门对这种执行计划做过了优化的，比如EMC Greenplum 和 HP Vertica .&#160; 这其中涉及到很多取舍问题，比如数据分布模式，数据重新分布的成本，中间交换数据的网卡速度，储存介质读写的速度和数据量大小（计算过程一般都会用临时表储存中间过程）. 一般在设计MPP 数据仓库的时候都会有一个指导原则用来得到比较好的性能，比如数据如何分布，customer 一般按照hash 分布比较好，而sales_order&#160; 一般按照时间分布. 所以一般建议在选型做POC 的时候，针对你自己需要的典型查询模式和负载进行测试. 一般优化的时候会考虑如下问题： 查询如何初始化？ 是否有足够的节点用来处理查询？ 同样的，数据装载的时候是否有足够节点用来装载数据 数据装载如何影响查询的，一些列数据库数据装载的时候一般不适合处理查询. 数据该复制多少份？把常用的数据分布在更多的节点上显然会减少数据移动的影响 [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e6%8a%80%e6%9c%af%e4%b8%ad%e7%9a%84mpp.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>数据仓库工作负载分类</title>
		<link>http://www.gemini5201314.net/bi/%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e5%b7%a5%e4%bd%9c%e8%b4%9f%e8%bd%bd%e5%88%86%e7%b1%bb.html</link>
		<comments>http://www.gemini5201314.net/bi/%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e5%b7%a5%e4%bd%9c%e8%b4%9f%e8%bd%bd%e5%88%86%e7%b1%bb.html#comments</comments>
		<pubDate>Sat, 15 Oct 2011 04:13:23 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[Analytic Platform]]></category>
		<category><![CDATA[Architecture]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[workload]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e5%b7%a5%e4%bd%9c%e8%b4%9f%e8%bd%bd%e5%88%86%e7%b1%bb.html</guid>
		<description><![CDATA[持续（准实时）类型 : 持续更新从OLTP 来的数据，包括刷新汇总和预计算的数据. 批量更新 : 在系统不忙的时候批量更新大量数据 支持报表和仪表盘的数据仓库 ： 使用常规的索引，物化视图，分区等优化手段 策略业务分析 : 只IT 的帮助下建立了通用的模型，但是业务人员自己需要交互式的分析改变和保存. 可能会产生非预测无法优化的情况. 即席查询的数据仓库 ： 用户以一种不可预知的方式查询任意数据. 传统的优化手段不可能预先覆盖所有情况. 面向分析的数据仓库 : 包括复杂的分析函数，排名，记分，预测，OLAP模拟，数据挖掘，文本挖掘等等，一般分析时间较长. 另外也有一种按数据仓库的使用案例分类的 EDW ： 最原始的理想状况的所有数据放一起的 Data Mart : 一般是部门级别的数据，管理起来方便，性能也更好 实时数据仓库 ： 需要实时更新的，尤其是对于操作型的一些报表和即席查询 历史数据仓库 :&#160; 历史数据，按时间归档，很少查，偶尔会有汇总 分析型OLTP 数据仓库 :&#160; 主要面向操作型的报表和仪表盘，大多是中小企业的 混合负载的 ： 白天可能有各种报表然后又实时的，晚上又是批量装载又是分析型的大量计算. &#160; 另外分析型的也有很多不好分的分类： high-volume simple processing online request processing internet request processing network [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e5%b7%a5%e4%bd%9c%e8%b4%9f%e8%bd%bd%e5%88%86%e7%b1%bb.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Oracle Exalytics 和 SAP HANA 火拼</title>
		<link>http://www.gemini5201314.net/bi/oracle-exalytics-%e5%92%8c-sap-hana-%e7%81%ab%e6%8b%bc.html</link>
		<comments>http://www.gemini5201314.net/bi/oracle-exalytics-%e5%92%8c-sap-hana-%e7%81%ab%e6%8b%bc.html#comments</comments>
		<pubDate>Thu, 06 Oct 2011 07:27:15 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>
		<category><![CDATA[Data Warehouse]]></category>
		<category><![CDATA[oracle exalytics]]></category>
		<category><![CDATA[sap hana]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/uncategorized/oracle-exalytics-%e5%92%8c-sap-hana-%e7%81%ab%e6%8b%bc.html</guid>
		<description><![CDATA[今年10月Oracle Openworld 大会Larry 大爷一上来就是宣布新的整体数据仓库解决方案Exalytics , 新配置可谓豪华： 40 个CPU 的整体配置 1TB 内存 最新版 OBIEE 11G 做前端展现 TimeTen 内存数据库 Essbase 做OLAP Server 这个都拿来和全年12月底SAP 发布的HANA 配置做对比，两个都是BI 整体的一体机配置 硬件合作伙伴HP , DELL&#160; 等5家 内存数据库 BO 4.0 Sybase IQ 的集群 如果两个硬要做对比的话，Oracle 的可能会有些优势 Sybase IQ 的集群规模可以比Oracle RAC 大，但是效率不一定高, 虽然Oracle RAC 的硬伤仍然是不具备线性扩展. 但是他较量的级别不是Sybase IQ . SAP 的硬件合作伙伴太多，这种整体的解决方案本来就是面向的高端客户，HANA一共就不一定卖多少套出去，别人要是问哪家的硬件好，你怎么回答. Sybase 的所谓内存计算早就不是新鲜科技了，但是他的内存数据库基本是一个新品牌，而Oracle 收购的Timeten 早就有N 多客户和行业经验了，打起广告来知名度都比较高 OBIEE [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/oracle-exalytics-%e5%92%8c-sap-hana-%e7%81%ab%e6%8b%bc.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>国内云的一些想法</title>
		<link>http://www.gemini5201314.net/bi/%e5%9b%bd%e5%86%85%e4%ba%91%e7%9a%84%e4%b8%80%e4%ba%9b%e6%83%b3%e6%b3%95.html</link>
		<comments>http://www.gemini5201314.net/bi/%e5%9b%bd%e5%86%85%e4%ba%91%e7%9a%84%e4%b8%80%e4%ba%9b%e6%83%b3%e6%b3%95.html#comments</comments>
		<pubDate>Tue, 04 Oct 2011 10:08:00 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>
		<category><![CDATA[杂谈]]></category>
		<category><![CDATA[cloud]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/%e6%9d%82%e8%b0%88/%e5%9b%bd%e5%86%85%e4%ba%91%e7%9a%84%e4%b8%80%e4%ba%9b%e6%83%b3%e6%b3%95.html</guid>
		<description><![CDATA[最近看到国外很多BI 公司都推出了自己的云平台，国外的很多调研机构基本都达成共识，BI 几大趋势之一的BI 云也算是真正进入普及阶段了. 有些国外的概念趋势也许对于国外是非常适合的，但是到了国内可能就有很大的变数.比如如下几个BI 的趋势

 云
开源
移动
社交
列式分析型数据库
内存BI
Big Data 与Hadoop]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e5%9b%bd%e5%86%85%e4%ba%91%e7%9a%84%e4%b8%80%e4%ba%9b%e6%83%b3%e6%b3%95.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>OBIEE ，MicroStrategy , Actuate 缓存对比</title>
		<link>http://www.gemini5201314.net/bi/obiee-%ef%bc%8cmicrostrategy-actuate-%e7%bc%93%e5%ad%98%e5%af%b9%e6%af%94.html</link>
		<comments>http://www.gemini5201314.net/bi/obiee-%ef%bc%8cmicrostrategy-actuate-%e7%bc%93%e5%ad%98%e5%af%b9%e6%af%94.html#comments</comments>
		<pubDate>Sat, 01 Oct 2011 10:49:43 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/obiee-%ef%bc%8cmicrostrategy-actuate-%e7%bc%93%e5%ad%98%e5%af%b9%e6%af%94.html</guid>
		<description><![CDATA[本文比较了OBIEE ， Actuate , MicroStrategy 3个BI 平台在缓存设计上的不同.
OBIEE
OBIEE 的缓存主要有两种类型：

 一种table cache,  
一种query cache ,
 table cache 在模型设计(rpd 模型库)里面, 对应每一个phisical table , 更新的方式就是定时更新.或者不cache.  ]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/obiee-%ef%bc%8cmicrostrategy-actuate-%e7%bc%93%e5%ad%98%e5%af%b9%e6%af%94.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>浅谈数据交互可视化（三）</title>
		<link>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%b8%89%ef%bc%89.html</link>
		<comments>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%b8%89%ef%bc%89.html#comments</comments>
		<pubDate>Sun, 25 Sep 2011 12:07:17 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>
		<category><![CDATA[Data Visualization]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%b8%89%ef%bc%89.html</guid>
		<description><![CDATA[数据交互可视化之OLAP 样式的可视化

如果要说为什么数据可视化这两年突然增长迅猛，主要由以下几个原因或者说特点：

基础平台的完善：现在大多数的厂商基础的报表功能都已经大同小异了，有实力开始进入这个领域
易用性：以前开发报表都是IT 人员搞定，现在很多通用的功能只用提供一个模板让业务人员填写就好，大部分不需要太多专业知识，界面都是傻瓜易懂的.
消费型BI：客户越来越强调视觉效果，用户体验，所以一些Flex]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%b8%89%ef%bc%89.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>浅谈高级数据交互可视化（二)</title>
		<link>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e9%ab%98%e7%ba%a7%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%ba%8c.html</link>
		<comments>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e9%ab%98%e7%ba%a7%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%ba%8c.html#comments</comments>
		<pubDate>Sun, 25 Sep 2011 09:51:31 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e9%ab%98%e7%ba%a7%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%ba%8c.html</guid>
		<description><![CDATA[抛开单独的图标组件之外，BI平台也需要对图表提供基本的支持，不然你用BI平台看到的东西跟用EXCEL 画出来的没区别, 这肯定是不能满足展现信息的需要的. &#160; 基础的数据源 &#160;&#160;&#160;&#160;&#160;&#160; 包括直接使用sql,或者 procedure , 或者每个不同平台提供的元数据生成的sql , 文本文件, excel ,多数据源的聚合,排序，过滤. 如果不提供这些功能，就只能要IT 开发人员预先准备数据了，如果是业务人员想要直接使用图表看数，这种易用性是显然满足不了的 . &#160; 安全性 &#160;&#160;&#160;&#160;&#160;&#160; 不同的人员的级别只能查看对应自己级别的数据源，有些表不能查看或者某个地区的人员只能查看自己这个区域列的数据. BI平台需要默认的提供这种安全机制. row, column . object, functiona 不同粒度的安全级别对应不同的需求. &#160; 数据建模问题 &#160;&#160;&#160;&#160; 取出来的数据代表什么含义，需要转换嘛? 没有提供的数据如何处理. 比如利润这种需要计算的列，或者排名这种列(有的排名甚至可能是分级的). &#160; 地图的支持 &#160;&#160;&#160;&#160; 在地图上用不同颜色标注不同的指标.过滤不同的区域. &#160; 格式化 &#160;&#160;&#160;&#160; 比如修改饼图上的颜色, 字体大小,饼图如果小于某个百分比就不用显示了. 柱状图的颜色用自定义的过滤条件来选择，比如红色代表销售很差. 条形图的每条的宽度定义等等 .这种自定义的细节化的控制往往需要底层的编程支持. &#160; 任意的布局 &#160;&#160;&#160;&#160; 图表的大小，如果是在dashboard 里面显示,是否支持在任意位置显示. 如果设置参数，比如过滤数据，或者选择图表的样式,(柱状图或条状图) &#160; web 导航 [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e9%ab%98%e7%ba%a7%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%ba%8c.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>浅谈高级数据交互可视化（一)</title>
		<link>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e9%ab%98%e7%ba%a7%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%b8%80.html</link>
		<comments>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e9%ab%98%e7%ba%a7%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%b8%80.html#comments</comments>
		<pubDate>Mon, 12 Sep 2011 16:12:12 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>
		<category><![CDATA[visualization]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e9%ab%98%e7%ba%a7%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%b8%80.html</guid>
		<description><![CDATA[&#160; &#160;&#160;浅谈高级数据交互可视化（一) &#160; &#8221;一图胜千言&#8220; 应该是BI 系统为什么经常使用图表来代替表格的主要原因了，而近期的的BI 市场高级可视化数据交互的各种厂商更是异军突起的主要领域, 本文就是简单讨论一下交互可视化的功能和特点. 分成如下3个部分讨论 BI 中常使用的图形种类和意义 BI 平台应该提供的功能 新 OLAP 样式的交互可视化 比较常见的图形可能有很多，但是其中一些不太可能出现在BI 系统中，比如word tag cloud , 化学中的分子图，数学里面的正态分布，二项式，或是社交网站的图谱. 经济学中的长尾理论图等等，BI 中使用的图形一般都是通用，直观的，用来代替数据说话，但是又不用解释太多，每个人看图都懂的. BI 中常见的图形每个人在excel 中基本可以见到大部分, 比如 柱状图,饼图，气泡图等等. 下面介绍一些常见图形拼起来的图形. marimekko chart 这种图X轴可以排序，颜色的区分是X 轴里面的小分类, 如果Y 轴是等高的就是按百分比比较的,如果不是Y轴等高就是按其他数字对比. 柱形图或者条形图&#160;都是用来对比, 可以用来比较两个维的比如下面两种 折线图&#160;一般用来表现趋势，X 一般都是时间，如果折线图和柱形图混在一起一般X 轴都是时间，而且都是双Y 轴的. 123 面积图&#160;既有对比也有趋势. 可以对比实际数字也可以对比百分比 散点图&#160;可以表示种类分布 聚合之后就变成了气泡图,同样可以区分2维的不同信息. 用颜色和大小来表示多一维的信息.(上面没有聚合的主要表示每个点在2维的分布，下面聚合的主要表示总和值所处的位置) 折线图&#160;不能表示太多的类别趋势, 超过3个就可能分不清楚了. 这种情况还是建议分成格子状的折线图（Trellis Line Chart) 普通的散点图&#160;用来表示数据分布,格子状的散点图则是用来表示种类的对比 如果散点图在X [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e6%b5%85%e8%b0%88%e9%ab%98%e7%ba%a7%e6%95%b0%e6%8d%ae%e4%ba%a4%e4%ba%92%e5%8f%af%e8%a7%86%e5%8c%96%ef%bc%88%e4%b8%80.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Gartner 的BI 平台功能比较评论</title>
		<link>http://www.gemini5201314.net/bi/gartner-%e7%9a%84bi-%e5%b9%b3%e5%8f%b0%e5%8a%9f%e8%83%bd%e6%af%94%e8%be%83%e8%af%84%e8%ae%ba-2.html</link>
		<comments>http://www.gemini5201314.net/bi/gartner-%e7%9a%84bi-%e5%b9%b3%e5%8f%b0%e5%8a%9f%e8%83%bd%e6%af%94%e8%be%83%e8%af%84%e8%ae%ba-2.html#comments</comments>
		<pubDate>Sun, 28 Aug 2011 04:38:00 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/?p=1265</guid>
		<description><![CDATA[Gartner 最近发布了2011年的BI Platforms User Survey, 2011: Customers Rate their BI Platform Functionality 报告.&#160; BI 市场这两年明显的变化就是客户的需求变的更加多样，所以各个BI厂商对于新需求的发展方向也是完全不同.Gartner 对BI 平台的定义还是原来的13条. &#160; 厂商分类方面&#160; &#160; Vendor Category Vendors/Products Megavendors IBM, Microsoft, Oracle, SAP Large Independent Vendors Information Builders, MicroStrategy, SAS Data Discover Vendors Advizor, QlikTech, Tableau, Tibco Spotfire Open Source Actuate BIRT, Jaspersoft, Pentaho SaaS Birst, PivotLink Small Independent Vendors [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/gartner-%e7%9a%84bi-%e5%b9%b3%e5%8f%b0%e5%8a%9f%e8%83%bd%e6%af%94%e8%be%83%e8%af%84%e8%ae%ba-2.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>最权威调研机构对所有主流BI 平台调研报告</title>
		<link>http://www.gemini5201314.net/bi/%e6%9c%80%e6%9d%83%e5%a8%81%e8%b0%83%e7%a0%94%e6%9c%ba%e6%9e%84%e5%af%b9%e6%89%80%e6%9c%89%e4%b8%bb%e6%b5%81bi-%e5%b9%b3%e5%8f%b0%e8%b0%83%e7%a0%94%e6%8a%a5%e5%91%8a.html</link>
		<comments>http://www.gemini5201314.net/bi/%e6%9c%80%e6%9d%83%e5%a8%81%e8%b0%83%e7%a0%94%e6%9c%ba%e6%9e%84%e5%af%b9%e6%89%80%e6%9c%89%e4%b8%bb%e6%b5%81bi-%e5%b9%b3%e5%8f%b0%e8%b0%83%e7%a0%94%e6%8a%a5%e5%91%8a.html#comments</comments>
		<pubDate>Mon, 09 Mar 2009 02:36:02 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>
		<category><![CDATA[actuate]]></category>
		<category><![CDATA[BIRT]]></category>
		<category><![CDATA[Oracle]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/?p=1157</guid>
		<description><![CDATA[如果你看到标题以为这是一篇标题党的文章，那你就要错过重要内容了. 收到olapreport 的一封邮件，说全世界最大的独立BI 调研机构Nigel Pendse 已经发表了它第8份针对全世界最大BI 平台的调研报告. Nigel Pendse 做BI 市场调研已经很多年了，最早的第一份BI 市场调研报告发表于2001年，现在已经是第8份了，世界500强超过一半都接受了调研，这次一共调研了2079个公司（这个数字够有说服力了吧），比去年略少79个，去年有2150个公司接受了调研，全世界最主流的23 款BI 平台都覆盖到了，并且它调研的最主要特点就是技术和用户第一。 它有非常详尽的各种技术比较，全部用客观数据说话，无任何主观论断. 新的报告引入了一种Customer Dashboard 的方式，对BI 平台的26个主要方面KPI 和8个聚合KPI 做全面分析，每一个BI 平台都覆盖到, 让你对每一个技术细节都全面了解 . 全文报告489页，已经放在www.bi-survey.com 上供用户购买，它提供一个8页的预览版可以免费下载，如果你对BI 很有兴趣的话，可以去看看这个报告. 在这8页的预览版中也提供了一些非常有技术含量的数据. 总的用户满意度，一共2071个公司接受调研，分别为已经在使用，六个月内会使用，1年内会使用，2年内会使用，最终会使用和绝不会使用划分. 其中总的使用率只有16.4% ，意思是公司已经购买并建设好data warehouse了，但是在公司内部大范围使用率还是只有16.4%. 其中调研人数最多和使用人数最多的是microstrategy ，一共56个公司（248×22.6%） , microstrategy 的产品一向以易用性闻名，这也在很大程度上符合了这个说法，BI&#160; 产品还是要符合用户习惯，做到平民化，很显然microstrategy 深深的了解这一点. 而其他几个大的BI 平台的数据都表现可以, Cognos Reporting, BO , Crystal Reports , OBIEE/BISEO 都在部分领域各有所长. 但最让人惊喜的是Actuate 平台以56.4% 的满意率高居第一，在六个月内打算部署Actuate 的客户数甚至达到了64.1% , [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/%e6%9c%80%e6%9d%83%e5%a8%81%e8%b0%83%e7%a0%94%e6%9c%ba%e6%9e%84%e5%af%b9%e6%89%80%e6%9c%89%e4%b8%bb%e6%b5%81bi-%e5%b9%b3%e5%8f%b0%e8%b0%83%e7%a0%94%e6%8a%a5%e5%91%8a.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Oracle 软件售价</title>
		<link>http://www.gemini5201314.net/bi/oracle-%e8%bd%af%e4%bb%b6%e5%94%ae%e4%bb%b7.html</link>
		<comments>http://www.gemini5201314.net/bi/oracle-%e8%bd%af%e4%bb%b6%e5%94%ae%e4%bb%b7.html#comments</comments>
		<pubDate>Thu, 26 Feb 2009 13:45:07 +0000</pubDate>
		<dc:creator>Alex</dc:creator>
				<category><![CDATA[BI]]></category>
		<category><![CDATA[Oracle price hyperion]]></category>

		<guid isPermaLink="false">http://www.gemini5201314.net/?p=320</guid>
		<description><![CDATA[看到oracle 网站上公布的软件售价,不得不说好贵,oracle 的东西好是好,但是如果真的不是”企业级”要用, 还真的不一定买得起. Oracle Database Enterprise Edition&#160;&#160;&#160; 47.5k 美元/每处理器. (不知道一服务器多CPU怎么算). 按照6.9 的汇率就是32万多人民币 , RAC&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; 23k Active Data Guard&#160;&#160;&#160;&#160;&#160;&#160;&#160; 5.8k Partitioning&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; 11.5k&#160;&#160;&#160;&#160;&#160; ( 无语) Advanced Compression 11.5k&#160;&#160;&#160;&#160; (&#160; 同样无语) Data Profiling and Quality&#160;&#160;&#160; 17.5k&#160;&#160;&#160; 这个是指OWB 的data profiling and quality 组件的售价,不包括OWB. Diagostics Pack&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; 3.5k Tunnig Pack&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160; 3.5k Weblogic Server Standard Edition&#160;&#160;&#160;&#160; 10k Weblogic Server Enterprise Edition&#160;&#160;&#160; [...]]]></description>
		<wfw:commentRss>http://www.gemini5201314.net/bi/oracle-%e8%bd%af%e4%bb%b6%e5%94%ae%e4%bb%b7.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

