限时干货下载:添加微信公众号“数据玩家「fbigdata」”
回复【2】免费获取「完整数据分析资料,包括SPSS\SAS\SQL\EXCEL\Project!」
来源:www.biaodianfu.com
(pre-ipo新三板企业投资机会,请联系微.信.号:6048856)
ClickHouse是俄罗斯第一大搜索引擎Yandex开发的列式储存数据库。据说,这个列式储存数据库的性能大幅超越了很多商业MPP数据库软件,比如Vertica(HP Vertica成为MPP列式存储商业数据库的高性能代表,Facebook就购买了Vertica数据用于用户行为分析。)、InfiniDB。
ClickHouse的主要特性:
深度列存储 True column-oriented
向量化查询执行 Vectorized query execution
数据压缩 Data compression
并行和分布式查询 Parallel and distributed query execution
实时数据注入 Real-time data ingestion
磁盘局部引用 On-disk locality of reference
实时查询处理 Real-time query processing
跨数据中心备份 Cross-datacenter replication
高可用性 High availability
类SQL支持 SQL support
本地及分布式的join Local and distributed joins
可插入式纬度表 Pluggable external dimension tables
支持数组及嵌套数据结构Arrays and nested data types
预估查询处理 Approximate query processing
概率数据结构 Probabilistic data structures
支持IPv6 Full support of IPv6
网站分析功能 Features for web analytics
先进的算法 State-of-the-art algorithms
详细的文档 Detailed documentation
注释的代码 Clean documented code
支持的场景:
网站或者APP分析系统 Web and App analytics
广告系统或RTB系统 Advertising networks and RTB
商业智能系统 Business intelligence
监控或遥感系统 Monitoring and telemetry
ClickHouse的缺点:
支持有限的操作系统(目前只支持Ubuntu)
不支持Transaction
缺少完整的Update/Delete操作
存储和计算没有做分离
与大数据生态有较大的隔阂
其他的一些代替方案:
HP Vertica:商业OLAP
RedShift:亚马逊的云存储服务
BigQuery:谷歌的云存储服务
Cloudera Impala Parquet
Spark SQL Parquet
Facebook Presto
Apache Drill
Apache Kylin
InfiniDB
MonetDB
LucidDB
|