加入收藏 | 设为首页 | 会员中心 | 我要投稿 宿州站长网 (https://www.0557zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

百分点大数据评测报告:开源OLAP引擎综评(HAWQ、Presto、ClickHouse)

发布时间:2020-01-23 00:19:22 所属栏目:大数据 来源:至顶网至顶Labs频道
导读:副标题#e# 谈到大数据就会联想到Hadoop、Spark整个生态的技术栈。大家都知道开源大数据组件种类众多,其中开源OLAP引擎包含Hive、SparkSQL、Presto、HAWQ、ClickHouse、Impala、Kylin等。当前企业对大数据的研究与应用日趋理性,那么,如何根据业务特点,选


我们通过添加单机的Worker数量验证是否提高查询效率,提高单机的查询利用率。 单机增加Presto Worker,部署多Worker。测试结果:表现为CPU瓶颈,没有效果。如下图,可以发现每个Worker的吞吐也少了一半。 

百分点大数据评测报告:开源OLAP引擎综评(HAWQ、Presto、ClickHouse)

Presto扩容:
我们通过添加扩容机器并部署Worker,验证查询性能影响。
加入新的机器,部署Worker。测试结果:表现为性能基本线性增长,受限于数据节点的磁盘IO和网络。 

百分点大数据评测报告:开源OLAP引擎综评(HAWQ、Presto、ClickHouse)

ClickHouse 横向扩展查询测试:

测试横向扩展对查询性能的影响,每个节点的数据量是相同的,使用相同的SQL分别测试单节点、五节点、十节点的查询性能。
根据测试结果可以看出,横向扩展后,节点数和数据量等比增加,查询时间几乎保持不变。所以对于ClickHouse我们可以基于单节点的数据量和性能,推断一定场景下整个集群的情况。

测试明细: 

百分点大数据评测报告:开源OLAP引擎综评(HAWQ、Presto、ClickHouse)

结果图形展示:

 百分点大数据评测报告:开源OLAP引擎综评(HAWQ、Presto、ClickHouse)

ClickHouse PageCache缓存查询测试:

测试PageCache对查询性能的影响,首先清除所有缓存分别查询四个SQL,然后再重复执行一次,可以发现,PageCache对第二次查询的性能提高是影响巨大的。

ClickHouse充分利用了系统缓存(PageCache),对查询有数量级的性能提升作用。

测试明细:

 百分点大数据评测报告:开源OLAP引擎综评(HAWQ、Presto、ClickHouse)

结果图形展示:

 百分点大数据评测报告:开源OLAP引擎综评(HAWQ、Presto、ClickHouse)


五、各组件综合分析
通过上述测试结果和分析图表,结合我们查询各组件的开源介绍进行综合分析,如下:


HAWQ采用基于成本的SQL查询优化器,生成执行计划;同时在标准化SQL兼容性这方面表现突出(基于TPC-DS进行SQL兼容性测试)。数据存储直接使用HDFS,与其它SQL on Hadoop引擎不一样,HAWQ采用自己的数据模型及存储方式。在本次对单表的查询测试中,性能并不理想,并且我们发现对于表查询类似limit 1语句。HAWQ也会全表扫描,这个过程让我们感觉有点诧异。 

(编辑:宿州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读