不同Hadoop上的SQL数据库引擎如何适配BI工作？

时间：2016-03-28 12:26:05 来源：搜狐科技作者：36大数据编辑：星辉 发表评论无障碍通道

Hadoop上的SQL引擎Impala是一种新型查询系统基准，发现Spark和Hive在BI的工作负载中有自己的优势与弱势。

根据最新的基准，三个主要的SQL-on-Hadoop引擎，Apache Impala 2.3, Apache Spark 1.6 和Apache Hive 1.2，都有各自独特的优势和劣势，这令他们能很好的适应一些BI用例，而不是其他智能。

“一个引擎是无法满足所有需求的”，Dave Mariani，大规模AtScale的CEO和创始人，AtScale是一个专门在hadoop上实现BI的创新企业。“我们已经完成了布置，对于我们的客户而言这是多个引擎的补充。”

36大数据专稿，原文作者： Thor Olavsrud 本文由36大数据翻译，任何不标明译者和出处以及本文链接http://www.36dsj.com/archives/445003均为侵权。

关于在Hadoop基础上的商业智能，AtScale帮助技术评估者选择最好的SQL –on-Hadoop技术，以帮助他们完成BI用例。AtScale测试团队使用星型架构基准(SSB)数据集，基于广泛使用的TPC-H数据(TPC-H是事务处理性能委员会公布的一套针对数据库决策支持能力的测试基准)，将其进行修改使之更加精确的表现一个面向BI的数据布局。数据集允许数据团队测试大型表的查询：在线订购表含有接近6百万行，大型客户表含有超过十亿行。

SQL-on-Hadoop引擎有不同的“甜区”工作负载

Mariani解释AtScale根据三个关键要求评价SQL-on-Hadoop引擎，以及它们的适应度是否能满足BI工作负载。

在大数据上执行。SQL-on-Hadoop引擎必须能够连续不断的分析十亿百亿行数据，并且没有生成错误，对命令的反应时间是10s或者是100s。

在小数据上速度快。引擎需要传递相互表现到已知查询模式，因此，

SQL-on-Hadoop引擎在处理小数据时，不超过几秒钟就能将结果返回。(小数据是指有着成千上百万的命令行的数据)。

对用户来说是稳定的。企业级BI用户的基础是由成百上千的数据工作人员组成。SQL-on-Hadoop引擎必须在高度并行分析的工作负载中运行可靠。

Mariani领导团队为雅虎的BI创建了可能是世界上最大的在线分层分析!他相信这三个标准是基本要求的代表，是企业在Hadoop上实现BI时都会遇到的。这个标准，是测试团队和大量行业企业合作得出的，包括金融服务，医疗，零售，电信等。

“我们使用了真实世界的的经验去形成文档，每一个技术评估者可以将其作为是评估流程的一部分”。Josh Klahr补充，AtScale.生产部门副总裁。

测试团队发现三个引擎都通过了测试，足够稳定去支持BI工作负载，但是一个引擎不能满足所有需求。每个引擎都有自己的“甜区”，企业有可能去寻找所有引擎的混合用法，他们相信这有可能最适合他们的目标。

当Hive在逐渐思考SQL-on-Hadoop的默认值时，它将基准中引擎运行最慢的情况放置一边，令其不能很好的配合相互查询。

“如果你使用Hive Tez作为你的相互查询引擎，你能做到的最佳是2.4秒”。Mariani 说。

但是它可能缓慢，Hive也是三个引擎中最稳定的，在多个查询类型中有着最好的连贯性。

“Hive Tez就像乌龟。”. Mariani 说，“它总是能完成竞赛，但是不是在壮观，迅速的时尚下。但是它是最可靠的。”

Impala和Spark，从利益方面来说，在处理小数据集时，他们是最好的。Impala会在大量的工作负载中覆盖了Spark，但是Mariani提到Spark1.6相比Spark1.5有了巨大的性能改变，他希望Spark能继续保持这样的发展趋势，因为Spark已经划出一块大的开源社区，关注着它的发展。数据管理公司云纪元公司(Cloudera)最近计划捐赠Impala给Apache软件基金会，这可以为其发展增加势头。

现在，Impala是用例的王者，它需要大量的用户。

“Impala在并发上真的很棒，” Mariani 说，“如果你打算拥有一大堆用户，让他们去使用小的快速的查询，Impala相比Spark是更好的选择。”

“如果速度不是最重要的，但是稳定性和可靠性很重要，我会选择使用Hive Tez作为我的数据管线引擎”，他补充道，“对于那些需要大批处理的工作负载，我会选择Hive Tez。如果我想要我的BI用户接入我的数据仓库，我会使用Spark或者Impala。”

Mariani 提到，虽然团队不能把其他引擎作为基准，如Apache Drill或者 Apache Presto,但是他们会在下次尝试。

他说，“你永远不知道引擎与引擎之间，谁将是可以作为赌注的更好的马。”

解密Apache HAWQ ——功能强大的SQL-on-Hadoop引擎

文章来源36大数据，www.36dsj.com ，微信号dashuju36 ，36大数据是一个专注大数据创业、大数据技术与分析、大数据商业与应用的网站。分享大数据的干货教程和大数据应用案例，提供大数据分析工具和资料下载，解决大数据产业链上的创业、技术、分析、商业、应用等问题，为大数据产业链上的公司和数据行业从业人员提供支持与服务。

10月30日，备受瞩目的iQOO最新旗舰机——被誉为“性能之光”的iQOO 13在深圳震撼发布。该款机型由BOE(京东方)独供6.82英寸超旗舰2K LTPO直屏，行业首发搭载全新一代Q10发光器件，在画面表现、护眼舒适度及性能功耗方面均达到行业领先水准，并以“直屏超窄边”的设计为用

在当前市场上，千元级别的投影仪中，当贝Smart1和小明Q5 Pro无疑是两款备受瞩目的产品。它们各自凭借独特的特点和优势，赢得了用户的认可，今天就来说说这两款哪个是千元投影仪最好的?将从显示技术、系统性能、智能功能以及设计便携性四个方面，对这两款投影仪进行详细

双十一购物狂欢节持续进行中，各大电商平台与厂家，纷纷推出了超值优惠吸引消费者。与此同时，为了解锁PC的出色性能，DIY装备也成为了玩家们重点关注的对象。对此，小编带来了全新“ROG三神套装”：ROG RYUJIN龙神3代360 ARGB水冷散热器、ROG THOR雷神3代氮化镓1600W电

近日，法国巴黎的Pathé Palace影院顺利安装了六套三星Onyx LED电影屏，连同影院大厅内安装的8K显示屏“The Wall”以及遍布影厅周边的智能标牌共同构成了一个全面提升的观影环境，旨在为观众带来更加沉浸与便捷的观影体验。经过长达五年的全面翻新，Pathé Palace 影院

近来传的沸沸扬扬的“Hi MateBook”笔记本终于水落石出，WIKO官方正式认领该产品，并官宣该系列笔记本电脑定于10月31日正式发布，届时将推出Hi MateBook 14 和Hi MateBook D 16两款新品。作为入局笔记本电脑赛道的首秀，官方大秀了一把同微软的亲密关系，同时揭晓了两款

2024年10月,鲸语品牌首款开放式真无线耳机——鲸语Loki 正式上市!鲸语以创新性地“配饰化”形态,专为潮流人群和音乐数码爱好者开辟开放式耳机的全新风格领域,以叛逆玩家的姿态,打造出街的潮音单品。鲸语Loki售价159元,上市期间限时优惠仅需129元。各大电商平台鲸语旗舰

鉴于ROG键盘改装赛2.0受到热烈反响，ROG决定将此赛事的报名期限延长，新的报名时间为10月25日至12月15日(其中，12月15日为决赛日，而最终结果的公示则定于12月25日)。本次延长赛程为玩家提供了丰厚的奖励，除了一系列诱人的ROG产品外，还准备了ROG键盘礼包，内含夜魔专

八位堂64手柄，为Analogue 3D精心打造，拥有霍尔摇杆并且采用人体工学设计，外观上重现任天堂N64手柄经典元素。八位堂与Analogue携手为玩家们带来无与伦比的游戏体验，重返游戏的黄金年代。八位堂64手柄，在2024.10.21预售开启当天，引爆外网，突破八位堂预售首发历史记

从“无线通信公司”转型为面向新一代AI处理时代的“连接计算公司”，在过去很长一段时间以来，都是高通标榜自身的主基调，而今年在夏威夷茂宜岛如期举行的骁龙峰会，话题正是从这一基调展开。连接与计算，是通信技术与智能技术的代称，新一代AI技术席卷之下，一切用户体

京东11.11福利再次加码，为耳机音箱产品爱好者们带来了一场品牌爆款五折抢购活动，10月24日晚8点，多款热门耳机音箱产品将以真五折的价格震撼上线。对于广大游戏爱好者来说，一款优质的游戏耳机无疑是提升游戏体验的重要装备。ROG棱镜精英版游戏耳机，作为ROG系列的明星

宛如岁末星河初绽，11.11如期而至。身处这场专为甄选精品而设的璀璨盛典，众多广受赞誉的臻品如星辰竞相闪耀，为每个追求品质生活与卓越人生的用户带来入手心仪好物的良机。例如代表着现代智能化科技生活的三星商城，就在其「超级星动为AI狂欢」活动中，为三星Galaxy T

莲偶科技最新发布的夜视AR眼镜莲光Visual- N，作为全球首款星光夜视AR眼镜，以其独特的差异化定位赢得了广泛关注。这款眼镜不仅搭载了先进的8片特制玻璃透镜光学模组，实现了66°的超大视场角(FOV)，在底照度低至0.01lux的环境下依然能清晰呈现，识别距离更是覆盖从最近

松下更新的 LUMIX S5D是一款混合型全画幅无反相机，在视频和照片方面都有出色的表现，非常适合专业摄像师和日常摄影使用。我们在原先LUMIX S5 紧凑型设计的基础上，配备了大疆 LiDAR 自动对焦功能*。如今的LUMIX S5D 与大疆 LiDAR 测距模块及大疆 RS3 Pro 云台配对使用

随着无人机的广泛普及，它们正逐渐融入智慧城市的各个领域，悄然改变着城市的建设与监测方式。相较于传统人力高空作业的高风险与低效，无人机以其独特的优势，不仅规避了人工操作的潜在危险，还降低了城市更新过程中如路网规划、自动化巡逻及风力发电机维护等关键任务的

在如今的用户购机需求中，性能是很多用户的第一需求，毕竟大家都经历过买的手机用了没多久就卡顿、不流畅的情况。原因有很多，很多的原因是你买的手机是入门款而不是旗舰手机，所以购机尽量买旗舰款，功能和配置都是top级别的。就比如刚刚发布没多久的vivo X200，不仅搭

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.