温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
  • 忘记密码?
登录注册×
获取短信验证码
其他方式登录
点击 登录注册 即表示同意 《亿速云用户服务条款》
  • 服务器
  • 数据库
  • 开发技术
  • 网络安全
  • 互联网科技
登 录 注册有礼
最新更新 网站标签 地图导航
产品
  • 首页 > 
  • 教程 > 
  • 互联网科技 > 
  • 大数据 > 
  • 企业级大数据技术体系是什么样的

企业级大数据技术体系是什么样的

发布时间:2022-01-18 10:51:59 来源:亿速云 阅读:223 作者:柒染 栏目: 大数据

今天给大家介绍一下企业级大数据技术体系是什么样的。文章的内容小编觉得不错,现在给大家分享一下,觉得有需要的朋友可以了解一下,希望对大家有所帮助,下面跟着小编的思路一起来阅读吧。

做你没做过的事叫成长,做你不愿做的事叫改变,做你不敢做的事叫突破。

企业级大数据技术体系是什么样的

企业级大数据技术框架(六层大数据技术体系)

1、数据收集层:分布式、异构性、多样化、流式产生

主要由关系型和非关系型数据收集组件,分布式消息队列构成。

Sqoop/Canal:关系型数据收集和导入工具,是连接 关系型数据库和Hadoop的桥梁,Sqoop可将关系型数据库的数据全量导入Hadoop,反之亦然。而Canal可用于实时数据的增量导入

Flume:非关系型数据收集工具,主要是流式日志数据,可近实时收集,经过滤,聚集后加载到HDFS等存储系统

Kafka:分布式消息队列,一般作为数据总线使用,它允许多个数据消费者订阅并获取感兴趣的数据。

2、数据存储层

主要由分布式文件系统(面向文件存储)和分布式数据库(面向行/列的存储)构成。

HDFS:Hadoop分布式文件系统,Google GFS的开源实现,具有良好的扩展性和容错性,目录已支撑各种类型的数据存储格式,包括SSTable,文本文件,二进制key/value格式Sequence File,列式存储格式Parquet,ORC和Carbondata等。

Hbase:构建在HDFS之上的分布式数据库,需要用户存储结构化与半结构化数据,支持行列无限扩展及数据随机查找与删除。

Kudu:分布式列数据库,允许用户存储结构化数据,支持行无限扩展以及数据的随机查找与更新。

3、资源管理与服务协调层:共享集群资源(优点:资源利用率高、运维成本低、数据共享)

YARN:统一资源管理与调度系统,它能够管理集群中的各种资源(eg:CPU、内存等),并按照一定的策略分配个上层各类应用,YARN内置了多种多租户资源调度器,允许用户按照队列的方式组织和管理资源,且每个队列的调度机制可独立定制。

ZooKeeper:基于简化的Paxos协议实现的服务协调系统,他提供了类似于文件系统的数据模型,允许用户通过简单的API实现leader选举、服务命名、分布式队列与分布式锁等复杂的分布式通用模块。

4、计算引擎层

包括批处理(时间要求低,高吞吐)、交互式处理(时间要求比较高,sql查询)、流式实时处理(时间要求非常高、广告投放等)三种引擎。

MapReduce/Tez:MapReduce是一个经典的批处理计算引擎,具体良好的扩展性与容错性,允许用户通过简单Api编写分布式程序;Tez是基于MapReduce开发的通用DAG(有向无环图)计算引擎,能够更加高效地实现复杂的数据处理逻辑,目前被应用在hive、pig等数据分析系统中。

Spark:通用的DAG计算引擎,它提供了基于RDD的数据抽象表示,允许用户充分利用内存进行快速的数据挖掘和分析。

Impala/Presto:开源的MPP系统,允许用户使用标准的SQL处理存储在Hadoop中的数据。它们采用了并行数据库架构,内置了查询优化器,查询下推,代码生成等优化机制,使得大数据处理效率大大提高。

Storm/Spark Streaming:分布式流式实时计算引擎,具有良好的容错性与扩展性,能够高效的处理流式数据,它允许用户通过简单的API完成实时应用程序开发。

5、数据分析层

为方便用户解决大数据问题而提供的各种数据分析工具。

Hive/Pig/SparkSQL:在计算引擎只是构建的支撑SQL或者脚本语言的分析系统,大大降低了用户进行大数据分析的门槛。其中hive是基于MapReduce/Tez实现的sql引擎,pig是基于MapReduce/Tez实现的工作流引擎,SparkSQL是基于spark实现的sql引擎。

Mahout/MLib:在计算引擎上构建的机器学习库,实现常用的机器学习和数据挖掘算法Mahout最初是基于MapReduce实现的,目前正迁移到spark,mlib是基于spark实现的。

Apache Beam/Cascading:基于各类计算框架而封装的高级API,方便构建复杂的流水线。Apache Beam统一了批处理和流式处理两类计算框架,提供了更高级的API方便用户编写与具体计算引擎无关的逻辑代码;Cascading内置了查询计划优化器,能够自动优化用户实现的数据流。采用了面向tuple的数据模型,如果你的数据可表示成类似与数据库行的格式,使用Cascading处理将变得很容易。

6、数据可视化层

应用UI展示,比如:运筹帷幄的Dashboard、火眼金睛的用户分析平台。

以上就是企业级大数据技术体系是什么样的的全部内容了,更多与企业级大数据技术体系是什么样的相关的内容可以搜索亿速云之前的文章或者浏览下面的文章进行学习哈!相信小编会给大家增添更多知识,希望大家能够支持一下亿速云!

向AI问一下细节
推荐阅读:
  1. MYSQL企业级应用(二)体系结构
  2. 什么是大数据技术专业

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

大数据
  • 上一篇新闻:
    场景下的交互式计算引擎Impala和Presto是怎样的
  • 下一篇新闻:
    大型企业java分布式微服务云架构服务组件有哪些

猜你喜欢

  • 批处理Taskkill命令的用法是什么
  • linux查看日志文件的方法是什么
  • oracle时间倒序查询的方法是什么
  • ubuntu怎么创建sudo用户
  • linux访问域名和端口怎么配置
  • win10如何显示音量图标
  • win10网卡被禁用如何恢复
  • php网站怎么启用伪静态
  • linux怎么倒序查看日志
  • linux的kill命令怎么使用
最新资讯
  • 如何在Flask中创建一个基本的路由
  • Flask和Django有什么主要区别
  • Flask框架是什么它的核心理念是什么
  • Lisp中的智能合约开发和区块链应用编程接口如何实现
  • 在Lisp中如何利用计算机视觉技术自动识别和分类图像
  • Lisp语言在教育技术和远程学习平台的开发中如何应用
  • 如何在Lisp中实施基于区块链的安全支付和加密货币交易
  • Lisp中的3D游戏引擎和游戏开发工具有哪些
  • 在Lisp中如何构建精确的天气预测和气候变化模型
  • Lisp语言在环境监测和灾害预警系统中的应用如何开展
相关推荐
  • PG体系结构是怎样的
  • Kafka的体系架构是怎样的
  • Java架构体系是怎样的
  • MySQL架构体系是怎样的
  • 什么是MySQL体系架构
  • HBase体系结构是怎么样的
  • HIVE体系架构是怎么样的
  • Android体系结构是怎样的
  • InnoDB体系架构是怎么样的
  • JAVA IO体系是怎样的

相关标签

大数据时代 大数据就业 大数据测试分析 大数据学习 大数据教程 大数据开发 大数据专业 大数据挖掘 大数据分析 大数据应用 大数据培训 大数据处理 大数据中心 大数据课程 大数据运营 大数据架构 大数据入门基础 大数据平台 大数据入门 大数据安全
AI

深圳SEO优化公司南充网站改版哪家好茂名高端网站设计报价昌都设计公司网站报价嘉兴英文网站建设哪家好拉萨百度爱采购报价内江网站建设公司果洛模板推广哪家好大鹏百度关键词包年推广报价漯河百姓网标王推荐那曲设计公司网站厦门关键词按天收费呼和浩特网络广告推广报价池州网站优化按天收费推荐衢州seo网站推广推荐沙井营销网站多少钱廊坊百度爱采购哪家好白城网站优化软件哪家好兰州百度标王价格文山网站定制报价东营百姓网标王推广公司泉州网站改版价格龙华网站推广方案多少钱襄阳seo排名南阳至尊标王哪家好酒泉百姓网标王推荐佛山网站开发公司松岗百度关键词包年推广哪家好楚雄建站多少钱北京关键词排名公司山南网络营销推荐歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化