最具影响力的数字化技术在线社区
开启辅助访问 合作 方案 投稿 需求 拼课 切换到宽版

168大数据

  找回密码
  立即注册

QQ登录

只需一步,快速开始

快捷导航
  • 头条数据人关心的头条
  • 文库数据人的知识中心
  • 日志数据人的小红书
  • 活动网聚最多大数据、人工智能行业活动
  • 星球数据人自己的星球
  • 社区数字化深度交流社区
  • 充值有粮票 好生活
搜索
热搜: 大数据 商业智能 人工智能 数据分析 架构 产品 企业 活动 干货 案例 招聘 求职 课程
1 2 3 4 5
168大数据» 社区 7F 数据中台(DG) 数据治理DG 企业构建大数据平台的痛点、思路与解决路径;大数据时代 ...
返回列表 发新帖
打印 上一主题 下一主题
开启左侧

[理论框架] 企业构建大数据平台的痛点、思路与解决路径;大数据时代,企业主数据管理体系与方法

[复制链接]
跳转到指定楼层
楼主
发表于 2019-2-23 13:27:31 | 只看该作者 回帖奖励 | 倒序浏览 | 阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号? 立即注册

x
创建 大数据平台,是个系统性的工程,并不像简简单单开发一款APP一样,需要深度了解当下以及未来的技术发展。
曾几何时,组织多半会选择以增量方式实现大数据解决方案。而并非每个分析和报告需求、大型数据集或来自多个数据源的临时报告执行并行处理的项目,都对大数据解决方案有着重要需求。
随着大数据技术的到来,企业会问自己:大数据是否是我的业务问题的正确解决方案,或者它是否为我提供了业务机会?大数据中是否隐藏着业务机会?
CIO在考虑创建大数据平台往往遇到以下问题:
● 如果我使用大数据技术,可能会获得何种洞察和业务价值?
● 它是否可以扩充我 现有的数据仓库?
● 我如何评估扩展当前环境或采用新解决方案的成本?
● 对我现有的IT治理有何影响?
● 我能否以增量方式实现大数据解决方案?
● 我需要掌握哪些具体的技能来理解和分析构建和维护大数据解决方案的需求?
● 我的现有企业数据能否用于提供业务洞察?
● 来自各种来源的数据的复杂性在不断增长。
● 大数据解决方案对我有帮助吗?
● 维度可帮助评估大数据解决方案的可行性? 
为了回答这些问题,本文提出了一种依据下图中所示的维度来评估大数据解决方案的可行性的结构化方法。
图 1. 评估大数据解决方案的可行性时要考虑的维度
对于每个维度,我们都给出了一些关键问题。依据业务上下文,为每个维度分配一个权重和优先级。评估会因业务案例和组织的不同而有所不同。
通过大数据技术获取何种业务价值?
许多组织想知道,他们寻找的业务洞察能否通过大数据解决方案来解决。然而事实上,没有权威的指南能够用来定义可从大数据获取的洞察。
具体场景需要由组织识别,而且这些场景在不断演变。
在确定和识别在实现后会给企业带来重大价值的业务用例和场景的过程中,数据科学家起着至关重要的作用。数据科学家必须能够理解关键绩效指标,对数据应用统计算法和复杂算法来获得一个用例列表。用例行业和业务不同而有所不同。
研究市场竞争对手的行动、发挥作用的市场力量,以及客户在寻找什么,会很有帮助。下表给出了来自各行各业的用例示例。
潜在的客户正在社交网络和评论站点上生成大量新数据。在企业内,随着客户切换到在线渠道来执行业务和与公司交互,交易数据和 Web 日志与日俱增。
确定数据的优先级
首先为企业内存在的数据创建一个清单,识别内部系统和应用程序中存在的数据以及从第三方传入的数据。如果业务问题可使用现有数据解决,那么有可能不需要使用来自外部来源的数据。这个时候,需考虑构建一个大数据解决方案的成本,并权衡它与带给业务部门的新洞察的价值。在有关现有客户的归档数据的上下文中分析此新数据时,业务人员将获得对新业务机会的洞察。
主要满足以下条件,大数据可提供可行的解决方案:
● 从数据中开发的洞察所生成的价值,值得在大数据解决方案中投入的资本成本
●面向客户的场景可证明来自洞察的潜在价值
评估通过大数据解决方案获取的业务价值时,企业还应考虑当前的环境是否可扩展并权衡此投资的成本。
我当前的环境能否扩展?
询问以下问题,确定企业能否扩充现有的数据仓库平台?
●当前的数据集是否非常大,是否达到了 TB 或 PB 数量级?
●现有的仓库环境是否包含生成或获取的所有 数据的存储库?
●是否有大量冷数据或人们很少接触的数据未分析,可以通过分析这些数据获得业务洞察?
●您是否需要丢弃数据,因为无法存储或处理它?
●您是否希望能够在复杂且大量的数据上执行数据探索?
●您是否希望能够对非操作数据执行分析?
●您是否有兴趣使用数据执行传统和新类型的分析?
●您是否试图延迟对现有数据仓库的升级?
●您是否在寻求途径降低执行分析的总体成本?
如果任何这些问题的答案是 “是”,那么企业就可以探索扩充现有数据仓库环境的方式。
扩展企业当前的环境的成本是多少?
扩展现有数据仓库平台或 IT 环境与实现大数据解决方案的成本和可行性取决于:
●现有工具和技术
●现有系统的可伸缩性
●现有环境的处理能力
●现有平台的存储能力
●执行的治理和策略
●现有 IT 应用程序的异构性
●组织中存在的技术和业务技能
它还依赖于将从新数据来源收集的数据量、业务用例的复杂性、处理的分析复杂性,以及获取数据和拥有恰当技能集的人员的成本。现有的资源池能否开发新的大数据技能,或者是否可从外部雇佣拥有稀缺技能的人员?
值得注意的是,大数据举措会对其他正在实施的项目产生影响。从新的来源获取数据具有很高的成本。您首先应当识别系统和应用程序内部存在的数据,以及目前收到的第三方数据,这一点很重要。如果业务问题可以使用现有数据解决,那么有可能不需要使用来自外部来源的数据。
在生成新工具和应用程序之前,请评估组织的应用程序组合。例如,一个普通的 hadoop 平台可能无法满足您的需求,您可能必须购买专业的工具。或者相对而言,Hadoop 的商业版本对当前用例而言可能很昂贵,但可能需要用作长期投资来支持一个战略性的大数据平台。考虑大数据工具和技术需要的基础架构、硬件、软件和维护的成本。
对现有的 IT 治理有何影响?
在决定是否实现一个大数据平台时,组织可能会查看新数据源和新的数据元素类型,而这些信息当前的所有权尚未明确定义。一些行业制度会约束组织获取和使用的数据。例如,在医疗行业,通过访问患者数据来从中获取洞察是否合法?类似的规则约束着所有行业。除了 IT 治理问题之外,组织的业务流程可能也需要重新定义和修改,让组织能够获取、存储和访问外部数据。
还需考虑以下治理相关问题:
● 安全性和隐私:为了与当地法规一致,解决方案可以访问哪些数据?可以存储哪些数据?哪些数据应在移动过程中加密?静止数据呢?谁可以查看原始数据和洞察?
● 数据的标准化:是否有标准约束数据?数据是否具有专用的格式?是否有部分数据为非标准格式?
● 数据可用的时段:数据在一个允许及时采取操作的时段是否可用?
● 数据的所有权:谁拥有该数据?解决方案是否拥有适当的访问权和权限来使用数据?
● 允许的用法:允许如何使用该数据?
企业能否增量地实现大数据解决方案?
大数据解决方案可以采用增量方式实现。明确地定义业务问题的范围,并以可度量的方式设置预期的业务收入提升,这样做会很有帮助。对于基础业务案例,请仔细列出问题的范围和解决方案带来的预期收益。
如果该范围太小,业务收益将无法实现,如果范围太大,获得资金和在恰当的期限内完成项目就会很有挑战性。在项目的第一次迭代中定义核心功能,以便能够轻松地赢得利益相关者的信任。
组织是否具备恰当技能的技术人员?
需要特定的技能来理解和分析需求,并维护大数据解决方案。这些技能包括行业知识、领域专长,以及有关大数据工具和技术的技术知识。拥有建模、统计、分析和数学方面的专业经验的数据科学家,是任何大数据举措成功的关键。
在实施一个新的大数据项目之前,确保已安排了合适的人员:
● 是否获得利益相关者和其他愿意投资该项目的业务赞助者的支持?
● 是否拥有熟悉该领域、能分析大量数据、而且能识别从数据生成有意义且有用的洞察的途径的数据科学家?
1
是否拥有可用于获取业务洞察的现有数据?
所有组织都拥有大量未用于获取业务洞察的数据。这些数据包括日志文件、错误文件和来自应用程序的操作数据。不要忽略此数据,它是宝贵信息的潜在来源。
1. 数据复杂性是否在增长?
查找数据复杂性增长的线索,尤其是在数据量、种类、速度和真实性方面。
2. 数据量是否已增长?
如果满足以下条件,企业可以考虑大数据解决方案:
● 数据大小达到 PB 和 EB 级,而且在不久的将来,它们可能增长到 ZB 级别。
● 这一数据量给使用传统方法(比如关系数据库引擎)存储、搜索、共享、分析和可视化数据带来的技术和经济挑战。
● 数据处理目前可使用可用硬件上的大规模并行处理能力。
3. 数据种类是否已增多?
如果满足以下条件,各种各样的数据可能都需要大数据解决方案:
● 数据内容和结构无法预期或预测。
● 数据格式各不相同,包括结构化、半结构化和非结构化数据。
● 用户和机器能够以任何格式生成数据,例如:Microsoft® Word 文件、Microsoft Excel® 电子表格、Microsoft PowerPoint 演示文稿、PDF 文件、社交媒体、Web 和软件日志、电子邮件、来自相机的照片和视频、信息感知的移动设备、空中感知技术、基因组和医疗记录。
● 以前没有为了获得洞察而被挖掘的数据来源不断地在产生新的数据类型。
● 领域实体在不同的上下文中具有不同的含义。
4. 数据的速度是否已增长或改变?
考虑您的数据是否:
● 在快速更改,必须立即响应。
● 拥有过多的传统技术和方法,它们不再足以实时处理传入的数据。
5. 您的数据是否值得信赖?
如果满足以下条件,那么请考虑使用大数据解决方案:
● 数据的真实性或准确性未知。
● 数据包含模糊不清的信息。
● 不清楚数据是否完整。
如果数据的量、种类、速度或真实性具有合理的复杂性,那么有可能会适合地采用大数据解决方案。对于更复杂的数据,需要评估与实现大数据解决方案关联的任何风险。对于不太复杂的数据,则应该评估传统的解决方案。
是否所有大数据都存在大数据问题?
不是所有大数据情形都需要大数据解决方案,我们需在市场中寻找线索:竞争对手在做什么?哪些市场力量在发挥作用?客户想要什么?
通过根据本文中的问题,确定大数据解决方案是否适合企业自身的业务情形和所需要的业务洞察。
大数据时代,企业主数据管理体系与方法
曹朝辉CIO进化论
摘 要
随着信息系统建设的增加和管理的精细化,越来越多的数据需要进行管理。一方面是由于数据增长的速度;另一方面是数据交互和共享的需求,尤其是大数据时代,数据可能存在结构化和非结构化,这些数据需要为企业在不同的业务领域提供管理支撑。从全球范围来讲,数据管理已成为企业提升管理能力的重要任务。就企业而言,需要考虑的不是数据管理工作是否开展的问题,而是该如何开展,以及何时开展。
数据管理不仅仅是信息化方面的投入,还包括如何从大量低密度的数据中获取数据价值,这是高绩效的企业必须面临的问题。对于解决所有数据问题的途径,最根本的方法是建立整个数据规划和管控体系。
以下为数据标准化资深专家 曹朝辉《大数据时代,企业主数据管理体系与方法》
【为避免文字较小影响您的阅读,请点击图片进行全屏观看】


楼主热帖
  • “中国寿险科技应用高峰论坛”及“中国财险科技应用高峰论坛“将于2024年7月在北京...[ 活动峰会]
  • InsurTecTalkAsia2024亚洲保险科技创新高峰论坛4月27日在上海成功落幕![ 活动峰会]
  • InsurTecTalk Asia 2024 亚洲保险科技创新高峰论坛即将于1月19-20日在上海召开[ 活动峰会]
  • 2023中国软件技术大会于12月15-16日在北京成功举办[ 活动峰会]
  • “大模型驱动下的软件变革”——2023中国软件技术大会召开在即[ 活动峰会]
  • 【启动仪式活动稿】“数字湾区·产业赋能” 第一届粤港澳大湾区数据[ 活动峰会]
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与 168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和 168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7. 168大数据管理员和版主有权不事先通知发贴者而删除本文。

回复

使用道具 举报

返回列表 发新帖
高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们| 小黑屋| Archiver| 168大数据 ( 京ICP备14035423号 )  | 申请友情链接

GMT+8, 2024-6-13 17:20

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表

深圳SEO优化公司固原推广网站报价上海SEO按天收费济宁网站优化按天计费价格塘坑百度seo价格银川seo网站优化价格南澳至尊标王报价天水百度竞价多少钱南阳模板推广哪家好霍邱网站定制推荐来宾网站优化按天扣费百色网络广告推广价格湖州企业网站建设多少钱晋城推广网站多少钱信阳关键词排名报价潜江设计公司网站廊坊SEO按天扣费哪家好茂名百度竞价推荐上饶网页制作惠州网站排名优化龙华seo网站推广哪家好台州seo网站优化推荐长春百度竞价哪家好贵港外贸网站制作哪家好玉溪关键词排名公司丽江关键词排名包年推广价格南澳关键词按天扣费多少钱衡阳建站报价亳州百姓网标王推广多少钱泰州网站推广价格廊坊网站制作设计歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化