搜索
  • 首页
  • 快讯
  • 资讯
    • 推荐
    • 财经
    • AI
    • 创新
    • 城市
    • 最新
    • 创投
    • 汽车
    • 科技
    • 专精特新
  • 直播
  • 视频
  • 专题
  • 活动
搜索
寻求报道
我要入驻
城市合作
首页> 人工智能>正文

亚马逊机器学习服务:深入研究AWS SageMaker

AI科技大本营·2020-01-25 11:20
Sagemaker是一项全受管服务,它可以让开发人员规模化地构建、训练、测试和部署机器学习模型。

编者按:本文来自微信公众号“ AI科技大本营”(ID:rgznai100),作者 Manish Manalath,36氪经授权发布。

机器学习是一个从数据中发现模式的强大概念。但是,如果您尝试过从零开始构建机器模型,那么您一定知道设计一个可扩展的机器学习工作流是多大的挑战。

使用传统方法构建机器学习模型,标记、训练和微调参数非常耗时。除此之外,训练模型是一个繁琐的过程,需要相当大的计算能力。正因如此,用复杂的模型构建可扩展的工作流,比如强化学习模型,是数据科学家面临的一大挑战。

Amazon试图用AWS SageMaker来解决这些挑战。

Sagemaker是Amazon推出的一项全受管服务,它提供了一组丰富的工具,帮助您轻松地构建、训练、测试和部署模型。Sagemaker可以让您设计一个完整的机器学习工作流,以最小的工作量将智能集成到您的应用程序中。

Sagemaker是一项全受管服务。这意味着没有设置,没有安装,也不需要手动扩展。Sagemaker提供了一个完整的机器学习套件,其中包括IDE,您可以使用它与您的团队进行实时协作。

让我们来看看SageMaker 的各个组件,了解它们如何协同工作,以帮助团队为客户打造和交付更好的解决方案。

SageMakerGround Truth


准备正确的数据集是构建机器学习模型的第一个挑战。这些数据集通常是从不同的来源获得的,可能有着不同的格式。由于算法不能处理原始数据,因此在数据准备阶段经常需要进行手动标记。除了训练模型,预处理数据是工程师花费时间最多的地方。

Sagemaker Ground Truth使用预先训练的机器学习模型自动标记原始数据,大大减少了创建标记数据集所需的时间和精力。随着时间的推移,通过学习手动创建的标签,GroundTruth也逐渐变得更好。

SageMaker Studio

Sagemaker Studio是一个功能丰富的机器学习集成开发环境(IDE)。您可以使用单一的集成接口编写、调试和可视化您的模型。

Sagemaker Studio还提供分步跟踪的功能,您可以使用暂停,重放和克隆步骤。这样,在机器学习工作流中来回移动来分析和迭代单个步骤会很容易。

Sagemaker Studio包含以下同步工作的工具,可以帮助您毫不费力地构建复杂的机器学习架构。

SageMaker AutoPilot

Autopilot是SageMaker中最有用的工具。在设计机器学习模型时,找到正确的算法是另一大挑战。鉴于解决机器学习问题的算法种类繁多,找到最有效的算法往往需要数小时的训练和测试。

Autopilot使用预先训练的机器学习模型来解决这个问题,为您的数据找到正确的算法。通过提供目标列进行预测,Autopilot将探索不同的解决方案,找到最适合您数据集的模型。一旦Autopilot找到了正确的模型,你还可以选择使用自定义的配置来扩展模型。

SageMaker Notebooks

如果您熟悉Jupyter Notebooks, SageMaker Notebooks就是一个可以与他人共享的Jupyter Notebooks。您可以与您的团队协作,使用SageMaker Notebooks实时构建机器学习模型。

Sagemaker Notebooks不受限于初始配置,这意味着您可以使用不同的硬件配置来测试您的机器学习模型。在创建一个新的SageMaker Notebook时,您还可以选择不同的预制模板。

SageMaker Experiments

为了训练模型,您必须在模型中运行数据进行多次迭代,直到获得最好的准确性。这包括尝试不同的算法,微调参数,调整特性等一系列操作。

Sagemaker Experiments可以将每个优化过程作为“实验”存储,并提供可视化界面供您浏览。Sagemaker Experiments 捕获每次迭代的输入参数、配置、结果等,供您浏览和审查它们的性能。

SageMaker Debugger

机器学习模型的准确性只有在训练完成后才能确定。但是训练模型是一个耗时的过程,需要几分钟到几小时不等。如果你不得不改变参数,那么就必须重新训练模型来计算其准确性。

Sagemaker Debugger在训练过程中捕获实时指标。捕获的验证、混淆矩阵和学习梯度等信息,可以帮助您分析整个训练过程,进行优化,以获得更高的准确性,而不用重新训练整个模型。Debugger还会对常见问题发出警告,并提供最佳操作建议。

SageMaker Model Monitor

一旦机器学习模型投入生产,就很难自动监控模型的性能。当模型从用户交互中接收到新的数据时,可能会出现数据偏移,这将改变基值,如均值、方差、平均值等。没有适当的统计分析,很难用传统的方法推断出这些问题。

Sagemaker Model Monitor监视生产中的机器学习模型,并在模型不能按预期那样运行时提醒您。通过配置,Sagemaker Model Monitor可以生成包含常规统计信息和性能指标的报告,并且可以定期存储在S3 bucket中

SageMaker Neo

像自动驾驶汽车这样的复杂机器学习解决方案是使用一组单独的模型构建的。这些模型必须做出快速、低延迟、高准确的实时预测。这样的模型需要花数年时间来训练、测试和部署。一旦部署后,除非有一个坚实的强化学习架构,否则很难更新edgelocations模型。

这时候SageMaker Neo就可以派上用场了。Neo对模型进行了优化,使其运行速度提高了两倍,而占用的内存不到十分之一,而且在准确性上没有任何损失。

Neo还可以将机器学习模型编译成一个可执行文件,部署到云端或者 Lambda edge上。Neo还支持使用AWSGreengrass对edgelocations(分发节点,是指亚马逊在全球建立的,对源服务器发布的内容进行缓存的节点。终端用户访问时,从最近的节点提供数据)的无线更新。

SageMaker Augmented AI

高度精确的机器学习模型,经过一定程度的人工干预,能更好地保证数据的质量和准确性。Amazon Augmented AI (A2I)使得构建人工审查预测结果的工作流变得容易。

这在处理诸如扫描文档和自然语言文本等低质量数据格式时特别有用。A2I可用于对低可信度预测结果进行人工审查,或持续地对预测进行审核。

AWS Marketplace

AWS Marketplace是一个数字目录,上面提供了数千项由独立软件供应商开发的预配置软件服务。AWSMarketplace提供了从操作系统到数据分析的一系列解决方案。

Aws Marketplace还提供了多种使用 AWS 平台构建、训练和测试的机器学习解决方案。您可以选择Marketplace上可用的现有模型,并将其直接部署到生产环境中。Marketplace解决方案也是可扩展的,在将这些模型部署给客户之前,开发人员能够添加额外的配置层。

总结

如果你是一名机器学习工程师,当你从头开始构建完整的机器学习工作流程时,Sagemaker会帮你大大缩减开销和设置的数量。 Sagemaker 还提供托管现场培训,使用多余的 AWS 现场实例运行您的培训作业。在训练大规模数据集时,这可以帮您节省计算能力方面的成本。

Sagemaker 还能很好地与Tensorflow和 Keras等语言兼容,能够提供一个GPU集群来并行运行计算。毫无疑问,SageMaker 是机器学习工程师工具箱里的一个强大工具。

原文链接:
https://hackernoon.com/amazon-machine-learning-a-deep-dive-into-aws-sagemaker-9mx3zs8
人工智能 aws亚马逊 统计学
+1
2

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
登录后参与讨论
提交评论0/1000
你可能也喜欢这些文章
服装设计,AI重生
这个只有AI的微博,藏着AI社交的另一种解法
Llama系列上新多模态,3.2版本开源超闭源,还和Arm联手搞了手机优化版
OpenAI连丢3高管,光杆司令奥特曼紧急扶持华人上位,半年流失15员大将
被引爆的新一波AI服务器需求
大模型时代,星纪魅族的多终端解法
OpenAI三位同日离职高管起底,今年已失去13位高管
150万条多语种音频数据,浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护
Meta首款多模态Llama 3.2开源,1B羊驼宝宝,跑在手机上了

最新文章推荐

服装设计,AI重生 靠“贩卖苦难”月入百万?陷入弃养争议,云南网红口碑崩塌 3000点回来了,你准备入市吗? 出海速递 | 字节跳动不能输掉的一场仗/ OpenAI高层再震荡: CTO 离职, Sora 恐长期停滞? 一个月暴涨78%,AI学英语赛道依旧火爆 深圳又杀出个超级IPO:年入8亿 市占率2.37% 上海杀出个超级巨头:全球领先,毛利超64% 这个只有AI的微博,藏着AI社交的另一种解法 新一轮刺激政策过后,蔚来大涨完又大跌,利好已经出尽? 全公司押注18A芯片, 英特尔背水一战
AI科技大本营
特邀作者

微信公众号:AI科技大本营(ID:rgznai100)

最近内容

李开复:中国落后美国大模型差距缩小为 6 个月,疯狂降价是双输
ChatGPT 价格里掩盖的算力分布秘密
万字长文解读:从Transformer到ChatGPT,通用人工智能曙光初现

下一篇

5个可以帮助你提高工作效率的新AI工具

毫无意义的新闻、故事和活动会占用你每天多少的工作时间?

2020-01-25

热门标签

补钙 乳钙 政府治理 阿姆斯特丹 性工作者 进出口总额 一般贸易 进门财经 库珀 溏心蛋 林俊杰演唱会 中环 赚家 书生 陈冬 陆磊 伊莉莎 黄远 财产性收入 中金黄金 战棋三国 米塔尔 叮咚音箱 红双喜 潘宁 邓小平 青城山 都江堰 任天堂3ds 艺博会
意见反馈
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

深圳SEO优化公司宁波网站优化软件开发青岛自适应网站优化公司株洲网站排名优化公司如何对网站seo优化江西咨询网站搭建优化如何优化网站好评云速捷专业海口营销型网站制作优化网站不收录怎么优化好信阳网站关键词优化企业网站优化找哪家海珠网站优化seo郑州网站优化搜索优化网站 主题迎泽区网站seo优化排名武汉市优化营商环境网站潮州网站的优化武穴网站优化哪家好包年网站优化哪家好太原网站优化推广渠道鄂州本地网站优化公司排名企业网站推广与优化seo网站优化学校靠谱网站优化公司推荐网站整站优化方案广东百度网站优化排名海门网站优化有哪些怎么大型网站优化马鞍山市网站关键词优化哪家不错网站排名优化公司西安做网站优化的公司歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化