首页 > 图书中心 >图书详情
深度学习之图像识别:核心算法与实战案例(全彩版)
作者:言有三
定价:159元
印次:1-1
ISBN:9787302635277
出版日期:2023.07.01
印刷日期:2023.07.26
- 内容简介
- 前言/序言
- 资源下载
- 版权信息
《深度学习之图像识别:核心算法与实战案例(全彩版)》全面介绍了深度学习在图像识别领域中的核心算法与应用。该书不但重视基础理论的讲解,而且从第4章开始,每章都提供了1~3个不同难度的案例供读者实践,读者可以在已有代码的基础上进行改进,从而加深对所学知识的理解。 《深度学习之图像识别:核心算法与实战案例(全彩版)》共9章:首先介绍深度学习的基础概念,包括神经网络基础知识和深度学习中的优化技术;然后系统介绍深度学习中与数据相关的知识,包括经典数据集的设计、数据集的增强,以及数据的获取、整理与可视化;接着重点针对图像识别领域,结合实战案例系统地介绍深度学习在图像分类、图像分割和目标检测3个领域的核心技术与应用;另外,还会对深度学习模型的可视化以及模型的压缩和优化进行详细介绍,为读者设计和训练更加实用的模型提供指导;最后以微信小程序平台为依托,介绍微信小程序前后端开发技术,从而完成深度学习模型的部署。 《深度学习之图像识别:核心算法与实战案例(全彩版)》理论结合实践,广度兼具深度,非常适合深度学习领域的相关技术人员与爱好者阅读,尤其适合基于深度学习的计算机视觉从业人员阅读,可以帮助他们全方位了解深度学习在计算机视觉领域的技术全貌。另外,该书还适合作为高校人工智能相关专业的教材和社会培训机构相关课程的教材。
more >前言 机器学习、深度学习和人工智能是近几年持续热门的话题,尤其是OpenAI公司的ChatGPT聊天机器人一上线,便把人工智能推向了一个新的热度。深度学习其实并不是一门全新的学科,其历史可以追溯到20世纪40年代,其背后的核心技术包括神经网络的结构设计和优化方法等。深度学习是一门应用性极强的工程技术,初学者要想掌握好这门技术,不仅需要进行系统的理论知识学习,而且还要紧随理论进行全面实践。 对于我国而言,人工智能俨然已经成为国家高科技发展的重中之重,近几年有数百所高等院校陆续开设了人工智能类专业。当前,令人瞩目的是以深度学习为代表的无监督特征学习技术在图像识别、语音识别和自然语言处理等领域频频取得新的突破,这促使我国数以千计的人工智能类科技公司得到了快速发展。 笔者在8年前就投身人工智能领域,从事图像识别方面的工作。在此期间,笔者多以深度学习技术为基础进行相关项目的开发,积累了大量的经验,而且还持续运营微信公众号“有三AI”,推出了数百篇与人工智能相关的文章,帮助大量读者了解和学习人工智能相关技术及发展趋势。 笔者曾在2019年5月出版了《深度学习之图像识别:核心技术与案例实战》,迄今已经5次印刷,销量超过万册,被众多读者所认可。只是这是笔者第一次执笔写作,当时笔者还在互联网公司上班,时间非常紧,加之自身能力不足,所写内容还不算太成熟和完备,仍然有大量可以改进、扩展和深入的空间。近几年,笔者进一步对相关技术进行了潜心研究和实践,对基于深度学习的图像识别技术有了更加深入和全面的认识,技术能力突飞猛进,其间还写作并出版了几本人工智能技术图书,还与大量读者和技术爱好者进行过多次线上和线下交流,并在各大平台上进行过多场直播,收集了大量的反馈和建议,因此笔者觉得有必要重新写一本书,以便与各位读者和技术爱好者分享更新、更系统、更细致和更深入的计算机视觉技术。于是笔者于2022年开始动笔,经过大半年的编写,终于完成了本书的写作。 本书首先从深度学习的背景和基础理论知识讲起,然后介绍深度学习中数据的使用,以及计算机视觉涉及的三大核心领域—图像分类、图像分割和目标检测,最后介绍深度学习模型的可视化、优化和部署等知识。 本书内容全面,理论结合实践,讲解由浅入深,图文并茂,尽可能地抛开过多的数学理论,将重点放在基于深度学习的图像识别关键技术与应用上,从而降低学习难度。本书紧随工业界和学术界计算机视觉技术的新近发展,带领读者全面、系统地了解并掌握相关技术。相信通过阅读本书,读者能够对相关知识有更加全面和深入的理解。 本书特色 相比前书,本书基本沿袭了《深度学习之图像识别:核心技术与案例实战》的内容架构,但在具体内容和风格上有很大的变化,主要体现在以下几个方面: 印刷更精美—采用四色印刷,能更好地呈现图像的色彩和各种细节。 内容更全面、新颖—除了详细介绍神经网络和深度学习的理论知识、数据使用方法,以及深度学习在图像分类、图像分割和目标检测三大领域的关键技术与应用外,还会介绍模型的可视化、优化与部署等知识,并重点突出新近研究成果,给出多个重要领域的应用实践代码。 内容更深入—在对内容进行横向扩展的同时,还会进一步从纵向挖掘,力争把知识讲深、讲透。 讲解更准确、细致—对涉及的概念和算法等理论知识给出更加准确的描述,并通过大量的示意图、表格和详细的步骤呈现技术细节。 框架更流行、易用—涉及的所有案例均采用更加流行和易用的PyTorch框架实现,更容易上手。 理论和实践结合更紧密,案例更典型—不仅对理论知识进行阐述,而且结合多个更加切合实际开发的典型案例进行实践,学习效果更好。 编排更合理—章节安排更加合理,更加符合读者的学习和认知规律。 本书内容 第1章神经网络与卷积神经网络基础,首先介绍神经网络的生物基础与数学模型,然后介绍卷积神经网络的基础知识,为后续学习深度学习模型打好基础。 第2章深度学习优化基础,首先介绍激活函数、参数初始化、标准化、最优化、正则化等与深度学习优化相关的知识,然后介绍Caffe、TensorFlow和PyTorch等开源框架的优缺点,旨在让读者对深度卷积神经网络优化有较为全面的认识,为后续学习打好基础。 第3章深度学习中的数据使用方法,首先介绍深度学习发展中的几个数据集,尤其是几个较为重要的数据集,然后介绍数据的收集、整理与标注方法,以及数据增强和可视化等相关知识。本章内容对工业项目开发非常重要,实践性较强。 第4章图像分类,首先介绍图像分类的基础知识,如单标签图像分类和图像分类经典模型等,然后详细介绍图像分类的几个重点研究领域,如多类别图像分类、细粒度图像分类、多标签图像分类、半监督与无监督图像分类、零样本图像分类等,接着以从零开始搭建图像分类模型和准备数据集为例,展示实现一个完整的工业级图像分类任务的流程,最后介绍一个细粒度级别的图像分类任务,以一个较好的基准模型,展示较复杂的图像分类任务的特点以及模型训练与调优方法。 第5章目标检测,首先介绍目标检测的基础知识和基本流程,并讲述一个经典的V-J目标检测框架,然后介绍基于深度学习的目标检测任务的研究方法与发展现状,并重点总结二阶段目标检测方法与一阶段目标检测方法,最后给出一个目标检测任务进行实践,即使用当前较为主流的YOLO系列中的YOLO v3框架进行模型的训练与测试。 第6章图像分割,首先介绍图像分割的研究方向,并简单地回顾经典的图像分割方法与评估指标等,然后重点介绍基于深度学习的图像分割方法的基本原理与核心技术,并总结语义分割、Image Matting和实例分割的相关模型,接着以从零开始搭建图像分割模型和准备数据集为例,展示实现一个完整的工业级图像分割任务的流程,最后介绍一个更加复杂的人像软分割任务,展示典型的Image Matting框架的代码实现与模型训练方法。 第7章模型可视化,首先介绍深度学习中的模型可视化基础知识,然后介绍具有代表性的模型可视化分析方法,接着结合案例分别对梯度法可视化、反卷积可视化和激活热图可视化方法进行代码分析与实践。 第8章模型压缩,首先介绍轻量级模型设计的典型方法,然后详细介绍模型剪枝、模型量化和模型蒸馏的相关知识,最后结合案例介绍基于缩放因子的结构化模型剪枝、基于KL散度的8bit模型量化及经典的知识蒸馏框架的代码实现、模型训练和压缩方法。 第9章模型部署与上线,依托微信小程序平台从两个方面介绍模型部署的相关知识。首先介绍微信小程序的前端开发,然后介绍微信小程序的服务端开发,以及服务端算法功能代码的实现方法,从而完成一个可供验证的工业级线上模型的部署。 配书资源获取方式 本书涉及的源代码文件和数据集需要读者自行下载。读者可在清华大学出版社网站(www.tup.com.cn)搜索到本书,然后找到页面上的“资源下载”模块,单击“网络资源”按钮进行下载即可。另外,读者也可在“有三AI”社区的开源GitHub上进行下载,网址为https://github.com/longpeng2008/yousan.ai,或者关注微信公众号“方大卓越”,回复“图像识别yys”,即可获取下载链接。 读者对象 深度学习技术爱好者与研究者; 基于深度学习的图像识别人员; 计算机视觉技术爱好者与从业人员; 高等院校相关专业的学生与老师; 相关培训机构的学生与老师。 售后支持 限于笔者水平,书中可能还存在一些疏漏和不足之处,敬请各位读者批评与指正。阅读本书时如果有疑问,可以通过电子邮件(bookservice2008@163.com)获取帮助。 致谢 感谢南京邮电大学的博士生尤帅!在本书的编写过程中,他协助笔者绘制了一些图表,并审阅和校正了部分内容。 感谢广大读者和技术爱好者!他们给笔者提供了已出版图书的阅读反馈和建议,这对笔者写作本书非常有价值。 最后感谢参与本书出版的各位编辑!没有他们的辛苦与努力,就不会有本书的高质量出版。 言有三
more >-
暂无课件
-
样章下载
-
网络资源
-
-
扫描二维码
下载APP了解更多
版权图片链接