第02课:深度学习在计算机视觉行业中的应用

第02课:深度学习在计算机视觉行业中的应用

伴随着深度学习技术的发展和普及,“计算机视觉”这一词汇也受到越来越多的人关注。尤其是深度学习计算芯片技术的发展,使得图像信息处理的能力大大加强,市场上关于计算机视觉技术的产品也越来越多。那到底什么是计算机视觉?它和深度学习有什么关系?目前有哪些计算机视觉相关的产品需要用到深度学习呢?

首先,我们解释下什么是计算机视觉?

计算机视觉是指用计算机实现人的视觉功能——对客观世界的三维场景的感知、识别和理解。这里主要有两类方法:一类是仿生学的方法,参照人类视觉系统的结构原理,建立相应的处理模块完成类似的功能和工作;另一类是工程的方法,从分析人类视觉过程的功能着手,并不去刻意模拟人类视觉系统内部结构,而仅考虑系统的输入和输出,并采用任何现有的可行的手段实现系统功能。[摘自《图像理解与计算机视觉》]

举个例子,最经典也是工业化水平最高的计算机视觉技术就是人脸识别技术。一个简单的人脸识别系统,包括了人脸数据库和人脸比对算法,判定两个人脸是否是同一个人脸,最直接的方法就是计算两张人脸图像之间的差异,然而,这样做往往是很难有效的区分相同人脸和不同人脸的。而计算机视觉技术的存在,就是通过对人脸图像进行特征表示,也就是抽取人脸图像中那些共性和差异性的特征,并用来对人脸图像进行重新表示,在结合度量方法来进行相似性的衡量。其中,表示和度量的过程,我们通常也就是采用机器学习的方法来完成。因此,机器学习技术就是解决计算机视觉任务的一种关键性技术。

1

那计算机视觉和人工智能是什么关系呢? 它属于人工智能的一个子领域,主要关注于图像信号数据的处理、理解和分析。因此,我们在研究计算机视觉技术的时候,会发现计算机视觉的理念在某些方面其实与很多概念有部分重叠,包括:人工智能、数字图像处理、机器学习、深度学习、模式识别、概率图模型、科学计算以及一系列的数学计算等。

还有一个概念经常会和计算机视觉搞混淆,那就是机器视觉。 很多人在开始接触到这两个概念的时候会简单的认为计算机也属于机器的一种,因此,计算机视觉就是机器视觉的一个方面。当然,这样认为也不是完全有错误,只是会显得有些局限。计算机视觉研究的是人眼的仿真,而机器视觉则侧重于为工业中的制造业提供更多有利于提高产品质量和提高生产效率的支持。我们强调机器视觉、计算机视觉和图像处理不是同义的。它们其中之一都不是任何其他两个的子集。计算机视觉是计算机科学的一个分支,而机器视觉是系统工程一个特殊领域。

深度学习属于机器学习的一种,对于大数据背景下的计算机视觉任务,尤其在检测、分类、识别等任务上,都表现出难以匹配的优势。尤其,目前越来越多的深度学习芯片的生产和制造,也确保了深度学习技术,在计算机视觉任务中的核心地位。接下来,我们看一下深度学习在计算机视觉任务中有哪些重要的应用领域。

1.深度学习在安防领域的重要应用。

利用计算机视觉技术来完成安防领域的解决方案,这是大多数视觉公司都会选择切入的一个领域,涉及到的企业包括海康威视、商汤科技、依图科技、Face++,甚至互联网公司百度、腾讯、阿里巴巴等。其中,一个重要的应用就是人脸识别技术,自2014年的 DeepFace 开始至今,深度学习的方法在该领域几乎达到垄断地位。而人脸识别技术,在安检、反恐等安防领域有着重要的意义。当然,除去人脸识别,近几年也开始研究从行人的角度出发的 ReID 技术,利用深度学习来进行人的检测、并刻画目标的特征,为后续的跟踪、异常行为分析提供有效的支撑。

2

2.深度学习在无人驾驶领域的重要应用。

在无人驾驶领域,考虑到激光、雷达等传感器价格昂贵等特点,这使得基于计算机视觉的解决方案大受追捧。而对于无人驾驶的摄像机采集到的视频数据,需要机器对其中的内容进行理解、分析并用于后续的决策控制,比如:前车碰撞预警等。因此,需要一系列的计算视觉算法来完成其中涉及的任务,具体包括了目标检测和识别、多目标跟踪、车道线检测分离等。而基于深度学习的目标检测和识别、基于深度学习的目标分割等方法,同样相对于传统的方法有着明显的优势。并且目前越来越多的深度学习芯片,尤其关注无人驾驶领域的问题,对相关算法的支持也越来越好,这也使得深度学习技术对无人驾驶技术的发展起到了重要的推动作用。目前国内对问题研究的机构同样非常多,包括了 Google、百度、海康威视、Mobileye 等,可以说,深度学习是无人驾驶领域的一种重要的基础算法。

3

3.深度学习在智能家居领域的重要应用。

传统的智能家居产品更多的是采用手机端结合蓝牙或者 WiFi 等通信手段来完成对家居的控制和使用。虽然此类解决方案能够实现一定程度上的家居智能,但是我们会依然觉得,智能化的程度依然不够。而深度学习的方法,则对于智能家居的发展起到了重要的作用。除了语音识别、语音合成以外,另一个重要的点就是利用视觉技术进行人机交互,比如:手势识别等。

4

4.深度学习在智慧教育领域的应用。

在教育领域,目前比较火热的产品就是拍照试题等 App ,通过手机端输入一张图片后,App 利用智能算法,来对获取到的区域的内容进行理解和分析,同样涉及到了深度学习的方法,比如:题目的检测、目标区域文字检测与识别等等。同样,深度学习的方法对于类问题的解决,依然有着重大的性能优势。

5

5.深度学习在 OCR 领域的重要应用。

除了教育会涉及到文字检测与识别,在一些诸如:简历的识别、文档的识别、身份证识别等等领域,同样会存在一些关于图片中文字的内容理解和分析的部分,而对于这也任务而言,同样深度学习是一种更优的选择。此类问题,其实可以直接概括为自然场景下的文本检测和识别任务。

6

6.深度学习在图片检索领域的重要应用。

以图搜索图的目的是为了找到和原图相似的图片,它不仅会涉及到图像检索引擎的建立,同样也依赖于一个较好的图像特征抽取的方法。而深度学习依然成为了一种较为有效的技术手段和方法,并在众多的图像检测问题中,起到了重要的作用。

7

7.深度学习在医疗影像数据中的应用。

深度学习在医疗健康领域的机遇主要有七大方向:一是提供临床诊断辅助系统等医疗服务,应用于早期筛查、诊断、康复、手术风险评估场景;二是医疗机构的信息化,通过数据分析,帮助医疗机构提升运营效率;三是进行医学影像识别,帮助医生更快更准地读取病人的影像所见;四是利用医疗大数据,助力医疗机构大数据可视化及数据价值提升;五是在药企研发领域,解决药品研发周期长、成本高的问题;六是健康管理服务,通过包括可穿戴设备在内的手段,监测用户个人健康数据,预测和管控疾病风险;七是在基因测序领域,将深度学习用于分析基因数据,推进精准医疗。而医学影像是医生判断疾病的一个重要手段,放射科、病理科等擅长读图的医生增长率和诊断效率急需提升,成为很多医疗机构的心病。目前,在人类医学专家的帮助下,国内外研究团队已经在心血管、肿瘤、神内、五官等领域建立了多个精准深度学习医学辅助诊断模型,取得了良好的进展。其中,依图科技则在深度学习医疗领域取得了不错的成绩。

8

8.深度学习与美颜相机。

对于美颜相机,大家一定都不陌生。在美颜相机中会有哪些地方涉及到深度学习的算法呢?其中最重要的就是人脸的关键点定位。只有找到关键点,才能有效的进行一些眼睛的修饰等操作,同样,相比于其他方法,基于深度学习的方法能够实现更优的性能。

9

9.深度学习在 Fashion 领域的探索。

目前,阿里巴巴携手香港理工举办了 FashionAI 的比赛,旨在探索如果通过机器学习的方法来完成关于流行趋势的分析和预测。而深度学习无疑会成为众多方法中的宠儿。其中涉及到了服装关键点检测和定位,服装分类等等问题。

10

10.深度学习芯片。

对于大多是计算机视觉从业者而言,往往会更多的侧重于深度学习算法而忽略了深度学习芯片。大家也都知道,深度学习算法的火爆,必然依托于深度学习芯片的发展。尤其最近的中兴事件暴露出的国产芯片的一系列问题,也使得越来越多的人开始关注芯片行业。而一项深度学习工程,其实可以分为训练和推断两个环节,对于训练环节大多采用 GPU 来完成,而实际在使用的时候,考虑到功耗等问题,推断芯片的研发也变得尤为重要,除了 CPU 和 GPU 以外,FPGA、ASIC 等同样发挥着重要的作用。对于智能社会而言,深度学习芯片将会起到重要的基石作用。

11

当然,除上述领域外,深度学习在其他的很多领域都有着重要的应用,比如:车牌识别、图像质量恢复、自动图像描述等等。总之,深度学习技术对于众多的计算机视觉任务而言,已经逐步占据了统治地位,作为一个计算机视觉从业者,它也成为了大家的基本技能。至于原因,大家可以看一下《为什么深度学习几乎成了计算机视觉研究的标配?》这篇文章,这里不再赘述。

上一篇
下一篇
目录