智能图像识别初探系列(二) 标签:人工智能、人工智能前沿、深度学习、图像识别、图像处理 在上期文章中,我们了解了图像识别的大致流程,并对图像处理中涉及的图像预处理和图像分割方法进行了阐述。在本期中,我们会接着上期的内容继续对图处理部分进行细分介绍,并了解卷积神经网络的基本结构以及图像处理相关算法的基本知识。 一、图像识别细分 卷积神经网络(CNN)通常被用来张量形式的输入,例如一张彩色图象对应三个二维矩阵,分别表示在三个颜色通道的像素。 许多其它输入数据也是张量的形式:如信号序列、语言、音频谱图、3D视频等等。卷积神经网络具有如下特点:局部连接,共享权值,采样和多层。 1/8 下图中我们可以看到一个4*3的矩阵,右侧是一个核。我们先将abef看成一个整体,去点对点的乘以核元素,就会得到加权的结果aw+bx+ev+fz,同理我们可以得到其他特征组合的加权求和结果。 在具体的学科中,图像处理时我们常用一个模板和一幅图像进行卷积,对于图像上的一个点,让模板的原点和该点重合,然后模板上的点和图像上对应的点相乘,然后各点的积相加,就得到了该点的卷积值。对图像上的每个点都这样处理。由于大多数模板都是对称的,所以模板不旋转。卷积是一种积分运算,用来求两个曲线重叠区域面积。可以看作加权求和,可以用来消除噪声、特征增强。 二、智能图像处理 1. 应用场景 上文我们主要探讨了智能图像特征分割、提取和识别等问题,接着我们如何从我们的图像或者样本中得到我们想要的结果呢?我们首先来看看实际应用中涉及智能图像的场景。 2/8 这个是谷歌推出来的一个聊天软件叫Allo,这个软件是什么作用呢?如果当对方给我发了一个图像,那么我可能在忙,不方便给他回信息内容,这时候呢,我想敷衍一下,或者自动回复消息,这时这个应用就起作用了。它能够自动的生成一些词汇。比如说对方给我发了一个小baby的图像,那么我正在忙,这时它会自动的生成:"哇,好漂亮啊!好可爱啊!真可爱的一个宝宝!"它会生成一些词汇。然后我随便的选一个发给对方,那我们的友谊小船就继续的往前走了。这是这样的一个具体应用。当然如果是不同的图片呢?它生成的关键词,或者说匹配出来的关键词是不太一样的,能够根据场景具体的匹配出来一些词。 我们再看一个小栗子,这是facebook做的一个deepmask和sharpmask。 实际上我们仔细看,这些图像都被标注出来了,也就是说它能够对当前场景中的图像进行检索。实际上呢,它起到的就是分割的作用,它能够把当前的前景图像和背景图像分割开来,或者说挑出我们我们感兴趣的对象。 接下来这个小栗子可能更高级一些。它是一个「目标检索」,而且能够给出我们一个提示。 3/8 比如说我们在这个场景中可以看到有很多只羊,那么计算机会把每一只羊给标注出来,告诉我们这个是羊。当然更高级的话呢?它会告诉我们,这个是羊的可能性是多少,比如说是羊的可能性是百分之八十,那么另一只羊是百分之九十,可能还有隐藏的很隐蔽的可能只有百分之六十等等。 上面这两幅图也是一个图像处理的应用。这个应用是能够通过计算机生成一个具有真实感的图像。左边是传统办法生成的图像,我们感到很模糊,而且一眼就能看出来这个图像不太真实。但是右边不太一样,人物非常有质感,看起来会很立体。这个也是智能图像处理的一个应用,它是属于图像生成的领域。 2. 智能图像处理技术 上述场景都是一些简单的应用。但是实际上我们仔细分析的话,我们称做智能图像处理。 4/8 智能图像处理我们给他拆开来看,实际上我们要关注两个问题,一个问题叫做智能技术,另外一个问题是图像处理技术。 如果说我们关注智能技术,进一步可以分成两块,一个是机器学习一个是深度学习,也可以说机器学习里边包含深度学习。但是因为深度学习又很特殊,所以我们一般会将两者分开,这是我们说的智能技术。另一个分支,是我们现在看到的右侧图像处理技术,其包含的知识点非常多,我们看这里仅仅罗列了一部分,其实还有非常多。所以说,我们要想学好智能图像处理,就要学好两个知识点,其中一个是智能技术,那么另外一个就是图像处理技术,我们必须有深厚的图像处理技术的功力,才能够做好智能图像处理。否则的话,我们谈不上智能图像处理好了。 三、两个"学友" 现在我们就分别来看下智能技术下两位好学友:「机器学习」和「深度学习」。 1. 机器学习 1.1 传统方法 传统上,我们一般的是提出来一个问题,然后确定如何去解决这个问题。接着对这个解决的方案进行评估。如果这个方案不错,那我们就说正常工作就可以了。如果我们对这个方案觉得不太好,那我们就要去修正他。然后对这个问题进行新的规则,确定新的规则后,可能是把原先的规则全部推倒,然后我们重新构建一遍,也可能是在原先的规则基础之上进行修修补补。这个是我们解决问题的思路。就像我们开车一样,我们会通过方向盘进行不断的修正,最后走上一条直线,解决问题也是一样,这是我们说传统的方式。 5/8