卷积运算(卷积运算和图像处理)
卷积运算(卷积运算和图像处理)
最近,我对图像核和卷积运算在图像处理中的应用产生了兴趣。诚然,这是因为它在社交媒体网站和Snapchat和Instagram等应用程序上很受欢迎。在一些应用程序上的许多照片都使用了特效,这些特效是通过改变图片像素的值和操作来实现对图像的修改。
图像处理有许多不同的应用,包括AR、文本分类、目标检测等。图像处理应用的数量激增的原因与深度学习领域的研究人员最近的发展有关。神经网络能够处理各种各样的输入,并在一系列计算的基础上提出预测。什么是卷积运算?
图2.卷积运算的一个例子
在讨论卷积运算之前,必须提到仿射变换,因为它们为卷积运算提供了基础(Dumoulin, 2018)。仿射变换用于通过一个称为核的矩阵来改变向量的值,核的值集可以是预先确定的,也可以是导出的。当改变向量的方向或位置时,这些转换是有用的。然而,仿射变换的局限性在于它们没有利用输入中的核可用的某些属性,如颜色或方向通道。通过利用前面提到的特性,操作可以减少必要的处理量,从而帮助更有效地解决任务。
这就是卷积运算发挥作用的地方。卷积运算采用仿射变换,允许它们有效地应用于具有高度维数或大量可变性(如图像、视频和声音字节)的输入。如图2所示,为了简化大数据集,使用卷积运算通过一系列的运算(一系列的乘法和加法)压缩输入。与仿射变换一样,卷积运算使用核函数来改变输入。这是通过将输入值与核值相乘来实现的。总数是通过在操作的第一步中添加一系列乘法的值获得的。在一系列的过程中,这些计算结果是一组小的值,这些值都在一个压缩的集合中保存了输入值。卷积神经网络(CNN)和卷积运算是否相关?
图3.Fjor Van Veen的卷积神经网络
在讨论卷积运算时,不得不提CNN。CNN在90年代早期被用于识别手写字符。一组研究人员通过最初分离然后标记它们来训练神经网络来识别手写字符(Le Cun,1995)。当CNN用于在比赛中击败ImageNet分类系统时,神经网络的潜力急剧扩大(Krizhevzky,2014)。CNN之所以成为机器学习实践者最希望利用的网络之一,是因为它的压缩作用是通过一系列卷积运算来完成的。这允许模型基于压缩的输入进行预测。由于输入已经被简化或压缩,因此在训练模型上花费的时间更少。
图3显示了CNN背后的典型设计。首先,可以使用具有多个维度的图像或音频文件作为输入(黄色圆圈)。然后将执行一系列卷积运算,以便在多个层(粉色圆圈)上简化或"卷积"输入,并将一系列卷积运算的输出馈送到神经网络中。根据Van Veen(绿色圆圈),分析卷积输出的神经网络通常是前馈神经网络。你如何评估CNN的表现?
神经网络模型建立后,利用大量的数据集进行正向和反向传播,改变网络各节点之间的连接,以达到尽可能高的精度。如何评估模型准确预测是通过一种名为混淆矩阵的方法。
混淆矩阵的四个部分:
混淆矩阵是一个2×2矩阵,用来计算模型的预测精度。矩阵的四个部分是真阳性、假阳性和真阴性、假阴性。从这四个值; 可以返回准确性,精确度以及正面和负面情况的覆盖范围。通过从矩阵中获取值并使用公式获得这些值。
如何训练模型:
输入数据分为两组,即测试组和训练组。可以使用任何比率来训练模型,但使用80%的数据集作为训练集是最流行的方法。这可以使用Python的sklearn库中的train_test_split()API调用来执行。通过拆分数据集,这允许网络使用先前未见过的数据来提高其预测的准确性并防止过度拟合。过度拟合是由具有相同数据的神经网络内的训练节点引起的问题,一旦出现不熟悉的问题,将导致精度损失。
如何进一步提高网络的准确性:
这可以通过交叉验证来完成,交叉验证是一种拆分数据集的方法,以便在整个集合中进行训练和测试。该方法允许将所有数据用作训练集和测试集,这将提高模型对未知或未见数据的预测的准确性。交叉验证的两种方法是leave p-labels out和k-fold测试。
Leave p-labels out:
为了实现更高的精度,测试可以用来忘记p为了测试,以"训练过度"偏爱的标签中的标签的数量。在测试期间,"遗漏"的标签被带回并使用。
k-fold测试:
这是最常用的交叉验证类型。这包括获取测试集并在整个数据集中"移动"该区域以确保所有数据都已用于测试。关于Kernel
图4.此图像核保存模糊值
上面显示的图像是3 x 3矩阵,核也可以是任何大小。核的大小由输入大小决定。考虑到这一点,核大小应足够大,以便在其计算中包含足够的数据,但也应该足够小,可以防止处理的信息重叠。此外,核保存常量,然后在一系列卷积运算中使用这些常量。有许多不同类型的自定义效果可以通过操纵核中保存的值来实现。例如,恒等核通过将nxn核的中心设置为1,将周围的单元格设置为0来保持图像的原样。这将保留想要的像素,同时在卷积运算的乘法运算中"忘记"其他不需要的值。通过这种方法,很容易假设以0作为核中的值的网格将被"遗忘",或者在卷积操作中不会被计算,而1将保持像素不变。通过增加输入的大小(核值大于1),可以执行模糊操作,通过缩小大小可以执行完全相反的效果(锐化)。图像处理还有其他部分吗?
图像核不是图像处理的唯一关键部分。如果我们参考图2,核似乎会在输入中移动。移动的程度称为步幅,可以自定义,以增加核跳过的像素数量。步幅的增加确保了图像核所研究的区域不重叠。
当核开始沿输入边缘移动时,Padding是图像处理的另一个重要部分。根据输入和核的大小,可以定制n个层。图4显示了一个卷积操作。不同类型的Padding
图5.The zeroes around the input helps the kernel process the image more accurately
虽然上面的图中显示的值是0,但是使用的值可以是任何数字。还可以使用其他类型的填充,例如reflective padding,但是为了简单起见,图4中所示的零填充将是讨论的重点。
No padding:
这需要核处理没有零层的输入的每个像素。这会导致输入的边缘不被整个核完全处理,如图1所示。
Half padding:
Half padding用于保持输入的大小。当在网络中涉及多层padding时,这可能是期望的。卷积运算减小了输入的大小,如图4所示。Half padding的名称来自用于执行它的公式。将内核大小分成两半,然后将划分的下部加倍,然后添加一个小于核大小的值。
Full padding:
这允许输入的大小增加,这可能对具有大量卷积的神经网络有用。这可以恢复被卷积操作删除的层。卷积运算有哪些种类?
处理输入时可以使用两种主要的卷积运算。通过更改前面提到的属性,可以根据自己的喜好自定义操作的详细信息,以增加每个卷积操作中表示的信息量。通过更改padding,您可以使核能够处理输入的边缘并保留或增加大小。不同类型的卷积运算
No zero padding with non-unit strides:
这将产生一个输出,它等于步数加1,包括核的初始位置,这是由核所采取的。Non-unit strides可以用来限制分析区域的重叠量。
Zero padding with non-unit strides:
通过对输入进行padding并将核设置为non-unit strides,可以完成另一个卷积操作来处理输入,并能够包含输入的边缘情况。转置卷积运算
转置卷积运算意味着切换卷积的方向。这意味着当核用于更改值并处理输入时,将交换forward 和 back swapping。步幅和padding用于实现类似的目标,即允许更好地处理数据。然而,由于前面提到的操作现在在相反的方向上工作,所以步幅和padding的结果与在标准卷积操作期间如何使用它们不完全相同。
图5所示是转置卷积运算。通过向输入添加padding,可以考虑每个感兴趣的区域,并且与只允许核研究四个阴影区域相比,输出可以包含更完整的数据。转置卷积运算通常用于提高图像分辨率。这方面的应用是无止境的,包括改善从商业中获取的颗粒状CCTV镜头或完成可能模糊或覆盖的面部或镜头。
图6.使用单位步幅和零padding的转置卷积自定义图像效果
如前所述,当使用图像核对图像(如模糊,旋转和裁剪)执行某些效果时,我们可以使用许多不同的设置进行自定义。因此,通过使用
http://setosa.io/ev/image-kernels/上提供的图像自 定义程序,可以创建自定义核(如图7所示),我们可以将核应用于图像。
图7.这是我们将用于应用模糊的核。
(上)图8.应用转换前的图像(下)图9.应用了自定义核模糊后的图像自定义Filters的实现
自定义Filters的实现可以在GitHub和GitLab等网站上在线找到,Python是最受欢迎的语言之一。我并不是说Python将为您的任务提供最好的性能,但是该语言中有许多库可以用于此目的,以及可供参考的文档。
更早些时候,在2004年,Apple提供了这部分代码,可用于自定义图像效果。可以改变向量和浮点数的值以实现所需的任何效果。
图10. Apple的自定义核实现
以上代码可以作为Java、Python、c++ /C甚至Matlab实现的起点!
卷积运算已经成为一种非常有用的工具,目前有许多不同的应用。您可以改变图像,简化图像来解决图像分类内的问题,并定制效果上传到任何社交媒体网站。
gnc怎么样(国外保健品健安喜少吃)(健康时报记者李超然)4月6日,哈药股份发布年度业绩报告称,2020年归属于上市公司股东的净利润由盈转亏,亏损约10。78亿元,基本每股收益亏损0。43元。这是哈药近十年来首次出现
哪些网是官网(一加官网)手机中国新闻北京时间3月24日下午2点,一加将在上海东方体育中心举办新品发布会,为大家带来全新的一加9系列。从官宣到现在,张老板已经公布了一加9系列的诸多配置,其中,与哈苏的合作最
什么手表保值(2万左右买什么手表比较好)天梭公司成立于瑞士朱拉山脉的一个小镇利洛克,其总部仍在那里。瑞士制造是天梭心中不可磨灭的品牌。天梭标志中的与瑞士国旗相同,这是质量的象征,显示了自1853年以来该品牌可靠的质量。天
卡诗顿手表怎么样(男士手表建议买什么牌子)宾格男士全自动机械表,高硬度玻璃镜面,刀刮无痕不磨损。30米深度防水,夜视效果,镂空工艺彰显品质。卡诗顿皮带腕表,真皮表皮材质,高端大气。30米生活防水,方便实用。时尚款式,潮流百
怎样快速借到5万元钱(哪里能借到4万块钱)无担保低利息秒到账还不用查征信填好资料后当天就能贷款5万这样的网络贷款,你贷不贷?如果你看到这样的网贷广告听我一句劝,千万不要贷因为,骗子已在后面设好了陷阱这不,现成的例子就来了1
哪里可以借3000块钱(怎样才能借到2万块钱)文涓子前段时间,小胡哥(老公)的小姑夫误入网贷,一下子被套了进去,掏空所有家底不说,还有很大一个洞要填,不得已只好到处借钱。小姑夫人缘一挺好,朋友一堆,平时只要一吆喝,就会一群朋友
香皂制作(关于手工皂的制备方法)香皂制作(关于手工皂的制备方法)基础混油法原理将配方中所有的油脂按照顺序依次加入加热溶解后与碱溶液混合搅拌,直至能够在皂液表面画出明显的8字图案,灌入模具即可。这个方法操作最为简单
加入云商需要多少钱(云商是怎么赚钱的)因为一场疫情一切聚会活动开学开工都受到了很大的影响几乎所有行业都受到冲击,迎来洗牌很多人的工作和收入也随之受到影响再加上4月7日理财市场再一次刷新了人们的底线支付宝数据显示截至4月
地图三要素(地图必须具备的三要素)地图三要素(地图必须具备的三要素)三要素方向(东西南北东北西北东南西南)比例尺(图上距离实际距离)图例注记。地图构成要素1图形要素是地图根据制图的要求所表达的内容。包括注记地学基础
记叙文三要素(掌握这个三要素写作法)记叙文三要素(掌握这个三要素写作法)生活中不知大家有没有遇到过这样的人唱歌五音挺全,但歌声就是缺乏特色和韵味烹饪技能过关,各种食材也运用娴熟,可做出来的菜就是不够香,不入味类似的例
csgo刀怎么获得(完美平台csgo怎么刷刀)刀具是CSGO中的一大特色,有些玩家宁愿不买武器皮肤,也要买一把自己喜欢的刀皮肤。刀具的价格差距很大,有些太便宜的不仅样子丑,拿出来还会被认为没牌面。但如果自己没有大量的预算怎么办
怎样查老婆和别人开过房(怎么查老婆和谁开宾馆)跟老婆吵架老婆出去开了宾馆,怎么才能让前台给查下房间号?我觉得一般前台再怎么样都不会让你知道房间号的,因为这是别人的隐私,这样做的话,他们酒店就不要做生意了。怎样查老婆和别人开过房
七夕的由来(七夕节的来历简短)七夕的由来(七夕节的来历简短)每一年都有七夕节,又称乞巧节,相传它还有一个美丽传说,下面就让我给大家讲述一下吧!七夕节很久以前,在一个小山村里,有一个放牛郎,村里的人们都叫他牛郎。
七夕是什么节日(七夕节的由来和传说)七夕是什么节日(七夕节的由来和传说)我国的传统节日有很多,七夕节就是其中一个,它已经有一千多年的历史了,每一个节日都有其特殊的含义,七夕节也被我们称为中国情人节,七夕节在每年的农历
放鞭炮的来历(放爆竹的由来和传说)放鞭炮的来历(放爆竹的由来和传说)我们一般的人都认为放爆竹可以创造一种喜庆气氛,是节日的一种娱乐活动,它可以给人们带来欢愉和吉利。然而,如果我们追溯爆竹的起源,就会了解古代人燃放爆
对联的由来(春节贴春联的起源和故事)对联的由来(春节贴春联的起源和故事)春联还有另外几种好听的名字比如门对春贴对联对子,春联的工整对偶简洁精巧的文字描绘出一个时代的背景,抒发出新一年美好的愿望,是我国特有的文学形式。
屈原的故事端午节来历(端午节的由来和屈原有什么联系吗?)屈原的故事端午节来历(端午节的由来和屈原有什么联系吗?)端午节(图片源自网络,侵删)五月五,是端阳门插艾,香满堂吃粽子,撒白糖,龙舟下水喜洋洋。一曲儿谣听罢,端午又至。端午节(图片
企业的宗旨(企业风险评估报告范本)企业的宗旨(企业风险评估报告范本)今日关注栏目组走访了仁寿县明邦门业有限公司,据悉该公司于2019年03月29日注册成立,位于仁寿县文林镇春燕街4号,主要从事批发兼零售安装及维修电
什么是服务(服务宗旨八个字)餐厅店面员工服务宗旨1服务是我们经营永恒的主题。首先服务是餐厅的重要组成部分,重视服务工作是我们的一贯经营思想,经济效益和社会效益的取得都是把服务工作摆在经营活动中的重要位置的结果
企业文化建设计划(企业文化建设策划)企业文化建设计划(企业文化建设策划)如何进一步做好企业内外部宣传及企业文化建设工作,为实现企业在特殊时期转型升级提供正能量,为企业发展提供精神动力和智力支持?企业内外部宣传及企业文
企业文化是什么(企业文化内容)企业文化到底是什么?用一个比喻来说企业文化就是企业通过管理或倡导在员工心田播种一颗果种,然后与员工共同培育种子发芽成长开花结果,共同培养果树壮大繁衍,包括获得的结果和成长过程。简单
企业文化包括哪些内容(企业文化内容)很多人一谈到企业文化就感觉很模糊,不清楚它的构成是什么样的,现在HR之眼就带你解读一下企业文化构成,让你直观快速地掌握。企业文化包含三个层面的内容,分别是精神层面行为层面形象层面。