首先我们放出tf2.0关于tf.keras.layers.Conv2D()函数的官方文档,然后逐一对每个参数的含义和用法进行解释:
从这个函数的定义能看出来,filters ,kernel_size过滤器个数和卷积核尺寸,这是两个位置参数,没有默认值,必须给。
后面的那个多参数,都是关键字参数(有等于号的),都是有默认值的,可以不写,下面来逐一分析每个参数的含义:
这是第一个参数,位置是固定的,含义是过滤器个数,或者叫卷积核个数,这个与卷积后的输出通道数一样,比如下面filters为5的时候,卷积输出的通道数(最后一位)就是5
filters卷积核个数为8的时候,输出的通道数就是8
卷积核尺寸,一般为3×3,或者5×5,此处用2个整数的元组或列表表示,比如(3,3),[5,5],如果height, width长宽一样,直接用一个整数表示就行,比如3或者5,卷积后的,卷积后的height,width的计算公式如下:滑动步长为strides,卷积核的尺寸为S,输入的尺寸为P,padding = ‘valid“
height =width = (P-S)/strides +1,
此处 输入形状为20×20,卷积核为3×3,滑动步长为1,所以输出为(20-3)/1 +1 =18
此处,输入为20×20,卷积核为5×5,滑动步长为2×2,所以输出的形状为,(20-5)/2 +1向下取整,等于8,
默认横向和纵向滑动均为1,这个与上面的 卷积核size配合使用,用来计算输出的形状,
height =width = (P-S)/strides +1,
默认是边缘不填充
此处只有两个取值,另一个取值为 “same”,表示边缘用0填充,如果padding =“same”,则输出的形状为 height =width = P/strides ,向上取整,如下图,
输入的数据格式
此处只有两个取值 ,“channels_first”,和“channels_last”,即输入的数据格式中,通道数是第一个还是最后一个,默认为“channels_last”,即默认输入数据的格式中,通道数为最后一个。
当data_format = "channels_first"的时候,输入和输出的shape格式为
(batch_size, channels, height, width)即(图片数量,通道数,长,宽)正如下图所示:
这个含义是卷积核的膨胀系数,
此处的作用是将卷积核进行形状膨胀,新的位置用0填充,新卷积核的尺寸和膨胀系数的计算公式如下:
原卷积核的尺寸为S ,膨胀系数为k,则膨胀后的卷积核尺寸为
size = k×(S-1)+1
此处的含义是激活函数,
相当于经过卷积输出后,在经过一次激活函数,常见的激活函数有relu,softmax,selu,等
偏置项
此处取值为布尔值,0或者1,0表示没有增加bias,1表示有。
- :卷积核初始化,
- :偏差值初始化,
- :卷积核正则化
- :偏差正则化
- :这个地方也是一个正则化
- :卷积核约束
- :偏差约束。
这几个参数不常用,
input_shape
这个是指输入的形状,一般是4D的,(batch size, height, width, channels),也可以不定义,那就是默认输入的形状。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
到此这篇conv2d函数(conv2d函数干什么的)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/haskellbc/58429.html