卷积在pytorch中有两种实现,一种是torch.nn.Conv2d(),一种是torch.nn.functional.conv2d(),这两种方式本质都是执行卷积操作,对输入的要求也是一样的,首先需要输入的是一个torch.autograd.Variable()的类型,大小是(批处理、通道,H, W),其中批表示输入的一批数据的数目,频道表示输入的通道数。
一般一张彩色的图片是3,灰度图片是1,而卷积网络过程中的通道数比较大,会出现几十到几百的通道数. h和W表示输入图片的高度和宽度,比如一个批处理是32张图片,每张图片是3通道,高和宽分别是50和100,那么输入的大小就是(32,50100)。
<>强如下代码是卷积执行soble边缘检测算子的实现:强>
进口火炬 进口numpy np 从火炬导入神经网络 从公益诉讼导入图像 从火炬。autograd导入变量 进口torch.nn。功能和F def nn_conv2d (im): #用nn.Conv2d定义卷积操作 conv_op=nn。Conv2d(1, 1, 3,偏见=False) #定义sobel算子参数 sobel_kernel=np。阵列([[1,1,1],[1 8 1],[1,1,1]],dtype=癴loat32”) #将sobel算子转换为适配卷积操作的卷积核 sobel_kernel=sobel_kernel。重塑((1,1,3,3)) #给卷积操作的卷积核赋值 conv_op.weight。data=https://www.yisu.com/zixun/torch.from_numpy (sobel_kernel) #对图像进行卷积操作 edge_detect=conv_op(变量(im)) #将输出转换为图片格式 .numpy .detach edge_detect=edge_detect.squeeze () () () 返回edge_detect def functional_conv2d (im): sobel_kernel=np。阵列([[1,1,1],[1 8 1],[1,1,1]],dtype=float32) # sobel_kernel=sobel_kernel。重塑((1,1,3,3)) 重量=变量(torch.from_numpy (sobel_kernel)) edge_detect=F.conv2d(变量(im),重量) .numpy .detach edge_detect=edge_detect.squeeze () () () 返回edge_detect def main (): #读入一张图片,并转换为灰度图 我=Image.open (“。/cat.jpg”) .convert (“L”) #将图片数据转换为矩阵 我=np。数组(im, dtype=癴loat32”) #将图片矩阵转换为pytorch张量,并适配卷积输入的要求 我=torch.from_numpy (im.reshape ((1, 1, im。形状[0],im.shape [1]))) #边缘检测操作 # edge_detect=nn_conv2d (im) edge_detect=functional_conv2d (im) #将数组数据转换为形象 我=Image.fromarray (edge_detect) #图像数据转换为灰度模式 我=im.convert (L) #保存图片 im.save (“edge.jpg”、质量=95) if __name__==癬_main__”: main () >之前原图片:cat.jpg
结果图片:edge.jpg
以上这篇Pytorch实现sobel算子的卷积操作详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
sobel Pytorch实现算子的卷积操作详解