PyTorch教程自定义层

不知名网友发布于2021-11-29 10:50 / 2012人阅读

摘要：上一小节讲的是怎么自定义初始化参数。这个自建一层的作用是让每一个特征量都减去其平均值。第一个是一个线性层。第二个就是我们的自定义层。带参数的层这个租赁一层是自定义实现了一个全链接层。输出它的权重看一下，确实是能生成的权重矩阵。

上一小节讲的是怎么自定义初始化参数。
这一节是看怎么自定义层。

这样可以想一下之前接触的楼层是什么。比如nn.Linear,nn.ReLU等。他们的作用就是作为某一层的处理。他们两个的区别在于前者有参数，后者是没有参数列表的。那现在我们也来实现一些有参数和没有参数列表的层操作。

import torchimport torch.nn.functional as Ffrom torch import nn

不带参数的层

class CenteredLayer(nn.Module):    def __init__(self):        super().__init__()    def forward(self, X):        return X - X.mean()

我们也只需要定义前向传播就可以了。这个自建一层的作用是让每一个特征量都减去其平均值。

layer = CenteredLayer()X = torch.arange(5)*0.1print(layer(X))

>>tensor([-0.2000, -0.1000,  0.0000,  0.1000,  0.2000])

经过测试我们可以看到这个层是完全有效的。

那如果将其放到复杂的模型之中呢。

net = nn.Sequential(nn.Linear(8, 128), CenteredLayer())Y = torch.rand(10, 8)print(net(Y).mean().data)

>>tensor(7.8231e-09)

好吧，这个模型其实并不复杂，它只有两层。第一个是一个线性层。第二个就是我们的自定义层。

生成一组随机的测试数据Y。然后使用我们构建的网络对外进行计算，然后输出其结果的平均值。

不出意外结果应该是0。虽然这里显示的不是0。这是因为浮点数的存储精度问题，你当然可以把这个极小的数近似看作它是0。

至于结果为什么失灵，这是一个数学问题，会去列几个数字自己算一下就明白了。

带参数的层

class MyLinear(nn.Module):    def __init__(self, in_units, units):        super().__init__()        self.weight = nn.Parameter(torch.ones(in_units, units))        self.bias = nn.Parameter(torch.zeros(units,))    def forward(self, X):        linear = torch.matmul(X, self.weight.data) + self.bias.data        return F.relu(linear)

这个租赁一层是自定义实现了一个全链接层。这个层里的参数需要用到权重和偏置，在计算之后最后返回再使用ReLU激活函数。

linear = MyLinear(5, 3)print(linear.weight.data)

>>tensor([[ 1.0599,  0.3885,  1.2025],        [-1.8313,  0.2097, -1.6529],        [ 1.4119,  0.2675, -0.4148],        [ 0.2596, -0.0319,  1.9548],        [-1.2874,  1.0776,  0.5804]])

输出它的权重看一下，确实是能生成5×3的权重矩阵。

X = torch.rand(2, 5)linear(X)

>>tensor([[2.3819, 2.3819, 2.3819],        [1.8295, 1.8295, 1.8295]])

单层测试结果也没有问题。

net = nn.Sequential(MyLinear(64, 8), MyLinear(8, 1))net(torch.rand(2, 64))

>>tensor([[0.4589],        [0.0000]])

将其放在网络中结果也没有问题。

现在我来放一段对比代码，就是我们自己写的这个层和pytorch人家写的层该怎么实现同样的功能。

net1 = nn.Sequential(MyLinear(64, 8), MyLinear(8, 1))net2 = nn.Sequential(nn.Linear(64,8),                     nn.ReLU(),                     nn.Linear(8,1),                     nn.ReLU())def init(m):    if type(m)==nn.Linear:        nn.init.ones_(m.weight)        nn.init.zeros_(m.bias)net2.apply(init)Y = torch.rand(4, 64)print(net1(Y).data)print(net2(Y).data)

>>tensor([[270.5055],        [253.7892],        [238.7834],        [258.4998]])tensor([[270.5055],        [253.7892],        [238.7834],        [258.4998]])

这样乍一看是不是两个结果完全一样。

相对于pytorch自带的实现来说，这个不需要你写一个加权重的过程，也不需要你再加一个ReLU层。

这样看起来很省事，但是实际中不建议你自己实现pytorch之中已经有的功能。因为使用人家的方法计算效率更高。

云服务器 GPU云服务器自定义头像自定义网站自定义自定义按钮

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/125513.html

Keras vs PyTorch：谁是「第一」深度学习框架？

摘要：第一个深度学习框架该怎么选对于初学者而言一直是个头疼的问题。简介和是颇受数据科学家欢迎的深度学习开源框架。就训练速度而言，胜过对比总结和都是深度学习框架初学者非常棒的选择。「第一个深度学习框架该怎么选」对于初学者而言一直是个头疼的问题。本文中，来自 deepsense.ai 的研究员给出了他们在高级框架上的答案。在 Keras 与 PyTorch 的对比中，作者还给出了相同神经网络在不同框...

_DangJin 2019-04-25 18:28 评论0 收藏0
从零开始PyTorch项目：YOLO v3目标检测实现

摘要：全卷积神经网络仅使用卷积层，这就使其成为全卷积神经网络。输入图像中包含了真值对象框中心的网格会作为负责预测对象的单元格。在图像中，它是被标记为红色的单元格，其中包含了真值框的中心被标记为黄色。在过去几个月中，我一直在实验室中研究提升目标检测的方法。在这之中我获得的较大启发就是意识到：学习目标检测的较佳方法就是自己动手实现这些算法，而这正是本教程引导你去做的。在本教程中，我们将使用 P...

sourcenode 2019-06-18 11:19 评论0 收藏0
LeCun推荐：最新PyTorch图神经网络库，速度快15倍

摘要：图神经网络是近年发展起来的一个很有前景的深度学习方向，也是一种强大的图点云和流形表示学习方法。地址基于的几何深度学习扩展库是一个基于的几何深度学习扩展库，用于不规则结构输入数据，例如图点云和流形。与相比，训练模型的速度快了倍。过去十年来，深度学习方法（例如卷积神经网络和递归神经网络）在许多领域取得了前所未有的成就，例如计算机视觉和语音识别。研究者主要将深度学习方法应用于欧氏结构数据 (Eu...

pinecone 2019-04-25 18:33 评论0 收藏0
PyTorch教程参数访问

摘要：因为在训练的过程中，我们的目标就是找到让损失函数最小化的参数值。经过训练之后我们需要将这些参数拿出来做预测，或者在其他地方使用。在不同模型组件间共享参数。当通过类定义模型时，我们可以通过索引来访问模型的任意层。为什么要单独摘出来参数讲一下。因为在训练的过程中，我们的目标就是找到让损失函数最小化的参数值。经过训...

番茄西红柿 2021-11-26 11:11 评论0 收藏2637
教程 | 图像分类: Caltech 256数据集

摘要：在该数据集中，图片被分为类，每个类别的图片超过张。这样做是为了减小图片的范围，使得图片的特征更易于学习。为了在数据集上获得更高的准确率，读者可尝试取消冻结参数的设置，使得卷积层也参与训练。 Caltech 256是什么？ Caltech 256数据集是加利福尼亚理工学院收集整理的数据集，该数据集选自Google Image数据集，并手工去除了不符合其类别的图片。在该数据集中，图片被分为...

Channe 2019-06-26 18:45 评论0 收藏0