如何创建多隐藏层网络以及计算神经网络的参数量
创始人
2025-05-28 23:20:24

对于全连接层来说,其单层的参数量为 (输入维度 + 1) * 该层神经元个数。这是因为全连接层的每个神经元都需要一个 权重向量 和一个 偏置值 来计算其输出,权重向量 的长度就是 输入维度偏置值 是一个标量。

若当前 networkhidden_layershidden layer,其中每层 hidden_layerhidden_dim 维,则有:

Total_params=(input_dim+1)∗hidden_dim+(hidden_dim+1)∗hidden_dim∗(hidden_layers−1)+(hidden_dim+1)∗output_dimTotal\_params = (input\_dim + 1) * hidden\_dim + (hidden\_dim + 1) * hidden\_dim * (hidden\_layers - 1) + (hidden\_dim + 1) * output\_dimTotal_params=(input_dim+1)∗hidden_dim+(hidden_dim+1)∗hidden_dim∗(hidden_layers−1)+(hidden_dim+1)∗output_dim

对于一个神经网络来说,其总参数量就是所有全连接层的参数量之和。例如,如果我们有一个神经网络,它有一个输入层(输入维度为 4),一个隐藏层(隐藏层神经元个数为 5),和一个输出层(输出维度为 3),那么它的总参数量就是:

输入层到隐藏层的全连接层:(4+1)∗5=25(4 + 1) * 5 = 25(4+1)∗5=25
隐藏层到输出层的全连接层:(5+1)∗3=18(5 + 1) * 3 = 18(5+1)∗3=18
总参数量:25+18=4325 + 18 = 4325+18=43

图源自《动手学深度学习》

那么该如何创建多隐藏层的网络以及打印参数量呢?
这里举个例子说明:

import torch.nn as nninput_dim = 8
hidden_dim = 16
hidden_layers = 2
output_dim = 8# 为了简洁,舍去了 Relu()
network = nn.Sequential(nn.Linear(input_dim, hidden_dim),# 在函数的调用中,一个 * 表示将一个序列展开为单独的位置参数,这一行代码是列表推导,最终的表现是重复生成多个 hidden layer*[nn.Linear(hidden_dim, hidden_dim) for _ in range(hidden_layers-1)], nn.Linear(hidden_dim, output_dim))
# 打印总参数量
total_params = ((input_dim+1) * hidden_dim +(hidden_dim + 1) * hidden_dim * (hidden_layers - 1) +(hidden_dim + 1) * output_dim
)
print(f'Total params: {total_params}')
>> Total params: 552

当然,实际上你可以直接使用 pytorch 中的函数进行打印

total_params = sum(param.numel() for param in network.parameters())
print(f'Total params: {total_params}')
>> Total params: 552

进一步的,如果你想查看各层分别的参数量,你可以使用以下代码

for name, param in network.named_parameters():print(name, param.numel())
0.weight 128
0.bias 16
1.weight 256
1.bias 16
2.weight 128
2.bias 8

其中 weight 对应的是权重,bias是偏差。

参考链接:
图源自《动手学深度学习》
HW02 的 Sample code

相关内容

热门资讯

15.2亿人次跨区域流动!“多... 青岛栈桥。 陈炳衡/摄本报(chinatimes.net.cn)记者张蓓 陈炳衡 北京报道2026年...
美伊释放矛盾信号,亚太股市冲高... 特朗普宣布美国将引导中立国船只通过霍尔木兹海峡,并称美伊谈判取得"非常积极"进展,这一消息在周一亚洲...
“我在地坛”彭明榜:53岁辞职... 这是一份在实体书店持续承压的十年里少见的“逆生长”履历。文|《中国企业家》见习记者 陈浩记者 马吉英...
十年来第一次!苹果讨论“涨价”... 十年来,苹果首次在季报文件中将"涨价"列为应对成本压力的选项。摩根士丹利据此判断,今年9月发布的iP...
魔幻的韩国股市,父母给婴儿开户... “全球资本正从美国的‘金融资产’向非美地区的‘实物资产’进行大规模再平衡。”文 /巴九灵在韩国,一种...