收藏本站
193
8
91
筑基丹师
五折 发表于 2024-3-15 12:39 重新创建需要预训练 如果参数 分辨率都不变,直接在之前预训练结束后的模型上正训就行 ...
使用道具 举报
545
16
184
元婴丹师
1万
406
9431
玉皇大帝
koosun 发表于 2024-3-25 12:37 dec值是指什么?是每个迭代之间的loss差值吗?
五折 发表于 2024-3-25 15:56 可以理解为loss的loss
37
1
15
练气丹师
336
20
金丹师
301
4
63
wangao1993 发表于 2024-5-14 12:43 请问一下,如果是分包训练的话,是每个包都按顺序①②③训练完以后再换下一个包,还是所有包轮着训练完步骤 ...
235
7
122
jimeili 发表于 2024-5-27 11:57 你好,为什么泛化训练第四步开启眼嘴后,loss下降的好慢好慢甚至不降,正常吗 ...
经常在论坛发帖,且发帖量较大
为论坛做出突出贡献的会员
我没有梦想,我靠签到吃遍天下~
小黑屋|ZhaTV ( 滇ICP备15003127号-4 ) |网站地图
GMT+8, 2025-5-9 13:50
Powered by Zhatv.cn
© 2022-2023