BlogJava - 所有随笔区

« 博客园 | C++博客 | 博问

所有随笔区最新随笔(rss)

搜索注册仅列出标题新闻风格

大模型训练的几个阶段

大模型开发出来后, 一般要经过以下几个阶段的训练:

预训练(Pre-Trained)
单纯提供文本: {"text":"..."}

训练模型由第一个文字开始, 预测后面的文字, 直到结束.

这种模型只会做完成文本的任务

监督微调(Supervised Fine Turning)
为了使模型能完成根据指令完成回答, 而不是随机生成回答

提供的文本: {"instruction":"...", "output":"..."}

高效参数微调(Parameter Efficient Fine Turning)
只调整部分参数, 具体实现方法有LoRA

参考:

https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb

2025-03-18 13:14 作者: paulwong 【评论:0】【阅读:84】

python资源

python

https://www.w3schools.com/python/

https://www.runoob.com/python/python-basic-syntax.html

廖雪峰的官方网站

https://liaoxuefeng.com/books/python/index.html

2025-03-16 20:54 作者: paulwong 【评论:0】【阅读:52】

共2页: 上一页 1 2 更多

技术改变世界

宣传语

发表原创精品文章,
共建精品Java社区!

网站分类

其他分类

Google站内搜索

24小时内最热随笔

统计信息

博客 -
18878
随笔 -
121795
文章 -
40021
评论 -
167715

Blog客户端API

MetaWeblog

博客排行榜[前100人]

1. 顺其自然EVO (rss)
(3936,03-18 22:10,3768216)
2. 疯狂 (rss)
(481,01-29 09:53,2846389)
3. 阿蜜果 (rss)
(297,07-27 08:19,2300592)
4. imxylz (rss)
(111,06-16 10:44,2211517)
5. dennis (rss)
(559,12-10 17:39,2087060)
6. 银河使者 (rss)
(312,11-03 18:03,1976336)
7. sanmao (rss)
(838,10-18 14:52,1698043)
8. nieyong (rss)
(152,09-13 10:12,1691889)
9. guanminglin@gmail.com (rss)
(90,02-18 23:58,1680578)
10. BlueDavy (rss)
(294,02-27 23:10,1612575)
11. zhyiwww (rss)
(536,04-08 11:18,1563472)
12. 々上善若水々 (rss)
(39,12-27 21:17,1539180)
13. rogerfan (rss)
(447,01-20 17:50,1477530)
14. fancydeepin (rss)
(126,06-27 21:26,1463053)
15. SIMONE (rss)
(495,11-01 16:23,1400127)
16. paulwong (rss)
(1202,09-10 13:25,1392247)
17. 诗特林 (rss)
(310,12-27 21:18,1384347)
18. 雪山飞鹄 (rss)
(215,04-02 15:23,1343574)
19. Alpha (rss)
(179,02-23 16:58,1333409)
20. 鱼上游 (rss)
(61,08-26 20:07,1269194)
21. Max (rss)
(34,06-22 20:11,1222964)
22. keith (rss)
(42,07-03 09:13,1189825)
23. xcp (rss)
(241,12-22 21:08,1168679)
24. 江南白衣 (rss)
(88,05-21 02:41,1134462)
25. 云自无心水自闲 (rss)
(288,08-09 19:52,1131402)
26. 大田斗 (rss)
(32,09-10 11:56,1105889)
27. 小马歌 (rss)
(955,11-26 16:19,1066569)
28. seal (rss)
(618,01-16 00:20,1040128)
29. 芦苇 (rss)
(15,02-18 19:36,1037847)
30. abin (rss)
(500,01-04 00:01,1021088)
31. 云云 (rss)
(110,05-03 17:18,1001328)
32. dreamstone (rss)
(239,02-24 09:55,988947)
33. 千里冰封 (rss)
(151,10-19 23:50,968890)
34. HUIKK (rss)
(671,09-01 20:19,967427)
35. 我心依旧 (rss)
(70,10-18 09:59,963356)
36. 坏男孩 (rss)
(560,12-30 15:38,936199)
37. 紫蝶∏飛揚↗ (rss)
(9,04-21 13:24,932422)
38. -274°C (rss)
(242,05-03 00:09,917983)
39. 小寻 (rss)
(303,08-30 16:47,904682)
40. DLevin (rss)
(146,02-27 22:15,898066)
41. david.turing (rss)
(163,08-24 08:12,875919)
42. 周锐 (rss)
(431,11-06 21:09,868917)
43. Jack.Wang (rss)
(195,11-20 23:47,861475)
44. Jasper (rss)
(51,06-20 00:49,860337)
45. benchensz (rss)
(86,05-22 17:30,860169)
46. xzc (rss)
(314,11-28 11:52,850927)
47. Ke (rss)
(6,11-15 10:02,830882)
48. TiGERTiAN (rss)
(348,12-28 05:55,815371)
49. sky ao (rss)
(187,02-17 15:49,801842)
50. 山风小子 (rss)
(221,03-09 22:41,797672)
51. 龚椿深 (rss)
(90,03-05 19:25,796540)
52. laogao (rss)
(508,05-19 22:09,785666)
53. 菠萝大象 (rss)
(67,09-30 11:33,782847)
54. 千山鸟飞绝 (rss)
(50,09-16 14:09,777032)
55. 不断前进的小乌龟 (rss)
(10,03-09 00:51,775129)
56. 墙头草 (rss)
(241,08-12 10:53,771366)
57. XiaoLi (rss)
(231,02-09 23:06,768246)
58. Robin's Programming World (rss)
(193,08-05 09:45,757453)
59. 礼物 (rss)
(143,08-06 14:36,748962)
60. 009 (rss)
(326,08-01 19:37,738282)
61. emu (rss)
(171,10-02 06:44,725826)
62. Eric_jiang (rss)
(611,08-31 09:27,699207)
63. 林光炎 (rss)
(104,05-09 17:28,698823)
64. 小菜毛毛 (rss)
(164,05-11 22:33,691157)
65. Werther (rss)
(199,11-11 15:34,687118)
66. x.matthew (rss)
(156,04-08 19:59,680488)
67. 草原上的骆驼 (rss)
(238,11-27 04:45,674657)
68. crazycy (rss)
(279,11-24 00:48,674085)
69. 找个美女做老婆 (rss)
(172,11-05 17:49,667607)
70. Flyingis (rss)
(156,07-30 14:13,662887)
71. 京山游侠 (rss)
(50,11-19 17:00,659525)
72. Rosen (rss)
(98,07-12 21:20,636504)
73. Paul Lin (rss)
(262,09-15 16:51,631246)
74. oksonic (rss)
(103,12-30 04:28,628554)
75. Rabbit (rss)
(120,05-07 22:22,614528)
76. landon (rss)
(114,03-16 15:09,600578)
77. 无声 (rss)
(200,03-02 08:20,599815)
78. leekiang (rss)
(536,09-28 09:16,599790)
79. 陈刚 (rss)
(71,01-02 15:46,593269)
80. ivaneeo (rss)
(669,07-13 15:24,589528)
81. 草儿 (rss)
(190,04-15 10:36,584276)
82. 有猫相伴的日子 (rss)
(230,09-09 17:56,579875)
83. 都市淘沙者 (rss)
(65,03-22 13:32,566954)
84. gembin (rss)
(387,03-13 12:26,561982)
85. 流浪汗 (rss)
(153,09-08 11:59,561768)
86. poetguo (rss)
(129,10-01 09:49,556812)
87. 我爱佳娃 (rss)
(124,03-30 15:45,554633)
88. Alex (rss)
(220,08-09 14:42,546491)
89. liaojiyong (rss)
(500,12-02 12:00,533384)
90. 交口称赞 (rss)
(119,08-08 15:21,529062)
91. sitinspring (rss)
(204,02-19 11:45,527943)
92. weidagang2046 (rss)
(8,12-26 17:28,524728)
93. sun_java_studio@yahoo.com.cn(电玩) (rss)
(34,02-23 16:24,524424)
94. John Jiang (rss)
(131,10-13 17:52,524307)
95. 黑灵 (rss)
(204,06-23 21:44,523503)
96. The Matrix (rss)
(75,01-28 10:59,522928)
97. ronghao (rss)
(193,08-22 16:52,519113)
98. wxb_nudt (rss)
(53,05-20 20:03,512905)
99. kxbin (rss)
(10,04-16 16:24,509170)
100. 艾波 (rss)
(93,04-19 09:53,504126)
更多博客

所有随笔区最新随笔(rss)

大模型训练的几个阶段

python资源

python

https://www.w3schools.com/python/

https://www.runoob.com/python/python-basic-syntax.html

廖雪峰的官方网站

https://liaoxuefeng.com/books/python/index.html

2025-03-16 20:54 作者: paulwong 【评论:0】【阅读:52】

共2页: 上一页 1 2 更多

技术改变世界

宣传语

网站分类

其他分类

Google站内搜索

24小时内最热随笔

统计信息

订阅

Blog客户端API

推荐客户端

博客排行榜[前100人]

所有随笔区最新随笔(rss)

大模型训练的几个阶段

python资源

python https://www.w3schools.com/python/ https://www.runoob.com/python/python-basic-syntax.html 廖雪峰的官方网站 https://liaoxuefeng.com/books/python/index.html 2025-03-16 20:54 作者: paulwong【评论:0】【阅读:52】

共2页: 上一页 1 2 更多

技 术 改 变 世 界

宣传语

网站分类

其他分类

Google站内搜索

24小时内最热随笔

统计信息

订阅

Blog客户端API

推荐客户端

博客排行榜[前100人]

python

https://www.w3schools.com/python/

https://www.runoob.com/python/python-basic-syntax.html

廖雪峰的官方网站

https://liaoxuefeng.com/books/python/index.html

2025-03-16 20:54 作者: paulwong 【评论:0】【阅读:52】

技术改变世界