机读格式显示(MARC)

000 01107nam0 2200265 450

001 0001174581

005 20251223150400.0

010 __ |a 978-7-121-50072-5 |d CNY109.00

100 __ |a 20250506d2025 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 大模型算法 |9 da mo xing suan fa |b 专著 |e 强化学习、微调与对齐 |d Large model algorithms |e reinforcement learning，fine-tuning，and alignment |f 余昌叶著 |z eng

210 __ |a 北京 |c 电子工业出版社 |d 2025

215 __ |a 10,230页 |c 图 |d 24cm

330 __ |a 本书系统地讲解了大模型技术、训练算法（包括强化学习、RLHF、DPO、SFT与蒸馏等）、效果优化及其实践。全书以大语言模型为核心，内容广泛且深入，绝大部分内容适用于视觉语言模型和多模态大语言模型。

510 1_ |a Large model algorithms |e reinforcement learning, fine-tuning, and alignment |z eng

517 1_ |a 强化学习、微调与对齐 |9 qiang hua xue xi 、 wei tiao yu dui qi

606 0_ |a 语言模型 |x 自然语言处理

690 __ |a TP391 |v 5

701 _0 |a 余昌叶 |9 yu chang ye |4 著

801 _0 |a CN |b 江苏新华 |c 20250401

801 _2 |a CN |b Wuxilib |c 20251223

905 __ |a Wuxilib |d TP391/216