机读格式显示(MARC)
- 000 01107nam0 2200265 450
- 010 __ |a 978-7-121-50072-5 |d CNY109.00
- 100 __ |a 20250506d2025 em y0chiy50 ea
- 200 1_ |a 大模型算法 |9 da mo xing suan fa |b 专著 |e 强化学习、微调与对齐 |d Large model algorithms |e reinforcement learning,fine-tuning,and alignment |f 余昌叶著 |z eng
- 210 __ |a 北京 |c 电子工业出版社 |d 2025
- 215 __ |a 10,230页 |c 图 |d 24cm
- 330 __ |a 本书系统地讲解了大模型技术、训练算法(包括强化学习、RLHF、DPO、SFT与蒸馏等)、效果优化及其实践。全书以大语言模型为核心,内容广泛且深入,绝大部分内容适用于视觉语言模型和多模态大语言模型。
- 510 1_ |a Large model algorithms |e reinforcement learning, fine-tuning, and alignment |z eng
- 517 1_ |a 强化学习、微调与对齐 |9 qiang hua xue xi 、 wei tiao yu dui qi
- 701 _0 |a 余昌叶 |9 yu chang ye |4 著
- 801 _0 |a CN |b 江苏新华 |c 20250401
- 801 _2 |a CN |b Wuxilib |c 20251223
- 905 __ |a Wuxilib |d TP391/216