从零构建大模型 (1) · 理解大语言模型
1.理解大语言模型
#LLM
#大模型
>_ 最新科技动态,技术趋势与生活思考
「那些杀不死你的,终将使你更强大。」
-- 尼采
用数据帮你做出更明智的饮食选择
每周二更新 · 食物热量速查 · 运动消耗计算
从零构建大语言模型,理解 GPT 底层原理
7 章 + 3 附录 · 注意力机制 · 预训练 · LoRA 微调
每日 AI 领域重要动态,自动抓取整理
每天早上 9:10 更新 · 订阅不错过任何重要新闻
轻松有趣的网页小游戏,每周更新
每周五更新 · 纯前端 · 即开即玩
OpenRouter 热度 + Artificial Analysis 智能指数
实时价格 · 上下文长度 · 厂商分布 · 能力排名
匿名留言,分享你的想法和故事
完全匿名 · 无需注册 · 畅所欲言
1.理解大语言模型
每日 AI 领域重要动态
2.处理文本数据
4.从零开始实现一个用于文本生成的 GPT 模型
6.用于分类任务的微调
5.在无标记数据集上进行预训练
7.指令遵循微调
附录A. PyTorch简介
附录D. 给训练循环添加高级技巧
每日一句励志名言,给你前行的力量
附录E. 使用LoRA的参数高效微调
拆解日常饮食中的隐形盐——从酱油到外卖,用数据告诉你,你每天都在不知不觉中超标吃盐
每日 AI 领域重要动态
每日一句励志名言,给你前行的力量