大语言模型(LLM)学习路径和资料汇总
前路未止 LLM AI 学习 30

0x00 学习路径

本文分为三个章节,各章节的学习目标如下。

  • 入门篇:
    • 了解大语言模型的基础知识和常见术语。
    • 学会使用编程语言访问 OpenAI API 等常见大语言模型接口。
    • 面向非专业背景的大模型普及知识。
  • 应用篇:
    • 可以在本地环境搭建开源模型的推理环境。
    • 大语言模型应用开发框架(如 LangChain、Dify等)。
    • Prompt 工程、 RAG、Agent 等大模型应用开发范式。
  • 深入篇:
    • 大模型技术原理、训练微调、数据工程、推理优化等。
    • 大模型应用范式(RAG、Agent等)前沿进展。

读者可以根据自己需要选择对应的章节,如对大语言模型的原理不感兴趣,可只关注入门篇和应用篇。 考虑到阅读背景,本文尽可能提供中文资料或有中文翻译的资料。

标记为【必看】的是我认为只要你对这个主题感兴趣,必须要看的资料。

0x10 入门篇

在入门之前,请申请 OpenAI API,并具备良好的国际互联网访问条件。
推荐注册 https://openrouter.ai/ 可一站式访问大量闭源和开源模型。

0x20 应用篇

0x30 深入篇

0x31 大模型技术基础方向

0x32 大模型技术原理方向

体系化课程:

  • CS25: 通识类的整体介绍(深度了解机器学习基础,可上CS229机器学习以及CS230深度学习。)
  • CS224N: NLP+深度神经网络+Transformer
  • CS336: 大语言模型从头实现(难度较高,别的课程的大作业自己写个Transformer是这节课的练习一),非常深入。

0x33 大模型训练微调方向

0x34 大模型数据工程方向

0x35 大模型推理优化方向

0x36 大模型应用方向

大语言模型(LLM)学习路径和资料汇总
https://www.ilay.top/archives/iadp3diynbmnccgl
作者
iLay
发布于
更新于
许可