已训练出的大模型学习新知识的方式有两种:微调学习与上下文学习。
对于微调学习,可以参考大模型微调的文章。
由于微调消耗算力且是静态更新大模型知识的方式,而打造一个学习助手,需要大模型快速高效地学习各种新知识。 主要是我想低成本白嫖啊,亲
任务(推荐从零搭建,如果使用已有框架也可以,但是难度会降为 2 星或 1 星):
- 了解什么是大模型的上下文学习能力?
- 了解什么是 RAG?为什么 RAG 可以实现?实现流程是啥?
- 使用任意编程语言,打造一个简单的 RAG 模块,能够根据语义在数据库检索内容
- 基于打造的 RAG 模块,打造一个学习助手 Agent,能够给它传入大量的教程文本,为你解读各种教程相关的问题
提示:
- 推荐使用 Python
- 向量数据库推荐 MongoDB、PostgreSQL with pgvector
- Text Embedding Model 推荐阿里云的 text-embedding-v4 或者 Jina 的 jina-embeddings-v4
- 如果最后实现效果一般的话,尝试分析哪些地方影响到效果了,溯因分析