逐步上手大语言模型 - 二面题

你使用过大语言模型（LLM）吗？你或许对这个名字并不熟悉，但你一定多少听过热门的 ChatGPT、文心一言、通义千问等，你也一定无数次在B站刷到过 Kimi 的广告，这些 AI 都被称为“大语言模型”，意味着他们从大量的语言文字数据训练而成，能够胜任常见的自然语言处理任务。在极创工作室，我们就有好几个项目基于大语言模型构建而成。

在本题中，我们希望通过几个小问题来引导你对大语言模型有个初步的认识。请在充分查阅了解之后，在提交框输入你的答案。问题比较多，你可以先在自己的笔记或者编辑器里写好，再复制粘贴进来。

到底什么是大语言模型？ 用你的方式给这个东西一个定义。
什么是 prompt（提示词）？ system prompt（系统提示词）和 user prompt（用户提示词）的区别是什么？
LLM 厂商通常会以两种形式对外提供服务：助手类应用和 API。前者面向普通用户，后者则面向开发者。你认为这两种使用 LLM 的方式，最显著的区别是什么？
我们很容易知道，LLM 在训练完成之后，内部的知识便已经冻结，既然如此， 为什么基于 LLM 的 AI 助手仍然能够给出实时的信息？（提示：function calling）
市面上的 AI 助手允许你提交一个特别大的文档并且使用 LLM 查阅和分析里面的内容，但是 LLM 普遍有着“上下文窗口”（context window），这个参数代表着输入模型的文本的最长上限。既然有着这个限制，AI 助手们是如何有效处理超大文档的呢？（提示：RAG）
在 AI 助手应用中，你常会遇到智能体（agent）的概念，结合以上内容，给出你对 agent 的定义。
（选做）结合以上内容，试解释目前面向用户的 AI 助手的实质。
（选做）在以上题目中，你会注意到我们仍然局限在“用户与模型相互对话”的思维。但是实际上，模型并不会“对话”，模型只会“续写”！请查阅 Transformer 模型的基本原理和指令微调的基本概念（无需了解具体算法内容），给出你对“模型只会续写”这句话的理解。