Tag: vector storage

See all tags.

检索增强生成（RAG）是一种为 LLM 提供外部知识来源的技术。它通过访问模型训练数据以外的信息，帮助提升 AI 回答的准确性。 SillyTavern 提供了一套工具，可从多种来源构建多用途知识库，并将收集到的数据用于 LLM 提示词中。

扩展

Chat Vectorization（聊天向量化）

聊天向量化会在当前聊天历史中搜索与最新消息相关的消息。它会临时将最相关的消息移动到聊天历史的开头或结尾。这一过程发生在模型针对你最后一条消息生成回复时。聊天历史开头和结尾的消息通常对模型的回复影响最大。因此，将相关消息移动到这些位置有助于模型在回复中关注相关信息。特别是，聊天向量化可以找到那些在消息历史中过于靠前、无法纳入请求上下文的相关消息。将这些消息移入上下文，可以为模型提供它本来无法获取的信息。聊天向量化是一种检索增强生成（RAG）技术。检索增强生成通过在提示词中提供额外的相关信息来提升模型生成回复的质量。