SillyTavern中文文档
  • GitHub
  • Discord
  • Reddit
Powered by

Tag: vector storage

See all tags.

使用指南 • 角色
数据库(RAG)

检索增强生成(RAG)是一种为 LLM 提供外部知识来源的技术。它通过访问模型训练数据之外的信息来帮助提高 AI 回答的准确性。 SillyTavern 提供了一套工具,用于从多种来源构建多用途知识库,以及在 LLM 提示词中使用收集的数据。

扩展
Chat Vectorization (聊天向量化)

聊天向量化会搜索当前聊天历史中与您最近消息相关的消息。 它会暂时将最相关的消息移动到聊天历史的开头或结尾。 这种移动发生在模型生成对您最后一条消息的回复时。 聊天历史开头和结尾的消息往往对模型的回复影响最大。 因此,将相关消息移动到这些位置可以帮助模型在回复中关注相关信息。 特别是,聊天向量化可以找到在消息历史中太靠后而无法放入请求上下文的相关消息。 将这些消息移入上下文为模型提供了原本无法获得的信息。 聊天向量化是一种检索增强生成(RAG)。检索增强生成通过在提示中提供额外的相关信息, 提高模型生成响应的质量。

© Copyright 2026. All rights reserved.