聊天向量化会搜索当前聊天历史中与您最近消息相关的消息。 它会暂时将最相关的消息移动到聊天历史的开头或结尾。 这种移动发生在模型生成对您最后一条消息的回复时。 聊天历史开头和结尾的消息往往对模型的回复影响最大。 因此,将相关消息移动到这些位置可以帮助模型在回复中关注相关信息。 特别是,聊天向量化可以找到在消息历史中太靠后而无法放入请求上下文的相关消息。 将这些消息移入上下文为模型提供了原本无法获得的信息。 聊天向量化是一种检索增强生成(RAG)。检索增强生成通过在提示中提供额外的相关信息, 提高模型生成响应的质量。