Naive RAG(Retrieval-Augmented Generation)是最基础的一种架构,用于结合检索和生成来处理复杂的任务,比如问答或内容生成。 负责从知识库(如文档集合或数据库)中找到与输入查询相关的上下文。 通常基于向量检索技术,使用嵌入模型(如 Sentence Transformers 或 ...
比如说,长文本导致的模型幻觉问题;中间丢失现象等多种性能问题;而且,在RAG技术中,长文本也是一个亟待解决的问题。 而现在业内普遍的处理方式就是文本分块,把一段长文本根据某种方式拆分成多种小的文本块;这样就有助于大模型进行处理,也能间接 ...