新智元报道  编辑:LRST【新智元导读】还在为部署RAG系统的庞大体积和高性能门槛困扰吗?港大黄超教授团队最新推出的轻量级MiniRAG框架很好地解决了这一问题。通过优化架构设计,MiniRAG使得1.5B级别的小模型也能高效完成RAG任务,为端侧 ...
对高效且轻量级的RAG系统需求日益增长,但RAG框架中部署小型语言模型(SLMs)在语义理解和文本处理上存在局限,阻碍了广泛应用。 与 LLMs 相比,SLMs 在索引和回答阶段都显示出显著的局限性。左侧:SLMs生成的描述质量明显低于LLMs。右侧 ...