这项技术名为“通用Transformer内存(Universal Transformer Memory)”,利用特殊的神经网络来优化LLM,保留重要的资讯,并从上下文中移除冗余的细节。