搜索优化
English
全部
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
14 小时
近8年后,谷歌Transformer继任者「Titans」来了,上下文记忆瓶颈被打破
在谈到推出 Titans 的初衷时,论文一作 Ali Behrouz 表示,「注意力机制一直是大多数 LLM 进展的重要组成部分,不过它无法扩展到长上下文。因此,Titans ...
来自MSN
4 天
像人一样学会记忆,谷歌新架构Titans打破Transformer上下文限制
现有的架构,如Hopfield网络、LSTM和Transformer会带来了二次方的时间和内存复杂度,限制了模型处理长序列的能力。人类的记忆不是单一的过程,而是由短期记忆、工作记忆和长期记忆等不同系统组成,每个系统都有不同的功能和神经结构。基于此,G ...
腾讯网
4 天
谷歌推出Transformer架构的继任者Titans:训练代码也会公开
谷歌发布Transformer架构的继任者Titans: 提出了一种新的神经长期记忆模块,它可以学习记忆历史背景,并帮助注意力在利用过去长期信息的同时关注当前背景。这种神经记忆具有快速并行训练的优势,同时还能保持快速推理 ...
6 天
谷歌新架构一战成名,打破Transformer记忆瓶颈,姚班钟沛林新作
为此,Titans 团队打算将过去信息编码到神经网络的参数中,训练了一个 在线元模型 (Online meta-model),该模型学习如何在测试时记住/忘记特定数据。 在另一项需要对分布在极长文档中的事实做推理的任务中,Titans 表现超过了 ...
来自MSN
6 天
谷歌新架构一战成名,打破Transformer记忆瓶颈,姚班校友钟沛林新作
梦晨 发自 凹非寺量子位 | 公众号 QbitAI 想挑战 Transformer 的新架构有很多,来自谷歌的“正统”继承者 Titan 架构更受关注。 英伟达把测试时间计算(Test-time Computing)称为大模型的第三个 Scaling ...
13 天
英伟达 DLSS 4发布:号称帧率提升8倍,首发支持超75款游戏和应用
与此同时,英伟达还推出了新一代 DLSS 4 技术,黄仁勋表示 RTX 5090 性能可以达到 RTX 4090 的 2 倍之高。据称,DLSS 4 首发当天已经支持超过 75 款游戏和应用程序。《黑神话:悟空》 将于今年晚些时候升级支持 DLSS 多帧生成。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈