搜索优化
English
搜索
图片
视频
地图
资讯
购物
Copilot
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 24 小时
时间不限
过去 1 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
来自MSN
16 小时
DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年 ...
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI DeepSeek版o1,有消息了。 还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。
来自MSN
21 小时
目前大模型的社会和商业价值是被低估还是高估了?面对 AI 时代 ...
作为一个AI老博士,个人愚见:大模型技术的市场热度,可能会逐步走入冷静期。 为什么我会这么说呢?在开始解释之前,容我先抛出“Gartner技术成熟度曲线(Gartner Hype Cycle)”这个概念,来方便我们更清晰地理解。
知乎 on MSN
21 小时
如何评价 MiniMax 于 2025 年 1 月 15 日发布的 MiniMax-01 系列模型?
现在国内友商也开始验证 RNN 的 scaling,很欣慰。 我说过很多次,RNN 的 scaling 比 GPT 强。 因为现在的新型 RNN 在扩大后,state 也随之扩大,这是额外的收益。 例如 headsz64 的 1B 的 state 是 24x2048x64 = 3145728 维。 而 headsz64 的 7B 的 state 是 ...
18 小时
合成数据,能与不能?
1、合成数据的优势涵盖可以大规模生成,可定制,可避开敏感信息,适应多模态学习和可帮助 AI Alignment 等。但这种看似美好的期许下,模型崩溃风险仍是阻止该技术广泛使用的最大障碍。
腾讯网
17 小时
DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源
DeepSeek版o1,有消息了。 还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。 注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview ...
腾讯网
18 小时
小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里 ...
多模态能力的融合正在改写 AI 发展路径。语音、视觉与自然语言处理的边界日益模糊,以 Transformer 为代表的通用解决方案,正在重塑传统技术领域。
18 小时
7B模型数学推理击穿o1,直逼全美20%尖子生,四轮进化,微软华人新作 ...
论文中,来自微软亚研院的全华人团队,提出了全新算法rStar-Math,证明了SLM无需从高级模型蒸馏,就能在数学推理上,媲美甚至一举超越o1。 论文链接:https://arxiv.org/pdf/2501.04519 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈