Scaler 3 - 搜索 News

来自MSN16 小时

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年 ...

梦晨西风发自凹非寺量子位 | 公众号 QbitAI DeepSeek版o1，有消息了。还未正式发布，已在代码基准测试LiveCodeBench霸榜前三，表现与OpenAI o1的中档推理设置相当。

来自MSN21 小时

目前大模型的社会和商业价值是被低估还是高估了？面对 AI 时代 ...

作为一个AI老博士，个人愚见：大模型技术的市场热度，可能会逐步走入冷静期。为什么我会这么说呢？在开始解释之前，容我先抛出“Gartner技术成熟度曲线（Gartner Hype Cycle）”这个概念，来方便我们更清晰地理解。

知乎 on MSN21 小时

如何评价 MiniMax 于 2025 年 1 月 15 日发布的 MiniMax-01 系列模型？

现在国内友商也开始验证 RNN 的 scaling，很欣慰。我说过很多次，RNN 的 scaling 比 GPT 强。因为现在的新型 RNN 在扩大后，state 也随之扩大，这是额外的收益。例如 headsz64 的 1B 的 state 是 24x2048x64 = 3145728 维。而 headsz64 的 7B 的 state 是 ...

18 小时

合成数据，能与不能？

1、合成数据的优势涵盖可以大规模生成，可定制，可避开敏感信息，适应多模态学习和可帮助 AI Alignment 等。但这种看似美好的期许下，模型崩溃风险仍是阻止该技术广泛使用的最大障碍。

腾讯网17 小时

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源

DeepSeek版o1，有消息了。还未正式发布，已在代码基准测试LiveCodeBench霸榜前三，表现与OpenAI o1的中档推理设置相当。注意了，这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview ...

腾讯网18 小时

小米语音首席科学家 Daniel Povey：语音识别卷完了，下一个机会在哪里 ...

多模态能力的融合正在改写 AI 发展路径。语音、视觉与自然语言处理的边界日益模糊，以 Transformer 为代表的通用解决方案，正在重塑传统技术领域。

18 小时

7B模型数学推理击穿o1，直逼全美20%尖子生，四轮进化，微软华人新作 ...

论文中，来自微软亚研院的全华人团队，提出了全新算法rStar-Math，证明了SLM无需从高级模型蒸馏，就能在数学推理上，媲美甚至一举超越o1。论文链接：https://arxiv.org/pdf/2501.04519 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果