搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
7 小时
OpenAI o1正确率仅 50%,清华、智谱推出大模型逻辑推理新基准
在一项案例研究中,LLM 在黑白棋(Reversi)游戏中的表现几乎“惨不忍睹”,除了 OpenAI o1,其他模型的得分几乎为(接近于)0,这同样表明 LLM 在处理复杂规则和进行多步推理方面依然困难。
22 小时
最强 OpenAI o1 逻辑推理正确率仅 50%,清华、智谱推出「大模型逻辑 ...
在一项案例研究中, LLM 在黑白棋(Reversi)游戏中的表现几乎“惨不忍睹”,除了 OpenAI o1,其他模型的得分几乎为(接近于)0 ,这同样表明 LLM 在处理复杂规则和进行多步推理方面依然困难。
9 天
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「 ...
用Meta的开源Llama 3.1-70B,团队微调出了Reflection 70B。它的基准测试结果惊人,可以和Claude 3.5 Sonnet以及GPT-4这类顶级闭源模型一较高下,直接登顶「世界开源新王」!
16 天
“不发模型、不上新功能”的OpenAI DevDay,开发者们还能期待啥
头图由豆包生成提示词:开发者互动,API调用,AI大模型,赛博朋克,高清细节作者|周一笑邮箱|
[email protected]
去年,OpenAI在旧金山举办了一场引发业界轰动的开发者大会(DevDay ...
16 天
跨平台高手必修课–Flutter动态化解决方案实战(完结)
构建一个跨平台的动态化解决方案,特别是在使用Flutter框架的情况下,可以极大地提高开发效率和灵活性。Flutter作为一个跨平台的UI工具包,允许开发者使用一套代码库构建iOS、Android、Web、Windows、macOS和Linux的应用 ...
20 天
11款实用工具,是个网工,都已经低调安装了!
优秀程序员之所以优秀的原因并不一定是他写代码的速度比所有人都快,但他解决事情的效率一定是比很多人都要高的,提升工作效率的方法并不需要我们十八般武艺样样精通,有时候使用好的工具就能帮助我们大大提升办事效率。
1 天
小滑块上个斜面,难倒多少高中生?现在,AI让它动起来了
机器之心报道编辑:佳琪、Panda原来物理还能这么学。学习物理,不同的人自然有不同的经历。一些人觉得物理课简单直观,但另一些人却认为它抽象又反直觉,根本就无法理解。为此,许多教师和教学研究者探索了各种方法(像是课堂演示、动画演示等),力图让物理课变得 ...
9 天
「世界开源新王」Reflection 70B 跌落神坛?重测跑分暴跌实锤造假
「世界开源新王」Reflection 70B,才坐上王座没几天就被打假,跌落神坛了!甚至有人质疑,它莫不是套壳的 Sonnet 3.5?发布者 Matt Shumer 和 Sahil Chaudhary 经过一番挣扎,已经光速「滑跪」,po 出的复盘长文也是亮点满满。
腾讯网
3 天
OpenAI今天Open了一下:开源多智能体框架Swarm
毫无疑问,多智能体肯定是 OpenAI 未来重要的研究方向之一,前些天 OpenAI 著名研究科学家 Noam Brown 还在 X 上为 OpenAI 正在组建的一个新的多智能体研究团队招募机器学习工程师。
20 天
CA/B论坛发起投票,弃用基于WHOIS的域名验证方法
近期,安全研究人员发现,过时的WHOIS服务器存在严重安全漏洞,可能被用于伪造TLS/SSL证书,威胁互联网安全。这一发现促使CA/B论坛发起投票,考虑弃用基于WHOIS登记邮箱的域名控制验证(DCV)方法,以提高互联网的整体安全性。
香港財華網(財華社)
29 天
谷歌云推出全新区块链RPC服务,现已支持以太坊主网及测试网
PANews 9月18日消息,据Google ...
4 天
谷歌正为安卓设备研发全新终端 App,可直接运行 Linux 命令
谷歌最近提交到 AOSP 的一组补丁引入了一个 新的开发者选项“Linux 终端” ,其带有“ferrochrome-dev-option”的标签,位于设置 > 系统 > 开发者选项中。用户可以经由这一选项,启动 AVF 终端应用来运行虚拟机中的 Linux 终端应用。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈