基准 benchmarking - Search News

10d

近年来，多模态大语言模型（MLLMs）的发展迅猛，但随之而来的安全性问题也引起了广泛关注。上海AI Lab近日推出了一款全新的安全基准工具——Multimodal Visual Leakless Safety Benchmark（VLSBench），旨在解决当前多模态模型在安全测试中面临的诸多挑战。VLSBench的核心目标是避免视觉信息泄漏（Visual Safety Information ...

15d

UL Solutions 推出 ProcyonAI：AI 文本生成基准测试引领行业新标准

随着人工智能技术的迅猛发展，AI文本生成作为其中一个重要应用，越来越受到业界的关注。近日，UL ...

腾讯网21d

对AI的可靠性提出质疑，科学家揭示零模型在大模型基准测试取得高胜率

相关论文以《在自动大语言模型基准测试中作弊：零模型获得高胜率》（Cheating automatic LLM benchmarks：Null models achieve high win rates）为题发表在预印本 ...

IT之家 on MSN14d

MLCommons 发布 PC AI 基准测试 MLPerf Client 首个公开版本 0.5

IT之家 12 月 12 日消息，开放式机器学习工程联盟 MLCommons 美国加州当地时间昨日宣布推出适用于衡量消费类 PC 的 AI 性能的 MLPerf Client 基准测试的 0.5 版本，这也是该测试的首个公开版本。

20don MSN

3DMark 推出新测试：更直观展示SSD开启DirectStorage后性能提升

IT之家 12 月 6 日消息，UL Benchmarks 于 12 月 4 日发布博文，宣布为旗下 3DMark 基准工具推出全新的 DirectStorage 功能测试，用于测试固态硬盘在游戏加载等场景下的性能，帮助玩家了解微软的 ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results