近年来,多模态大语言模型(MLLMs)的发展迅猛,但随之而来的安全性问题也引起了广泛关注。上海AI Lab近日推出了一款全新的安全基准工具——Multimodal Visual Leakless Safety Benchmark(VLSBench),旨在解决当前多模态模型在安全测试中面临的诸多挑战。VLSBench的核心目标是避免视觉信息泄漏(Visual Safety Information ...
随着人工智能技术的迅猛发展,AI文本生成作为其中一个重要应用,越来越受到业界的关注。近日,UL ...
相关论文以《在自动大语言模型基准测试中作弊:零模型获得高胜率》(Cheating automatic LLM benchmarks:Null models achieve high win rates)为题发表在预印本 ...
IT之家 12 月 12 日消息,开放式机器学习工程联盟 MLCommons 美国加州当地时间昨日宣布推出适用于衡量消费类 PC 的 AI 性能的 MLPerf Client 基准测试的 0.5 版本,这也是 该测试的首个公开版本 。
IT之家 12 月 6 日消息,UL Benchmarks 于 12 月 4 日发布博文,宣布为旗下 3DMark 基准工具推出全新的 DirectStorage 功能测试,用于测试固态硬盘在游戏加载等场景下的性能,帮助玩家了解微软的 ...