Crawl - 搜索 News

来自MSN2 天

Nvidia发布6.3兆Token大型英文数据集Nemotron-CC

Nvidia发布了一套名为Nemotron-CC的大型英文数据集，总计包含6.3兆个Token，其中1.9兆包含合成数据。Nemotron-CC的发布使得学术界与企业界有能力再进一步推进大型语言模型的训练成果，提升其准确性。

来自MSN2 天

英伟达宣布推出 Nemotron-CC：用于 LLM 预训练的万亿级英语语言数据集

品玩1月14日讯，据英伟达官方消息，英伟达近日宣布推出Nemotron-CC，这是一种包含 6.3 万亿个token的英语语言Common Crawl数据集，用于预训练高度准确的大语言模型。

3 天

英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC

IT之家 1 月 13 日消息，据英伟达官方博客，英伟达宣布推出一款名为 Nemotron-CC 的大型英文 AI 训练数据库，总计包含 6.3 万亿个 Token，其中 1.9 万亿为合成数据 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果