品玩1月14日讯,据英伟达官方消息,英伟达近日宣布推出Nemotron-CC,这是一种包含 6.3 万亿个token的 英语语言Common Crawl数据集 ,用于预训练高度准确的大语言模型 。