() 3月1日消息:Meta最近宣布推出了一款新的大型语言模型LLaMA-13B,该模型的参数规模虽然比OpenAI的GPT- 3 模型小,但表现更为出色,而且只需要单张显卡即可运行,这使得采用普通用户的硬件也有可能提供与ChatGPT相似的AI聊天机器人性能。
LLaMA语言模型的规模从 70 亿到 650 亿个参数,而OpenAI GPT- 3 模型有 1750 亿个参数。Meta使用了Common Crawl、Wikipedia和C4 等公共数据集来训练该模型,并有可能公开其源代码和权重。Meta表示LLaMA是其基础模型,将是该公司未来更先进模型的基础。
LLaMA-13B模型在BoolQ、PIQA、SIQA、HellaSwag、WinoGrande、ARC和OpenBookQA等标准测试中的表现超过了GPT-3。而GPT- 3 等后续模型需要数据中心规模的计算能力进行处理,而LLaMA-13B只需要单张显卡即可运行,为在消费者硬件上实现类似ChatGPT的性能打开了大门。
这一消息引起了广泛关注。现在,Nebuly AI就推出了基于人类反馈强化学习的LLaMA AI聊天机器人的首个开源实现ChatLLaMA(https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama)。
精彩评论