投递软件

Meta Llama 3.1 开源大语言模型 Llama 3.1
荐

神经网络/人工智能 LLM（大语言模型）

授权协议: 未知

开发语言: Python 查看源码»

操作系统: 跨平台

收录时间: 2024-07-24

投递者: 局

收藏3

Llama 3.1 是 Meta 发布的新一代开源大模型，提供 8B、70B 及 405B 参数版本。

Llama 3 使用了超过 1.6 万个 H100 GPU、以及超过 15T token 的公开数据进行训练。

架构方面，该模型选择标准的仅解码器 transformer 模型架构进行调整，而不是混合专家模型，以最大化训练稳定性。

此外，Llama 3 采用了迭代的后训练程序，每一轮使用监督微调和直接偏好优化。

Meta 表示，Llama 3.1 系列在推理能力和多语言支持方面进行了改善，其上下文长度被提升至 128K，而模型参数也被提高到了 4050 亿规模，是近年来规模最大的大语言模型之一。该模型在通用常识、可引导性、数学、工具使用和多语言翻译等广泛任务中足以对标 GPT-4、Claude 3.5 Sonnet 等领先闭源模型。

加载中

点击加入讨论🔥(5)

Meta 今天发布了 Llama 3.2 系列开源模型，其中包括小型和中型视觉 LLMs（11B 和 90B），以及适合边缘和移动设备的小型纯文本模型（1B 和 3B），包括预训练和指令调整版本。 LLaMA 3.2 支持同...

菠萝的海子

09/26 10:29

继 Meta 昨天发布最强开源大模型 Llama 3.1 后，法国 AI 初创公司 Mistral AI 也加入了竞争，今天发布了全新的旗舰开源模型 Mistral Large 2。该模型拥有 1230 亿个参数，可在单个 H100 节点...

07/25 10:50

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。 # 2024.7.24 今日要闻 Meta 发布新一代开源大模型 Llama 3.1 今天凌晨，Meta 正式发布新一代开源大模型 Llama 3.1 系列，提供 8B、7...

07/24 18:40

Meta 在今天凌晨正式发布新一代开源大模型 Llama 3.1 系列。与此同时，Meta 创始人兼首席执行官马克·扎克伯格也发布了一封名为“Open Source AI Is the Path Forward”的公开信，描绘了 AI...

白开水不加糖

07/24 11:08

今天凌晨，Meta 正式发布新一代开源大模型 Llama 3.1 系列，提供 8B、70B 及 405B 参数版本。 Llama 3 使用了超过 1.6 万个 H100 GPU、以及超过 15T token 的公开数据进行训练。架构方面，该...

07/24 10:15

没有更多内容

加载失败，请刷新页面

没有更多内容

{{o.author.name}}

{{o.pubDate | formatDate}}

{{parseInt(o.viewCount) | bigNumberTransform}}

{{parseInt(o.replyCount) | bigNumberTransform}}

没有更多内容

暂无内容

OSCHINA

登录后可查看更多优质内容

使用微信快捷登录

©OSCHINA(OSChina.NET)

工信部

开源软件推进联盟

指定官方社区

社区规范

深圳市奥思网络科技有限公司版权所有

粤ICP备12009483号

顶部