聚焦资讯
服务于区块链创业者

专用于法律的两个开源大模型,最高1410亿参数

chatGPT账号

法国国家高等教育计算中心、巴黎萨克雷大学的研究人员联合开源了专用于法律领域的大模型——SaulLM。

SaulLM一共有540亿、1410亿两种参数,以及基础模型和指令微调两种版本。SaulLM的最大特色是使用了5400亿token的专业法律数据进行了预训练,包括美国、欧洲、澳大利亚等地的法律文本,输出内容的准确率高于很多同类模型。

开源地址:https://huggingface.co/Equall/SaulLM-54-Base

指令微调:https://huggingface.co/Equall/SaulLM-141B-Instruct

SaulLM-54B和SaulLM-141B是基于Mixtral系列模型开发而成,通过引入专家混合(MoE)机制,显著提升了模型处理大量数据的能力。

MoE架构的核心思想是将大型模型分解为多个小型专家网络,这些专家可以根据输入数据的不同特点被动态地激活。这种方法不仅提高了模型的计算效率,还增强了模型处理复杂法律文本的能力。

SaulLM-54B由32层组成,模型维度为4096,隐藏维度为14336;而SaulLM-141B则由56层构成,模型维度增至6144,隐藏维度达到16384。使得两个模型最多能支持长达32768和65536个token的上下文长度。

研究人员使用了分段策略来训练SaulLM模型,包括持续预训练、专业法律指令遵循协议的实施,以及模型输出与人类偏好的对齐。

第一步使用了超过5400亿token的专业法律语料库对模型进行预训练,盖了来自不同法律体系的广泛文本,包括美国、欧洲、澳大利亚等地的法律文献。

在预训练过程中,研究人员采用了AdamW优化器,并设置了特定的学习速率和梯度累积策略,以优化模型的学习效率和稳定性。此外,为了应对模型在训练过程中可能出现的灾难性遗忘等问题,研究团队还引入了重放策略,重新引入早期训练分布中的数据,以增强模型的记忆能力。

法律领域对大模型输出内容的准确性和专业性要求极高。为了提升模型在法律任务上的表现,研究人员使用了专业法律指令遵循协议,训练模型理解和执行法律场景中的指令。

在这一阶段,模型接受了包括法律分析、案件总结、法规解读等多种法律相关任务的训练。通过这种方式,模型学会了如何根据法律专家的需求,提供准确和相关的信息。

为了使模型的输出更加符合法律专业人士的期望和偏好,使用了模型输出与人类偏好的对齐方法。主要使用了合成数据和人类反馈来调整模型的输出。合成数据的生成是基于模型的自我对话,模拟法律专家在分析案件时可能提出的问题和答案。通过这种方式,模型能够学习到法律推理的深层逻辑和结构。

同时,研究人员还引入了人类反馈机制,通过评估模型输出的准确性、相关性和逻辑一致性,进一步优化模型的性能。

研究人员在专业法律基准测试平台LegalBench – Instruct 和多基准平台MMLU上对模型进行了综合评估。

实验结果显示, SaulLM – 54B优于 Mixtral – 54B,SaulLM -141B也优于Mixtral – 141B,比GPT-4、Llama-3也更加出色。此外,继续预训练显著增强了模型在法律领域的性能,在 IFT和 DPO阶段都有大约 7% 的显著提升。

免责声明

发文时比特币价格:$68249

免责声明:

本文不代表行至网立场,且不构成投资建议,请谨慎对待。用户由此造成的损失由用户自行承担,与行至网没有任何关系;

行至网不对网站所发布内容的准确性,真实性等任何方面做任何形式的承诺和保障;

网站内所有涉及到的区块链(衍生)项目,行至网对项目的真实性,准确性等任何方面均不做任何形式的承诺和保障;

网站内所有涉及到的区块链(衍生)项目,行至网不对其构成任何投资建议,用户由此造成的损失由用户自行承担,与行至网没有任何关系;

行至区块链研究院声明:行至区块链研究院内容由行至网发布,部分来源于互联网和行业分析师投稿收录,内容为行至区块链研究院加盟专职分析师独立观点,不代表行至网立场。

chatGPT账号
赞(0) 打赏
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权,未经允许不得转载。
文章名称:《专用于法律的两个开源大模型,最高1410亿参数》
文章链接:https://www.xingzhi.io/indbchain/virtualreal/35423.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!

 

服务于区块链创业者

业务范围商务合作

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起创建更加美好的区块链世界!

支付宝扫一扫打赏

微信扫一扫打赏

登录后才能复制或下载网站内容