LegalOne: A Family of Foundation Models for Reliable Legal Reasoning

Haitao Li1,2, Yifan Chen1,2, Shuo Miao1,2, Qian Dong1,2, Jia Chen1,2, Yiran Hu3,†,
Junjie Chen1,2, Minghao Qin4,†, Qingyao Ai1,2,∗, Yiqun Liu1,2, Cheng Luo2,5,
Quan Zhou2,5, Ya Zhang2,5, Jikun Hu2,5

1Department of Computer Science, Tsinghua University    2Quancheng Laboratory
3University of Waterloo, Canada    4China University of Political Science and Law
5MegaTech.AI Inc

Corresponding author    Work done during internship at Tsinghua University.

📢 News

[2026.01.23] 🎉 LegalOne-1.7B, LegalOne-4B, and LegalOne-8B are now open-sourced! 🚀

Introduction

LegalOne Parameters

While Large Language Models (LLMs) have demonstrated impressive general capabilities, their direct application in the legal domain is often hindered by a lack of precise domain knowledge and complexity of performing rigorous multi-step judicial reasoning. To address this gap, we present LegalOne, a family of foundational models specifically tailored for the Chinese legal domain. LegalOne is developed through a comprehensive three-phase pipeline designed to master legal reasoning. Experimental results demonstrate that LegalOne achieves state-of-the-art performance across a wide range of legal tasks, surpassing general-purpose LLMs with vastly larger parameter counts through enhanced knowledge density and efficiency.

Pipeline

LegalOne is developed through a comprehensive three-phase pipeline designed to master legal reasoning. First, during mid-training phase, we propose Plasticity-Adjusted Sampling (PAS) to address the challenge of domain adaptation. This perplexity-based scheduler strikes a balance between the acquisition of new knowledge and the retention of original capabilities, effectively establishing a robust legal foundation. Second, during supervised fine-tuning, we employ Legal Agentic CoT Distillation (LEAD) to distill explicit reasoning from raw legal texts. Unlike naive distillation, LEAD utilizes an agentic workflow to convert complex judicial processes into structured reasoning trajectories, thereby enforcing factual grounding and logical rigor. Finally, we implement a Curriculum Reinforcement Learning (RL) strategy. Through a progressive reinforcement process spanning memorization, understanding, and reasoning, LegalOne evolves from simple pattern matching to autonomous and reliable legal reasoning.

LegalOne Pipeline Overview

Results

LegalOne-1.7B significantly outperforms the general-purpose Qwen3-1.7B and delivers performance comparable to the much larger GPT-4o.
LegalOne-8B delivers highly competitive performance, surpassing significantly larger models such as DeepSeek-v3.2 and Qwen3-Max in multiple dimensions.
Average Performance Chart
JEC-QA Chart
LexEval Chart

Click on any chart to enlarge

Case Study

Legal Analysis and Judgment Prediction of Cases Involving the Crime of Operating a Gambling Establishment
LegalOne-8B
📝 Answer
基于以上分析,结合广西壮族自治区量刑细则和司法实践,可能作出如下判决: 1. 邱寿强 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑四年 理由: 虽涉案金额大(赌资超六百万元,获利30万元),属"情节严重" 但具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 2. 程锦玲 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑四年 理由: 与邱寿强共同犯罪,但作用相对较小(从犯) 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 3. 邱豪 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑三年 理由: 涉案金额和获利均低于邱寿强、程锦玲 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 4. 林声宇 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑三年 理由: 涉案金额和获利均低于邱豪 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 5. 吴泽天 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑三年 理由: 涉案金额和获利与林声宇相近 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 6. 李文炳 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑二年 理由: 涉案金额和获利均低于其他被告人 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 7. 财产处理 邱寿强、程锦玲的违法所得30万元予以没收,上缴国库 邱豪的违法所得97637元予以没收,上缴国库 林声宇的违法所得9024元予以没收,上缴国库 吴泽天的违法所得11394元予以没收,上缴国库 李文炳的违法所得22843元予以没收,上缴国库 作案工具(手机、银行卡等)予以没收
🔍 Structure
Comprehensive fact analysis
Identify key evidentiary details
Systematically applies the Three-Tier Theory of Crime
Analyze Constitutive Requirements, Illegality, and Culpability
Establish criminal liability
Sentencing analysis
Cite relevant legal statutes
一、案件事实梳理 本案涉及六名被告人(邱寿强、程锦玲、邱豪、林声宇、吴泽天、李文炳)被指控犯开设赌场罪。经审理查明: 邱寿强、程锦玲:自2017年6月起,邱寿强成为"CC彩球网"赌博网站总代理,与妻子程锦玲共同经营,邱寿强负责发展下级代理和会员,程锦玲负责财务管理(上、下分、提现及分红)。二人涉案赌资超过六百万元,非法获利30万元。 邱豪:自2017年12月起,作为邱寿强、程锦玲的下线,担任代理(账号H-GV66),发展下线人员,涉案赌资210万余元,非法获利97637元。 林声宇:自2018年3月起,作为邱寿强、程锦玲的下线,担任代理(账号I-GT28),发展下线人员,涉案赌资110万元以上,非法获利9024元。 吴泽天:自2018年3月起,作为邱寿强、程锦玲的下线,担任代理(账号I-GT29),发展下线人员,涉案赌资110万元以上,非法获利11394元。 李文炳:自2017年12月起,作为邱寿强、程锦玲的下线,担任代理(账号H-GV96),发展下线人员,涉案赌资30万元以上,非法获利22843元。 各被告人均已退赃,且认罪态度较好。 二、法律分析 (一)构成要件该当性分析 根据三阶层理论,首先需判断行为是否符合刑法规定的构成要件。 1. 客观构成要件 《刑法》第三百零三条第二款规定:"开设赌场的,处五年以下有期徒刑、拘役或者管制,并处罚金;情节严重的,处五年以上十年以下有期徒刑,并处罚金。" 《最高人民法院、最高人民检察院、公安部关于办理网络赌博犯罪案件适用法律若干问题的意见》第一条明确规定:"利用互联网、移动通讯终端等传输赌博视频、数据,组织赌博活动,具有下列情形之一的,属于刑法第三百零三条第二款规定的'开设赌场'行为:(一)建立赌博网站并接受投注的;(二)建立赌博网站并提供给他人组织赌博的;(三)为赌博网站担任代理并接受投注的;(四)参与赌博网站利润分成的。" 本案中: 邱寿强、程锦玲作为赌博网站总代理,发展下级代理和会员,接受投注并获取返利 邱豪、林声宇、吴泽天、李文炳作为下级代理,发展下线并接受投注 各被告人均通过微信、银行卡等方式进行赌资结算 各被告人的行为均符合"为赌博网站担任代理并接受投注"的客观构成要件。 2. 主观构成要件 开设赌场罪要求行为人具有故意且以营利为目的。 本案中: 邱寿强供述"其参与赌博、抽水,还参与分红,其有一个上家老板,他给其做一个总代理,之后其就发展新赌客(会员)或二层代理,二层代理就发展新的会员" 其他被告人均供述通过发展下线获取返利和分红 各被告人均有明确的非法获利(30万元至22843元不等) 各被告人均明知自己在为赌博网站担任代理并接受投注,且以营利为目的,符合主观构成要件。 (二)违法性分析 开设赌场行为严重扰乱社会秩序,损害社会公序良俗,具有明显的社会危害性。本案中,各被告人的行为均无正当防卫、紧急避险等违法阻却事由,因此具有违法性。 (三)有责性分析 有责性是指行为人对其违法行为应当承担刑事责任。 本案中: 各被告人均已达刑事责任年龄(邱寿强1989年出生,程锦玲1988年出生,邱豪1983年出生,林声宇1989年出生,吴泽天1980年出生,李文炳1985年出生) 各被告人均具有完全刑事责任能力 各被告人均无精神疾病等影响责任能力的情形 因此,各被告人均具有有责性。 (四)"情节严重"的认定 根据《最高人民法院、最高人民检察院、公安部关于办理网络赌博犯罪案件适用法律若干问题的意见》第一条,利用互联网组织赌博活动,具有下列情形之一的,应当认定为"情节严重": 抽头渔利数额累计达到3万元以上的 赌资数额累计达到30万元以上的 参赌人数累计达到120人以上的 建立赌博网站后通过提供给他人组织赌博,违法所得数额在3万元以上的 参与赌博网站利润分成,违法所得数额在3万元以上的 为赌博网站招募下级代理,由下级代理接受投注的 本案中,各被告人的涉案金额均远超"情节严重"的标准: 邱寿强、程锦玲:涉案赌资超过六百万元,非法获利30万元 邱豪:涉案赌资210万余元,非法获利97637元 林声宇、吴泽天:涉案赌资110万元以上 李文炳:涉案赌资30万元以上 因此,各被告人的行为均构成开设赌场罪且"情节严重"。 三、量刑分析 (一)量刑起点确定 根据《最高人民法院、最高人民检察院关于常见犯罪的量刑指导意见(二)(试行)》: "犯罪情节一般的,在二年以下有期徒刑、拘役幅度内确定量刑起点" "情节严重的,在五年至六年有期徒刑幅度内确定量刑起点" 本案中,各被告人均属"情节严重",量刑起点应在五年至六年有期徒刑。 (二)基准刑确定 在量刑起点基础上,根据赌资数额、违法所得等增加刑罚量确定基准刑。但本案中各被告人均有多个从轻、减轻处罚情节: 坦白情节:各被告人均如实供述罪行,根据《刑法》第六十七条第三款,可减少基准刑20%以下 退赃情节:各被告人均已退赃,根据量刑指导意见,可减少基准刑30%以下 初犯情节:除邱寿强外,其他被告人均系初犯,可酌情从轻 作用大小:程锦玲在共同犯罪中作用相对较小,可认定为从犯,减少基准刑20%-50% 认罪态度:各被告人均认罪态度较好,可酌情从轻 (三)缓刑适用分析 根据《刑法》第七十二条,对于被判处拘役、三年以下有期徒刑的犯罪分子,同时符合以下条件的,可以宣告缓刑: 犯罪情节较轻 有悔罪表现 没有再犯罪的危险 宣告缓刑对所居住社区没有重大不良影响 本案中: 各被告人犯罪后均如实供述、积极退赃、认罪态度好 除邱寿强外均为初犯 无证据表明有再犯罪危险 均居住在昭平县,宣告缓刑对社区无重大不良影响 因此,各被告人均符合缓刑适用条件。 四、判决预测 基于以上分析,结合广西壮族自治区量刑细则和司法实践,可能作出如下判决: 1. 邱寿强 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑四年 理由: 虽涉案金额大(赌资超六百万元,获利30万元),属"情节严重" 但具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 2. 程锦玲 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑四年 理由: 与邱寿强共同犯罪,但作用相对较小(从犯) 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 3. 邱豪 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑三年 理由: 涉案金额和获利均低于邱寿强、程锦玲 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 4. 林声宇 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑三年 理由: 涉案金额和获利均低于邱豪 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 5. 吴泽天 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑三年 理由: 涉案金额和获利与林声宇相近 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 6. 李文炳 罪名:开设赌场罪 刑期:有期徒刑三年,缓刑二年 理由: 涉案金额和获利均低于其他被告人 具有坦白、退赃、初犯等从轻情节 认罪态度好,悔罪表现明显 符合缓刑适用条件 7. 财产处理 邱寿强、程锦玲的违法所得30万元予以没收,上缴国库 邱豪的违法所得97637元予以没收,上缴国库 林声宇的违法所得9024元予以没收,上缴国库 吴泽天的违法所得11394元予以没收,上缴国库 李文炳的违法所得22843元予以没收,上缴国库 作案工具(手机、银行卡等)予以没收 五、结论 本案中,六名被告人的行为均构成开设赌场罪且"情节严重",但鉴于各被告人均具有坦白、退赃、认罪态度好等从轻、减轻处罚情节,且符合缓刑适用条件,极有可能判处各被告人有期徒刑三年,适用缓刑,并处罚金,同时追缴违法所得。 这一判决既体现了对网络赌博犯罪的严厉打击,又贯彻了宽严相济的刑事政策,符合罪责刑相适应原则,能够实现法律效果与社会效果的统一。

Citation

@misc{li2026legalonefamilyfoundationmodels,
      title={LegalOne: A Family of Foundation Models for Reliable Legal Reasoning}, 
      author={Haitao Li and Yifan Chen and Shuo Miao and Qian Dong and Jia Chen and Yiran Hu and Junjie Chen and Minghao Qin and Qingyao Ai and Yiqun Liu and Cheng Luo and Quan Zhou and Ya Zhang and Jikun Hu},
      year={2026},
      eprint={2602.00642},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2602.00642}, 
}