当前位置: 首页 > news >正文

一直怕大模型幻觉,发现针对性harness约束能大大消除

我让AI写长文然后人工审核发现大量胡编乱造。如果人工一个个消除实在太累了这就不是LLM自动化办公的路子了尝试了 harness (engineering)的实操路子 试用发现大模型正在把长文中我人工审核发现的幻觉问题一点点列出来原来它自己可以发现这些——虽然仍然不完整但终于明白了啥叫 Harness Engineering以及如何实施。但是对于长上下文、复杂案例想通过这种方式彻底消除hallucination这种当前transfomer算法LLM的固有特性似乎是难度极高、近乎不可能的。所以人工审核仍然是必不可少环节。正确实施的harness engineering手段看起来主要优势在于可以大大减少人工审核的工作强度。importosimportreimportjsonimportsysclassLegalVerifier:def__init__(self,evidence_path,db_path,draft_path):self.evidence_pathevidence_path self.db_pathdb_path self.draft_pathdraft_path# 加载数据withopen(evidence_path,r,encodingutf-8)asf:self.evidence_textf.read()withopen(db_path,r,encodingutf-8)asf:self.law_dbjson.load(f)self.draft_textifos.path.exists(draft_path):withopen(draft_path,r,encodingutf-8)asf:self.draft_textf.read()defverify_step_1_fact_mapping(self):第一步校验事实锚定检查。检查草稿中是否有无中生有的数字/日期errors[]# 抽取草稿中所有的金额和日期最容易产生幻觉的地方money_exprsre.findall(r(\d万[元||]?|\d分|\d元),self.draft_text)date_exprsre.findall(r(\d{4}年\d月\d日),self.draft_text)formoneyinmoney_exprs:ifmoneynotinself.evidence_text:errors.append(f【事实幻觉】文书出现了金额 {money}但该金额未在原始证据材料中记载)fordateindate_exprs:ifdatenotinself.evidence_text:errors.append(f【事实幻觉】文书出现了日期 {date}但该日期未在原始证据材料中记载)returnerrorsdefverify_step_2_mcp_law_check(self):第二步校验模拟 MCP 确定性法条与类案校验errors[]# 匹配文书中的法条格式例如《民法典》第五百六十三条laws_citedre.findall(r《([^》])》第([百十万零一二三四五六七八九\d])[条],self.draft_text)# 匹配文书中的案例号例如(2025)最高法民终123号cases_citedre.findall(r?\(\d{4}\)[^号]号?,self.draft_text)valid_lawsself.law_db.get(laws,{})valid_casesself.law_db.get(cases,[])forlaw,clauseinlaws_cited:iflawnotinvalid_lawsorclausenotinvalid_laws[law]:errors.append(f【法条幻觉】文书引用了未经校验的法条《{law}》第{clause}条请联网或检索确定库。)forcaseincases_cited:clean_casecase.strip(())ifclean_casenotinvalid_cases:errors.append(f【类案幻觉】文书引用了虚构的案例号{case}该案例不存在于受信类案库中。)returnerrorsdefverify_step_3_critic_audit(self):第三步校验反向合规审计。检查是否强制标注了证据来源标记 (见附件/见材料)errors[]linesself.draft_text.split(\n)fori,lineinenumerate(lines):if(原告inlineor被告inline)and(证明inlineor陈述inlineor约定inline):if见notinlineand附件notinlineand证据notinline:errors.append(f【中立与合规审计】第{i1}行事实陈述缺乏物理证据指针违反封闭宇宙原则内容: \{line.strip()}\)returnerrorsdefrun_all_checks(self):print( ⚖️ 开始执行 Trae 法律智能体防御性三步校验 )ifnotself.draft_text:print([AUDIT_FAILED] 错误目标文书草稿为空或不存在。)sys.exit(1)all_errors[]all_errors.extend(self.verify_step_1_fact_mapping())all_errors.extend(self.verify_step_2_mcp_law_check())all_errors.extend(self.verify_step_3_critic_audit())ifall_errors:print(\n[AUDIT_FAILED] 审计未通过发现以下幻觉或违规行为)forerrinall_errors:print(err)print(\n请 Trae Agent 根据上述错误报告重新读取源材料修改文书并再次运行此脚本。)sys.exit(1)else:print(\n[AUDIT_PASSED] 恭喜文书 100% 契合已知事实法条/案例全部真实有效未发现任何幻觉偏离。)sys.exit(0)if__name____main__:verifierLegalVerifier(evidence_pathdata/evidence.txt,db_pathdata/law_database.json,draft_pathoutput/judgment_draft.md)verifier.run_all_checks()
http://www.zskr.cn/news/1372015.html

相关文章:

  • 2026年5月惠州地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 安全漏洞防护完全指南
  • LeetCode 164:最大间距 | 桶排序与鸽巢原理
  • DeepSeek混合云架构下跨AZ流量调度困局:基于eBPF+Service Mesh的实时负载感知调度器设计(已上线支撑日均2.7亿QPS)
  • 2026年5月赣州宁都地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 2026年5月惠州惠城地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 鸿蒙PC:Qt适配OpenHarmony实战【问答盒】:选择题、即时反馈和分数统计的 QML 写法
  • 2026年5月惠州惠东地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 2026年5月惠州惠阳地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 2026年5月甘南合作地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 现在停用默认filter_config将导致合规风险!DeepSeek最新CVE-2024-7812漏洞预警及3小时紧急加固方案
  • 定位失效酿成搜救困局,无源无感定位破解矿山致命隐患
  • 山西沁源矿难血训:持卡定位不可靠,无感定位才是井下生命线
  • 2026年5月赣州石城地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 2026年5月抚顺地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • ChatGPT移动端数据同步失效?抓包分析发现:微软Azure CDN缓存策略竟导致会话丢失——附绕过方案
  • 2026年5月赣州信丰地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 2026年5月甘南夏河地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • DeepSeek模型轻量化部署:从GPU服务器到树莓派4B的72小时落地全流程
  • 2026年5月菏泽东明地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 2026年5月抚顺抚顺地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 【限时技术白皮书解禁】ChatGPT企业版SLA协议深度拆解:99.95%可用性背后的6层容灾设计
  • 2026年5月甘肃地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 2026年5月抚顺顺城地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 通过curl命令快速测试Taotoken大模型API接口是否通畅
  • 2026年5月红河个旧地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 2026年5月德阳地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 解锁硬件潜能:3步让你的电脑性能飙升50%
  • 微信M4A文件打不开怎么办?m4a转MP3只需一招,小白也能操作
  • 2026年5月红河红河地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收