电力作业,一步走错可能就是生死之别。
工作票漏签、接地顺序错、安全距离不够、未戴安全帽……每一条违章背后,都是血的教训。但现实是:安规条文几百条,新人记不住;现场监护人只有一双眼睛,顾不过来;夜间、偏远变电站,监管更是形同虚设。
大模型Agent(LLM Agent)的到来,让"AI安全监护人"从概念走向现实——它24小时不眨眼,熟记所有安规条文,能看懂现场画面,还能通过AR眼镜实时提醒每一个操作者。
更重要的是:它不依赖人,它只认规程。
一、技术架构:LLM Agent + AR安全监护人系统
整套系统的设计思路很清晰:用大模型Agent理解"正在发生什么",用AR把安全提示"贴"在操作者视野里。
①感知层:AR眼镜摄像头 + 现场固定摄像头 + 传感器(距离、电流、电压)
②推理层:多模态LLM Agent,实时分析画面+语音+传感器数据
③交互层:AR眼镜显示预警框、箭头指引、语音播报
核心技术来自中国电力科学研究院2025年公开的专利(CN 119625477 A):基于多模态大模型的作业现场安全管控方法。该专利的核心思路是——把"违章识别"从一个单纯的视觉检测问题,升级成一个"理解场景+理解规程+理解意图"的认知问题。
| 传统安全监控 | LLM Agent + AR安全监护人 |
|---|---|
| 事后回放,出了问题才查录像 | 实时分析,违章发生前就预警 |
| 只能识别"有没有人/有没有安全帽" | 理解"这个操作在什么上下文里,合不合规" |
| 误报率高,风吹草动都报警 | 结合规程上下文,只报真正的违章 |
| 监控室里几个人盯着几十个屏幕 | AI同时盯200个作业面,不眨眼 |
二、核心能力一:实时违章识别与预警
电力作业的违章行为,大致可以归为三类:操作违章、安全防护违章、环境违章。LLM Agent的优势在于——它不仅能"看到"违章,还能"理解"为什么违章。
操作违章识别
举例:倒闸操作必须"先断断路器,再拉负荷侧隔离开关,最后拉电源侧隔离开关"。这个顺序错了,会产生电弧伤人。
传统视觉AI只能检测"有没有人在操作开关",但不知道操作顺序对不对。LLM Agent可以:
- 通过AR眼镜摄像头追踪操作者的每一次操作
- 将操作序列与操作票(数字形式)实时比对
- 发现顺序错误 → 立即AR红色警示 + 语音阻断:"操作顺序错误!请先确认断路器已断开"
安全防护违章识别
进入高压区未戴安全帽、未穿绝缘靴、未挂接地线就开始作业……这些"低级错误"恰恰是事故发生的主要原因。
多模态LLM同时分析:
- 视觉画面:有没有戴安全帽/绝缘手套
- 空间位置:操作者是不是进入了未停电的区域
- 工作票状态:当前作业面是否已经许可、是否已经验电接地
三者一对照,漏了哪一步,立即AR标注出来。
环境违章识别
安全距离是最容易忽视的。DL/T 26860规定:10kV安全距离0.7米,110kV是1.5米,220kV是3米。人眼判断距离是很不可靠的。
LLM Agent + AR方案:AR眼镜内置深度摄像头,实时测量操作者与被操作设备的空间距离,小于安全阈值 → 视野边缘红色闪烁 + 语音:"注意!您距220kV设备2.1米,低于3米安全距离!"
三、核心能力二:上下文感知与智能引导
这是LLM Agent相比传统视觉AI最大的优势——上下文感知(Context-Awareness)。
同一个动作,在不同上下文里,性质完全不同:
- 用手触碰柜体 → 违章(带电状态)
- 用手触碰柜体 → 正常(已停电、已接地、在验电)
LLM Agent通过以下上下文信息来"理解"当前场景:
| 上下文维度 | 数据来源 | 作用 |
|---|---|---|
| 当前作业任务 | 工作票/操作票(数字化) | 知道"应该做什么" |
| 设备状态 | SCADA系统 / 智能锁具状态 | 知道"设备是否带电" |
| 人员身份与权限 | 定位工牌 / 人脸识别 | 知道"谁在什么位置" |
| 历史操作记录 | 操作日志(数字化系统) | 知道"已经做了什么,下一步该做什么" |
基于这些上下文,LLM Agent能做一件很厉害的事:预测性安全干预——在违章发生之前就提醒。
举例:操作票要求"验电→挂接地线→操作"。LLM Agent监测到操作者完成"验电"后,没有直接去拿接地线,而是走向了操作机构——此时Agent通过AR提示:"请先挂接地线,再进行后续操作",把违章扼杀在萌芽状态。
四、核心能力三:安规知识库 + RAG智能问答
现场作业人员最经常遇到的情况:"这条规程具体怎么理解?""这种情况算不算违章?"
传统做法是翻纸质安规,或者打电话问安全员——效率低,而且夜间/偏远现场根本找不到人问。
LLM Agent + RAG(检索增强生成)方案:
第一步:构建安规知识库
把《电力安全工作规程》(变电/线路/热机三部分)、各公司实施细则、事故案例库、工作票填写规范……全部向量化,存入向量数据库。中国电科院的专利里提到,这个知识库需要覆盖"法规标准、规章制度、生产制度、行业规范、事故案例、教培管理"六大类。
第二步:现场语音问答
操作者戴着AR眼镜,直接问:"我现在要操作这台开关柜,需要注意什么?"
LLM Agent自动:
- 语音识别 → 提取意图
- 检索安规知识库 → 找到相关条文
- 结合当前上下文(什么设备、什么作业类型)→ 生成针对性回答
- AR显示 + 语音播报
第三步:主动推送相关知识
更高级的用法:LLM Agent根据当前作业内容,主动推送"你可能需要注意的安规条文"。比如操作者开始进行"电缆沟内作业",Agent自动在AR视野角落显示:"有限空间作业注意事项:①进入前强制通风②检测氧气/有毒气体③专人监护④不得单独作业"
五、技术实现细节
这套系统看起来很美好,技术上怎么落地?核心难点有三个。
难点一:多模态数据融合
LLM Agent需要同时处理:
- 视频流(AR眼镜实时画面)
- 语音(操作者的问话、现场环境音)
- 结构化数据(工作票状态、设备带电状态、人员位置)
- 知识库文本(安规条文)
技术路线:用多模态大模型(支持图像+文本联合输入)作为核心推理引擎,将视频帧+传感器数据+文本提示词一起输入,输出安全判断。
难点二:实时性要求
安全预警的延迟必须控制在1秒以内,否则等Agent"想明白",事故可能已经发生了。
解决方案:
- 简单违章(未戴安全帽)→ 端侧轻量模型直接判断,<100ms响应
- 复杂场景理解(当前操作是否合规)→ 上传云端大模型,但用流式输出,先给初步判断
- 5G + MEC(多接入边缘计算):把模型部署在变电站本地,避免公网延迟
难点三:误报率控制
如果Agent整天误报,操作者会"狼来了"效应,最后无视所有预警。
降低误报的关键:结合上下文过滤。不是"看到有人没戴安全帽"就报,而是"看到有人在高压区没戴安全帽"才报。LLM的语义理解能力在这里是关键优势——它能区分"戴了安全帽但没系下巴带"和"完全没戴",采取不同级别的预警。
| 预警级别 | 触发条件 | AR反馈方式 |
|---|---|---|
| 提示(绿色) | 操作顺序正确,但即将进入关键步骤 | AR箭头指引 + 温和语音提醒 |
| 注意(黄色) | 检测到潜在安全隐患,尚未构成违章 | 视野边缘黄色高亮 + "请注意…"语音 |
| 警告(红色) | 明确违章行为,或即将进入高危区域 | 红色闪烁框 + 语音阻断 + 自动记录 |
六、落地路径与实施建议
技术再好,落不了地也是空中楼阁。基于电力行业的实际情况,落地路径建议分三步走:
第一阶段:数字化基础(1~3个月)
- 工作票/操作票数字化:把纸质票变成系统里的结构化数据,这是LLM Agent获取"应该做什么"的前提
- 视频监控联网:现有监控摄像头接入AI分析平台,先做到"能看"
- 安规知识库建设:把规程条文、事故案例整理成机器可读的格式
第二阶段:AR试点(3~6个月)
- 选1~2个变电站作为试点,配备AR眼镜
- 先上线"实时违章识别"功能,不依赖复杂上下文,容易出效果
- 积累误报数据,迭代模型
第三阶段:全网推广(6~12个月)
- LLM Agent接入SCADA、工作票系统,实现上下文感知
- AR安全监护人成为标准配置
- 建立"AI安监"考核指标:违章率、预警准确率、事故率
不要想着一步到位。先从"事后回溯"场景切入(用LLM分析已发生的违章视频,自动生成整改报告),让管理层看到价值,再推实时预警。
七、总结
电力安全管理的本质,是把"人"的不确定性,尽可能用"技术"来约束。
LLM Agent + AR安全监护人不是来"替代"安监员的,而是让每一个操作者都配备一个"随身安监员"——它不累、不疏忽、不讲情面,只认规程。
当每一条安规都"活"在操作者的AR视野里,当每一次违章都在发生前被预警,"零违章作业"就不再是口号,而是可以量化的目标。