核能是安全、经济、高效的清洁能源,是人类应对气候变化的重要能源选择,也是实现碳达峰、碳中和目标的重要选项。自2011年福岛核电站事故发生后,核安全再次成为人们关注的焦点。就核电设备生产企业而言,稳定可靠的供货设备是核电站安全运行的最基本保证,生产过程中留下的任何质量隐患都有可能导致严重的后果[1]。核电设备质量管理水平、风险监测和评估及预警水平的提升就显得尤为重要。在核电产品生产过程中对质量事件进行细致分析、制定有效的纠正和预防措施、降低质量风险点、避免质量事件重复发生、降低可预见的生产周期风险,需要借助有效的方法实现。本文将结合某公司核岛主设备质量事件实例,探讨根本原因分析技术(RCA-Root Cause Analysis,简称RCA)在实践中的应用。
1.什么是RCA
每一个质量事件的发生,都有其产生的原因,任何质量事件都是一连串原因产生的结果。RCA就是用来帮助人们逐步分析、查找出那些造成超出我们期望结果或事件的根本性原因的方法,并通过对事件原因采取适当的处理措施,避免类似事件重复发生或者尽可能地降低该类事件发生的机率。RCA起源于美国海军核部门,经过几十年的发展,已广泛应用于石油、化工、矿山、制造等行业,被证明是非常实用、有效的事故根本原因分析技术。1979年美国三里岛核电站事故及后续的研究审查,促使RCA在核工业及政府核武器研究领域得到广泛的传播[2]。
2. RPV顶盖密封槽加工尺寸错误质量事件
根本原因分析技术是一个系统化的问题处理过程,需要分析方法和组织管理体系两方面支撑[3]。其主要流程为:收集信息→分析评价→制定纠正措施→结果反馈→跟踪验证。文中以某公司核岛主设备反应堆压力容器(简称RPV)顶盖密封槽尺寸加工错误事件为案例进行根本原因分析。
质量事件发生后,须成立根本原因分析小组,确定根本原因分析方法,然后根据事件组织成员进行任务分工和开展相关分析。首先,需要对事件的基本情况作出判断,依据成员的专业特长进行分工,并面向各种可能的情况进行信息收集,调查开始时尽量将事件基本信息掌握的客观、详尽,以便后续调查分析实施阶段的顺利开展。为保证调查准备工作的充分性,根本原因分析小组须进行必要的事前沟通和任务分配,明确调查方向避免偏离,必要时根本原因分析小组内组织讨论对调查进行初步分析并明确事件调查的组织纪律。
2.1 事件描述
某公司生产车间立车机台长在对前一班操作者加工的RPV顶盖密封槽尺寸进行复检时发现:内、外两个圆形密封槽尺寸和位置,均向外圆直径方向偏移16mm,即密封槽位置向外圆直径方向偏移了一个槽的宽度尺寸。
按照该公司项目不符合项管理规定要求,发生质量问题后须开启外部不符合项,同时报采购方和技术责任单位审批。采购方对该不符合项的最终处置意见为:按照技术责任单位认可的工艺规程和返修方案进行返修。该质量事件对项目进度带来严重拖期,对经济成本带来较大损失,对公司声誉造成不良影响。
2.2 收集信息
质量事件发生后应立即成立根本原因分析小组收集事件现场信息和记录信息,包括事件发生前、中、后的相关情形,相关环境及其他相关信息,还原问题发生的场景。小组成员须参加过原因分析相关培训知识,须基于技术知识、经验和对原因分析过程的熟悉程度,能做出客观公正的调查判断。
针对该质量事件,成立根本原因分析小组,与操作者核实事发经过,对现场部位尺寸进行复检和拍照。收集现场机械加工工艺、检查记录、日常交接班记录、设备每日运行检查记录、设备操作规程管理细则等记录信息。
2.3分析评价
此阶段主要是对质量事件进行调查和详细描述,通过根本原因分析方法分析出事件的根本原因。
2.3.1质量事件调查
事发当日早6点左右由于立车出现故障停止作业,立车操作者开始RPV顶盖密封槽加工相关准备工作。
为方便加工密封槽各部尺寸,通常情况下操作者习惯以密封槽内圆直径为基准计算尺寸链。由于图纸标注的是密封槽外圆直径,因此在加工准备期间,操作者根据图纸计算尺寸链,即将图中密封槽外圆直径尺寸转换为内圆直径尺寸,并以此手绘密封槽各部尺寸简图作为加工依据。
主技工在绘制完密封槽简图轮廓后,由于看图不仔细,标注尺寸时错将图纸中密封槽外圆直径当成内圆直径,即将密封槽外圆尺寸标注在简图中密封槽的内圆,并根据简图计算得出加工需要的各部尺寸。绘制简图后由副技工进行确认,副技工在复算尺寸时并未根据图纸进行校核,而是根据主技工画的简图校对各部尺寸链关系。
当日早8点交接班时,立车故障还未修理好,操作者交接工作时未核对简图。下午1点立车完成修理可以正常运行,主技工准备加工密封槽。在动刀加工前依旧根据简图复核尺寸,复检尺寸正确后开始加工操作。
次日换班立车机台长对前一班操作者的加工尺寸进行复检时发现:内、外两个圆形密封槽尺寸和位置,均向外圆直径方向偏移了16mm,即密封槽位置向外圆直径方向偏移了一个槽的宽度尺寸。
质量事件发生后,根本原因分析小组第一时间组织对不符合项的处理进度和成本进行了影响评估。第一,不符合项开启后经审批、补做工艺评定、补焊、检测、加工、加工后检测等工序到处理完成,耗时约40天。第二,不符合项处理过程中,补焊所需焊材费用约2.7万元,焊接工时费用约1.2万元,补做焊接工艺评定费用约2.4万元,能源费用约0.1万元,检验检测费用约0.3万元,焊接前后立车加工台时费约1.2万元,直接经济损失将近8万元,间接经济损失如项目拖期引起的合同里程碑节点滞后扣款,需与采购方进一步协商解决。该质量事件对项目进度造成了严重拖期,对项目成本带来较大的经济损失,对公司声誉造成不良影响。
2.3.2 事件根本原因分析
根本原因指那些不仅仅是单一异常状态/事件的原因之一,也是可能发生的一系列异常状态/事件的共同原因,如果该原因被纠正,可以防止一系列异常状态/事件的发生。
根本原因分析是对事件原因查找的过程,纠正后将阻止事件重复发生并显著降低同类事件发生的概率。根本原因是最基本的原因,它解释事件因为什么而发生。并据此提出建议纠正措施,用以有效阻止事件的重复发生,并能够预防同类事件的发生。根本原因比直接原因评估分析层次更深,根本原因分析通常使用至少两种的分析工具来确定事件的原因。
根本原因分析经常用一种方法开始(如事件原因因子图、因果图)来分隔、识别事件产生的特殊要素,然后应用另一种方法(如屏障分析、原因树)来进一步分析、检查每个事件发生的原因因子。不同等级的事件其影响范围、重要程度不尽相同。为了提高人力资源的利用效率,并不是对所有事件都需要进行根本原因分析。界定事件就是根据事情的重要性,确定事件是否需要进行根本原因分析,具体界定调查分析深度可根据组织相应的管理需求而判定[4]。
2.3.2.1根本原因分析工具介绍
根本原因分析工具有原因树、鱼骨图、事件和原因因子图等。根本原因分析小组成员采用事件和原因因子图、原因树进行根本原因分析、查找原因、提出改进措施,避免类似风险事件再次发生。事件和原因因子图能够再现事件的全过程,是整个事件的流程图,适用于涉及设备运转和人员的质量事件,用于帮助分析成员理解事件发生次序及引发事件的原因,核心是事件发生的顺序及事件进度线上标识的事实。原因树适用于各种问题,是以提出“为什么出现这个问题”开始,持续对答案问“为什么”,一系列问题的提问用于判定潜在的主要原因和其他原因。目的是从事件结果一层一层逐步寻找引发事故的触发事件、直接原因、间接原因,通过假设、核实来分析事故的根本原因[5]。
根本原因分析小组实施根本原因分析任务,须确保使用正确的原因分析流程和工具开展调查分析,通过采用至少两种独立的分析方法查找事件发生的主要因素,在进行原因分析时还应充分了解组织管理情况。根据本次事件的性质和各个分析方法的适用性,确定采用事件和原因因子图法、原因树法对本次质量事件的原因进行根本原因分析。
2.3.2.2开展根本原因分析
利用事件和原因因子图、原因树工具对密封槽加工失误质量事件进行分析。先建立事件的基本主线,主事件和次级事件用实箭头连接,其次用分析工具分析得出条件和原因因子,使其位于主线的上侧或下侧。
1) 将已知的事件按照发生顺序画出初步的主线,确认初始事件、终止事件以及任何已知的主要影响(做错的事和引起终止事件的事)。
从“车间按照工艺卡片和工艺加工图纸加工RPV顶盖密封槽”初始事件开始,按照事件发生的先后关系,首先画出“主技工按照工艺卡片步骤加工基准面”、“主技工测量基准面加工后的内圆直径”事件,接着发生了第一个不当行为“主技工在加工简图中将密封槽外圆位置尺寸标注在内圆位置”事件,然后“主技工计算密封槽加工开始位置(内圆)尺寸,标注在加工简图”中,紧随其后发生了第二个不当行为“副技工按加工简图中标注尺寸核对密封槽加工开始位置(内圆)尺寸”事件,接着“主技工按照加工简图中位置尺寸加工密封槽”,然后“下一班主技工按照有效工艺加工图纸核对密封槽尺寸”,最后终止事件是 “顶盖密封槽加工位置错误”结束。
2) 在初步的事件顺序主线上加入次级事件、条件和假设条件,确定引起主要影响不当行为的条件。用原因树方法分析导致不当行为发生的条件和因子。
第一个不当行为“主技工在加工简图中将密封槽外圆位置尺寸标注在内圆位置”发生的原因因子有两个,分别是主技工未注意加工简图中工件标注位置;主技工习惯以内圆尺寸作为加工基准并手绘简图进行加工,最后导致“主技工计算密封槽加工位置错误”事件发生。
第二个不当行为“副技工按加工简图中标注尺寸核对密封槽加工开始位置(内圆)尺寸”事件。分析原因是副技工未按照工艺加工图纸核对密封槽加工开始位置尺寸,违反《核电产品加工准备及操作细则》要求。
3) 找出差异,补充调查收集新事实。查找生产车间加工工作管理文件《核电产品加工准备及操作细则》要求,核对并判断主/副技工是否按照细则要求进行工作。
4) 用其他分析手段完善调查分析结果。用原因树法分析(见图1)得知,主/副技工未执行《核电产品加工准备及操作细则》中 “加工时要严格对照图纸和工艺,并经由主副技工确认,不许凭记忆进行加工”、 “建立互相复查习惯,在定中心、尺寸、确定“0”点时必须经主副技工互审确认,确认无误后方可加工”的规定,是导致此次事件的直接原因。《核电产品加工准备及操作细则》中未规定非数控程序加工时的试切削及试切削后的测量尺寸要求;未规定加工简图的控制要求和加工尺寸链计算要求是此次事件发生的根本原因。
图1 事件和原因因子图
2.3纠正措施
纠正措施是为了消除已发现或者潜在不期望情况的原因所采取的行动[6],是在根本原因分析基础上采取的针对有效性措施以保证同类或类似问题不会重复发生的根本方法。具体纠正措施如下:
1) 生产车间立车立即停止作业,开启外部不符合项,报送采购方和技术责任单位进行审批。
2) 工艺部门根据现状制定返修方案。由于密封槽是在不锈钢堆焊层上加工而成,目前密封槽底处堆焊层剩余厚度为8.3mm,并未加工到产品母材。工艺部门制定了补焊方案,为保证后续返修质量,拟先对密封槽直边进行坡口加工,然后实施补焊,补焊检查合格后,再重新进行密封槽加工。质量事件的处理工作待返修方案得到技术责任单位认可后开展。
3) 修订、完善《核电产品加工准备及操作细则》,增加试切削以及测量尺寸要求;增加对加工简图、计算尺寸链的控制要求。同时对细则文件进行宣贯培训。
4) 生产车间各机台长梳理目前执行的加工工艺中需要操作者进行数据计算的工序,由生产车间统一形成报告,报送公司领导和工艺部门,将加工涉及的尺寸链体现在图纸或工艺中,不再由操作者现场计算。
2.4反馈
反馈是对纠正措施实施情况的响应,生产车间在实施纠正措施时要做好各项记录,并反馈实施中发现的新问题;质量部门作为监督方对提出的纠正措施有效性进行检查。生产车间按照上述纠正措施要求,逐一落实并反馈质量部门。
生产车间开启不符合项,按照认可的返修方案实施处理工作,同时对同类事件进行了排查。修订、完善《核电产品加工准备及操作细则》,增加加工时必须使用产品图纸,严禁操作者自己绘制简图;关重件及关键工序的尺寸链,在技术交底时由操作者和工艺部门共同确定需要计算哪些尺寸链,在加工时由操作者和工艺部门共同计算,相互确认无误后在产品余量处预加工并测量验证。相关人员对细则文件进行了培训和质量责任讨论活动。
2.5 跟踪验证
跟踪验证是为确定物项、工艺、服务或文件是否符合规定的要求而进行的审查、检查或其他核实并形成文件的活动。对质量事件的纠正措施行动实施情况和效果进行跟踪和验证,确保生产车间能有效实施并保持下去,跟踪验证工作不止一次,应该进行多次验证,并记录验证结果,特别应关注是否有遗留问题。此案例中,质量部门对制定的每项纠正措施进行了跟踪,验证行动措施的执行结果,评价纠正措施切实有效。
根据上述案例可以看出,根本原因分析是通过采用至少两种独立的分析方法,查找导致事件发生的主要原因的分析过程。纠正后将避免类似事件的重复发生,并显著降低同类事件的发生概率。
3.结语
根本原因分析技术是一项结构化的问题处理法,其工作着眼点在整个系统,而不仅仅是一时一地的改进[7]。采用规范、客观、合理的分析方法是对质量事件根本原因分析技术的重要基础。随着这种方法展现出的良好效果,已经在电力、能源、医药等行业得到广泛应用,对识别、发现、预防和避免质量事件的发生,改进质量管理体系运行中存在的问题有着积极的现实意义,也为企业改善产品质量、提升客户满意度、提高市场竞争力起到重要的作用。
参考文献
[1] 高立刚,王宗军,戴忠华.大亚湾核电站设备可靠性管理体系创新[J].核科学与工程,2006,26(2):156-164.
[2]黄潜.根本原因分析[M].北京:中国原子能出版社,1900,10-11.
[3]刘燕芳,赵兵,李楠等.RCA方法在某核电站设备故障分析中的应用[J].核安全,2019,(018)001:24-30.
[4]刘玉东.根本原因分析过程的组织管理探讨 [J].科技创新导报,2014,(7):177-180.
[5]倪桂才.Why-tree分析及其在事故调查中的运用[J].安全、健康和环境,2017,17(11):4-6.
[6]张勇.重视实施"纠正措施"提高质量管理体系的有效性[J].中国标准导报,2011,(7):13.
[7]盛文佳,金可可,曹艳佩等.根本原因分析法实践研究[J].中国卫生质量管理,2011,18(1):20-22.