某装备控制显示器故障分析
摘要: 采用故障树分析法,对一起飞机控制显示器启动先蓝屏后黑屏故障进行分析,对导致故障的各主机模块、接口模块、电源模块进行分析,定位故障原因,并制定解决措施,保证装备的可靠性。

1 故障现象
某装备控制显示器在检查时出现了故障,故障现象表现为控制显示器启动后蓝屏,显示“无信号输入”,大约30秒后黑屏,没有显示程序主画面。对控制显示器多次加电,故障复现。
2 故障定位
2.1 工作原理介绍
控制显示器由主机模块、接口模块、电源模块三部分组成,各模块功能如下:
1)主机模块
主机模块是控制显示器的核心,该模块既负责与接口模块的数据交互,在此基础上完成与控制显示器交联的各系统的工作模式及状态控制管理、数据加载及通信等;又与键盘面板之间通过开关量采集方式处理键盘输入;还要承担显示功能,显示各交联系统工作方式和状态,提供方便的人机交互接口。
2) 接口模块
接口模块主要用于处理控制显示器与其它交联设备之间的数据通信,与其它交联设备的通信方式包括RS422总线、HB6096总线、开关量信号等。接口模块与主机模块之间采用PCIE总线进行数据交互。
3) 电源模块
接收机上28V电源输入,经滤波处理后,提供稳定可靠的28V、5V直流电源输出。
控制显示器的工作原理为主机模块加电启动后,与接口模块通过PCIE总线建立通信,通信成功后,主机模块软件通过接口模块与外部交联设备通信,并将软件画面推到液晶屏模块上。电源模块接收外部28V电源输入,为控制显示器内部各SRU提供包括5V和28V的二次电源供电。
通过工作原理分析,由于控制显示器启动后液晶屏先进入蓝屏,并显示“无信号输入”。可以判断电源模块与液晶屏模块并未出现故障,否则液晶屏将直接进入黑屏状态。因此进一步将故障锁定到主机模块或接口模块。
通过控制显示器调试插头,将主机模块与接口模块的调试串口引出到调试计算机上,控制显示器加电后,发现接口模块调试串口输出正常,表明接口模块正常启动。而主机模块调试串口无输出,表明主机模块未正常启动。下面以主机模块无法启动为顶事件建立故障树。
2.2 建立故障树
根据故障现象建立故障树如下:

8.PNG

图1主机模块无法启动问题的故障树

2.3 故障树分析
1)故障分支1“BIOS问题”分析
主机模块2015年研制首套样机,参加了各项试验,未发生过类似的BIOS软件故障,目前已生产交付多台;
如果是BIOS软件设计缺陷,故障发生时机应表现出一定的随机性,而且每台设备都会出现,不会只在某一台设备中反映出来。因此,可以排除故障分支1“BIOS问题”。
2)故障分支2“操作系统和应用软件问题”分析
主机模块2015年研制首套样机,参加了各项试验,未发生过类似的软件故障,目前已生产交付多台;且目前已经完成软件评测,软件评测中发现的问题没有会导致类似故障的问题。
如果是软件设计缺陷,故障发生时机应表现出一定的随机性,而且每台设备都会出现,不会只在某一台设备中反映出来。因此,可以排除故障分支2“操作系统和应用软件问题”。
3)故障分支3“电路设计故障”分析
主机模块目前已生产多批次,已随整机完成了鉴定试验,功能联试和试验中都没有发现类似的故障,如果是硬件设计缺陷,故障发生时机应表现出一定的随机性,而且每台设备都会出现,不会只在某一台设备中反映出来。因此,可以排除故障分支3“电路设计故障”。
4)故障分支4“器件故障”
排除了软件和硬件设计故障后,对故障的主机模块器件进行排查,首先测量板卡上各路二次电源是否正常。对主机模块单板用5V加电,使用万用表对主机模块各二次电源进行测量,测量结果如表1所示:

表1 故障主机模块各二次电源值9.PNG

从表中可见,S0_2.5V,S0_1.8V,S0_1.4V,S0_1.0V等4路二次电源实际值不正常,针对这四路二次电源进行进一步分析。
主机模块电源功能框图如下图2所示:10.PNG

图2主机模块电源功能框图

从图中可见,S0_2.5V,S0_1.8V,S0_1.4V,S0_1.0V等4路实际值不正常的二次电源均是由电源芯片产生的。故而推断电源芯片出现故障。该电源芯片出现故障后,将导致主机模块的处理器i.MX6无法正常工作,程序无法正常运行。
将电源芯片拆下后,发现芯片最上面一排的中间几个PIN的焊盘上焊锡很少,且个别锡球有氧化的现象,导致焊接到板卡后与芯片的PCB板连接不牢固出现虚焊,这几个焊盘包括了电源芯片启动信号(3.3VPG)管脚,如这几个焊盘和芯片接触不良,就会出现电源芯片没有收到启动信号,导致工作不正常,全部二次电源输出均为电源芯片内部LDO电压(即0.696V左右)的现象,从而导致主机模块无法启动。
将该电源芯片重新植球焊接在原模块上后,电源芯片可以找到,模块功能测试也都正常,可排除了电源芯片问题。

3 机理分析
该模块的加工工艺包括制版工艺和焊接工艺,将电源芯片重新植球焊接后模块功能正常,可排除PCB制板工艺的问题。
针对焊接工艺问题,我们对焊接厂的焊接温度曲线进行复查,焊接温度曲线如图3所示,与之前批次焊接温度一致,因此可以排除焊接工艺的问题。
图3 焊接温度曲线
该模块是在2018年交付的板卡,由于当年生产量不大,电源芯片是从分销商那里采购的,不是原包封装,存在个别芯片氧化的可能性电源芯片BGA焊球氧化导致焊接时出现裂纹,在初期因裂纹不大,并未影响芯片的工作状态,但随着主机模块做完了交付试验和环筛试验,并不断的使用后,在经历了高温、低温和振动冲击后,导致虚焊裂纹慢慢扩展,最终导致电源芯片焊球与芯片或电路板接触不良,从而导致电源芯片工作不正常,主机模块无法正常启动。
根据以上分析,主机模块无法启动问题是因电源芯片焊球氧化,导致焊接后焊球与芯片的PCB板之间出现虚焊。
4 解决措施
对故障设备在常温下加电10次,均出现了先蓝屏后黑屏的故障现象;更换了新的电源芯片焊接到主机模块上。并依据控制显示器交付试验大纲,重新做了振动试验、高低温试验以及连续工作试验,控制显示器工作正常,故障未复现,证明更改措施有效。
后续所有器件从代理商或者整盘采购,保证器件焊接前没有氧化现象;生产焊接前,拆封密封包装的器件时,检查焊盘有无氧化现象,有氧化器件不允许焊接;所有板卡焊接完成后采用X光检测的方式检查所有贴片器件的焊接质量,保证100%无遗漏。