由于企业发展的需要,2014年在一家从未接触可靠性的企业,负责可靠性研究及应用推 广;通过学习、交流、研讨,逐步摸索出一些可靠性应用的经验,结合过程中自身的困惑和收获,分享下如何在中小企业推广应用可靠性的几个建议,抛砖引玉,希望对那些准备开展可靠性的企业,尤其是中小型企业有所帮助。
一、可靠性落地的重要性
可靠性,是质量控制的一个分支。当企业把可靠性提升到一个专门技术来看待,是产品不断追求完美的一个重要阶段。我国可靠性研究起步较晚,可靠性分析技术、可靠性设备相对落后。在质量管理体系方面,中国似乎已赶上先进国家水平,但是实际应用时较多企业尤其是中小企业还是存在形式主义严重,以取证为目标,实际应用与流程“两张皮”现象屡见不鲜。随着行业竞争的提升,未来企业之间产品实力的竞争,将会是可靠性水平的竞争。所以,中小企业在成长过程中,可靠性的推广应用成功与否会越来越关键。
二、关于可靠性架构形式与运作模式
可靠性工程师,表面上是一种工种的设定,实际上体现了企业对可靠性的重视程度。
传统的产品质量控制,也在开展一定程度的可靠性工作。比如开发部门的 DQE(开发测试工程师)、品质部的 QA、QE,都承担一部分可靠性工作。但归根结底,这些职能还是以产品的功能,性能符合为主,由于认知及设备的制约,故障分析相对表面。在这种情况下,虽然开展了一定程度的控制质量及整改措施,但是仍然会出现不良现象,很难杜绝,其根本原因就在于没有开展可靠性相关分析及研究。
可靠性研究的两大核心内容就是失效分析和可靠性工程(包括破坏性实验)。两者之间是相互影响和相互制约的。
在初创阶段,为了方便开展工作,可以把这两块工作分开开展。把失效分析和可靠性测试当成是可靠性研究的两个层次(严格讲来,这种分法并不恰当,只是在中小企业更便于开展)。企业可以根据自身的实际作出不同的策略。
以失效分析为主的模式,相对来说是比较被动的模式,等问题发生后,拿到故障样本才开展分析工作。借助微观及化学工具,获取失效机理后定位根因,再影响设计、工艺、流程、测试等。失效分析可根据企业经营情况,评估投入预算,实现基本分析 委外分析、整体失效分析、FMECA 等阶段。具备失效分析能力的企业,哪怕只是第一阶段,也能快速推动企业的质量改进,该模式在大部分中小企业中比较容易上手和见效。
以可靠性工程(包括可靠性测试)为主的模式,其涵盖可靠性设计、可靠性分析、可靠性测试、可靠性制造等一系列工作,该模式是一个系统工程,要求的资源投入非常大,时间、设备。人力相比前面那种多了很多。同时还有对信息的收集和统计(“只有在统计受控的条件下生产的元器件才会具有高可靠性”)需要系统及分析工具的支持。由于投入过大,形成规模周期长,需要企业尤其是一把手在深刻了解可靠性必要性及感受到可靠性带来的价值后开展。
当企业下定决心,准备初创可靠性时,应该如何设定可靠性架构呢?
由于企业不确定可靠性带来的价值,一开始规模较小,并不足以单独设定一个专门部门, 但务必设定单独的岗位,如可靠性工程师(或失效分析工程师)。可靠性工程师设定在品质部还是研发部直接影响到失效分析的效率,中小企业初创阶段,可靠性工程师建议归属于研发部门。常规品质问题,由品质工程师正常处理,可靠性工程师,主要分析的是故障率高的元器件失效,或对生产影响比较严重的元器件失效,否则初创阶段单薄的可靠性工程师资源会消耗于常规业务中,无法集中精力攻克解决重大难题。当然,现阶段的可靠性工程师尚不能完全依靠自身的经验和能力去独立解决问题,其工作模式主要是组织协调,整合公司资源,成立失效分析专家小组,明确小组成员职责,共同分析问题,查出原因,定位责任,提出改善措施,跟踪实施效果。专家小组能把失效原因定位更精准,提出的解决方案也更有效,可以有效地解决公司级疑难杂症。专家小组可以由固定的人员组成,也可以结合实际情况指定人员,一般除可靠性工程师外,会邀请研发、工程技术、品质、生产等人员参与。
所谓的“重大难题”,提出方可以是市场客服人员,也可以是生产部,品质部,或研发部门自身。
三、可靠性工程师的素质要求之我见
可靠性除了分析器件失效外,还有硬件设计合理性、软件系统设计可靠性、生产工艺匹配、人为误操作、使用应力等各个因素,或多种组合因素。作为主要因素的元器件失效,必须追溯到供应商,开展二级供方管控,深挖其原材料可靠性,设计、工艺、人为、应力等因素。所以,可靠性工程师,必须要求对元器件的设计选用、测试、生产工艺熟悉。同时,可以多与供应商沟通,对于尚不能深入了解的元器件开展现场考察、交流。
除此之外,可靠性工程师必须熟悉相关产品设计知识,掌握系统工作原理和流程,结合原理开展分析才能更好的定位失效机理。熟悉物理化学知识,掌握失效演化过程及分析的手段;熟悉生产工艺、工装治具和辅料特性,了解产品应用场景,掌握环境及工作应力情况。同时,个人还需要逻辑严密,具有推理能力。同样的失效现象,有可能有不同的原因引起。在失效分析技术中,提出假说是很常用的一种方法,针对良品按假说实验,复现失效现象,印证假说。
个人素质方面还需要考虑问题全面,小心谨慎,失效分析并非对人对事“吹毛求疵”。须与企业的实际情况相匹配,考虑全局利益,不能不考虑成本无限要求质量,如工业用和民用产品不能以军标要求。所以发现问题时,可靠性研究必须提出筛选方案,保证能把有隐患的不良品提前暴露出来,又不会由于不恰当的测试应力增加隐患。而对于特定情况下是否可以放行,必须给决策层提供具体的数据和明确的结论,以免不良品流出,或过于谨慎造成浪费。
实事求是,数据真实可靠。“风险可控”是可靠性给中小企业带来价值的基础,而非杜绝一切隐患。
四、关于流程建设和掌握的数据
当企业决定以可靠性工程为主,系统性推广应用时,会涉及新建制定许多规范与流程。而初创阶段,以失效分析为主时,设定流程时建议以简便高效优先,主要是要失效分析专家小组的工作流程,其他可以在实际工作中根据需要逐步建立。同样也可以借鉴其他公司甚至是供应商处的成功应用经验。另外报告方面,基本上已有较为规范的格式,可以专业的说明失效分析及改善情况,可以结合企业的实际情况恰当修改。相关部门及领导拿到一份专业的失效分析报告,基本上可以对分析的来龙去脉一清二楚。
对于过程中掌握的数据,除了产品本身外,还需要收集公司产品的使用环境,公司历年产品的运行分布及失效数据,同行产品的数据。统计分析返修率高的元器件失效,或对生产影响比较严重的元器件失效,为改善措施是否有效提供对比数据。如果人力资源充足,甚至可以对所有元件的失效率进行统计。收集各种类型的元器件的失效率允许范围的数据。比如,某个元件,生产时失效率是万分之二,这个失效率能不能接受?如果把挑选过后的良品放出去,会有多大隐患呢?后续怎么跟踪呢?这些数据都必须收集。
关键性的可靠性测试项目和规范。即使可靠性实验不能全部做,也要挑取对产品影响最重要的一些项目来测试。厂内主要针对成品或半成品级的测试。在必要时,要求供应商针对其元器件开展可靠性自测并提供数据。
五、开展可靠性的资源:软硬两手抓
专业的可靠性实验设备、失效分析仪器以及元器件开封的工具材料种类很多,并且大多仪器非常昂贵。所以,一个合格的可靠性工程师必须考虑企业实际情况,选择成本允许而且是必须的工具,同时也要开展软件方面的培养和提升。
硬件方面,初创阶段一般无法配备非常齐全的失效分析工具和可靠性设备。要根据失效分析的深度和广度来提出相应的配置。最基本的失效分析工具应该配备高倍率显微镜,以便从微观的方面,观察失效部位的物理表现。由于部分失效器件存在封装,还需要配置开封碾磨机、化学开封设备。必要时,可配置冷热快速循环试验设备激发故障。
“软件”方面,需要上层领导对可靠性的重视和认可,并通过案例宣贯、可靠性培训等措施强化全员的可靠性意识,也可和外部知名机构开展长期合作。另外,可靠性是基于应用场景的工作,对客户的使用情况和使用环境的信息越丰富,分析起来就越准确,该工作需要市场业务人员积极配合,并且有意识地收集相关信息并反馈,必要时可靠性工程师也可到现场进一步收集。
六、可靠性工程师的定位及指标
同样是故障分析、定责和改善跟踪,可靠性工程师与品质工程师看似定位重叠,但实质上品质工程师以全业务、浅分析、快响应为主,可能无法解决难点和挖掘深层原因。我认为两者主要区别还是专业程度不同,可以简单定性,可靠性工程师必须解决品质工程师解决不了的失效问题。而开发工程师、生产技术工程师、生产管理人员等,主要是为设计或工艺或人为引起的失效负责,并实施改善。考核可靠性工程师的主要标准为产品现场应用的质量数据是否得到有效改善。
七、初创企业可靠性工程师最好应设在研发部的理由
首先,由于研发部是技术权威,初创企业的可靠性工程师必须有技术权威作支持,最好是调用有经验和资历,且有意愿和能力的研发骨干从事可靠性工作。其次,解决问题的力度方面。如果可靠性工程师在其他部门,提出改善方案时,特别是与设计有关的问题时,推动开发改进比较难,但是如果把可靠性和失效分析的主要责任放在研发部时,自然会更积极解决问题。接着,如果把可靠性工程师放在其他部门,那么失效控制是滞后控制的方式,而把可靠性工程师放在研发部,从设计源头即参与,整体成本更低。最后,由于部门性质及处理问题的特性,研发部门开展可靠性作为内需,更注重实事求是;而在品质部门的话,过于重视“成绩”和影响力,而更少从合适的角度考虑问题,形式主义更多些。
2014年,在创新发展和市场诉求的双重压力下,公司从上而下推动可靠性建设,本人从研发部门调任可靠性,全面负责公司级别可靠性建设;回顾整个过程,也是从失效分析开始,围绕外部重大问题进行一系列的调研、分析,并最终改善,在失效分析过程中逐步接触到可靠性相关理论和模型,“因困惑故学习、有效果故应用、已应用故推广”。经过多年的发展完善,在业内率先基于可靠性工程成功应用,除了开展可靠性制造外,还组建“失效分析室”、 “可靠性实验室”、“安全实验室”、“环境寿命实验室”、“综合应力实验室”、“户外试挂站”等多个可靠性应用研究!
暂无评论