基于标准的“以可靠性为中心的维护(RCM)”

导读:本文做为RCM分析过程的一个大纲,通过抽象行业标准中的关键步骤,帮助用户快速理解RCM的过程,并能够参考用于实施的分析工作。

可靠性中心维护(RCM)是一种建立维保策略的过程,它在最小的维保资源投入下,同时能确保设备能在当前运营环境中按设计的功能运行。它基于分析故障模式(Failure Modes)的概率和后果,来确定最佳维护和操作策略。

RCM是:按照以最少的 资源消耗保持装备固有可靠性和安全性的原则,应用逻辑决 断的方法确定装备预防性维修要求的过程或方法

GJB 1378A-2007 《装备可靠性为中心的维修分析》

RCM理论起源于 20世纪 60年代美国的航空业,其目的 是为了提高飞机的可靠性。 目前RCM已经成为是国际上通用的、用以确定资产预防性维修需求、优化维修制度的一种系统工程方法。

国际上目前各个行业广泛认可与推行的标准为,美国汽车工业协会的JA1012标准《 以可靠性为中心的维护(RCM)过程的评估标准 》。
在国内可参考的相关标准为:GJB 1378A-2007 中华人员共和国国家军用标准 《装备可靠性为中心的维修分析》。

基本过程:SAE JA1012“可靠性中心维护(RCM)过程评估标准”指南中给出以下七个基本问题:

  1. 功能(Function):资产/系统在其当前运营环境中, 预期的功能和性能有哪些?
  2. 功能故障(Function Failure):它无法提供预期功能可能是哪些方式?
  3. 故障原因(Failure Mode/Cause):每次功能故障的原因是什么?
    备注:对于Failure Mode这个词的定义在各个标准中存在理解差异。 在JA1012中Failure Mode指原因。但GJB标准中Failure Mode指故障本身(Function Failure)。但无论哪种术语,在故障后下一层表达的就是故障的各项原因。
  4. 故障影响(Failure Effect):每次故障发生后会发生什么?
  5. 失败后果(Failure Consequences):每个故障的影响是什么,并且程度是什么样的?
  6. 建议措施(Recommended Actions):如何预防故障,或降低发生的风险?
  7. 默认操作(Default Actions):如果代不到预防性的措施,应当如何处理?

RCM评估的结果是设备/系统的维修策略,包括预防性维修计划、设计改进计划、故障发生后的补救事项等。

基本概念

RCM分析的范围

在开始RCM分析时,首先要明确被分析的对象。RCM不是全局性的资产分析,是针对重要设备/系统的分析。

针对于重要的功能产品(设备/系统)按GBJ1378A建议重要功能产品的界定原则如下:

  • 该产品的故障可能影响安全
  • 该产品的故障可能影响任务完成
  • 该产品的故障可能导致重大经济损失
  • 该产品的隐蔽功能故障与另一相关或备用产品的故障综合可能导致上述一项或多项影响。
  • 该产品的故障可能引起的从属故障装导致上述一项或多项影响

在实践中也可能通过ACR( 参考:资产重要性是可靠性提升的基础 )进行资产重要性评估,后针对最重要的资产进行RCM分析。
或相关生产运营中的设备故障排名表进行范围划定。

设备/系统的功能 – Function

“功能”是指被分析的对象需要完成的功能与达到的能力。每个系统可以具有一个或多个功能,每个功能都在单独的记录中定义。为了列全系统下所有可能的功能,可以考虑逐个分析系统下每个单独设备单元、功能位置的作用。

例如,冷却塔的功能如下:在所有环境条件下都可以,每分钟提供500加仑的水,最高温度为90华氏度。

分析团队还应该定义每个功能是明显的还是隐蔽的。明显的功能是在正常情况下操作人员会注意到故障的功能。隐蔽功能是指可能不能被发现的功能。
例如有两个组件(如泵、马达)同时提供功能,其中之一故障并不会导致功能故障,但两个都坏了就会有影响。那其中之一的故障不会被操作人员察觉,就是个隐蔽的故障。

SAE标准JA1012“以可靠性为中心的维护(RCM)过程的评估标准”,对于定义“功能”有如果要求:

  1. 应说明资产运行的环境场景。
  2. 应识别资产/系统的所有功能(所有主要和次要功能,包括所有自身保护装置的功能)。
  3. 所有功能的描述,都应包含动词,对象和性能标准(在每种情况下都可以量化)。
  4. 功能描述中的性能标准应为资产/系统的所有者或用户在其运行环境中所期望的性能水平。

关于功能故障 – Function Failure

在定义了系统的功能之后,下一步是定义每个功能发生的所有(有理由发生的)故障。

示例:冷却塔以下示例显示了冷却塔的一个可能功能和相关的功能故障:
功能:在所有环境条件下,每分钟提供500加仑的水,最高温度为90华氏度。
功能故障:无法每分钟产生500加仑的水,原因可能是一个供水泵故障。

根据SAE标准JA1012“以可靠性为中心的维护(RCM)过程的评估标准”,在定义故障时要求如下:

  • 应识别与每个功能相关的所有故障。

按GJB标准,故障(GJB标准中称为故障模式)一般情况下是指“可以观察到的故障表现形式”。

故障原因 Cause

可以为每个故障定义一个或多个故障发生的原因。

分析团队应确定可能发生的故障模式。模式可能是实际发生,参考相似系统的,也可能是理论上的。SAE标准JA1012“以可靠性为中心的维护(RCM)过程的评估标准”建议RCM团队检查:恶化,设计缺陷和人为错误可能导致故障的所有原因。

SAE标准JA1012“以可靠性为中心的维护(RCM)过程的评估标准”定义了故障原因的以下要求:

  • 应识别每个故障下的所有故障原因。
  • 用于确定故障原因的方法应该是资产的所有者或使用者可接受的。
  • 故障原因列表应包括:以前发生的故障原因,现有维保机制正在防止的故障成因,以及尚未发生但在运行环境中被认为有理由发生的故障成因。
  • 故障原因应包括可能导致功能故障的任何事件或过程,包括:恶化,设计缺陷和人为错误,无论是由操作员还是维护人员造成的(除非人为错误可以被RCM以外的过程有效控制) 。

故障影响 Failure Effective

在定义了所有故障原因后,可以为每种故障原因定义一个或多个故障影响。
故障影响记录了发生故障的后果。大多数FMEA方法会评估故障相关的安全,环境和经济(或生产运营)影响。

SAE标准JA1012“以可靠性为中心的维护(RCM)过程的评估标准”定义了故障影响的以下要求:

  • 故障影响应描述:如果没有执行特定任务来预测、预防或检测故障,会发生什么后果。
  • 失效影响应包括支持评估故障后果所需的所有信息,包括以下数据:
    • 发生过故障的证据(如果有的话)(对于隐蔽功能,如果发生多次故障会发生什么)。
    • 故障会造成人员伤害,或对环境产生不利影响(如果有的话)。
    • 故障对生产或运营产生不利影响(如果有的话)。
    • 故障会造成什么物理损坏(如果有的话)。
    • 在故障之后必须做什么(如果有的话)来恢复系统的功能。

建议的任务 Tasks

建议管理和SAE标准对于各个故障影响,可以定义一个或多个“建议”。

通常,对于设备或位置和系统所有者,建议的操作应把故障的概率与后果降低到可接受的水平(而不是解决所有的问题),因此可以基于故障模式和风险矩阵分析的结果。对于危害严重的设备故障,进行重点的预防和处理。

在分析团队对系统进行全面分析之后,团队还应该定义“重新评估”的标准。
例如,分析团队可以定义是否应根据时间间隔、工况条件、某个明确的日期、系统流程更改或设计代码时就需要重新评估建议。

按GBJ1378A建议,对应的建议任务包括:

  • 预防性维修
    • 保养(清洗、擦拭、通用、润滑、充电、充气、紧固、调整)
    • 操作人员监控(使用前检查、仪表监控、专业巡点检)
    • 使用检查: 按计划进行,以检查隐蔽故障为目的的维修工作。
    • 功能检测: 按计划进行,以检查潜在故障为目的的维修工作。
    • 定时拆修
    • 定时报废
    • 综合以上多种工作
  • 设计改进:如加冗余备用装置、安全保险装置、改变工艺设备的使用、改变设备的设计。
  • 使用补偿措施: 故障后的恢复措施。

SAE标准JA1012,会将所有对安全、环境危害的重点处理到可容忍的水平,对没有安全环境危害的要求任务成本小于故障成本。

GJB标准,会通过严酷程度(Severity )、概率等级(Probability)进行风险评估,确立一个综合的风险等级(Risk Priority)。

FEMCA分析示例:

GJB/Z 1391-2008 故障模式、影响及危害性分析指南

总结:RCM计划与分析的过程

简单来说RCM的过程如下:

  1. 建立RCM分析计划:确定要分析的对象(识别重要资产/系统)、参与人员、时间等
  2. 展开分析
    1. 定义功能
    2. 定义功能故障
    3. 进行功能故障和功能影响FMEA/FMECA分析
    4. 给出建议的任务、执行周期、重估条件
  3. 审计与评估分析结果
  4. 实施建议
  5. 持续改进RCM分析:做为一个长期有效的计划,要基于目标效果、时间周期进行重新分析评估。

发表评论