Отказы оборудования – предмет особого внимания на любом предприятии. Как минимум они несут с собой издержки в виде прямых и значительных затрат на аварийные ремонты. Возможны и более серьезные производственные последствия, связанные с остановкой производства и недовыпуском продукции, не говоря уже о последствиях в сфере безопасности и экологии.
В таких случаях организационная культура зачастую включает в себя традицию указывать пальцем на отдел технического обслуживания и ремонта (ТОиР) как источник (и решение) проблемы. Сам же отдел ТОиР может быть при этом перегружен заданиями на работы, которые в силу ограничений не может выполнить в полном объеме.
Насколько оправдан такой стереотип? Действительно ли надежность машин и оборудования, одним словом – активов, полностью находится в руках отдела ТОиР? Реальная деятельность на жизненном цикле производственных активов фиксирует много других лиц, влияющих на надежность. Перечислим некоторых из них.
Конструкторы и сборщики
Ранние стадии жизненного цикла, начиная с определения требований и постановки задачи на проектирование, чрезвычайно важны для надежности активов. Этапы проектирования и сборки (изготовления) определяют собственную надежность актива, т.е. верхний предел его характеристик.
Упущения на этих этапах впоследствии дорого обходятся владельцу активов. Этот факт наглядно иллюстрируется диаграммой (рис. 1), которую приводит Рамеш Гулати (Ramesh Gulati), всемирно известный популяризатор лучших практик ТОиР.
Рис. 1. TCO и возможности повышения надежности на жизненном цикле актива
Как видим, возможность повысить собственную надежность актива, его безопасность и эффективность стремительно исчерпывается именно на ранних стадиях жизненного цикла. А на стадии эксплуатации остается лишь поддерживать эксплуатационную надежность на том уровне, которого удалось достичь.
Но при этом львиная доля (до 75%) совокупной стоимости владения активом (TCO) приходится именно на стадию эксплуатации и обслуживания. Если не принимать во внимание, что часть этих затрат может быть связана с конструктивными дефектами оборудования, то можно оправдать все «шишки», которые валятся на отдел ТОиР.
Из диаграммы очевидно также, что если управлять активами надлежащим образом на всем жизненном цикле, включая чуть более высокие затраты на ранних стадиях, то это даст к концу жизненного цикла экономию совокупной стоимости владения до 40%.
Монтажники
На этапе монтажа должны быть правильно подобраны и установлены регламентированные документацией крепежные элементы, выдержана последовательность крепления, обеспечено точное соблюдение крутящего момента затяжки. Регулировка соосности валов и шкивов проведена в пределах допусков и с учетом теплового расширения. Обеспечена балансировка фаз в т трехфазной сети питания, при необходимости проведена механическая балансировка динамического оборудования.
В противном случае собственная надежность актива будет снижена. С некоторыми упрощениями эту ситуацию иллюстрирует рис. 2, где изображены два варианта хорошо известной кривой П-Ф [1]:
вариант (а) соответствует хорошему монтажу, вариант (б) – плохому.
Рис. 2. Кривая П-Ф в зависимости от качества крепежа, центровки и балансировки
Кривая П-Ф (или P-F, по начальным буквам терминов Potentialfailure и Failure) представляет собой модель развития отказа оборудования от потенциального отказа или предотказного состояния (точка П), которое может быть обнаружено методами диагностики, до наступления функционального отказа (точка Ф) – т.е. состояния, в котором актив не способен выполнять требуемую функцию в соответствии со стандартом производительности.
Интервал от начала эксплуатации до предполагаемой точки П служит для установления периодичности профилактического обслуживания: интервал между профилактиками должен быть меньше него. В этом случае профилактические работы будут упреждать потенциальный отказ и восстанавливать надлежащее состояние оборудования.
В свою очередь, П-Ф-интервал – это промежуток (в единицах времени или иных единицах, в которых измеряется наработка) между потенциальным и функциональным отказом, который показывает, насколько быстро развивается отказ, и служит для определения применимости обслуживания по состоянию и выбора периодичности работ по контролю технического состояния.
Если состояние потенциального отказа существует и однозначно определено, а П-Ф-интервал достаточно длительный, чтобы успеть выполнить контроль состояния, спланировать, обеспечить ресурсами и начать корректирующее обслуживание, то обслуживание по состоянию применимо. Контроль состояния необходимо выполнять с периодом повторения, меньшим, чем П-Ф-интервал, чтобы не пропустить точку П. Желательно существенно меньшим (например, в два раза), чтобы иметь запас времени на корректирующее обслуживание.
Очевидно, что если периодичность профилактики или контроля состояния будет выбрана исходя из предположения хорошего монтажа, по факту он будет плохим, то несмотря на соблюдение периодичности возникнет отказ. Следует отметить, что часть вины за отказ может нести и отдел ТОиР, поскольку он должен периодически проверять крепеж, центровку и балансировку.
Чтобы сфокусировать внимание на важности правильного монтажа (и проектирования), была предложена [2] модификация кривой П-Ф – так называемая D-I-P-F кривая (Design–Installation–
Potentialfailure–Failure).
Недостаток классической кривой П-Ф в том, что для организаций, обслуживающих оборудование по состоянию, точка П стала центром внимания: они ищут точку П, ожидают точку П, стараются не пропустить точку П. И упускают саму причину появления точки П.
Проблема в том, что точка П – это уже поздно, так как предотказное состояние уже возникло. Вопрос, который нужно задать в первую очередь: почему появляется точка П?
Операторы
Исследование [3] показало, что производственный отдел, операторы технологического оборудования, оказывают такое же влияние на надежность и эффективность активов, как и организация ТОиР. И одна из рекомендаций в итоге этого исследования – поместить оператора в центр внимания.
Если имеют место нарушения технологического процесса производства и эти нарушения повторяются длительное время, то это становится причиной отказов. И как бы вы ни улучшали систему ТОиР и ни мотивировали отдел ТОиР, вы не добьетесь результата.
Нарушения могут происходить в виде ошибочных действий оператора, вызванных его недостаточной квалификацией. Другой вариант – если производственникам нужно наверстать отставание в объеме производства за период. С этим могут быть связаны выплаты премий, и поэтому они постараются выжать из технологической линии больше нормы, регулярно превышая границы нормативных режимов.
Сверхнормативное использование оборудования скажется на его надежности и остаточном ресурсе, и через какое-то время предприятие будет наказано отказами. Производственники получат премии, отдел ТОиР – нагоняй.
Таким образом, важно различать эксплуатационный и деградационный отказ [4]. Первый возникает по причине, связанной с нарушением установленных правил и (или) условий эксплуатации объекта. Этот отказ не связан с возрастом и наработкой оборудования, поэтому манипуляции периодичностью ТОиР ничего не дадут.
Причиной второго являются естественные процессы старения, износа, коррозии и усталости при соблюдении всех установленных правил и (или) норм проектирования, изготовления и эксплуатации. Здесь имеется связь с возрастом, и при соблюдении регламентов обслуживания и ремонта (замены) таких отказов быть не должно.
Согласно исследованию [5], только 11% отказов носят деградационный характер. Остальные 89% отказов не подчиняются модели износа и внешне выглядят как случайные отказы (имеют постоянную интенсивность). На самом деле они не случайны, поскольку являются эксплуатационными отказами. Было бы крайне близоруко возлагать ответственность за отказы только на отдел ТОиР, в то время как за 89% отказов она делится с производственным отделом.
Снабженцы
Одно из условий обеспечения эксплуатационной надежности – наличие и качество запасных частей и материалов, необходимых для ТОиР. Это является областью ответственности службы закупок и материально-технического снабжения.
Как правило, службе снабжения и складам устанавливается такая метрика эффективности, как стоимость (объем) запасов. И зачастую она является вообще единственной.
Отсюда вытекает требование минимизации запасов. С одной стороны, такое требование мотивирует службу снабжения анализировать запасы, выявлять неликвиды или запчасти к старому оборудованию, которое уже не используется на предприятии.
С другой стороны, улучшение этого показателя может осуществляться без учета критичности запчастей, затрат времени на выполнение их заказа и последствий отказа, для устранения или предупреждения которого нужна данная запчасть. В таком случае характеристики надежности могут ухудшиться. Отдел ТОиР мог бы указать на эту проблему, однако не всегда есть необходимые для этого связи и горизонтальные процессы.
Другой пример. Инженер-механик указал конкретную марку товара, в отношении которого его опыт говорит о наилучшей надежности. Но служба закупок отклонилась от его рекомендаций, купив у другого поставщика или другой товар, но по меньшей стоимости. Функция закупок покажет экономию, но какой ценой? Возможно, закупленный элемент выходит из строя чаще, а производство будет терпеть убытки от простоев.
Прозрачность запасов также влияет на характеристики надежности. Если тратится много времени на поиск и транспортировку запчастей, это снижает эффективность ремонтной деятельности, увеличивает длительность простоев в ремонтах и ухудшает характеристики надежности [6].
Общие метрики надежности
Указанные проблемы – следствие разобщенности служб, разделенных внутренними барьерами. Поэтому логичным является введение общего для них показателя надежности, так, чтобы они вместе решали проблему, если он снизится.
Показатели надежности оборудования (объекта) не могут быть общими, так как они понятны только техническим службам. В то же время перечисленные выше действующие лица и службы, а также оборудование, сырье, полуфабрикаты, упаковка, оснастка, энергия, информация и т.д. образуют единый технологический процесс. В этой связи в качестве общего показателя целесообразно использовать показатель надежности выполнения задания [7], характеризующий способность выполнять задание в соответствии с установленными требованиями: к объему производства, качеству продукции, затратам на изготовление. По сути, это показатель надежности технологического процесса.
Лучшим показателем надежности в этом свете является OEE (Overall Equipment Effectiveness), или общая эффективность оборудования, который фиксирует потери фонда времени работы оборудования и, соответственно, потери объема производства. Показатель OEE включает в себя три фактора.
- Готовность (Availability) – учитывает потери, связанные с простоями оборудования. A = Фактически отработанное время / Плановое время выпуска продукции.
- Производительность (Performance) – учитывает потери, связанные с уменьшением скорости производства.
P = (Количество произведенной продукции / Фактически отработанное время) / Норма производства в час. - Качество (Quality) – учитывает потери, связанные с низким качеством продукции.
Q = Количество качественной продукции / Количество произведенной продукции. Результирующее выражение для расчета OEE: OEE = A * P * Q.
В мировой практике принято считать плохим показатель OEE менее 65%, удовлетворительным – от 65% до 75%, хорошим – более 75%, лучшим – 80–85%.
Составляющая «А» учитывает в том числе простои по причине отказов оборудования, в связи с внеплановой переналадкой или продлением планового обслуживания, из-за отсутствия сырья или упаковки, в связи с дефектами упаковки и т.д.
Составляющая «P» учитывает снижение скорости работы оборудования по причине частичных отказов, из-за неправильной наладки, некачественного обслуживания или плохой смазки и т.д.
Составляющая «Q» учитывает снижение качества в связи с неправильной наладкой оборудования, неправильным обслуживанием, а также из-за некачественного сырья, разрыва упаковки и т.д.
Очевидно, что показатель OEE будет реально работать только при условии систематического и корректного сбора данных о всех фактах внеплановых простоев оборудования, изменений эксплуатационных режимов, выпуска брака, снижения скорости производства с фиксацией причин. На более-менее крупном производстве это возможно только в информационной системе. Возможности такой системы и результаты ее реализации на основе программного обеспечения TRIM описаны в статьях [8, 9].
Исследование [10] выявило и другие замечательные свойства OEE. Согласно статистическим данным крупной американской производственной компании за пятилетний период (более 10 заводов по всему миру), величина OEE коррелирует с уровнем травматизма: травматизм снижается с ростом OEE.
Данные примерно 180 производственных предприятий, в основном перерабатывающих, показали: чем больше на предприятии реактивного обслуживания (и меньше предупредительного), тем ниже OEE, и наоборот.
Кроме того, данные крупного химического завода за восьмилетний период свидетельствуют: чем больше реактивного обслуживания, тем выше травматизм, и наоборот. Получается, если у вас много реактивного обслуживания (выполняемого после отказа), то OEE у вас будет ниже, а травм будет больше.
Таким образом, OEE представляет собой комплексный показатель, коррелирующий с различными аспектами деятельности организации, в том числе с уровнем зрелости системы ТОиР, уровнем безопасности, техническим состоянием активов и их надежностью, качеством сырья и упаковки и т.д.
Анализ коренных причин
Очевидно, что одного только введения показателя OEE совершенно недостаточно. Согласно исследованию консалтинговой фирмы A.T. Kearney, ответственность за потери производства делится между несколькими службами (рис. 3).
Рис. 3. Распределение потерь по месту возникновения
Поэтому критически важно определять первопричин потерь, в том числе связанные с отказами оборудования, а затем спланировать и выполнить правильные корректирующие действия, направленные на устранение причин. Если первопричины будут упущены из виду, то инициативы по улучшению управления активами потерпят крах.
Этой цели служит известная и хорошо зарекомендовавшая себя методология RCA (Root Cause Analysis), или анализ коренных причин [11, 12].
В основе общепринятых представлений об RCA лежит классификация причин на три категории [13]:
- Скрытые (системные) причины. Это недостатки системы управления, действующей в организации.
Например, нового работника не обучили выполнению смазывания подшипников, поскольку регламентом не предусмотрено, кто занимается обучением во время отпуска инструктора. Или, например, система управления предусматривает повышенную оплату за сверхурочные работы по устранению отказов и не предусматривает поощрения за безотказность, т.е. фактически вознаграждает персонал за отказы. - Человеческий фактор. Это неправильные решения, принятые под воздействием недостатков системы управления: ошибки (сделали то, что не должны были делать) или упущения (не сделали то, что должны были).
Например, смазчик вносит слишком много смазки. Или, например, персонал уклоняется от операций контроля за чистотой смазки. - Видимые (физические) причины. Это осязаемые и непосредственные причины проблемы.
Например, перегрев и разрушение подшипника как причина отказа оборудования контроля за чистотой смазки. Например, перегрев и разрушение подшипника как причина отказа оборудования.
Видимая причина, как правило, не является коренной причиной. Иногда поиск коренной причины фокусируется на лицах, принимающих решения, и превращается в поиск виновного. Корректирующие действия в таком случае сводятся к дисциплинарному взысканию и материальной ответственности, а расследования инцидентов приобретают черты инквизиции. Является ли такой подход эффективным с точки зрения интересов организации? Очевидно, что нет. Культура наказаний – это верный способ убить культуру RCA. Это вообще не RCA.
Когда мы проникаем в мотивы людей, принявших неправильные решения, то в большинстве случаев обнаруживаем абсолютно логичные доводы. Их решения чаще всего носят благонамеренный характер. Что еще важнее, другие, скорее всего, примут такое же решение, учитывая ту же информацию и при тех же условиях.
Истинная первопричина заложена в системах управления, находящихся в основе принятых решений. Нас должно интересовать, почему человек думал, что его решение было правильным, когда он его принимал.
Таким образом, процесс RCA должен быть направлен на выявление скрытых (системных) причин, поскольку именно они являются коренными причинами проблем. По сути, процесс RCA представляет собой расследование цепочки обстоятельств, ведущей от видимых причин к скрытым причинам.
Тем не менее необходимо выявить и человеческие ошибки. Это может вызвать опасения, что расследование остановится на поиске виновного, и люди откажутся предоставить полную и достоверную информацию. В этой связи культура RCA предполагает отказ от отношения к человеку, допустившему ошибку, как к «слабому звену» в коллективе и соответствующее отношение к самой ошибке/упущению:
- ошибка неизбежна;
- ошибка не является изначально плохой, человечество училось на своих ошибках;
- все совершают ошибки, а некоторые из худших ошибок совершаются самыми опытными людьми;
- обвинение и наказание почти всегда неуместны, но это не означает, что люди не должны нести ответственность за свои умышленные действия.
Для эффективности RCA важно также понимать, что RCA – это не задача и не проект, имеющий начало и окончание, а непрерывно работающая и растущая система управления корпоративными знаниями.
Заключение
Деятельность на жизненном цикле производственных активов демонстрирует, что на их надежность влияет целый ряд лиц, помимо отдела ТОиР. Это конструкторы, сборщики (изготовили), монтажники, операторы, снабженцы, кладовщики и другие.
Для реального решения проблемы повышения надежности, а не поиска козла отпущения, необходимо внедрение общих для всех служб показателей надежности, чтобы они сообща искали решение, чтобы их улучшить. Лучшим показателем надежности в этом свете является OEE (Overall Equipment Effectiveness). Необходима также действующая на предприятии система анализа коренных причин проблем (RCA, Root Cause Analysis), которая, собственно, и позволит, отталкиваясь от текущих значений OEE, выявить первопричины, спланировать и реализовать корректирующие действия, направленные на устранение первопричин.
Список литературы
- ГОСТР 55.0.05-2016. Управление активами. Повышение безопасности и надежности активов. Требования. М.: Стандартинформ, 2016. – 10 с.
- PerryGregory. The P-F curveandthepathtocapacityassurance // Plant Services. – July 2019. – P. 33-35.
- Rethinking asset performance management / ARC Strategies, July 2019. ARC Advisory Group. – 20 p.
- ГОСТ Р 27.102-2021 Надежность в технике. Надежность объекта. Термины и определения. М.: Стандартинформ, 2021. – 40 с.
- Nowlan F. S., Heap H. F. Reliability-centered Maintenance. San Francisco: Dolby Access Press, 1978. – 466 p.
- Антоненко И.Н. Применение принципов бережливого производства к организации ТОиР // Главный энергетик. – 2021. – №10. – С. 26-33.
- ГОСТ Р 27.101-2021 Надежность в технике. Надежность выполнения задания и управление непрерывностью деятельности. Термины и определения. М.: Стандартинформ, 2021. – 20 с.
- Антоненко И.Н. Крюков И.Э., Шестопалов П.С. Менеджмент простоев производственного оборудования // Главный механик. – 2010. – №11. – С. 39-45.
- Шестопалов П.С. Наши результаты: эффективное управление основными фондами и снижение затрат на ресурсы // Информатизация и системы управления в промышленности. – – №5(53). – С.81-84. URL: https://isup.ru/articles/1/6485/ (дата обращения 18.05.2022).
- Moore Ron. A Reliable Plant is a Safe Plant is a Cost-Effective Plant: [сайт] URL: https://www.lce.com/A-Reliable-Plant-is-aSafe-Plant-1266.html (дата обращения 18.05.2022).
- IEC 62740:2015 Root cause analysis (RCA). International Electrotechnical Commission, 2015. – 151 p.
- ПНСТ 427-2020 Системы менеджмента качества организаций авиационной, космической и оборонной отраслей промышленности. Перспективное планирование качества продукции. Анализ корневых причин и решение проблемы. М.: Стандартинформ, 2020. – 50 с.
- Latino R.J., Latino M.A., Latino K.C. Root Cause Analysis: Improving Performance for Bottom-Line Results. CRC Press, 5th edition, 2021. – 332 p.
Журнал Prostoev.NET № 4(29) 2021
И.Н. АНТОНЕНКО, начальник отдела маркетинга ООО «НПП «СпецТек», к. т. н.