A Fiabilidade, muitas vezes designada por Análise de Sobrevivência (Survival Analysis), constitui um método de análise estatística para estudar as ocorrências e os respetivos tempos dos acontecimentos (Dias, 2002).
De acordo com a norma NP EN 13306 (2007), Fiabilidade é a aptidão de um bem para cumprir uma função requerida sob determinadas condições, durante um dado intervalo de tempo. O
mesmo documento refere ainda que o termo fiabilidade também é utilizado como uma medida de desempenho mas, na sua essência, é sempre uma probabilidade.
Ferreira (1998) define Fiabilidade como sendo a característica dum dispositivo, expressa pela probabilidade de exercer uma função requerida em condições de utilização e por um período de tempo determinado.
Um sistema reparável pode ser avaliado de diversas formas. Essa performance pode ser medida através do número de falhas ou avarias do sistema reparável. Se as falhas ou avarias ocorrerem sem tendência ao longo do tempo, ou seja, se o sistema se comporta como um Processo de Poisson Homogéneo (Dias, 2002) então pode calcular-se a taxa média de falhas ou o seu inverso o MTBF. Este indicador pode permitir o cálculo da fiabilidade considerando a distribuição de Poisson com um número de ocorrências iguais a zero.
4.3.1.1. Modelos de Fiabilidade
Em termos gerais, podem-se considerar dois tipos fundamentais de modelos de fiabilidade: os determinísticos e os estatísticos:
• Os modelos de fiabilidade determinísticos (Sobral, 2010) são baseados nas leis de
degradação física dos componentes ou sistemas sujeitos a falha ou avaria. É importante conhecer o que dá início ao processo, que condições podem acelerar ou potenciam o seu desenvolvimento, e como estas condições conduzem à falha do componente. Também há que controlar as formas pelas quais se consegue parar ou diminuir a taxa de progressão dos efeitos associados à falha. A aplicação deste tipo de modelos pode prever o comportamento de componentes, com uma certa margem de erro relativamente pequena, contudo, a equipamentos ou sistemas mais complexos, torna-se bastante difícil. Estes modelos não permitem o tratamento simultâneo de vários processos, salvo se houver um modo de falha bem definido e predominante que se sobreponha a todos os outros;
• Os modelos de fiabilidade estatísticos podem ser paramétricos ou não paramétricos, consoante se pretenda ou não ajustar uma distribuição aos tempos de falha de uma população homogénea. São modelos de fiabilidade que recorrem ao conhecimento de situações históricas ocorridas num componente ou com um sistema não reparável, através do ajustamento de uma distribuição probabilidade (AFTM, Accelerated Failure Time Models). Os modelos não paramétricos não necessitam de especificar a distribuição de probabilidade já que assumem a proporcionalidade das covariáveis envolvidas (PHM, Proportional Hazards Modelling). As covariáveis explicativas dos modelos podem ser discretas ou contínuas ou, em situações muito específicas, podem ser dependentes do tempo de vida do sistema no momento da falha ou avaria.
Dias et al. (2007) aplicam um modelo tradicional de otimização de custos para modelar o período ótimo de substituição preventiva de componentes com função de risco crescente. A metodologia
utilizada no trabalho recorre à distribuição estatística do tempo de vida dos componentes que, na sua generalidade, podem ser modelados por uma distribuição de Weibull. O caso prático de estudo em Dias et al. (2007) refere-se a uma empresa de oleaginosas, onde foi aplicada a metodologia que possibilita associar os custos ao cálculo fiabilístico, permitiu identificar situações em que os custos de manutenção preventiva serão de uma grandeza muito inferior aos custos de manutenção corretiva.
Sobral e Ferreira (2007) apresentam um estudo com o intuito de mostrar a importância do tratamento dos parâmetros reais recolhidos, aplicando uma metodologia, onde se pode estimar a tendência da falha e o momento em que a mesma potencialmente poderá ocorrer. Sobral e Ferreira (2007) recorreram a um programa informático (RealiaSoft corporation, Weibull ++7) para simplificação dos cálculos referentes ao desenvolvimento e aplicação da metodologia na análise e tratamento de parâmetros de degradação de um caso real. Os componentes estudados nesta análise foram filtros de ar de um sistema de AVAC. Equipamentos que se encontram, normalmente, instalados em edifícios para garantirem a qualidade do ar interior. O software utilizado pelos autores permitiu através de testes de aderência verificar que a distribuição que mais se ajustava à informação contida nos dados de entrada era a distribuição de Weibull a 3 parâmetros, obtidos por sua vez através do teste de Máxima Verosimilhança. É referido também que o software específico permitiu comparar resultados analíticos com gráficos. Com o referido estudo os autores (Sobral e Ferreira, 2007) afirmam ter estimado a tendência das falhas e o momento em que as mesmas potencialmente poderão ocorrer.
4.3.1.2. Fiabilidade Humana
Um outro aspeto, de grande importância na área da fiabilidade e gestão do risco e cuja influência é determinante em determinados estudos, é o fator humano e organizacional. Segundo Assis (2010), a fiabilidade humana é uma matéria extensa, alvo de investigações recentes, na tentativa de mudar a ideia estabelecida de que “errar é humano”.
O erro pode ser definido como a falha de um objetivo proposto ou como um desvio em relação a uma norma. O homem desempenha, cada vez mais, um papel importante na interatividade com os sistemas. Para Assis (2010), a fiabilidade de um sistema será o resultado da interatividade homem-máquina. O mesmo autor refere ainda que o erro humano ocorre quando o comportamento humano ou a sua influência sobre um sistema excede os limites de aceitabilidade, contudo, o homem apresenta um grau elevado de variabilidade do seu comportamento.
Para alguns autores o erro humano tem um papel fundamental na ocorrência de acidentes em sistemas críticos. É constatado por Sobral (2010) que a fiabilidade humana (HRA - Human Reliability Analysis) pode ser analisada de forma semelhante à análise de fiabilidade dos equipamentos, podendo as falhas ser classificadas, quantificadas e analisadas através de distribuição estatística adequada. Contudo, ao contrário dos equipamentos que sofrem uma degradação ao longo do tempo no cumprimento de uma missão, as falhas humanas podem ser
reduzidas tendo em conta alguns fatores, como a aptidão, o treino, a experiência, ou mesmo a idoneidade humana.
Assis (2010) apresenta os erros humanos classificados em cinco categorias. Assim temos erros por:
• Omissão – não executar tarefa do plano de organização do trabalho; • Execução – não executar tarefa na forma prevista no plano;
• Derivação – introduzir uma ação não prevista no plano;
• Sequência – executar tarefa em momento que não corresponde ao previsto no plano; • Atraso – executar a tarefa após o momento previsto no plano.
Segundo Assis (2010) o erro humano pode ser quantificado em termos de frequência, pelo número de erros cometidos em “ ” solicitações e/ou pelo número de erros cometidos durante um determinado período de observação. A fiabilidade humana pode ser avaliada na fase de aprendizagem, onde apresentará possivelmente uma taxa de falhas decrescente e na fase de execução, onde presumivelmente o comportamento da taxa de falhas será aleatório (Sobral, 2010). Em Assis (2010) é referido também o estudo das probabilidades de erro humano (HEP - Human Error Probability), pretendendo perceber o erro humano, suas causas e consequências, com o objetivo de reduzir a sua ocorrência até limites aceitáveis. Normalmente, fatores como o stress dos colaboradores nas operações de manutenção, levam à ocorrência de erros que devem ser analisados e corrigidos.
n
Atualmente, existem várias metodologias para análise da fiabilidade humana. Em Sobral (2010) e em Assis (2010) são referidas algumas metodologias para a quantificação das falhas humanas, tais como:
• TESEO (Technique for Empirical Simulation of Errors in Operations);
• HEART (Human Error Assessment and Reduction Technique);
• THERP (Technique for Human-Error Rate Prediction);
• SHERPA (Systematic Human Error Reduction and Prediction Approach);
• CREAM (Cognitive Reliability and Error Analysis);
• ASEP (Accident Sequence Evaluation Program);
• MPPS (Maintenance Personnel Performance Simulation).
O estudo da fiabilidade humana, e consequentemente o estudo de uma qualquer metodologia nesta área, considera-se pertinente para a investigação de desempenhos da manutenção. Para uma gestão da manutenção LARG em edifícios eficiente, será importante ponderar a fiabilidade dos meios humanos envolvidos, de forma a anular ou reduzir significativamente a possibilidade de erro nas suas atuações. A influência do erro humano é determinante na eficiência da manutenção que se pretende Agile e Resilient.
Pretende-se uma Manutenção Agile, que habilite as equipas de manutenção para uma rápida e eficiente resposta às ocorrências ou alterações de sistemas. Uma manutenção Agile tem um forte impacto na competitividade nos negócios, pois permite a mobilização dos seus recursos para acompanhar a alteração e evolução da tecnologia, dos materiais, dos mercados e das expectativas dos clientes, face ao serviço prestado. O aumento da fiabilidade humana proporcionará agilidade à manutenção e, consequentemente, eficiência nas suas atuações.
Por outro lado, pretende-se uma manutenção Resilient, pois num momento de adversidade numa grande estrutura ou edifício, a devida resiliência das equipas de manutenção permitirá lidar com problemas sob pressão, mantendo o equilíbrio das operações necessárias com segurança para os utentes e/ou intervenientes. Uma manutenção Resilient está capacitada para dar resposta a eventuais acidentes, catástrofes ou mesmo sobrecarga dos serviços ou utilização. Será uma manutenção com capacidade de se adaptar a mudanças ou alterações do seu padrão normal de atuação. A diminuição da probabilidade de erro humano, ou seja o aumento da fiabilidade humana, contribuirá para uma maior resiliência da manutenção.
4.3.2. Disponibilidade
O termo disponibilidade sugere uma noção de tempo, durante o qual determinado equipamento está disponível para a operação.
De acordo com a norma NP EN 13306 (2007), a disponibilidade é a aptidão de um bem para cumprir uma função requerida sob determinadas condições, num dado instante ou durante um dado intervalo de tempo, assumindo que é assegurado o fornecimento dos necessários recursos externos.
Disponibilidade é a probabilidade de um sistema, segundo condições de fiabilidade e manutibilidade definidas, realizar uma determinada função num instante de tempo ou num período definido.
A indisponibilidade ou “não disponibilidade” caracteriza o tempo de inatividade dos sistemas (tempo de não-produção), e pode-se definir como a probabilidade de um sistema não realizar a sua função num determinado instante de tempo ou num período definido.
O aumento da disponibilidade é alcançado se a fiabilidade e/ou a manutibilidade forem melhoradas. Com a redução da probabilidade de falha e/ou diminuição dos tempos de intervenção para realizar as atividades de manutenção, quer de carácter preventivo, quer corretivo, o tempo global em que o bem se encontra disponível para cumprir a sua função aumentará.
4.3.3. Manutibilidade
Segundo Ferreira (1998), manutibilidade é a probabilidade de recuperar um sistema nas condições de funcionamento especificadas, em prazos de tempo estabelecidos, quando as ações de manutenção são efetuadas nas condições e com os meios previstos.
Manutibilidade representa tudo o que poderá influenciar a aptidão de um sistema para receber manutenção (facilidade de acesso, condições de segurança, precisão, economia). A manutibilidade dos equipamentos e sistemas está diretamente relacionada com a rapidez e facilidade com que as intervenções de manutenção podem ser realizadas.
Ferreira (1998) apresenta ainda uma definição para manutibilidade como sendo a fiabilidade com que as reparações e o restante trabalho da manutenção é efetuado e afeta diretamente a disponibilidade dos equipamentos para efetuarem o serviço requerido. Pois, o tempo gasto na reparação de avarias e nas ações de manutenção preventiva, contribuem para a diminuição do tempo de exploração dos sistemas.
De acordo com a norma NP EN 13306 (2007), manutibilidade é a aptidão de um bem, sob condições de utilização definidas, para ser mantido ou restaurado, de tal modo que possa cumprir uma função requerida, quando a manutenção é realizada em condições definidas, utilizando procedimentos e recursos prescritos.
Os indicadores de manutibilidade são, primordialmente, medidas que indicam a aptidão do sistema para ser reparado para uma condição de bom funcionamento. Assim, ao total dos tempos de reparação (manutenção corretiva) do sistema, não devem ser somados os tempos de manutenção preventiva que efetivamente com o ativo possam ter sido despendidos.
O conceito de manutibilidade só deve ser utilizado quando se trata de bens reparáveis, uma vez que traduz a aptidão e consequente rapidez com que um ativo, após avaria, pode ser reposto no seu estado operacional.
Assim, Sobral (2010) observa que a manutibilidade de um sistema é a sua capacidade, expressa por uma probabilidade, de:
• Ser convenientemente reparado, ou seja, colocar no estado considerado operacional, para reposição do serviço;
• Num período de tempo conveniente;
• Sob condições operacionais e ambientais especificadas; • Por uma equipa ou operador habilitado.
Como a manutibilidade também pode ser traduzida por uma probabilidade, pode-se também ajustar aos tempos de reparação ou recolocação em serviço uma determinada distribuição estatística. Sobral (2010) refere que, à semelhança da fiabilidade, as distribuições estatísticas mais características, quando se efetuam estudos de manutibilidade, são Weibull, Exponencial, e Lognormal. Na investigação de Sobral (2010), são apresentadas algumas constatações sobre a utilização de distribuições estatísticas para ajustar aos tempos de reparação ou recolocação de sistemas em serviço.
4.3.4. Segurança
O conceito de segurança está intimamente ligado aos outros três elementos do acrónimo RAMS. Sobral (2010) menciona que torna-se evidente em aplicações consideradas críticas ou instalações de alto risco. Nomeadamente, se com a ocorrência de avarias ou indisponibilidade dos equipamentos estiverem em causa riscos para a vida humana, ambiente ou fatores económicos relacionados com a perda de bens ou cessação das atividades. Diz-se que existe segurança quando há ausência de risco não aceitável.
Em termos de segurança para aplicações criticas, Sobral (2010) aconselha que, deverão adotar-se mecanismos especiais, de forma a garantir que qualquer estado considerado inseguro não ocorra. Na eventualidade de acontecer, o sistema deverá acionar uma redução ou atenuação das suas consequências e a rápida recuperação para um dado estado considerado seguro.
O desenvolvimento de soluções tecnológicas, que restringem ou reduzem a possibilidade de falhas nos sistemas, com especial atenção nos sistemas críticos ou de alto risco, tem evidenciado grandes desafios no campo da investigação e engenharia.
Sobral (2010) aponta que os conceitos técnicos de segurança são baseados no conhecimento de: • Situações potencialmente perigosas dos sistemas;
• Característica de cada situação potencialmente perigosa, quanto à gravidade das suas consequências;
• Critérios de avaria contrários à segurança (modos de avaria, probabilidade de ocorrência, sequência ou coincidência de acontecimentos, estados operacionais, condições, etc.); • Manutibilidade dos bens (facilidade para executar manutenção, probabilidade de
ocorrência de erros durante as ações de manutenção, tempo para se atingir um estado de segurança, etc.);
• Sistema de exploração e manutenção (influência de fatores humanos, ferramentas, infraestruturas logísticas, procedimentos e controlos, etc.).
Assim, o conceito de segurança encontra-se diretamente ligado à noção de risco. A segurança é uma atividade interdisciplinar que se ocupa da identificação e da avaliação dos riscos inerentes a cada atividade específica. A segurança torna-se um tema inevitável quando se efetuam análises a instalações de risco elevado. Os estudos na área do RAMS justificam-se, portanto, nas instalações que apresentem potenciais riscos (vida humana, económicos, ambientais).
Como definição clássica, o risco é basicamente composto por duas componentes, uma é a incerteza quanto à ocorrência dos acontecimentos futuros e a outra refere-se à dimensão ou intensidade das consequências de cada acontecimento possível.
O risco envolve acontecimentos futuros de consequências incertas, tipicamente relacionados com aspetos como a vida humana, bens materiais ou consequências ambientais, por vezes, também
relacionados com valores monetários, traduzindo o risco em valores mais palpáveis e fáceis de analisar.
Sobral (2010) atribui uma definição mais precisa do risco, que pode ser expressa pelo valor esperado, por unidade de tempo, das consequências de determinado processo. Portanto, o risco é uma combinação da probabilidade de dano e a sua severidade, enquanto a segurança se relaciona com a ausência de risco considerado inaceitável.
Entre as várias metodologias disponíveis para a análise de risco, Sobral (2010) salienta a Árvore de Acontecimentos (ETA - Event Tree Analysis) para determinar a probabilidade das várias consequências de acontecimentos e a Árvore de Falhas (FTA - Fault Tree Analysis) para calcular a probabilidade de ocorrência de cada acontecimento. Nesta investigação são apresentadas e aplicadas estas metodologias na análise de barreiras de segurança em instalações industriais de risco elevado. Julgam-se ser metodologias também adequadas para a análise de risco em edifícios e de contributo significativo para uma abordagem LARG à gestão da manutenção em edifícios.
O mesmo autor desenvolveu, ainda, a metodologia RODS (Reliability Of Dormant Systems) especialmente para a determinação da probabilidade de falha em equipamentos tipo “dormat” (equipamentos num estado adormecido, na configuração operacional normal e ligado, mas não em operação). Esta ferramenta pode ser utilizada para modelar o cálculo da fiabilidade das barreiras de segurança contra incêndios, geradores, entre outros ativos que normalmente se encontram instalados em estado “dormat”, em edifícios e grandes estruturas. A metodologia RODS é uma técnica que permite a análise da indisponibilidade de componentes necessários na fase de arranque de equipamentos em instalações críticas. O conhecimento do potencial risco, inerente a essas instalações, permitirá definir critérios para aceitação do risco, no caso de este ser tolerável, ou criar mecanismos para a sua redução.