Você está na página 1de 30

TÉCNICAS DE ANÁLISE E MONITORAMENTO

ESTATÍSTICO APLICADOS AOS DADOS 3W

Felipe da Costa Silva*


*
Programa de Engenharia Química/COPPE, Universidade Federal do Rio de Janeiro, Cidade
Universitária, Rio de Janeiro, Brasil

Resumo: O constante aprimoramento dos sistemas tecnológicos contribui intensamente para na


qualidade e no aumento do número de dispositivos de medição na indústria de processos. Diante
da decorrente disponibilidade de grandes volumes de dados, inicia-se uma mudança de
paradigma em que a aplicação de técnicas livres de modelos (Model-Free) aparenta ser mais
adequada para identificar padrões de mudanças de processo e o seu monitoramento. O setor de
óleo e gás apresenta grande desafios quanto ao monitoramento de eventos indesejados que
podem provocar perdas de produção, danos ao meio ambiente e perdas humanas. Por conta
disso, o presente trabalho tem como objetivo a aplicação de técnicas de análise e monitoramento
estatístico ao conjunto de dados de poços de petróleo denominado 3W. Para isso, foi proposto
o uso da técnica PCA e do espectro de variância para avaliar o comportamento dinâmico do
processo e atribuir métricas para detecção de falhas com base em dados reais de oito variáveis.
A técnica PCA mostrou-se limitada para interpretar o conjunto de dados devido ao inerente
comportamento dinâmico dos poços de petróleo. Por sua vez, as técnicas baseadas nas
características estatísticas foram capazes de explicar a dinâmica dos poços e atribuir uma
métrica de correlação entre duas variáveis que possibilitou a identificação do evento indesejado
de fechamento espúrio da válvula de fundo de poço (DHSV), contribuindo para a sua detecção
prévia.

Keywords: statiscal analysis; data-driven; model-free; variance; PCA; variance spectra; fault.

1 INTRODUÇÃO Os controladores tradicionais (PID,


MPC etc.) apresentam ação de controle
A busca por melhorias nos setores de baseada na fenomenologia do processo. Por
produção das indústrias químicas e outras conta disso, estudos de modelagem
indústrias relacionadas têm ganhado grande fenomenológica têm sido desenvolvidos
destaque nas últimas décadas. Incessantes para melhorar a caracterização dos efeitos
esforços têm sido destinados a garantia da decorrentes de mudanças nas variáveis do
qualidade dos produtos fabricados, a processo, permitindo uma ação de controle
segurança operacional, a eficiência de assertiva. [2]
geração de recursos e a redução do seu Paralelamente a essa vertente, os
impacto ambiental. [1] sistemas de instrumentação em plantas
Guiados por essa demanda, processos químicas e a acurácia dos dispositivos de
químicos modernos tem se destacado por medição (sensores) tem aumentado nas
seu investimento nos setores de controle e últimas décadas, permitindo a coleta e
automação de processos. Tal investimento estocagem de um grande volume de dados
visa promover o controle de um elevado de variáveis de processo. Tais informações
número de variáveis de processo, as quais podem ser usadas em estratégias de controle
podem estar suscetíveis a efeitos de de processo ou podem ser empregadas para
distúrbios que podem acarretar na mudança a detecção de falhas (desvios indesejáveis
indesejada da especificação do produto.[1,2]
COQ866 – Estimação de Parâmetros e Planejamento Experimental

de pelo menos um comportamento nomeado como 3W, que contêm eventos


característico ou variável de processo).[2,3] indesejáveis em poços de petróleo
A base fenomenológica dos pertencentes à Petrobrás. Tais dados podem
controladores clássicos não permite sua ter o potencial para serem utilizados como
atuação satisfatória em regiões de falhas (ou benchmarks para o desenvolvimento de
de eventos indesejáveis). Para contornar técnicas para diversas tarefas associadas
essa lacuna, o uso de procedimentos de com eventos indesejáveis em poços de
controle estatístico de processos (SPC) se petróleo. O grupo de pesquisadores
torna adequado, tendo por base a aplicação composto por Vargas utilizou esse conjunto
de métodos de monitoramento para de dados para a implementação de técnicas
detecção, diagnóstico e eventual remoção de classificação supervisionadas
de tais falhas ou de qualquer outro evento direcionadas a modelos preditivos. [7]
anormal que comprometa o comportamento No presente trabalho, o banco de dados
do processo.[2,4] 3W será explorado através da sua
SPC é uma ferramenta de caracterização estatística e do emprego de
monitoramento do processo que está técnicas estatísticas que permitam verificar
associado com a melhoria do processo a integridade dos dados e a sua correlação,
através do reconhecimento de informações assim como a definição de métricas para
de comportamentos anômalos, permitindo a detecção de anomalias características.
implementação de ações que conduzem a
redução da variabilidade, o aumento da 2 REVISÃO BIBLIOGRÁFICA
confiabilidade e da qualidade do produto. [2-
4] Um conjunto de técnicas de análise de
O acúmulo de banco de dados de dados multivariadas foram desenvolvidas e
variáveis de processos nas indústrias, as aprimoradas desde o início do século
dificuldades de custo e de tempo para passado (por exemplo, por Pearson[8] em
desenvolvimento de modelos cada vez mais 1901). As técnicas mais conhecidas e
específicos para plantas industriais e a comumente empregadas são: Análise de
crescente demanda por processos com Componentes Principais (PCA), Análise
melhores desempenhos são os principais Discriminante Linear ou Análise de Fisher,
fatores que justificam a tendência de Análise de Componentes Independentes,
desenvolvimento e implementação de Análise de Correlação Canônica, Redução
técnicas de monitoramento estatístico de por Regressão de Posto, Mínimos
processos direcionadas a dados (Data Quadrados Parciais (PLS) e Redundância
Driven).[2,5,6] Máxima.[3]
Técnicas baseadas em modelos se As técnicas citadas anteriormente se
tornam pouco relevantes em um cenário em baseiam na redução de dados através do
que dados são gerados em grande volume e estabelecimento de variáveis latentes. Estas
variedade. É possível inferir que modelos por sua vez são capazes de extrair as
de processos são visualizados como uma principais características do conjunto de
aproximação do comportamento do sistema dados, permitindo também verificar a
com alguns erros[11]. Nesse sentido, o correlação entre as variáveis de processo.
estudo de métodos direcionados aos dados Dentre as técnicas em questão, a análise
sem a utilização de modelos (Model-Free) PCA é a técnica de monitoramento
se torna mais interessante, ou até mais multivariado mais antiga. Maiores
adequado, para ser aplicado no detalhamentos serão fornecidos a
[3,5,9]
monitoramento de processos. seguir.
Vargas et al. (2019) divulgou um banco
de dados realistas originados de três
diferentes fontes de poços de petróleo,
2
COQ866 – Estimação de Parâmetros e Planejamento Experimental

2.1 Análise dos componentes principais valores característicos L e de vetores


característicos P, de acordo com a seguinte
A aplicação da análise dos componentes equação[5,10,13,18]:
principais ou PCA resulta na criação de N
novas variáveis não correlacionadas pela 𝑆𝑋𝑋 = (𝐾 − 1)−1 𝑋 𝑇 𝑋 = 𝑃𝐿𝑃𝑇 (2)
combinação linear de N variáveis originais,
mantendo a variabilidade total do sistema. Como resultado, a nova matriz de dados
Essas variáveis podem ser descritas como (T) será composta por N componentes
combinações lineares das variáveis principais, em que o componente t 1
originais, oriundas de um rotacionamento expressa a maior variabilidade do sistema, o
do espaço, resultando num espaço com componente t2 expressa a segunda maior
vetores ti, chamados de vetores variabilidade e assim por diante. Tais
característicos, ortogonais entre si (Figura componentes são ortogonais entre si e são
1). Seu emprego possibilita a redução da definidos por[5,13]:
dimensionalidade do sistema pela utilização
dos seus componentes principais, os quais 𝑡𝑖 = 𝑋𝑝𝑖 (3)
são organizados pela quantidade de , onde 𝑝𝑖 são os vetores característicos da
informações extraídas do sistema.[2,3,5,10] matriz de covariância de X, também
chamados de loadings, e 𝑡𝑖 são os
componentes principais, o qual possui
variância equivalente ao valor característico
(li) correspondente e que possui
componentes comumente chamados de
scores.
Logo, para um processo com variáveis
correlacionadas, os primeiros componentes
principais serão responsáveis por descrever
a maior parte da informação do sistema, ou
seja, os sinais intrínsecos. Os demais
componentes serão parte do espaço residual
(E), caracterizando os ruídos do processo. A
seguinte relação pode ser estabelecida entre
Figura 1 – Gráfico demonstrando a rotação dos a matriz de variáveis originais e os espaços
eixos do PCA. Fonte: Jiang et al. (2013) principal e residual[5]:
Dado um conjunto de dados (𝑋 ∗ ) a ser
analisado, é comum realizar uma 𝑋 = 𝑇𝑃𝑇 + 𝐸 (4)
normalização quando há diferenças de
grandezas entre as observações das Como resultado da aplicação da técnica,
variáveis, a qual pode ser calculada por: as correlações entre as variáveis podem ser
utilizadas como métricas na detecção de

𝑥𝑘𝑖 − 𝜇𝑖 falhas, cuja ocorrência geralmente está
𝑥𝑘𝑖 = (1) associada a uma quebra de correlação entre
𝜎𝑖
, onde 𝑥𝑘𝑖 são os elementos da matriz 𝑋𝑘 𝑥 𝑁 as variáveis de processo.
(k observações e N variáveis) normalizados No presente trabalho, a determinação do
com média (µ) zero e variância (𝜎 2 ) número de componentes principais
unitária. integrantes do espaço principal será dado
A matriz de covariância (𝑆𝑋𝑋 ) pode ser pela regra de percentagem de variância
determinada por (𝐾 − 1)−1 𝑋 𝑇 𝑋 . Aplicando acumulada (cumulative percentage
a técnica de decomposição matricial a essa variance). Esse teste é determinado pela
matriz, é possível determinar a matriz de soma da variância dos componentes
3
COQ866 – Estimação de Parâmetros e Planejamento Experimental

principais, correspondente aos valores matriz de recorrência[12], que será abordada


característicos, com relação a variabilidade na próxima subseção.
máxima do sistema, que conduz a um valor Feital e Pinto (2015) apresentaram novas
superior ao limite de variância acumulada técnicas baseadas no espectro de
do sistema (CPV).[3] (co)variância para utilização no
desenvolvimento e implementação de
∑𝑛𝑖= 1 𝜆𝑖 validação de sistemas de medição e no
𝐶𝑃𝑉 = 100% (5) controle de qualidade em fábricas.[6]
∑𝑁𝑖=1 𝜆𝑖
O espectro de (co)variância pode ser
Em análises multivariadas, é rotineiro o interpretado como uma série de variâncias
uso de estatísticas junto a técnica PCA para calculadas ao longo de uma amostra de uma
critérios de controle e monitoramento. A série temporal de dados enquanto uma ou
estatística de erro de predição quadrático - mais variáveis tem a sua grandeza alterada.
SPE (Squared Prediction Error) está Esse permite determinar as seguintes
relacionada com a variabilidade da matriz características: o comportamento de um
de erro residual E (Equação 6). A hipótese sinal ao longo do tempo, o mínimo e o
de distribuição gaussiana imposta as máximo de variância em uma amostra de
variáveis pelo emprego da técnica PCA série temporal, comportamentos
resulta na distribuição qui-quadrado para o tendenciosos e outras características
índice SPE, dependendo de um único relacionadas a sinais.[6]
parâmetro relacionado ao conjunto Uma abordagem de janelas móveis pode
amostral. A adição dessa estatística permite ser utilizada para a construção do espectro
impor um limite de confiança para a de (co)variância. Para isso, varia-se o
variância do sistema, cujo rompimento pode comprimento (w) da janela e calcula-se a
estar associado a uma quebra de correlações média e a mediana através do seu
existentes entre as variáveis.[18,19] deslocamento ao longo de uma série
temporal, permitindo a construção de um
𝐸 = 𝑋 − 𝑇𝑃𝑇 (6) diagrama variância versus w. Uma das
características que podem ser retiradas
𝑆𝑃𝐸 ~ 𝐶ℎ𝑖 (𝜒 2 ; 𝜐) (7) desse diagrama é a saturação de
informações do sistema, ocorrendo quando
não há variabilidade significativa para um
2.2 Espectros de variância e
aumento no comprimento de janela[6].
covariância
Uma observação importante do ponto de
Em um estágio tecnológico em que vista estatístico é a medição do erro. Dados
grandes quantidade de dados são gerados e industriais não apresentam réplicas, pois
armazenados a uma elevada velocidade, não há viabilidade para utilização de
começa a ocorrer, ainda de forma branda, múltiplos sensores idênticos atuando no
uma mudança de paradigma, em que a mesmo ponto de medição e ao longo de todo
necessidade de modelos matemáticos para o espaço de operação. Para contornar esse
explicar e identificar fenômenos e problema, o estudo propôs que a
processos começa a ser sobreposta pelo variabilidade originada do uso de tamanhos
aumento do uso e do surgimento de novas de janelas muito pequenos, com variação de
técnicas voltadas aos padrões e assinaturas tempo de amostragens 10% inferior ao
estatísticas dos dados, principalmente no tempo total, permite caracterizar o ruído dos
campo de monitoramento de processos. medidores. Tal observação só é possível
Nesse contexto, as seguintes técnicas pois assume-se que observações
model-free podem ser citadas: o espectro de consecutivas, com tamanho de janela w = 2,
variância, o espectro de covariância[6] e a representam replicações da mesma
medida.[6]
4
COQ866 – Estimação de Parâmetros e Planejamento Experimental

por sua confiabilidade perante o ambiente


2.3 Matriz de recorrência hostil.[7]
O arquivo de dados divulgado por
Fadel (2018) apresentou uma nova Vargas et. al (2019) é composto por oito
estratégia para monitoramento via Matriz variáveis: PDG (medida de pressão
de Recorrências. Sua motivação teve como proveniente de um medidor de fundo de
base a dificuldade encontrada pelas técnicas poço, do inglês Permanent Downhole
Data-Driven atuais para modelagem do Gauge), TPT (medidas de pressão e
comportamento dinâmico de um temperatura provenientes de um transdutor,
[12]
processo. do inglês Temperature and Pressure
A técnica de Matriz de Recorrências Transducer), CKP (Pressão a montante e
sugerida se divide em algumas etapas. A Temperatura a jusante da válvula choke),
primeira etapa consiste na construção de um CKGL (Pressão e Temperatura) e QGL
conjunto de matrizes de distâncias padrão (Vazão volumétrica). Suas observações em
para representar o comportamento normal todo o período de armazenamento de
de operação de uma planta. A construção informações (2012-2018) foram
dessa matriz de referência é realizada pela previamente rotuladas em um período
utilização de duas janelas (W1 e W2), normal (sem eventos indesejáveis) e em oito
defasadas em D amostras, que tem por situações em que foram detectadas
função percorrer as séries temporais que anomalias nos poços de petróleo.[7]
contém o comportamento padrão do Os seguintes eventos indesejáveis são
processo. Cada deslocamento ocorre sem observados no conjunto 3W:
superposição de janelas e retorna uma
matriz de distâncias compostas pelas duas • Aumento abrupto do BSW:
janelas. [12] correspondente ao aumento do percentual
De posse desse conjunto padrão, a etapa de água e sedimentos (BSW) nas amostras
seguinte consiste na utilização de uma de óleo, ocasionado por um aumento da
métrica (Norma de Frobenius) para a produção de água do aquífero do
comparação entre as matrizes de referência, reservatório natural ou da sua injeção
seguidos do cálculo da média das normas. natural durante a etapa de declínio da
Isso é necessário para gerar um limiar de produção por esgotamento do poço;[7]
detecção a ser aplicado no monitoramento.
Dessa forma, é possível utilizar essas • Fechamento espúrio do DHSV: o
ferramentas para comparar novas matrizes DHSV (Downhole Safety Valve) é uma
de distância e analisar o seu válvula de segurança posicionada no duto
comportamento.[12] de produção, tendo por objetivo assegurar o
encerramento do poço no caso do
2.4 O conjunto de dados 3W encerramento da sua conexão com a
unidade de produção, de emergências ou
O termo 3W, proveniente do inglês three defeitos nos equipamentos da superfície.
wells, correspondente as suas três fontes de Seu fechamento incorreto não é identificado
informações (ocorrências) de eventos em pelos dispositivos na superfície, podendo
poços de petróleo: reais, simuladas e levar a perdas de produção;[7]
esboçadas (hand-drawn). Tal conjunto é
formado por séries temporais multivariadas • Produção em golfadas graves
provenientes de oito variáveis de processo (Severe slugging): ocorre quanto há uma
monitoradas na Petrobras, tendo por alternância de fluxo de gases e líquidos,
justificativa uma razão custo-benefício criando diferença de pressão e flutuações de
vinculada a disponibilidade de vazão que são detectadas por todos os
instrumentação em posições estratégicas e equipamentos. O fenômeno apresenta um
5
COQ866 – Estimação de Parâmetros e Planejamento Experimental

comportamento periódico. Em condições Com relação a dimensão das variáveis


extremas, pode conduzir ao fim da em análise, foram consideradas as unidades
produção e encerramento do poço;[7,15] de Pascal (Pa), metro cúbico padrão por
segundo (sm3/s) e graus Celsius (°C). A
• Instabilidade de fluxo: durante essa fonte do conjunto de dados está presente em
instabilidade, pelo menos uma das variáveis um repositório no GitHub
manipuladas comportamento oscilatório (https://github.com/ricardovvargas/3w_dat
com mudança relevante, mas de amplitude aset).
tolerável. Não possui periocidade. Tal
instabilidade pode progredir para uma 3 PROPOSTA
produção em golfadas graves (ou
severas);[7] O presente trabalho propõe o emprego
das técnicas multivariadas de espectro de
• Perda rápida de produtividade: É variância/covariância e PCA para análise do
caracterizada pela redução do fluxo ou o seu conjunto de dados de poços de petróleo
cessar em função da alteração das divulgado por Vargas et al. e disponível em
propriedades do poço, como a pressão <https://github.com/ricardovvargas/3w_dat
estática do reservatório, porcentagem de aset.>.
sedimentos e água, viscosidade do fluido, As técnicas model-free baseadas em
diâmetro da linha de produção, entre outros. padrões e assinaturas estatísticas serão
Sua identificação prévia permite a mudança aplicadas inicialmente para permitir a
do ponto operacional pela equipe de compreensão dos dados, tendo em vista a
operadores;[7] carência de um tratamento preliminar
decorrente da sua recente divulgação.
• Rápida restrição no PCK: PCK Tendo a etapa anterior sido concluída
(Production Choke) é uma válvula de com êxito, pretende-se utilizar a técnica de
controle responsável pelo controle do poço matriz de recorrências proposta por Fadel e
na superfície. Sua operação (acima de uma outras técnicas, como o PCA, para o
porcentagem padrão e em um curto monitoramento e diagnóstico de falhas.
intervalo de tempo) pode levar a restrições Todas as análises serão realizadas
indesejadas que podem eventualmente utilizando Python, por ser uma linguagem
conduzir a problemas operacionais;[7] de programação de código aberto, de alto
nível, de sintaxe intuitiva, de ambiente
• Incrustação no PCK: Resultante da amigável para programação e por ser amplo
deposição de compostos inorgânicos no emprego em análises Big Data e nas áreas
estrangulador (choke), podendo conduzir a de Machine Learning e Data Science.
redução da produção de óleo e gás. Sua <www.python.org/>
identificação permite a injeção de um O conjunto de dados 3W é composto ao
inibidor.[7,16] todo por 1984 arquivos de dados do tipo
CSV (comma-separeted values). Por conta
do elevado volume de dados, propõe-se a
• Hidrato na linha de produção: É um
aplicação das técnicas estatísticas
dos maiores problemas na indústria de
petróleo, apresentando estrutura cristalina abordadas anteriormente em arquivos
pontuais que retornem informações
semelhante ao gelo por ser formado pela
interação entre água e gás natural em altas relevantes as abordagens propostas
anteriormente.
pressões e baixas temperaturas. Sua
ocorrência pode conduzir a uma interrupção
total do escoamento.[7,17]

6
COQ866 – Estimação de Parâmetros e Planejamento Experimental

4 METODOLOGIA 4.2 Análise dos componentes principais


(PCA)
A presente seção está dividida nos
seguintes procedimentos metodológicos A tradicionalidade da técnica PCA e a
empregados na análise do conjunto de facilidade da sua implementação e
dados 3W: Caracterização estatística dos interpretação justificam o seu uso no
dados, análise das assinaturas estatísticas presente trabalho. Sua aplicação tem por
pelo uso dos espectros de variância e/ou objetivo a redução da dimensionalidade do
covariância, emprego da técnica PCA para conjunto de dados 3W, com preservação da
redução da dimensionalidade do sistema e máxima variabilidade dos dados, pelo uso
busca por correlações e o emprego da dos seus componentes principais.
técnica de matriz de recorrência proposta Adicionalmente, o modelo residual
por Fadel[12] com o intuito de determinar composto pela matriz E (Equação 6) pode
métricas que possibilitem a detecção de ser utilizado como métrica para o índice de
falhas. erro de predição quadrático - SPE,
permitindo avaliar possíveis violações da
região de confiança da variância do
4.1 Caracterização estatística
sistema[3,18,19].
Conjuntos de dados industriais As abordagens foram aplicadas a dados
comumente apresentam lacunas de dados de condições normais e de eventos
decorrentes de variáveis “congeladas” (que indesejados (falhas). O caso estudado levou
apresentam a mesma medida ao longo da em consideração um grau de confiança de
série temporal), valores NaN (do inglês not 95% e limite de variância acumulada (CPV)
a number), valores pouco variantes de 90%.
ocasionados por problemas com os
medidores, observações ausentes, entre 4.3 Espectros variância e covariância
outros. Essas ocorrências podem interferir
na análise dos dados, principalmente em Por último, empregou-se as técnicas de
técnicas que empregam inversão de análise de dados com base nas assinaturas
matrizes em função do seu comportamento estatísticas correspondente aos espectros de
singular. Por conta disso, a etapa de variância e covariância. O principal
caracterização estatística se torna um ponto objetivo é avaliar o padrão estatístico das
importante no presente trabalho, permitindo variáveis durante o período normal e
verificar a quantidade de dados durante o período de falha, visando
corrompidos/ausentes decorrente desses identificar padrões de comportamento pela
problemas. mudança do espectro.
O emprego dessa análise no conjunto de Espera-se que o espectro de variância
dados 3W objetiva determinar o número informe o comportamento da variabilidade
total e tipo de variável (numérico, texto, dos dados e as condições de saturação.
booleano etc.), número total de Quanto ao espectro de covariância, deseja-
observações, número de observações se avaliar o grau de dependência funcional
ausentes, variáveis congeladas, média e entre as variáveis e a sua mudança em
variância. A ferramenta utilizada nessa períodos de falha.
etapa foi o pacote Pandas Profiling para
Python, por sua capacidade de gerar um Por conta do elevado volume de dados e
relatório do perfil estatístico dos dados. de ausência de determinadas variáveis para
cada poço, foram estabelecidos três estudos
de caso:

7
COQ866 – Estimação de Parâmetros e Planejamento Experimental

i. Determinar comportamento estatístico


das variáveis pela aplicação da técnica Tabela 1 – Registro dos arquivos de dados da
para dois turnos (~5h) de coleta de condição de operação Normal.
dados, comparando-os e verificando se
estão correlacionados ou não. Condição Normal (0) Arquivos
ii. Comparar os espectros entre poços para well-00001 94
avaliar o seu comportamento dinâmico. well-00002 210
iii. Aplicar a técnica para diferentes well-00003 26
condições de falha, buscando identificar well-00004 12
padrões de comportamento. well-00005 81
well-00006 115
5 RESULTADOS well-00007 2
A seção trata dos principais resultados well-00008 57
obtidos para a caracterização estatística dos Total 597
dados e para a aplicação das técnicas de
análise dos componentes principais e de
espectro de variância e de covariância (ou
correlação) para cada um dos estudos de
caso definidos na seção anterior. As rotinas
computacionais utilizadas encontram-se
disponíveis no Apêndice B.

5.1 Caracterização estatística e


comportamento dinâmico dos poços
A etapa de caracterização estatística
consistiu na avaliação dos conjuntos de
dados explorados, permitindo identificar as
variáveis que precisam ser excluídas das
análises posteriores devido a sua
irrelevância do ponto de vista numérico,
assim como a determinação da média e da Figura 2 – Ilustração da árvore de natal submarina em um
variância das demais variáveis. poço de elevação natural (Vargas et al., 2019).
O primeiro passo consistiu na análise
exploratória dos dados correspondentes a
condição normal do sistema, permitindo
determinar um conjunto de interesse

Tabela 2 – Relatório estatístico de variáveis e observações ausentes.

Série de dados - Condição Nº observações Nº observações Variáveis Variáveis


Normal por variável ausentes ausentes congeladas
WELL-00001_20170201020207 17874 17874 1 2
WELL-00001_20170201070114 17927 17927 1 2
WELL-00002_20170209120022 17979 17979 1 3
WELL-00007_20170801180000 7185 14370 2 0

8
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Tabela 3 – Relatório estatístico da média e variância das séries de dados multivariadas da condição normal em análise.

Característica P-MON- T-JUS- P-JUS- T-JUS-


Série de dados estatística P-PDG P-TPT T-TPT CKP CKP CKGL CKGL QGL

Média - 100,55 119,03 15,8 84,23 15,66 - -


WELL-
00001_20170201020207 Variância - 0,045 0,0013 3,18 0,17 0,00012 - -

Média - 100,19 119,03 15,76 84,15 15,7 - -


WELL-
00001_20170201020207 Variância - 0,031 0,00081 3,19 0,18 0,00011 - -

Média - 82,48 117,03 17,45 73,97 - - -


WELL-
00002_20170209120022 Variância - 0,22 0,033 6,76 0,35 - - -

Média 224,49 130,29 55,8 34,42 39,83 - - 1,58


WELL-
00007_20170801180000 Variância 0,0028 0,012 0,0002 0,2 0,007 - - 0,00011

composto pelas oito variáveis medidas. caso, é ainda mais extremo, pois os
Como resultado, foi possível realizar um dispositivos de medição estão submetidos a
registro da quantidade de poços de petróleo condições ambientais severas. Por exemplo,
(oil wells) e dos seus arquivos a variável P-PDG corresponde a medida de
disponíveis (Tabela 1). As variáveis pressão de uma válvula de fundo de poço,
medidas são: P-PDG, P-TPT, T-TPT, P- localizada no tubo de produção (Figura 2),
MON-CKP, T-JUS- CKP, P-JUS-CKGL, interno a árvore de natal submarina (subsea
T-JUS-CKGL e QGL. christmas tree), próximo ao fundo do mar.
Em uma primeira etapa, foi gerado o Sua localização torna sua manutenção
relatório estatístico para cada um dos casos custosa em caso de falha, justificando a
de estudo detalhados na Tabela 2. Nota-se a ausência da sua medida em vários dos
ausência de alguma variável em todas os conjuntos de dados explorados e que serão
casos selecionados, que é uma característica exibidos em uma etapa posterior.[7,20]
comum ao trabalhar com dados reais. Nesse

Figura 3 – Sinal da instância normal para o poço WELL-00001 (2017-02-01/02-07h).

9
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 4 – Sinal da instância normal para o poço WELL-00001 (2017-02-01/02-07h).

A Tabela 3 apresenta as características dificulta a aplicação efetiva das técnicas


estatísticas de média e variância dos estatísticas para estudo do comportamento
principais conjuntos de dados analisados no dinâmico do sistema, assim como a
presente trabalho. Verifica-se a ausência de determinação de métricas para detecção de
uma ou mais variáveis nos conjuntos de falhas.
dados analisados, característica que 5.1.1 Dinâmica dos poços de petróleo
entre turnos de operação

O estudo do comportamento dinâmico


dos poços iniciou-se com a comparação das
características estatísticas e dos sinais
provenientes dos dispositivos de medição
entre dois turnos sequenciais de operação.
Os dados de caracterização estatística
presentes na Tabela 3 para o poço W-00001
demonstram que não há diferença
significativa entre as suas médias e
variâncias, podendo ser um indicativo de
que os turnos não representam eventos
independentes, eles estão correlacionados,
que é o comportamento esperado. O mesmo
comportamento pode ser verificado pela
comparação dos sinais presentes nas
Figuras 3 e 4, os quais apresentam
visualmente baixa variabilidade de
intensidade de sinal.
De modo a fortalecer essa observação, a
técnica PCA foi aplicada aos dois conjuntos
de dados. Para isso, foram realizados
Figura 5 – Diagrama de variância acumulada para a tratamentos para a remoção de valores NaN
análise PCA aplicada aos dois primeiros turnos do poço
WELL-00001 (2017-02-01/02-07h) e (2017-02-01/07- e nulos e foi considerado que o dispositivo
12h). responsável pela variável P-JUS-CKGL
estava com defeito, pois sua baixa
10
COQ866 – Estimação de Parâmetros e Planejamento Experimental

variabilidade não é um comportamento de comportamento não é explicado pela


esperado para um sistema real. Apesar das técnica PCA devido a sua base linear.
variáveis P-TPT e T-TPT terem É conhecido que a técnica PCA
apresentado comportamentos constantes considera distribuição gaussiana para o
durante vários intervalos de coleta de dados, conjunto de dados e o SQE considera
suas medidas não foram desprezadas nesse distribuição qui-quadrado. Com o propósito
estudo. Como resultado, foram obtidos 4 de assegurar que os resultados provenientes
componentes principais para ambos os dessas técnicas são válidos, verificou-se o
casos (Figuras 5), indicando que essas cumprimento dessas condições pelas
variáveis não se correlacionam. É válido distribuições de dados na forma de gráfico
ressaltar que uma simulação foi realizada de barras presentes no Apêndice A. Esse
para verificar a influência da variável P- estudo permitiu verificar que os sensores T-
JUS-CKGL na análise, resultando no MON-CPK e T-JUS-CPK apresentaram um
mesmo número de componentes principais perfil semelhante ao gaussiano,
por conta de um indicativo de correlação comportamento ideal para a aplicação das
com as outras variáveis de medidas de técnicas em questão. No entanto, as
pressão. variáveis correspondentes ao dispositivo
Quanto aos índices SQE, dado pelas TPT apresentaram um perfil completamente
Figuras 6 e 7, verificou-se violações do diferente, com picos esporádicos ao longo
limite de confiança de 95% com um do tempo, violando completamente as
comportamento quase-periódico, podendo hipóteses da técnica PCA. Apesar de um
ser interpretado como uma possível forte indicativo de que a técnica PCA em
característica dinâmica do poço. Esse tipo sua forma primitiva não é adequada para a
análise estatística do conjunto de conjunto

Figura 6 – Limite SPE junto ao PCA para o poço WELL-00001 (2017-02-01/02-07h).

Figura 7 – Limite SPE junto ao PCA para o poço WELL-00001 (2017-02-01/07-12h).

11
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 8 – Espectro de variância da variável P-TPT para o poço WELL-00001 (2017-02-01/02-07h).

de dados em questão, optou-se por utilizá-la uso de janelas de tamanho variável


para verificar o comportamento de um outro (acopladas e desacopladas). Para isso, foi
poço de petróleo, com resultados mostrados utilizada a classe Spectra criada por
em uma etapa posterior. Melo[21] no projeto spectra, com base nas
Como o presente trabalho consiste na técnicas de espectro de variância,
exploração de dados de operação de poços covariância e correlação propostas pro
de petróleo, é mais coerente fazer uso de Feital e Pinto[6].Os espectros gerados para o
técnicas que não sejam baseadas em modelo primeiro turno do poço W-0001 são
e que permitam avaliar as características ilustrados pelas Figuras 8-12, podendo ser
estatísticas das variáveis. Nesse sentido, analisados com base na caracterização do
empregou-se a técnica de espectro de seu comportamento, na observação da
variância que permite desmembrar as influência do tamanho de janela e na
grandezas estatísticas (médias, medianas e amplitude da variância capturada.
variância) em várias escalas de tempo pelo

Figura 9 – Espectro de variância da variável T-TPT para o poço WELL-00001 (2017-02-01/02-07h).

12
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 10 – Espectro de variância da variável P-MON-CKP para o poço WELL-00001 (2017-02-01/02-07h).

Figura 11 – Espectro de variância da variável T-JUS-CKP para o poço WELL-00001 (2017-02-01/02-07h).

Como pode-se notar, quase todos os Os espectros correspondentes as


espectros correspondentes a janelas variáveis P-MON-CKP e T-JUS-CKP
disjuntas apresentaram saltos e para janelas (Figuras 10 e 11) apresentaram saturação
adjuntas surgiram pequenas “barrigas” rápida de variância, com um tamanho de
provenientes de flutuações nas variâncias, janela pequeno. Notou-se um
conforme observado por Melo no projeto comportamento curioso para a variável P-
spectra[21]. A única exceção corresponde a MON-CKP, em que há uma redução da
variável P-JUS-CKGL (Figura 12) que variância com o aumento do tamanho de
apresentou um crescimento bem janela. Maiores informações só podem ser
comportado da variância com o aumento do obtidas pela comparação com a dinâmica de
tamanho de janela, com janelas disjuntas outros poços.
menos dispersas. Acredita-se que este É importante destacar que
comportamento de baixa variabilidade aparentemente o espectro de variância não
esteja associado ao crescimento linear da foi influenciado pelo comportamento
pressão ao longo do tempo. anormal aparesentado pela distribuição dos

13
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 12 – Espectro de variância da variável P-JUS-CKGL para o poço WELL-00001 (2017-02-01/02-07h).

dados para os dispositivos TPT comentado indicativo de que não há correlações


anteriormente. Dessa forma, o proeminentes entre as variáveis com dados
comportamento característico dessas disponíveis. Apesar disso, empregou-se a
distribuições não é relevante para o presente técnica de espectro de correlação dinâmico
trabalho. para conferir a evolução da correlação entre
Com o propósito de descobrir métricas as variáveis à medida que um determinado
para a detecção de falhas, realizou-se uma comprimento de janela avança na série
busca por variáveis com alto grau de temporal com um passo constante. Os
correlação. A técnica PCA já havia dado um espectros foram gerados com tamanhos de

Figura 13 – Espectro de correlação entre as variáveis P-TPT/P-MON-CKP (𝑤 = 50 e ∆𝑡 = 10) para o poço


WELL-00001 (2017-02-01/02-07h).

14
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 14 – Espectro de correlação entre as variáveis P-TPT/P-MON-CKP (𝑤 = 100 e ∆𝑡 = 10) para o poço
WELL-00001 (2017-02-01/02-07h).

janela variando de 50 a 100 e passo de correlação entre as variáveis P-TPT e P-


tempo (∆𝑡) fixo de 10 unidades de tempo. MON-CKP ilustrado pelas Figuras 13 e 14.
Como resultado, foi confirmada a baixa A mesma análise estatística foi aplicada
correlação entre as variáveis, que pode estar ao conjunto de dados correspondente ao
associado a ausência de observações segundo turno do poço em questão. Notou-
relatada na Tabela 2. Por conta da baixa se que os espectros de variância (Figuras
correlação, os espectros não apresentaram 15-19) não apresentaram mudanças
mudanças significativas com a variação do significativas nas grandezas estatísticas,
tamanho de janela, conforme exemplo da

Figura 15 – Espectro de variância da variável P-TPT para o poço WELL-00001 (2017-02-01/07-12h).

15
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 16 – Espectro de variância da variável T-TPT para o poço WELL-00001 (2017-02-01/07-12h).

Figura 17 – Espectro de variância da variável P-MON-CKP para o poço WELL-00001 (2017-02-01/07-12h).

Figura 18 – Espectro de variância da variável T-JUS-CKP para o poço WELL-00001 (2017-02-01/02-07h).

16
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 19 – Espectro de variância da variável P-JUS-CKGL para o poço WELL-00001 (2017-02-01/02-07h).

comportamento o qual já tinha sido 5.1.2 Comportamento dinâmico entre


verificado nos dados presentes na Tabela 3. poços de petróleo
Com base em todos os resultados pode-
se afirmar que o comportamento entre os Dando sequência ao estudo do
vários turnos de um mesmo dia para o comportamento dinâmico dos poços,
mesmo poço estão altamente aplicou-se ao poço de petróleo W-00002 o
correlacionados, não trazendo informações procedimento metodológico realizado
adicionais sobre a variabilidade do poço. anteriormente pelo uso da técnica PCA e
Portanto, nota-se a baixa relevância do uso das técnicas de espectros de variância e
das suas estatísticas para atribuição de correlação.
métricas de detecção de falhas. A média e variância do conjunto de
dados se encontram na Tabela 3. Nota-se
um aumento da variância quando
comparado ao caso anterior, com variação

Figura 20 – Sinal da instância normal para o poço WELL-00002 (2017-02-09/12-17h).

17
COQ866 – Estimação de Parâmetros e Planejamento Experimental

(Figura 21) mostra o crescimento lento da


interpretação da variabilidade do sistema
com o aumento do número de componentes,
com primeiro componente caracterizando,
aproximadamente, 36% da variância total.
Regras adicionais que geralmente são
estabelecidas para escolher um menor
número de componentes principais para
reconstrução das variáveis que
correspondam, por exemplo, a pelo menos
70% da variância total não foram
consideradas nesse trabalho.
Pelo gráfico SPE, dado pela Figura 22,
Figura 21 – Diagrama de variância acumulada para a verifica-se uma mudança de intensidade de
análise PCA aplicada aos dados do poço WELL-00002 sinal ao longo da série temporal, assim
(2017-02-09/12-17h). como uma série de violações do limite de
confiança dos dados. Os comportamentos
de média expressiva somente para a
observados podem constituir um indicativo
variável P-TPT. Com base nisso, é
de que as técnicas PCA e SPE, em sua
interessante verificar como o espectro de
forma padrão, não são apropriadas para
variância se comporta perante essas
estabelecer métricas de detecção de falhas.
mudanças.
A técnica apresenta uma série de
A Figura 20 apresenta o sinal
limitações que podem estar associadas aos
correspondente a cada uma das variáveis em
comportamentos anormais observados,
análise. O mesmo comportamento de sinal
como a sua ineficácia diante de sistemas
constante em determinados períodos foi
não-lineares, já que uma de suas hipóteses
observado para as leituras do dispositivo
supõe que há dependência linear entre as
TPT. Além disso, há a ausência de sinal da
variáveis, com determinação direta pela
variável P-MON-CKGL que foi
matriz de covariância e correlação. Além
desconsiderada na análise anterior por
disso, a hipótese de que os resíduos formam
apresentar crescimento constante.
parcelas de comportamento idêntico é
A aplicação da técnica PCA resultado em
fisicamente improvável para esse sistema
quatro componentes principais, cada um
em que há medições de variáveis de
correspondendo a uma variável, assim
diferentes características físicas, como
como ocorreu na análise realizada na seção
temperatura e vazão. Ainda se tratando da
anterior. O gráfico de variância acumulada
característica física do processo, há

Figura 22 – Limite SPE junto ao PCA para o poço WELL-00002 (2017-02-09/12-17h).

18
COQ866 – Estimação de Parâmetros e Planejamento Experimental

mudanças de condições dinâmicas inerentes constante. Por sua vez, o espectro T-TPT
as condições de operação que invalidam a com janelas adjuntas não apresentou uma
hipótese de dados estacionários. Por fim, mudança de perfil tão significativa,
seus sistemas de medição estão sujeitos a diferindo com relação a maior variância
condições extremas e a possíveis distúrbios capturada.
externos que podem conduzir a sinais O espectro correspondente a variável P-
anormais e a erros diferentes nas diferentes MON-CKP (Figura 25) apresentou o
variáveis.[18] mesmo comportamento de redução da
Algumas alternativas presentes na variância, com acentuado espalhamento
literatura que podem se adequar melhor aos para janelas disjuntas. A grande diferença
problemas acima mencionados são as com relação ao caso anterior é a saturação
técnicas de PCA modificados, como o não- mais lenta, em uma janela de tamanho
linear, dinâmico, robusto, entre outros. [12,18] próximo a 200, com uma maior variância.
A aplicação dos espectros de variância Já para variável T-JUS-CKP foi observado
aos dados desse poço de petróleo resultou o um pico de variância em um tamanho de
em assinaturas estatísticas dos dispositivos janela muito curto, seguido do seu aumento
de medição similares as observadas na bem-comportado para as janelas adjuntas e
seção anterior, com destaque para os saltos agressivo para as janelas disjuntas. Foram
nos espectros com janelas disjuntas realizados testes com alterações na
inerentes as flutuações nas variâncias. Os frequência de amostragem dos dados, os
sensores P-TPT e T-TPT apresentaram o quais não apresentaram mudanças
mesmo comportamento crescente, com significativas.
formação de “barrigas” para os espectros Mais uma vez, as variáveis apresentaram
com janelas adjuntas (Figuras 23 e 24). pouca correlação. De modo a comparar o
Nota-se um crescimento mais lento da comportamento do espectro com o poço
variância com o aumento do tamanho de estudado na seção anterior, a Figura 27
janela, tendo um aumento suave, sem mostra o espectro dinâmico de correlação
indicativos de saturação para ambas as para as variáveis P-TPT e P-MON-CKP. É
variáveis. Quando comparado com o caso possível identificar um comportamento
anterior, o espectro com janelas adjuntas simular de flutuação dos espectros de
para P-TPT apresentou medidas de correlação ao redor de zero. É curioso que
variância superiores, com crescimento exista uma pequena correlação entre as

Figura 23– Espectro de variância da variável P-TPT para o poço WELL-00002 (2017-02-09/12-17h).

19
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 24 – Espectro de variância da variável T-TPT para o poço WELL-00002 (2017-02-09/12-17h).

Figura 25 – Espectro de variância da variável P-MON-CKP para o poço WELL-00002 (2017-02-09/12-17h).

Figura 26 – Espectro de variância da variável T-JUS-CKP para o poço WELL-00002 (2017-02-09/12-17h).

20
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 27 – Espectro de correlação entre as variáveis P-TPT/P-MON-CKP (𝑤 = 100 e ∆𝑡 = 10) para o poço
WELL-00002 (2017-02-09/12-17h).

variáveis para tamanho de janelas muito por apresentar os mesmos dispositivos de


pequenos, a qual termina por se desfazer à medição em funcionamento que os poços
medida que o tamanho de janela aumenta. anteriores. Os demais poços, com exceção
Quanto aos demais poços de petróleo, do Well-00007, apresentaram diversos
promoveu-se uma busca exaustiva por dispositivos congelados ou com defeitos,
variáveis altamente correlacionadas. O com variáveis restantes fracamente
poço Well-00003 foi descartado da busca correlacionadas.

Figura 28 – Sinal da instância normal para o poço WELL-00007 (2017-08-01/20-22h).


21
COQ866 – Estimação de Parâmetros e Planejamento Experimental

O poço Well-00007 apresenta um variância. O espectro correspondente a


conjunto de dados em que há leitura dos variável T-TPT (Figura 31) apresentou
dispositivos P-TPT e QGL, com sinais comportamento similar ao observado para o
representados na Figura 28. É importante poço Well-00001. Por sua vez, para a
ressaltar que os dados foram amostrados em variável P-MON-CKP, a construção do
uma frequência de 15 segundos, menor do espectro (Figura 32) resultou no aumento da
que a das demais análises (40 segundos), variância com o tamanho de janela,
devido a menor quantidade de observações. resultado totalmente diferente das análises
As Figuras 29-34 representam os anteriores.
espectros de variância para o conjunto de Com relação a variável T-JUS-CKP,
dados em análise. Observa-se um nota-se uma suavização da determinação
comportamento muito parecido entre os das grandezas estatísticas com o aumento de
espectros P-PDG e P-TPT, com mudanças janela. Por fim, gerou-se o espectro da
relacionadas a amplitude da variância variável QGL relacionada a vazão
alcançada (Figuras 29-30). Mais uma vez volumétrica padrão, o qual apresenta
foram observados saltos nos espectros aumento da variância com o aumento de
disjuntos ocasionados por flutuações de tamanho de janela, com saltos

Figura 29 – Espectro de variância da variável P-PDG para o poço WELL-00007 (2017-08-01/20-22h).

Figura 30 – Espectro de variância da variável P-TPT para o poço WELL-00007 (2017-08-01/20-22h).

22
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 31 – Espectro de variância da variável T-TPT para o poço WELL-00007 (2017-08-01/20-22h).

Figura 32 – Espectro de variância da variável P-MON-CKP para o poço WELL-00007 (2017-08-01/20-22h).

Figura 33 – Espectro de variância da variável P-JUS-CKP para o poço WELL-00007 (2017-08-01/20-22h).

23
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 34 – Espectro de variância da variável QGL para o poço WELL-00007 (2017-08-01/20-22h).

Figura 35 – Espectro dinâmico de correlação entre as variáveis P-PDG/P-TPT (𝑤 = 50 e ∆𝑡 = 10) para o poço
WELL-00007 (2017-08-01/20-22h).

24
COQ866 – Estimação de Parâmetros e Planejamento Experimental

característicos para o espectro com janelas variáveis P-PDG e P-TPT, já que o


disjuntas. dispositivo de medição de pressão PDG
A busca exaustiva resultou na encontra-se em uma situação mais instável
determinação do conjunto de dados em e suas medidas geralmente estão
questão, no qual o medidor de pressão PDG indisponíveis.
encontra-se em funcionamento. Como Todos os procedimentos de análise de
consequência, foi possível determinar a sua dados foram realizados com dados reais.
correlação com a variável P-PTP. Pelo Adicionalmente, foram consideras somente
espectro de correlação (Figura 35) é as instâncias que apresentaram período
possível verificar o grau de dependência normal maior ou igual a 20 minutos
funcional direto existente entre as variáveis, (1,2,5,6,7,8) para detecção de eventos
com um aumento deste à medida em que a anormais, assim como foi sugerido por
janela vai avançando na série temporal. Vargas et al.[7].
Essa correlação tem sentido físico, pois Nenhuma observação real presente na
ambos os sensores se encontram na árvore instância 1, relacionada ao evento de
de natal submarina. Sendo assim, atribuiu- aumento abrupto de BSW, apresentou
se esta condição como referência para a medidas do dispositivo PDG. Logo, esse
detecção de falhas. evento não pode ser explorado pelo critério
5.2 Caracterização das condições de de correlação estabelecido.
falha Para a instância 2, correspondente ao
fechamento espúrio da válvula de segurança
Os resultados obtidos tiveram como de fundo de poço (DHSV), observou-se
premissa o efeito de quebra de correlação uma baixa variabilidade dos sinais das
durante um evento anormal, aqui variáveis P-PDG e T-TPT para o poço Well-
denominado como falha. Promoveu-se a 00003 (Figura 36), o que pode estar
alteração da instância dos conjuntos de associado a uma inerente transição para
dados normais para a de eventos uma falha desde o início da série temporal.
indesejados, os quais são classificados de 1 Apesar disso, o espectro dinâmico de
a 8 conforme descrição presente na seção
correlação (para 𝑤 = 100 e ∆𝑡 = 20) foi
2.4. Esta etapa teve como desafio a busca capaz de identificar a mudança de
por eventos contendo atividade mútua das correlação entre as variáveis, as quais

Figura 36 – Sinal da instância 2 (Encerramento abrupto do DSHV) para o poço WELL-00003 (2017-07-28/15-17h).

25
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 37 – Espectro dinâmico de correlação entre as variáveis P-PDG/P-TPT (𝑤 = 100 e ∆𝑡 = 20) para o poço
WELL-00003 (2017-07-28/15-17h) com evento de encerramento abrupto do DSHV.
estavam diretamente correlacionadas antes superfície, pois está relacionado
do evento e passaram a ser indiretamente diretamente ao dispositivos submarinos.
correlacionadas a medida que ocorreu a Uma observação curiosa é que as
transição para a condição de falha, medidas de pressão e temperatura do
conforme ilustrado na Figura 37. dispositivo TPT que anteriormente não
A mudança do tipo de correlação possuíam correlação alguma, passaram a ser
verificado anteriormente pode ser diretamente correlacionadas com o evento,
interpretada com base no posicionamento assim como pode ser verificado pelo
dos dispositivos na árvore de natal espectro dinâmico de correlação (Figura
submarina. Conforme explicado na seção 38). Por sua vez, passa a existir a mesma
2.4, a válvula DHSV encontra-se correlação indireta entre as variáveis T-TPT
posicionada no duto de produção, com e P-PDG.
medidor PDT posicionado na extremidade Quanto ao evento 5 (perda de
inferior do duto, próximo ao fundo do poço, produtividade), não houve mudança de
e o transdutor TPT em uma posição superior correlação significativa entre as variáveis P-
da árvore. Como resultado da localização PDG e P-TPT que possibilitasse o seu uso
física dos dispositivos, é compreensível que como medida de detecção de falhas. Seu
o fechamento da válvula provoca aumento espectro dinâmico (Figura 39) mostra a
da pressão a montante e queda de pressão a dependência funcional direta entre as
jusante, resultando nas medidas de pressão variáveis dada pela correlação.
verificadas pelos dispositivos durante o Para o evento 6, correspondente a
evento. Conforme citado por Vargas et restrição rápida no estrangulador de
al.[7], esse evento não é verificado pelos produção (PCK), não foi encontrada
dispositivos de medição presentes na nenhuma observação real com medidas do

26
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Figura 38 – Espectro dinâmico de correlação entre as variáveis P-TPT/T-TPT (𝑤 = 100 e ∆𝑡 = 20) para o poço
WELL-00003 (2017-07-28/15-17h) com evento de encerramento abrupto do DHSV.

Figura 39 – Espectro dinâmico de correlação entre as variáveis P-TPT/T-TPT (𝑤 = 100 e ∆𝑡 = 10) para o poço
WELL-00016 (2018-04-05/02-03h) com evento de perda de produtividade.

27
COQ866 – Estimação de Parâmetros e Planejamento Experimental

dispositivo PDG disponíveis. Por sua vez, A análise estatística resultou no número
sabe-se que esse dispositivo se encontra na de variáveis ausentes e/ou congeladas,
superfície, então não é esperado que assim como o número de observações
variáveis correspondentes a dispositivos ausentes. Além disso, foi possível
submersos possam interpretar eventos de determinar a média e a variância do
superfície. A mesma condição de ausência conjunto de dados, possibilitando
de observações foi verificada para o evento caracterizar a dinâmica de cada poço
7 de incrustação no PCK. analisado. Por fim, foi possível concluir que
Por fim, a formação de hidrato na linha sempre há ausência de uma ou mais
de produção, uma das ocorrências mais variáveis no conjunto de dados 3W,
problemáticas, classificado como evento 8, característica que torna desafiador o uso e
não pode ser interpretada pela correlação interpretação dos resultados obtidos por
entre as variáveis P-PDG e P-TPT já que técnicas baseadas em assinaturas
estas são mantidas durante o período de estatísticas.
falha, conforme verificado para o poço A técnica PCA não foi capaz de reduzir
Well-00021 e demonstrado pelo espectro a dimensionalidade do sistema e nem
dinâmico de correlação (Figura 40). reproduzir as variáveis através dos seus

Figura 40 – Espectro dinâmico de correlação entre as variáveis P-TPT/T-TPT (𝑤 = 100 e ∆𝑡 = 10) para o poço
WELL-00021 (2017-05-09/13:35-20h) com evento de formação de hidrato na linha de produção.

6 CONCLUSÃO componentes principais por conta da


violação das suas hipóteses de normalidade
Técnicas de análise e monitoramento dos dados e ausência de comportamentos
estatístico foram aplicadas ao conjunto de dinâmicos. Concluiu-se que as técnicas
dados de poços de petróleo denominado PCA dinâmico, PCA não-linear e/ou PCA
3W, sendo composto por oito variáveis robusto podem ser mais adequadas para
correspondentes a medidas de pressão, aplicação no monitoramento de sistemas.
temperatura e vazão volumétrica.

28
COQ866 – Estimação de Parâmetros e Planejamento Experimental

A técnica de espectro de variância


possibilitou verificar a evolução das [3] Kruger, U., Xie, L., Statistical
características estatísticas com o avanço de Monitoring of Complex Multivariate
diferentes janelas ao longo das séries Process: With Application in Industrial
temporais. Sua aplicação permitiu concluir Process Control, John Wiley & Sons,
que os diversos turnos de um mesmo poço United Kingdom, 2012.
não representam eventos distintos e que os
poços classificados como 1 e 2 mostraram [4] Kourti, T., Lee, J., Macgregor, J.F.,
comportamento dinâmico similar para todas Experiences with Industrial Applications of
as variáveis analisadas, diferindo quanto a Projection Methods for Multivariate
sua variabilidade. Statistical Process Control, Comp. Chem.
A técnica de espectro dinâmico de Eng., Pergamon, 1996.
correlação permitiu verificar um alto grau
de correlação entre as variáveis P-PDT e P- [5] Kourti, T., Process Analysis and
TPT no poço de petróleo número 7. Abnormal Situation Detection: From
Conclui-se que essa correlação está Theory to Practice, IEEE Control Systems
associada a localização física dessas Magazine, 2002.
variáveis na árvore de natal submarina.
Com essa técnica, foi possível concluir que [6] Feital, T., Pinto, J.C., Use of Variance
o evento fechamento espúrio da válvula de Spectra for In-Line Validation of Process
segurança de fundo de poço provoca a Measurements in Continuos Processes, The
alteração do grau de dependência funcional Can. J. of Chem. Eng., v. 93, 2015.
das variáveis citadas anteriormente, que
passam a ter correlação indireta. Essa
mudança está relacionada ao aumento da [7] Vargas, R.E.V. et al., A realistic and
pressão a montante e a sua redução a public dataset with rare undesirable real
jusante, provando aumento das leituras do events in oil wells, J. of Petr. Sci. and Eng.,
medidor PDG e redução das leituras do v. 181, 2019.
transdutor, tanto de pressão quanto de
temperatura. [8] Pearson, K., On lines and planes of
Concluiu-se que o uso das técnicas de closest fit to systems of points in space,
possibilitou estudar o comportamento Philosof. Mag., v. 2, 1901, p. 559-572.
dinâmico dos poços em condições normais
e de falha. Outros estudos podem ser [9] Kourti, T., Application of Latent
realizados para estabelecer métricas de Variable Methods to Process Control and
detecção de falha, por exemplo, a aplicação Multivariate Statistical Process Control in
da técnica de matriz de recorrências, a qual Industry, Int. J. of Adapt. Control and
não pode ser explorada no presente Signal Process., v. 19, 2005, p. 213–246.
trabalho.
[10] Saporta, G., Niang, N., Principal
7 REFERÊNCIAS component analysis: application to
statistical process control. In: G. Govaert,
[1] Jamsa-Jounela, S.-L., Future trends in ed. Data Analysis. John Wiley & Sons,
process automation, Anual Reviews in London, 2009, p. 1–23.
Control, v. 31, 2007, p. 211-220.
[11] Hou, Z., Jin, S., Data-Driven Model-
[2] Russel, E., Chiang, L.H., Braatz, R.D., Free Adaptive Control for a Class of MIMO
Data-driven Methods for Fault Detection Nonlinear Discrete-Time Systems, IEEE
and Diagnosis in Chemical Processes, Transactions Neural Networks, v. 22, n. 12,
Springer, 2000. 2011, p. 2173-2187.
29
COQ866 – Estimação de Parâmetros e Planejamento Experimental

Kalman Filter vs. Artificial Neural


[12] Fadel, F.E.F., Uma Avaliação Crítica Networks, IFAC, v. 28, 2019, p. 508-513.
sobre Técnicas Baseadas em PCA para
Detecção de Falhas em Processos da [21] Melo, A. Espectros de variância,
Indústria Química. Dissertação de covariância e correlação. [Online].
Mestrado, Universidade Federal do Rio de https://github.com/afraeq/spectra/blob/mast
Janeiro, Rio de Janeiro, 2018, jun. er/notebooks/primeira_apresentacao.ipynb

[13] Abdi, H., Williams, L. J., Principal


component analysis, WIRES
Computational Statistics, John Wiley &
Sons, v. 2, p. 433-459, 2010.

[14] Jiang, Q., Yan, X., Zhao, W., Fault


Detection and Diagnosis in Chemical
Process Using Sensitive Principal
Components Analysis, Ind. Eng. Chem.
Res., v. 52, p. 1653-1644, 2013.

[15] Malekzaged, R., Henkes, R. A. W. M.,


Mudde, R. F., Severe slugging in a long
pipeline-riser system: Experiments and
predictions, Internation Journal of
Multiphase Flow, v. 46, p. 9-21, 2012.

[16] DUCHENE, Aurelie et al. System and


method downhole inorganic scale
monitoring and intervention in a production
well. Depositante: Baker Hughes (US).
Depósito: 23 jul. 2015. Concessão: 19 jun.
2019.

[17] Adisasmito, S., Parubak, E. Ethylene


glycol injection for hydrate formation
prevention in deepwater gas pipelines.
MATEC Web of Conferences, v. 268, 2019.

[18] Feital, T. S., Monitoramento da


Condição de Processos Químicos
Industriais. Tese de Doutorado,
Universidade Federal do Rio de Janeiro,
Rio de Janeiro, 2011, nov.

[19] Schwaab, M., Pinto, J. C., Análise de


Dados Experimentais I: Fundamentos de
Estatística e Estimação de Parâmetros. E-
papers: Rio de Janeiro, 2007.

[20] Apio, A. et al., PDG Pressure


Estimation in Offshore Oil Well: Extended
30

Você também pode gostar