Você está na página 1de 14

ANÁLISE DE FLUTUAÇÃO (DFA)

Em processos estocásticos, teoria do caos e análise de séries temporais,


a análise de flutuação (DFA) é um método para determinar a auto-
afinidade estatística de um sinal. É útil para analisar séries temporais que
assemelham aos processos de memória longa ou ruído 1/f, em seu tempo de
correlação divergente, por exemplo, e na função de autocorrelação de decaimento
da lei de potência. (BRYCE et al.,2012); (KANTELHARDT, 2001)

O expoente obtido é semelhante ao expoente de Hurst, exceto que o DFA


também pode ser aplicado a sinais cujas estatísticas subjacentes (como média e
variância) ou dinâmica não-estacionárias (mudando com o tempo). (BRYCE et
al.,2012)

Desta forma, compreende-se que a análise de flutuação está relacionada a


medidas baseadas em técnicas espectrais, como autocorrelação. (BRYCE et
al.,2012)

Peng et al., (1994) introduziu o DFA e representa uma extensão da análise de


flutuação (ordinária) (FA), que é afetada por não-estacionariedade.

Para a exposição detalhada do cálculo, dada uma série temporal limitada X(t)
de comprimento N, em que t∈ ℕ a integração ou a somatória primeiro converte isso
em um processo ilimitado, têm-se Χt : (KANTELHARDT, 2001)

Onde <c> denota o valor médio da série temporal. X t é chamado soma


cumulativa ou perfil. Este processo converte, por exemplo, um iid ruído
branco processo em um passeio aleatório .(KANTELHARDT, 2001)

Próximo, X t é dividido em janelas de tempo de comprimento amostras cada, e


um ajuste linear de mínimos quadrados locais (a tendência local) é calculado
minimizando os erros quadrados dentro de cada janela de tempo. Υt indica a
sequência resultante de ajustes em linha reta. Então, o desvio da raiz quadrada
média da tendência, a flutuação , é calculado: (KANTELHARDT, 2001)
Por fim, esse processo de distorção seguido de medição de flutuação é
repetido em uma faixa de diferentes tamanhos de janela. e um gráfico log-log de
F(n)  contra n É construído:

Uma linha reta neste gráfico log-log indica auto-afinidade estatística. O expoente de


escala  é calculado como a inclinação de uma linha reta ajustada ao gráfico log-log
de n  contra F(n) usando mínimos quadrados. 

Este expoente é uma generalização do expoente de Hurst . Porque o


deslocamento esperado em uma caminhada aleatória não correlacionada de
comprimento N cresce como raíz de N um expoente de 1/2 corresponderia a ruído
branco não correlacionado. (BRYCE et al.,2012)

Quando o expoente está entre 0 e 1, o resultado é o movimento Browniano


Fracionário, com o valor preciso dando informação sobre as auto-correlações em
série: (BRYCE et al.,2012)

alfa < ½: anti-correlacionado

alfa ≅ ½ ruído branco não correlacionado

alfa > correlacionado

alfa ≅ 1 / f-noise, ruído rosa

alfa > não estacionário, ilimitado

alfa ≅ Ruído browniano

Tendências de ordem superior podem ser removidas por um DFA de ordem


superior, em que um ajuste linear é substituído por um ajuste polinomial. No caso
descrito, ajustes lineares (i = 1) são aplicados ao perfil, sendo assim chamado de
DFA1. Para remover tendências de ordem superior, o DFAi, usa ajustes polinomiais
de ordem i. Devido à soma (integração) de x ipara Xt, as tendências lineares na
média do perfil representam tendências constantes na sequência inicial e o DFA1
remove apenas essas tendências constantes (etapas) na xi. Em geral, o DFA de
ordem  remove tendências (polinomiais) de ordem i -1 Para tendências lineares na
média xi pelo menos o DFA2 é necessário. A análise de Hurst R / S remove
constantes tendências na sequência original e, portanto, em sua desvantagem, é
equivalente a DFA1. O método DFA foi aplicado a muitos sistemas; por exemplo,
sequências de DNA, oscilações neuronais, detecção de patologia da fala, e
flutuação de batimentos cardíacos em diferentes estágios do sono. O efeito das
tendências na DFA foi estudado em e a relação com o método do espectro de
potência é apresentada. (BRYCE et al.,2012)

Desde na função de flutuação F(n) o quadrado (raiz) é usado, o DFA mede o


comportamento de escala das flutuações do segundo momento,
. A generalização multifractal usa um momento variável q e fornece alfa
(q).Kantelhardt et al.(2001) relata este expoente escalonado como uma
generalização do expoente clássico de Hurst. O expoente clássico de Hurst
corresponde ao segundo momento para casos estacionários H = alfa (2) e para o
segundo momento menos 1 para casos não estacionários H alfa (2) -1 (BRYCE et
al.,2012) (KANTELHARDT, 2001)

RELAÇÕES COM OUTROS MÉTODOS

No caso de autocorrelações em decadência da lei de potência, a função de


correlação decai, bem como o espectro de energia, logo, os três expoentes ficam
relacionados por: (KANTELHARDT, 2001)

As relações podem ser derivadas usando o teorema de Wiener-Khinchin.

Portanto, alfa está ligado à inclinação do espectro de energia beta e é usado para
descrever a cor do ruído por essa relação: alfa = (beta +1)/2 (KANTELHARDT, 2001)

Para o ruído fracionário gaussiano (FGN), temos:

Para o movimento browniano fracionário (FBM), temos :


Neste contexto, FBM é a soma cumulativa ou a integral de FGN, assim, os
expoentes de seus espectros de potência diferem em 2.(KANTELHARDT, 2001)

FALHA NA INTERPRETAÇÃO 

Tal como acontece com a maioria dos métodos que dependem de ajuste de
linha, é sempre possível encontrar um número pelo método DFA, mas isso não
implica necessariamente que a série temporal seja auto-similar. (HARDSTONE et
al., 2012)

Auto-similaridade requer que os pontos no gráfico log-log sejam


suficientemente colineares em uma ampla gama de tamanhos de janela L. Além
disso, uma combinação de técnicas incluindo MLE, em vez de mínimos quadrados,
foi mostrada para melhor aproximar o expoente da escala.(HARDSTONE et al.,
2012)

Além disso, existem muitas grandezas semelhantes ao expoente de escala


que podem ser medidas para uma série temporal semelhante, incluindo a dimensão
do divisor e o expoente de Hurst . Portanto, o expoente de dimensionamento do DFA
não é uma dimensão fractal compartilhando todas as propriedades desejáveis
da dimensão Hausdorff , por exemplo, embora em alguns casos especiais possa ser
mostrado estar relacionado à dimensão de contagem de caixas para o gráfico de
uma série temporal. (HARDSTONE et al., 2012)

DISTRIBUIÇÃO DE PROBABILIDADE

Uma distribuição de probabilidade é uma fórmula ou uma tabela utilizada para

atribuir probabilidades para cada valor possível de uma variável aleatória X . Uma

distribuição de probabilidade pode ser discreta ou contínua. Uma distribuição

discreta significa que X pode assumir um de um número contável (geralmente finito)

de valores, enquanto uma distribuição contínua significa que X pode assumir um de

um número infinito (incontável) de valores diferentes.


DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS

Diversas distribuições de probabilidade discretas especializadas são úteis


para aplicações específicas. Para aplicativos comerciais, três distribuições discretas
frequentemente são usadas: (CEMPEL, 1989)

•Binomial

•Geométrico

•Poisson

A utilização da distribuição binomial serve para calcular as probabilidades de


um processo em que apenas um dos dois resultados possíveis pode ocorrer em
cada tentativa. (CEMPEL, 1989)

A distribuição geométrica está relacionada com a distribuição binomial, isto é,


usa-se a distribuição geométrica para determinar a probabilidade de que um
determinado número de tentativas ocorra antes do primeiro sucesso ocorrer. Pode-
se usar a distribuição de Poisson para medir a probabilidade de que um
determinado número de eventos ocorrerá durante um determinado período de
tempo. (CEMPEL, 1989) (BUNDE, 1996)

DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS

Muitas distribuições contínuas podem ser usadas para aplicativos de


negócios; dois dos mais utilizados são:(CEMPEL, 1989)

•Uniforme

•Normal

A distribuição uniforme é útil porque representa variáveis que são distribuídas

uniformemente em um determinado intervalo. Por exemplo, se o período de tempo

até a próxima peça defeituosa chegar em uma linha de montagem é igualmente

provável que seja qualquer valor entre um e dez minutos, então, pode-se usar a

distribuição uniforme para calcular probabilidades pelo tempo até a próxima peça

defeituosa chegar .(CEMPEL, 1989)


A distribuição normal é útil para uma ampla variedade de aplicativos em

muitas disciplinas. Em aplicações de negócios, variáveis como retornos de ações

são frequentemente consideradas como seguindo a distribuição normal. A

distribuição normal é caracterizada por uma curva em forma de sino , e as áreas sob

essa curva representam probabilidades.(CEMPEL, 1989) (BUNDE, 1996)

Gráfico 1 – Distribuição Normal

Fonte: (HARDSTONE et al., 2012)

DISTRIBUIÇÃO HIPERGEOMÉTRICA

Na teoria de probabilidade e estatística , a distribuição hipergeométrica é


uma distribuição de probabilidade discreta que descreve a probabilidade de
k sucessos (sorteios aleatórios para os quais o objeto desenhado possui um recurso
especificado) desenha,sem substituição, de uma população finita de tamanho N que
contém exatamente K objetos com esse recurso, em que cada sorteio é um sucesso
ou uma falha. (BUNDE, 1996)

 Em contraste, a distribuição binomial descreve a probabilidade de ksucessos em 


desenha com substituição.
Na estatística , o teste hipergeométrico usa a distribuição hipergeométrica
para calcular a significância estatística de ter desenhado uma k sucessos (fora de n
total de empates) da população acima mencionada. (BUNDE, 1996)

O teste é frequentemente usado para identificar quais sub-populações estão


super ou sub-representadas em uma amostra. Este teste tem uma ampla gama de
aplicativos. Por exemplo, um grupo de marketing poderia usar o teste para entender
sua base de clientes, testando um conjunto de clientes conhecidos para
representação excessiva de vários subgrupos demográficos (por exemplo,
mulheres, pessoas com menos de 30 anos). (BUNDE, 1996)

Definição
As seguintes condições caracterizam a distribuição hipergeométrica:

I.O resultado de cada sorteio (os elementos da população que está sendo
amostrada) pode ser classificado em uma das duas categorias mutuamente
exclusivas (por exemplo, Pass / Fail ou Employed / Unemployed).
II.A probabilidade de um sucesso muda em cada sorteio, pois cada sorteio diminui a
população ( amostragem sem substituição de uma população finita).(BUNDE, 1996)
III.Uma variável x aleatória segue a distribuição hipergeométrica se a sua função de
massa de probabilidade (pmf) é dada por

Onde

I. N é o tamanho da população,


II. Ké o número de estados de sucesso na população,
III.n é o número de sorteios (isto é, quantidade sorteada em cada ensaio),
IV.ké o número de sucessos observados,
V.(a/b) é um coeficiente binomial .

O pmf é positivo quando:


Uma variável aleatória distribuída hipergeometricamente com parâmetrosN K
e n está escrito X ~ Hipergeométrico (N, K,n) e tem função de massa de
probabilidade p x (k) acima. (CEMPEL, 1989)

Identidades combinatórias

Conforme necessário, têm-se:

que essencialmente segue da identidade de Vandermonde da combinatória .

Observe também que

o que decorre da simetria do problema, mas também pode ser mostrado


expressando os coeficientes binomiais em termos de fatoriais e rearranjando os
últimos. (CEMPEL, 1989)

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÃO DE PROBABILIDADE

Variáveis aleatórias e distribuições de probabilidade são dois dos conceitos


mais importantes em estatística. Uma variável aleatória atribui valores numéricos
exclusivos aos resultados de um experimento aleatório; Este é um processo que
gera resultados incertos. Uma distribuição de probabilidade atribui probabilidades a
cada valor possível de uma variável aleatória. (CEMPEL, 1989)

Os dois tipos básicos de distribuições de probabilidade são discretos e


contínuos. Uma distribuição de probabilidade discreta só pode assumir
um número finito de valores diferentes. (CEMPEL, 1989)

Exemplos de distribuições discretas incluem:

• Binomial

• Geométrico
• Poisson

Uma distribuição de probabilidade contínua pode assumir


um número infinito de valores diferentes. Exemplos de distribuições contínuas
incluem: (CEMPEL, 1989)

• Uniforme

• Normal

• T de estudante

• Qui-quadrado

Figura 1-a – Função de massa de probabilidade e Função de distribuição


cumulativa
Fonte:  Bryce et al., (2012)

Figura 1b Parâmetros, apoio, cdf, significar, modo, variância e torção

Fonte:  Bryce et al., (2012)

A DISTRIBUIÇÃO DE POISSON

A distribuição de Poisson é útil para medir quantos eventos podem ocorrer


durante um determinado horizonte de tempo, como o número de clientes que entram
em uma loja durante a próxima hora, o número de acessos em um site durante o
próximo minuto e assim por diante. O processo de Poisson ocorre ao longo do
tempo, em vez de uma série de tentativas; cada intervalo de tempo é
considerado independente de todos os outros intervalos. (CEMPEL, 1989)

Calcula-se, portanto, as probabilidades de Poisson com a seguinte fórmula:

Vê-se que cada elemento dessa fórmula representa:

É importante salientar que o processo de Poisson é uma constante


amplamente usada em aplicativos financeiros. Um dos usos mais importantes é
computar valores presentes de somas de dinheiro quando as taxas de juros
são continuamente combinadas - compostas por um número infinito de vezes. A
maioria das calculadoras possui uma chave chamada e x que se pode usar para
calcular o valor de e elevado para uma potência especificada. No Excel, a função
apropriada para determinar o valor de e é EXP. (BRYCE, et al.,2012)

Exemplo do processo de Poisson

Por exemplo, suponha-se que o número de mensagens que uma pessoa


recebe em seu celular seja em média de uma por hora e que o número de
mensagens recebidas a cada hora seja independente de todas as outras horas.
Qual é a probabilidade dele receber duas mensagens na próxima hora?

Neste caso, o valor de lambdaé igual a 1, porque o número médio de


mensagens por hora é igual a 1. A probabilidade de receber duas mensagens
durante a próxima hora é
Como alternativa, pode-se obter resultados de uma tabela de Poisson configurada
como a tabela a seguir:

Tabela 1 – Processo de Poisson

Fonte: Bryce et al., 2012

A tabela mostra as probabilidades de Poisson para diferentes valores de


lambda

Os momentos da distribuição de Poisson são usados para representar o valor


médio da distribuição e a dispersão da distribuição. Tal como acontece com a
distribuição binomial e geométrica, esses momentos podem ser calculados com
fórmulas simplificadas. (BRYCE, et al.,2012)

ANÁLISE DE REGRESSÃO

A análise de regressão é uma ferramenta estatística utilizada para a


investigação de relações entre variáveis. Normalmente, o investigador procura
determinar o efeito causal de uma variável sobre a outra - o efeito de um aumento
de preço sob demanda, por exemplo, ou o efeito de mudanças na oferta monetária
sobre a taxa de inflação. (BRYCE, et al.,2012)
A análise de regressão é usada para estimar a força e a direção da relação entre
duas variáveis linearmente relacionadas: X e Y. X é a variável “independente” e Y é
a variável “dependente”.(BRYCE, et al.,2012)

Os dois tipos básicos de análise de regressão são:

• Análise de regressão simples: usada para estimar a relação entre uma


variável dependente e uma única variável independente; por exemplo, a
relação entre rendimento de culturas e precipitação. (BRYCE, et al.,2012)

• Análise de regressão múltipla: Usada para estimar a relação entre uma


variável dependente e duas ou mais variáveis independentes; por exemplo, a
relação entre os salários dos empregados e sua experiência e educação.

A análise de regressão múltipla introduz várias complexidades adicionais,


mas pode produzir resultados mais realistas do que a análise de regressão
simples. (BRYCE, et al.,2012)

A análise de regressão é baseada em várias suposições fortes sobre as variáveis


que estão sendo estimadas. Vários testes principais são usados para garantir que
os resultados sejam válidos, incluindo testes de hipóteses. Esses testes são usados
para garantir que os resultados da regressão não sejam simplesmente devidos ao
acaso, mas indicam uma relação real entre duas ou mais variáveis. (BRYCE, et
al.,2012)

Uma equação de regressão estimada pode ser usada para uma ampla variedade de
aplicativos de negócios, como:

• Medindo o impacto nos lucros de uma corporação de um aumento nos lucros

• Entender como as vendas de uma empresa são sensíveis a mudanças nos


gastos com publicidade

• Vendo como o preço de uma ação é afetado por mudanças nas taxas de juros

A análise de regressão também pode ser usada para fins de previsão; por exemplo,
uma equação de regressão pode ser usada para prever a demanda futura de
produtos de uma empresa. (BRYCE, et al.,2012)

Devido à extrema complexidade da análise de regressão, ela é frequentemente


implementada através do uso de calculadoras especializadas ou programas de
planilhas.
Referências Bibliográficas

Cempel, Czeslaw – Passive Diagnostics and Reliability Experiment: Application


in Machine Condition Monitoring. Vol. 111 Janeiro 1989.

Peng, CK; et al. (1994). "Organização mosaica de nucleotídeos de


DNA" . Phys. Rev. E. 49

Peng, CK; et al. (1994). "Quantificação de expoentes de escalonamento e


fenómenos de cruzamento em séries temporais de batimentos cardíacos não
estacionários". Chaos . 49 : 82-87.1995

Bryce, RM; Sprague, KB (2012). Revisitando a análise de flutuação


retificada . Sci. Rep . 2 : 315. 2012

Kantelhardt JW; et al. (2001). Detectando correlações de longo alcance com análise


de flutuação retificada. Physica A . 295 : 441-454. arXiv :

Buldirev; et al. (1995). Propriedades de Correlação de Longo Alcance de


Codificação e Sequências de DNA Não Codificadoras - Análise do
Genbank . Phys. Rev. E . 51 : 5084-5091. : 1995

 Bunde A, Havlin S (1996). Fractals and Disordered Systems, Springer, Berlim,


Heidelberg, Nova Iorque".

Hardstone, Richard; Poil, Simon-Shlomo; Schiavone, Giuseppina; Jansen,


Rick; Nikulin, Vadim V .; Mansvelder, Huibert D .; Linkenkaer-Hansen, Klaus
(2012). Análise de Flutuação Destendenciada: Uma Visão Livre de Escala em
Oscilações Neuronais. Fronteiras em Fisiologia 

Você também pode gostar