Você está na página 1de 27

UNIVERSIDADE DO VALE DO ITAJAÍ

JEROME DA CRUZ BAS

RAFAEL SANTANA RODRIGUES

RÔMULO PEDRO THOMSEN

SABRINA MAYNARA DA CUNHA

VINÍCIUS WENTZ RITZEL

ESTATÍSTICA

As 10 distribuições.

ITAJAÍ

Maio de 2023
JEROME DA CRUZ BAS

RAFAEL SANTANA RODRIGUES

RÔMULO PEDRO THOMSEN

SABRINA MAYNARA DA CUNHA

VINÍCIUS WENTZ RITZEL

ESTATÍSTICA: As 10 distribuições.

Este trabalho tem como objetivo


passar sobre as distribuições.
Apresentado e entregue para a
matéria de Estatística da
Universidade do Vale do Itajaí.
Professor: Rodrigo Sant''ana

ITAJAÍ

Maio de 2023
Introdução:

Este trabalho irá apresentar sobre os 10 tipos de distribuição.

Sendo 5 distribuições contínuas:

 Burr XII;
 Gumbel;
 Dagum;
 Rayleigh;
 Tweedie.

5 distribuições discretas:

 Kumaraswamy;
 Zipf-Mandelbrot;
 Polya-Aeppli;
 Skellam;
 Narayana.
1. Contínuas

1.1 – Burr XII

O sistema de distribuição Burr foi criado por Irving W. Burr em 1942. O sistema
incluía 12 Funções de Distribuição Acumulada que incluem uma grande
variedade de formatos de densidade e é dado se a FDA se satisfaz resolvendo
uma certa equação especial a qual a solução é dada por:

(Figura 1: solução de equação especial)

Onde a letra grega é escolhida para que a G (x) seja uma FDA. As 12 escolhas
para aquela letra grega gerou ou sistema das 12 distribuições de Burr. Houve
uma atenção especial dada a chamada “Burr XII” que participa deste sistema.

Burr XII possui 3 parâmetros, c>0, d>0 e s>0, aonde as letras podem variar de
fonte para fonte, porém c e d são parâmetros de forma enquanto o s tem a ver
com a Escala.

Sua FDA é dada por:

(Figura 2: FDA de Burr XII)

Sua FDP é dada por:

(Figura 3: FDP de Burr XII)


Quando c = 1, o modelo BXII se reduz ao modelo de Lomax ou modelo de
Pareto tipo II. Quando d=1, BXII se reduz ao modelo de Log-Logistic (LL). Para
c = s =1, BXII se reduz ao modelo de um parâmetro de LL. Se c=1 o modelo se
reduz ao modelo de dois parâmetros de BXII. Quando d tende ao infinito BXII
se reduz ao modelo de dois parâmetros de Weibull e para s=1 com d tendendo
ao infinito, BXII reduz-se ao modelo de um parâmetro de Weibull.

Alguns casos que Burr XII foi usada em trabalhos foi:

 O trabalho de Weron e Kotulski (1997) foi dada a interpretação física da


distribuição de BXII na teoria de reação e relaxamento em sistemas
complexos.
 Brzezińzki (2014) considerou BXII para modelar fatores de impactos
diários.
 Li et al (2015) concluiu que a distribuição de BXII é boa para modelar a
precipitação sobre duas bacias hidrográficas na China.

Burr XII possui uma aplicabilidade bem variada e pode ser aplicado desde em
simulações até aproximações de distribuições e desenvolvimento de gráficos
de controle não normal.

Novamente, a caso de curiosidade, deixarei os tipos de XII e os autores que os


criaram.

(Figura 5: tabela que demonstra tipos de Burr XII, autores e anos de criação)
(Figura 6: como cada variável afeta o gráfico)

Não encontramos uma variância e esperança de alguma fonte confiável, porém


alguns artigos dizem que a esperança e a variância são moldáveis.

Aqui podemos ver o gráfico de Burr XII. Há locais onde trocam “d” por “k” e “s”
por alfa, mas é o mesmo esquema. As letras mudam de autor para autor, mas
neste gráfico podemos ver como cada variável afeta o gráfico. Acabei por
encontrar a função quântica:

(Figura 7: função quântica de Burr XII)

1.2 – Distribuição de Gumbel

Distribuição de Gumbel é uma distribuição contínua de probabilidade que é


frequentemente usada para modelar o valor máximo ou mínimo em um
conjunto de variáveis aleatórias independentes e identicamente distribuídas. A
distribuição é nomeada em homenagem ao matemático Emil Julius Gumbel,
que a utilizou pela primeira vez em 1935 para modelar eventos extremos em
hidrologia.

A fórmula geral para a função de densidade de probabilidade (FDP) da


distribuição de Gumbel (mínimo) é:

(Figura 8: fórmula FDP de Gumbel mínimo)

Parâmetros: μ é localização e β é a escala. A distribuição padrão de Gumbel se


torna no caso de μ = 0 e β = 1.

A equação padrão de Gumbel mínimo se reduz a:

(Figura 9: equação reduzida de Gumbel mínimo)

Obtém-se este gráfico de FDP para o caso mínimo:

(Figura 10: gráfico FDP de Gumbel mínimo)


No caso da distribuição caso máximo, a FDP é:

(Figura 11: FDP Gumbel caso máximo)

Parâmetros: μ é localização e β é a escala. A distribuição ganha o nome de


Distribuição padrão de Gumbel se torna no caso de μ = 0 e β = 1. A equação
da distribuição de Gumbel (máximo) se reduz à:

(Figura 12: Gumbel caso máximo reduzido)

Aqui é como será seu gráfico caso a FDP seja de Gumbel para o caso máximo:

(Figura 13: gráfico Gumbel caso máximo)

Foi possível observar que para o caso máximo ele sobe depois dos negativos e
se estende para os positivos, já o caso mínimo é o contrário, ele vem dos
negativos chegando em zero um pouco depois de chegar nos positivos. Isto
que deu para perceber ao ver os dois gráficos, ambos são quase um oposto do
outro.
Sua faixa vai do infinito negativo ao positivo.

Desvio padrão é dado por:

(Figura 14: Gumbel desvio padrão)

A moda é o μ:

(Figura 15: coeficiente de variação)

Exemplos de aplicação: A distribuição de Gumbel é particularmente útil para


modelar a distribuição de valores máximos ou mínimos em um conjunto de
variáveis aleatórias independentes e identicamente distribuídas. Um exemplo
que pode ser dado foi o trabalho em que a distribuição de Gumbel foi utilizada:
“Aplicação da Distribuição de Gumbel para Valores Extremos de Precipitação
no Município de Vitória-Es.” - Publicado pela revista brasileira de Climatologia.

“Para a série de precipitações acumuladas mensais, o menor valor acumulado


(1,3 mm) ocorreu em maio de 2006 e o maior valor acumulado (662,7mm)
ocorreu no mês novembro de 2008. A média das precipitações máximas
mensais foi 113,9mm e o desvio padrão de 100,8mm. A mediana dos dados foi
84,1mm.”

1.3 – Distribuição de Dagum.

A distribuição de Dagum é uma distribuição de probabilidade contínua proposta


por Camilo Dagum ao decorrer da década de 70, ela é utilizada para modelar
dados assimétricos acima de zero, e possui um amplo leque de usos nas mais
diversas áreas para modelar variáveis aleatórias positivas, para citar algumas:
• Finanças e economia
• Análise de demanda
• Estudos de confiabilidade
A função de densidade de probabilidade da distribuição de Dagum utiliza de
diversos parâmetros, esses sendo a, b e p, porém seu x deve ainda se manter
positivo.
O a controla a forma da cauda da distribuição. Quanto maior o valor de a, mais
pesada é a cauda da distribuição e maior a probabilidade de ocorrerem valores
extremos.
O p é um parâmetro adicional, quando p é igual a 1, a distribuição de Dagum é
equivalente à distribuição de Pareto. Quando p é maior do que 1, a distribuição
é unimodal (tem apenas um pico) e assimétrica. Quando p é menor do que 1, a
distribuição é unimodal e tem a forma de sino.
O parâmetro b controla a escala da distribuição. Quando b aumenta, a
distribuição é deslocada para a direita, e quando b diminui, a distribuição é
deslocada para a esquerda.
E por fim, o parâmetro x é a variável aleatória.
A sua função de densidade de probabilidade toma a seguinte forma:

(Figura 16: FDP de Dagum)

Com sua esperança e variância possuindo as seguintes formas:

(Figura 17: esperança de Dagum)

(Figura 18: variância de Dagum)


(Figura 19: gráficos ilustrando o comportamento da distribuição de Dagum)

Esse gráfico demonstra o efeito dos demais parâmetros sendo alterados, a, b e


p são parâmetros de forma, e o x, que é a progressão, é a variável aleatória.
1.4 – Distribuição de Rayleigh

Descrição: A distribuição de Rayleigh é uma distribuição contínua utilizada


para modelar a magnitude de um vetor bidimensional ou tridimensional cujas
componentes são distribuídas normalmente e independentemente. Ela é
amplamente aplicada em engenharia, física e estatística, especialmente
quando se lida com a análise de ruído, propagação de ondas e fenômenos
aleatórios relacionados.

A função de densidade de probabilidade de Rayleigh:


(Figura 20: FDP de Rayleigh)

Onde σ² é a média temporal da potência do sinal antes da detecção do


envelope e y²/2 é a potência do sinal em desvanecimento de pequena escala.

(Figura 21: gráfico de distribuição Rayleigh)

Exemplos de aplicação: A distribuição de Rayleigh é frequentemente usada


em estudos de física para modelar fenômenos relacionados à propagação de
ondas, como a intensidade do sinal após atravessar uma barreira ou ser
espalhado por um meio turbulento.

 Esperança: E(x) = σ * √(π/2)


 Variância: Var(x) = (4 - π) * σ² / 2
(Figura 22: equações da distribuição Rayleigh)

Foi pesquisado e encontrado este quadro com uma das equações e o seguinte
que mostra um gráfico no qual utilizaram a distribuição de Rayleigh.

(Figura 23: gráfico demonstrando diferentes parâmetros em Rayleigh)

Este gráfico é de um estudo que mostra uma relação entre a quantidade de


esforço de trabalhadores em função do tempo, onde “a” é 1/tempo^2, quanto
mais alto o valor de “a” mais cedo ocorre o pico máximo e maior vai ser a
inclinação do gráfico ou “steepness”.

Este gráfico mostra a distribuição de Rayleigh, a linha preta diz a respeito da


chamada de “Distribuição Standard de Rayleigh.”
Parâmetros: x ≥ 0 é a variável aleatória, e σ > 0 é o parâmetro de escala que
determina a dispersão dos dados.

1.5 – Distribuição de Tweedie.


A família de Tweedie é uma classe de distribuição que é capaz de modelar
ambas probabilidades discretas e contínuas como um único modelo e suas
distribuições são um caso especial de modelos de dispersão exponencial.
Porém, ela não tem uma FDP capaz de ser expressa de forma simples através
de uma única expressão, apesar de ter esperança e variância, que podem ser
expressos como:

(Figura 24: esperança em Tweedie)

(Figura 25: variância em Tweedie)

Uma função de variância que é um parâmetro que adiciona forma para a


distribuição em que "p" é algumas vezes escrito nos “termos de forma” do
parâmetro a: p = (a -2) / (a -1).
Apesar de sua inata complexidade, Tweedie ainda pode ser expressada de
forma gráfica:

(Figura 26: gráfico ilustrando o comportamento de Tweedie)

Um exemplo aonde a Distribuição de Tweedie pode ser utilizada é para


modelar queda de chuva. Foram usados para mostrar a medição da queda de
chuva mensal de Charlesville e da queda de chuva diária em Melbourne.

2. Discretas

2.1 - Distribuição de Kumaraswamy;


Em estatísticas, a distribuição de Kuramaswamy é na verdade, uma família de
distribuições de probabilidade, originalmente proposta por Ponnambalam
Kumaraswamy, que foi um dos principais hidrólogos da Índia, e desenvolveu a
função de probabilidade para variáveis com limites superiores e inferiores.

Essa distribuição tem uma relação próxima com a distribuição Beta, e tem a
seguinte forma:

(Figura 27: função de distribuição Kuramaswamy)

E suas respectivas esperanças e variâncias tem as seguintes formas:

(Figura 28: esperança de Kuramaswamy)

(Figura 29: variância de Kuramaswamy)

(Figura 30: gráfico demonstrando o comportamento de diferentes parâmetros em


Kuramaswamy)
A distribuição de Kumaraswamy é definida por dois parâmetros, denotados por
a e b. Os parâmetros a e b devem ser positivos e controlam a forma da
distribuição: quanto maior o valor de a, mais concentrada a distribuição em
torno do limite inferior (x=0); quanto maior o valor de b, mais concentrada a
distribuição em torno do limite superior (x=1).

Vale denotar que os resultados no gráfico são extremamente similares a função


Beta, como pode ser visto:

(Figura 31: gráfico do comportamento da função Beta para comparação)

2.2 Distribuição de Zipf-Mandelbrot;

Descrição: A distribuição de Zipf-Mandelbrot é uma distribuição discreta que é


uma variação da distribuição de Zipf. Essa distribuição é frequentemente usada
para modelar a distribuição de frequências de palavras em textos, onde
algumas palavras são extremamente comuns e outras são extremamente
raras.

(Figura 32: função da distribuição de Zipf-Mandelbrot)

 Aonde P1, P2 e P3 são constantes.


Exemplos de aplicação: Um exemplo comum de aplicação da distribuição de
Zipf-Mandelbrot é na modelagem de distribuição de palavras em textos. Essa
distribuição pode ajudar a entender e caracterizar a distribuição de frequências
de palavras em diferentes línguas ou corpora textuais.

Também pode ser utilizado para outras coisas como por exemplo:

A distribuição das 50 maiores cidades dos Estados unidos de acordo com o


próprio ranque.

(Figura 33: gráfico A de Zipf-Mandelbrot)

O autor assume arbitrariamente que as datas possuem 5% de erro. Os valores


reais dos parâmetros ajustados dependem dos detalhes do ajuste. Esta por sua
vez mostra “A lista de países mais populosos, ajustados pela fórmula de
Mandelbrot:
(Figura 34: gráfico B de Zipf-Mandelbrot)

Esperança e Variância: A esperança matemática (valor médio) e a variância


para a distribuição de Zipf-Mandelbrot são mais complexas de serem
calculadas em termos explícitos e dependem dos parâmetros “α” e “s”. No
entanto, é possível estimá-las a partir de técnicas estatísticas.

2.3 – Distribuição de Polya-Aeppli;

A fórmula para a função de massa de probabilidade Polya-Aeppli é:

(Figura 35: função da distribuição Polya-Aeppli)

A fórmula de sua variância é a seguinte:


(Figura 36: variância de Polya-Aeppli)

Esperança:

(Figura 37: esperança de Polya-Aeppli)

(Figura 38: gráfico de Polya-Aeppli)

Este é um gráfico de Polya-Aeppli com θ, qual especifica o primeiro parâmetro


de forma, e p o qual especifica o segundo parâmetro de forma. X é uma V.A. e
y também pode ser uma V.A. quanto um parâmetro onde o valor do FDP de
Polya-Aeppli é armazenado.
Polya-Aeppli pode ser implementada em programação estatística na qual a
linguagem R está presente.

Em um dos trabalhos consultados, mostra-se que Poisson é um caso particular


de Polya-Aeppli e que o processo de Polya-Aeppli poderia ser dispersado o
que dá uma maior flexibilidade em modelar data contada. Geralmente é
utilizada no processo de contagem de modelos de risco.

2.4 – Distribuição de Skellam;

Distribuição proposta por Alzaid e Omair (2010) ao estudarem as propriedades


e aplicações de uma distribuição obtida a partir da diferença entre variáveis
aleatórias independentes de Poisson. A distribuição foi chamada como
Skellam.

Qualquer par de V. A. (variáveis aleatórias) que podem ser escritas como: X =


W1 + W3 e Y = W2 + W3 com W1 ~ Poisson (θ1) independente de W2 ~
Poisson (θ2) e W3 seguindo uma distribuição qualquer, a Função de
Probabilidade de Z = X – Y é dada por:

(Figura 39: função de probabilidade de Z = X -Y)

Em que

(Figura 40: função da variável I)

É a função de Bessel modificada de primeiro tipo e Z é dito ter distribuição


denotada de e por Skellam (θ1, θ2).

Skellam tem 4 propriedades:


I) Soma de variáveis aleatórias que seguem a distribuição de Skellam.

II) A diferença de variáveis aleatórias também segue a distribuição de

Skellam:
III) A função geradora de momentos da distribuição Skellam é dada por:
MY1 (t) = exp [− (θ1 + θ2) + θ1et + θ2e−t];

Os valores de variância são dados por:

(Figura 41: variância de Skellam)

Os valores de esperança são dados por:

(Figura 42: esperança de Skellam)


(Figura 43: ilustração em gráficos)

(Figura 44: gráfico demonstrando parâmetros diferentes)

As letras gregas se mudam, mas as distribuições são de Skallam. As linhas dos


primeiros 4 gráficos são distribuições: Histograma, Gaussiana e Skew Normal
se aproximando do comportamento de Skellam.

A distribuição de Skellam é usada em campos variados como física, medicina e


dados esportivos.

2.5 – Distribuição de Narayana.

Fontes citam essa distribuição como uma distribuição discreta, porém, há de se


duvidar de que isso sequer seja uma distribuição. A distribuição de Narayana é
uma distribuição discreta que modela o número de caminhos de comprimento n
em uma grade n x n que não cruzam a diagonal principal. Ela é usada em
diversas áreas, como combinatorial, física e estatística. A distribuição de
Narayana é definida pelos números de Narayana, que são dados pela seguinte
fórmula recursiva:
(Figura 45: fórmula de recursão dos números de Narayana)

Ao utilizar uma tecnologia levemente diferente T. V. Narayana introduziu a


distribuição:

(Figura 46: fórmula da distribuição de Narayana)

Com os parâmetros: 1 menor ou igual a k menor ou igual a n. além de se dividir


em dois com I-Narayana e o s-Narayana. Aparentemente Narayana é uma
distribuição de pontos, não exatamente de probabilidade.

(Figura 47: o caminho esquerdo P pertence a L13)

(Figura 48: um caminho P’ e seu polinômio correspondente)


(Figura 49: a árvore correspondendo ao caminho)

(Figura 50: a correspondência de uma disseção de um polígono e de uma árvore)

Relatório da busca por informações e conclusão:

Certas fontes não passam confiabilidade então houve uma busca por fontes
melhores e um aprimoramento do trabalho anterior. As distribuições de
Kumaraswamy e Narayana obtiveram pequenos contratempos, contudo
espera-se que este artigo possa passar o conteúdo de forma clara e objetiva
para quem o ler. Os diversos métodos de cálculo de probabilidade possuem
seus mais diversos cenários para uso, e esse artigo teve em vista ilustrar dez
desses.
Referências

GUERRA, Renata Rojas. SOME GENERALIZED BURR XII DISTRIBUTIONS


WITH APPLICATIONS TO INCOME AND LIFETIME DATA. Disponível em:
https://repositorio.ufpe.br/bitstream/123456789/25301/1/TESE%20Renata
%20Rojas%20Guerra.pdf. Acesso em: 18 maio 2023.
PERALTA, Danielle et al. APLICAÇÃO DA DISTRIBUIÇÃO BURR XIII NA
ANÁLISE DO TEMPO ATÉ A PRIMEIRA POSTURA DE CODORNAS.
Disponível em: http://repositorio.ufla.br/bitstream/1/13960/1/ARTIGO_Aplica
%c3%a7%c3%a3o%20da%20distribui%c3%a7%c3%a3o%20Burr%20XII
%20na%20an%c3%a1lise%20do%20tempo%20at%c3%a9%20a%20primeira
%20postura%20de%20codornas.pdf. Acesso em: 18 maio 2023.
GUERRA, Renata Rojas; PEÑA-RAMÍREZ, Fernando A.; CORDEIRO, Gauss
M.. The Weibull Burr XII distribution in lifetime and income analysis.
Disponível em: https://www.scielo.br/j/aabc/a/vR75PXVgmxtML8Fx6q6vTbR/.
Acesso em: 18 maio 2023.
GAD, Ahmed M. et al. The Burr XII-Burr XII Distribution: Mathematical
Properties andThe Burr XII-Burr XII Distribution: Mathematical Properties
and CharacterizationsCharacterizations. Disponível em:
https://epublications.marquette.edu/cgi/viewcontent.cgi?
article=1016&context=math_fac. Acesso em: 18 maio 2023.
EXTREME Value Type I Distribution. Disponível em:
https://www.itl.nist.gov/div898/handbook/eda/section3/eda366g.htm. Acesso
em: 18 maio 2023.
COTTA, Higor Henrique Aranda; CORREA, Wesley de Souza Campos;
ALBUQUERQUE, Taciana Toledo de Almeida. APLICAÇÃO DA
DISTRIBUIÇÃO DE GUMBEL PARA VALORES EXTREMOS DE
PRECIPITAÇÃO NO MUNICÍPIO DE VITÓRIA - ES. Disponível em:
https://revistas.ufpr.br/revistaabclima/article/view/39440/29391. Acesso em: 18
maio 2023.
KLEIBER, Christian. A Guide to the Dagum Distributions. Disponível em:
https://edoc.unibas.ch/61230/1/20180305141821_5a9d439d76be5.pdf. Acesso
em: 18 maio 2023.
SANTOS, José Vicente Cardoso; MOREIRA, Davidson Martins; MORET,
Marcelo A.. POTENCIAL EÓLICO, MODELAGENS DE RAYLEIGH-WEIBULL
E CORRELAÇÕES BILINEARES DE LONGO ALCANCE EM SALVADOR-
BA. Disponível em:
https://web.archive.org/web/20180512203019id_/https://www.revistas.uneb.br/
index.php/gestecimc/article/viewFile/3027/1965. Acesso em: 18 maio 2023.

LINO, Fernando. Caracterização da distribuição de Weibull em ambientes


indoor. Disponível em:
http://repositorio.sis.puc-campinas.edu.br/handle/123456789/15069. Acesso
em: 18 maio 2023.
MELO FILHO, Eloi et al. Distribuição estatística de alturas de ondas
individuais em Santa Catarina: resultados preliminares. Disponível em:
https://repositorio.furg.br/handle/1/5120. Acesso em: 18 maio 2023.
SANTOS, Lucas Pereira dos. PROPOSTA DE UM MÉTODO DE ESTIMATIVA
DE ESFORÇO PARA PROJETOS DE DESENVOLVIMENTO DE SOFTWARE
CRÍTICOS. Disponível em: http://mtc-m21c.sid.inpe.br/col/sid.inpe.br/mtc-
m21c/2018/11.01.15.50/doc/publicacao.pdf. Acesso em: 18 maio 2023.
FÁVERO, Alessandro Abreu et al. Distribuição de abundância de espécies
da comunidade arbórea dotopo de um morro na floresta estacional
subtropical. Disponível em:
https://www.scielo.br/j/cr/a/L6d3P47drxVWzDQxCXfHs6y/?lang=pt. Acesso em:
18 maio 2023.
TUNNINCLIFE, Martin; HUNTER, Gordon. Random sampling of the Zipf–
Mandelbrot distribution as a representation of vocabulary growth.
Disponível em:
https://www.sciencedirect.com/science/article/pii/S0378437122008172?via
%3Dihub. Acesso em: 18 maio 2023.
Budker Institute of Nuclear Physics. Citations and the Zipf-Mandelbrot’s law.
Disponível em: https://arxiv.org/pdf/physics/9901035.pdf. Acesso em: 18 maio
2023.
THE Mathematica Journal: Volume 13. Volume 13. Disponível em:
https://www.mathematica-journal.com/2011/07/01/the-combinatorics-of-
distributions/. Acesso em: 18 maio 2023.
MENDES, Fernanda Gabriely Batista. Processo Skellam INAR(1) Assim
́etrico. Disponível em: https://repositorio.ufmg.br/bitstream/1843/BUBD-
A9ZH9Z/1/disserta__o_final_.pdf. Acesso em: 18 maio 2023.
SHEWHART, Walter A.; WILKS, Samuel S.. Statistical Size Distributions in
Economics and Actuarial Sciences. Disponível em:
http://www.louischauvel.org/kk.pdf. Acesso em: 18 maio 2023.

Você também pode gostar