Você está na página 1de 30

Estatística Descritiva

Estatística: ferramenta de análise e interpretação de dados (de variáveis);

Variável: um atributo, uma característica, uma quantidade de um objeto

Tipos de variáveis: quantitativas e qualitativas


Ex. quantitativo: diâmetro, altura, pesos, comprimentos ...;
Ex. qualitativo: classe de tortuosidade do tronco de uma árvore, classes de
qualidade, ...

Variáveis aleatórias: variáveis que possuem probabilidades associadas a sua


ocorrência;

Variáveis aleatórias contínuas: assumem todo e qualquer valor dentro de um


intervalo definido.
Ex: diâmetro, altura, peso, comprimentos, ...
Estatística Descritiva
Variáveis aleatórias discretas: assumem apenas alguns valores dentro de um
intervalo definido.
Ex: faces de um dado, número de galhos de uma árvore, classes de
infestação de cipós;

Distribuição de variáveis aleatórias (contínuas e discretas)

Os valores de uma variável seguem uma distribuição de probabilidades, definida


por uma função densidade de probabilidade (fdp), no caso de variáveis aleatórias
contínuas, ou uma função de probabilidade (fp), no caso de variáveis aleatórias
discrestas.
Entre elas temos algumas como a distribuição de Poisson, Binomial, Exponencial,
Weibull, Beta, Gama, “t”de Student e Normal, sendo esta última a mais
amplamente por representar a distribuição de muitas variáveis aleatórias
contínuas.
Estatística Descritiva
Distribuição estatística de variáveis aleatórias discretas (fp)

* Binomial
É a distribuição de probabilidades do número de sucessos em uma
sequência de n tentativas, onde cada tentativa (independente) tem como
resultado duas possibilidades - binômio - (sucesso ou fracasso).
Sua função de probabilidade é dada por:

p = probabilidade de sucesso;
n = número de ensaios;
X = k = número de sucessos.
Estatística Descritiva
Exemplo:
Suponha que a probabilidade de encontrar uma árvore com tronco
defeituoso em uma floresta (sucesso) é de 10% (p=0,1). Amostrando-se
aleatoriamente 10 árvores em uma floresta, qual a probabilidade de se obter,
por exemplo, uma árvore (k=1) com tronco defeituoso, assumindo uma
distribuição binomial?

No software Excel podemos utilizar o seguinte comando:


Estatística Descritiva
Comando do Excel:
Estatística Descritiva
Distribuição estatística de variáveis aleatórias discretas (fp)

* Poisson
No caso onde o número de ensaios é muito grande (n → ) e p é muito
pequeno (p →), há algumas dificuldades de cálculo da função binomial. Assim,
utiliza-se a função de probabilidade (fp) de Poisson, apropriada, por exemplo,
para eventos “raros”.
Sua função de probabilidade é dada por:

em que: = n.p

p = probabilidade de sucesso;
n = número de ensaios;
X = k = número de sucessos.
Estatística Descritiva
Exemplo:
Suponha que a probabilidade de encontrarmos uma árvore de
determinada espécie em uma floresta (sucesso) seja de 0,001% (p=0,00001).
Qual a probabilidade de encontrar uma árvore “rara” (k=1) em um total de
4.000 árvores amostradas (n), considerando uma distribuição de Poisson?

= n.p = 4.000 x 0,00001 = 0,04

No software Excel podemos utilizar o seguinte comando:


Estatística Descritiva
Comando do Excel:
Estatística Descritiva
Distribuição estatística de variáveis aleatórias contínuas (fdp)

* Exponencial
A distribuição exponencial apresenta a seguinte função densidade de
probabilidade:

O comportamento gráfico da distribuição das probabilidades em relação


aos valores de x é:

???????
Estatística Descritiva
Distribuição estatística de variáveis aleatórias contínuas (fdp)

* Exponencial
Probabilidade é a área sob a curva de probabilidades. Assim, integrando-
se a função entre intervalos definidos, obtém-se a função de distribuição
acumulada (fda), dada por:

O comportamento gráfico da distribuição acumulada das probabilidades


em relação aos valores de x é:
Estatística Descritiva
Distribuição estatística de variáveis aleatórias contínuas (fdp)

* Exponencial
Seja um igual a 0,5 (taxa de descréscimo das probabilidades). Assim, a
probabilidade acumulada até um valor de x igual a 2 é:

Obs: ver gráfico anterior!

No Excel, o comando para calcular a probabilidade acumulada até um


dado valor de x, considerando uma distribuição exponencial, é:

=DISTR.EXPON(2;0,5;VERDADEIRO)
Estatística Descritiva
Distribuição estatística de variáveis aleatórias contínuas (fdp)

* Exponencial
Suponha que x=2 seja referente a segunda classe de diâmetro em uma
distribuição diamétrica de uma floresta natural com 10.000 árvores. Desta
forma, o número de árvores acumulado até a segunda classe seria:
N = 0,6321 x 10.000 = 6321 árvores

Se quiser saber quantas árvores tem na segunda classe, basta calcular a


probabilidade acumulada até x=1, diminuir da probabilidade acumulada até
x=2 e multiplicar por 10.000.

N(2) =
Estatística Descritiva
Distribuição estatística de variáveis aleatórias contínuas (fdp)

* Weibull
A função densidade de probabilidade Weibull (fdp) com três parâmetros
é dada por:

Sendo α (alfa) denominado de parâmetro de posição, pois controla a


posição da curva sobre o eixo das abscissas; β (beta) o parâmetro de escala,
uma vez que controla as dimensões que a curva assume, dada uma forma
constante; e ϒ (gama) o parâmetro de forma, por controlar as diferentes
formas que a distribuição pode assumir, tornando-a uma função muito flexível
Estatística Descritiva
Distribuição estatística de variáveis aleatórias contínuas (fdp)

* Weibull
A função densidade acumulada (fda) é dada por:

Por exemplo, para uma floresta equiânea, cujas estimativas dos


parâmetros da função Weibull (fda) são: α=4,0; β=13,962715; γ=2,614441,
tem-se a seguinte distribuição diamétrica observada e estimada.
Estatística Descritiva
Distribuição estatística de variáveis aleatórias contínuas (fdp)

* Weibull
Estatística Descritiva
* Distribuição normal

Sua fdp é dada por:

Graficamente, tem-se:
Estatística Descritiva
* Distribuição normal

Sua fdp é dada por:

X~N(μ, )

Não existe uma curva única de distribuição normal porque esta depende
dos parâmetros da média e da variância da distribuição dos valores de X.
Assim, se fizermos μ = 0 e , então temos a distribuição normal padronizada Z,
tal que Z ~ N(0, ), com a qual calculamos as probabilidades de ocorrência de
valores de X.
Tabela de Z!
Estatística Descritiva
*Distribuição normal

Interpretação: espera-se uma maior probabilidade de ocorrência de valores


de uma variável X qualquer próximo a média, considerando uma variação em
torno deste valor médio.
Em termos de esperança metemática tem-se: E(x) = μ
Estatística Descritiva
Estimadores dos parâmetros da distribuição normal!

A distribuição tem dois parâmetros: μ (média) e σ2 (variância), os quais são


estimados por:

• Média aritmética:

• Variância:
Estatística Descritiva
Demonstrações (no quadro):

=>

Exemplo:

Seja uma variável X ~ N(, σ2), cuja amostra de tamanho n=6, foi obtida:
X= 5, 7, 9, 14, 18 e 21

Assim, as estimativas de média e variância são, respectivamente:


Estatística Descritiva
> = 40,67

A variabilidade em torno da média, na unidade original é dada pelo desvio


padrão (S), tal que:

A variabilidade em torno da média também pode ser expressa em termos


percentuais pelo coeficiente de variação, calculado por:
Estatística Descritiva
As estimativas da média e da variabilidade, em termos absoluto (S2 e S)
depende da grandeza da medida, mas o coeficiente de variação, não. Por
exemplo, sejam dados de duas amostra de uma variável X1 e X2:

X1 = 2, 5, 7, 9, 14
X2 = 25, 35, 41, 48, 51
Estatística Descritiva
No Excel, o comando para o cálculo das estatísticas para a variável X1, é:
Estatística Descritiva
Como demonstrado é um estimador de μ. Se, de um total de “N”
observações, for retirada uma amostra de tamanho “n” e calculada a
estimativa de , o quanto esta estimativa pode ser diferente de μ?

Esta informação pode ser obtida calculando-se o erro padrão da média,


dado por:

ou
População infinita População finita

Obs: se todos os “N” valores forem medidos, então, n=N e 0, porque tem-se
μ. Se todos os “N” valores forem iguais, então, S2 = 0 e 0. Nestas duas
situações, =μ.
Estatística Descritiva
Demostração da expressão do erro padrão da média (no quadro):

Exemplo:
Sejam dados de uma amostra de tamanho n= 5, tal que:

X = 2, 5, 7, 9, 14 =>

Interpretação!
Estatística Descritiva
No setor florestal, bem como em outras áreas de conhecimento, é comum
agrupar os dados para conhecer melhor as tendências, elaborando tabelas de
frequência e gráficos de distribuição.

Exemplo 1:
Por exemplo, no inventário florestal é comum elaborar uma tabela de
frequência do número de indivíduos amostrados em cada espécie e o
percentual de contribuição em relação ao total de indivíduos amostrados, ou
representar o conteúdo da tabela em um gráfico de distribuição, como se
segue:
Estatística Descritiva
Exemplo 1:
Estatística Descritiva
Exemplo 2:
É comum agrupar os diâmetros das árvores ou as suas alturas para conhecer a
distribuição destas variáveis, calcular estatísticas e prescrever atividades como
o desbaste de árvores.
Estatística Descritiva
No exemplo 2, se o manejador da floresta quisesse calcular a média das
alturas das árvores, o estimador correto seria:

E a estimativa média das alturas das árvores seria, então:

Esta estimativa com os dados agrupados pode ser diferente da estimativa com
os dados individuais, dependendo da amplitude da classe e da distribuição
dos dados dentro da classe.
Estatística Descritiva
Exercício para casa:

Você também pode gostar