Você está na página 1de 6

1 ESTATISTICA DESCRITIVA O objetivo da Estatstica Descritiva resumir as principais caractersticas de um conjunto de dados por meio de tabelas e grficos e resumos

os numricos. Conceitos importantes Populao - o conjunto total de elementos portadores, de pelo menos, uma caracterstica comum. Amostra - uma parcela representativa da populao que ser examinada com o propsito de tirarmos concluses sobre essa populao.

Dados Brutos - So dados que ainda no foram numericamente organizados. Portanto difcil termos uma idia exata do comportamento do grupo como um todo. Rol - Um rol a tabela obtida aps a ordenao dos dados. Classe o intervalo de variao da varivel e simbolizado por i e o nmero total de classe simbolizado por k Limites de Classe So os extremos de cada classe. O menor nmero o limite inferior de classe (li) e o maior nmero limite superior de classe (ls). Amplitude do Intervalo de Classe obtida por meio da diferena entre o limite superior e inferior da classe e simbolizada por

hi = ls li .

Ponto Mdio da Classe o ponto que divide o intervalo de classe em duas partes iguais. Amplitude Total da Amostra (Rol) a diferena entre o valor mximo e o valor mnimo do rol. Em nosso exemplo:

AT = 61 41 = 20

Distribuio de Freqncia sem Intervalos de Classe: a simples condensao dos dados conforme a repetio de seus valores. Distribuio de Freqncia com Intervalo de Classe: Quando o tamanho da amostra mais elevado, mais racional efetuar o agrupamento dos valores em intervalos de classe. Construo: 1) Organizar os dados brutos em um rol; 2) Calcular a amplitude total da amostra; 3) Calcular o n de classes, utilizando a frmula de Sturges k = 1+ 3,22log n, onde n o nmero de dados ou de observaes; 4) Determinar a amplitude do intervalo de classe, dividindo a amplitude total AT da amostra pelo nmero de classes k, ou seja , faa h = AT / k. MEDIDAS DE TENDNCIA CENTRAL So medidas que fornecem o valor do ponto em torno do qual se distribuem os dados. A MDIA ARITMTICA mdia aritmtica uma medida estatstica que calculada somando-se todos os possveis valores de um conjunto de dados e dividindo-se pelo nmero de itens desse mesmo conjunto. 1) Para dados no-agrupados ou dados brutos Utilizamos a expresso

X =

x
n

2) Para dados agrupados: Dados agrupados so aqueles que esto dispostos em uma tabela de distribuio de freqncias. Utilizamos a expresso:

X =
A MEDIANA

x .f
i

; onde

n = fi

A mediana o valor que ocupa a posio central de uma distribuio de dados ordenados em um rol. Consideremos tambm dois casos: 1) PARA DADOS NAO AGRUPADOS 5.2.1 Amostras de tamanho impar - Ex: 1, 4, 6, 9 e 11

Md=6

5.2.2 Amostras de tamanho par - Ex: 1, 5, 7, 10, e 11 M d = (7 + 8) /2 = 7,5 2) PARA DADOS AGRUPADOS. Utilizamos a expresso:

M d = lmd
l md h n f f md = = = = =

n fi 2 .h + f md

Onde:

Limite Inferior da classe que contm a M d Amplitude da classe M d Tamanho da amostra Freqncia acumulada anteriores M d Freqncia absoluta da classe M d

A MODA o valor que ocorre com mais ou maior freqncia em uma distribuio de dados Aqui, tambm temos que considerar dois casos: 1) 5.3.1 DADOS NO AGRUPADOS Valor (es) que mais se repetem

2) 5.3.2 DADOS AGRUPADOS 1 Passo : Identifica-se a classe modal. A classe modal aquela que possui maior freqncia.

2 Passo : Aplica-se a frmula:

M o = li +

1 .h 1 + 2

Onde:

li

= Limite inferior da classe modal;

1 = Diferena entre a freqncia da classe modal e a classe anterior ; 2 = Diferena entre a freqncia da classe modal e a classe posterior; h = Amplitude da classe. QUARTIS So Separatrizes que dividem um conjunto de dados em quatro partes iguais 0% 25% Q1 6.1.1 Primeiro Quartil - Q1 Separatriz que divide a distribuio em duas partes, tal que 25% dos valores sejam menores que ele e 75% maiores que ele. 6.1.2 Segundo Quartil - Q2 O segundo quartil coincide exatamente com a mediana. o valor que divide a distribuio em exatamente metade dos elementos. 6.1.3 Terceiro Quartil - Q3 Valor que deixa 75% dos valores sua esquerda e os 25% restante sua direita - Frmula para o Clculo dos Quartis. a mesma utilizada para o clculo da mediana, com pequenas adaptaes. 50% Q2 75% Q3 100%

n f ant 4 Q1 = lQ1 + f Q1

.h

Determinao de Q 1 1 Passo : Calcula-se n/4; 2 Passo : Identifica-se a classe Q1, atravs da Fi ; 3 Passo : Aplica-se a frmula. - Determinao de Q3 1 Passo : Calcula-se 3n/4; 2 Passo : Identifica-se a classe Q3 pela Fi; 3 Passo : Aplica-se a frmula DECIS - Di So separatrizes que dividem uma srie ou uma seqncia de dados ou de observaes em 10 partes iguais. 0% 10 % 20% 30% 40% 50% . . . . . . . . . . . . . . . . . . . . 90% 100%

D1 - Frmula

D2

D3

D4

D5

D6

D7

D8

D9

D10

A frmula, neste caso, tambm idntica s separatrizes anteriores. - Procedimento 1 passo : Calcula-se (i . n) / 10, i = 1, 2, 3, 4, 5, 6, 7, 8, 9 2 passo: Identifica-se a classe D i pela F ac. 3 passo : Aplica-se a frmula:

Di = l Di
l Di n h f Di f ant
_

in f ac 10 + f Di

.h

Onde :

= limite inferior da classe D i , i = 1, 2, 3, ..9 = tamanho da amostra = amplitude de classe = freqncia da classe D i = soma das freqncias anteriores classe D i

6.3 PERCENTIS - Pi So as medidas que dividem a amostra em 100 partes iguais. 0% 1% 2% 3% 4% ....... 50% .... 97% 98% 99% 100%

P1

P2

P3

P4 ..

P50 ............P70

P97

P98

P99

P100

- Procedimento: 1 Passo: Calcula-se in / 100 , com i = 1, 2, 3, ......, 98, 99. 2 Passo: Identifica-se a classe Pi pela F ac 3 Passo: Usa-se a mesma frmula dos Decis, trocando-se l di por l Pi e f Di por f Pi MEDIDAS DE DISPERSO (VARIABILIDADE) So medidas que servem fundamentalmente para verificar a representatividade das medidas de tendncia central, pois, estas, por si s, no so suficientes para caracterizar totalmente uma seqncia numrica. A VARINCIA E O DESVIO-PADRO 1. Nosso propsito medir o grau de concentrao dos dados em torno da mdia; 2. Nada mais interessante de que estudarmos os desvios de cada valor em relao media, isto ,

(Xi X )

3. Tomando-se o somatrio de todos esses desvios, temos que: O DESVIO MDIO

=(Xi X ) =0

DM =

. fi

7.3.1 Clculo da Varincia e do Desvio-padro: Para o clculo da varincia e do desvio-padro vamos considerar as seguintes expresses: Varincia Desvio-padro Universo Populacional Amostral

2 =

( X i X )2 . fi n
i

2
S2

S2 =

( X

X )2 . fi

n 1

Comentrios 1 - No clculo da varincia, quando elevamos os desvios ao quadrado, a unidade de medida tambm ficar elevada ao quadrado, sempre; 2 - Em diversas situaes, a unidade de medida da varincia nem faz sentido. o caso por exemplo, em que os dados so expressos em litros, pizzas, salrios, etc... Portanto, o valor da varincia no pode ser comparado diretamente com os dados da srie, ou seja, a varincia no tem interpretao 3 - Exatamente para suprir essa deficincia da varincia que lanamos mo da definio do desvio-padro, que por sua vez, ter sempre a mesma unidade de medida da srie e portanto admite interpretao. 7.3.3 Interpretao do Desvio-padro O desvio-padro , sem dvida a mais importante das medidas de disperso e vital que o pesquisador consiga relacionar o valor obtido atravs da frmula, com os dados da srie. Quando uma curva de freqncia representativa de uma srie perfeitamente simtrica , a construo grfica em forma de sino corresponde curva normal (curva de Gauss) e podemos afirmar que:

+2

+3

Zona de normalidade (2) Intervalo (%) de valores contidos da srie 68 95 99

(X ) ( X 2 ) ( X 3 )
- ZONA DE NORMALIDADE

A zona de normalidade definida por um conjunto de valores (ou uma regio) em torno da mdia aritmtica, contidos num intervalo de amplitude 2 , ou seja, - antes da mdia e + depois da mdia COEFICIENTE DE VARIAO (Disperso Relativa) Coeficiente de Variao, ou seja,

Cv =
Concluso

1. 2.

O coeficiente de variao um nmero puro, portanto pode ser expresso em percentual. O coeficiente de variao leva em considerao tanto a mdia quanto a disperso absoluta da srie, portanto uma medida mais completa do que a disperso absoluta isoladamente;

3 . Para nosso exemplo, comparando os C V de X e Y conclui-se que Y tem menor disperso relativa do que X. MEDIDAS DE ASSIMETRIA Assimetria o grau de afastamento de uma distribuio da unidade de simetria. Quando uma distribuio simtrica, os valores da mdia, da moda e da mediana so coincidentes. A figura abaixo (a) mostra uma distribuio simtrica; (b) assimtrica positiva e (c) assimtrica negativa. (a) f f (b) f (c)

X =Mo =Md
simtrica 8.1 COEFICIENTE DE ASSIMETRIA 1 Coeficiente de Pearson

M o M d X
assimtrica positiva

X M d M o
assimtrica negativa

2 Coeficiente de Pearson (Bowley)

(X M o ) As =
Observaes 1 2

As =

(Q1 + Q3 2M d ) Q3 Q1

O uso de um ou outro coeficiente vai depender da dificuldade de se calcular uma ou outra estatstica. (Q3 Q1) Chama-se Intervalo Interqualtico. = 0 < > 0 0 distribuio Simtrica. Assimtrica Negativa Assimtrica Positiva

AS

MEDIDAS DE CURTOSE Curtose o grau de achatamento de uma distribuio. As figuras a, b, e c mostram as trs formas que uma distribuio pode se apresentar segundo sua curtose. (b) f f f (a) (c)

mesocrtica k = 0,263 k > 0,263

leptocrtica k < 0,263

platicrtica

9.1 CLCULO DO COEFICIENTE DE CURTOSE Para se medir o Grau de Achatamento ou de Curtose de uma distribuio utiliza-se o Coeficiente:

K=

Q P90 P10

que chamado de Coeficiente Percentlico de Curtose Onde Q = 1/2 (Q 3 - Q 1) chamado de Intervalo Semi-interqualtico