Você está na página 1de 22

Probabilidades e Estatstica

Estatstica Descritiva
Introduo
Estatstica Cincia/Disciplina cujo objectivo fundamental a recolha, a compilao, a anlise e a interpretao de dados. Nota: A palavra estatstica deriva da palavra alem staatenkund que significa cincia das coisas do estado. Os primeiros estudos estatsticos tinham como objectivo o conhecimento dos bens do Estado e de como estavam distribudos pela populao. Como todas as cincias, a Estatstica utiliza uma linguagem prpria. Assim, num estudo estatstico, comeamos por definir: Populao/Universo conjunto de elementos com determinada caracterstica em comum e com interesse para o estudo. Ex.: Objectivo: estudar a altura dos alunos do IPCB. Populao: conjunto de todos os alunos do IPCB. Populao Alvo a totalidade dos elementos sobre os quais se deseja obter determinado tipo de informao. Ex: Aceitao de uma bebida alcolica pelos portugueses. Populao: Habitantes de Portugal. Populao Alvo: Portugueses maiores de idade ( 18 anos). Finita nmero de alunos de uma escola. Populao Infinita conjunto das temperaturas nos diversos pontos do pas num determinado momento. Cada elemento da populao designado por unidade experimental ou unidade estatstica. Ex.: cada aluno do IPCB constitui uma unidade experimental do estudo das alturas dos alunos do IPCB.

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Se vamos estudar a altura dos alunos do IPCB, caracterstica altura chamamos varivel estatstica. Varivel Estatstica caracterstica ou atributo em estudo, comum a todos os elementos de uma populao. Ex.: cor dos olhos, altura, idade, etc. Quantitativa: quando se expressa numericamente (altura, peso, etc.) (mensurvel). Varivel Estatstica Qualitativa: quando se expressa nominalmente (profisso, cor dos olhos, religio, etc) (no mensurvel). Cada varivel pode tomar um determinado conjunto de valores. Ex.: cor dos olhos (varivel) > azul, castanho, verde, etc. (valores)

Discreta: pode tomar um nmero finito de valores. Ex.: n de golos num jogo. Varivel Estatstica Quantitativa Contnua: pode tomar um nmero infinito de valores. Ex.: peso corporal, altura, etc.

Ao resultado da observao de uma varivel chama-se dado estatstico. No classificado: sem qualquer ordenao. Dado Estatstico Classificado: agrupados atravs de um quadro estatstico. Ex.: abb cad dbc Valores qualitativos Dados no classificados xi a b c d Fi 2 3 2 2

Dados classificados

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Nota: por vezes conveniente fazer corresponder um nmero a cada expresso nominal correspondente a um dado qualitativo para facilitar o tratamento dos dados. Ex.: Varivel: cor dos olhos 1 azul 2 verde (...) Para se efectura um estudo estatstico necessrio recolher os dados. A recolha de dados pode ser realizada atravs de um censo/resenseamento ou de uma sondagem. Censo/Resenseamento processo que permite ter acesso a todos os elementos da populao. Nem sempre possvel ou conveniente analisar todos os elementos da populao em estudo, porque: O universo infinito ou demasiado extenso. Ex.: Presses atmosfricas nos diversos pontos da terra, num dado momento. A recolha de dados muito dispendiosa ou leva muito tempo e quando fica completa os resultados j esto desactualizados. Ex.: Censo opinio pblica sobre um candidato. A observao implicaria a destruio generalizada dos elementos da populao. Ex.: Experimentar fsforos para verificar se tm problemas. Nestes casos recorre-se a uma amostra. Amostra subconjunto de elementos extrados da populao. Sondagem estudo estatstico de uma populao feito atravs de uma amostra. Este processo permite, ter acesso a todos os elementos da amostra. Distribuio Estatstica conjunto de dados ordenados de forma ascendente [x(1), x(2), ..., x(n)]. Parmetro Estatstico caracterstica numrica da populao. Se for seleccionada uma boa amostra, podemos calcular caractersticas amostrais (ex.: mdia das alturas dos alunos da ESTCB), e com base nesses resultados efectuar uma boa avaliao dos parmetros correspondentes da populao (Ex.: Altura mdia (Parmetro populacional) dos alunos do IPCB).

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Tcnicas de Amostragem Amostragem: Operao atravs da qual se torna um certo nmero de elementos da populao em estudo. Para se obter uma amostra representativa da populao devem ser tomados os seguintes cuidados: Imparcialidade todos os elementos devem ter a mesma oportunidade de fazer parte da amostra. Representatividade a amostra deve conter em proporo tudo o que a populao possui, qualitativamente e quantitativamente. Tamanho a amostra deve ter uma dimenso adequada.

Aleatria: escolha parcial/totalmente ao acaso dos elementos a Amostragem constituirem a amostra No aleatria/ Viciada

Amostragem Aleatria Simples extrair da populao ao acaso, um nmero de elementos fixado como dimenso da amostra. Ex.: atribuir um nmero a cada aluno da EST e seleccionar 30 ao acaso. Estratificada recenseamento das unidades mais abrangentes e procede-se a uma amostragem aleatria simples em cada um dos estratos, na proporo em que a dimenso do estrato est para a dimenso da populao. Ex.: Considerar que cada curso um estrato. O nmero de alunos a escolher em cada estrato deve ser proporcional ao nmero de alunos de cada curso. Sistemtica seleccionar os elementos da amostra a partir de intervalos fixos. Ex.: Seleccionar os alunos cujo nmero mltiplo de 5.

Amostragem No aleatria Acidental baseia-se no que convm ao observador. Por cotas por idade / por classe social, etc. Convenincia seleccionar os empregados de uma empresa para responder sobre o grau de satisfao dos clientes em relao ao atendimento.

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Consoante o tipo de estudo a realizar podemos classificar a estatstica em: Estatstica Descritiva quando se analisa um conjunto de dados retirados de uma amostra. Estatstica Dedutiva/Inferncia Estatstica quando a partir das concluses obtidas durante a anlise de um conjunto de dados se retiram concluso sobre todos os elementos da populao a estudar.

Populao

amostra

Parmetros (desconhecidos)

Estatsticas (conhecidos)

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Organizao de Dados
Aps a recolha de dados necessrio proceder sua organizao de forma a se conseguir retirar informao. A organizao dos dados pode ser realizada atravs de Tabelas de Frequncias e de Grficos. A forma de organizao em tabela ou o tipo de grfico a usar depende do tipo de dados: Discretos ou Contnuos.

Tabelas de Frequncias As tabelas de frequncias permitem organizar os dados observados. Numa primeira coluna colocamos os dados observados (xi) por ordem crescente (no caso dos dados serem contnuos os dados so agrupados em classes sendo estas apresentadas na primeira coluna da tabela ver forma de criao de classes mais frente). Uma vez definidos os valores da varivel, vamos contabilizar quantas vezes observado cada um desses valores, obtendo-se a Frequncia Absoluta de cada dado. Supondo que foram observados k dados diferentes, a tabela seguinte apresenta a forma de organizao dos dados em tabela de frequncias: xi x1 x2 ... xk
k

fi f1 f2 ... fk

Fi F1=f1+0 F2=f2+F1

fri

Fri Fr1=fr1+0 Fr2=fr2+Fr1

fr1 = fr2

f1 n f2 = n

Fk=fk+Fk-1=n

frk =
k

fk n

Frk=frk+Fr(k-1)=1

fi = n
i =1

fri = 1
i =1

fi - Frequncia Absoluta: corresponde ao nmero de vezes que ocorre o valor do dado de ndice i. A soma de todas as frequncias absolutas igual ao nmero total de observaes da amostra.

fi = n
i =1

Fi Frequncia Absoluta Acumulada: o somatrio de todas as frequncias absolutas de ndice menor ou igual a i.

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

fri Frequncia Relativa: o quociente entre a frequncia absoluta e o

f nmero total de observaes da amostra. fri = i n


Fri Frequncia Relativa Acumulada: o somatrio de todas as frequncias relativas de ndice menor ou igual a i. No caso dos dados serem relativos a variveis contnuas ou, sendo dados discretos, apresentem uma grande diversidade de dados observados, os dados so agrupados em intervalos ou classes sendo estas que passam a figurar na 1 coluna da respectiva Tabela de Frequncias. Definio: No mbito da disciplina define-se classe como sendo um intervalo fechado esquerda e aberto direita: [Ii;Si[ onde Ii e Si definem respectivamente os limites inferior e superior da classe. Com esta definio de classe podemos definir: Amplitude da Classe = Si - Ii

I + Si Ponto Mdio da Classe = i = x i' 2


Com base nos dados observados, para proceder sua organizao em tabela de frequncias necessrio definir as classes com que vamos trabalhar. Para isso devemos comear por definir quantas classes vamos usar e depois a amplitude de cada classe. No existe uma regra universalmente aceite para determinar o n de classes a considerar. No mbito da disciplina iremos utilizar a seguinte regra:

5 , se n < 25 k = n , se n 25
Uma vez definido o n de classes a considerar, a amplitude de cada classe ser determinada da seguinte forma: Amplitude da Classe =

Amplitude do Intervalo de Variao = N de Classes Valor Mximo Observado Valor Mnimo Observado N de Classes

A definio das classe deve comear tendo por base o valor mais baixo observado ao qual se soma a amplitude calculada obtendo-se o limite superior da classe. Este valor usado como limite inferior da classe seguinte ao qual se soma a amplitude calculada para obter o limite superior. Este procedimento repetido at se definirem todas as classes previstas para o conjunto de dados.

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

NOTA: Por vezes acontece termos observaes que no ficam incluidas nas classes consideradas inicialmente. Geralmente este facto deve-se a arredondamentos nos clculos e resolve-se criando uma nova classe com a amplitude da anterior de forma a que todas as observaes constem na tabela de frequncias.

Representaes Grficas Os dados tambm podem ser representados graficamente. Os tipos de grficos a usar dependem do tipo de dados com que estamos a trabalhar: Grficos Dados Discretos Grficos de Barras usam-se para representar frequncia absolutas ou frequncias relativas Pictogramas (semelhantes aos grficos de barras mas que utilizam imagens relativas aos dados em vez das barras) Sectogramas - usam-se para representar frequncia absolutas Diagramas de Caule e Folhas - usam-se para organizar/representar os dados observados sem recurso tabela de frequncias Grficos da Funo Cumulativa usam-se para representar frequncias absolutas acumuladas ou frequncias relativas acumuladas Grficos Dados Agrupados em Classes Histograma grfico construdo com rectngulos adjacentes de tal modo que a base de cada rectngulo tem largura proporcional amplitude da respectiva classe e a altura proporcional respectiva frequncia (absoluta, relativa, absoluta acumulada ou relativa acumulada, consoante o que se pretende representar) Polgonos de Frequncias Os polgonos de frequncias so grficos construdos a partir de histogramas diferindo o modo de construo consoante se est a representar frequncias absolutas/relativas ou frequncias acumuladas. Caso o polgono esteja a ser construido com base no histograma de frequncias absolutas/relativas, este obtm-se unindo os pontos mdios dos topos dos rectngulos dos histogramas. Caso o polgono esteja a ser construido com base no histograma de frequncias acumuladas (absolutas/relativas), este obtm-se unindo os limites superiores dos topos dos rectngulos dos histogramas. A este polgono d-se o nome de Ogiva de Galton. Apresentam-se de seguida exemplos de organizao de dados.

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Exemplos de Organizao de Dados Discretos A tabela seguinte apresenta as idades de 20 alunos de uma turma. 17 18 19 17 21 20 19 20 22 18 18 17 18 18 18 19 19 17 18 19

Organizao dos dados em Tabela de Frequncias xi 17 18 19 20 21 22


k

fi 4 7 5 2 1 1

Fi 4+0=4 7+4=11 5+11=16 18 19 20


k

fri

Fri 0,2 0,35+0,2=0,55 0,8 0,9 0,95 1

4 = 0,2 20 7 = 0,35 20
0,25 0,10 0,05 0,05

fi = 20

i =1

fri = 1
i =1

Atravs da tabela podemos verificar que: Existem 7 alunos com 18 anos (ver nas frequncia absolutas); Existem 16 alunos com idade inferior a 20 anos (ver nas frequncias absolutas acumuladas); Os alunos com 20 anos constituem 10% do total de alunos (ver nas frequncia relativas); 80% dos alunos tm idade inferior ou igual a 19 anos (ver nas frequncia relativas acumuladas).

NATRCIA SANTOS

2011/2012

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Representaes Grficas Grficos de Barras:

fi 8 7 6 5 4 3 2 1 0

Grfico de Barras

17

18

19

20

21

22 Xi

Sectograma:

grfico circular dividido em sectores. Cada sector corresponde a um valor

observado sendo a sua amplitude proporcional respectivafrequncia absoluta. O clculo da amplitude de cada sector realiza-se da seguinte forma:

n 360 o fi

ai

f * 360 o ou seja amplitude do sector = ai = i n


Por exemplo, a amplitude do sector

correspondente aos alunos com 18 anos ser igual a:

a18 =
Procedendo

7 * 360 o = 126 o 20
para cada idade observada

obtm-se o grfico apresentado ao lado.

Diagrama de Caule e Folhas: Permite ao observados uma percepo do aspecto global dos dados sem perda da informao contida na coleco de dados inicial. Trata-se de uma linha vertical registando-se esquerda o dgito das dezenas e direita os sucessivos dgitos das unidades. Com base directa nos dados observados temos:

NATRCIA SANTOS

2011/2012

10

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

0 1 7898887998887799 2 1200 3 Ordenando obtemos, 0 1 7777888888899999 2 0012 3

NOTA: Apesar de neste documento no aparecerem exemplos de grficos de funo cumulativa ou de frequncias relativas no significa que no sejam objecto de avaliao este um documento de apoio, mas no uma sebenta exaustiva de todos os casos estudados nas aulas... O estudo da disciplina deve ser realizado preferencialmente atravs dos

apontamentos fornecidos nas aulas

NATRCIA SANTOS

2011/2012

11

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Exemplos de Organizao de Dados Agrupados em Classes A tabela seguinte apresenta as alturas de 20 alunos de uma turma. 151 157 158 156 163 170 172 171 174 150 154 162 173 166 165 160 160 164 153 158

Organizao dos dados em Tabela de Frequncias 1- Calcular o n de classes a considerar Como n=20 <25, vamos considerar 5 classes. 2- Calcular a Amplitude de cada classe Amplitude da Classe =

174 - 150 = 4,8 . 5

Para simplificar os clculos vamos considerar classes de amplitude 5. 3- Construir a Tabela de Frequncias Classes [150;155[ [155;160[ [160;165[ [165;170[ [170;175[
k

fi 4 4 5 2 5

Fi 4+0=4 4+4=8 5+8=13 15 20


k

fri

Fri 0,2 0,2+0,2=0,4 0,65 0,75 1

4 = 0,2 20 4 = 0,2 20
0,25 0,10 0,25

fi = 20

i =1

fri = 1
i =1

NATRCIA SANTOS

2011/2012

12

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Medidas de Localizao
As medidas de localizao so medidas calculadas com base nos dados permitindo descrever globalmente o conjunto de valores observados. As medidas de localizao dividem-se em: Medidas de Tendncia Central: Mdia Moda Mediana Medidas de Tendncia no Central Quantis Quartis Decis Centis/Percentis

As frmulas para o clculo das medidas de localizao so diferentes consoante se est a trabalhar com dados discretos ou com dados agrupados em classes.

Medidas de Tendncia Central Mdia Existe sempre; Leva em conta todos os valores observados; afectada pelos valores extremos Dados Agrupados em k Classes
_ x = 1 n k

Dados Organizados em k Modalidades


_ x = 1 n k

i =1

fi x i

fix i' , xi' o ponto mdio da classe


i =1

Moda Valor mais frequente; Pode no existir; pode existir mais do que uma moda. Apenas uma Moda: a distribuio diz-se Unimodal; Duas Modas: distribuio Bimodal Mais do que duas Modas: Distribuio Plurimodal No leva em conta todos os valores observados; No afectada pelos valores extremos

NATRCIA SANTOS

2011/2012

13

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Dados Organizados em k Modalidades

Dados Agrupados em k Classes 1. Determinar a Classe Modal: classe com maior frequncia absoluta; 2. Aplicar a frmula: f(Mo + 1) Mo = li (Mo ) + a(Mo ) = f(Mo 1) + f(Mo + 1)

A Moda (Mo) o valor com maior frequncia absoluta

= Mo = li +

fp fa + fp

ai

Legenda: li = li(Mo ) - limite inferior da classe Modal fa = f(M o + 1) - Frequncia Absoluta da classe posterior classe Modal fp = f(M o 1) - Frequncia Absoluta da classe anterior classe Modal ai = a(M o ) - amplitude da classe Modal

Mediana

Corresponde ao valor do meio; Existe sempre; No leva em conta todos os valores observados; No afectada pelos valores extremos Dados Agrupados em k Classes 1. Determinar a Classe Mediana: classe que n acumula observaes; 2 2. Aplicar a frmula: n F(Me 1) Me = li (Me ) + 2 a(Me ) = f(Me ) = Me

Dados Organizados em k Modalidades

Me

x n +1 se n mpar 2 = x x n+2 n + se n par 2 2 2

x (k ) - elemento x que acumula k


observaes ver nas Fi

n Fa 2 = li + ai fi

Legenda: li = li(Mo ) - limite inferior da classe Mediana Fa = F(M e 1) - frequncia acumulada da classe anterior classe Mediana fi = f(M e ) - frequncia absoluta da classe Mediana ai = a(M e ) - amplitude da classe Mediana

NATRCIA SANTOS

2011/2012

14

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Medidas de Tendncia No Central - Quantis Quartis

Dividem a distribuio em 4 partes iguais Dados Agrupados em k Classes 1. Determinar a posio do quartil

Dados Organizados em k Modalidades 1. Determinar a posio do quartil

PQi =

i (n + 1) = k, d 4

i = 1, 2, 3

PQi =

in 4

i = 1, 2, 3

2. Aplicar a frmula

Qi = x(k) + 0, d (x(k +1) x (k) )


x (k ) - elemento x que acumula k
observaes ver nas Fi

2. Determinar a classe quartil: classe que in acumula PQi = observaes 4 3. Aplicar a frmula: in F(Qi 1) Q i = li (Q i ) + 4 a(Qi ) = f(Q i )

in Fa = Q i = li + 4 ai fi
Legenda: li = li (Qi ) - limite inferior da classe Quartil Fa = F(Q i 1) - frequncia acumulada da classe anterior classe Quartil fi = f(Q i ) - frequncia absoluta da classe Quartil ai = a(Q i ) - amplitude da classe Quartil

Diagrama de Caixa com Bigodes Uma vez calculados os quartis e considerando os valores extremos (valor mnimo e valor mximo observados) podemos construir uma caixa com bigodes: escala, marcamos os quartis que definem uma caixa na qual se asinala a mediana. Para cada lado da caixa desenha-se uma linha horizontal (bigodes) at aos valores extremos da distribuio. EX: No estudo de uma distribuio obtiveram-se os seguintes valores: Min=5; max=14; Q1=9; Q2= Me =10; Q3=12. A figura seguinte apresenta o respectivo diagrama de caixa com bigodes.

10

11

12

13

14

Q1 Q2=Me

Q3

NATRCIA SANTOS

2011/2012

15

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Medidas de Tendncia No Central Decis e Centis/Percentis NOTA: As frmulas para os Decis (Di) e para os Centis (Ci)/Percentis (Pi) so anlogas s dos Quartis apenas diferindo no nmero de partes em que dividimos a distribuio 10 ou 100 em vez de 4.

Decis

Dividem a distribuio em 10 partes iguais Dados Agrupados em k Classes 1. Determinar a posio do decil

Dados Organizados em k Modalidades 1. Determinar a posio do decil

PDi =

i (n + 1) = k, d 10

i = 1, 2, ...,9

PDi =

in 10

i = 1, 2,...,9

2. Aplicar a frmula

Di = x (k) + 0, d (x (k +1) x (k) )


x (k ) - elemento x que acumula k
observaes ver nas Fi

2. Determinar a classe decil: classe que in acumula PDi = observaes 10 3. Aplicar a frmula:

in F(Di 1) Di = li (Di ) + 10 a(Di ) = f(Di ) in Fa = Di = li + 10 ai fi

Legenda: li = li (Di ) - limite inferior da classe Decil


Fa = F(D i 1) - frequncia acumulada da

classe anterior classe Decil fi = f(D i ) - frequncia absoluta da classe Decil ai = a(Di ) - amplitude da classe Decil

NATRCIA SANTOS

2011/2012

16

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Centis/Percentis

Dividem a distribuio em 100 partes iguais Dados Agrupados em k Classes 1. Determinar a posio do centil

Dados Organizados em k Modalidades 1. Determinar a posio do centil i (n + 1) PCi = = k, d i = 1, 2, ...,99 100

PCi =

in 100

i = 1, 2,...,99

2. Aplicar a frmula Ci = x (k) + 0, d (x (k +1) x (k) )

2. Determinar a classe centil: classe que in acumula PCi = observaes 100 3. Aplicar a frmula: in F(C i 1) 100 C i = li (C i ) + a(C i ) = f(C i )

x (k ) - elemento x que acumula k


observaes ver nas Fi

in Fa ai = C i = li + 100 fi
Legenda: li = li (C i ) - limite inferior da classe centil
Fa = F(C i 1) - frequncia acumulada da

classe anterior classe centil fi = f(C i ) - frequncia absoluta da classe centil ai = a(Di ) - amplitude da classe centil

NATRCIA SANTOS

2011/2012

17

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Medidas de Disperso
As medidas de localizao no permitem avaliar se os dados de uma distribuio esto ou no concentrados em torno de um valor (por exemplo, da mdia). assim necessrio complementar as medidas de tendncia central com medidas que permitam avaliar o grau de disperso dos dados. Amplitude Total: a diferena entre o valor mximo e o valor mnimo observados

w = x (max) x (min)
Amplitude Inter Quartil: a diferena entre o terceiro quartil e o primeiro quartil AIQ=Q3-Q1 Estas medidas so pouco realistas em termos de avaliao da disperso dos dados uma vez que no consideram todos os dados no seu clculo. As medidas seguintes j tm em conta todos os dados: Desvio Absoluto Mdio (dm): a mdia aritmtica dos valores absolutos dos desvios de cada um dos dados em relao mdia. Dados Organizados em k Modalidades Dados Agrupados em k Classes

dm

1 = n

k i =1

fi | xi x |

dm =

1 n

k i =1

fi | xi' x | ,

' xi o ponto mdio da classe

Varincia (s2): obtm-se somando os quadrados dos desvios das observaes da amostra, relativamente sua mdia, e dividindo pelo nmero de observaes da amostra. Dados Organizados em k Modalidades Dados Agrupados em k Classes

1 s2 = n

k i =1

fi (xi x)

_2

s2 =

1 n

k i =1

fi (xi' x)

_2

' x i o ponto mdio da classe

A varincia uma medida que se expressa no quadrado da unidade da varivel (por exemplo, no caso do estudo da altura dos alunos de uma escola, os dados so expressos em metro (m) e a varincia define-se em metro quadrado (m2). conveniente usar uma medida de disperso que se expresse na mesma unidade dos dados: usamos ento o Desvio Padro. Desvio Padro (s): a raz quadrada da varincia. D informao sobre a variabilidade dos dados em relao mdia. s =

s2

NATRCIA SANTOS

2011/2012

18

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Coeficiente de Variao de Pearson (Cvp): o quociente, em termos percentuais, entre o desvio padro e a mdia da distribuio.

s C vp = _ x 100 x
Ao contrrio das medidas de disperso anteriores, o Coeficiente de Variao de Pearson uma medida independente das unidades em que se expressa a varivel, pelo que deve ser utilizada quando se pretendem comparar distribuies que se expressem em unidades diferentes ou que apresentem mdias diferentes. Em termos prticos, um Coeficiente de Variao acima de 50% indica um alto grau de disperso dos dados em torno da mdia e, consequentemente, uma pequena representatividade da mdia como medida realstica. Por exemplo, suponha-se que a mdia das notas a uma disciplina de 10 valores e que os dados variam entre os 8 e os 12 valores a disperso dos dados baixa, pelo que o Cvp deve apresentar um baixo valor. Mas se, para a mesma mdia, os dados se situam entre 0 e 1 valores e entre os 19 e 20 valores, a mdia de 10 valores j no representativa da distribuio, devendo o Cvp apresentar um valor acima dos 50%.

Medidas de Assimetria

Assimetria: grau de desvio ou afastamento da simetria de uma distribuio. Uma distribuio diz-se assimtrica quando no existe simetria da curva de frequncias em relao recta vertical que passa pela abcissa correspondente mdia. Uma distribuio pode ser classificada como sendo:

Simtrica:

NATRCIA SANTOS

2011/2012

19

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Assimtrica Positiva:

Assimtrica Negativa:

Mtodos de Classificao de uma distribuio quanto Simetria Para distribuies Unimodais e Moderadamente Assimtricas a classificao pode ser realizada das seguintes formas: Comparao das Medidas de Tendncia Central

Se Mo = Me = mdia temos uma Distribuio Simtrica Se Mo < Me < mdia temos uma Distribuio Assimtrica Positiva Se mdia < Me < Mo temos uma Distribuio Assimtrica Negativa

Clculo de Coeficientes de Assimetria

Primeiro Coeficiente de Assimetria de Pearson

x Mo C p1 = s

C p1 = 0 , Distribuio Simtrica
Se C p1 > 0 , Distribuio Assimtrica Positiva

C p1 < 0 , Distribuio Assimtrica Negativa

NATRCIA SANTOS

2011/2012

20

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Segundo Coeficiente de Assimetria de Pearson

3 (x Me ) C p2 = s

C p2 = 0 , Distribuio Simtrica
Se C p2 > 0 , Distribuio Assimtrica Positiva

C p2 < 0 , Distribuio Assimtrica Negativa

Tambm

podemos

classificar

distribuio

usando

Coeficiente

Quartlico

de

Assimetria:

Cq

Q + Q1 2Q 2 = 3 Q 3 Q1

C q = 0 , Distribuio Simtrica
Se C q > 0 , Distribuio Assimtrica Positiva

C q < 0 , Distribuio Assimtrica Negativa

NOTA: Em certas situaes pode acontecer que as concluses obtidas atravs destes mtodos no sejam todas coincidentes. Tal facto, usualmente, deve-se a erros de arredondamento dos clculos ou ao facto de no se usarem os dados todos disponveis para o clculo dos coeficientes.

NATRCIA SANTOS

2011/2012

21

PROBABILIDADES E ESTATSTICA

ESTATSTICA DESCRITIVA

Medidas de Achatamento ou Curtose


As medidas de achatamento do uma indicao da intensidade das frequncias na vizinhana dos valores centrais. A classificao da distribuio quanto curtose realizada por comparao com a curva da Distribuio Normal: Distribuio Mesocrtica: Se a curva da distribuio for igual curva da distribuio Normal; Distribuio Leptocrtica: Se a curva da distribuio for mais afunilada do que a curva da distribuio Normal; Distribuio Platicrtica: Se a curva da distribuio for mais achatada do que a curva da distribuio Normal.

Leptocrtica

Mesocrtica

Platicrtica

Coeficiente de Curtose

K =

Q 3 Q1 0,263 2 (P90 P10 )

K = 0 , Distribuio Mesocrtica
Se K > 0 , Distribuio Platicrtica

K < 0 , Distribuio Leptocrtica

NATRCIA SANTOS

2011/2012

22

Você também pode gostar