Você está na página 1de 7

ESTATSTICA DESCRITIVA

O principal objectivo da ESTATSTICA DESCRITIVA a reduo de dados. A importncia de que se revestem os mtodos que visam exprimir a informao relevante contida numa grande massa de dados atravs de um nmero muito menor de valores ou medidas caractersticas ou atravs de grficos simples, tal que a estatstica descritiva se debrua a estudar os mtodos que o permitam. Pelo progresso da cincia que exige que se atenda mais profundamente aquisio, qualidade e tratamento de dados, J. Tuckey introduziu um conjunto de tcnicas estatsticas a que chamou Data Analisys. Na anlise de dados reconhecem-se duas componentes: uma mais prxima da estatstica descritiva e outra da estatstica indutiva. A estatstica descritiva anlise exploratria de dados pretende isolar as estructuras e padres mais relevantes e estveis patenteados pelo conjunto de dados objectos do estudo. A estatstica indutiva anlise confirmatria de dados pretende avaliar, nomeadamente, atravs da recolha e anlise de novas observaes, a reprodutividade ou permanncia das estruturas e padres detectados. A anlise de dados, fortalecida pela quantidade e variedade dos dados disponveis e pelo poder de computao acessvel, que no se pode dissociar das grandes capacidade grficas, contribui para estabelecer uma maior ligao entre os aspectos descritivos e inferncias da estatstica. Os dados estatsticos resultam de experincias ou inquritos conduzidos sobre um conjunto restrito a amostra e as concluses procuram alargar-se a um conjunto mais vasto a populao. O principal objectivo da anlise estatstica consiste em determinar que generalizaes sobre a populao podem fazer-se a partir da amostra que da mesma foi recolhida. A designao de amostra tomada correntemente num sentido mais amplo como sinnimo de dados ou observaes enquanto a populao a totalidade; ou seja, o conjunto de todas as possveis observaes feitas em condies semelhantes. O processo de amostragem o processo seguido para escolher os elementos da populao a incluir na amostra, condicionada, logicamente, a inferncias ou concluses permitidas pela amostra. Diz-se que se trata de amostragem casual quando as N variveis aleatrias observadas Xi (i=1,2,3,..N) so independentes e identicamente distribudas. Nos estudos por amostragem convm sempre distinguir entre populao objectivo e populao inquirida. A populao objectivo a totalidade dos elementos que esto sobre estudo e em relao aos quais e se deseja obter certo tipo de informao. Muitas vezes no se consegue uma amostra da populao objectivo, podendo-se efectuar a amostragem a partir de outra populao relacionada de algum modo com a primeira e que constitui a populao inquirida. CET Controlo Estatstico de Qualidade Pg 1

MEDIDAS DE LOCALIZAO Mdia


A mdia amostral ou simplesmente mdia, que se representa por uma medida de localizao do centro da amostra, e obtm-se a partir da seguinte expresso:

onde x1, x2, ..., xn representam os elementos da amostra e n a sua dimenso.

Moda
Para um conjunto de dados, define-se moda como sendo: o valor que surge com mais frequncia se os dados so discretos, ou, o intervalo de classe com maior frequncia se os dados so contnuos. Assim, da representao grfica dos dados, obtm-se imediatamente o valor que representa a moda ou a classe modal

Esta medida especialmente til para reduzir a informao de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais no se pode calcular a mdia e por vezes a mediana (se no forem susceptveis de ordenao).

Mediana
A mediana, m, uma medida de localizao do centro da distribuio dos dados, definida do seguinte modo: Ordenados os elementos da amostra, a mediana o valor (pertencente ou no amostra) que a divide ao meio, isto , 50% dos elementos da amostra so menores ou iguais mediana e os outros 50% so maiores ou iguais mediana Para a sua determinao utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos: Se n mpar, a mediana o elemento mdio. Se n par, a mediana a semi-soma dos dois elementos mdios.

CET Controlo Estatstico de Qualidade

Pg 2

Se se representarem os elementos da amostra ordenada com a seguinte notao: X1:n , X2:n , ... , Xn:n ento uma expresso para o clculo da mediana ser:

Como medida de localizao, a mediana mais robusta do que a mdia, pois no to sensvel aos dados!

Quantis
Quantis de ordem p Generalizando a noo de mediana m, que como vimos anteriormente a medida de localizao, tal que 50% dos elementos da amostra so menores ou iguais a m, e os outros 50% so maiores ou iguais a m, temos a noo de quantil de ordem p, com 0<p<1, como sendo o valor Qp tal que 100p% dos elementos da amostra so menores ou iguais a Qp e os restantes 100 (1-p)% dos elementos da amostra so maiores ou iguais a Qp. Tal como a mediana, uma medida que se calcula a partir da amostra ordenada. Quartis Os quartis inferior e superior, Q1 e Q3, so definidos como os valores abaixo dos quais esto um quarto e trs quartos, respectivamente, dos dados. Estes dois valores so frequentemente usados para resumir os dados juntamente com o mnimo e o mximo. Eles so obtidos ordenando os dados do menor para o maior, e ento conta-se o nmero apropriado de observaes: ou seja e para o quartil inferior e quartil superior, respectivamente. A medidade de disperso a amplitude inter-quartis, IQR diferena entre o quartil superior e o inferior. Q3 Q1, i.e. a

MEDIDAS DE DISPERSO
Permitem medir a variabilidade presente num conjunto de dados.

Varincia
Define-se a varincia, e representa-se por s2, como sendo a medida que se obtm somando os quadrados dos desvios das observaes da amostra, relativamente sua mdia, e dividindo pelo nmero de observaes da amostra menos um:

CET Controlo Estatstico de Qualidade

Pg 3

Desvio Padro
Uma vez que a varincia envolve a soma de quadrados, a unidade em que se exprime no a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou disperso com as mesmas unidades que os dados, tomamos a raiz quadrada da varincia e obtemos o desvio padro:

O desvio padro uma medida que s pode assumir valores no negativos e quanto maior for, maior ser a disperso dos dados. Algumas propriedades do desvio padro, que resultam imediatamente da definio, so:

o desvio padro sempre no negativo e ser tanto maior, quanta mais variabilidade houver entre os dados. se s = 0, ento no existe variabilidade, isto , os dados so todos iguais.

Amplitude
Uma medida de disperso que se utiliza por vezes, a amplitude amostral r, definida como sendo a diferena entre a maior e a menor das observaes:r = xn:n - x1:n onde representamos por x1:n e xn:n, respectivamente o menor e o maior valor da amostra (x1, x2, ..., xn), de acordo com a notao introduzida anteriormente, para a amostra ordenada.

Amplitude Inter-Quartil
A medida anterior tem a grande desvantagem de ser muito sensvel existncia, na amostra, de uma observao muito grande ou muito pequena. Assim, define-se uma outra medida, a amplitude inter-quartil, que , em certa medida, uma soluo de compromisso, pois no afectada, de um modo geral, pela existncia de um nmero pequeno de observaes demasiado grandes ou demasiado pequenas. Esta medida definida como sendo a diferena entre os 1 e 3 quartis Amplitude inter-quartil = Q3/4 - Q1/4 Do modo como se define a amplitude inter-quartil, conclumos que 50% dos elementos do meio da amostra, esto contidos num intervalo com aquela amplitude. Esta medida no negativa e ser tanto maior quanto maior for a variabilidade nos dados.

CET Controlo Estatstico de Qualidade

Pg 4

Ateno: Mas, ao contrrio do que acontece com o desvio padro, uma amplitude interquartil nula, no significa necessariamente, que os dados no apresentem variabilidade.

Coeficiente de variao
O coeficiente de variao uma medida de disperso que se presta para a comparao de distribuies diferentes. O desvio-padro, uma medida de disperso, relativo mdia e como duas distribuies podem ter mdias diferentes, o desvio dessas duas distribuies no comparvel. A soluo usar o coeficiente de variao, que igual ao desvio-padro dividido pela mdia:

cv =

s (100%) x

DADOS, TABELAS E GRFICOS Representao Grfica de Dados


HISTOGRAMA Um HISTOGRAMA uma de duas representaes grficas de distribuio de frequncias. Consiste num conjunto de rectngulos que tm: a base num eixo horizontal (eixo dos xx) com centro no ponto mdio e a largura igual amplitude dos intervalos das classes. as reas proporcionais s frequncias das classes. Se todos os intervalos tiverem a mesma amplitude, as alturas dos rectngulos sero proporcionais s frequncias das classes; costuma-se tomar as alturas numricas iguais a essas frequncias. Um POLGONO de frequncia um grfico de linha em que as frequncias so colocadas sobre perpendiculares, levantadas nos pontos mdios. Pode-se tambm obtlos ligando-se os pontos mdios dos topos dos rectngulos de um histograma. Diagrama de caule-e-folhas um tipo de representao que se pode considerar entre a tabela e o grfico, uma vez que so apresentados os verdadeiros valores da amostra, mas numa apresentao sugestiva, que faz lembrar um histograma. Consiste em escrever do lado esquerdo de uma linha vertical o dgito (ou dgitos) da classe de maior grandeza, seguidos dos restantes. A representao obtida ter o seguinte aspecto:

CET Controlo Estatstico de Qualidade

Pg 5

Diagrama de extremos e quartis e Caixa dos bigodes um tipo de representao grfica, em que se realam algumas caractersticas da amostra. O conjunto dos valores da amostra compreendidos entre o 1 e o 3 QUARTIS, que vamos representar por Q1 e Q3 representado por um rectngulo (caixa) com a MEDIANA indicada por uma barra. A largura do rectngulo no d qualquer informao, pelo que pode ser qualquer. Consideram-se seguidamente duas linhas que unem os meios dos lados do rectngulo com os extremos da amostra. Para obter esta representao, comea por se recolher da amostra, informao sobre 5 nmeros, que so: os 2 extremos (mnimo e mximo), a mediana e o 1 e 3 quartis. A representao do diagrama de extremos e quartis tem o seguinte aspecto:

O extremo inferior o mnimo da amostra, enquanto que o extremo superior o mximo da amostra.

MEDIDAS DA FORMA DA DISTRIBUIO Simetria


Uma distribuio diz-se simtrica se a mdia divide o histograma em duas metades iguais, uma constituindo uma imagem em espelho da outra. Se a distribuio no simtrica, diz-se assimtrica. O que quer dizer que umdos lados do grfico da distribuio mais alongado do que o outro. Adistribuio assimtrica positiva se o alongamento tende a ocorrer no lado direito e assimtrica negativa se o alongamento ocorrer predominantemente do lado esquerdo. A curva normal, por exemplo, tem uma assimetria de 0. Se a assimetria maior do que 1, a forma da distribuio comea a afastar-se significativamente da curva normal.

Curtose
Esta uma medida do grau de achatamento e afunilamento da curva que descreve a distribuio. O seu valor diz-nos se a curva tende a ser muito afunilada, com uma

CET Controlo Estatstico de Qualidade

Pg 6

elevada proporo dos dados aglomerados junto do centro, ou achatada, com os dados espalhando-se ao longo de uma grande amplitude. A distribuio normal tem uma curtose igual a 0. Um valor positivo indica que os dados esto concentrados no centro e que a distribuio apresenta um forte pico/elevao nesse lugar (neste caso, diz-se que a distribuio leptocrtica). Um valor negativo indica que os dados esto dispersos e que a distribuio mais achatada do que a curva normal (diz-se que a distribuio platicrtica). A curva normal diz-se mesocrtica. Valores de curtose superiores a 1 indicam que a curva no mesocrtica.

CET Controlo Estatstico de Qualidade

Pg 7

Você também pode gostar