Você está na página 1de 22

1. IMPORTNCIA DA ESTATSTICA 1.1 Por que precisamos aprender Estatstica?

Os mtodos estatsticos so consciente ou inconscientemente usados em vrias situaes, especialmente na apresentao de informaes oriundas de dados numricos. Diversas vezes, apresentaes so baseadas, principalmente, em algum tipo de tcnica utilizando teorias matemticas; porm durante a preparao e apresentao dos dados, mtodos estatsticos so utilizados para definir a tcnica de coleta de dados e chegar a uma concluso atravs das informaes coletadas. Os mtodos estatsticos tm aplicaes em controle de processo, controle de produto, soluo de problema, melhora na fabricao e manuteno econmica alm de satisfao do cliente. Por este motivo o conhecimento destes mtodos est se tornando cada vez mais importante para engenheiros e demais pr ofissionais engajados em programas de promoo da qualidade e produtividade. Mtodos estatsticos representam as ferramentas bsicas para remediar e controlar variaes, porque a anlise estatstica a nica base para tentar entender variabilidade. Inds trias ocidentais esto acordando para o uso de mtodos estatsticos e tcnicas relacionadas para fazer frente ao crescimento constante da competio. Estas empresas tambm sabem que a implantao de um programa para melhoria da qualidade pode eliminar desperdcios, reduzir os ndices de produtos defeituosos fabricados, diminuir a necessidade da realizao de inspeo e aumentar a satisfao dos clientes, fatores que implicam em um aumento da produtividade e da competitividade das empresas. Um profissional treinado em Estatstica ter maior facilidade em identificar um problema em sua rea de atuao, determinar os tipos de dados que iro contribuir para a sua anlise, coletar estes dados e a seguir estabelecer concluses e determinar um plano de ao para a soluo do problema detectado. A Estatstica Descritiva abrange mtodos grficos e numricos utilizados para resumir dados de maneira que caractersticas importantes da amostra possam ser expostas. 2. APRESENTAO DOS DADOS 2.1. O que estatstica e suas divises A Estatstica uma cincia ( ou mtodo) baseada na Teoria das Probabilidades, cujo objetivo principal nos auxiliar a tomar decises ou tirar concluses em situaes de incerteza, a partir de informaes numricas. Divises da Estatstica A Teoria Estatstica moderna se divide em dois grandes campos: Estatstica Descritiva - consiste num conjunto de mtodos que ensinam a reduzir uma quantidade de dados bastante numerosa por um nmero pequeno de medidas, substitutas e representantes daquela massa de dados. Estatstica Indutiva - consiste em inferir (deduzir ou tirar concluses a respeito das) propriedades de um universo a partir de uma amostra. O processo de generalizao, que caracterstico do mtodo indutivo, est associado a uma margem de incerteza. A medida da incerteza tratada mediante tcnicas e mtodos que se fundamentam na Teoria das Probabilidades. 2.2 Populao e amostra Populao - Conjunto de indivduos, objetos ou informaes que apresentam pelo menos uma caracterstica comum, cujo comportamento interessa-nos analisar. Ou, em outras palavras, conjunto de todas as medidas, observaes relativas ao estudo de determinado fenmeno.

i) Deseja-se conhecer o consumo total de energia eltrica em MWH nas residncias da cidade de Salvador no ano de 1998. Populao ou universo: todas as residncias que estavam ligadas a rede eltrica em Salvador, em 1998. Caractersticas: X = consumo anual de energia eltrica em MWH. i) Deseja-se saber se nas indstrias situadas no Estado da Bahia, em 1997, existia algum tipo de controle ambiental. Populao ou universo: indstrias situadas no Estado da Bahia em1998. Caracterstica: X = existncia ou no de algum tipo de controle ambiental na indstria. Populao caractersticas Amostra Tcnicas de Amostragem Anlise Descritiva Concluses sobre as caractersticas da populao Informaes contidas nos dados Inferncia Estatstica i) Estudo sobre a precipitao pluviomtrica na Regio Nordeste no ano 1997. Populao ou universo: rea referente Regio Nordeste. Caracterstica: X = precipitao pluviomtrica. Populaes finitas e infinitas: Quanto ao nmero de elementos, as populaes podem ser classificadas em finita ou infinita, dependendo se o nmero de elementos que a compe for finito ou infinito. Exemplos: i) Populao finita: empresas do Plo Petroqumico de Camaari. i) Populao infinita: as presses atmosfricas ocorridas nos diversos pontos do Continente em determinado momento. Em geral, como os universos so grandes, investigar todos os elementos populacionais para determinarmos a caracterstica necessita muito tempo, e/ou o custo elevado, e/ou o processo de investigao leva a destruio do elemento observado, ou, como no caso de populaes infinitas, impossvel observar a totalidade da populao. Assim, estudar parte da populao constitui-se um aspecto fundamental da Estatstica. Amostra: qualquer subconjunto da populao. 2.3. Tcnicas de Amostragem A amostragem um campo da estatstica bastante sofisticado que estuda tcnicas de planejamento de pesquisa para possibilitar inferncias sobre um universo a partir do estudo de uma pequena parte de seus componentes, uma amostra. A representatividade da populao na amostra, ou validade, assegurada pelo planeja mento cientfico da pesquisa, que pode ser dividida nas seguintes etapas: 1) Formulao do problema; 2) Escolha da unidade amostral (residncias, bairro, cidade, fbricas, rios, etc) 3) Escolha das variveis que sero medidas; 4) Planejamento da pesquisa 5)

Coleta de dados; 6) Produo de resultados; 7) Anlise dos resultados; 8) Relatrio contendo as concluses. Esquemas amostrais

geralmente mdias e totais, e de modo que se possa obter suas varincias Por esquema amostral entende-se a dupla: sorteio e mtodos de estimao dos parmetros, Os principais esquemas amostrais so: amostragem aleatria simples, sistemtica, estratificada e por conglomerados. Normalmente usada uma combinao destes esquemas bsicos. 2.3.1. Amostragem Aleatria Simples Neste tipo de amostra considera-se que cada componente da populao estudada tem a mesma chance de ser escolhido para compor a amostra e a tcnica que garante esta igual probabilidade a seleo aleatria de indivduos, por exemplo atravs de sorteio. O sorteio dos elementos da amostra feito geralmente de uma lista com todos os elementos da populao, e pode-se usar a tabela de nmeros aleatrios. 2.3.2. Amostragem Aleatria Estratificada Na amostragem estratificada a populao dividida em estratos e em seguida selecionada uma amostra aleatria de cada estrato. Esta estratgia geralmente aplicada quando o evento estudado numa populao tem caractersticas distintas para diferentes categorias que divid em esta populao. Muitas vezes, deseja-se estimar os parmetros de interesse relativos a subgrupos homogneos da populao, como por exemplo, estimar a proporo de rios poludos em alguns estados do Nordeste. O que se deseja na amostragem estratificada obter estratos internamente homogneos, de modo que as estimativas desses estratos sejam representativas dos mesmos. O fato dos estratos serem homogneos significa que a varincia interna mnima e a varincia entre os estratos mxima. A amostragem estratificada faz com que ao se ponderar as estimativas vindas de cada estrato em uma estimativa global, a variabilidade final seja menor do que se fosse usada a amostragem aleatria simples. O dimensionamento das sub-amostras, ou alocao dos elementos, pode ser de maneira balanceada (mesmo nmero de elementos em cada estrato) ou proporcional (nmero de elementos no estrato proporcional sua contribuio no total populacional). 2.3.3. Amostragem Sistemtica Deve obedecer ao mesmo princpio da amostragem aleatria simples de iguais probabilidades de pertencer amostra para todos os componentes da populao estudada. No entanto, prev a coleta de dados ao longo de um perodo de tempo e arbitra um ritmo para tomada de unidades da populao para compor a amostra. O nmero de observaes pode ser calculado como na amostragem aleatria simples. Exemplo: numa listagem de indivduos da populao, sorteamos um nome entre os dez primeiros da lista. A partir do nome sorteado, selecionamos um a cada dez indivduos (o dcimo, vigsimo e assim por diante). 2.3.4. Amostragem Aleatria por Conglomerados.

A populao dividida em subpopulaes distintas (conglomerados). Alguns dos conglomerados so selecionados segundo a amostragem alea tria simples e so observadas todas as unidades dos conglomerados selecionados. 2.3.5. Amostragem por Mltiplos Estgios Esta estratgia de amostragem pode ser vista como uma combinao de dois ou mais planos amostrais. Considere por exemplo uma populao estratificada onde o nmero de estratos muito grande. Ao invs de sortear uma amostra de cada estrato, o que poderia ser invivel devido quantidade de estratos, o pesquisador poderia optar por sortear alguns estratos e em seguida selecionar uma amostra de cada estrato sorteado. Neste caso, teramos uma amostragem em dois estgios usando, nas duas vezes, a amostragem aleatria simples, sendo que no primeiro estgio as unidades amostrais so os estratos e no segundo so as componentes da populao. 2.4. - Classificao de Variveis A Estatstica ocupa-se fundamentalmente das propriedades das populaes cujas caractersticas so passveis de representao numrica como resultado de medies e contagens. Essas caractersticas da populao so comumente chamadas de variveis. Varivel qualquer atributo/caracterstica que exera influncia no fenmeno estudado. A adequao da tcnica apropriada est diretamente relacionada ao tipo de varivel obtida na pesquisa. As variveis podem ser classificadas em qualitativas e quantitativas. i) Qualitativas : se os resultados das observaes forem expressos atravs de categorias, que se distinguem por alguma caracterstica no-numrica. Ex: setor de atividade econmica, sexo, nvel de escolaridade, porte da empresa. Estas podem ser classificadas em: Nominal: caracteriza-se por dados que consistem apenas em nomes, rtulos ou categorias. Os dados no podem ser dispostos segundo um esquema ordenado. Ex: setor de atividade econmica, sexo, etc. Ordinal: envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores dos dados no podem ser determinadas ou no tem sentido. Ex: Nvel de escolaridade, classe scio-econmica, porte da empresa, etc. i) Quantitativas - os resultados das observaes sero expressos sempre atravs de nmeros, que representam contagens ou medidas. Ex: idade, altura, peso, nmero de empregados, salrio mensal, volume de dejetos, n de habitantes do domiclio, etc. Estas podem ser classificadas em: Discreta - s pode assumir valores pertencentes a um conjunto finito ou enumervel. Ex: nmero de empregados, , n de habitantes do domiclio, etc. Contnua : pode assumir qualquer valor pertencente a um determinado intervalo do conjunto dos Reais. Pode-se dizer que a varivel contnua resulta normalmente de mensuraes. Ex: Estatura, peso, salrio mensal, volume de dejetos, etc. Exerccio: Em um estudo estatstico a caracterstica de interesse pode ser qualitativa (nominal ou ordinal) ou quantitativa (discreta ou contnua). Classifique as variveis nos exemplos que se seguem: a) populao: moradores de uma certa cidade varivel: cor dos olhos (pretos,

castanhos, azuis, s) ) opulao: casais si nt s uma certa ci ade ari el : nmero de filhos ari el : classe econmica c) populao: candidatos a um exame esti ular ari el : renda familiar ari el : sexo masculino, feminino) ari el : nmero de pessoas na famlia d) populao: sabonetes de certa marca ari el: peso l uido e) populao: aparelhos produzidos por uma linha de montagem ari el: nmero de defeitos por unidade . . Apresentao dos ados . . . S ries Estatsticas
         

uando realizamos um levantamento de dados sobre um fenmeno ou vari vel, o ue obtemos como resultado chamado de srie estatstica. modo de condensao ou apresentao das informaes pode ser na forma de tabelas ou de grficos ue facilitam a visuali zao do fenmeno, permitem a comparao com outros elementos ou, ainda, fazer previses. Para fazermos a diferenciao de uma srie estatstica para outra, devemos levar em considerao os elementos ue a compe: a poca fator temporal ou cronol gico) a ue se refere o fenmeno observado; o local fator espacial ou geogrfico) onde o fenmeno acontece; o fenmeno espcie do fato ou fator especificativo) ue descrito.
 "   & # %  #            

Itaparica Lauro de reitas


 1

orrespondncia entre as sries estatsticas e a representao grfica

((

&

E: IBGE,

enso

emogrfico, Bahia.

&

Vera
$#1

ruz

Simes ilho
1

&

So rancisco do
1

adre de

eus

i as 'Avila


0)

andeias

onde 0

 !

I PI S P P LA
 

em .0 habitantes)

(( ' " $# 

Exemplo : P P LA ESI E E P LI A A E SALVA


  # $  "$ % " !  &# %

E SEG

I PI S A EGI

()

&

&

i stribuio de freqncias

Intensidade do fenmeno
3

i stograma contnua), Basto discreta), Barras,


58 9

olunas ou Setores qualitativa )

. .

i stribuio de freqncias
A 7

este tipo de srie estatstica o tempo, o local e o fenmeno permanecem fixos. fenmeno considerado uma varivel qualitativa ou quantitativa discreta ou contnua) e seus valores observados so descritos considerando o nmero de vezes que ocorreram na srie freqncia).
@ 7

Algumas definies: reqncia simples absoluta: o nmero de ocorrncias ou repeties de um valor individual ou um intervalo de valores.
@ 4

otao: fi
7

reqncia simples relativa: a razo entre a freqncia simples absoluta e o nmero total de dados soma de todas as freqncias simples absolutas).
@ 4

otao: fri

Agora vamos exemplificar distribuies de freqncia e suas respectivas tabelas para cada tipo de varivel.
5 B

ados discretos
4

Tabela de reqncias mero de defeitos


4 @

reqncia simples absoluta reqncia simples relativa

Total 0 ,0 onte: ados fictcios


5 4 B C

8B B B

Exemplo: oi observado o nmero de defeitos apresentados por uma mquina industrial durante o perodo de 0 dias. s resultados foram os seguintes: 0 0 0 0 0 0
B CB 8 BB BBB A B BB88C C B DB B B

Geogrficas Local
5

artogramas,

olunas, Barras ou Setores

Temporal poca urvas, excepcionalmente olunas ou Setores


3 3 6 4 4 8

olunas Especificativas enmeno Barras,

2 ) ados contnuos: Para um certo conjunto de dados, vamos adotar a seguinte nomenclatura: . ximo max): maior valor do conjunto. 2. nimo min): menor valor do conjunto. . Amplitude total AT): a diferena entre o valor mximo e mnimo. AT AX I . lasse: cada intervalo em que se subdivide a amplitude total. epresentao: k nmero de classes . Limite superior ls ): a cota superior para os valores da classe.
X H H P H RGQ GP U V I G T S H G F H H

. Limite inferior li): a cota inferior para os valores da classe. . Amplitude do intervalo de classe h ): o comprimento da classe, definida como a diferena entre o limite superior e inferior. Exemplo: Antes de enviar um lote de aparelhos eltricos para venda, o epartamento de Inspeo da empresa produtora selecionou uma amostra casual de 2 aparelhos avaliando o desempenho atravs de uma medida especfica, obtendo os seguintes resultados:
I E

Aproximando para o nmero inteiro mais prximo, temos que k . A amplitude total ser dada por AT 218 154 4. Assim, a amplitude de cada intervalo de classe ser:
WP WP P

essa forma, a tabela de distribuio de freqncias para dados agrupados em classes fica da seguinte maneira: Tabela de reqncias edida reqncia simples absoluta
Y Y G

reqncia simples relativa

Total 2 1,0 onte: ados fictcios


Y I

Aproximando para o inteiro mais prximo, temos que h


E

1.

onstruir uma tabela de distribuio de freqncias por intervalos de classes. Soluo: caso, n 2 pela regra de Sturges
IP

este

2.4. . epresentao Grfica Sero apresentadas algumas sries estatsticas e seus respectivos grficos. 1) Grfico em barras Exemplo: Srie Especificativa
c a

Tipo de fraude nos cartes de crdito da


d

Tipo de fraude
e

uantidade arto falsificado 85 Pedido por correio/telefone 52


f

AT h
c

Tipos de fraude nos cartes de crdito da arto falsificado


e

Pedido por correio/telefone


f

utros

T ip o d e f r a u d e

2) Grfico em colunas Exemplo: Srie Geogrfica mero de crianas de baixa renda, segundo o bairro de residncia, que participaram do ensino de msica na Escola XYZ, em Salvador 1998
h h

Bairro

mero de crianas

Paripe1Periperi 39 Plataforma 45 Praia Grande 25 Total 120 onte: Escola de


g h b

sica XYZ, Salvador.

mero de crianas de baixa renda, segundo o bairro de residncia, que participaram do ensino de msica na Escola XYZ, em Salvado 1998 r ParipePeriperiPlataform a Praia Grande Bairro de crianas
b h c

onte: Escola de

sica XYZ, Salvador

uantidade onte: Triola,


g

ario .

onte: Triola,

ario .

arto roubado 243


b

astercard Internacional no Brasil 2000

utros 46

g g

astercard Internacional no Brasil 2000

Exemplo: Srie Especificativa-Temporal


i i

Ingressantes da

niversidade XYZ Segundo rea de estudo e ano umanas 2 85 112 Biolgicas 169 145 3 onte: ados i ctcios
r s r q q p

Exatas 120 156 68 Ingressantes da

niversidade

XYZ - segundo rea de estudo e classe scio econmica- 1999

Exatas umanas Biolgicas


p

ndice de Produto Industrial Brasil 1979

onte: IBGE
r

ndice de Produto Industrial - Brasil - 1979

3) Grfico em Linhas ou

onte:

ados i ctcios urvas Exemplo: Srie Temporal

r r

jan fev mar abr mai jun jul ago set out nov dez IPI onte: IBGE
u u u

4) Grfico em setores Exemplo: Srie Geogrfica Percentual de funcionrios da


w

ompanhia

ilsa segundo regio de procedncia

Percentual de funcionrios da
w

ompanhia
v

ilsa segundo regio de procedncia


x

Interior apital onte: Bussab i stograma


y

utro

5)

Este grfico utilizado para quando os dados esto agrupados em intervalos de classes. o caso de classes de mesma amplitude, construdo um ret ngulo para cada classe, com base igual amplitude do intervalo classe e altura proporcional a freqncia da classe. este caso, altura ~ freqncia absoluta ou relativa) uando temos classes com amplitudes diferentes, devemos construir um ret ngulo para cada classe, com base igual amplitude do intervalo de classe e altura dada por: classedaamplitudefreqencia ote que, neste caso, a rea do ret ngulo igual afreqncia da classe. A altura d definida acima chamada de densidade de freqncia.
y

Exemplo:

i stograma para a distribuio de freqncia do exemplo 5.

Tabela de reqncias edida reqncia simples absolut a


u u w

reqncia simples relativa

Total 32 1,0 onte: ados fictcios edida especfica de um aparelho eltrico


u w

Interior 3,30

apital 30,60

v v

Procedncia Percentual utro 36,10 onte: Bussab

A estatstica descritiva ensina a reduzir a informao contida em uma grande quantidade de dados a um pequeno nmero de medidas, substitutas e representantes daquela massa de dados. As principais medidas da Estatstica escritiva so agrupadas em medidas d posio e ou de locao ou de localizao) e medidas de disperso ou de variabilidade). ma mdia de uma lista de nmeros um valor que pode substituir todos os valores da lista sem alterar uma certa caracterstica da lista.

i) uando a caracterstica a ser mantida a soma dos elementos da lista, obtemos a mdia aritmtica. A mdia aritmtica simples de n nmeros nx,...,x,x21 um valor x tal que

nx n x...x x n Ex: A mdia aritmtica dos nmeros 3, 36 e 54 31 3 i) uando a caracterstica a ser mantida o produto dos elementos da lista, obtemos a mdia geomtrica. A mdia geomtrica simples dos n nmeros positivos nx,...,x,x21 um valor positivo g tal que Ex: A mdia geomtrica dos nmeros 3, 36 e 54 18543633= omentrios

Podemos pensar na mdia aritmtica como o valor tpico do conjunto de dados e considerada a principal medida de tendncia central. Algumas das razes que fazem com que seja a medida de posio mais recomendada so: definida rigorosamente e pode ser interpretada sem ambiguidades; Leva em considerao todas as observaes efetuadas; e alcula-se com facilidade.

Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensvel a valores extremos, isto , a valores excessivamente pequenos ou excessivamente grandes, em relao s demais observaes do conjunto de dados. Exemplo: Temos o seguinte conjunto de salrios mensais, em reais: 123- 145 - 210 - 225 2500. Podemos observar que quatro dos cinco salrios ap resentam valores entre 123 e 225 reais, porm a mdia salarial de 640,6 reais bastante distinta desse conjunto pela influncia do salrio de 2500 que puxou o valor mdio para cima. A mdia geomtrica apresenta valor mais coerente 291,6 reais.

3.2.

dias ponderadas

tiliza-se uma mdia ponderada quando os valores do conjunto de dados apresentam diferentes graus de import ncia. ualquer uma das mdias definidas acima pode ser tambm

3.

E I AS E P SI

considerada com valores ponderados. Vamos ver a seguir a definio da m aritmtica dia ponderada.

i) A mdia aritmtica ponderada dos nmeros nxxx,...,,21, n com pesos p1, p2,, pn definida por

i iiiip .px

ou quando estamos tratando com distribuio de frequncias i iiiif Exemplo: Em um grupo de pessoas, 70% so adultos e 30% so crianas. peso mdio dos adultos 70 kg e o peso mdio das crianas 40 kg. ual o peso mdio do grupo? Soluo: a mdia aritmtica ponderada dos dois subgrupos:

i) A mdia geomtrica ponderada dos nmeros nxxx,...,,21, n com pesos p1, p2,, pn

Sandra-CET060-16 definida por

ppgnxxxx 21 ou quando estamos tratando com distribuio de frequncias =

ffgnxxxx 21 f fn 21 3.3. oda utra medida de tendncia central menos usada que as mdias a moda. A moda o valor que ocorre com maior freqncia no conjunto de dados. otao: o = moda
d

Exemplo 6:

uando o conjunto de dados apresenta mais de uma moda damos o nome de distribuio plurimodal.
f

uando a distribuio de freqncias est organizada por classes de valores, devemos identificar a classe modal classe em que observamos a maior freqncia). A moda bruta ser o ponto mdio da classe modal. o l hi i= + 2 onde: li = limite inferior da classe modal; hi = amplitude da classemodal;
g e f

Exemplo1:
g

bs:

o casosFreqncia Simples Absoluta fi)

e acordo com a definio a moda 25, entretanto este valor no representativo do conjunto de dados e portanto a moda no uma boa medida de locao neste caso.
j

Exemplo2: Tabela de Freqncias edida Freqncia simples absoluta fi)


g e

Total 32

3.4. Separatrizes As separatrizes so medidas de posio que permitem calcularmos valores da varivel que dividem ou separam a distribuio em partes iguais. Temos quatro tipos de separatrizes, tambm chamadas de quantis: a mediana; os quartis; os decis; e os percentis.

c) Z = {2, 2, 5, 5, 7, 7}

b) Y = {10, 12, 17, 21, 32}

o = no existe, a distribuio amodal. o = no existe

a) X = {2, 3, 3, 5, 5, 5, 6, 7}

o=5

efinio: Chamamos de mediana o elemento do conjunto que ocupa a posio central na distribuio ordenada crescente ou decrescentemente). Isto , divide a distribuio emduas partes iguais de modo que 50% dos valores observados so inferiores ao valor mediano e 50% superiores a esse valor.
o k n

i)

eterminao da

ediana para dados brutos no tabelados) 1)

uando n par

Emd n =, neste caso teremos dois valores centrais e a mediana ser

d1 uando n mpar
o

2)

1Emd += n , neste caso teremos um valor central e a mediana ser

1nMdx

Exemplo: Comparao entre a mdia aritmtica e a mediana para os conjuntos de salrios em reais) dados. Podemos observar que no caso do conjunto Y a mdia no sintetiza adequadamente o conjunto de dados, pois apenas um valor superior a ela.
n o

3.4.2.

uartis,

ecis e Percentis

A construo das medidas de posio denominadas quartis, decise percentis anloga a da mediana. Enquanto a mediana separa a distribuio em duas partes iguais, a caracterstica principal de cada uma dessas medidas :
np

uartis: dividem a distribuio em quatro partes iguais;

ecis: dividem em dez partes iguais;

e
p

Percentis: dividem em cem partes iguais. bservaes:


q o

iv) Podemos tambm ter idia sobre a assimetria da distribuio utilizando apenas seus quartis:
o o p r

Se Md - 1) < 3 - Md) => assimetria assimetria esquerda ou negativa;


r o p

direita ou positiva; Se Md -

1) >

i) intervalo interquartil ou interquartlico, definido por 1; observaes localizadas mais ao cento da distribuio.
q

o l

i) Temos a seguinte igualdade: C50 = anlogo ao dos quartis.

5=

2 = Md i)

clculo para os decis e centis

3), contm 50% do total de

3 - Md) =>

o l

3.4.1.
n

ediana que tambm uma medida de tendncia central) otao:

d = mediana

op

k q

Se Md - 1) = 3 - Md) => distribuio simtrica i) Clculo dos percentis para dados brutos no tabelados) A posio do percentil de ordem i no conjunto de dados ordenado ser definida como: . n iPosi=, onde Posi = posio do percentil de ordem i; e n = freqncia total da distribuio. 1) Se Posi = valor inteiro, ento o percentil definido como a mdia dos valores que ocupam a posio Posi e Posi + 1. 2) Se Posi = valor no inteiro, ento o percentil defin como o valor que ocupa a posio k ido + 1, onde k = inteiro mais prximo que seja menor que Posi.
t ts t s s

Exemplo 8: Calcule
s

1 para o seguinte conjunto de dados: 21 23 18 25 24 28


t

2. Pos 25 = 25 6/100) = 1,5 valor no inteiro) posio na srie ordenada.


u

k = 1 e portanto o

1 o valor que ocupa a 2

i)

eterminao da Mediana de valores tabelados agrupados em classes:

Para dados agrupados em classes o elemento mediano obtido atravs da frmula Emd = n/2, no se fazendo distino entre nmero par ou mpar de observaes. Pelo elemento mediano encontrada a classe mediana e em seguida a mediana ser calculada atravs da seguinte expresso: elemento mediano ser sempre definido como:
v

= imd f E, e a mediana por:

antacmd i f onde, li = limite inferior da classe mediana; h = amplitude do intervalo de classe


w

Emd = elemento mediano facant = frequncia acumulada anterior frequncia absoluta simples da classe mediana Exemplo: Carga anula de fsforo l bs/ac/ano) nos rios. Carga anual l bs/ac/ano) de rios Fiac
x s s

TOTAL 2 Encontre a mediana

classe mediana fi =

50% dos rios tm carga de fsforo inferior ou igual a 0,64 lbs/ac/ano e 50% deles tm carga de fsforo superior ou igual a 0,64 lbs/ac/ano.
y

i)

eterminao do percentil ou centil) de valores tabelados agrupados em classes:

Percentil ou centil: separatriz que divide um conjunto ordenado de dados em cem partes iguais. Atravs desta separatriz encontramos todas as demais. O elemento do percentil ser sempre definido como:

iE , i=1, 2, 9 . O percentil ser definido por:

antacci i f onde, li = limite inferior da classe do percentil i; h = amplitude do intervalo de classe


{

Emd = elemento do percentil i facant = frequncia acumulada anterior frequncia absoluta simples da classe do percentil i Exemplo: Tabela de Freqncias

Total 32 a) Encontre o percentil : 25 e 95 b) Verifique a assimetria da distribuio

25% das observaes tm valores inferiores ou iguais a 173,8 e 75% delas tm valores superiores ou iguais a 173,8. 95% das observaes tm valores inferiores ou iguais a 216,5 e apenas 5% delas tm valores superiores ou iguais a 216,5.

b) Ec75 = 24 C75 = 203,5


|

Md -

1) <

3 - Md) 187 173,8) < 203,5 187) 13,2 < 16,5 direita ou positiva
{

i stribuio assimtrica
y y yy

4. ME I AS E ISPE SO
}

classe do percentil i fi =

Emd = 16 Md = 187
z

| z

As medidas de disperso servem para avaliar o grau de variabilidade dos valores de um conjunto de dados. Estas medidas permitem estabelecer comparaes entre fenmenos de mesma natureza ou de natureza distinta e geralmente essa variabilidade observada em torno de uma medida de tendncia central. Essas medidas podem ser absolutas ou relativas. Exemplo: uas mquinas foram reguladas para encher cada pacote de caf com 500g. C o om objetivo de verificar a regulagem dessas mquinas, um fiscal de rea anotou o peso dos 5 primeiros pacotes produzidos por cada mquina e calculou o peso mdio dos pacotes. Os resultados encontram-se abaixo:
~

Observando apenas o peso mdio dos pacotes, poderamos concluir que a mquina B apresentou melhor desempenho do que A. Porm, quando observamos cada informao separadamente, verificamos que o peso dos pacotes vindos da mquina A variou entre 495 e 500g, enquanto que o da B variou entre 490 e 510g. Isto quer dizer que a mquina A enche os pacotes mais uniformente que a mquina B. 4.1. Amplitude Total


otao: AT = Amplitude Total

A amplitude total de um conjunto de nmeros a diferena entre o maior e omenor valor do conjunto. Exemplo: Calcular as amplitudes totais do exemplo anterior e identificar qual a mquina que apresentou a menor disperso no peso dos pacotes de caf.

A mquina A apresentou uma menor variabilidade nos pesos dos pacotes de caf. Observaes: 1) A amplitude total a medida mais simples de disperso. 2) A desvantagem desta medida de disperso que leva em conta apenas os valores mnimo e mximo do conjunto. 3) A amplitude total tambm sofre a influncia de um valor "atpico"na distribuio um valor muito elevado ou muito baixo em relao ao conjunto). 4) A amplitude total para dados tabelados agrupados em classes s poder ser calculada se houver incluso do menor valor da primeira classe e do maior valor da ltima classe. 4.2 esvio Padro uma medida que avalia a disperso dos dados em torno de sua mdia.
~ ~

4.2.1.
~

esvio Padro simples

efinio: Sejam xxxn12,,...,, n valores que a varivel X assume. O desvio padro amostral definido como:

ii Exemplo: trs grupos de dados

esoluo: Para A, utilizando a definio, temos:

O desvio ponderado para dados agrupados em classes onde a freqncia absoluta simples considerada como o fator ponderador.

i i f fXx S Ex: Encontre o desvio padro para o conjunto de dados abaixo. Valores

xi xi- )2 * fi de observaes

Ski Para B: 1,0=S; para C: 08,0=S. Com os valores encontrados para o desvio padro, podemos observar que o grupo C apresentou a menor disperso em relao aos demais. 4.2.2. esvio padro ponderado

otao: s2 Observaes:

i) O desvio padro tem a unidade de medida igual a unidade de medida original da varivel, enquanto que a vari ncia apresentar a unidade de medida elevada ao quadrado. i) Ao trabalharmos com os dados de toda a populao calculamos a vari ncia e o desvio padro populacional dividindo por tamanho da populao) e no por -1. 4.4 Coeficiente de Variao de Pearson CV) uando se deseja comparar a variabilidade de duas ou mais distribuies, mesmo quando essas se referem a diferentes fenmenos e sejam expressas em unidades de medida distintas, podemos utilizar o Coeficiente de Variao de Pearson medida de disperso relativa). efinio: O coeficiente de variao para um conjunto de n observaes definido como o quociente entre o desvio padro e a mdia aritmtica da distribuio. X uma medida adimensional normalmente expressa em porcentagem. Exemplo: Turma Mdia aritmtica

esvio Padro Coeficiente de Variao

As medidas produzidas pela turma B so mais homogneas, pois apresenta menor disperso relativa. 5. Boxplot O Boxplot um mtodo alternativo para representar os dados. O Boxplot fornece inf rmaes o sobre as seguintes caractersticas de um conjunto de dados: locao, disperso, assimetria e outliers observaes discrepantes). Boxplot O centro da distribuio indicado pela linha da mediana. A disperso representada pela altura do ret ngulo 3-Q1), o qual contm 50% dos valores do conjunto de dados. A posio da linha mediana no ret ngulo informa sobre a assimetria da distribuio. ma distribuio simtrica teria mediana no centro do ret ngulo. Se a mediana prxima de Q1 ento os dados

4.3 Vari ncia


efinio: A vari ncia o quadrado do desvio padro.

so positivamente assimtricos. Se a mediana prxima de Q3 os dados so negativamente assimtricos. Os valores fora de Q1 1.5(Q3-Q1) e Q3 1.5(Q3-Q1) geralmente so chamados de outside e devem ser investigados como possveis outliers. Referncias Bibliogrficas BUSSAB, Wilton O. e MORETTIN, Pedro A.. Estatstica Bsica. TO EDO, eraldo . e OVA E, Ivo I.. Estatstica bsica. Ed. Atlas, So Paulo. TRIO A, Mario F. Introduo Estatstica. Material de Aula da disciplina MAT236 (UFBA)

Total 18 a) Construa um grfico adequado para esta srie. b) Identifique os tipos de defeitos que os tcnicos da empresa deveriam atacar em primeiro lugar, com o objetivo de melhorar os resultados que vinham sendo obtidos pela indstria. Justifique sua resposta.

3) Uma empresa procurou estudar a ocorrncia de acidentes com seus empregados, tendo, para isso, realizado um levantamento abrangendo um perodo de 36 meses, onde foi observado o nmero de operrios acidentados para cada ms. Os dados correspondentes so: 1 2 2 3 3 3 3 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7 7 8 8 8 9 9 1 a) Construa uma distribuio de freqncia adequada (obs: mantenha o valor das amplitudes de classes com uma casa decimal); b) encontre o intervalo inter-quartlico; c) qual o percentual de acidentes ocorridos em menos de sete meses? 4) Carga anual de nitrognio (lbs/ac/ano) nos rios.

Resp: b) IQ = 7,4

4,2 = 3,2 c) 69,4%

1 ISTA DE EXERCCIOS 1) Classifique cada uma das variveis abaixo em qualitativa (nominal/ordinal) ou quantitativa (discreta/contnua): a) Ocorrncia de hipertenso arterial (sim ou no so possveis respostas para esta varivel). b) Inteno de voto para presidente (possveis respostas so os nomes dos candidatos, alm de indeciso). c) Perda de peso de maratonistas na Corrida de So Silvestre, em quilos. d) Intensidade da perda de peso de maratonistas na Corrida de So Silvestre (leve, moderada, forte). e) rau de satisfao da populao brasileira com relao ao trabalho de seu presidente (valores de a 5). 2) Uma indstria automobilstica verificou que, nos ltimos meses, ocorreu um aumento no nmero de reclamaes sobre a ocorrncia de defeitos no suporte da lanterna tras eira de um modelo de automvel por ela fabricado. A empresa desejava eliminar esta situao indesejvel e para isto iniciou estudos para melhorar resultados. Na etapa de identificao do problema, os tcnicos da indstria classificaram o nmero total de peas defeituosas encontradas em uma amostra de peas produzidas durante uma semana de trabalho, segundo os tipos de defeitos que foram detectados. Os dados obtidos so apresentados na tabela abaixo. Defeitos encontrados em uma amostra de suportes da lanterna traseira de um modelo de automvel durante uma semana de produo de uma indstria. Tipo de defeito Quantidade de defeitos Moldagem solta 14 Solda quebrada 1 Centro da moldagem deslocado 4 ateral da moldagem deslocada 24 Moldagem arranhada 1 Moldagem dentada 4 Plstico arranhado 7 impeza incompleta 79 Orifcio deslocado 1 Pino deslocado 5

Carga anual l bs/ac/ano) de rios


etermine: a) A carga mdia de nitrognio b) a carga mediana de nitrognio c) Avalie a distribuio quanto assimetria d) O desvio-padro e) O coeficiente de variao f) qual o percentual de rios com carga anual de nitrognio superior ou igual a 8lbs/ac/ano g) 40% dos rios tm carga anual de nitrognio superior a qual valor? esp:a) 8,2 b)7,6 c)ass. direita d) 4,7 e) 57,3% f) 46,2% g) 8,9

08 1 08 12 14 13 1 14 14 05 06 10 14 13 06 12 resp: a) 10,7 b) 1,5 c) 14 d) 9 e) 3,2 4) Contou-se o nmero de erros de impresso da primeira pgina de um jornal durante 16 dias, obtendo-se os resultados abaixo: a) Calcule o nmero mdio de erros de impresso por primeira pgina; b) Calcule a mediana; c) etermine a moda; d) a amplitude tota e) o desviol padro

a)

) 50% dos dados de qualquer amostra situam-se acima da mdia; uma turma de 50 alunos onde todos tiraram a nota mxima, o desvio padro zero;

b)

d) ) Somando-se ou subtraindo-se) um valor constante e arbitrrio a cada um dos elementos de

e)

) Multiplicando-se ou dividindo-se) um valor constante e arbitrrio a cada um dos elementos

f) ) Somando-se ou subtraindo-se) um valor constante e arbitrrio a cada um dos elementos de

e)

) Multiplicando-se ou dividindo-se) um valor constante e arbitrrio a cada um dos elementos

esp: a) F b) V c) F d) V e) V f) F g) V

5) Coloque V verdadeiro) e F(falso) e justifique: utilizamos a mdia; um conjunto de dados, a mdia aritmtica fica adicionada (ou subtrada) dessa constante. de um conjunto de dados, a mdia aritmtica fica multiplicada (ou dividida) por essa constante. umconjunto de dados, o desvio padro fica adicionado (ou subtrado) dessa constante. de um conjunto de dados, o desvio padro fica multiplicado (ou dividido) por essa constante.

Construa com os resultados um Box-plot e explique

c)

) Quando queremos verificar a questo de uma prova que apresentou maior nmero de erros,

6) Explique os dados da tabela abaixo. Encontre os percentis 25, 50 e 75 e explique os resultados. P OPORO E OMICLIOS COM ABASTECIME TO AG A IARIO A MICRO -AREA (Programa Bahia Azul) Proporo (min:0 ; max:1) Freqncia absoluta Frequncia acumulada Percentual (%) Percentual acumulado ,13 2 2 1,6 1,6

7) ma indstria de alimentos estava interessada em analisar seu processo de produo de determinado alimento. Existem nesta indstria duas mquinas responsveis pelo controlam o processo de desidratao do alimento. m importante item de controle do processo a umidade do produto final, que segundo as especificaes, deve estar na faixa de 8,0% a 12%. Foi detectado incapacidade do processo em atender s especificaes. A equipe tcnica suspeitava de que podia haver diferenas na forma de funcionamento das duas mquinas de desidratao. Com o objetivo de observar o funcionamento das mquinas foram feitas medidas do teor de umidade do produto final, estratificadas por mquina de desidratao. Os resultados esto apresentados a seguir:

Para cada mquina calcule a mdia, a mediana, o intervalo interquartlico, o desvio padro e o coeficiente de variao. A partir das medidas obtidas compare o desempenho das duas mquinas comentando os aspectos de posio e variabili ade dos dados. d

Você também pode gostar