Você está na página 1de 31

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

SUMRIO
1. GENERALIDADES ....................................................................................................................................................3 1.1. INTRODUO ..........................................................................................................................................................3 1.2. DIVISO DA ESTATSTICA ........................................................................................................................................3 1.3. MENSURAO.........................................................................................................................................................4 1.3.1. Introduo .....................................................................................................................................................4 1.3.2. Formas de mensurao ..................................................................................................................................5 2. RESUMO DE PEQUENOS CONJUNTOS DE DADOS ...........................................................................................7 2.1. INTRODUO ..........................................................................................................................................................7 2.2. MEDIDAS DE POSIO OU TENDNCIA CENTRAL ........................................................................................................7 2.2.1. As mdias.......................................................................................................................................................7 2.2.2. A mediana......................................................................................................................................................9 2.2.3. A moda ..........................................................................................................................................................9 2.3. MEDIDAS DE VARIABILIDADE OU DISPERSO ........................................................................................................... 10 2.3.1. A amplitude.................................................................................................................................................. 10 2.3.2. O desvio mdio (absoluto)............................................................................................................................ 10 2.3.3. A varincia .................................................................................................................................................. 10 2.3.4. O desvio padro........................................................................................................................................... 11 2.3.5. A varincia relativa ..................................................................................................................................... 11 2.3.6. O coeficiente de variao ............................................................................................................................ 12 3. DISTRIBUIES DE FREQNCIAS .................................................................................................................. 13 3.1. INTRODUO ........................................................................................................................................................ 13 3.2. DISTRIBUIES POR PONTO OU VALORES. ............................................................................................................... 13 3.3. DISTRIBUIES POR CLASSES OU INTERVALOS......................................................................................................... 13 3.4. ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIAS.............................................................................................. 14 3.4.1. A freqncia relativa ou percentual ............................................................................................................. 14 3.4.2. A freqncia acumulada simples ou absoluta. .............................................................................................. 15 3.4.3. A freqncia acumulada relativa ou percentual ........................................................................................... 15 3.4.4. Outros elementos ......................................................................................................................................... 15 3.5. APRESENTAO DE UMA DISTRIBUIO DE FREQNCIAS ........................................................................................ 16 3.5.1. Distribuio de freqncias por pontos ou valores....................................................................................... 16 3.5.2. Distribuio de freqncias por classes ou intervalos .................................................................................. 16 3.6. RESUMO DE UMA DISTRIBUIO DE FREQNCIAS ................................................................................................... 17 3.6.1. Medidas de posio ou tendncia central..................................................................................................... 17 3.6.2. Medidas de variabilidade ou disperso ........................................................................................................ 20 3.6.3. Medidas de assimetria.................................................................................................................................. 22 3.7. PROPRIEDADES DAS MEDIDAS ................................................................................................................................ 22 3.7.1. Medidas de posio...................................................................................................................................... 22 3.7.2. Medidas de disperso................................................................................................................................... 22 4. EXERCCIOS ........................................................................................................................................................... 24 5. RESPOSTAS DOS EXERCCIOS ........................................................................................................................... 29 6. REFERNCIAS ........................................................................................................................................................ 31

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

1. GENERALIDADES
1.1. INTRODUO
Por onde quer que se olhe ou escute uma coleo de nmeros so normalmente enunciados como estatsticas. Estes nmeros referem-se aos mais diversos campos de atividades: esportes, economia, finanas, etc. Assim tem-se por exemplo: O nmero de carros vendidos no pas aumentou em 30%. A taxa de desemprego atinge, hoje, 7,5%. As aes da Telebrs subiram R$ 1,5, hoje. Resultados do Carnaval no trnsito: 145 mortos, 2430 feridos. Um nmero denominado uma estatstica (singular). No fechamento da bolsa as aes da Vale foram cotadas a R$ 45.50. As vendas de uma empresa no ms constituem uma estatstica. J uma coleo de nmeros ou fatos denominado de estatsticas (plural). Por exemplo, As vendas da empresa Picunhas totalizaram: 2,5 milhes em janeiro, 2,7 em fevereiro e 3.1 em maro. No entanto o termo Estatstica tem um sentido muito mais amplo, do que apenas nmeros ou coleo de nmeros. A Estatstica pode ser definida como: A cincia de coletar, organizar, apresentar, analisar e interpretar dados numricos com o objetivo de tomar melhores decises. Assim como advogados possuem regras de evidncia e contabilistas possuem prticas comumente aceitas, pessoas que tratam com dados numricos seguem alguns procedimentos padres. Alguns destes mtodos sero vistos no que se denomina de estatstica descritiva.

1.2. DIVISO DA ESTATSTICA


A Estatstica que lida com a organizao, resumo e apresentao de dados numricos denominada de Estatstica Descritiva. Assim pode-se definir a Estatstica Descritiva como sendo: Os procedimentos usados para organizar, resumir e apresentar dados numricos. Conjuntos de dados desorganizados so de pouco ou nenhum valor. Para que os dados se transformem em informao necessrio organiz-los, resumi-los e apresent-los. O resumo de conjuntos de dados feito atravs das medidas e a organizao e apresentao atravs das distribuies de freqncias e dos grficos ou diagramas. Estatstica Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade no possvel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto. O principal motivo para se trabalhar com uma parte do conjunto ao invs do conjunto inteiro o custo. O conjunto de todos os elementos que se deseja estudar denominado de populao. Note-se que o termo populao usado num sentido amplo e no significa, em geral, conjunto de pessoas. Pode-se definir uma populao como sendo: Uma coleo de todos os possveis elementos, objetos ou medidas de interesse. Assim, so exemplos de populaes: 1. O conjunto das rendas de todos os habitantes de Porto Alegre;
Prof. Lor Viali, Dr. viali@mat.ufrgs.br h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

2. O conjunto de todas as notas dos alunos de Estatstica; 3. O conjunto das alturas de todos os alunos da Universidade; etc. Um levantamento efetuado sobre toda uma populao dito de levantamento censitrio ou simplesmente censo. Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muito difcil. Isto se deve vrios fatores. O principal o custo. Um censo custa muito caro e demanda um tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da populao denominadas de amostras. Uma amostra pode ser caracterizada como: Uma poro ou parte de uma populao de interesse. Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na Agricultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver plos seguintes exemplos: Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies. Uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de tempo especificados para verificar se o processo est sob controle e evitar a fabricao de itens defeituosos. O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc. Redes de rdio e tv se utilizam constantemente dos ndices de popularidade dos programas para fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfatria. Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos. O processo de escolha de uma amostra da populao denominado de amostragem. Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decises sobre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser utilizada para fornecer uma idia do risco envolvido, ou seja, do erro que se comete ao utilizar uma amostra ao invs de toda a populao, desde que, claro, a amostra seja selecionada atravs de critrios probabilsticos, isto , ao acaso. Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou Inferencial como: A coleo de mtodos e tcnicas utilizados para se estudar uma populao baseados em amostras probabilsticas desta mesma populao.

1.3. MENSURAO 1.3.1. I N T R OD U O


O processo de selecionar o modelo matemtico ou estatstico a ser utilizado com uma dada tcnica de pesquisa ou procedimento operacional envolve algumas decises importantes. A tomada de deciso do modelo matemtico ou estatstico a ser aplicado costuma ser precedida pela mensurao do fenmeno envolvido. E uma primeira dificuldade surge na necessidade de se definir o que mensurao. Se o termo se referir somente aqueles tipos de medidas comumente utilizados em cincias tais como a fsica (por exemplo: medidas de comprimento, massa ou tempo) no haver muitos problemas na escolha do sistema matemtico. Mas se o conceito de medida for amplo o suficiente para incluir certos
Prof. Lor Viali, Dr. viali@mat.ufrgs.br h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

procedimentos de categorizao normalmente utilizados em Cincias Sociais, ento o problema torna-se mais complexo. Pode-se distinguir entre diversos nveis de mensurao e para cada um existem diferentes modelos estatsticos apropriados.

1.3.2. F OR M A S

D E M E N SU R A O

Existem quatro formas de mensurao ou tipos ou nveis de medidas ou ainda escalas que so conhecidas como: nominal, ordinal, intervalar e razo. Nvel nominal. A operao bsica e mais simples em qualquer cincia a de classificao. Na classificao tenta-se separar conjuntos de elementos com respeito a certas categorias, tomando decises sobre quais elementos so mais parecidos e quais so diferentes. O objetivo colocar os elementos em categorias to homogneas quanto possvel quando comparados com as diferenas existentes entre as categorias. Os termos nvel nominal de medida ou escala nominal so utilizadas para se referir a queles dados que s podem ser classificados em categorias. Se bem que no sentido estrito no existe na realidade uma medida ou escala envolvida. Existe apenas uma contagem. Variveis que podem ser colocadas nesta categoria so, por exemplo, a classificao das pessoas quanto religio, sexo, estado civil, etc. No existe uma ordem particular entre as categorias ou grupos e alm disso duas categorias quaisquer so mutuamente excludentes, isto , uma pessoa no pode ser ao mesmo tempo catlico e protestante. Alm disso as categorias so exaustivas, significando que um membro da populao deve aparecer em uma e somente uma das categorias. Observe a tabela um abaixo. Tabela 1.1 - Exemplo de varivel nominal Estado civil Casado Solteiro Vivo Divorciado Total Nmero de pessoas 340 250 40 50 700

Deve-se ser salientado que as classes ou categorias podem ser rotuladas com nmeros, mas isto no significa as operaes aritmticas com estes nmeros tenham algum significado em particular. Neste caso os nmeros exercem a mesma funo dos nomes, isto , identificar a categoria. Nvel ordinal. O nvel ordinal o tipo nominal em que se pode ordenar as categorias. A nica diferena entre os dois nveis a relao de ordem que se pode estabelecer entre as categorias. No entanto, no possvel afirmar o quanto uma categoria maior do que a anterior, isto , no se pode afirmar o quanto uma categoria possui da caracterstica. A avaliao atravs de conceitos feita por uma escala ordinal. Veja um exemplo na tabela dois abaixo. Tabela 1.2 - Exemplo de varivel em escala ordinal Conceitos A B C D E Total Nmero de alunos 4 6 15 3 2 30
viali@mat.ufrgs.br h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

Prof. Lor Viali, Dr.

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

No se pode afirmar neste caso que quem tirou A teve um nmero de acertos duas vezes maior que quem tirou C. A nica coisa que se sabe que quem tem A acertou mais questes do quem tem B e este de quem tem C e assim por diante. As famlias podem ser classificadas de acordo com seu estatus scio econmico em: alta, mdia alta, mdia, mdia baixa, baixa. No possvel entretanto afirmar que a diferena entre a alta e a mdia alta seja a mesma que entre a mdia e a mdia baixa. Nvel intervalar. No sentido estrito da palavra o termo mensurao pode ser utilizado para se referir a situaes em que se pode, no somente ordenar objetos com respeito ao grau de que eles possuem certa caracterstica, mas tambm indicar a exata distncia entre eles. Isto possvel atravs de uma escala denominada de "escala de intervalos". A escala de medida intervalar uma escala nominal em que a distncia entre as categorias, ao contrrio da ordinal, sempre a mesma. Ou seja, ela possui todas as caractersticas da escala ordinal mais o fator de que a distncia entre as diversas categorias (ou valores) sempre constante. As escalas de medir temperaturas como a Fahrenheit e a Celsius so exemplos de escalas de intervalo. No entanto, no se pode afirmar que uma temperatura de 40 graus duas vezes mais quente que uma de 20 graus, embora se possa dizer que a diferena entre 20 graus e 40 graus a mesma que entre 75 graus e 95 graus. Isto porque este tipo de escala no possui um zero absoluto. Ou seja o valor zero na escala apenas um ponto de referncia e no significa a ausncia de calor. Escores padronizados so tambm exemplos deste tipo de nvel de medida. Torna-se evidente que uma escala de intervalo requer o estabelecimento de algum tipo de unidade fsica a qual todos concordem, isto , um padro, e, que seja replicvel, isto , possa ser aplicada muitas vezes e fornecendo sempre os mesmos resultados. Comprimento medido em termos de cm ou metros, tempo em segundos, temperatura em centgrados ou Fahrenheit, renda em dlar ou reais. Por outro lado no existem tais unidades para inteligncia, autoritarismo ou prestgio que sejam unnimes entre todos os cientistas sociais e que possam ser assumidas constantes de uma situao para outra. Nvel de razo. Este o mais alto nvel de medida. caracterizado por apresentar todas as caractersticas da escala intervalar mais um zero absoluto. Aqui o zero pode ser entendido como a ausncia da caracterstica e as comparaes de valor (razo) tm sentido. Um exemplo de varivel deste tipo o peso. Um valor igual a zero significa ausncia de peso e um valor de 20 kg duas vezes mais pesado que um de 10 kg.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

2. RESUMO DE PEQUENOS CONJUNTOS DE DADOS


2.1. INTRODUO
Para se analisar um conjunto de valores necessrio primeiramente, para fins de notao, distinguir se este conjunto resultado de um censo ou de uma amostragem. A Estatstica Descritiva pode ser estudada considerando os conjuntos de valores analisados como sendo amostras ou ento populaes. Como o caso mais comum a obteno de amostras a notao apresentada ser feita considerando os valores como resultados de amostragens. No entanto, convm ficar atento, com a bibliografia, pois dependendo do autor a orientao pode ser outra. A diferena, considerada do ponto de vista da descrio dos dados, apenas notacional. Assim o tamanho de uma populao (quando finita) representado, normalmente por N, enquanto que o tamanho de amostra representado por n. Afora algumas excees os valores calculados na amostra so representados por letras latinas enquanto que os correspondentes na populao o so pelas mesmas letras s que gregas. Para facilitar o estudo da Estatstica Descritiva os conjuntos de valores sero considerados como pequenos e grandes. Assim se um conjunto tiver 30 ou menos valores a anlise ser feita sem o agrupamento. Caso o conjunto tenha mais do que 30 valores ento primeiramente ser feito o agrupamento de acordo com o tipo de varivel considerada. O valor 30 apenas um ponto de referncia escolhido arbitrariamente e dependendo da situao pode-se considerar o agrupamento com mais ou menos valores envolvidos. Um conjunto de dados, de qualquer tamanho, pode ser resumido de acordo com as seguintes medidas: 1. Medidas de tendncia central ou posio 2. Medidas de disperso ou variabilidade. 3. Medidas de assimetria. 4. Medidas de achatamento ou curtose.

2.2. MEDIDAS DE POSIO OU TENDNCIA CENTRAL


Um conjunto de valores (amostra) ser representada por: x1, x2, ..., xn, onde n o nmero de elementos do conjunto, isto , o tamanho da amostra.

2.2.1. A S

MDIAS

(a) A mdia aritmtica


A mdia aritmtica do conjunto x1, x2, ..., xn representada por x e calculada por:

x = (x1 + x2 +... + xn) / n = x i


n

(b) A mdia geomtrica


A mdia geomtrica dos valores positivos: x1, x2, ..., xn, representada por mg e calculada por:

mg =

x1 x2 .... xn =

xi
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

(c) A mdia harmnica


A mdia harmnica dos valores positivos x1, x2, ..., xn representada por mh e calculada por:

mh =

1 1 x1 + 1 x2 n + .... + 1 xn

n 1 x1 + 1 x2 + ... + 1 xn

n 1 xi

Observando a expresso do clculo da mdia harmnica pode-se verificar que ela definida como sendo: O inverso da mdia aritmtica dos inversos. Exemplo: Calcular as mdias dos seguintes conjuntos de dados: 9 (b) 4 6 (c) 1/2 (a) 1 Para o conjunto em (a) tem-se:

4/5

3/2

7/4

x = (1 + 9) / 2 = 5 mg = 19 . = 9 = 3 mh = 2 / (1 + 1/9) = 18/10 = 1,80


Para o conjunto em (b) tem-se:

x = (4 + 6) / 2 = 5 mg =
Para o conjunto em (c) tem-se:

4.6 = 24

= 4, 90

mh = 2 / (1/4 + 1/6) = 24/5 = 4,80 mg = 4 1 . 4 . 3 . 7 = 4 84 = 1,02


2 5 2 4 80

x = [1/2 + 4/5 + 3/2 + 7/4] / 4 = 91/80 = 1,14


mh =
4 4 336 = = = 0,89 2 5 2 4 377 377 + + + 1 4 3 7 84

Relao entre as trs mdias


As trs mdias mantm a seguinte relao entre elas, desde que os valores sejam positivos e diferentes entre si.

x > mg > mh
(d) A mdia quadrtica
A mdia geomtrica dos valores positivos: x1, x2, ..., xn, representada por mq e calculada por:
2 2 2 2 x x i 1 + x 2 + ... + x n mq = =

(e) A mdia aritmtica ponderada


A mdia aritmtica ponderada do conjunto x1, x2, ..., xk, com pesos w1, w2, ..., wk, representada por map e calculada por:

map = (x1 w1 + x2 w2 +... + xn wk) / (w1 + w2 + ...+ wk) = x i w i wi

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

(f) A mdia geomtrica ponderada


A mdia geomtrica ponderada do conjunto x1, x2, ..., xk, com pesos w1, w2, ..., wk, representada por mgp e calculada por:

mgp =

wi

w1 w 2 .... w k x1 x2 xk

(g) A mdia harmnica ponderada


A mdia harmnica ponderada do conjunto x1, x2, ..., xk, com pesos w1, w2, ..., wk, representada por mhp e calculada por:

mhp = w i wi xi
Exemplo: A mdia da primeira prova de Estatstica da turma 135 foi de 6,0 e foi realizada por 55 alunos. Na segunda prova compareceram 50 alunos que tiveram uma mdia de 6,5. A terceira prova realizada por 40 alunos teve mdia de 5,5. Qual a mdia aritmtica geral das 3 provas?

mp = x i w i = (6,0.55 + 6,5.50 + 5,5.40) / (55 + 50 + 40) = 875 / 145 = 6,03. wi

2.2.2. A

MEDIANA

A mediana de um conjunto ordenado de valores, anotada por me, definida como sendo o valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se n (nmero de elementos) mpar a mediana o valor central do conjunto. Caso contrrio a mediana a mdia dos valores centrais do conjunto. Tem-se:

me = x(n+1)/2 se n mpar e
Exemplo: Para o conjunto: 15 18 21 A mediana :

me = [x(n/2) + x(n/2)+1] / 2 se n par

32

45

46

49

me = x(7+1)/2 = x4 = 32,
Ou seja, a mediana o quarto valor na seqncia ordenada de elementos. Se o conjunto acima fosse: 15 18 21 32 45 46 Ento a mediana seria:

me = [x(n/2) + x(n/2)+1] / 2 = [x(6/2) + x(6/2)+1] / 2 = (x3 + x4) / 2 = (21 + 32) / 2 = 53/2 = 26,50

2.2.3. A

M OD A

A moda de um conjunto de valores, anotada por mo, definida como sendo o valor (ou os valores) do conjunto que mais se repete. Convm lembrar que a moda ao contrrio da mediana e da mdia pode no ser nica, isto , um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem moda). Se a moda existir ser representada por mo.
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

Exemplo: Dado o conjunto: 1 2 2 A moda ser:

15

mo = 4,
Pois este valor se repete 3 vezes no conjunto e qualquer outro se repete duas ou menos vezes.

2.3. MEDIDAS DE VARIABILIDADE OU DISPERSO 2.3.1. A


AMPLITUDE

A mais simples das medidas de disperso a amplitude, anotada por h, e definida como sendo a diferena entre os valores extremos do conjunto, isto :

h = xmax - xmin
Exemplo: A amplitude do conjunto: -5 4 0 3 8

10, vale:

h = xmax - xmin = 10 - (-5) = 15.

2.3.2. O

D E SV I O M D I O ( A B SOL U T O )

A amplitude uma medida simples e fcil de calcular. Tem a virtude de dar uma idia da variabilidade do conjunto. No entanto ela no leva em considerao todos os valores do conjunto como seria desejvel. Assim prefere-se, em geral, trabalhar com medidas que utilizam toda a informao disponvel. Uma destas medidas o desvio mdio absoluto ou simplesmente desvio mdio. O desvio mdio representado por dma e definido como sendo a mdia das distncias que os valores do conjunto se encontram da mdia.

x dma = [ |x1 - x | + |x2 - x | + ... + |xn - x | ] / n = x i


n
Exemplo: Calcular o dma do conjunto: -7 4 0 3 8 10 A mdia x = (-7 + 4 + 0 + 3 + 8 + 10) / 6 = 18/6 = 3 Ento o desvio mdio ser:

dma = [|-7 - 3| + |4 - 3| + |0 - 3| + |3 - 3| + |8 - 3| + |10 - 3|] / 6 = (10 + 1 + 3 + 0 + 5 + 7) / 6 =


26/6 = 4,33

2.3.3. A

VARINCIA

O desvio mdio apesar de intuitivamente fcil de interpretar e simples de calcular no muito utilizado em Estatstica. O que de fato a medida de disperso usual a varincia e principalmente sua raiz quadrada que denominada de desvio padro. A varincia anotada por s2 e definida como sendo
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

10

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

a mdia dos quadrados dos desvios em relao a mdia aritmtica. Por desvio entende-se a diferena entre um valor do conjunto e a mdia. n Nem sempre esta expresso a mais indicada para ser utilizada. Quando a mdia um valor decimal no exato ela no muito prtica, uma vez que entrar no clculo n vezes aumentando os erros de arredondamento que ocorrem. Neste caso melhor se valer de uma expresso alternativa que pode ser derivada da expresso acima desenvolvendo o quadrado dentro do somatrio e fazendo algumas simplificaes. Trabalhando inicialmente apenas com o numerador da frmula acima vem:
2 2 2 2 (xi x) = ( x 2 i 2 xi x + x ) = x i 2 x xi x

s = [(x1 - x ) + (x2 - x ) + ... + (xn - x ) ] / n =

2 ( x ix)

Observando que x = x i tem-se que: x i = nx e ainda que: x 2 = n x 2 vem: n


2 2 (x i x ) = x i2 2n x 2 + n x 2 = x 2 i nx

Dividindo este resultado por n e simplificando a segunda parcela vem: n n Esta uma segunda expresso para o clculo da varincia e em muitas situaes mais vantajosa de ser usada. Neste caso a varincia pode ser caracterizada como sendo: a mdia dos quadrados menos o quadrado da mdia.

s =
2

( xi x )

= xi x 2

2.3.4. O

D E SV I O P A D R O

A varincia por ser um quadrado no permite comparaes com a unidade que se est trabalhando. Para se ter uma medida de variabilidade com a mesma unidade do conjunto utiliza-se a raiz quadrada da varincia, que denominada de desvio padro. Assim a expresso para o desvio :

s=

(xi x)
n

= xi x2
n

Exemplo: Calcular a varincia e o desvio padro do conjunto: -7 4 0 3 8 10 A mdia x = (-7 + 4 + 0 + 3 + 8 + 10) / 6 = 18/6 = 3 Ento varincia ser:

s2 = [(-7 - 3)2 + (4 - 3)2 + (0 - 3)2 + (3 - 3)2 + (8 - 3)2 + (10 - 3)2] / 6 =


= (100 + 1 + 9 + 0 + 25 + 49) / 6 = 184 / 6 = 30,67 E o desvio padro: s = 5,54

2.3.5. A

VARINCIA RELATIVA

A varincia relativa, representada por g2 o quociente entre a varincia absoluta e o quadrado da mdia. Isto :

g2 = s2 / x 2
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

11

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA


C OE F I C I E N T E D E V A R I A O

2.3.6. O

O coeficiente de variao a raiz quadrada da varincia relativa. Isto : g = s /


Exemplo: Calcular a varincia relativa e o coeficiente de variao do conjunto: -7 4 0 3 8 10 A mdia x = (-7 + 4 + 0 + 3 + 8 + 10) / 6 = 18/6 = 3 Ento varincia ser:

s2 = [(-7 - 3)2 + (4 - 3)2 + (0 - 3)2 + (3 - 3)2 + (8 - 3)2 + (10 - 3)2] / 6 =


= (100 + 1 + 9 + 0 + 25 + 49) / 6 = 184 / 6 = 30,67 O desvio padro ser: s = 5,54 Ento a varincia relativa ser:

g2 = (184/6) / 9 = 3,41
E o coeficiente de variao ser: g = s /

x = 5,54 / 3 = 184,59%

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

12

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

3. DISTRIBUIES DE FREQNCIAS
3.1. INTRODUO
Para se trabalhar com grandes conjuntos de dados necessrio inicialmente agrupar estes dados. O agrupamento feito em tabelas, denominadas de distribuies de freqncias. Para se construir uma distribuio de freqncias comum fazer a distino entre dois tipos de variveis. A varivel (ou conjunto) discreta (valores que so resultados de contagem) e a varivel (ou conjunto) contnua (valores que so resultados de uma medida). Em geral variveis discretas so agrupadas em distribuies por ponto ou valores e variveis contnuas em distribuies por classes ou intervalos. A separao no rgida e depende basicamente dos dados considerados. Poder ser necessrio usar uma distribuio por classes ou intervalos mesmo quando a varivel discreta.

3.2. DISTRIBUIES POR PONTO OU VALORES.


Considere-se um conjunto de valores resultados de uma contagem. Poderia ser, por exemplo, o nmero de irmos dos alunos da turma U, disciplina de Estatstica.
Nmero de irmos dos alunos da turma U - disciplina Estatstica
0 4 3 4 1 1 5 1 1 0 1 1 2 1 2 6 1 1 0 1 3 1 1 2 1 1 0 1 1 2 3 2 1 4 3 1 2 5 3 0 1 4 5 2 1 0 1 6 2 0

Esta coleo de valores no constitui informao mas pode ser transformada em informao mediante sua representao em uma distribuio de freqncias por pontos ou valores. Para tal, colocase o conjunto em uma tabela em que a coluna da esquerda representada pelos diferentes nmeros ordenados (os pontos ou valores) e a coluna da direita pelo nmero de vezes que cada valor se repetiu (as freqncias simples ou absolutas). Para o exemplo, na tabela trs, tem-se: Tabela 03 - Distribuio de freqncias por ponto ou valores do nmero de irmos dos alunos da turma U. Disciplina Estatstica.
Nmero de irmos 0 1 2 3 4 5 6 Total Nmero de alunos 7 21 8 5 4 3 2 50

3.3. DISTRIBUIES POR CLASSES OU INTERVALOS


Considere-se um conjunto de valores resultados de uma medida. Poderia ser, por exemplo, a idade dos alunos da turma U da disciplina de Estatstica.
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

13

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

Idade (em meses) dos alunos da turma U - Disciplina Estatstica

230 334 287 240 252

234 268 344 320 298

276 288 300 308 315

245 336 244 299 255

345 299 303 312 274

240 236 248 324 264

270 239 251 289 263

310 355 265 320 230

368 330 246 264 303

369 247 266 275 281

Este conjunto de valores, obviamente no pode ser apresentado da mesma forma que o anterior, pois quase no h repeties. Neste caso necessrio construir uma tabela denominada de distribuio de freqncias por classes ou intervalos. Evidentemente haver perda de informao neste processo, mas o ganho obtido pela facilidade compreenso dos dados compensa. O procedimento para construir esta distribuio envolve os seguintes passos (algoritmo):
Determinar a amplitude dos dados: h = xmax - xmin. Decidir sobre o nmero de classes k a ser utilizado. Recomenda-se um nmero de classes entre 5 e 15. Para que a deciso no seja totalmente arbitrria pode-se usar a raiz quadrada do nmero de valores como o nmero de classes, ou seja, k n . Determinar a amplitude de cada classe. Sempre que possvel manter todas as amplitudes iguais. Para tanto deve-se dividir a amplitude dos dados h pelo nmero de classes k, arredondando para mais, ou seja, hi h / k. Contar o nmero de valores pertencentes a cada classe. Em geral, utiliza-se a simbologia (|--- ), para indicar um intervalo fechado esquerda e aberto direita. Tambm poderia ser utilizado o intervalo aberto esquerda e fechado direita (---|), aberto de ambos os lados ( --- ) ou ainda fechado de ambos os lados (|---|). Um exemplo de uma distribuio por classes ou intervalos apresentado na tabela 04. Tabela 04 - Idades dos alunos da turma U - Disciplina Estatstica. Idades 230 |---- 250 250 |---- 270 270 |---- 290 290 |---- 310 310 |---- 330 330 |---- 350 350 |---- 370 Total Nmero de alunos 12 9 8 7 6 5 3 50

3.4. ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIAS


Alm da freqncia simples ou absoluta pode-se definir ainda:

3.4.1. A

F R E Q N C I A R E L A T I V A OU P E R C E N T U A L

A freqncia relativa simples ou percentual definida como sendo o quociente entre a freqncia simples fi e o total de dados n.

fri = fi / n

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

14

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

Exemplo: Na tabela trs tem-se: fr3 = 8 / 50 = 0,16 = 16%, significando que 16% dos alunos da turma possuem 2 irmos. Na tabela quatro tem-se: fr2 = 9 / 50 = 0,18 = 18%, significando que 18% dos alunos possuem idades maiores ou iguais a 250 meses porm menores do que 270 meses.

3.4.2. A

F R E Q N C I A A C U M U L A D A SI M P L E S OU A B SOL U T A .

A freqncia acumulada simples ou absoluta da linha i definida como sendo a soma das freqncia simples ou absolutas at a linha i .

Fi = f1 + f2 + ... + fi
Exemplo: Na tabela trs tem-se: F4 = f1 + f2 + f3 + f4 = 7 + 21 + 8 + 5 = 41, significando que 41 alunos da turma possuem at 3 irmos.

3.4.3. A

F R E Q N C I A A C U M U L A D A R E L A T I V A OU P E R C E N T U A L

A freqncia acumulada relativa ou percentual da linha i definida como sendo a soma das freqncia relativas ou percentuais at a linha i . Fri = fr1 + fr2 + ... + fri , ou ento, como sendo o quociente da freqncia acumulada simples pelo total de dados.

Fri = Fi / n
Exemplo: Na tabela quatro tem-se: Fr2 = (12 + 9) / 50 = 42%, isto , 42% dos alunos possuem idades menores do que 270 meses.

3.4.4. O U T R OS

E L E M E N T OS

(i) Na tabela trs os valores da coluna da esquerda so denominados de pontos ou valores. Cada um deles representado por xi , onde i varia de 1 at k, sendo k o nmero de linhas da tabela. (ii) Na tabela quatro os valores da coluna da esquerda so denominados de classes ou intervalos. As classes, tambm, variam de 1 at k. (iii) Limite inferior da classe i. Anota-se por lii. Na tabela 4 o limite inferior da terceira classe : 270. (iv) Limite superior da classe i. Anota-se por lsi. Na tabela 4 o limite superior da quinta classe : 330. (v) Amplitude da classe i. Anota-se por hi e calculada como a diferena entre os limites superior ou inferior da classe i. Assim hi = lsi - lii. Na tabela quatro a amplitude da classe quatro : h4 = ls4 - li4 = = 310 - 290 = 20 meses. (vi) Ponto mdio da classe. Como no possvel trabalhar com classes necessrio escolher um representante da classe. Este representante denominado de ponto mdio da classe. representado por xi e calculado por: xi = (lii + lsi) / 2 ou ento xi = lii + hi / 2.
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

15

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

Na tabela quatro o ponto mdio da terceira classe : x3 = (li3 + ls3) / 2 = (270 + 290) / 2 = 280 meses.
Exemplo: Na tabela 05, abaixo, esto ilustrados os clculos das freqncias relativas percentuais, da freqncia acumulada simples e da freqncia acumulada percentual. Tabela 05 - Exemplos de freqncias Nmero de irmos 0 1 2 3 4 5 6 Total Nmero de alunos 7 21 8 5 4 3 2 50 fri 14 42 16 10 8 6 4 100 Fi 7 28 36 41 45 48 50 ---Fri 14 56 72 82 90 96 100 ----

3.5. APRESENTAO DE UMA DISTRIBUIO DE FREQNCIAS 3.5.1. D I ST R I B U I O


D E F R E Q N C I A S P OR P ON T OS OU V A L OR E S .

Uma distribuio de freqncias por pontos ou valores apresentada graficamente atravs de um diagrama de linhas ou colunas, onde a varivel xi representada no eixo das abcissas (horizontal) e as freqncias (que podem ser de qualquer tipo) no eixo das ordenadas (vertical). Veja-se um exemplo de diagrama de colunas simples na figura 01.
Figura 01 - Diagrama de colunas simples da varivel "nmero de irmos dos alunos da turma U - Disciplina de Estatstica"
25 20 15 10 5 0 0 1 2 3 4 5 6

3.5.2. D I ST R I B U I O

D E F R E Q N C I A S P OR C L A SSE S OU I N T E R V A L OS

Uma distribuio de freqncias por classes ou intervalos apresentada graficamente atravs de um diagrama denominado de histograma. Um histograma um grfico de retngulos justapostos onde a base de cada retngulo a amplitude de cada classe e a altura proporcional a freqncia (simples ou relativa) de modo que a rea de cada retngulo seja igual a freqncia considerada. Desta forma a altura de cada retngulo ser igual a: fi / hi ou ento fri / hi. Veja-se o clculo das alturas na tabela 06 e o exemplo na figura 02. Tambm pode ser construdo um histograma utilizando-se as freqncias acumuladas. Neste caso o diagrama resultante denominado de ogiva. Se os pontos mdios
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

16

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

de cada classe de um histograma forem unidos atravs de segmentos de retas teremos ento um diagrama denominado de polgono de freqncias.
Tabela 06 - Clculo das ordenadas do histograma Idades 230 |---- 250 250 |---- 270 270 |---- 290 290 |---- 310 310 |---- 330 330 |---- 350 350 |---- 370 Total Nmero de alunos 12 9 8 7 6 5 3 50 fi / hi 0,60 0,45 0,40 0,35 0,30 0,25 0,15 ----

Figura 02 - Histograma de freqncia simples da varivel "idades dos alunos da turma U - Disciplina de Estatstica"
fi / hi 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
230 |--- 250 250 |--- 270 270 |--- 290 290 |--- 310 310 |---330 330 |--- 350 350 |--- 370

3.6. RESUMO DE UMA DISTRIBUIO DE FREQNCIAS 3.6.1. M E D I D A S


D E P OSI O OU T E N D N C I A C E N T R A L

(i) A mdia aritmtica


A mdia aritmtica de uma distribuio de freqncias por pontos ou valores ou ainda por classes ou intervalos dada por:

x = (f1x1 + f2x2 +... + fnxn) / (f1 + f2 + ... + fn) = f i x i


n

Exemplos: A mdia da distribuio da tabela trs, utilizando a tabela 07 para fazer os clculos ser:

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

17

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

Tabela 07 - Clculo da mdia de uma distribuio por pontos ou valores Nmero de irmos 0 1 2 3 4 5 6 Total Nmero de alunos 7 21 8 5 4 3 2 50 fixi 0 21 16 15 16 15 12 95

n Ou seja, o nmero mdio de alunos da turma U, de Estatstica, de 1,90. J para a tabela quatro necessrio primeiro obter os valores dos pontos mdios de cada classe ou intervalo. Fazendo os clculos na tabela 08, vem:

x = f i x i = 95 / 50 = 1,90 irmos.

Tabela 08 - Clculo da mdia de uma distribuio por classes Idades 230 |---- 250 250 |---- 270 270 |---- 290 290 |---- 310 310 |---- 330 330 |---- 350 350 |---- 370 Total Nmero de alunos 12 9 8 7 6 5 3 50 xi 240 260 280 300 320 340 360 ---fixi 2880 2340 2240 2100 1920 1700 1080 14260

Deste modo a mdia das idades ser:

x = f i xi = 14 260 / 50 = 285,20 meses, ou seja, 285 meses e 6 dias.


n

(ii) A mediana
(a) A mediana de uma distribuio de valores ou pontos obtida da mesma forma que para dados no agrupados, isto :

me = x(n+1)/2 se n mpar e me = [x(n/2) + x(n/2)+1] / 2 se n par


Observao: Neste caso deve-se trabalhar como se o conjunto no estivesse agrupado.
Exemplo: Para os valores da tabela trs a mediana :

me = [x50/2 + x(50/2)+1] / 2 = [x25 + x26] / 2 = (1 + 1) / 2 = 1, pois da oitava posio at a


vigsima oitava posio todos os valores so iguais a um, e a mediana a mdia entre os valores que se encontra na vigsima quinta e vigsima sexta posio.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

18

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

(b) A mediana de uma distribuio de freqncias por classes ou intervalos dada pela seguinte expresso:

n Fi -1 , onde me = lii + h i 2 fi

lii = limite inferior da classe mediana, isto , a classe que contm o ou os valores centrais; hi = amplitude da classe mediana; fi = freqncia simples da classe mediana; Fi-1 = freqncia acumulada simples da classe anterior classe mediana.
Exemplo: Considerando que a classe mediana, na tabela quatro, a que contm os valores x25 e x26, isto , a terceira classe, vem:

F2 = 270 + 20[(25 - 21) / 8] = 270 + 10 = 280 meses. me = li3 + h 3 2 f3

(iii) A moda
(a) A moda de uma distribuio de valores ou pontos obtida da mesma forma que para dados no agrupados, ou seja, observando o valor ou os valores que mais se repetem.

mo = valor da linha com maior freqncia (se existir apenas uma).


Exemplo: Para os valores da tabela trs a moda :

mo = 1, pois este valor com uma freqncia de 21 o que mais se repete.


(b) A moda de uma distribuio de freqncias por classes ou intervalos dada pelas seguintes expresses:

mo = lii + hi f i+1 , denominada de moda de King, ou f i-1 + f i+1

mo = lii + hi

f i f i-1 , denominada de moda de Kzuber, onde: 2f i f i-1 f i+1

lii = limite inferior da classe modal, isto , a classe de maior freqncia; hi = amplitude da classe modal; fi = freqncia simples da classe modal; fi-1 = freqncia simples da classe anterior classe modal; fi+1 = freqncia simples da classe superior classe modal.
Exemplo: Considerando que a classe de maior freqncia, a classe modal, na tabela quatro, a primeira,

vem:

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

19

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

mo = li1 + h1 f 2 = 230 + 20 = 250 meses.


f2

mo = li1 + h1

f1 = 230 + 20[12 / (24 - 9)] = 230 + 16 = 246 meses. 2f 1 f 2

(iv) Relao entre as trs medidas de posio


Karl Pearson estabeleceu a seguinte relao aproximada entre as trs medidas de posio:

x - mo = 3 ( x - me),
Ou seja, em uma distribuio de freqncias diferena entre a mdia e a moda 3 vezes maior do que a diferena entre a mdia e a mediana.

3.6.2. M E D I D A S

D E V A R I A B I L I D A D E OU D I SP E R S O

(a) A amplitude
A amplitude de uma distribuio de freqncias definida como sendo a diferena entre os valores extremos da distribuio, isto :

h = xmax - xmin, para a distribuio por pontos ou valores e h = lsk - li1, para a distribuio por classes ou intervalos.
Exemplo: A amplitude da distribuio da tabela trs :

h = xmax - xmin = 6 - 0 = 6 irmos


J a amplitude da distribuio da tabela quatro vale:

h = ls7 - li1 = 370 - 230 = 140 meses

(b) O desvio mdio (absoluto)


O desvio mdio absoluto de uma distribuio de freqncias dado por:

dma = [ f1|x1 - x | + f2|x2 - x | + ... + fk|xn - x | ] / n = f i x i

Exemplo: O dma da distribuio da tabela trs utilizando a tabela 09 para os clculos, vale: Tabela 09 - Clculo dos desvio mdio absoluto Nmero de irmos 0 1 2 3 4 5 6 Total
Prof. Lor Viali, Dr.

Nmero de alunos 7 21 8 5 4 3 2 50

fi|xi - x | 7|0 - 1,90| = 13,30 21|1 - 1,90| = 18,90 8|2 - 1,90| = 0,80 5|3 - 1,90| = 5,50 4|4 - 1,90| = 8,40 3|5 - 1,90| = 9,30 2|6 - 1,90| = 8,20 64,40
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

viali@mat.ufrgs.br

20

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

dma = f i x i

= 64,40 / 50 = 1,29 irmos

(c) A varincia
A varincia de uma distribuio de freqncias pode ser avaliada por qualquer uma das expresses abaixo.

( x) s = [f1(x1 - x ) + f2(x2 - x ) + ... + fk(xk - x ) ] / n = f i x i = f i x i x2 n n


2 2

(d) O desvio padro


O desvio padro de uma distribuio de freqncias determinado extraindo-se a raiz quadrada da varincia. Assim, do desvio padro :

( x) f x s = f i xi = i i x2
2

Exemplo: A varincia e o desvio padro da distribuio da tabela 04, utilizando a tabela 10 para os clculos vale: Tabela 10 - Ilustrao do clculo da varincia Idades Nmero de alunos xi fixi fix2

230 |---- 250 250 |---- 270 270 |---- 290 290 |---- 310 310 |---- 330 330 |---- 350 350 |---- 370 Total

12 9 8 7 6 5 3 50

240 260 280 300 320 340 360 ----

2880 2340 2240 2100 1920 1700 1080 14260

691200 608400 627200 630000 614400 578000 388800 4138000

A varincia da distribuio ser:

s = f i x i x 2 = 4 138 000 / 50 - 285,202 = 82760 - 81339,04 = 1420,96


2

n O desvio padro vale:


2

x s = f i i x 2 = 37,70
n

x 2 = 0,0175 O coeficiente de variao vale: g = s / x = 0,132 2 = 13,22%

A varincia relativa: g2 = s2 /

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

21

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA


D E A SSI M E T R I A

3.6.3. M E D I D A S

A assimetria de um conjunto de dados, agrupados ou no, pode ser avaliada atravs da seguinte relao devida a Karl Pearson:

a1 = 3( x - me) / s
Se a1 for igual a zero ento a distribuio (ou conjunto) dito simtrico. Se a1 > 0 ento a assimetria positiva significando que o grfico da distribuio tem uma cauda alongada direita. Caso a1 seja negativo a cauda do grfico ser alongada esquerda. Se uma distribuio de freqncias simtrica ento as 3 medidas de posio coincidem, isto : x = me = mo.

x > me > m0 E se a distribuio negativamente assimtrica ento x < me < mo


Se a distribuio positivamente assimtrica ento

3.7. PROPRIEDADES DAS MEDIDAS 3.7.1. M E D I D A S


D E P OSI O

(i) Se todos os valores de um conjunto de dados forem somados a uma constante ento as medidas de posio aumentam desta constante. Em smbolos. Dado um conjunto de dados x e somando a este conjunto uma constante c. Ento para y = x + c, tem-se:

y = x +c
O mesmo acontece com a mediana e a moda. (ii) Se todos os valores de um conjunto de dados forem multiplicados a uma constante ento as medidas de posio ficam multiplicadas por esta constante. Em smbolos. Se um conjunto de dados x for multiplicado por uma constante c. Ento para y = cx, tem-se:

y= cx
O mesmo acontece com a mediana e a moda.

3.7.2. M E D I D A S

D E D I SP E R S O

(i) Se todos os valores de um conjunto de dados forem somados a uma constante ento as medidas de disperso no se alteram. Em smbolos. Dado um conjunto de dados x e somando a este conjunto uma constante c. Ento para y = x + c, tem-se:

s y = sx
O mesmo vale para a varincia e para o dma. O coeficiente de variao e a varincia relativa so excees, pois so medidas derivadas, que combinam uma medida de posio a mdia no denominador que se altera e uma medida de disperso o desvio padro ou a varincia no numerador que no se altera. (ii) Se todos os valores de um conjunto de dados forem multiplicados a uma constante ento as medidas de posio ficam multiplicadas por esta constante, sendo que a varincia fica multiplicada pelo quadrado desta constante. Em smbolos. Se um conjunto de dados x for multiplicado por uma constante c. Ento para y = cx, tem-se:

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

22

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

sy = csx
O mesmo vale para a o dma. J a varincia que um quadrado fica multiplicada pelo quadrado da constante. O coeficiente de variao e a varincia relativa so excees, pois so medidas derivadas, que combinam uma medida de posio, a mdia no denominador que se altera, e uma medida de disperso, o desvio padro ou a varincia no numerador, que tambm se altera. Como tanto o numerador quanto o denominador se alteram na mesma proporo, ento a razo entre as duas alteraes passar a ser um. Portanto tanto a varincia relativa quanto o coeficiente de variao so indiferentes a uma multiplicao do conjunto de valores por uma constante.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

23

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

4. EXERCCIOS
1. Identifique os tipos de escalas utilizadas para cada uma das seguintes caractersticas das unidades de observao, retiradas de uma tabela do Guia do Usurio do aplicativo Microsoft Excel: ms, tipo de produto, vendedor, regio do pas, unidades vendidas e total de vendas. 2. possvel encontrar a seguinte srie de desvios tomados em relao a mdia aritmtica: 4, -3, 2, -7 e 5? Justifique. 3. Dados dois grupos de pessoas, o grupo A com 10 elementos e o grupo B com 40 elementos. Se o peso mdio do grupo A for de 80 kg e o do grupo B for de 70 kg ento verdade que o peso mdio dos dois grupos considerados em conjunto de 75 kg? Justifique. 4. Um concurso realizado simultaneamente nos locais A, B e C, apresentou as mdias: 70, 65 e 45, obtidos por 30, 40 e 30 candidatos, nessa ordem. Qual foi a mdia geral do concurso? 5. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma mdia de 70 pontos em determinada prova. Sabendo-se que a mdia geral dos candidatos (independente de sexo) foi de 64 pontos, qual foi a mdia dos candidatos do sexo feminino? 6. Determinar a moda dos seguintes conjuntos: (6.1) 1, 6, 9, 3, 2, 7, 4 e 11 (6.2) 6, 5, 5, 7, 5, 6, 5, 6, 3, 4 e 5 (6.3) 8, 4, 4, 4, 4, 6, 9, 10, 10, 15, 10, 16 e 10 (6.4) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28 e 18 7. Determinar a mediana dos seguintes conjuntos: (7.1) 9 14 2 8 7 14 3 21 1 (7.2) 0,02 0,25 0,47 0,01 -0,30 -0.5 (7.3) 1/2 3/4 4/7 5/4 -2/3 -4/5 -1/5 3/8 8. Para os conjuntos abaixo, determinar com aproximao centesimal, as seguintes medidas: (a) A amplitude (b) O desvio mdio (c) A varincia (d) O desvio padro (e) O coeficiente de variao. (8.1) 0,04 0,18 0,45 1,29 2.35 (8.2) -7/4 -1/3 3/5 7/20 1 4/3 9. Dados os seguintes conjuntos de valores: (a) 1 3 7 9 10 (b) 20 60 140 180 200 (c) 10 50 130 170 190. Calculando a mdia e o desvio padro do conjunto em (a), determinar, atravs das propriedades, a mdia e o desvio padro dos conjuntos em (b) e (c). 10. Quarenta alunos da PUC foram questionados quanto ao nmero de livros lidos no ano anterior. Foram registrados os seguintes valores:
4 0 8 3 2 2 0 4 1 1 1 3 0 1 6 2 3 0 5 1 1 4 3 0 2 3 2 2 0 2 1 1 2 3 6 0 1 5 4 3

(10.1) Organize os dados em uma tabela adequada. (10.2) Qual o percentual de alunos que leram menos do que 3 livros.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

24

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

(10.3) Qual o percentual de alunos que leram 4 ou mais livros. (10.4) Classifique a varivel e o tipo de distribuio utilizada. 11. O conjunto de dados abaixo representa uma amostra de 40 elementos:
3,67 5,36 5,28 0,90 1,82 3,96 5,41 5,09 3,73 6,54 7,77 4,07 4,10 5,84 4,65 8,67 4,30 7,35 1,88 0,90 1,28 3,63 2,12 6,67 8,14 2,93 4,26 8,96 2,43 2,82 2,78 4,00 4,17 8,45 5,54 2,00 2,88 4,15 6,00 2,01

(11.1) Agrupe os dados em uma distribuio de freqncias, considerando o limite inferior igual a zero, o superior igual a 10 e utilizando cinco classes de mesma amplitude. (11.2) Construa um histograma de freqncias relativas. (11.3) Una os pontos mdios de cada retngulo, obtendo o polgono de freqncias relativas e classifique o conjunto quanto assimetria. 12. A tabela registra simultaneamente 200 aluguis de imveis urbanos e 100 de imveis rurais. (12.1) Calcule e interprete fr2 para cada caso. (12.2) Calcule e interprete F3 para cada caso. Aluguis Zona Urbana Zona Rural (12.3) Calcule e interprete Fr4 - Fr2 para cada caso.
1 |----- 3 10 3 |----- 5 40 13. O histograma abaixo representa os salrios, em 5 |----7 80 unidades monetrias (u.m.) dos 100 empregados de 7 |----9 50 uma empresa: 9 |----- 11 20 (13.1) Que percentual de empregados recebem 8 200 u.m. ou mais? (13.2) Quantos empregados recebem de 4 a 16 u.m.? (13.3) Quantos empregados recebem menos que 4 u.m. ou mais que 12 u.m.?
0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0

30 50 15 05 00 100

fri/hi

0 |-- 4

4 |-- 8

8 |-- 12

12 |--16

16 |--20

14. Um livro com 50 pginas apresentou um nmero de erros de impresso por pgina conforme tabela: (14.1) Qual o nmero mdio de erros por pgina? Erros Nmero de pginas (14.2) Qual o nmero mediano de erros por pgina? 0 25 1 20 (14.3) Qual o nmero modal de erros por pgina? 2 3 (14.4) Qual o desvio padro do nmero de erros por pgina?
3 4 Total 1 1 50

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

25

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

15. Durante certo perodo de tempo o rendimento de 10 aes foram os que a tabela registra. (15.1) Calcule o rendimento mdio. (15.2) Calcule o rendimento mediano. (15.3) Calcule o rendimento modal. (15.4) Calcule o desvio padro do rendimento. (15.5) Calcule o coeficiente de variao do rendimento. 16. Uma regio metropolitana tem 50 quarteires com os seguintes nmeros de casas por quarteiro:
2 18 26 45 66 2 18 27 46 66 3 20 29 48 68 10 21 29 52 75 13 22 30 58 78 14 22 32 59 80 15 23 36 61 89 15 23 42 61 90 16 25 44 61 92

Ao 1 2 3 4 5 6 7 8 9 10 16 25 45 65 97

Taxa (%) 2,59 2,64 2,60 2,62 2,57 2,55 2,61 2,50 2,63 2,64

(16.1) Construa, com os dados, uma distribuio de freqncias por intervalos fazendo com que as classes tenham amplitudes igual a 14. (16.2) Calcule o nmero mdio de casas por quarteiro. (16.3) Determine o nmero mediano de casas por quarteiro. (16.4) Calcule a varincia do nmero de casas por quarteiro. (16.5) Calcule, plos dois processos, o nmero modal de casas por quarteiro. 17. De um levantamento feito entre 100 famlias resultou a tabela ao lado. Determine: (17.1) O nmero mdio de filhos. Nmero de filhos Nmero de famlias (17.2) O nmero mediano de filhos. 0 18 1 23 (17.3) O nmero modal de filhos. 2 28 (17.4) O desvio padro do nmero de filhos. 3 21 18. As informaes abaixo dizem respeito a distribuio de trs variveis. Indique, justificando, qual delas tem mdia mais representativa. Distribuio A Distribuio B n = 200 n = 50 fx = 5000 fx = 500 2 fx2 = 5450 fx = 130000
4 5 Total 7 3 100

Distribuio C x =8 fx = 3200 fx2 = 32000

19. Identifique, justificando, qual a varivel mais homognea. Distribuio A Distribuio B x = 50 n = 100

fx = 5000 fx2 = 256400

fx = 10000 f(x - x )2 = 7200

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

26

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

20. Uma varivel x tem mdia igual a 10 e varincia igual a 16. Calcule a mdia e a varincia da varivel dada por y = (3x + 5) / 2 21. Uma varivel x tem mdia igual a 5 e desvio padro igual a 3. Calcule o coeficiente de variao da varivel y = 4x + 4 22. Uma varivel x tem mdia igual a 6 e coeficiente de variao igual a 0,50. Calcule o coeficiente de variao da varivel y = (5x - 2) / 2 23. Os operrios de um setor industrial tm, em uma poca 1, um salrio mdio de 5 salrios mnimos (sm) e desvio padro de 2 sm. Um acordo coletivo prev, para uma poca 2, um aumento linear de 60%, mais uma parte fixa correspondente a 70% de um salrio mnimo. Calcule a mdia e o desvio padro dos salrios na poca 2. 24. Uma varivel x assume valores no intervalo [10; 30]. (23.1) Sabendo que x tem uma distribuio assimtrica positiva voc diria que a mdia de x : 20, menor que 20 ou maior que 20. Justifique. (23.2) E se x tiver uma distribuio simtrica? 25. O que se pode dizer se fosse dada a informao de que o salrio mediano de um conjunto de profissionais de 6 sm? 26. Um a comunidade A tem 100 motoristas profissionais cujo salrio mdio de 5 sm. A comunidade B, com 300 desses profissionais, remunera-os com uma mdia de 4 sm. (25.1) correto afirmar que A remunera melhor seus motoristas profissionais que B? (25.2) Diante das informaes disponveis h garantia que os 100 salrios individuais de A so maiores que os 300 de B? Por que? 27. Abaixo voc encontra duas distribuies que refletem os comportamentos de x e y (tamanhos de famlias) em duas comunidades, sendo que uma de base cultural alem e outra italiana. Utilize tais informaes para uma anlise que indique qual das duas comunidades tem famlias maiores.
X 2 3 4 5 6 7 f 25 30 48 111 98 88 Y 3 4 5 6 7 8 9 f 48 51 48 41 32 14 6

28. O departamento de pessoal de um certa firma fez um levantamento dos salrios dos 120 funcionrios do setor administrativo, obtendo os resultados da tabela: (28.1) Determine o salrio mdio dos funcionrios (28.2) Determinar a varincia e o desvio padro dos salrios. (28.3) Determinar o salrio mediano. (28.4) Determinar o salrio modal plos critrios de Faixa salarial (s.m.) % de funcionrios King e Czuber. 1 |---- 3 0,25 (28.5) Se for dado um aumento de 20% para todos os 3 |---- 5 0,40 funcionrios, qual ser o novo salrio mdio e o novo 5 |---- 7 0,20 desvio padro dos salrios? 7 |--- 10 0,15 (28.6) Se for dado um abono de 0,5 s.m. a todos os Total 1,00 funcionrios como fica a mdia e o desvio padro dos
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

27

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

salrios? 29. O que acontece com a mdia e o desvio padro de um conjunto de dados quando: (29.1) Cada valor multiplicado por 2. (29.2) Soma-se o valor 10 a cada valor. (29.3) Subtrai-se a mdia de cada valor. (29.4) De cada valor subtrai-se a mdia e em seguida divide-se pelo desvio padro 30. A mdia aritmtica entre dois valores igual a 5 e a mdia geomtrica igual a 4. Qual a mdia harmnica entre estes dois valores?

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /

28

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

5. RESPOSTAS DOS EXERCCIOS


(01) Ms (Qualitativa ordinal) ; Tipo de produto (Qualitativa nominal); Vendedor (Qualitativa nominal); Regio do pas (Qualitativa ordinal); Unidades vendidas (Quantitativa discreta); Total de vendas (Quantitativa contnua). (02) No, pois a soma dos desvios diferente de zero. (03) No, pois o clculo deve ser realizado atravs da mdia ponderada e no da mdia aritmtica simples. (04) 60,50 (05) 55 (06) (6.1) Amodal (07) (7.1) 8 (08) (8.1) (a) 2,31 (8.2) (a) 37/12 = 3,08 (6.2) 5 (7.2) 0,02 (b) 0,77 (b) 149/180 = 0,83 (6.3) 4 e 10 (7.3) 7/16 (c) 0,74 (c) 1,03 (d) 0,86 (d) 1,02 (e) 99,90% (e) 508,01% (6.4) 18

(09) Observe que o conjunto em (b) igual ao conjunto em (a) multiplicado por 20 e o conjunto em (c) igual ao conjunto em (a) multiplicado por 20 e subtrado de 10 unidades. (10) (10.1)
Nmero de livros 0 1 2 3 4 5 6 8 Total Nmero de alunos 7 9 8 7 4 2 2 1 40

(10.2) 24/40 = 60% (10.3) 9/40 = 22,5% (10.4) Distribuio por ponto ou valores

fr / h

(11) (11.1)

Varivel 0 |----- 2 2 |----- 4 4 |----- 6 6 |----- 8 8 |----- 10

Freqncias 5 12 14 5 4 40

(11.2)

0,2100 0,1800 0,1500 0,1200 0,0900 0,0600 0,0300 0,0000 0 |--- 2 2 |--- 4 4 |--- 6 6 |--- 8 8 |--- 10

(11.3) Assimtrica positiva


0 , 2 10 0 0 , 18 0 0 0 , 150 0 0 , 12 0 0 0 ,0 9 0 0 0 ,0 6 0 0 0 ,0 3 0 0 0 ,0 0 0 0 -1 1 3 5 7 9 11

P r o f . L o r V i a l i , D r . viali@mat.pucrs.br - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i /

29

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

(12) (12.1) Zona urbana: fr2 = 0,20 20% dos aluguis observados esto entre 3 e 5. Zona rural: fr2 = 0,50 50% dos aluguis investigados ente entre 3 e 5. (12.2) Zona urbana: F3 = 130 130 aluguis investigados so menores do que 7. Zona rural: F3 = 95 95 aluguis investigados so menores do que 7. (12.3) Zona urbana: Fr4 - Fr2 = 0,90 - 0,25 = 0,65 = 65% dos aluguis esto entre 5 e 9. Zona rural: Fr4 - Fr2 = 1,00 - 0,80 = 0,20 = 20% dos aluguis esto entre 5 e 9. (13) (13.1) 64% (14) (14.1) 0,66 erros (15) (15.1) 2,60% (16) (16.1) (13.2) 76 (14.2) 0,50 erros (15.2) 2.60%
02 |----- 16 16 |----- 30 30 |----- 44 44 |----- 58 58 |----- 72 72 |----- 86 86 |----- 100

(13.3) 56 (14.3) Zero erros (15.3) 2,64%


Nmero de quarteires 8 16 4 6 9 3 4 50

(14.4) 0,84 erros (15.4) 0,04% (15.5) 1,63%

Nmero de casas por quarteiro

(16.2) 41,76 casas (16.3) 33,50 casas (16.4) 686,86 casas (16.5) 20,67 e 21,60 casas (17) (17.1) 1,85 filhos (17.2) 2 filhos (17.3) 2 filhos (17.4) 1,30 filhos (18) a varivel A cujo coeficiente de variao 0,20, o menor dentre as 3. (19) a varivel B cujo coeficiente de variao 0,12, o menor dentre as 2.

s2 = 36 (23) x = 8,70 sm s = 3,20 sm


(20) x = 17,50

(21) g = 50%

(22) g = 0,5357 = 53,57%

(24) (24.1) Deve ser maior que 20. (24.2) Seria 20, pois 20 o centro da distribuio. (25) Que 50% dos profissionais recebem at 6 sm. (26) (26.1) Sim, em mdia. (26.2) No. (27) A comparao pretendida deve ser feita pelas mdias. As famlias de base cultural alem tem, em mdia, 5,23 membros, enquanto que as de base italiana tem 5,10. Ento as de base alem tem o hbito de ter famlias maiores. (28) (28.1) 4,58 sm (28.2) 4,51 e 2,12 sm (28.3) 4,25 sm (28.4) 3,89 sm e 3,86 sm (28.5) 5,49 e 2,55 sm (28.6) 5,08 e 2,12 sm (29) (29.1) A mdia e o desvio padro ficam multiplicados por 2. (29.2) A mdia fica somada de 10 e o desvio padro no se altera. (29.3) A mdia fica igual a zero e o desvio padro no se altera. (29.4) A mdia fica igual a zero e o desvio padro fica igual a um. (30) 3,2

P r o f . L o r V i a l i , D r . viali@mat.pucrs.br - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i /

30

7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10

SRIE: Estatstica Bsica Texto i: DESCRITIVA

6. REFERNCIAS
AZEVEDO, Amilcar Gomes de, CAMPOS, Paulo Henrique Borges de. Estatstica Bsica. So Paulo: Livros Tcnicos e Cientficos, 1981. BUSSAB, Wilton O, MORETTIN, Pedro A. Estatstica Bsica. 3 ed. So Paulo: Atual, 1986. HOFFMAN, Rodolfo. Estatstica para Economistas. So Paulo: Pioneira, 1980. NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo: Edgard Blcher, 1977. MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Economics. Boston (MA): IRWIN, 1990. SPIEGEL, Murray R. Estatstica. So Paulo: McGraw-Hill do Brasil, 1985. STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo: Harbra, 1981. WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica. Rio de Janeiro: Livros Tcnicos e Cientficos, 1985.

P r o f . L o r V i a l i , D r . viali@mat.pucrs.br - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i /

31

Você também pode gostar