Escolar Documentos
Profissional Documentos
Cultura Documentos
Faetec Apostila Estatistica PDF
Faetec Apostila Estatistica PDF
República
Curso: Informática
Disciplina: Estatística
Apostila de Estatística
PANORAMA HISTÓRICO
MÉTODO ESTATÍSTICO
A ESTATÍSTICA
utilizando-a com maior ou menor intensidade. Isto se deve às múltiplas aplicações que o método
estatístico proporciona àqueles de que dele necessitam.
Testar sistematicamente algo requer muitas vezes uma pesquisa cuidadosamente planejada e
executada. Sendo assim, distingui-se no método estatístico as seguintes fases:
d) Crítica dos dados. Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de
possíveis falhas e imperfeições, a fim de evitar erros grosseiros ou de certo vulto, que
possam influir sensivelmente nos resultados.
A crítica dos dados pode ser externa ou interna.
• Externa: quando procura por erros por parte do informante devido principalmente à
má interpretação das perguntas.
• Interna: quando observa os dados coletados a procura de erros devidos,
principalmente, à digitação.
3
e) Apuração dos dados. É a soma e o processamento dos dados obtidos e a sua disposição
mediante critérios de classificação.
f) Exposição ou apresentação dos dados. Nesta fase os dados devem ser apresentados através
de gráficos, tabelas e coeficientes que permitam descrever resumidamente os fenômenos
observados tornando mais fácil o exame daquilo que é o objeto da pesquisa.
VARIÁVEIS
Tipos de Variáveis
Nominal
Qualitativa
Ordinal
Variável
Quantitativa Discreta
Contínua
Variáveis Qualitativas
São variáveis que apresentam como possíveis realizações uma qualidade (ou atributo) do
que se está investigando.
Variável para a qual não existe nenhuma ordenação nas prováveis realizações.
Variável para a qual existe uma certa ordem nos possíveis resultados.
Variáveis Quantitativas
São aquelas cujos possíveis valores formam um conjunto finito ou enumerável de números e
que resultam, freqüentemente, de uma contagem.
São aquelas cujos possíveis valores formam um intervalo de números reais e que resultam,
normalmente, de uma mensuração (medida).
POPULAÇÃO E AMOSTRA
Por definição população é o conjunto de indivíduos (ou objetos), que tem pelo menos uma
característica em comum.
Amostra é qualquer subconjunto da população.
As medidas estatísticas utilizadas para descrever uma característica da população são
chamadas de parâmetros.
As medidas estatísticas utilizadas para descrever uma característica da amostra são
chamadas de estatísticas.
TÉCNICAS DE AMOSTRAGEM
Para que possamos inferir sobre as características de uma população é necessário que a
amostra seja representativa da mesma. Através das Técnicas de Amostragem podemos obter
amostras representativas da população.
Neste tipo de amostragem os elementos são retirados ao acaso da população. Assim, cada
elemento da população tem a mesma probabilidade de fazer parte da amostra.
Para a sua realização, numera-se a população de 1 até n e a partir de um dispositivo aleatório
(como uma tabela de números aleatórios) são sorteados os k elementos que farão parte da amostra.
Exemplo: De uma população de 90 alunos sortear uma amostra de 10% deles (9 alunos).
72 16 59 83 00 04 85 15 91 15 51 42 50
Os números 00 e 91 foram desprezados por não fazerem parte da população, assim como o
segundo número 15. Logo, os alunos que farão parte da amostra são:
72 16 59 83 04 85 15 51 42
6
Primeiramente, numeramos os alunos de 01 até 90, sendo que de 01 até 54 são os meninos e
de 55 até 90 são as meninas. Com o auxílio da Tabela de Números Aleatórios (Apêndice A) e
definindo o critério de utilização desta tabela, sorteamos os elementos que irão fazer parte da
amostra.
Se definirmos que o critério de utilização da tabela será a primeira coluna e a segunda
coluna da esquerda, de cima para baixo. Assim, os elementos selecionados são:
72 25 72 00 64 63 05 99 06
75 06 58 10 70 81 44 60 43
Meninos: 25 05 06 10 44
Meninas: 72 64 63 75
Amostragem Sistemática
Exemplo: Suponha um consultório médico com 900 pacientes que se deseja obter uma amostra de
50 pacientes.
Tamanho da população 900
Primeiramente, calculamos a seguinte razão: = = 18 ,
Tamanho da amostra 50
escolhemos por sorteio aleatório um número entre 1 e 18 (inclusive), e a partir daí retira-se
periodicamente de 18 em 18.
Se o número sorteado fosse o 4, selecionaríamos na amostra o 4º prontuário, o 22º
prontuário (4 + 18), o 40º prontuário (22 + 18), o 58º prontuário (40 + 18), etc.
7
SÉRIES ESTATÍSTICAS
Uma série estatística é definida como toda e qualquer coleção de dados estatísticos. Em uma
série estatística observa-se a existência de três elementos (ou fatores):
a) a época (fator temporal ou cronológico) a que se refere o fenômeno analisado;
b) o local (fator espacial ou geográfico) onde o fenômeno acontece;
c) o fenômeno (espécie do fato ou fator especificativo) que é descrito.
Exemplo:
Distribuição do Número de Internações Hospitalares no Brasil
Segundo Mês de Competência. 2000.
Nº
Mês de Competência
Internações
Janeiro 993.204
Fevereiro 1.006.409
Março 1.013.642
Abril 1.028.015
Maio 1.025.876
Junho 991.928
Julho 996.413
Agosto 1.010.099
Setembro 970.688
Outubro 978.005
Novembro 977.334
Dezembro 945.710
TOTAL 11.937.323
Fonte: SIH/SUS
Exemplo:
Distribuição do Número de Internações Hospitalares
Segundo Regiões do Brasil. 2000.
Nº
Região
Internações
Região Norte 914.104
Região Nordeste 3.601.780
Região Sudeste 4.536.395
Região Sul 1.983.313
Região Centro-Oeste 901.731
TOTAL 11.937.323
Fonte: SIH/SUS
Séries Específicas
Exemplo:
Distribuição do Número de Internações Hospitalares no Brasil
Segundo Capítulos da CID. 2000.
REPRESENTAÇÃO TABULAR
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem
assumir, para que se tenha uma visão global da variação dessa ou dessas variáveis. Esse objetivo é
inicialmente alcançado através da construção de tabelas e gráficos.
A tabela é utilizada para resumir um conjunto de observações.
Uma tabela é composta de:
a) corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo;
b) cabeçalho: parte superior da tabela que especifica o conteúdo das colunas;
c) coluna indicadora: parte da tabela que especifica o conteúdo das linhas;
d) título: conjunto de informações, as mais completas possíveis, respondendo às perguntas: O
quê?, Quando?, Onde?, localizado no topo da tabela;
e) fonte: origem dos dados. A fonte é localizada no rodapé da tabela.
Pode-se apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto
é, a conjugação de duas ou mais séries.
Conjugando duas séries em uma única tabela, obtém-se uma tabela de dupla entrada. Nesse
tipo de tabela ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical
(coluna).
Exemplo:
Distribuição do Número de Internações Hospitalares
Segundo Regiões do Brasil e Ano de Competência. 1998-2000.
No exemplo apresentado houve a conjugação de uma série geográfica com uma série
histórica, originando uma série geográfica-histórica ou histórica-geográfica.
DISTRIBUIÇÃO DE FREQÜÊNCIAS
Exemplo:
Distribuição por sexo dos adolescentes das Classes Sociais A e B.
Sexo Nº de adolescentes
Masculino 289
Feminino 155
Total 444
Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro.
CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999.
Dados absolutos são os dados estatísticos resultantes da coleta direta da fonte sem qualquer
tratamento além da contagem ou medida.
Os dados relativos representam o resultado de comparações por quocientes (razões) entre
dados absolutos, que tem por finalidade facilitar as comparações entre quantidades. As
percentagens, os índices, os coeficientes e as taxas são tipos de dados relativos.
As Percentagens
289 x 100
Masculino → = 65,09 = 65,1
444
155 x 100
Feminino → = 34,91 = 34,9
444
11
Assim, os valores dessa nova coluna nos revelam que de cada 100 adolescentes
entrevistados nas Classes Sociais A e B, aproximadamente, 65 são do sexo masculino e 35 são do
sexo feminino.
Distribuição por sexo dos adolescentes das Classes Sociais (A e B) e (C, D e E).
Nº de adolescentes das Classes Sociais
Sexo AeB C, D e E
Masculino 289 242
Feminino 155 228
Total 444 470
Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro.
CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999.
Qual dos grupos de Classes Sociais tem, comparativamente, maior número de adolescentes
em cada sexo?
Como o número total de adolescentes não é o mesmo nos dois grupos, não podemos fazer a
comparação pelo valor absoluto. Assim, devemos usar a percentagem para fazer essa comparação.
Distribuição por sexo dos adolescentes das Classes Sociais (A e B) e (C, D e E).
Classes Sociais A e B Classes Sociais C, D e E
Sexo Nº de adolescentes % Nº de adolescentes %
Masculino 289 65,1 242 51,5
Feminino 155 34,9 228 48,5
Total 444 100,0 470 100,0
Fonte: Pesquisa Juventude, Cidadania e Violência no Município do Rio de Janeiro.
CLAVES/FIOCRUZ, UNESCO, Fundação Ford. 1999.
Observa-se que as Classes Sociais A e B, contam com mais adolescentes do sexo masculino
(65 em cada 100 adolescentes são do sexo masculino nessas Classes Sociais), enquanto nas Classes
Sociais C, D e E essa relação é de, aproximadamente, 52 adolescentes do sexo masculino para cada
100 adolescentes.
12
Os Índices
Os índices representam razões entre duas grandezas, sendo que uma não inclui a outra.
Exemplos:
peso
a) Índice de massa corporal (IMC):
altura 2
população
b) Densidade demográfica:
sup erfície
total da produção
c) Produção per capita:
população
consumo do bem
d) Consumo per capita:
população
renda
e) Renda per capita:
população
receita
f) Receita per capita:
população
Produção per capita, Consumo per capita, Renda per capita e Receita per capita são índices
econômicos.
Os Coeficientes
Exemplos:
número de nascimentos
a) Coeficiente de natalidade:
população total
número de óbitos
b) Coeficiente de mortalidade:
população total
As Taxas
As taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1.000, etc).
Exemplos:
Exercícios:
Com base nos dados abaixo, divulgados pelo IBGE, para o Município do Rio de Janeiro, em 2001,
calcule:
a) Densidade demográfica;
b) Coeficiente de natalidade;
c) Coeficiente de mortalidade;
d) Taxa de natalidade;
e) Taxa de mortalidade.
GRÁFICO ESTATÍSTICO
O gráfico estatístico é uma forma de apresentação dos resultados que tem a função de
facilitar a compreensão através de seu efeito visual imediato. Essa característica é uma vantagem
que os gráficos têm em relação às tabelas, uma vez que a impressão que eles produzem é mais
rápida.
Os gráficos devem apresentar:
a) Simplicidade: O gráfico não deve conter elementos desnecessários à sua construção que
possam levar a uma análise mais demorada ou até mesmo errônea;
b) Clareza: o gráfico deve apresentar de forma clara os valores observados no fenômeno em
estudo, possibilitando a sua correta interpretação;
c) Veracidade: o gráfico deve representar a verdade sobre o fenômeno em estudo.
DIAGRAMAS
Exemplo:
Produção Brasileira de Trigo
1991-2001
Quantidade
Anos
(em toneladas)
1991 2.916.823
1992 2.795.598
1993 2.197.354
1994 2.096.259
1995 1.533.871
1996 3.292.759
1997 2.489.070
1998 2.269.847
1999 2.461.856
2000 1.725.792
2001 3.366.599
Fonte: IBGE - Produção Agrícola Municipal
15
4.000.000
3.000.000
Toneladas
2.000.000
1.000.000
0
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Ano
Fonte: IBGE - Produção Agrícola Municipal
Exemplo:
a) Gráfico em colunas
4.000.000
3.000.000
Toneladas
2.000.000
1.000.000
0
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Ano
Fonte: IBGE - Silvicultura
b) Gráfico em barras
São Paulo
Rio de Janeiro
Espírito Santo
Minas Gerais
Este gráfico é geralmente utilizado quando se deseja representar dois ou mais fenômenos
comparando-os.
Exemplo:
90.000
60.000
30.000
0
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Ano
Consensual Não consensual
Fonte: IBGE - Estatísticas do Registro Civil
O Gráfico em Setores
Exemplo:
Paraná
Santa Catarina
Rio Grande do Sul
Exemplos:
Considere uma coleta de dados relativos aos pesos de 40 alunos, que compõem uma amostra
de alunos de um colégio.
Tabela Primitiva:
66 59 47 62 60 62 61 54 64 53
58 56 52 58 68 50 57 57 68 53
60 56 62 52 60 54 61 63 69 62
46 57 63 59 61 61 49 63 64 56
Rol:
46 47 49 50 52 52 53 53 54 54
56 56 56 57 57 57 58 58 59 59
60 60 60 61 61 61 61 62 62 62
62 63 63 63 64 64 66 68 68 69
DISTRIBUIÇÃO DE FREQÜÊNCIA
Exemplo:
Pesos de 40 alunos
de um colégio
Peso (em kg) Freqüência
46 1
47 1
49 1
50 1
52 2
53 2
54 2
56 3
57 3
58 2
59 2
60 3
61 4
62 4
63 3
64 2
66 1
68 2
69 1
Total 40
Exemplo:
Pesos de 40 alunos
de um colégio
Peso (em kg) Freqüência
46 ├ 50 3
50 ├ 54 5
54 ├ 58 8
58 ├ 62 11
62 ├ 66 9
66 ├ 70 4
Total 40
21
a) Classe
b) Limites de classe
Limites de classes são os valores que definem cada um dos intervalos de classe.
O menor valor do intervalo de classe i é o limite inferior da classe (li) e o maior valor do
intervalo de classe i é o limite superior da classe (Li).
Na quarta classe (58 ├ 62) do nosso exemplo temos:
l4 = 58 e L4 = 62
22
h i = Li − li
h 4 = L 4 − l 4 = 62 − 58 = 4 ⇒ h 4 = 4 kg
A amplitude total da distribuição (AT) é a distância entre o limite superior da última classe
(limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo), ou seja, é a
diferença entre o limite superior máximo e o limite inferior mínimo.
AT = L(máx.) − l(mín.)
AT = 70 − 46 = 24 ⇒ AT = 24 kg
Obs.: Se todas as classes possuem a mesma amplitude, como no nosso exemplo, verifica-se a
relação:
AT
=k
hi
24
=6
4
e) Amplitude amostral
A amplitude amostral (AA) é a diferença entre o maior valor e o menor valor observado na
amostra.
AA = x (máx.) − x (mín.)
AA = 69 − 46 = 23 ⇒ AA = 23 kg
23
O ponto que divide o intervalo de classes em duas partes iguais é chamado de ponto médio
de uma classe, e é representado por xi. O ponto médio de uma classe é o valor que a representa.
O ponto médio de uma classe é obtido somando-se o limite inferior da classe com o limite
superior da classe e dividindo o resultado dessa soma por 2, ou seja através da média aritmética dos
limites da classe.
li + Li
xi =
2
l 4 + L 4 58 + 62 120
x4 = = = = 60 ⇒ x 4 = 60 kg
2 2 2
f1 = 3, f2 = 5, f3 = 8, f4 = 11, f5 = 9 e f6 = 4
k
∑ fi = n .
i =1
k
∑ f i = 40 ou simplesmente ∑ f i = 40
i =1
Pesos de 40 alunos
de um colégio
i Peso (em kg) fi
1 46 ├ 50 3
2 50 ├ 54 5
3 54 ├ 58 8
4 58 ├ 62 11
5 62 ├ 66 9
6 66 ├ 70 4
Total ∑ f i = 40
24
A determinação do número de classes, das amplitudes das classes e dos limites dos
intervalos de classe é uma preocupação que o pesquisador deve ter na construção da distribuição de
freqüências.
Usualmente, utilizamos a Regra de Sturges que fornece o número de classes em função do
número de observações da variável e é dada por:
k ≅ 1 + 3,3 log n
onde:
k é o número de classes
n é o número total de observações
Além da Regra de Sturges existem outras fórmulas usadas para a determinação do número
de classes que deve ter a distribuição de freqüências, como por exemplo, k ≅ n , porém o número
de classes depende mais de um julgamento pessoal por parte do pesquisador que deve considerar a
natureza dos dados, sua unidade e o objetivo da pesquisa, evitando classes com freqüência zero e,
também, uma grande concentração de dados em uma única classe.
Para se determinar a amplitude dos intervalos de classe, dividimos a amplitude amostral pelo
número de classes:
AA
h=
k
AA 69 − 46 23
h= = = = 3,8 ≅ 4
k 6 6
25
TIPOS DE FREQÜÊNCIAS
∑ fi = n
fi f
fri = = i
∑ fi n
f3 8
fr3 = ⇒ fr3 = = 0,200 ⇒ fr3 = 0,200
∑ fi 40
∑ fri = 1
Fi = f1 + f 2 + L + f k ou Fi = ∑ f i , (i = 1, 2, L , k )
4
F4 = ∑ f i = f1 + f 2 + f 3 + f 4 ⇒ F4 = 3 + 5 + 8 + 11 ⇒ F4 = 27
i =1
Esse resultado indica que 27 alunos têm peso inferior a 62 kg (limite superior do intervalo
da quarta classe).
26
Fi
Fri =
∑ fi
F4 27
Fr4 = ⇒ Fr4 = = 0,675 ⇒ Fr4 = 0,675
∑ fi 40
Com as freqüências estudadas podemos montar a seguinte tabela para o nosso exemplo:
Exemplo:
Uma distribuição de freqüência pode ser representada graficamente pelo histograma, pelo
polígono de freqüências e pelo polígono de freqüências acumuladas, que são os gráficos utilizados
para a representação de uma variável quantitativa contínua.
A construção desses gráficos baseia-se no sistema de coordenadas cartesianas. No eixo das
abscissas (horizontal) são colocados os valores da variável e no eixo das ordenadas (vertical) são
colocadas as freqüências.
Histograma
12
6
f
0
44 48 52 56 60 64 68 72
X
Polígono de freqüências
O polígono de freqüências é um gráfico em linha obtido através da união dos pontos médios
dos patamares do histograma. Para completar a figura consideram-se duas classes laterais, uma
imediatamente anterior a primeira e outra imediatamente posterior a ultima, ambas com freqüências
nulas.
12
6
f
0
44 48 52 56 60 64 68 72
X
29
40
30
20
F
10
0
46 50 54 58 62 66 70
X
Exercícios:
10 17 9 15 13
11 9 12 14 14
15 12 11 13 9
8 6 11 19 5
Com base nessas informações, construa uma distribuição de freqüências para essa variável e
calcule:
a) a freqüência relativa;
b) a freqüência acumulada;
c) a freqüência acumulada relativa;
d) a amplitude dos intervalos de classes;
e) os pontos médios das classes;
f) a amplitude total da distribuição.
INTRODUÇÃO
As medidas de posição são usadas para resumir os dados apresentando um ou alguns valores
para representar a série toda.
Entre as medidas de posição destacam-se: a média aritmética, a moda e a mediana, que
também são chamadas de medidas de tendência central uma vez que os dados observados,
geralmente, se agrupam em torno de valores centrais.
MÉDIA ARITMÉTICA (X )
A média aritmética de um conjunto de “n” números x1, x2, ..., xn, é representada por X (leia-
se “X barra”) e definida pela soma das observações dividida pelo número total delas, ou seja, é o
quociente da divisão da soma de todos os valores da variável pelo número deles.
x 1 + x 2 + ... + x n ∑ x i
X= =
n n
onde:
X = a média aritmética;
x i = os valores da variável;
n = o número de observações.
2 + 8 + 3 + 6 + 11 30
X= = =6
5 5
Se os números x1, x2, ..., xk, ocorrerem, respectivamente, f1, f2, ..., fk vezes (isto é, ocorrerem
com as freqüências f1, f2, ..., fk) a média aritmética será definida por:
f x + f 2 x 2 + ... + f k x k ∑ f i x i ∑ f i x i
X= 1 1 = =
f1 + f 2 + ... + f k ∑ fi n
31
Exemplo: Calcule a média aritmética para a distribuição do número de viagens realizadas por 20
famílias no período de um ano.
X=
∑ f i x i = 36 = 1,8 ⇒ X = 1,8 viagens
n 20
X=
∑ fi xi
n
Exemplo: Calcule a média aritmética para a distribuição dos pesos de 40 alunos de um colégio.
X=
∑ fi x i = 2360 = 59 ⇒ X = 59 kg
n 40
32
MODA (Mo)
A moda de um conjunto de números é o valor que ocorre com maior freqüência, isto é, é o
valor mais comum. A moda pode não existir, e mesmo que ela exista, pode não ser única.
Quando os valores não estão agrupados, para se calcular a moda basta procurar o valor que
aparece o maior número de vezes.
Exemplos:
b) O conjunto 3, 5, 8, 10, 12, 15, 16, não tem moda e é chamado de amodal.
Quando os valores estão agrupados sem intervalos de classe, a moda é o valor que
apresentar a maior freqüência.
Exemplo: Calcule a moda para a distribuição do número de viagens realizadas por 20 famílias no
período de um ano.
Assim, Mo = 2 viagens.
33
D1
Mo = l * + × h *
D1 + D 2
onde:
Mo = moda;
l* = limite inferior da classe modal;
D1 = diferença entre a freqüência da classe modal e a da classe imediatamente anterior;
D2 = diferença entre a freqüência da classe modal e a da classe imediatamente posterior;
h* = amplitude do intervalo de classe modal.
D1 = 11 − 8 = 3
D 2 = 11 − 9 = 2
D1 3 3 12
Mo = l * + × h* = 58 + × 4 = 58 + × 4 = 58 + = 58 + 2,4 = 60,4
D1 + D 2 3+ 2 5 5
Mo = 60,4 kg
34
MEDIANA (Md)
Md = x n +1
2
x n + x n
+1
2 2
Md =
2
Exemplos:
Md = x n +1 = x 9+1 = x 10 = x 5 = 6
2 2 2
x n + x n x 8 + x 8
+1 +1 x (4 ) + x (4+1)
2 2 2 2 x 4 + x 5 9 + 11 20
Md = = = = = = = 10
2 2 2 2 2 2
Exemplo: Calcule a moda para a distribuição do número de viagens realizadas por 20 famílias no
período de um ano.
Como o número de observações é par, a mediana é dada pela média dos valores centrais da
série.
x n + x n x 20 + x 20
+1 +1 x (10 ) + x (10+1)
2 2 2 2 x 10 + x 11 2 + 2 4
Md = = = = = = =2
2 2 2 2 2 2
Md = 2 viagens
∑ fi
− F(ant ) × h *
Md = l * +
2
f*
onde:
Md = mediana;
l* = limite inferior da classe da mediana;
∑ f i = soma das freqüências (freqüência total);
F(ant ) = freqüência acumulada até a classe anterior a que contém a mediana;
f* = freqüência da classe da mediana;
h* = amplitude do intervalo de classe da mediana.
36
∑ fi 40
= = 20 ⇒ Classe da mediana (i = 4).
2 2
∑ fi 40
− F(ant ) × h * − 16 × 4
Md = l * +
2 = 58 +
2 = 58 +
(20 − 16) × 4 = 58 + 4 × 4 = 58 + 16 =
f* 11 11 11 11
= 58 + 1,455 = 59,455
Md = 59,5 kg
Nas distribuições simétricas os valores da média, mediana e moda são iguais. Nas
distribuições assimétricas essas medidas de posição são diferentes e quanto maior for a assimetria
maior será a diferença.
Exercícios:
Conjunto a)
19; 17; 15; 15; 14; 16.
Conjunto b)
Xi fi
62 1
63 4
64 3
65 2
Total 10
Conjunto c)
Classes fi
46,7 ├ 51,7 5
51,7 ├ 56,7 1
56,7 ├ 61,7 9
61,7 ├ 66,7 3
66,7 ├ 71,7 2
Total 20
38
INTRODUÇÃO
∑ xi 210
X= ⇒ X= = 35
n 6
∑ yi 210
Y= ⇒ Y= = 35
n 6
∑ zi 210
Z= ⇒ Z= = 35
n 6
AMPLITUDE TOTAL
AT = x (máx.) − x (mín.)
AT = 12 − 2 = 10
Quanto maior for a amplitude total dos valores menor será o grau de concentração dos
mesmos. Assim, considerando, novamente, as variáveis X, Y e Z, temos:
X: 35, 35, 35, 35, 35, 35.
Y: 32, 33, 35, 36, 37, 37.
Z: 8, 19, 21, 35, 54, 73.
39
Quando os valores estão agrupados sem intervalos de classe, a amplitude total também será
a diferença entre o maior e o menor valor observado.
AT = x (máx.) − x (mín.)
Exemplo: Calcule a amplitude total para a distribuição do número de viagens realizadas por 20
famílias no período de um ano.
AT = 3 − 0 = 3 .
AT = L(máx.) − l(mín.)
40
Exemplo: Calcule a amplitude total para a distribuição dos pesos de 40 alunos de um colégio.
AT = 70 − 46 = 24
DESVIO PADRÃO
É a raiz média quadrática dos desvios absolutos das observações em relação a média
aritmética.
O desvio padrão de um conjunto de n números x1, x2, ..., xn é representado por “s” e definido
por:
∑ (x i − X )
2
s=
n
onde:
s = desvio padrão;
x i = os valores da variável;
X = a média aritmética;
n = o número de observações.
41
2 + 8 + 3 + 6 + 11 30
Primeiramente, calcula-se a média aritmética: X = = =6
5 5
Aplicando a fórmula:
xi xi − X (x i − X )2
2 -4 16
8 2 4
3 -3 9
6 0 0
11 5 25
∑ = 54
∑ (x i − X )
2
54
s= = = 10,8 = 3,286
n 5
Se os números x1, x2, ..., xk, ocorrerem, respectivamente, f1, f2, ..., fk vezes (isto é, ocorrerem
com as freqüências f1, f2, ..., fk) o desvio padrão será definido por:
∑ f i (x i − X )
2
s=
n
Exemplo: Calcule o desvio padrão para a distribuição do número de viagens realizadas por 20
famílias no período de um ano.
X=
∑ f i x i = 36 = 1,8
n 20
∑ f i (x i − X )
2
21,2
s= = = 1,06 = 1,0296
n 20
42
∑ f i (x i − X )
2
s=
n
Exemplo: Calcule o desvio padrão para a distribuição dos pesos de 40 alunos de um colégio.
X=
∑ f i x i = 2360 = 59 kg
n 40
∑ f i (x i − X )
2
1240
s= = = 31 = 5,5678 kg
n 40
VARIÂNCIA
É a média quadrática dos desvios absolutos das observações em relação a média aritmética.
A variância de um conjunto de dados é definida como o quadrado do desvio padrão e é
representada por “s2”.
∑ (x i − X )
2
s = 2
n
onde:
s 2 = variância;
x i = os valores da variável;
X = a média aritmética;
n = o número de observações.
2 + 8 + 3 + 6 + 11 30
Primeiramente, calcula-se a média aritmética: X = = =6
5 5
Aplicando a fórmula:
xi xi − X (x i − X )2
2 -4 16
8 2 4
3 -3 9
6 0 0
11 5 25
∑ = 54
∑ (x i − X )
2
54
s =
2
= = 10,8
n 5
Se os números x1, x2, ..., xk, ocorrerem, respectivamente, f1, f2, ..., fk vezes (isto é, ocorrerem
com as freqüências f1, f2, ..., fk) a variância será definida por:
∑ f i (x i − X )
2
s =
2
n
44
Exemplo: Calcule a variância para a distribuição do número de viagens realizadas por 20 famílias
no período de um ano.
X=
∑ fi x i = 36 = 1,8
n 20
∑ f i (x i − X )
2
21,2
s =
2
= = 1,06
n 20
∑ f i (x i − X )
2
s2 =
n
X=
∑ fi x i = 2360 = 59 kg
n 40
∑ f i (x i − X )
2
1240
s2 = = = 31 kg 2
n 40
45
Obs.: Sendo a variância uma medida que expressa um desvio quadrático médio, ela pode causar
alguns problemas de interpretação. Para evitar isto, costuma-se usar o desvio padrão que é uma
medida de variabilidade expressa na mesma unidade dos valores do conjunto de dados.
s
CV =
X
Esta medida serve para caracterizar a dispersão dos dados em termos relativos a seu valor
médio.
X = 59 kg e s = 5,5678 kg
s 5,5678
CV = = = 0,094 = 9,4%
X 59
X s
Peso 65 kg 7 kg
Altura 168 cm 12 cm
7
CVPeso = = 0,108 = 10,8%
65
12
CVAltura = = 0,071 = 7,1%
168
Observa-se que nesse grupo os pesos apresentam um maior grau de dispersão que as alturas.
46
Exercícios:
Para cada um dos conjuntos vistos no exercício da unidade 6, abaixo relacionados, calcule:
a) a amplitude total;
b) a variância;
c) o desvio padrão;
d) o coeficiente de variação.
Conjunto a)
19; 17; 15; 15; 14; 16.
Conjunto b)
Xi fi
62 1
63 4
64 3
65 2
Total 10
Conjunto c)
Classes fi
46,7 ├ 51,7 5
51,7 ├ 56,7 1
56,7 ├ 61,7 9
61,7 ├ 66,7 3
66,7 ├ 71,7 2
Total 20
47
7 2 1 6 5 9 8 3 0 0 0 4 8 5 1 5 9 1 1 5 5 1 4 2 5 0 5 3 8 9 2 2 3 9 3 0 4 2 2 6 2 6 9
2 5 0 4 3 5 4 5 3 8 1 7 5 6 0 4 6 5 5 2 8 4 8 5 2 3 7 9 3 4 5 9 8 3 5 6 3 9 4 3 0 7 5
7 2 0 4 3 7 7 4 9 1 6 0 0 1 7 5 8 2 8 3 7 0 3 0 3 3 2 0 3 3 9 8 8 5 4 5 8 3 3 8 1 5 5
0 0 9 0 3 3 3 4 9 3 3 0 2 7 9 3 4 2 5 8 8 9 9 3 6 4 2 5 1 3 9 0 4 4 3 2 5 0 7 8 3 8 7
6 4 0 0 7 7 9 4 3 7 2 9 2 8 2 6 9 8 6 2 6 6 7 9 5 1 0 9 8 7 2 8 2 3 2 1 9 7 8 2 0 4 0
6 3 4 5 7 6 4 5 5 5 5 5 9 1 2 3 8 4 0 1 1 3 2 3 5 8 1 1 1 2 6 7 9 1 8 3 2 8 0 8 7 5 7
0 5 1 7 2 8 4 2 7 6 6 9 1 9 0 2 2 1 3 5 7 3 1 1 5 2 0 4 6 0 9 7 4 5 3 3 9 2 2 3 2 6 3
9 9 2 6 6 9 6 2 2 7 2 4 8 9 4 7 8 9 9 7 5 3 9 4 4 4 0 5 2 0 2 3 1 4 9 7 2 5 0 8 6 9 7
0 6 8 5 7 6 2 9 1 9 4 2 4 1 3 9 9 9 2 6 6 0 7 6 1 5 9 6 1 4 8 8 5 8 8 6 0 0 5 0 8 1 3
7 5 2 9 4 6 1 8 3 1 4 4 3 9 7 9 4 7 4 5 7 0 7 7 7 6 5 0 0 4 0 9 2 1 5 7 6 6 8 7 6 9 1
0 6 4 3 3 0 5 5 7 1 4 8 8 7 9 4 7 0 9 9 7 0 9 7 2 2 6 2 3 8 3 1 5 4 6 4 1 5 6 2 1 0 7
5 8 9 3 1 6 2 3 1 2 4 4 2 4 4 0 8 3 7 6 8 1 5 4 5 5 1 9 8 5 0 5 8 6 4 8 4 2 7 7 6 6 4
1 0 8 1 6 5 5 5 9 0 7 8 9 0 6 1 5 8 7 7 4 1 0 5 8 4 2 9 9 5 9 9 0 3 0 2 2 2 0 4 2 6 6
7 0 8 6 2 4 6 0 4 4 4 1 2 6 5 3 4 2 5 7 5 1 8 8 6 4 5 1 3 5 0 6 2 1 6 3 4 5 4 9 3 5 3
8 1 6 0 7 8 9 8 6 8 4 3 7 6 7 6 5 6 5 8 0 8 9 8 6 4 4 0 9 1 3 7 3 2 6 0 6 4 5 4 8 8 9
4 4 0 3 7 7 0 8 7 7 3 4 1 5 8 4 5 2 0 7 8 0 9 1 4 1 9 8 6 0 6 8 1 2 9 4 1 4 0 1 7 7 2
6 0 0 0 7 2 9 2 5 5 2 3 3 1 9 8 1 0 6 9 5 7 2 4 6 9 5 0 9 1 9 5 3 2 1 2 7 8 1 8 8 4 8
4 3 6 1 0 0 2 6 8 9 3 6 2 4 1 2 2 1 3 1 2 7 0 0 2 2 0 4 9 1 8 4 4 8 4 4 2 7 9 9 7 0 8
6 0 4 6 1 5 5 4 3 4 7 9 1 7 3 4 9 8 0 2 3 1 7 0 9 7 5 1 7 6 0 7 6 2 8 7 4 4 2 0 1 8 6
8 7 5 9 5 0 3 2 6 5 2 7 1 4 9 9 6 6 7 8 1 7 1 5 1 2 6 0 9 5 6 6 9 9 7 4 9 3 8 8 4 2 7
8 6 5 2 7 1 5 7 8 4 6 9 6 8 0 0 5 8 0 7 1 3 0 5 6 1 7 5 5 8 7 0 4 0 1 1 8 3 7 1 2 0 8
8 3 0 9 8 9 5 9 5 1 2 2 5 0 1 1 3 8 7 8 8 7 7 0 0 9 4 5 7 8 4 4 7 6 5 2 9 4 0 9 2 8 2
5 4 3 2 3 5 4 5 2 3 2 5 3 9 9 0 8 9 2 6 5 0 2 3 6 2 4 0 1 1 1 9 0 8 6 4 8 8 0 5 0 3 6
3 4 4 7 9 6 4 3 9 2 5 4 7 3 7 5 7 5 0 8 4 2 0 3 3 0 1 3 5 2 0 6 2 8 8 8 3 5 8 0 4 6 4
1 5 2 2 0 6 1 2 1 8 7 7 9 5 9 9 9 2 1 1 0 0 3 1 4 2 4 6 1 5 4 8 6 5 4 4 3 4 9 6 4 6 5
3 7 0 0 2 0 3 2 3 1 6 2 9 0 1 8 8 1 2 5 3 8 7 5 7 8 1 5 7 5 2 5 8 7 6 0 8 4 1 9 5 7 9
6 6 4 8 6 5 5 9 0 6 1 0 2 7 1 4 6 1 0 8 9 1 8 4 0 2 8 2 8 7 0 9 8 3 0 2 7 9 1 6 1 0 3
3 9 8 0 1 2 9 4 1 9 7 5 9 7 8 4 3 1 2 1 9 0 4 4 4 8 1 4 7 1 8 2 8 0 9 6 8 8 7 5 5 7 1
5 4 6 1 4 6 1 7 4 0 3 5 7 8 3 1 1 4 9 5 8 2 8 7 4 8 7 3 3 3 0 0 4 3 3 5 6 0 1 4 0 1 1
6 8 5 9 5 8 0 9 1 2 5 9 9 7 8 4 8 7 1 0 4 9 1 5 5 8 5 3 9 6 2 8 5 9 4 2 9 4 3 1 1 0 7
2 3 9 4 2 9 6 0 5 6 6 0 1 0 1 8 5 8 6 5 7 5 8 1 4 7 3 3 2 6 3 8 7 8 6 4 0 7 9 7 3 1 8
3 0 3 9 0 6 3 4 6 1 2 1 1 0 1 5 8 5 6 1 3 5 9 8 1 9 3 0 5 4 5 2 9 9 6 9 9 0 8 3 5 1 3
5 5 2 0 7 1 5 5 8 4 7 9 1 2 1 2 0 3 6 5 0 0 7 9 0 7 9 2 1 7 8 7 1 4 0 7 9 7 4 1 5 6 5
8 5 5 3 0 8 4 5 1 0 3 8 7 3 4 8 7 5 6 4 0 3 7 2 8 1 2 1 6 0 8 3 1 6 7 2 0 2 6 1 5 3 3
7 9 0 4 2 8 2 4 2 7 0 8 6 8 8 3 4 4 4 2 4 6 8 9 1 4 9 7 4 7 5 9 5 8 1 4 5 9 6 8 6 8 4
3 9 2 0 4 7 1 6 6 9 9 7 8 1 9 7 1 6 0 8 3 7 2 7 2 6 6 4 0 8 4 0 4 1 9 4 0 8 7 3 5 9 2
5 5 9 4 0 4 9 6 7 6 3 9 6 4 4 0 7 4 9 0 3 1 6 3 8 6 0 3 9 3 3 6 4 0 8 9 2 4 0 3 6 8 8
3 2 8 1 8 8 2 1 9 5 7 7 5 1 0 0 4 0 7 8 3 7 3 5 9 2 1 0 0 6 4 2 3 3 0 9 5 4 2 0 8 8 7
2 8 6 7 4 7 2 1 2 2 0 9 1 8 2 7 7 5 1 3 3 1 9 6 3 4 9 5 7 8 5 9 9 8 5 7 1 2 1 9 4 9 7
9 6 8 8 8 0 6 2 9 9 5 8 3 9 3 7 6 4 4 0 2 5 6 5 2 6 7 7 2 3 7 0 9 3 9 2 8 1 1 8 9 4 5
5 4 8 6 6 0 8 6 4 7 1 4 0 1 7 4 2 4 5 0 8 9 9 8 5 1 5 5 2 0 1 2 4 4 5 2 7 5 4 5 6 3 7