Escolar Documentos
Profissional Documentos
Cultura Documentos
BÁSICA
(Prof. Carlos Eduardo Rocha dos Santos)
Curso 40 horas
SUMARIO
2. Distribuição de Freqüência.................................................................................................09
2
CAPÍTULO 1 – INTRODUÇÃO A ESTATISTICA
1. Objeto da Estatística
Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar,
resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como
média ou desvio padrão.
A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas
vezes incompletos, na medida em que nos dão informação útil sobre o problema em estudo,
sendo assim, é objetivo da Estatística extrair informação dos dados para obter uma melhor
compreensão das situações que representam.
Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser
utilizados mesmo antes de se recolher à amostra, isto é, deve-se planejar a experiência que
nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o máximo
de informação relevante para o problema em estudo, ou seja, para a população de onde os
dados provêm.
Quando de posse dos dados, procura-se agrupa-los e reduzi-los, sob forma de amostra,
deixando de lado a aleatoriedade presente.
2. Ferramentas Estatísticas
Segundo JURAN:
1. É a ciência da tomada de decisão perante incertezas;
2. Coleta, análise e interpretação de dados;
3. É um “kit” de ferramentas que ajuda a resolver problemas;
4. Base para a maior parte das decisões tomadas quanto ao controle da qualidade, assim
como em quase todas as outras áreas da atividade humana moderna.
Vista dessa forma, a Estatística não deve ser confundida como uma disciplina isolada, e sim,
compreendida como uma ferramenta ou um conjunto de ferramentas, disponível para a
solução de problemas em diversas áreas do conhecimento.
3
2.2 Definições Básicas da Estatística
As ferramentas devem ser utilizadas de maneira eficiente para alcançar o sucesso. Para tanto,
o processo deve incluir:
1. planejamento cuidadoso da coleta de dados;
2. análise de dados para tirar conclusões estatísticas e
3. transição para a resposta ao problema técnico original.
4
Segundo JURAN, alguns passos-chave são:
1. Coletar informações anteriores suficientes para traduzir o problema de engenharia em
problema específico que possa ser avaliado por métodos estatísticos;
2. Planejar a coleta de dados:
a. Determinar o tipo de dados necessários – quantitativos (mais custo, mais útil) e
qualitativos;
b. Determinar se quaisquer dados prévios estão disponíveis e são aplicáveis ao presente
problema;
c. Se o problema exigir uma avaliação de várias decisões alternativas, obter informações
sobre as conseqüências econômicas de uma decisão errada.
d. Se o problema exigir a estimação de um parâmetro, definir a precisão necessária para a
estimativa;
e. Determinar se o erro de medição é grande o suficiente para influenciar o tamanho
calculado da amostra ou o método da análise de dados;
f. Definir as suposições necessárias para calcular o tamanho da amostra exigido;
g. Calcular o tamanho da amostra necessário considerando a precisão desejada do resultado,
erro amostral, variabilidade dos dados, erros de medição e outros fatores;
h. Definir quaisquer requisitos para preservar a ordem das medições quando o tempo for um
parâmetro chave;
i.Determinar quaisquer requisitos para coletar dados em grupos definidos – diferentes
condições a serem avaliadas;
j. Definir o método de análise de dados e quaisquer hipóteses necessárias;
k.Definir os requisitos para quaisquer programas de computador que venham a ser
necessários.
3. Coletar dados:
a. Usar métodos para assegurar que a amostra é selecionada de forma aleatória;
b. Registrar os dados e também as condições presentes no momento de cada observação;
c. Examinar os dados amostrais para assegurar que o processo mostra estabilidade suficiente
para se fazer previsões válidas para o futuro.
4. Analisar os dados:
a. Selecionar os dados;
b. Avaliar as hipóteses previamente estabelecidas. Se necessário, tomar atitudes corretivas
(novas observações);
c. Aplicar técnicas estatísticas para avaliar o problema original;
d. Determinar se dados e análises adicionais são necessários;
e. Realizar “análises de sensibilidade” variando estimativas amostrais importantes e outros
fatores na análise e observando o efeito sobre as conclusões finais.
5. Rever as conclusões da análise de dados para determinar se o problema técnico original
foi avaliado ou se foi modificado para se enquadrar nos métodos estatísticos.
6. Apresentar os resultados:
a. Estabelecer as conclusões de forma significativa, enfatizando os resultados nos termos do
problema original, e não na forma dos índices estatísticos usados na análise;
b. Apresentar graficamente os resultados quando apropriado. Usar métodos estatísticos
simples no corpo do relatório e colocar as análises complexas em um apêndice.
7. Determinar se as conclusões do problema específico são aplicáveis a outros
problemas ou se os dados e cálculos poderiam ser úteis para outros problemas.
5
3. ESTATÍSTICA DESCRITIVA
Viu-se anteriormente um roteiro para coleta e análise de dados. As séries de dados,
basicamente, são provenientes de duas fontes: os “dados históricos” e os “dados de
experimentos planejados”.
4. SÉRIES ESTATÍSTICAS
De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar:
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que
nestes documentos as tabelas não serão abertas devido a limitações do editor html".
6
É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em
função da época, do local ou da espécie.
Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou
descontínua. Podem ser do tipo temporal, geográfica ou específica.
JAN/2002 20
FEV/2002 10
TOTAL 30
* Em mil unidades
.b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato
(espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização.
São Paulo 13
Rio de Janeiro 17
TOTAL 30
* Em mil unidades
7
Vendas no 1º bimestre de 2002
FIAT 18
GM 12
TOTAL 30
* Em mil unidades
* Em mil unidades
8
Quando da análise de dados, é comum procurar conferir certa ordem aos números tornando-
os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou
categorias, verificando-se o número de indivíduos pertencentes a cada classe.
É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições
de seus valores).
Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram
numericamente organizados. É difícil formarmos uma idéia exata do comportamento do
grupo como um todo, a partir de dados não ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Tabela 1
Dados Frequência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
Tabela 2
Classes Frequências
9
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes
iguais. Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja, x3=(Li+Ls)/2.
10
7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,3 8,4
8,5 8,5 8,6 8,7 8,8 8,8 8,9 9 9,1 9,2
9,4 9,4 9,5 9,5 9,6 9,8 9,9 10 10,2 10,2
10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9
6º Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe
(inferior e superior), onde limite Inferior será 5,1 e o limite superior será 15 + 1,23.
Obs: Agrupar os dados em classes é uma importante ferramenta para resumir grandes massas
de dados brutos, no entanto acarreta perda de alguns detalhes.
Frequências simples ou absolutas (fi): são os valores que realmente representam o número
de dados de cada classe. A soma das frequências simples é igual ao número total dos dados
da distribuição.
11
Frequências relativas (fr): são os valores das razões entre as frequências absolutas de cada
classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100
%).
Frequência simples acumulada de uma classe (Fi): é o total das frequências de todos os
valores inferiores ao limite superior do intervalo de uma determida classe.
Há várias medidas de tendência central, entretanto nesta apostila, será abordado o estudo de
apenas aquelas que são mais significativas. As mais importante medidas de tendência central
são: a média aritmética, média aritmética para dados agrupados, média aritmética ponderada,
mediana, moda.
12
3. Medidas de Centralidade
Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua
utilização, pois pode dar uma imagem distorcida dos dados.
A média tem uma outra característica, que torna a sua utilização vantajosa em certas
aplicações: Quando o que se pretende representar é a quantidade total expressa pelos dados,
utiliza-se a média.
É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.
Seja X uma variável que assume os valores x1, x2, x3 ,..., xn. A média aritmética
simples de X, representada por x, é definida por:
x1 + x2 + x3 + ... + xn ∑ xi
x = ------------------------------- ou x = -------
n n
Exemplo: A produção leiteira diária da vaca B, durante uma semana, foi de 10, 15, 14, 13, 16, 19, e
18 litros. Determinar a produção média da semana (a média aritmética).
∑xi 10 + 15 + 14 + 13 + 16 + 19 + 18
x = --------- x = ---------------------------------------------- = 15 litros
n 7
13
∑ xi . ƒi
x = ------------ , onde: xi : valores observados da variável ou ponto médio das classes
n ƒi: freqüência simples absoluta
∑ƒi = n : número de elementos da amostra observada
A fórmula acima será usada para as distribuições de freqüências sem classes e com classes.
Média aritmética para dados agrupados sem classes (Média aritmética ponderada)
∑ xi . ƒi
x = ------------ = ---------- → x =
n
14
Dados agrupados:
Nº de erros frequência = fi
0 2
1 6
2 10
3 12
4 4
total 34
Como as frequências são números indicadores da intensidade de cada valor da variável, elas
funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética
ponderada, dada pela fórmula:
15
Nº de molas frequência = fi ponto médio = xi ..xi.fi.
50 |---- 54 4 52 208
54 |---- 58 9 56 504
58 |---- 62 11 60 660
62 |---- 66 8 64 512
66 |---- 70 5 68 340
70 |---- 74 3 72 216
Total 40 2.440
1ª propriedade
A soma algébrica dos desvios em relação à média é zero (nula).
∑ di = ∑ (xi - x ) = 0
onde: di são as distâncias ou afastamentos da média.
Em uma distribuição simétrica será igual a zero e tenderá a zero se a distribuição for assimétrica.
Idades ( xi ) di = xi - x
2 d1 = 2 – 6 = -4
4 d2 = 4 – 6 = -2
6 d3 = 6 – 6 = 0
8 d4 = 8 – 6 = +2
10 d5 = 10 – 6 = +4
∑ 0
2 + 4 + 6 + 8 + 10
x = ------------------------------- = 6
5
2ª propriedade
Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma variável,
a média do conjunto fica aumentada ou diminuída dessa constante.
Idades ( xi ) xi + 2
16
2 2+2= 4
4 4+2= 6
6 6+2= 8
8 8 + 2 = 10
10 10 + 2 = 12
∑ 40
3ª propriedade
Multiplicando-se ou dividindo-se todos os valores de uma variável por uma
constante (c), a média do conjunto fica multiplicada ou dividida por essa constante:
Idades ( xi ) xi x 2
2 2x2= 4
4 4x2= 8
6 6 x 2 = 12
8 8 x 2 = 16
10 10 x 2 = 20
∑ 60
4ª propriedade
x1 = 10 n1 = 15
x2 = 18 n2 = 23
(10 . 15 ) + (18 . 23 )
xG = -------------------------------- = 14,84
15 + 23
5ª propriedade
17
4 d2 = 4 – 6 = -2 (– 2)2 = 4
6 d3 = 6 – 6 = 0 ( 0)2 = 0
8 d4 = 8 – 6 = +2 ( +2)2 = 4
10 d5 = 10 – 6 = +4 ( +4)2 = 16
∑ 0 40
De modo que: ∑ (xi – x)2 = 40 sendo este valor o menor possível. Isso significa que, se tomássemos
outro valor que não a média (x), o resultado dessa operação seria maior que o obtido.
6ª propriedade
A média aritmética é atraída pelos valores extremos.
MÉDIA GEOMÉTRICA = g
É a raiz n-ésima do produto de todos eles.
ou ..
Ex - Calcular a média geométrica dos valores da tabela abaixo:
...xi... ...fi...
1 2
3 4
9 2
27 1
Total 9
= (12 * 34 * 92 * 271) (1/9)........R: 3,8296
MÉDIA HARMÔNICA - h
18
É o inverso da média aritmética dos inversos.
.
Média Harmônica Simples:. (para dados não agrupados)
.. ou
.
Média Harmônica Ponderada : (para dados agrupados em tabelas de freqüências)
OBS: A média harmônica não aceita valores iguais a zero como dados de uma
série.
g = ( .+ h ) /.2
• Demonstraremos a relação acima com os seguintes dados:
19
Também chamada de norma, valor dominante ou valor típico. É o valor que ocorre com maior
freqüência em uma série de valores.
Mo é o símbolo da moda.
Desse modo, a força modal de remoção para um conector é a força mais comum, isto é, a
força de remoção medida em um teste de laboratório para um conector.
• Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.
• .Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então,
que a série tem dois ou mais valores modais.
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o
valor da variável de maior frequência.
Temperaturas Frequência
0º C 3
1º C 9
2º C 12
3º C 6
20
A classe que apresenta a maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre
os limites da classe modal. O método mais simples para o cálculo da moda consiste em
tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta.
Mo = ( Li+ Ls) / 2
onde Li = limite inferior da classe modal e Ls= limite superior da classe modal.
Resp: a classe modal é 58|--- 62, pois é a de maior frequência. Li=58 e Ls=62
Exemplo:
21
Tabela 5.7 – Taxas municipais de 1º) Identifica-se a classe (a de maior freqüência):
urbanização (em %) – Alagoas, 1970. Na Tabela é a 1ª classe: 6 --- 16
Número de
Taxas (em %) Municípios 2º passo: Aplica-se a fórmula:
( fi ) li + ls
6 --- 16 29 1º processo: Moda bruta: Mo = --------
16 --- 26 24 2
26 --- 36 16 sendo,
36 --- 46 13 li: limite inferior da classe modal = 6
46 --- 56 4 ls: limite superior da classe modal = 16
56 --- 66 3
66 --- 76 2 6 + 16
76 --- 86 2 Mo = ----------- = 11%
86 --- 96 1 2
Total (∑) 94
D1
2º processo: Fórmula de Czuber: Mo = LMo + -------------- x h
(método mais elaborado) D1 + D2
sendo:
LMo : limite inferior da classe
h: intervalo da classe modal
D1 : freqüência simples da classe modal − freqüência simples anterior à da classe modal
D2 : freqüência simples da classe modal − freqüência simples posterior à da classe modal
Obs: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de
posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a
média aritmética é a medida de posição que possui a maior estabilidade.
MEDIANA
22
A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou
decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos
de mesmo número de elementos.
Símbolo da mediana: Md
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.
1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a
mediana.
1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
Notas:
23
• Quando o número de elementos da série estatística for ímpar, haverá coincidência da
mediana com um dos elementos da série.
• Quando o número de elementos da série estatística for par, nunca haverá coincidência
da mediana com um dos elementos da série. A mediana será sempre a média
aritmética dos 2 elementos centrais da série.
• Em um série a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
• A mediana, depende da posição e não dos valores dos elementos na série ordenada.
Essa é uma da diferenças marcantes entre mediana e média (que se deixa
influenciar, e muito, pelos valores extremos). Vejamos:
Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência
dos valores extremos, ao passo que a mediana permanece a mesma.
Quando o somatório das frequências for ímpar o valor mediano será o termo de ordem dado
pela fórmula :.
Como o somatório das frequências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3..
24
Quando o somatório das frequências for par o valor mediano será o termo de ordem dado
pela fórmula :.
Aplicando a fórmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 +
16) / 2 = 15,5
2º) Calculamos ;
Exemplo:
25
classes frequência = fi Frequência acumulada
50 |---- 54 4 4
54 |---- 58 9 13
58 |---- 62 11 24
62 |---- 66 8 32
66 |---- 70 5 37
70 |---- 74 3 40
Total 40 -
Emprego da Mediana
• Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.
• Quando há valores extremos que afetam de maneira acentuada a média aritmética.
26
Denominamos curtose o grau de achatamento de uma distribuição em relação a uma
distribuição padrão, denominada curva normal (curva correspondente a uma distribuição
teórica de probabilidade).
Distribuições simétricas
Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando de
dados que se distribuem em forma de sino.
Distribuições Assimétricas
Observamos que nas extremidades há uma grande concentração de dados em relação aos
concentrados na região central da distribuição.
27
1. for aproximadamente simétrica, a média aproxima-se da mediana
2. for enviesada para a direita (alguns valores grandes como "outliers"), a média tende a ser
maior que a mediana
3. for enviesada para a esquerda (alguns valores pequenos como "outliers"), a média tende a
ser inferior à mediana.
São representações visuais dos dados estatísticos que devem corresponder, mas nunca
substituir as tabelas estatísticas. Têm como características principais, o uso de escalas, a
existência de um sistema de coordenadas, a simplicidade, clareza e veracidade de sua
representação.
28
5. REPRESENTAÇÃO GRÁFICA
5.1 INTRODUÇÃO
a. Diagramas: gráficos geométricos dispostos em duas dimensões. São mais usados na representação
de séries estatísticas.
b. Cartogramas: é a representação sobre uma carta geográfica, sendo muito usado na Geografia,
História e Demografia.
a. Gráficos de informação
CARACTERÍSTICAS:
b. Gráficos de análise
Estes gráficos fornecem informações importantes na fase de análise dos dados, sendo
também informativos.
Os gráficos de análise, geralmente, vêm acompanhado de uma tabela e um texto onde se
destaca os pontos principais revelados pelo gráfico ou pela tabela.
29
5.5 PRINCIPAIS TIPOS DE GRÁFICOS
São usados para representar séries temporais, principalmente quando a série cobrir um
grande número de períodos de tempo.
2000
1500
1000
500
0
84 85 86 87 88 89 90 91 92 93 94
30
(ton.)
1991 117.579
1992 148.550
1993 175.384
1994 220.272
1995 265.626
Fonte: Secretaria Municipal de Agricultura
Para cada ano é construído uma coluna, variando a altura (proporcional a cada quantidade). As
colunas são separadas uma das outras.
Observação: O espaço entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna.
300000
250000
200000
150000
100000
50000
0
1991 1992 1993 1994 1995
Tabela 4.3
Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966
Regiões Fisiográficas Área
(Km2)
Norte 3.581.180
Nordeste 965.652
Sudeste 1.260.057
Sul 825.621
Centro-oeste 1.879.965
Brasil 8.511.965
Fonte: IBGE.
31
Grafico 4.3. Áreas (Km 2) das Regiões Fisiográficas - Brasil - 1966.
Km 2 4.000.000
3.500.000
3.000.000
2.500.000
2.000.000
1.500.000
1.000.000
500.000
0
Norte Nordeste Sudeste Sul Centro-Oeste
Obs: Na tabela as regiões são apresentadas em ordem geográficas. No gráfico as colunas são
ordenadas pela altura, da maior para a menor, da esquerda para a direita.
Norte
Centro-Oeste
Sudeste
Nordeste
Sul
0 0 0 0 0 0 0 0 0
00 00 00 00 00 00 00 00
00. 00. 00. 00. 00. 00. 00. 00. Km2
5 0 5 0 5 0 5 0
1. 1. 2. 2. 3. 3. 4.
Tabela 4.4
32
Ramos de ensino Matrículas
Filosofia, Ciências e Letras 44.802
Direito 36.363
Engenharia 26.603
Administração e Economia 24.027
Medicina 17.152
Odontologia 6.794
Agricultura 4.852
Serviço Social 3.121
Arquitetura e Urbanismo 2.774
Farmácia 2.619
Demais ramos 11.002
Total 180.109
Fonte: Fictícia
Direito
Engenharia
Administração e Econômia
Medicina
Odontologia
Agricultura
Serviço Social
Arquitetura e Urbanismo
Farmácia
Demais ramos
0 00 0 0 0 0 0 0 0 0
50 00 00 00 00 00 00 00 00
10 15 20 25 30 35 40 45
Matrículas
OBS: Quando a variável em estudo for qualitativa e os nomes das categorias for extenso ou as
séries forem geográficas ou específicas é preferível o gráfico em barras, devido a dificuldade em
se escrever a legenda em baixo da coluna.
33
Entrada de migrantes em três Estados do Brasil - 1992-1994
Número de migrantes
Anos Estados
Total
Amapá São Paulo Paraná
1992 4.526 2.291 1.626 609
1993 4.633 2.456 1.585 592
1994 4.450 2.353 1.389 708
Fonte: Fictícia
Gráfico 4.6. Entrada de m igrantes em três Estados do Brasil
1992-1994.
Quantidade
2500
2000
1500
1000
500
0
1992 1993 1994
Am apá São Paulo Paraná
34
Gráfico 4.7. Im portação Brasileira de vinho e cham panhe proveniente de várias
origens - 1994.
França
Portugal
Itália
Espanha
Chile
Argentina
Total - 360°
Parte - x°
Exemplo:
Tabela 4.7
Produção Agrícola do Estado A - 1995
Produtos Quantidade (t)
Café 400.000
Açúcar 200.000
Milho 100.000
Feijão 20.000
Total 720.000
Fonte: Fictícia
35
Gráfico 4.8. Produção Agrícola do Estado A - 1995.
Feijão
Milho
3%
14%
Café
Açucar 55%
28%
400.000
350.000
300.000
250.000
200.000
150.000
100.000
50.000
0
Café Açucar Milho Feijão
Café
Açucar
Milho
Feijão
0 0 00 00 00 00 00 00 00
. 00 .0 .0 .0 .0 .0 .0 .0 Quantidade (t)
50 0 0 0 0 0 0 0
10 15 20 25 30 35 40
36
CAPÍTULO 6 - MEDIDAS DE DISPERSÃO OU DE
VARIABILIDADE
DESVIO PADRÃO ( S )
É a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores
da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão
baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida
como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada
por S.
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a
mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as
mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio
padrão.
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior
for, maior será a dispersão dos dados.
37
Exemplo: Calcular o desvio padrão da população representada por - 4 , -3 , -2 , 3 , 5
Xi
-4 - 0,2 - 3,8 14,44
-3 - 0,2 - 2,8 7,84
-2 - 0,2 - 1,8 3,24
3 - 0,2 3,2 10,24
5 - 0,2 5,2 27,04
Total - - 62,8
ou
Xi f i Xi . f i .fi
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 - - - 32,70
Se considerarmos os dados como sendo de uma amostra o desvio padrão seria a raiz
quadrada de 32,7 / (30 -1) = 1,062
38
Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizada é a
mesma do exemplo anterior.
VARIÂNCIA ( S2 )
Define-se a variância, como sendo a medida que se obtém somando os quadrados dos
desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de
observações da amostra menos um.
S2 =
A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é
extremamente importante na inferência estatística e em combinações de amostras.
Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio
padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor
médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua
dispersão ou variabilidade, quando expressas em unidades diferentes.
39
Exemplo 1:
Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor
será o de maior homogeneidade (menor dispersão ou variabilidade).
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os
pesos.
Exemplo 2:
O risco de uma ação de uma empresa pode ser devidamente avaliado através da variabilidade
dos retornos esperados. Portanto, a comparação das distribuições probabilísticas dos
retornos, relativas a cada ação individual, possibilita a quem toma decisões perceber os
diferentes graus de risco. Analise, abaixo, os dados estatísticos relativos aos retornos de 5
ações e diga qual é a menos arriscada?
40
Exercícios
1. Identifique os tipos de escalas utilizadas para cada uma das seguintes características das
unidades de observação, retiradas de uma tabela do Guia do Usuário do aplicativo Microsoft
Excel: mês, tipo de produto, vendedor, região do país, unidades vendidas e total de vendas.
2. É possível encontrar a seguinte série de desvios tomados em relação a média aritmética: 4,
-3, 2, -7 e 5? Justifique.
3. Dados dois grupos de pessoas, o grupo A com 10 elementos e o grupo B com 40
elementos. Se o peso médio do grupo A for de 80 kg e o do grupo B for de 70 kg então é
verdade que o peso médio dos dois grupos considerados em conjunto é de 75 kg? Justifique.
4. Um concurso realizado simultaneamente nos locais A, B e C, apresentou as médias: 70, 65
e 45, obtidos por 30, 40 e 30 candidatos, nessa ordem. Qual foi a média geral do concurso?
5. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma
média de 70 pontos em determinada prova. Sabendo-se que a média geral dos candidatos
(independente de sexo) foi de 64 pontos, qual foi a média dos candidatos do sexo feminino?
6. Determinar a moda dos seguintes conjuntos:
(6.1) 1, 6, 9, 3, 2, 7, 4 e 11
(6.2) 6, 5, 5, 7, 5, 6, 5, 6, 3, 4 e 5
(6.3) 8, 4, 4, 4, 4, 6, 9, 10, 10, 15, 10, 16 e 10
(6.4) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28 e 18
7. Determinar a mediana dos seguintes conjuntos:
(7.1) 9 14 2 8 7 14 3 21 1
(7.2) 0,02 0,25 0,47 0,01 -0,30 -0.5
(7.3) 1/2 3/4 4/7 5/4 -2/3 -4/5 -1/5 3/8
8. Para os conjuntos abaixo, determinar com aproximação centesimal, as seguintes medidas:
(a) A amplitude (b) O desvio médio (c) A variância (d) O desvio padrão
(e) O coeficiente de variação.
(8.1) 0,04 0,18 0,45 1,29 2.35
(8.2) -7/4 -1/3 3/5 7/20 1 4/3
9. Dados os seguintes conjuntos de valores:
(a) 1 3 7 9 10 (b) 20 60 140 180 200 (c) 10 50 130 170 190.
Calculando a média e o desvio padrão do conjunto em (a), determinar, através das
propriedades, a média e o desvio padrão dos conjuntos em (b) e (c).
10. Quarenta alunos da PUC foram questionados quanto ao número de livros lidos no ano
anterior.
Foram registrados os seguintes valores:
4 2 1 0 3 1 2 0 2 1
0 2 1 1 0 4 3 2 3 5
8 0 1 6 5 3 2 1 6 4
3 4 3 2 1 0 2 1 0 3
(10.1) Organize os dados em uma tabela adequada.
(10.2) Qual o percentual de alunos que leram menos do que 3 livros.
(10.3) Qual o percentual de alunos que leram 4 ou mais livros.
(10.4) Classifique a variável e o tipo de distribuição utilizada.
41
(11.1) Agrupe os dados em uma distribuição de freqüências, considerando o limite inferior
igual a
zero, o superior igual a 10 e utilizando cinco classes de mesma amplitude.
(11.2) Construa um histograma de freqüências relativas.
12. Um livro com 50 páginas apresentou um número de erros de impressão por página
conforme
tabela:
(12.1) Qual o número médio de erros por página?
(12.2) Qual o número mediano de erros por página?
(12.3) Qual o número modal de erros por página?
(12.4) Qual o desvio padrão do número de erros por página?
Aluguéis Zona Urbana Zona Rural
1 |----- 3 10 30
3 |----- 5 40 50
5 |----- 7 80 15
7 |----- 9 50 05
9 |----- 11 20 00
∑ 200 100
13.Um livro com 50 páginas apresentou um número de erros de impressão por página
conforme
tabela:
(13.1) Qual o número médio de erros por página?
(13.2) Qual o número mediano de erros por página?
(13.3) Qual o número modal de erros por página?
(13.4) Qual o desvio padrão do número de erros por página?
14. Durante certo período de tempo o rendimento de 10 ações foram os que a tabela registra.
(14.1) Calcule o rendimento médio.
(14.2) Calcule o rendimento mediano. Ação Taxa (%)
(14.3) Calcule o rendimento modal. 1 2,59
(14.4) Calcule o desvio padrão do rendimento. 2 2,64
(14.5) Calcule o coeficiente de variação do rendimento. 3 2,60
4 2,62
5 2,57
6 2,55
7 2,61
8 2,50
9 2,63
10 2,64
42
15. Uma região metropolitana tem 50 quarteirões com os seguintes números de casas por
quarteirão:
2 2 3 10 13 14 15 15 16 16
18 18 20 21 22 22 23 23 25 25
26 27 29 29 30 32 36 42 44 45
45 46 48 52 58 59 61 61 61 65
66 66 68 75 78 80 89 90 92 97
(15.1) Construa, com os dados, uma distribuição de freqüências por intervalos fazendo com
que as classes tenham amplitudes iguais a 14.
(15.2) Calcule o número médio de casas por quarteirão.
(15.3) Determine o número mediano de casas por quarteirão.
(15.4) Calcule a variância do número de casas por quarteirão.
(15.5) Calcule, pelos dois processos, o número modal de casas por quarteirão.
16. De um levantamento feito entre 100 famílias resultou a tabela ao lado. Determine:
(16.1) O número médio de filhos.
(16.2) O número mediano de filhos. Número de filhos Número de famílias
(16.3) O número modal de filhos. 0 18
(16.4) O desvio padrão do número de filhos. 1 23
2 28
3 21
4 7
5 3
Total 100
18. Uma variável x tem média igual a 10 e variância igual a 16. Calcule a média e a
variância da variável dada por y = (3x + 5) / 2
19. Os operários de um setor industrial têm, em uma época 1, um salário médio de 5 salários
mínimos (sm) e desvio padrão de 2 sm. Um acordo coletivo prevê, para uma época 2, um
aumento linear de 60%, mais uma parte fixa correspondente a 70% de um salário mínimo.
Calcule a média e o desvio padrão dos salários na época 2.
20. O que se pode dizer se fosse dada a informação de que o salário mediano de um conjunto
de profissionais é de 6 sm?
21. Um a comunidade A tem 100 motoristas profissionais cujo salário médio é de 5 sm. A
comunidade B, com 300 desses profissionais, remunera-os com uma média de 4 sm.
(21.1) É correto afirmar que A remunera melhor seus motoristas profissionais que B?
43
(21.2) Diante das informações disponíveis há garantia que os 100 salários individuais de A
são maiores que os 300 de B? Por que?
22. O departamento de pessoal de um certa firma fez um levantamento dos salários dos 120
funcionários do setor administrativo, obtendo os resultados da tabela:
(22.1) Determine o salário médio dos funcionários
(22.2) Determinar a variância e o desvio padrão dos salários.
(22.3) Determinar o salário mediano.
(22.4) Determinar o salário modal pêlos critérios de King e Czuber.
(22.5) Se for dado um aumento de 20% para todos os funcionários, qual será o novo salário
médio e o novo desvio padrão dos salários?
(22.6) Se for dado um abono de 0,5 s.m. a todos os funcionários como fica a média e o
desvio padrão dos salários?
23. O que acontece com a média e o desvio padrão de um conjunto de dados quando:
(23.1) Cada valor é multiplicado por 2.
(23.2) Soma-se o valor 10 a cada valor.
(23.3) Subtrai-se a média de cada valor.
(23.4) De cada valor subtrai-se a média e em seguida divide-se pelo desvio padrão.
24. A média aritmética entre dois valores é igual a 5 e a média geométrica igual a 4. Qual a
média harmônica entre estes dois valores?
44