Você está na página 1de 44

ESTATÍSTICA

BÁSICA
(Prof. Carlos Eduardo Rocha dos Santos)
Curso 40 horas
SUMARIO

1. Introdução Geral à Compreensão Estatística......................................................................03

2. Distribuição de Freqüência.................................................................................................09

3. Medidas de Centralidade ou de Tendência Central............................................................13

4. Medidas de Assimetria e Curtose.......................................................................................28

5. Principais Tipos de Representação Gráfica........................................................................30

6. Medidas de Dispersão ou de Variabilidade........................................................................38

2
CAPÍTULO 1 – INTRODUÇÃO A ESTATISTICA
1. Objeto da Estatística

Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar,
resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como
média ou desvio padrão.

A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas
vezes incompletos, na medida em que nos dão informação útil sobre o problema em estudo,
sendo assim, é objetivo da Estatística extrair informação dos dados para obter uma melhor
compreensão das situações que representam.

Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser
utilizados mesmo antes de se recolher à amostra, isto é, deve-se planejar a experiência que
nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o máximo
de informação relevante para o problema em estudo, ou seja, para a população de onde os
dados provêm.

Quando de posse dos dados, procura-se agrupa-los e reduzi-los, sob forma de amostra,
deixando de lado a aleatoriedade presente.

Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou


testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as quais realçam toda a
potencialidade da Estatística, na medida em que vão permitir tirar conclusões acerca de uma
população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro
cometido.

2. Ferramentas Estatísticas

2.1 - O que é Estatística?

Segundo JURAN:
1. É a ciência da tomada de decisão perante incertezas;
2. Coleta, análise e interpretação de dados;
3. É um “kit” de ferramentas que ajuda a resolver problemas;
4. Base para a maior parte das decisões tomadas quanto ao controle da qualidade, assim
como em quase todas as outras áreas da atividade humana moderna.

Vista dessa forma, a Estatística não deve ser confundida como uma disciplina isolada, e sim,
compreendida como uma ferramenta ou um conjunto de ferramentas, disponível para a
solução de problemas em diversas áreas do conhecimento.

Segundo FEIGENBAUM: “Precisão significativamente aumentada em produção de itens e


produtos tem sido acompanhada pela necessidade de métodos aperfeiçoados para medição,
especificação e registro dela. A estatística, denominada ciência das medições, representa uma
das técnicas mais valiosas utilizadas nas quatro tarefas, e isso tem ficado cada vez mais
evidente”.

3
2.2 Definições Básicas da Estatística

1) FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo


seja possível da aplicação do método estatístico. São divididos em três grupos:
Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples
observação. A estatística dedica-se ao estudo desses fenômenos.

Fenômenos individuais: são aqueles que irão compor os fenômenos de massa.


Fenômenos de multidão: quando as características observadas para a massa não se
verificam para o particular.

2) DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-prima sobre a


qual iremos aplicar os métodos estatísticos.
3) POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, uma
característica comum.
4) AMOSTRA: é uma parcela representativa da população que é examinada com o
propósito de tirarmos conclusões sobre a essa população.
5) PARÂMETROS: São valores singulares que existem na população e que servem para
caracterizá-la.Para definirmos um parâmetro devemos examinar toda a população.
6) ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da
amostra.
7) ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o
levantamento e os estudos necessários ao tratamento desses dados são designados
genericamente de estatística de atributo.
8) VARIÁVEL: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Variável Qualitativa: Quando seus valores são expressos por atributos


Variável Quantitativa: Quando os dados são de caráter nitidamente quantitativo, e o
conjunto dos resultados possui uma estrutura numérica, trata-se, portanto da estatística de
variável e se dividem em:
Variável Discreta ou Descontínua: Seus valores são expressos geralmente através de
números inteiros não negativos. Resulta normalmente de contagens. Ex: Nº de alunos
presentes às aulas de introdução à estatística econômica no 1º semestre de 1997: mar = 18,
abr = 30 , mai = 35 , jun = 36.
Variável Contínua: Resulta normalmente de uma mensuração, e a escala numérica de seus
possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir,
teoricamente, qualquer valor entre dois limites. Ex.: Quando você vai medir a temperatura de
seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio,
ao dilatar-se, passará por todas as temperaturas intermediárias até chegar na temperatura
atual do seu corpo.

2.3 Planejamento para Coleta e Análise de Dados

As ferramentas devem ser utilizadas de maneira eficiente para alcançar o sucesso. Para tanto,
o processo deve incluir:
1. planejamento cuidadoso da coleta de dados;
2. análise de dados para tirar conclusões estatísticas e
3. transição para a resposta ao problema técnico original.

4
Segundo JURAN, alguns passos-chave são:
1. Coletar informações anteriores suficientes para traduzir o problema de engenharia em
problema específico que possa ser avaliado por métodos estatísticos;
2. Planejar a coleta de dados:
a. Determinar o tipo de dados necessários – quantitativos (mais custo, mais útil) e
qualitativos;
b. Determinar se quaisquer dados prévios estão disponíveis e são aplicáveis ao presente
problema;
c. Se o problema exigir uma avaliação de várias decisões alternativas, obter informações
sobre as conseqüências econômicas de uma decisão errada.
d. Se o problema exigir a estimação de um parâmetro, definir a precisão necessária para a
estimativa;
e. Determinar se o erro de medição é grande o suficiente para influenciar o tamanho
calculado da amostra ou o método da análise de dados;
f. Definir as suposições necessárias para calcular o tamanho da amostra exigido;
g. Calcular o tamanho da amostra necessário considerando a precisão desejada do resultado,
erro amostral, variabilidade dos dados, erros de medição e outros fatores;
h. Definir quaisquer requisitos para preservar a ordem das medições quando o tempo for um
parâmetro chave;
i.Determinar quaisquer requisitos para coletar dados em grupos definidos – diferentes
condições a serem avaliadas;
j. Definir o método de análise de dados e quaisquer hipóteses necessárias;
k.Definir os requisitos para quaisquer programas de computador que venham a ser
necessários.
3. Coletar dados:
a. Usar métodos para assegurar que a amostra é selecionada de forma aleatória;
b. Registrar os dados e também as condições presentes no momento de cada observação;
c. Examinar os dados amostrais para assegurar que o processo mostra estabilidade suficiente
para se fazer previsões válidas para o futuro.
4. Analisar os dados:
a. Selecionar os dados;
b. Avaliar as hipóteses previamente estabelecidas. Se necessário, tomar atitudes corretivas
(novas observações);
c. Aplicar técnicas estatísticas para avaliar o problema original;
d. Determinar se dados e análises adicionais são necessários;
e. Realizar “análises de sensibilidade” variando estimativas amostrais importantes e outros
fatores na análise e observando o efeito sobre as conclusões finais.
5. Rever as conclusões da análise de dados para determinar se o problema técnico original
foi avaliado ou se foi modificado para se enquadrar nos métodos estatísticos.
6. Apresentar os resultados:
a. Estabelecer as conclusões de forma significativa, enfatizando os resultados nos termos do
problema original, e não na forma dos índices estatísticos usados na análise;
b. Apresentar graficamente os resultados quando apropriado. Usar métodos estatísticos
simples no corpo do relatório e colocar as análises complexas em um apêndice.
7. Determinar se as conclusões do problema específico são aplicáveis a outros
problemas ou se os dados e cálculos poderiam ser úteis para outros problemas.

5
3. ESTATÍSTICA DESCRITIVA
Viu-se anteriormente um roteiro para coleta e análise de dados. As séries de dados,
basicamente, são provenientes de duas fontes: os “dados históricos” e os “dados de
experimentos planejados”.

Os dados históricos são séries de dados existentes e, em geral, analisar estatisticamente


esses dados é mais econômico (tempo e despesas) se comparado com dados obtidos a partir
de experimentos planejados. Mesmo com uma análise estatística complexa, em geral, pouco
sucesso se obtém com tais dados. No controle de um processo, algumas razões para esse
insucesso ocorrer são:
1. As variáveis do processo podem estar altamente correlacionadas entre si, tornando
impossível distinguir a origem de um determinado efeito.
2. .As variáveis do processo podem ter sido manipuladas para controlar o resultado do
processo.
3. .A
 s variáveis do processo têm abrangência pequena em relação ao intervalo de operação
do processo.
4. Outras variáveis que afetam o resultado do processo podem não ter sido mantidas
constantes, e serem as reais causadoras dos efeitos observados no processo.
Por essas razões, recomenda-se a análise de séries de dados históricos apenas para a
indicação de variáveis importantes a serem observadas em um experimento planejado.

Os dados de experimentos planejados são coletados com o objetivo estudar e analisar um


problema. São dados reunidos em diversas séries de variáveis com aparente importância em
um processo, enquanto se mantém constantes (com valores registrados) todas as outras
variáveis que possivelmente poderiam alterar o resultado. Aqui tratar-se-á de métodos
práticos de organização de dados. Segundo SPIEGEL4: “A parte da estatística que procura
somente descrever e analisar um certo grupo, sem tirar quaisquer conclusões ou inferências
sobre um grupo maior, é chamada estatística descritiva ou dedutiva.”
Freqüentemente dois ou mais métodos de organização são utilizados para descrever com
clareza dados coletados. Alguns desses métodos são: gráficos dos dados na ordem
cronológica, distribuição e histogramas de freqüência, características amostrais, medidas de
tendência central e medidas de dispersão.

4. SÉRIES ESTATÍSTICAS

TABELA: Resume um conjunto de dados dispostos segundo linhas e colunas de maneira


sistemática.

De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar:

• um traço horizontal ( - ) quando o valor é zero;


• três pontos ( ... ) quando não temos os dados;
• zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada;
• um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de
determinado valor.

Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que
nestes documentos as tabelas não serão abertas devido a limitações do editor html".

6
É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em
função da época, do local ou da espécie.

Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou
descontínua. Podem ser do tipo temporal, geográfica ou específica.

a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a


espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou
evolutiva.

ABC VEÍCULOS LTDA.

Vendas no 1º bimestre de 2002

PERÍODO UNIDADES VENDIDAS *

JAN/2002 20
FEV/2002 10
TOTAL 30

* Em mil unidades

.b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato
(espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização.

ABC VEÍCULOS LTDA.

Vendas no 1º bimestre de 2002

FILIAIS UNIDADES VENDIDAS *

São Paulo 13
Rio de Janeiro 17
TOTAL 30

* Em mil unidades

c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de


série categórica.

ABC VEÍCULOS LTDA.

7
Vendas no 1º bimestre de 2002

MARCA UNIDADES VENDIDAS *

FIAT 18
GM 12
TOTAL 30

* Em mil unidades

Séries Conjugadas: Também chamadas de tabelas de dupla entrada. São apropriadas à


apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de
classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica-
temporal.

ABC VEÍCULOS LTDA.

Vendas no 1º bimestre de 2002

FILIAIS Janeiro/2002 Fevereiro/2002


São Paulo 10 3
Rio de Janeiro 12 5
TOTAL 22 8

* Em mil unidades

Obs: as séries heterógradas serão estudas no capítulo 2 ( distribuição de frequências ).

CAPÍTULO 2 – DISTRIBUIÇÃO DE FREQUÊNCIAS

É uma ferramenta estatística apropriada para a apresentação de grandes massas de dados


numa forma que torna mais clara a tendência central e a dispersão dos valores ao longo da
escala de medição, bem como a freqüência relativa de ocorrência dos diferentes valores.

8
Quando da análise de dados, é comum procurar conferir certa ordem aos números tornando-
os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou
categorias, verificando-se o número de indivíduos pertencentes a cada classe.

É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições
de seus valores).

Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram
numericamente organizados. É difícil formarmos uma idéia exata do comportamento do
grupo como um todo, a partir de dados não ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

ROL: Tem-se um rol após a ordenação dos dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados


conforme as repetições de seus valores. Para um tabela de tamanho razoável esta distribuição
de frequência é inconveniente, já que exige muito espaço. Veja exemplo abaixo:

Tabela 1

Dados Frequência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20

Distribuição de frequência com intervalos de classe:Quando o tamanho da amostra é


elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe.

Tabela 2

Classes Frequências

9
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20

2.1 Elementos de uma Distribuição de Freqüência com classes

CLASSE: são os intervalos da variável simbolizada por i e o número total de classes


simbolizada por k. Ex: na tabela anterior k=5 e 49 |------- 53 é a 3ª classe, onde i=3. Para a
construção de uma tabela a partir de um dado bruto calcularemos o k através da Regra de
Sturges" k=1+3,3logn (para n<25) ou k= n (para n>25).

LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite


inferior de classe (li) e o maior número, limite superior de classe (Ls). Ex: em 49 |--- 53
Li3= 49 e Ls3= 53. O símbolo |--- representa um intervalo fechado à esquerda e aberto à
direita. O dado 53 não pertence à classe 3 e sim a classe 4 representada por 53 |--- 57.

AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o


limite superior e inferior da classe simbolizada por a = Ls - li. Ex: na tabela anterior a= 53 -
49 = 4. Obs: Na distribuição de frequência c/ classe o c será igual em todas as classes. Para
a construção de uma tabela a partir de um dado bruto temos: a=Ls-Li/K

AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o valor máximo e o


valor mínimo da amostra. Onde At = Xmax - Xmin. Em nosso exemplo At = 60 - 41 = 19.

PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes
iguais. Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja, x3=(Li+Ls)/2.

Os dados brutos a seguir apresentam um conjunto de tempos para determinada operação.

5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,2


6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7
6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,2
7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8

10
7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,3 8,4
8,5 8,5 8,6 8,7 8,8 8,8 8,9 9 9,1 9,2
9,4 9,4 9,5 9,5 9,6 9,8 9,9 10 10,2 10,2
10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9

2.2 Regras para a elaboração de uma distribuição de freqüências com classes

1º Organize os dados brutos em um ROL.

2º Calcule a amplitude total At.

No nosso exemplo: At =14,9 – 5,1 = 9,8

3º Calcule o número de classes (K), que será calculado usando K = . Obrigatoriamente


deve estar compreendido entre 5 a 20. Neste caso, K é igual a 8,94, aproximadamente, 8. No
nosso exemplo: n = 80 dados, então , k= n = 8,9 .

4º Conhecido o número de classes define-se a amplitude de cada classe:

No exemplo, a será igual a:

5º Temos então o menor nº da amostra, o nº de classes e a amplitude do intervalo. Podemos


montar a tabela, com o cuidado para não aparecer classes com frequência = 0 (zero).

6º Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe
(inferior e superior), onde limite Inferior será 5,1 e o limite superior será 15 + 1,23.

Intervalo de Freqüência Freqüência Freqüência Freqüência


Classe Absoluta (fi) Acumulada (Fi) Relativa (fr) Acumulada (Fr)
05,10 |---| 06,33 13 13 16,25 16,25
06,34 |---| 07,57 21 34 26,25 42,50
07,58 |---| 08,81 22 56 27,50 70,00
08,82 |---| 10,05 15 71 18,75 88,75
10,06 |---| 11,29 4 75 5,00 93,75
11,30 |---| 12,53 3 78 3,75 97,50
12,54 |---| 13,77 1 79 1,25 98,75
13,78 |---| 15,01 1 80 1,25 100
Total 80 - 100 -

Obs: Agrupar os dados em classes é uma importante ferramenta para resumir grandes massas
de dados brutos, no entanto acarreta perda de alguns detalhes.

Frequências simples ou absolutas (fi): são os valores que realmente representam o número
de dados de cada classe. A soma das frequências simples é igual ao número total dos dados
da distribuição.

11
Frequências relativas (fr): são os valores das razões entre as frequências absolutas de cada
classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 (100
%).

Frequência simples acumulada de uma classe (Fi): é o total das frequências de todos os
valores inferiores ao limite superior do intervalo de uma determida classe.

Frequência relativa acumulada de um classe (Fr): é a frequência acumulada da classe,


dividida pela frequência total da distribuição.

CAPÍTULO 3 – MEDIDAS DE CENTRALIDADE

Há várias medidas de tendência central, entretanto nesta apostila, será abordado o estudo de
apenas aquelas que são mais significativas. As mais importante medidas de tendência central
são: a média aritmética, média aritmética para dados agrupados, média aritmética ponderada,
mediana, moda.

12
3. Medidas de Centralidade

3.1 Média Aritmética=

Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua
utilização, pois pode dar uma imagem distorcida dos dados.

A média possui uma particularidade bastante interessante, que consiste no seguinte:


se calcularmos os desvios de todas as observações relativamente à média e somarmos esses
desvios o resultado obtido é igual a zero.

A média tem uma outra característica, que torna a sua utilização vantajosa em certas
aplicações: Quando o que se pretende representar é a quantidade total expressa pelos dados,
utiliza-se a média.

Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade


pretendida.

É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.

Média aritmética – para dados não-agrupados (ou dados simples)

Seja X uma variável que assume os valores x1, x2, x3 ,..., xn. A média aritmética
simples de X, representada por x, é definida por:
x1 + x2 + x3 + ... + xn ∑ xi
x = ------------------------------- ou x = -------
n n

xi : são os valores que a variável X assume


n: número de elementos da amostra observada

Exemplo: A produção leiteira diária da vaca B, durante uma semana, foi de 10, 15, 14, 13, 16, 19, e
18 litros. Determinar a produção média da semana (a média aritmética).

∑xi 10 + 15 + 14 + 13 + 16 + 19 + 18
x = ---------  x = ---------------------------------------------- = 15 litros
n 7

Média aritmética – para dados agrupados

Se os valores da variável forem agrupados em uma distribuição de freqüências será usada a


média aritmética dos valores x1, x2, x3 ,..., xn ponderadas pelas respectivas frequências absolutas: f1,
f2, f3 ,..., fn.

13
∑ xi . ƒi
x = ------------ , onde: xi : valores observados da variável ou ponto médio das classes
n ƒi: freqüência simples absoluta
∑ƒi = n : número de elementos da amostra observada

A fórmula acima será usada para as distribuições de freqüências sem classes e com classes.

Média aritmética para dados agrupados sem classes (Média aritmética ponderada)

(Dados sem classes): Determinar a média aritmética da Tabela 5.4

Tabela 5.4 - Número de filhos de um grupo de 50 casais


Número de filhos Numero
( xi ) de casais xi . ƒi
( fi ) ∑ xi . ƒi 117
0 6 x = ----------- = ------ = 2,34
1 16 n 50
2 9
3 8 x = 2,3 filhos
4 3
5 3
6 3
7 2
Total (∑) 50

Os 50 casais possuem, em média 2,3 filhos.

Média aritmética para dados agrupados com classes intervalares

(Dados com classes): Determinar a média aritmética da Tabela 5.7

Tabela 5.7 - Taxas municipais de urbanização, no Estado de Alagoas(em %) 1970.


Número de
Taxas (em %) Municípios xi xi . ƒi
( fi )
6 --- 16 29
16 --- 26 24
26 --- 36 16
36 --- 46 13
46 --- 56 4
56 --- 66 3
66 --- 76 2
76 --- 86 2
86 --- 96 1
Total (∑) 94

∑ xi . ƒi
x = ------------ = ---------- → x =
n

14
Dados agrupados:

Sem intervalos de classe

Consideremos a distribuição relativa de um canal de comunicação que está sendo


monitorado pelo registro do nº de erros em um conjunto de caracteres (string) 1.000 bits.
Dados para 34 desses conjuntos são vistos a seguir.

Nº de erros frequência = fi
0 2
1 6
2 10
3 12
4 4
total 34

Como as frequências são números indicadores da intensidade de cada valor da variável, elas
funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética
ponderada, dada pela fórmula:

..xi. ..fi. ..xi.fi .


0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
total 34 78

onde 78 / 34 = 2,3 erros

Com intervalos de classe

Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de


classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por
meio da fórmula:

..onde Xi é o ponto médio da classe.

Exemplo: Calcular o número de molas fora de conformidade, em cada batelada de produção,


com um tamanho igual a 40 conforme a tabela abaixo.

15
Nº de molas frequência = fi ponto médio = xi ..xi.fi.
50 |---- 54 4 52 208
54 |---- 58 9 56 504
58 |---- 62 11 60 660
62 |---- 66 8 64 512
66 |---- 70 5 68 340
70 |---- 74 3 72 216
Total 40 2.440

Aplicando a fórmula acima temos: 2.440 / 40.= 61. logo... = 61 molas

Propriedades da média aritmética

1ª propriedade
A soma algébrica dos desvios em relação à média é zero (nula).

∑ di = ∑ (xi - x ) = 0
onde: di são as distâncias ou afastamentos da média.

Em uma distribuição simétrica será igual a zero e tenderá a zero se a distribuição for assimétrica.

Idades ( xi ) di = xi - x
2 d1 = 2 – 6 = -4
4 d2 = 4 – 6 = -2
6 d3 = 6 – 6 = 0
8 d4 = 8 – 6 = +2
10 d5 = 10 – 6 = +4
∑ 0

2 + 4 + 6 + 8 + 10
x = ------------------------------- = 6
5

2ª propriedade
Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma variável,
a média do conjunto fica aumentada ou diminuída dessa constante.

Somar o valor 2 aos dados da tabela e calcular a nova média

Idades ( xi ) xi + 2

16
2 2+2= 4
4 4+2= 6
6 6+2= 8
8 8 + 2 = 10
10 10 + 2 = 12
∑ 40

A nova média será: 40


x = ------ = 8. No caso, a média aritmética anterior ficou aumentada de
2. 5

3ª propriedade
Multiplicando-se ou dividindo-se todos os valores de uma variável por uma
constante (c), a média do conjunto fica multiplicada ou dividida por essa constante:

Multiplicar o valor 2 aos dados da tabela e calcular a nova média

Idades ( xi ) xi x 2
2 2x2= 4
4 4x2= 8
6 6 x 2 = 12
8 8 x 2 = 16
10 10 x 2 = 20
∑ 60

A nova média será: 60


x = ------ = 12. No caso, a média aritmética anterior ficou multiplicada
por 2.
5

4ª propriedade

A média das médias é a média global de 2 ou mais grupos.

x1 = 10 n1 = 15
x2 = 18 n2 = 23

Então: (x1 . n1 ) + (x2 . n2 ) + ... + (xk . nk )


xG = ---------------------------------------------------
n1 + n2 + .... + nk

(10 . 15 ) + (18 . 23 )
xG = -------------------------------- = 14,84
15 + 23

5ª propriedade

A soma dos quadrados dos afastamentos contados a partir da média aritmética é um


mínimo.

Idades ( xi ) di = (xi – x) ∑ di2 = ∑ (xi – x)2


2 d1 = 2 – 6 = -4 (– 4)2 = 16

17
4 d2 = 4 – 6 = -2 (– 2)2 = 4
6 d3 = 6 – 6 = 0 ( 0)2 = 0
8 d4 = 8 – 6 = +2 ( +2)2 = 4
10 d5 = 10 – 6 = +4 ( +4)2 = 16
∑ 0 40

De modo que: ∑ (xi – x)2 = 40 sendo este valor o menor possível. Isso significa que, se tomássemos
outro valor que não a média (x), o resultado dessa operação seria maior que o obtido.

6ª propriedade
A média aritmética é atraída pelos valores extremos.

Considere os valores originais:


xi : 2, 4, 6, 8, 10 → x = 6

Se o primeiro valor xi for alterado para 0:


xi : 0, 4, 6, 8, 10 → x = 5,6

Se o último valor xi for alterado para 12:


xi : 2, 4, 6, 8, 12 → x = 6,4

MÉDIA GEOMÉTRICA = g
 É a raiz n-ésima do produto de todos eles.

Média Geométrica Simples: ou

Ex.: - Calcular a média geométrica dos seguintes conjuntos de números: E


a) { 10, 60, 360 }.: = ( 10 * 60 * 36 0) ^ (1/3) ....R: 60
b) { 2, 2, 2 }........: = (2 * 2 * 2 ^ (1/3) .. .R: 2
c) { 1, 4, 16, 64 }: = (1 * 4 * 16 * 64 ) ^(1/4) ....R: 8

Média Geométrica Ponderada :

ou ..
Ex - Calcular a média geométrica dos valores da tabela abaixo:
...xi... ...fi...
1 2
3 4
9 2
27 1
Total 9
= (12 * 34 * 92 * 271) (1/9)........R: 3,8296
MÉDIA HARMÔNICA - h

18
 É o inverso da média aritmética dos inversos.
.
Média Harmônica Simples:. (para dados não agrupados)

.. ou
.
Média Harmônica Ponderada : (para dados agrupados em tabelas de freqüências)

Ex.: Calcular a média harmônica dos valores da tabela abaixo:

classes ....fi.... ....xi.... ........fi/xi........


1 |--------- 3 2 2 2/2 = 1,00
3 |--------- 5 4 4 4/4 = 1,00
5 |--------- 7 8 6 8/6 = 1,33
7 |--------- 9 4 8 4/8 = 0,50
9 |--------- 11 2 10 2/10 = 0,20
total 20 4,03

Resp: 20 / 4,03 = 4,96

OBS: A média harmônica não aceita valores iguais a zero como dados de uma
série.

• A igualdade g = h.= ....só ocorrerá quando todos os valores da série forem


iguais.

OBS: Quando os valores da variável não forem muito diferentes, verifica-se


aproximadamente a seguinte relação:

g = ( .+ h ) /.2
• Demonstraremos a relação acima com os seguintes dados:

z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 }

Média aritmética = 51,3 / 5 = 10,2600


Média geométrica= = 10,2587
Média harmônica = 5 / 0,4874508 = 10,2574

Comprovando a relação: 10,2600 + 10,2574 / 2 = 10,2587 = média geométrica


MODA

19
Também chamada de norma, valor dominante ou valor típico. É o valor que ocorre com maior
freqüência em uma série de valores.

Mo é o símbolo da moda.

Desse modo, a força modal de remoção para um conector é a força mais comum, isto é, a
força de remoção medida em um teste de laboratório para um conector.

A Moda quando os dados não estão agrupados

• A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor


que mais se repete.

Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.

• Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.

• .Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então,
que a série tem dois ou mais valores modais.

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é


bimodal.

.A Moda quando os dados estão agrupados

a) Sem intervalos de classe

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o
valor da variável de maior frequência.

Exemplo: Qual a temperatura mais comum medida no mês abaixo:

Temperaturas Frequência
0º C 3
1º C 9
2º C 12
3º C 6

Resp: 2º C é a temperatura modal, pois é a de maior frequência.

b) Com intervalos de classe

20
A classe que apresenta a maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre
os limites da classe modal. O método mais simples para o cálculo da moda consiste em
tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta.

Mo = ( Li+ Ls) / 2

onde Li = limite inferior da classe modal e Ls= limite superior da classe modal.

Exemplo: Calcule a resistência modal dos 33 resistores conforme a tabela abaixo.

Resistência (em ohms) Freqüência


54 |---- 58 9
58 |---- 62 11
62 |---- 66 8
66 |---- 70 5

Resp: a classe modal é 58|--- 62, pois é a de maior frequência. Li=58 e Ls=62

Mo = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o valor real da


moda).

Método mais elaborado pela fórmula de CZUBER:

Mo = Li + ((fmo - fant) / ( 2fmo – (fant + fpost))) x c

Li= limite inferior da classe modal

fmo = frequência da classe modal

fant =frequência da classe anterior à da classe modal

fpost =frequência da classe posterior à da classe modal

c = amplitude da classe modal

Exemplo:

21
Tabela 5.7 – Taxas municipais de 1º) Identifica-se a classe (a de maior freqüência):
urbanização (em %) – Alagoas, 1970. Na Tabela é a 1ª classe: 6 --- 16
Número de
Taxas (em %) Municípios 2º passo: Aplica-se a fórmula:
( fi ) li + ls
6 --- 16 29 1º processo: Moda bruta: Mo = --------
16 --- 26 24 2
26 --- 36 16 sendo,
36 --- 46 13 li: limite inferior da classe modal = 6
46 --- 56 4 ls: limite superior da classe modal = 16
56 --- 66 3
66 --- 76 2 6 + 16
76 --- 86 2 Mo = ----------- = 11%
86 --- 96 1 2
Total (∑) 94

D1
2º processo: Fórmula de Czuber: Mo = LMo + -------------- x h
(método mais elaborado) D1 + D2
sendo:
LMo : limite inferior da classe
h: intervalo da classe modal
D1 : freqüência simples da classe modal − freqüência simples anterior à da classe modal
D2 : freqüência simples da classe modal − freqüência simples posterior à da classe modal

Na Tabela 5.7, temos: 29


LMo = 6 Mo = 6 + ------------- x 10 = 14,5%
h = 10 29 + 5
D1 = 29 − 0 = 29
D2 = 29 − 24 = 5 A taxa de urbanização mais freqüente ficou em
torno de 14,5%.

Obs: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de
posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a
média aritmética é a medida de posição que possui a maior estabilidade.

MEDIANA

22
A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou
decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos
de mesmo número de elementos.

Símbolo da mediana: Md

.A mediana em dados não-agrupados

Dada uma série de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }

De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação


(crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }

O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.

Método prático para o cálculo da Mediana

Se a série dada tiver número ímpar de termos:

O valor mediano será o termo de ordem dado pela fórmula :

O elemento mediano será:..EMd = n + 1 / 2

Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }

n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a
mediana.

A mediana será o 5º elemento, ou seja, Md = 2

Se a série dada tiver número par de termos:

O elemento mediano será:..EMd = n / 2

Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }

1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }

n = 10 logo a fórmula ficará: :..EMd = 10 / 2 = 5

Será na realidade (5º termo + 6º termo) / 2

A mediana será = (2+3) / 2, ou seja, Md = 2,5 . A mediana no exemplo será a média


aritmética do 5º e 6º termos da série.

Notas:

23
• Quando o número de elementos da série estatística for ímpar, haverá coincidência da
mediana com um dos elementos da série.
• Quando o número de elementos da série estatística for par, nunca haverá coincidência
da mediana com um dos elementos da série. A mediana será sempre a média
aritmética dos 2 elementos centrais da série.
• Em um série a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
• A mediana, depende da posição e não dos valores dos elementos na série ordenada.
Essa é uma da diferenças marcantes entre mediana e média (que se deixa
influenciar, e muito, pelos valores extremos). Vejamos:

Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10

Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10

Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência
dos valores extremos, ao passo que a mediana permanece a mesma.

A mediana em dados agrupados

a) Sem intervalos de classe

Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade


da soma das frequências. A mediana será aquele valor da variável que corresponde a tal
frequência acumulada.

Exemplo conforme tabela abaixo:

Variável xi Frequência fi Frequência acumulada


0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
Total 35 -

Quando o somatório das frequências for ímpar o valor mediano será o termo de ordem dado
pela fórmula :.

Como o somatório das frequências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3..

24
Quando o somatório das frequências for par o valor mediano será o termo de ordem dado
pela fórmula :.

Exemplo - Calcule Mediana da tabela abaixo:

Variável xi Frequência fi Frequência acumulada


12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 -

Aplicando a fórmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 +
16) / 2 = 15,5

b) Com intervalos de classe

Devemos seguir os seguintes passos:

1º) Determinamos as frequências acumuladas ;

2º) Calculamos ;

3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à

. Tal classe será a classe mediana;

4º) Calculamos a Mediana pela seguinte fórmula:..Li + [(EMd - Fant) x c] / fMd

Li = é o limite inferior da classe mediana.

Fant = é a frequência acumulada da classe anterior à classe mediana.

fMd= é a frequência simples da classe mediana.

c = é a amplitude do intervalo da classe mediana.

Exemplo:

25
classes frequência = fi Frequência acumulada
50 |---- 54 4 4
54 |---- 58 9 13
58 |---- 62 11 24
62 |---- 66 8 32
66 |---- 70 5 37
70 |---- 74 3 40
Total 40 -

= 40 / 2 =.20..logo.a classe mediana será 58 |---- 62

Li = 58....... Fant = 13........... fMd = 11........... c = 4

Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11


= 60,54

OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição.

Emprego da Mediana

• Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.
• Quando há valores extremos que afetam de maneira acentuada a média aritmética.

CAPÍTULO 4 - MEDIDAS DE ASSIMETRIA E CURTOSE

26
Denominamos curtose o grau de achatamento de uma distribuição em relação a uma
distribuição padrão, denominada curva normal (curva correspondente a uma distribuição
teórica de probabilidade).

Distribuições simétricas

A distribuição das freqüências faz-se de forma aproximadamente simétrica, relativamente a


uma classe média. Quando a distribuição é simétrica, a média e a mediana coincidem.

Caso especial de uma distribuição simétrica

Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando de
dados que se distribuem em forma de sino.

Distribuições Assimétricas

A distribuição das freqüências apresenta valores menores num dos lados:

Distribuições com "caudas" longas

Observamos que nas extremidades há uma grande concentração de dados em relação aos
concentrados na região central da distribuição.

A partir do exposto, deduzimos que se a distribuição dos dados:

27
1. for aproximadamente simétrica, a média aproxima-se da mediana

2. for enviesada para a direita (alguns valores grandes como "outliers"), a média tende a ser
maior que a mediana

3. for enviesada para a esquerda (alguns valores pequenos como "outliers"), a média tende a
ser inferior à mediana.

São representações visuais dos dados estatísticos que devem corresponder, mas nunca
substituir as tabelas estatísticas. Têm como características principais, o uso de escalas, a
existência de um sistema de coordenadas, a simplicidade, clareza e veracidade de sua
representação.

CAPÍTULO 5 - REPRESENTAÇÃO GRÁFICA

28
5. REPRESENTAÇÃO GRÁFICA

5.1 INTRODUÇÃO

A Estatística Descritiva pode descrever os dados através de gráficos.


A apresentação gráfica é um complemento importante da apresentação tabular. A vantagem de um
gráfico sobre a tabela está em possibilitar uma rápida impressão visual da distribuição dos valores ou
das freqüências observadas. Os gráficos propiciam uma idéia inicial mais satisfatória da
concentração e dispersão dos valores, uma vez que através deles os dados estatísticos se apresentam
em termos de grandezas visualmente interpretáveis.

5.2 REQUISITOS FUNDAMENTAIS EM UM GRÁFICO:

a. Simplicidade: possibilitar a análise rápida do fenômeno observado. Deve conter apenas o


essencial.
b. Clareza: possibilitar a leitura e interpretações correta dos valores do fenômeno.
c. Veracidade: deve expressar a verdade sobre o fenômeno observado.

5.3 TIPOS DE GRÁFICOS QUANTO A FORMA:

a. Diagramas: gráficos geométricos dispostos em duas dimensões. São mais usados na representação
de séries estatísticas.

b. Cartogramas: é a representação sobre uma carta geográfica, sendo muito usado na Geografia,
História e Demografia.

c. Estereogramas: representam volumes e são apresentados em três dimensões.

d. Pictogramas: a representação gráfica consta de figuras representativas do fenômeno. Desperta logo


a atenção do público.

5.4 CLASSIFICAÇÃO DOS GRÁFICOS QUANTO AO OBJETIVO

a. Gráficos de informação

O objetivo é proporcionar uma visualização rápida e clara da intensidade das categorias


ou dos valores relativos ao fenômeno. São gráficos tipicamente expositivos, devendo ser o mais
completo possível, dispensando comentários explicativos.

CARACTERÍSTICAS:

- deve conter título em letra de forma;


- as legendas podem ser omitidas, desde que as informações presentes possibilite a interpretação do
gráfico.

b. Gráficos de análise

Estes gráficos fornecem informações importantes na fase de análise dos dados, sendo
também informativos.
Os gráficos de análise, geralmente, vêm acompanhado de uma tabela e um texto onde se
destaca os pontos principais revelados pelo gráfico ou pela tabela.

29
5.5 PRINCIPAIS TIPOS DE GRÁFICOS

5.5.1 GRÁFICOS EM CURVAS OU EM LINHAS

São usados para representar séries temporais, principalmente quando a série cobrir um
grande número de períodos de tempo.

Considere a série temporal:


Tabela 4.1
Produção de Arroz do Município X - 1984-1994
Quantidade
Anos
(1000 ton)
1984 816
1985 904
1986 1.203
1987 1.147
1988 1.239
1989 1.565
1990 1.620
1991 1.833
1992 1.910
1993 1.890
1994 1.903
Fonte: Fictícia

Gráfico 4.1. Produção de Arroz do Município X - 1984-1994


(1000 ton)
2500

2000

1500

1000

500

0
84 85 86 87 88 89 90 91 92 93 94

5.5.2 GRÁFICOS EM COLUNAS


É a representação de uma série estatística através de retângulos, dispostos em colunas
(na vertical) ou em retângulos (na horizontal). Este tipo de gráfico representa praticamente
qualquer série estatística.
As regras para a construção são as mesmas do gráfico em curvas.
As bases das colunas são iguais e as alturas são proporcionais aos respectivos dados.

Exemplo: Tabela 4.2


Produção de Soja do Município X - 1991-1995
Anos Quantidade

30
(ton.)
1991 117.579
1992 148.550
1993 175.384
1994 220.272
1995 265.626
Fonte: Secretaria Municipal de Agricultura

Para cada ano é construído uma coluna, variando a altura (proporcional a cada quantidade). As
colunas são separadas uma das outras.
Observação: O espaço entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna.

Gráfico 4.2. Produção de Soja do Município X - 1991-1995


Toneladas

300000

250000

200000

150000

100000

50000

0
1991 1992 1993 1994 1995

Uso do gráfico em colunas para representar outras séries estatísticas

Tabela 4.3
Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966
Regiões Fisiográficas Área
(Km2)
Norte 3.581.180
Nordeste 965.652
Sudeste 1.260.057
Sul 825.621
Centro-oeste 1.879.965
Brasil 8.511.965
Fonte: IBGE.

31
Grafico 4.3. Áreas (Km 2) das Regiões Fisiográficas - Brasil - 1966.
Km 2 4.000.000
3.500.000
3.000.000
2.500.000
2.000.000
1.500.000
1.000.000
500.000
0
Norte Nordeste Sudeste Sul Centro-Oeste

Obs: Na tabela as regiões são apresentadas em ordem geográficas. No gráfico as colunas são
ordenadas pela altura, da maior para a menor, da esquerda para a direita.

5.5.3 GRÁFICOS EM BARRAS


As alturas dos retângulos são iguais e arbitrárias e os comprimentos são proporcionais
aos respectivos dados.
As barras devem ser separadas uma das outras pelo mesmo espaço de forma que as
inscrições identifiquem as diferentes barras. O espaço entre as barras pode ser a metade (½) ou dois
terços(2/3) de suas larguras.
As barras devem ser colocadas em ordem de grandeza de forma decrescente para
facilitar a comparação dos valores. A categoria “outros” (quando existir) são representadas na barra
inferior, mesmo que o seu comprimento exceda o de alguma outra.
Outra representação gráfica da Tabela 4.3:

Grafico 4.4. Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966.

Norte

Centro-Oeste

Sudeste

Nordeste

Sul

0 0 0 0 0 0 0 0 0
00 00 00 00 00 00 00 00
00. 00. 00. 00. 00. 00. 00. 00. Km2
5 0 5 0 5 0 5 0
1. 1. 2. 2. 3. 3. 4.
Tabela 4.4

Matrícula efetiva no Ensino Superior, segundo os ramos de ensino -Brasil - 1995

32
Ramos de ensino Matrículas
Filosofia, Ciências e Letras 44.802
Direito 36.363
Engenharia 26.603
Administração e Economia 24.027
Medicina 17.152
Odontologia 6.794
Agricultura 4.852
Serviço Social 3.121
Arquitetura e Urbanismo 2.774
Farmácia 2.619
Demais ramos 11.002
Total 180.109
Fonte: Fictícia

Grafico 4.5. Matrícula efetiva no Ensino Superior, segundo os ram os de ensino -


Brasil - 1999.
Filosofia, Ciências e Letras

Direito

Engenharia

Administração e Econômia

Medicina

Odontologia

Agricultura

Serviço Social

Arquitetura e Urbanismo

Farmácia

Demais ramos

0 00 0 0 0 0 0 0 0 0
50 00 00 00 00 00 00 00 00
10 15 20 25 30 35 40 45
Matrículas

OBS: Quando a variável em estudo for qualitativa e os nomes das categorias for extenso ou as
séries forem geográficas ou específicas é preferível o gráfico em barras, devido a dificuldade em
se escrever a legenda em baixo da coluna.

5.5.4 GRÁFICO EM COLUNAS MÚLTIPLAS (AGRUPADAS)

É um tipo de gráfico útil para estabelecer comparações entre as grandezas de cada


categoria dos fenômenos estudados.
A modalidade de apresentação das colunas é chamada de Gráfico de Colunas
Remontadas. Ele proporciona economia de espaços sendo mais indicado quando a série apresenta um
número significativo de categorias.

Exemplo: Tabela 4.5

33
Entrada de migrantes em três Estados do Brasil - 1992-1994
Número de migrantes
Anos Estados
Total
Amapá São Paulo Paraná
1992 4.526 2.291 1.626 609
1993 4.633 2.456 1.585 592
1994 4.450 2.353 1.389 708
Fonte: Fictícia
Gráfico 4.6. Entrada de m igrantes em três Estados do Brasil
1992-1994.
Quantidade

2500

2000

1500

1000

500

0
1992 1993 1994
Am apá São Paulo Paraná

5.5.5 GRÁFICO EM BARRAS MÚLTIPLAS (AGRUPADAS)


Útil quando a variável for qualitativa ou os dizeres das categorias a serem escritos são
extensos.
Exemplo:
Tabela 4.6
Importação Brasileira de vinho e champanhe proveniente de várias origens - 1994

Países Importação (1.000 dólares)


Vinho Champanhe
Portugal 220 15
Itália 175 25
França 230 90
Argentina 50 5
Chile 75 20
Espanha 110 16
Fonte: Fictícia

34
Gráfico 4.7. Im portação Brasileira de vinho e cham panhe proveniente de várias
origens - 1994.

França

Portugal

Itália

Espanha

Chile

Argentina

0 50 100 150 200 250

Vinho Champanhe 1000 dólares

5.5.6 GRÁFICO EM SETORES


É a representação gráfica de uma série estatística em um círculo de raio qualquer, pôr
meio de setores com ângulos centrais proporcionais às ocorrências.
É utilizado quando se pretende comparar cada valor da série com o total.
O total da série corresponde a 360° (total de graus de um arco de circunferência).
O gráfico em setores representam valores absolutos ou porcentagens complementares.
As séries geográficas, específicas e as categorias em nível nominal são mais
representadas em gráficos de setores, desde que não apresentem muitas parcelas (no máximo sete).
Cada parcela componente do total será expressa em graus, calculada através de uma
regra de três:

Total - 360°
Parte - x°

Exemplo:
Tabela 4.7
Produção Agrícola do Estado A - 1995
Produtos Quantidade (t)
Café 400.000
Açúcar 200.000
Milho 100.000
Feijão 20.000
Total 720.000
Fonte: Fictícia

35
Gráfico 4.8. Produção Agrícola do Estado A - 1995.
Feijão
Milho
3%
14%

Café
Açucar 55%
28%

Outras maneiras de representar graficamente a Tabela 4.7:

Gráfico 4.9. Produção Agrícola do Estado A - 1995.


Quantidade (t)

400.000
350.000
300.000
250.000
200.000
150.000
100.000
50.000
0
Café Açucar Milho Feijão

Gráfico 4.10. Produção Agrícola do Estado A - 1995.

Café

Açucar

Milho

Feijão

0 0 00 00 00 00 00 00 00
. 00 .0 .0 .0 .0 .0 .0 .0 Quantidade (t)
50 0 0 0 0 0 0 0
10 15 20 25 30 35 40

36
CAPÍTULO 6 - MEDIDAS DE DISPERSÃO OU DE
VARIABILIDADE

No capítulo 3 vimos algumas medidas de localização do centro de uma distribuição de


dados. Veremos agora como medir a variabilidade presente num conjunto de dados.

Um aspecto importante no estudo descritivo de um conjunto de dados é o da determinação


da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro
da amostra.

DESVIO PADRÃO ( S )

É a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores
da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão
baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida
como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada
por S.

Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a
mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as
mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio
padrão.

O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior
for, maior será a dispersão dos dados.

A fórmula acima é empregada quando tratamos de uma população de dados não-


agrupados.

37
Exemplo: Calcular o desvio padrão da população representada por - 4 , -3 , -2 , 3 , 5

Xi
-4 - 0,2 - 3,8 14,44
-3 - 0,2 - 2,8 7,84
-2 - 0,2 - 1,8 3,24
3 - 0,2 3,2 10,24
5 - 0,2 5,2 27,04
Total - - 62,8

Sabemos que n = 5 e 62,8 / 5 = 12,56.

A raiz quadrada de 12,56 é o desvio padrão = 3,54

Quando os dados estão agrupados (temos a presença de frequências) a fórmula do desvio


padrão ficará:

ou

Exemplo: Calcule o desvio padrão populacional da tabela abaixo:

Xi f i Xi . f i .fi
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 - - - 32,70

Sabemos que fi = 30 e 32,7 / 30 = 1,09.

A raiz quadrada de 1,09 é o desvio padrão = 1,044

Se considerarmos os dados como sendo de uma amostra o desvio padrão seria a raiz
quadrada de 32,7 / (30 -1) = 1,062

38
Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizada é a
mesma do exemplo anterior.

VARIÂNCIA ( S2 )

Define-se a variância, como sendo a medida que se obtém somando os quadrados dos
desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de
observações da amostra menos um.

S2 =

A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é
extremamente importante na inferência estatística e em combinações de amostras.

MEDIDAS DE DISPERSÃO RELATIVA

CVP: Coeficiente de Variação de Pearson

Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio
padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor
médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito.

Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua
dispersão ou variabilidade, quando expressas em unidades diferentes.

Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou


variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada de
CVP: Coeficiente de Variação de Pearson (é a razão entre o desvio padrão e a média
referente aos dados de uma mesma série).

A fórmula do CVP = (S / ) x 100 (o resultado neste caso é expresso em percentual,


entretanto pode ser expresso também através de um fator decimal, desprezando assim o valor
100 da fórmula).

39
Exemplo 1:

Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos:

Discriminação MÉDIA DESVIO PADRÃO


ESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2,0 kg

Qual das medidas (Estatura ou Peso) possui maior homogeneidade?

Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor
será o de maior homogeneidade (menor dispersão ou variabilidade).

CVP estatura = ( 5 / 175 ) x 100 = 2,85 %

CVP peso = ( 2 / 68 ) x 100 = 2,94 %.

Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os
pesos.

Exemplo 2:

O risco de uma ação de uma empresa pode ser devidamente avaliado através da variabilidade
dos retornos esperados. Portanto, a comparação das distribuições probabilísticas dos
retornos, relativas a cada ação individual, possibilita a quem toma decisões perceber os
diferentes graus de risco. Analise, abaixo, os dados estatísticos relativos aos retornos de 5
ações e diga qual é a menos arriscada?

Discriminação Ação A Ação B Ação C Ação D Ação E


Valor esperado 15 % 12 % 5% 10 % 4%
Desvio padrão 6% 6,6 % 2,5 % 3% 2,6 %
Coeficiente de variação 0,40 0,55 0,50 0,30 0,65

40
Exercícios
1. Identifique os tipos de escalas utilizadas para cada uma das seguintes características das
unidades de observação, retiradas de uma tabela do Guia do Usuário do aplicativo Microsoft
Excel: mês, tipo de produto, vendedor, região do país, unidades vendidas e total de vendas.
2. É possível encontrar a seguinte série de desvios tomados em relação a média aritmética: 4,
-3, 2, -7 e 5? Justifique.
3. Dados dois grupos de pessoas, o grupo A com 10 elementos e o grupo B com 40
elementos. Se o peso médio do grupo A for de 80 kg e o do grupo B for de 70 kg então é
verdade que o peso médio dos dois grupos considerados em conjunto é de 75 kg? Justifique.
4. Um concurso realizado simultaneamente nos locais A, B e C, apresentou as médias: 70, 65
e 45, obtidos por 30, 40 e 30 candidatos, nessa ordem. Qual foi a média geral do concurso?
5. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma
média de 70 pontos em determinada prova. Sabendo-se que a média geral dos candidatos
(independente de sexo) foi de 64 pontos, qual foi a média dos candidatos do sexo feminino?
6. Determinar a moda dos seguintes conjuntos:
(6.1) 1, 6, 9, 3, 2, 7, 4 e 11
(6.2) 6, 5, 5, 7, 5, 6, 5, 6, 3, 4 e 5
(6.3) 8, 4, 4, 4, 4, 6, 9, 10, 10, 15, 10, 16 e 10
(6.4) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28 e 18
7. Determinar a mediana dos seguintes conjuntos:
(7.1) 9 14 2 8 7 14 3 21 1
(7.2) 0,02 0,25 0,47 0,01 -0,30 -0.5
(7.3) 1/2 3/4 4/7 5/4 -2/3 -4/5 -1/5 3/8
8. Para os conjuntos abaixo, determinar com aproximação centesimal, as seguintes medidas:
(a) A amplitude (b) O desvio médio (c) A variância (d) O desvio padrão
(e) O coeficiente de variação.
(8.1) 0,04 0,18 0,45 1,29 2.35
(8.2) -7/4 -1/3 3/5 7/20 1 4/3
9. Dados os seguintes conjuntos de valores:
(a) 1 3 7 9 10 (b) 20 60 140 180 200 (c) 10 50 130 170 190.
Calculando a média e o desvio padrão do conjunto em (a), determinar, através das
propriedades, a média e o desvio padrão dos conjuntos em (b) e (c).
10. Quarenta alunos da PUC foram questionados quanto ao número de livros lidos no ano
anterior.
Foram registrados os seguintes valores:
4 2 1 0 3 1 2 0 2 1
0 2 1 1 0 4 3 2 3 5
8 0 1 6 5 3 2 1 6 4
3 4 3 2 1 0 2 1 0 3
(10.1) Organize os dados em uma tabela adequada.
(10.2) Qual o percentual de alunos que leram menos do que 3 livros.
(10.3) Qual o percentual de alunos que leram 4 ou mais livros.
(10.4) Classifique a variável e o tipo de distribuição utilizada.

11. O conjunto de dados abaixo representa uma amostra de 40 elementos:


3,67 1,82 3,73 4,10 4,30 1,28 8,14 2,43 4,17 2,88
5,36 3,96 6,54 5,84 7,35 3,63 2,93 2,82 8,45 4,15
5,28 5,41 7,77 4,65 1,88 2,12 4,26 2,78 5,54 6,00
0,90 5,09 4,07 8,67 0,90 6,67 8,96 4,00 2,00 2,01

41
(11.1) Agrupe os dados em uma distribuição de freqüências, considerando o limite inferior
igual a
zero, o superior igual a 10 e utilizando cinco classes de mesma amplitude.
(11.2) Construa um histograma de freqüências relativas.
12. Um livro com 50 páginas apresentou um número de erros de impressão por página
conforme
tabela:
(12.1) Qual o número médio de erros por página?
(12.2) Qual o número mediano de erros por página?
(12.3) Qual o número modal de erros por página?
(12.4) Qual o desvio padrão do número de erros por página?
Aluguéis Zona Urbana Zona Rural
1 |----- 3 10 30
3 |----- 5 40 50
5 |----- 7 80 15
7 |----- 9 50 05
9 |----- 11 20 00
∑ 200 100

13.Um livro com 50 páginas apresentou um número de erros de impressão por página
conforme
tabela:
(13.1) Qual o número médio de erros por página?
(13.2) Qual o número mediano de erros por página?
(13.3) Qual o número modal de erros por página?
(13.4) Qual o desvio padrão do número de erros por página?

Erros Número de páginas


0 25
1 20
2 3
3 1
4 1
Total 50

14. Durante certo período de tempo o rendimento de 10 ações foram os que a tabela registra.
(14.1) Calcule o rendimento médio.
(14.2) Calcule o rendimento mediano. Ação Taxa (%)
(14.3) Calcule o rendimento modal. 1 2,59
(14.4) Calcule o desvio padrão do rendimento. 2 2,64
(14.5) Calcule o coeficiente de variação do rendimento. 3 2,60
4 2,62
5 2,57
6 2,55
7 2,61
8 2,50
9 2,63
10 2,64

42
15. Uma região metropolitana tem 50 quarteirões com os seguintes números de casas por
quarteirão:

2 2 3 10 13 14 15 15 16 16
18 18 20 21 22 22 23 23 25 25
26 27 29 29 30 32 36 42 44 45
45 46 48 52 58 59 61 61 61 65
66 66 68 75 78 80 89 90 92 97
(15.1) Construa, com os dados, uma distribuição de freqüências por intervalos fazendo com
que as classes tenham amplitudes iguais a 14.
(15.2) Calcule o número médio de casas por quarteirão.
(15.3) Determine o número mediano de casas por quarteirão.
(15.4) Calcule a variância do número de casas por quarteirão.
(15.5) Calcule, pelos dois processos, o número modal de casas por quarteirão.
16. De um levantamento feito entre 100 famílias resultou a tabela ao lado. Determine:
(16.1) O número médio de filhos.
(16.2) O número mediano de filhos. Número de filhos Número de famílias
(16.3) O número modal de filhos. 0 18
(16.4) O desvio padrão do número de filhos. 1 23
2 28
3 21
4 7
5 3
Total 100

17. As informações abaixo dizem respeito a distribuição de três variáveis. Indique,


justificando, qual delas tem média mais representativa.
Distribuição A Distribuição B Distribuição C
n = 200 n = 50 =8
∑ fx = 5000 ∑ fx = 500 ∑ fx = 3200
∑ fx2 = 130000 ∑ fx2 = 5450 ∑ fx2 = 32000

18. Uma variável x tem média igual a 10 e variância igual a 16. Calcule a média e a
variância da variável dada por y = (3x + 5) / 2
19. Os operários de um setor industrial têm, em uma época 1, um salário médio de 5 salários
mínimos (sm) e desvio padrão de 2 sm. Um acordo coletivo prevê, para uma época 2, um
aumento linear de 60%, mais uma parte fixa correspondente a 70% de um salário mínimo.
Calcule a média e o desvio padrão dos salários na época 2.
20. O que se pode dizer se fosse dada a informação de que o salário mediano de um conjunto
de profissionais é de 6 sm?
21. Um a comunidade A tem 100 motoristas profissionais cujo salário médio é de 5 sm. A
comunidade B, com 300 desses profissionais, remunera-os com uma média de 4 sm.
(21.1) É correto afirmar que A remunera melhor seus motoristas profissionais que B?

43
(21.2) Diante das informações disponíveis há garantia que os 100 salários individuais de A
são maiores que os 300 de B? Por que?
22. O departamento de pessoal de um certa firma fez um levantamento dos salários dos 120
funcionários do setor administrativo, obtendo os resultados da tabela:
(22.1) Determine o salário médio dos funcionários
(22.2) Determinar a variância e o desvio padrão dos salários.
(22.3) Determinar o salário mediano.
(22.4) Determinar o salário modal pêlos critérios de King e Czuber.
(22.5) Se for dado um aumento de 20% para todos os funcionários, qual será o novo salário
médio e o novo desvio padrão dos salários?
(22.6) Se for dado um abono de 0,5 s.m. a todos os funcionários como fica a média e o
desvio padrão dos salários?

Faixa salarial (s.m.) % de funcionários


1 |---- 3 0,25
3 |---- 5 0,40
5 |---- 7 0,20
7 |--- 10 0,15
Total 1,00

23. O que acontece com a média e o desvio padrão de um conjunto de dados quando:
(23.1) Cada valor é multiplicado por 2.
(23.2) Soma-se o valor 10 a cada valor.
(23.3) Subtrai-se a média de cada valor.
(23.4) De cada valor subtrai-se a média e em seguida divide-se pelo desvio padrão.
24. A média aritmética entre dois valores é igual a 5 e a média geométrica igual a 4. Qual a
média harmônica entre estes dois valores?

44

Você também pode gostar