Você está na página 1de 63

1

Universidade Presbiteriana Mackenzie


ESTATÍSTICA APLICADA I
PROFESSORA: Grácia Maria Catelli Anacleto

1. CONCEITOS BÁSICOS:
A estatística é a ciência que tem como objetivo fornecer subsídios para o
planejamento e a execução de experimentos, bem como para a coleta, a descrição e a análise de
dados e para a interpretação de resultados. Nesse contexto a estatística pode ser dividida em
duas partes:

ESTATÍSTICA DESCRITIVA: Que trata da descrição tabular, gráfica e


paramétrica (relativo a parâmetro) dos dados provenientes de populações e amostras. Na
verdade ela é a parte da estatística que se fundamenta por apenas descrever o
comportamento dos dados, sem tirar inferências sobre os mesmos.

ESTATÍSTICA INFERENCIAL: Parte dos resultados obtidos nas amostras e faz


inferências para a população. Estuda a estimação e os testes sobre os parâmetros
populacionais.
Inferência Estatística é o processo pelo qual estatísticos tiram conclusões acerca
da população usando informações de uma amostra.

Para se analisar os dados de forma estatística podem-se obter os resultados de


duas maneiras: através de um censo ou através de uma amostragem (pesquisa em uma
amostra).

POPULAÇÃO: Em termos estatísticos define-se uma população como sendo um


conjunto de informações que tenham, pelo menos, uma característica em comum.

Exemplos:
Moradores de Porto Alegre;
Peças produzidas por uma máquina;
Consumidores de uma marca de sabão em pó;
Empresas produtoras de peças para relógios;
Lagartas em uma plantação de soja;
Contribuintes para a receita estadual. etc.

Uma população pode ainda ser caracterizada como sendo:

FINITA: É aquela população que podemos enumerar todos os seus elementos


(podem ser totalizados e expressos por uma quantidade definida).

Exemplo:
Número de eleitores no município de Porto Alegre;
Número de empresas cadastradas na Junta Comercial. etc.
INFINITA: É quando a quantidade de elementos da população não pode ser
expressa por uma quantidade definida de valores. Mesmo que esta quantidade
exista mas não possa ser contada por ser incomensurável.
Exemplo:
Peças produzidas por uma linha de produção que trabalhe 24 horas por dia. Nesse
caso o tamanho da população é sempre incrementado a cada dia;
Quantidade de plantas em uma mata nativa. A quantidade é tão grande que pode
ser considerada infinita.
Parâmetro: São medidas obtidas através dos elementos da população.
Os símbolos são apresentados por letras grega.:
µ = Média, σ² = Var. absoluta; σ = Desvio Padrão.
Estatísticas Amostrais ou Estatísticas: São medidas obtidas através dos
elementos das amostras.:
Média da Amostra = X; Variância = S²;Desvio padrão amostral = S
2

2. ESTATÍSTICA DESCRITIVA
2.1. VARIÁVEIS E ATRIBUTOS
Na investigação estatística de dados uma definição muito utilizada é a variável.
Define-se variável como o resultado de um experimento. As variáveis podem ser:

VARIÁVEIS QUALITATIVAS:
São aquelas usadas para descrever qualidades, categorias, etc. São também
definidas como ATRIBUTOS.
Exemplos:
Sexo: Masculino e feminino.
Cor dos olhos: Verde, azul, preto, castanho, etc.
Classe de renda: Alta, média e baixa, etc.

VARIÁVEIS QUANTITATIVAS:
São aquelas que descrevem quantidades e, deste modo, podem ser comparadas
a conjuntos numéricos. Podem ser classificadas em discretas e contínuas.
Variáveis discretas: São as variáveis usadas para descrever dados discretos, ou
seja, apenas assumem valores inteiros, pois é oriunda de uma contagem.
Exemplos:
Número de filhos por casais;
Número de Fiscais do Tesouro do Estado por setor;
Quantidade de desempregados na região, etc.

Variáveis contínuas: São usadas para descrever dados contínuos, ou seja,


podem assumir valores não inteiros, pois são oriundas de uma medição.
Exemplos:
Renda familiar;
Preço de um produto;
Peso, altura, etc.

2.2. DISTRIBUIÇÃO DE FREQÜÊNCIA


Organização de dados estatísticos:

Os dados estatísticos coletados podem ser apresentados em forma tabular


(através de tabelas ) ou gráfica (através de gráficos ). Podem também ser classificados em séries
estatísticas de dados grupados ( distribuições de freqüências: por intervalos e por pontos ) ou não
grupados ( séries temporais, históricas e geográficas ).
Antes de apresentar os dados nas mais diferentes formas cabe descrever quais
são as normas técnicas de apresentação.

NORMAS PARA APRESENTAÇÃO TABULAR DE DADOS

Tabela é um quadro, não fechado nas extremidades, que resume um conjunto de


observações.

Uma tabela compõem-se de:

a. corpo – conjunto de linhas e colunas que contêm informações sobre a variável em


estudo;
b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas;
d. casa ou célula – espaço destinado a um só número;
e. título – conjunto de informações, as mais completas possíveis, respondendo às
perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela;
3
f. fonte – indicação da entidade responsável pelo fornecimento dos dados ou pela sua
elaboração.

Séries Estatísticas

Denomina-se de séries estatísticas toda tabela que apresenta a distribuição de um


conjunto de dados estatísticos em função da época, do local ou da espécie.

Séries temporais, históricas, cronológicas ou marchas

Descrevem os valores da variável, em determinado local, discriminados segundo


intervalos de tempo variáveis.

Exemplo:
Taxas de desemprego no Município de Porto Alegre 1995/2000
ANOS Taxas de Desemprego
1995 9,6
1996 11,7
1997 12,5
1998 14,4
1999 16,9
2000 15,4
Fonte; PED-RMPA – Convênio FEE, FGTAS/SINE-RS,SEADE-SP, DIEESE E PMPA

Séries geográficas, espaciais, territoriais ou de localização

Descrevem os valores da variável, em determinado tempo e local, discriminados segundo


especificações ou categorias.
Exemplo:
Taxas de desemprego na Região Metropolitana de Porto Alegre, no Município de Porto Alegre e
demais Regiões Metropolitanas selecionadas – 2000

Regiões Taxas de Desemprego


Belo Horizonte 17,8
Salvador 26,6
Recife 20,7
São Paulo 17,6
Porto Alegre 15,4
RMPA 16,6
Fonte; PED-RMPA – Convênio FEE, FGTAS/SINE-RS,SEADE-SP, DIEESE E PMPA
Séries específicas ou categóricas

Descrevem os valores da variável, em determinado tempo e local, discriminados segundo


especificações ou categorias.

Exemplo:
PRINCIPAL PROBLEMA DO BRASIL EM %.
AMOSTRA REALIZADA EM SETEMBRO DE 1998 COM 12079 PESSOAS EM296 CIDADES.
4

PROBLEMA %
DESEMPREGO 53
SAÚDE 9
VIOLÊNCIA/SEGURANÇA/POLÍCIA 8
FOME/MISÉRIA 5
EDUCAÇÃO 4
CORRUPÇÃO 3
ECONOMIA 2
SALÁRIO 2
HABITAÇÃO 1
INFLAÇÃO 1
REFORMA AGRÁRIA/SEM TERRA 0
OUTRAS 6
NÃO SABE 6
Fonte: DATAFOLHA

Séries mistas

Descrevem os valores da variável, em relação a dois critérios (tabela cruzada).


Exemplo1:
PERFIL DA POPULAÇÃO BRASILEIRA EM % -1998- PESQUISA AMOSTRAL
DATAFOLHA-BRASIL

NORTE/C-OESTE
IDADE MÉDIA

RENDA FAM

NORDESTE
RENDA IND
POS-GRAD

SUDESTE
ATÉ 1º G
MASC

FEM

SUP
2º G

SUL
ELITE 53 47 37 0 25 67 8 3724 1601 63 16 11 9
BATALHADORES 59 41 40 65 35 0 0 3943 1539 61 15 13 11
REMEDIADOS 53 47 38 54 46 0 0 1692 624 55 16 18 11
DESLOCADOS 49 51 32 0 83 16 1 756 394 49 18 22 11
EXCLUIDOS 49 51 40 87 13 0 0 403 207 37 15 34 15
POBRES 55 45 39 91 9 0 0 752 377 56 20 13 11
DESPOSSUÍDOS 48 52 35 72 28 0 0 350 183 35 14 36 16
MISERÁVEIS 48 52 46 100 0 0 0 234 131 27 13 45 16
TOTAL 50 50 38 64 28 7 1 907 413 43 15 28 13
FONTE: DATAFOLHA (BASE 100,8 MILHÕES DE PESSOAS)

DISTRIBUIÇÕES DE FREQÜÊNCIAS

Os dados em distribuições de freqüências são uma maneira de apresentar


informações grupadas. Neste caso a variável pode ser expressa por ponto ( um único valor ) ou
por intervalo ( dentro de um intervalo de valores ). Ao se constituir uma distribuição de freqüências
(DF) precisa-se descrever alguns componentes da mesma.

Tabela Primitiva

Supondo uma coleta amostral de dados relativos aos salários semanais de quarenta funcionários
que compõem uma amostra de uma Empresa Z. Os valores de cada um dos salários estão
listados a seguir:
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS
PELOS FUNCIONÁRIOS DA EMPRESA Z

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
5

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos
tabela primitiva ou dados brutos.
Rol

O rol é uma lista em que os valores estão dispostos em uma determinada ordem, crescente ou
decrescente. Veja a seguir:

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Distribuição de Freqüência

A freqüência é o número de repetições da observação no conjunto de observações.


A distribuição de freqüência de uma série de observações é uma função que representa
os pares de valores formados por cada observação e seu número de repetições.

Exemplo:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS


PELOS FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL

Elementos de uma Distribuição de Freqüência

- Classe

Classes de freqüência ou, simplesmente, classe são intervalos de variação da variável.

As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, . . ., k (onde k é o


número total de classes da distribuição).

Exemplo: O intervalo 154 |--- 158 define a segunda classe (i = 2)


A distribuição é formada por seis classes, podemos afirmar que i = 6.
– Limites de Classe

Determina-se limites de classes os extremos de cada classe.

O menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da


classe ( ls ).

Exemplo: Na terceira classe do exemplo acima, temos: li3 = 158 e Ls3= 162

– Amplitude de um Intervalo de Classe ( h )

É a medida de intervalo que define a classe. Ela é obtida pela diferença entre os limites
superior e inferior. Assim:

h =ls −li

Exemplo: Calcule o intervalo de classe do exemplo acima.


6

– Amplitude Total ( H )

É a diferença entre o valor máximo e o valor mínimo da amostra.

H =Ls −Li

Exemplo: Calcule amplitude amostral do exemplo acima.

– Ponto Médio de uma Classe ( Xi )

É o ponto que divide o intervalo de classe em duas partes iguais.

li + ls
Xi =
2

Exemplo: O ponto médio da segunda classe, em nosso exemplo, é 156.

– Freqüência Simples ou Absoluta ( fi )

É o número de observações correspondentes a uma classe.

A soma de todas freqüências é representada por:

N = ∑ fi ( população ) n = ∑ fi ( amostra )

Exemplo: Para a distribuição em estudo, temos:

n = ∑fi = 40

– Número de Classes

Pode-se utilizar a regra de STURGES, que fornece o número de classes em função do total de
casos:
K = 1 + 3,33 log n( N )

Onde:
K é o número de classes;
N ou n é o número total de observações.

Para determinar a amplitude do intervalo de classe, temos:

H
h=
K
Exemplo: a) Se o número de observações for 500:
b) Se n = 50

Truman L. Kelley, sugere os seguintes números de classes, com base no número total de
observações, para efeito de representação gráfica:

n 5 10 25 50 100 200 500 1000


K 2 4 6 8 10 12 15 15

SIMBOLOGIA ENTRE OS VALORES DE CLASSE:


7

 Inclui o valor da esquerda mas não o da direita.


 Inclui o valor da direita mas não o da esquerda.
 Não inclui nem o valor da direita, nem o da esquerda.
 Inclui tanto o valor da direita quanto o da esquerda.

– Tipos de Freqüências

– Freqüências Relativas simples (fri)

São os valores da razão entre as freqüências simples e a freqüência total.


fi
fri =
n
Exemplo: Calcule a freqüência relativa simples da terceira classe, em nosso exemplo:

( R. 27,5 % dos funcionários recebem salário de R$ 158 até menos de R$ 162. )

– Freqüência Acumulada ( Fi )

É o total das freqüências de todos os valores inferiores ao limite superior.


do intervalo de uma dada classe.

Fi = f 1 + f 2 + ... + fi ou Fi = ∑ fi
Exemplo: Calcule a freqüência acumulada correspondente à terceira classe, em nosso exemplo:
( R. 24 funcionários recebem salário de R$ 150 até menos de R$ 162. )

– Freqüência Acumulada Relativa ( Fri )

É a freqüência acumulada da classe, dividida pela freqüência total da distribuição.


Fi
Fri =
n
Exemplo: Para a terceira classe, qual é a freqüência acumulada relativa?
( R. 60 % dos funcionários recebem salário de R$ 150 até menos de R$ 162. )

EXERCÍCIO
Complete a seguinte tabela e responda as seguintes perguntas:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS


PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$) Freqüências Xi fri % fri FI Fri


150 |--- 154 4 152 0,1 10 4 0,1
154 |--- 158 9 156 0,225 22,5 13 0,325
158 |--- 162 11 160 0,275 27,5 24 0,6
162 |--- 166 8 164 0,2 20 32 0,8
166 |--- 170 5 168 0,125 12,5 37 0,925
170 |--- 174 3 172 0,075 7,5 40 1
Total 40 1 100
FONTE: PESQUISA DO SETOR DE PESSOAL

a) Quantos empregados tem salário entre R$ 154, inclusive, e R$ 158? ( R. 9 )


8

b) Qual a percentagem de empregados cujas salários são inferiores a R$ 154? ( R.10% )

c) Quantos empregados tem salário abaixo de R$ 162? ( R. 24 )

d) Quantos empregados tem salário não inferior a R$ 158? ( R. 27 )

– Distribuição de Freqüência sem Intervalos de Classe

Quando se trata de variáveis discreta de variação relativamente pequena, cada valor pode ser
tomado como um intervalo de classe.

Exemplo: Se X a variável é o número de filhos do sexo masculino de 34 famílias de quatro filhos


pesquisadas, complete a tabela:

i X fi fri Fi Fri
0 2 0,0588 2 0,0588
1 6 0,1765 8 0,2353
2 10 0,2941 18 0,5294
3 12 0,3529 30 0,8824
4 4 0,1176 34 1,0000

EXERCÍCIOS

1. Conhecidas as notas de 50 alunos:


84 68 33 52 47 73 68 61 73 77
74 71 81 91 65 55 57 35 85 88
59 80 41 50 53 55 76 85 73 60
67 41 78 56 94 35 45 55 64 74
65 94 66 48 39 69 89 98 42 54

Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para
intervalo das classes.

NOTAS 30  40 40  50 50  60 60  70 70  80 80  90 90  100
fi 4 6 10 10 9 7 4

2. Os resultados do lançamento de um dado 50 vezes foram os seguintes

6 5 2 6 4 3 6 2 6 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3

Forme uma distribuição de freqüência sem intervalos de classe.

XI 1 2 3 4 5 6
fi 6 8 9 7 10 10

– Representação Gráfica

O gráfico estatístico é uma forma de apresentação dos dados, onde o objetivo é o de


produzir, no investigador ou no público em geral, uma impressão mais rápida e visual do fenômeno
em estudo.

Veja alguns exemplos de gráficos:


9

1. POLIGONAL:
Gráfico de linha ou poligonal.

EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS

70.000

60.000

50.000

40.000
US$

30.000

20.000

10.000

0
1990 1991 1992 1993 1994 1995 1996 1997 1998*
ANOS

IMPORTAÇÕES EXPORTAÇÕES

2. GRÁFICO DE COLUNAS:
Com os mesmos dados do exemplo anterior:

EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS

70.000

60.000

50.000

40.000
US$

30.000

20.000

10.000

0
1990 1991
1992 1993
1994 1995 1996 1997 1998*
ANOS

IMPORTAÇÕES EXPORTAÇÕES
10

3. GRÁFICO DE BARRAS:
Com os mesmos dados anteriores.

EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS EM 1997

1998* 27.970

1997 61.358

1996 53.301

1995 49.583

ANOS 1994 33.079

1993 25.256

1992 20.544

1991 21.041

1990 20.661

0 10.000 20.000 30.000 40.000 50.000 60.000 70.000


US$

IMPORTAÇÕES

4. GRÁFICO DE SETORES:
EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS EM 1997

52.086

61.358

IMPORTAÇÕES EXPORTAÇÕES

5. HISTOGRAMA:

Um histograma é uma representação gráfica de uma série de dados grupados por


meio de retângulos cujas áreas são proporcionais às freqüências absolutas simples de cada
intervalo (classe).
Exemplo:
Número de salários mensais recebidos pelos funcionários da Empresa Beta - POA - 1999.
11

250

200

150

100

50

0
2 4 6 8 10

Os dados deste histograma foram obtidos a partir da seguinte tabela:

SALÁRIOS MENSAIS Número de funcionários


0 2 20
2 4 100
4 6 200
6 8 150
810 30
Total 500

6. POLÍGONO DE FREQÜÊNCIAS:

É a representação gráfica de uma série de dados grupados por meio de um


polígono, considerados os pontos médios de classes e as respectivas freqüências absolutas dos
mesmos.
Com os dados do exemplo anterior:

Número de salários

200

180
160

140
120

100

80
60

40
20

0
1 3 5 7 9

salários.

2.4. MEDIDAS DE TENDÊNCIA CENTRAL


Na maior parte das vezes em que os dados estatísticos são analisados,
procuramos obter um valor para representar um conjunto de dados. Este valor deve
12
sintetizar, da melhor maneira possível, o comportamento do conjunto do qual ele é
originário. Nem sempre os dados estudados têm um bom comportamento, isto pode
fazer com que um único valor bem represente ou não o grupo.
As medidas de posição mais importantes são as medidas de tendência central,
que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a
se agrupar em torno dos valores centrais. Dentre as medidas de tendência central,
destaca-se as seguintes: Média aritmética, Moda e Mediana. Cada uma com um
significado diferenciado, porém tendo como serventia representar um conjunto de dados.
A maneira de se obter estas medidas é um pouco diferenciada dependendo de como os
dados são apresentados. Eles podem vir de forma isolada (não grupados) ou ainda ponderados
(grupados em intervalos ou sem intervalo de classe, por ponto).

2.4.1. – Média Aritmética ( µ ou x )

É o quociente da divisão da soma dos valores da variável pelo número deles:

µ=
∑ xi ou X =
∑ xi
N n
Sendo: µ ou x : média aritmética
Xi : valores da variável
n ou N : número de valores
2.4.1.1. – Dados não-agrupados

Quando deseja-se conhecer a média dos dados não-agrupados, determinamos a média aritmética
simples .

Exemplo: Sabendo-se que as vendas diárias da empresa A, durante uma semana, foram de 10, 14,
13, 15, 16, 18 e 12 unidades, tem-se, para produção média da semana: (R. 14 unidades )

2.4.1.2. – Propriedades da Média


1ª Propriedade
A soma algébrica dos desvios em relação à média é nula.
∑ di = 0
No exemplo anterior, temos:
Desvio em relação à média
É a diferença entre cada elemento do conjunto de valores e a média .
di = xi − x ou di = xi − µ
Para o exemplo dado, temos:

d1 = 10 – 14 = -4
d5 = 16 – 14 = 2
d2 = 14-14 = 0
d6 = 18 – 14 = 4
d3 = 13 – 14= -1
d7 = 12 – 14 = -2
d4 = 15 – 14 = 1

2ª Propriedade

Somando-se (ou subtraindo-se) uma constante (c ) a de todos os valores de uma variável a média
do conjunto fica aumentada (ou diminuída) dessa constante.
yi = xi ± c ⇒ y = x ± c

Somando-se 2 a cada um dos valores da variável do exemplo dado, tem-se:

y1 = 12 , y2 = 16 , y3 = 15 , y4 = 17 , y5 = 18 , y6 = 20 e y7 = 14

Calcule yi .
13
3ª Propriedade

Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante ( c ), a
média do conjunto fica multiplicada (ou dividida) por essa constante.
xi x
yi = xi.c ⇒ y = x.c ou yi = ⇒y=
c c
Multiplicando-se por 3 cada um dos valores da variável do exemplo dado, obtem-se:

y1 =30 , y2 = 42 , y3 = 39 , y4 = 45 , y5 = 48 , y6 = 54 e y7 = 36

Calcule yi = 42
2.4.1.4 – Dados Agrupados

2.4.1.4.1 – Sem intervalos de classe

As freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam
como fatores de ponderação, o que leva a calcular a média aritmética ponderada .

µ= ∑ xi. fi ( população ) X =
∑ xi. fi ( amostra )
N n

Exemplo:
Considerando a distribuição relativa a 34 famílias de quatro filhos, adotando-se a variável “número de
filhos do sexo masculino”, determine a média.

N.º de Meninos fi
0 2
1 6
2 10
3 12
4 4
Σ = 34

2.4.1.4.2. – Com intervalos de classe

Convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem


com o seu ponto médio, e determina-se a média aritmética ponderada.

µ= ∑ xi. fi ( população ) X =
∑ xi. fi ( amostra )
N n

onde Xi é o ponto médio da classe.

Exemplo:
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
14
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL

EXERCÍCIOS

1 – Calcule a média aritmética das seguintes distribuições amostrais:

a) Classes 30 |--- 50 |--- 70 |--- 90 |--- 110 |--- 130

fi 2 8 12 10 5

b) Consumo (kwh) 5 |--- 25 |--- 45 |--- 65 |--- 85 |--- 105 |--- 125 |--- 145 |--- 165

N.º de Usuários 4 6 14 26 14 8 6 2

c) Custos (R$) 450 |--- 550 |--- 650 |--- 750 |--- 850 |--- 950 |--- 1050 |--- 1150

fi 8 10 11 16 13 5 1

Respostas: a) x = 84,3, x = 79,5 Kwh x = R$ 754,69

2.4.2. – Moda ( Mo )

A moda de uma distribuição é o valor da variável que tem a maior freqüência absoluta
simples, quer dizer aquele valor que aparece mais [mais se repete]. Existem algumas situações
nas quais não existe moda, isto é, todos os valores da variável só aparecem uma vez, não se
repetem. Em outras situações pode-se ter mais de uma moda, isto é, quando dois ou mais valores
da variável têm maior freqüência [freqüências iguais], neste caso diz-se que o conjunto é bimodal.
Pode-se ter três, quatro, etc. Nestes casos é difícil escolher a moda como um representante do
grupo, uma vez que teremos muitos representantes.
Para que se possa obter o valor da moda é necessário que os dados estejam no mínimo em
escala nominal, quer dizer, com qualquer nível de mensuração podemos obter o valor da moda, uma
vez que ela é oriunda apenas de uma contagem. Portanto, a moda é o valor que ocorre com maior
freqüência em uma série de valores.

Exemplo: - o dono do restaurante vai preparar mais o filé de maior saída;


- maioria tirou “C” numa turma;
- o proprietário da loja de sapato vai comprar mais os números de maior saída.

2.4.2.1 – Dados não-agrupados

A moda é facilmente reconhecida: basta procurar o valor que mais se repete.

Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 12, 12, 12, 13, 15 tem moda igual a 12 .

• Amodal : são as séries nas quais nenhuma valor apareça mais vezes que outros.

Exemplo: 3, 5, 8, 10, 13.

• Multimodal : é uma série que possui dois ou mais valores modais.

Exemplo: Xi = 2 3 4 4 4 5 6 7 7 7
Mo1 = 4 Mo2 = 7

2.4.2.2. – Dados agrupados

2.4.2.2.1 – Sem intervalos de classe

É o valor da variável de maior freqüência.


15
Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos (ver página 14), indique a
moda dessa distribuição. R: = 3

2.4.2.2.2 – Com intervalos de classe

A classe que apresenta maior freqüência é denominada classe modal .

O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe
modal. Damos a esse valor a denominação de moda bruta .
Há, para o cálculo da moda, outros métodos mais elaborados, como, por exemplo, o que faz uso
da fórmula de CZUBER :

D1
Mo = li + .h
D1 + D 2
na qual:
li : Limite inferior de classe modal.
h : Amplitude da classe modal.
D1: fMo – f ant : freqüência simples da classe modal menos a freq. anterior.
D2: fMo – f post : freqüência simples da classe modal menos a freq. posterior.

Exemplo:

Calcule a moda da seguinte distribuição pela fórmula de Czuber:


SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$) Freqüências


150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL
R: R$ 159,6

2.4.3. – Mediana ( Md )

É o número que se encontra no centro de uma série de números, estando estes dispostos
segundo uma ordem.
Para que se possa obter o valor da mediana os dados têm que estar em uma escala de
medida no mínimo ordinal, uma vez que precisa-se ordená-los.
A mediana é o valor que divide o conjunto ao meio, isto é, concentra antes e depois de si,
50% das observações ordenadas. Ao contrário da média aritmética a mediana não sofre influência
quando temos no conjunto valores discrepantes [ tanto para mais como para menos ]. Neste caso a
mediana pode melhor representar um conjunto do que a média aritmética, porém não tem o mesmo
significado que aquela. A mediana pode ou não pertencer ao conjunto do qual ela é originária, vai
pertencer sempre que o conjunto tiver um número ímpar de informações e vai ou não pertencer
quando o conjunto tiver um número par de observações. Com isso já podemos ver que a quantidade
de observações influi na maneira pela qual vamos encontrar o valor da mediana.

2.4.3.1. – Dados não-agrupados

Estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor
mediano será, quando n for:

n +1
• impar : o termo de ordem ;
2
16
n n
• par : a média aritmética dos termos de ordem e +1.
2 2
Exemplo 1: Dada a série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, identifique a mediana.
Md = 10

Exemplo 2: Dada a série de valores: 2, 6, 7, 10, 12, 13, 18, 21, calcule a mediana.
Md = 11

• O valor da mediana pode coincidir ou não com um elemento da série.

2.4.3.2. – Dados agrupados


Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada
por:
n
2
2.4.3.2.1 – Sem intervalos de classe

É o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das


freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada.

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino, determine a mediana:

N.º de Meninos fi
0 2
1 6
2 10
3 12
4 4
Σ = 34

R: 2 meninos

• No caso de existir uma freqüência acumulada (Fi), tal que:


xi + xi +1
a mediana será dada por: Md = isto é, a mediana será a média aritmética entre o valor
2
da variável correspondente a essa freqüência acumulada e a seguinte.
Exemplo: Determine a mediana da distribuição abaixo:
Xi fi Fi
12 1
14 2
15 1
16 2
17 1
20 1
R: Md = 15,5

2.4.3.2.2 – Com intervalos de classe


Σf i
Classe mediana é aquela correspondente à freqüência acumulada imediatamente superior a .
2
Em seguida, emprega-se a fórmula:

n
( − Fant ).h
Md = liMd + 2
fMd

onde: li Md = Limite inferior da classe da mediana.


17
fi Md = Freqüência simples da classe da mediana.
h = amplitude da classe da mediana.
Fant = Freqüência acumulada anterior a classe da mediana.
Exemplo: Calcule a mediana da seguinte distribuição:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS


SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL
R: Md = R$ 160,54
Σf i
No caso de existir uma freqüência acumulada exatamente igual a , a mediana será o limite
2
superior da classe correspondente.
Exemplo:
i Classes fi Fi
0 |--- 10 1
10 |--- 20 3
20 |--- 30 9
30 |--- 40 7
40 |--- 50 4
50 |--- 60 2
26

EXERCÍCIOS
1 – Considerando os conjuntos de dados calcule a média, a mediana e a moda.
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 R: X = 5,1 Md = 5 mo = 5
b) 20, 9, 7, 2, 12, 7, 20, 15, 7 R: X = 11 Md = 9 mo = 7
c) 51,6; 48,7; 50,3; 49,5; 48,9 R: X = 49,8 Md = 49,5 amodal
d) 15, 18, 20, 13, 10, 16, 14 R: X = 15,1 Md = 15 amodal

2.5. MEDIDAS DE DISPERSÃO

2.5.1. – Dispersão ou Variabilidade

A média, ainda que considerada como um número que tem a faculdade de representar uma série
de números não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que
existe entre os valores que compõem o conjunto.

Considerando os seguintes conjuntos de valores das variáveis X, Y e Z:

X: 5, 5, 5, 5, 5.
Y: 3, 4, 5, 6, 7.
Z: 5, 0, 10, 8, 2.

Calculando a média aritmética de cada um desses conjuntos, obtem-se: X =Y = Z =5.


Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma
variável em torno do valor da média, pode-se dizer que o conjunto Xi apresenta dispersão ou
variabilidade nula e que o conjunto yi apresenta uma dispersão ou variabilidade menor que o
conjunto zi.

Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão
ou variabilidade entre esses valores e a sua média, é necessário recorre às medidas de dispersão.
18
Dessas medidas, estudaremos: a .variância absoluta, o desvio padrão e o coeficiente de variação
ou de variabilidade .

2.5.2. – Variância ( σ² ou s² ) e Desvio Padrão ( σou s )

A amplitude total e o desvio médio também são medidas de variação, no entanto a variância e o
desvio padrão levam em consideração a totalidade dos valores da variável em estudo sem utilizar
a idéia de módulo, o que faz delas índices de variabilidade bastante estáveis e os mais
empregados.

A variância baseia-se nos desvios em torno da média aritmética, porém determinando a


média aritmética dos quadrados dos desvios.
Dados não agrupados Dados agrupados

σ2 =
∑( xi − µ) 2

ou σ2 = ∑( xi − µ) 2
fi
( população )
N N

s2 =
∑( xi − x) 2
ou s2 =
∑( xi − x) 2
fi
( amostra )
n −1 n −1
ou

σ2 = ∑ xi 2

− µ2 σ2 = ∑xi 2
fi
− µ2 ( população )
N N

∑ xi ∑ xi
2 2
2
− nx 2
fi − n x
s 2
= s 2
= ( amostra )
n −1 n −1

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em
unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um
inconveniente.

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas,
denominada desvio padrão, definida como a raiz quadrada da variância.
σ = σ2 ( população )

s= s2 ( amostra )

• Tanto o desvio padrão como a variância são usados como medidas de dispersão ou
variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista.

• A variância é uma medida que tem pouca utilidade na estatística descritiva, porém é
extremamente importante na inferência estatística e em combinações de amostras.

Para o cálculo do desvio padrão, considera-se os seguintes casos:


2.5.2.1. – Dados não-agrupados

σ= ∑ xi 2

− µ2 ( população ) ou
N

∑ xi
2
2
− nx
s= ( amostra )
n −1
19
Observe como exemplo, o conjunto de valores da variável populacional x:

40, 45, 48, 52, 54, 62, 70

O modo mais prático para se obter o desvio padrão é formar uma tabela com duas
colunas:

Xi xi2

R: σ = 9,49

Exemplo: Calcule o desvio padrão, dados os valores da população: 8, 10, 11, 15, 16, 18
R: σ = 3,56
2.5.2.2. – Dados Agrupados

– Sem intervalo de classe

Como, neste caso, temos a presença de freqüências, deve-se levá-las em consideração,


resultando a fórmula:

σ = ∑ xi 2
fi
− µ2 ( população ) ou
N

∑ xi
2
2
fi − n x
s= ( amostra )
n −1

Exemplo: Calcule o desvio padrão da seguinte distribuição amostral:

Xi fi Xi fi X²i fi
0 2 0 0
1 6 6 6
2 12 24 48
3 7 21 63
4 3 12 48
30 63 165

R: s = 1,06

– Com intervalos de classe

Exemplo: Calcule o desvio padrão da tabela abaixo.


SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$) Freqüências
150 |--- 154 4
154 |--- 158 9
158 |--- 162 11
162 |--- 166 8
166 |--- 170 5
170 |--- 174 3
Total 40
FONTE: PESQUISA DO SETOR DE PESSOAL
R: s = R$ 5,64
As fórmulas apresentadas abaixo, para o cálculo do desvio padrão, só não são o método
usualmente mais prático, como também mais preciso. Quando a média não é exata e tem de ser
arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O
mesmo acontece com os quadrados, podendo os resultados do cálculo ser menos exatos.
20
Dados não agrupados Dados agrupados

σ= ∑ xi 2

− µ2 ou σ = ∑ xi 2
fi
− µ2 ( população ) ou
N N

∑ xi ∑ xi
2 2
2
− nx 2
fi − n x
s= ou s= ( amostra )
n −1 n −1

2.5.2.3 - Propriedades

1º) Somando-se (ou subtraindo-se) uma constante ( c ) a (de) todos os valores de uma variável, o
desvio padrão não se altera:
yi = xi ± c ⇒ σy = σx
2º) Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o
desvio padrão fica multiplicado por essa constante:
xi σx
yi = xi.c ⇒ σy = σx.c ou yi = ⇒ σy =
c c
3º) Em se tratando de uma distribuição normal, observa-se que entre os limites proporcionados
por:
a) µ ± σ, estão contidas cerca de 68% das informações;
b) µ ± 2σ, estão contidas cerca de 95% das informações;
c) µ ± 3σ, estão contidas cerca de 99% das informações.

2.5.3. – Coeficiente de Variação ( δ para população ou g para amostras )

É a caracterização da dispersão ou variabilidade dos dados em termos relativos a seu valor.


σ s
δ = ou g=
µ x

Exemplo 1: Determine o coeficiente de variação da distribuição de freqüência da página anterior:


R: g = 3,5%
Exemplo 2: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo
de indivíduos:
x s

Estaturas 175 cm 5,0 cm


R: g1 = 2,86% < g2 = 2,94%
Pesos 68 kg 2,0 kg

EXERCÍCIOS

1 – Calcule os desvios padrões dos conjuntos de dados amostrais :


a) 1, 3, 5, 9 R: s = 3,42
b) 20, 14, 15, 19, 21, 22, 20 R: s = 3,07
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2 R: s = 3,30
d) -10, -6, 2, 3, 7, 9, 10 R: s = 7,60

2 – Calcule os desvios padrões das distribuições:

a) Xi 2 3 4 5 6 7 8 R: s = 1,54

fi 1 3 5 8 5 4 2

3 – Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente:


N.º de Caras 0 1 2 3 4 5 R: s = 1,13
21
Freqüências 4 14 34 29 16 3

Calcule o desvio padrão.

– Calcule o desvio padrão da distribuição:

Classe 2 |--- 6 6 |--- 10 10 |--- 14 14 |--- 18 18 |--- 22


fi 5 12 21 15 7
R: s = 4,48
5 – Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio
padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que
disciplina foi maior a dispersão? R: Estatística
6 – Medidas as estaturas de 107 indivíduos, obtivemos X = 162,2 cm e s = 8,01 cm. O peso
médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos
apresentam maior variabilidade em estatura ou em peso? R: Estatura

7 – Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão de 5,97 cm.
Outro grupo de 125 moças tem um estatura média de 161,9 cm, sendo o desvio padrão igual a
6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais
homogêneo?
8 – Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de
variação de 3,3 %. Qual o desvio padrão desse grupo? R: 3,72% e 3,71% ; o segundo

9 – Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e g = 2,9 % . Determine a média


da distribuição. R: 51,72

3. NÚMEROS ÍNDICES
3.1. RELATIVOS E ÍNDICES

3.1.1. Conceito e aplicações


Números índices são medidas estatísticas usadas para mostrar as diferentes
variações da variável, ou variáveis em relação ao tempo, a localização, rendimento ou outras
características.

Um conjunto de números índices com determinada característica chama-se de


série de índices.

Os números índices servem para comparar custos referentes à alimentação, custo


de vida e produção de uma região, durante um período com os de outro período ou outra região.
Normalmente são utilizados nos negócios e na economia, porém também têm sua utilidade na
educação, saúde, segurança, etc.

Com finalidade financeira e econômica, os índices fornecem parâmetros para as


previsões e informações gerais freqüentemente utilizadas nos negócios. No Brasil encontram-se
índices de salários, de produção, de desemprego, custo de vida e outros. Os índices mais
conhecidos são o ÍNDICE GERAL DOS PREÇOS (IGP), calculado pela Fundação Getúlio Vargas,
e o ÍNDICE DE PREÇO AO CONSUMIDOR ( IPC), calculado pelo IBGE. Nos contratos de
trabalho, torna-se comum o uso de cláusulas de indexação que prevêem aumentos automáticos
de salários correspondentes ao acréscimo do custo de vida.

Pode-se dizer que o número índice é um indicador de tendência central de um


conjunto de variáveis, em duas ou mais situações, pretendendo refletir o comportamento de modo
aproximado de determinadas variáveis.
Normalmente a “cesta de produtos”, usualmente adotada para o cálculo do índice
do custo de vida, inclui o custo da:
- alimentação;
- vestuário;
- habitação;
- educação;
- transportes;
- gastos gerais.
22
Há limitação no cálculo destes índices, e pode-se dizer que eles funcionam bem
nos períodos de prosperidade e depressão moderadas, porém, falham durante uma forte
depressão.

3.2. ÍNDICE DE UM BEM


3.2.1. Relativos de preço

É um indicador que fornece a variação dos preços de uma mercadoria ou conjunto


de mercadorias, entre dois tempos ou espaços distintos.

É a relação entre o preço de uma única utilidade , em um período determinado, e


o de outro período chamado básico de referência.

Se os preços não se mantêm constantes em um período, pode-se obter uma


média adequada para expressar esta variação.

Seja:
Po = preço da utilidade durante o período básico
Pt = preço da utilidade durante o período considerado
Pt
Preço relativo = x 100
Po
Representa-se por: Pt,n

De maneira geral Pa e Pb são preços de uma utilidade durante os períodos a e b


respectivamente.

O preço relativo do período b, referido ao período a é definido por:

Pb
Pb/Pa e notado por: Pa,b =
Pa
Ex.: O preço médio de um litro de leite nos anos de 1999 e 2000 são
respectivamente R$ 0,6 e R$ 0,8. Tomando-se 1999 como básico e 2000 como ano dado tem-se:

preco2000 0,8
Preço relativo = P1999, 2000 = = = 1,33 = 133%
preco1999 0,6
Significa que o preço do leite em 2000 foi de 133% do de 1999, ou seja aumentou
33%.

3.2.2. Relativo de quantidade

É o indicador que fornece a variação nas quantidades de um produto ou de um


conjunto de produtos, entre dois períodos de tempo ou pontos no espaço. Por exemplo, num
índice de produção a expressão é a seguinte:
qt
o,t = x 100
qo
3.3. OS ÍNDICES DE LASPEYRES E DE PAASCHE
3.3.1. ÍNDICES PONDERADOS
Os índices simples apresentam algumas desvantagens, em especial, a
inexistência de pesos diferentes para cada utilidade que os compõem, de acordo com sua
importância relativa.

A ponderação utilizada nos métodos a seguir baseia-se na participação de cada


bem no valor transacionado total, mediante a fixação do peso na época básica ou peso variável na
época atual.

3.3.2. Índice de Laspeyres (época básica)


23
Constitui uma média ponderada de relativos, sendo os fatores de ponderação
determinados a partir de preços e de quantidades da época básica.

3.4.2.1. Índice de Preço ILPo, t

∑ Pt i . qoi
ILPo,t =
∑ Poi . qoi

3.4..2.2. Índice de Quantidade


(permuta-se P por q)
q i t . Poi
ILQo,t =
q i o. Po1
No Índice de Preço a diferença da importância gasta deve-se a variação nos
preços, e no índice de quantidade a variação se deve a variação nas quantidades adquiridas, uma
vez que os preços permanecem constantes.

Exemplo: Com os dados da tabela abaixo e considerando o ano de 2000 como


base, determine um índice de preço e de quantidade consumida, usando o método de Laspeyres .

Artigos 2000 2001 2002


Preço Quantidade Preço Quantidade Preço Quantidade
médio consumida médio consumida médio consumida
açúcar 2 4 2 5 3 6
arroz 3 3 4 2 6 3
feijão 5 2 6 5 8 6

Índice de Laspeyres de preço


∑ pt i . qoi
ILPo,t =
∑ poi . qoi
∑ p i 01.q i 80 ( 2 x 4) + ( 4 x3) + ( 6 x 2 ) 32
ILP00,01 = = = = 1,1852 ou 118,52%
∑ p i 00.q i 80 ( 2 x 4 ) + ( 3x3) + ( 5 x 2 ) 27
∑ p i 02.q i 80 ( 3x 4 ) + ( 6 x3) + ( 8 x 2 ) 46
ILP00,02 = = = = 1,7037 ou 170,37%
∑ p i 00.q i 80 ( 2 x 4) + ( 3 x3) + ( 5 x 2 ) 27

Índice de Laspeyres de Quantidade


∑ qt i . Poi
ILQo,t =
∑ qoi . poi
∑ q i 01. p i 80 ( 5 x 2) + ( 2 x3) + ( 5 x5) 41
ILQ00,01 = = = = 1,5185 ou 151,85%
∑ q i 00. p i 80 ( 4 x 2 ) + ( 3 x3) + ( 2 x5) 27
∑ q i 02. p i 80 ( 6 x 2 ) + ( 3 x3) + ( 6 x5) 51
ILQ00,02 = = = = 1,8889 ou 188,89%
∑ q i 00. p i 80 ( 4 x 2 ) + ( 3 x3) + ( 2 x5) 27

3.3..3. Índice de Paasche (época atual)


Trata-se de uma média ponderada de relativos, sendo os pesos calculados com
base nos preços e nas quantidades dos bens da época atual. A base portanto é a época atual. É a
relação do dispêndio com o componente i na época atual com o total da mesma época.

3.3..3.1. Índice de Paasche de preço

∑ Pt i . qt i
IPPo,t =
∑ Poi . qt i
24

O índice mede a relação entre o dispêndio monetário necessário para adquirir


bens nas quantidades e sistemas de preços da época atual e o dispêndio dado pelas quantidades
da época atual aos preços vigentes na época básica.

3.3..3.2. Índice de Paasche de Quantidade


∑ qt i pt i
IPQo,t =
∑ qoi pt i

3.4. ÍNDICES DE BASE FIXA E MÓVEL

3.4.1. ÍNDICES DE BASE FIXA


São séries de números índices construídas através da fixação de um período
base.

A fixação da base possui uma importância considerável já que alguns índices,


geralmente, não satisfazem a propriedade circular, no caso do Índice de Laspeyres, por exemplo,
ao fixar-se a base de comparação, fixa-se também a base de ponderação.

3.4.2. ÍNDICE DE BASE MÓVEL (ENCADEADA)


A base, neste método, é alterada de período a período. O método consiste:
a) construção de índices em elos
IO,1,I1,2. I (t-l),t
b) construção de um índice em cadeia, fixando-se determinado período como
base, aplicando-se o critério circular.
IO,1 = IO,1
IO,2 = IO,1.I1,2
IO,3 = IO,1 . I1,2. I2,3

3.5. TROCA DE BASE

A mudança de base na prática, de uma série de número, para uma base mais
recente, é feita dividindo-se cada índice da série original pelo número índice correspondente à
nova época base. Sob o aspecto matemático este procedimento só é válido e aplicável quando os
números índices satisfazem as propriedades circular (não é válido para os índices de Laspeyres,
Paasche, pois apresentam pesos variáveis, onde a mudança no período exige a mudança dos
pesos).

Exemplo: A tabela a seguir apresenta a produção industrial no período de 1979 a


1990, sendo o ano de 1979 considerado a época base. Obter um novo índice adotando como
básico o ano de 1983.

1)
Anos Índice produção industrial Novo índice
(1979 = 100) (1983 = 100)
1979 100 83
1980 104 87
1981 97 81
1982 112 93
1983 120 100
1984 124 103
1985 134 112
1986 125 104
1987 139 116
1988 143 119
1989 143 119
1990 134 112
Fonte: Dados Hipotéticos
25

2) Conjugação de duas ou mais séries.


Ano Índice antigo Índice novo Mudança base Índice conjugado
(1980 = 100) (1985=100) índice antigo (1985=100
(1985 = 100)
1980 100 50 50
1981 90 45 45
1982 108 54 54
1983 160 80 80
1984 196 98 98
1985 200 100 100 100
1986 120 120
1987 160 160
1988 210 210
1989 240 240
1990 250 250

Os índices, na mudança de base para 1985, foram divididos por 200 e


multiplicados por 100 este resultado. A última coluna fornece a série completa.

Se a série de 80 a 85 for construída com base na fórmula de Laspeyres,


estaríamos admitindo que as quantidades de 1985 e não de 1980 estariam agora figurando como
pesos, uma vez que neste índice, os pesos (quantidades) mudam quando mudar a base.

Pelo método de Laspeyres os I83,80 e I85,80 seriam assim expressos:

P83. q80 P85. q 80


= 160 e = 200
P80. q 80 P80. q 80

Mudando de base para 1985, pelo método abreviado para o ano de 1983, as
expressões seriam:
P83. q80 160
= = 0,8 ou 80%
P85. q80 200

P83. q80 P83. q 85



P85. q80 P85. q 85

Os valores só coincidem quando as quantidades (pesos) de 1980 forem iguais a 1985. Esse
exemplo mostra as limitações do método prático.

3.6. NÚMEROS ÍNDICES EM CADEIA

São encadeamentos de números índices que satisfazem o teste circular.

Seja P1, P2 e P3 os preços de um produto em 3 períodos. Então pode-se dizer:


P3 P3 P2
I (P3/P1) = = I (P3/P2). I (P2/P1)
P1 P 2 P1
O mesmo acontece com as quantidades. E isto é denominado de encadeamentos
que satisfazem o teste circular.
Os índices construídos por encadeamento somente coincidem com os de base
fixa, quando a fórmula utilizada satisfizer a propriedade circular.
4. PROBABILIDADE

4.1. – Experimento Aleatório


26
São aqueles que não podem ser previamente determinados. Essa impossibilidade de prever-se os
resultados, chamamos de acaso .

Exemplo: Lançar um dado e anotar o número que ocorrerá na face voltada para cima.

4.2. – Espaço Amostral ( E )

É o conjunto formado por todos os resultados possíveis de um experimento aleatório.

Exemplo 1: Ao se lançar um dado e observar a face superior, tem-se o espaço amostral:


E = { 1,2,3,4,5,6 }

Exemplo 2: Numa partida de futebol, uma das equipes pode obter resultados tais como: vitória (v),
empate (e) ou derrota (d). Tem-se então:
E = { v, e, d }
4.3. – Evento

É um conjunto qualquer de resultados de um experimento aleatório. Pode-se dizer que um


evento é um subconjunto do espaço amostral.

Tipos de eventos:

• Evento certo – é o próprio espaço amostral.

Exemplo: Lançamento de um dado e ocorrência de um número menor ou igual a 6 na face


superior.

• Evento impossível – é o subconjunto vazio do espaço amostral.

Exemplo: Lançamento de um dado e ocorrência de um número maior do que 6 na face superior.

• Eventos elementares – são aqueles que têm um só elemento.

Exemplo: Lançamento de um dado e ocorrência de um número ímpar maior do que 4 na face


superior.

EXERCÍCIOS

1 – No lançamento de uma moeda duas vezes consecutivas, determine o número de ocorrência


de:
R: E = { (C,C),(C,K),(K,C),(K,K) }
a) duas coroas (c); R: 1
b) duas caras (k); R:1
c) exatamente uma cara; R: 2
d) exatamente uma coroa; R: 2
e) pelo menos uma cara; R: 3
f) pelo menos uma coroa; R: 3
g) no mínimo uma cara; R: 3
h) no máximo uma cara. R: 3

2 - No lançamento consecutivo de dois dados de cores diferentes, um vermelho e um branco,


observando-se a face superior temos o seguinte espaço amostral:

(1,1);(1,2);(1,3);(1,4);(1,5 );(1,6)
(2,1);(2,2);(2,3);(2,4);(2,5 );(2,6)
E= (3,1);(3,2);(3,3);(3,4);(3,5 );(3,6)
(4,1);(4,2);(4,3);(4,4);(4,5 );(4,6)
(5,1);(5,2);(5,3);(5,4);(5,5 );(5,6)
(6,1);(6,2);(6,3);(6,4);(6,5 );(6,6)

Com base no espaço amostral acima, determine a ocorrência de números:


27
a) iguais nos dois dados; R: 6
b) cuja soma seja 12; R: 1
c) cuja soma seja menor ou igual a 12; R: 36
d) cuja soma seja igual a 9; R: 4
e) cuja soma seja menor que 10; R: 30
f) cuja soma seja 7; R: 6
g) iguais ou com soma igual a 8; R: 10
h) múltiplos de 3 nos dois dados. R: 4

4.1. O CÁLCULO DA PROBABILIDADE


Chamamos de probabilidade de um evento A ( A ⊂ E) o número real P(A), tal que:

n( A)
P ( A) =
n( E )

onde: n(A) é o número de elementos de A;


n(E) é o número de elementos de E.

Exemplo 1: Considerando o lançamento de uma moeda e o evento A “obter cara”.

R: E = { k, c } n(E)=2
A={k} n(A)=1

n( A) 1
P ( A) = =
n( E ) 2

Exemplo 2: Considerando o lançamento de um dado, vamos calcular a probabilidade do:


R: E = { 1,2,3,4,5,6 }
a) evento A “obter um número par na face superior”. R: 1/2
b) evento B “obter um número menor ou igual a 6 na face superior”. R: 6/6
c) evento C “obter um número 4 na face superior”. R: 1/6
d) evento D “obter um número maior que 6 na face superior”. R: 0/6

Pelos exemplos que acabamos de ver, podemos concluir que:


• Probabilidade do evento certo é igual a 1.
• Probabilidade do evento impossível é igual a 0.
• Probalidade de um evento A qualquer ( A ⊂ E ) um número real P(A), tal que:
0 ≤ P( A ) ≤ 1

Exemplo 3: Qual a probabilidade de sair o ás de ouro quando retiramos uma carta de um baralho
de 52 cartas?
R:1/52

Exemplo 4: Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52
cartas?
R:1/13

Exemplo 5: Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule a
probabilidade de essa peça ser defeituosa.

R:1/3

Exemplo 6: No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.


R:1/9

Eventos Complementares ( P (A ) )


28
A probabilidade de não ocorrer o evento A é igual a 1 menos a probabilidade de ocorrer A,
que pode ser representada por:

P (A ) = 1 – P(A)

Exemplo: A tabela a seguir, apresenta o número de bombas injetoras existentes em uma fábrica,
conforme as suas características. Todas estão em caixas iguais. Escolhendo uma caixa
ao acaso, determine a probabilidade dela:

Bombas Elétricas Manuais


Novas 45 30
Usadas 15 10

a) conter uma bomba nova;


R:3/4
b) conter uma bomba manual;
R:2/5
c) não conter uma bomba elétrica nova;
R:11/20
d) não conter uma bomba manual usada.
R:9/10
3.2. AXIOMAS E TEOREMAS
A probabilidade de ocorrer um evento A é representado por p(A) que satisfaz os seguintes
axiomas.
1) P (A) ≥ 0

2) P (s) = 1

3) P (φ) = 0 ( A probalidade de um conjunto vazio é zero.)

4) P (AUB) = P (A) + P (B) ( teorema da soma para eventos mutuamente exclusivos)

EVENTOS MUTUAMENTE EXCLUSIVOS (DISJUNTOS):

Dois ou mais eventos são mutuamente exclusivos quando a ocorrência de um impede a


ocorrência do outro. Diferentemente dos eventos complementares onde não necessariamente a
união de dois eventos mutuamente exclusivos vai constituir o espaço amostral. Por isso todos os
eventos complementares são mutuamente exclusivos, mas a recíproca não é verdadeira. Por
exemplo, se lançarmos um dado e considerarmos os seguintes eventos: o primeiro estabelece o
resultado como um número maior que dois { 3, 4 , 5 , 6} e o segundo um resultado menor que dois
{ 1 }. Nesse caso um número não pode ser maior e menor que dois ao mesmo tempo e a união
dos dois conjuntos não forma o espaço amostral, pois o 2 está de fora.
Sendo A e B evento mutuante excludentes, isto é não podem ocorrer ao mesmo por A ∩ B = φ

A B

5) Se A1, A2.... An são dois eventos mutuante excludentes.



P ( A1 U A2 U A3 U.... U An U...) = Σ P (Ai)
i=1
6) P (AUB) = P (A) + P (B) – P (A ∩ B ) ( regra geral ou para eventos não exclusivos)

EVENTOS NÃO EXCLUSIVOS:

Dois ou mais eventos são não mutuamente exclusivos quando é possível ambos
ocorrerem simultaneamente. Necessariamente os dois eventos não necessitam ocorrer juntos.
29

A B

4.3. PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA DE EVENTOS

REGRAS DE MULTIPLICAÇÃO:

As regras de multiplicação se relacionam com a determinação da probabilidade da


ocorrência conjunta de A e B, isto é a interseção de A e B.
P (A e B) = P (A ∩ B ) = P (A) . P (B) (para eventos independentes)
P (A e B) = P (A ∩ B ) = P (A) . P (B / A) (para eventos dependentes)

EVENTOS INDEPENDENTES:

Diz-se que dois ou mais eventos são independentes, quando eles não exercem ações
recíprocas, comportando-se cada um de maneira que lhe é própria, sem influenciar os demais. Isto
é, a ocorrência de um não influencia de maneira alguma a ocorrência do outro. Lançando-se uma
moeda o fato de sair cara no primeiro lançamento em nada influencia a probabilidade de sair uma
nova cara, ou não, em um segundo lançamento, porém, em um sorteio como o da loto, o fato de
um número ter saído no primeiro sorteio já altera as probabilidades dos outros números saírem
nos próximos sorteios.

EVENTOS DEPENDENTES:
Dois ou mais eventos são dependentes, quando eles exercem ações recíprocas, ou seja a
ocorrência de um influencia de alguma maneira a ocorrência do outro.
O diagrama de árvore é particularmente útil como método para descrever os possíveis eventos
conjuntos associados com as observações ou as tentativas seqüenciais.
Exemplo: A probabilidade de duas pessoas A e B resolverem um problema são 1/3 e 2/5,
respectivamente. Sabendo que a resolução do problema é independente para A e B, calcule a
probabilidade de que:
(a) nenhum resolva o problema
(b) pelo menos um resolva o problema
(c) A resolva o problema, mas B não
(d) B resolva o problema, mas A não.
Pessoa A pessoa B evento conjunto probabilidade do evento conjunto
Br Ar e Br 1/3 . 2/5
Ar Ar e Br 1/3 . 3/5
Br
Ar Br Ar e Br 2/3 . 2/5

Br Ar e Br 2/3 . 3/5

4.5. DISTRIBUIÇÃO DE PROBABILIDADE

4.5.1. Variáveis Aleatórias

É uma função com valores numéricos, cujo valor é determinado por fatores de chance .

As variáveis aleatórias são discretas ou contínuas .

Uma variável aleatória é considerada discreta quando os valores podem ser contados .

Exemplo: - Número de acidentes numa semana;


- Número de defeitos de sapatos;
30
- Número de terremotos;
- Número de livros numa estante; etc.

4.5.2. Valor Esperado ou Esperança Matemática ( E (x) )

Se uma variável aleatória x com os valores x1, x2,...xn, associado as probabilidades


correspondentes p(x1), p(x2),...p(xn) então o seu valor esperado é:

E(x) = x1 p(x1 ) + x2 p(x2) + .... +xn p(xn)

O valor esperado de um experimento é uma média, e pode ser calculado como:

E(x) = Σ Xi p(Xi)

Exemplo 1: Se jogamos um dado equilibrado, qual o valor esperado numa jogada?

R.: 3,5

Exemplo 2: Um investidor julga que tem 0,40 de probabilidade de ganhar R$ 25 000,00 e 0,60 de
probabilidade de perder R$ 15 000,00 num investimento. Seu ganho esperado é:

R.: R$ 1000
4.5.3. Desvio padrão ( σ (x) )
O desvio padrão é calculado com a fórmula:
σ ( x) = ∑ xi p( xi) − [ E ( x)]
2 2

Exemplo 3: Um empreiteiro faz as seguintes estimativas:

Prazo de execução Probabilidade Xi P(Xi) Xi² P(Xi)


10 dias 0,20 2 2
15 dias 0,30 4,5 4,5
22 dias 0,50 11 11
17,5 17,5

O prazo esperado para execução da obra, de acordo com essas estimativas, é:


R.: 17,5 DIAS.

O desvio padrão é:
σ ( x) = 329,5 − 306,25 = 4,82

EXERCÍCIOS

1 – Dez por cento dos carros num parque de carros usados têm bateria defeituosa. Se há 82
carros no lote, qual o número esperado de carros com bateria defeituosa?
R.: 8,2
2 – O número de chamadas telefônicas recebidas por uma mesa e suas respectivas
probabilidades para um intervalo de 3 minutos são:

Número de chamadas 0 1 2 3 4 5
Freqüência relativa 0,60 0,20 0,10 0,04 0,03 0,03

Em média, quantas chamadas podem ser esperadas num intervalo de 3 minutos?


R.: 0,79
3 – O Departamento Nacional de Saúde relata que aproximadamente 15% dos adultos do país
serão atingidos por determinada espécie de gripe nos próximos 12 meses. Para uma cidade de
250 000 adultos, quantos podemos esperar serem afetados?
31
R.: 37500
4.6. – Distribuição de Probabilidade

Consideremos a distribuição de freqüências relativa ao número de acidentes diários em um


estacionamento:
Número de Acidentes Freqüências Probabilidades
0 22 0,73
1 5 0,17
2 2 0,07
3 1 0,03
∑ = 30

Em um dia, a probabilidade de:


a) não ocorrer acidente é: R.: 0,73
b) ocorrer um acidente é: R.: 0,17
c) ocorrerem dois acidentes é: R.: 0,07
d) ocorrerem três acidentes é: R.: 0,03

Pode-se, então, escrever:


Número de Acidentes (Xi) Probabilidades P(Xi)
0 0,73
1 0,17
2 0,07
3 0,03
Σ 1

Essa tabela é denominada DISTRIBUIÇÃO DE PROBABILIDADE .

Seja X uma variável aleatória que pode assumir os valores x1, x2,...xn. A cada Xi
correspondem pontos do espaço amostral. Associando, então, a cada valor Xi a probabilidade pi
de ocorrência de tais pontos no espaço amostral tem-se um distribuição de probabilidade.

Onde, Σ pi = 1

Exemplo 1: Considerando o espaço amostral relativo ao “lançamento simultâneo de duas moedas”


e se X representa “o número de caras” que aparecem, a cada ponto amostral, construa
uma distribuição de probabilidade.

Número de caras (XI) P( XI )


0 0,25
1 0,5
2 0,25
Σ 1
4.7. Distribuição Binomial
Requisitos:
1) Um experimento repetido n vezes independentes.

2) A probabilidade de ocorrer um evento A é representado por p e é dita prob. de sucesso.

O valor de p é calculado para um experimento isolado.

3) A probabilidade de não ocorrer A é dita, prob. de insucesso e é representado por q, sendo


p+q=1
32

4) Seja X a variável aleatória discreta (vad) que assume os valores 0, 1, 2, ....n e representa
o número de sucessos em n repetições do experimento.
n!
Satisfeitas estas condições a P (X = x) = f (x) = p ( x) = p x q n− x
x!( n − x)!
x = nº de sucessos
n = nº de experimento

p = probabilidade de sucesso com 1 experimento.

Ex:

1) A probabilidade de ganhar em um certo jogo é 40% em 1 rodada, se uma pessoa vai


jogar 5 rodadas, qual a probabilidade de ganhar:

a) uma rodada:

P = 0,40 q = 0,60 p+q=1


x=1
n=5

P(X=1)=5x 0,4x 0,1296 = 0,2592


x x (n-x)
P ((X = x) = f (1) = C . p . q
n

b) mais de 4 rodadas
X=4
5 5 0
P (x>4) = (x=5) f (x) = C . 0,4 . 0,6 = 1 x 0,01024 = 0,01014
5

c) no máximo 1 rodada

X = 0 f (0) + f (1) = f (0) + f (1)


0,2592 + 0,0776 = 0,3868
0 0 5
C . 0,4 . 0,6 = 0,0776
5

d) no mínimo 2 rodadas

f (2) U f (3) U f (4) U f (5)

ou

1 - (f (0) + f (1)) = 0,6632

2. Um time de futebol tem prob. constante de vencer um jogo num torneio equivalente a
30% qual a probabilidade de vencer a maioria das partidas em um torneio constituído por 5 jogos.

P (X ≥ 3) = P (x = 3) + P (x = 4) + P (x = 5)

n=5
p = 0,30
q = 0,70

3. Uma companhia que vende equipamentos eletrônicos verifica que de todas as máquinas
por ela instaladas, 40% exigem novos ajustamentos após a instalação.
33

a) Em 4 equipamentos instalados, qual a probabilidade de pelo menos 1


equipamento necessitar ajustamento.

a) P = 0,40
q = 0,60
n=4

p (x ≥ 1 ) = 1 - p (x = 0)

0 0 4-0
p (x = 0) = C p q
4
p (x ≥1) = 1 - 0,1292 = 0,8704

4.,7. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE


4.7.1. A DISTRIBUIÇÃO NORMAL

Entre as distribuições teóricas de variável aleatória contínuas, uma das mais empregadas é a
DISTRIBUIÇÃO NORMAL .

O aspecto gráfico de uma distribuição normal é o da figura abaixo:

Principais características:

1ª) A variável aleatória X pode assumir todo e qualquer valor real .

2ª) A representação gráfica da distribuição normal é uma curva em forma de sino,


simétrica em torno da média, que recebe o nome de curva normal ou GAUSS .

3ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.

4ª) A curva normal é ASSINTÓTICA em relação ao eixo das abscissas, isto é, aproxima-se
indefinidamente do eixo das abscissas sem, contudo, alcançá-lo.

5ª) Como a curva é SIMÉTRICA em torno da média, a probabilidade de ocorrer valor maior
do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as
probabilidades são iguais a 0,5 . Escreve-se: P (X > µ ) = P (X < µ ) = 0,5 .

Quando existe uma variável aleatória com distribuição normal, o principal interesse é obter
a probabilidade dessa variável aleatória assumir um valor em um determinado intervalo. Para
calcular essa probabilidade é usada a distribuição normal padrão.

A DISTRIBUIÇÃO NORMAL REDUZIDA (PADRÃO) (Z) tem distribuição normal de média 0


e desvio padrão 1. X ∼ N (µ = 0; σ = 1)
X −µ
Z=
σ

A tabela de distribuição normal reduzida, em anexo, apresenta a probabilidade de Z


assumir qualquer valor entre a média 0 e um dado valor Z, isto é: P(0<Z<Z)
34
Exemplo 1: Em um exame final de Matemática, a média foi 72 e o desvio padrão 15. Determinar a
variável reduzida (isto é, os graus expressos em unidades de desvio padrão) dos estudantes que
obtiveram graus:

a) 60; R.: -0,8 b) 93; R.: 1,4 c) 72. R.: 0

Exemplo 2: Com referência ao exemplo 1, determinar os graus correspondentes aos escores


reduzidos:

a) –1 ; R.: 57 b) 1,6. R.: 96

Exemplo 3: Dois estudantes foram informados de que alcançaram as variáveis reduzidas de 0,8 e
–0,4, respectivamente, em um exame de múltipla escolha de inglês. Se seus graus foram 88 e 64,
respectivamente, determinar a média e o desvio padrão dos graus do exame.
R.: 72 e 20
Exemplo 4: Determinar a área limitada pela curva normal em cada um dos casos abaixo:
a) Entre z = 0 e z = 1,2 R.: 0,3849
b) Entre z = -0,68 e z = 0 R.: 0,2518
c) Entre z = -0,46 e z = 2,21 R.: 0,6636
d) Entre z = 0,81 e z = 1,94 R.: 0,1828
e) À esquerda de z = - 0,6 R.: 0,2742
f) À direita de z = -1,28 R.: 0,8997
g) À direita de z = 2,05 e à esquerda de z = -1,44 R.: 0,0951

EXERCÍCIOS

1 – Determinar a média e o desvio padrão de um exame, cujos graus 70 e 88 correspondem,


respectivamente, os escores reduzidos –0,6 e 1,4.
R.: 75,4 e 9
2 – Determinar a área subtendida pela curva normal:
a) cc R.: 0,2991
b) À esquerda de z = -1,78 R.: 0,0375
c) À esquerda de z = 0,56 R.: 0,7123
d) À direita de z = -1,45 R.: 0,9265
e) Correspondente a z ≥ 2,16 R.: 0,0154
f) Corresponde a -0,80 ≤ z ≤ 1,53 R.: 0,7252
g) À esquerda de z = -2,52 e à direita de z = 1,83 R.: 0,0395
h) Corresponde a z ≥ -1,64 R.: 0,9495
i) Corresponde a -1,96 ≤ z ≤ 1,96 R.: 0,9500

Exemplo 5: Determinar o valor, ou valores, de z em cada um dos casos, nos quais as áreas
referem-se às limitadas pela curva normal:

a) A área entre 0 e z é 0,3770.


b) A área à esquerda de z é 0,8621.
c) A área entre –1,5 e z é 0,0217.
Exemplo 6: O peso médio de 500 estudantes do sexo masculino, de uma determinada
universidade, é 75,5 kg e o desvio padrão é 7,5 kg. Admitindo-se que os pesos estão
distribuídos normalmente, determinar quantos estudantes pesam:

a) entre 60 e 77,5 kg; R.: 294 estudantes


b) mais do que 92,5 kg. R.: 6 estudantes

Exemplo 7: Determinar quantos estudantes do exemplo 6 pesam:

a) menos do que 64 kg; R.: 32 estudantes


b) 64 kg; R.: 0 estudantes

Exemplo 8: A média dos diâmetros internos de uma amostra de 200 arruelas produzidas por uma
certa máquina é 0,502 polegadas e o desvio padrão é 0,005 polegadas. A finalidade para a qual
35
essas arruelas são fabricadas permite a tolerância máxima, para o diâmetro, de 0,496 a 0,508
polegadas; se isso não se verificar, as arruelas serão consideradas defeituosas. Determinar a
percentagem de arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros
são distribuídos normalmente.
R.: 0,2302
5. AMOSTRAGEM
5.1. CENSO X AMOSTRA
População:
Qualquer conjunto que possui, pelo menos, uma característica em comum.

Exemplo: Produção de peças da Indústria X.


A população pode ser finita ou infinita.
População finita:
É aquela em que é possível enumerar todos os seus elementos.
População infinita:
É aquela em que não é possível enumerar todos os seus elementos.
Uma população finita pode ser transformada, mediante processos operacionais,
em infinita.
Ex.: Retirar as fichas de uma urna e, depois de cada extração, repô-las.
Pesquisa estatística: Pode ser feita através de dois processos: censo e
amostragem.
CENSO: Quando é investigada todas (sem exceção) as unidades de uma população.

AMOSTRA: Uma amostra é qualquer subconjunto não vazio de uma


população. Pode ser uma amostra com caráter científico: probabilística ou sem caráter
científico: não probabilística.
AMOSTRAGEM: É o processo através do qual é selecionada uma amostra de
uma população. Nesta etapa define-se quais unidades populacionais que irão fazer parte da
amostra.
As razões pelas quais opta-se por realizar uma pesquisa amostral ao invés de um
censo são:

 Economia de tempo;

 Economia de custos;

 Economia de trabalho;

 Quando a população for infinita ou muito grande;

 Quando a investigação for destrutiva.


Apesar do processo amostral apresentar estas vantagens sobre o processo
censitário ele acaba perdendo em precisão, pois é estudado apenas um subconjunto da
população. Nesse caso todo resultado de amostra está sujeito a um erro amostral, o que não
ocorre no censo, porém este custa mais caro, leva mais tempo e dá mais trabalho, principalmente
quando a população é muito grande.
5.2. AMOSTRAGEM PROBABILÍSTICA E SUBJETIVA
O método de amostragem, como foi dito, é classificado em:
PROBABILÍSTICO: Quando todos os elementos da população têm probabilidade
conhecida, e diferente de zero, de ser incluídos na amostra. Nesse caso este tipo de amostragem
é o que dá a melhor garantia de representatividade da amostra em relação a população.
NÃO-PROBABILÍSTICO: Quando a seleção é subjetiva, ou seja, a escolha dos elementos
da amostra é feita de forma não-aleatória, justificadamente ou não. A chance que cada elemento
tem de ser selecionado na amostra é desconhecida. Decorre disso que as probabilidades de
serem identificadas características semelhantes da amostra e da população são pequenas ou
inconsistentes.
36
5.3. O MÉTODO DE AMOSTRAGEM ALEATÓRIA SIMPLES
1. Conceitos Básicos:
Um processo de amostragem pode ser desenvolvido de duas maneiras distintas, são elas:
AMOSTRAGEM COM REPOSIÇÃO:
Uma amostra é dita com reposição quando as unidades amostrais são devolvidas à
população, após cada extração.
AMOSTRAGEM SEM REPOSIÇÃO:
Quando a unidade amostral que é investigada não volta novamente para a
população. Nesse caso utilizamos este tipo de amostragem para pequenas amostras.
A diferença básica entre um tipo e outro de amostragem é a possibilidade de um
elemento ser ou não considerado mais de uma vez na amostra que está sendo produzida.
Processo de amostragem aleatória simples: (AAS) É aquele em que a
amostra é dita aleatória simples.
Definição: Uma amostra aleatória simples ( A A S ) é aquela em que cada
elemento da população tem mesma chance de pertencer a amostra. Para o processo de AAS é
necessário: 1º) ter um cadastro; 2º) a variância da população deve ser pequena; 3º) cada elemento
deve ter igual probabilidade de seleção.
Tipos de amostragem aleatória simples: a) A A S com reposição; b) A A S sem reposição.

Número de A A S que se obtêm de uma população:


a) Finita
- Adotando o processo A A S com reposição.

K = Nn onde N é o tamanho da população, n é o tamanho da amostra.


- Processo de A A S sem reposição
N!
K = c Nn =
n!( N − n)!

b) Infinita: Não se conhece o número de elementos da população.


Teremos infinitas amostras

5.4.Distribuição Amostral de Médias


Se a partir de uma certa população, calcula-se a média de todas as amostras possíveis de mesmo
tamanho n, teremos uma distribuição amostral de médias.
Propriedades de uma distribuição amostral de médias:
1º Propriedade:
A expectância de X é a média da população. E (X) = µ
2º Propriedade:
O desvio padrão da distribuição amostral de medias de uma população infinita é da pela expressão.
_
σ
σx=
n

3ºPropriedade:
O desvio padrão da distribuição de media considerando uma população finita é dado pela expressão.

onde ,
− N −n σ
σx= .
N −1 n
N −n é dito fator de correção para populações finitas.
N −1
Exercícios sobre amostragem:

1.Uma população consiste de 5 números: 1, 3, 5, 7 e 9.


37
a) Determine os parâmetros média e variância absoluta.
b) Determine o número de amostras possíveis de tamanho 2, que podemos obter da
população em questão, adotando-se o esquema de AAS, sem reposição.
c) Considerando a variável x, baseado em todas as amostras possíveis sem reposição,
determine a média e o desvio padrão da distribuição amostral de x.
a)

µ=
∑ x = 25 = 5
N 5

σ2 =
∑x 2

− µ2 =
(1 + 9 + 25 + 49 + 81)
− 52 =8
N 5
σ= 8 = 2,83

5! 4 x5
b) C 53 = = = 10
2!(5 − 2)! 2
E( X ) = µ = 5
E ( X ) = ∑ xP x
Adotando-se o processo de A A S sem reposição com amostras de tamanho 2, tem-se:

1, 3 1, 5 1, 7 1, 9 3, 5 3, 7 3, 9 5, 7 5, 9 7, 9

amostras Médias amostrais P(x) x i . P(x) x² i . P(x)


1;3 2,0 0,10 0,20 0,40
1;5 3,0 0,10 0,30 0,90
1;7 4,0 0,10 0,40 1,60
1;9 5,0 0,10 0,50 2,50
3;5 4,0 0,10 0,40 1,60
3;7 5,0 0,10 0,50 2,50
3;9 6,0 0,10 0,60 3,60
5;7 6,0 0,10 0,60 3,60
5;9 7,0 0,10 0,70 4,90
7;9 8,0 0,10 0,80 6,40
Σ 1 5,00 28,00

c)
_
N −n σ
σx= . _
5−2 8
N −1 n σx= . = 0,866(2) = 1,73
5 −1 2

2
σ ( X ) = (Σ X P X ) − (Ε( X )) 2 = 28 − 25 = 1,73

2. Uma variável apresenta média 56 e variância 6,7. Considerando todas as amostras possíveis de
tamanho 100 que podem ser selecionadas dessa população, utilizando o processo de AAS sem
reposição, determine.

a) A média da distribuição amostral de médias.


b) A variância absoluta da distribuição amostral de médias.
c) O desvio padrão da distribuição amostral de médias.

µ = 56
σ²= 6,7
n = 100
38

_
a)
E ( x) = µ = 56

b)
2
2 σ  σ 2 6,7
σx =   = = = 0,067
 n n 100

c)
− 6,7
σx= = 0,258 = 0,067
n

4º) Propriedade
Seja X uma variável aleatória normalmente distribuída com média µ e desvio
padrão σ. A variável aleatória x obtida de todas as amostras possíveis de tamanho n, terá
distribuição normal com média E (X) = µ e desvio padrão σx. Portanto podemos associar a V.A. X
uma V.A. padronizada:
X−µ
Z= _
~ N (0,1)
σx

3. Sabendo-se que o peso, dado em gramas, de determinado produto, produzido por uma fábrica está
normalmente distribuído com média 400 e desvio padrão 40g, determinar.

a) A probabilidade da média de 1 amostra de tamanho 100, pertencer ao intervalo


[390;410].
b) A probabilidade da média de 1 amostra de tamanho 25, pertencer ao intervalo
[390;410].
c) A probabilidade da média de 1 amostra constituída por 400 artigos pertencer ao
intervalo [390;410].
µ = 400; σ = 40
a) P (390 ≤ x ≤ 410) = P (Z1 ≤ Z ≤ Z2)

− σ 40
σ = 40 g → σ x = = =4
n 10
n = 100

390 − 400
Z1 = = −2,5
4

410 − 400
Z2 = = 2,5
4
-2,5 2,5

0,9938 - 0,0062 = 0,9876

b) n = 25
_
P (390 ≤ x ≤ 410) = 0,78871

_
σ 40
σx= = =8
n 5

390 − 400
Z1 = = −1,25
8
39

390 − 400
Z2 = = 1,25
8

-1,25 1,25

_
c)P (390 ≤ x ≤ 410)

390 − 400
Z1 = = −5 2 σ 40
2 σx = = =2
n 400
410 − 400
Z2 = =5
2

-5 5

d) Quanto maior a amostra mais chance existe para acertar o valor do parâmetro.

5.5. Distribuição amostral da proporção

Parâmetro proporção π da população


Estatística proporção P da amostra

P P
P p p E (p) = π
P P P

5.5.1. Propriedades:

1ªPropriedade: E (p) = π : a expectativa ou média da distribuição amostral de


proporção corresponde ao parâmetro populacional proporção.

2ªPropriedade: O desvio padrão da distribuição amostral de proporções para


populações infinitas é dado pela fórmula.

π (1 − π )
σ p=
n

3ª Propriedade: O desvio padrão da distribuição amostral de proporções


para populações finitas é:
40

N − n π (1 − π )
σ p= .
N −1 n

4ª Propriedade: A estatística proporção amostral P, que associa a variável


padronizada Z é:
P −π
Z= ~ N (0,1)
σp

Exercício:
1. Sabendo que 80% das unidades produzidas por determinada fábrica são
classificadas como artigo de exportação. Considerando a extração de uma amostra aleatória de 64
unidades, determine a probabilidade que a proporção de unidades classificadas como artigos de
exportação assumir um valor abaixo de 76%.

a) Considere o mesmo enunciado para uma amostra de 100 unidade.

π = 0,8 n= 64

(π )(1 − π ) 0,8 x0,2


σp= = = 0,05
n 64

0,76 − 0,8
Z= = −0,8
0,05

P ( P ≤ -,76) = P (Z ≤ - 0,8) = 0,2119 = 21,19%

0,8 x0,2
a) σp= = 0,04
100

0,76 − 0,8
Z= = −1,0
0,04

P (P ≤ 0,76) = P (Z ≤ -1,0) = 0,1587


15,87%

2. Numa eleição determinado candidato recebeu 46% dos votos. Determine a


probabilidade de que um escrutínio efetuado em 212 votantes se obtenha a maioria em favor do
candidato.

0,54 x0,46
σ p= = 0,0342
212
41
π = 0,46 n = 212
1- π = 0,54

E (p) = 0,46 → σp = 0,0342

P (p ≥ 0,5) = P (Z > 1,17) = 0,121 → 12,1%

0,5 − 0,46
Z= = 1,169 = 1,17
0,0342

6. ESTIMAÇÃO

É o processo com a finalidade de estimar parâmetros populacionais através de


amostras. Com resultados calculados na amostra (estatística amostrais) estima parâmetros
populacionais.

6.1. ESTIMADORES E SUAS PROPRIEDADES ACONSELHÁVEIS

Parâmetro Estatística
µ X => E (x) = µ
P p => E (p) = p
T t => E (t) ≠ T
σ² s² => E (s²)≠ σ²

Estimador não tendencioso:

Um estimador é dito não tendencioso se sua expectância corresponde ao valor do


parâmetro.
_
Ex.: X e P

Exemplo de estimadores tendenciosos:


_
1- do total: t = N x

2- da variância absoluta: S²

6.2. ESTIMATIVAS PONTUAIS E INTERVALARES

6.2.1. ESTIMATIVAS PONTUAIS


6.2.1.1 – O parâmetro média populacional µ, pode ser estimado através de um
único valor não-tendêncioso X .
_
Ex.: X = 20 logo, 20 é uma estimativa de µ

6.2.1.2 - Parâmetro variância populacional σ² através do estimados não-


tendêncioso S².

Ex.: S² = 2,3, então 2,3 é uma estimativa de σ².

6.2.1.3 - Parâmetro proporção π, através do estimador não-tendêncioso P.

Ex.: P = 0,6 é estimativa de π.


42

6.2.2 ESTIMATIVAS INTERVALARES DA MÉDIA E DA PROPORÇÃO


POPULACIONAL

6.2.2.1. - Estimativa para a média populacional, µ

1- Variância populacional conhecida e população normalmente


distribuída.

Intervalo genérico
_ _
[x-E≤µ≤x+E]
_ _ _ _
[ x - Z σx ≤ µ ≤ x + Z σx ] (fórm. 01)

E = erro absoluto de estimação = Z σx

nível de
confiança

Fórmulas usadas:
Pop. infinita
_
σ
σx= ;
n

N −n σ
σx= .
N −1 n

Pop. Finita

Exercício:
1. Para uma amostra de 50 firmas tomadas de um parque industrial o n.º médio de
empregados por firma é 420,4, neste parque industrial há um total de 380 firmas. Determine o interva-
lo de confiança de 95% para estimar o n.º médio de trabalhadores por firma do parque industrial,
admitindo-se que esta variável tem distribuição normal, com desvio padrão de 55,7.
n = 50
x = 420,4
N = 380 firmas
1 - α = 95%
µ=?
σ = 55,7
σx = 7,35

_
N −n σ 380 − 50 55,7
σx= . = . = 0,93(7,88) = 7,35
N −1 n 380 −1 50

-1,96 1,96

95% → Z = ± 1,96
43
X ~ N ( µ,55,7²)
_ _ _ _
[ X - Z. σx ≤ µ ≤ x + Z σx ]

[ 420,4 – (1,96)7,35 ≤ µ < 420,4 + (1,96)7,35 ]

[ 405,99 ≤ µ ≤ 434,81 ]

2- Variância populacional desconhecida e população normalmente distribuída.

a- Amostra ≥ 30 (grande)normal ou não, pois n ≥ 30, distribuição se comporta


como normal.
_ _ _ _
[ x - Z (σx )≤ µ ≤ x + Z (σ x )]

S _
N −n S
σx= ;σ x = .
n N −1 n

Ex.: A empresa ABC enviou um questionário a 100 pessoas de uma população de


4000 clientes perguntando qual seria sua provável necessidade em relação a certo produto, no
semestre seguinte. As respostas estão na tabela abaixo.

Número provável de unidades Número de clientes Σ xifi fixi²

1 20 20 20
2 8 16 32
3 28 84 252
4 4 16 64
5 40 200 1000

Σ 100 336 1368

Construa o intervalo de confiança de 95,45% para a provável:

a) necessidade média de 4000 clientes.


n = 100
N = 4000
_ _ _ _
a) [ x - Z σx ≤ µ ≤ x + Z σx ]

X = 3,36

2
fx 2 .n x
S =
2
= 2,31 ⇒ S = 2,31 = 1,52
n −1

P (Z1 ≤ Z ≤ Z2) = 0,9545 → Z = 2

Z = 2 → 95,45%

N −n s 3900 1,52
σx= . = . = 0,15
N −1 n 3999 100

[3,06 ; 3,66]
44

P [ 3,06 ≤ µ ≤ 3,66 ] = 95,45%

b- Amostras pequenas (n < 30) a distribuição deve ser sempre “t” (variância desconhecida).

_ s _
s 
 x − t . ≤ µ ≤ x + t.
 n n 

Ex.: Foi testada uma amostra de 15 cigarros de certa marca com relação ao
conteúdo de nicotina, obtendo-se uma média de 22 mg e um desvio padrão de 4mg. Encontre-os
limites de confiança para média de nicotina dos cigarros desta marca, considerando um nível de
confiança de 95%.
1 - α = 95%
n = 15
x = 22
S=4
Tabela t
Graus de liberdade = n - 1 = 15 - 1 = 14

nível de significância = 1 - 0,95 = 0,05

t14; 0,05 => 2,145 -2,145 2,145

 4 _
4 
 22 − 2,145 . ≤ x ≤ 22 − 2,145.
 15 15 

[19,78 ; 24,22]

6.2.2.2 - Estimativa para a proporção populacional, π

Normalmente o n é maior que 100. Então, é usada a estatística z.

[ P - Z σp ≤ π ≤ P + Z σp ]

Formulário:

Pop. infinita
π (1 − π )
σ p= Pop. finita
n
Onde: p = proporção na amostra e σp = desvio padrão da distribuição amostral

N − n π (1 − π )
σ p= .
N −1 n
das proporções.
Ex.: Deseja-se conhecer o nível de desemprego em uma certa comunidade, com este
objetivo realizou-se uma amostra aleatória de 900 pessoas que indicou uma taxa de desemprego de
9%. Ache o intervalo de confiança de 90% para proporção de desemprego nesta comunidade.
n = 900
taxa de desemprego => 9%= 0,9 → p => Q = 1- 0,09 = 0,91

1 - α = 90% Z => 1,64


∧ ∧
[ P - Z σp ≤ π ≤ P + Z.σp ]

PQ 0,09 x0,91
σ p= = = 0,00954
n 900
45
[ 0,09 - 1,64 (0,00954) ≤ π ≤ 0,09 + 1,64 (0,00954) ]

[ 0,0737 ; 0,106 ] = [ -7,37% ; 10, 6% ]


Espera-se com 95% de confiança que este intervalo contenha a proporção populacional.

7. DIMENSIONAMENTO DA AMOSTRA

7.1. Para a estimação da média

7.1.1 - Erro fixado e σ² conhecido (erro absoluto)

Z² σ²
no = (população infinita com repos.)

Quando as populações são finitas é considerado o coeficiente:
N. no
n=
N + no

Ex.: Deseja-se estimar a renda média dos moradores do bairro A da cidade C,


sabendo-se que o desvio padrão da renda é de 300 UM. Exige-se um erro absoluto de 20 UM e uma
confiança de 95% nos resultados.
a) Qual deve ser o tamanho da amostra?
b) Supondo que exista 5.000 moradores no bairro A, qual o tamanho de amostra a ser
utilizado?

R: 864 e 736

7.1.2 Erro fixado e σ² desconhecido (erro absoluto)

Z² S²
no = (população infinita - com rep.)

N. no
n= (pop. finita - sem repos.)
N + no
Ex.: Suponha-se que em uma escola deseja-se uma estimativa da altura média dos
estudantes, com erro de 5cm de confiança de 99%. A variância das alturas é estimada em 625.
a) Qual deve ser o tamanho da amostra?
b) Supondo que a escola tenha 200 alunos, qual o tamanho da amostra?

7.1.3 - Erro relativo fixado e σ² conhecida

_ _ σ²
Obs: Er = Z σ x σ x = _______
n

Z² σ²
no = _______ (pop. infinita com rep.)
Er²
N no
n= (pop. finita - sem rep.)
N + no
Ex.: Deseja-se estimar a produção média de trigo em determinada área geográfica
onde o coeficiente de variação da produção é 70%. Exige-se um erro de estimação de 5% e uma
confiança de 95%.
a) Quantas propriedades produtoras devem ser examinadas?
46
b) Admitindo N = 2.000, qual o n?

R: 752 e 546

7.1.4 - Erro relativo fixado e σ² desconhecida

Z² σ²
no = _______ (pop. infinita - com repos.)
Er²

N no
n= (pop. finita - sem repos.)
N + no

Ex.: 1- Quantos estabelecimentos industriais devem ser examinados a fim de se estimar o


número médio de empregados por estabelecimento com erro de 10% e confiança de 95%?
(coeficiente de variação do nº de empregados é estimado em 60%)
2- Admita 500 estabelecimentos, qual deve ser o tamanho da amostra

R: 138 e 108

7.3. Para a estimação da proporção

7.3.1 - Erro rel. fixado e PQ conhecidos

Z² PQ
no = _______ (pop. admitida infinita - com repos.)
Er²
N no
n= ______ (pop. finita - sem repos.)
N + no

Ex.: Uma amostra preliminar de 50 famílias foi selecionada de 4.000 famílias.


Constatou-se que na amostra 30 famílias possuiam renda superior a 1.000 UM. Qual o tamanho da
amostra a ser selecionada, com nível de confiança de 95%, para um erro de estimação de famílias
com renda de 1.000 UM seja no máximo de 5%?

R: 369 e 338

7.3.2 - Erro relativo fixado e PQ desconhecidos.

Admite-se o maior valor de P.Q tal que P + Q = 1. Isto significa que P = Q = 0,5 e
PQ = 0,25.

Ex.: A proporção de agricultores que utilizam implementos agrícolas deve ser estimada
para uma população de 3000 agricultores. Exige-se um nível de confiança de 95% e um erro de 5%
nos resultados. Qual o tamanho da amostra?

R: 384 ou 340

LISTA DE EXERCÍCIOS

ESTATÍSTICA DESCRITIVA

01- Considerando uma população hipotética , cujos elementos são vinte dias em um determinado
Hospital contando-se o número de leitos disponíveis por dia, obteve-se os seguintes dados:
2 1 0 2 4 1 2 1 0 2 1 2 2 1 0 3 4 2 3 3
47
Pede-se: a) organizar uma tabela sem intervalo de classes b) calcular a média, moda, mediana,
a variância absoluta, a variância relativa , o desvio-padrão e o coeficiente de variabilidade.

02- Uma amostra de vinte e dois trabalhadores de uma microempresa, apresentou os seguintes
salários em Reais para uma dada semana:
140 140 140 140 140 140 140 140 140 155 155 161 165 165 180
180 190 200 205 225 230 250

Determine:

a) uma tabela com intervalo de classe usando a fórmula de STURGES.


b) calcular a média, moda, mediana, a variância absoluta, a variância relativa , o desvio-padrão e
o coeficiente de variabilidade.

03- Abaixo são mostrados os saldos médios amostrais de 48 contas de clientes do BB S.A.
( dados brutos em US$ 1,00).

450 500 150 1.000 250 275 550 500 225 475 150
450 950 300 800 275 600 750 375 650 150 500
1.000 700 475 900 800 275 600 750 375 650 150
500 225 250 150 120 250 360 230 500 350 375
470 600 1.000 270

Pede-se:

a) agrupar os dados numa distribuição de freqüências com intervalo de classes ( use form. de
STURGES);
b) construa o correspondente histograma de freqüências absolutas e relativas simples e
acumuladas;
c) construa a ogiva de freqüência absoluta e acumuladas;
d) determine as freqüências simples e acumuladas (absolutas e relativas);
e) calcule a interprete: fr2, f3 e Fr4 - Fr2;
f) calcule as medidas de tendência central : moda, média e mediana (Interprete);
g) encontre as medidas de variabilidade: amplitude, variância absoluta e relativa, desvio-padrão e
coeficiente de variação.

04- Os dados abaixo representam todos a idade dos clientes que acessaram a página da internet
da Empresa “X” no mês de julho de 1998.

Faixa etária 0 |-----10 10 |-----20 20 |----- 30 30 |----- 40 40 |-----50 50 |----- 60


N° de casos 27 71 118 20 18 10

Calcule as medidas de tendência central e de dispersão.

05- Os vinte funcionários d e um programa de treinamento (pop.) obtiveram as seguintes notas:

84 88 78 80 89
94 95 74 81 90
83 87 91 83 92
90 92 77 86 99

Pede-se determinar:
a) agrupar os dados numa distribuição de freqüências com intervalo de classes ( use form. de
STURGES);
b) a amplitude total das notas;
c) o desvio-padrão das notas;
d) a variância absoluta das notas;
48
e) o coeficiente de variação
f) a proporção de alunos com notas maiores que 89;
g) a média, sabendo-se que o professor resolveu acrescentar 5 pontos para cada aluno;
h) o desvio-padrão quando foi adicionado 5 pontos.

06- Para facilitar um projeto de ampliação da rede de filiais de uma empresa comercial de uma
certa região, tomaram uma amostra de tamanho 50 dos 270 lojas que compõe a região, e foram
encontrados os seguintes números de clientes semanais:

02 02 03 10 13 14 15 15 16 16 18 18
20 21 22 22 23 24 25 25 26 27 29 29
30 32 36 42 44 45 45 46 48 52 58 59
61 61 61 65 66 66 68 75 78 80 89 90
92 97

Pede-se:
a) Construa uma distribuição de freqüências considerando seu limite inferior igual a dois e uma
amplitude de classe igual a 14;
b) Calcule a moda, mediana e a média da distribuição do item “a”.

07- Sabendo que uma distribuição da variável “x” possui média igual a 50 e o desvio-padrão igual
a 6, calcule o coeficiente de variação da variável cuja distribuição é dado por y = 2x + 3.

08-O Departamento Pessoal de uma certa firma fez um levantamento dos 120 funcionários de
todo o setor de produção, obtendo os seguintes resultados:

Salário (x sal. min.) Freqüência relativa


0 |----- 2 0,25
2 |----- 4 0,40
4 |----- 6 0,20
0,15
6 |----- 8

Pede-se:
a) Construa um histograma de freqüências absolutas;
b) Calcule a média dos salários
c) Calcule o desvio-padrão dos salários;
d) Se for concedido um aumento para esses funcionários de 100%, haverá alteração na média? E
no desvio-padrão? Justifique.
e) Se for concedido um abono de um salário mínimo para todos os 120 funcionários, haverá
alteração na média? E no desvio-padrão? Justifique.

09- Calcule as medidas de tendência central e de variabilidade dos dados apresentados a seguir:

Número de peças defeituosas, por dia, num levantamento realizado em uma população de 350
lotes de fabricação de um produto:

N° de peças defeituosas 0 1 2 3 4 5 6
Nº de lotes 55 60 112 82 31 8 2
Fonte: Dados fictícios

10- Complete a tabela a seguir:


Salário dos 50 empregados da empresa ‘x’. (valores em R$)
salários fi fri % fri Fi Fri % Fri
100 I----- 120 4
120 I----- 140 0,22
140 I----- 160 0,78
160 I----- 180 16
180 I----I 200

fonte: dados fictícios.


49
11. Considerando a tabela a seguir:
a) calcular e interpretar estas medidas a média , moda , e mediana da distribuição amostral
apresentada abaixo;
b) calcular e interpretar %fr3,F4,f2 e %Fr3.
c) Calcule o desvio-padrão dos salários;

Idade de uma amostra de candidatos a um programa de treinamento

Idade (anos) Nº de Candidatos

18 |-----20 5
20 |-----22 18
22 |-----24 10
24 |-----26 6
26 |-----28 5

12. Para o seguinte conjunto de observações amostrais determine:


a) a média aritmética o desvio padrão e o coeficiente de variação.
b) a moda e a mediana.
-----------------------------------------------------------------
Tempo de serviço Freqüência acumulada
-----------------------------------------------------------------
5 I---- 10 9
10 I---- 15 12
15 I---- 20 18
20 I----I 25 25
-----------------------------------------------------------------

RESPOSTAS:
1. a)
Nr. de leitos disponíveis/dia Nr. de dias
0 3
1 5
2 7
3 3
4 2
∑ 20

b) µ = 1,8 Nr. de leitos disponíveis/dia ; Mo = 2 Nr. de leitos disponíveis/dia ; Md = 2 Nr. de


leitos disponíveis/dia; σ² = 1,36 Nr. de leitos disponíveis/dia ² ; δ² = 0,4198 ou 48,98
%; σ = 1,17 Nr. de leitos disponíveis/dia; δ = 0,6479 ou 64,79 %.

2. a)
salários em R$ nr. de empregados
140 I----------- 162 12
162 I----------- 184 4
184 I----------- 206 3
206 I----------- 228 1
228 I----------- 250 2
∑ 22

_
b) x = R$ 172,00 ; Mo = R$ 153,20 ; Md = R$ 160,17; s² = R$ 851,71² ; g² = 0,0288 ou
2,88 %; s = R$ 29,18; g = 0,1697 ou 16,97 %.
3.
saldos médios fi fri % fri Fi Fri % Fri
50
119 I----- 245 9 0,1875 18,75 9 0,1875 18,75
245 I----- 371 10 0,2083 20,83 19 0,3958 39,58
371 I----- 497 8 0,1667 16,67 27 0,5625 56,25
497 I----- 623 9 0,1875 18.75 36 0,7500 75,00
623 I----- 749 3 0,0625 6,25 39 0,8125 81,52
749 I----- 875 4 0,0833 8,33 43 0,8958 89,58
875 I----- 1001 5 0,1042 10,42 48 1,0000 1,00

e) fr2 = 0,2083; f3 = 8; Fr4 - Fr2 = 0,3542


_
f) x = 483,88; Mo = 287; Md = 449,75
g) AT = US$ 880 ou US$ 882 na tabela; s² = US$ 59.274,62² ; g² = 0,2532 ou 25,32 %; s = US$
243,46; g = 0,5031 ou 50,31 %.

4. µ = 23,52 anos ; Mo = 23,24 anos ; Md = 22,88 anos; AT = 60 anos; σ² = 134,56 anos² ; σ =


1160 anos.

5. a)
notas fi
74 I------ 79 3
79 I------ 84 4
84 I------ 89 4
89 I------ 94 6
94 I------ 99 3
∑ 20

b) AT = 25
c) σ = 6,5
d) σ² = 42,25
e) δ = 0,0747
f) 0,45 ou 45 %
g) µ + 5 = 87 + 5 = 92
h) σ = 6,5

6. a)
nr. de cliente / semana fi
2 I------------ 16 8
16 I------------ 30 16
30 I------------ 44 4
44 I------------ 58 6
58 I------------ 72 9
72 I------------ 86 3
86 I------------ 100 4
∑ 50
_
b) x = 41,76 cliente / semana; Mo = 21,6 cliente / semana; Md = 33,5 cliente / semana.

7. 11,65 %
8. b) µ = 3,5 S. M.
c) σ = 1,987 S. M.
d) sim, média = 2(3,5) = 7 S. M; desvio-padrão = 2( 1,987) = 3,975 S. M.
e) média = 3,5 + 1,0 = 4,5 S.M; o desvio-padrão permanece inalterado.
9. µ = 2,02 peças defeituosas ; Mo = 2 peças defeituosas ; Md = 2 peças defeituosas; AT = 6
peças defeituosas; σ² = 1,69 peças defeituosas ² ; σ = 1,298 peças defeituosas.
51
10.
salários fi fri % fri Fi Fri % Fri
100 I----- 120 4 0,08 8 4 0,08 8
120 I----- 140 11 0,22 22 15 O,30 30
140 I----- 160 24 0,48 48 39 0,78 78
160 I----- 180 8 0,16 16 47 0,94 94
180 I----I 200 3 0,06 6 50 1,0 100
∑ 50 1,0 100 - - -

11.
_
a) x = 22,45 anos ; Mo = 21,24 anos ; Md = 21,89 anos.
b) % fr3 = 22,73 % dos candidatos apresentam idade de 22 até menos que 24.
F4 = 39 candidatos apresentam idade de 18 até menos que 26.
f2 = 18 candidatos apresentam idade de 20 até menos que 22.
% Fr3 = 75 % dos candidatos apresentam idade de 18 até menos que 24.
c) s = 2,38 anos.
12. _
a) x = 14,7 anos; s =6,30 anos g = 0,4289 ou 42,89 %.

b) Mo = 8 anos ; Md = 15,25 anos.

RELATIVOS E ÍNDICES

1. A tabela a seguir mostra os preços médios para o varejo e as quantidades vendidas dos
produtos: carne bovina, carne suína e ovina durante os anos de 1991, 1992 e 1993 (dados
fictícios).

Produtos 1991 1992 1993


Preço Quantidade Preço Quantidade Preço Quantidade
Carne bovina 37 120 45 150 43 170
Carne suína 35 80 33 100 38 90
Carne ovina 28 90 30 100 35 150

a) Calcule o índice de preços de 1993,tomando como base 1992;


b) Calcule o índice de quantidade para 1993, tomando como base 1992;
c) Calcule o índice de preços de Laspeyres para 1993, admitindo como período-base 1991;
d)Calcule o índice de quantidade de Laspeyres para 1993, admitindo a base para 1991;
e) Determine o índice de Paasche para o preço de 1993, tomando como base 1992;
f) Qual é o índice de quantidade de Paasche para 1993, sendo 1991 a base?

2- Dada a tabela abaixo:

Anos 1991 1992 1993 1994 1995 1996


Artigo P Q P Q P Q P Q P Q P Q
A 3 10 3,5 15 4,2 18 5,0 25 5,1 23 5,5 28
B 10 20 11,0 25 13,0 30 15,0 35 15,0 40 17,0 45
C 5 5 5,5 8 6,0 18 7,5 10 8,0 30 9,0 20

a) Determine os relativos de preços para o artigo A, tomando 1991 = 100;


b) Determine os relativos de quantidades para o artigo B, tomando 1992 = 100;
c) Usando base móvel, estude as variações de preços para o artigo A;
d) Calcule o índice de preços de Laspeyres, sendo 1991 = 100 e 1996 a época atual.

3- Dada a tabela abaixo calcule os índices relativos adotando uma base móvel. Interprete os
resultados.
Ano 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992
Dív. ext.* 62,4 74,0 85,3 93,6 102,0 105,1 111,0 121,2 113,5 115,1 123,4 123,9 132,3
52
(*) Os dados são referentes a dívida externa brasileira, expressa em US$ bilhões.

4- Considere a tabela a seguir:


Crianças Assassinadas (RJ)

Ano Homicídios total Até 17 anos


1985 4.542 172
1986 4.996 204
1987 5.483 227
1988 6.023 294
1989 7.654 437
1990 7.850 427
1991 7.510 306
1992 7.635 450
1993 8.026 656
(*) Estimativa. Fonte: Sec. Est. Pol. Civil RJ.
Com base nos dados acima, calcule os relativos de quantidade, com base em 1985. Interprete os
resultados.

5- Considerando os dados constantes na tabela abaixo, determine:


a) os relativos de quantidade para 1993 tomando como base 1992;
b) os índices agregativos simples de quantidade para 1993 tendo como base 1992;
c) a média aritmética simples dos relativos de quantidade para 1993 com 1992 = 100.
Produção em toneladas
anos Variação (%)
Cultura 1992 1993
arroz 9.961.899 10.186.384
cebola 886.128 821.262
feijão 2.795.011 2.503.243
fumo 577.494 671.513
milho 30.556.634 29.177.581
soja 19.184.919 22.762.777
uva 798.800 806.303
Fonte: IBGE - ago/1993

6- Dada a tabela abaixo obtenha nova série de índices, adotando 1992 como base.
Ano 1988 1989 1990 1991 1992 1993 1994 1995
Índice de produção (88 = 100) 100 132 125 130 140 148 162 150

7- Dadas as variações (em relação ao mês anterior) da produção industrial brasileira de janeiro a
setembro de 1993, segundo o IBGE, calcule:

a) a variação acumulada até o mês de setembro;


b) a taxa média mensal de variação no referido período.

Meses jan. fev. mar. abr. maio jun. jul. ago. set.
variações/ mês 5,05 0,36 4,80 1,30 2,13 -5,10 -0,80 -2,00 -1,70

8- O índice constante da tabela abaixo foi calculado com base móvel.

Anos 1981 1982 1983 1984 1985


Índices 120 150 110 130 120
Calcule:
a) o índice com base em 1980;
b) o índice com base em 1985.

9- Suponha que um índice de preços mostrou os seguintes dados relativos ao faturamento de


1980 a 1984.

Ano Faturamento IGP 1977 = 100


1980 50.000 407
53
1981 60.000 559
1982 140.000 848
1983 200.000 1493
1984 250.000 2811

a) Calcule o faturamento real da empresa, a preços de 1980.


b) Calcule a taxa anual de variação do faturamento real no período.
10.
Ano Valor das Vendas Salários na Indústria ICV 1999 = 100 Índice de Preços Industriais
Industriais (anual) 1999 = 100
1998 200.000,00 40.000,00 80 60
1999 220.000,00 50.000,00 100 100
2000 250.000,00 60.000,00 108 108

a) Determine o valor das vendas industriais a preços constantes de 1978 ( 1978 = 100)
b) Determine o salário, os preços constantes de 1978 ( 1978 = 100).

11. Os índices abaixo foram calculados com base móvel.

meses jan fev mar abr mai


índices 136 149 128 95 155
calcular: a)os índices com base fixa em abril.
b)os índices com base fixa em dezembro.

12. Utilizando os dados da tabela seguinte, calcule os índices de Laspeyres, Paasche e Fischer
para preços com base em janeiro.

meses jan fev mar


produtos p q p q p q
a 14 7 13 10 10 6
b 15 6 14 12 12 8

13. Uma revista publicou a tabela a seguir com o respectivo comentário: A produção de batata
aumentou 113% no ano de 2002 em relação a 1999 e, aumentou 83% em 2001 com base em
1999. Esta informação está correta? Justifique.
produção de batatas
anos quantidade(ton)
1999 12
2000 11
2001 10
2002 13

14. Os índices abaixo foram calculados com base móvel.

meses jan fev mar abr mai


índices 136 149 138 95 89
calcular: a) os índices com base fixa em abril.
b) os índices com base fixa em dezembro.

RESPOSTAS
1.
a) 95,56; 115,15; 116,67.
b) 113,33; 90,00; 150,00.
c) 116,29.
d) 139,75.
e) 105,69.
f) 140,79.
2.
a) 100; 116,7; 140; 166,7; 170; 183,3.
b)80; 100; 120; 140; 160; 180.
c) 116,7; 120; 119; 102; 107,8.
54
d)172,5.
3. 118,6; 115,3; 109,7; 109; 103; 105,6; 109,19; 93,6; 101,4; 107,2; 100,4; 106,8.
4. Homicídios total: 100; 110; 120,72; 132,61; 168,52; 172,83; 165,35; 168,1; 176,71.
Hom. Até 17 anos: 100; 118,6; 131,98; 170,93; 254,07; 248,26; 177,1; 201,63; 381,4.
5. a) 102,15; 92,68; 89,56; 116,28; 95,49; 118,65; 100,94.
b) 103,33.
c) 117,01.

6.
Ano 1988 1989 1990 1991 1992 1993 1994 1995
Índice de produção 92=100 71,43 94,29 89,29 92,86 100 105,71 115,71 107,14

7.
a) 3,67%
b) 0,40%.
8.
Anos 1981 1982 1983 1984 1985
Índices 80=100 120 180 198 257,4 308,9
Índices 85=100 38,9 58,3 64,1 83,3 100

9.
Ano IGP 1980 = 100 Faturamento 80 = 100 taxa de variação
1980 100 50.000 -
1981 137 43.796 -12,41
1982 207 67.633 54,43
1983 367 54.496 -19,42
1984 691 36.179 -33,61

10.
Ano Valor das Vendas Salários na Indústria ICV 1998 = 100 Índice de Preços Industriais
Industriais (anual) 1999 = 100
1998 200.000,00 40.000,00 100 100
1999 131.974,00 40.000,00 125 166,7
2000 138.889,00 44.444,00 135 180

11.
meses jan fev mar abr mai
índices a) 55,19 82,28 105 100 155
índices b) 136 202,6 259,4 246,4 381,9

12. LJ,M =93,09% LJ,M=75,53%


PJ,M =93,13% PJ,M=76,47%
FJ,M =93,11% FJ,M=75,99%
13. Não está correta a notícia.
I1999,2002 = 118% (AUMENTO DE 18%)
I1999,2001 = 83,33% (REDUÇÃO DE 16,67%)

14.
meses jan fev mar abr mai
índices a) 51,19 76,28 105,3 100 98
índices b) 136 202,6 279,6 265,7 236,4

EXERCÍCIOS DE PROBABILIDADE:

1. Determinar a probabilidade ou sua estimativa da cada um dos seguintes eventos:


a) Aparecer um rei, valete ou dama , ao tirar uma carta única de um baralho de 52 cartas, bem
embaralhadas.
b) Resultar soma oito em um lance único de dois dados honestos.
55
c) Encontra-se um parafuso não defeituoso se entre 600, doze eram defeituosos.
d) Obter 7 ou 11 em uma única jogada de um par de dados não chumbados.
e) Ocorrer ao menos uma cara em três lances de uma moeda honesta.

2. Um grupos de 15 elementos apresenta a seguinte composição.

HOMENS MULHERES
Menores 5 3
Adultos 5 2

Um elemento é escolhido ao acaso, qual a probabilidade de:


a . Ser homem?
b . Ser adulto
c . Ser menor e mulher.

3. A probabilidade de duas pessoas A e B resolverem um problema são 1/3 e 2/5,


respectivamente. Sabendo que a resolução do problema é independente para A e B, calcule a
probabilidade de que:
a) nenhum resolva o problema;
b) pelo menos um resolva o problema;
c) A resolva o problema, mas B não;
d) B resolva o problema, mas A não.

4. A probabilidade de um homem estar vivo daqui a 30 anos é de 2/3 e a de sua mulher é de 3/5.
Considerando que as sobrevivências são independentes, determine a probabilidade de que, daqui
a 30 anos:
(a) ambos estejam vivos
(b) somente o homem esteja vivo
(c) ambos estejam mortos
(d) pelo menos um esteja vivo.

RESPOSTAS
1. a) = 0,23

b) = 0,138

588
c) = ------
600

8
d) = -----------
36

2.
a) 10
P (H) = ------
15
b) 7
P (A) = -----
15
c) P (M) ∩ P(M) =
3
P (M e M) = ------- = ( Ver na tabela)
15
56

3.(a) 0,4 (b) 0,6 (c) 0,2 (d) 0,2667

4. (a) 0,4 (b) 0,2667 (c) 0,1333 (d) 0,8667

EXERCÍCIOS DE PROBABILIDADE BINOMIAIS:

1. Devido as altas de taxas de juros, uma firma informa que 30% de suas contas a receber de outras
firmas comerciais se encontram vencidas. Se um contador escolhe aleatoriamente uma amostra de
cinco delas, determinar a probabilidade de cada um dos seguintes eventos usando a fórmula da
probabilidade binomiais:
a) Nenhuma das contas está vencida
b) Exatamente duas contas estão vencidas
c) A maioria das contas estão vencidas
d) Exatamente 20% das contas estão vencidas.
2. Uma firma de pedidos pelo correio envia uma carta circular que terá uma taxa de respostas de
10%. Suponha que 20 cartas circulares são endereçadas a uma nova área geográfica como um teste
de mercado. Supondo que na nova área é aplicável a taxa de respostas de 10, determinar as
probabilidades dos seguintes eventos, usando a tabela de probabilidades binomiais:
a) Ninguém responde
b) Exatamente duas pessoas respondem
c) A maioria das pessoas responde
d) Respondem menos do que 20% das pessoas.
3. Existe 90% de probabilidade de que um certo tipo de componente se comporte de forma adequada
sob condições de elevadas temperaturas. Se o dispositivo em questão tem quatro de tais
componentes, determinar, por meio de fórmula de probabilidade binomiais, a probabilidade de cada
um dos seguintes eventos.
a) Todos os componentes se comportam de forma adequada e, por conseguinte, o dispositivo
funciona.
b) O dispositivo não funciona porque falha um dos quatro componentes.
c) O dispositivo não funciona porque falham um ou mais dos componentes.
4.Usando a tabela de probabilidade binomiais, determinar:
a) P (X = 8 | n = 20,p = 0,30)
b) P (X ≥ 10 | n = 20,p = 0,30)
c) P (X ≤ 5 | n = 20,p = 0,30)
d) P(X = 5 | n = 10,p = 0,40)
e) P(X > 5 | n = 10,p = 0,30)
f) P(X < 5 | n = 10,p = 0,40)
5. Determinar, por meio da tabela de probabilidade binomiais:
a) P(X = 4 | n = 12,p = 0,70)
b) P(X ≥ 9 | n = 12,p = 0,70)
c) P(X ≤ 3 | n = 8,p = 0,60)
d) P(X < 3 | n = 8,p = 0,60)
e) P(X = 5 | n = 10,p = 0,90)
f) P(X > 7 | n = 10,p = 0,90)
6. Suponha que 40% dos empregados horistas de uma grande empresa estejam a favor da
representação sindical e que se peça uma resposta anônima a uma amostra aleatória de 10
empregados. Qual a probabilidade de estarem a favor da representação sindical:
a) A maior parte dos que respondem
b) Menos da metade dos que respondem.
RESPOSTAS
1. a) 0,16807

2. a) 0,12,16
b) 0,2852
c) 0
d) 1

3. a) 0,65611
b) 0,2916
c) 0,3439
57

4. a) 0,1144
b) 0,0479
c) 0,4165
d) 0,2007
e) 0,0473
f) 0,6330

5. a) 0,0078
b) 0,4925
c) 0,1738
d) 0,0499
e) 0,0015
f) 0,9298

6. a) 0,1663
b) 0,6330

EXERCÍCIOS DE DISTRIBUIÇÃO NORMAL:

1. Os resultados de um exame nacional para estudantes recém-formados apresentarem uma média


µ = 500 com o desvio padrão σ = 100. Os resultados têm uma distribuição aproximadamente
normal. Qual a probabilidade de que o grau de um indivíduo escolhido aleatoriamente esteja:
a) entre 500 e 650?
b) entre 450 e 600?
c) inferior a 300?
d) superior a 650?

2. A vida útil de uma certa marca de pneus radiais tem uma distribuição normal com µ = 38.000 Km
e σ = 3.000Km.
a) Qual a probabilidade de que um pneu escolhido aleatoriamente tenha uma vida útil de no mínimo
35.000Km?
b) Qual a probabilidade de que ele dure mais do que 45.000Km?

3. Sabendo que o tempo gasto pelos indivíduos para resolver um teste é normalmente distribuído
com média de 20 minutos e desvio-padrão de 4 minutos, determine a probabilidade de que
uma pessoa gaste para resolver um teste:
(a) entre 16 e 22 minutos
(b) entre 22 e 25 minutos
(c) mais do que 23 minutos
(d) menos que 16 minutos
4. A duração de um certo componente eletrônico é normalmente distribuída com média de 850
dias e desvio-padrão de 45 dias. Calcule a probabilidade de um componente desse tipo durar:
(a) entre 700 e 1000 dias
(b) mais do que 800 dias
(c) menos do que 750 dias
5. O número de pessoas que almoçam num restaurante suburbano é aproximadamente normal
com média de 250 e desvio padrão de 20 pessoas, por dia. Determine a probabilidade de que, em
um dia qualquer, sejam atendidas:
(a) menos de 200 pessoas
(b) entre 225 e 275 pessoas
6. As notas de Estatística dos alunos de uma Universidade distribuem-se normalmente com média
de 6,4 e desvio-padrão de 0,8. Em uma classe de 80 alunos, quantos terão nota:
(a) menor do que 5,0?
(b) entre 5,0 e 7,5?
(c) maior que 7,5?
58

7. Numa pesquisa salarial, verificou-se que o salário de determinada categoria segue uma
distribuição normal com média de 15.000 u.m. e desvio-padrão de 2.000 u.m. Determine:
(a) a probabilidade de que um empregado tenha salário entre 17.000 u.m. e 18.000 u.m.
(b) quantos empregados entre 1.000, tem salário superior a 18.000 u.m.?

8. O peso médio dos alunos de uma escola é 57,45 Kg, com desvio-padrão de 6,12 Kg,
normalmente distribuído. Se são 850 os alunos desta escola:
(a) quantos têm peso inferior a 50 Kg?
(b) qual a probabilidade de um aluno sorteado pesar entre 55 Kg e 65 Kg?
(c) é considerado gordo um aluno que pesa mais de 70 Kg. Quantos serão considerados gordos?
RESPOSTAS
1. a) 0,4332 b) 0,5328 c) 0,0228 d) 0,0668

2. a) 0,8413 b) 0,0099

3. (a) 0,5328 (b) 0,2029 (c) 0,2266 (d) 0,1587


4. (a) 0,9992 (b) 0,8665 (c) 0,0132
5. (a) 0,0062 (b) 0,7888
6. (a) 3 (b) 70 (c) 7
7. (a) 0,0919 (b) 67
8. (a) 95 (b) 0,5461 (c) 17

EXERCÍCIOS SOBRE AMOSTRAGEM

1. Uma população consiste de 5 números: 2, 3, 6, 8 e 11.

a) Determine os parâmetros média e a variância absoluta.


b) Determine o número de amostras possíveis de tamanho 3, que podemos obter da
população em questão, adotando-se o esquema de AAS, sem reposição.
_
c) Considerando a variável x, baseado em todas as amostras possíveis sem reposição
determine a média e o desvio padrão da distribuição amostral de x.

2. Uma variável apresenta média 56 e variância 6,7. Considerando todas as amostras possíveis de
tamanho 100 que podem ser selecionadas dessa população, utilizando o processo de AAS sem
reposição, determine.

a) A média da distribuição amostral de médias.


b) A variância absoluta da distribuição amostral de médias.
c) O desvio padrão da distribuição amostral de médias.

3. O valor médio das vendas de um determinado produto durante o último ano foi de R$ 3400 por
varejistas que trabalha com o produto, com desvio padrão de R$ 220. Se um grande número de
varejistas trabalha com o produto, determine o erro padrão da média admitindo-se amostras de
tamanho 25.

4. Admita-se no exercício anterior, que apenas 100 varejistas trabalhem com o produto.

5. Sabendo-se que o peso, dado em gramas, de determinado produto, produzido por uma fábrica
está normalmente distribuído com média 400 e desvio padrão 40g, determinar.

a) A probabilidade da média de 1 amostra de tamanho 100, pertencer ao intervalo [390;410].


59
b) A probabilidade da média de 1 amostra de tamanho 25, pertencer ao intervalo [390;410].
c) A probabilidade da média de 1 amostra constituída por 400 artigos pertencer ao intervalo
[390;410].

RESPOSTAS

1. a) 6 e 10,8 b) 10 c) 6 e 1,34
2. a) 56 b) 10 c) 0.26
3. R$ 44,00
4. R$ 38,00
5. a) 0,98759 b) 0,78871 c) 1

EXERCÍCIOS SOBRE ESTIMAÇÃO DA MÉDIA

1. Um analista de um departamento de pessoal seleciona aleatoriamente os registros de 16


empregados horistas e acha que a taxa de salários por hora é R$ 7,50. Supõe-se que os salários da
firma sejam distribuídos normalmente. Se o desvio padrão dos salários é conhecido e igual a R$ 1,00,
estimar a taxa média de salários na firma usando um intervalo de confiança de 95%.

2. Para uma mostra de 50 firmas tomada de uma determinada indústria, o número médio de
empregados por firma é 420,4 com um desvio padrão na amostra de 55,7. Nesta indústria, há um
total de 380 firmas. Determinar o intervalo de confiança de 90%, para estimar o número médio de
trabalhadores por firma da indústria.
(Obs: indústria eqüivale a um parque industrial).

3. Considerando os resultados do exercício anterior qual o erro absoluto de estimação obtido?

4. Um departamento de manutenção recebeu um carregamento de 100 máquinas defeituosas. Sabe-


se por experiência anterior que o desvio padrão em relação ao tempo necessário para conserto é de
15 minutos. Estimar o tempo médio, por máquina, necessário para consertar as máquinas do
carregamento, usando um nível de confiança de 90%. Para tal finalidade tomou-se uma amostra
aleatória de 10 máquinas e o tempo médio necessário para conserto de 85,0 minutos.

5. Foi testada uma amostra de 15 cigarros de certa marca, com relação ao conteúdo de nicotina,
obtendo-se uma média de 22 miligramas e um desvio padrão de 4 miligramas de nicotina. Encontre
os limites de confiança para µ (média populacional), considerando 1 - α = 95%.

6. O diâmetro médio de uma amostra de 12 bastões cilíndricos em um carregamento é de 2,35mm. A


distribuição dos diâmetros de todos os 2000 bastões incluídos no carregamento é aproximadamente
normal com desvio padrão de 0,05 mm. Determinar o intervalo de confiança de 99% para estimar o
diâmetro médio de todos os bastões incluídos no carregamento.

RESPOSTAS

1. [6,97 ≤ µ ≤ 8,03]

2. [408,35 ≤ µ ≤ 432,45]

3. 12,05

4. [77,6 ≤ µ ≤ 92,4]

5. [19,71 ≤ µ ≤ 24,29]

6. [2,322 ≤ µ ≤ 2,37]
60

INTERVALO DE CONFIANÇA PARA A PROPORÇÃO

1. Uma centena de componentes foi ensaiada e 93 deles funcionaram mais de 500 horas.
Determinar um intervalo de confiança de 95% para a proporção.

2. Uma amostra aleatória de 400 domicílios mostra-nos que 25% deles são casas de aluguel.
Qual é o intervalo de confiança que podemos, razoavelmente supor que seja o da proporção
de casas de aluguel? α = 2%.

3. Em 50 lances de uma moeda, foram obtidas 30 caras. A partir de um intervalo de confiança


de 96%, pode dizer que a moeda é honesta?

4. Para verificar se um dado era viciado, jogou-se o mesmo 120 vezes, obtendo-se 25 vezes
o número cinco. Calcular um intervalo de confiança para a proporção: α = 1%. Pode-se dizer
que o dado é viciado?

5. Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a água
fluorada. Encontrar os limites de confiança para a proporção da população favorável a
floruação.

6. Numa eleição determinado candidato recebeu 46% dos votos. Determine a probabilidade de
que um escrutínio efetuado em 212 votantes se obtenha a maioria em favor do candidato.

7. Deseja-se conhecer o nível de desemprego em uma certa comunidade, com este objetivo
realizou-se uma amostra aleatória de 900 pessoas que indicou uma taxa de desemprego de 9%.
Ache o intervalo de confiança de 90% para proporção de desemprego nesta comunidade.

RESPOSTAS

1. 0,88 ≤ P ≥ 0,98

2. 0,20 ≤ P ≥ 0,30

3. 0,46 ≤ P ≥ 0,74 , SIM

4. 0,11 ≤ P ≥ 0,31, NÃO

5. a) 0,55 ≤ P ≥ 0,65 b) 0,54 ≤ P ≥ 0,66

6. P (p ≥ 0,5) = P (Z > 1,17) = 0,121 → 12,1%

7. [ -7,43% ; 10,56% ]

CONSTRUÇÃO DE TABELAS E CÁLCULOS ESTATÍSTICOS USANDO O EXCEL

Partindo da seguinte série de dados, vamos construir: uma distribuição de freqüência sem
intervalo de classe e com intervalo de classe, um histograma e cálculos de estatística
descritiva.

14 12 13 11 12 13 16 14 14 15 17 14 11
13 14 15 13 12 14 13 14 13 15 16 12 12
61
Entrada de Dados

• Para entrar no Microsoft Excel, clicar no botão .


• Entrar com os dados na coluna A.
• Na célula C1, digitar Variáveis.
• Na célula D1, digitar fi.
• Na célula E1, digitar fri.
• Na célula F1, digitar Fi.
• Na célula G1, digitar Fri.
• Marcar as células C1:G1, na barra de formatos, clicar no botão Negrito e no botão
Centralizar .

• Nas células C2:C8, digitar as variáveis correspondentes a cada classe para uma distribuição
de freqüência sem intervalo de classe. (11, 12, 13, 14, 15, 16, 17)

• Marcar as células C2:C9, na barra de formatos, clicar no botão Negrito e no botão


Centralizar .

Freqüência Simples

• Marcar as células D2:D8, na barra de ferramentas, clicar no botão Colar Função

• Na janela da esquerda, clicar em Estatística e na janela da direita, procurar Freqüência, clicar


em Ok.
• Na Matriz_dados, digitar A1:A26.
• Na Matriz_bin, digitar C2:C8.
• Como os dados foram preparados para obter os dados da função freqüência como matriz
coluna, no lugar de pressionar Ok ou a tecla Enter , devemos pressionar ao mesmo tempo as
três teclas Ctrl + Shift + Enter.

 Se não funcionar, começamos por:


 Marcar as células D2:D8
 Digitar a fórmula = FREQÜÊNCIA(A1:A26;C2:C8)
 Sem pressionar a tecla Enter , devemos pressionar ao mesmo tempo as três teclas Ctrl + Shift
+ Enter.
• Na célula C9, digitar Total.
• Clicar na célula D9 e na barra de ferramentas, clicar no botão Auto Soma . (Vai aparecer
os valores acima marcados e a fórmula.) Pressionar a tecla Enter.
• Marcar D2:G9 e clicar no botão Centralizar .

Freqüência Simples Relativa

• Na célula E2, digitar a fórmula = D2/$D$9 e pressionar a tecla Enter.


• Retornar para a célula E2 e no canto inferior direito, pressionar o botão esquerdo do mouse e
arrastar até a célula E8.
• Na barra de ferramentas, clicar no botão Diminuir Casas Decimais, até 4 casas decimais.

• Na célula E9, clicar no botão Auto Soma .

Freqüência Acumulada

• Na célula F2, digitar a fórmula = FREQÜÊNCIA($A$1:$A$26,C2) e pressionar a tecla Enter.


• Retornar para a célula F2 e no canto inferior direito, pressionar o botão esquerdo do mouse e
arrastar até a célula F8.

Freqüência Acumulada Relativa


62
• Na célula G2, digitar a fórmula = F2/$D$9 e pressionar a tecla Enter.
• Retornar para a célula G2 e no canto inferior direito, pressionar o botão esquerdo do mouse e
arrastar até a célula G8.
• Na barra de ferramentas, clicar no botão Diminuir Casas Decimais, até 4 casas decimais.

Histograma e Freqüência Simples

• Na barra de títulos, abrimos o menu Ferramentas, escolher Análise de Dados, recebe-se a


caixa de diálogo com todas as ferramentas de análise disponíveis. Nessa caixa de diálogo
escolher Histograma e pressionar o botão Ok.
Obs.: Se ao abrirmos o menu Ferramentas, não estiver disponível Análise de Dados, devemos
clicar em Suplementos. Ao abrir uma janela, devemos ativar Ferramentas de Análise,
pressionar o botão Ok e repetir o passo anterior.
• No Intervalo de Entrada, digitar $A$1:$A$26.
• No Intervalo do Bloco, digitar $C$2:$C$8.
• No Intervalo de Saída, digitar $C$11. (O resultado gráfico será apresentado a partir desta
célula.)
• Assinalar, através de um click, Porcentagem Cumulativa e Resultado Gráfico e pressionar o
botão Ok.
• Marcar e deletar as células C19:E19.
• Dar um duplo click dentro de um dos retângulos do histograma.
• Dentro da caixa Formatar Ponto de Dados, selecionar Opções.
• A Largura do Espaçamento, reduzir para zero, e pressionar o botão Ok.

Distribuição de Freqüência com Intervalos de Classe

• Selecionar uma nova planilha, copiando para essa os dados da coluna A.


• Na célula C1, digitar Classes.
• Na célula D1, digitar Li.
• Na célula E1, digitar fi.
• Marcar as células C1:E1, centralizar e colocar em negrito.
• Marcar as células C2:E5 e centralizar.
• Digitar as classes na coluna C e os limites superiores na coluna D.

• Marcar as células E2:E5, na barra de ferramentas, clicar no botão Colar Função. Na


janela da esquerda, clicar em Estatística e na janela da direita, procurar Freqüência, clicar em
Ok.
• Na Matriz_dados, digitar A1:A26.
• Na Matriz_bin, digitar D2:D5.
• Como os dados foram preparados para obter os dados da função freqüência como matriz
coluna, no lugar de pressionar Ok ou a tecla Enter , devemos pressionar ao mesmo tempo as
três teclas Ctrl + Shift + Enter.

Análise dos Dados

• Na barra de títulos, abrimos o menu Ferramentas, escolher Análise de Dados, recebe-se a


caixa de diálogo com todas as ferramentas de análise disponíveis. Nessa caixa de diálogo
escolher Estatística Descritiva e pressionar o botão Ok.
• No Intervalo de Entrada, digitar $A$1:$A$26.
• No Intervalo de Saída, digitar $B$7.
• Assinalar em Resumo Estatístico, Enésimo Maior e Enésimo Menor, pressionar o botão Ok.
Abaixo, encontram-se os resultados das atividades descritas acima:
63