Você está na página 1de 54

Ministério da Educação

Instituto Federal de Goiás


Campus Goiânia
Departamento de Áreas Acadêmicas II

Professor:
 Maciel Souza

Estatística
&
Probabilidade
 Eng. de Controle e Automação
Turma: ____________

Nome:

1
1. INTRODUÇÃO À ESTATÍSTICA
1.1. Introdução
A palavra estatística lembra, à maioria das pessoas, recenseamentos. Os censos existem há milhares de anos e
constituem um esforço imenso e caro feito pelos governos com o objetivo de conhecer seus habitantes, sua condição
sócio-econômica, sua cultura, religião, etc. Portanto, associar-se estatística a censo é perfeitamente correto do ponto de
vista histórico, sendo interessante salientar que as palavras, estatística e estado têm a mesma origem latina: status.
A estatística é também comumente associada às pesquisas de opinião pública, aos vários índices governamentais, aos
gráficos e médias publicadas diariamente na imprensa. Na realidade, entretanto, a estatística engloba muitos outros
aspectos, sendo fundamental na análise de dados provenientes de quaisquer processos onde exista variabilidade.

1.2. Importância da Estatística


O mundo está repleto de problemas. Para resolvermos a maioria deles necessitamos de informações. Mas, que tipo de
informações? Quantas? E após obtê-las, que fazer com essas informações? A Estatística lida com essas informações,
associando os dados ao problema, descobrindo como e o que coletar e obter conclusões a partir de todas essas
informações de tal forma que possam ser entendidas por outras pessoas.
A estatística é uma metodologia utilizada para agrupar dados de um fenômeno, analisá-los, interpretá-los e, a partir
daí, tomar decisões.
Esse importante ramo da Matemática tem aplicações nos mais variados campos de atuação.
O sociólogo necessita conhecer as populações, sua distribuição por sexo, idade, profissão, etc.
A meteorologia usa a Estatística para fazer previsões do tempo. Ao agricultor, ela serve para orientá-lo com maior
segurança sobre safras, valores de produção, etc.
Na Biologia, então, a Estatística tem inúmeras aplicações. Por exemplo, nos trabalhos efetuados por Johann Gregor
Mendel (1822 - 1884) que são as bases das leis da herança.
O geógrafo utiliza a Estatística para obter informações relacionadas às densidades de população, aos climas, às
correntes marítimas, etc.
Na indústria, a Estatística é usada para comparar produções, volume de vendas, estudar situações de mercado e suas
tendências.
Atualmente, um grande número de empresas utiliza o controle estatístico no processo de produção. Trata-se de uma
importante ferramenta de trabalho, que garante informações seguras e possibilita inúmeros benefícios, como a redução de
desperdícios e a identificação de problemas, por exemplo.

1.3. Estatística
A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição,
análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
Podemos dizer que a Estatística se divide em dois grupos, são eles:
 Estatística Descritiva – esta tem por objetivo a coleta, a organização e a descrição dos dados.
 Estatística Indutiva ou Inferencial – esta destina-se à análise e à interpretação dos dados.

1.4. Variáveis
A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:
 para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino;
 para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números
naturais: 0, 1, 2, 3,..., n;
 para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de
valores numéricos dentro de um determinado intervalo.

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.


Os exemplos acima nos dizem que uma variável pode ser:

2
a. qualitativa – quando seus valores são expressos por atributos: sexo (masculino - feminino), cor da pele (branca,
preta, amarela, vermelha, parda) etc.;
Nominal: Quando não permitem comparações. Ex: Sexo, cor de pele;
Ordinal: Quando permitem comparações. Ex: Classe social, grau de instrução;
b. quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma
escola etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o
nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável
recebe o nome de variável discreta.
Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N (números
naturais), mas nunca valores como 2,5 ou 3,78 ou 4,325 etc. Logo, é uma variável discreta. Já o peso desses alunos é
uma variável contínua, pois um dos alunos tanto pode pesar 72 kg, como 72,5 kg, como 72,54 kg etc., dependendo esse
valor da precisão da medida.
De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis
discretas.
1.5. População e Amostra
Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população estatística
ou universo estatístico.
Exemplo:
Conjunto formado pelos eleitores de uma cidade.

Se todos podem ser pesquisados, realizamos o que chamamos de CENSO.


Se a população é um conjunto formado por muitos elementos, torna-se inviável analisá-la por inteiro, quer seja
fator tempo ou pelo custo.
Nesse caso, devemos trabalhar com uma parte da população, denominada amostra.
Por exemplo, para conhecer algumas características do nosso sangue, não é preciso tirar todo o sangue do corpo,
mas apenas uma amostra.
É fundamental que as amostras sejam representativas, pois as conclusões dessas amostras serão também da
população (Inferência Estatística).
Para a seleção, coleta de uma amostra há técnicas denominadas amostragem.
Mediante uma destas técnicas é possível garantir o acaso na escolha e assegurar à amostra a representatividade da
população.
EXERCÍCIOS
1. Classifique as variáveis em qualitativas ou quantitativas (contínuas ou discretas):
a) Universo: alunos de uma escola.
Variável: cor dos cabelos - _________________________________________
b) Universo: casais residentes em uma cidade.
Variável: número de filhos - ________________________________________
c) Universo: as jogadas de um dado.
Variável: o ponto obtido em cada jogada - _____________________________
d) Universo: peças produzidas por certa máquina.
Variável: número de peças produzidas por hora - ________________________
e) Universo: peças produzidas por certa máquina.
Variável: diâmetro externo - ________________________________________
f) População: alunos de uma cidade.
Variável: cor dos olhos - __________________________
g) População: casais residentes em uma cidade.
Variável: sexo dos filhos - __________________________

3
2. Diga quais das variáveis quantitativas abaixo são discretas e quais são contínuas:
a) População: estação meteorológica de uma cidade.
Variável: precipitação pluviométrica, durante um ano - ___________________
b) População: Bolsa de Valores de São Paulo.
Variável: número de ações negociadas - __________________________
c) População: pregos produzidos por uma máquina.
Variável: comprimento - __________________________
d) População: propriedades agrícolas do Brasil.
Variável: produção de algodão - __________________________
e) População: segmentos de reta.
Variável: comprimento - __________________________
f) População: bibliotecas da cidade de São Paulo.
Variável: número de volumes - __________________________
g) População: aparelhos produzidos em uma linha de montagem.
Variável: número de defeitos por unidade - __________________________

1.6. Etapas da Análise Estatística

1.7. Subdivisões da Estatística


 AMOSTRAGEM: técnicas para obter uma amostra representativa, suficiente e que possa ser generalizada para a
população.
 ANÁLISE EXPLORATÓRIA DE DADOS: técnicas para resumir, organizar e interpretar os dados, de uma
amostra ou da população, para obter informações.
 PROBABILIDADE: técnicas que permitem calcular a confiabilidade das conclusões de Inferência Estatística.
 INFERÊNCIA ESTATÍSTICA: técnicas para generalizar estatisticamente os resultados de uma amostra para a
população.

1.8. Amostragem
Quando o tamanho da amostra é grande em relação ao tamanho da população, ou quando se exige o resultado
exato, ou quando já se dispõe dos dados da população, é recomendado realizar um censo, que considera todos os
elementos da população, ou seja, dispensa-se o uso da amostragem.
Para realizar um estudo por amostragem, a amostra deve ser representativa da população estudada. Para isso,
existem técnicas adequadas para cada tipo de situação.
Veremos a seguir as principais técnicas de amostragem, divididas em probabilísticas e não probabilísticas:
1.8.1. Técnicas Probabilísticas (aleatórias)
As técnicas probabilísticas garantem a possibilidade de realizar afirmações sobre a população com base nas
amostras. Normalmente, todos os elementos da população possuem a mesma probabilidade de serem selecionados.
Assim, considerando N como o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. Estas
técnicas garantem o acaso na escolha.

4
São técnicas probabilísticas:
1.8.1.1. Amostragem: Aleatória Simples -AAS (ou Casual)
É o processo mais elementar e frequentemente utilizado. Pode ser realizado numerando-se os elementos da
população de 1 a n e sorteando-se, por meio de um dispositivo aleatório qualquer, X números dessa sequencia, que
corresponderão aos elementos pertencente à amostra.

Exemplo: Obter uma amostra representativa, de 10%, de uma população de 200 alunos de uma escola.

1º) Numerar os alunos de 1 a 200;


2º) Escrever os números de 1 a 200 em pedaços de papel e
colocá-los em uma urna;
3º) Retirar 20 pedaços de papel, um a um, da urna,
formando a amostra da população.
Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem
selecionados: 1/N, onde N é o número de elementos da população.
Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de
facilitá-lo, foi elaborada uma tabela - Tabela de Números Aleatórios (TNA) -, construída de modo que os dez
algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas (Anexo), neste caso, também podemos utilizar a função
ALEATÓRIO do Excel.
Exercício: Resolver o exemplo anterior usando a TNA, considerando à partir da 5ª linha, da esquerda para a
direita, de cima para baixo, tomando números de três algarismos, evidentemente, os números maiores que 200 e
os que já tenham aparecido, serão desprezados.

1.8.1.2. Amostragem Estratificada (ou Proporcional Estratificada)


Quando a população possui características que permitem a criação de subconjuntos, as amostras extraídas por
amostragem simples são menos representativas. Nesse caso, é utilizada a amostragem estratificada.
Como a população se divide em subconjuntos, convém que o sorteio dos elementos leve em consideração tais
divisões, para que os elementos da amostra sejam proporcionais ao número de elementos desses subconjuntos. Observe a
figura abaixo:

Exemplo: Em uma população de 200 alunos, há 120 meninos e 80 meninas. Extraia uma amostra representativa,
de 10%, dessa população.
Nesse exemplo, há uma variável que permite identificar 2 subconjuntos, a variável sexo. Considerando essa
divisão, vamos extrair a amostra da população.
SEXO POPULAÇÃO AMOSTRA (10%)
Masculino 120
Feminino 80
Total
Portanto, a amostra deve conter 12 alunos do sexo masculino e 8 do sexo feminino, totalizando 20 alunos, que
correspondem a 10% da população.
Para selecionar os elementos da população para formar a amostra, podemos executar os seguintes passos:
1º) numerar os alunos de 1 a 200, sendo os meninos numerados de 1 a 120 e as meninas, de 121 a 200;
2º) escrever os números de 1 a 120 em pedaços de papel e colocá-los em uma urna A;
3º) escrever os números de 121 a 200 em pedaços de papel e colocá-los em uma urna B;
4º) retirar 12 pedaços de papel, um a um, da urna A, e 8 da urna B, formando a amostra da população.

5
Exercício: Obter uma amostra proporcional estratificada, utilizando a TNA à partir da 8ª linha da esquerda para a
direita e de cima para baixo.

São exemplos desta técnica de amostragem as pesquisas eleitorais por região, cidades pequenas e grandes, área
urbana e área rural, sexo, faixa etária, faixa de renda, etc.

1.8.1.3. Amostragem Sistemática


Esta técnica de amostragem em populações que possuem os elementos ordenados, em que não há necessidade de
construir um sistema de referência. Nesta técnica, a seleção dos elementos que comporão a amostra pode ser feita por um
sistema criado pelo pesquisador, ou seja, escolhe-se cada elemento de ordem k.

Exemplo: Obter uma amostra de 80 casas em uma rua que contém 2000 casas. Nesta técnica de amostragem,
podemos realizar o seguinte procedimento:
1º) Como 2000 dividido por 80 é igual a 25, escolhemos, por um método aleatório qualquer, um número de 1 e
25, que indica o primeiro elemento selecionado para a amostra.
2º) Consideramos os demais elementos, periodicamente, de 25 em 25, até o fim da rua.
Se o número sorteado entre 1 e 25 for o número 8, a amostra será formada pelas casas: 8ª, 33ª, 58ª, 83ª, 108ª, etc.

1.8.2. Técnicas Não-Probabilísticas (não aleatórias)


São técnicas em que há uma escolha deliberada dos elementos da população, que não permite generalizar os
resultados das pesquisas para a população, pois as amostras não garantem a representatividade desta.

São técnicas não-probabilísticas:


1.8.2.1. Amostragem de Conveniência
Os elementos são escolhidos por conveniência ou por facilidade. Um exemplo deste tipo de amostragem é o caso
em que os espectadores de um determinado programa são convidados a responder a um questionário. As amostras obtidas
desta forma não são representativas da população.

Ei!! você é a favor da pena de morte?

1.8.2.2. Amostragem Acidental


Trata-se da formação de amostras por aqueles elementos que vão aparecendo. Este método é utilizado,
geralmente, em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos.
Exemplo: Pesquisas de opinião em praças públicas e ruas movimentadas de grandes cidades.

1.8.2.3. Amostragem Intencional


De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que comporão a
amostra. O pesquisador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião.
Exemplos:
- Em uma pesquisa sobre preferência por determinado cosmético, o pesquisador entrevista as frequentadoras de
um grande salão de beleza.
- Escolha de localidades "representativas" em tempo de eleições.

6
EXERCÍCIOS
1. Considere um grupo de trabalho, formado por vinte acadêmicos da disciplina de Estatística, da Alfa, formado
pelos alunos (1) Adilson, (2) Adriana, (3) Alexandre, (4) Alisson, (5) Edenilson, (6) Éder, (7) Edson, (8)
Flávio, (9) Francieli, (10) Gisele, (11) José, (12) Juliano, (13) Maria, (14) Marisa, (15) Patrícia, (16) Pedro,
(17) Raquel, (18) Renata, (19) Silvano e (20) Wagner. Obtenha uma amostra de 25% da população, utilizando:
a) amostragem aleatória simples (utilizar a TNA, iniciar na 2ª linha da esquerda para a direita).
b) amostragem estratificada (sexo).

2. Em um Centro Universitário existem 250 alunos em determinado curso superior, sendo:

50 alunos no 1º período 35 alunos no 5º período


32 alunos no 2º período 27 alunos no 6º período
30 alunos no 3º período 26 alunos no 7º período
28 alunos no 4º período 22 alunos no 8º período
Obtenha uma amostra de 40 alunos, preencha o quadro seguinte.

PERÍODOS POPULAÇÃO CÁLCULO PROPORCIONAL AMOSTRA


50.40
1º 50 
250


28

6

TOTAL 250 - 40

3. Dada uma população de 4 pessoas, Antônio (A), Carlos (C), Luís (L) e Pedro (P), quantas amostras aleatórias
simples de tamanho 2 podem ser obtidas? Quais são essas amostras?

4. Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente,


n1 = 40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma amostragem proporcional estratificada, nove
elementos da amostra foram retirados do 3o estrato, determine o número de elementos de cada estrato que
comporá a amostra e o número total de elementos da amostra.

CÁLCULO
ESTRATOS TAMANHO PERCENTUAL AMOSTRA
PROPORCIONAL

7
5. Uma cidade X apresenta o seguinte quadro relativo às suas escolas de ensino fundamental.

Nº DE ESTUDANTES
ESCOLAS CÁLCULO CÁLCULO
MASC. AMOSTRA FEM. AMOSTRA
PROPORCIONAL PROPORCIONAL
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
TOTAL 876 --------------- 955 -------------------

Obtenha uma amostra proporcional estratificada total de 121 estudantes do total geral 1831.

6. Uma empresa tem 3.414 empregados repartidos nos seguintes departamentos:

CÁLCULO
DEP. Nº DE EMP. AMOSTRA
PROPORCIONAL
Administração 914
Transporte 348
Produção 1401
Outros 751
Total 3414

Deseja-se extrair uma amostra entre os empregados para verificar o grau de satisfação em relação à qualidade
da comida servida no refeitório. Diga como a amostragem seria realizada considerando uma amostra de 20 % da
população.

7. Para cada uma das seguintes situações diga qual o tipo de amostragem utilizada.
a) Em uma IES, o Conselho Universitário deseja conhecer a opinião dos alunos e professores sobre uma
resolução a ser votada, que estabelece horários fixos para o atendimento de alunos pelos professores. Para
compor a amostra foram sorteados aleatoriamente 10% dos alunos matriculados e 10% dos professores.
Amostragem _______________________.
b) Um treinador de uma confederação esportiva deseja dividir 20 times em dois grupos. Para o primeiro grupo
ele seleciona aleatoriamente 10 times, e considera os 10 restantes para o segundo grupo.
Amostragem __________________________.
c) Uma lista numerada contém 1000 nomes, numerados consecutivamente a partir de 1. Iniciando-se do 15º
nome, uma amostra foi composta considerando sorteados os nomes referentes aos números 25, 35, 45, 55 e
assim sucessivamente até que fossem escolhidos 100 nomes.
Amostragem __________________________.

8
8. Complete:
a) Na amostragem _______________ cada elemento da população tem a mesma chance de ser incluído na
amostra.
b) Na amostragem ___________________a seleção dos itens da população que farão parte da amostra são
escolhidos seguindo uma sequencia fixa, isto é, são escolhidos os itens r, r + k, r + 2k, r + 3k, e assim por
diante.
c) A amostragem __________________pressupõe a divisão da população em subgrupos de itens similares,
procedendo-se então a amostragem em cada subgrupo.

9. Um grupo industrial deseja determinar a reação do público à rotulagem dos produtos. Numa parte da cidade,
há 40 quarteirões, com 10 casas por quarteirão. Suponha que se queira selecionar aleatoriamente 10 casas.
Como proceder?

10. Os empregados de uma firma têm etiquetas de identificação numeradas consecutivamente de 101 a 873. Deve-
se escolher um comitê de segurança de 10 pessoas, selecionadas aleatoriamente. Como fazer a seleção do
comitê, utilizando:
a) amostragem aleatória simples (utilizar à partir da 10ª coluna da TNA de cima para baixo);
b) amostragem sistemática.

Classes fi Classes fi
0 2 4 1 4
2 4 5 2 5
2. DISTRIBUIÇÃO DE FREQUÊNCIAS
Ao estudar grandes conjuntos de dados, é conveniente resumi-los numa tabela, através do agrupamento dos
dados em classes, com suas respectivas frequências.
Denominamos frequência o número que fica relacionado a um determinado valor da variável.
Quando os dados são discretos com valores repetidos, a simples identificação dos mesmos com as respectivas
frequências, pode ser um procedimento adequado, ao que damos o nome de distribuição de frequências sem intervalos
de classes.
Quando os dados são contínuos, pode acontecer que poucos, ou até nenhum deles, apresente frequência.
Nestes casos, o procedimento começa pela definição de classes.
Classes de frequência, ou simplesmente, classes são intervalos de variação da variável.
Uma distribuição de frequências é uma tabela na qual os possíveis valores de uma variável se encontram
agrupados em classes, registrando-se o número de valores observados em cada classe. Os dados organizados em
uma distribuição de frequência são chamados de dados agrupados.

2.1. Conceitos Essenciais


Para cada classe, em uma distribuição de frequência, os limites de classe inferior e superior indicam os valores
compreendidos pela classe. As classes são representadas simbologicamente por i, sendo i = 1, 2, 3, ..., k (onde k é o
número total de classes da distribuição). Há diversos métodos para determinar o número de classes, os quais veremos
mais adiante.
Limites de classes são os extremos de cada classe. O menor número é o limite inferior da classe (li) e o maior
número, o limite superior da classe (Li).
Classe ou Intervalo de classe  li (incluir) |––– Li (excluir) Ex: 0 |––– 2

Amplitude de um intervalo de classe, ou simplesmente, intervalo de classe (hi) é a medida do intervalo que define a
classe: hi = Li – li, amplitude da i-ésima classe. Ex: 4-2 = 2

9
Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior
máximo) e o limite inferior da primeira classe (limite inferior mínimo): AT = Lmáx – lmín. Ex: 4-0 = 4
Amplitude amostral (A.A.) é a diferença entre o valor máximo e o valor mínimo da amostra: A.A. = xmáx – xmín.

Ponto médio de uma classe (xi) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas
li  Li
partes iguais. O ponto médio da i-ésima classe é obtido da seguinte maneira: xi  . Ex: (4+2)/2 = 3
2
Regras básicas
1. Efetua-se um rol (ordenação crescente ou decrescente de grandeza) nos dados brutos (aqueles ainda não
organizados numericamente – tabela primitiva).
2. Determina-se a amplitude amostral (A.A.) da distribuição.
3. Escolhe-se convenientemente o número de classes k (nº. inteiro), 5 ≤ k ≤ 15 onde podemos tomar k  n ou
a regra de Sturges k  1  3,3  log n , n ≥ 25 (total de observações). Se possível determina-se, ou seja,
AA
constrói-se classes de mesma amplitude, tomando h  .
k
4. Efetua-se o agrupamento em classes e, a seguir, toma-se às frequências das classes, elaborando-se, portanto, a
tabela de distribuição de frequências.

2.2. Tipos de Frequências


a) Frequências simples ou absolutas ou, simplesmente, frequências de uma classe ou de um valor
individual é o número de observações correspondentes a essa classe ou a esse valor.
A frequência simples é simbolizada por fi (lemos: f índice i ou frequência da classe i).
k
Obs.:  f  f
i 1
i i  n (número total de observações).

b) Frequências relativas (fri) são valores das razões entre as frequências simples e a frequência total:
fi
fri  .
n
Obs.:  fr i  1 ou 100%.
c) Frequência acumulada (Fi) (do tipo “abaixo de”) é o total das frequências de todos os valores inferiores
ao limite superior do intervalo de classe:
k
Fk  f1  f 2  ...  f k ou Fk   f i .
i 1

d) Frequência acumulada relativa (Fri) de uma classe é a frequência acumulada da classe, dividida pela
frequência total da distribuição:
Fi
Fri  .
f i

2.3. Distribuição de Frequência sem Intervalos de Classe


Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado como um
intervalo de classe (intervalo degenerado) e, nesse caso, ela é chamada distribuição sem intervalos de classe,
tomando a seguinte forma:
xi fi
x1 f1
x2 f2
 
xn fn
f i n
10
2.4. Representação Gráfica de uma Distribuição de Frequência
Outra maneira de apresentar uma distribuição de frequência é por meio de gráficos.

Obs.: não é necessário que seja a mesma escala para os dois eixos.

2.4.1. Histograma
O histograma é um gráfico formado por retângulos justapostos, tendo como base o intervalo de classe, sendo a
área de cada retângulo proporcional à frequência da classe correspondente. Esse gráfico foi idealizado pelo geneticista
e estatístico Karl Pearson (1857 - 1936).

Exemplo: A distribuição das notas dos trinta alunos de Estatística de uma escola está representada abaixo:

Classes
fi
(notas)
0 2 4
2 4 5
4 6 12
6 8 8
8 10 1

Representando as classes da distribuição no eixo das abscissas e as frequências no eixo das ordenadas, temos o
seguinte histograma:

O histograma é a região colorida.

2.4.2. Polígono de Frequência


Ao ligar os pontos médios da parte superior de cada retângulo do histograma, obtemos um polígono
denominado polígono de frequência.
Devemos completar a figura (polígono), ligando os extremos da linha obtida aos pontos médios da classe
anterior à primeira e da posterior à última, da distribuição.

Obs.: No caso de termos uma variável essencialmente positiva, cuja distribuição se inicie no valor zero, devemos
considerar um intervalo anterior localizado no semi-eixo negativo. Porém, consideraremos apenas a parte positiva do
segmento que liga o ponto médio desse intervalo com a frequência do intervalo 0 ... .

11
Retornando ao histograma do exemplo anterior, temos:

2.4.3. Polígono de frequência acumulada


É traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos
pontos correspondentes aos limites superiores dos intervalos de classes.

Exemplo: Sejam os seguintes dados: Estaturas de 50 crianças

30 35 35 39 41 41 42 45 47 48
51 52 53 54 55 55 57 59 60 60
62 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97

Preencha a distribuição de frequências abaixo:


i Classes xi fi Fi
1 30  40
2 40  50
3 50  60
4 60  70
5 70  80
6 80  90
7 90 100
-------- ------- = --------

Construa o Histograma, o Polígono de Frequência e o Polígono de Frequência Acumulada da distribuição acima.


Respostas: fi
Histograma 12

30 40 50 60 70 80 90 100 Classes
12
Polígono de Frequência
fi
12

35 45 55 65 75 xi
85 95

Polígono de Frequência Acumulada

Fi

50

47

40

31

18

10

30 40 50 60 70 80 90 100 Classes

Exemplos
1. Os valores abaixo representam as estaturas, em cm, de 75 alunos regularmente matriculados em um
determinado curso universitário. (Utilize duas casas decimais para as frequências relativas).
172 180 174 182 176 167 160 162 162 164 167 174 169 155 155
180 176 171 179 167 173 180 172 163 168 165 183 189 178 164
170 168 169 180 174 175 191 172 176 172 174 173 165 165 163
150 166 178 178 168 181 184 166 177 167 166 173 160 180 186
156 163 169 155 172 164 154 165 181 156 180 168 185 169 179

Pede-se:
a) O rol;

13
b) A amplitude amostral; AA=______________
c) O número de classes; i=______
d) A amplitude das classes; h=_________
e) A amplitude total; AT=_____________
f) Preencher a distribuição de frequências; k  n
i Estaturas(cm) xi fi fri (%) Fi Fri (%)
1 (cm)
2
3
4
5
6
7
8
9
--- -------- ----- = = ----- ------
Obs.: xi é o ponto médio da classe
g) A frequência da quinta classe; f5=________
h) Qual o limite superior da segunda classe? L2=______
i) Qual o limite inferior da terceira classe? l3=_____
j) Qual o ponto médio da quarta classe? x4=_____
k) Qual a porcentagem dos alunos que possui estatura inferior a 175 cm?______
l) Qual a porcentagem dos alunos cuja estatura não atinge 185 cm?_________
m) Qual a porcentagem dos alunos cuja estatura seja maior ou igual 170 cm?_________
n) O histograma;
o) O polígono de frequência;
p) O polígono de frequência acumulada.

2. Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:

i xi fi fri (%) Fi Fri (%)


1 2 4
2 3 7
3 4 5
4 5 2
5 6 1
6 7 1
---- ------   20   100 % ------- ------

Observando a tabela acima, responda:


a) A amplitude total;
b) Preencher a distribuição de frequências, acima;
c) A frequência da quinta variável;
d) Qual a porcentagem de famílias que possui casa com o número de cômodos inferior a 4?
e) Qual a porcentagem de famílias que possui casa com o número de cômodos superior a 6?
f) Qual a porcentagem de famílias que possui casa cujo número de cômodos não atinge 5?
g) Qual o número de famílias que possui casa que não contém 4 cômodos?
14
EXERCÍCIOS

1. Os resultados do lançamento de um dado 50 vezes foram os seguintes:


Rol
6 5 2 6 4 3 6 2 6 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3

Fazer o rol dos 50 lançamentos, preencher a tabela com os vários tipos de frequências (sem intervalos de
classe) e responder as seguintes perguntas:

i Nº da face (dado) fi fri (%) Fi Fri (%)


1
2
3
4
5
6
  50   100 %

a) Quantas vezes o número 4 foi obtido no dado?


b) Quantas vezes o número obtido no dado foi maior que 3?
c) Quantas vezes saíram os números inferiores a 4?
d) Qual é a porcentagem de ocorrência do número 2?
e) Qual é a porcentagem de ocorrência dos números menores ou iguais a 4?
2. Montar uma distribuição de frequências com dados agrupados com classes utilizando os dados abaixo,
tomando o limite inferior da primeira classe o número 10 e a amplitude das classes igual a 15, construa o
histograma, o polígono de frequência e o polígono de frequência acumulada da distribuição (Utilize uma casa
decimal para as frequências relativas).

48 - 34 - 78 - 36 - 65 - 48 - 54 - 42 - 24 - 96
30 - 60 - 90 - 66 - 72 - 60 - 20 - 24 - 85 - 52
84 - 54 - 36 - 42 - 84 - 10 - 18 - 12 - 22 - 25
34 - 60 - 55 - 21 - 47 - 65 - 77 - 34 - 51 - 80

i Classes xi fi fri (%) Fi Fri (%)


1
2
3
4
5
6
 
15
3. Complete a de distribuição de frequências.

i Classes fi fri (%) Fi Fri (%)


1 6 |--- 10 1
2 10 |--- 14 25
3 14 |--- 18 8 14
4 18 |--- 22 90
5 22 |--- 26 2 20

4. Complete a distribuição de frequências com intervalos (iguais) de classes.

i Classes xi fi fri (%) Fi Fri (%)


1 6 |--- 10 8 4 20
2 35 11
3 14 |--- 18 16 5 80
4 2 18 90
5 24 5
6 1 5 20

5. Complete a distribuição de frequência:

i Classes fi fri (%) Fi Fri (%)


1 100 |-- 72
2 |--
3 |-- 56 14 228
4 |-- 44 272 68
5 600 |--
6 |-- 52 360
7 |--
8 |-- 8 400
TOTAL   400   100%
Determine:
a) A amplitude das classes;
b) A frequência da 3ª classe;
c) A frequência relativa da 1ª classe;
d) A frequência acumulada da 4ª classe;
e) O percentual e o número de ocorrências superiores ou iguais a 600;
f) A frequência acumulada relativa da 7ª classe.

16
6. Em uma fábrica foram testadas 400 luminárias. A duração delas aparece na seguinte distribuição de frequência
(Utilize três casas decimais para as frequências relativas e não multiplicá-las por 100):

i Duração (horas) N° de luminárias f i fri Fi Fri


1 300 |-- 400 14
2 400 |-- 500 46
3 500 |-- 600 58
4 600 |-- 700 76
5 700 |-- 800 68
6 800 |-- 900 62
7 900 |-- 1000 48
8 1000 |-- 1100 22
9 1100 |-- 1200 6
-- --------  = 400 ---- -------
Observando a distribuição, responda:
a) Qual a amplitude de cada classe?
b) Qual a amplitude total da distribuição?
c) Complete a tabela de distribuição por frequência.
d) Qual a frequência relativa da sétima classe?
e) Qual o percentual de luminárias com durabilidade inferior a 600 horas?
f) Qual o percentual de luminárias com durabilidade maior ou igual a 800 horas?
g) Qual a durabilidade média das luminárias inclusas na classe de maior frequência simples?
h) Qual o percentual de luminárias com durabilidade maior ou igual a 700 e menor que 1000?
i) Qual a classe da 155ª luminária?
j) Até que classe está incluída 65% das luminárias?

7. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus
(Utilize duas casas decimais para as frequências relativas):

i Nº de acidentes ( xi ) fi fri (%) Fi Fri (%)


1 0 20
2 1 10
3 2 16
4 3 9
5 4 6
6 5 5
7 6 3
8 7 1
=  =100%
Obs.: fi é o número de motoristas
Determine:
a) O número de motoristas que não sofreram nenhum acidente;
b) O número de motoristas que sofreram pelo menos 4 acidentes;
c) O número de motoristas que sofreram menos de 3 acidentes;
d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes;
e) A porcentagem de motoristas que sofreram no máximo 2 acidentes.

17
8. Complete a distribuição de frequências referente as notas de 50 alunos na disciplina de Estatística:

i Notas fi fri (%) Fi Fri (%)


1 20 |----- 30 2
2 30 |----- 40 4
3 40 |----- 50 6
4 50 |----- 60 8
5 60 |----- 70 12
6 70 |----- 80 10
7 80 |----- 90 6
8 90 |----- 100 2
=  =100%
Conforme a distribuição, responda:
a) A amplitude total da distribuição; _______________________________________
b) O limite inferior da terceira classe; _______________________________________
c) A amplitude do intervalo da quinta classe; _________________________________
d) A frequência da primeira classe; _________________________________________
e) A frequência acumulada da quarta classe; __________________________________
f) O número de alunos que não atingiram nota 70; _____________________________
g) O número de alunos que atinge e ultrapassa nota 50; _________________________
h) A porcentagem dos alunos cuja nota é de 40, no mínimo, mas inferior a 80; _______
i) Até que classe estão incluídos 70% dos alunos; ______________________________
j) A porcentagem dos alunos cuja nota não atinge 50. _________________________

9. Pesquisadas as idades de quarenta pessoas, obtiveram-se os seguintes resultados:

4 21 13 16 14
22 12 18 13 11
10 14 20 6 15
17 8 10 17 8
10 22 18 15 23
23 9 6 13 17
6 10 21 12 14
12 5 15 18 4
Conforme os dados apresentados resolvam os itens abaixo:
a) Faça o rol dos dados acima;
b) Preencha a distribuição de frequência, utilizando as classes (Utilize uma casa decimal para as frequências
relativas): 4 9, 9 14, 14 19 e 19 24

i Classes xi fi fri (%) Fi Fri (%)


1
2
3
4
= =
c) Quantas pessoas pertencem à classe 14 19?
d) Qual é a porcentagem de pessoas que têm menos de 14 anos?
e) Construa o histograma, o polígono de frequência e o polígono de frequência acumulada da distribuição acima.
18
3. MEDIDAS DE POSIÇÃO
O estudo feito sobre distribuições de frequências, até agora, permite-nos descrever, de modo geral, os grupos
dos valores que uma variável pode assumir. Dessa forma, podemos localizar a maior concentração de valores de uma
dada distribuição, isto é, se ela se localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual.
Porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou em confronto com
outras, necessitamos introduzir conceitos que se expressem através de números, que nos permitam traduzir essas
tendências.
Estudaremos, agora, as medidas de posição – estatísticas que representam uma série de dados orientando-nos
quanto à posição da distribuição em relação ao eixo horizontal (eixo das abscissas).
As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação
pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de
tendência central, destacamos:
a) A média aritmética;
b) A mediana;
c) A moda.

As outras medidas de posição são as separatrizes, que englobam:


a) A própria mediana;
b) Os quartis;
c) Os percentis.

3.1. Dados não-agrupados


3.1.1. Média Aritmética (x)
Em um conjunto de dados, podemos definir vários tipos de médias. Porém em nossos estudos iremos nos
limitar a mais importante: a média aritmética.

Definição: A média aritmética, ou simplesmente, média de um conjunto de dados é a soma das entradas de
 xi
dados dividida pelo número de entradas. Para encontrar a média use a fórmula a seguir: x  , sendo:
n
x a média aritmética;
xi os valores da variável;
n o número de valores.

Exemplo: A tabela seguinte mostra o número de gols feitos em cada uma das quatro rodadas de um campeonato de
futebol.

1ª rodada 2ª rodada 3ª rodada 4ª rodada


26 gols 23 gols 20 gols 21 gols

A média de gols por rodada é dada por:_____________

Definição: Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de
valores e a média aritmética.

Notação: d i  xi  x .

19
3.1.2. Moda (Mo)
Definição: Denominamos moda o valor que ocorre com maior frequência em uma série de valores.
Para encontrarmos a moda, de acordo com a definição, basta procurar o valor que mais se repete, entretanto,
podemos encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que
outros (amodal). Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então,
que a série tem dois ou mais valores modais (bimodal ou plurimodal).

3.1.3. Mediana (Md)


Definição: A mediana é outra medida de posição definida como o número que se encontra no centro de uma
série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de
valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois
subconjuntos de mesmo número de elementos.
Se a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números
compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio.
Assim, a série de valores:
2, 4, 7, 8, 10, 12, 12, 14
tem para mediana a média aritmética entre ______ e _______.
8  10
Logo: Md  9.
2
Exemplo
Para os dados não agrupados, 1, 3, 3, 3, 4, 5, 6, 6, determinar:
a) A média
b) Os desvios em relação à média
c) A moda
d) A mediana.

EXERCÍCIOS
1. Considerando os conjuntos de dados: Calcule: a média, a mediana e a moda.

a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b) 20, 9, 7, 2, 12, 7, 20, 15, 7
c) 51,6; 48,7; 50,3; 49,5; 48,9
d) 15, 18, 20, 13, 10, 16, 14

2. Dê um exemplo, de um conjunto de 5 (cinco) dados, no qual a mediana e a moda sejam iguais.

3. Dê um exemplo, de um conjunto com 7 (sete) dados, no qual a amplitude total seja 10 e a mediana seja 6.

4. Os salários-hora de cinco funcionários de uma companhia são:


R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88.
Determine:
a) A média dos salários-hora;
b) O salário-hora mediano.

5. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine:
a) A nota média;
b) A nota mediana;
c) A nota modal.

20
6. A média das idades de três pessoas reunidas em uma sala é 25 anos. Se uma criança de 5 anos entrar na sala, a
nova média das idades será:
a) 15 anos c) 20 anos e) 24 anos
b) 18 anos d) 22 anos

7. A nota média dos meninos de uma classe foi 6,0 e das meninas, 7,0. Se a classe é composta de dezoito
meninos e doze meninas, então a nota média da classe foi:
f) 6,5 g) 7,2 h) 4,8 i) 6,4 j) 7,0

8. A média de um conjunto de valores iguais a uma constante é:


k) igual à unidade m) o valor da constante
l) zero n) igual à soma das constantes

9. A média das idades dos 11 funcionários de uma empresa era de 40 anos. Um dos funcionários se aposentou
com 60 anos, saindo da empresa. A média de idade dos 10 funcionários restantes passou a ser:
a) 40 anos c) 38,9 anos e) 37,8 anos
b) 39,8 anos d) 38 anos

10. Em um edifício residencial com 54 apartamentos, 36 condôminos pagam taxa de condomínio de R$ 380,00;
para os demais, essa taxa é de R$ 440,00. Qual é o valor da taxa média de condomínio nesse edifício?

3.2. Dados agrupados


3.2.1. Média Aritmética (x)
3.2.1.1. Sem Intervalos de Classes
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos
do sexo masculino:
Nº de meninos ( xi ) fi xi f i
0 2
1 6
2 10
3 12
4 4
 f i  34  xi f i  ______
TABELA 1.

Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas
 xi f i
funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética, dada pela fórmula: x 
 fi
Logo, a média dos dados da tabela anterior é:________________

3.2.1.2. Com Intervalos de Classes


Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem
com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:

 xi f i
x
 fi
onde xi é o ponto médio da classe.
21
Considerando a distribuição:

i Estaturas (cm) fi xi xi f i
1 150 |---- 154 4
2 154 |---- 158 9
3 158 |---- 162 11
4 162 |---- 166 8
5 166 |---- 170 5
6 170 |---- 174 3
 f i  ______  xi f i  ______
TABELA 2.
Calcule a média:____________

3.2.2. Moda (Mo)


3.2.2.1. Sem Intervalos de Classes
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de
maior frequência.
Na distribuição da Tabela 1, à frequência máxima _______ corresponde o valor ______ da variável.
Logo: Mo = __________.

3.2.2.2. Com Intervalos de Classes


A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a
moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal.
Damos a esse valor a denominação de moda bruta.
l *  L*
Temos, então: Mo  , onde: l* é o limite inferior da classe modal; L* é o limite superior da classe modal.
2
Assim, para a distribuição da Tabela 2, temos que a classe modal é i = _____, l* = _______ e L* = ________.
l *  L*
Logo, Mo  =_______=_______
2

3.2.3. Mediana (Md)


3.2.3.1. Sem Intervalos de Classes
Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das
frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada.
Tomemos a distribuição relativa à Tabela 1, completando-a com a coluna correspondente à frequência
acumulada:
Nº de meninos (xi) fi Fi  fi
Sendo: = _______a menor frequência acumulada que supera esse
0 2 2
1 6 valor é _____, que corresponde ao valor ______ da variável, sendo este o
2 10 valor mediano. Logo: Md = _________.
3 12
4 4 Nota: No caso de existir uma frequência acumulada (Fi), tal que:
 f i  34  fi x  xi 1
Fi  , a mediana será dada por: Md  i , isto é, mediana
2 2
será a média aritmética entre o valor da variável correspondente a essa frequência acumulada e a seguinte.

22
Exemplo

xi fi Fi  fi
Temos: =
12 1 2
14 2 Logo: Md = _________
15 1
16 2
17 1
20 1
 fi  8

3.2.3.2. Com Intervalos de Classes


Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana.
Para tanto, executamos os seguintes passos:
1º) Determinamos as frequências acumuladas.
 fi
2º) Calculamos .
2
 fi
3º) Marcamos a classe correspondente a frequência acumulada imediatamente superior à – classe mediana –
2
e, em seguida, empregamos a fórmula:
  fi 
  Fant.   h *
Md  l *   
2
f*
na qual: l * é o limite inferior da classe mediana;
Fant. é a frequência acumulada da classe anterior à classe mediana;
f * é a frequência simples da classe mediana;
h * é a amplitude do intervalo da classe mediana.
Assim, considerando a distribuição da Tabela 2, temos:

i Estaturas (cm) fi Fi
1 150 |---- 154 4
2 154 |---- 158 9
3 158 |---- 162 11
4 162 |---- 166 8
5 166 |---- 170 5
6 170 |---- 174 3
 f i  ______
 fi
Como: =
2
Logo, a classe mediana é a de ordem ____. Então: l * = _____, Fant. = ______, f * = _____ e h * = ______.
Substituindo esses valores na fórmula, obtemos:
Md =

 fi
Nota: No caso de existir uma frequência acumulada exatamente igual a , a mediana será o limite
2
superior da classe correspondente.

23
Exemplos

i Classes fi Fi  fi
Temos: =
1 0 |---- 10 1 2
2 10 |---- 20 3
3 20 |---- 30 9 13 Logo: Md =
4 30 |---- 40 7
5 40 |---- 50 4
6 50 |---- 60 2
 f i  ______

3.3. As Separatrizes
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No entanto, ela
apresenta uma outra característica, tão importante quanto a primeira: ela separa a série em dois grupos que
apresentam o mesmo número de valores.
Assim, além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são
medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica, já que se
baseiam em sua posição na série. Essas medidas – os quartis, os percentis e os decis – são, juntamente com a
mediana, conhecidas pelo nome genérico de separatrizes.

3.3.1. Os Quartis
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Há, portanto, três quartis:
a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é
menor que ele e as três quartas partes restantes (75%) são maiores.
b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md).
c) O terceiro quartil (Q3) – valor situado de tal modo que as três quartas partes (75%) dos termos são
menores que ele e a uma quarta parte restante (25%) é maior.
Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana,
f i kf i
bastando substituir, na fórmula da mediana, por: , sendo k o número de ordem do quartil.
2 4
  fi  *  3  fi 
  F ant.   h   Fant.   h *
Assim, temos: Q1  l *    e Q3  l *   
4 4
* *
.
f f

3.3.2. Os Percentis
Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais.
Indicamos:
P1 , P2 , ..., P32 , ..., P99 .

É evidente que:
P50  Md , P25  Q1 e P75  Q3 .
f i
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula será
2
kf i
substituída por , sendo k o número de ordem do percentil.
100

24
EXERCÍCIOS
1. Determine a média aritmética de:
a)
i Valores ( xi ) Quantidades ( f i ) xi f i
1 50 8
2 60 5
3 80 4
4 90 3
 f i  ______  xi f i  ______

b) c)
i xi fi xi f i xi fi xi f i
1 50 20 4 20
2 58 50 5 40
3 66 30 6 30
 f i  ______  xi f i  ______ 7 10
 f i  100  xi f i  ______

2. Considerando a distribuição abaixo:

i xi fi xi f i Fi Calcule:
1 3 4 a) a média;
2 4 8 b) a mediana;
3 5 11 c) a moda.
4 6 10
5 7 8
6 8 3
 f i  ______  xi f i  ______

3. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição:

i Notas ( xi ) Nº de alunos ( f i ) xi f i Fi Calcule:


1 2 1 a) a nota média;
2 3 3 b) a nota mediana;
3 4 6 c) a nota modal.
4 5 10
5 6 13
6 7 8
7 8 5
8 9 3
9 10 1
 f i  ______  xi f i  ______

25
4. Calcule a média aritmética, mediana e moda de cada uma das distribuições abaixo:
a)
i Notas fi xi xi f i Fi
1 0 |---- 2 5
2 2 |---- 4 8
3 4 |---- 6 14
4 6 |---- 8 10
5 8 |---- 10 7
 f i  ______  xi f i  ______

b)
i Estaturas (cm) fi xi xi f i Fi
1 150 |---- 158 5
2 158 |---- 166 12
3 166 |---- 174 18
4 174 |---- 182 27
5 182 |---- 190 8
 f i  ______  xi f i  ______

c)
i Salários (R$) fi xi xi f i Fi
1 500 |---- 700 18
2 700 |---- 900 31
3 900 |---- 1100 15
4 1100 |---- 1300 3
5 1300 |---- 1500 1
6 1500 |---- 1700 1
7 1700 |---- 1900 1
 f i  ______  xi f i  ______

5. Calcule o primeiro e o terceiro quartis das distribuições do exercício anterior.

6. Calcule o 10º, o 1º, o 23º, o 15º e o 90º percentis das distribuições do exercício 4.

7. Determine se as seguintes afirmações são verdadeiras ou falsas. Se for falsa, reescreva-a em sua forma
verdadeira.
a) ( ) O ponto médio de uma classe é a soma de seus limites inferior e superior.
b) ( ) A frequência relativa de uma classe é a frequência da classe dividida pelo tamanho da amostra.
c) ( ) O somatório das frequências relativas, obrigatoriamente, tem que ser igual a 1.
d) ( ) A mediana é a medida de tendência central mais provável de ser afetada por um dado estranho (aquele
que está muito afastado dos outros dados do conjunto).
e) ( ) Nem todo conjunto de dados possui uma moda.
f) ( ) Alguns conjuntos de dados quantitativos não têm uma mediana.
g) ( ) O segundo quartil é a mediana de um conjunto ordenado de dados.
26
RESPOSTAS:
1. a) x  64,50 e b) x  58,80
2. a) x  5,43 , b) Md  5 e c) Mo  5
3. a) x  5,92 , b) Md  6 e c) Mo  6
4. a) x  5,27 , Md  5,29 e Mo  5
b) x  172,40 cm , Md  174 cm e Mo  178 cm
c) x  R$ 842,86 , Md  R$ 809,68 e Mo  R$ 800,00
5. a) Q1  3,50 e Q3  7,20
b) Q1  166,22 cm e Q3  179,19 cm
c) Q1  R$ 694,44 e Q3  R$ 946,67
6. a) P10  1,76; P1  0,18; P23  3,28; P15  2,40 e P90  8,74
b) P10  159,33 cm; P1  151,12 cm; P23  165,40 cm; P15  161,67 cm e P90  183 cm
c) P10  R$ 577,78; P1  R$ 507,78; P23  R$ 678,89; P15  R$ 616,67 e P90  R$1.086,67

4. MEDIDAS DE DISPERSÃO
4.1. Dispersão ou Variabilidade
As medidas de dispersão são utilizadas para avaliar o grau de variabilidade dos dados. Não se justifica calcular
uma média de um conjunto de dados onde não haja variação, todavia se a variabilidade desses dados for muito grande,
a representatividade da média será muito pequena. Assim, é importante caracterizar a dispersão dos dados, uma vez
que diferentes amostras com médias semelhantes, podem apresentar diferentes variabilidades.
Por exemplo, mesmo sabendo que a temperatura média de duas cidades é a mesma, e igual a 24ºC, ainda assim
somos levados a pensar a respeito do clima dessas cidades. Em uma delas poderá a temperatura variar entre limites de
muito calor e de muito frio e haver, ainda, uma temperatura média de 24ºC. A outra poderá ter uma variação pequena
de temperatura e possuir, portanto, no que se refere à temperatura, um clima mais favorável.
Vemos, então, que a média – ainda que considerada como um número que tem a faculdade de representar uma
série de valores – não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os
valores que compõem o conjunto.
Por exemplo, consideremos os seguintes conjuntos de valores das variáveis x, y e z:
X: 70, 70, 70, 70, 70. AT = 70 - 70 = 0

Y: 68, 69, 70, 71, 72.


Z: 5, 15, 50, 120, 160.
Verifiquemos que a média dos três conjuntos são iguais.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou
variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de
variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente de variação.
4.2. Amplitude Total
Amplitude total é a diferença entre o maior e o menor dos valores da série de dados, ou seja, é o maior desvio
da amostra. A sua utilização, além de mostrar o máximo desvio, serve para uma avaliação preliminar dos dados,
verificando-se a possibilidade de possíveis erros nas coletas dos dados ou das digitações, já que as variáveis podem
apresentar extremos conhecidos.
AT  xmáx.  xmín.

27
No caso dos dados serem agrupados com intervalos de classe, a amplitude total é a diferença entre o limite
superior da última classe e o limite inferior da primeira classe:
AT  Lmáx.  lmín.

A amplitude é, na verdade, uma medida fraca de dispersão, porque ela considera somente os valores extremos
e não diz nada sobre a distribuição dos valores intermediários.
4.3. Variância e Desvio Padrão
Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são, na sua
maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade
dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os
mais geralmente empregados.
A variância é baseada nas diferenças entre cada valor do conjunto de dados e a média do grupo (desvios). A
variância é dada pela soma dos quadrados dos desvios xi  x  de cada observação em relação à média, dividida pelo
número de elementos da amostra, ou seja, ela é a média aritmética dos quadrados dos n desvios.

Para uma população, a variância é representada pela letra grega minúscula  2 (ler “sigma dois” ou “sigma ao
quadrado”) e a variância de uma amostra é representada por s2.
n

(x i  x )2
Para uma amostra de n valores x1 , x2 , ..., xn de uma variável X, a variância é dada por: s 2  i 1
.
n

d1 d3 d4
d2 d6 d7
d5

(x i  x )2
d  d2  d3  d4  d5  d6  d7
2 2 2 2 2 2 2
s 
2 i 1
 1
7 7

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em
relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio
padrão, definida como a raiz quadrada da variância e representada por s: s  s2 .

 x  x
2

Assim: s 
i
. (I)
n

28
Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua compreensão, ela não é
uma boa fórmula para fins de computação, pois, em geral, a média aritmética  x  é um número fracionário, o que
torna pouco prático o cálculo das quantidades xi  x  .
2

Podemos simplificar os cálculos fazendo uso de uma equivalente de (I), escrevendo-a da seguinte maneira:

x   xi
2
2

s   . (II)
i

n  n 
 
Não apenas este método é usualmente mais prático, como também mais preciso. Quando a média não é exata e
tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo
acontece com os quadrados, podendo o resultado do cálculo ser menos exato do que quando a fórmula (II) é usada.
O desvio padrão é uma das medidas mais comumente usadas para distribuições, e desempenha papel relevante
em toda a Estatística. Cabe notar que a unidade do desvio padrão é a mesma da média. Por exemplo, se a média é em
R$ (real), o desvio padrão também se exprime em real. A variância, por outro lado, se exprime em quadrados de
unidades (Ex.: real2, metros2), como já vimos anteriormente.
Intuitivamente, o desvio padrão representa uma média dos desvios (absolutos) que todos os valores amostrais
possuem ao redor da média. Valores da série próximos uns dos outros originam um desvio padrão menor, enquanto
valores muito afastados uns dos outros dão um desvio padrão maior. Em outras palavras, a série de dados que
apresentar desvio padrão maior, terá uma distribuição de frequências mais aberta que a série com desvio padrão
menor.
Obs.: Quando os dados estão agrupados, o desvio padrão é obtido pela seguinte fórmula:

fx   f i xi
2
2

s   ,
i i

f  f



onde x i é o valor da variável (sem intervalos de classes) e o ponto médio (com intervalos de classe).

4.4. Coeficiente de Variação


Considere, a título de ilustração, as vendas diárias de dois restaurantes.
Restaurante
Restaurante
Fogão à
Dallas
Lenha
50 470
70 490
60 460
80 480
x = 65 x = 475
s = 11,18 s = 11,18

Obviamente, trata-se de restaurantes com poder de vendas diferentes. Apesar de possuírem o mesmo desvio
padrão, é evidente que diferenças nas vendas da ordem de 10 kg, por exemplo, possuem um peso relativo muito maior
para o restaurante Dallas comparado ao Fogão à Lenha. Assim, é razoável afirmar que as variabilidades das vendas
diárias em kg para o restaurante Dallas é bem superior, tornando-se necessária a elaboração de uma medida apropriada
nessas situações onde se deseja comparar conjuntos de dados com médias bem discrepantes.
Necessitamos de uma medida que reúne essas características, que não seja útil apenas na comparação entre
conjuntos de dados de mesma unidade, mas que permita ainda a comparação da variabilidade entre conjuntos de dados
referentes a diferentes características. O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de
duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média
29
for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos
dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão
ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados
em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV):
s
CV   100 .
x
O Coeficiente de Variação indica o percentual de variação média dos dados em torno da sua média.
Voltando ao exemplo considerado no início, temos:
Restaurante Dallas: CV = 17,20% - A variação média das vendas foi de 17,20% em torno da sua média.
Restaurante Fogão à Lenha: CV = 2,35% - A variação média das vendas foi de 2,35% em torno da sua média.
Desta forma pode-se afirmar que as vendas diárias do restaurante Dallas em kg apresentam uma variabilidade
bem superior comparada ao restaurante Fogão à Lenha.

Exemplos:
1. Seja o conjunto de dados (não-agrupados):
xi xi2
40, 45, 48, 52, 54, 62 e 70.
Calcule a amplitude total e o desvio padrão. 40
R: AT = 30 e s = 9,49. 45
48
52
54
62
70
 
2. Suponha que você esteja gerenciando uma pizzaria e que mantém um controle das vendas dos diversos tipos
de pizza. Suponha ainda que tenha observado os seguintes valores de vendas diárias de pizzas do tipo
calabresa durante um período de 9 dias: 40, 56, 38, 38, 63, 59, 52, 49, 46. Calcule, nesses 9 dias:
a) A média b) A mediana c) A moda d) O desvio padrão (Via calculadora)
R: 49, 49, 38pizzas e 8,73

3. Seja a distribuição de frequências com dados agrupados sem intervalos de classe:

xi fi f i xi f i xi2
0 2
1 6
2 12
3 7
4 3
  
Calcule a amplitude total e o desvio padrão.
R: AT = 4 e s = 1,04.

30
4. Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:

x s
Estaturas (cm) 175 5,0
Pesos (kg) 68 2,0
Temos:
CVE =

CVP =

Logo, nesse grupo de indivíduos, os pesos apresentam _________ (maior, menor) grau de dispersão
que as estaturas.

5. Considere a seguinte distribuição de frequências com dados agrupados com intervalos de classe:

i Estaturas (cm) fi xi f i xi f i xi2


1 150 |---- 154 4
2 154 |---- 158 9
3 158 |---- 162 11
4 162 |---- 166 8
5 166 |---- 170 5
6 170 |---- 174 3
  
Calcule a amplitude total e o desvio padrão. R: AT = 24 cm e s = 5,57 cm.

EXERCÍCIOS

1. Durante um determinado mês, os oito vendedores de uma concessionária venderam os seguintes


números de unidades de veículos: 8, 11, 5, 14, 8, 11, 16, 11. Considerando este mês como uma
população estatística de interesse, o número médio de unidades vendidas é de:_____? Calcule a
amplitude total e o desvio padrão. R: x = 10,50, AT = 11 e s = 3,28.

xi fi f i xi f i xi2

  

31
2. Uma amostra de 17 operários de uma companhia apresentou os seguintes salários (R$) recebidos
durante certa semana: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190,
200, 240. Calcule a amplitude total e o desvio padrão. R: AT = R$ 100,00 e s = R$ 27,60.

xi fi f i xi f i xi2

  
3. Um especialista em padrões de trabalho observa, em um escritório, a quantidade de tempo requerida
para a digitação de uma amostra de 10 cartas, com os seguintes resultados enumerados em ordem
crescente: 5, 5, 5, 7, 9, 14, 15, 15, 16, 18. Calcule a amplitude total e o desvio padrão.
R: AT = 13 min e s = 4,93 min.
xi fi f i xi f i xi2

  

4. Seja a distribuição de frequências com dados agrupados sem intervalos de classe:

xi fi f i xi f i xi2
2 1
3 3
4 5
5 8
6 5
7 4
8 2
  
Calcule a amplitude total e o desvio padrão. R: AT = 6 e s = 1,51.

32
5. Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente, considere a variável
“número de caras obtidas”:

xi fi f i xi f i xi2
0 4
1 14
2 34
3 29
4 16
5 3
  
Calcule a amplitude total e o desvio padrão. R: AT = 5 e s = 1,13.

6. A tabela abaixo se refere às taxas mensais de aluguéis de apartamentos na cidade de Porto Alegre.
Calcule a amplitude total e o desvio padrão. R: AT = R$ 300,00 e s = R$ 61,99.

Aluguel (R$) Nº de apartamentos ( f i ) xi f i xi f i xi2


150 |---- 180 3
180 |---- 210 8
210 |---- 240 10
240 |---- 270 13
270 |---- 300 33
300 |---- 330 40
330 |---- 360 35
360 |---- 390 30
390 |---- 420 16
420 |---- 450 12
  
7. Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo necessário
para realizar a auditoria de 50 balanços contábeis, tal como indicado na seguinte tabela. Calcule a
amplitude total e o desvio padrão para o tempo de auditoria necessário para esta amostra de registros.
R: AT = 50 min. e s = 12,28 min..

Tempo de auditoria Nº de balanços


xi f i xi f i xi2
(min) ( fi )
10 |---- 20 3
20 |---- 30 5
30 |---- 40 10
40 |---- 50 12
50 |---- 60 20
  

33
8. Na distribuição de frequências a seguir estão reproduzidos os números médios de acidentes por
1.000 horas/homem em 50 indústrias mecânicas. Determinar a amplitude total e o desvio padrão.

Nº médio de
Nº de acidentes ( f i ) xi f i xi f i xi2
acidentes
1,5 |---- 1,8 3
1,8 |---- 2,1 12
2,1 |---- 2,4 14
2,4 |---- 2,7 9
2,7 |---- 3,0 7
3,0 |---- 3,3 5
  
R: AT = 1,8 acidentes e s = 0,42 acidente.

9. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão,
respectivamente, 18,3 e 1,47, calcule o coeficiente de variação. R: CV = 8,03%.

10. Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio
padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que
disciplina foi maior a dispersão? R: Estatística (10,41%).

11. Medidas as estaturas de 1.017 indivíduos, obtivemos média igual a 162,2 cm e desvio padrão de 8,01
cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses
indivíduos apresentam maior variabilidade em estatura ou em peso? R: Estatura (4,94 %).

12. Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 6,05 cm.
Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01
cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo?
R: O de 125 moças.

13. Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação
de 3,3%. Qual o desvio padrão desse grupo? R: s = 5,41 cm.

14. Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da
distribuição. R: x  51,72.

34
5. CORRELAÇÃO E REGRESSÃO
5.1. Introdução
Muitas vezes, na prática, necessitamos estudar o relacionamento de duas variáveis, coletadas como
pares de valores, para resolver questões, como por exemplo:
O sucesso de um emprego pode ser predito com base no resultado de testes;
Quanto maior for a produção, maior será o custo total;
Quanto maior for a idade de um automóvel, menor será seu preço de venda.
Problemas como esses podem ser estudados através de uma análise de correlação simples, onde
podemos determinar a “força” do relacionamento entre estas duas variáveis estudadas.
As variáveis estudadas serão: x, denominada de variável independente, e y, denominada de
variável dependente.
Se o relacionamento entre x e y for consistente e necessitamos fazer uma predição para o valor de y, conhecido
um valor de x, através de uma fórmula matemática adequada, podemos aplicar a chamada análise de regressão
simples.
5.2 Diagrama de Dispersão
É um gráfico no qual cada ponto plotado representa um par observado de valores para as variáveis
estudadas (x, y), num sistema de eixos cartesianos.
Através do diagrama de dispersão podemos ter uma idéia do tipo de relação entre as variáveis
estudadas.
A seguir temos alguns exemplos de diagramas de dispersão.

35
5.3 Coeficiente de Correlação Linear
Medida do grau de associação (relacionamento) entre duas variáveis estudadas a partir de uma série
de observações.
Esta medida é também chamada de coeficiente de correlação de Pearson, em homenagem ao seu
criador e é dada por:

n xi yi   xi  yi 
r
n x 2
i  xi 
2
 n y 2
i  yi 
2

Onde n é o número de pares de valores (x, y) observados e r varia no intervalo  1  r  1 , para o
mesmo, temos que:
• Valores de r próximos de (+1) indicam uma forte correlação positiva entre x e y;
• Valores de r próximos de (– 1) indicam uma forte correlação negativa entre x e y;
• Valores de r próximos de 0 indicam uma fraca correlação positiva ou negativa entre x e y.
A partir dos valores de r, podemos verificar o tipo da correlação existente entre as variáveis
estudadas, conforme a seguinte tabela:
Valor de r Correlação
0,0 nula
0,0 ----| 0,5 fraca
0,5 ----| 0,8 média
0,8 ---- 1,0 forte
1,0 perfeita

Obs.: Usar a equação de regressão somente quando r indicar correlação linear significativa.

5.4 Alguns Conceitos

Outliers – pontos muito afastados dos demais.


Predição – as equações de regressão podem ser úteis para predizer (estimar) o valor de uma variável, dado
um valor determinado da outra variável.
Coeficiente Angular (a) – medida da variação que ocorre em uma característica quando outra característica
se modifica de uma unidade.
Intercepto – coeficiente linear (b) – ponto de intersecção da reta com o eixo das ordenadas (eixo y).
Equivale ao valor de y quando x = 0.
Equação das Retas de Regressão – funções resultantes do ajuste de uma função linear entre 2 variáveis y e
x, define a linha reta que descreve a associação entre duas características e permite estimar o valor de uma
medida pela outra. Para obter a reta de regressão é necessário calcular o Coeficiente angular “a” e o
Coeficiente linear da reta com o eixo das ordenadas “b”.

Parâmetros da reta y = ax + b (Regressão):


n xi yi   xi  yi 
a e b  y  ax .
n xi2  xi 
2

x i y
Onde: x  e y i .
n n

36
Exemplo. Consideremos as duas variáveis, Pesos e Comprimentos de Ursos (População), cujos dados
coletados estão abaixo.

x Comprimento (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0
y Peso (lb) 80 344 416 348 262 360 332 34
Obs.: in. – polegada e lb – libras.

A relação entre as variáveis é evidenciada pela formação de um padrão no Diagrama de Dispersão.


Segue abaixo o Diagrama de Dispersão dos dados do problema.

Observando a tabela e o diagrama anteriores desenvolva os itens abaixo.

a) Preencha a tabela abaixo.

Comprimento ( xi ) Peso ( y i ) xi y i xi2 y i2

  ________    ______   ______   ______


_________

b) Calcule o coeficiente de correlação de Pearson. r = 0,90


c) Tire conclusões: ________________ (há ou não há) evidência suficiente para apoiar a existência de
uma correlação linear significativa entre as duas variáveis.
d) Encontre a equação da reta ajustada. y = 9,66 x – 351,65
e) Se um urso tem comprimento de 71,0 in., prediga seu peso. y = 334,21

37
EXERCÍCIOS

1. Sejam os seguintes diagramas de dispersão. Determine se há uma correlação linear positiva, uma
correlação linear negativa ou se não há correlação entre as variáveis.

2. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real e a
média dos pesos aparentes, dados pelo grupo, obteve-se a tabela:

Peso real ( xi ) Peso aparente ( y i ) xi y i xi2 y i2


18 10
30 23
42 33
62 60
73 91
97 98
120 159
  ________   _________   ______  
______ ______
Com a tabela preenchida, calcule o índice de correlação.

3. Uma amostra de residências selecionadas aleatoriamente, num bairro, foi observada quanto à idade
do imóvel (x), em anos, e ao preço de venda (y), em mil reais, resultando:

xi yi xi y i xi2 y i2
1 100
2 80
3 90
4 15
5 50
6 20
  _______   _______   _______   _______   _______

Com os dados da tabela, responda os itens abaixo.


a) Estime a reta de regressão.
b) Calcule o coeficiente de correlação x e y.

38
4. Considere os resultados de dois testes, x e y, obtidos por um grupo de alunos da escola A:

xi yi xi y i xi2 y i2
11 13
14 14
19 18
19 15
22 22
28 17
30 24
31 22
34 24
37 25
  _______   _______   _______    _______
_______

Com os dados da tabela, calcule o coeficiente de correlação.

5. Pretendendo-se estudar a relação entre as variáveis “consumo de energia elétrica” (x i) e “volume de


produção nas empresas industriais” (yi), fez-se uma amostragem que inclui vinte empresas,
computando-se os seguintes valores:
 xi  11,34,  yi  20,72,  xi2  12,16,  yi2  84,96,  xi yi  22,13.
Determine:
a) O cálculo do coeficiente de correlação;
b) A equação de regressão de y para x;

6. A variação do valor da UPC (Unidade Padrão de Capital), relativamente a alguns meses de 2009,
deu origem à tabela:

Meses xi Valores (R$) ( y i ) xi y i xi2 y i2


Maio 21,75
Junho 21,75
Julho 21,78
Agosto 21,78
Setembro 21,78
Outubro 21,81
Novembro 21,81
    
_____ _____________ ________ ________ ________
Preencha a tabela e responda os itens abaixo.
a) Calcule o grau de correlação.
b) Estabeleça a equação de regressão de y sobre x.
c) Estime o valor da UPC para o mês de dezembro.

39
Sugestão: Substitua os meses, respectivamente, por 5, 6, ..., 11.

7. A partir da tabela:
xi yi xi y i xi2 y i2
1 70
2 50
3 40
4 30
5 20
6 10
  ___________   _____________   ________   _______   _______
a) Calcule o grau de correlação;
b) Determine a reta ajustada;
c) Estime o valor de y para x = 0.

8. Usando uma amostra de 18 elementos casuais um agente estimou o coeficiente de correlação entre x
e y em 0,32. O que isso te comunica sobre essas duas variáveis nessa população?

9. Em certa população o coeficiente de correlação entre x e y é – 0,8. O que isso significa?

10. Quando você investiga a relação entre duas variáveis aleatórias contínuas, por que é importante fazer
um gráfico de dispersão dos dados?

Respostas:
1. Correlação linear negativa, correlação linear positiva, não há correlação;
2. Índice de correlação r = 0,98
3. a) y = – 16,14 x + 115,67 b) r = – 0,83
4. r = 0,89
5. a) r = 0,54 b) y = 1,81 x + 0,01
6. a) r = 0,94 b) y = 0,01 x + 21,69 c) R$ 21,81
7. a) r = – 0,99 b) y = – 11,43 x + 76,67 c) y = 76,67

40
11. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação,
uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma
delas a idade (x) e a massa muscular (y).

Idade (xi) Massa muscular (yi) xi y i xi2 y i2


71 82
64 91
43 100
67 68
56 87
73 73
68 78
56 80
76 65
65 84
45 116
58 76
45 97
53 100
49 105
78 77
73 73
68 78
  ________   _________   ________   _________   _________
Com os dados da tabela, responda os itens abaixo.
a) O diagrama de dispersão está construído abaixo, interprete-o.

b) Calcule o coeficiente de correlação linear entre x e y. O que se pode concluir sobre a correlação de
posse do valor de r?
Resp.: -0,86
c) Ajuste uma reta de regressão para a relação entre as variáveis y: massa muscular (dependente) e x:
idade (independente).
Resp.: Y=-1,04x+149,7

d) Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50
anos. Resp.: y=97,7

41
12. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades
monetárias) para uma amostra de 25 famílias.

Gasto com
Renda Familiar (xi) xi y i xi2 y i2
Alimentação (yi)
3 1,5
5 2,0
10 6,0
10 7,0
20 10,0
20 12,0
20 15,0
30 8,0
40 10,0
50 20,0
60 20,0
70 25,0
70 30,0
80 25,0
100 40,0
100 35,0
100 40,0
120 30,0
120 40,0
140 40,0
150 50,0
180 40,0
180 50,0
200 60,0
200 50,0
  _________   _________   _________   _________   _________

Faça o que se pede com o auxílio do Excel.


a) Faça o diagrama de dispersão e interprete-o.
b) Calcular o coeficiente de correlação entre essas variáveis. O que se pode concluir sobre a correlação
de posse do valor de r. r = 0,95

c) Obtenha a equação de regressão do gasto com alimentação em função da renda familiar.


R: y = 0,26 x + 5,05

42
ANEXO

TABELA DE NÚMEROS ALEATÓRIOS (T.N.A.)

L/C 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 5 7 7 2 0 0 3 9 8 4 8 4 4 1 7 9 6 7 7 1 4 0 2 1 1
2 2 8 8 0 5 3 5 1 5 9 0 9 9 3 9 8 8 7 5 8 7 0 2 7 7
3 9 2 5 9 1 8 5 2 8 7 3 0 4 8 8 6 9 7 4 8 3 5 2 5 1
4 9 0 3 8 1 2 9 1 7 4 3 0 1 9 7 5 8 9 0 7 5 0 6 4 1
5 8 0 9 1 1 6 9 4 6 7 5 8 6 0 8 2 0 6 6 6 9 0 4 7 5
6 2 2 0 1 7 0 3 1 3 2 9 6 9 1 9 2 7 5 4 0 1 6 5 4 2
7 5 6 2 4 1 0 0 4 3 0 2 0 4 6 2 9 9 0 5 3 5 3 1 1 0
8 7 9 4 4 9 2 6 2 0 2 9 6 8 6 6 4 3 0 0 0 9 4 5 6 6
9 5 3 9 9 6 6 4 5 0 8 8 9 7 8 5 0 7 7 5 3 3 7 2 5 7
10 1 8 9 2 8 7 3 5 8 8 5 5 0 5 2 1 3 6 5 1 3 9 2 8 5
11 5 3 0 8 5 8 9 6 6 3 0 5 6 1 2 5 7 0 2 2 5 0 4 1 2
12 0 3 5 8 8 0 2 9 2 8 7 6 8 9 5 1 1 8 2 4 8 8 8 9 4
13 2 7 0 7 8 1 8 8 6 5 6 9 4 9 9 8 0 0 2 8 0 4 7 0 5
14 0 5 2 1 0 8 5 9 0 1 0 6 2 2 2 4 9 8 9 1 8 1 1 7 5
15 4 0 3 6 1 3 2 7 8 4 3 0 8 2 3 3 3 6 3 9 6 9 4 2 0
16 5 4 6 0 2 5 2 8 8 5 8 8 2 0 0 0 1 0 5 9 6 1 0 5 3
17 7 1 5 1 6 3 4 0 7 6 7 1 1 1 7 3 7 3 5 2 3 7 3 1 6
18 6 1 0 2 0 1 8 1 7 3 9 2 6 0 6 6 7 3 5 8 5 3 3 4 4
19 8 2 5 5 9 3 1 3 4 6 3 0 9 5 2 6 5 5 0 6 9 6 1 7 6
20 8 9 9 8 5 4 1 4 2 1 7 4 1 3 5 7 6 8 1 9 8 6 2 8 6
21 0 0 9 9 8 4 8 4 1 4 6 7 9 5 1 3 7 7 5 8 9 0 1 4 5
22 6 2 4 1 5 0 7 8 2 0 4 8 0 5 8 8 4 3 5 2 9 8 0 3 1
23 9 4 2 7 9 0 6 9 2 4 6 8 0 9 9 2 1 1 8 6 0 7 6 3 8
24 4 4 8 9 2 9 2 8 8 4 3 6 2 8 2 5 1 5 8 2 8 7 7 4 1
25 9 7 3 0 7 6 9 5 3 3 2 1 1 0 5 4 2 6 9 5 6 6 6 5 5
26 3 9 1 6 5 8 0 4 4 4 8 0 1 5 5 9 5 9 8 3 9 0 9 5 5
27 6 0 7 8 1 1 0 3 2 6 6 7 5 0 3 4 0 9 6 1 3 1 3 0 2
28 0 3 1 9 2 3 4 7 6 2 8 9 5 7 7 7 9 1 3 3 8 8 4 7 6
29 4 1 2 8 5 2 6 7 5 6 2 5 3 9 5 9 9 6 6 5 5 1 3 6 9
30 7 7 5 4 9 8 5 0 3 9 2 5 3 7 4 2 5 2 9 7 1 0 0 3 5
31 2 8 6 3 4 1 6 1 9 1 6 4 2 4 8 3 8 1 3 7 3 4 4 8 8
32 7 4 2 4 4 8 8 5 4 0 1 2 3 3 5 9 6 7 5 0 1 4 9 8 1
33 0 0 2 4 0 3 3 7 9 6 4 6 6 8 7 5 0 5 3 2 4 2 1 6 6
34 0 5 4 1 4 7 6 9 6 9 4 5 3 6 1 6 7 1 1 8 9 5 5 1 9
35 6 2 6 9 8 4 9 7 9 7 4 7 2 3 6 6 5 1 5 6 1 3 0 8 6

43
2. INTRODUÇÃO À PROBABILIDADE

A teoria da probabilidade é um dos campos mais aliciantes da Matemática. Parte dos acontecimentos do
dia a dia tropeça no conceito de azar ou de sorte e estabelece leis que permitem “medir a sorte”. Odete
Bernardes
2.1. Experimento Aleatório
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “é provável
que o meu time ganhe a partida de hoje” pode resultar:
a) que, apesar do favoritismo, ele perca;
b) que, como pensamos, ele ganhe;
c) que empate.
Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados fenômenos
aleatórios ou experimentos aleatórios.

Definição 1: Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob
condições semelhantes, apresentam resultados imprevisíveis, e será denotado por  (épsilon).
Devemos raciocinar em termos de materiais ideais. Por exemplo, moedas com as faces cara e coroa, dados
com material homogêneo.

Exemplo 1
1. Jogar uma moeda para verificar a face que ficará voltada para cima.
2. Jogar um dado para verificar a face superior.
3. Testar uma peça para verificar se está ou não perfeita.
4. Retirar uma bola de uma urna que contenha uma bola branca, uma azul, uma cinza, uma vermelha e
uma verde e observar a cor da bola premiada.

Se deixarmos uma massa M cair em queda livre de uma altura de 1 metro sobre uma superfície poderemos
anotar o tempo t, de queda livre. Este fenômeno é classificado como determinístico (Física).

2.2. Espaço Amostral


Definição 2: Denomina-se Espaço Amostral ao conjunto formado por todos os resultados de um
experimento aleatório, representado por S.

Exemplo 2
Dos experimentos do exemplo 1, os respectivos espaços amostrais são:
a) S1 = ____________________________________
b) S2 = ____________________________________
c) S3 = _________________________________________________
d) S4 = ___________________________________________________________

2.3. Eventos
Definição 3: Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório.
Notação: A, B, C, D, E,...
Assim, qualquer que seja E, se E  S , então E é um evento de S.

Se E = S, E é chamado evento certo, este é o evento que sabemos que irá ocorrer antes mesmo da
realização da experiência.
44
Exemplo 3 Ocorrência de Cara ou Coroa no lançamento de uma moeda.

Se E  S e E é um conjunto unitário, E é chamado evento elementar.


Se E   , E é chamado evento impossível, ou seja, o evento é constituído por nenhum resultado do
espaço amostral de um experimento aleatório. É o evento que jamais irá ocorrer.

Exemplo 4 Ocorrência de Paus e Ouro na mesma carta.

Ilustração dos conceitos vistos

Exemplo 3
No lançamento de um dado, onde S =  ________________________  , temos:
a) A  2,4,6  S ; logo, A é um evento de S.
b) B  1,2,3,4,5,6  S ; logo, B é um evento ___________________ de S.
c) C  4  S ; logo, C é um evento __________________________ de S.
d) D    S ; logo, D é um evento ___________________________ de S.

45
2.4. Probabilidade
Probabilidade é a parte da Estatística que tem por objetivo atribuir um valor numérico que represente de
forma clara e correta a chance que cada evento tem quando se executa um experimento aleatório.
Este valor numérico é representado por um número relativo, isto é, compreendido entre zero e um;
pelo qual pode ser transformado em porcentagem.
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S
tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.

Definição 4: Chamamos de probabilidade de um evento A  A  S  o número real P(A), tal que:


n( A)
P( A) 
n( S )
onde: n(A) é o número de elementos de A;
n(S) é o número de elementos de S.

Exemplo 5
a) Considerando o lançamento de uma moeda e o evento A “obter cara”, temos:

b) Considerando o lançamento de um dado, vamos calcular:


- a probabilidade do evento A “obter um número par na face superior”.

- a probabilidade do evento B “obter um número menor ou igual a 6 na face superior”.

- a probabilidade do evento C “obter um número 4 na face superior”.

- a probabilidade do evento D “obter um número maior que 6 na face superior”.

c) Quais destes eventos têm probabilidade igual a 0 (ou muito próximo a zero) e quais têm probabilidade
igual a 1 (ou muito próximo a 1)?
- A noite suceder ao dia
- Todos os políticos falarem a verdade o tempo todo
- Você achar um cheque de um milhão de reais dentre as páginas de um livro pego na biblioteca
- Ocorrer um incêndio nesta sala

2.5. Eventos Mutuamente Exclusivos (ME)


Definição 5: Os eventos A e B se dizem Mutuamente Exclusivos (ME) se a ocorrência de um deles exclui
(impossibilita) a ocorrência do outro.

Nota: Em termos matemáticos é o mesmo que dizer: A  B   .


Existe sempre a relação:
P( A  B)  P( A)  P( B) .

46
Exemplo 6
No lançamento de um dado os eventos A “obter o número 3” e B “obter um número par”, são mutuamente
exclusivos. Encontrar a probabilidade de ocorrer A ou B.

2.6. Eventos Complementares


Definição 6: Os eventos A e B se dizem complementares se satisfizerem simultaneamente as duas
condições:
a) Forem ME, isto é, A  B   ;
b) A B  S.

Notação: O complementar do evento A é denotado por A .


Assim, temos:
P( A)  1  P( A)

Exemplo 7: Se A for a ocorrência de Cara no lançamento de uma moeda, então Coroa será o evento A ,
ou evento complementar de A.
2.7. Eventos Independentes
Definição 7: Dizemos que dois eventos são independentes quando a realização ou a não-realização de um
dos eventos não afeta a probabilidade da realização do outro e vice-versa.

Se dois eventos, A e B são independentes, a probabilidade de que eles se realizem simultaneamente


é igual ao produto das probabilidades de realização dos dois eventos, ou seja:
P A  B  P A  PB .
Exemplo 6
Lançamos dois dados. Sejam os eventos A “obter 6 no primeiro dado” e B “obter 4 no segundo dado”.
Encontrar a probabilidade de obter, simultaneamente, 6 no primeiro e 4 no segundo.

Obs.: Não confundir Eventos Mutuamente Exclusivos com Eventos Independentes.

* Eventos Mutuamente Exclusivos: a ocorrência de um implica a NÃO ocorrência do outro, ou seja, não
ocorrem simultaneamente.

* Eventos Independentes: a ocorrência de um não afeta a ocorrência do outro, mas ambos podem ocorrer
simultaneamente.

47
2.8. Principais Propriedades da Probabilidade
P1. P( )  0 .
P2. P( A)  1  P( A) .
P3. P( A  B)  P( A)  P( B)  P( A  B) A e B quaisquer eventos.
Obs.: Se A e B forem ME, então P( A  B)  P( A)  P( B)
P4. P A  B  C   P A  PB  P(C)  P( A  B)  P( A  C)  P( B  C)  P( A  B  C)
P5. Se A  B então P( A)  P( B) .

2.9. Baralho Padrão de Cartas de Jogo

Exemplo 7
Seleciona-se uma carta de um baralho normal. Determine a probabilidade dos seguintes eventos ocorrerem:
a) A “selecionar um 7 de ouros”;
b) B “selecionar uma carta de ouro”;
c) C “selecionar uma carta de ouro, copas, paus ou espada”.

EXERCÍCIOS
1. No experimento aleatório  , seu espaço amostral é:
S  a, b, c, d , e, f , g , h, i, j
sejam os seguintes eventos associados a  :
A  a, b, c B  g , h, i, j C  c, d , e, f 
D  d , e, f , g , h, i, j E  a, f , g
a) Verifique quais pares de eventos são:
a1. Mutuamente Exclusivos
a2. Complementares

b) Encontre o complementar de C e o de D.

2. Temos do exercício anterior que:


P(A) = P(B) = P(C ) =

P( A  C ) = P ( A  B) = P( B  C ) =
R: 0,30; 0,40; 0,40; 0,10; 0,00; 0,00

3. A probabilidade de um evento A qualquer, varia no intervalo _____  P( A)  _____.


4. Uma urna contém duas bolas brancas e três bolas vermelhas. Suponha que são sorteadas duas bolas ao
acaso, sem reposição.
a) Qual a probabilidade das duas bolas serem brancas?
( ) 0,05 ( ) 0,08 ( ) 0,10 ( ) 0,12 ( ) 0,15
b) Qual a probabilidade das duas bolas serem vermelhas?
( ) 0,30 ( ) 0,35 ( ) 0,40 ( ) 0,45 ( ) 0,50

48
c) Qual a probabilidade da 1ª ser vermelha e a 2ª ser branca?
( ) 0,20 ( ) 0,30 ( ) 0,35 ( ) 0,40 ( )
0,45

5. Enumere a segunda coluna de acordo com a primeira:

(1) Experimentos Aleatórios ( ) Qualquer subconjunto do espaço amostral.

n ( A)
(2) Evento ( ) .
n( S )
( ) O conjunto formado por todos os resultados possíveis de
(3) Probabilidade de um evento A
um experimento aleatório.

(4) Espaço Amostral ( ) O resultado final depende do acaso.

6. Considerando um lote de 12 peças, 4 são defeituosas, e o experimento aleatório “Retirar uma peça do
lote” vamos calcular:
a) a probabilidade do evento A “obter uma peça defeituosa”.

b) a probabilidade do evento B “obter uma peça não defeituosa”. R: 0,3333; 0,6667

7. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. R: 0,1111

8. De dois baralhos de 52 cartas, cada, retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade de ocorrer o evento A “obter um rei do primeiro baralho” e B
“obter um 5 de paus do segundo”? R: 0,0015

9. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas,
1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual
é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente,
branca, preta e verde? R: 0,0370

10. De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a
primeira carta ser o ás de paus e a segunda ser o rei de paus? R: 0,0004

11. No lançamento de um dado, qual a probabilidade de se obter um número não-inferior a 5? R: 0,3333

12. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.
R: 0,1667

13. Determine a probabilidade de cada evento:


a) Um número par aparece no lançamento de um dado.
b) Uma figura aparece ao se extrair uma carta de um baralho de 52 cartas.
c) Uma carta de ouros aparece ao se extrair uma carta de um baralho de 52 cartas.
d) Uma só coroa aparece no lançamento de três moedas. R: 0,5000; 0,2308; 0,2500; 0,3750

49
14. Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50. Determine a
probabilidade de:
a) o número ser divisível por 5;
b) o número terminar em 3;
c) o número ser divisível por 4 e por 6. R: 0,2000; 0,1000; 0,0800

15. Dois dados são lançados simultaneamente. Determine a probabilidade de:


a) a soma ser menor que 4;
b) a soma ser 9;
c) o primeiro ser maior que o segundo;
d) a soma ser menor ou igual a 5. R: 0,0833; 0,1111; 0,4167; 0,2778

16. Uma moeda é lançada duas vezes. Calcule a probabilidade de:


a) não ocorrer cara nenhuma vez;
b) obter-se cara na primeira ou na segunda jogada. R: 0,2500; 0,5000
ou – exclusivo

17. Um inteiro entre 3 e 11 será escolhido ao acaso.


a) Qual é a probabilidade de que este número seja ímpar?
b) Qual é a probabilidade de que este número seja ímpar e divisível por 3? R: 0,4286; 0,1429

18. Um empresário supersticioso, quando necessita viajar, escolhe o modelo de transporte através do
lançamento de uma moeda: se sair cara viaja de ônibus, se sair coroa, viaja de avião. Numa semana em
que tiver de fazer exatamente 4 viagens, ache a probabilidade de que ele faça:
a) Nenhuma de avião;
b) Exatamente duas de ônibus;
c) Pelo menos uma de avião. R: 0,0625; 0,3750; 0,9375

19. Para fazer escolha do dia da semana (6 dias úteis) de folga de um funcionário o Diretor de uma empresa
joga um dado e a face voltada para cima indicará o dia de folga, sendo que nesta empresa trabalha um
casal (esposo / esposa). Em uma semana ache a probabilidade de que, para este casal ocorra a seguinte
folga:
a) Esposo e esposa no mesmo dia;
b) Esposa antes do esposo;
c) Esposo e esposa em dias seqüenciais. R: 0,1667; 0,4167; 0,2778

20. Na parte de higiene de um supermercado, possui uma prateleira de Pasta Dental. A tabela abaixo mostra
a disponibilidade nesta prateleira:
Marca Quantia de Pasta Dental por tamanho Total
75g 90g 120g
Close-Up 12 10 8
Sorriso 18 12 11
Colgate 22 14 7
Phillips 8 12 6

Total

50
Um comprador pega uma destas embalagens totalmente ao acaso. Ache a probabilidade de que o
produto comprado:
a) Seja Colgate ou Phillips;
b) Seja Close-Up ou de 120g;
c) Não seja Phillips;
d) Não seja de 75g, nem Close-Up. R: 0,4929; 0,3857; 0,8143; 0,4429

21. O departamento de entrega de uma distribuidora possui 5 veículos numerados de 1 a 5. Para cada
entrega é feito um sorteio. No dia em que houver 2 entregas simultâneas, ache a probabilidade dos
veículos que farão as entregas serem:
a) De numeração seqüencial;
b) Todos de numeração par;
c) Um de numeração par e o outro ímpar;
d) Pelo menos um de numeração maior que 3. R: 0,4000; 0,1000; 0,6000; 0,7000

22. O Conselho Norte-americano de Investigação de Riscos e Segurança Química é responsável por


determinar as causas principais de acidentes industriais. Desde sua criação em 1998, identificou 83
acidentes que foram causados por falhas em sistemas de gestão (Process Safety Progress, dez. 2004). A
tabela a seguir dá um detalhamento das causas principais desses 83 acidentes.

Categoria de causa de Número de


sistemas de gestão incidentes
Engenharia e projeto 27
Procedimento e práticas 24
Gerência e supervisão 22
Treinamento e comunicação 10
Total 83
Fonte: Blair, A. S. “Management system failures identified in
incidents investigated by the U. S. Chemical Safety and
Hazard Investigation Board”. Process Safety Progress, v. 23,
n. 4, dez. 2004.

a) Determine e interprete a probabilidade de que um acidente industrial seja causado por engenharia ou
projeto defeituosos. (0,3253)

b) Determine e interprete a probabilidade de que um acidente industrial seja causado por alguma outra
coisa diferente de procedimentos e práticas defeituosas. (0,7108)

c) Determine e interprete a probabilidade de que um acidente industrial seja causado por gerência e
supervisão ou treinamento e comunicação. (0,3855)

23. De acordo com o Journal of Business Venturing (vol. 17, 2002), 27% de todos os pequenos negócios
cujos donos são brancos não hispânicos nos Estados Unidos são empresas de propriedade de mulheres.
Se selecionarmos, ao acaso, um pequeno negócio cujo dono seja um branco não hispânico, qual será a
probabilidade de que seja uma empresa de propriedade de um homem?

51
24. O Organization Development Journal (verão, 2006) relatou os resultados de um levantamento feito com
gerentes de recursos humanos de grandes empresas localizadas em uma cidade do sudeste norte-
americano. O foco do estudo foi o comportamento dos empregados – especificamente, absenteísmo,
disposição para o trabalho e rotatividade. O estudo mostrou que 55% dos gerentes de RH tiveram
problemas com absenteísmo dos empregados e que 41% tiveram problemas com rotatividade. Suponha
que 22% dos gerentes de RH tenham enfrentado problemas com absenteísmo e também com
rotatividade. Use essa informação para achar a probabilidade de que um gerente de RH selecionado
dentro do grupo pesquisado tenha tido problemas com absenteísmo ou com a rotatividade dos
empregados. (74%)

25. O E*Trade Group Inc. foi a primeira companhia a proporcionar a negociação de ações on-line para seus
clientes, oferecendo uma alternativa às firmas de investimento tradicionais. De acordo com a Business
Week, as negociações de ações representam uma parte significativa do negócio de corretagem. A
seguinte tabela mostra o número de contas on-line e tradicionais de cinco corretoras importantes.

Corretora Contas on-line Contas tradicionais Total de contas


Fidelity Investiments 2,8 milhões 8,0 milhões 10,8 milhões
Merrill Lynch & Co. 0 8,0 milhões 8,0 milhões
Charles Schwab % Co. 2,8 milhões 3,5 milhões 6,3 milhões
TD Waterhouse Group Inc. 1,0 milhões 1,1 milhões 2,1 milhões
E*Trade Group Inc. 1,24 milhões 0 1,24 milhões
Totais 7,84 milhões 20,6 milhões 28,44 milhões
Fonte: Business Week, 18 out. 1999, p. 185-186.

Suponha que um cliente seja escolhido ao acaso da população de contas descritas na tabela.
Considere os seguintes eventos:
A “A conta é com a Merrill Lynch”
B “A conta é on-line”
C “A conta é com a E*Trade e é on-line”
D “A conta é com a TD Waterhouse ou com a E*Trade e é uma conta on-line”
E “A conta é com a E*Trade”
a) Determine a probabilidade dos eventos anteriormente mencionados.
b) Determine P( A  B) .
c) Determine P( A  B) .
d) Determine P( B  E ) .
e) Determine P( A  E ) .

R: a) 0,2813; 0,2757; 0,0436; 0,0788;0,0436; b) 0; c) 0,5570; d) 0; e) 0,3249.

26. O American Journal of Public Health (jan. 2002) relatou um estudo a respeito de cadeirantes idosos que
vivem em casa. Foi realizada uma pesquisa com uma amostra de 306 cadeirantes, com 65 anos ou mais
de idade, para saber se sofreram uma queda violenta durante o ano e se as suas casas foram
estruturalmente modificadas de uma das seguintes maneiras: modificações no banheiro, nas portas e nos
corredores mais largos, modificações na cozinha, instalação de brilhos e portas fáceis de abrir. O resumo

52
das respostas está na tabela a seguir. Suponha que selecionemos, ao acaso, um dos 306 cadeirantes
pesquisados.
Mudanças nas casas Queda(s) violentas Sem quedas Total
Todas as 5 2 7 9
Pelo menos 1, mas não todas 26 162 188
Nenhuma 20 89 109
Total 48 258 306
Fonte: Berg, K., Hines, M., e Allen, S. “Wheelchair users at home: few home modifications and many injurious falls.”
American Journal of Public Health, vol. 92, n. 1, jan. 2002 (Tabela 1)

a) Determine a probabilidade de que o cadeirante tenha tido uma queda violenta. (0,1569)
b) Determine a probabilidade de que o cadeirante tenha todas as cinco modificações instaladas em casa.
(0,0294)
c) Determine a probabilidade de que o cadeirante não tenha sofrido quedas e nenhuma das
modificações instaladas em casa. (0,2908)
d) Determine a probabilidade de que o cadeirante tenha todas as cinco modificações instaladas em casa
ou sofreram quedas violentas. (0,1797)

27. Extrai-se ao acaso uma bola de uma caixa que contém 6 bolas vermelhas, 4 brancas e 5 azuis. Determine
a probabilidade de a bola extraída ser:
a) vermelha
b) branca
c) azul
d) não-vermelha
e) vermelha ou branca

28. Da mesma caixa do problema anterior, extraem-se três bolas sucessivamente. Determine a probabilidade
de as mesmas serem extraídas na ordem vermelho-branca-azul, (a) havendo reposição, (b) não havendo
reposição.

29. Joga-se um dado “honesto” duas vezes. Determinar a probabilidade de se obter 4, 5 ou 6 na 1ª jogada e
1, 2, 3 ou 4 na 2ª jogada.
30. Determinar a probabilidade de não se obter 7 ou 11 em nenhuma de duas jogadas de dois dados
honestos.
31. Extraem-se aleatoriamente duas cartas de um baralho comum de 52 cartas. Determine a probabilidade
de serem ambas ases, se a primeira carta (a) é reposta, (b) não é reposta.

"Certas derrotas preparam-nos para grandes vitórias"


(Max-Pol Fouchet)

53
REFERÊNCIA BIBLIOGRÁFICA

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. 4ª ed. São Paulo: Atual, 1987.

CRESPO, Antônio Arnot. Estatística Fácil. 18ª ed. São Paulo: Saraiva, 2002.

DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. São Paulo: Saraiva, 1999.

FONSECA, Jairo Simon da; MARTINS, Gilberto Andrade. Curso de Estatística. 6ª ed. São Paulo:
Atlas, 1996.

FREUND, John E.; SIMON, Gary. Estatística Aplicada: Economia, Administração e Contabilidade.
9ª ed. Porto Alegre: Bookman, 2000.

HOEL, Paul G. Estatística Elementar. São Paulo: Atlas, 1980.

McCLAVE, James T. Estatística para administração e economia. 10ª ed. São Paulo: Pearson Prentice
Hall, 2009.

MONTEIRO FILHO, Gercino. Estatística Prática para Administração e Contábeis. 1ª ed. Goiânia:
Gráfica e Editora Vieira Ltda, 1999.

LARSON, Ron. Estatística aplicada. 4ª ed. São Paulo: Pearson Prentice Hall, 2010.

SILVA, Ermes Medeiros da. Et al. Estatística para os curso de Economia, Administração e Ciências
Contábeis. 3ª ed. São Paulo: Atlas, v. I, 1999.

SPIEGEL, Murray R. Estatística. 3ª ed. São Paulo: Makron Books, 1996.

SPIEGEL, Murray R. Probabilidade e Estatística. Coleção Schaum. 3ª ed. São Paulo: Pearson
Education do Brasil, 2004.

STEVENSON, Willian. Estatística Aplicada à Administração. São Paulo: Harpes & Row, 1981.

TRIOLA, Mário F. Introdução à Estatística. 7ª ed. Rio de Janeiro: LTC, 1999.

54

Você também pode gostar