Escolar Documentos
Profissional Documentos
Cultura Documentos
Professor:
Maciel Souza
Estatística
&
Probabilidade
Eng. de Controle e Automação
Turma: ____________
Nome:
1
1. INTRODUÇÃO À ESTATÍSTICA
1.1. Introdução
A palavra estatística lembra, à maioria das pessoas, recenseamentos. Os censos existem há milhares de anos e
constituem um esforço imenso e caro feito pelos governos com o objetivo de conhecer seus habitantes, sua condição
sócio-econômica, sua cultura, religião, etc. Portanto, associar-se estatística a censo é perfeitamente correto do ponto de
vista histórico, sendo interessante salientar que as palavras, estatística e estado têm a mesma origem latina: status.
A estatística é também comumente associada às pesquisas de opinião pública, aos vários índices governamentais, aos
gráficos e médias publicadas diariamente na imprensa. Na realidade, entretanto, a estatística engloba muitos outros
aspectos, sendo fundamental na análise de dados provenientes de quaisquer processos onde exista variabilidade.
1.3. Estatística
A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição,
análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
Podemos dizer que a Estatística se divide em dois grupos, são eles:
Estatística Descritiva – esta tem por objetivo a coleta, a organização e a descrição dos dados.
Estatística Indutiva ou Inferencial – esta destina-se à análise e à interpretação dos dados.
1.4. Variáveis
A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:
para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino;
para o fenômeno “número de filhos” há um número de resultados possíveis expresso através dos números
naturais: 0, 1, 2, 3,..., n;
para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de
valores numéricos dentro de um determinado intervalo.
2
a. qualitativa – quando seus valores são expressos por atributos: sexo (masculino - feminino), cor da pele (branca,
preta, amarela, vermelha, parda) etc.;
Nominal: Quando não permitem comparações. Ex: Sexo, cor de pele;
Ordinal: Quando permitem comparações. Ex: Classe social, grau de instrução;
b. quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma
escola etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o
nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável
recebe o nome de variável discreta.
Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N (números
naturais), mas nunca valores como 2,5 ou 3,78 ou 4,325 etc. Logo, é uma variável discreta. Já o peso desses alunos é
uma variável contínua, pois um dos alunos tanto pode pesar 72 kg, como 72,5 kg, como 72,54 kg etc., dependendo esse
valor da precisão da medida.
De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis
discretas.
1.5. População e Amostra
Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população estatística
ou universo estatístico.
Exemplo:
Conjunto formado pelos eleitores de uma cidade.
3
2. Diga quais das variáveis quantitativas abaixo são discretas e quais são contínuas:
a) População: estação meteorológica de uma cidade.
Variável: precipitação pluviométrica, durante um ano - ___________________
b) População: Bolsa de Valores de São Paulo.
Variável: número de ações negociadas - __________________________
c) População: pregos produzidos por uma máquina.
Variável: comprimento - __________________________
d) População: propriedades agrícolas do Brasil.
Variável: produção de algodão - __________________________
e) População: segmentos de reta.
Variável: comprimento - __________________________
f) População: bibliotecas da cidade de São Paulo.
Variável: número de volumes - __________________________
g) População: aparelhos produzidos em uma linha de montagem.
Variável: número de defeitos por unidade - __________________________
1.8. Amostragem
Quando o tamanho da amostra é grande em relação ao tamanho da população, ou quando se exige o resultado
exato, ou quando já se dispõe dos dados da população, é recomendado realizar um censo, que considera todos os
elementos da população, ou seja, dispensa-se o uso da amostragem.
Para realizar um estudo por amostragem, a amostra deve ser representativa da população estudada. Para isso,
existem técnicas adequadas para cada tipo de situação.
Veremos a seguir as principais técnicas de amostragem, divididas em probabilísticas e não probabilísticas:
1.8.1. Técnicas Probabilísticas (aleatórias)
As técnicas probabilísticas garantem a possibilidade de realizar afirmações sobre a população com base nas
amostras. Normalmente, todos os elementos da população possuem a mesma probabilidade de serem selecionados.
Assim, considerando N como o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. Estas
técnicas garantem o acaso na escolha.
4
São técnicas probabilísticas:
1.8.1.1. Amostragem: Aleatória Simples -AAS (ou Casual)
É o processo mais elementar e frequentemente utilizado. Pode ser realizado numerando-se os elementos da
população de 1 a n e sorteando-se, por meio de um dispositivo aleatório qualquer, X números dessa sequencia, que
corresponderão aos elementos pertencente à amostra.
Exemplo: Obter uma amostra representativa, de 10%, de uma população de 200 alunos de uma escola.
Exemplo: Em uma população de 200 alunos, há 120 meninos e 80 meninas. Extraia uma amostra representativa,
de 10%, dessa população.
Nesse exemplo, há uma variável que permite identificar 2 subconjuntos, a variável sexo. Considerando essa
divisão, vamos extrair a amostra da população.
SEXO POPULAÇÃO AMOSTRA (10%)
Masculino 120
Feminino 80
Total
Portanto, a amostra deve conter 12 alunos do sexo masculino e 8 do sexo feminino, totalizando 20 alunos, que
correspondem a 10% da população.
Para selecionar os elementos da população para formar a amostra, podemos executar os seguintes passos:
1º) numerar os alunos de 1 a 200, sendo os meninos numerados de 1 a 120 e as meninas, de 121 a 200;
2º) escrever os números de 1 a 120 em pedaços de papel e colocá-los em uma urna A;
3º) escrever os números de 121 a 200 em pedaços de papel e colocá-los em uma urna B;
4º) retirar 12 pedaços de papel, um a um, da urna A, e 8 da urna B, formando a amostra da população.
5
Exercício: Obter uma amostra proporcional estratificada, utilizando a TNA à partir da 8ª linha da esquerda para a
direita e de cima para baixo.
São exemplos desta técnica de amostragem as pesquisas eleitorais por região, cidades pequenas e grandes, área
urbana e área rural, sexo, faixa etária, faixa de renda, etc.
Exemplo: Obter uma amostra de 80 casas em uma rua que contém 2000 casas. Nesta técnica de amostragem,
podemos realizar o seguinte procedimento:
1º) Como 2000 dividido por 80 é igual a 25, escolhemos, por um método aleatório qualquer, um número de 1 e
25, que indica o primeiro elemento selecionado para a amostra.
2º) Consideramos os demais elementos, periodicamente, de 25 em 25, até o fim da rua.
Se o número sorteado entre 1 e 25 for o número 8, a amostra será formada pelas casas: 8ª, 33ª, 58ª, 83ª, 108ª, etc.
6
EXERCÍCIOS
1. Considere um grupo de trabalho, formado por vinte acadêmicos da disciplina de Estatística, da Alfa, formado
pelos alunos (1) Adilson, (2) Adriana, (3) Alexandre, (4) Alisson, (5) Edenilson, (6) Éder, (7) Edson, (8)
Flávio, (9) Francieli, (10) Gisele, (11) José, (12) Juliano, (13) Maria, (14) Marisa, (15) Patrícia, (16) Pedro,
(17) Raquel, (18) Renata, (19) Silvano e (20) Wagner. Obtenha uma amostra de 25% da população, utilizando:
a) amostragem aleatória simples (utilizar a TNA, iniciar na 2ª linha da esquerda para a direita).
b) amostragem estratificada (sexo).
3º
4º
28
5º
6
6º
7º
8º
TOTAL 250 - 40
3. Dada uma população de 4 pessoas, Antônio (A), Carlos (C), Luís (L) e Pedro (P), quantas amostras aleatórias
simples de tamanho 2 podem ser obtidas? Quais são essas amostras?
CÁLCULO
ESTRATOS TAMANHO PERCENTUAL AMOSTRA
PROPORCIONAL
7
5. Uma cidade X apresenta o seguinte quadro relativo às suas escolas de ensino fundamental.
Nº DE ESTUDANTES
ESCOLAS CÁLCULO CÁLCULO
MASC. AMOSTRA FEM. AMOSTRA
PROPORCIONAL PROPORCIONAL
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
TOTAL 876 --------------- 955 -------------------
Obtenha uma amostra proporcional estratificada total de 121 estudantes do total geral 1831.
CÁLCULO
DEP. Nº DE EMP. AMOSTRA
PROPORCIONAL
Administração 914
Transporte 348
Produção 1401
Outros 751
Total 3414
Deseja-se extrair uma amostra entre os empregados para verificar o grau de satisfação em relação à qualidade
da comida servida no refeitório. Diga como a amostragem seria realizada considerando uma amostra de 20 % da
população.
7. Para cada uma das seguintes situações diga qual o tipo de amostragem utilizada.
a) Em uma IES, o Conselho Universitário deseja conhecer a opinião dos alunos e professores sobre uma
resolução a ser votada, que estabelece horários fixos para o atendimento de alunos pelos professores. Para
compor a amostra foram sorteados aleatoriamente 10% dos alunos matriculados e 10% dos professores.
Amostragem _______________________.
b) Um treinador de uma confederação esportiva deseja dividir 20 times em dois grupos. Para o primeiro grupo
ele seleciona aleatoriamente 10 times, e considera os 10 restantes para o segundo grupo.
Amostragem __________________________.
c) Uma lista numerada contém 1000 nomes, numerados consecutivamente a partir de 1. Iniciando-se do 15º
nome, uma amostra foi composta considerando sorteados os nomes referentes aos números 25, 35, 45, 55 e
assim sucessivamente até que fossem escolhidos 100 nomes.
Amostragem __________________________.
8
8. Complete:
a) Na amostragem _______________ cada elemento da população tem a mesma chance de ser incluído na
amostra.
b) Na amostragem ___________________a seleção dos itens da população que farão parte da amostra são
escolhidos seguindo uma sequencia fixa, isto é, são escolhidos os itens r, r + k, r + 2k, r + 3k, e assim por
diante.
c) A amostragem __________________pressupõe a divisão da população em subgrupos de itens similares,
procedendo-se então a amostragem em cada subgrupo.
9. Um grupo industrial deseja determinar a reação do público à rotulagem dos produtos. Numa parte da cidade,
há 40 quarteirões, com 10 casas por quarteirão. Suponha que se queira selecionar aleatoriamente 10 casas.
Como proceder?
10. Os empregados de uma firma têm etiquetas de identificação numeradas consecutivamente de 101 a 873. Deve-
se escolher um comitê de segurança de 10 pessoas, selecionadas aleatoriamente. Como fazer a seleção do
comitê, utilizando:
a) amostragem aleatória simples (utilizar à partir da 10ª coluna da TNA de cima para baixo);
b) amostragem sistemática.
Classes fi Classes fi
0 2 4 1 4
2 4 5 2 5
2. DISTRIBUIÇÃO DE FREQUÊNCIAS
Ao estudar grandes conjuntos de dados, é conveniente resumi-los numa tabela, através do agrupamento dos
dados em classes, com suas respectivas frequências.
Denominamos frequência o número que fica relacionado a um determinado valor da variável.
Quando os dados são discretos com valores repetidos, a simples identificação dos mesmos com as respectivas
frequências, pode ser um procedimento adequado, ao que damos o nome de distribuição de frequências sem intervalos
de classes.
Quando os dados são contínuos, pode acontecer que poucos, ou até nenhum deles, apresente frequência.
Nestes casos, o procedimento começa pela definição de classes.
Classes de frequência, ou simplesmente, classes são intervalos de variação da variável.
Uma distribuição de frequências é uma tabela na qual os possíveis valores de uma variável se encontram
agrupados em classes, registrando-se o número de valores observados em cada classe. Os dados organizados em
uma distribuição de frequência são chamados de dados agrupados.
Amplitude de um intervalo de classe, ou simplesmente, intervalo de classe (hi) é a medida do intervalo que define a
classe: hi = Li – li, amplitude da i-ésima classe. Ex: 4-2 = 2
9
Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior
máximo) e o limite inferior da primeira classe (limite inferior mínimo): AT = Lmáx – lmín. Ex: 4-0 = 4
Amplitude amostral (A.A.) é a diferença entre o valor máximo e o valor mínimo da amostra: A.A. = xmáx – xmín.
Ponto médio de uma classe (xi) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas
li Li
partes iguais. O ponto médio da i-ésima classe é obtido da seguinte maneira: xi . Ex: (4+2)/2 = 3
2
Regras básicas
1. Efetua-se um rol (ordenação crescente ou decrescente de grandeza) nos dados brutos (aqueles ainda não
organizados numericamente – tabela primitiva).
2. Determina-se a amplitude amostral (A.A.) da distribuição.
3. Escolhe-se convenientemente o número de classes k (nº. inteiro), 5 ≤ k ≤ 15 onde podemos tomar k n ou
a regra de Sturges k 1 3,3 log n , n ≥ 25 (total de observações). Se possível determina-se, ou seja,
AA
constrói-se classes de mesma amplitude, tomando h .
k
4. Efetua-se o agrupamento em classes e, a seguir, toma-se às frequências das classes, elaborando-se, portanto, a
tabela de distribuição de frequências.
b) Frequências relativas (fri) são valores das razões entre as frequências simples e a frequência total:
fi
fri .
n
Obs.: fr i 1 ou 100%.
c) Frequência acumulada (Fi) (do tipo “abaixo de”) é o total das frequências de todos os valores inferiores
ao limite superior do intervalo de classe:
k
Fk f1 f 2 ... f k ou Fk f i .
i 1
d) Frequência acumulada relativa (Fri) de uma classe é a frequência acumulada da classe, dividida pela
frequência total da distribuição:
Fi
Fri .
f i
Obs.: não é necessário que seja a mesma escala para os dois eixos.
2.4.1. Histograma
O histograma é um gráfico formado por retângulos justapostos, tendo como base o intervalo de classe, sendo a
área de cada retângulo proporcional à frequência da classe correspondente. Esse gráfico foi idealizado pelo geneticista
e estatístico Karl Pearson (1857 - 1936).
Exemplo: A distribuição das notas dos trinta alunos de Estatística de uma escola está representada abaixo:
Classes
fi
(notas)
0 2 4
2 4 5
4 6 12
6 8 8
8 10 1
Representando as classes da distribuição no eixo das abscissas e as frequências no eixo das ordenadas, temos o
seguinte histograma:
Obs.: No caso de termos uma variável essencialmente positiva, cuja distribuição se inicie no valor zero, devemos
considerar um intervalo anterior localizado no semi-eixo negativo. Porém, consideraremos apenas a parte positiva do
segmento que liga o ponto médio desse intervalo com a frequência do intervalo 0 ... .
11
Retornando ao histograma do exemplo anterior, temos:
30 35 35 39 41 41 42 45 47 48
51 52 53 54 55 55 57 59 60 60
62 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
30 40 50 60 70 80 90 100 Classes
12
Polígono de Frequência
fi
12
35 45 55 65 75 xi
85 95
Fi
50
47
40
31
18
10
30 40 50 60 70 80 90 100 Classes
Exemplos
1. Os valores abaixo representam as estaturas, em cm, de 75 alunos regularmente matriculados em um
determinado curso universitário. (Utilize duas casas decimais para as frequências relativas).
172 180 174 182 176 167 160 162 162 164 167 174 169 155 155
180 176 171 179 167 173 180 172 163 168 165 183 189 178 164
170 168 169 180 174 175 191 172 176 172 174 173 165 165 163
150 166 178 178 168 181 184 166 177 167 166 173 160 180 186
156 163 169 155 172 164 154 165 181 156 180 168 185 169 179
Pede-se:
a) O rol;
13
b) A amplitude amostral; AA=______________
c) O número de classes; i=______
d) A amplitude das classes; h=_________
e) A amplitude total; AT=_____________
f) Preencher a distribuição de frequências; k n
i Estaturas(cm) xi fi fri (%) Fi Fri (%)
1 (cm)
2
3
4
5
6
7
8
9
--- -------- ----- = = ----- ------
Obs.: xi é o ponto médio da classe
g) A frequência da quinta classe; f5=________
h) Qual o limite superior da segunda classe? L2=______
i) Qual o limite inferior da terceira classe? l3=_____
j) Qual o ponto médio da quarta classe? x4=_____
k) Qual a porcentagem dos alunos que possui estatura inferior a 175 cm?______
l) Qual a porcentagem dos alunos cuja estatura não atinge 185 cm?_________
m) Qual a porcentagem dos alunos cuja estatura seja maior ou igual 170 cm?_________
n) O histograma;
o) O polígono de frequência;
p) O polígono de frequência acumulada.
2. Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:
Fazer o rol dos 50 lançamentos, preencher a tabela com os vários tipos de frequências (sem intervalos de
classe) e responder as seguintes perguntas:
48 - 34 - 78 - 36 - 65 - 48 - 54 - 42 - 24 - 96
30 - 60 - 90 - 66 - 72 - 60 - 20 - 24 - 85 - 52
84 - 54 - 36 - 42 - 84 - 10 - 18 - 12 - 22 - 25
34 - 60 - 55 - 21 - 47 - 65 - 77 - 34 - 51 - 80
16
6. Em uma fábrica foram testadas 400 luminárias. A duração delas aparece na seguinte distribuição de frequência
(Utilize três casas decimais para as frequências relativas e não multiplicá-las por 100):
7. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus
(Utilize duas casas decimais para as frequências relativas):
17
8. Complete a distribuição de frequências referente as notas de 50 alunos na disciplina de Estatística:
4 21 13 16 14
22 12 18 13 11
10 14 20 6 15
17 8 10 17 8
10 22 18 15 23
23 9 6 13 17
6 10 21 12 14
12 5 15 18 4
Conforme os dados apresentados resolvam os itens abaixo:
a) Faça o rol dos dados acima;
b) Preencha a distribuição de frequência, utilizando as classes (Utilize uma casa decimal para as frequências
relativas): 4 9, 9 14, 14 19 e 19 24
Definição: A média aritmética, ou simplesmente, média de um conjunto de dados é a soma das entradas de
xi
dados dividida pelo número de entradas. Para encontrar a média use a fórmula a seguir: x , sendo:
n
x a média aritmética;
xi os valores da variável;
n o número de valores.
Exemplo: A tabela seguinte mostra o número de gols feitos em cada uma das quatro rodadas de um campeonato de
futebol.
Definição: Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de
valores e a média aritmética.
Notação: d i xi x .
19
3.1.2. Moda (Mo)
Definição: Denominamos moda o valor que ocorre com maior frequência em uma série de valores.
Para encontrarmos a moda, de acordo com a definição, basta procurar o valor que mais se repete, entretanto,
podemos encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que
outros (amodal). Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então,
que a série tem dois ou mais valores modais (bimodal ou plurimodal).
EXERCÍCIOS
1. Considerando os conjuntos de dados: Calcule: a média, a mediana e a moda.
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b) 20, 9, 7, 2, 12, 7, 20, 15, 7
c) 51,6; 48,7; 50,3; 49,5; 48,9
d) 15, 18, 20, 13, 10, 16, 14
3. Dê um exemplo, de um conjunto com 7 (sete) dados, no qual a amplitude total seja 10 e a mediana seja 6.
5. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine:
a) A nota média;
b) A nota mediana;
c) A nota modal.
20
6. A média das idades de três pessoas reunidas em uma sala é 25 anos. Se uma criança de 5 anos entrar na sala, a
nova média das idades será:
a) 15 anos c) 20 anos e) 24 anos
b) 18 anos d) 22 anos
7. A nota média dos meninos de uma classe foi 6,0 e das meninas, 7,0. Se a classe é composta de dezoito
meninos e doze meninas, então a nota média da classe foi:
f) 6,5 g) 7,2 h) 4,8 i) 6,4 j) 7,0
9. A média das idades dos 11 funcionários de uma empresa era de 40 anos. Um dos funcionários se aposentou
com 60 anos, saindo da empresa. A média de idade dos 10 funcionários restantes passou a ser:
a) 40 anos c) 38,9 anos e) 37,8 anos
b) 39,8 anos d) 38 anos
10. Em um edifício residencial com 54 apartamentos, 36 condôminos pagam taxa de condomínio de R$ 380,00;
para os demais, essa taxa é de R$ 440,00. Qual é o valor da taxa média de condomínio nesse edifício?
Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas
xi f i
funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética, dada pela fórmula: x
fi
Logo, a média dos dados da tabela anterior é:________________
xi f i
x
fi
onde xi é o ponto médio da classe.
21
Considerando a distribuição:
i Estaturas (cm) fi xi xi f i
1 150 |---- 154 4
2 154 |---- 158 9
3 158 |---- 162 11
4 162 |---- 166 8
5 166 |---- 170 5
6 170 |---- 174 3
f i ______ xi f i ______
TABELA 2.
Calcule a média:____________
22
Exemplo
xi fi Fi fi
Temos: =
12 1 2
14 2 Logo: Md = _________
15 1
16 2
17 1
20 1
fi 8
i Estaturas (cm) fi Fi
1 150 |---- 154 4
2 154 |---- 158 9
3 158 |---- 162 11
4 162 |---- 166 8
5 166 |---- 170 5
6 170 |---- 174 3
f i ______
fi
Como: =
2
Logo, a classe mediana é a de ordem ____. Então: l * = _____, Fant. = ______, f * = _____ e h * = ______.
Substituindo esses valores na fórmula, obtemos:
Md =
fi
Nota: No caso de existir uma frequência acumulada exatamente igual a , a mediana será o limite
2
superior da classe correspondente.
23
Exemplos
i Classes fi Fi fi
Temos: =
1 0 |---- 10 1 2
2 10 |---- 20 3
3 20 |---- 30 9 13 Logo: Md =
4 30 |---- 40 7
5 40 |---- 50 4
6 50 |---- 60 2
f i ______
3.3. As Separatrizes
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No entanto, ela
apresenta uma outra característica, tão importante quanto a primeira: ela separa a série em dois grupos que
apresentam o mesmo número de valores.
Assim, além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são
medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica, já que se
baseiam em sua posição na série. Essas medidas – os quartis, os percentis e os decis – são, juntamente com a
mediana, conhecidas pelo nome genérico de separatrizes.
3.3.1. Os Quartis
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Há, portanto, três quartis:
a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é
menor que ele e as três quartas partes restantes (75%) são maiores.
b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md).
c) O terceiro quartil (Q3) – valor situado de tal modo que as três quartas partes (75%) dos termos são
menores que ele e a uma quarta parte restante (25%) é maior.
Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana,
f i kf i
bastando substituir, na fórmula da mediana, por: , sendo k o número de ordem do quartil.
2 4
fi * 3 fi
F ant. h Fant. h *
Assim, temos: Q1 l * e Q3 l *
4 4
* *
.
f f
3.3.2. Os Percentis
Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais.
Indicamos:
P1 , P2 , ..., P32 , ..., P99 .
É evidente que:
P50 Md , P25 Q1 e P75 Q3 .
f i
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula será
2
kf i
substituída por , sendo k o número de ordem do percentil.
100
24
EXERCÍCIOS
1. Determine a média aritmética de:
a)
i Valores ( xi ) Quantidades ( f i ) xi f i
1 50 8
2 60 5
3 80 4
4 90 3
f i ______ xi f i ______
b) c)
i xi fi xi f i xi fi xi f i
1 50 20 4 20
2 58 50 5 40
3 66 30 6 30
f i ______ xi f i ______ 7 10
f i 100 xi f i ______
i xi fi xi f i Fi Calcule:
1 3 4 a) a média;
2 4 8 b) a mediana;
3 5 11 c) a moda.
4 6 10
5 7 8
6 8 3
f i ______ xi f i ______
25
4. Calcule a média aritmética, mediana e moda de cada uma das distribuições abaixo:
a)
i Notas fi xi xi f i Fi
1 0 |---- 2 5
2 2 |---- 4 8
3 4 |---- 6 14
4 6 |---- 8 10
5 8 |---- 10 7
f i ______ xi f i ______
b)
i Estaturas (cm) fi xi xi f i Fi
1 150 |---- 158 5
2 158 |---- 166 12
3 166 |---- 174 18
4 174 |---- 182 27
5 182 |---- 190 8
f i ______ xi f i ______
c)
i Salários (R$) fi xi xi f i Fi
1 500 |---- 700 18
2 700 |---- 900 31
3 900 |---- 1100 15
4 1100 |---- 1300 3
5 1300 |---- 1500 1
6 1500 |---- 1700 1
7 1700 |---- 1900 1
f i ______ xi f i ______
6. Calcule o 10º, o 1º, o 23º, o 15º e o 90º percentis das distribuições do exercício 4.
7. Determine se as seguintes afirmações são verdadeiras ou falsas. Se for falsa, reescreva-a em sua forma
verdadeira.
a) ( ) O ponto médio de uma classe é a soma de seus limites inferior e superior.
b) ( ) A frequência relativa de uma classe é a frequência da classe dividida pelo tamanho da amostra.
c) ( ) O somatório das frequências relativas, obrigatoriamente, tem que ser igual a 1.
d) ( ) A mediana é a medida de tendência central mais provável de ser afetada por um dado estranho (aquele
que está muito afastado dos outros dados do conjunto).
e) ( ) Nem todo conjunto de dados possui uma moda.
f) ( ) Alguns conjuntos de dados quantitativos não têm uma mediana.
g) ( ) O segundo quartil é a mediana de um conjunto ordenado de dados.
26
RESPOSTAS:
1. a) x 64,50 e b) x 58,80
2. a) x 5,43 , b) Md 5 e c) Mo 5
3. a) x 5,92 , b) Md 6 e c) Mo 6
4. a) x 5,27 , Md 5,29 e Mo 5
b) x 172,40 cm , Md 174 cm e Mo 178 cm
c) x R$ 842,86 , Md R$ 809,68 e Mo R$ 800,00
5. a) Q1 3,50 e Q3 7,20
b) Q1 166,22 cm e Q3 179,19 cm
c) Q1 R$ 694,44 e Q3 R$ 946,67
6. a) P10 1,76; P1 0,18; P23 3,28; P15 2,40 e P90 8,74
b) P10 159,33 cm; P1 151,12 cm; P23 165,40 cm; P15 161,67 cm e P90 183 cm
c) P10 R$ 577,78; P1 R$ 507,78; P23 R$ 678,89; P15 R$ 616,67 e P90 R$1.086,67
4. MEDIDAS DE DISPERSÃO
4.1. Dispersão ou Variabilidade
As medidas de dispersão são utilizadas para avaliar o grau de variabilidade dos dados. Não se justifica calcular
uma média de um conjunto de dados onde não haja variação, todavia se a variabilidade desses dados for muito grande,
a representatividade da média será muito pequena. Assim, é importante caracterizar a dispersão dos dados, uma vez
que diferentes amostras com médias semelhantes, podem apresentar diferentes variabilidades.
Por exemplo, mesmo sabendo que a temperatura média de duas cidades é a mesma, e igual a 24ºC, ainda assim
somos levados a pensar a respeito do clima dessas cidades. Em uma delas poderá a temperatura variar entre limites de
muito calor e de muito frio e haver, ainda, uma temperatura média de 24ºC. A outra poderá ter uma variação pequena
de temperatura e possuir, portanto, no que se refere à temperatura, um clima mais favorável.
Vemos, então, que a média – ainda que considerada como um número que tem a faculdade de representar uma
série de valores – não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os
valores que compõem o conjunto.
Por exemplo, consideremos os seguintes conjuntos de valores das variáveis x, y e z:
X: 70, 70, 70, 70, 70. AT = 70 - 70 = 0
27
No caso dos dados serem agrupados com intervalos de classe, a amplitude total é a diferença entre o limite
superior da última classe e o limite inferior da primeira classe:
AT Lmáx. lmín.
A amplitude é, na verdade, uma medida fraca de dispersão, porque ela considera somente os valores extremos
e não diz nada sobre a distribuição dos valores intermediários.
4.3. Variância e Desvio Padrão
Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são, na sua
maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade
dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os
mais geralmente empregados.
A variância é baseada nas diferenças entre cada valor do conjunto de dados e a média do grupo (desvios). A
variância é dada pela soma dos quadrados dos desvios xi x de cada observação em relação à média, dividida pelo
número de elementos da amostra, ou seja, ela é a média aritmética dos quadrados dos n desvios.
Para uma população, a variância é representada pela letra grega minúscula 2 (ler “sigma dois” ou “sigma ao
quadrado”) e a variância de uma amostra é representada por s2.
n
(x i x )2
Para uma amostra de n valores x1 , x2 , ..., xn de uma variável X, a variância é dada por: s 2 i 1
.
n
d1 d3 d4
d2 d6 d7
d5
(x i x )2
d d2 d3 d4 d5 d6 d7
2 2 2 2 2 2 2
s
2 i 1
1
7 7
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em
relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio
padrão, definida como a raiz quadrada da variância e representada por s: s s2 .
x x
2
Assim: s
i
. (I)
n
28
Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua compreensão, ela não é
uma boa fórmula para fins de computação, pois, em geral, a média aritmética x é um número fracionário, o que
torna pouco prático o cálculo das quantidades xi x .
2
Podemos simplificar os cálculos fazendo uso de uma equivalente de (I), escrevendo-a da seguinte maneira:
x xi
2
2
s . (II)
i
n n
Não apenas este método é usualmente mais prático, como também mais preciso. Quando a média não é exata e
tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo
acontece com os quadrados, podendo o resultado do cálculo ser menos exato do que quando a fórmula (II) é usada.
O desvio padrão é uma das medidas mais comumente usadas para distribuições, e desempenha papel relevante
em toda a Estatística. Cabe notar que a unidade do desvio padrão é a mesma da média. Por exemplo, se a média é em
R$ (real), o desvio padrão também se exprime em real. A variância, por outro lado, se exprime em quadrados de
unidades (Ex.: real2, metros2), como já vimos anteriormente.
Intuitivamente, o desvio padrão representa uma média dos desvios (absolutos) que todos os valores amostrais
possuem ao redor da média. Valores da série próximos uns dos outros originam um desvio padrão menor, enquanto
valores muito afastados uns dos outros dão um desvio padrão maior. Em outras palavras, a série de dados que
apresentar desvio padrão maior, terá uma distribuição de frequências mais aberta que a série com desvio padrão
menor.
Obs.: Quando os dados estão agrupados, o desvio padrão é obtido pela seguinte fórmula:
fx f i xi
2
2
s ,
i i
f f
onde x i é o valor da variável (sem intervalos de classes) e o ponto médio (com intervalos de classe).
Obviamente, trata-se de restaurantes com poder de vendas diferentes. Apesar de possuírem o mesmo desvio
padrão, é evidente que diferenças nas vendas da ordem de 10 kg, por exemplo, possuem um peso relativo muito maior
para o restaurante Dallas comparado ao Fogão à Lenha. Assim, é razoável afirmar que as variabilidades das vendas
diárias em kg para o restaurante Dallas é bem superior, tornando-se necessária a elaboração de uma medida apropriada
nessas situações onde se deseja comparar conjuntos de dados com médias bem discrepantes.
Necessitamos de uma medida que reúne essas características, que não seja útil apenas na comparação entre
conjuntos de dados de mesma unidade, mas que permita ainda a comparação da variabilidade entre conjuntos de dados
referentes a diferentes características. O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de
duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média
29
for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos
dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão
ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados
em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV):
s
CV 100 .
x
O Coeficiente de Variação indica o percentual de variação média dos dados em torno da sua média.
Voltando ao exemplo considerado no início, temos:
Restaurante Dallas: CV = 17,20% - A variação média das vendas foi de 17,20% em torno da sua média.
Restaurante Fogão à Lenha: CV = 2,35% - A variação média das vendas foi de 2,35% em torno da sua média.
Desta forma pode-se afirmar que as vendas diárias do restaurante Dallas em kg apresentam uma variabilidade
bem superior comparada ao restaurante Fogão à Lenha.
Exemplos:
1. Seja o conjunto de dados (não-agrupados):
xi xi2
40, 45, 48, 52, 54, 62 e 70.
Calcule a amplitude total e o desvio padrão. 40
R: AT = 30 e s = 9,49. 45
48
52
54
62
70
2. Suponha que você esteja gerenciando uma pizzaria e que mantém um controle das vendas dos diversos tipos
de pizza. Suponha ainda que tenha observado os seguintes valores de vendas diárias de pizzas do tipo
calabresa durante um período de 9 dias: 40, 56, 38, 38, 63, 59, 52, 49, 46. Calcule, nesses 9 dias:
a) A média b) A mediana c) A moda d) O desvio padrão (Via calculadora)
R: 49, 49, 38pizzas e 8,73
xi fi f i xi f i xi2
0 2
1 6
2 12
3 7
4 3
Calcule a amplitude total e o desvio padrão.
R: AT = 4 e s = 1,04.
30
4. Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:
x s
Estaturas (cm) 175 5,0
Pesos (kg) 68 2,0
Temos:
CVE =
CVP =
Logo, nesse grupo de indivíduos, os pesos apresentam _________ (maior, menor) grau de dispersão
que as estaturas.
5. Considere a seguinte distribuição de frequências com dados agrupados com intervalos de classe:
EXERCÍCIOS
xi fi f i xi f i xi2
31
2. Uma amostra de 17 operários de uma companhia apresentou os seguintes salários (R$) recebidos
durante certa semana: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190,
200, 240. Calcule a amplitude total e o desvio padrão. R: AT = R$ 100,00 e s = R$ 27,60.
xi fi f i xi f i xi2
3. Um especialista em padrões de trabalho observa, em um escritório, a quantidade de tempo requerida
para a digitação de uma amostra de 10 cartas, com os seguintes resultados enumerados em ordem
crescente: 5, 5, 5, 7, 9, 14, 15, 15, 16, 18. Calcule a amplitude total e o desvio padrão.
R: AT = 13 min e s = 4,93 min.
xi fi f i xi f i xi2
xi fi f i xi f i xi2
2 1
3 3
4 5
5 8
6 5
7 4
8 2
Calcule a amplitude total e o desvio padrão. R: AT = 6 e s = 1,51.
32
5. Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente, considere a variável
“número de caras obtidas”:
xi fi f i xi f i xi2
0 4
1 14
2 34
3 29
4 16
5 3
Calcule a amplitude total e o desvio padrão. R: AT = 5 e s = 1,13.
6. A tabela abaixo se refere às taxas mensais de aluguéis de apartamentos na cidade de Porto Alegre.
Calcule a amplitude total e o desvio padrão. R: AT = R$ 300,00 e s = R$ 61,99.
33
8. Na distribuição de frequências a seguir estão reproduzidos os números médios de acidentes por
1.000 horas/homem em 50 indústrias mecânicas. Determinar a amplitude total e o desvio padrão.
Nº médio de
Nº de acidentes ( f i ) xi f i xi f i xi2
acidentes
1,5 |---- 1,8 3
1,8 |---- 2,1 12
2,1 |---- 2,4 14
2,4 |---- 2,7 9
2,7 |---- 3,0 7
3,0 |---- 3,3 5
R: AT = 1,8 acidentes e s = 0,42 acidente.
9. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão,
respectivamente, 18,3 e 1,47, calcule o coeficiente de variação. R: CV = 8,03%.
10. Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio
padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que
disciplina foi maior a dispersão? R: Estatística (10,41%).
11. Medidas as estaturas de 1.017 indivíduos, obtivemos média igual a 162,2 cm e desvio padrão de 8,01
cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses
indivíduos apresentam maior variabilidade em estatura ou em peso? R: Estatura (4,94 %).
12. Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 6,05 cm.
Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01
cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo?
R: O de 125 moças.
13. Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação
de 3,3%. Qual o desvio padrão desse grupo? R: s = 5,41 cm.
14. Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da
distribuição. R: x 51,72.
34
5. CORRELAÇÃO E REGRESSÃO
5.1. Introdução
Muitas vezes, na prática, necessitamos estudar o relacionamento de duas variáveis, coletadas como
pares de valores, para resolver questões, como por exemplo:
O sucesso de um emprego pode ser predito com base no resultado de testes;
Quanto maior for a produção, maior será o custo total;
Quanto maior for a idade de um automóvel, menor será seu preço de venda.
Problemas como esses podem ser estudados através de uma análise de correlação simples, onde
podemos determinar a “força” do relacionamento entre estas duas variáveis estudadas.
As variáveis estudadas serão: x, denominada de variável independente, e y, denominada de
variável dependente.
Se o relacionamento entre x e y for consistente e necessitamos fazer uma predição para o valor de y, conhecido
um valor de x, através de uma fórmula matemática adequada, podemos aplicar a chamada análise de regressão
simples.
5.2 Diagrama de Dispersão
É um gráfico no qual cada ponto plotado representa um par observado de valores para as variáveis
estudadas (x, y), num sistema de eixos cartesianos.
Através do diagrama de dispersão podemos ter uma idéia do tipo de relação entre as variáveis
estudadas.
A seguir temos alguns exemplos de diagramas de dispersão.
35
5.3 Coeficiente de Correlação Linear
Medida do grau de associação (relacionamento) entre duas variáveis estudadas a partir de uma série
de observações.
Esta medida é também chamada de coeficiente de correlação de Pearson, em homenagem ao seu
criador e é dada por:
n xi yi xi yi
r
n x 2
i xi
2
n y 2
i yi
2
Onde n é o número de pares de valores (x, y) observados e r varia no intervalo 1 r 1 , para o
mesmo, temos que:
• Valores de r próximos de (+1) indicam uma forte correlação positiva entre x e y;
• Valores de r próximos de (– 1) indicam uma forte correlação negativa entre x e y;
• Valores de r próximos de 0 indicam uma fraca correlação positiva ou negativa entre x e y.
A partir dos valores de r, podemos verificar o tipo da correlação existente entre as variáveis
estudadas, conforme a seguinte tabela:
Valor de r Correlação
0,0 nula
0,0 ----| 0,5 fraca
0,5 ----| 0,8 média
0,8 ---- 1,0 forte
1,0 perfeita
Obs.: Usar a equação de regressão somente quando r indicar correlação linear significativa.
x i y
Onde: x e y i .
n n
36
Exemplo. Consideremos as duas variáveis, Pesos e Comprimentos de Ursos (População), cujos dados
coletados estão abaixo.
x Comprimento (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0
y Peso (lb) 80 344 416 348 262 360 332 34
Obs.: in. – polegada e lb – libras.
37
EXERCÍCIOS
1. Sejam os seguintes diagramas de dispersão. Determine se há uma correlação linear positiva, uma
correlação linear negativa ou se não há correlação entre as variáveis.
2. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real e a
média dos pesos aparentes, dados pelo grupo, obteve-se a tabela:
3. Uma amostra de residências selecionadas aleatoriamente, num bairro, foi observada quanto à idade
do imóvel (x), em anos, e ao preço de venda (y), em mil reais, resultando:
xi yi xi y i xi2 y i2
1 100
2 80
3 90
4 15
5 50
6 20
_______ _______ _______ _______ _______
38
4. Considere os resultados de dois testes, x e y, obtidos por um grupo de alunos da escola A:
xi yi xi y i xi2 y i2
11 13
14 14
19 18
19 15
22 22
28 17
30 24
31 22
34 24
37 25
_______ _______ _______ _______
_______
6. A variação do valor da UPC (Unidade Padrão de Capital), relativamente a alguns meses de 2009,
deu origem à tabela:
39
Sugestão: Substitua os meses, respectivamente, por 5, 6, ..., 11.
7. A partir da tabela:
xi yi xi y i xi2 y i2
1 70
2 50
3 40
4 30
5 20
6 10
___________ _____________ ________ _______ _______
a) Calcule o grau de correlação;
b) Determine a reta ajustada;
c) Estime o valor de y para x = 0.
8. Usando uma amostra de 18 elementos casuais um agente estimou o coeficiente de correlação entre x
e y em 0,32. O que isso te comunica sobre essas duas variáveis nessa população?
10. Quando você investiga a relação entre duas variáveis aleatórias contínuas, por que é importante fazer
um gráfico de dispersão dos dados?
Respostas:
1. Correlação linear negativa, correlação linear positiva, não há correlação;
2. Índice de correlação r = 0,98
3. a) y = – 16,14 x + 115,67 b) r = – 0,83
4. r = 0,89
5. a) r = 0,54 b) y = 1,81 x + 0,01
6. a) r = 0,94 b) y = 0,01 x + 21,69 c) R$ 21,81
7. a) r = – 0,99 b) y = – 11,43 x + 76,67 c) y = 76,67
40
11. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação,
uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma
delas a idade (x) e a massa muscular (y).
b) Calcule o coeficiente de correlação linear entre x e y. O que se pode concluir sobre a correlação de
posse do valor de r?
Resp.: -0,86
c) Ajuste uma reta de regressão para a relação entre as variáveis y: massa muscular (dependente) e x:
idade (independente).
Resp.: Y=-1,04x+149,7
d) Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50
anos. Resp.: y=97,7
41
12. Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades
monetárias) para uma amostra de 25 famílias.
Gasto com
Renda Familiar (xi) xi y i xi2 y i2
Alimentação (yi)
3 1,5
5 2,0
10 6,0
10 7,0
20 10,0
20 12,0
20 15,0
30 8,0
40 10,0
50 20,0
60 20,0
70 25,0
70 30,0
80 25,0
100 40,0
100 35,0
100 40,0
120 30,0
120 40,0
140 40,0
150 50,0
180 40,0
180 50,0
200 60,0
200 50,0
_________ _________ _________ _________ _________
42
ANEXO
L/C 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 5 7 7 2 0 0 3 9 8 4 8 4 4 1 7 9 6 7 7 1 4 0 2 1 1
2 2 8 8 0 5 3 5 1 5 9 0 9 9 3 9 8 8 7 5 8 7 0 2 7 7
3 9 2 5 9 1 8 5 2 8 7 3 0 4 8 8 6 9 7 4 8 3 5 2 5 1
4 9 0 3 8 1 2 9 1 7 4 3 0 1 9 7 5 8 9 0 7 5 0 6 4 1
5 8 0 9 1 1 6 9 4 6 7 5 8 6 0 8 2 0 6 6 6 9 0 4 7 5
6 2 2 0 1 7 0 3 1 3 2 9 6 9 1 9 2 7 5 4 0 1 6 5 4 2
7 5 6 2 4 1 0 0 4 3 0 2 0 4 6 2 9 9 0 5 3 5 3 1 1 0
8 7 9 4 4 9 2 6 2 0 2 9 6 8 6 6 4 3 0 0 0 9 4 5 6 6
9 5 3 9 9 6 6 4 5 0 8 8 9 7 8 5 0 7 7 5 3 3 7 2 5 7
10 1 8 9 2 8 7 3 5 8 8 5 5 0 5 2 1 3 6 5 1 3 9 2 8 5
11 5 3 0 8 5 8 9 6 6 3 0 5 6 1 2 5 7 0 2 2 5 0 4 1 2
12 0 3 5 8 8 0 2 9 2 8 7 6 8 9 5 1 1 8 2 4 8 8 8 9 4
13 2 7 0 7 8 1 8 8 6 5 6 9 4 9 9 8 0 0 2 8 0 4 7 0 5
14 0 5 2 1 0 8 5 9 0 1 0 6 2 2 2 4 9 8 9 1 8 1 1 7 5
15 4 0 3 6 1 3 2 7 8 4 3 0 8 2 3 3 3 6 3 9 6 9 4 2 0
16 5 4 6 0 2 5 2 8 8 5 8 8 2 0 0 0 1 0 5 9 6 1 0 5 3
17 7 1 5 1 6 3 4 0 7 6 7 1 1 1 7 3 7 3 5 2 3 7 3 1 6
18 6 1 0 2 0 1 8 1 7 3 9 2 6 0 6 6 7 3 5 8 5 3 3 4 4
19 8 2 5 5 9 3 1 3 4 6 3 0 9 5 2 6 5 5 0 6 9 6 1 7 6
20 8 9 9 8 5 4 1 4 2 1 7 4 1 3 5 7 6 8 1 9 8 6 2 8 6
21 0 0 9 9 8 4 8 4 1 4 6 7 9 5 1 3 7 7 5 8 9 0 1 4 5
22 6 2 4 1 5 0 7 8 2 0 4 8 0 5 8 8 4 3 5 2 9 8 0 3 1
23 9 4 2 7 9 0 6 9 2 4 6 8 0 9 9 2 1 1 8 6 0 7 6 3 8
24 4 4 8 9 2 9 2 8 8 4 3 6 2 8 2 5 1 5 8 2 8 7 7 4 1
25 9 7 3 0 7 6 9 5 3 3 2 1 1 0 5 4 2 6 9 5 6 6 6 5 5
26 3 9 1 6 5 8 0 4 4 4 8 0 1 5 5 9 5 9 8 3 9 0 9 5 5
27 6 0 7 8 1 1 0 3 2 6 6 7 5 0 3 4 0 9 6 1 3 1 3 0 2
28 0 3 1 9 2 3 4 7 6 2 8 9 5 7 7 7 9 1 3 3 8 8 4 7 6
29 4 1 2 8 5 2 6 7 5 6 2 5 3 9 5 9 9 6 6 5 5 1 3 6 9
30 7 7 5 4 9 8 5 0 3 9 2 5 3 7 4 2 5 2 9 7 1 0 0 3 5
31 2 8 6 3 4 1 6 1 9 1 6 4 2 4 8 3 8 1 3 7 3 4 4 8 8
32 7 4 2 4 4 8 8 5 4 0 1 2 3 3 5 9 6 7 5 0 1 4 9 8 1
33 0 0 2 4 0 3 3 7 9 6 4 6 6 8 7 5 0 5 3 2 4 2 1 6 6
34 0 5 4 1 4 7 6 9 6 9 4 5 3 6 1 6 7 1 1 8 9 5 5 1 9
35 6 2 6 9 8 4 9 7 9 7 4 7 2 3 6 6 5 1 5 6 1 3 0 8 6
43
2. INTRODUÇÃO À PROBABILIDADE
A teoria da probabilidade é um dos campos mais aliciantes da Matemática. Parte dos acontecimentos do
dia a dia tropeça no conceito de azar ou de sorte e estabelece leis que permitem “medir a sorte”. Odete
Bernardes
2.1. Experimento Aleatório
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “é provável
que o meu time ganhe a partida de hoje” pode resultar:
a) que, apesar do favoritismo, ele perca;
b) que, como pensamos, ele ganhe;
c) que empate.
Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados fenômenos
aleatórios ou experimentos aleatórios.
Definição 1: Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob
condições semelhantes, apresentam resultados imprevisíveis, e será denotado por (épsilon).
Devemos raciocinar em termos de materiais ideais. Por exemplo, moedas com as faces cara e coroa, dados
com material homogêneo.
Exemplo 1
1. Jogar uma moeda para verificar a face que ficará voltada para cima.
2. Jogar um dado para verificar a face superior.
3. Testar uma peça para verificar se está ou não perfeita.
4. Retirar uma bola de uma urna que contenha uma bola branca, uma azul, uma cinza, uma vermelha e
uma verde e observar a cor da bola premiada.
Se deixarmos uma massa M cair em queda livre de uma altura de 1 metro sobre uma superfície poderemos
anotar o tempo t, de queda livre. Este fenômeno é classificado como determinístico (Física).
Exemplo 2
Dos experimentos do exemplo 1, os respectivos espaços amostrais são:
a) S1 = ____________________________________
b) S2 = ____________________________________
c) S3 = _________________________________________________
d) S4 = ___________________________________________________________
2.3. Eventos
Definição 3: Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório.
Notação: A, B, C, D, E,...
Assim, qualquer que seja E, se E S , então E é um evento de S.
Se E = S, E é chamado evento certo, este é o evento que sabemos que irá ocorrer antes mesmo da
realização da experiência.
44
Exemplo 3 Ocorrência de Cara ou Coroa no lançamento de uma moeda.
Exemplo 3
No lançamento de um dado, onde S = ________________________ , temos:
a) A 2,4,6 S ; logo, A é um evento de S.
b) B 1,2,3,4,5,6 S ; logo, B é um evento ___________________ de S.
c) C 4 S ; logo, C é um evento __________________________ de S.
d) D S ; logo, D é um evento ___________________________ de S.
45
2.4. Probabilidade
Probabilidade é a parte da Estatística que tem por objetivo atribuir um valor numérico que represente de
forma clara e correta a chance que cada evento tem quando se executa um experimento aleatório.
Este valor numérico é representado por um número relativo, isto é, compreendido entre zero e um;
pelo qual pode ser transformado em porcentagem.
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S
tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.
Exemplo 5
a) Considerando o lançamento de uma moeda e o evento A “obter cara”, temos:
c) Quais destes eventos têm probabilidade igual a 0 (ou muito próximo a zero) e quais têm probabilidade
igual a 1 (ou muito próximo a 1)?
- A noite suceder ao dia
- Todos os políticos falarem a verdade o tempo todo
- Você achar um cheque de um milhão de reais dentre as páginas de um livro pego na biblioteca
- Ocorrer um incêndio nesta sala
46
Exemplo 6
No lançamento de um dado os eventos A “obter o número 3” e B “obter um número par”, são mutuamente
exclusivos. Encontrar a probabilidade de ocorrer A ou B.
Exemplo 7: Se A for a ocorrência de Cara no lançamento de uma moeda, então Coroa será o evento A ,
ou evento complementar de A.
2.7. Eventos Independentes
Definição 7: Dizemos que dois eventos são independentes quando a realização ou a não-realização de um
dos eventos não afeta a probabilidade da realização do outro e vice-versa.
* Eventos Mutuamente Exclusivos: a ocorrência de um implica a NÃO ocorrência do outro, ou seja, não
ocorrem simultaneamente.
* Eventos Independentes: a ocorrência de um não afeta a ocorrência do outro, mas ambos podem ocorrer
simultaneamente.
47
2.8. Principais Propriedades da Probabilidade
P1. P( ) 0 .
P2. P( A) 1 P( A) .
P3. P( A B) P( A) P( B) P( A B) A e B quaisquer eventos.
Obs.: Se A e B forem ME, então P( A B) P( A) P( B)
P4. P A B C P A PB P(C) P( A B) P( A C) P( B C) P( A B C)
P5. Se A B então P( A) P( B) .
Exemplo 7
Seleciona-se uma carta de um baralho normal. Determine a probabilidade dos seguintes eventos ocorrerem:
a) A “selecionar um 7 de ouros”;
b) B “selecionar uma carta de ouro”;
c) C “selecionar uma carta de ouro, copas, paus ou espada”.
EXERCÍCIOS
1. No experimento aleatório , seu espaço amostral é:
S a, b, c, d , e, f , g , h, i, j
sejam os seguintes eventos associados a :
A a, b, c B g , h, i, j C c, d , e, f
D d , e, f , g , h, i, j E a, f , g
a) Verifique quais pares de eventos são:
a1. Mutuamente Exclusivos
a2. Complementares
b) Encontre o complementar de C e o de D.
P( A C ) = P ( A B) = P( B C ) =
R: 0,30; 0,40; 0,40; 0,10; 0,00; 0,00
48
c) Qual a probabilidade da 1ª ser vermelha e a 2ª ser branca?
( ) 0,20 ( ) 0,30 ( ) 0,35 ( ) 0,40 ( )
0,45
n ( A)
(2) Evento ( ) .
n( S )
( ) O conjunto formado por todos os resultados possíveis de
(3) Probabilidade de um evento A
um experimento aleatório.
6. Considerando um lote de 12 peças, 4 são defeituosas, e o experimento aleatório “Retirar uma peça do
lote” vamos calcular:
a) a probabilidade do evento A “obter uma peça defeituosa”.
8. De dois baralhos de 52 cartas, cada, retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade de ocorrer o evento A “obter um rei do primeiro baralho” e B
“obter um 5 de paus do segundo”? R: 0,0015
9. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas,
1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual
é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente,
branca, preta e verde? R: 0,0370
10. De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a
primeira carta ser o ás de paus e a segunda ser o rei de paus? R: 0,0004
12. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.
R: 0,1667
49
14. Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50. Determine a
probabilidade de:
a) o número ser divisível por 5;
b) o número terminar em 3;
c) o número ser divisível por 4 e por 6. R: 0,2000; 0,1000; 0,0800
18. Um empresário supersticioso, quando necessita viajar, escolhe o modelo de transporte através do
lançamento de uma moeda: se sair cara viaja de ônibus, se sair coroa, viaja de avião. Numa semana em
que tiver de fazer exatamente 4 viagens, ache a probabilidade de que ele faça:
a) Nenhuma de avião;
b) Exatamente duas de ônibus;
c) Pelo menos uma de avião. R: 0,0625; 0,3750; 0,9375
19. Para fazer escolha do dia da semana (6 dias úteis) de folga de um funcionário o Diretor de uma empresa
joga um dado e a face voltada para cima indicará o dia de folga, sendo que nesta empresa trabalha um
casal (esposo / esposa). Em uma semana ache a probabilidade de que, para este casal ocorra a seguinte
folga:
a) Esposo e esposa no mesmo dia;
b) Esposa antes do esposo;
c) Esposo e esposa em dias seqüenciais. R: 0,1667; 0,4167; 0,2778
20. Na parte de higiene de um supermercado, possui uma prateleira de Pasta Dental. A tabela abaixo mostra
a disponibilidade nesta prateleira:
Marca Quantia de Pasta Dental por tamanho Total
75g 90g 120g
Close-Up 12 10 8
Sorriso 18 12 11
Colgate 22 14 7
Phillips 8 12 6
Total
50
Um comprador pega uma destas embalagens totalmente ao acaso. Ache a probabilidade de que o
produto comprado:
a) Seja Colgate ou Phillips;
b) Seja Close-Up ou de 120g;
c) Não seja Phillips;
d) Não seja de 75g, nem Close-Up. R: 0,4929; 0,3857; 0,8143; 0,4429
21. O departamento de entrega de uma distribuidora possui 5 veículos numerados de 1 a 5. Para cada
entrega é feito um sorteio. No dia em que houver 2 entregas simultâneas, ache a probabilidade dos
veículos que farão as entregas serem:
a) De numeração seqüencial;
b) Todos de numeração par;
c) Um de numeração par e o outro ímpar;
d) Pelo menos um de numeração maior que 3. R: 0,4000; 0,1000; 0,6000; 0,7000
a) Determine e interprete a probabilidade de que um acidente industrial seja causado por engenharia ou
projeto defeituosos. (0,3253)
b) Determine e interprete a probabilidade de que um acidente industrial seja causado por alguma outra
coisa diferente de procedimentos e práticas defeituosas. (0,7108)
c) Determine e interprete a probabilidade de que um acidente industrial seja causado por gerência e
supervisão ou treinamento e comunicação. (0,3855)
23. De acordo com o Journal of Business Venturing (vol. 17, 2002), 27% de todos os pequenos negócios
cujos donos são brancos não hispânicos nos Estados Unidos são empresas de propriedade de mulheres.
Se selecionarmos, ao acaso, um pequeno negócio cujo dono seja um branco não hispânico, qual será a
probabilidade de que seja uma empresa de propriedade de um homem?
51
24. O Organization Development Journal (verão, 2006) relatou os resultados de um levantamento feito com
gerentes de recursos humanos de grandes empresas localizadas em uma cidade do sudeste norte-
americano. O foco do estudo foi o comportamento dos empregados – especificamente, absenteísmo,
disposição para o trabalho e rotatividade. O estudo mostrou que 55% dos gerentes de RH tiveram
problemas com absenteísmo dos empregados e que 41% tiveram problemas com rotatividade. Suponha
que 22% dos gerentes de RH tenham enfrentado problemas com absenteísmo e também com
rotatividade. Use essa informação para achar a probabilidade de que um gerente de RH selecionado
dentro do grupo pesquisado tenha tido problemas com absenteísmo ou com a rotatividade dos
empregados. (74%)
25. O E*Trade Group Inc. foi a primeira companhia a proporcionar a negociação de ações on-line para seus
clientes, oferecendo uma alternativa às firmas de investimento tradicionais. De acordo com a Business
Week, as negociações de ações representam uma parte significativa do negócio de corretagem. A
seguinte tabela mostra o número de contas on-line e tradicionais de cinco corretoras importantes.
Suponha que um cliente seja escolhido ao acaso da população de contas descritas na tabela.
Considere os seguintes eventos:
A “A conta é com a Merrill Lynch”
B “A conta é on-line”
C “A conta é com a E*Trade e é on-line”
D “A conta é com a TD Waterhouse ou com a E*Trade e é uma conta on-line”
E “A conta é com a E*Trade”
a) Determine a probabilidade dos eventos anteriormente mencionados.
b) Determine P( A B) .
c) Determine P( A B) .
d) Determine P( B E ) .
e) Determine P( A E ) .
26. O American Journal of Public Health (jan. 2002) relatou um estudo a respeito de cadeirantes idosos que
vivem em casa. Foi realizada uma pesquisa com uma amostra de 306 cadeirantes, com 65 anos ou mais
de idade, para saber se sofreram uma queda violenta durante o ano e se as suas casas foram
estruturalmente modificadas de uma das seguintes maneiras: modificações no banheiro, nas portas e nos
corredores mais largos, modificações na cozinha, instalação de brilhos e portas fáceis de abrir. O resumo
52
das respostas está na tabela a seguir. Suponha que selecionemos, ao acaso, um dos 306 cadeirantes
pesquisados.
Mudanças nas casas Queda(s) violentas Sem quedas Total
Todas as 5 2 7 9
Pelo menos 1, mas não todas 26 162 188
Nenhuma 20 89 109
Total 48 258 306
Fonte: Berg, K., Hines, M., e Allen, S. “Wheelchair users at home: few home modifications and many injurious falls.”
American Journal of Public Health, vol. 92, n. 1, jan. 2002 (Tabela 1)
a) Determine a probabilidade de que o cadeirante tenha tido uma queda violenta. (0,1569)
b) Determine a probabilidade de que o cadeirante tenha todas as cinco modificações instaladas em casa.
(0,0294)
c) Determine a probabilidade de que o cadeirante não tenha sofrido quedas e nenhuma das
modificações instaladas em casa. (0,2908)
d) Determine a probabilidade de que o cadeirante tenha todas as cinco modificações instaladas em casa
ou sofreram quedas violentas. (0,1797)
27. Extrai-se ao acaso uma bola de uma caixa que contém 6 bolas vermelhas, 4 brancas e 5 azuis. Determine
a probabilidade de a bola extraída ser:
a) vermelha
b) branca
c) azul
d) não-vermelha
e) vermelha ou branca
28. Da mesma caixa do problema anterior, extraem-se três bolas sucessivamente. Determine a probabilidade
de as mesmas serem extraídas na ordem vermelho-branca-azul, (a) havendo reposição, (b) não havendo
reposição.
29. Joga-se um dado “honesto” duas vezes. Determinar a probabilidade de se obter 4, 5 ou 6 na 1ª jogada e
1, 2, 3 ou 4 na 2ª jogada.
30. Determinar a probabilidade de não se obter 7 ou 11 em nenhuma de duas jogadas de dois dados
honestos.
31. Extraem-se aleatoriamente duas cartas de um baralho comum de 52 cartas. Determine a probabilidade
de serem ambas ases, se a primeira carta (a) é reposta, (b) não é reposta.
53
REFERÊNCIA BIBLIOGRÁFICA
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. 4ª ed. São Paulo: Atual, 1987.
CRESPO, Antônio Arnot. Estatística Fácil. 18ª ed. São Paulo: Saraiva, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. São Paulo: Saraiva, 1999.
FONSECA, Jairo Simon da; MARTINS, Gilberto Andrade. Curso de Estatística. 6ª ed. São Paulo:
Atlas, 1996.
FREUND, John E.; SIMON, Gary. Estatística Aplicada: Economia, Administração e Contabilidade.
9ª ed. Porto Alegre: Bookman, 2000.
McCLAVE, James T. Estatística para administração e economia. 10ª ed. São Paulo: Pearson Prentice
Hall, 2009.
MONTEIRO FILHO, Gercino. Estatística Prática para Administração e Contábeis. 1ª ed. Goiânia:
Gráfica e Editora Vieira Ltda, 1999.
LARSON, Ron. Estatística aplicada. 4ª ed. São Paulo: Pearson Prentice Hall, 2010.
SILVA, Ermes Medeiros da. Et al. Estatística para os curso de Economia, Administração e Ciências
Contábeis. 3ª ed. São Paulo: Atlas, v. I, 1999.
SPIEGEL, Murray R. Probabilidade e Estatística. Coleção Schaum. 3ª ed. São Paulo: Pearson
Education do Brasil, 2004.
STEVENSON, Willian. Estatística Aplicada à Administração. São Paulo: Harpes & Row, 1981.
54