Você está na página 1de 101

1

Dicionário – Estatística
Amostra - é um subconjunto finito da população que se supõe representativo desta.
Amostra Representativa - é aquela que deve conter em proporção todas as características
qualitativas e quantitativas da população.
Amostragem Aleatória Simples - é aquela em que qualquer elemento da população tem a mesma
probabilidade de ser escolhido.
Amostragem Estratificada - é aquela em que a população está dividida em estratos ou grupos
diferenciados.
Amostragem Sistemática - é aquela em que os elementos são escolhidos a partir de uma regra
previamente estabelecida.
Amplitude de um Conjunto de Dados - é a diferença entre o maior valor e o menor valor desse
conjunto. Se os dados estiverem agrupados em classes, a amplitude é a diferença entre o limite
superior da última classe e o limite inferior da primeira.
Atributos Qualitativos - são atributos que estão relacionados com uma qualidade e apresentam-
se com várias modalidades.
Atributos Quantitativos - são atributos aos quais é possível atribuir uma medida e apresentam-se
com diferentes valores.
Censo - é um estudo estatístico que resulta da observação de todos os indivíduos da população
relativamente a diferentes atributos pré-definidos.
Correlação - é a relação ou dependência entre as duas variáveis de uma distribuição
bidimensional.
Desvio Padrão - é a raiz quadrada positiva da variância.
Distribuição de Frequências - o mesmo que Tabela de Freqüências.
Estatística - é o método que ensina a recolher, classificar, apresentar e interpretar um conjunto de
dados numéricos.
Estatística Descritiva - ramo da Estatística que tem por finalidade descrever certas propriedades
relativas a um conjunto de dados.
Estatística Indutiva - ramo da Estatística que procura inferir propriedades da população a partir de
propriedades verificadas numa amostra da mesma.
Freqüência Absoluta - é o número de vezes que o valor de determinada variável é observado.
Freqüência Absoluta Acumulada - é a soma das freqüências absolutas anteriores com a
freqüência absoluta deste valor.
Freqüência Relativa - é o quociente entre a freqüência absoluta do valor da variável e o número
total de observações.
Freqüência Relativa Acumulada - é a soma das freqüências relativas anteriores com a freqüência
relativa desse valor.
Gráfico de Barras - é constituído por barras horizontais ou verticais, de comprimento proporcional
à freqüência.

PROBABILIDADE E ESTATÍSTICA
2
Histograma - é um gráfico de barras em que a área destas é proporcional à freqüência, não
havendo espaço entre as mesmas. Só se utiliza em variáveis quantitativas contínuas.
Média Aritmética Simples - é o quociente da soma de todos os dados não classificados pelo
número desses dados.
Média Aritmética Ponderada - é o quociente entre o somatório do produto de cada dado
classificado pela sua freqüência absoluta e o número desses dados.
Mediana - é o valor da variável, para dados não classificados, que ocupa a posição central da
distribuição.
Medidas de Dispersão - é um conjunto de medidas (Amplitude, Variância e Desvio Padrão)
utilizadas no estudo da variabilidade de uma determinada distribuição, permitindo obter uma
informação mais completa acerca da "forma" da mesma.
Medidas de Tendência Central - o mesmo que Medidas de Localização.
Moda - observação que ocorre com maior freqüência numa amostra.
Pictogramas - são gráficos onde se utilizam figuras ou símbolos alusivos ao problema em estudo.
Polígono de Freqüências - são gráficos com aspecto de linhas quebradas. Constroem-se unindo
por segmentos de reta os pontos médios das bases superiores dos retângulos de um histograma.
População - é um conjunto de seres com uma dada característica em comum e com interesse para
o estudo.
Quartis - são os valores que dividem a distribuição em quatro partes iguais.
Somatório ( - representa de forma abreviada, uma soma.
Sondagem - é o estudo estatístico que se baseia numa parte da população, isto é, numa amostra
que deve ser representativa dessa população.
Tamanho da Amostra - é o número de elementos que constituem uma dada amostra.
Variância - é a medida que permite avaliar o grau de dispersão dos valores da variável em relação
à média.
Variáveis Contínuas - são as variáveis que podem tomar qualquer valor de um determinado
intervalo.
Variáveis Discretas - são as variáveis que podem tomar um número finito ou uma infinidade
numerável de valores.
Variáveis Qualitativas - o mesmo que Atributos Qualitativos.
Variáveis Quantitativas - o mesmo que Atributos Quantitativos.

PROBABILIDADE E ESTATÍSTICA
3
INTRODUÇÃO AO ESTUDO DA ESTATÍSTICA

Ciência que fornece métodos para a coleta, organização, descrição, análise e interpretação
de dados, utilizando-os na tomada de decisões.

USO NA VIDA PROFISSIONAL


Pesquisa, organização de relatórios/palestras, tomadas de decisão.

POPULAÇÃO/AMOSTRA
População é o conjunto de entes portadores de, pelo menos, uma característica comum. Ex:
fazer uma pesquisa entre os alunos das escolas de I grau, precisamos definir quais são os alunos
que formam o universo: os que atualmente estão no colégio ou devemos incluir os que já passaram
pela escola? A solução do problema depende de cada caso em particular. Na maioria das vezes,
por impossibilidade ou inviabilidade econômica ou temporal, limitamos a pesquisa a apenas uma
parte da população. A essa parte proveniente da população em estudo denominamos amostra.

DIVISÃO QUANTO AO CONTEÚDO


Estatística Descritiva/Indutiva

DESCRITIVA  descreve, organiza, sintetiza os dados facilitando sua interpretação. Rol, tabelas,
gráficos, medidas descritivas.

INDUTIVA  faz a inferência, o ato de expandir resultados obtidos com as amostras para a
população. Intervalo de confiança/testes estatísticos.

VARIÁVEIS ESTATÍSTICAS
Qualquer atributo medido numa pesquisa: renda familiar, número de indivíduos de uma
família.

Variáveis Qualitativas  expressam qualidade. Representadas por palavras. Ex: sexo, grau de
instrução, estado civil.

Nominal: Os indivíduos são classificados em categorias segundo uma característica.


Ex: sexo (masculino, feminino), hábito de fumar (fumante, não fumante), cargo na empresa (diretor,
vice, financeiro).
Não existe ordem entre as categorias e suas representações, se numéricas, são destituídas de
significado numérico.
Ex: sexo masculino = 1, sexo feminino = 2. Os valores 1 e 2 são apenas rótulos.

PROBABILIDADE E ESTATÍSTICA
4
Ordinal: Os indivíduos são classificados em categorias que possuem algum tipo inerente
de ordem. Neste caso, uma
categoria pode ser "maior" ou "menor" do que outra.
Ex: nível sócio-econômico (A, B, C e D; onde A representa maior poder aquisitivo); nível de retinol
sérico (alto, aceitável, baixo, deficiente) onde alto: maior ou igual a 50,0 µg/dl; aceitável: 20,0 a
49,9 µg/dl, baixo: 10,0 a 19,9 µg/dl e deficiente: menor ou igual a 10,0 µg/dl; grau de instrução.
Exemplos:
Você tem diabetes? Sim. Não. Não sei. Você é fumante? Sim. Não. Já fui.
Qual é o seu tipo de sangue? A. B. AB. O. Não sei.

Variáveis Quantitativas  expressam quantidade. Representadas por números.

Discretas: o resultado numérico da mensuração é um valor inteiro.


Ex: número de refeições em um dia (nenhuma, uma, duas, três, quatro, ...), frequência de consumo
semanal de determinado alimento (1 vez, 2 vezes, 3 vezes, 4 vezes, 5 vezes, 6 vezes, 7 vezes),
número de filhos, empregados.

Contínuas: podem assumir qualquer valor do intervalo. Ex: estatura, salário.

Dados Brutos  valores medidos em pesquisa, na ordem em que foram medidos.

Rol  valores organizados em ordem crescente ou decrescente.

Tabela 1: Informações sobre estado civil, grau de instrução, número de filhos, salário (expresso
como fração do salário mínimo), idade (medida em anos e meses) e procedência de 36
empregados da seção de orçamentos de uma Empresa.

Variável Qualitativa Nominal: para a qual não existe nenhuma ordenação nos possíveis
resultados.

PROBABILIDADE E ESTATÍSTICA
5
Exemplo: Região de Procedência, etc.

Variável Qualitativa Ordinal: para a qual existe uma ordem natural nos seus resultados.
Exemplo: Grau de instrução, etc.
As variáveis Quantitativas também podem sofrer uma classificação dicotômica:

Variável Quantitativa Discreta: cujos possíveis valores formam um conjunto finito ou enumerável
de números, e que resultam, freqüentemente, de uma contagem.
Exemplo: Nº de Filhos, etc.

Variável Quantitativa Contínua: cujos possíveis valores pertencem a um intervalo de números


reais e que resultam de uma mensuração.
Exemplo: Salário, etc.
EXERCÍCIOS
01. Classifique as variáveis abaixo:
a) Tempo para fazer um teste. b) Número de alunos aprovados por turma.
c) Nível sócio-econômico d) QI (Quociente de inteligência).
e) Sexo f) Gastos com alimentação.
g) Opinião com relação à pena de morte h) Religião
i) Valor de um imóvel j) Conceitos em certa disciplina
k) Classificação em um concurso.

02. Em uma pesquisa realizada em uma escola, identificou-se os seguintes indicadores:


(1) idade (2) anos de estudo (3) ano de escolaridade
(4) renda (5) sexo (6) local de estudo
(7) conceito obtido na última prova de estatística (8) Quantidade de livros que possui

a) Das variáveis acima, quais são as quantitativas e quais são as qualitativas?

b) Das variáveis quantitativas, diga quais são discretas?

03. Foi encomendado um estudo para avaliação de uma entidade de ensino superior. Para isso,
aplicou-se um questionário e obtiveram-se respostas de 110 alunos. Indique:
a) a variável em estudo;

b) a população em estudo;

PROBABILIDADE E ESTATÍSTICA
6
c) a amostra escolhida;

PORCENTAGEM

Praticamente todos os dias, observamos nos meios de comunicação, expressões


matemáticas relacionadas com porcentagem. O termo por cento é proveniente do Latim per
centum e quer dizer por cem. Toda razão da forma a/b na qual o denominador b = 100, é chamada
taxa de porcentagem ou simplesmente porcentagem ou ainda percentagem.

Para que serve o cálculo da porcentagem?


Razões são utilizadas para podermos comparar grandezas e em sendo a porcentagem uma razão,
é exatamente esta a utilidade da porcentagem.
Digamos que a população de uma cidade A cresceu de 100 mil para 125 mil em dez anos.
Sabemos também que no mesmo período, a população da cidade B passou de 40 mil para 50 mil
habitantes. Qual das cidades teve um aumento populacional maior?

Aumento populacional da cidade A em porcentagem: (100000 / 125000 - 1) . 100 = 25

Aumento populacional da cidade B em porcentagem: 40000 / 50000 - 1) . 100 = 25

Segundo os cálculos realizados acima, percebemos que embora a população da cidade A seja
muito maior que a outra, o aumento percentual das duas populações foi o mesmo.

Veja também que a razão da população atual para a população de 10 anos atrás, de ambas as
cidades é a mesma, uma outra prova de que o crescimento foi proporcionalmente o mesmo:
125000 : 100000 = 50000 : 40000 = 1,25

As porcentagens costumam ser representadas de três maneiras. Por exemplo:

61
- sessenta e um por cento: 61% ou ou 0,61
100

9
- nove por cento: 9% ou ou 0,09
100

PROBABILIDADE E ESTATÍSTICA
7
APRESENTAÇÃO GRÁFICA DOS DADOS

Vantagens
a- Causam melhor impressão visual
b- Em conjunto com as tabelas, facilitam a análise e a interpretação

Desvantagens
a- Demora na confecção
b- Valores arredondados
c- Pequeno número de elementos
Corresponde às representações dos dados sob diferentes formas gráficas, a fim de permitir
uma visão rápida e global do fato estudado. De uma maneira geral, podemos dizer que os gráficos
devem ser construídos de maneira simples e clara, de tal sorte que o observador entenda
facilmente aquilo que o gráfico busca evidenciar. É extremamente importante que o gráfico seja
construído com honestidade, buscando retratar a realidade, observando-se o máximo cuidado no
traçado quanto na escala.
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o
de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do
fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.
Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência
entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série
seja representado por uma figura proporcional. A representação gráfica de um fenômeno deve
obedecer a certos requisitos fundamentais para ser realmente útil:

a. Simplicidade  o gráfico deve ser destituído de detalhes de importância secundária, assim como
de traços desnecessários que possam levar o observador a uma análise morosa ou com erros.
b. Clareza  o gráfico deve possibilitar uma correta interpretação dos valores representativos do
fenômeno em estudo.
c. Veracidade  o gráfico deve expressar a verdade sobre o fenômeno em estudo.
Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas.

GRÁFICOS ESPECIAIS PARA DISTRIBUIÇÕES DE FREQUÊNCIAS

Gráficos de COLUNAS ou BARRAS


É a representação de uma série por meio de retângulos, dispostos verticalmente (em
colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e
as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a

PROBABILIDADE E ESTATÍSTICA
8
mesma altura e os comprimentos são proporcionais aos respectivos dados. Assim estamos
assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos.
É um tipo de gráfico recomendado para analisar as informações absolutas de séries geográficas,
especificativas e ainda algumas séries temporais (estas, com cinco ou menos datas).

HISTOGRAMA
É a representação gráfica através de retângulos adjacentes onde a base colocada no eixo
das abscissas corresponde aos intervalos das classes, e a altura é dada pela frequência absoluta
das classes. Exemplo:

GRÁFICOS EM COLUNAS OU BARRAS


São representados por retângulos de base comum e altura proporcional à magnitude dos
dados. Quando dispostos em posição vertical, dizemos colunas; quando colocados na posição
horizontal, são denominados barras. Embora possam representar qualquer série estatística,
geralmente são empregados para representar as séries específicas.

PROBABILIDADE E ESTATÍSTICA
9

COLUNAS CONTRAPOSTAS OU OPOSTAS


É aquele em que os retângulos são dispostos de maneira oposta entre si, cada um deles
representando um fato qualquer.

PROBABILIDADE E ESTATÍSTICA
10
COLUNAS SUPERPOSTAS
É aquele em que os retângulos são dispostos um sobre o outro, procurando evidenciar suas
diferenças.
Situação Patrimônio Empresa X ($ 1.000)

Anos Receita Despesa

84 8.000 6.000
85 12000 11.000
86 9.000 10.000
87 11.000 9.500

COLUNAS COMPOSTAS
É aquele em que um retângulo é construído de forma a representar as partes em que se
divide o fato.
Alunos do Grupo Escolar X — 1980
1a série - 400
2 a série - 300
3 a série - 200
a
4 série - 100
1000

Gráfico de LINHA ou CURVA


Este tipo de gráfico representa a série histórica, exclusivamente. Requer, entretanto, que tal série
apresente um número significativo de informações (5 ou mais), ou melhor, para 5 ou número menor
de ocorrências um outro gráfico deve ser construído, o gráfico de colunas.

POLÍGONO DE FREQUÊNCIAS
É a representação gráfica de uma distribuição de frequências por meio de um polígono,
onde os pontos são obtidos por perpendiculares traçadas a partir dos pontos médios das classes, e
de altura proporcional a frequência de cada uma das classes. No caso da frequência acumulada,
os segmentos perpendiculares são traçados a partir dos limites superiores da classe. Em ambos os
PROBABILIDADE E ESTATÍSTICA
11
casos, o primeiro e o último pontos são colocados de modo a manter a proporcionalidade do
gráfico.

GRÁFICOS LINEARES OU DE CURVAS


São gráficos em duas dimensões, baseados na representação cartesiana dos pontos no
plano. Servem para representar séries cronológicas, sendo que o tempo é colocado no eixo das
abscissas e os valores observados no eixo das ordenadas.

GRÁFICOS DE SETORES
O gráfico em setores tem finalidade de analisar as informações percentuais de séries geográficas
ou especificativas, com ”poucas” ocorrências (para que ele não se apresente confuso, dificultando
a sua interpretação). A escolha do gráfico em retângulos ou em setores é opcional.
São representados por meio de setores em um círculo, e têm a mesma finalidade que os de
colunas compostas, ou seja, representar um fato e todas as partes em que o mesmo se subdivide.

PROBABILIDADE E ESTATÍSTICA
12

GRÁFICOS PICTÓRICOS
O pictograma constitui um dos processos gráficos
que melhor fala ao público, pela sua forma ao
mesmo tempo atraente e sugestiva. A
representação gráfica consta de figuras. Na
confecção de gráficos pictóricos temos que utilizar
muita criatividade, procurando obter uma
otimização na união da arte com a técnica. Não é
utilizado em trabalhos científicos. Seu principal uso
está em revistas voltadas ao público em geral.
Regras fundamentais para a construção:

a) Os símbolos devem explicar-se por si próprios.

b) As quantidades maiores são indicadas por meio de um número maior de símbolos, mas não por
um símbolo maior.

c) Os símbolos comparam quantidades aproximadas, não detalhes minuciosos.

d) Os gráficos pictóricos só devem ser usados para comparações, nunca para afirmações isoladas.

PROBABILIDADE E ESTATÍSTICA
13
CARTOGRAMAS
São gráficos baseados em mapas, utilizados para representar as séries geográficas.

EXERCÍCIOS DE GRÁFICOS ESTATÍSTICOS

01. Num curso de iniciação à informática, a


distribuição das idades dos alunos, segundo o sexo, é
dada pelo gráfico seguinte.
Com base nos dados do gráfico, pode-se afirmar que:
a) o número de meninas com, no máximo, 16 anos é
maior que o número de meninos nesse mesmo
intervalo de idades.
b) o número total de alunos é 19.
c) a média de idade das meninas é 15 anos.
d) o número de meninos é igual ao número de
meninas.
e) o número de meninos com idade maior que 15 anos é maior que o número de meninas nesse
mesmo intervalo de idades.

02. Um novo "boom" desponta nas estatísticas dos últimos vestibulares. Desde o surgimento de
Dolly, a polêmica ovelha clonada a partir da célula de um animal adulto, a carreira de ciências
biológicas recebe cada vez mais candidatos e esta área firma-se como a ciência do próximo
milênio. O gráfico a seguir ilustra o número de inscritos nos últimos quatro vestibulares que
disputaram as vagas oferecidas pela Universidade de São Paulo (USP) e pelas universidades
federais do Rio de Janeiro (UFRJ), de Minas Gerais (UFMG) e do Rio Grande do Sul (UFRGS).
Com base nessas informações, julgue os itens seguintes:

PROBABILIDADE E ESTATÍSTICA
14

(1) De 1997 a 1998, o crescimento percentual do número de inscritos na USP foi maior que o da
UFRGS.
(2) Todos os segmentos de reta apresentados no gráfico têm inclinação positiva.
(3) Durante todo período analisado, a UFMG foi a universidade que apresentou o maior
crescimento percentual, mas não o maior crescimento absoluto.
(4) Os crescimentos percentuais anuais na UFRJ diminuíram a cada ano.

03. (UFRGS) As questões de Matemática do Concurso Vestibular da UFRGS de 2004 foram


classificadas em categorias quanto ao índice de facilidade, como mostra o gráfico de barras. Se
esta classificação fosse apresentada em um gráfico de setores circulares, a cada categoria
corresponderia um setor circular. O ângulo do maior desses setores mediria

a) 80° b) 120° c) 157° d) 168° e) 172°

PROBABILIDADE E ESTATÍSTICA
15
04. (UFMG) Este gráfico representa o resultado de uma pesquisa realizada com 1000 famílias
com filhos em idade escolar.
Considere estas afirmativas referentes às famílias pesquisadas:
I) O pai participa da renda familiar em menos de 850 dessas famílias.
II) O pai e a mãe participam, juntos, da renda familiar em mais de 500 dessas famílias.
Então, é CORRETO afirmar que:

a) nenhuma das afirmativas é verdadeira.


b) apenas a afirmativa I é verdadeira.
c) apenas a afirmativa II é verdadeira.
d) ambas as afirmativas são verdadeiras.

05.

06.

PROBABILIDADE E ESTATÍSTICA
16

07. Gráficos a seguir mostram alterações do número de passageiros aéreos e da população nos
últimos 30 anos. Comparando-se os dados dos gráficos, pode-se concluir:
a) A população, no período de 1980 a 2000, teve um decrescimento de 7%.

b) de 1970 a 1980, o aumento do número de passageiros foi aproximadamente o triplo do aumento


da população no mesmo período.

c) de 1990 até hoje, o número de passageiros diminui em 10%.

d) A população e o número de passageiros aumentaram num mesmo ritmo desde 1970.

e) A média aritmética dos percentuais de crescimento da população de 1970, até os dias de hoje,
é de 23%.

Gabarito
1) D 2) F F F V 3) D 4) C 5) D 6) D 7) B

PROBABILIDADE E ESTATÍSTICA
17

DISTRIBUIÇÃO DE FREQUÊNCIAS

Como verificamos, é uma série estatística específica, onde os dados encontram-se


dispostos em classes ou categorias juntamente com as frequências correspondentes. Desta forma,
podemos dividir as distribuições de freqüências em dois tipos:

Tipo A ou Tipo I
Usada para variáveis qualitativas ou então quantitativas discretas com poucos valores
diferentes.
Exemplos: número de acidentes de trabalho na Empresa X; quantidade de livros de estatística na
biblioteca da UFSM.
Eis um exemplo de distribuição de frequências para variável discreta (tipo A)
Tabela 1 - Número de acidentes de trabalho em pequenas empresas da cidade de Porto Alegre
Número de Acidentes Número de Empresas
(Xi) (fi)
0 35
1 20
2 13
3 6
4 4
5 ou mais 2
Total 80

Xi = identifica as categorias em que o fato se subdivide.


fi = corresponde a frequência absoluta, isto é, o número de vezes que cada uma das categorias
ocorre.
N = soma dos fi = total de elementos observados na população.
n = soma dos fi = total de elementos observados na amostra.

Tipo B ou Tipo II
Usada para variáveis quantitativas contínuas ou discretas com muitos valores diferentes.
Não é possível enumerar todos os valores. Geralmente esta variável provém de medições.
Exemplos: peso dos alunos de uma classe; tempo de duração de um transistor; nota de
aproveitamento dos alunos.

Eis um exemplo de distribuição de frequências para variável contínua (Tipo B)


X = Notas finais de 50 estudantes da disciplina de estatística
PROBABILIDADE E ESTATÍSTICA
18
22 46 9 40 57 22 22 13 50 42
35 2 15 41 34 52 32 75 69 44
26 42 60 56 30 3 17 79 45 37
0 12 62 50 45 41 59 11 66 39
43 33 70 50 47 20 36 40 67 29

Então a distribuição de frequência será expressa pela tabela:


Tabela 2 – Notas finais dos estudantes da disciplina de Estatística – 2012/2
Notas fi
0  10 4
10  20 5
20  30 6
30  40 8
40  50 12
50  60 7
60  70 5
70  80 3
Total 50

Onde fi é a frequência absoluta das classes

Para explicar a colocação das notas dos alunos, segundo uma distribuição do tipo B, necessitará
de algumas definições. Assim:
1) Dados Brutos: Aqueles que não foram numericamente organizados, como é o caso das 50
notas dos alunos.
2) Rol: É o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente. Portanto,
teríamos:
0 2 3 9 11 12 13 15 17 20
22 22 22 26 29 30 32 33 34 35
36 37 39 40 40 41 41 42 42 43
44 45 45 46 47 50 50 50 52 56
57 59 60 62 66 67 69 70 75 79

3) Limites de Classe: São os números extremos de cada classe; sendo assim, temos um limite
inferior e um superior. Se o 10 intervalo for notas de 0 até 10, o 0 será o limite inferior enquanto que
o 10 será o limite superior desta classe.

PROBABILIDADE E ESTATÍSTICA
19

4) Intervalo de Classe: Existem várias maneiras de apresentarmos o intervalo de classes: iguais


ou diferentes entre si. Porém, sempre que possível, deveremos optar por intervalos iguais, o que
facilitará os cálculos posteriores. Mas mesmo com intervalos iguais, as distribuições poderão
apresentar-se da seguinte forma:

0 —10: compreende todos os valores entre 0 e 10, exclusive os extremos.


0 10: compreende todos os valores entre 0 e 10, inclusive os extremos.
0 10: compreende todos os valores entre 0 e 10, inclusive o 10 e exclusive o 0.
0  10: compreende todos os valores entre 0 e 10, inclusive o 0 e exclusive o 10.
Como optaremos por este último tipo (0  10), poderemos definir como intervalo de classe
a diferença entre o limite superior e o limite inferior da classe. Portanto, no exemplo, 10 – 0 = 10
é o intervalo ou amplitude da classe.

5) Amplitude Total ou "Range": é a diferença entre o maior e o menor dado. Em nosso caso, a
nota maior é 79 é a menor é 0; logo, nossa amplitude total é 79 – 0 = 79.
Cumpre observar que, quando não dispusermos dos dados, o cálculo da amplitude se fará levando-
se em consideração a diferença entre o limite superior da última classe e o limite inferior da
primeira classe.

6) Ponto Médio das Classes (Xi). É a média aritmética entre o limite superior e o limite inferior da
0 + 10
classe. Assim, se a classe for 0  10, teremos: = 5, que será o ponto médio da classe.
2

7) Número de Classes (K): quantas classes serão necessárias para representar o fato? Existem
vários critérios que podem ser utilizados a fim de possuirmos uma ideia do melhor número de
classes, porém tais critérios servirão apenas como indicação e nunca como regra fixa, pois caberá
sempre ao pesquisador estabelecer o melhor número, levando-se em conta o intervalo de classe e
a facilidade para os posteriores cálculos numéricos. Assim, podemos citar o critério que leva em
consideração:

PROBABILIDADE E ESTATÍSTICA
20
a)
número de classes (k)

n0 de elementos
observados Mínimo máximo

até 50 5 10
51 a 100 8 16
101 a 200 10 20
201 a 300 12 24
301 a 500 15 30
mais de 500 20 40

b) Fórmula de Sturges
k = n0 de classes = 1+3,3.log N onde N = número de elementos observados
Usando a tabela, em nosso exemplo de notas, segundo o número de elementos, poderíamos
utilizar de 5 até 10 classes, pois possuímos 50 notas. E. segundo a fórmula de Sturges, teríamos:
K = 1 + 3,3 log N K = 1 + 3,3 log 50 K = 1 + 3,3(1,6989) K = 1 + 5,6 = 6,6 ou
arredondando: 7 classes.
Existe ainda uma terceira forma que pode ser utilizada para descobrir o número de classes
que é k = n

k= n = 50  7

8) Amplitude ou Intervalo de Classes (h)


amplitude total
h=
número de classes

Teríamos no exemplo: 79/7 = 12 Notas fi


0  10 4
Dessa forma, o pesquisador, usando o bom-senso e a sua
10  20 5
experiência, verificará que seria mais conveniente a utilização de um
20  30 6
intervalo de classe igual a 10 e de um número de classes igual a 8, mesmo
30  40 8
que o número de classes não seja o determinado pela fórmula de Sturges,
40  50 12
mas que facilite as operações posteriores. Assim sendo:
50  60 7
amplitude total 80
Intervalo de classes = = = 10 60  70 5
número de classes 8
70  80 3
Portanto, a distribuição de frequências do tipo B, para as notas dos alunos,
ficaria: Total 50

Frequência Relativa da Classe: corresponde ao quociente entre a frequência absoluta da classe e


o total de elementos.
No exemplo, a frequência relativa da 7a classe é:
PROBABILIDADE E ESTATÍSTICA
21

fi 5
fri = = = 0,1
N 50

Frequência Acumulada Crescente (FAC): corresponde à soma de frequências de determinada


classe com as anteriores. No exemplo, a frequência acumulada crescente da 4a classe será:

f1 + f2 + f3 + f4 = 4 + 5 + 6 + 8 = 23.

Frequência Acumulada Decrescente (FAD): corresponde à soma da frequência de determinada


classe com as subsequentes.
No exemplo, a frequência acumulada decrescente da 4a classe será:

f4 + f5 + f6 + f7 + f8 = 8 + 12 + 7 + 5 + 3 = 35.

Resumindo, teríamos:
Notas fi Xi(pt FAC FAD fri frAC Fpercentual simples
médio)
0  10 4
10  20 5
20  30 6
30  40 8
40  50 12
50  60 7
60  70 5
70  80 3
Total 50

PROBABILIDADE E ESTATÍSTICA
22

EXERCÍCIOS
01. Uma indústria embala peças em caixas com 100 unidades. O controle de qualidade selecionou
48 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Obteve os
seguintes dados:
2 0 0 4 3 0 0 1 0 0
1 1 2 1 1 1 1 1 1 0
0 0 3 0 0 0 2 0 0 1
1 2 0 2 0 0 0 0 0 0
0 0 0 0 0 0 1 0
Agrupe, por frequência estes dados.

02. Considere as notas de um teste de inteligência aplicado a alunos de um estabelecimento de


ensino:
62 72 74 78 81 84 86 89 94 98
63 72 74 78 81 84 86 90 94 98
64 72 75 78 82 84 86 90 95 99
66 73 75 78 82 85 86 90 95 101
67 73 76 79 82 85 86 91 95 102
68 73 76 80 83 85 86 92 96 103
70 73 76 80 83 85 87 92 96 103
70 73 76 81 83 85 87 92 96 103
71 73 78 81 83 85 88 93 98 105
71 74 78 81 83 86 89 93 98 108

Construa a distribuição de frequências com intervalo de classes e responda:


Quantos alunos participaram do teste? Qual a menor nota registrada?
Qual e o número de classes? Qual e a terceira classe?
Qual e a amplitude total da amostra? Qual e a amplitude total da distribuição?
Qual e o limite superior da quarta classe? Qual e limite inferior da sétima classe?
Qual e a amplitude do quinto intervalo de classe?

PROBABILIDADE E ESTATÍSTICA
23
03. No quadro a seguir estão apresentadas as velocidades médias (em km/h) de uma amostra
constituída por 48 motoristas que utilizam diariamente determinada rodovia.

55 78 90 110 70 90 60 100 100 120 110 115

112 77 70 72 58 65 65 60 80 88 90 96

120 120 110 80 87 110 83 96 75 100 120 105

93 95 112 96 98 100 112 60 80 110 90 80

Construir uma tabela na qual constem: classes de velocidades, frequência, frequência relativa,
frequência acumulada e pontos médios dos intervalos.

04. Uma empresa procurou estudar a ocorrência de acidentes com seus empregados e realizou um
levantamento por um período de 36 meses. As informações apuradas estão na tabela a seguir:

A porcentagem de meses em que houve menos de 5 empregados acidentados é:


a) 50% b) 45% c) 35% d) 33% e) 30%

05. Antes de enviar um lote de aparelhos elétricos para venda, o Departamento de Inspeção da
empresa produtora selecionou uma amostra casual de 32 aparelhos avaliando o desempenho
através de uma medida especifica, obtendo os seguintes resultados:

Construa uma tabela de frequências.

06. Os pesos dos 40 funcionários de uma empresa estão abaixo descritos:


69 57 72 54 93 68 72 58 64 62
65 76 60 49 74 59 66 83 70 45
60 81 71 67 63 64 53 73 81 50
PROBABILIDADE E ESTATÍSTICA
24
67 68 53 75 65 58 80 60 63 53
Determinar:
a) A distribuição de frequência do tipo B.
b) A distribuição de frequência acumulada crescente.
c) A distribuição de frequência porcentual simples.
d) A distribuição de frequência relativa simples.

08. Com os dados abaixo, fazer uma distribuição de frequências do tipo B.


63 81 57 90 46 68 72 75 50 60
76 61 52 56 68 80 75 95 47 73
76 71 82 63 74 56 68 72 64 77
77 65 71 85 80 75 75 86 69 58
70 68 56 79 51 78 80 72 61 53

Determinar:
a) Frequência absoluta das classes.
b) Distribuição de frequência acumulada crescente.
c) Distribuição de frequência acumulada decrescente.
d) Distribuição de frequência porcentual simples.
e) Distribuição de frequência porcentual acumulada crescente.
f) Distribuição de frequência relativa simples.
g) Distribuição de frequência relativa acumulada crescente.

MEDIDAS DE POSIÇÃO

Definição : As medidas de posição mais importantes são as medidas de tendência central, que
recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em
torno dos valores centrais. Dentre as medidas de tendência central, destacamos:
- a média aritmética;
- a mediana;
- a moda.
As outras medidas de posição são as separatrizes, que englobam:
- a própria mediana;
- os quartis;
- os percentis.

Para dados não-agrupados

(Quando os dados não estiverem na forma de distribuição de freqüência)

PROBABILIDADE E ESTATÍSTICA
25
Média Aritmética: ( x ): é o quociente da divisão da soma dos valores (dados, observações) da
variável pelo número deles:

x
i 1
i
x
n

sendo:
x = a média aritmética;
x i = os valores da variável;
n = o número de valores.

Moda (Mo): Denominamos moda de um conjunto de dados o valor (ou valores) que ocorre com
maior freqüência.
Ex: o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa indústria.

Mediana (Md): A mediana é outra medida de posição definida como o número que se encontra no
centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras
palavras, a mediana de um conjunto de valores, ordenados, é o valor situado de tal forma no
conjunto que o separa em dois subconjuntos de mesmo número de elementos.

Obs: - Se o nº de elementos for ímpar, então a mediana será exatamente o valor “do meio”.
- Se o nº de elementos for par, então a mediana será exatamente a média “dos dois valores
do meio”.

Emprego da Mediana
Empregamos a mediana quando:
 desejamos obter o ponto que divide a distribuição em partes iguais;
 há valores extremos que afetam de uma maneira acentuada a média;
 a variável em estudo é salário.

COMPARAÇÃO ENTRE A MÉDIA, A MEDIANA E A MODA


Medida de Posição Vantagens Desvantagens
Média Reflete cada valor observado É Influenciado por valores
na distribuição externos
Mediana Menos sensível a valores Difícil de determinar para

PROBABILIDADE E ESTATÍSTICA
26
externos do que a média grande quantidade de dados
Moda Maior quantidade de valores Não se presta a análise
concentrados neste ponto matemática

Exemplo: Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de: 10,
14, 13, 15, 16, 18 e 12 litros, pergunta-se: Encontre a média, a moda e a mediana para a
produção diária de leite desta vaca.

MÉDIA
n

x i
10  14  13  15  16  18.  12 98
x i 1
   14
n 7 7

Logo, x = 14 litros de leite em média por dia que representa uma produção de 98 litros de leite em
média por semana.

OBS.: a média pode ser um número diferente de todos os valores da amostra que ela representa.

MODA: Como não existe um valor que aparece com maior freqüência que os outros, não há valor
de moda para este exemplo.
MEDIANA: Ordenando os dados temos:

10 12 13 14 15 16 18

Desta forma, o valor mediano é o valor central dos dados, ou seja, 14 litros de leite por dia.

Para dados agrupados

(Quando os dados estiverem na forma de distribuição de freqüência)


Quando os dados estiverem agrupados, ou seja, na forma de distribuição de freqüências a
forma de calcular a média aritmética muda um pouco. Nestes casos, como as freqüências são
números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de
ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:

x f i i
x i 1
n

f
i 1
i

PROBABILIDADE E ESTATÍSTICA
27
OBS.: A moda e a mediana são encontradas teoricamente da mesma forma citada
anteriormente.
Exemplos:
1) Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino:

Nº de fi xifi
meninos
0 2
1 6
2 10
3 12
4 4

f i  34

Qual é a média, a moda e a mediana do nº de meninos por família?

Solução:

Média:
n

x f i i
Devemos usar a fórmula x  i 1
n
, já que estamos trabalhando com dados agrupados,
f
i 1
i

assim temos:
n

x f
i 1
i i =

f
i 1
i 

x f i i
78
Portanto, x  i 1
n
  2,29  2,3
f
34
i
i 1

Interpretação: Sendo x uma variável discreta, como interpretar o resultado obtido, 2 filhos e 3
décimos (ou 0,3) de menino?

PROBABILIDADE E ESTATÍSTICA
28
O valor médio 2,3 meninos sugere, que o maior número de famílias com 4 filhos tem 2
meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em
relação ao número de meninos.

Moda: O valor encontrado com maior frequência para este conjunto de dados é de 3 meninos por
família de 4 filhos.

Mediana: Geralmente, quando os dados estão tabelados, a variável de interesse já está ordenada.
Portanto, basta encontrar o valor central dos dados. Neste exemplo temos que a mediana é de 2
meninos.

Para Agrupamentos com intervalos

n 
  fant 
Md = imed   2 .hmed
 fmed 
 
 

imed : limite inferior da classe mediana

fant : freqüência acumulada da classe anterior à classe mediana

hmed : amplitude do intervalo da classe mediana

fmed : freqüência absoluta da classe mediana

2) Calcule a média, a moda e a mediana da seguinte distribuição de freqüência:

Custos R$ Pm fi x ifi FAC


( xi )
Classes de fr.
450 |- 550 8
550 |- 650 10
650 |- 750 11
750 |- 850 16
850 |- 950 13
950 |- 1050 5
1050 |- 1150 1
Total 64

PROBABILIDADE E ESTATÍSTICA
29
n
: x:
2
Classe mediana:
imed: Mo:
fant:
hmed: Md:
fmed:

EXERCÍCIOS

Salário (R$) fi FAC P. Médio (xi) xi . fi

200 |- 300 2
300 |- 400 3
400 |- 500 13
500 |- 600 11
600 |- 700 9
700 |- 800 2
Total 40

1) Qual a salário médio, o salário mediano e a moda dos salários? Resp. x = R$ 520,00, Md =
R$ 518,18 e Mo = R$ 450,00

2) Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo tiveram
seu consumo observado durante 1000 quilômetros. A informação obtida é apresentada na tabela
abaixo em Km/litro.

Freqüência
Faixas
7 |- 8 27
8 |- 9 29
9 |-10 46
10 |- 11 43
11 |- 12 55

Determine:
a) Qual a variável em estudo? Esta variável é discreta ou contínua?

PROBABILIDADE E ESTATÍSTICA
30
b) A média aritmética, a mediana e a moda da variável em estudo. Interprete os resultados.
c) Construa um histograma para os dados.

3) Os salários-hora de sete funcionários de uma companhia são: R$180,00, R$220,00, R$253,00,


R$220,00 e R$192,00 R$1200,00 e R$750,00. Determine a média, a moda, a mediana.

4) A pulsação de 08 estudantes após exercícios físicos foram as seguintes (em batimentos por
minuto): 80, 91, 84, 86, 80, 89, 85 e 86. Determine à média, a moda, a mediana.

5) Considere a distribuição de frequências das estaturas de 40 alunos de uma determinada classe


de 8ª série.
Estaturas fi xi xi.fi FAC
150 |- 154 4
154 |- 158 9
158 |- 162 11
162 |- 166 8
166 |- 170 5
170 |- 174 3
Total 40

Pergunta-se: qual a estatura média, a estatura mediana e a moda dos alunos desta sala?

SEPARATRIZES
Definição: Além das medidas de posição, há outras que, consideradas individualmente, não são
medidas de tendência central, mas estão ligadas à mediana relativamente à sua Segunda
característica, já que se baseiam em sua posição na série (no conjunto de dados). São elas:
 os quartis;
 os percentis;
 os decis.

Quartis: denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Há, portanto, três quartis:

 O primeiro quartil (Q 1 ): é o valor situado de tal modo na série que uma quarta parte
(25%) dos dados é menor que ele e as três quartas partes restantes (75%) são
maiores.

PROBABILIDADE E ESTATÍSTICA
31
 O segundo quartil (Q 2 ): é exatamente o valor da mediana, ou seja, o valor
situado de tal modo na série que deixa metade (50%) dos dados a esquerda dele e a
outra metade à direita (Q 2 = Md).

 O terceiro quartil (Q 3 ): é o valor situado de tal modo na série que as três quartas

partes (75%) dos dados são menores que ele e uma quarta parte restante (25%) é
maior.

Percentis: denominamos percentis os noventa e nove valores que separam uma série em 100
partes iguais, ou seja:

P1 , P2 , P3 , , P99 , onde P 50 = Md = Q 2 , P 25 = Q 1 e P 75 = Q 3

Decis: os decis por sua vez, são os dez valores que dividem a série em 10 partes iguais, onde,
cada uma delas contém 10% dos dados.

MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

1. DISPERSÃO OU VARIABILIDADE
Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado,
por meio de procedimentos matemáticos, em poucos valores representativos — média aritmética,
mediana e moda. Tais valores podem servir de comparação para dar a posição de qualquer
elemento do conjunto.
No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já
convenientemente simplificados, é necessário ter-se uma idéia retrospectiva de como se
apresentavam esses mesmos dados nas tabelas.
Assim, não é o bastante dar uma das medidas de posição para caracterizar perfeitamente
um conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura média de duas
cidades é a mesma, e igual a 24°C, ainda assim somos levados a pensar a respeito do clima
dessas cidades. Em uma delas poderá a temperatura variar entre limites de muito calor e de muito

PROBABILIDADE E ESTATÍSTICA
32
frio e haver, ainda, uma temperatura média de 24° C. A outra poderá ter uma variação pequena
de temperatura e possuir, portanto, no que se refere à temperatura, um clima mais favorável.
Vemos, então, que a média — ainda que considerada como um número que tem a
faculdade de representar uma série de valores — não pode, por si mesma, destacar o grau de
homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis x, y e z:
X: 70, 70, 70, 70, 70. Y: 68, 69, 70, 71, 72. Z: 5, 15, 50, 120, 160.
Calculando a média aritmética de cada um desses conjuntos, obtemos:
_ 350 _ 350 _ 350
X = = 70 Y = = 70 Z = = 70
5 5 5

Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70.
Entretanto, é fácil notar que o conjunto X é mais homogênea que os conjuntos Y e Z, já que
todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto
Z, pois há menor diversificação entre cada um de seus valores e a média representativa.
Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de
uma variável em torno de um valor de tendência central tomado como ponto de comparação,
podemos dizer que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto Y
apresenta uma dispersão ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às
medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o
coeficiente de variação.

2. VARIÂNCIA/DESVIO PADRÃO
Como vimos, a amplitude total é instável, por se deixar influenciar pêlos valores extremos,
que são, na sua maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a
totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante
estáveis e, por isso mesmo, os mais geralmente empregados.
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média
aritmética dos quadrados dos desvios. Assim, representando a variância por s2, temos:

S2 
∑(x - x )
i
2

∑f i

PROBABILIDADE E ESTATÍSTICA
33
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade
quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um
inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretações práticas,
denominada desvio padrão, definida como a raiz quadrada da variância e representada por s.

Então s = s 2 (1)

OBS: Tanto o desvio padrão como a variância são usados como medidas de dispersão ou
variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista.
A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é
extremamente importante na inferência estatística e em combinações de amostras.

∑ xi2 ∑ xi
2

S= d
2
(2)
-
n n S=
n 1

O desvio padrão pode ser calculado utilizando a fórmula (1) ou (2), sendo esta mais prática,
como também mais precisa. Quando a média não é exata e tem de ser arredondada, cada desvio
fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo acontece com os
quadrados, podendo os resultados do cálculo ser menos exatos do que quando a fórmula (2) é
usada.

 d 2
≠ d
2

COEFICIENTE DE VARIAÇÃO
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas
unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no
entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio
padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos
comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando
expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou
variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada
coeficiente de variação (CV)

s
CV = __ . 100 (maior C.V. é mais heterogênio)
x
Exemplo.

PROBABILIDADE E ESTATÍSTICA
34
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de
indivíduos.

x s

Estatura 175 cm 5 cm
Pesos 68 kg 2 kg

5
CVE = x100 = 2,85%
175

2
CVP = x100 = 2,94%
68

CONCLUSÃO: Nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão


que as estaturas.

EXERCÍCIOS DE DESVIO PADRÃO


01. Calcule as medidas de variabilidade para o problema abaixo. Peso em kg de dois grupos
crianças observadas durante o estágio na pediatria do hospital, 2011.

No Grupo A Desvio Desvio2 Grupo B Desvio Desvio2


1 10 7
2 10 7
3 11 8
4 12 9
5 12 12
6 13 13
7 14 13
8 14 16
9 14 17
10 15 23
Somatório
Média
Mediana
Amp. Total
DP
CV

PROBABILIDADE E ESTATÍSTICA
35

Idade de dois grupos de hipertensos. Calcule e interprete as medidas que pede no quadro.

No Grupo A Desvio Desvio2 Grupo B Desvio Desvio2


1 40 35
2 40 40
3 41 40
4 41 40
5 44 60
6 45 60
7 50 70
8 55 80
9 59 80
10 60 80
11 67 80
12 67 80
13 67 80
Somatório
Média
Mediana
Amp. Total
DP
CV

PROBABILIDADE E ESTATÍSTICA
36
03. Perguntou-se a um grupo de alunos quantas horas eles passavam por semana em trabalhos
de meio período. Uma amostra das respostas (registradas em horas) foi a seguinte:
5 9 4 12 3 8 4 10
a) Calcule a moda, média e mediana.
b) Calcule a amplitude e o desvio padrão
c) Outro aluno respondeu dizendo que trabalhava 30 horas por semana. Recalcule as medidas da
letra (a).

04. Uma loja vende cinco produtos básicos A, B, C, D e E. O lucro por unidade comercializada
destes produtos vale, respectivamente $ 200,00; $ 300,00; $ 500,00; $ 1.000,00; $ 5.000,00. A loja
vendeu em determinado mês 20; 30; 20; 10; 5 unidades, respectivamente. Qual foi o lucro médio
por unidade comercializada por esta loja? R: 682,35

05. Uma empresa tem duas filiais praticamente idênticas quanto às suas características funcionais.
Um levantamento sobre os salários dos empregados dessas filiais resultou nos seguintes valores:
Filial A: Média A = 400 e DP A = 20
Filial B: Média B = 500 e DP B = 25
Podemos afirmar que as duas filiais apresentam a mesma dispersão? R: Sim, pois apresentam o
mesmo CV.

06. Os dados abaixo representam as vendas semanais, em classes de salários mínimos de


vendedores de gêneros alimentícios.

PROBABILIDADE E ESTATÍSTICA
37

Calcule a media e moda bruta. R: Média = 35,97, Moda Bruta = 32,5

07. Retirou-se uma amostra de 8 funcionários de nível superior em duas regiões (A e B) e verificou-
se a informação do número de salários mínimos de cada um. Determine, qual das duas regiões
apresenta maior variabilidade. R: A região B (maior CV)

EXEMPLO PARA CASA (trabalho)


O rol de dados abaixo apresenta os coeficientes de liquidez obtidos da análise de balanço de 50
empresas.

7,4 7,5 7,9 8,1 8,1 8,1 8,1 8,1 8,5 8,5 8,5
8,6 8,7 8,8 8,8 9,7 9,7 9,7 10,1 10,2 10,2 10,2
10,3 10,3 10,4 10,5 10,5 10,6 10,6 10,6 10,7 10,7 10,8
10,8 10,8 10,8 10,9 10,9 10,9 11,1 11,1 11,2 11,2 11,3
11,4 11,5 11,5 11,5 11,5 11,5

Calcule e interprete a média, a moda, a mediana e desvio padrão e o coeficiente de variação.

AMOSTRAGEM

De uma forma geral, as populações ou universos nos quais o pesquisador está interessado
são grandes demais para serem estudados na sua totalidade. O tempo necessário para estudar
PROBABILIDADE E ESTATÍSTICA
38
toda a população, as despesas e o número de pessoas envolvidas são de tal monta que tornam
o estudo proibitivo. Por isso, o mais comum é se estudarem amostras retiradas da população de
interesse. Para que os resultados obtidos em uma amostra possam ser generalizados para a
população, isto é, para que se possam realizar inferências válidas, a amostra deve ser
representativa da população. A melhor maneira de se obter uma amostra representativa é
empregar um procedimento aleatório para a seleção dos indivíduos.
Uma vantagem de se usarem amostras aleatórias é que, para este tipo de amostras,
existem inúmeros métodos estatísticos que poderão auxiliar o pesquisador. Na verdade, todas as
técnicas apresentadas neste texto pressupõem o uso de amostras aleatórias. Além disto, tal tipo de
amostragem não dá oportunidade ao pesquisador de escolher, mesmo de forma inconsciente, uma
amostra que favoreça a hipótese que ele gostaria de ver confirmada.

VANTAGENS DA AMOSTRAGEM EM RELAÇÃO AO CENSO


Quando estudamos todos os elementos de uma população, estamos realizando o que
denominamos censo. O IBGE, por exemplo, realiza periodicamente (de dez em dez anos) o censo
relativo a inúmeras características do Brasil; obtém dados a respeito da saúde, ensino, habitação,
produção vegetal e animal, prestação de serviços, etc., em todo o território nacional, pesquisando
todos os elementos da população.
O censo, porém, nem sempre pode ou deve ser utilizado, devido à impossibilidade de
estudar a população, por apresentar pouca precisão e em razão de seu custo econômico.

∆ Custo reduzido
Sendo os dados obtidos apenas de uma fração ao da população, as despesas são menores do que
as oriundas de um censo. Tratando-se de grandes populações, pode-se obter resultados
suficientemente precisos, para serem úteis, de amostras que representam apenas uma pequena
fração da população. Segundo COCHRAN (1977), nos Estados Unidos, os mais importantes
levantamentos periódicos, realizados pelo governo, usavam amostras de cerca de 100.000
pessoas, ou, aproximadamente uma pessoa em cada 1800.

∆ Maior rapidez
Os dados podem ser apurados e sintetizados mais rapidamente em uma amostragem do que em
uma contagem completa. Este é um fator primordial, quando se necessita urgentemente das
informações. O objetivo de uma investigação é o de conhecer a situação de um determinado
fenômeno, no momento da coleta da informação, para que de acordo com a informação obtida, se
possam tomar as medidas possíveis para resolver algum problema. Se o resultado dessa pesquisa
for conhecido muito tempo depois, é bem possível que a situação que se pretendia resolver, seja
nesse momento, completamente diferente da que existia no momento da coleta dos dados.

PROBABILIDADE E ESTATÍSTICA
39

∆ Maior amplitude e flexibilidade


Em certos tipos de investigação, tem-se que utilizar pessoal bem treinado e equipamento altamente
especializado, cuja disponibilidade é limitada para a obtenção de dados. O censo completo torna-
se impraticável e resta a escolha entre obter as informações por meio de uma amostra, ou não
consegui-las de todo. Dessa forma, os levantamentos que se fundamentam na amostragem tem
maior amplitude e flexibilidade.

∆ Maior exatidão
Em virtude de se poder empregar pessoal de melhor qualidade e intensivamente treinado, e por se
tornar exequível a supervisão mais cuidadosa do campo de trabalho e do processamento de dados,
dada a redução no volume de trabalho, portanto, uma amostragem pode, na realidade,
proporcionar resultados mais exatos que o censo.

∆ Não destruição da população


Finalmente, pode ser impraticável investigar toda a população em determinados procedimentos de
controle de qualidade. Por exemplo, se quisermos verificar a qualidade de uma marca de
fósforos, necessitaremos riscá-los a fim de verificar o seu funcionamento. Se inspecionarmos toda
a população de fósforos, riscando-os, acabaremos com a população, pois o processo de aferição
da qualidade do fósforo o destrói. Novamente, o estudo da população toma-se impraticável.

∆ Representatividade da amostra
Para que as conclusões da teoria de amostragem sejam válidas, as amostras devem ser
escolhidas de modo a serem representativas da população. Isso significa que a amostra deve
possuir as mesmas características básicas da população, no que diz respeito a (s) variável (eis)
que desejamos estudar. Plano de amostragem deve ser formulado para garantir a
representatividade.
Alguns procedimentos básicos para a obtenção de amostras aleatórias são apresentados a
seguir.

AMOSTRAGEM PROBABILÍSTICA
Note-se bem que o termo probabilístico se aplica a amostra escolhida de forma aleatória.
Por envolver o sorteio, a seleção independe do pesquisador e elimina-se a possível
tendenciosidade do mesmo.

PROBABILIDADE E ESTATÍSTICA
40
AMOSTRAGEM ALEATÓRIA SIMPLES
Uma amostra aleatória simples é aquela obtida de tal modo que todos os indivíduos da
população têm igual probabilidade de serem selecionados.
Para se obter uma amostra aleatória simples, atribui-se, inicialmente, um número de ordem a cada
elemento da população. A seguir, por meio de um dispositivo aleatório qualquer, seleciona-se ao
acaso a quantidade desejada de indivíduos. Um procedimento aleatório a ser utilizado pode ser
colocar em uma urna todos os números que serão submetidos ao sorteio, retirando depois alguns
às cegas. Pode-se ainda usar os números de loteria sorteados nos últimos anos, ou uma tabela de
números aleatórios, ou ainda programas de computador para selecionar aleatoriamente os
componentes da amostra.
Um ponto importante a salientar é que, usando este procedimento, nenhum indivíduo, por
ter esta ou aquela característica, terá oportunidade maior de ser escolhido, pois a escolha
independe da vontade do selecionador da amostra.

TABELA DE NÚMEROS ALEATÓRIOS


As tabelas de números aleatórios facilitam o processo de seleção de uma amostra aleatória.
Estas tabelas são formadas por sucessivos sorteios de algarismos do conjunto {0,1,2,...,9}, com
reposição. Uma destas tabelas encontra-se no apêndice, donde extraímos uma parte e
apresentamos a seguir. Os espaços colocados a cada dois valores servem, apenas, para facilitar a
visualização da tabela, não interferindo na sua utilização.

98 08 62 48 26 45 24 02 84 04 44 99 90 88 96 39 09 47 34 07 35 44 13 18 80
33 18 51 62 32 41 94 15 09 49 89 43 54 85 81 88 69 54 19 94 37 54 87 30 43
80 95 10 04 06 96 38 27 07 74 20 15 12 33 87 25 01 32 52 98 94 62 46 11 71

Exemplo. Com o objetivo de estudar algumas características dos funcionários de uma certa
empresa, vamos extrair uma amostra aleatória simples de tamanho cinco. A listagem dos
funcionários da empresa é apresentada a seguir.

POPULAÇÃO: funcionários da empresa


Aristóteles Anastácia Arnaldo Bartolomeu Bernardino Cardoso Carlito
Cláudio Ermílio Ercílio Ernestino Endevaldo Francisco Felício
Fabrício Geraldo Gabriel Getúlio Hiraldo João Joana
Joaquim José Josefina Mauro Paula Paulo

Para utilizar uma tabela de num dos aleatórios, precisamos associar cada elemento da
população a um número Por simplicidade, consideraremos números inteiros sucessivos, com a
mesma quantidade de algarismos, iniciando-se por 1 (um).

PROBABILIDADE E ESTATÍSTICA
41

Numeração dos elementos da população


01.Aristóteles 02.Anastácia 03.Arnaldo 04.Bartolomeu 05.Bernardino 06.Cardoso 07.Carlito
08.Cláudio 09.Ermílio 10.Ercílio 11.Ernestino 12.Endevaldo 13.Francisco 14.Felício
15.Fabrício 16.Geraldo 17.Gabriel 18.Getúlio 19.Hiraldo 20.João 21.Joana
22.Joaquim 23.José 24.Josefina 25.Mauro 26.Paula 27.Paulo

Para extrairmos uma amostra aleatória simples de tamanho n = 5, basta tomar cinco
números aleatórios do conjunto { 01,02,...,27}. Os funcionários associados aos números
selecionados formarão a amostra. Não existe forma específica de extrair os números da tabela.
Usaremos neste caso, a primeira linha, desprezando os valores que estiverem fora do conjunto
{ 01,02,...,27} e os valores que se repetem.
Números aleatórios extraídos da tabela  08 / 26 / 24 / 02 / 04

Amostra da população de funcionários  Cláudio / Paula / Josefina / Anastácia / Bartolomeu.

AMOSTRAGEM ALEATÓRIA ESTRATIFICADA


Às vezes, a população é constituída de subpopulações ou estratos e pode ser razoável
supor que a variável de interesse apresenta comportamento diferente nos distintos estratos. Neste
caso, para que uma amostra seja representativa, ela deve apresentar a mesma estratificação do
universo de origem. Para garantir que o procedimento aleatório produza uma amostra estratificada
adequada, deve-se:
1. Verificar quais os estratos presentes na população.
2. Calcular seus tamanhos relativos (proporções).
3. Determinar o tamanho dos estratos na amostra, observando estas mesmas proporções.
4. Obter aleatoriamente os elementos para cada estrato, ou sorteando dentro de cada estrato, ou
sorteando dentro da população e preenchendo os espaços reservados para cada estrato.

Exemplo. Deseja-se avaliar o número médio de cáries em escolares de 8 anos de certa escola.
Como parece razoável supor que esta variável depende do nível socioeconômico da criança, o
procedimento de amostragem escolhido é o de amostragem por estratos. Para tanto,
1. Verifica-se, inicialmente, quais os níveis socioeconômicos existentes nessa escola (suponha que
sejam três: A, B e C).
2. Avalia-se a participação relativa de cada um, por exemplo, o nível A abrange 3% da população, o
nível B 22% e o C 75%.
3. Determina-se então que, para uma amostra de 120 crianças, quatro deverão ser do nível A (pois
3% de 120 é 3,6), 26 do nível B e 90 do C.

PROBABILIDADE E ESTATÍSTICA
42
4. Sorteiam-se, aleatoriamente, quatro dentre as crianças do nível A, 26 do B e 90 do C. Ou
então realiza-se o sorteio diretamente do total de crianças da escola e preenchem-se as
subamostras conforme os indivíduos vão sendo selecionados. Caso seja sorteado um número que
corresponda a um aluno A e já tenham sido selecionadas quatro crianças para este estrato, o
número é desprezado e o sorteio prossegue.
Os extratos podem ser estabelecidos com base em variáveis qualitativas, como visto acima,
ou variáveis quantitativas; neste caso, os estratos são determinados com base em faixas de
valores, por exemplo, faixas etárias.

Exercício. Se uma população se encontra dividida em quatro estratos, com tamanhos N1 = 90,
N2 = 120, N3 = 60 e N4 = 480 e temos possibilidade de retirar no total 100 amostras, quantas
amostras devem ser retiradas de cada estrato?

12,16,8,64

Exercício.Numa sala de aula temos 36 homens e 28 mulheres. Faça uma amostragem


estratificada proporcional de tamanho 16 considerando o sexo como variável estratificadora
. Quantos de cada sexo serão analisados?

9,7

AMOSTRAGEM ALEATÓRIA SISTEMÁTICA


Se os elementos da população estão ordenados de alguma maneira (em listas, filas,
prateleiras, linhas de produção), é possível realizar uma amostragem sistemática, a qual é feita do
seguinte modo:
1. Escolhe-se uma constante conveniente.
2. Sorteia-se o primeiro indivíduo.
3. Evitam-se tantos indivíduos quantos forem indicados pela constante e toma-se o indivíduo
seguinte.
4. Repete-se o processo a partir do segundo passo até obter o tamanho amostral desejado.

PROBABILIDADE E ESTATÍSTICA
43
Exemplo. Em um hospital há 10 mil fichas de pacientes. Deseja-se uma amostra de 500
pacientes, isto é, 5% ou um a cada 20 indivíduos da população. O ponto de partida será uma ficha
selecionada aleatoriamente dentre as primeiras 20, por exemplo, a de número 9. A próxima a ser
retirada será a 29a, a seguinte a 49a, etc.
Nas amostras sistemáticas, deve-se estar atento para a possibilidade da variável em estudo
apresentar ciclos que se confundam com a constante utilizada na amostragem, o que poderia
invalidar os resultados do estudo.

Exercício. Uma população é composta por 2960 elementos que estão ordenados. Se devesse ser
retirada uma amostra sistemática de 20 elementos desta população, como você procederia?

AMOSTRAGEM ALEATÓRIA POR CONGLOMERADOS


Se a população apresenta-se subdividida em pequenos grupos ou conglomerados
(freqüentemente no espaço), é muitas vezes conveniente a realização da amostragem diretamente
nos conglomerados, do seguinte modo:
1. Identificam-se os conglomerados por meio de números de ordem.
2. Sorteiam-se os conglomerados.
3. Analisam-se todos os indivíduos pertencentes aos conglomerados sorteados.
Exemplo. Deseja-se fazer uma pesquisa de opinião em uma vila. Numeram-se os quarteirões, que
são os conglomerados, em um mapa. Sorteia-se uma determinada quantidade de quarteirões.
Todas as residências do quarteirão escolhido devem ser visitadas para obtenção dos dados
desejados.

AMOSTRAGEM NÃO PROBABILÍSTICA


Nos métodos não-probabilísticos, não temos conhecimento da probabilidade de escolha de
determinado elemento da amostra. Nesse caso, a seleção não utiliza o sorteio, o que acarreta a
sua subjetividade e a influência do pesquisador sobre que elementos da população farão parte da
amostra.

▪Inacessibilidade a toda a população: quando a amostra é retirada na parte da população que


nos é acessível. Surge aqui uma distinção entre população objeto e população amostrada. A

PROBABILIDADE E ESTATÍSTICA
44
população objeto é aquela que temos em mente ao realizar o trabalho estatístico. Apenas uma
parte dessa população, porém, está acessível para que dele retiremos a amostra. Essa parte é a
população amostrada.
Ex. Controle de qualidade numa linha de produção de cigarros. Só tem-se acesso aos cigarros que
já estão prontos, embora os que ainda serão produzidos fazem parte da população de cigarros
produzidos por aquela linha produção.

▪Amostragem a esmo ou sem norma: é a amostragem em que o amostrador para simplificar o


processo procura ser aleatório, sem realizar propriamente o sorteio, usando algum dispositivo
aleatório.
Ex. Amostrar 80 frangos num galpão com 3000 frangos, amostrar peixes em um lago, pessoas em
uma praia, etc.

▪População formada por material contínuo: nesse caso é impossível realizar amostragem
probabilística, devido à impraticabilidade de um sorteio rigoroso.
Ex: Processo utilizado para se amostrar líquidos, gases ou sólidos. Homogeniza-se o material a ser
amostrado e em seguida colhe-se a amostra.

▪Amostragem intencional: é aquela em que o amostrador deliberadamente escolhe certos


elementos para pertencer à amostra, por julgar tais elementos bem representativos da população.
Ex: Pesquisa de mercado para lançar uma nova marca de leite longa vida tipo A. O pesquisador
selecionará indivíduos com poder aquisitivo médio/alto, que são os principais consumidores deste
produto (público alvo), embora toda a população independentemente do poder aquisitivo possa ser
consumidora deste produto.

Exercício. Analise as situações descritas abaixo e decida se a pesquisa deve ser feita por
amostragem ou por censo, justificando sua resposta.
a) Numa linha de produção de empacotamento de remédio em uma indústria farmacêutica,
observar o peso especificado.
b) Em uma sala de aula composta por 40 alunos, analisar suas idades.
c) Observar se a água de uma lagoa está contaminada.
d) Verificar a carga horária diária de trabalho dos funcionários do PA de Alegrete.

Exercício. Identifique o tipo de amostragem utilizado.


a) Ao escalar um júri um tribunal de justiça decidiu selecionar aleatoriamente 4 pessoas brancas, 3
morenas, e 4 negras.

PROBABILIDADE E ESTATÍSTICA
45

b) Um cabo eleitoral escreve o nome de cada senador do Brasil, em cartões separados, mistura e
extraí 10 nomes.

c) Um administrador hospitalar faz uma pesquisa com as pessoas que estão na fila de espera para
serem atendidas pelo sistema SUS, entrevistando uma a cada 10 pessoas da fila.

d) Um médico está interessado em obter informação sobre o número médio de vezes em que
15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter uma
amostra n = 1.600.

e) Suponha que existem N = 1000 fichas de pacientes das quais uma amostra aleatória de
n = 20 deve ser selecionada. Determine que fichas devem ser escolhidas na amostra de tamanho
n = 20. Diga que tipo de amostragem deve ser feita e como foram selecionadas as fichas.

PROBABILIDADE

Processo ou Experimento Aleatório

Qualquer fenômeno que gere resultado incerto ou casual é chamado de Processo ou


Experimento Aleatório.
Exemplos:

1) Jogar uma moeda duas vezes e observar a seqüência obtida de caras e coroas;

2) Jogar um dado e observar o número mostrado na face superior;

3) Peso de Animais;

4) Número de filhos de um casal.

PROBABILIDADE E ESTATÍSTICA
46
Espaço Amostral (Ω)
Espaço amostral (Ω) é o conjunto de todos os resultados possíveis de um experimento
aleatório.

Exemplos: Obtenha o espaço amostral dos seguintes experimentos:


1) Jogar um dado e observar o resultado: Ω = {1, 2, 3, 4, 5, 6}.
2) Lançar uma moeda duas vezes e observar as faces obtidas;
3) Uma urna contém 10 bolas azuis e 10 brancas. 3 bolas são retiradas ao acaso e as cores são
anotadas;
4) Dois dados são lançados simultaneamente e estamos interessados na soma das faces
observadas;
5) Uma moeda é lançada consecutivamente até o aparecimento da 1ª cara;
6) Uma máquina produz 20 peças por hora. Ao final da primeira hora de produção, observa-se o nº
de defeituosas;
7) Medição do “tempo de vida” de uma lâmpada antes de se queimar.

Evento
Evento é qualquer subconjunto do espaço amostral.
Exemplos:
(a) Alguns eventos do experimento 1: A = {5}, B = {2, 4, 6}, etc.
(b) Alguns eventos do experimento 2:
Existem dois eventos especiais: espaço todo (Ω) e o conjunto vazio (∅).
Operações com Eventos
Sejam A e B dois eventos de um mesmo espaço amostral:
• O evento interseção de A e B, denotado A∩B, é o evento em que A e B ocorrem
simultaneamente.
• O evento união de A e B, denotado A∪B, é o evento em que A ocorre ou B ocorre (ou ambos).
• O evento complementar de A, denotado AC, é o evento em que A não ocorre.

EVENTOS COMPLEMENTARES
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra
(sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe
sempre a relação: p + q = 1  q = 1 – q
Assim, se a probabilidade de se realizar um evento é p = 1/5, a probabilidade de que ele não ocorra
é 4/5
Sabemos que a probabilidade de tirar o 4 no lançamento de um dado é p 1/6. Logo, a probabilidade
de não tirar o 4 no lançamento de um dado é 5/6.

PROBABILIDADE E ESTATÍSTICA
47
EVENTOS INDEPENDENTES
Dizemos que dois eventos são independentes quando a realização ou a não-realização de
um dos eventos não afeta a probabilidade da realização do outro e vice-versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do
resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de
realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é
dada por: p1 x p2

Exemplo:
Lançamos dois dados. A probabilidade de obtermos 1 no primeiro dado é p1 = 1/6
A probabilidade de obtermos 5 no segundo dado é p2 = 1/6
Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo é:
p = p1 x p2 = 1/6 x 1/6 = 1/36

Eventos Particulares

Se E = S, E é chamado evento certo ou seja evento que possui os mesmos elementos do espaço
amostral.
Ex: a soma dos resultados de dois dados é menor ou igual a 12.

Se E C S e E é um conjunto unitário, E é chamado evento elementar.


Ex: a soma do resultado em 2 dados é igual a 12. E = {(6,6)}

Se E = Ø, E é chamado evento impossível.


Ex: o número de um dado é igual a 7.
Exercícios
1. Um dado não viciado é lançado e a face superior é observada. Se o resultado for par, você
ganhará R$ 10,00. Se for ímpar você perderá R$ 10,00. Qual a probabilidade de você vencer?

2. Considere o experimento de lançar 2 moedas viciadas (seus Ponto amostral Probabilidade


resultados não são equiprováveis). As probabilidades estão no cara/cara 4/9
quadro abaixo. Determine; cara/coroa 2/9
a) A probabilidade de obter uma cara;
Coroa/cara 2/9
Coroa/coroa 1/9

PROBABILIDADE E ESTATÍSTICA
48
b) A probabilidade de obter pelo menos uma cara.

3. O espaço amostral para um experimento contém 4 pontos Ponto amostral Probabilidade


com as probabilidades mostradas na tabela. Determine a 1 0,05
probabilidade de cada um dos seguintes eventos. 2 0,20
A: {ocorre qualquer um de 1, 2 ou 3} 3 0,30
B: {qualquer um de 1, 3 ou 5} 4 0,30
C: {4 não ocorre} 5 0,15

4. Dois dados são lançados e a face de cada lado é observada. Determine a probabilidade:
A: {aparecer 3 em cada lado}
B: {a soma dos dois números mostrados ser 7}
C: {os dois números serem iguais}

5. Assaltos contra trabalhadores do correio. Uma amostra de 12000 trabalhadores do correio, 600
foram assaltados no trabalho no último ano. Estime a probabilidade de que um trabalhador dos
correios não seja assaltado no trabalho durante o ano.

6. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e


uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do
segundo ser o 5 de paus?

7. Falhas no sistema de gerência. Um resumo dos principais Sistema de Número de


causas dos 83 acidentes causados por falhas no sistema de gerência acidentes
gerência é reproduzido pela tabela. Engenharia e 27
a) Determine e interprete a probabilidade de um acidente projeto
industrial seja causado por engenharia e projetos defeituosos. Procedimentos 24
b) Determine e interprete a probabilidade de que um acidente e práticas
industrial seja causado por alguma outra coisa diferente de Gerência e 22
procedimentos e práticas defeituosas. supervisão
Treinamento e 10
comunicação
Total 83

8. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.

PROBABILIDADE E ESTATÍSTICA
49

9. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2
pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de
cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas
serem, respectivamente, branca, preta e verde?

10. De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual a
probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus?

11. Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52
cartas?

12. Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de
um baralho de 52 cartas?

13. No lançamento de um dado, qual a probabilidade de se obter um número não-inferior a 5?

14. São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma dama e um rei, não
necessariamente nessa ordem?

15. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior
que 10.

Definição Clássica de Probabilidade


Dado um conjunto de N eventos equiprováveis, a probabilidade de ocorrência de um
determinado evento A, é dado pela razão
n
P(A) =
N
onde n é o número de elementos em A e N é o número de elementos em Ω.
PROBABILIDADE E ESTATÍSTICA
50

Exemplo: Considere o lançamento de uma moeda equilibrada, nesse caso o espaço amostral
associado é Ω = {Cara, Coroa}. Então, pela definição clássica, a probabilidade de ocorrência do
1
evento “cara” é P(cara) =
2

Definição Moderna de Probabilidade


Probabilidade é uma função P(.), que associa a cada evento do espaço amostral Ω, um número
real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:
(1) 0 ≤ P(A) ≤ 1.
(2) P(Ω) = 1.
(3) Se A e B são eventos mutuamente exclusivos: P(A∪B) = P(A) + P(B).

Probabilidade Condicional

A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade


de um evento A ocorrer sabendo que um evento B já ocorreu.
Sejam A e B dois eventos associados a um mesmo espaço amostral Ω. Denota-se por P(A |
B) a probabilidade condicionada do evento A, quando o evento B tiver ocorrido.
Sempre que calculamos P(A | B), estamos essencialmente calculando P(A) em relação ao
espaço amostral reduzido devido a B ter ocorrido, em lugar de fazê-lo em relação ao espaço
amostral original Ω.

Definição (Probabilidade Condicional): Dados dois eventos A e B, a probabilidade condicional de


A dado que ocorreu B é representada por P(A | B) e definida por
P(A  B)
P(A | B) = , P(B) > 0
P( B)

Exemplo: Totais de alunos das exatas são 200. No Curso de Estatística são 20 mulheres e 10
homens. Dado que um estudante, escolhido ao acaso, esteja matriculado no curso de Estatística, a
probabilidade de que seja mulher é de 20/30 = 2/3. Escrevemos
2
P(mulher | Estatística) =
3
Para o exemplo mencionado, se A e B, sendo P(B) > 0, definimos a probabilidade
condicional de A dado B, P(A | B), como sendo
P(A  B)
P(A | B) =
P( B)

Para o exemplo mencionado, se B e A indicam, respectivamente, os eventos “aluno


matriculado em Estatística” e “aluno é mulher”, então

PROBABILIDADE E ESTATÍSTICA
51
20 / 200 2
P(A | B) = 
30 / 200 3
Da definição de probabilidade condicional, obtemos a regra do produto de probabilidades.
P(A ∩ B) = P(B)P(A | B)

EXERCÍCIOS
01. Registros hospitalares mostram que 12% de todos os pacientes são admitidos para tratamento
cirúrgico, 16% são admitidos para obstetrícia e 2% para ambos. Se um novo paciente é admitido no
hospital, qual a probabilidade de ele seja admitido para cirurgia, para obstetrícia ou para ambos?

02. Considere o quadro a seguir, representativa da distribuição da renda anual de produtores rurais
e duas cooperativas em uma determinada região.

Observando-se os dados acima, se verifica que a probabilidade de um cooperado aleatoriamente


escolhido ser:
a) da cooperativa A. R: 0,575
b) da cooperativa B. R: 0,425
c) de ter renda entre R$ 15.000,00 e R$ 20.000,00. R: 0,550
d) da cooperativa B e ter renda entre R$ 15.000,00 e R$ 20.000,00. R: 0,20
e) ter renda entre R$ 15.000,00 e R$ 20.000,00 dado que é da cooperativa B. R: 0,4706

03. As probabilidades de três vendedores, A, B e C, que trabalham independentemente, efetivarem


uma venda quando abordam um cliente são 2/3, 4/5 e 7/10, respectivamente. Se cada um abordar
um cliente, qual a probabilidade de que pelo menos um efetive a venda? R: 0,98

04. A e B são dois mestres que já estão suficientemente treinados em partidas de xadrez e jogam
120 partidas, das quais A ganha 60, B ganha 40, e 20 terminam empatadas. A e B concordam em
jogar três partidas. Determinar a probabilidade de:
a) A ganhar todas as três partidas; R: 0,125
b) duas partidas terminarem empatadas; R: 0,0694
c) A e B ganharem alternadamente. R: 0,1388

PROBABILIDADE E ESTATÍSTICA
52
05. Num período de um mês, cem funcionários de uma empresa que trabalha com resíduos
nucleares, sofrendo de determinada doença, foram tratados. Informações sobre o método de
tratamento aplicado a cada funcionário e o resultado final obtido estão no quadro abaixo:

Sorteando-se aleatoriamente um desses funcionários, determine a probabilidade de que o


funcionário escolhido:
a) tenha sido submetido ao tratamento A; R: 0,6
b) tenha sido totalmente curado; R: 0,4
c) tenha sido submetido ao tratamento A e tenha sido parcialmente curado; R: 0,24
d) tenha sido submetido ao tratamento A ou tenha sido parcialmente curado. R: 0,76

06. Num teste com duas marcas que lhe são apresentadas em ordem aleatória, um experimentador
de vinhos faz três identificações corretas em três tentativas.
a) Qual a probabilidade de isso ocorrer, se na realidade ele não possui habilidade alguma para
distingui-los? R: 1/8
b) E se a probabilidade de distinguir corretamente é de 90% em cada tentativa? R: 0,9*0,9*0,9 =
0,729

Teorema de Bayes
Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo
Teorema de Bayes. Thomas Bayes (1702 - 1761) afirmou que as probabilidades devem ser revistas
quando conhecemos algo mais sobre os dados. A versão mais simples desse teorema é dada pela
fórmula
P ( A  B ) P ( A).P ( B | A)
P(A | B) = 
P( B) P( B)

A forma geral do Teorema de Bayes pode ser introduzida da seguinte forma:


Considere a seqüência {C1, C2, ..., Cn} como sendo uma partição do espaço amostral Ω, isto é,
Ci ∩ Cj =  sempre que i ≠ j e C1 ∪ C2 ∪ ... ∪ Cn = Ω.
Considere um evento qualquer A em Ω. Suponha que sejam conhecidas as probabilidades de cada
partição (P(Ci)) e as probabilidades condicionais P(A | Ci).

Logo, temos o seguinte teorema:

PROBABILIDADE E ESTATÍSTICA
53
Teorema: A probabilidade de ocorrência do evento Ci, supondo a ocorrência do evento A, é
dado por

P(Ci).(A | Ci)
P(Ci | A) = n


j1
P(Cj).(A | Cj)

para todo i = 1, 2, ..., n.

Curiosidade

O teorema de Bayes, que aparentemente poderia ser encarado como mais um resultado na teoria
de probabilidades, tem importância fundamental, pois fornece a base para uma abordagem da
inferência estatística conhecida como inferência bayesiana.
Como estamos falando do Thomas Bayes, não podemos deixar de fazer um breve comentário
sobre o que chamamos de probabilidades subjetivas, ou seja, cada indivíduo, baseado em
informações anteriores e na sua opinião pessoal a respeito de um evento em questão, pode ter
uma resposta para a probabilidade desse evento. A inferência Bayesiana toma como uma de suas
bases o fato de que todas as probabilidades são subjetivas. O teorema de Bayes tem um papel
importante nesse tipo de inferência, pois passa a ser visto como um mecanismo de atualização de
opiniões, ou seja, o indivíduo aprende B e passa a ter opinião P(A|B) sobre A. As probabilidades
associadas a eventos de modo subjetivo têm propriedades análogas as que foram mencionadas
nesse texto.
Exemplo:
Níveis Históricos de Qualidade de Dois Fornecedores
% de Peças Boas % de Peças Ruins
Fornecedor 1 98 2
Fornecedor 2 95 5

Considere uma empresa fabricante que recebe embarques de peças de dois diferentes
fornecedores. Atualmente, 65% das peças compradas pela empresa são do fornecedor 1 e o
restante, 35%, são do fornecedor 2. Dado que uma peça selecionada seja defeituosa, qual a
probabilidade dela ter vindo do fornecedor 2?

P(D | F2) P(F2) P(D | F2) P(F2) 0,05.0,35 0,0175


P(F2 | D)      0,57
P( D) P(D | F1) P(F1)  P(D | F2) P(F2) 0,02.0,65  0,05.0,35 0,0305

Exercício
01. Em um centro de máquinas, há quatro máquinas automáticas de parafusos. Uma análise
dos registros de inspeção passados fornece os seguintes dados:

PROBABILIDADE E ESTATÍSTICA
54
Máquina Percentual de Produção Percentual de Defeitos Produção
1 15 4
2 30 3
3 20 5
4 35 2

Suponha que o estoque atual reflita as porcentagens de produção indicadas. Se um parafuso é


selecionado aleatoriamente do estoque e ele é defeituoso, qual é a probabilidade de que seja da
máquina 2?

VARIÁVEL ALEATÓRIA DISCRETA ( APARTIR DAQUI 2° PROVA )


Exemplos
1. Lança-se uma moeda 10 vezes e anota-se o número de caras. Este número pode ser 0, 1,
2,...,10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um
determinado produto. O número de pessoas que compram o produto varia de 0 a 200.
3. Conta-se o nº de acidentes que ocorrem em uma rodovia num feriado prolongado. O número de
acidentes em questão pode ser: 0, 1, 2… Como não temos um valor que limite esse número,
supomos que o número de acidentes é qualquer inteiro não negativo.
4. Número de chamadas telefônicas que chegam a uma central em um intervalo de tempo.

Introdução
Vamos incorporar o conceito de probabilidade ao estudo de variáveis associadas a características
em uma população. Muitos experimentos produzem resultados não numéricos. Antes de analisá-
los, é conveniente transformar seus resultados em números. Isto é feito através da variável
aleatória que é uma função que associa um valor numérico a cada ponto do espaço amostral.
Para entender melhor o conceito, considere o seguinte exemplo.

Exemplo: Observa-se o sexo das crianças em famílias com três filhos. O espaço amostral é Ω=
{(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM), (FFF)}
Uma variável aleatória de interesse é: X = {Número de crianças do sexo masculino}. A cada evento
simples, ou ponto de Ω, associamos um número, que é o valor assumido pela variável aleatória X:

Evento MMM MMF MFM FMM MFF FMF FFM FFF


X 3 2 2 2 1 1 1 0

Poderíamos também ter considerado o nº. de crianças do sexo feminino. Os valores de X, na


mesma ordem, seriam então 0, 1, 1, 1, 2, 2, 2, 3.
Obs: A expressão “variável aleatória” será abreviada por “v.a.”.

PROBABILIDADE E ESTATÍSTICA
55

Definição: uma v.a. é discreta quando o conjunto de valores possíveis for finito ou infinito
numerável.
Exemplos: Número de filhos, Número de bactérias numa lâmina, número de lâmpadas em uma
residência, etc.
O passo fundamental para entendermos uma v.a. discreta é associar a cada valor a sua
probabilidade, obtendo o que se chamamos de distribuição de probabilidade.
X x1 X2 ... xn
P(X = x) P(X = x1) P(X = x2) ... P(X = xn)

A função de probabilidade (P(.)) deve satisfazer: 0 ≤ P(X = xi) ≤ 1 p/ ∀ xi e Σn i = 1 P(X = xi) = 1

Exemplo: Certo departamento da UNIPAMPA é formado por 35 professores, sendo 21 homens e


14 mulheres. Uma comissão de 3 professores será constituída, sorteando-se, ao acaso, três
membros do departamento. Qual a probabilidade da comissão ser formada por pelo menos duas
mulheres?

Seja X = {nº. de mulher na comissão}

Função de Distribuição Acumulada

A função de distribuição acumulada nos dá uma maneira de descrever como as probabilidades são
associadas aos valores ou aos intervalos de valores de uma variável aleatória.

Definição: A função de distribuição acumulada de uma variável aleatória X é uma função que a
cada número real x associa o valor:

A notação [X ≤ x] é usada para designar o conjunto , isto é, denota a imagem


inversa do intervalo pela variável aleatória X.

O conhecimento da função de distribuição acumulada é suficiente para entendermos o


comportamento de uma variável aleatória. Mesmo que a variável assuma valores apenas num
subconjunto dos reais, a função de distribuição é definida em toda a reta. Ela é chamada de função
de distribuição acumulada, pois acumula as probabilidades dos valores inferiores ou iguais a x.

Exemplo: vamos encontrar a função distribuição acumulada de X: "número de caras obtidas nos
três lançamentos".

PROBABILIDADE E ESTATÍSTICA
56
Os valores que X pode assumir são: 0, 1, 2 e 3.

Assim temos que a função de distribuição acumulada de X é dada por

VARIÁVEL ALEATÓRIA CONTINUA

Definição: Seja X uma variável aleatória. Suponha que o contradomínio ( ) de X seja um


intervalo ou uma coleção de intervalos. Então diremos que X é uma variável aleatória contínua.

Os exemplos abaixo ajudam a ilustrar esse conceito.

Exemplo: Uma válvula eletrônica é instalada em um circuito, seja X o período de tempo em a


válvula funciona.

Neste caso, X é uma variável aleatória contínua podendo tomar valores nos reais positivos, ou seja,
o subconjunto dos números reais .

Exemplo: Um navio petroleiro sofre um acidente o qual seu casco é rompido e o óleo é derramado
seja Y a variável aleatória que determina a área atingida pelo óleo do navio.

Neste caso, temos que a variável Y é uma variável continua a qual também assume valores em no
subconjunto dos números reais .

Definição: Seja X uma variável aleatória contínua. A função densidade de probabilidade f, indicada
abreviadamente por fdp, é uma função que satisfaz às seguintes condições:

1. , para todo

PROBABILIDADE E ESTATÍSTICA
57

2.

Além disso, definimos para qualquer , c < d,

Vale a pena notar que da forma como a probabilidade foi definida a probabilidade de um ponto

isolado é sempre zero, ou seja, . Desta forma podemos concluir que


quando X é uma variável aleatória continua a probabilidade de ocorrer um valor especifico é zero.

EXERCÍCIOS
01. Um dado não viciado é lançado e a face superior é observada. Se o resultado for par, você
ganhará R$ 10,00. Se for ímpar você perderá R$ 10,00. Qual a probabilidade de você vencer?

02. Considere o experimento de lançar 2 moedas viciadas (seus Ponto amostral Probabilidade
resultados não são equiprováveis). As probabilidades estão no cara/cara 4/9
quadro abaixo. cara/coroa 2/9
Determine; a) A probabilidade de obter exatamente uma cara.
coroa/cara 2/9
b) A probabilidade de obter pelo menos uma cara.
coroa/coroa 1/9

03. Você tem um capital para investir em 2 dos 4 empreendimentos. Você não sabe, mas 2
empreendimentos vão eventualmente falhar e 2 serão bem sucedidos. Você estuda os 4
empreendimentos e decide ao acaso por dois deles. Qual a probabilidade de você selecionar pelo
menos um bem sucedido? R: 5/6

04. O espaço amostral para um experimento contém 4 pontos Ponto amostral Probabilidade
com as probabilidades mostradas na tabela. Determine a 1 0,05
probabilidade de cada um dos seguintes eventos. 2 0,20
A: {ocorre qualquer um de 1, 2 ou 3} 3 0,30
B: {qualquer um de 1, 3 ou 5} 4 0,30
C: {4 não ocorre} 5 0,15

PROBABILIDADE E ESTATÍSTICA
58
05. Dois dados são lançados e a face de cada lado é observada. Determine a probabilidade:
A: {aparecer 3 em cada lado}
B: {a soma dos dois números mostrados ser 7}
C: {os dois números serem iguais}

06. Assaltos contra trabalhadores do correio. Uma amostra de 12000 trabalhadores do correio, 600
foram assaltados no trabalho no último ano. Estime a probabilidade de que um trabalhador dos
correios não seja assaltado no trabalho durante o ano.

07. Falhas no sistema de gerência. Um resumo dos Sistema de gerência Número de


principais causas dos 83 acidentes causados por acidentes
falhas no sistema de gerência é reproduzido pela Engenharia e projeto 27
tabela. Procedimentos e 24
a) Determine e interprete a probabilidade de um práticas
acidente industrial seja causado por engenharia e Gerência e supervisão 22
projetos defeituosos.
Treinamento e 10
b) Determine e interprete a probabilidade de que
comunicação
um acidente industrial seja causado por alguma
Total 83
outra coisa diferente de procedimentos e práticas
defeituosas.

08. Investimentos em ações. De uma lista de ações (E1, E2, E3, E4, E5) recomendadas pelo
seu corretor, você vai selecionar 2 para investir. Qual a probabilidade de que você escolha E2 e
E3?

Pelos exemplos que acabamos de ver, podemos concluir que, sendo n(S) = n:
A. a probabilidade do evento certo é igual a 1:P(S) = 1
B. a probabilidade do evento impossível é igual a zero: P(Ø) = 0
C. a probabilidade de um evento E qualquer (E C S) é um número real P(E), tal que: 0  P(E)  1
D. a probabilidade de um evento elementar E qualquer é, lembrando que n(E) = 1: P(E) = 1/n

MODELOS MATEMÁTICOS
Tipos de Modelos
Modelo Empírico  é formado pelos dados registrados pelo pesquisador.

PROBABILIDADE E ESTATÍSTICA
59
Modelo Teórico o pesquisador procura uma fórmula matemática a qual os dados se ajustem.
Conhecendo as propriedades desta fórmula podemos conhecer o comportamento de certos
fenômenos.
DISTRIBUIÇÃO BINOMIAL
Existem muitos problemas aplicados em que estamos interessados na probabilidade de que
um evento vá ocorrer x vezes a cada n tentativas. Por exemplo, podemos estar interessados na
probabilidade de obter 45 respostas a 400 questionários distribuídos como parte de um estudo
sociológico, a probabilidade de 5 em 12 ratos sobreviverem por determinado prazo após a injeção
de uma substância cancerígena, a probabilidade de 45 em 300 motoristas retidos numa barreira de
trânsito estarem usando seus cintos de segurança, ou a probabilidade de 66 em 200 telespectado-
res entrevistados por um serviço de medição de audiência lembrarem quais produtos foram anun-
ciados num determinado programa. Utilizando a linguagem dos jogos de azar, poderíamos dizer,
em cada um desses exemplos, que estamos interessados na probabilidade de obter "x sucessos
em n provas" ou, em outras palavras, "x sucessos e n – x fracassos em n tentativas."
Se p e 1 – p são as probabilidades de um sucesso e de um fracasso numa dada prova
qualquer, então a probabilidade de obter x sucessos e n – x fracassos numa determinada ordem é
px.(1 – p)n-x. Claramente, nesse produto de p com (1 – p) há um fator p para cada sucesso e um
fator 1 – p para cada fracasso e os x fatores p e os n – x fatores 1 – p são todos multiplicados entre
si em decorrência da generalização da regra especial de multiplicação para dois ou mais eventos
independentes. Como essa probabilidade se aplica a qualquer ponto do espaço amostral que
represente x sucessos e n – x fracassos (em alguma ordem determinada), é suficiente contar
quantos desses pontos há e multiplicar esse número por
px(1 – p)n-x . Claramente, o número de maneiras em que podemos escolher x provas em que
n 
devem ocorrer os sucessos é   , e assim chegamos ao resultado seguinte. A probabilidade de
x

obter x sucessos em n provas independentes é:

n 
f( x ) = x . px . (1 – p)n-x para n = 0, 1, 2, ..... ou n
 
OBS:

EXERCÍCIOS
01. Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que
contém 12 peças. Calcule a probabilidade de um cliente comprar uma caixa contendo:
a) nenhuma peça defeituosa. R: 0,2824
b) uma peça defeituosa. R: 0,3766
PROBABILIDADE E ESTATÍSTICA
60

02. A probabilidade de um funcionário das Metalúrgicas Bigorna Ltda. ser promovido a gerente com
menos de cinco anos de trabalho na empresa é igual a 7,5%. Calcule a probabilidade de, em grupo
de seis funcionários novos:
a) nenhum ser promovido a gerente; R: 63%
b) pelo menos um ser promovido; R: 37%
c) todos serem promovidos. R: Aprox. zero

03. Se 7% das lâmpadas de certa marca são defeituosas, achar a probabilidade de que, numa
amostra de 100 lâmpadas, escolhidas ao acaso, tenhamos:
a) nenhuma defeituosa? R: 0,0007
b) três defeituosas? R: 0,048
c) mais do que uma defeituosa? R: 0,994

04. Uma empresa comercial calcula que 5% de suas vendas não são recebidas, em função do
recebimento de cheques sem fundos. Ao se analisar uma amostra formada por oito vendas, qual a
probabilidade de:
a) todas serem pagas normalmente? R: 66%
b) uma ou duas vendas, apenas, serem pagas? R: Aprox. zero
c) pelo menos três vendas serem pagas normalmente? R: Aprox. 100%
d) todas as vendas não serem pagas? R: Aprox. zero

05. A probabilidade de uma determinada construtora vencer licitações é aproximadamente igual a


54% . Em seis licitações, qual a probabilidade de essa empresa:
a) perder todas; R: 0,9%
b) vencer apenas uma; R: 6,7%
c) vencer pelo menos uma; R: 99,1%
d) perder três licitações. R: 31%

06. Um estudo na área da Medicina Ocupacional (MO) revelou que um em cada quatro motoristas
de ônibus apresentava algum grau de lombalgia. Tomando para uma experiência um grupo de 12
motoristas, quais são as chances de:
a) nenhum apresentar lombalgia; (R: 0,03168)
b) menos de 2 manifestarem a doença; (R: 0,1584)
c) mais de 4 apresentarem a doença. (R: 0,1576)

07. Dos trabalhadores de uma indústria 41 % fumam cigarro. Escolhem-se seis ao acaso para
darem uma opinião sobre o fumo. Determine a probabilidade de:
a) nenhum dos seis ser fumante. (R: 0,0422)

PROBABILIDADE E ESTATÍSTICA
61
b) todos os seis fumarem. (R: 0,48)
c) ao menos a metade dos seis ser fumante. (R: 0,4765)

TESTES ADICIONAIS
01. Uma empresa envia 5 propostas para seus clientes e, historicamente, sabe-se que a
probabilidade da proposta se converter em um contrato é de 40%. Determine:
a) a probabilidade da empresa fechar ao menos um contrato; R: 92%
b) a probabilidade da empresa fechar entre 2 e 4 contratos (inclusive); R: 65%
c) a probabilidade da empresa não fechar nenhum contrato. R: 8%

02. As linhas telefônicas de um sistema de reservas de uma Cia. Aérea estão ocupadas 35% do
tempo. Considere que 10 chamadas aconteçam.
a) Qual é a probabilidade de que, para exatamente 3 chamadas, as linhas estejam ocupadas?
R: 25,2%
b) Qual é a probabilidade de que, para no mínimo uma chamada, as linhas estejam ocupadas?
R: 98,7%
c) Qual é a probabilidade de haver mais de cinco chamadas não atendidas em função das linhas
estarem todas ocupadas? R: 9,5%

03. Uma empresa recebe um carregamento com 20 itens. Como a inspeção individual de cada item
é muita cara, há uma orientação de se verificar aleatoriamente uma amostra de apenas 6 itens,
aceitando-se o lote se não houver mais do que um item defeituoso. Qual é a probabilidade de que
um lote com cinco itens defeituosos seja aceito? R: 1,5%

04. O maior número de reclamações dos proprietários de automóveis com dois anos de uso se
referem ao desempenho do sistema elétrico. Considere que um questionário anual, enviado aos
proprietários de mais de 300 marcas e modelos de automóveis, revelou que 10% dos proprietários
de automóveis com dois anos de uso encontraram pontos com problemas no sistema elétrico, que

incluíam o motor de arranque, o alternador, a bateria, controles diversos, luzes e radio. Qual a
probabilidade de que uma amostra de 12 proprietários de automóveis com dois anos ter:
a) exatamente dois proprietários com problemas no sistema elétrico. R: 23%
b) pelo menos dois proprietários com problemas no sistema elétrico. R: 34%

05. Suponha que a probabilidade de que um item produzido por uma máquina seja defeituoso é de
0,2. Se 4 itens são produzidos por esta máquina são selecionados ao acaso, qual a probabilidade
de que não mais do que um item defeituoso seja encontrado? R:82%

PROBABILIDADE E ESTATÍSTICA
62
DISTRIBUIÇÃO DE POISSON
Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo. A
probabilidade da ocorrência de um sucesso no intervalo é proporcional ao intervalo. A
probabilidade de mais de um sucesso nesse intervalo é bastante pequena com relação à
probabilidade de um sucesso.
Seja X o número de sucessos no intervalo, então:

e   .x
P(X  x) 
x! onde  é a media.

A variável X assim definida tem distribuição de Poisson.


A distribuição de Poisson, além da utilização para o cálculo aproximado da distribuição binomial
tem vasta aplicação em problemas de fila de espera, controle de estoques, controle de qualidade,
programação de equipamentos, número de relatórios de acidentes enviados a uma seguradora em
uma semana, etc.

Principais características:
 Média : E(X)  

 Variância : Var(X)  

OBS: Muitas vezes, no uso da binomial, acontece que n é muito grande e p é muito pequeno.

  np
Podemos então fazer uma aproximação de binomial pela distribuição de Poisson, fazendo:

Exemplos
(0,72)x . e - 0,72
01. A função probabilidade de Poisson é dada por: P(X = x) = . Calcule em cada caso:
x!

a) P(X = 0)
b) P(X = 1)
c) P(X = 2)
02. O número de reclamações do tipo X que uma empresa recebe por dia é uma variável aleatória
que segue a distribuição de Poisson, com média de 5 reclamações.
a) Qual a probabilidade de que, num dia, ele receba 3 reclamações? R: 14%
b) Qual a probabilidade do laboratório receber menos que 3 reclamações num dia? R: 12,4%
c) Qual a probabilidade de receber mais de uma reclamação? R: 95,8%

03. Supondo que o número de carros que chegam a fila de guichê de um pedágio tem distribuição
de Poisson a uma taxa de 3 por minuto, calcule a probabilidade de que cheguem cinco carros nos
próximos 2 minutos. R: 16%
PROBABILIDADE E ESTATÍSTICA
63

04. Um tear produz um defeito a cada 200m de tecido produzido. Se o número de defeitos admite
uma distribuição de Poisson, calcule a probabilidade de:
a) uma peça com 20m não apresente defeitos. R: 0,9048
b) um lote de 10 peças de 20m cada, apresentar exatamente um defeito. R: 0,3679

05. Todos os 10 funcionários de uma empresa esperam contar com a seguridade social para o
rendimento na aposentadoria. O que se percebe realmente é que 22% dos trabalhadores
cadastrados no INSS obtém este benefício integralmente. Assim, calcule a probabilidade:
a) de que apenas 5 destes funcionários consigam o benefício integral. R: 4,76%
b) de que no máximo 2 indivíduos consigam a aposentadoria integral. R: 62%
c) de que no mínimo 2 funcionários consigam o benefício integral. R: 65%

06. Uma empresa vendedora de carros usados tem suas vendas distribuídas de acordo com a
distribuição de Poisson. Sabendo-se que a empresa vende em média 6 carros por
mês(considerando o mês com 30 dias de trabalho) e analisando-se uma quinzena de vendas, qual
a probabilidade de a empresa vender:
a) apenas 3 carros? R: 22,4% b) nenhum carro? R: 4,97%

07. Um gerente de suprimentos estuda o dimensionamento ideal de estoques para uma


determinada indústria. A demanda é medida em contêineres por dia e segue aproximadamente,
uma distribuição de Poisson, com lambda igual a quatro contêineres por dia. Em um determinado
dia, qual a probabilidade de serem demandados: a) dois contêineres? b) pelo menos dois
contêineres? c) no máximo três contêineres? R: 14,6% / 90,8% / 43,3%

08. A central de atendimentos de uma operadora de cartões de crédito recebe denúncias de roubo
de cartões à razão de quatro ligações por hora, no período matutino, em dias úteis. O número de
ligações recebidas pode ser aproximado por uma distribuição de Poisson. Pede-se: a) quantas
chamadas são esperadas num período de 30 minutos? R: 2 b) qual a probabilidade de não
ocorrer nenhuma chamada num período de 30 minutos? R: 13,5% c) qual a probabilidade de
ocorrerem ao menos duas chamadas no mesmo período? R: 59,3%

09. A aplicação de pintura metálica em chapas de zinco com 3 m2 é feita automaticamente e pode
produzir defeitos de acordo com uma variável aleatória que segue uma distribuição de Poisson com
parâmetro λ = 0,5 defeitos por m2. Se uma chapa for sorteada ao acaso, qual a probabilidade de:
a) encontrarmos pelo menos um defeito? R: 77,7%
b) encontrarmos exatamente dois defeitos? R: 25,1%

PROBABILIDADE E ESTATÍSTICA
64
10. Uma rodovia registra um total de oito acidentes por ano, em média., Qual a probabilidade de
que em um determinado ano apenas três acidentes sejam verificados? R: 3%

11. Um caixa rápido atende a clientes à razão de dois por minuto. Em um intervalo de dez minutos,
Calcule a probabilidade de serem atendidos: a) 20 clientes; R: 9% b) 21 clientes; R: 8,4%
c) 18 clientes. R: 8,4%

12. A área de controle de qualidade de uma fábrica de tapetes artesanais costuma verificar a
existência de duas manchas por metro quadrado produzido, em média. Qual a probabilidade de
aparecerem oito defeitos em um tapete com dimensões iguais a 3 x 3 m? R: 0,4%

13. O departamento de logística de uma fábrica de fertilizantes despacha pedidos à razão de 3,5
por hora. Determine a probabilidade de ele despachar, no máximo, um único pedido em um
intervalo de uma hora. R: 13,6%

14. Uma central telefônica costuma registrar uma média de 300 telefonemas por hora. Qual a
probabilidade que em um minuto não haja nenhum chamado? R: 0,7%

15. O número de falhas em um fio delgado de cobre segue distribuição de Poisson, com média
igual a 2,3 falhas/mm. Determine:
a) a probabilidade de existir exatamente 2 falhas em um milímetro de fio; R: 26,5%
b) a probabilidade de haver 10 falhas em cada 5 milímetros; R: 11,3%

DISTRIBUIÇÃO NORMAL DE PROBABILIDADE


A distribuição normal também é conhecida como distribuição de Gauss. É um dos mais
importantes modelos de probabilidade para variáveis aleatórias contínuas, sendo aplicado em
vários fenômenos e muito utilizado no desenvolvimento teórico na área de inferência estatística.
Se coletássemos os dados quanto ao peso de 1000 indivíduos, encontraríamos diversos
valores dos quais haveria pequena quantidade de baixos e altos, e grande quantidade em torno
dos valores centrais.

PROBABILIDADE E ESTATÍSTICA
65

Numa representação, o gráfico dos dados obtidos, encontraríamos uma distribuição normal,
conforme figura acima.
A distribuição normal se caracteriza por reunir um grande número de valores em torno da
média, que diminuem gradualmente de frequência à medida que se afastam dela.
A curva em forma de sino, que engloba o total de frequências ou 100%, é simétrica e
unimodal: a média, a moda e a mediana coincidem.
Os elementos mais importantes nesta distribuição são a média e o desvio padrão. A média
nos dá uma ideia da magnitude dos valores e de qual é o centro da distribuição. O desvio padrão
nos indica a dispersão dos valores em torno da média. A um menor desvio padrão corresponde
uma curva mais elevada em sua parte central, indicando maior concentração de frequências em
seu ponto médio.

RESUMINDO
68,2%  Média ± 1 DP
95,4%  Média ± 2 DP
99,6%  Média ± 3 DP

Exemplo:
Seja X a variável aleatória que representa os diâmetros
dos parafusos produzidos por certa máquina. Vamos supor que
_
essa variável tenha distribuição normal com média x = 2 cm e
desvio padrão s = 0,04 cm.
Pode haver interesse em conhecer a probabilidade de um
parafuso ter um diâmetro com valor entre 2 e 2,05 cm.

PROBABILIDADE E ESTATÍSTICA
66

É fácil notar que essa probabilidade, indicada por:


P (2 < X < 2,05), corresponde a área hachurada na figura abaixo.
O cálculo direto dessa probabilidade exige um conhecimento de Matemática mais avançado
do que aquele que dispomos no curso de 2° grau.

Entretanto, podemos contornar facilmente esse problema. Basta aceitar, sem


demonstração, que, se X é uma variável aleatória com distribuição normal de média x e desvio
_
x - x
padrão s, então a variável: z  tem distribuição normal reduzida, isto é, tem distribuição
s
normal de média 0 e desvio padrão 1.

As probabilidades associadas à distribuição normal padronizada são encontradas em


tabelas, não havendo necessidade de serem calculadas. O anexo abaixo é uma tabela de
distribuição normal, que nos dá a probabilidade de Z tomar qualquer valor entre a média 0 e um
dado valor z, isto é: P ( 0 < Z < z );

PROBABILIDADE E ESTATÍSTICA
67
ÁREA SUBTENTIDA
z 0 1 2 3 4 5 6 7 8 9 PELA CURVA NORMAL
0,027 REDUZIDA DE 0 A z
0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0319 0,0359
0,0 9
0398 0438 0478 0517 0557 0596 0636 0675 0714 0754
0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0,1 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
0,2
0,3 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879
0,4

1915 1950 1985 2019 2054 2088 2123 2157 2190 2224 0 z
0,5
2258 2291 2324 2357 2389 2422 2454 2486 2518 2549
2580 2612 2642 2673 2704 2734 2764 2794 2823 2852
0,6 2881 2910 2939 2967 2996 3023 3051 3078 3106 3133
0,7
0,8 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389
0,9

3413 3438 3461 3485 3508 3531 3554 3577 3599 3621
1,0
3643 3665 3686 3708 3729 3749 3770 3790 3810 3830
3849 3869 3888 3907 3925 3944 3962 3980 3997 4015
1,1 4032 4049 4066 4082 4099 4115 4131 4147 4162 4177
1,2 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1,3
1,4 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441
1,5
4452 4463 4474 4484 4495 4505 4515 4525 4535 4545
4554 4564 4573 4582 4591 4599 4608 4616 4625 4633
1,6 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706
1,7 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767
1,8
1,9 4772 4778 4783 4788 4793 4798 4803 4808 4812 4817
2,0
4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2,1 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2,2 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2,3
2;4 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952
2,5
4953 4955 4956 4957 4959 4960 4961 4962 4963 4964
4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
2,6 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981
2,7
2,8 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
2,9

4987 4987 4987 4988 4988 4989 4989 4989 4990 4990
3,0
4990 4991 4991 4991 4992 4992 4992 4992 4993 4993
4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3,1 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997
3,2 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998
3,3 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998
3,4 4998
4999 4998
4999 .4999
4999 4999
4999 4999
4999 4999
4999 4999
4999 4999
4999 4999
4999 4999
4999
3,5
3,6 4999
0,5000 4999
0,5000 4999
0,5000 4999
0,5000 4999
0,5000 4999
0,5000 4999
0,5000 4999 4999
0,500 0,5000 4999
0,5000
3,7
3,8
3,9 0

PROBABILIDADE E ESTATÍSTICA
68
_
Temos, então, que se X é uma variável aleatória com distribuição normal de média x e
_
_ x - x
desvio padrão s, podemos escrever: P( x < X < x) = P(0 < Z < z), com z 
s
Voltemos, então, ao nosso problema.
Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar,
_
calcular o valor de z que corresponde a x = 2,05 (x = 2 => z = 0, pois x = 2). Temos, então:
_

z 
x - x = 2, 05 - 2
= 0, 05  1,25
s 0,04 0,04

onde: P( 2 < X < 2,05 ) = P( 0 < z < 1,25) Procuremos, agora, na tabela acima o valor de z = 1,25.

Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos, na primeira


linha, o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da
linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever:
P(0 < Z < 1,25) = 0,3944
Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro entre a
_
média x = 2 e o valor x = 2,05 é 0,3944.
Escrevemos, então: P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%

EXERCÍCIOS
01. Determine as probabilidades :
a) P (-1,25 < Z < 0)
b) P (- 0,5 < Z < 1,48)
c) P (0,8 < Z < 1,23)
d) P (Z > 0,6)
e) P (Z < 0,92

02. Os salários semanais dos funcionários de uma empresa são distribuídos normalmente, em
torno da média de R$ 500, com desvio padrão de R$ 40. Calcule a probabilidade de este
funcionário ter seu salário semanal situado entre R$ 490 e R$ 520.

03. A quantidade efetiva de café que uma máquina deposita em taças de 15g varia de uma para
outra taça, e pode ser considerada uma VA normal com desvio padrão de 0,8g. Se apenas 2% das
taças devem conter menos de 15g, qual deve ser a quantidade média a ser posta nessas taças? R:
16,64 g
04. O volume de correspondência recebido por uma firma quinzenalmente tem distribuição normal
com média de 4000 e-mails e desvio padrão de 200 e-mails. Qual a porcentagem de quinzenas em
que a firma recebe:

PROBABILIDADE E ESTATÍSTICA
69
a) entre 3600 e 4250 e-mails? R: 0,871 b) menos de 3400 e-mails? R: 0,0013

05. Suponha que você é gerente de um banco onde os montantes diários de depósitos e de
retiradas são dados por variáveis aleatórias independentes com distribuições normais. Para os
depósitos, a média é de $ 12.000 e o desvio-padrão $ 4.000; para as retiradas, a média é $ 10.000
e o desvio-padrão $ 5.000. Calcule a probabilidade de cada um dos eventos abaixo em um
determinado dia:
a) Depósitos superiores a $ 13.000. R: 0,40
b) Retiradas entre $ 13.000 e $ 18.000. R: 0,219

06. Um fabricante de máquinas de lavar sabe, por longa experiência, que a duração de suas
máquinas tem distribuição normal com média 1000 dias e desvio padrão de 200 dias. Oferece uma
garantia de 1 ano (365 dias). Produz mensalmente 2000 máquinas. Quantas esperam trocar pelo
uso da garantia dada, mensalmente. R: 2 máquinas

07. O peso x de peças produzidas por uma fábrica tem distribuição normal com média igual a
54,76g e desvio padrão de 3,72g. Uma amostra de 9 peças é examinada. Calcular a probabilidade
de que a média dessa amostra:
a) seja maior que 56g; R: 37% b) seja menor que 54g. R: 42%

08. Suponha um consultor investigando o tempo que os trabalhadores de uma fábrica levam para
montar determinada peça. Suponha que análises da linha de produção tenham calculado tempo
médio de 75 segundos e desvio padrão de 6 segundos. Qual a probabilidade de um trabalhador
montar uma peça em menos de 62 segundos? R: 0,0150

Exercícios de DISTRIBUIÇÃO NORMAL

01. Determine as probabilidades de:


a) P(Z < 1,58) b) P(-1,60 < Z < 1,40)
c) P(Z > 2,10) d) P(Z > 4,5)

02. Sabendo que X tem distribuição normal com média 10 e desvio padrão 2, determine:
a) P(8 < X < 10) b) P(9 < X < 12) c) P(X <10) d) P(7< X <11)
03. Considerando que o peso de determinado artigo produzido por uma fábrica seja normalmente
distribuído com média de 20 gramas e desvio padrão de 4 gramas, determine a probabilidade de
que uma unidade, selecionada ao acaso, tenha peso:
a) entre 16 e 22 gramas; b) entre 22 e 25 gramas: c) maior que 23 gramas:

PROBABILIDADE E ESTATÍSTICA
70
04. As vendas diárias de um restaurante tem distribuição normal com média igual a 53 unidades
monetárias e desvio padrão igual a 12 U.M.:
a) Qual a probabilidade das vendas excederem 70 U.M. em determinado dia?
b) Esse restaurante deve vender no mínimo 30 U.M. por dia para não ter prejuízo.
Qual a probabilidade de que, em certo dia haja prejuízo?

05. Suponha que a renda familiar de uma comunidade possa ser razoavelmente aproximada por
uma distribuição normal com média igual a 15 unidades monetárias e desvio padrão igual a 3 U.M.
Numa amostra de 50 famílias, quantas podemos esperar que tenham renda inferior a 10,5 U.M.?

06. Suponha que as notas em certa disciplina estão normalmente distribuídas com média 5,0 e
desvio padrão 1,5:
a) determine o percentual de estudantes com nota superior a 8,0;
b) se a nota mínima para obter aprovação e 3,0, determine o percentual de estudantes reprovados;
c) explique por que a probabilidade de um estudante dessa população obter nota acima de 9,8 é
praticamente zero.

07. Suponha que o consumo diário de cachaça pelos alcoólatras de certa cidade seja normalmente
distribuído com média 320 ml e desvio padrão 50 ml. Selecionando ao acaso um alcoólatra desta
cidade, determine a probabilidade de que ele tenha consumo diário:
a) maior que 330 ml; b) inferior a 370 ml; c) entre 240 e 330 ml; d) entre 320 e 380 ml.

08. Suponhamos que o nível educacional de adultos de certo Pais apresenta distribuição normal
com média de 11 anos e desvio padrão de 2 anos. determine:
a) a probabilidade de que um adulto, escolhido aleatoriamente, tenha entre 9 e 14 anos de tempo
de estudo.
b) a probabilidade de que um adulto tenha mais de 18 anos de estudo.
c) o numero de adultos que se espera que tenham menos de 7 anos, considerando uma amostra
de 500 adultos.

09. O tempo que os alunos gastam para fazer uma prova é normalmente distribuído com média de
72 minutos e desvio-padrão de 5 minutos. Determine a probabilidade de um aluno gastar:
a) mais de 84 minutos; b) mais de 48 minutos; c) entre 70 e 84 minutos;
d) entre 60 e 70 minutos..

10. O salário dos funcionários de uma empresa é normalmente distribuído com média de 500 reais
e desvio-padrão de 10 reais. Determine a percentagem de funcionários cujo salário situa-se:

PROBABILIDADE E ESTATÍSTICA
71
a) acima de 510 reais; b) abaixo de 495 reais; c) entre 480 e 520 reais;

d) abaixo de 525,8 reais; e) exatamente em 520 reais.

11. Para as famílias de certos status sócio-econômico, a despesa com alimentação é normalmente
distribuída com média de 1400 unidades monetárias, com desvio-padrão de 180 unidades
monetárias. Considerando um total de 16000 famílias desta classe social, determine o numero de
famílias em que o gasto com alimentação seja:
a) maior que 1600 unidades monetárias; b) menor que 1700 unidades monetárias.

12. 0 conteúdo liquido das garrafas de 300 ml de um refrigerante é normalmente distribuído com
média de 300 ml e desvio-padrão de 2 ml.
a) Determine o percentual de garrafas cujo conteúdo seja inferior a 302 ml.
b) Entre 200 garrafas, quantas deverão ter menos de300 ml?
13. 0 peso de 600 estudantes é normalmente distribuído com média de 65,3 kg e desvio padrão de
5,5 kg. Determine o numero de estudantes que pesam:
a) entre 60 e 70 kg; b) mais de 63,2 kg; c) menos de 68 kg.

14. As notas em um teste padronizado tem média igual a 100 e desvio padrão de 10, um indivíduo
submetido ao teste ter nota:
a) maior que 120; b) maior que 80; c) entre 85 e 115; d) maior que 100.

15. Suponha que os diâmetros dos parafusos produzidos por uma fabrica sejam normalmente
distribuídos com média de 0,25 polegadas e desvio-padrão de 0,02 polegadas. Um parafuso e
considerado defeituoso de o seu diâmetro e menor que 0,20 polegadas ou maior que 0,28
polegadas. Encontre a porcentagem de parafusos defeituosos produzidos pela fábrica.

16. Suponha que as notas de um exame são normalmente distribuídas com média de 76 e desvio-
padrão de 15. Os estudantes que ficarem entre as 15% melhores notas, receberão conceito A e os
estudantes que ficarem entre as 10% piores notas, receberão conceito F. Determine a nota mínima
para um estudante:
a. receber conceito A; b. não receber conceito F.

17. Um fabricante de baterias sabe, por experiência passada, que as baterias de sua fabrica o tem
vida média de 600 dias e desvio-padrão de 100 dias, sendo que a duração segue uma distribuição
normal. Oferece uma garantia de 312 dias, isto é, troca as baterias que apresentarem falhas nesse

PROBABILIDADE E ESTATÍSTICA
72
período. Fabrica 10000 baterias mensalmente. Quantas devera trocar, mensalmente, pelo uso
da garantia?

18. Uma fabrica de carros sabe que os motores de sua fabricação tem duração normal com média
de 150000 km e desvio-padrão de 5000 km.
a) Qual a probabilidade de que um carro tenha motor que dure menos que 170000 km?
b) Qual a probabilidade de que um carro tenha motor que dure entre 140000 e 165000 km?
c) Se a fábrica substitui o motor que apresente duração inferior a garantia, qual deve ser esta
garantia, para que a porcentagem de motores substituídos seja de 0,2%?

19. O volume de correspondência recebido por uma firma quinzenalmente tem distribuição normal
com média de 4000 cartas e desvio-padrão de 200 cartas. Qual a porcentagem de quinzenas em
que a firma recebe:
a) entre 3600 e 4250 cartas? b) mais de 3400 cartas? c) mais de 4636 cartas?

20. Numa fábrica foram instaladas 1000 lâmpadas novas. Sabe-se que a duração média das
lâmpadas e de 800 horas e o desvio-padrão e de 100 horas, com distribuição normal. Determine a
quantidade de lâmpadas que durarão:
a) menos de 500 horas;
b) mais de 700 horas;
c) entre 516 e 814 horas.

RESPOSTAS DOS EXERCÍCIOS DE DIST. NORMAL

1. a) 0,9430; b) 0,8644; c) 0,0179; d) 0.


2. a) 0,3413; b) 0,5328; c) 0,50; d) 0,6247.
3. a) 0,5328; b) 0,2029; c) 0,2266.
4. a) 0,0778; b) 2,74%.
5. 3,34.
6. a) 2,28%; b) 9,18%; c) 0.
7. a) 0,4207; b) 0,8413; c) 0,5245; d) 0,3849.
8. a) 0,7745; b) 0; c) 11,40.
9. a) 0,0082; b) 1; c) 0,6472; d) 0,3364.
10. a) 15,87%; b) 30,85%; c) 95,44%; d) 99,51%; (e) 0.

PROBABILIDADE E ESTATÍSTICA
73
11. a) 2136; b) 15240.
12. a) 99,86%; b) 100.
13. a) 380; b) 389; c) 413.
14. a) 0,0228; b) 0,9772; c) 0,8664; d) 0,5.
15. 7,3%
16. a) 91,6; b) 56,8.
17. 20
18. a) 1,0; b) 0,9759; c) 135650.
19. a) 87,16%; b) 99,87%; c) 0,07%.
20. a) 1; b) 841; c) 553.

ESTIMAÇÃO DE PARÂMETROS

Introdução
O objetivo da Estatística é a realização de inferências acerca de uma população, baseadas
nas informações amostrais. Como as populações são caracterizadas por medidas numéricas
descritivas, denominadas parâmetros, a inferência estatística diz respeito à realização de
inferências sobre esses parâmetros populacionais.
Os métodos de realizar inferências a respeito dos parâmetros pertencem a duas categorias.
Podem-se tomar decisões relativas ao valor do parâmetro, através de um teste de hipótese ou
pode-se estimar ou prever o valor do mesmo.
A estimação é o processo que consiste em utilizar dados amostrais para estimar os valores
de parâmetros populacionais desconhecidos. Qualquer característica de uma população pode ser
estimada a partir de uma amostra aleatória. Entre as mais comuns, estão a média e o desvio
padrão de uma população e a proporção populacional.
Parâmetros: valores calculados com dados da população (média da população, desvio padrão)
Estimativas: valores calculados com dados da amostra (média da amostra)

Estimativas pontuais e intervalares


As estatísticas amostrais são utilizadas como estimadores de parâmetros populacionais.
Assim uma média amostral é usada como estimativa de uma média populacional; etc..
Tais estimativas chamam-se estimativas pontuais, porque originam uma única estimativa do
parâmetro. A amostragem aleatória apresenta tendência a gerar amostras em que a média
amostral, por exemplo, não é igual à média da população, embora os dois valores em geral sejam
próximos. Ex: Amostra de 5 alunos resultou uma média de 1,70m. Então considera-se que o valor
mais provável para a turma seja 1,70m.
Na estimativa intervalar calculam-se 2 valores que definem um intervalo (intervalo de
confiança) e se espera que o parâmetro esteja dentro do intervalo.

PROBABILIDADE E ESTATÍSTICA
74
A margem de erro é chamada de “nível de significância”, representada por . Valores
mais usados 5% (0,05), 1% (0,01) e 10% (0,10).

Cálculo do Intervalo de Confiança para uma proporção


Amostragem de uma população infinita, ou com reposição, de uma população finita
P ( p - e0 < p < p + e0 ) = 1 - 

p.q
e0 = zc onde p e q são as proporções amostrais; q = 1 – p
n

Amostragem sem reposição de uma população finita de tamanho N

p.q N -n
P ( p - e0 < p < p + e0 ) = 1 -  e0 = zc .
n N -1

A tabela abaixo dá os valores de z correspondentes a vários níveis de confiança adotados na


prática.

Limites de 99,73% 99% 98% 96% 95,45% 95% 90% 80% 68,27% 50%
Confiança
zc 3,00 2,58 2,33 2,05 2,00 1,96 1,645 1,28 1,00 0,6745

Exemplo:
01. A pedido da direção da empresa uma nutricionista fez uma pesquisa para saber a % de
funcionários, de uma empresa que apresentavam excesso de peso (IMC>24,9). Para isso, avaliou
140 funcionários encontrando 52 com excesso de peso. A empresa tem 500 funcionários. Calcule o
intervalo de confiança com  = 0,05.

02. A fim de estimar a proporção de estudantes de determinado campus favoráveis a uma


campanha geral contar o uso de álcool, um pesquisador entrevistou uma amostra aleatória de 50
estudantes dentre a população de uma faculdade, constatando que 36% da amostra era favorável
à proibição do álcool. De posse dessa informação, determine:
a. erro padrão da proporção com índice de confiança de 95%.

PROBABILIDADE E ESTATÍSTICA
75
b. um intervalo de confiança de 95% para a proporção populacional.

Cálculo do Intervalo de Confiança para Média

_ 
X ± Zc .
N

Exemplo:
Uma pesquisadora do vício do fumo está interessada em estimar a idade média em que os
usuários de cigarros começam a fumar. Tomando uma amostra aleatória de 25 fumantes, ela
calcula uma média amostral de 16,8 anos e um desvio padrão amostral de 1,5 ano. Construa um
intervalo de 95% de confiança para estimar a idade média em que a população começa a fumar.

Exemplo:
Suponha que o tempo de permanência dos clientes em uma loja seja normalmente distribuído.
Uma amostra aleatória de 16 consumidores revelou um tempo médio de 25 min. Assuma que o
desvio padrão seja 6 min. Encontre os intervalos de confiança de 95% e 99% para o tempo médio
populacional.

Nível de Confiança e Nível de Significância


O nível de confiança representa a probabilidade de acerto na estimativa, enquanto que o nível de
significância apresenta a eventual probabilidade de erro.

Assim, se uma pesquisa na área da saúde detecta que 60% das pessoas analisadas estão
infectadas por uma determinada bactéria com uma margem de erro igual a 3% e um nível de
confiança igual a 95%, existem 95% de probabilidade de das pessoas infectadas estarem entre
60% + 3%, ou 57% e 60% - 3%, ou 63%. Se o nível de significância da pesquisa é de 5%, existem

PROBABILIDADE E ESTATÍSTICA
76
5% de chances de que o número construído esteja errado. Existe uma probabilidade igual a 5%
de a percentagem no universo ser menor que 57% ou maior que 63%.
EXERCÍCIOS
01. O DRH de una empresa informa que o tempo de execução de tarefas que envolvem
participação manual varia de tarefa para tarefa, mas o desvio padrão populacional permanece
constante, em 3 min. Uma nova tarefa está sendo implantada na empresa. Uma amostra a. s. do
tempo de execução de 50 destas novas tarefas forneceu o valor médio de 15 min. Determinar o lC
de 95% para o tempo médio desta nova tarefa. R: 15 ± 0,83

02. Um levantamento de cotações para o preço de um produto na bolsa de mercadorias apontou a


partir de uma amostra de 100 cotações, um preço médio de R$ 2,40. Sabe-se por experiência
anterior, que a variância para este tipo de cotação é aproximadamente constante e de valor R$
0,16. Construa o IC 95% para o preço médio deste produto. R: 2,4 ± 0,08
03. Um comerciante que trabalha com o produto do problema anterior acredita que terá lucro se
conseguir pagar um preço menor que o preço médio da bolsa. Qual é o preço máximo que poderá
pagar ao nível de 80%? R: 2,4 ± 0,05

04. Para estudar a situação salarial dos funcionários de uma empresa, um consultor levantou uma
amostra de 50 salários recebidos na empresa. Sabe-se por experiência com empresas similares,
que o desvio padrão é aproximadamente constante de valor 40 u. m. O salário médio amostral foi
calculado em 245 u. m. Determine o lC com 95%de confiança para o salário médio dos funcionários
da empresa. R: 245 ± 11

05. O controle de qualidade de uma empresa levantou uma a. a. s. de 50 peças da produção de


uma máquina. Obteve um diâmetro médio de 42 mm com desvio padrão de 0,2mm.
a) Qual é o IC com 98% de confiança para o diâmetro médio das peças? R: 42 ± 0,06
b) A máquina está regulada quando fornece estimativa máxima menor que 42 mm ao nível de 95%
de confiança. R: 42 ± 0,05

06. Um restaurante do tipo Self-Service cobra refeições por peso. Uma a.a.s. de 12 refeições
selecionadas em um período em que foram servidas 80 refeições apresentou um peso médio de
460g e desvio padrão de 80g. Supondo que o peso das refeições são distribuídas normalmente
determine um IC com 98% de confiança para o peso médio das refeições servidas neste local.
R:460 ± 53,8

LISTA DE EXERCÍCIOS
01. Líderes estudantis de uma faculdade querem conduzir uma pesquisa para determinar a
proporção p de estudantes a favor de uma mudança no horário de aulas. Como é impossível

PROBABILIDADE E ESTATÍSTICA
77
entrevistar todos os 2000 estudantes em um tempo razoável, decide-se fazer uma amostragem
aleatória simples dos estudantes:
a) Determinar o tamanho de amostra (número de estudantes a serem entrevistados) necessário
para estimar p com um erro máximo de 0,05 e nível de confiança de 95%. Assumir que não há
nenhuma informação a priori disponível para estimar p.
b) Os líderes estudantis também querem estimar a proporção de p de estudantes que sentem que
a representação estudantil atende adequadamente as suas necessidades.
c) Qual o tamanho de amostra adequado para atingir ambos os objetivos da pesquisa?

02. Determinar o tamanho de amostra necessário para estimar o volume médio de vendas de
carros novos nacionais entre as concessionárias, fixando um nível de confiança de 99% para um
erro de estimação igual a 1 automóvel. É conhecido que existem 200 concessionárias na região em
estudo. Em uma pesquisa similar feita 5 anos antes, o desvio-padrão amostral foi igual a 2,8.

03. Um assistente social deseja saber o tamanho da amostra (n) necessário para determinar a
proporção da população atendida por uma Unidade de Saúde, que pertence ao município de
Cariacica. Não foi feito um levantamento prévio da proporção amostral e, portanto, seu valor é
desconhecido. Ela quer ter 90% de confiança que sua o erro máximo de estimativa (E) seja de
±5% (ou 0,05). Quantas pessoas necessitam ser entrevistadas?

04. O tempo médio de atendimento em uma agência lotérica está sendo analisado por técnicos.
Uma amostra de 40 clientes foi sistematicamente monitorada em relação ao tempo que levavam
para serem atendidos, obtendo-se as seguintes estatísticas: tempo médio de atendimento de 195
segundos e desvio padrão de 15 segundos. Considerando que o tempo de utilização segue uma
distribuição normal:
a) Faça uma estimação por intervalo para o tempo médio de utilização para toda a população de
clientes da agência lotérica, utilizando um nível de confiança de 95%.
b) A amostra utilizada seria suficiente se fosse exigida uma precisão de 1 minuto?
c) O dono da agência garante que o tempo médio de atendimento é de 3 minutos (se for maior ele
se compromete a contratar mais um atendente). Com base nos dados da amostra a afirmação do
dono é verdadeira, ou ele deve contratar um novo atendente? Use um nível de significância de 1%?

05. A satisfação da população em relação a determinado governo foi pesquisada através de uma
amostra com a opinião de 1000 habitantes do estado. Destes, 585 se declararam insatisfeitas com
a administração estadual. Admitindo-se um nível de significância de 5%, solucione os itens abaixo.
a) Estime o percentual da população que está insatisfeita com a administração estadual.
b) Qual o tamanho da amostra necessária para a estimação se a empresa responsável pela
pesquisa estipulou uma folga máxima de 2,5% ?

PROBABILIDADE E ESTATÍSTICA
78
c) A atual administração decidiu que se o percentual de descontentamento fosse superior a 50%
deveria ser redirecionado o plano governamental. Utilizando a informação amostral o que você
concluiria?

06. Um banco possui 800 terminais de autoatendimento instalados no estado do RS. Avaliando 48
terminais, 6 apresentavam defeitos. Estime a proporção de terminais com defeitos.

07. Em uma pesquisa de mercado, acerca da preferência pelo produto X, 300 consumidores foram
entrevistados, sendo que 100 declararam consumir o produto.
a) O fabricante quer que você determine um intervalo de 95% para a proporção populacional de
pessoas que consomem o produto.
b) Um dos diretores do fabricante exige que o intervalo de confiança para a proporção populacional
tenha 99% de confiança, com um erro máximo de 2,5%. A amostra retirada satisfaz estes critérios?
c) No passado, o produto X era a marca líder de mercado, com cerca de 40% da preferência do
consumidor. Com base nos dados, e usando uma significância de 1%, a marca ainda tem a
liderança?
08. A Polícia Rodoviária Estadual fez recentemente uma pesquisa secreta sobre as velocidades
desenvolvidas na SC 401 das 23h às 2h. No período de observação, 100 carros passaram por um
aparelho de radar a uma velocidade média de 112 km/h, com desvio padrão de 22 km/h. Construa
um intervalo de 95% de confiança para a média da população.

CORRELAÇÃO/REGRESSÃO
Em pesquisas, frequentemente, procura-se verificar se existe relação entre duas ou mais
variáveis, isto é, saber se as alterações sofridas por uma das variáveis são acompanhadas por
alterações nas outras. Por exemplo, peso vs. idade, consumo vs. renda, altura vs. peso, de um
indivíduo.
Uma vez caracterizada esta relação, procura-se descrevê-la sob a forma matemática,
através de uma função. A estimação dos parâmetros dessa função matemática é o objeto da
regressão. Os pares de valores das duas variáveis poderão ser colocados num diagrama
cartesiano chamado “diagrama de dispersão”. A vantagem de construir um diagrama de dispersão
está em que, muitas vezes sua simples observação já nos dá uma ideia bastante boa de como as
duas variáveis se relacionam. Então:
♦ A CORRELAÇÃO mede a força, a intensidade ou grau de relacionamento entre 2 ou mais
variáveis.
♦ A REGRESSÃO fornece uma equação que descreve esse relacionamento em termos
matemáticos.
CORRELAÇÃO LINEAR

PROBABILIDADE E ESTATÍSTICA
79
É uma relação estatística para determinar se há algum relacionamento significativo entre
duas variáveis. Podemos estudar essa relação com auxílio de um diagrama de dispersão e ou de
um coeficiente de correlação.

Coeficiente de correlação linear


Mede o grau de relação linear entre os valores emparelhados x e y em uma amostra.
Também conhecido como coeficiente de correlação de Pearson.

n  xy  (  x).(  y)
r
n(  x2 ) (  x)2 . n(  y2 ) (  y)2

O valor de r deve estar entre – 1 e + 1 inclusive. Se o valor de r está próximo de 0, concluímos que
não há correlação linear significativa entre x e y, mas se r está próximo de – 1ou + 1 concluímos
pela existência de correlação linear significativa entre x e y.

PROBABILIDADE E ESTATÍSTICA
80

EXERCÍCIOS
01. Sobre os diagramas de dispersão para duas variáveis é correto afirmar que:
I - se a nuvem de pontos distribui-se nas proximidades de uma reta, então há correlação linear.
II - se a nuvem de pontos não se distribui nas proximidades de qualquer que seja a reta, então não
há correlação.
III - se todos os pontos de diagrama pertencem a uma única reta oblíqua, então há correlação
linear perfeita.
IV - se a nuvem de pontos distribui-se nas proximidades de uma reta que represente uma função
crescente, então há correlação linear positiva.
a) Todas as afirmativas são verdadeiras. b) Somente a afirmativa II é falsa.
c) Somente a afirmativa IV é falsa.
d) As afirmativas I e II são falsas. e) Todas as alternativas são falsas.

PROBABILIDADE E ESTATÍSTICA
81
02. Abaixo temos uma tabela com as notas obtidas por 10 alunos em Matemática (variável X) e
Estatística (variável Y). Determine o coeficiente de correlação.

Aluno X Y
A 6 7
B 5 6
C 9 10
D 10 9
E 3 2
F 4 3
G 8 9
H 7 5
I 6 6
J 2 3

R:
0,91

03. Seja a tabela abaixo composta pela massa (Kg) e altura em (cm) de crianças com 10 meses de
idade.
Altura Massa
(cm) (Kg)
75 9,0
70 9,2
73 8,9
78 8,5
80 9,5
69 9,6
71 9,1
72 10,0
74 8,7
77 9,4
Determine o coeficiente de Pearson e verifique que tipo de correlação existe entre as variáveis
massa e altura. R: - 0,24

PROBABILIDADE E ESTATÍSTICA
82

04. (BACEN-98) Duas variáveis X e Y têm coeficiente de correlação linear igual a 0,9. Obtendo-se
a reta de regressão linear simples de Y sobre X, pode-se dizer que seu coeficiente angular:
a) Será menor que 0,9 b) Será maior que 0,9 c) Poderá ser negativo
d) Poderá ser nulo e) Será positivo R:e

05. (IBGE-2002) Os dados a seguir apresentam os investimentos (em milhares de reais) e os lucros
(em milhares de reais) no ano seguinte realizados por cinco empresas escolhidas aleatoriamente:
Empresa Investimento Lucro
1 10 1,5
2 15 2,0
3 5 0,5
4 12 1,5
5 18 2,5
O coeficiente de correlação linear amostral destes dados é, aproximadamente, igual a:
a) 0,74 b) – 0,26 c) 0,48 d) 0,72 e) 0,98 R: e

REGRESSÃO LINEAR
Quando duas variáveis possuem certo grau de relacionamento (verificado pela correlação),
podemos aplicar a análise de regressão que vai nos permitir descrever através de um modelo
matemático, a relação entre duas variáveis, partindo de n observações das mesmas. Para
executarmos a regressão, as variáveis serão divididas em variável dependente e variável
independente. Para o eixo x, indicamos a variável independente e para o eixo y, a dependente.
Dessa forma temos:
y = a + bx
De modo geral, as variáveis x e y, por convenção, são definidas do seguinte modo:
y = variável dependente, explicada. (valor de y quando o x = 0, ou intercepto da reta no eixo y)
x = variável independente, explicativa. (valor do coeficiente angular, que indica a inclinação da reta)
No processo de determinação dos valores das constantes a e b, costuma-se aplicar o
método dos mínimos quadrados, que determina a equação de ajuste linear que apresenta a menor
soma dos quadrados dos erros.
É importante destacar que a análise simples de regressão linear apenas se preocupa em
determinar a forma numérica de associação entre x e y. Não estabelece nenhuma relação de
causação.

PROBABILIDADE E ESTATÍSTICA
83
Então o objetivo da regressão linear é obter os parâmetros de uma reta que melhor define
o comportamento físico a partir de medições práticas, ou seja descrevê-la através de uma
função matemática.
Na Figura 1.1, a reta azul é suposta ser a regressão linear entre as grandezas Y e X conforme
medições
Gastos com
hipotéticas Vendas(y, em mil dadas
publicidade (x, em
reais)
pelas marcas mil reais)
vermelhas. 3 7
4 14
8 15
12 28
14 32

Fig 1.1

O método dos mínimos quadrados determina que a e b devem ser obtidos de modo que:

∑y - b∑x n(∑xy) - (∑x.∑y)


a= b=
n n(∑x2 ) - (∑x)2
Para ilustrar a aplicação do método dos mínimos quadrados, usaremos o exemplo dos dados sobre
gastos com publicidade e volume de vendas.

a=
∑y - b∑x
n
n(∑xy) - (∑x.∑y)
b=
n(∑x2 ) - (∑x)2

PROBABILIDADE E ESTATÍSTICA
84
Em outro exemplo, considere o exemplo fictício da Ceres Fruticultura. A empresa coletou dados
referentes ao volume de chuvas nos últimos seis anos e a produtividade média por hectare em 2
culturas diferentes: manga e goiaba. Os
Ano Chuvas Goiaba
valores estão representados abaixo:
1 42 15
2 18 15
a=
∑y - b∑x
n 3 25 15
4 20 25
n(∑xy) - (∑x.∑y)
b=
n(∑x2 ) - (∑x)2 5 35 25
6 10 18,3

a=
∑y - b∑x
n
n(∑xy) - (∑x.∑y)
b=
n(∑x2 ) - (∑x)2
Ano Chuvas Manga
1 42 134
2 18 86
3 25 100
4 20 90
5 35 120
EXERCÍCIOS 6 10 70
01. Uma cadeia de supermercados financiou
um estudo dos gastos realizados por família
de quatro pessoas com renda mensal líquida entre oito e vinte salários mínimos. A pesquisa levou
a equação de regressão y = - 1,2 + 0,4.x, onde y representa a despesa mensal estimada ( através
do modelo) e x a renda mensal líquida expressa em numero de salários mínimos.
a) Estime a despesa mensal de uma família com renda líquida mensal de 15 salários mínimos.
b) A equação parece sugerir que uma família com renda mensal de 3 salários mínimos nada gasta
com mercadorias. O que você tem a dizer sobre isso?
PROBABILIDADE E ESTATÍSTICA
85
c) A equação em questão serve para estimar a despesa mensal de uma família de 5 pessoas
com renda líquida de 12 salários mínimos? Justifique.

02. Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada


substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações
conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo:
X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0
Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1
Obtenha a reta de regressão da variável Y em função de X. R: y = 0,16 + 0,98x

03. Uma amostra de fábricas de uma indústria levou a:


Custo total Produção
Y X
80 12
44 4
51 6
70 11
61 8
a) Determine a equação de regressão linear. b) Quais os significados econômicos de "a" e "b"?
04. Pretendendo estudar a relação entre o tempo necessário a um consumidor para optar e o
número de produtos substitutos alternativos expostos a ele, foi observada uma amostra aleatória de
15 consumidores, da qual resultaram os seguintes dados,:
Y X
5 2
8 2
8 2
7 2
9 2
7 3
9 3
8 3
9 3
10 3
10 3
11 4
10 4
12 4
9 4

PROBABILIDADE E ESTATÍSTICA
86
A variável Y refere-se ao tempo necessário para a tomada de decisão e X o número de
alternativas.
a) Estime o coeficiente de correlação linear de Pearson.
b) Determine a equação de regressão para a amostra dada.
c) Interprete os valores dos coeficientes encontrados para a reta.
05. Uma amostra de residências selecionadas aleatoriamente foi observada quanto à idade do
imóvel X e quanto ao preço de venda. Resultou:

X Y
1 10
2 30
3 40
4 50
5 65
6 70

a) Estime a reta de regressão populacional; b) Estime o coeficiente de correlação entre X e Y.


06. Procurando quantificar os efeitos da escassez de sono sobre a capacidade de resolução de
problemas simples, um agente tomou ao acaso 10 sujeitos e os submeteu a experimentação.
Deixou-os sem dormir por diferentes números de horas, após o que solicitou que os mesmos
resolvessem os itens "contas de adicionar" de um teste. Obteve, assim, os seguintes dados:
Número de Horas sem
erros - Y dormir - X

8 8
6 8
6 12
10 12
8 16
14 16
14 20
12 20
16 24
12 24

a) Calcule o coeficiente de correlação linear de Pearson e teste a sua significância ao nível de 1%.
b) Determine a equação de regressão linear. Teste a existência da regressão, ao nível de 1 % e
5%.
TESTE DE HIPÓTESES

PROBABILIDADE E ESTATÍSTICA
87
Na teoria de decisão estatística, os testes de hipóteses assumem uma importância
fundamental, já que estes permitem nos dizer, por exemplo, se duas populações são de fato iguais
ou diferentes, utilizando para isso amostras destas populações. Desta forma, a tomada de decisão
de um gestor, deve estar baseada na análise de dados a partir de um teste de hipótese.
Para você decidir se uma hipótese é verdadeira ou falsa, ou seja, se ela deve ser aceita ou
rejeitada, considerando uma determinada amostra, precisamos seguir uma série de passos. Os
passos são mostrados a seguir.
1) Definir a hipótese de igualdade (H0) e a hipótese alternativa (H1) para tentar rejeitar H0 (possíveis
erros associados à tomada de decisão).
2) Definir o nível de significância (α).
3) Definir a distribuição amostral a ser utilizada.
4) Definir os limites da região de rejeição e aceitação.
5) Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos e tomar a
decisão.
Você deve tomar a decisão baseada na seguinte regra: se o valor da estatística da distribuição
calculado estiver na região de rejeição, rejeitar, então, a hipótese nula, senão a decisão será que a
hipótese nula não poderá ser rejeitada ao nível de significância determinada.
Hipóteses estatística
É uma suposição quanto ao valor de um parâmetro populacional, ou quanto à natureza da
distribuição de probalidade de uma variável populacional.
Ex.: a) A altura média da população brasileira é 1,65 m, isto é: H: μ = 1,65.
Tipos de hipóteses
1. Hipótese nula (Ho) é a hipótese estatística a ser testada e expressa uma igualdade.
A hipótese nula sempre alega a igualdade de um determinado parâmetro.
2. Hipótese alternativa (H1) expressa uma desigualdade ou hipótese diferente da nula.
A hipótese alternativa alega a desigualdade de um determinado parâmetro. Pode envolver a
alegação de 3 tipos diferentes de hipóteses: diferente, maior ou menor.
Primeiramente, vamos estabelecer as hipóteses nula e alternativa.
Para exemplificar, você deve considerar um teste de hipótese para uma média. Então, a hipótese
de igualdade é chamada de hipótese de nulidade ou Ho. Suponha que você queira testar a
hipótese de que o tempo médio de ligações é igual a 50 segundos. Então, esta hipótese será
simbolizada da maneira apresentada a seguir:
Ho: = 50 (hipótese de nulidade)
Esta hipótese, na maioria dos casos, será de igualdade.
Se você rejeitar esta hipótese, vai aceitar, neste caso, outra hipótese, que chamamos de hipótese
alternativa. Este tipo de hipótese é simbolizada por H1 ou Ha.
As hipóteses alternativas mais comuns são as apresentadas a seguir a partir do nosso exemplo:
H1: > 50 (teste unilateral ou unicaudal à direita)  O tempo médio de ligação é superior a 50
segundos

PROBABILIDADE E ESTATÍSTICA
88

Ho: μ = 50 H1: μ > 50


H1: < 50 (teste unilateral ou unicaudal à esquerda)  O tempo médio de ligação é inferior a 50
segundos

Ho: μ = 50 H1: μ < 50


H1 ≠ 50 (teste bilateral ou bicaudal)  O tempo médio de ligação pode ser superior ou inferior a 50

Ho: μ = 50 H1: μ ≠ 50
Qual hipótese alternativa que vamos utilizar? A resposta é bem simples.
A hipótese alternativa será definida por você, em função do tipo de decisão que deseje
tomar.
Veja os seguintes exemplos.
SITUAÇÃO 1  Um comerciante alega que suas vendas médias diárias nunca são iguais a
R$ 400,00. Neste caso, a desigualdade já está alegada.
H0: H1:
SITUAÇÃO 2  Um fabricante alega que suas embalagens de amaciante têm, em média, sempre
mais que 200 ml. Neste caso, de forma similar à situação anterior, a desigualdade já está alegada.
H0: H1:
SITUAÇÃO 3  Uma indústria de papel alega que suas resmas sempre contem em média e no
mínimo 500 folhas. Neste caso, a igualdade está contida na alegação da empresa, já que conter no
mínimo 500 folhas é conter uma quantidade igual ou maior que 500 folhas. Assim a hipótese nula
estabelece a igualdade alegada pelo fabricante enquanto a hipótese alternativa a nega, afirmando
uma média menor que 500 folhas. A afirmação do fabricante apenas será negada se a quantidade
média encontrada for significativamente menor que 500 folhas.
H0: H1:

TESTE DE UMA AMOSTRA PARA MÉDIA


Procedimentos para teste de significância
Considera-se, para os testes de significância, apenas o erro α. É o mais usado nas pesquisas
educacionais, socioeconômicas etc.
Os procedimentos são os seguintes:
1o Passo: formular ou enunciar as hipóteses H0 e H1;
HO: μ = μO
H1: uma das alternativas
PROBABILIDADE E ESTATÍSTICA
89
μ ≠ μO μ > μO μ < μO
2o Passo: fixar o limite do erro α (na prática é mais comum o uso dos níveis de significância 0,05 e
0,01), e identificar a variável (“t” ou Z) do teste;
3o Passo: com o auxílio das tabelas estatísticas, fixado α e a variável do teste, determinar as RC
(região crítica) ou RR (região de rejeição) e RA (região de aceitação) para HO;
4o Passo: usando os elementos amostrais, calcular o valor da estatística que definirá a decisão;
Se o desvio padrão populacional for conhecido ou o tamanho da amostra for igual ou maior
30.
_
x-  o
z=
s
n
Se o desvio padrão populacional for desconhecido e o tamanho da amostra for menor que
30.
_
x-  o
t=
s
n
_
Ζ (ou t) = estatística de teste x = média obtida na amostra μ0 = média esperada da

população
S = desvio padrão da população n = número de elementos na amostra
o
5 Passo: concluir pela aceitação (se o valor amostral cair na RA) ou rejeição de HO (se o valor
amostral cair na RR) pela comparação com o valor obtido no passo anterior com RA e RC.

EXEMPLOS
01. Uma empresa alega que a quantidade média de açúcar contida nas embalagens standard é
exatamente igual a 200g. Uma pesagem de 14 embalagens escolhidas ao acaso apresentou um
peso médio igual a 180g. Estudos feitos com produtos similares indicam que o desvio padrão
populacional dos produtos analisados é igual a 25g. Para um nível de significância igual a 5%, o
que se pode dizer sobre a alegação do fabricante? R: z = - 2,9933 Rejeita Ho (não é possível
aceitar a alegação do fabricante)

PROBABILIDADE E ESTATÍSTICA
90

02. Registros dos últimos anos de uma auditoria demonstram que o valor médio de todas as contas
a recebidas de uma empresa é de R$ 115,00. Para testar a hipótese da média das novas contas a
receber, tirou-se, ao acaso uma amostra de 20 contas, obtendo-se a média de R$ 118,00 e desvio
padrão de R$ 20,00. Admite-se que α = 0,05, para efetuar o teste.
03. Um fabricante de rações para aves alega que uma embalagem com kg conterá em média, no
máximo, 4,5 kg de um determinado composto. Uma pesquisa realizada por um criatório cliente,
utilizando-se de uma amostra de 190 embalagens de 20 kg, revelou uma quantidade média de
4,8 kg com um desvio padrão de 0,3 kg. Considerando um nível de confiança igual a 96%, é
possível aceitar a alegação do fabricante?

EXERCÍCIOS
01. Para uma amostra de 50 firmas tomadas de uma indústria, o número médio de empregados por
firma é de 420,4 com um desvio padrão amostral de 55,7. Existem ao todo 380 firmas nesta
indústria. Antes que os dados fossem coletados, foi feita a hipótese de que o número médio de
empregados por firma, nesta indústria, não era superior a 408. Testar esta hipótese ao nível de
significância de 5%.

02. Uma grande revista de negócios brasileira afirmou que o faturamento médio das indústrias de
uma determinada região sul do país seria igual a R$ 820.000,00. Sabe-se que o desvio padrão do
faturamento de todas as empresas da região é igual a R$ 120.000,00. Um pesquisador
independente analisou os dados de uma amostra formada por 19 empresas, encontrando um
faturamento médio igual a R$ 780.000,00. Assumindo nível de significância igual a 8%, seria
possível concordar com a alegação?

03. Um fundo de investimento utiliza como estratégia na captação de clientes, o slogan “O Fundo
que em média, rende 1% ao mês”. Você investirá nesse fundo desde que consiga previamente se
certificar da média anunciada. Monte um teste de hipóteses com 5% de nível de significância, com
amostras de 40 elementos (cada elemento representa o retorno em um mês determinado).
Simulação 1
Se após a coleta de dados referentes a 40 amostras encontra-se 1,05% e 0,20% para média e
desvio-padrão amostrais, respectivamente, qual deverá ser a decisão? R: z = 1,58 Aceita H0.
Simulação 2
E se a média fosse de 0,95% e o desvio-padrão fosse 0,1%? R: z = - 3,16 Rejeita H0.

04. Uma instituição de ensino alega que a média de seus alunos em provas de vestibulares de
universidades de primeira linha é igual a 7,60. Uma amostra aleatória formada por 60 alunos

PROBABILIDADE E ESTATÍSTICA
91
revelou uma média igual a 6,80, com desvio igual a 2,40. Assumindo alfa igual a 5%, teste a
alegação da instituição, supondo que as hipóteses alternativas (H1) sejam:
a) média populacional diferente de 7,60; R: Z = - 2,582 (rejeita)
b) média populacional menor que 7,60. R: z = - 2,582 (rejeita)

05. Uma empresa produtora de cosméticos alega que a quantidade de algas marinhas especiais
contidas em frascos de 400 g é, no mínimo, igual a 58 g. Uma amostra formada por 23 frascos
revelou que estes continham, em média, 52 g, com um desvio padrão de 18 g. Pede-se:
a) é possível concordar com a afirmação do fabricante? . R: t = - 1,599 (aceita)
b) refaça a questão, supondo que a amostra tivesse sido formada por 74 frascos. Assuma alfa igual
a 3% e suponha população normalmente distribuída. R: z = - 2,867 (rejeita)

06. A Construtora Estrada Forte Ltda. alega ser capaz de produzir concreto com, no máximo, 15 kg
de impurezas para cada tonelada fabricada. Dezenove amostras de uma tonelada cada uma
revelaram possuir impurezas com média amostral igual a 23 kg e desvio padrão amostral igual a
9 kg. Assumindo alfa igual a 4% e população normalmente distribuída, seria possível discordar da
construtora? R: t = 3,875 (rejeita)

07. Um empresário pretende montar um negócio num bairro de Curitiba, em que transitam em
média e no mínimo, segundo morador do local, 1.500 pessoas por dia. Para o tipo de bairro em
questão, é possível supor que o número médio de pessoas que transitam tem distribuição próxima
à de Student, podendo-se aceitar o desvio padrão como sendo igual a 200 pessoas. Uma amostra
aleatória formada por 12 observações revelou que passariam pelo local escolhido 1.400 pessoas
por dia, em média. Pode-se aceitar a alegação do morador? Assuma α = 5% e suponha população
normalmente distribuída. R: z = - 1,732 (rejeita)

08. Um hotel afirma receber em média, no mínimo, 450 hóspedes por mês. Uma operadora
turística, interessada em comprar o hotel, observou a frequência mensal do hotel durante dois
anos. Encontrou uma média igual a 400 hóspedes/mês, com um desvio padrão associado igual a
60 hóspedes por mês. O que se pode afirmar acerca da alegação do hotel? Assuma um nível de
significância igual a 2% e suponha população normalmente distribuída. R: t = - 4,082 (rejeita)

09. Uma grande rede de lanchonetes afirma que suas vendas médias são exatamente iguais a
$ 10,00. Uma amostra aleatória formada por 16 vendas apontou uma média igual à $ 9,00. Supõe-
se que o desvio padrão populacional das vendas é igual a $ 3,00, sendo as vendas normalmente
distribuídas. O que pode ser dito sobre a alegação? Assuma H1 como média populacional diferente
de $ 10,00 e adote 5% de nível de significância. R: z = - 1,33 (aceita)

PROBABILIDADE E ESTATÍSTICA
92

TESTE DE UMA AMOSTRA PARA PROPORÇÃO

Teste de uma amostra para proporção difere do teste de amostra para média apenas no que diz
respeito aos dados amostrais. Geralmente se referem a variáveis qualitativas, sendo apresentados
sob a forma de contagem ou frequência relativa, ao invés de médias. A confrontação de uma
frequência ou probabilidade alegada com os dados de uma a mostra geralmente costuma ser feita
com grandes amostras. A distribuição costuma ser aproximada pela curva normal. O valor da
estatística teste z, pode ser apresentada como:

p - po
z=
p.(1 - p)
n

Ζ = estatística de teste p = proporção amostral po = proporção alegada para a população


n = número de elementos na amostra

EXEMPLO
A análise de uma amostra de 600 leitoras da revista Ioga revelou que 62% possuem habilitação.
Poderia esta amostra ter sido retirada de uma população que tivesse exatamente 60% de leitoras
habilitadas? Considere um nível de confiança igual a 95%.
R: z = 1,0093 Aceita Ho.

02. Um produtor afirma que 60% dos peixes de uma represa pesam mais que 1kg. O comprador,
para testar a hipótese do vendedor, tomou uma amostra de 200 peixes, dos quais 104 pesaram
mais de 1kg. Fazer um teste de hipóteses para testar as hipóteses: H0: p = 60% VS H1: p < 60%
(a = 0,10).

PROBABILIDADE E ESTATÍSTICA
93
EXERCÍCIOS
01. Um fabricante de creme dental alega que em no máximo 3% dos casos seus produtos
apresentam menos de 100 g por embalagem. Uma amostra aleatória com 300 produtos revelou
que 14 possuíam menos de 100 g. Assumindo alfa igual a 5%, é possível dizer que o fabricante
está mentindo? R: z = 1,3686 (aceita)

02. Uma agência de propaganda alega que pelo menos 19% das pessoas que assistem a um
determinado filme comercial exibido no horário nobre da televisão são capazes de recordá-lo
durante os 30 dias seguintes. Um pesquisador independente questionou 350 telespectadores
diferentes e encontrou que apenas 64 foram capazes de recordar o comercial após 30 dias. Estaria
a agência de publicidade mentindo? Assuma alfa igual a 1%. R: z = - 0,3457 (aceita)

03. Um fabricante de pesticidas afirma que em no máximo 2% das aplicações seus produtos
causam problemas ambientais considerados sérios. Após estudar 560 aplicações, o Ministério da
Agricultura encontrou que 15 aplicações haviam causado sérios danos ao meio ambiente. É
possível aceitar a alegação da indústria? Considere um nível de confiança igual a 95%.
R: 0,9946 (aceita)

04. A partir de uma pesquisa sobre duas companhias telefônicas, constatou-se que, de uma
amostra formada por 200 pessoas, 110 preferiam a companhia A. É possível afirmar que a
telefônica A tem a preferência? Suponha um nível de significância igual a 6%.
R: z = - 1,4213 (aceita)

05. Uma grande rede de academias de ginástica alega que no mínimo 80% de seus equipamentos
utilizados pelos alunos estão em boas condições de uso. De uma amostra de 160 equipamentos,
90 estavam em más condições de uso. Será que é possível aceitar a afirmação da rede? Use
α = 5%. R: z = - 9,2431 (rejeita)

Tabela z

PROBABILIDADE E ESTATÍSTICA
94

z 0 1 2 3 4 5 6 7 8 9

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0754
0,2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0,3
0,1 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
0,4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879

0,5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224

0,6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549
0,7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852
0,8 2881 2910 2939 2967 2996 3023 3051 3078 3106 3133
0,9 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389

1,0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621

1,1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830
1,2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015
1,3 4032 4049 4066 4082 4099 4115 4131 4147 4162 4177
1,4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1,5 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441

1,6 4452 4463 4474 4484 4495 4505 4515 4525 4535 4545
1,7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633
1,8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706
1,9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767
2,0 4772 4778 4783 4788 4793 4798 4803 4808 4812 4817

2,1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
2,2 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2,3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2;4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2,5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952

2,6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964
2,7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
2,8 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981
2,9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986

3,0 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990

3,1 4990 4991 4991 4991 4992 4992 4992 4992 4993 4993
3,2 4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3,3 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997
3,4 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998
3,5 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998
3,6 4998 4998 4999 4999 4999 4999 4999 4999 4999 4999
3,7 4999 4999 . 4999 4999 4999 4999 4999 4999 4999 4999
3,8 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,500 0,5000

PROBABILIDADE E ESTATÍSTICA
95
Tabela t (student)

PROBABILIDADE E ESTATÍSTICA
96
TESTE DE HIPÓTESES COM DUAS AMOSTRAS
TESTE DE IGUALDADE DE MÉDIAS POPULACIONAIS
Outra forma de apresentação de testes de hipóteses pode envolver duas diferentes amostras.
Nestas situações, se deseja decidir se um grupo é diferente de outro. Por exemplo, um professor
poderia comparar a média de amostras de alunos de sexo feminino e masculino, tentando verificar
se as amostras são originárias de populações com médias diferentes. Em outra situação, um
candidato a governador poderia comparar sua preferência em amostras de eleitores obtidas na
capital e no interior. Poderia desejar saber se as preferências populacionais seriam iguais ou
diferentes.
Se n1 + n2 ≥ 30 e se os desvios populacionais forem conhecidos
_ _
x1 - x 2
z=
1 2  2 2
+
n1 n2
Se n1 + n2 ≥ 30 e se os desvios populacionais forem desconhecidos
_ _
x1 - x 2
z=
s12 s22
+
n1 n2
Se n1 + n2 < 30 e se os desvios populacionais forem desconhecidos e n1 = n2
_ _
x1 - x 2
t=
s12 s22
+
n1 n2
Se n1 + n2 < 30 e se os desvios populacionais forem desconhecidos e n1 ≠ n2
_ _
x1 - x 2
t=
(n1 - 1)s12 + (n2 - 1)s22 1 1
[ ].( + )
n1 + n2 - 2 n1 n2
Concluir pela aceitação (se o valor amostral cair na RA) ou rejeição de H O (se o valor amostral cair
na RR) pela comparação com o valor obtido no passo anterior com RA e RC.

EXEMPLOS

PROBABILIDADE E ESTATÍSTICA
97
01. A indústria de chocolates Delícia afirmava que seus chocolates eram os mais vendidos, em
média, no canal de distribuição de supermercados, quando comparados com as vendas do rival,
chocolates Saboroso. Duas amostras com 14 observações cada obtidas em 14 lojas revelaram os
dados apresentados no quadro. É possível aceitar a hipótese que ambas vendem a mesma
quantidade média de chocolate com nível de confiança de 95%.

02. Duas amostras de notas finais de alunos de diferentes escolas constituídas por 20 e 30 alunos
foram examinadas. Na primeira, o grau médio foi 54, com desvio padrão 7. Na segunda, a média foi
58, com desvio padrão 6. Deseja-se testar se há uma diferença significativa entre as médias
populacionais das duas escolas, ao nível de significância de 0,05.

03. Um professor de cálculo desconfiava que os alunos do turno vespertino estudavam com
intensidade maior do que os alunos do turno da noite, que seria refletido na média das notas de
ambos os grupos. Assim, o professor desejava testar a hipótese alternativa da média das notas da
tarde ser maior que as médias das notas da noite. Uma amostra aleatória por 37 alunos da tarde
revelou uma média em cálculo igual a 7,2, com um desvio padrão amostral igual a 1,4. Outra
amostra, formada por 33 alunos da noite, revelou uma média igual a 6,7, com desvio padrão
amostral igual a 0,8. Considerando um nível de confiança igual a 95%, pede-se testar a
desconfiança do professor de cálculo.

TESTE DE IGUALDADE DE PROPORÇÕES POPULACIONAIS

p1 - p2
z= x1 x _ x + x2
_ _ 1 1 p1 = , p2 = 2 e p = 1
p .(1 - p).( + ) n1 n2 n1 + n2
n1 n2

EXEMPLO
01. A fábrica de TV Tela Grande constatou que a proporção de TV fabricados com defeito era
35 em cada amostra de 10000 televisores fabricados. Sua concorrente, a fábrica Tela
Pequena, constatou 50 unidades com defeito em uma amostra de 12000 televisores
produzidos. Pede-se testar a afirmação da qualidade de produção da Tela Grande ser
inferior a da Tela Pequena, assumindo um nível de significância, alfa, igual a 5%.

TESTE DE IGUALDADE DE MÉDIAS POPULACIONAIS


01. Dois fabricantes de automóveis possuíam o intuito de verificar qual dos dois veículos seria o
mais econômico. Após analisar uma amostra de 22 automóveis das duas marcas, obteve-se o

PROBABILIDADE E ESTATÍSTICA
98
resultado apresentado a seguir. Seria possível afirmar que o carro Andaluz é menos econômico,
isto é, que apresenta uma média populacional inferior que o do Reluzente? Assuma alfa igual a 3%
e populações normalmente distribuídas.

02. Automóvel Tamanho da Média de consumo Desvio padrão Uma


amostra
Andaluz 12 unidades 14 km/l 2 km/l
Reluzente 10 unidades 15 km/l 4 km/l

empresa fabricante de telefones celulares afirma que a duração média em horas (em stand by) da
sua bateria é superior à duração da concorrente. Duas amostras formadas por 40 baterias do
fabricante e 40 do concorrente apresentaram médias iguais a 65 e 60 horas, com desvio padrão de
2 e 3 horas, respectivamente. Seria possível supor que a bateria da empresa do fabricante tenha
maior duração? Suponha um nível de confiança igual a 98%.

03. Um fabricante de pneus produz dois tipos principais: A e B. Para o tipo A, estima que o desvio
padrão populacional seja igual a 2.300 km, e para o tipo B, 2.500 km. Uma empresa de táxis testou
35 pneus do tipo A e 40 do tipo B, obtendo 2.200 km e 2.400 km de duração média dos respectivos
tipos. Adotando-se um nível de significância de 4%, teste a hipótese de que a vida média dos dois
tipos seja a mesma.

04. Ao verificar a eficiência dos funcionários de uma fábrica de sapatos, uma amostra de 6
funcionários da Ala C apresentou uma produtividade média de 5,4 unidades/dia, com desvio padrão
de 0,8 unidade/dia. Verificando outra amostra com 5 funcionários da Ala B, observou-se uma
produtividade média igual a 5,2 unidades/ dia, com s igual a 0,6 unidade/dia. Pode-se dizer que os
funcionários da Ala C são mais eficientes?

05. Assuma um nível de confiança igual a 97% e suponha populações normalmente distribuídas.
Numa comparação de aprovação no vestibular de uma importante universidade, seis alunos de
colégios particulares (amostra a) preencheram o gabarito no tempo médio de 6,4 min, (desvio
padrão igual a 60 segundos). Outra amostra foi formada por cinco alunos selecionados
aleatoriamente do mesmo universo (amostra b). Após realizarem treinamento para preenchimento
de gabaritos, constatou-se que estes cinco alunos realizaram a tarefa em um tempo médio de 5,9
minutos, com desvio padrão de 60 segundos. Pede-se:
PROBABILIDADE E ESTATÍSTICA
99
a) no estudo da eficácia do treinamento, quais hipóteses poderiam ser formuladas?
b) caberia um teste bilateral ou unilateral?
c) assumindo alfa igual a 2% e populações normalmente distribuídas, o que poderia ser dito sobre
a eficácia do teste?

06. Em um teste recente sobre a eficácia de Treinamentos Baseado em Computador, TBCs, no


aprendizagem de Matemática Financeira, foram estudados os resultados de dois grupos distintos,
formados por alunos escolhidos aleatoriamente de uma instituição de ensino:
a) Grupo Ensino em Micro: recebeu treinamento exclusivamente em microcomputadores, com
software apropriado e sem auxílio de professores ou monitores;
b) Grupo Ensino em Sala: realizou curso convencional em sala de aula.
As notas obtidas pelos dois grupos estão apresentadas na tabela seguinte. A um nível de
significância de 5%, pode-se afirmar que o treinamento em computador é eficaz? Assumem-se
populações normalmente distribuídas.

Grupo N Média de consumo Desvio padrão


Em micro 9 7,32 1,78
Em sala 15 6,28 2,25

TESTE DE IGUALDADE DE PROPORÇÕES POPULACIONAIS

01. A Distribuidora de Doces Divinos Ltda., em recente pesquisa realizada na faculdade com 400
alunos do curso de Administração dos turnos vespertino e noturno (200 alunos de cada turno),
afirmou que mais alunos do turno noturno consumiam seus produtos em relação aos do turno
vespertino. E possível aceitar essa alegação? Sabe-se que 45% dos alunos do turno matutino
consumiam regularmente os doces, contra 52% do noturno. Assuma 91% como nível de confiança.

02. Dois grupos, T e S, são formados, cada um, por 180 pessoas que têm uma determinada
enfermidade. O grupo T, denominado grupo de controle, recebeu a medicação tradicional,
enquanto o grupo S recebeu um novo soro, recentemente desenvolvido. Verificou-se que 80 e 60
pessoas do grupo T e S, respectivamente, curaram-se da enfermidade. Testar a hipótese de o soro
auxiliar a cura da enfermidade, adotando-se o nível de significância igual a 0,01.

03. Uma empresa de pesquisa de opinião pública selecionou, aleatoriamente, 500 eleitores da
Bahia e 600 de Pernambuco, e perguntou a cada um se votaria ou não no candidato Honesto Certo

PROBABILIDADE E ESTATÍSTICA
100
nas próximas eleições presidenciais. 80 eleitores da Bahia e 150 de Pernambuco responderam
afirmativamente. Existe alguma diferença significativa entre as proporções de eleitores a favor do
candidato nos dois Estados? Use o nível de significância igual a 6%.

04. Estão em testes dois processos para a fabricação de chuveiros. Numa sequência de 2.000
chuveiros, o processo 1 gera 70 rejeições, enquanto o processo 2 acusa apenas 100 rejeições.
Pode-se, considerando alfa igual a 5%, concluir que a qualidade de fabricação dos dois processos
seja diferente?

05. Numa pesquisa sobre o fornecimento de água tratada, encontraram-se 130 das 200 casas
pesquisadas do bairro A e 250 das 400 residências do bairro B. Há diferença significativa entre a
proporção de possuidores de água tratada nos dois bairros? Sabe-se que o nível de significância é
igual a 10%.

PROBABILIDADE E ESTATÍSTICA
101
BIBLIOGRAFIA

MARQUES, Clandio T. Polígrafo de ESTATÍSTICA I para o Curso de Ciências Contábeis:


Centro Universitário Franciscano, Santa Maria, 2011.

MARQUES, Clandio T. Polígrafo de ESTATÍSTICA I para o Curso de Matemática: Centro


Universitário Franciscano, Santa Maria, 2011.

P.A. Morettin, W. de O. Bussab, “Estatística Básica”, 5a Ed., São Paulo: Saraiva, 2002.

www.pucrs.br/famat/rossana/educacao1/Medidas_de_Posicao.ppt
www.uff.br/.../medidasposicao/medidasposicao.../Medidas..

PROBABILIDADE E ESTATÍSTICA

Você também pode gostar