Você está na página 1de 74

SISTEMA FAESA DE EDUCAÇÃO

ASSOCIAÇÃO EDUCACIONAL DE VITÓRIA

MATERIAL DE ESTUDO
para acompanhamento na sala de aula

PROBABILIDADE E ESTATÍSTICA

Professora Lúcia Helena Sagrillo Pimassoni

Agosto, 2017.
APRESENTAÇÃO DA DISCIPLINA

UNIDADE I – INTRODUÇÃO

I.1 Definição:

O Que é Estatística?
É um conjunto de métodos para planejar experimentos, obter dados, organizá-los,
resumi-los, analisá-los, interpretá-los e deles extrair conclusões.

I.2 Divisão da Estatística


A estatística pode ser dividida em três grupos para seu estudo:
 A estatística descritiva
Compreende a organização, o resumo e, em geral, a simplificação de informações. A
finalidade é tornar as informações mais fáceis de entender, de relatar e de discutir.
 A teoria da probabilidade
É uma ferramenta útil para analisar situações que envolvem o acaso. Ex.: Jogos de
azar, decisão quanto a investimentos em determinados fundos e outros.
 A estatística inferencial
- Diz respeito à análise e interpretação de dados amostrais.
- É um processo pelo qual podemos conhecer uma população a partir de uma amostra
desta mesma população (“não preciso comer um bolo inteiro para saber se é bom”).
- A idéia básica é efetuar determinada mensuração sobre uma parcela pequena, mas
típica, de determinada “população” e utilizar essa informação para fazer inferência
sobre a população toda.

I.3 Uso da Estatística

A estatística no curso de Engenharia tem como objetivo principal:

Desenvolver a habilidade na resolução de problemas, o que inclui a capacidade de


reconhecer qual técnica se aplica à determinada situação e utilizá-la eficazmente na
resolução do problema.

I.4 Histórico da Estatística


O histórico da estatística deve ser lido no seguinte endereço eletrônico:
ftp://ftp.usjt.br/pub/revint/191_41.pdf

2
UNIDADE II – NOÇÔES DE PLANEJAMENTO DE EXPERIMENTOS

II.1 Conceitos Básicos


a) População: é uma coleção completa de todos os elementos (valores, pessoas,
medidas, etc.) de interesse em um determinado estudo.
b) Censo é o estudo de toda a população. Muito custoso e demanda muito tempo. A
informação pode tornar-se obsoleta. A amostra apresenta a vantagem de ter um custo
menor e demandar menos tempo.
c) Amostra é um subconjunto de elementos extraídos da população, é uma parte
representativa da população. Muitas das vezes, por restrições de custo, tempo,
material, etc. adotamos apenas uma parte da população para estudo – a amostra.

Figura 1. População e Amostra

II.2 Noções de amostragem


Experimentos aleatórios são procedimentos estímulo-resposta a que submete-se um
objeto em estudo que, ao serem repetidos sob as mesmas condições, não produzem
as mesmas respostas. Por essa razão, o planejamento de experimentos aleatórios é
uma atividade necessária para se descobrir informações fidedignas, apesar das
respostas diferentes a cada repetição sobre um processo ou sistema em particular. A
principal vantagem do planejamento é a economia de tempo, custos e a redução da
variabilidade nos resultados, o que permite conhecer melhor o objeto estudado
(Montgomery, 2001). Uma aplicação na indústria é a inspeção por amostragem, já na
área ambiental coletas de unidades amostrais são necessárias a elaboração de planos
de gerenciamento de resíduos sólidos, verificação de condicionantes, etc.

Para a perfeita execução de um planejamento de experimentos é essencial definir a


unidade experimental (elemento do qual serão extraídas as informações) e o que será
observado (variáveis). Além disso, se forem realizadas comparações entre grupos ou
métodos, deve-se defini-los claramente.

Etapas de um Planejamento do Experimento:

3
 Definição do Problema e objetivo da pesquisa.
 Organização da pesquisa
 Coleta dos dados
 Análise estatística do problema
 Conclusões

Amostragem e Inferência Estatística

Através do plano de amostragem é possível coletar uma amostra representativa da


população e realizar inferência estatística.

“Um plano de amostragem consiste em obter uma regra de ação que, aplicada a uma
série de lotes, permite aceitar lotes de certa qualidade, com um risco calculado”.
(definição dada em controle de qualidade)

Em geral, quanto MAIOR a precisão, MAIOR é o CUSTO envolvido (maior


tamanho de amostra global e, portanto, maior número de incrementos; maior
número de pontos de coleta; melhores técnicas de preparação e melhores
tecnologias de análise).

A NBR ISO sugere diversas tabelas para determinação de número mínimo de


incrementos (amostras) para diversas situações nas indústrias.

Segundo GÓES, M. A. C. de; LUZ, A. B. da; POSSA, M. V. Amostragem


(Comunicação técnica elaborada para a 4ª edição do livro de Tratamento de
Minérios). Rio de Janeiro: CETEM, 2004:

“Uma amostragem mal conduzida pode resultar em prejuízos vultosos ou em


distorções de resultados com consequências técnicas imprevisíveis”.

4
“A amostragem é, sem dúvida, uma das operações mais complexas e passíveis
de introduzir erros, principalmente nas indústrias da mineração e metalurgia”.

“Uma boa amostragem não é obtida tendo-se como base apenas o juízo de valor
e a experiência prática do operador”.

EXEMPLO DE APLICAÇÃO NA INDÚSTRIA: amostragem de material em vagões,


caminhões ou containers, material em polpa onde ocorra sedimentação e não seja
possível a homogeneização, amostragem de minério oriundo de diferentes frentes de
lavra etc.

II.3 Tipos de Amostragem

1. Amostragem Intencional (não probabilística): Seleciona elementos ou amostras


que consideramos serem típicas ou representativas da população. Amostras de água
poluída e não poluída.

2. Amostragem Probabilística: Associa a cada elemento da população uma chance


(probabilidade) de fazer parte da amostra. Os resultados podem ser estendidos para a
população com um determinado grau de confiança.

Tipos de amostragem probabilística

2.1 Amostragem Aleatória Simples:


Todo elemento tem a mesma chance de ser escolhido.
Faz-se uma lista dos elementos da população e sorteiam-
se os elementos que farão parte da amostra. Pode-se
utilizar a tabela de números aleatórios.

2.2 Amostragem Sistemática: os elementos da população apresentam-se ordenados


e são retirados periodicamente, ou seja, são selecionados elementos de ordem k da
população. Geralmente são se relacionam com as características da população.
Exemplo: Suponha que é necessário constituir uma amostra de 30 alunos de uma sala
de 90. Poderiam ser escolhidos, sequencialmente, os alunos cujo número na lista de

5
chamada é de ordem k = 3 (pois 90/30 = 3). Seriam escolhidos: 3, 6, 9, …, 90 (1.k, 2.k,
3.k, ...., 30.k). Em outro exemplo imagine que se queira escolher as famílias residentes
a cada k casas, até compor o total necessário. Assim, começando por uma
extremidade de uma rua do bairro, poderiam ser tomadas das casas de ordem 5, o
que corresponderia a entrevistar a primeira família, pular 4 casas novamente e
entrevistar a segunda família, e assim por diante.

2.3 Amostragem Estratificada: consiste em dividir a população em grupos


homogêneos e proceder a retirada de uma amostra aleatória simples ou sistemática
dentro de cada estrato.

2.4 Amostragem por Conglomerados: É aquela na qual as unidades de amostragem


estão geograficamente reunidas em grupos e seleciona-se amostras aleatórias dentro
do cluster.

6
PRIMEIRA LISTA DE EXERCÍCIOS

1. Identifique o tipo de amostragem (aleatória, estratificada, sistemática e


conglomerados) utilizada em cada um dos casos seguintes:
a) Um psicólogo da FAESA faz uma pesquisa sobre o nível de agressividade dos
alunos. Para o estudo o psicólogo escolheu 1000 alunos através de um sorteio pelo nº
da matrícula.
b) A indústria de chocolate seleciona um a cada 1000° bombom de sua linha de
produção e faz um teste em relação ao sabor.
c) Para estudar a satisfação dos alunos da FAESA foi coletada uma amostra de 30
alunos por curso.
d) Para estudar a percepção de certa população em relação a uma indústria, foram
sorteados alguns bairros com características similares e depois foram selecionados os
elementos aleatoriamente.

2. Suponha que em uma escola se queira tomar uma amostra sistemática de alunos
do ensino fundamental. A quantidade de alunos no ensino fundamental é de 5000
alunos. Considere um tamanho de amostra de 200. Explique como faria todo o
levantamento da amostra.

3. Suponha que do total das empresas no setor de mármore do ES, 1500 estão com
certificação ambiental e 500 não. Para realizar um estudo sobre as empresas será
necessária uma coleta de amostra. Considere uma amostra de 150 empresas. Como
seria a distribuição da amostra se fosse realizada uma amostragem estratificada
proporcional ao tamanho do estrato?

UNIDADE 3 – ESTATÍSTICA DESCRITIVA

A Estatística Descritiva permite-nos organizar, resumir, descrever e compreender um


conjunto de dados.

3.1 Variáveis

As características que observadas (ou medidas) em cada elemento da população, sob


as mesmas condições são Variáveis. As variáveis originam valores que tendem a
exibir certo grau de variabilidade quando se fazem mensurações repetidas. Ex.:
quantidade de café servida no copo por uma máquina, idade dos estudantes de

7
engenharia, estado civil, etc. Assim, Dados Estatísticos são observações da realidade
que nos cerca. Podem ser fatos ou números.

“A técnica estatística depende da


natureza do dado/variável”.

De acordo com sua natureza os dados podem ser classificados como: dados
qualitativos ou quantitativos.

3.1.1 Dados qualitativos (ou categóricos): são aqueles nos quais as características
de um elemento são fornecidas por um nome ou por um rótulo. Por exemplo, a cor da
camisa de alunos pode ser branca, amarela, verde, vermelha, etc. O nome “branca”
está caracterizando o elemento observado (neste caso, o aluno). Os dados qualitativos
são classificados como:

a. Qualitativos Nominais: são dados que podem ser separados em categorias


chamadas de não mensuráveis, por exemplo, estado civil, tipo de acomodação,
marcas de carro, estado civil, tipo de transporte, e outros.

b. Qualitativos Ordinais: envolvem dados que podem ser dispostos em alguma


ordem. O nível ordinal dá informações sobre comparações relativas, mas os graus de
diferença não servem para cálculos. Os dados em nível ordinal não devem, pois, ser
utilizados em cálculos.
Ex.: Opinião em relação ao atendimento de navios por empresas de logística.
Excelente bom fraco muito fraco

3.1.2 Dados quantitativos: são aqueles nos quais as características do elemento


observado é uma quantidade. Por exemplo, saldo em conta corrente de um
determinado cliente, peso, estatura, resistência de certo material e material particulado
em determinada hora. Os dados quantitativos são classificados como:

a. Quantitativos Discretos: assumem valores inteiros. Os dados discretos são


resultantes da contagem de um número de itens. Resultam de um conjunto finito de
valores. Ex.: nº de táxis que circulam na cidade de Vitória por dia, nº. de pessoas

8
diárias por ônibus do sistema Transcol, nº de crianças internadas porque foram
expostas a poluição atmosférica, etc.

b. Quantitativos Contínuos: assumem qualquer valor num intervalo de valores. São


dados resultantes de medições. Resultam de um número infinito de valores possíveis.
Ex.: temperatura da cidade de Vitória, peso por caminhão carregado de pedras de
mármore, quantidade de energia gasta por dia na cidade de Vitória e outros.

Após os dados serem coletados eles devem ser organizados em uma planilha para
que se possa realizar a análise estatística. Abaixo é mostrado um exemplo de Planilha
para organização de dados coletados.

elemento VAR 1 VAR2 … VARp


1
2
3
4




n

3.2 Formas de organização e apresentação de dados: Métodos Tabulares e


gráficos

Ao estudarmos grandes conjuntos de dados, é conveniente organizá-los e resumi-los.


Os dados qualitativos ou quantitativos discretos podem ser apresentados ou
organizados das seguintes maneiras:
 Tabela de Frequências
 Gráfico de Barras/Colunas
 Gráfico de Setores e outros.

Os dados quantitativos contínuos podem ser apresentados ou organizados em


classes das seguintes maneiras:
 Tabela de frequências em classes
 Histogramas

9
 Polígono de frequências
 Curvas de frequências e outros.

3.2.1 Tabela de Frequências


É uma tabela na qual numa das colunas aparecem os valores observados da variável
aleatória e nas demais colunas aparecem às frequências de ocorrência dos
respectivos valores. Essas colunas contêm as seguintes frequências:
 Frequências observadas.
 Frequências acumuladas.
 Frequências relativas.
 Frequências relativas acumuladas.

 Frequência observada (fi) é o número de vezes que cada valor se repete.

 A Frequência relativa (fri) fornece a relação entre a frequência observada de um


determinado valor e o número total de observações realizadas no experimento, ou
seja, é a frequência observada divida pelo total de elementos.

Exemplo: Suponha que foi realizado um estudo com as “classes taxonômicas” de


algas planctônicas encontradas em 20 amostras de um corpo receptor da ETE de
Jardim Camburi. O resultado foi o seguinte:

Bacillariophyceae Bacillariophyceae Cyanophyceae Euglenophyceae


Cyanophyceae Euglenophyceae Bacillariophyceae Bacillariophyceae
Bacillariophyceae Cyanophyceae Euglenophyceae Bacillariophyceae
Cyanophyceae Bacillariophyceae Cyanophyceae Euglenophyceae
Bacillariophyceae Bacillariophyceae Bacillariophyceae Bacillariophyceae

A Tabela de distribuição de frequências ficará assim:

Classes Frequênci a %
Bacil lariophyceae 11 55,0
Cyanophyceae 5 25,0
Eugl enophyceae 4 20,0
Total 20 100,0

 Frequência acumulada (Fi) contabiliza as observações até o valor considerado.


Pode ser calculada somente para variáveis numéricas.

10
Exemplo: Nº de livros por aluno

Nº de livros frequência observada (fi) frequência acumulada (Fi)


3 2 2
5 1 2+1 = 3
6 3 3+3=6
8 1 6+1=7
Total 7 -

 Frequência relativa acumulada (Fri) fornece a relação entre a frequência


acumulada e o nº. Total de observações realizadas.

3. 2.2 Gráfico de Barras/Colunas


 No eixo horizontal deve ser colocada a variável sob estudo.
 No eixo vertical a frequência (observada, acumulada ou relativa).
 É traçada, para cada valor (atributo) da variável, uma barra com comprimento
proporcional à frequência.
 O eixo vertical e horizontal pode ser invertido, ou seja, a variável pode ser
colocada no eixo vertical e a frequência no eixo horizontal (gráfico de barras).

Exemplo:
Figura 1. Título da figura.
12

10
Frequência

2
Bacillariophyceae Euglenophyceae
Cyanophyceae

Classes

3.2.3 Gráfico de Setores


 Consta de um círculo dividido em setores, cada setor relacionado a um valor da
variável a ser representada.

11
 A abertura angular de cada setor é proporcional à frequência observada para cada
valor.
Abaixo é mostrado um exemplo do gráfico de setores (pizza).

Figura 2. Classe socioeconômica.

13%
A
40%
20% B
C
D

27%

3.2.4 Tabela de Frequências para dados agrupados em classe


É constituída da mesma forma que para dados não agrupados, com a diferença de
que agora os valores da variável a ser descrita passam a ser organizados por classes.
 O nº de classes deve ficar entre 5 e 20;
 Se menor do que 5, aproximar para 5;
 Se maior do que 20, aproximar para 20.
Exemplo de dados agrupados em classe para estaturas de alunos do curso de
engenharia ambiental/FAESA:

Tabela 1. Estatura de alunos do curso de engenharia ambiental*.


Estaturas (cm) fi
150 |-- 154 2
154 |-- 158 3
158 |-- 162 1
162 |-- 166 2
Total 8
*Amostra de 8 alunos da FAESA.

Dada à seqüência: 1, 2, 3, 4, 5, 6, 7, 8. Podem-se representar intervalos das seguintes


formas:
 Intervalo aberto: 1 --- 8 = 2, 3, 4, 5, 6, 7

12
 Intervalo fechado: 1 |---| 8 = 1,2,3,4,5,6,7,8
 Intervalo fechado à esquerda: 1|--- 8 = 1,2,3,4,5,6,7
 Intervalo fechado à direita: 1 ---| 8 = 2, 3, 4, 5, 6, 7, 8

Uma tabela de frequência em classe possui os seguintes termos:

 Classes: são os intervalos de variação da variável. Denotamos por k o nº de classes


da distribuição.
 Limites de Classe: são os extremos de cada classe sendo li o limite inferior e Li o
limite superior da classe i.
 Amplitude de um intervalo de Classe: é obtida pela diferença entre o limite
superior e o limite inferior dessa classe.

Amplitude=Li - li
 Frequência simples ou absoluta (fi): é o nº de observações contidas em cada
classe.
Como montar uma tabela de frequência para dados contínuos?

1. Determinar o número de classes: k  n , onde n é o nº de observações. Caso


k não seja inteiro arredondar para o inteiro mais próximo.

2. Determinar a amplitude ou largura de cada classe: Identifica-se o maior e o


menor valor do conjunto de dados, assim a largura da classe pode ser determinada
por:

Maior valor dos dados  Menor valor dos dados


Amplitude da classe 
N º de classes

Exemplo: Um gerente de uma loja mandou realizar um estudo a respeito do valor das
compras feitas por seus clientes. Foi colhida uma amostra aleatória de 50 compras
realizadas por seus clientes e o resultado foi o seguinte:
VALORES DAS COMPRAS (R$)

315,10 129,00 174,80 202,30 218,20 224,50 236,10 249,20 269,00 284,10
328,00 228,30 238,00 289,00 252,40 270,80 142,50 175,40 204,30 219,70
152,40 186,80 149,30 180,40 208,40 219,90 161,80 195,40 211,50 220,80
169,70 199,10 213,00 215,80 221,90 229,10 239,20 259,30 271,60 293,20
232,80 242,50 262,80 274,50 296,10 235,40 246,70 265,10 281,00 302,10

13
1. Determinar o número de classes = k  n  50  7,07  7
2. Determinar a amplitude de cada classe
Maior valor  Menor valor 328  129
Amplitude da classe    28,4  29
Número de classes 7
OBS.: A amplitude da classe foi arredondada para cima, pois o número de classes já
havia sido arredondado para baixo.

Para se formar as classes tomam-se o menor valor do conjunto de dados, 129, e soma
a ele a amplitude, 29, obtendo assim o limite superior da classe 158, os outros limites
são obtidos sempre se somando a amplitude, 29, até formar 7 classes. A frequência
observada é obtida contando-se a quantidade de elementos no intervalo, ou seja, de
129 a 159 (não incluindo esse extremo) existem 4 valores, e assim sucessivamente.
As outras frequências são obtidas da mesma forma que para dados não agrupados
em classe.
Classes Frequência observada
129 |-- 158 4
158 |-- 187 6
187 |-- 216 8
216 |-- 245 14
245 |-- 274 9
274 |-- 303 7
303 |-- 332 2
Total 50

3.2.5 Histogramas
 Cada classe é representada por um retângulo.
 A base do retângulo é o intervalo de classe.
 A altura do retângulo é proporcional à frequência da classe.
 A área do histograma é proporcional à soma das frequências, se usarmos a
frequência relativa a área sob a curva vale 1.

A figura abaixo mostra um exemplo de histograma.

14
3.2.6 Polígono de Frequências

 Nesse gráfico as classes são representadas pelos seus pontos médios.


 O polígono é formado pela união, por retas, dos pontos médios das partes
superiores de cada retângulo do histograma.

A Figura abaixo mostra um exemplo de polígono de frequência.

3.2.7 Diagrama de Pareto

É recurso gráfico utilizado para estabelecer uma ordenação nas causas de


perdas que devem ser sanadas, ou seja, prioriza a ação que trará o melhor
resultado. O diagrama é uma ferramenta da qualidade e baseia-se no princípio
de que a maioria das perdas tem poucas causas.

Princípio 80-20: 80% das consequências decorrem de 20% das causas.


Exemplo: Analisando as reclamações dos clientes obtidas pelo SAC da
empresa MSM alimentos, percebemos que o maior número de reclamações
decorre de problemas com o atendimento de nossos funcionários e atrasos nas
entregas e que ao sanar 2 problemas resolve-se 80% das nossas falhas.

A idéia é: “a maior parte dos defeitos, falhas, reclamações e seus custos


provêm de um número pequeno de causas”.

15
SEGUNDA LISTA DE EXERCÍCIOS

1) Classifique cada uma das variáveis abaixo e indique uma forma de representação
gráfica:
a) Tipos de defeitos em placas de aço.
b) Resistência de certo tipo de cimento.
c) Grau de satisfação da população em relação à reimplantação da Samarco no
Município de Anchieta (muito satisfeito, satisfeito, pouco satisfeito, insatisfeito).
d) Nº de amostras de água contaminadas em um lote coletado pela Cesan.
e) Tempo para fazer um teste (min)
f) Número de alunos aprovados por turma
g) Nível de escolaridade
h) Material particulado na atmosfera (µg/m 3)
i) Gastos com alimentação (R$)
j) Nº de acertos em uma prova objetiva
k) Religião
l) Valor de um imóvel (R$)
m) Nº de peças defeituosas por lote
n) Classificação em um concurso.

2) A força de remoção para um conector é medida em um teste de laboratório. Dados


para 40 corpos de prova são mostrados a seguir.

150 185 195 205 212 225 241 249


165 190 195 205 213 235 245 250
168 190 198 205 218 236 245 260
170 194 199 210 220 237 245 270
180 194 200 210 220 238 248 280

Monte uma distribuição de frequências em classe. Desenhe o histograma e o polígono


de frequências.

16
3) Considerando a distribuição de frequência da viscosidade para um produto químico
observado de hora em hora (amostra de 250 horas). Calcule a frequência observada,
frequência acumulada e a frequência relativa acumulada.

Viscosidade f i (%)
40 |-- 44 20
44 |-- 48 10
48 |-- 52 37
52 |-- 56 18
56 |-- 60 15
Total 100

4) Elabore uma tabela de frequência baseada no gráfico abaixo:

5) Elabore uma tabela de frequência baseada no histograma e considerando uma


amostra de estaturas (cm) de 20 alunos da turma:

17
3.3 Resumo de Dados

3.3.1 Medidas de Tendência Central

Medidas de Tendência Central são usadas para indicar um valor que tendem a
representar melhor, um conjunto de dados.

1. A média aritmética
Calcula-se a média aritmética determinando-se a soma dos valores do conjunto e
dividindo-se esta soma pelo número de valores do conjunto. Se os dados são de uma

amostra, a média é denotada por x (lê-se: x barra), se os dados são de uma


população, a média é denotada pela letra grega μ (lê-se: mi) .
n

X i
X i 1

n
onde a letra grega Σ é o símbolo do somatório e n é o número de elementos da
amostra.

Algumas propriedades da média aritmética:


 A média de um conjunto de números pode ser sempre calculada.
 Para um dado conjunto de números a média é única.
 A média é sensível a (ou afetada por) todos os valores do conjunto. Assim se um
valor se modifica, a média também se modifica.

Observe que na
figura ao lado, na
média, cada
indivíduo comeu um
frango cada um.

Quando os dados se encontram agrupados em distribuição de frequência, os valores


de x devem ser ponderados pelas respectivas frequências absolutas. Para dados
organizados em classe o ponto médio de cada classe é usado como uma aproximação

18
de todos os valores contidos na classe. Assim na determinação das medidas de
posição para dados agrupados em classe, cada classe será representada pelo seu
ponto central, ou seja, xi será o ponto médio da classe.

Calcula-se a média aritmética para dados agrupados multiplicando cada ponto médio
de classe pela respectiva frequência da classe somando-se os produtos e sendo,
então, a soma dividida pelo número total de observações. Assim,

X i i f
X i 1
n

f
i 1
i

Sendo fi a frequência absoluta e xi o ponto médio da classe se os valores estiverem


organizados em classe.

Exemplo: Considere que uma pesquisa sobre os valores das compras efetuadas em
uma loja de vestuário Trinca localizada em um dos shoppings da cidade utilizou uma
amostra de 480 compras, escolhidas aleatoriamente. Encontre o valor médio de
compra para as duas situações abaixo:

Valores (R$) Nº. de clientes


100 123
145 60
200 77
350 120
400 100
Total 480

2. A média ponderada

Ao calcularmos uma média, podemos cometer enganos, se ignorarmos o fato de que


as grandezas em questão não têm a mesma importância em relação ao fenômeno que
está sendo estudado, por exemplo, a situação em que o professor informe à classe
que haverá dois exames valendo cada um 30% do total de pontos do curso, e um
exame final valendo 40%. O cálculo da média deve considerar os pesos desiguais os
exames.

A média ponderada é uma média na qual cada valor se encontra ponderado de acordo
com sua importância no grupo total.

19
n

X w i i
Xw  i 1
n

w
i 1
i

n
Onde,  X w é a soma dos produtos de cada x pelo seu peso correspondente
i 1
i i

w
i 1
i é a soma dos pesos.

EX.: notas de alunos

Exame inicial Trabalho 1 Trabalho 2 Prova final Média


Peso 1 =3 Peso 2 =1 Peso 3=2 Peso 4 =4 ponderada

3. A média geométrica

Sejam X1, X2, X3, ..., Xn. A média geométrica de X é definida por:

Mg  n x1.x2 .x3 . ... xn

Exemplo: Calcular a média geométrica dos valores:


3, 6, 12, 24, 48

Mg  5 3  6 12 24  48  5 248832  12

20
A Média Geométrica é frequentemente usada quando discutimos taxas de
rendimento em investimento e também em padrões de poluição atmosférica, etc.
Exemplo de aplicação de médias:

4. A moda

A moda é o valor que possui a maior frequência de observação.


 Caso ocorra dois valores com a mesma maior frequência de observação, teremos
um processo bimodal.
 Caso ocorra vários valores com frequência maior de observação, teremos um
processo multimodal.

21
 Caso todos os valores tenham a mesma frequência de observação, teremos um
processo amodal.

Algumas propriedades:
 Fácil de calcular;
 Não é afetada por valores extremos;
 Pode estar afastada do centro dos
valores;
 Não utiliza todos os valores da
variável;
 Nem sempre ela existe e pode existir
mais de uma moda.

Exemplo: Indique a moda para os seguintes conjuntos de dados:


a) 8; 10; 13; 13; 17; 29  moda = 13
b) 1; 3; 7; 9; 15; 20; 5  processo amodal, ou seja, a moda não existe
c) 2; 4; 6; 2; 4; 8; 10; 12; 14; 16  moda = 2 e 4
d) 1; 1; 1; 2; 2; 2; 3; 3; 3; 4; 5; 6; 7; 8; 9; 10  moda = 1, 2 e 3

Classe modal é a classe com a maior frequência de observação. As mesmas


observações feitas para a moda para dados nominais continuam válidas, isto é:
 Processo bimodal: duas classes com a mesma frequência de observação;
 Processo multimodal: várias classes com a mesma frequência de observação;
 Processo amodal: todas as classes com a mesma frequência de observação.
Determinação de valores pontuais representativos da moda:
Fórmula de King :
h fp
mod a  l mo 
f a  fp
Fórmula de Czuber:

h   fm  fa 
mod a  lmo 
2  f m    f a  f p 
Considere:
• lmo = limite inferior da classe modal;
• h = intervalo de classe;
• f m = frequência da classe modal;
• f a = frequência da classe anterior à classe modal;
• f p = frequência da classe posterior à classe modal.

22
3.3.2 Medidas de Posição Relativa

As medidas de posição relativa não são afetadas pelos valores observados. Serão
apresentadas as seguintes medidas:
 Mediana
 Quartis
 Percentis

A mediana e os quartis, e percentis são medidas físicas de posição, não sendo


influenciadas pelos valores observados.

Após a ordenação dos valores, do menor para o maior, a mediana dividirá a série de
observações em 2 partes iguais, os quartis em 4 partes e os percentis em 100 partes.

1. Mediana

A mediana é freqüentemente usada para a renda anual e para dados de valores de


bens, porque algumas rendas ou valores de bens extremamente elevados podem
inflacionar a média, nestes casos a mediana é a melhor medida de posição central.
 Regra prática para achar a posição do elemento que corresponde à mediana:

n
Pos   0,5
2

Se o valor de Pos for inteiro, a mediana é o elemento que ocupa a posição “Pos”. Se o
valor de Pos não for inteiro, a mediana será a média aritmética do elemento que ocupa
a posição inteira anterior e posterior a “Pos”.
 Após a ordenação dos valores, do menor para o maior, a mediana dividirá a série de
observações em 2 partes iguais, ou seja, 50% menores valores se encontram abaixo
da mediana e 50% maiores valores se encontram acima da mediana.

23
Algumas propriedades
 Fácil de calcular;
 Não é afetada por valores
extremos;
 É um valor único;
 Não utiliza todos os valores da
variável.

Exemplo: Considere as notas: 8, 9, 0, 6, 7, 1, 5.


Ordenando-se as notas da turma tem-se: 0, 1, 5, 6, 7, 8, 9. Assim a mediana será
igual a 6.

Qual das três medidas usar? Média, mediana ou moda?


 Quando procuramos conhecer valores médios: a média. Ex.: em controle de
qualidade, a média é utilizada para determinar se o processo está operando ao redor
de um valor esperado, o alvo.
 Se a variável tiver valores extremos, a mediana é mais adequada. Ex.: salário.
 A moda é um valor típico. Variáveis qualitativas. Tipo de transporte mais usado
para determinado tipo de carga.

Se os dados estão organizados em classe deve-se determinar a classe mediana


através da posição:

n
Pos 
2
Aplicar a fórmula à classe mediana:
h  Pos  Fant 
Med  lmed 
f med

• h = Amplitude de classe;
Fant = Frequência acumulada até a classe anterior à que contém a mediana;

• lmed = Limite inferior da classe que contém a mediana;

• lmed = Limite inferior da classe que contém a mediana;


• f med = Frequência da classe que contém a mediana.

24
2. Quartis

 25% das observações estão à esquerda do 1º quartil (Q1).


 50% estão à esquerda do 2º quartil (Q2) e 75% à esquerda do 3º quartil (Q3).

25%
25% 25%
25%

Q1 Q2 Q3

 Regra prática para determinar o elemento que corresponde ao i-ésimo quartil:


Sendo n = o nº. de observações

in
PosQi   0,5
4

Exemplo: Para os dados abaixo calcule o 1º, 2º e 3º quartil.


5, 8, 9, 10, 11, 13, 14, 16, 17, 18, 20, 21

O Quartil para dados em classe é dado por:

h  Pos  Fant  in


Qi  lqi  ; Pos 
f qi 4

3. Percentis

 Os i % das observações estão a esquerda do i-ésimo percentil. Assim, 68% das


observações estão à esquerda (são menores) do 68º percentil e 32% à direita (são
maiores).
 Regra prática para se determinar o elemento correspondente ao i-ésimo percentil:

in
 PosP   0,5 Sendo n o nº. de observações.
i
100

25
O percentil para dados em classe é dado por:

h  Pos  Fant  in


Pi  l pi  ; Pos 
f pi 100

Representação gráfica dos Quartis: Box-plot ou Gráfico de Caixas

O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a distribuição empírica


do dados. É formado pelo primeiro e terceiro quartil e pela mediana.

Exemplo
50

40
Idade (anos)

30

20

10
Grupo1 Grupo 2

GRUPO

3.3.3 Medidas de Variabilidade ou Dispersão

Medidas de dispersão dizem respeito à descrição de um grupo de valores em termos


da variabilidade existente entre os itens incluídos dentro do grupo, ou seja, essas

26
medidas indicam se os valores estão relativamente próximos uns dos outros, ou
separados.

Pequena dispersão

Grande dispersão

1. Amplitude

A amplitude pode ser expressa pela diferença entre o maior e o menor número num
conjunto de dados.

Amplitude = Maior valor - menor valor


Exemplos
a) 1, 5, 7, 13 Amplitude = 13-1=12
b) 14, 3, 17, 4, 8, 73, 36, 48 Amplitude = 73-3=70
c) 1, 2, 2, 3, 5, 7, 8, 9, 10 Amplitude = 9
d) 0, 70, 70, 70, 70, 70 Amplitude = 70

2. Variância e Desvio padrão

Para melhorar o resumo dos dados,


podemos apresentar uma medida de
dispersão destes dados, como a
variância ou desvio padrão.

Considere as notas do provão de alunos de três faculdades de Vitória:

Faculdade Notas dos alunos Média da Faculdade


A 6 6 6 6 6 6 6 6 6,0

B 1 2 4 6 6 9 10 10 6,0

C 0 6 7 7 7 6 8 7 6,0

As notas das três faculdades apontam para a mesma nota média, mas as notas estão
distribuídas diferentemente em cada Faculdade. Comparando as notas de A com B e
C, notamos que as notas de B são bem mais dispersas, indicando que B é mais
heterogênea em termos de notas obtidas. Em C observamos um ponto discrepante

27
dos demais, uma nota extremamente baixa, acarretando um valor para a média abaixo
da maioria das notas da turma.

Algumas Propriedades:
 é sempre um número positivo;
 se todos os valores de uma amostra forem iguais, a variância e o desvio padrão
serão zero;
 a variância e o desvio padrão são medidas afetadas pelos valores extremos da
variável.
A variância e o desvio padrão avaliam a dispersão de um conjunto de valores em
relação à média aritmética. Para calcularmos a variância ou o desvio padrão, devemos
considerar os desvios de cada valor em relação à média. Depois construímos uma
espécie de média destes desvios. Assim:
 Seja um conjunto de números: x1, x2, x3, x4 ,..., xn

 Tomemos as diferenças de cada um em relação à média, assim:

x1  x , x2  x , x3  x , ..., xn  x
n

 (x  x)  0
i 1
i

Como temos valores positivos e negativos a soma dos desvios é sempre zero.
 Como estamos interessados nos tamanhos dos desvios e não no fato deles serem
positivos e negativos trabalhamos com os desvios ao quadrado. Tomamos a média
aritmética dos desvios ao quadrado, obtendo a variância. A unidade de medida da
variância equivale à unidade dos dados ao quadrado. Para retornarmos a unidade
original dos dados tiramos à raiz quadrada da variância obtendo assim o desvio
padrão.
Variância Populacional
n Onde
 ( xi   )2 •µ (mi) é a média populacional
2  i 1

N • N é o tamanho da população
•  (sigma) é o desvio padrão
Desvio Padrão Populacional
populacional
n

 (x  )i
2

 i 1

28
Exemplo: Notas de 8 alunos: 4, 5, 5, 6, 6, 7, 7, 8
2
Nota Desvio = Nota - Média (Desvio)
4 -2 4
5 -1 1
5 -1 1
6 0 0
6 0 0
7 1 1
7 1 1
8 2 4
Soma 0 12

Variância = 12/8 = 1,5

Variância Amostral
n

 (x  x) 2 Onde

s2  i 1
i

x 2
i  nx 2
• x é a média amostral
n 1 n 1 • n é o tamanho da amostra
Desvio Padrão Amostral • s é o desvio padrão amostral
n

 (x  x)
i
2

x 2
 nx 2
s i 1
 i

n 1 n 1

Exemplo: Considere que o gerente de uma loja de um shopping da cidade realizou


uma pesquisa a respeito do número diário de clientes que solicitam pagamento
parcelado de suas compras. Foram observados 12 dias escolhidos aleatoriamente e o
resultado foi o seguinte: 14 ; 6 ; 8 ; 22 ; 18 ; 14 ; 16 ; 14 ; 24 ; 32 ; 14 e 16. Calcule a
variância e o desvio padrão

Para o cálculo das medidas de variabilidade temos que ter o valor da média aritmética.
A média aritmética é igual a:

14  6  8  22  18  14  16  14  24  32  14  16
X  16,5
12

29
i xi  x
xi ( xi  x ) 2
1 14 14-16,5 = -2,5 6,25
2 6 6-16,5 = -10,5 110,25
3 8 8-16,5 = -8,5 72,25
4 22 22-16,5 = 5,5 30,25
5 18 18-16,5 = 1,5 2,25
6 14 14-16,5 = -2,5 6,25
7 16 16-16,5 = -0,5 0,25
8 14 14-16,5 = -2,5 6,25
9 24 24-16,5 = 7,5 56,25
10 32 32-16,5 = 15,5 240,25
11 14 14-16,5 = -2,5 6,25
12 16 16-16,5 = -0,5 0,25
Total 0 537

537
A Variância será a seguinte: s2   44,75
12
O desvio padrão é: s  44,75  6,7

Para o cálculo da variância e desvio padrão com tabelas de frequências aplicar as


fórmulas:
n

 (x  x)
i
2
fi
x 2
f  nx 2
s  i 1

2 i i

n 1 n 1

 (x  x)
i
2
fi
x2
f  nx 2
s i 1
 i i

n 1 n 1

 Onde
 x é a média amostral
 n é o tamanho da amostra
 s é o desvio padrão amostral
 fi é a frequência da classe
 se os dados estão agrupados em classe xi é ponto médio da classe.

30
Exemplo: para o exemplo anterior calcule o desvio padrão amostral:

Valores ($) fi
$10,00 a $ 20,00 62
20,00 a $ 30,00 84
$ 30,00 a $ 40,00 123
$ 40,00 a $ 50,00 93
$ 50,00 a $ 60,00 52
$ 60,00 a $ 70,00 36
Total

3. Coeficiente de variação (cv)

O coeficiente de variação é uma medida relativa da variabilidade. Ele é útil quando


queremos comparar a variabilidade de dois conjuntos de dados que tenham diferentes
desvios padrões e diferentes médias.

Para o exemplo anterior o coeficiente de variação seria:


6,7 Desvio padrão
CV   100  40,6% CV  100
16,5 Média

De uma maneira geral:

se CV:

menor ou igual a 15% - Baixa dispersão – homogênea, estável.

Entre 15 e 30% - Média dispersão.

Maior que 30% - Alta dispersão – heterogênea.

É bom lembrar que dizer se a variabilidade é grande ou pequena depende o objeto


que está sendo estudado.

TERCEIRA LISTA DE EXERCÍCIOS

1) Calcule a média, mediana, moda, o desvio padrão populacional e o coeficiente de


variação dos valores de contratos (R$) de uma micro empresa que presta consultorias
ambientais:

31
102, 305, 405, 550, 760, 567, 100, 459

2) Suponha que suas notas do segundo semestre em estatística sejam as seguintes:


5,0; 6,5 e 9,5. A primeira nota valem 15% a segunda vale 25% e a última vale 60%.
Qual a sua nota semestral?

3) Dada às distribuições abaixo, calcule a média, mediana, a moda e o desvio padrão


amostral na letra a e desvio padrão populacional na letra b.

Tabela. Pesos (kg)


Pesos fi
40 |-- 44 2
44 |-- 48 5
48 |-- 52 9
52 |-- 56 6
56 |-- 60 4
Total 26

4) Os valores de ferro (mg/L) de 7 amostras de água subterrâneas foram os seguintes:


1,70; 1,97; 2,62; 2,30; 3,12; 2,53 e 1,95. Calcule a média, mediana e o terceiro quartil.
Interprete os resultados.

5) Calcule o desvio padrão amostral dos dados apresentados abaixo:


Xi fi fri Fi
0 1 0,05
1 0,15 4
2 4
3 0,25 13
4 3 0,15
5 2 18
6 19
7
Total Soma = 20 1,00

UNIDADE IV – NOÇÕES DE PROBABILIDADE

IV.1 Introdução

Encontramos na natureza dois tipos de fenômenos: determinísticos e aleatórios.

Os fenômenos determinísticos são aqueles em que os resultados são sempre os


mesmos, qualquer que seja o numero de ocorrências verificadas. Se tomarmos um
determinado sólido, sabemos que a certa temperatura haverá a passagem para o
líquido. Esse exemplo caracteriza um fenômeno determinístico.

32
Nos fenômenos aleatórios, os resultados não serão previsíveis, mesmo que haja um
grande número de repetições do mesmo fenômeno. Por exemplo: se considerarmos
um pomar com centenas de laranjeiras, as produções de cada planta serão diferentes
e não previsíveis, mesmo que as condições de temperatura, humidade, solo, etc.,
sejam as mesmas para todas as árvores. Nos experimentos aleatórios, mesmo que as
condições iniciais sejam as mesmas, os resultados finais de cada tentativa do
experimento serão diferentes e não previsíveis.

Utiliza-se probabilidade na engenharia para se verificar, por exemplo, a


probabilidade de aceitação ou rejeição de um lote de peças e também na
realização de inspeção por amostragem.

IV. 2 Definições

 Probabilidade é uma ferramenta matemática que tem por propósito medir a


“chance”.
 Experimento (E): refere-se a qualquer processo de observação ou medida. Ex.:
lançamento de uma moeda, taxa de inflação do próximo mês, estudo da causa de uma
doença, e outros.
 Espaço amostral (S): é o conjunto de todos os resultados possíveis do
experimento.Exemplo: E: lançamento de um dado. S: {1, 2, 3, 4, 5, 6}
 Evento: são subconjuntos do espaço amostral. São representados por letras
maiúsculas do nosso alfabeto, A, B, C, ....
Exemplo:
A: ocorrer um número par no lançamento de um dado.
A: {2, 4, 6}

Notação para Probabilidades


P denota uma probabilidade. A, B, C, ... Denotam eventos
específicos.
P(A) denota a probabilidade de ocorrência do evento A.

IV. 3 Enfoques para as probabilidades

As três abordagens frequentemente mais usadas são o Método Clássico, o de


frequência relativa e o subjetivo.

33
O Método Clássico: de atribuir probabilidade é apropriado quando todos os
resultados experimentais são igualmente prováveis. Se há n possibilidades igualmente
prováveis, das quais uma deve ocorrer, e s são consideradas como favoráveis ou
como um “sucesso”, então a probabilidade de um sucesso é s/n , ou seja,

N º de maneiras como A pode ocorrer


P( A) 
N º de resultados possíveis no espaço amostral

Exemplo 1
E: Lançamento de um dado equilibrado
A: Obter a face 5
S = {1, 2, 3, 4, 5, 6}
Então
A = {5}
1
P ( A) 
6
Exemplo 2
E: Retirar uma carta de um baralho de 52 cartas
B: Extrair um ás
“Bem misturado” significa que qualquer carta tem a mesma chance de ser extraída.
Como há s = 4 ases entre as n = 52 cartas, a probabilidade é dada por:
s 4 1
P( B)   
n 52 13

No método da frequência relativa a probabilidade de um evento é a proporção do


número de vezes que eventos do mesmo tipo ocorrem em longo prazo. Realize
(observe) um experimento um grande número de vezes e conte quantas vezes o
evento A ocorre. Então P(A) é estimado por:

N º de ocorrências de A
P( A) 
N º de repetições do exp erimento

Exemplo 1: Os registros de uma companhia de aviação mostram que durante certo


tempo 468 dentre 600 de seus jatos da linha Vitória-Rio chegaram no horário, qual a
probabilidade de que um avião daquela linha chegue no horário?

Uma estimativa para a probabilidade desejada é:

34
468
 0,78  78%
600

Exemplo 2: Lote de N peças, com D defeituosas:

Fração defeituosa do lote P = D/N

P é o nível de qualidade do lote, expresso em (%)

Ao calcularmos a probabilidade pelo método da frequência relativa, obtemos uma


aproximação no lugar de um valor exato. À medida que o número de observações
aumenta, as aproximações tendem a ficar mais próximas da probabilidade efetiva.
Esta propriedade é enunciada pelo teorema conhecido como lei dos grandes números.

Lei dos Grandes Números: “Se repete-se um experimento um grande número de


vezes a probabilidade pela frequência relativa de um evento tende para a
probabilidade teórica”.

Na abordagem subjetiva a probabilidade associada a um evento irá basear-se na


opinião pessoal do analista sobre as chances de sua ocorrência. Pode-se usar
qualquer informação disponível para atribuir probabilidade ao evento, tal como nossa
experiência ou intuição.

Exemplo: Um investidor decide aplicar em ações porque seu “feeling” indica que a
probabilidade de ganho é de 60% ao ano.

IV. 4 Propriedades da Probabilidade


 0  P( A)  1 para qualquer evento A.
 A probabilidade de um evento cuja ocorrência é certa é igual a 1, ou seja, P(S) =1.
 A probabilidade de um evento impossível é 0, ou seja, P (. )  0

Exemplos:
• A probabilidade de obter um número menor ou igual a 6 no lançamento de um
dado.
• Probabilidade de obter um número maior que 6 no lançamento de um dado.

- Eventos Complementares: Um evento ou conjunto de eventos é complementar a


outro quando, juntos, formam o espaço amostral.

35
A Onde A é o complementar de A.
A

Cálculo da probabilidade usando o complemento:

P( A)  1  P( A )

Exemplo: Sendo A: obter a face 5 no lançamento de um dado, calcule a probabilidade


do complementar de A.

IV. 5 Eventos compostos

Evento composto é qualquer evento que combina dois ou mais eventos simples. Ex.:
Lançamento de duas moedas, retirar um ÁS de um baralho e obter a face 6 no
lançamento de um dado.

União de dois eventos (AUB): A união de A e B é o evento contendo todos os pontos


amostrais que pertencem a A a B ou a ambos.

S S

A B A B

Interseção de dois eventos (A ∩ B): A interseção de A e B é o evento que contém os


pontos amostrais que pertencem tanto a A como a B.

36
IV. 5.1 Regra da Adição

É usada quando estamos interessados em conhecer a probabilidade de que pelo


menos um deles ocorra. Isto é, estamos interessados na ocorrência de A, de B ou
ambos.
A probabilidade de ocorrer “A” ou “B” é fornecida aplicando-se a regra da adição de
probabilidades:

P(AB) = P(A) + P(B) – P(A e B)

Para o caso de eventos mutuamente excludentes (a ocorrência de um resultado exclui


o outro), então:
P(AB) = P(A) + P(B)
Diagrama de Venn para Eventos Mutuamente Excludentes

A B

Observe que não existe área de intercessão entre os círculos A e B.

Exemplo de eventos mutuamente excludentes: Em um baralho, qual a


probabilidade de se tirar uma carta de “ás” ou uma de “reis”?

Neste caso, não existe uma carta no baralho que seja “ás” e “reis” ao mesmo tempo.
Então, a intercessão é nula.
Como existem 4 “ás” e 4 “reis” no baralho (uma de cada naipe), a probabilidade será
4 4 8
igual a:  
52 52 52

Exemplo de eventos não mutuamente excludentes: Qual a probabilidade de se tirar


do mesmo baralho uma carta de “ás” ou uma de “espadas”?

Neste caso existe uma carta que é „ás” e “espadas” simultaneamente. Assim sendo,
existe intercessão.
A probabilidade será, então, igual a:

4 13 1 16
  
52 52 52 52

37
IV. 5.2 Probabilidade Condicional
É a probabilidade de ocorrência de um evento submetida à ocorrência de um outro
evento.
A sua notação é: P(A/B ) e se lê da seguinte maneira: Probabilidade de ocorrer o
evento “A” dado que ocorreu o evento “B”.
Neste caso, a ocorrência do evento “B” é um fato. Não existe incerteza a esse
respeito. A incerteza está restrita à ocorrência do evento “A”.
Expressão formal da probabilidade condicional:
P( A  B)
P( A / B) 
P( B)

P( A  B)
P( B / A) 
P( A)

Abordagem intuitiva da probabilidade condicional:

Podemos determinar a probabilidade condicional de A “dado” B supondo que B já


tenha ocorrido e, sob essa hipótese, calculando a probabilidade de ocorrência do
evento A.

Exemplo: Suponha que em uma sala de aula existam 14 meninas e 16 rapazes. Das
14 meninas, 6 estão vestidas com blusas brancas, enquanto que dos 16 rapazes, 10
estejam vestidos com blusas brancas.

Considere que será realizado o seguinte experimento: será escolhido aleatoriamente


um aluno e serão feitas duas observações: o sexo do aluno e a cor da blusa que está
usando.
Neste caso, a probabilidade de se escolher um aluno do sexo Trinca é de 14/30.
O espaço amostral a ser considerado neste cálculo é o conjunto de todos os 30 alunos
existentes dentro da sala de aula.
Suponha, agora, que é dada a seguinte informação: “o aluno sorteado está vestindo
blusa branca”.
Nesse caso, todos os alunos que não estejam vestindo blusa branca são retirados do
espaço amostral.

38
A probabilidade condicional diminuiu o espaço amostral original. O espaço amostral
agora é constituído somente pelos alunos, do sexo Trinca ou do sexo Arranhão, que
estejam usando blusa branca.

Assim, a probabilidade de se sortear um aluno do sexo Trinca dado que o aluno


sorteado está usando blusa branca passa a ser igual a 6/16.

IV. 5.3 Regra da Multiplicação

A multiplicação de probabilidades está relacionada com a intercessão de eventos. É a


probabilidade de ocorrerem os eventos “A” e “B” simultaneamente.

Forma geral: P(A  B) = P(A) x P(B/A)

P(A  B) = P(B) x P(A/B),

A intercessão de eventos está relacionada com o conceito de independência entre


eventos.

Considere os eventos “A” e “B”. Diz-se que os eventos “A” e “B” são estatisticamente
independentes entre si se P(A) = P(A/B) ou P(B) = P(B/A).

Regra da multiplicação para eventos independentes

P(A  B) = P(A) x P(B)

Não confundir eventos independentes com eventos mutuamente excludentes. Eventos


mutuamente excludentes são intensamente dependentes entre si.

Exemplo: Considere uma caixa contendo 10 peças, sendo 8 boas e 2 ruins. Retira-se,
aleatoriamente, duas peças. Vamos considerar dois casos:
 1º caso: experimento com reposição;
 2º caso: experimento sem reposição.

1º caso: Experimento com reposição

39
A probabilidade da 1ª peça ser boa é igual a 8/10. Como o experimento é com
reposição, a probabilidade da 2ª peça ser boa será também igual a 8/10 quer a 1ª
peça tenha sido boa ou não. Então:
P(2ª peça boa) = P(2ª peça boa/1ª peça foi boa)

Dessa forma, os eventos “1ª peça boa” e “2ª peça boa” são independentes entre si.

2º caso: Experimento sem reposição

Neste caso, a probabilidade da 2ª peça ser boa vai depender da 1ª peça ter sido boa
ou não.
Se a 1ª peça foi boa, a P(2ª peça boa) é igual a 7/9.
Se a 1ª peça foi ruim, a P(2ª peça boa) é igual a 8/9.

Então, a probabilidade de “2ª peça boa” vai depender do que ocorreu com a 1ª peça.
Assim, esses eventos (“1ª peça boa” e “2ª peça boa”) são dependentes entre si.

Exemplo: Suponha que de cada 100 automóveis que trafegam pelas ruas, 70 sejam
de fabricação nacional e 30 sejam importados. Suponha também que 60% dos
automóveis nacionais sejam de cor clara e 40% de cor escura. Dos importados, 35%
são de cor clara e 65% de cor escura.
Determine a probabilidade de se escolher aleatoriamente um automóvel nacional e
escuro.
 O que se deseja calcular é P(nacional  escuro)
 Usando a forma geral da multiplicação:
P(nacional  escuro) = P(nacional) x P(escuro/nacional)
 Aplicando os dados constantes do enunciado do problema:
P(nacional  escuro) = 0,70 x 0,40 = 0,28

QUARTA LISTA DE EXERCÍCIOS

1) De 1000 amostras de água de certo manancial do norte do estado, 200 estão


contaminadas por mercúrio e 300 com coliformes fecais. Estes dados incluem 150
amostras que possuem ambos contaminantes. Qual a probabilidade de que uma amostra
escolhida aleatoriamente esteja contaminada por mercúrio (A) ou por coliformes (B)?

2) Suponha que quatro cartas são escolhidas aleatoriamente e sem reposição de um baralho
de 52 cartas. Qual a probabilidade de que todas as quatro cartas sejam reis?

40
3) Suponha que quatro cartas são retiradas aleatoriamente de um baralho de 52 cartas, após
cada retirada a carta é recolocada no maço e todas as cartas são embaralhadas
novamente antes da seleção da próxima carta. Qual a probabilidade de que todas as
quatro cartas sejam reis?

4) Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se 3 bolas sem
reposição. Achar a probabilidade de que:
a) nenhuma vermelha;
b) exatamente uma vermelha;
c) todas sejam da mesma cor.

5) A empresa M & tem M tem 15800 empregados, classificados de acordo com a tabela
abaixo:

IDADE Sexo
Homens Mulheres Total
< 25 anos 2000 800 2800
25 – 40 anos 4500 2500 7000
> 40 anos 1800 4200 6000
Total 8300 7500 15800

Um empregado e sorteado ao acaso, calcular a probabilidade de ser ele:


a) um empregado com 40 anos de idade ou menos;
b) um empregado com mais de 40 anos de idade e que seja homem;
c) um empregado com 40 anos de idade ou menos, e mulher;
d) uma mulher, dado que é um empregado com menos de 25 anos.

7) Em uma indústria há 10% pessoas que ganham mais de 20 salários mínimos (s.m.), 20%
que ganham entre 10 e 20 s.m. e 70% que ganham menos de 10 s.m. Três pessoas desta
industria são selecionadas com reposição. Determinar a probabilidade de que pelo menos uma
ganhe menos de 10 s.m.

8) P(A) = 1/3, P(B) = 3/4 e P(AUB) = 11/12, calcular P(A/B).

UNIDADE V – VARIÁVEL ALEATÓRIA

Variável aleatória (v.a) é uma variável que tem um valor numérico único, para cada
resultado de um experimento.
Seja E um experimento e S o espaço amostral associado ao experimento. Uma função
X, que associe a cada elemento s  S um número real X(s) é denominada variável
aleatória.
S R
X •
s•
X(s)

Variável aleatória

41
EXEMPLO:
E: lançamento de duas moedas
X: número de caras obtidas nas duas moedas
S = {(ca,ca),(ca,co),(co,ca),(co,co)}
X = 0: corresponde ao evento (co,co)
X = 1: corresponde ao evento (co,ca), (ca,co)
X = 2: corresponde ao evento (ca,ca)

V.1 VARIÁVEL ALEATÓRIA DISCRETA

Uma variável aleatória X será discreta se assumir valores em um conjunto finito ou


infinito numerável.

V. 1.1 Função de probabilidade da variável aleatória discreta


É uma função que associa a cada valor assumido pela variável aleatória a
probabilidade do evento correspondente.

Seja X uma v. a. discreta. A probabilidade da variável aleatória X assumir um valor


particular x, é a função de probabilidade X que se representa por P(X = x). A função
P(X = x) determina a distribuição de probabilidades da v.a.

Condições para uma distribuição de probabilidades


1.  P(x)  1 , onde x toma todos os valores possíveis.

2. 0  P( x)  1,  x
Exemplo: E: lançamento de duas moedas.
X: Nº de caras obtidas.

A distribuição de probabilidade da v. a. X é dada por:

X 0 1 2
P(x) 0,25 0, 5 0,25

O gráfico de P(x) em função de X do exemplo anterior acima é:

42
EXEMPLO: Verifique se a seguinte função é dunção de probabilidade e determine as
probabilidades requeridas:
2x  1
f ( x)  , x = 0, 1, 2, 3, 4.
25
a) P(X = 2)
b) P(X ≤ 1)
c) P(2 ≤ X < 4)
d) P( X > -10)

V. 1.2 Média (ou valor esperado) e variância de uma variável aleatória discreta
Valor esperado E(x) é uma medida de tendência da variável aleatória “x”. É igual à
média de um número infinito de observações desta variável.

A sua expressão matemática é a seguinte:

E ( X )     xP( x)
É também chamada de esperança matemática ou média.

Exemplo: Considere que o valor de venda de um determinado imóvel pode alcançar


os valores a seguir, com as respectivas probabilidades de ocorrência:
VALOR PROBABILIDADE
$180.000,00 0,15
$215.000,00 0,30
$250.000,00 0,45
$280.000,00 0,10

Qual o valor esperado do preço de venda deste imóvel?


O valor esperado será, então, igual a:

43
Ex   180.000  0,15  215.000,00  0,30  250.000,00  0,45  280.000,00  0,10
E x   232.000,00
Isso significa que se este imóvel fosse vendido um infinito nº de vezes, a média
dos seus valores de venda seria igual a $232.000,00. Uma outra interpretação
seria a de que se um nº infinito de imóveis desse mesmo tipo fosse vendido, o
valor médio do preço de venda seria $ 232.000,00.

A variância para uma distribuição de probabilidades é dada por:

 2    x   2 Px 
Podendo ser reescrita como:

 
 2  E X 2  E (X ) 2
O desvio padrão (  ) da variável aleatória da v.a. discreta é dado por:

   2  VAR ( X )

Cálculo da Variância de “X” a partir do seu Valor Esperado

EXEMPLO: Considere que o número de reclamações recebidas diariamente em uma


determinada empresa de telefonia segue a seguinte distribuição de probabilidades:

Nº DE RECLAMAÇÕES PROBABILIDADE

1 0,10
2 0,30
3 0,35
4 0,25

Determine a variância do nº. de reclamações diárias.

O valor esperado do nº. de reclamações diárias será igual a:

E  X   1 0,10  2  0,30  3  0,35  4  0,25  2,75

O valor esperado do quadrado do nº de reclamações diárias será igual a:


 
E X 2  1 0,10  4  0,30  9  0,35  16  0,25  8,45
A variância do nº de reclamações diárias será igual a:

 2  8, 45  2,75  0,8875
2

44
QUINTA LISTA DE EXERCÍCIOS

1. Uma seguradora paga R$ 30.000,00 em caso de acidente de carro e cobra uma


taxa de R$ 1000,00. Sabendo que a probabilidade de que um carro sofra acidente é
de 3%. Quanto espera a seguradora ganhar por carro segurado?
Resposta: R$100,00

2. Um negociante espera vender um automóvel até sexta-feira. A expectativa de venda


na segunda-feira é de 50%. Na terça-feira é de 30%, na quarta-feira é de 10%, na
quinta-feira é de 5% e na sexta-feira é de 5%. Se lucro é de R$ 3000,00 se vender na
segunda-feira e diminui 40% a cada dia.
a) Calcule o valor esperado do lucro deste negociante nesta venda.
b) Calcule o desvio padrão do lucro.
Resposta: 2199,84 e 881,98

3. Uma máquina de apostas tem 2 discos que funcionam independentemente um do


outro. Cada disco tem 10 figuras: 4 maçãs, 3 bananas, 2 peras e uma laranja. Uma
pessoa paga R$ 80,00 e aciona a máquina. Se aparecerem 2 maçãs, ganha R$ 40,00.
Se aparecerem 2 bananas ganha R$ 80,00, ganha R$140,00 se aparecerem 2 peras
e ganha R$ 180,00 se aparecerem duas laranjas. Se não aparecerem duas frutas
iguais o jogador não tem ganho. Qual a esperança de ganho numa única jogada?
Resposta: -59,00

4. Num jogo de dados, A paga R$20,00 a B e lança 3 dados. Se sair a face 1 em um


dos dados apenas, A ganha R$20,00. Se sair a face 1 em dois dados apenas, A ganha
R$50,00, e se sair 1 nos três dados dados, A ganha R$80,00. Calcular o lucro líquido
médio de A em uma jogada. (Morettim pág 47).
Resposta: -9,21

V. 1.3 Função de Distribuição Acumulada (fda) da v.a. discreta

Definição: É a probabilidade de variável aleatória X assumir um valor menor ou igual


a X, ou seja, função acumulada que fornece, para cada ponto considerado, a
probabilidade de que a variável assuma um valor menor ou igual que a
correspondente a esse ponto (definição prof. Wofgam – controle de qualidade).

F(x) = P(X  x) =  p( x )
xi x
i

Exemplo: Seja X a variável aleatória número de caras obtidas no lançamento de 2


moedas, determine F(x) e construa o gráfico de F(x).
x P(x) F(x)
0 1/4 1/4
1 1/2 3/4
2 1/4 1

45
Temos então:
F (0)  P( X  0)  P( X  0)  1 / 4
F (1)  P( X  1)  P( X  0)  P( X  1)  3 / 4
F (2)  P( X  2)  P( X  0)  P( X  1)  P( X  2)  4 / 4

Portanto os valores para F(x) são:


zero, quando: x < 0·.
1/4, quando: 0  x < 1.
F(x) = 3/4, quando: 1  x < 2.
1, quando: x  2.

V.2 VARIÁVEL ALEATÓRIA CONTÍNUA

Uma variável aleatória X contínua pode assumir qualquer valor no intervalo de sua
definição. EX.: medida da corrente de um fio delgado de cobre.

V. 2. 1 Função de Densidade de Probabilidade

Assim como as variáveis discretas possuem suas funções de probabilidade, as


variáveis contínuas possuem suas funções densidade de probabilidade. A diferença
entre as duas é que enquanto a função de probabilidade fornece diretamente a
probabilidade da v.a. discreta assumir um determinado valor, tal não acontece com a
função de densidade. A probabilidade de uma v.a. contínua assumir um valor
localizado dentro de um determinado intervalo é igual à área embaixo da função
densidade, limitada pelos pontos extremos do intervalo. Assim a probabilidade de uma
v. a. contínua assumir um determinado valor (probabilidade no ponto) é nula, pois a

46
área embaixo de um ponto é igual a zero. Uma função densidade de probabilidade f(x)
pode ser usada para descrever uma distribuição de probabilidades de uma variável
aleatória contínua X.

Funções de densidade são usadas na engenharia para descrever sistemas físicos,


como por exemplo, a densidade de uma carga em uma viga longa e delgada.

Definição: Para uma variável aleatória contínua X, uma função densidade de


probabilidade (fdp) é uma função tal que:
a) f ( x)  0 para todo x;


b)
 f ( x)dx  1 ;


c) P ( a  X  b) 
 f ( x)dx
a
= a área sob f(x) para quaisquer a, b, com

   a  b   .
Obs.:
* 0  P(a  X  b)  1

* P( X  x)  0

* P(a  X  b)  P(a  X  b)  P(a  X  b)  P(a  X  b)

V. 2. 2 Média (ou valor esperado) e variância de uma variável aleatória contínua

A média e a variância de uma v.a. contínua são definidas de modo similar a uma v.a.
discreta. A integração substitui a soma nas definições.

Definição: Suponha que X seja uma v. a. contínua com uma função densidade de
probabilidade f(x).

A média ou o valor esperado de X, denotado por μ ou E(X) é



  E( X )   x  f ( x)dx


A variância de X, denotada por  ou VAR(X), é


2

 
 2  E X 2  E (X ) 2

47

E( X )  x  f ( x)dx
2 2
Onde,


V. 2. 3 Função de Distribuição Acumulada (fda) da v.a. contínua


Definição: A função de distribuição cumulativa de uma v.a. contínua X é
x
F( X )  P( X  x)  f (u )du para  x  


A função densidade de probabilidade de uma v.a. contínua pode ser determinada a


partir de uma diferenciação da função de distribuição cumulativa. Ou seja, dada F(X),
tem-se

dF ( X )
f ( x)  , desde que a derivada exista.
dx

SEXTA LISTA DE EXERCÍCIOS

 2 x  3 se 0  x  2
1. Verificar se f ( x)   é uma fdp.
0, se x  0 ou x  2
R: Não é uma fdp

2. Seja uma v.a. X a corrente em um fio delgado de cobre, medida em miliampères. Suponha
que a faixa de X seja [0, 20 mA] e considere que a função densidade de probabilidade de X
seja f ( x)  0,05 para 0  x  20 . Qual a probabilidade de que uma medida da corrente
seja menor 10 miliampères? R: 0,5

3.Suponha que uma função densidade de probabilidade de comprimentos de cabo


computadores seja f (X) = 0,1 de 1200 a 1210 milímetros. Determine a média e o desvio padrão
do comprimento do cabo. R: E(X) = 1205 DP (X) = 2,89

4. Suponha que o tamanho de uma partícula de contaminação possa ser modelado como
f ( x)  2 x 3 para 1 < X. Determine a média de X. R: 2

5. Seja X o tempo até que uma reação química esteja completa é aproximado pela função de
distribuição cumulativa abaixo:

 0 se x  0
F(X )   0 , 01x
1  e , se x  0

Determine a função densidade de probabilidade de X. Que proporção de reações é completada


dentro de 200 segundos? R: f(x) = 0,01e-0,01x e P(x<200) = 0,8647

48
6. Seja X uma variável aleatória contínua, o tempo de falha de um componente eletrônico de
uma copiadora e a fdp de X, f (x) , foi dada:
f ( x)  2 x , para 0 < x < 1
e f ( x)  0 , para quaisquer outros valores de x.
Determine a probabilidade do tempo gasto ser de no máximo ¼ h, isto é, P( X  1 / 4)  ? R =
1/16

UNIDADE VI – DISTRIBUIÇÃO DE PROBABILIDADES

Na prática as distribuições de probabilidades são usadas para resolver problemas. Os


tipos de distribuições podem ser considerados modelos para descrever situações que
envolvem resultados gerados pela chance.
Existem muitos problemas parecidos, então poucos modelos solucionam uma grande
quantidade de problemas. Ex.: a jogada de moedas para o ar e nº de itens defeituosos
numa remessa de peças recaem sobre o mesmo modelo de probabilidade. A
constatação desse fato levou o desenvolvimento de técnicas padronizadas para a
resolução de muitos problemas diferentes.

Cada distribuição de probabilidade tem um conjunto de hipóteses que devem ser


verificadas para se utilizar o modelo.
O uso da distribuição de probabilidade consiste em comparar as hipóteses do tipo da
distribuição com as características do problema real.

Verificada a correspondência, o problema é enquadrado em uma classe de


distribuição de probabilidade e é resolvido sempre da mesma maneira.

VI. 1 Distribuições Discretas de Probabilidades

As distribuições discretas envolvem variáveis aleatórias relativas a dados que resultam


de contagem, como o nº. de ocorrências por amostra, nº. de ocorrências por intervalo
de tempo, de área, ou distância.

VI. 1.1 Distribuição Binomial

O termo “binomial” designa situações em que os resultados de uma v.a. podem ser
agrupados em duas categorias (os dados são, pois, nominais). Exemplo: em

49
processos industriais as peças falham ou não falham; em medicina o paciente
sobrevive ou morre; em marketing o consumidor reconhece um produto ou não.

Definição: um experimento binomial satisfaz as seguintes condições:


 O experimento deve ser repetido, sob as mesmas condições um nº finito de vezes
(n);
 As repetições devem ocorrer de forma independente;
 Cada repetição possui dois resultados possíveis: sucesso (p) e fracasso (q = 1- p);
 As probabilidades devem permanecer constantes para cada repetição.
 Descreve a amostragem COM REPOSIÇÃO.
 Tende para a distribuição Normal quando n cresce.

Exemplo: Imagine uma máquina de confeccionar parafusos. Dos parafusos fabricados


por essa máquina, 2% saem com algum tipo de defeito (esta é uma característica da
máquina). Suponha que a produção dessa máquina é lançada ininterruptamente em
uma esteira, e que dessa esteira são retirados 10 parafusos.

 Para variáveis com essa distribuição resolvemos problemas do tipo: determinar a


probabilidade de se obter “k” sucessos em “n” tentativas.

 Seja “X” número de sucessos em “n” tentativas. A função de probabilidade da


variável X é dada por:

n n n!
P ( X  k )    p k (1  p ) n  k ;   
k   k  x!( n  x)!
 Notação: X: B (n, p).
p: probabilidade de sucesso em uma das repetições;
(1-p): probabilidade de fracasso em uma das “n” repetições;
n: número de repetições;
k: nº de sucessos em “n” repetições, pode ser qualquer inteiro entre 0 e n,
inclusive;
P (X = k): é a probabilidade de obter “k” sucessos em “n” repetições.

 Média e desvio padrão de uma variável binomial:


Média = n.p

Desvio padrão =
n  p  (1  p)

50
Exemplo 1: Uma partida tem a fração defeituosa p=0,04. Calcular a probabilidade de
aceitação da partida, com amostra de n = 50 peças, e sendo que a aceitação ocorrerá
se menos de uma estiver defeituosa. R: 0,3999

Exemplo 2: Cada amostra de ar tem 10% de chance de conter uma certa molécula
rara. Considere que as amostras sejam independentes com relação à presença da
molécula rara. Encontre a probabilidade de que nas próximas 18 amostras,
exatamente 2 contenham a molécula rara. R: 0,28

VI. 1. 2 Distribuição Hipergeométrica

Consideram-se uma população com N elementos, dos quais r tem uma determinada
característica (a retirada de um desses elementos corresponde ao sucesso). Retira-se
dessa população, sem reposição, uma amostra de tamanho n.

Seja X: número de sucessos na amostra (saída do elemento com a característica).

Para sabermos a função de probabilidade, consideramos que podemos tirar  


N
n
 
r
amostras sem reposição. Os sucessos na amostra podem ocorrer com   maneiras
k 
N  r
e fracassos de   maneiras. Logo:
nk 

r N  r
    
 k   n  k 
P( X  k )  , 0k n e k r
N
 
n

A variável X assim definida tem distribuição hipergeométrica.

Exemplo 1: Seja uma partida de N = 50 peças, com 2 defeituosos. Qual a


probabilidade de aceitação da partida, inspecionando-se uma amostra de n = 10, com
número de aceitação a=1 (vai aceitar se tiver no máximo uma defeituosa)?
Solução: X: nº de motores defeituosos da amostra.
N = 50; r = 2; n = 10

51
 2   50  2   2   50  2 
       
 0   10  0   1   10  1 
P( X  0) P( X  1)   0,637  0,326  0,963
 50   50 
   
 10   10 
Exemplo 2: Pequenos motores são guardados em caixas de 50 unidades. Um
inspetor de qualidade examina cada caixa, antes da posterior remessa, testando 5
motores. Se nenhum motor for defeituoso, a caixa é aceita. Se pelo menos um for
defeituoso, todos os 50 motores são testados. Há 6 motores defeituosos numa caixa.
Qual a probabilidade de que seja necessário examinar todos os motores dessa caixa?
Solução: X: nº de motores defeituosos da amostra.
N = 50; r = 6; n = 5

Inspecionar todos se pelo menos um é defeituoso  P(Pelo menos um defeituoso)=

 6   50  6 
    
 0   5  0 
P(X  1) = 1 – P(X < 1) = 1 - P(X = 0) = 1   1  0,5127  0,4874
 50 
 
5
VI. 1. 3 Distribuição de Poisson

É freqüentemente usada para estimar o número de ocorrências sobre um intervalo de


tempo ou espaço.

Exemplo: Número de defeitos por centímetro quadrado, clientes atendidos por hora,
chegada de navios por dia no porto de Vitória.

 Propriedades do experimento de Poisson:


 A probabilidade de ocorrência é a mesma para quaisquer dois intervalos de igual
comprimento.
 O número de ocorrências em qualquer intervalo é independente do número de
ocorrências em outros intervalos.

EXEMPLO 1: Suponha que em uma agência bancária entrem, em média, 60 clientes


por hora. Qual a probabilidade de, em 10 minutos, entrarem 4 clientes?
Observe que o “sucesso” é à entrada do cliente. A probabilidade desejada é a de 4
sucessos, isto é, 4 entradas de clientes, dentro de um período de tempo de 10
minutos.

52
EXEMPLO 2: Suponha que uma vistoria em uma estrada constatou que, em média,
existem 10 imperfeições no seu leito a cada 1000 metros. Qual a probabilidade de, em
100 metros, serem encontradas 2 imperfeições?
Nesse caso, o “sucesso” é encontrar uma imperfeição no leito da estrada, e o período
ao longo do qual se deseja calcular a probabilidade, é o espaço de 100 metros.
 Como calcular a Probabilidade:
Seja:  = Nº. médio de sucessos no intervalo pretendido
x = Nº. de sucessos pretendidos. Então:

 x  e 
P( X  x) 
x!
Onde:
  t
e = 2,71828
“” é a razão de ocorrência do “sucesso” e o “t” é o período ao longo do qual se deseja
calcular a probabilidade.

No exemplo nº. 1:
 = 60 clientes/hora = 60 clientes/60 minutos
t = 10 minutos.
60
Então:  10  10
60
104  e 10
P ( X  4)   0,0189
4!

No exemplo nº. 2:
 = 10 imperfeições/1000 metros
t = 100 metros.
Então:  = 10
100  1
1000

12  e 1
P ( X  2)   0,1839
2!
EXEMPLO: O número de chamadas telefônicas que chegam a uma central é
freqüentemente modelado como uma variável aleatória de Poisson. Considere que,
em média, há 10 chamadas por hora.
a) Qual a probabilidade de que haja exatamente 5 chamadas em uma hora? R: 0,03
b) Qual a probabilidade de que haja 3 ou menos chamadas em uma hora? R: 0,01

53
c) Qual a probabilidade de que haja exatamente 15 chamadas em duas horas? R:
0,05
d) Qual a probabilidade de que haja exatamente 5 chamadas em 30 minutos? R: 0,17

VI. 1.4 Distribuição Binomial Negativa ou Pascal

Esta distribuição de probabilidades baseia-se nos seguintes pressupostos:


1. A experiência aleatória consiste numa sequencia de provas independentes;
2. Cada prova é um processo de Bernoulli, isto é, pode ocasionar um de dois
resultados possíveis e exclusivos (designados genericamente por sucesso, fracasso);
3. A probabilidade de cada resultado (sucesso, fracasso) mantém-se constante em
cada repetição do experimento;
4. A experiência continua (isto é, vão-se realizando provas sucessivas) até se obterem
r ≥ 0 sucessos.

Suponha que um experimento aleatório seja repetido independentemente até que um


evento A ocorra pela r-ésima vez.

Seja P(A) = p (sucesso) e P( A )  1  p (fracasso) em cada tentativa do experimento.

Seja X: Número de repetições necessárias para que A ocorra pela r-ésima vez.

Se X = x, o evento A ocorre r-ésima vez na repetição de número x. Logo, A ocorre (r-1)


vezes nas (x-1) repetições anteriores.

 x  1 r
P( X  x)    p (1  p) x r , xr
 r  1
A variável aleatória X assim definida tem distribuição de Pascal.

Exemplo: A probabilidade de que um sinal de trânsito esteja aberto numa esquina é


de 0,20. Qual a probabilidade de que seja necessário passar pelo local 10 vezes para
encontrá-lo aberto pela 4ª vez?
X = Número de passagens pela esquina.
r=4
p = 0,20

54
10  1
P( X  10)   0,20 4 (1  0,20)104  0,035232
 4 1 

SÉTIMA LISTA DE EXERCÍCIOS

1) Ontem, 80% das ações mais negociadas na Bolsa de Valores Alpha caíram de preço.
Suponha que você tenha uma carteira com 20 dessas ações e que as ações que perderam
valor possuam distribuição binomial. Pede-se calcular:
a) quantas ações de sua carteira você espera que tenham caído de preço; R: 16
b) o valor do desvio padrão das ações que tem na carteira; R: 1,79
c) a probabilidade de que tenham caído de preço exatamente 15 dessas ações. R: 0,17

3) Um lote de equipamentos novos é recebido pela empresa que você trabalha como gerente.
10 equipamentos são inspecionados. O lote é rejeitado se pelo menos 2 equipamentos forem
defeituosos. Sabendo-se que 1% dos equipamentos é defeituoso, determinar a probabilidade
de a firma rejeitar o lote. R: 0,0043

4) Uma firma recebe 720 mensagens em seu fax em 8 horas de funcionamento. Qual a
probabilidade de que:
a) em seis minutos receba pelo menos 4 mensagens? R: 0,979
b) Em 4 min não receba nenhuma mensagem? R: 0,00248

5) Numa linha adutora de água, de 60 km de extensão, ocorrem 30 vazamentos no período de


um mês.
a) Qual a probabilidade de ocorrer, durante o mês, pelo menos 3 vazamentos num certo setor
de 3 km de extensão? R: 0,1913
b) A ocorrência de 10 vazamentos em num certo setor de 3 km de extensão é muito rara?
Explique. R: 0,0000035. É rara.

6) Numa linha de montagem, 10% das peças são defeituosas.Qual a probabilidade da quinta
peça que se analisa ser a segunda defeituosa? R: 0,02916

7) Qual a probabilidade de que no 25º lançamento de um dado ocorra a face 4 pela 5ª vez? R:
0,0356

8) Uma uran tem 10 bolas brancas e 40 pretas.


a) Qual a probabilidade de que a 15ª bola extraída com reposicao seja a 6ª branca? R: 0,0172
b) Qual a probabilidade de que em 30 bolas retiradas com reposição ocorram no máximo 2
brancas? R: 0,0442

9) Uma firma compra lâmpadas por centenas. Examina sempre uma amostra de 15 lâmpadas
para verificar se estão boas. Se uma centena inclui 12 lâmpadas queimadas, qual a
probabilidade de se escolher uma amostra com pelo menos uma lâmpada queimada? R:
0,8747

10) Uma fábrica de motores para máquinas de lavar roupas separa de sua linha de produção
diária de 350 peças uma amostra de 30 itens para inspeção. O número de peças defeituosas é
de 14 por dia. Qual a probabilidade de que a amostra contenha pelo menos 3 motores
defeituosos? R: 0,108453

55
VI. 2 Distribuições Contínuas de Probabilidades

Serão estudadas as seguintes Distribuições Contínuas de Probabilidades:


- Distribuição Normal
- Distribuição Exponencial
- Distribuição Uniforme
- Outros modelos importantes: Gama, qui-quadrado, t-Student e F-Snedecor.

VI. 2.1 Distribuição Normal


 A Distribuição Normal é uma das mais importantes distribuições, se não a mais
importante, da Estatística.
 Ela é aplicada a um grande número de processos aleatórios relacionados com o ser
humano.
 Ela também é intensamente utilizada ao longo da Estatística Inferencial.

Características da Distribuição Normal


 A v.a. de distr. normal pode assumir todo e qualquer valor real, é definida de   a 
.
 A Distribuição Normal é uma distribuição simétrica. Assim sendo, a média, a
mediana e a moda assumem o mesmo valor.
 A forma assumida pela função densidade de probabilidade Normal é a de um sino.
 O ponto mais elevado da curva corresponde ao seu valor médio.
 A curva é assintótica.
 Cada distribuição normal fica especificada por sua média e seu desvio padrão.
 A área total sob a curva é 1 e a probabilidade de ocorrer um valor maior que a média
é igual a probabilidade de ocorrer um valor menor do que a média.
 O desvio padrão da distribuição determinará a abertura dessa curva, assim:

- Média +
Mediana
Moda

Desvio padrão grande

56
- Média +
Mediana
Moda
Desvio padrão pequeno

 Em uma Distribuição Normal observa-se que:


 68% das observações são localizadas dentro de ± 1 desvio padrão em torno da
média;
 95% das observações são localizadas dentro de ± 2 desvios padrão em torno da
média;
 99,7% das observações são localizadas dentro de ±3 desvios padrão em torno
da média.

Função Densidade de Probabilidade

1  x 
2

1   
2   
f ( x)  e
 2

57
 O cálculo da probabilidade da variável aleatória assumir um valor dentro de um
determinado intervalo se dará através da integral da função densidade de
probabilidade ao longo do intervalo pretendido.
 Seria mais prático usarmos tabelas, como já fizemos para outras distribuições.
 Acontece que teríamos que construir infinitas tabelas, uma para cada par de valores
da média e do desvio padrão da distribuição.

Distribuição Normal Padrão

 A solução foi definir uma Distribuição Normal Padrão.


 Uma Distribuição Normal Padrão é uma distribuição normal cuja média é igual a zero
e o desvio padrão é igual a 1.
 A Distribuição Normal Padrão é, então, tabelada.
 A operação para se calcular uma probabilidade normal passa a ser a conversão da
normal qualquer, da qual desejamos calcular a probabilidade, em uma normal padrão,
seguida de uma consulta à tabela da normal padrão.
 A transformação de uma normal qualquer de média  e desvio padrão  é realizada
com o auxílio de uma variável aleatória auxiliar “Z”, assim calculada:
X 
Z

 Com o valor de “Z” assim calculado, entra-se na tabela da distribuição normal
padrão.
 A Tabela da Distribuição Normal Padrão (vide a tabela Distribuição normal padrão no
ANEXO I) fornece a probabilidade do valor da variável aleatória cair dentro de um
intervalo entre a média e o determinado valor de “Z”.
 A Tabela possui dois argumentos de entrada:
 Na margem vertical à esquerda, entra-se com a parte inteira e o 1º decimal de
“Z”;
 Na margem horizontal superior entra-se com o 2º decimal de “Z”. No cruzamento,
lê-se a probabilidade.

Uso da Tabela da Normal Padrão

58
Entre com o inteiro e 1º Entre com o 2º decimal
decimal do valor de Z do valor de Z
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,1
0,2 Probabilidade para
.
. Z entre 0 e 1,14
.
1,0
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2
.
.
.
2,0 Leia, no cruzamento
2,1
. a Probabilidade
.
.

Exemplos:
1. Um estudo diário realizado sobre material particulado em suspensão feito em uma
determinada área da cidade nos finais de semana revelou que essa variável aleatória
é normalmente distribuída com uma média de 98 μg/m3 e um desvio padrão de 20
μg/m3. Qual a probabilidade de se ter uma medição cujo valor seja:
a) Entre 98 e 110? R: 0,2257
b) Maior do que 110? R: 0,2743
c) Entre 95 e 105? R: 0,1964
d) Menor que 110? R: 0,7257

2. Suponha que medidas da corrente em um pedaço de fio sigam a distribuição


normal, com uma média de 10 miliampères e uma variância de 4 (miliampères) 2. Qual
a probabilidade da medida exceder 13 miliampères?
R: 0,0668

3. Sendo X: N (50,16), determinar Xα tal que:


a) P( X  X  )  0,05 R: 56,6

b) P( X  X  )  0,99 R: 59,3

VI. 2.2 Distribuição Exponencial

 É aplicada para o cálculo da probabilidade de intervalos de tempo ou de espaço


físico entre dois eventos governados por um processo de Poisson.

59
 A variável aleatória é o intervalo de tempo ou espaço entre dois eventos
consecutivos.
Função Densidade de Probabilidade é igual a:
x
1 

f ( x)  e

onde  = tempo (ou espaço) médio

 O cálculo de uma probabilidade exponencial é feito da seguinte forma :


x
 0

P( x  x 0 )  1  e , para valores de x  xo

x
 0

P( x  x0 )  e , para valores de x  xo

EXEMPLO: Um banco está implementando um serviço de atendimento a clientes


especiais após o término do expediente. O gerente da agência fez um estudo a
respeito da demanda por esses serviços e constatou que, em média, a agência era
procurada por cerca de seis clientes por hora. Qual a probabilidade de um cliente
chegar pelo menos 10 minutos após o anterior ter chegado?

Neste caso, o período de tempo entre os dois eventos consecutivos é de 10 minutos: 6


clientes em 1 hora ou 10 minutos entre dois clientes consecutivos.
A probabilidade que se deseja calcular é a de P(t  10 minutos)
Aplicando-se a fórmula apropriada, teremos:
10

P( 10)  e 10
 0,3679
Veja no gráfico abaixo a área correspondente à probabilidade calculada.

P(t 10 )
minutos)=0,3679

0 10 t

Qual a probabilidade um cliente chegar, no máximo, 8 minutos após a chegada do


cliente anterior?

60
A probabilidade que se deseja calcular, neste caso, é P (t  8 minutos). Tem-se então
que:
8

p(t  8)  1  e 10
 0,5507

Veja no gráfico abaixo a área correspondente à probabilidade calculada:

P(t  8 )
)minutos)=0,5507

0 8 t

Qual a probabilidade do período de tempo entre duas chegadas consecutivas de


cliente ficar entre 5 minutos e 9 minutos?

Nesse caso, a probabilidade que se deseja é p ( 5‟  t  ‟ .


p(5  t  9)  p(t  9)  p(t  5)
9 5
 
p(5  t  9)  (1  e 10
)  (1  e 10
)  0,20

P(5  t  9)
99)=0,20

0 5 9 t

VI. 2.3 Distribuição Uniforme

 É aplicada às Variáveis Aleatórias Contínuas nas quais todos os resultados


localizados no intervalo de sua definição possuem a mesma probabilidade de ocorrer.
 O gráfico apresentado a seguir mostra uma distribuição uniforme definida no
intervalo de “a” a “b”.

61
Esta área é igual a 1

 1 
 
 b-a 

a b X

Função Densidade de Probabilidade:

 Para valores de “x” tais que a  x  b:

1
f ( x) 
ba
 Para outros valores:

f ( x)  0

EXEMPLO: O valor de uma compra em uma loja de discos é uma variável aleatória
uniformemente distribuída no intervalo entre $ 10,00 e $ 35,00. Qual a probabilidade
de um cliente realizar uma compra cujo valor se situe entre $ 15,00 e $ 28,00?
Observem no gráfico a seguir os valores envolvidos no problema.

Probabilidade Desejada

 1 
 
 35 - 10 

10 15 28 35 X

A probabilidade procurada será igual à:

 1 
p   28  15  0,52
 35  10 

VI. 2.4 Distribuição log-normal

Características:

62
1. Aplica-se a casos em que uma transformação log-natural resulte em uma
distribuição normal.
2. Como a função logaritmo não está definida para valores menores ou iguais à zero,
X somente poderá assumir valores maiores do que zero.
3. O formato da curva que representa a função densidade de probabilidade
apresentará assimetria à esquerda.
4. O modelo apresenta um parâmetro de localização µ e um de escala σ.

Encontrado em http://www.itl.nist.gov/div898/handbook (Engineering Statistics


Handbook).

Diz-se que uma v.a. não negativa X possui distribuição lognormal se a v.a. Y = ln(X)
possui uma distribuição normal. A f.d. p. resultante de uma v.a. lognormal quando ln(X)
tiver distribuição normal com parâmetros µ e σ é:

1  Ln ( x )   
2

2   

f ( x)  e 2  
, para x ≥0.
x 2

Tenha cuidado neste caso. Os parâmetros µ e σ não são a média e o desvio padrão
de X e sim da variável Y = ln (X). A média e a variância de X são:
2
 
E( X )   x  e 2

Var ( X )   2 x  e 2   2

 e 1
2

63
Padronização:
Ln(x)  
Z

Exemplo:
A distribuição lognormal é usada como modelo para diversas propriedades de
materiais. Um artigo sugere que a distribuição lognormal com µ = 0,375e σ = 0,25 é
um modelo plausível para X = módulo da elasticidade de sistemas de vigas de
madeira construídos de hem-fir grau número 2. O valor da média e variância de X são:
0, 252
0, 375 
E( X )   x  e 2
 1,50

 
Var ( X )   2 x  e 2  0,375  0, 25  e 0, 25  1  0,1453
2 2

A probabilidade de X estar entre 1 e 2 é:

P(1  X  2)  P(1,5  Z  1,27)  0,8312

Ln(1)  0,375 Ln(2)  0,375


Z1   1,5 Z2   1,27
0,25 0,25

Aplicação:
A partir dos dados dos tempos de reparo para as falhas do Circuito de Via Reed
(equipamento utilizado em sinalização ferroviária), fornecidos pelas equipes de
manutenção corretiva, os seguintes parâmetros da distribuição log-normal foram
estimados e traçadas as curvas abaixo:

Os parâmetros: α = 0,9268 e β = 1,8412 foram obtidos, a partir dos dados observados


dos tempos de reparo (pontos verdes), utilizando-se o método da regressão linear.
Logo após, foi traçada a curva em azul (curva teórica da manutenibilidade do "circuito
de via reed"). A curva vermelha foi obtida após as modificações efetuadas nos
métodos e processos de manutenção deste item.

64
Após a análise da manutenibilidade, foram identificados diversos problemas que
estavam conduzindo a altos tempos de reparo, tornando-se preciso modificar o
sistema de manutenção. Como exemplo, de problemas identificados, podemos citar:
 Algumas falhas, devido ao treinamento inadequado para as equipes de
manutenção, estavam conduzindo a tempos de reparo excessivamente altos.
 Os procedimentos de diagnose não estavam corretos na grande maioria dos
reparos.

O estudo para determinar a maneira precisa, como os dois parâmetros da distribuição


log-normal α e β estão relacionados com os fatores de manutenção que os
determinam, permitem obter predições apuradas da distribuição dos tempos de
paralisação de sistemas ou equipamentos. De importância particular no estudo, é a
descoberta e avaliação do efeito preciso do desempenho da manutenção devido aos
vários fatores humanos.

A análise dos tempos de reparo de sistemas ou equipamentos conduzem a(o):


melhoramento da qualidade dos serviços, aumento da disponibilidade, diminuição dos
custos de mão-de-obra e redução dos custos de perda de produção.

EXEMPLOS:
1. A concentração de poluentes produzidos por indústrias químicas é conhecida por
exibir comportamento que lembra uma distribuição log-normal. Isso é importante
quando considerarmos assuntos relacionados ao cumprimento das regulamentações
governamentais. Suponha que assumimos que a concentração de certo poluente, em
ppm, tem distribuição log-normal com parâmetros µ=3,2 e σ=1. Qual é a probabilidade
de que a concentração exceda oito partes por milhão? R: 0,8686

65
2. Em um estudo de Marketing, os dados referentes ao número de minutos diários que
100 indivíduos selecionados aleatoriamente passam em frente à TV foram tabulados;
após algumas análises chegou-se a conclusão de que o Ln (X) apresentava-se como
uma v.a. Y normalmente distribuída com média igual a 5 e desvio padrão de 1,5.
a) Qual a probabilidade de selecionarmos um indivíduo que assista no máximo 95 min
diários de televisão? R: 0,3821
b) Qual o tempo médio que um indivíduo passa diante da TV? R: E(X) = 457,14

VI. 2.5 Distribuição de Weibull

É usada para modelar o tempo até uma falha. Os parâmetros da distribuição


permitem modelar sistemas onde o número de falhas aumenta com o tempo (desgaste
do mancal), diminui com o tempo (alguns semicondutores) ou permanece constante.

A variável aleatória X com função densidade de probabilidade com parâmetros α e β:



x
   1
 
 
f ( x;  ,  )     x  e , para x  0 x
 0 x0

tem uma distribuição de Weibull com parâmetro de escala α >0 e parâmetro de forma
β > 0.
Quando α=1, a distribuição de Weibull é idêntica à distribuição exponencial.

A flexibilidade da distribuição é mostrada na Figura abaixo:

66
Função densidade de probabilidade de Weibull para valores selecionados de β e α.

A função de distribuição acumulada é frequentemente usada para calcular as


probabilidades. O seguinte resultado pode ser obtido:

0 x0

F ( x;  ,  )   x

 

  
 P ( X  x )  1  e x0
A média e a variância da v.a. X que tem distribuição de Weibull é:
 1
E (X )     1  
 
2
 2   1 
VAR ( X )     1     2 1  
2 2

     
Onde

r   (r  1)! se r for um inteiro positivo.


r   (r  1) (r  1) de uma maneira geral.
1 / 2  
e

( )   e  x x  1dx
0

67
Exemplo: O tempo de falha (em horas) de um mancal em um eixo mecânico é
satisfatoriamente modelado como uma v.a. de Weibull com α =1/2 e β = 5000 horas.
Determine o tempo médio até falhar.

 1 
E ( X )  5000 1    5000 (3)  5000  2! 10000 horas
 0,5 
Determine a probabilidade de um mancal durar no mínimo 6000 horas.
0,5
 6000
 
P( X  6000)  1  F ( x)  e  5000
 e 1, 2  0,301

APLICAÇÃO DA DISTRIBUIÇÃO DE WEIBULL

1. Velocidade do vento: A distribuição de Weibull tem sido utilizada em inúmeros


estudos destinados à análise de frequência da velocidade do vento, como no exemplo
abaixo:

2. Taxa de falha: É útil para determinarmos a taxa de falha (algumas vezes chamadas
de taxa de risco) e percebemos o desgaste ou deterioração do componente. Define-se
confiabilidade de um componente ou produto como a probabilidade de que ele
funcionará apropriadamente por, pelo menos, um tempo determinado, sob condições
experimentais específicas.

EXEMPLOS:

68
1. Suponha que X tem distribuição de Weibull com α =0,2 e β = 100 horas. Determine:
a) P(X <1000) R: 0,795
b) P(X>5000) R: 0,887

2. Suponha que a vida de um mancal de rolamento siga uma distribuição de Weibull


com α =0,2 e β = 10000 horas. Determine a probabilidade de um mancal durar menos
de 8000 horas. R: 0,6157

3. Suponha que a vida útil de um disco magnético de armazenamento exposto a gases


corrosivos tem uma distribuição de Weibull com α =0,5 e com β de 600 horas.
a) Determine a probabilidade de um disco de armazenamento durar no mínimo 500
horas. R: 0,401
b) Determine a probabilidade de um disco de armazenamento falhar antes de 400
horas. R: 0,558

UNIDADE VII. DISTRIBUIÇÕES AMOSTRAIS

Uma das realidades da amostragem aleatória é que, quando se extraem repetidas


amostras da mesma população, há tendência da estatística amostral variar de uma
amostra para outra, e também em relação ao verdadeiro valor do parâmetro,
simplesmente em razão de fatores casuais relacionados com amostragem. Essa
tendência é conhecida com variabilidade amostral. Assim quando fazemos inferências
sobre uma população devemos considerar a variabilidade amostral.

69
VII.1 Distribuição Amostral da Média

As distribuições de probabilidade das estatísticas amostrais são chamadas de


distribuições amostrais.

A média, bem como todas as demais estatísticas de uma amostra, são variáveis
aleatórias. Dessa forma, possuem distribuições de probabilidade como qualquer outra
variável aleatória. Uma distribuição amostral de médias é uma distribuição de
probabilidade que mostra a variabilidade das médias amostrais.
 A média de uma distribuição amostral é sempre igual à média populacional

x  

 Quando a população é infinita, o desvio padrão da distribuição amostral da média


é:

x 
n

EXEMPLO: Uma amostra aleatória de 100 observações dos valores das vendas
realizadas em determinada loja apresentou uma média igual a $ 328,40 e um desvio
padrão de $ 87,43. Qual o valor estimado da média, da variância e do desvio padrão
amostrais?
A média amostral será igual a: a $ 328,40
O desvio padrão amostral será igual a: 87,43/10 = 8,743
Teorema do Limite Central

Informações
1. A variável aleatória x tem distribuição (que pode ser normal ou não), com média µ e
desvio padrão σ .
2. Amostras de tamanho n são extraídas aleatoriamente dessa população.

Conclusão
1. Na medida em que o tamanho da amostra aumenta a distribuição das médias
amostrais x  , tende para uma distribuição normal.
2. A média das médias amostrais será a média populacional µ.

3. O desvio padrão das médias amostrais será
n

70
Regras práticas de uso comum
1. Para amostras de tamanho n>=30, a distribuição das médias amostrais pode ser
aproximada satisfatoriamente por uma distribuição normal. A aproximação melhora na
medida em que aumenta o tamanho da amostra n.
2. Se a própria distribuição original tem distribuição normal, então as médias
amostrais terão distribuição normal para qualquer tamanho amostral n.

EXEMPLO: Considere uma população com estatura média de 170 cm de altura e


desvio padrão de 9 cm.
A. Selecionada uma pessoa aleatoriamente, determine a probabilidade de sua
estatura estar entre 170 cm e 175 cm:
B. Selecionada aleatoriamente 35 pessoas, determine a probabilidade de suas
estatura terem média entre 170 cm e 175 cm:

VII.2 Distribuição Amostral da Proporção

A média (proporção ou percentagem média) da distribuição amostral p é sempre igual


à proporção populacional. Isto é,

p p

Onde:
p = proporção populacional
p = média da distribuição amostral das proporções.

Quando a população é muito grande ou infinita, o desvio padrão da distribuição


amostral se calcula pela fórmula:

71
p(1  p)
p 
n

Exemplo: Um varejista compra copos diretamente da fábrica em grandes lotes.


Periodicamente o varejista inspeciona os lotes para determinar a proporção dos
quebrados. Se um grande lote contém 10% de quebrados, qual a probabilidade do
varejista obter uma amostra de 100 copos com 17% ou mais defeituosos?
Solução: O primeiro passo é calcular o desvio padrão da população:

p(1  p) 0,10(0,90)
p    0,03
n 100
Usando a padronização temos:

P( pˆ  0,17)  ?
0,17  0,10
z  2,33
0,03

Olhando na tabela normal padrão temos que a probabilidade procurada é 0,0099.

OITAVA LISTA DE EXERCÍCIOS


1) A população das importâncias das compras em certo supermercado 24 horas tem média de
R$ 5,20 e desvio de R$ 4,10. Qual a probabilidade de um total de 100 compras o valor médio
exceder R$ 6,00? R= 0,0256

2) A distribuição do peso de homens que viajam de avião de Vitória para São Paulo tem média
de 163 libras e desvio padrão de 18 libras, qual é a probabilidade do peso médio de 36
homens tomados aleatoriamente ser menor que 167 libras.R=0,9082

3) Se vamos extrair amostras de n = 100 observações de uma população muito grande, em


que a proporção populacional é 20%, qual a probabilidade das proporções amostrais podemos
esperar nos intervalos abaixo? (Stevenson, pag, 188)
a) maior que 24% R =0,1587
b) 16% a 24% R =0,6826
c) 12% a 28% R= 0,9544
d) menos de 12% ou mais de 28% R = 0,0456

72
73
74

Você também pode gostar