Escolar Documentos
Profissional Documentos
Cultura Documentos
2. Probabilidades .............................................................................................................................................. 42
2.1. Introdução .............................................................................................................................................. 42
2.2. Conceitos fundamentais ......................................................................................................................... 42
2.3. Probabilidade.......................................................................................................................................... 45
2.4. Probabilidade condicionada ................................................................................................................... 51
2.5. Acontecimentos independentes ............................................................................................................ 51
3. Variáveis aleatórias....................................................................................................................................... 61
3.1. Noção de variável aleatória .................................................................................................................... 61
3.2. Caracterização e propriedades de variáveis aleatórias discretas........................................................... 61
3.3. Parâmetros associados às variáveis aleatórias discretas ....................................................................... 64
1
A Estatística fornece-nos técnicas para extrair informação de um
conjunto de dados, os quais são muitas vezes incompletos. O objetivo
final é obter uma melhor compreensão das situações, transformando
essa informação em conhecimento e permitindo tomar decisões mais
conscientes e assertivas.
Aqui serão revistos conceitos de estatística descritiva e inferencial,
aplicados às Ciências Empresariais.
O uso do software IBM SPSS será uma constante como ferramenta de
suporte aos conceitos introduzidos.
“Statistical Thinking will be one day as necessary for efficient citizenship as the ability
to read and write.”
H.G. Wells
1
1. Estatística Descritiva
_______________________________
1.1. Introdução
A Estatística é a ciência que recolhe, organiza, analisa, apresenta e interpreta os dados. São várias os campos
de atuação da Estatística, nomeadamente na indústria (ex.: cartas de controle, controlo de qualidade, eficácia
de fármacos), Administração Pública (ex.: censos), Meteorologia (ex.: dados de previsão para a navegação
aérea e marítima), Informática (ex.: Inteligência Artificial), Marketing (ex.: impacto campanha publicitária,
estudos de mercado), Política (ex.: sondagens), entre outros.
• Estatística Descritiva, que pretende isolar as estruturas e padrões mais relevantes num conjunto de
dados. É uma síntese e representação de uma forma compreensível da informação contida num
conjunto de dados, através da construção de tabelas, gráficos ou cálculo de medidas de localização e
de dispersão. É nesta área que se vai focar este capítulo.
• Inferência estatística, que generaliza resultados de uma amostra para uma população, estima
parâmetros desconhecidos, podendo testar hipóteses e ajudar na tomada de decisão.
População
Amostra
2
Quando a população é pequena ou o estudo requer uma maior precisão, devemos recorrer a um censo (estudo
de toda a população).
3
1.4. Tabela de frequências e gráficos
Após a recolha dos dados é necessário organizá-los e ordená-los. Geralmente define-se uma tabela com os
seguintes tipos de frequências:
Numa linha de produção são retiradas amostras do produto para avaliar o número de defeitos. O número de
defeitos por produto, numa amostra de 50 produtos, está sumariado a seguir.
0 0 1 1 2 3 4 2 3 0
0 0 2 3 3 4 4 2 2 2
1 1 1 1 1 2 0 0 0 1
1 1 1 1 2 3 4 1 2 2
3 3 1 1 1 0 0 2 2 3
4
Nas tabelas de frequências de dados agrupados em classes é comum acrescentar-se uma outra coluna com o
ponto médio de cada intervalo, que servirá de apoio para o cálculo de medidas estatísticas (ver próxima
secção).
O ponto médio de um intervalo ou classe com valores entre a e b é calculado da seguinte forma:
𝑎+𝑏
𝑷𝒐𝒏𝒕𝒐 𝑴é𝒅𝒊𝒐[𝒂;𝒃[ = 𝑀 = .
2
Considere-se parte de uma tabela relativa aos salários dos 150 trabalhadores de uma empresa:
O salário mensal dos 150 trabalhadores da empresa foi resumido na seguinte tabela.
Constatamos que “salários dos trabalhadores” é uma variável quantitativa contínua, onde os valores
individuais foram agrupados em intervalos salariais (classes). Assim, podemos fazer a tabela de frequências e
incluir o cálculo do ponto médio de cada classe/intervalo.
Freq. Freq.
Freq. Freq.
Salário Ponto Médio absoluta relativa
absoluta relativa
Mensal 𝑀 acumulada acumulada
𝑓 𝑓𝑟 (%)
𝐹 𝐹𝑟 (%)
[500; 1000[ 750 60 60 40 40
[1000; 1500[ 1250 65 125 43,3 83,3
[1500; 2000[ 1750 15 140 10 93,3
[2000;2500[ 2250 10 150 6,7 100
Total 150 100
5
Em termos gráficos obtemos a seguinte representação. Este gráfico designa-se histograma.
Nota complementar:
O número de classes, a sua amplitude e os seus limites poderão ser definidos pelo investigador, em função
dos dados e do estudo que pretende realizar.
Contudo, há indicadores que podem ser utilizados como referência:
o número de classes deve variar entre 4 e 20;
o número de classes deverá corresponder ao inteiro mais próximo da raiz quadrada
da dimensão (nº classes = 𝐶 = √𝑛);
no caso de se pretender classes com a mesma amplitude esse valor será dado por
6
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
2. Considere a variável “classificação do material usado no suporte de uma prateleira”, onde as opções de
resposta são Excelente, Bom ou Fraco. Então é uma variável:
(A) Qualitativa nominal
(B) Qualitativa ordinal
(C) Quantitativa discreta
(D) Quantitativa contínua
(E) Nenhuma das restantes
4. Considere o tempo de atraso dos comboios que passam numa estação durante um dia. Qual a
percentagem de comboios que têm um atraso entre 20 a 30 minutos?
(A) 140% Atraso (min) Nº de comboios
(B) 28% [0; 10[ 12
(C) 20% [10;20[ 16
(D) 14% [20;30[ 14
(E) nenhuma das restantes [30;40[ 8
7
5. A tabela a seguir representa o volume de vendas, em euros, de um café durante 200 dias.
Quais os valores corretos para os valores em falta?
Total de vendas f fr (%) Fr(%)
[0;30[ 5 2.5 a
[30;60[ 13 b c
[60;90[ d e 46
[90; 120[ f g h
[120; 150[ i 15 j
🔌 Tabelas de https://www.youtube.com/watch?v=sEFW7DX_2pM
frequências
https://www.youtube.com/watch?v=V4yqP6D8VY4
Gráficos https://www.youtube.com/watch?v=RE9eNdJuMGQ
https://www.youtube.com/watch?v=603rjGO3VPM
8
1.5. Medidas de estatística descritiva
Medidas descritivas são valores numéricos que procuram descrever ou sumariar as características
quantitativas de uma população ou de uma amostra.
Assim, denominamos de:
• Parâmetros - medidas descritivas que caracterizam a população. Geralmente são representados por
letras gregas.
• Estatísticas – medidas descritivas calculadas a partir de uma amostra. Geralmente são representadas
por letras romanas.
Pretende-se que as estatísticas sejam bons estimadores dos parâmetros, muitas vezes desconhecidos, da
população.
9
1.5.1. Medidas de tendência central
As medidas de tendência central são assim denominadas por indicarem um valor em torno do qual se
distribuem os dados. Este valor tende a ser o centro da distribuição dos dados.
Média
A média aritmética, ou simplesmente designada média, é a soma de todos os valores observados da variável
dividida pelo número total de observações.
∑𝑓 𝑥
Dados quantitativos organizados em tabelas de frequências: 𝑋̅ = 𝑛𝑖 𝑖 ou 𝑋̅ = ∑ 𝑓𝑟𝑖 𝑥𝑖
∑𝑓 𝑀
Dados quantitativos agrupados em classes: 𝑋̅ ≈ 𝑖 𝑖 ou 𝑋̅ ≈ ∑ 𝑓𝑟𝑖 𝑀𝑖 , sendo 𝑀𝑖 o ponto médio da
𝑛
classe 𝑖
(Nota: quando se refere a média populacional substituímos, como vimos anteriormente, 𝑋̅ por 𝜇)
Exemplo 1
Foi registado o número de clientes que chegam a uma loja por dia durante 15 dias.
3 4 1 4 2 3 5 6 3 4 3 3 4 2 3
3+4+1+4+2+3+5+6+3+4+3+3+4+2+3
Média: 𝑋̅ = 15
≈ 3,33.
Exemplo 2
Foi registado o número de lugares desocupados em 10 comboios que passaram numa estação num dia.
6 1 7 2 5 3 8 4 0 100
6+1+7+2+5+3+8+4+0+100
Média: ̅
𝑋= ≈ 13,6. Note-se que o facto do último comboio ter um número
10
muito elevado de lugares vazios, afetou consideravelmente a média.
10
Exemplo 3 (exemplo da secção anterior)
Numa linha de produção são retiradas amostras do produto para avaliar o número de defeitos. O número de
defeitos por produto, numa amostra de 50 produtos, está sumariado a seguir.
0×10+1×16+2×12+3×8+4×4
Média: 𝑋̅ = 50
=1,6 ou
Salário mensal Ponto Médio Freq. absoluta Freq. Absoluta Freq. relativa Freq. Relativa
𝑀𝑖 𝑓 acumulada 𝐹 𝑓𝑟 (%) Acumulada 𝐹𝑟 (%)
[500; 1000[ 750 60 60 40 40
[1000; 1500[ 1250 65 125 43,3 83,3
[1500; 2000[ 1750 15 140 10 93,3
[2000;2500[ 2250 10 150 6,7 100
Média: 𝑋̅ ≈ 750 × 0,40 + 1250 × 0,433 + 1750 × 0,10 + 2250 × 0,067 = 1167
Mediana
A mediana (𝑀𝑒𝑑 ou 𝑋̃) é o valor que ocupa a posição central de uma série de observações ordenadas de uma
variável, dividindo o conjunto em duas partes iguais. Em termos práticos, a mediana é o valor que de um lado
tem 50% de observações com os valores mais baixos e do outro tem 50% das observações com os valores mais
elevados.
Note que, os dados têm que estar sempre dispostos por ordem crescente ou decrescente .
𝑥𝑛 +𝑥𝑛
+1
o Se o número de dados for par: 𝑋̃ = 2
2
2
11
Dados quantitativos organizados na tabela de frequências: é o valor que ocupa o centro da amostra,
ou seja, 50% dos elementos são menores e 50% dos elementos são maiores do que a mediana.
0.5−𝑓𝑎−
Dado quantitativos organizados em classes: 𝑋̃ ≈ 𝐿𝐼 + ∆, onde:
𝑓𝑎 + −𝑓𝑎 −
A mediana apresenta a vantagem de ser robusta quando a amostra contém valores extremos ou outliers, ou
seja, não se deixa influenciar por esses valores.
𝑋̃ = 𝑥15+1 = 𝑥8 = 3
2
o que significa que esta loja em 50% dos dias teve no máximo 3 clientes por dia ou, visto de outra forma, nos
restantes 50% dos dias teve pelo menos 3 clientes por dia.
Exemplo 2 (cont.)
0 1 2 3 4 5 6 7 8 100
Exemplo 3 (cont.)
𝑥25 +𝑥26 1+1
Mediana: 1 (𝑋̃ = 2
= 2
= 1).
12
Exemplo 4 (cont.)
Classe mediana: [1000;1500[ (através da frequência relativa acumulada, verificamos que nesta classe atingimos 50% das
observações).
Moda
A moda (𝑀𝑜𝑑 ou 𝑋̂ ) é o valor da variável que apresenta a maior frequência de entre os valores observados.
Exemplo 1 (cont.)
Moda: 𝑋̂ = 3, que é o número de clientes por dia mais frequente.
Exemplo 2 (cont.)
Moda: não existe, pois todas os dados têm igual frequência. Neste caso dizemos que se trata de uma amostra
amodal.
Exemplo 3 (cont.)
Moda: 𝑋̂ = 1 pois é o valor mais frequente (verificado através da frequência absoluta ou frequência relativa)
Exemplo 4 (cont.)
Classe modal: [1000; 1500[
Percentis
Por exemplo, P5 significa o percentil de ordem 5, isto é, P5 é o valor que, num conjunto ordenado, se encontra
numa posição em que de um lado tem 5% das observações menores e no outro lado tem as restantes 95%.
Decis
13
Quartis
Assim, a mediana corresponde ao Q2, que é simultaneamente igual ao percentil de ordem 50.
Representando num gráfico os valores mínimo, máximo e quartis, obtemos a designada caixa-de-bigodes ou
diagrama de extremos e quartis ou boxplot. Este gráfico pode ser apresentado quer na horizontal quer na
vertical.
Exemplo 3 (cont.)
Numa linha de produção são retiradas amostras do produto para avaliar o número de defeitos. O número de
defeitos por produto, numa amostra de 50 produtos, está sumariado a seguir.
Verificamos que:
Q1=1
Q2=Med=1
Q3=2
14
1.5.3. Medidas de dispersão
As medidas de dispersão auxiliam as medidas de tendência central a descrever adequadamente o conjunto de
dados estudado. Permitem descrever o quanto os resultados observados se distribuem em torno dos valores
centrais, isto é, se estão muito concentrados (baixa dispersão), ou se estão afastados uns dos outros (grande
dispersão).
Amplitude (A)
𝐴 = 𝑥𝑚á𝑥𝑖𝑚𝑜 − 𝑥𝑚í𝑛𝑖𝑚𝑜
(A amplitude é a diferença entre os valores máximo e mínimo observados)
𝐴𝐼𝑄 = 𝑄3 − 𝑄1
(A amplitude interquartil é a diferença entre o Quartil 3 e o Quartil 1)
Nota:
Diz-se que uma observação é um outlier se o seu valor é superior a 𝑄3 + 1,5𝐴𝐼𝑄 ou inferior a
𝑄1 − 1,5𝐴𝐼𝑄
Diz-se que uma observação é uma observação extrema ou outlier severo se o seu valor é superior a
𝑄3 + 3𝐴𝐼𝑄 ou inferior a 𝑄1 − 3𝐴𝐼𝑄
Variância
Esta medida de dispersão traduz a variação de um conjunto de dados em torno da média, ou seja, da maior
ou menor variabilidade dos valores observados. Esta medida só assume valores não negativos e quanto maior
o seu valor, maior a dispersão dos dados.
∑𝑛 ̅ 2
𝑖=1(𝑥𝑖 −𝑋)
Variância amostral: 𝑠 2 =
𝑛−1
∑𝑁
𝑖=1(𝑥𝑖 −𝜇)
2
(Nota: A variância populacional é dada por 𝜎 2 = )
𝑁
Desvio padrão
É a medida de dispersão mais utilizada. O valor desta medida é obtido através da raiz quadrada da variância.
∑𝑛 ̅ 2
𝑖=1(𝑥𝑖 −𝑋)
Desvio padrão amostral: 𝑠 = √𝑠 2 = √
𝑛−1
∑𝑁
𝑖=1(𝑥𝑖 −𝜇)
2
(Nota: Desvio padrão populacional é dado por 𝜎 = √𝜎 2 = √ )
𝑁
15
Coeficiente de variação
Esta medida de dispersão relativa não depende das unidades em que a variável é expressa, pelo que é útil
para comparar duas ou mais distribuições relativamente à dispersão. Mede o grau de concentração em torno
da média, em valor percentual:
𝑠
𝐶𝑉 = × 100
𝑋̅
Exemplo
Considere-se os salários anuais de duas PME (em milhares de euros):
Empresa A 44 45 50 51 60
Empresa B 5 5 30 100 110
O salário médio é igual em ambas as empresas. Por isso, esta medida estatística não é suficiente para descrever
as diferenças salariais nas duas empresas. Observando os salários em cada empresa, verificamos que na
empresa B há salários muito diferentes entre si. Surge a necessidade de usar as medidas de dispersão.
Variância:
(44 − 50)2 +(45 − 50)2 + (50 − 50)2 + (51 − 50)2 + (60 − 50)2
𝑠𝐴2 = = 40,5
5−1
Desvio padrão:
Coeficiente de variação:
𝑆 𝑆
𝐶𝑉𝐴 = 𝑋̅𝐴 × 100 = 12,72 e 𝐶𝑉𝐵 = 𝑋̅𝐵 × 100 = 102,72
𝐴 𝐵
Apesar da média salarial de ambas as empresas ser igual, através das medidas de dispersão conseguimos
verificar que na empresa B existe uma grande variabilidade nos salários pagos.
16
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
1. Um valor numérico usado como medida de resumo para uma amostra, como a média amostral, é
conhecido como:
(A) Parâmetro da população
(B) Parâmetro da amostra
(C) Estatística da amostra
(D) População média
(E) Nenhuma das anteriores
2. Qual das opções seguintes fornece uma medida de tendência central para um conjunto de dados?
(A) Desvio padrão
(B) Média
(C) Variância
(D) Amplitude
(E) 1º Quartil
3. Uma vez que o tamanho da população é sempre maior do que o tamanho da amostra, então a estatística
da amostra:
(A) Nunca pode ser maior do que o parâmetro da população
(B) Nunca pode ser igual ao parâmetro da população
(C) Nunca pode ser menor do que o parâmetro da população
(D) Tem de ser sempre igual ao parâmetro da população
(E) Pode ser menor, maior ou igual ao parâmetro da população
17
6. Se duas amostras de uma mesma população têm a mesma média, então:
(A) O desvio padrão tem de ser igual para ambas as amostras
(B) As medianas têm de ser iguais
(C) A moda tem de ser igual para ambas as amostras
(D) A amplitude tem de ser igual para ambas as amostras
(E) Nenhuma das restantes alternativas é correta
9. Considere o número de clientes de uma loja, por dia. A média e desvio Nº de clientes Frequência
padrão são, respetivamente: 0 8
(A) 2.19; 1.46 1 16
2 22
(B) 2.19; 2.10
3 14
(C) 3.42; 1.46
4 6
(D) 3.42; 2.17 5 4
(E) 1.91; 1.44 6 2
10. Durante 21 dias foi medida a humidade relativa de uma cidade. Teve uma média de 65% e uma mediana
de 68%. Infelizmente descobriu-se que um dos registos estava errado: tinha sido registado 35% quando
na verdade deveria ter sido 40%. Se for feita a correção desse dado, então:
(A) a média permanece a mesma, mas a mediana aumenta
(B) a média e a mediana permanecem as mesmas
(C) a mediana permanece a mesma, mas a média aumenta
(D) a média e a mediana aumentam
(E) média aumenta, mas a mediana diminui.
18
11. A seguinte tabela representa o número de telemóveis vendidos por dia numa loja.
Nº de telemóveis 0 1 2 3 4 ou mais
Frequência relativa 0.55 0.20 0.10 0.15 0
Das afirmações que se seguem, quais são as verdadeiras?
(i) A média e a moda são iguais
(ii) A média e a mediana são iguais
(iii) A mediana e a moda são iguais
(A) Apenas (i)
(B) Apenas (ii)
(C) Apenas (iii)
(D) Apenas (i) e (ii)
(E) Todas as afirmações são verdadeiras
12. A tabela representa o número de bactérias por amostra num rio, recolhidas Número de Número
durante 50 dias por uma empresa da de microbiologia. O valor médio de bactérias de
bactéria da amostra é: amostras
(A) 70 [50, 60[ 5
[60, 70[ 15
(B) 71
[70, 80[ 20
(C) 72
[80, 90[ 10
(D) 76
(E) 65
13. Considere a tabela do exercício 12. Qual das seguintes afirmações é falsa?
(A) A classe modal é [70, 80[.
(B) A classe mediana é [70, 80[.
(C) O ponto médio do segundo intervalo é 65.
(D) Q3 pertence ao intervalo [70, 80[
(E) Q1 pertence ao intervalo [50, 60[
14. Uma empresa faz um teste psicotécnico (cotado de 0 a 100) para um conjunto de potenciais candidatos
a um lugar na empresa. Os resultados foram os seguintes:
20, 35, 35, 45, 50, 55, 65, 75, 75, 75, 85, 85, 95, 95, 100.
Depois de calcular as medidas de tendência central destes resultados, descobriu-se que um dos testes
tinha sido mal cotado: um dos 75% era na realidade 85%. Quais as medidas estatísticas que sofreram
alteração?
(A) apenas a média
(B) apenas a moda
(C) apenas a mediana
(D) a média e a moda
(E) as três medidas
19
15. Considere as informações sobre o salário mensal Filial A Filial B
de duas filiais da mesma empresa. Tamanho da amostra 45 45
Qual das seguintes frase é necessariamente Média da amostra 1000€ 800€
verdadeira? Desvio Padrão da amostra 80€ 70€
(A) Os salários pagos em A são todos mais elevados que os salários pagos em B
(B) A variabilidade dos salários na filial A é menor que a variabilidade na filial B.
(C) A variância associada aos salários da filial B é 6400.
(D) A variabilidade dos salários na filial A é maior que a variabilidade na filial B.
(E) Não se pode tirar qualquer tipo de conclusão, pois não há dados suficientes.
18. Considere o conjunto de dados ordenados do menor para o maior: 2 12 y 15 15 18 18 19, com y
um número inteiro. Quais das seguintes afirmações são verdadeiras?
(i) A mediana e o primeiro quartil não são iguais.
(ii) A moda é 18.
(iii) 2 é o mínimo.
(A) Apenas (i)
(B) Apenas (ii)
(C) Apenas (iii)
(D) Apenas (i) e (iii)
(E) Todas
20
19. Considere o gráfico caixa de bigodes relativo ao peso (em Kg) dos bebés à nascença. Considere as
afirmações:
i) A média do peso dos bebés é
3,1 Kg
ii) 75% dos bebés têm peso
inferior ou igual a 3Kg
👉 Soluções: 1.C | 2.B | 3.E | 4.B | 5.B | 6.E | 7.D | 8.B | 9.A | 10.C | 11.C | 12.C | 13.E |
14.D | 15.B |16.C | 17.D | 18.D | 19.E
🔌 Medidas de https://www.youtube.com/watch?v=v8fo_hSpo-k
tendência
central
Medidas de https://www.youtube.com/watch?v=ie2few5B7ZU
partição
Medidas de https://www.youtube.com/watch?v=Za8SUxUNVIo
dispersão
https://www.youtube.com/watch?v=Js71WYZsy50
21
1.6. Software SPSS e Estatística descritiva
O SPSS (Statistical Package for Social Sciences) é uma ferramenta para análise estatística de dados, num
ambiente gráfico, com menus e caixas de diálogo de fácil utilização.
SPSS Editor de dados – onde são apresentados os dados em estudo e as caraterísticas das variáveis
definidas; esta janela apresenta dois separadores:
o visualização de dados, onde é possível visualizar e editar os dados;
o visualização da variável, onde é permitido definir ou alterar as características das variáveis.
SPSS Visualizador – onde se apresentam os resultados dos estudos realizados; a janela está dividida
em duas partes, mostrando no lado esquerdo o título dos resultados obtidos e no lado direito os
resultados gerados.
22
1.6.2. Base de dados
No SPSS o ficheiro de dados é constituído por uma matriz na qual as colunas correspondem às variáveis e as
linhas aos indivíduos/casos. Cada célula corresponde a uma observação individual da variável correspondente.
Podemos criar uma nova base de dados ou usar uma já existente. Nesta secção os retângulos a cinza
descrevem os comandos usados no SPSS.
Na criação de uma base de dados tem que se preencher os dois separadores presentes no editor de dados:
No separador “Visualização de dados”, cada coluna corresponderá a uma variável, que será encimada pelo
nome, e os valores observados da variável terão que ser escritos, um a um, na coluna.
No separador “Visualização da variável”, cada linha contém a informação respeitante a cada variável:
Nome - deve ser indicado o nome da variável, que aparecerá no topo da coluna na janela “Visualização
de dados”. Este nome deve seguir determinadas regras, das quais se destacam não haver espaços
entre palavras e ou números; o nome não pode iniciar-se com um número; alguns caracteres especiais
não são aceites; não são permitidos nomes em duplicado, isto é, o nome de uma variável é único na
base de dados.
Tipo - deve ser indicado o tipo de variável, de uma escolha que o programa oferece; na maioria dos
casos os tipos utilizados são o tipo numérico ou a sequência de caracteres.
23
Largura - este campo corresponde à dimensão da variável, isto é, define o nº máximo de algarismos
ou caracteres que o valor da variável pode tomar.
Decimais - deve indicar-se o n.º de casas decimais que a variável pode tomar, caso seja do tipo
numérico.
Rótulo - não é um campo obrigatório, mas pode ser de extrema utilidade. Por exemplo, pode conter
uma descrição mais completa da variável, descrição essa que aparecerá nas tabelas e gráficos
construídos.
Valores - onde é indicado o código utilizado para definir valores da variável. Por exemplo: suponha
que, para simplificar, se definia o valor 1 para o género masculino e 2 para o género feminino. Então
é aqui que se deve informar o sistema deste “código”.
Ausente/Omisso - onde se informa o sistema que um determinado valor representa uma situação
anómala e não um valor aceitável para a variável. Existem também system-missing, quando o sistema
não é informado sobre a situação (qualquer célula em branco).
Colunas - indica a largura da coluna que conterá a informação da variável no separador “Visualização
de Dados”.
Medir - é onde se indica a escala de medida da variável, que pode ser Nominal ou Ordinal, para as
variáveis qualitativas, ou de Escala, para as variáveis quantitativas.
~
24
Exemplo
Considere os dados relativos à venda diária de um produto XYZ numa cadeia de supermercados.
Vendas diárias Posição na prateleira Loja
14 1 Norte
15 2 Norte
16 1 Centro
10 2 Centro
14 3 Centro
11 1 Norte
17 1 Centro
16 1 Norte
14 1 Centro
15 1 Norte
12 1 Centro
10 1 Norte
15 2 Centro
19 2 Norte
11 2 Norte
23 2 Norte
20 2 Centro
18 2 Norte
17 3 Centro
27 3 Norte
33 3 Centro
22 3 Centro
26 3 Centro
28 3 Norte
No SPSS obtemos a seguinte base de dados (supermercado.sav), onde na visualização dos dados temos…
Houve o cuidado de transformar a localização da loja num código para ser mais fácil tratar os dados
nominais posteriormente.
Assim, os dados podem ser visualizados com a localização (Norte ou Centro) ou com o valor
atribuído a cada localização (1 ou 2, respetivamente). Basta clicar no ícone seguinte para
trocar a visualização.
25
1.6.3. Transformação dos dados
Para além da introdução das variáveis no separador “Visualização dos dados”, o SPSS possibilita a criação de
novas variáveis através de transformações ou de cálculos numéricos entre as variáveis já existentes. As
ferramentas usadas para isso são:
Cálculo de uma nova variável, recorrendo a fórmulas matemáticas e/ou lógicas;
Transformação de uma variável existente, recodificando-a (por exemplo, agrupando os valores
numéricos em intervalos).
Exemplo (supermercado.sav)
Lucro_diario=venda*15
Recodificação em variável diferente, que cria uma nova variável com a recodificação pretendida dos
valores da variável original (recodificação aconselhada);
Recodificação automática, que recodifica variáveis do tipo sequência de caracteres ou do tipo
numérico em número inteiros consecutivos.
26
Exemplo (supermercado.sav)
1) Vamos supor que precisamos de criar uma nova variável relativa às vendas, onde se pretende que os
dados estejam agrupados em intervalos de amplitude 5, da seguinte forma:
1=[10; 15[ 2=[15; 20[ 3=[20; 25[ 4=[25; 30[ 5=[30; 35]. Então devemos fazer:
2) Suponhamos agora que se pretendia que os dados fossem agrupados nos seguintes intervalos:
1=[10; 15] 2=]15; 20] 3=]20; 25] 4=]25; 30] 5=]30; 35]. Então teríamos que fazer:
27
3) Suponhamos, ainda, que se pretendia agora que os dados fossem agrupados nos seguintes intervalos:
1=[10; 15] 2=]15; 20[ 3=[20; 25] 4=]25; 30[ 5=[30; 35].
Neste caso a introdução da codificação seria:
Exemplo (supermercado.sav)
28
Menu: Analisar Estatística descritiva Frequências
Caixa Variável: colocar a(s) variável(eis) que se pretende(m) estudar
Após esta seleção é possível obter-se:
* Tabela de frequências: manter selecionada a opção “Exibir tabela de frequências”
* Estatísticas descritivas: Botão “Estatísticas” Selecionar as estatísticas que se pretende continuar
*Gráficos: Botão “Gráficos” selecionar o tipo de gráfico pretendido (barras, circular – e se se pretende
frequências absolutas ou relativas – ou histograma) continuar
Exemplo (supermercado.sav)
29
Estatísticas
venda diária
N Válido 24
Omisso 0
Média 17,63
Mediana 16,00
Modo 14a
Erro Desvio 6,114
Variância 37,375
Intervalo 23
Mínimo 10
Máximo 33
Percentis 25 14,00
50 16,00
75 21,50
a. Há vários modos. O menor valor é
mostrado
Existe um menu específico para a construção de gráficos, permitindo uma abordagem mais detalhada.
Menu: Gráficos Caixa de diálogo legadas Selecionar o tipo de gráfico que se pretende analisar, em
particular:
* Gráfico de barras Simples e Resumo de grupos de casos Colocar a variável que se quer estudar em
“Eixo de categoria” e selecionar a “Representação de barras” pretendida (ex.: frequência absolutas, relativas,
acumuladas, …)
Exemplo (supermercado.sav)
Nota complementar:
A edição de título, legendas, eixos, cor, entre outras, podem ser feitas no editor de gráficos. Para isso, basta
clicar no ficheiro de dados, clicar duas vezes em cima do gráfico e abrirá uma janela com variadas opções.
30
1.6.7. Análise estatística bivariada
Por vezes surge a necessidade de estudar uma variável de forma mais pormenorizada, subdividindo os dados
tendo em conta um determinado fator, ou cruzar a informação dada por duas variáveis.
No exemplo do supermercado, podemos querer estudar as vendas tendo em conta a localização da loja (Norte
ou Centro) ou tendo em conta a localização do produto na prateleira (posição 1, 2 ou 3).
Devemos iniciar com uma tabela cruzada para entender melhor a distribuição dos dados
Menu: Analisar Estatística descritiva Tabela de referência cruzada
Caixa Linhas: selecionar uma variável
Caixa coluna: selecionar a outra variável
Para construir os gráficos selecionar:
“Exibir gráfico de barras agrupadas”
“Células” Contagens (selecionar observado); Percentagens (selecionar pelo menos o total)
Exemplo (supermercado.sav)
Se se pretender analisar as vendas, tendo em conta a localização da loja, obtemos os quadros:
31
16 Contagem 1 1 2
% do Total 4,2% 4,2% 8,3%
17 Contagem 0 2 2
% do Total 0,0% 8,3% 8,3%
18 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
19 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
20 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
22 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
23 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
26 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
27 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
28 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
33 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
Total Contagem 12 12 24
% do Total 50,0% 50,0% 100,0%
32
Exemplo (supermercado.sav)
Se se pretender analisar as vendas, tendo em conta a localização da loja, surgem os seguintes quadros:
33
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
4. (*). Duzentos alunos foram inquiridos sobre quantas horas passam por dia no
Horas Número
computador. A tabela seguinte traduz essa informação. A média e o desvio
de alunos
padrão são, respetivamente: 3 30
(A) 4,85 e 1,198 4 50
(B) 4,85 e 1,435 5 60
(C) 5 e 1,198
6 40
(D) 5 e 1,435
7 20
(E) 40 e 1,234
5. (*). Considere a tabela com o número de dias no hospital após uma cirurgia; referentes a 50 pacientes.
Qual das seguintes afirmações é verdadeira?
Nº dias 2 3 4 5 6 7
(A) O tempo médio de estadia é superior para o
género feminino. Feminino 0 3 6 8 4 1
(B) A mediana é igual para ambos os géneros. Masculino 2 3 6 8 3 6
(C) A amplitude é 5 para ambos os géneros.
(D) A variância para o género feminino é superior ao do género masculino.
(E) Não existe nenhum outlier quando é estudada a distribuição de dias no hospital agrupada
por género.
(*). Poderá construir a base de dados no SPSS para facilitar os cálculos.
🔌 Introdução ao https://www.youtube.com/watch?v=9pRpDy7Z8Lo
SPSS
Recodificar https://www.youtube.com/watch?v=53S6gpM3PHE&t=364s
variáveis
https://www.youtube.com/watch?v=l12KKfjXXGs
Análise https://www.youtube.com/watch?v=eRIv7qxqY0M
univariada
Análise https://www.youtube.com/watch?v=NfHiHP_QPy0
bivariada
https://www.youtube.com/watch?v=4Y_OC2vP0vA
35
Ficha de trabalho nº1
1. Classifique cada uma das seguintes variáveis:
1.1. Nº de clientes que entram por dia numa loja de roupa;
1.2. Cor favorita;
1.3. Profissão desejada;
1.4. Velocidade do carro em km/h;
1.5. Temperatura ambiente;
1.6. Número de irmãos;
1.7. Nível cultural dos habitantes de uma região;
1.8. Temperaturas registadas por dia num posto de meteorologia.
3. Considere os dados apresentados no gráfico abaixo relativos ao número de reuniões realizadas pelos
clientes de uma empresa de marketing. Complete:
3.1. Variável em estudo: _________________________________
3.2. ______% de clientes
tiveram menos do que 4 25 23 23
reuniões.
20
frequência absoluta
nº de reuniões
36
4. O seguinte quadro estatístico refere-se ao número clientes numa loja de telemóveis por dia.
Nº de clientes Frequência Frequência Frequência Frequência
absoluta acumulada relativa relativa
acumulada
0 8
1 0,15
2 20
3 0,9
4 4
4.1. Qual a variável em estudo? Classifique-a.
4.2. Complete a tabela.
4.3. Apresente as medidas de tendência central.
4.4. Apresente o desvio padrão e a amplitude interquartil. Apresente a caixa de bigodes.
5. O responsável pela gestão hospitalar de uma unidade de cuidados Dias de internamento Nº de doentes
médicos intensivos, obteve a seguinte distribuição referente ao [0; 10[ 48
tempo de internamento dos doentes daquela unidade: [10; 20[ 33
5.1. Qual a variável em estudo? Classifique-a. [20; 30[ 27
[30; 40[ 18
5.2. Apresente a tabela de frequências absolutas e relativas.
[40; 50[ 15
5.3. Determine o número médio de dias de internamento. [50; 60[ 9
Total 150
5.4. Encontre a classe mediana e a classe modal.
5.5. Construa o histograma de frequências absolutas.
6. Considere o seguinte histograma de frequências relativas, referente à distribuição das pensões de 1000
reformados dentro do regime de Segurança Social.
Indique, justificando:
6.1. O número de reformados cuja
pensão é inferior a 26 dezenas de
euros, mas superior ou igual a 18
dezenas de euros.
6.2. A percentagem de reformados
cuja pensão é superior ou igual a
200 euros.
6.3. A percentagem de reformados
cuja pensão é de pelo menos 18
dezenas de euros.
6.4. O número de inválidos cuja pensão é inferior a 160 euros.
6.5. Construa o polígono de frequências correspondente ao histograma.
37
7. Admita que se realizou um inquérito a um grupo de compradores de 30 carros novos para determinar
quantas reparações ou substituições de peças foram feitas durante o primeiro ano de utilização dos carros,
tendo-se obtido os seguintes resultados:
1 5 2 1 2 1 2 2 1 3
3 4 1 3 2 4 0 3 1 2
7 1 1 4 0 2 3 1 3 2
7.1. Qual a variável em estudo? Classifique-a.
7.2. Apresente os dados numa tabela de distribuição de frequência. Apresente o respetivo gráfico de
barras respeitante às frequências relativas.
7.3. Calcule o número de compradores que realizaram no máximo 3 reparações ou substituições de peças
durante o primeiro ano de utilização do carro.
7.4. Indique o número de compradores que realizaram mais do que 5 reparações ou substituições de
peças durante o primeiro ano de utilização do carro.
7.5. Qual a percentagem de compradores que realizaram um número de reparações ou substituições de
peças inferior a 4.
8. Ao longo do ano de 2008, o número de empréstimos diários que o balcão de Maçores fez, numa amostra
de 40 dias escolhidos aleatoriamente, está registado na tabela que se segue:
7 6 9 9 10 5 3 1 5 0
2 7 10 11 3 5 9 10 5 3
0 4 11 10 7 8 9 9 10 8
7 8 6 9 8 6 3 5 2 5
8.1. Classifique a variável em estudo;
8.2. Apresente os dados numa tabela, apenas com frequências absolutas, sem agrupar os dados em
classes;
8.3. Calcule a média, a mediana e os quartis;
8.4. Calcule o desvio padrão e o intervalo interquartil;
8.5. Sabendo que numa amostra do balcão de Aceira se obteve uma média de 5 e variância de 6, indique
justificando em qual dos balcões a dispersão em torno da média desta variável é maior.
38
10. Os dados seguintes dizem respeito às cotações de 40 títulos da bolsa de valores de Novaterra (em
unidades monetárias):
174 178 175 168 161 156 174 189 170 172
168 174 181 176 176 171 171 183 186 173
177 172 173 178 161 188 181 169 164 172
171 168 170 163 171 167 170 163 172 167
10.1. Organize os dados em classes de igual amplitude.
10.2. Construa o histograma e o polígono de frequências referentes às frequências relativas ordinárias e
acumuladas.
11. Uma turma (A) com 30 alunos tem a Matemática uma classificação média de 11 valores. Uma outra turma
(B) com 25 alunos tem, na mesma disciplina, uma média de 13 valores. Dois alunos da turma A com notas
de 7 e 8 valores, trocaram com outros dois alunos da turma B com classificações de 13 e 17 valores. Nestas
condições qual passou a ser a classificação média em cada turma na disciplina de Matemática?
12. Calcule a mediana da seguinte amostra: 4, 4, 5, X, 5, 4, 4, onde X é um valor desconhecido. Justifique a sua
resposta.
13. Numa empresa, a distribuição dos salários é dada pela seguinte tabela:
Salário Nº de funcionários
100 150
500 15
1000 5
3000 1
13.1. Qual a variável em estudo? Classifique-a.
13.2. Calcule as medidas de tendência central.
13.3. Apresente a caixa de bigodes.
13.4. Calcule as medidas de dispersão.
13.5. Está numa negociação sindical. Que medida(s) de tendência central que usaria para negociar se
fosse o diretor da empresa? E se fosse o representante sindical? Justifique.
14. Perguntou-se o salário, em euros, aos operários de duas fábricas, tendo-se obtido os seguintes valores:
Fábrica A Fábrica B
700 900 800 750 1000 1050 800 750 950 700 850 800 900
Determine a média e o desvio padrão dos salários dos operários de cada uma das fábricas. Em qual das
fábricas é maior a dispersão dos salários dos operários? Justifique.
39
15. Uma concessionária de automóveis, com 20 trabalhadores, num determinado mês registou a seguinte
informação:
Anos na Número de Género
Idade Salário (em €)
empresa vendas
34 5 1100 10 Masculino
26 1 650 3 Feminino
35 10 1450 8 Masculino
43 4 1100 7 Feminino
27 3 800 15 Masculino
38 8 1300 11 Feminino
26 2 650 5 Masculino
37 5 1250 7 Feminino
24 3 700 10 Masculino
45 13 1700 13 Feminino
31 7 1200 6 Masculino
36 4 950 17 Feminino
25 3 1050 10 Masculino
32 8 1300 9 Feminino
24 2 700 4 Masculino
29 9 1300 5 Feminino
36 8 1250 12 Masculino
32 5 1150 6 Feminino
44 13 1700 7 Masculino
35 6 1200 18 Feminino
15.1. Construa a base de dados no SPSS, codificando 1=masculino e 2=feminino.
15.4. Construa uma nova variável ”bónus salarial”, usando a seguinte fórmula:
Bónus_salarial = salário + 200 * anos na empresa
40
16. Foi elaborado um inquérito a 42 jovens. Os resultados encontram-se no ficheiro inquerito.sav.
16.1. Apresente a tabela de frequências para as variáveis Sexo e Cor.
16.2. Cruze as variáveis Sexo e Cor e determine:
16.2.1. o número de rapazes que responderam ao questionário
16.2.2. o número de meninas que responderam ao questionário
16.2.3. a percentagem total de homens e mulheres que gostam da cor azul
16.3. Para a variável Altura, determine:
16.3.1. A média e o desvio padrão.
16.3.2. os quartis e os percentis 10 e 90.
16.3.3. o valor máximo e valor mínimo.
16.3.4. Crie uma nova variável “altura em classes” que reescreva os dados nos seguintes intervalos:
[1,40; 1,50[, [1,50; 1,60[, [1,60; 1,70[ e [1,70; 1,80[
16.3.5. Apresente um histograma com esta nova variável.
16.3.6. Compare as alturas entre ambos os géneros.
𝑝𝑒𝑠𝑜
16.4. Crie uma nova variável, relativa ao índice de massa corporal: 𝐼𝑀𝐶 = 𝑎𝑙𝑡𝑢𝑟𝑎2, onde o peso tem de
ser medido em kg e a altura em metros.
16.5. Selecione apenas os homens desta amostra. Apresente a caixa de bigodes relativo ao peso.
17. O ficheiro empréstimo.sav diz respeito a dados de 100 clientes de um banco que fizeram um pedido de
empréstimo.
17.1. Relativamente à variável número de anos que está no mesmo emprego:
17.1.1. Apresente o gráfico de barras das frequências relativas. Qual o número de anos no mesmo
emprego mais frequente?
17.1.2. Apresente a tabela de frequências relativas e indique qual a percentagem de clientes que
continua no mesmo emprego há pelo menos 15 anos.
17.1.3. Apresente as medidas estatísticas mais usuais. Explique o significado das medidas de
tendência central.
17.1.4. Apresente a caixa de bigodes. Comente os resultados obtidos.
17.2. Relativamente à variável salário:
17.2.1. Apesente o histograma. Admita que o salário mínimo neste país é de 45 mil euros.
Apresente no histograma uma linha vertical com esse indicador e mude as barras para a
cor verde.
17.2.2. Apresente uma nova variável “salario_classes”, que apresenta os salários dos clientes
organizados pelos seguintes intervalos, em milhares de euros: 1=[10;50[, 2=[50;90[,
3=[90;130[ e 4=[130;190[. Na visualização da variável deve estar também codificada.
17.3. Relativamente à variável salário_classes, em função do incumprimento de empréstimos anteriores:
17.3.1. Apresente a tabela de referência cruzada e apresente a percentagem de clientes que tendo
um salário anual entre 50 e 90 milhares de euros, estiveram em incumprimento em
empréstimos anteriores.
17.3.2. Apresente o gráfico de barras agrupadas. Comente o gráfico obtido.
17.4. Crie uma nova variável “total de crédito”:
17.4.1. usando a seguinte expressão: Total de crédito=cartão de crédito + outros créditos
17.4.2. Apresente as medidas estatísticas mais usuais, tendo como fator de análise o
incumprimento de empréstimos anteriores. Comente os resultados.
17.5. Selecione apenas os clientes que têm licenciatura. Qual o valor médio do rácio entre o valor em
dívida e o salário ganho?
41
2. Probabilidades
_______________________________
2.1. Introdução
A noção de probabilidade é difícil de definir, caso não se usem conceitos matemáticos. A palavra probabilidade
deriva do Latim probare (provar ou testar). Assim, de forma genérica podemos identificar a “probabilidade de
um acontecimento” como o processo usado para medir o “grau de convicção” na sua realização.
Define-se como espaço amostral ou espaço de resultados o conjunto de todos os resultados possíveis de
uma experiência aleatória. O espaço amostral é habitualmente representado por Ω ou U.
Exemplos
Considere a experiência aleatória lançamento de um dado e observar a face que fica voltada para cima. O
espaço amostral é Ω = {1, 2, 3, 4, 5, 6}.
2.2.1. Acontecimentos
Um acontecimento é um subconjunto do espaço de resultados. Um acontecimento pode ser classificado
como:
Exemplo
42
Considere a experiência aleatória lançamento de um dado e observar a face que fica voltada para cima.
Temos por exemplo, os seguintes acontecimentos:
̅ (ou Ac)
complementar do evento A, 𝑨
conjunto constituído pelos elementos do espaço amostral
que não pertencem a A
se 𝐴 ∩ 𝐵 = ∅ A B
A e B são contrários
se 𝐴 ∩ 𝐵 = ∅ e 𝐴 ∪ 𝐵 = ∅
43
Dupla negação: 𝐴̅ = 𝐴
Distributiva: (𝐴 ∪ 𝐵) ∩ 𝐶 = (𝐴 ∩ 𝐶) ∪ (𝐵 ∩ 𝐶) e (𝐴 ∩ 𝐵) ∪ 𝐶 = (𝐴 ∪ 𝐶) ∩ (𝐵 ∪ 𝐶)
Exemplo
Houve um sorteio de um prémio para o departamento de informática, que é composto por 10 funcionários.
A cada trabalhador foi atribuído um papel com um número (de 1 a 10). Todos os funcionários colocaram o
seu número num saco opaco.
Considere os acontecimentos:
a) 𝐴 ∪ 𝐵 = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} = Ω
b) 𝐴 ∩ 𝐵 = ∅, pelo que A e B são acontecimentos contrários
c) 𝐴 ∪ 𝐶 = {2, 3, 4, 6, 8, 9, 10}
d) 𝐴 ∩ 𝐶 = {6}
e) 𝐵 ∪ 𝐷 = 𝐵
f) 𝐵∩𝐷 ={}
g) 𝐵 ∪ 𝐸 = 𝐸 = Ω
h) 𝐵 ∩ 𝐸 = 𝐵
i) 𝐴̅ = {1, 3, 5, 7, 9}
j) 𝐶̅ = {1, 2, 4, 5, 7, 8, 10}
k) 𝐷̅=Ω
l) 𝐸̅ = ∅
m) 𝐴\𝐵 = ∅
n) 𝐵\𝐶 = {1, 5, 7}
44
2.3. Probabilidade
Existem diferentes conceitos de probabilidade. A formalização mais antiga é o conceito clássico.
Exemplo
Considere-se uma agência bancária. Supondo que o crédito é atribuído aleatoriamente e que pelo histórico,
em 200 clientes, 140 conseguem crédito bancário. O Valério entra nessa agência bancária. A probabilidade do
Valério conseguir aprovação de um crédito é:
140
𝑃(𝑡𝑒𝑟 𝑐𝑟é𝑑𝑖𝑡𝑜) = = 0,7
200
Posteriormente surgiu o conceito frequencista que ultrapassa certas limitações do conceito clássico,
nomeadamente a restrição de o número de experiências a realizar serem finitas no conceito clássico.
Atualmente considera-se uma definição axiomática de probabilidade que permite trabalhar em qualquer
universo e que ultrapassa as limitações dos anteriores conceitos.
1) 0 ≤ 𝑃(𝐴) ≤ 1
2) 𝑃(Ω) = 1
3) 𝑃(∅) = 0
4) 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
5) Se A e B forem acontecimentos mutuamente exclusivos, então 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
6) 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)
7) 𝑃(𝐴̿) = 𝑃(𝐴)
8) 𝑃(𝐴̅) = 1 − 𝑃(𝐴)
̅̅̅̅̅̅̅
9) 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴̅ ∩ 𝐵̅)
̅̅̅̅̅̅̅
10) 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴̅ ∪ 𝐵̅)
11) 𝑃(𝐴\𝐵) = 𝑃(𝐴 ∩ 𝐵̅) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵)
45
Exemplo 1
Numa caixa há 40 peças, onde 10 das quais são pintadas à mão e as restantes ainda não têm cor.
Um operário extrai ao acaso uma peça. Qual a probabilidade de:
a) Sair uma peça pintada à mão?
10 1
Seja o acontecimento A: sair peça pintada à mão. Então 𝑃(𝐴) = 40 = 4
b) Sair uma peça sem cor?
10 3
𝑃(𝐴̅) = 1 − 𝑃(𝐴) = 1 − =
40 4
Exemplo 2
Duas lojas aceitam pagamento em dinheiro ou com cartões de débito. Na última semana, o histórico dos
pagamentos está definido na tabela ao lado. Considere os seguintes acontecimentos:
Loja Norte Loja Sul
A: pagamento efetuado na loja Norte
Pagamento a dinheiro 35 45
B: pagamento com dinheiro Pagamento com cartão de débito 50 70
Exemplo 3
Questionou-se um conjunto de 350 pessoas sobre os seus hábitos de leitura. Destas, 160 responderam que
gostam de ler romances, 130 policiais e 40 gostam de ambos os géneros literários.
Se definirmos R para as pessoas que leem romance e P para as pessoas
que leem policiais, podemos definir o seguinte diagrama de Venn para
representar a informação.
Escolhendo uma pessoa ao acaso, qual a probabilidade de:
160 16
a) Ler romances? 𝑃(𝑅) = 350 = 35
90 9
b) Ler apenas policiais? 𝑃(𝑎𝑝𝑒𝑛𝑎𝑠 𝑝𝑜𝑙𝑖𝑐𝑖𝑎𝑖𝑠) = 𝑃(𝑃\𝑅) = 350 = 35
120+40+90 5
c) Ler ambos os géneros? 𝑃(𝑅 ∪ 𝑃) = 350
=7
100 2
̅̅̅̅̅̅̅
d) Não ler qualquer livro? 𝑃(𝑅 ∪ 𝑃) = 350 = 7
46
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
6. Num café estão 20 pessoas. Sabendo que 8 são mulheres, indique a probabilidade de ao escolher uma
das pessoas ao acaso, escolhermos um homem?
(A) 60%
(B) 0.4
(C) 12%
(D) 12
(E) 0.06
7. Uma caixa contém 10 bolas, 3 das quais são vermelhas, 2 são amarelas e 5 são azuis. Cinco bolas são
retiradas ao acaso, com reposição. Qual a probabilidade de no máximo 1 bola seja vermelha?
(A) 0.3601
(B) 0.5
(C) 0.5282
(D) 0.8369
(E) 0.3452
8. Uma caixa contém oito bombons, três dos quais são de laranja. Uma outra caixa contém cinco bombons,
dois dos quais são de laranja. Tira-se um bombom da primeira caixa e, em seguida, um bombom da
segunda caixa. A probabilidade de que apenas um seja de laranja é:
(A) 5/13
(B) 9/40
(C) 19/40
(D) 1/4
(E) 2/3
9. Sendo A e B acontecimentos do espaço amostral Ω tais que 𝐴 ∪ 𝐵 = Ω. Se 𝑃(𝐴̅ ) = 0.3 e 𝑃(𝐵) = 0.4,
então o valor de 𝑃(𝐴 ∩ 𝐵) é:
(A) 0
(B) 0.1
(C) 0.2
(D) 0.3
(E) Nenhuma das restantes opções
10. Uma empresa de cofres atribui ao acaso um código secreto a cada cofre que comercializa. Cada código
secreto é formado por quatro algarismos por uma ordem sequencial. Escolhendo-se um cofre ao acaso,
qual é a probabilidade de o código ter exatamente três zeros?
(A) 0.0004
(B) 0.0027
(C) 0.0036
(D) 0.004
(E) 0.1234
47
11. No lançamento de um dado viciado, a probabilidade de obtermos um nº par é o triplo da probabilidade
de obter um número ímpar. A probabilidade de sair ímpar é:
(A) 0.25
(B) 0.75
(C) 0.5
(D) 3
(E) 0.4
12. Numa empresa de 28 funcionários, 9 só praticam natação, 12 praticam apenas futebol e os restantes
praticam as duas modalidades. Escolhido um funcionário ao acaso, a probabilidade de:
(A) praticar natação é 4/7
(B) praticar natação é 9/28
(C) praticar futebol é 12/28
(D) não praticar natação é 19/28
(E) Nenhuma das restantes opções
13. Foi consultado um certo número de pessoas sobre as emissoras de TV que habitualmente assistem.
Obteve-se o resultado seguinte: 300 pessoas assistem ao canal A, 270 pessoas assistem ao canal B, das
quais 150 assistem a ambos os canais A e B e 80 assistem a outros canais distintos de A e B. O número
de pessoas entrevistadas foi:
(A) 800
(B) 720
(C) 570
(D) 500
(E) 1000
14. Num saco estão bolas azuis e vermelhas, num total de 50 bolas. Sabendo que a probabilidade de tirar
bola azul é 0,34 podemos concluir que o número de bolas vermelhas é:
(A) 16
(B) 33
(C) 25
(D) 17
(E) 20
16. A Sara construiu um dado desequilibrado em que a probabilidade de sair face ímpar é 6 vezes mais do
que a probabilidade de sair face par. Ao lançar uma vez o dado, a Sara apostou com o Paulo de que
sairia face par. Qual a probabilidade do Paulo ganhar a aposta?
48
(A) 1/5
(B) 3/4
(C) 1/3
(D) 6/7
(E) 5/6
17. Foi realizado um inquérito a um conjunto de clientes de uma marca desportiva sobre a modalidade
desportiva que seguiam na TV. Das respostas obtidas, obteve-se a seguinte informação:
28% dos inquiridos viam ginástica
29% dos inquiridos viam basebol
19% dos inquiridos viam futebol
14% dos inquiridos viam ginástica e basebol
12% dos inquiridos viam basebol e futebol
10% dos inquiridos viam ginástica e futebol
8% dos inquiridos viam os três desportos.
Calcule a percentagem de inquiridos que não viam nenhum dos três desportos.
(A) 24%
(B) 36%
(C) 41%
(D) 42%
(E) 52%
18. Num saco existem 15 cartões: 8 desses cartões são azuis e numerados de 1 a 8; os restantes 7 cartões são
vermelhos e numerados de 1 a 7. Retirou-se um cartão ao acaso. Qual a probabilidade de ser um cartão
azul ou ter um número par?
(A) 8/15
(B) 7/15
(C) 12/15
(D) 11/15
(E) 9/15
19. Um saco contém 7 bolas verdes e 8 brancas. Se duas bolas são retiradas sucessivamente e sem
reposição, a probabilidade de ambas serem da mesma cor é:
(A) 8/15
(B) 10/21
(C) 11/21
(D) 15/21
(E) 7/15
20. A Lídia e o Miguel resolveram lançar uma moeda para decidir quem ia pagar o café. Embora não o
soubessem, a moeda estava desequilibrada, pois a face ocorre 4 vezes mais frequentemente que a
coroa. Sabendo que se sair face a Lídia terá que pagar o café, qual a probabilidade de ser o Miguel a
pagar?
49
(A) 1/5
(B) 3/4
(C) 1/3
(D) 6/7
(E) 5/6
21. Com base no histórico de corridas de três galgos, sabe-se que o galgo 1 tem o dobro de vitórias do
galgo 2 e o galgo 3 tem um terço das vitórias do galgo 2. Numa nova corrida com os três galgos, qual
a probabilidade de ser o galgo 3 a ganhar?
(A) 6/10
(B) 1/3
(C) 2
(D) 3/10
(E) 1/10
👉 Soluções: 1.A | 2.C | 3.C | 4.B | 5.C | 6.A | 7.A | 8.D | 9.B| 10.E | 11.D. | 12.E | 13.D |14. E | 15.A |16. E
50
2.4. Probabilidade condicionada
A probabilidade de um acontecimento A condicionado à ocorrência de um acontecimento B, e escreve-se
P(A|B), é definida por
𝑃(𝐴∩𝐵)
𝑃(𝐴|𝐵) = 𝑃(𝐵)
, com 𝑃(𝐵) ≠ 0
Exemplo
Da população jovem dos 16 aos 21 anos, que não frequentam o ensino superior, sabe-se que 13% estão
desempregados, 21% abandonaram a escola e 5% abandonaram a escola e estão desempregados. Qual a
probabilidade de um indivíduo estar desempregado, dado que abandonou a escola?
Considere-se os acontecimentos:
D: estar desempregado
A: abandonar a escola
Do texto podemos retirar a seguinte informação: 𝑃(𝐷) = 0.13, 𝑃(𝐴) = 0.21 e 𝑃(𝐷 ∩ 𝐴) = 0.05.
𝑃(𝐷∩𝐴) 0.05
Assim, 𝑃(𝐷|𝐴) = 𝑃(𝐴)
= 0.21 ≅ 0.24
Exemplo
Considere uma vila que tem 200 000 habitantes. A campanha publicitária na TV para um produto atingiu
50 000 habitantes; a campanha publicitária na rádio para o mesmo produto atingiu 30 000 habitantes; e ambas
as campanhas publicitárias conseguiram atingir 10 000 habitantes. Será que as campanhas publicitárias são
independentes?
Considerem-se os acontecimentos:
T: ser influenciado pela campanha publicitária na TV
R: ser influenciado pela campanha publicitária na rádio
50 000 1 30 000 3 10 000 1 1 3 3
𝑃(𝑇) = 200 000 = 4; 𝑃(𝑅) = 200 000 = 20; 𝑃(𝑇 ∩ 𝑅) = 200 000 = 20; 𝑃(𝑇) × 𝑃(𝑅) = 4 × 20 = 80
Como 𝑃(𝑇 ∩ 𝑅) ≠ 𝑃(𝑇) × 𝑃(𝑅), então podemos afirmar que as campanhas publicitárias não são
independentes.
51
O Teorema de Bayes surge como uma generalização, face à realização de determinando acontecimento A que
se supõe interferir na realização de Bn:
𝑃(𝐴|𝐵𝑛 )𝑃(𝐵𝑛 )
𝑃(𝐵𝑛 |𝐴) = 𝑛
∑𝑖=1 𝑃(𝐴|𝐵𝑖 )𝑃(𝐵𝑖 )
O diagrama em árvore pode ajudar a sintetizar informação que envolve probabilidades condicionadas.
Exemplo
Numa empresa de transportes, a probabilidade de que um camião tenha um acidente é igual a 0.1. Quando
há um acidente, a probabilidade de se perder a carga é 0.95. Por outro lado, se não houver um acidente, a
probabilidade de se perder a carga é de 0.04.
A: ter acidente
C: perder a carga
0.1 0.05
Esta informação pode ser representada num diagrama em árvore.
a) Qual a probabilidade de um camião perder a carga?
𝑃(𝐶) = 𝑃(𝐴 ∩ 𝐶) + 𝑃(𝐴̅ ∩ 𝐶) = 0.04
0.9
𝑃(𝐴). 𝑃(𝐶|𝐴) + 𝑃(𝐴̅). 𝑃(𝐶|𝐴̅) =
= 0.1 × 0.95 + 0.9 × 0.04 = 0,131
0.96
b) Qual a probabilidade de um camião não ter tido um acidente e não perdeu a carga?
𝑃(𝐴̅ ∩ 𝐶̅ ) = 0.9 × 0.96 = 0.864
52
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
1. A tabela seguinte dá informação das preferências, por género, do tipo de formato para guardar/ouvir
música.
CD MP3 Vinil
Feminino 146 106 48
Masculino 146 64 40
Relativamente aos acontecimentos “ser do género masculino” e “preferir vinil”, podemos afirmar:
(A) Os eventos são mutuamente exclusivos e independentes.
(B) Os eventos não são mutuamente exclusivos, mas são independentes.
(C) Os eventos são mutuamente exclusivos, mas não são independentes.
(D) Os eventos não são mutuamente exclusivos, nem independentes.
(E) Não é possível tirar qualquer conclusão.
3. Observou-se que 5/8 dos funcionários de uma empresa usavam jeans, 1/4 usavam t-shirt e, dos que
usavam t-shirt, metade usavam jeans. Escolheu-se aleatoriamente um funcionário da empresa. Qual a
probabilidade de ele não trazer jeans nem t-shirt?
(A) 1/2
(B) 1/3
(C) 1/4
(D) 3/4
(E) 1/5
53
5. Seja A um acontecimento possível e não certo. O valor de 𝑃(𝐴|𝐴̅) é:
A) 0
B) 1
C) P(A)
D) 1 - P(A)
E) Nenhuma das restantes opções.
6. Numa escola:
36% dos alunos têm TV por fibra;
dos alunos que têm TV por fibra, 22% também têm Internet móvel;
30% dos alunos têm Internet móvel.
Escolhida um aluno ao acaso, qual a probabilidade desse estudante ter ambos os serviços (TV por fibra e
Internet móvel)?
(A) 0.06125
(B) 0.0660
(C) 0.0792
(D) 0.08125
(E) 0.0847
7. Sejam A, B e C eventos tais que P(A)=0.2, P(B)=0.1 e P(C)=0.3. Os eventos A e B são independentes, os
eventos B e C são independentes, e os eventos A e C são mutualmente exclusivos. Calcule P(A U B U C).
(A) 0.496
(B) 0.540
(C) 0.550
(D) 0.600
(E) 0.618
9. O Roberto está com febre e o médico suspeita que seja febre tifoide. Para ter certeza, o médico deseja
realizar o teste. O resultado do teste é positivo, quando o paciente realmente apresenta febre tifoide, em
80% das vezes. O teste é positivo quando o paciente não apresenta febre tifoide em 10% das vezes. Se
1% da população tem febre tifoide, qual é a probabilidade de que o Roberto tenha febre tifoide, desde
que tenha testado positivo?
54
(A) 12%
(B) 7%
(C) 25%
(D) 31.5%
(E) 10%
10. As forças armadas dos EUA testam seus recrutas quanto ao HIV quando são recrutados. Eles são
testados em três rodadas do teste Elisa (um teste de HIV) antes de serem considerados positivos. Pelo
histórico, sabe-se que a probabilidade de alguém ter HIV é 0,00148. A verdadeira taxa positiva (dar
positivo, sabendo que tem a doença) para Elisa é de 93% e a verdadeira taxa negativa (dar teste
negativo, sabendo que não tem a doença) é de 99%. Qual é a probabilidade de um recruta ter HIV, dado
que deu positivo no primeiro teste Elisa?
(A) 14%
(B) 80%
(C) 42%
(D) 12%
(E) 35%
11. Uma companhia de seguros distribui os seus assegurados por três classes, A, B e C, consoante o menor
ou maior risco que lhe atribui. Em dezembro, tinha 35000, 50000 e 15000 segurados nas classes A, B e
C, respetivamente. A probabilidade dos segurados de cada classe sofrerem um ou mais acidentes no
próximo ano é de 0.01, 0.04 e 0.15, respetivamente. Qual das seguintes afirmações é falsa?
(A) Sabendo que o cliente é da classe C, a probabilidade de ele ter pelo menos um acidente no próximo
ano é de 0.15.
(B) A probabilidade de um segurado ter pelo menos um acidente no próximo ano é de 0.046.
(C) A probabilidade de um segurado ser da classe C e ter pelo menos um acidente é de 0.0225
(D) A probabilidade de um segurado não ter acidentes no próximo ano é de 0.954.
(E) A probabilidade de um segurado ser da classe C ou ter pelo menos um acidente no próximo ano é
de 0.35.
12. Uma seguradora reuniu a seguinte informação sobre a sua carteira de clientes:
(i) Todos os clientes têm pelo menos um seguro (existem um grande conjunto de seguros associados
a esta seguradora).
(ii) 70% dos clientes fizeram um seguro a um carro.
(iii) 20% dos clientes fizeram um seguro de acidentes pessoal.
(iv) Dos clientes que seguram um carro, 15% fizeram um seguro de acidentes pessoal.
Calcule a probabilidade de que um cliente selecionado aleatoriamente, não tenha nem seguro de carro,
nem seguro de acidentes pessoal.
(A) 0.125
(B) 0.205
(C) 0.24
(D) 0.245
(E) 0.31
55
13. Considere os eventos:
V= extrair uma carta vermelha de um baralho de cartas
O=extrair um ouro de um baralho de cartas
Qual das afirmações abaixo é verdadeira?
14. Sejam A, B e C eventos tais que P(A)=0.2, P(B)=0.1 e P(C)=0.3. Os eventos A e B são independentes, os
eventos B e C são independentes, e os eventos A e C são mutualmente exclusivos. Calcule P(A U B U C).
(A) 0.496
(B) 0.540
(C) 0.550
(D) 0.600
(E) 0.618
👉 Soluções: 1.D | 2.C | 3.C | 4.C | 5.A | 6.C | 7.C | 8.E | 9.B | 10.D | 11.E. | 12.B | 13.E |14.C
Diagrama em https://www.youtube.com/watch?v=1TDOLFVrX9o
árvore
56
Ficha de trabalho nº2
1. Para verificar a predisposição de um conjunto de pessoas a aderir a um novo tarifário de telemóvel, fez-
se um inquérito cujos resultados estão registados na tabela seguinte:
1.1. Indique o número de pessoas que responderam ao inquérito.
1.2. Quantas pessoas pensam aderir ao novo tarifário?
1.3. Determine a probabilidade de, escolhendo uma Sexo
pessoa ao acaso: F M
1.3.1. não pensar em aderir ao novo tarifário. Pensa mudar para este Sim 90 100
1.3.2. ser um homem que pensa aderir ao tarifário. novo tarifário? Não 60 30
1.3.3. ser uma mulher que não pensa aderir ao tarifário.
2. Num curso superior, perguntou-se quantos alunos tinham computador em casa e de que tipo: 70% dos
alunos afirmaram que têm computador em casa, 40% dos quais têm computador portátil e 30% têm os
dois (portátil e fixo). Escolhido um aluno ao acaso, calcule a probabilidade de:
2.1. Ter pelo menos um dos tipos de computadores.
2.2. Não ter computador.
2.3. Ter um e um só computador.
3. Numa pesquisa de mercado, verificou-se que 2000 pessoas utilizam os produtos A ou B. O produto B é
utilizado por 800 pessoas e 320 pessoas utilizam os dois produtos simultaneamente. Quantas pessoas
utilizam o produto A?
4. Numa empresa de desportos ao ar livre com 1260 clientes registados, constatou-se que 500 inscreviam-
se em atividades relacionadas com caminhadas, 420 inscreviam-se em atividades aquáticas e 180
inscreviam-se em ambos os tipos de atividades. Determine o número de clientes que:
4.1. Apenas praticam atividades relacionadas com caminhadas.
4.2. Apenas praticam caminhadas ou atividades aquáticas, e não ambas.
4.3. Não se tem inscrito em nenhuma atividade.
5. Num saco foram introduzidas algumas bolas numeradas. Sabe-se que algumas dessas bolas são azuis.
Retirou-se, ao acaso, uma bola e tem-se que:
A probabilidade de essa bola ser azul é 0.5;
A probabilidade de essa bola ter o número seis é 0.2;
A probabilidade de essa bola ser azul ou ter o número seis é 0.6.
Mostre que a bola azul com o número seis está entre as bolas que estão no saco.
6. No frigorífico tínhamos iogurtes da mesma marca e de três sabores: morango, ananás e banana. A
probabilidade de tirar ao acaso um iogurte de morango é 1/5, de tirar um iogurte de banana é 1/3.
Sabendo que há 14 iogurtes de ananás, determine quantos iogurtes há ao todo no frigorífico.
57
7. Na extração ao acaso de uma carta de um baralho incompleto sabe-se que:
A probabilidade de essa carta ser de espadas é 25%;
A probabilidade de essa carta ser um ás é 5%;
A probabilidade de essa carta ser de espadas ou ser um ás é 30%.
Extraindo uma carta do baralho, prove que não foi o ás de espadas a carta retirada.
9. Uma cidade com 50.000 habitantes possui apenas 3 jornais Nº de pessoas Compram o(s) jornal(ais)
diários, A, B e C. Uma investigação mostrou as compras
20000 A
diárias de cada jornal. Qual a probabilidade de que um
16000 B
habitante, escolhido ao acaso, compre:
10000 C
9.1. Somente C.
12000 AeB
9.2. A\B.
3000 BeC
9.3. Nenhum dos jornais.
7000 AeC
1000 A, B e C
10. Sendo 𝑃(𝐴) = 0.5 e 𝑃(𝐴 ∪ 𝐵) = 0.7, determine a probabilidade de ocorrência de B, quando:
10.1. A e B são mutuamente exclusivos;
10.2. A e B são acontecimentos independentes;
11. Sejam A e B dois acontecimentos associados a uma experiência aleatória. Seja 𝑃(𝐴 ∪ 𝐵) = 0.9,
𝑃(𝐵) = 0.6 e 𝑃(𝐴|𝐵) = 0.5. Verifique se os acontecimentos são independentes.
12. Sejam A e B dois acontecimentos, tais que 𝑃(𝐴) = 0.3 e 𝑃(𝐴 ∪ 𝐵) = 0.5
12.1. Se A e B forem mutuamente exclusivos, determine P(B).
12.2. Se 𝑃(𝐴|𝐵) = 0.4, determine P(B).
13. Seja 𝑃(𝐴) = 0.6, 𝑃(𝐴 ∩ 𝐵̅) = 0,55 e 𝑃(𝐴̅ ∩ 𝐵̅) = 0,2.
13.1. Determine a probabilidade de B.
13.2. Os acontecimentos A e B são independentes? Justifique.
14. Uma escola tem 100 alunos dos quais 55 estudam Estatística e 75 estudam Biologia, sendo que 35
alunos estudam ambas as disciplinas. Tendo-se escolhido um aluno ao acaso:
14.1. Qual a probabilidade de estudar Estatística ou Biologia?
14.2. Qual a probabilidade de não estudar nenhuma das duas disciplinas?
14.3. Se esse aluno estudar Estatística, qual a probabilidade de também estudar Biologia?
58
15. Uma empresa de embalagens tem duas máquinas a funcionar. A máquina A produz 60% do total das
embalagens. No entanto, 6% das embalagens produzidas pela máquina A têm defeito enquanto que a
máquina B produz apenas 3% com defeito.
15.1. Qual a probabilidade de escolhida uma embalagem ao acaso, ela ter defeito?
15.2. Qual a probabilidade de escolhida uma embalagem com defeito, ela ter sido produzida pela
máquina A?
16. Uma fábrica possui três máquinas que produzem o mesmo tipo de peças. A máquina 1, que produz 40%
das peças, produz 5% de peças defeituosas. A máquina 2, que produz 35% das peças, produz 10% de
peças defeituosas. A máquina 3 produz 15% de peças não defeituosas. Determine:
16.1. a percentagem total de peças defeituosas produzidas em tal fábrica.
16.2. a probabilidade de ser uma peça defeituosa, sabendo que foi fabricada pela máquina 1.
16.3. a probabilidade de uma peça defeituosa e ter sido fabricada pela máquina 1.
17. Uma companhia de seguros classifica alguns dos seus segurados de alto risco. Estudos da companhia
indicam que dos segurados de alto risco, 30% estarão envolvidos em algum acidente no próximo ano.
Sabe-se ainda que, dos seus segurados, 15% estarão envolvidos no próximo ano em algum acidente e
80% não são classificados de alto risco.
17.1. Determine a probabilidade de um segurado da companhia se envolver num acidente no próximo
ano e ser um segurado classificado de alto risco.
17.2. Qual a percentagem de segurados da companhia que pertencem ao grupo classificado de alto
risco ou estarão envolvidos em algum acidente no próximo ano.
17.3. Mostre que, de entre os segurados que estarão envolvidos no próximo ano em algum acidente,
40% pertencem ao grupo classificado de alto risco.
18. Um estudo feito a uma certa marca de iogurtes revelou que se um iogurte está dentro do prazo de
validade, a probabilidade de estar estragado é 0.005. Se um iogurte está fora do prazo de validade, a
probabilidade de estar estragado é 0.65. Considere que, num certo dia, uma mercearia tem dez iogurtes
dessa marca, dos quais dois estão fora do prazo. Escolhendo, ao acaso, um desses dez iogurtes, qual a
probabilidade de ele estar estragado?
19. Uma empresa está equipada com um sistema de alarme. A probabilidade de ocorrer um assalto é 0.1. Se
ocorrer um assalto, a probabilidade de o alarme funcionar é 0.95. A probabilidade do alarme funcionar e
não ter ocorrido um assalto é 0.03. Calcule:
19.1. A probabilidade de o alarme funcionar.
19.2. A probabilidade de que, não tendo funcionado o alarme, tenha ocorrido um assalto.
20. A e B são os dois únicos fornecedores de um artigo a uma empresa transformadora que o armazena num
contentor. Sabe-se que 5% dos artigos de A e 9% dos artigos de B são defeituosos, razão pela qual a
empresa compra quatro vezes mais à fornecedora A do que à fornecedora B.
20.1. Foi escolhido ao acaso um dos artigos do contentor. Qual a probabilidade de ser defeituoso?
20.2. Verificou-se que o artigo é defeituoso. Qual é a probabilidade de ter sido fornecido por A?
59
21. O Nuno vai ao Japão para tentar vender um produto. No entanto a reunião com os clientes foi agendada
em cima da hora, pelo que, a probabilidade de ele chegar a tempo é 0.6. Os japoneses gostam de
pontualidade assim, a probabilidade do Nuno conseguir vender o produto se não chegar atrasado é 0.8
mas, se chegar atrasado é apenas 0.4.
21.1. Calcule a probabilidade do Nuno conseguir vender o produto.
21.2. Sabendo-se que o Nuno conseguiu vender o produto indique a probabilidade de não ter chegado
atrasado.
21.3. Os acontecimentos “O Nuno vender o produto” e “O Nuno chegar atrasado” são dois
acontecimentos independentes?
👉 Soluções
1. 280 190 9/28; 5/14; 3/14 11. Não
60
3. Variáveis aleatórias
_______________________________
61
Exemplo (Lançamento de duas moedas)
1
4
, 𝑥=0
1
, 𝑥=1
A função de probabilidade é 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 2
1
𝑥=2
4
,
{ 0, 𝑜. 𝑣.
Graficamente pode ser representada da seguinte forma: f(x)
Uma caixa contém 5 parafusos defeituosos (D) e 5 não defeituosos. Extraem-se 2 parafusos sem reposição.
Considere X: número de peças defeituosas extraídas.
X pode assumir os valores 0 (𝐷 𝐷), 1 (𝐷 𝐷 𝑒 D 𝐷) e 2 (𝐷𝐷).
5 4 2 5 5 5 5 4 2
𝑓(0) = 𝑃(𝑋 = 0) = 10 × 9 = 9; 𝑓(1) = 𝑃(𝑋 = 1) = 10 × 9 × 2 = 9; e 𝑓(2) = 𝑃(𝑋 = 2) = 10 × 9 = 9
62
3.2.1. Função de distribuição
Consideremos X uma variável aleatória discreta.
A função de distribuição (acumulada) de 𝑿 é uma função 𝑭(𝒙) que fornece a probabilidade de 𝑋 assumir
valores menores ou iguais a 𝒙, isto é,
Para cada valor de 𝑥, 𝐹 fornece o somatório das probabilidades até ao valor de 𝑋 = 𝑥 (inclusive).
0, 𝑥<0
1
4
, 0≤𝑥<1
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 3 A sua representação gráfica é:
,
1≤𝑥<2
4
{1, 𝑥≥2
É possível observar que a função é definida no intervalo ] − ∞; +∞[, sempre em escada e não decrescente.
Os patamares são fechados à esquerda (exceto no −∞) e abertos à direita.
0, 𝑥<0
2
, 0≤𝑥<1
9
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 7 A representação gráfica é:
, 1≤𝑥<2
9
{1, 𝑥≥2
63
3.3. Parâmetros associados às variáveis aleatórias discretas
Para cada variável aleatória pode-se definir parâmetros estatísticos que a caracterizam quanto à sua
localização ou dispersão. Nesta seção vamos centrar a atenção na média, variância e desvio padrão.
Tal como definido no capítulo 1, a média é um parâmetro de localização que nos dá ideia da tendência
central da distribuição. Se X é uma v.a. discreta, a média ou valor esperado pode ser calculado como
𝜇 = 𝐸[𝑋] = ∑ 𝑥𝑓(𝑥)
∀𝑥
A variância é a medida de dispersão que se baseia no quadrado da distância de cada valor da variável à sua
média. Assim, a variância é definida como
1 1 1
Variância: 𝜎 2 = 𝑉𝑎𝑟[𝑋] = ∑∀𝑥(𝑥 − 𝜇)2 𝑓(𝑥) = (0 − 1)2 × + (1 − 1)2 × + (2 − 1)2 × = 0.5
4 2 4
Exemplo
O controlo de qualidade de uma empresa de fabrico de pneus constatou que o número de pneus feitos por
dia, com defeito, é uma variável aleatória X, com a seguinte função de probabilidade:
𝑥 2 3 4 5 o.v.
𝑃(𝑋 = 𝑥) 0.48 0.36 0.12 0.04 0
64
b) Sabendo que a empresa apresentou mais de 2 pneus com defeito num dia, a probabilidade de ter
menos de 4 pneus com defeito é:
𝑃(𝑋 < 4 ∧ 𝑋 > 2) 𝑃(𝑋 = 3) 0.36
𝑃(𝑋 < 4 | 𝑋 > 2) = = = ≈ 0.69
𝑃(𝑋 > 2) 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5) 0.36 + 0.12 + 0.04
0, 𝑥<2
0.48, 2 ≤ 𝑥 < 3
c) A função de distribuição é definida como: 𝐹(𝑥) = 0.84, 3 ≤ 𝑥 < 4
0.96, 3 ≤ 𝑥 < 4
{ 1, 𝑥≥4
Exemplo
Dado que se trata de uma função de probabilidade, então a soma de todas as probabilidades tem de ser
igual a 1. Assim,
𝑘+1 𝑘 𝑘−1 𝑘
+ + + = 1 ⟺ 𝑘 + 1 + 𝑘 + 𝑘 − 1 + 𝑘 = 8 ⟺ 4𝑘 = 8 ⇔ 𝑘 = 2
8 8 8 8
Assim, a tabela pode ser reescrita como:
1
Como 𝐸(𝑋) = 4, então
3 2 1 2 1
(𝑚 − 1) × + 𝑚 × + (𝑚 + 3) × + (𝑚 + 5) × = ⇔
8 8 8 8 4
⇔ 3𝑚 − 3 + 2𝑚 + 𝑚 + 3 + 2𝑚 + 10 = 2 ⇔
⇔ 𝑚 = −1
65
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
2. Seja X uma v.a. que representa o número de defeitos existentes em 100 metros de um cabo elétrico e
cuja função de probabilidade é:
x 0 1 2 3 4 5 o.v.
f(x) 0,10 0,35 0,25 0,15 0,10 0,05 0
Sabendo que nos 100 metros de cabo temos menos de 3 defeitos, determine a probabilidade de o
número de defeitos ser superior a 1.
(A) 0,3571
(B) 0,9091
(C) 0,3478
(D) 0,1176
(E) 1
4. Uma pesquisa de mercado compilou informação sobre o número de computadores pessoais que há em
cada casa. Considere “X=número de computadores em cada casa” uma variável aleatória, que tem a
seguinte distribuição:
X 0 1 2 3 4 5 o.v.
P(X) 0.24 0.37 0.20 0.11 a 0.03 0
66
Considere a um número real. Qual a probabilidade de que uma casa escolhida ao acaso tenha pelo menos
2 computadores pessoais?
(A) 0.19
(B) 0.20
(C) 0.29
(D) 0.39
(E) 0.61
5. O número de dias de estadia num hotel, X, é uma variável discreta com função de probabilidade
6−𝑥
𝑓(𝑥) = 𝑃[𝑋 = 𝑥] = { 15 , 𝑥 = 1,2,3,4,5
0, 𝑜𝑢𝑡𝑟𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
Determine o número médio de dias que é expectável que cada cliente fique no hotel.
(A) 1
(B) 7/3
(C) 1/15
(D) 1/5
(E) 3
6. Considere X uma variável aleatória discreta com função de probabilidade dada por:
𝑥
𝑠𝑒 𝑥 = 1, 2, 3
10
𝑓(𝑥) = 4
𝑠𝑒 𝑥 = 12
10
{ 0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
Das alíneas abaixo, só uma é correta. Assinale-a.
(A) 𝑃(𝑋 = 3) = 0,03
(B) 𝑃(𝑋 = 3) + 𝑃(𝑋 = −1) = 0,4
(C) P(X ≥ 12) = 0
(D) O valor médio é 3,74
(E) Nenhum dos casos anteriores.
67
8. Dos gráficos seguintes, qual pode representar uma função distribuição F(x) de uma v.a. discreta:
(A) (i)
(B) (ii)
(C) (iii)
(D) (iv)
(E) (v)
9. O número de vendas diárias de eletrodomésticos de uma determinada marca é uma v.a. X com
distribuição de probabilidade dada pela seguinte tabela:
x 0 1 2 3 4 5 o.v.
P(x) 0.10 0.28 0.18 0.11 0.16 0.17 0
O número esperado de vendas num dia e o respetivo desvio padrão são, aproximadamente:
(A) 2.46 e 3.76
(B) 2.46 e 1.46
(C) 2.46 e 2.75
(D) 0.17 e 1.46
(E) 0.17 e 2.75
👉 Soluções: 1.B | 2.A | 3.B | 4.D | 5.B | 6.E | 7.C | 8.A | 9.C
São necessários mais exercícios?
🔌 Definição de https://www.youtube.com/watch?v=33J3ODB_22w
variável aleatória
Função de https://www.youtube.com/watch?v=gxqFgxp0hCA&list=PLNG6I1
probabilidade M7eOuxtORJqqgIkUUbwuddrirb6
Função de https://www.youtube.com/watch?v=F9fXrpqCttI
distribuição
Valor esperado
Média e variância https://www.youtube.com/watch?v=PeKE-72pv7o
68
Ficha de trabalho nº3
1. Considere a variável aleatória X que representa a soma das pintas que ficam voltadas para cima quando
se lançam dois dados.
1.1. Defina esta variável aleatória e determine a sua função de probabilidade.
1.2. Qual a probabilidade da soma das pintas dos dados ser inferior ou igual a 5?
3. Um grupo de 6 homens e 4 mulheres são candidatos à eleição para uma comissão de 2 elementos e
todos têm as mesmas hipóteses.
3.1 Determine as funções de probabilidade e de distribuição acumulada para o número de mulheres
eleitas para a comissão.
3.2 Determine a probabilidade da comissão ter uma mulher, sabendo que não é constituída só por
mulheres.
4. Uma caixa contém 15 canetas: 5 pretas, 5 azuis, 2 verdes e 3 vermelhas. Extraem-se sucessivamente e
sem reposição três canetas da caixa. Seja X a variável que representa o número de canetas pretas
retiradas da caixa.
4.1. Defina as funções de probabilidade e de distribuição acumulada da variável X.
4.2. Calcule o valor das seguintes probabilidades:
𝑃(𝑋 < 2); 𝑃(𝑋 ≥ 1); 𝑃(𝑋 < 2|1 ≤ 𝑋 ≤ 3).
4.3. Repita a alínea 4.1 para o caso em que se retiram as três canetas com reposição.
69
5.4. Calcule o valor de E(X) e de Var(X).
6. O número de vendas diárias de eletrodomésticos da marca Baratinho é dado pela seguinte distribuição
de probabilidade:
x 0 1 2 3 4 5 o.v.
f(x) 0,10 0,28 0,18 0,11 0,16 0,17 0
6.1. Calcule a probabilidade de vender menos de 4 eletrodomésticos num dia.
6.2. Calcule a probabilidade de vender pelo menos 4 eletrodomésticos, sabendo que já vendeu mais
de 2 eletrodomésticos.
6.3. Calcule o valor esperado e o desvio padrão.
1
x , x 4, 5, 10
f ( x) 0.1, x 2, 3
0.25, x 1
0, O.V .
7.1. Prove que se trata de uma função de probabilidades.
7.2. Indique a função distribuição correspondente.
7.3. Indique a probabilidade de a variável tomar um valor superior a 2,5.
7.4. Determine o valor de E(X) e de Var(X).
𝑥3
,
𝑥 = 1,2,3
8.1. A função 𝑓, definida como 𝑓(𝑥) = { 28
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
define uma função de probabilidade.
8.2. Se X é uma variável aleatória com função distribuição acumulada F e F(2)=1 então, a probabilidade
de encontrar um valor de X superior a 2 é nula.
70
9.3. P(0<X<5)
👉 Soluções
3. 8/13 8. F V
5. 5.3. 4/9 5.4. 38/15; 1,49 10. 10.2. 0.8; 0.2; 5/8
71
4. Distribuições teóricas
de probabilidade
______________________________
A partir da definição de função de probabilidade do capítulo anterior, podemos constatar que existe uma
infinidade de possíveis funções para modelar as variáveis aleatórias. Contudo, quando aplicamos a Estatística,
verificamos que muitos dos problemas apresentam as mesmas características, o que nos permite estabelecer
um modelo teórico para determinação da solução dos problemas. Tratam-se de modelos matemáticos
(distribuições) que se adaptam bem a um vasto conjunto de situações e que, simultaneamente, têm um
tratamento matemático simples.
Há dois tipos de distribuições teóricas que correspondem a diferentes tipos de dados ou variáveis aleatórias:
72
O resultado de cada experiência de Bernoulli é independente dos resultados das experiências
anteriores e das seguintes, isto é, o resultado obtido numa determinada experiência não afeta os
resultados das experiências subsequentes nem se deixa afetar pelas anteriores.
Exemplo
a) Considere-se o lançamento de uma moeda ao ar. Se o sucesso for considerado “sair face”, então:
P(sucesso) = P(sair face) = 1/2
P(insucesso) = P(não sair face)=1/2
b) Considere-se agora uma caixa com bolas numeradas de 1 a 10. Se o sucesso for o resultado “sair
número menor que 4”, então:
P(sucesso) = P(sair número menor do que 4) = 3/10
P(insucesso) = P(não sair número menor do que 4)=7/10
𝑁
A função de probabilidade é: 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = ( ) 𝑝 𝑥 𝑞 𝑁−𝑥 , com 𝑥 = 0, 1 ,2 ,3, … 𝑒 0 < 𝑝 < 1.
𝑥
Nota:
𝑁 𝑁 𝑁!
( ) = 𝐶𝑥𝑁 e lê-se “Combinações de N, x a x”. O valor de ( ) = 𝐶𝑥𝑁 = , sendo que
𝑥 𝑥 𝑥!×(𝑁−𝑥)!
𝑁! = 𝑁 × (𝑁 − 1) × (𝑁 − 2) × … × 3 × 2 × 1.
Média: 𝜇 = 𝐸[𝑋] = 𝑁𝑝
Variância: 𝜎 2 = 𝑉𝑎𝑟[𝑋] = 𝑁𝑝𝑞
Exemplo
Uma das componentes para ingressar num emprego é fazer um teste de escolha múltipla com 10 questões.
Cada questão tem 5 respostas alternativas, sendo que apenas uma é correta. Suponha que a Matilde não se
preparou para este teste e, portanto, irá responder ao acaso a todas as questões.
a) Nesta situação, qual a probabilidade da Matilde acertar:
a1) exatamente em 4 questões?
73
a2) no máximo em 2 questões?
a3) pelo menos em 8 questões?
b) Quantas perguntas se espera que a Matilde acerte?
Num teste de escolha múltipla temos apenas duas situações para cada resposta: ou acerta ou falha. Se cada
questão tem 5 alternativas, em que apenas uma delas está correta, então a probabilidade de acertar é:
P(sucesso)=P(acertar na resposta)=1/5=0.2
Assim, podemos definir a seguinte variável aleatória:
X: nº de questões, em 10, que a Matilde acerta. X ~ B(10; 0.2)
a3) 𝑃(𝑋 ≥ 8) = 𝑃(𝑋 = 8) + 𝑃(𝑋 = 9) + 𝑃(𝑋 = 10) = 0,0001 + 0,0000 + 0,0000 = 0,0001
1
b) 𝐸[𝑋] = 𝑁𝑝 = 10 × 5 = 2 Espera-se que a Matilde, respondendo ao acaso, acerte em 2 questões.
Nota complementar
Se tiver dúvidas como calcular as combinações na sua calculadora, veja estes links para as principais marcas:
Calculadora científica não gráfica: https://www.youtube.com/watch?v=gFZIN-_PRIY
Exemplo
Para o modelo de calculadora XYZ, o fabricante sabe que 5% das calculadoras irão falhar nos primeiros dias de
uso e serão devolvidas para reparação. Admita que uma loja comprou 15 calculadoras do modelo XYZ.
a) Qual a probabilidade de, no máximo, três falharem?
b) Qual a probabilidade de pelo menos 2 falharem?
c) A Clara comprou uma calculadora e falhou após os primeiros dias. Foi à loja e entregaram-lha outra
do mesmo lote. Se a primeira calculadora falhou, qual a probabilidade da segunda calculadora falhar?
74
d) Qual o número de calculadoras que se espera que sejam devolvidas? E se tivessem sido compradas 60
calculadoras?
Facilmente podemos perceber que existe uma dicotomia (a calculadora falha ou não falha). Assim,
considerando como “sucesso” a calculadora falhar, p=P(sucesso)=5%=0.05. Podemos então escrever a seguinte
v.a.:
X: nº de calculadoras, em 15, que irão falhar nos primeiros dias de uso.
X~ B (15; 0.05)
2) No valor de n encontrado,
escolher o valor de x
apropriado;
3) Depois de selecionar a linha que contém o n e x anteriores, selecionar a coluna com o valor de p
(probabilidade do sucesso discriminado na primeira linha).
Na interseção da linha com a coluna, encontramos a probabilidade da v.a. X tomar o valor x.
75
Exemplo
A probabilidade de ocorrência de turbulência num determinado percurso a ser feito por um avião é de 0,4
num circuito diário. Seja X o número de voos com turbulência num total de 7 desses voos. Determine a
probabilidade de não haver turbulência em nenhum dos 7 voos?
Ou recorrendo à tabela
76
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
12. Numa dada região, 11% da população usa a Netflix. Num encontro de 20 pessoas, qual a probabilidade
de exatamente 2 pessoas usarem a Netflix?
(A) 0,316
(B) 0,001
(C) 0,282
(D) 0
(E) 0,245
13. Numa repartição pública verificou-se que 10% das guias preenchidas estão incorretas. Qual a
probabilidade de, em doze guias, haver pelo menos duas guias incorretas?
(A) 0,341
(B) 0,889
(C) 0,111
(D) 0,659
(E) Nenhuma das anteriores
14. Foi instituído um programa de crédito subsidiado para a aquisição da casa própria destinado a famílias
de baixo rendimento de uma certa região. Porém, nem todos os beneficiários desse tipo de financiamento
de facto pagam o que devem. Sabe-se que 8% dos beneficiários ficam em incumprimento. Selecionou-se
um conjunto de 15 créditos. Qual a probabilidade de no máximo 2 famílias não cumprirem as obrigações
de pagamento?
(A) 0,943
(B) 0,917
(C) 0,887
(D) 0,853
(E) Nenhuma das anteriores
77
15. Numa grande empresa de produtos financeiros, 20% dos trabalhadores já admitiram ter tido uma
situação de ansiedade. Se se selecionar 10 trabalhadores aleatoriamente, a média e o desvio padrão
daqueles que já experienciaram ansiedade são, respetivamente:
(A) 1.6 e 1.414
(B) 1.6 e 1.265
(C) 2 e 1.6
(D) 2 e 1.414
(E) 2 e 1.265
16. A probabilidade de um set de ténis ir para um desempate é de 17%. Qual a probabilidade de em três sets,
irem dois para desempate?
(A) 0,029
(B) 0,072
(C) 0,170
(D) 0,351
(E) 0,500
17. Um estudo recente concluiu que 4% das mulheres ficam grávidas nos primeiros 12 meses de iniciação da
vida laboral. Considere que todas as gravidezes ocorrem de uma forma independente umas das outras.
Suponha que 15 mulheres, que ingressaram no mundo do trabalho há 12 meses, são escolhidas
aleatoriamente. Qual a probabilidade de estarem grávidas entre 3 e 5 mulheres, inclusive?
(A) 0.001
(B) 0.105
(C) 0.018
(D) 0.099
(E) 0.020
18. Um atirador fez uma aposta com um amigo: atiraria ao alvo 10 vezes e ganharia a aposta se conseguisse
acertar na mosca pelo menos 7 vezes. Sabe-se, com base no desempenho usual desse atirador, que ele
costuma acertar na mosca em 80% das vezes. Qual a probabilidade do atirador ganhar a aposta?
(A) 0,382
(B) 0,879
(C) 0,531
(D) 0,165
(E) 0,558
19. Das 220 crianças que frequentam o infantário "Os Traquinas", 44 têm menos de dois anos de idade. São
selecionadas, ao acaso, 25 crianças para irem assistir a uma peça de teatro. Qual o número de crianças
com menos de dois anos se espera ter no grupo?
(A) 1
(B) 2
(C) 3
(D) 4
(E) 5
78
20. Se X ~ B (100; 0,1), calcule a probabilidade de X ser igual à sua variância.
(A) ≈ 1
(B) 0,0059
(C) 0,1304
(D) ≈ 0
(E) 0,0638
21. Numa população, a probabilidade de uma pessoa ter contraído uma determinada doença é 0,10.
Determine quantas pessoas devem ser analisadas para que a probabilidade de encontrar pelo menos 1
pessoa com a doença seja superior a 0,5.
(A) N=14
(B) N=7
(C) N=5
(D) N=4
(E) Nenhuma das anteriores
👉 Soluções: 1.C | 2.E | 3.C | 4.A | 5.C | 6.E | 7.B | 8.E | 9.B | 10.E | 11. C | 12.B
🔌 Distribuição https://www.youtube.com/watch?v=P-
binomial oN6gQHWYU&list=PL7xT0Gz6G0-
QE_GjV3WevJC7zWyhKm77h&index=2
Exercícios https://www.youtube.com/watch?v=-mtmK8vBSZI
resolvidos https://www.youtube.com/watch?v=uis8mx98bzk
79
4.2. Distribuição de Poisson
Enquanto a distribuição binomial pode ser usada para encontrar a probabilidade de um número de sucessos
em N tentativas, a distribuição de Poisson é usada para encontrar a probabilidade de um número de eventos
ocorridos num intervalo. Este intervalo pode ser referente a tempo, área, volume, entre outros.
Exemplo
Considera-se que:
𝑒 −𝜆 𝜆𝑥
A função de probabilidade é: 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥!
Média: 𝜇 = 𝐸[𝑋] = 𝜆
Variância: 𝜎 2 = 𝑉𝑎𝑟[𝑋] = 𝜆
Se 𝑋1 , 𝑋2 , … , 𝑋𝑘 são v.a. discretas que seguem uma distribuição de Poisson, 𝑋𝑖 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆𝑖 ), então
𝑌 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑘 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆1 + 𝜆2 + ⋯ + 𝜆𝑘 )
80
Exemplo
Uma empresa de tintas recebe os pedidos dos seus vendedores por email, com uma média de 5 pedidos por
hora.
Seja X o número de pedidos por email, por hora, que a empresa de tintas recebe. X ~ Poisson (5)
𝑒 −5 53
a) 𝑃(𝑋 = 3) = = 0,1404
3!
𝑒 −5 50 𝑒 −5 51 𝑒 −5 52
b) 𝑃(𝑋 > 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)] = 1 − [ 0!
+ 1!
+ 2!
] =
1 – [0.0067 + 0.0337 + 0.0842] = 1 – 0.1246 = 0,8754.
Dado que a probabilidade de haver mais de 2 pedidos é bastante elevada, seria importante a empresa
aumentar o número de funcionários para o horário de almoço.
c) Se numa hora, a empresa atende em média 5 pedidos por email, espera-se que, em média, a empresa
atenda 40 (8x5 ou 5+5+5+5+5+5+5+5) pedidos nas oito horas.
Assim,
Y: número de pedidos por email, em 8 horas
Y~Poisson(40)
Logo, são esperados E[Y]=40
𝑒 −40 4050
d) 𝑃(𝑌 = 50) = 50!
= 0,0177.
81
Exemplo
O número de casas vendidas por um agente imobiliário segue uma distribuição de Poisson, com média 2 por
semana.
a) Calcule a probabilidade de na próxima semana, o agente imobiliário venda:
a1) Exatamente 3 casas
a2) No mínimo 6 casas
b) O agente imobiliário recebe um bónus, se vender mais do que 15 casas no próximo mês (4
semanas). Calcule a probabilidade do agente receber o bónus.
c) Quantas casas se espera que o agente venda num ano?
d) Considerando que um ano tem 52 semanas, e que em média ele vende 2 casas. Então espera-se que,
num ano, o agente venda 52 × 2 = 104 casas. (isto é, o número de casas vendidas em 52 semanas é
uma v.a. com distribuição de Poisson de média 104).
82
4.2.4. Aproximação da distribuição binomial à distribuição de Poisson
A distribuição Binomial converge/aproxima-se para a distribuição Poisson, quando N → ∞ e 𝑝 → 0,
mantendo-se constante 𝜆 = N𝑝. Na prática recorre-se a esta aproximação quando 𝑁 ≥ 20 e 𝑁. 𝑝 < 7.
Ou seja, se 𝑋~𝐵(𝑁, 𝑝), e 𝑁 ≥ 20 e 𝑁. 𝑝 < 7, então X pode aproximar-se por 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑁𝑝)
Exemplo
No caso de termos 𝑋~𝐵(30, 𝑝), vemos que a aproximação entre as duas distribuições acontece à medida
que o valor de p aumenta.
Exemplo
Numa empresa, sabe-se que 1% das peças produzidas saem com defeito.
a) O gabinete de qualidade da empresa seleciona aleatoriamente 15 peças produzidas nesse dia. Qual a
probabilidade de não haver qualquer peça com defeito?
b) Um hipermercado quer fazer uma grande encomenda, mas obrigada a um controlo de qualidade mais
apertado. Se em 300 peças escolhidas aleatoriamente, houver pelo menos 2 com defeito, o contrato
não será realizado. Qual a probabilidade da empresa ganhar o contrato?
83
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
1. Em média, nascem 2 bebés por hora num hospital. A probabilidade de, na próxima hora, nascerem no
máximo 3 bebés é:
(A) 0.1429
(B) 0.1804
(C) 0.3233
(D) 0.6767
(E) 0.8571
2. Um livro tem, em média, 2 erros ortográficos por cada página. Determine a probabilidade de, numa
página, o número de erros ortográficos ser superior ao esperado?
(A) 0.5940
(B) 0.3233
(C) 0.2727
(D) 0.4080
(E) 0.6807
4. O número de acidentes por dia num troço de 100 km de uma autoestrada segue a distribuição de Poisson
com parâmetro 2.2. Qual é a melhor aproximação da probabilidade de não haver acidentes nesta secção
durante 2 dias?
(A) 0.0123
(B) 0.0014
(C) 0.1108
(D) 0.0002
(E) 0.2043
5. Um livro contém 500 páginas. Se houver 200 erros de digitação distribuídos aleatoriamente por todo o
livro, use a distribuição Poisson para determinar a probabilidade de uma página conter exatamente três
erros.
(A) 0.1734
(B) 0.0129
(C) 0.0005
(D) 0.0072
(E) 0.1234
84
6. Uma loja de equipamentos de hardware vende em média 3 impressoras por dia. Sabendo que vendeu
pelo menos uma impressora, qual a probabilidade de ter vendido no máximo 4?
(A) 0.81
(B) 0.63
(C) 0.39
(D) 0.56
(E) 0.22
7. O número de chamadas telefónicas para um estabelecimento comercial é uma v.a. de Poisson, com média
de 7 chamadas por hora. Considere o período entre as 9:00 e as 9:30 de um dia qualquer da semana.
Determine a probabilidade de não serem recebidas chamadas no referido período.
(A) 0.1888
(B) 0.1850
(C) 0.0302
(D) 0.0771
(E) 0.2301
8. Em média chega a uma central telefónica 1 chamada por minuto. A telefonista costuma, de vez em
quando, fazer um intervalo de 5 minutos. Considere um desses intervalos. Calcule a probabilidade de,
durante a sua pausa, a telefonista deixar de atender 1 chamada.
(A) 0.0842
(B) 0.0337
(C) 0.1404
(D) 0.1755
(E) 0.1324
9. Se X e Y são variáveis aleatórias que seguem uma distribuição de Poisson, com parâmetros 𝜆1 e 𝜆2 , então
X+Y é também uma variável aleatória que segue uma distribuição de Poisson, com parâmetro:
(A) 𝜆1 − 𝜆2
(B) 𝜆1 × 𝜆2
(C) 𝜆1 /𝜆2
(D) 𝜆1 + 𝜆2
(E) 𝜆1 2 + 𝜆2 2
10. Sabe-se que X, v. a. que representa o número de automóveis que entram numa autoestrada num período
de 30 segundos, segue uma distribuição de Poisson com desvio-padrão 2. Em média quantos automóveis
entram na autoestrada num período de 3 minutos?
(A) 18
(B) 24
(C) 30
(D) 36
(E) 42
85
11. O proprietário de uma pequena loja de conveniência está a decidir se deve ou não interromper a venda
de revistas. O proprietário suspeita que apenas 5% dos clientes compram uma revista e acha que poderá
usar esse espaço para vender algo mais rentável. Ontem entraram 50 clientes na sua loja. Qual a
probabilidade de no máximo 5 dos seus clientes terem comprado revistas?
(A) 0.0042
(B) 0.8912
(C) 0.1088
(D) 0.0668
(E) 0.9580
12. Numa população, a probabilidade de uma pessoa ter contraído uma determinada doença é 0.001.
Determine a probabilidade de numa cidade de 5 mil habitantes, no mínimo 3 pessoas terem contraído a
doença.
(A) 0.8754
(B) 0.2650
(C) 0.7350
(D) 0.4405
(E) 0.3219
👉 Soluções: 1.E | 2.B | 3.D | 4.A | 5.D | 6.A | 7.C | 8.B | 9.D | 10.B | 11. E | 12.A
🔌 Distribuição de https://www.youtube.com/watch?v=C3pdH2NbuzU
Poisson
https://www.youtube.com/watch?v=86NBQhuK8r0
Exercícios http://www.bertolo.pro.br/FinEst/Estatistica/ExerciciosReso
resolvidos lvidosPoisson.pdf
86
4.3. Distribuição Normal
A distribuição normal é a distribuição contínua mais comum.
Um matemático relevante, Friedrich Gauss (1777 - 1855), estudou alguns eventos da natureza, e observou o
comportamento padrão entre as amostras. Desta forma, a curva da distribuição normal também é conhecida
como curva gaussiana.
A curva da distribuição normal representa o comportamento de diversos fenómenos, como por exemplo, peso
e altura de uma população, pressão sanguínea de um grupo de pessoas, tempo gasto de um conjunto de
indivíduos a executar uma tarefa, entre outras. Além disso, algumas distribuições discretas, como é o caso da
Binomial ou Poisson, podem ser aproximadas (sob certas condições) pela distribuição normal.
1 𝑥−𝜇 2
1 − ( )
𝑓(𝑥) = 𝑒 2 𝜎 , com 𝑥 ∈ ℝ
√2𝜋𝜎 2
Média: 𝜇 = 𝐸[𝑋] = 𝜇
Variância: 𝜎 2 = 𝑉𝑎𝑟[𝑋] = 𝜎 2
87
Existem probabilidades bem conhecidas:
As probabilidades de variáveis aleatórias contínuas são definidas como a área sob a curva da sua distribuição.
Assim, apenas as faixas de valores podem ter uma probabilidade diferente de zero. A probabilidade de que
uma variável aleatória contínua seja igual a algum valor é sempre zero. Assim:
Uma vez que os parâmetros da distribuição podem tomar um número infinito de valores possíveis, existe uma
infinidade de distribuições normais diferentes. Tendo em conta que a função de densidade de probabilidade
envolve cálculo morosos, houve a necessidade de recorrer ao processo de padronização ou estandardização.
Desta forma:
𝑋−𝜇
𝑋~𝑁(𝜇, 𝜎 2 ) então 𝑍= ~𝑁(0, 1)
𝜎
88
Exemplo
A variação diária da cotação de fecho de um determinado fundo transacionado na bolsa de valores, pode ser
aproximado por uma distribuição normal com valor esperado 0.3% e desvio padrão 2%. Qual a probabilidade
da próxima variação ser menor que 3%?
3 − 0.3
𝑃(𝑋 < 3) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < 1.35) = 0.9115
2
Dado que a tabela traduz uma área abaixo da curva, então podemos observar as seguintes propriedades:
89
Exemplo
A tabela da normal também pode ser analisada no sentido inverso, isto é, dada uma certa probabilidade,
podemos calcular o valor da v.a. que a originou.
Exemplo
𝑎−4
Logo, 𝑃(𝑋 ≤ 𝑎) = 0.975 ⇔ 𝑃 (𝑍 ≤ 3
) = 0.975
Sabemos que se trata de uma área superior a 0.5 e por isso terá a representação ao lado.
𝑎−4 𝑎−4
𝑃 (𝑍 ≤ ) = 0.975 ⇔ = 1,96
3 3
⇔ 𝑎 = 1,96 × 3 + 4 ⇔ 𝑎 = 9.88
90
Exemplo
Qual o valor de z?
Exemplo
Uma máquina de refrigerantes está regulada de modo a servir uma média de 200ml por copo. Considere
também a quantidade servida por copo seguir uma distribuição normal com desvio padrão de 15 ml.
230−200
𝑃(𝑋 > 230) = 𝑃 (𝑍 > 15
) = 𝑃(𝑍 > 2) = 1 − 𝑃(𝑍 ≤ 2) = 1 − 0.9772 = 0.0228.
b) Determine acima de que valor estão 1% das bebidas com excesso de refrigerante.
𝑎 − 200
𝑃(𝑋 > 𝑎) = 0.01 ⇔ 𝑃 (𝑍 > ) = 0.01
15
𝑎 − 200
⇔ 𝑃 (𝑍 > ) = 0.01
15
𝑎 − 200
⇔ 1 − 𝑃 (𝑍 ≤ ) = 0.01
15
𝑎 − 200
⇔ 𝑃 (𝑍 ≤ ) = 0.99
15
𝑎 − 200
⇔ = 2.326
15
⇔ 𝑎 = 234.89
91
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
1. O nível de colesterol da população de um determinado país segue uma distribuição normal com média
170 e desvio padrão 30. Níveis superiores a 200 são alvo de preocupação e vigilância. Qual a probabilidade
de um indivíduo ter colesterol superior a 200?
(A) 0.2514
(B) 0.2033
(C) 0.1587
(D) 0.1210
(E) Nenhuma das anteriores
2. O período de gestação de uma mulher é normalmente distribuído com uma média de 268 dias e uma
variância de 225. Qual a probabilidade da gravidez de uma mulher durar menos de 256 dias?
(A) 0.1151
(B) 0.2119
(C) 0.2743
(D) 0.3446
(E) Nenhuma das anteriores
3. Assuma que a altura da população masculina portuguesa é normalmente distribuída, com média 175cm
e desvio padrão 7cm. Para entrar nas forças armadas, a altura mínima é de 165cm e máxima de 198cm.
Escolhido um homem ao acaso, qual a probabilidade de ele ter os requisitos de altura para entrar nas
forças armadas?
(A) 0.9231
(B) 0.8707
(C) 0.7889
(D) 0.8800
(E) Nenhuma das anteriores
4. Admita que a distribuição da altura dos jogadores de basquetebol é uma Normal com média 195 cm e
desvio padrão 20 cm. Que percentagem dos jogadores tem menos de 1.80 m de altura?
(A) 15.77%
(B) 20.04%
(C) 22.66%
(D) 26.89%
(E) 30.85%
5. Considere X o lucro que uma loja faz por dia. Podemos considerar que X é aproximadamente normal com
média 360€ e variância 2500€. Qual o valor de P(X>400)?
(A) 0.2119
(B) 0.2881
(C) 0.5319
(D) 0.7881
(E) 0.8450
92
6. Se 𝑋~𝑁(25; 25), calcule a P(X>22)
(A) ≈ 0
(B) 0.4487
(C) 0.8325
(D) 0.7257
(E) ≈ 1
7. Se X segue uma distribuição normal de média 16 e variância 16, calcule a P(X> -1)
(A) ≈ 0
(B) 0.2287
(C) 0.7357
(D) 0.8325
(E) ≈ 1
8. Se X é uma v.a. Normal com média 160, indique qual das afirmações é verdadeira:
(A) P(X < 150) < 0.5
(B) P(X > 170) > 0.5
(C) P(X > 150) < 0.5
(D) P(X < 170) < 0.5
(E) nenhuma das outras alternativas
9. O tempo de encher um copo de refrigerante numa cadeia de fast food segue uma distribuição normal de
média 10 segundos e variância 16 segundos. Chega um novo pedido de refrigerante. Qual a probabilidade
do copo demorar a encher mais de 25 segundos?
(A) ≈ 1
(B) 0.8264
(C) 0.1736
(D) 0.2236
(E) ≈ 0
10. Dois testes psicotécnicos foram feitos em simultâneo a um conjunto de alunos de uma escola. O teste A
teve uma pontuação normalmente distribuída com média de 1026 com um desvio padrão de 209 pontos.
O teste B, que tem uma escala diferente, teve uma pontuação normalmente distribuída com média de
20,8 e um desvio padrão de 4.6. A Clara fez ambos os testes e teve as pontuações de 860 no teste A e 16
no teste B. Compare os resultados tendo por base os resultados da escola e escolha a afirmação correta.
(A) A pontuação de 860 no teste A é melhor.
(B) A pontuação de 16 no teste B é melhor.
(C) Não podemos determinar qual a melhor pontuação tendo por base a informação dada.
(D) Ambos os testes são estatisticamente iguais.
(E) A Clara foi a melhor da escola nos testes.
11. Uma máquina de corte de rolhas de cortiça opera para que o diâmetro das rolhas produzidas siga uma
distribuição normal com média 3 cm e desvio padrão 0,1cm. Qual a medida máxima da rolha
(arredondado a 2 casas decimais) a para abranger 90% das rolhas?
93
(A) 3,03
(B) 3,05
(C) 3,08
(D) 3,13
(E) Nenhuma das anteriores
12. Considere que o valor monetário que o Daniel faz semanalmente por fazer trabalhos de jardinagem na
vizinhança segue uma distribuição normal, de média 240€ e desvio padrão 60€. Qual o valor máximo que
o Daniel obteve numa semana, sabendo que a probabilidade foi de 0.6? (aproxime o valor às unidades)
(A) 30
(B) 114
(C) 216
(D) 255
(E) 360
13. O tempo de entrega de um pedido num restaurante de fast food, segue uma distribuição normal com
média de 5 minutos e desvio padrão de 1 minuto. A política do restaurante é que, se um cliente não for
servido dentro de um período de tempo máximo, ele não será cobrado pelo alimento pedido. A
administração deseja fornecer esse programa de incentivo para no máximo 10% dos clientes. O tempo
máximo de espera garantido deve ser definido em:
(A) 6.3
(B) 6.7
(C) 7.3
(D) 6.9
(E) nenhuma das anteriores
14. Numa distribuição normal com média 200, sabe-se que P(X > 225) = 0,1587. Qual a variância dessa
distribuição?
(A) 25
(B) 625
(C) 1
(D) 200
(E) Nenhuma das anteriores
👉 Soluções: 1.C | 2.B | 3.A | 4.C | 5.A | 6.D | 7.E | 8.A | 9.E | 10.A | 11.D | 12.D | 13.A | 14.B
https://www.youtube.com/watch?v=NkiOvuytah4
94
4.3.4. Aditividade da distribuição normal
Quando temos várias variáveis aleatórias normais, a combinação linear das mesmas é ainda uma variável
aleatória normal, ou seja,
Exemplo
A produção semanal das bebidas A, B e C na empresa XPTO podem ser consideradas variáveis independentes
e com distribuições normais: 𝐴~𝑁(551, 332 ) ; 𝐵~𝑁(250, 282 ) e 𝐶~𝑁(831, 422 ).
b) Qual a probabilidade da totalidade de bebidas produzidos semanalmente pela empresa exceder as 1600
unidades de medida?
Logo, 𝑋 = 𝐴 + 𝐵 + 𝐶~𝑁(551 + 250 + 831, 332 + 282 + 422 ), ou seja , 𝑋~𝑁(1632, 3637)
1600−1632
𝑃(𝑋 > 1600) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −0.53) = 𝑃(𝑍 < 0.53) = 0.7019
√3637
Quando N é suficientemente grande e p suficientemente elevado para que a distribuição binomial seja
aproximadamente simétrica (na prática N≥20 e N.p>7), então a distribuição binomial aproxima-se da normal
com parâmetros 𝜇 = 𝑁𝑝 e 𝜎 2 = 𝑁𝑝𝑞. Ou seja,
se 𝑋~𝐵(𝑁, 𝑝), e 𝑁 ≥ 20 e 𝑁. 𝑝 > 7, então X pode aproximar-se por uma distribuição 𝑁(𝑁𝑝, 𝑁𝑝𝑞)
Nota: a aproximação da distribuição binomial pela Normal também pode fazer-se quando se verificam as
condições 𝑁 ≥ 20; 𝑁𝑝≥5 e 𝑁𝑞≥5
95
4.3.6. Aproximação da distribuição de Poisson à distribuição normal
Sempre que 𝜆 > 20, a distribuição de Poisson pode ser aproximada à distribuição normal. Assim,
se 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆), e 𝜆 > 20, então X pode aproximar-se por uma distribuição 𝑁(𝜆, 𝜆)
Nota: outros autores consideram que para aproximar a distribuição de Poisson à Normal basta que 𝜆 ≥ 5.
A aproximação de uma distribuição discreta (por exemplo, Binomial ou Poisson) para a distribuição contínua
(Normal) tem de ser feita com alguns ajustes. De facto, o acontecimento 𝑋 = 𝑥, no caso discreto, tem de ser
reescrito como 𝑥 − 𝜀 ≤ 𝑋 ≤ 𝑥 + 𝜀 no caso contínuo, uma vez que 𝑃(𝑋 = 𝑥) = 0, quando X é uma variável
aleatória contínua. Como os valores discretos consecutivos distam uma unidade entre si, escolhemos 𝜀 = 0.5.
Assim, sempre que aproximarmos uma variável aleatória discreta para a distribuição normal, devemos
recorrer à correção de continuidade:
Exemplo
96
Exemplo
Numa determinada vila, a taxa de desemprego situa-se nos 9%. Tendo-se recolhido uma amostra de 500
pessoas, calcule a probabilidade de haver no máximo 60 desempregados?
𝑋~𝐵(500, 0.09).
Dado que 𝑁 = 500 (≥ 20) e 𝑁𝑝 = 500 × 0.09 = 45 (> 7) então pode-se aproximar X pela distribuição
Normal,
60.5 − 45
𝑃(𝑋 ≤ 60) = 𝑃(𝑋 ≤ 60 + 0.5) = 𝑃(𝑋 ≤ 60.5) = 𝑃 (𝑍 ≤ ) = 𝑃(𝑍 ≤ 2.42) = 0.9922
√40.95
Exemplo
O número de avarias que uma máquina tem por dia é uma variável aleatória com distribuição de Poisson de
valor médio 0.2. Qual a probabilidade da referida máquina ter, durante um ano comum, pelo menos 100
avarias?
Se considerarmos um ano,
99.5 − 73
𝑃(𝑌 ≥ 100) = 𝑃(𝑌 ≥ 100 − 0.5) = 𝑃(𝑌 ≥ 99.5) = 𝑃 (𝑍 ≥ ) = 𝑃(𝑍 ≥ 3.10)
√73
= 1 − 𝑃(𝑍 < 3.10) = 1 − 0.9990 = 0.001
97
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
1. O montante de depósitos à ordem efetuados diariamente numa agência bancária é uma variável aleatória
com distribuição normal de média 120 unidades monetárias e desvio padrão 8. A agência bancária
cumpre os seus objetivos se o total depósitos efetuados em dois meses (40 dias laborais) exceder 5000
unidades monetárias. Qual a probabilidade da agência cumprir os seus objetivos?
(A) 0.7357
(B) 0.2643
(C) 0.5
(D) 0.5319
(E) 0.4681
2. Uma empresa, tem produção constante de 90 toneladas por dia. Sabe-se que a procura diária é uma v.a.
com distribuição Normal, com média 80 toneladas e desvio padrão 10 toneladas. Calcule a probabilidade
de, em 9 dias, a procura ser superior a 700 toneladas?
(A) 0.5871
(B) 0.4129
(C) 0.22
(D) 0.5080
(E) 0.4920
3. O salário mensal da cidade X é normalmente distribuído, com uma média de 800 euros e desvio padrão
de 400 euros. A cidade Y, também apresenta um salário mensal de média 700 euros e desvio padrão 500
euros. Assim, a diferença salarial entre as cidades X e Y (X-Y) pode ser descrita como normalmente
distribuída e com média e variância:
(A) 100 e 640, respetivamente
(B) 100 e 900
(C) 100 e 410 000
(D) 100 e 100
(E) Nenhuma das anteriores
4. Em qual das alternativas a seguir poderíamos usar uma distribuição normal para aproximar a distribuição
binomial?
(A) N = 15, p = 0.70
(B) N = 18, p = 0.90
(C) N = 22, p = 0.03
(D) N = 40, p = 0.10
(E) N = 24, p = 0.85
98
5. Selecione a seguinte probabilidade binomial, 𝑃(𝑋 < 25), com sua aproximação de probabilidade à
distribuição normal, após uma correção de continuidade.
(A) 𝑃(𝑋 > 25.5)
(B) 𝑃(𝑋 < 25.5)
(C) 𝑃(𝑋 > 24.5)
(D) 𝑃(𝑋 < 24.5)
(E) 𝑃(24 ≤ 𝑋 < 25)
6. Num estudo de mercado recente, verificou-se que 78% dos adultos com mais de 50 anos necessitam de
óculos para conduzir. Se se selecionar, aleatoriamente, 40 adultos com mais de 50 anos, qual a
probabilidade de pelo menos 30 necessitarem de usar óculos para conduzir?
(A) 0.2611
(B) 0.5987
(C) 0.4013
(D) 0.7389
(E) 0.6480
7. Se 62% de todos os adolescentes dizem que têm redes sociais, qual é a probabilidade de numa amostra de
200 adolescentes, menos de 124 adolescentes tenham redes sociais?
(A) 0.4721
(B) 0.5279
(C) 0.2140
(D) 0.5000
(E) 0.7860
8. Sabe-se que X, v. a. que representa o número de automóveis que entram numa autoestrada num período
de 30 segundos, segue uma distribuição de Poisson com desvio-padrão 2. Num período de 3 minutos,
qual a probabilidade de passarem exatamente 33 automóveis?
(A) 0.9738
(B) 0.0156
(C) 0.9582
(D) 0.0231
(E) Nenhuma das anteriores
99
Ficha de trabalho nº4
1. Numa cidade de milhares de pessoas, sabe-se que 20% estão contaminadas com o vírus W. Escolhendo 6
pessoas ao acaso para amostra, qual a probabilidade de:
1.1. nenhuma esteja contaminada. (R:0,2621)
1.2. metade ou mais estejam contaminadas. (R: 0,0989)
1.3. todas estejam contaminadas, sabendo-se que pelo menos uma pessoa está contaminada.
2. Uma empresa comercializa garrafas de vinho do Porto de 1 litro. Supõe-se, no entanto, que 40% dessas
garrafas contém realmente uma menor quantidade de líquido do que o volume indicado no rótulo. Tendo
adquirido 6 dessas garrafas, qual a probabilidade de:
2.1. Duas delas conterem menos de 1 litro? (R: 0,3110)
2.2. No máximo 2 delas conterem menos de 1 litro? (R: 0,5443)
2.3. Pelo menos 2 delas conterem menos de 1 litro? (R: 0,7667)
2.4. Todas conterem menos de 1 litro? (R: 0,0041)
2.5. Todas conterem o volume indicado no rótulo ou mais? (R: 0,0467)
2.6. Represente a função de probabilidade da v.a. em questão.
3. Numa linha de enchimento de frascos de compota, a falta de calibração da máquina origina diariamente
5% de frascos com menos produto do que o pretendido. Se for selecionada aleatoriamente uma amostra
de 15 frascos, determine a probabilidade de:
3.1. De nenhum frasco ter menos do que o pretendido. (R: 0,4633)
3.2. No máximo, 3 frascos terem menos do que o pretendido. (R: 0,9946)
3.3. Calcule o valor esperado e a variância da variável em estudo. (R: E(X)=0,75; Var(X)=0,7125)
5. Num centro comercial está instalado um sistema de 12 máquinas para utilização de Multibanco.
Considera-se que o sistema está em funcionamento se pelo menos metade dessas máquinas funcionar.
Suponha que cada máquina funciona independentemente das outras e que a probabilidade de
funcionamento de cada uma é de 0,6. Calcule a probabilidade de o sistema funcionar. (R: 0,8418)
100
6. Numa experiência biológica, para a qual a escolha das cobaias é bastante dispendiosa, verifica-se que a
experiência é bem-sucedida em 40% dos casos.
6.1. Se o investigador tiver 10 cobaias à sua disposição, qual a probabilidade de se verificarem pelo menos
2 experiências bem-sucedidas? (R: 0,9537)
6.2. Quantas cobaias são necessárias para que o número esperado de sucessos seja 24? (R: N=60)
6.3. Quantas cobaias serão necessárias para garantir que a probabilidade de obter pelo menos uma
experiência com sucesso seja superior a 0.95? (R: N≥6)
7. Numa escola primária foi feita uma grande campanha sobre a reciclagem do papel. Em cinco estudantes,
espera-se que quatro guardem escrupulosamente o papel usado para o colocar no papelão.
7.1. Calcule a probabilidade de que em 15 estudantes, mais de metade coloque o papel no papelão. (R:
0,9957)
7.2. Quantos estudantes devem ser selecionados de modo a que a probabilidade de encontrar pelo
menos três a cumprir esta exigência ambiental seja maior do que 99%. (R: N≥7)
8. Um armazenista controla a qualidade dos produtos que compra em lotes, inspecionando em cada lote de
10 peças e classificando-as em defeituosas ou perfeitas.
8.1. O armazenista tem por regra o seguinte: rejeita o lote e devolve-o ao fabricante se encontra mais de
duas peças defeituosas na amostra que retira em cada lote. Suponha que 5% das peças dum lote são
defeituosas.
8.1.1. Qual a probabilidade de o armazenista aceitar aquele lote? (R:0,9884)
8.1.2. Determine o número de peças defeituosas que o armazenista espera obter. (R: 0,5)
8.2. O seu fornecedor garante que o lote é de elevada qualidade pois apenas deverá ter 1% de peças
defeituosas. O fornecedor tem um sistema de controlo de qualidade que consiste em utilizar uma
amostra de 20 peças. Pretendendo que a probabilidade de aceitação de um lote seja de 0,999, qual
deverá ser o número máximo de peças defeituosas que o fornecedor pode admitir na sua amostra?
(R: 2)
9. Suponha que X tem distribuição binomial com parâmetros N e p. Sabendo que E(X)=5 e Var(X)=4,
determine N e p. (R: N=25, p=1/5)
10. O número de chamadas que chegam num período de 5 minutos a uma central telefónica de uma empresa
é uma v.a. com distribuição de Poisson de parâmetro λ=10.
10.1. Calcule a probabilidade de num período de 5 minutos:
101
10.1.1. Chegarem exatamente 8 chamadas. (R: 0,1126)
10.1.2. Chegarem menos de 5 chamadas. (R: 0,0293)
10.1.3. Chegarem no mínimo 3 chamadas. (R: 0,9972)
10.1.4. Chegarem pelo menos 20 chamadas. (R: 0,0035)
10.1.5. Não chegar nenhuma chamada. (R: 0)
10.2. Calcule agora a probabilidade de num período de 3 minutos chegarem à central da empresa:
10.2.1. No máximo 4 chamadas. (R:0.2851)
10.2.2. Menos de 15 chamadas. (R: 9987)
10.3. Qual o número esperado de chamadas em 10 minutos? E numa hora? (R:20 / 120)
11. Numa fábrica o número de acidentes por semana segue uma distribuição de Poisson de parâmetro igual
a 2. Calcule a probabilidade de que:
11.1. Numa semana haja pelo menos um acidente. (R: 0,8647)
11.2. Numa semana haja pelo menos um acidente, sabendo que na semana anterior não se tinha
registado nenhum acidente. (R: 0,8647)
11.3. Em duas semanas se verifiquem 4 acidentes. (R: 0,1954)
11.4. Numa semana haja 2 acidentes e na semana seguinte outros 2. (R: 0,0733)
12. O número de clientes que chega a uma caixa de supermercado num período de 10 minutos tem uma
distribuição de Poisson com média 5.
12.1. Calcule a probabilidade de num período de 5 minutos chegarem 2 ou mais clientes. (R: 0,7127)
12.2. Quantos lugares deverá ter a fila de modo a que todos os clientes que chegam num período de 5
minutos possam nela ter lugar com probabilidade pelo menos igual a 0,95. (R: 5)
13. O número de petroleiros que chega a uma certa refinaria, em cada dia, é uma v.a. X com distribuição de
Poisson de parâmetro 2. As atuais instalações portuárias da refinaria podem atender até 3 petroleiros por
dia. Se mais de 3 petroleiros chegam num dia, os petroleiros em excesso são enviados para outro porto.
13.1. Qual a probabilidade de, num dado dia, a refinaria ter de recusar petroleiros? (R: 0,1429)
13.2. Qual deverá ser a capacidade de atendimento da refinaria para permitir o acolhimento de todos os
petroleiros que chegam em cerca de 95% dos dias? (R: 5 petroleiros)
13.3. Qual o número esperado de petroleiros chegados por dia? (R: E(X)=2)
13.4. Qual o número mais provável de petroleiros chegados num dia? (R: 1 ou 2)
13.5. Qual a probabilidade de, em dois dias, chegarem 5 petroleiros? (R: 0,1563)
102
14. Um produtor de refrigerantes resolveu lançar uma campanha publicitária, oferecendo prémios impressos
nas cápsulas das garrafas. Durante a campanha, 5% das garrafas distribuídas para venda tinham prémio.
14.1. O Sr. João adquiriu 15 garrafas.
14.1.1. Qual a probabilidade de receber pelo menos 1 prémio? (R: 0,5367)
14.1.2. Qual probabilidade de receber no máximo 5 prémios? (R: 1)
14.1.3. Quantos prémios espera o Sr. João receber? (R: 0,75)
14.2. Um ATL vai fazer uma festa e comprou um lote de 100 refrigerantes. Qual a probabilidade de:
14.2.1. não receber qualquer prémio? (R:0.0067)
14.2.2. receber mais prémios que o esperado? (R: 0.384)
15. A procura diária do produto ZZZ numa determinada loja segue uma distribuição de Poisson. Sabendo que
a média diária é de 3 produtos e que o stock diário é mantido em 6 unidades, calcule:
15.1. a probabilidade de num dia serem procurados pelo menos 2 produtos. (R: 0,8008)
15.2. a probabilidade de se registar uma rutura de stock. (R: 0,0335)
15.3. o novo stock diário a assegurar de forma a que a probabilidade rutura seja no máximo de 0,004.
(R: s=8)
15.4. qual a procura média semanal esperada, sabendo que a loja está aberta todos os dias? Qual a
probabilidade da procura semanal ultrapassar os 20 produtos? (R: 0,5438)
👉 Soluções
2. 2.1.0.3110 2.2. 0.5443 2.3. 0.7667 10. 10.1.1. 0.1126 10.1.2. 0.0293 10.1.3. 0.9972
10.1.4. 0.0035 10.1.5. 0
2.4. 0.0041 2.5. 0.0467 10.2.1. 0.2851 10.2.2. 0.9987 10.3. 20 e 120
3. 3.1. 0.4633 3.2. 0.9946 3.3. 0.75 e 0.7125 11. 11.1. 0.8647 11.2. 0.8647 11.3.0.1954
11.4. 0.0733
13.5. 0.1563
6. 6.1. 0.9537 6.2. N=60 6.3. N≥6 14. 14.1.1. 0.5367 14.1.2. 1 14.1.3. 0.75
7. 7.1. 0.9957 7.2. N≥7 15. 15.1. 0.8008 15.2. 0.0335 15.3. 8 15.4. 0.5438
103