Você está na página 1de 105

ESTATÍSTICA

com aplicações às Ciências Empresariais

Helena Sofia Rodrigues * Florbela Correia


Índice

1. Estatística Descritiva ....................................................................................................................................... 2


1.1. Introdução ................................................................................................................................................ 2
1.2. População vs Amostra .............................................................................................................................. 2
1.3. Classificação da variável ........................................................................................................................... 3
1.4. Tabela de frequências e gráficos .............................................................................................................. 4
1.5. Medidas de estatística descritiva ............................................................................................................. 9
1.6. Software SPSS e Estatística descritiva .................................................................................................... 22

2. Probabilidades .............................................................................................................................................. 42
2.1. Introdução .............................................................................................................................................. 42
2.2. Conceitos fundamentais ......................................................................................................................... 42
2.3. Probabilidade.......................................................................................................................................... 45
2.4. Probabilidade condicionada ................................................................................................................... 51
2.5. Acontecimentos independentes ............................................................................................................ 51

3. Variáveis aleatórias....................................................................................................................................... 61
3.1. Noção de variável aleatória .................................................................................................................... 61
3.2. Caracterização e propriedades de variáveis aleatórias discretas........................................................... 61
3.3. Parâmetros associados às variáveis aleatórias discretas ....................................................................... 64

4. Distribuições teóricas de probabilidade ...................................................................................................... 72


4.1. Distribuição Binomial.............................................................................................................................. 72
4.2. Distribuição de Poisson .......................................................................................................................... 80
4.3. Distribuição Normal................................................................................................................................ 87

1
A Estatística fornece-nos técnicas para extrair informação de um
conjunto de dados, os quais são muitas vezes incompletos. O objetivo
final é obter uma melhor compreensão das situações, transformando
essa informação em conhecimento e permitindo tomar decisões mais
conscientes e assertivas.
Aqui serão revistos conceitos de estatística descritiva e inferencial,
aplicados às Ciências Empresariais.
O uso do software IBM SPSS será uma constante como ferramenta de
suporte aos conceitos introduzidos.

“Statistical Thinking will be one day as necessary for efficient citizenship as the ability
to read and write.”
H.G. Wells

1
1. Estatística Descritiva
_______________________________

1.1. Introdução
A Estatística é a ciência que recolhe, organiza, analisa, apresenta e interpreta os dados. São várias os campos
de atuação da Estatística, nomeadamente na indústria (ex.: cartas de controle, controlo de qualidade, eficácia
de fármacos), Administração Pública (ex.: censos), Meteorologia (ex.: dados de previsão para a navegação
aérea e marítima), Informática (ex.: Inteligência Artificial), Marketing (ex.: impacto campanha publicitária,
estudos de mercado), Política (ex.: sondagens), entre outros.

Na Estatística existem duas grandes áreas de atuação:

• Estatística Descritiva, que pretende isolar as estruturas e padrões mais relevantes num conjunto de
dados. É uma síntese e representação de uma forma compreensível da informação contida num
conjunto de dados, através da construção de tabelas, gráficos ou cálculo de medidas de localização e
de dispersão. É nesta área que se vai focar este capítulo.
• Inferência estatística, que generaliza resultados de uma amostra para uma população, estima
parâmetros desconhecidos, podendo testar hipóteses e ajudar na tomada de decisão.

1.2. População vs Amostra


Dois conceitos-chave serão focados ao longo deste texto:

• População: refere-se ao conjunto de todos os objetos, indivíduos ou resultados experimentais acerca


do qual se pretende estudar alguma característica (designada variável).
Chama-se dimensão ao número de objetos de uma população e representa-se, habitualmente, por N.
Como exemplo do estudo estatístico da população temos os censos, que na população portuguesa são
realizados a cada 10 anos.
• Amostra: um subconjunto da população que é observado com o objetivo de obter informação sobre
a característica pretendida da população. A dimensão da amostra (nº de objetos observados na
amostra) representa-se habitualmente por n.
Um exemplo do estudo estatístico recorrendo a amostras são as sondagens políticas, que através de
um conjunto reduzido de votantes tentam prever o resultado eleitoral.

População

Amostra

2
Quando a população é pequena ou o estudo requer uma maior precisão, devemos recorrer a um censo (estudo
de toda a população).

No entanto, na maioria das vezes recorre-se ao uso de uma amostra.


São várias as razões para a utilização de amostras:
 população demasiado grande ou infinita;
 realização de testes destrutivos para obtenção dos dados (por exemplo, controlo de qualidade numa
fábrica de fósforos);
 limitação de tempo e ou elevados custos associados à recolha de dados (por exemplo, sondagens para
eleições)

1.3. Classificação da variável


Uma variável é uma característica do sujeito em estudo, podendo tomar diferentes valores. Pode estar
classificada consoante o seguinte esquema:

Consoante a variável em estudo, a análise gráfica e as medidas estatísticas podem variar.

Destacam-se as mais usuais na tabela seguinte.

Variável Representação gráfica Medidas estatísticas


Gráfico de barras
Qualitativa Moda
Gráfico circular
Gráfico de barras Medidas de localização
Quantitativa discreta
Caixa de bigodes Medidas de dispersão
Histograma e polígono de frequências Medidas de localização
Quantitativa contínua
Caixa de bigodes Medidas de dispersão

3
1.4. Tabela de frequências e gráficos
Após a recolha dos dados é necessário organizá-los e ordená-los. Geralmente define-se uma tabela com os
seguintes tipos de frequências:

• Frequência absoluta (𝒇): 𝑓𝑖 =número de vezes que se observou um determinado valor 𝑥𝑖

• Frequência acumulada (𝑭): 𝐹𝑖 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖


𝑖 𝑓
• Frequência relativa (𝒇𝒓 ): 𝑓𝑟𝑖 = 𝑛º 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠 (de notar que a frequência relativa é sempre um valor entre 0 e 1)

Se pretendermos apresentar a frequência relativa sob a forma percentual, teremos de multiplicar o


resultado por 100, isto é, 𝑓𝑟𝑖 (%) = 𝑓𝑟𝑖 × 100.

Exemplo para dados discretos

Numa linha de produção são retiradas amostras do produto para avaliar o número de defeitos. O número de
defeitos por produto, numa amostra de 50 produtos, está sumariado a seguir.

0 0 1 1 2 3 4 2 3 0
0 0 2 3 3 4 4 2 2 2
1 1 1 1 1 2 0 0 0 1
1 1 1 1 2 3 4 1 2 2
3 3 1 1 1 0 0 2 2 3

Com os dados anteriores podemos construir a seguinte tabela de frequências.

Variável: Frequência Frequência Frequência Frequência relativa


Nº de defeitos absoluta acumulada relativa em % acumulada
por produto f 𝐹 𝑓𝑟 (%) 𝐹𝑟 (%)
0 10 10 20 20
1 16 26 32 52
2 12 38 24 76
3 8 46 16 92
4 4 50 8 100
Total 50 100

Com os dados organizados podemos construir gráficos de barras.

4
Nas tabelas de frequências de dados agrupados em classes é comum acrescentar-se uma outra coluna com o
ponto médio de cada intervalo, que servirá de apoio para o cálculo de medidas estatísticas (ver próxima
secção).

O ponto médio de um intervalo ou classe com valores entre a e b é calculado da seguinte forma:
𝑎+𝑏
𝑷𝒐𝒏𝒕𝒐 𝑴é𝒅𝒊𝒐[𝒂;𝒃[ = 𝑀 = .
2

Exemplo para dados contínuos

Considere-se parte de uma tabela relativa aos salários dos 150 trabalhadores de uma empresa:

1250€ 655,40€ 1734€ 543€ 678€ 2221,30€ 1256€ … 563€

O salário mensal dos 150 trabalhadores da empresa foi resumido na seguinte tabela.

Salário mensal Nº de trabalhadores


[500; 1000[ 60
[1000; 1500[ 65
[1500; 2000[ 15
[2000;2500[ 10

Constatamos que “salários dos trabalhadores” é uma variável quantitativa contínua, onde os valores
individuais foram agrupados em intervalos salariais (classes). Assim, podemos fazer a tabela de frequências e
incluir o cálculo do ponto médio de cada classe/intervalo.

Freq. Freq.
Freq. Freq.
Salário Ponto Médio absoluta relativa
absoluta relativa
Mensal 𝑀 acumulada acumulada
𝑓 𝑓𝑟 (%)
𝐹 𝐹𝑟 (%)
[500; 1000[ 750 60 60 40 40
[1000; 1500[ 1250 65 125 43,3 83,3
[1500; 2000[ 1750 15 140 10 93,3
[2000;2500[ 2250 10 150 6,7 100
Total 150 100

5
Em termos gráficos obtemos a seguinte representação. Este gráfico designa-se histograma.

Nota complementar:

O número de classes, a sua amplitude e os seus limites poderão ser definidos pelo investigador, em função
dos dados e do estudo que pretende realizar.
Contudo, há indicadores que podem ser utilizados como referência:
 o número de classes deve variar entre 4 e 20;
 o número de classes deverá corresponder ao inteiro mais próximo da raiz quadrada
da dimensão (nº classes = 𝐶 = √𝑛);
 no caso de se pretender classes com a mesma amplitude esse valor será dado por

𝑀á𝑥𝑖𝑚𝑜 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 − 𝑀í𝑛𝑖𝑚𝑜 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜


𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 ≈
𝐶

6
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.

1. Qual das seguintes variáveis não é categórica?


(A) Idade
(B) Género
(C) Estado civil
(D) Profissão
(E) Classificação de um serviço (muito satisfatório, satisfatório, nada satisfatório)

2. Considere a variável “classificação do material usado no suporte de uma prateleira”, onde as opções de
resposta são Excelente, Bom ou Fraco. Então é uma variável:
(A) Qualitativa nominal
(B) Qualitativa ordinal
(C) Quantitativa discreta
(D) Quantitativa contínua
(E) Nenhuma das restantes

3. O gráfico representa a frequência


acumulada de um conjunto de
consumidores, no que diz respeito ao
número de horas que vê televisão por
semana. Quantos consumidores veem
18 horas?
(A) 24
(B) 16
(C) 167
(D) 183
(E) 83

4. Considere o tempo de atraso dos comboios que passam numa estação durante um dia. Qual a
percentagem de comboios que têm um atraso entre 20 a 30 minutos?
(A) 140% Atraso (min) Nº de comboios
(B) 28% [0; 10[ 12
(C) 20% [10;20[ 16
(D) 14% [20;30[ 14
(E) nenhuma das restantes [30;40[ 8

7
5. A tabela a seguir representa o volume de vendas, em euros, de um café durante 200 dias.
Quais os valores corretos para os valores em falta?
Total de vendas f fr (%) Fr(%)
[0;30[ 5 2.5 a
[30;60[ 13 b c
[60;90[ d e 46
[90; 120[ f g h
[120; 150[ i 15 j

(A) a=2.5 b= 6.5 f=78 i=200


(B) d=74 e=37 g=78 h=85
(C) a=2.5 c=9 i=200 j=100
(D) b=6.5 c=9 g=39 h=80
(E) e=37 g=39 i=30 j=100

👉 Soluções: 1.A | 2.B | 3.A | 4.B | 5.E

São necessários mais exercícios?

📖 A. Afonso e C. Nunes (2019) Probabilidades e estatística – Aplicações e


soluções em SPSS. Universidade de Évora.
http://rdpc.uevora.pt/bitstream/10174/25959/3/ProbabilidadesEstatistica2
019.pdf

F. Mahaluça e A. Vilanculos (2019). Coletânea de exercícios resolvidos de


estatística.
https://www.researchgate.net/publication/339352708_Colectanea_de_Exer
cicios_Resolvidos_de_Estatistica

🔌 Tabelas de https://www.youtube.com/watch?v=sEFW7DX_2pM
frequências
https://www.youtube.com/watch?v=V4yqP6D8VY4

Gráficos https://www.youtube.com/watch?v=RE9eNdJuMGQ

https://www.youtube.com/watch?v=603rjGO3VPM

8
1.5. Medidas de estatística descritiva
Medidas descritivas são valores numéricos que procuram descrever ou sumariar as características
quantitativas de uma população ou de uma amostra.
Assim, denominamos de:
• Parâmetros - medidas descritivas que caracterizam a população. Geralmente são representados por
letras gregas.
• Estatísticas – medidas descritivas calculadas a partir de uma amostra. Geralmente são representadas
por letras romanas.

Pretende-se que as estatísticas sejam bons estimadores dos parâmetros, muitas vezes desconhecidos, da
população.

Desta forma, podemos ter o seguinte esquema de representação:

As medidas descritivas podem estar subdivididas em medidas de localização e de dispersão.

9
1.5.1. Medidas de tendência central
As medidas de tendência central são assim denominadas por indicarem um valor em torno do qual se
distribuem os dados. Este valor tende a ser o centro da distribuição dos dados.

Média

A média aritmética, ou simplesmente designada média, é a soma de todos os valores observados da variável
dividida pelo número total de observações.

Temos as seguintes fórmulas para o cálculo da média amostral 𝑋̅:


∑𝑥
 Dados quantitativos não agrupados: 𝑋̅ = 𝑛 𝑖

∑𝑓 𝑥
 Dados quantitativos organizados em tabelas de frequências: 𝑋̅ = 𝑛𝑖 𝑖 ou 𝑋̅ = ∑ 𝑓𝑟𝑖 𝑥𝑖

∑𝑓 𝑀
 Dados quantitativos agrupados em classes: 𝑋̅ ≈ 𝑖 𝑖 ou 𝑋̅ ≈ ∑ 𝑓𝑟𝑖 𝑀𝑖 , sendo 𝑀𝑖 o ponto médio da
𝑛
classe 𝑖

(Nota: quando se refere a média populacional substituímos, como vimos anteriormente, 𝑋̅ por 𝜇)

Algumas propriedades da média aritmética:


a) a média é um valor calculado facilmente e depende de todas as observações;
b) a média é única num conjunto de dados e nem sempre tem existência real, ou seja, nem sempre é um
valor observado. (Ex: a média de filhos dos agregados familiares pode ser 1,4; contudo não há nenhum agregado familiar com 1,4 filhos);
c) a média é afetada por valores extremos ou outliers;
d) por depender de todos os valores observados, qualquer modificação nos dados poderá alterar o valor
da média.

Exemplo 1
Foi registado o número de clientes que chegam a uma loja por dia durante 15 dias.
3 4 1 4 2 3 5 6 3 4 3 3 4 2 3
3+4+1+4+2+3+5+6+3+4+3+3+4+2+3
Média: 𝑋̅ = 15
≈ 3,33.

Exemplo 2
Foi registado o número de lugares desocupados em 10 comboios que passaram numa estação num dia.
6 1 7 2 5 3 8 4 0 100
6+1+7+2+5+3+8+4+0+100
Média: ̅
𝑋= ≈ 13,6. Note-se que o facto do último comboio ter um número
10
muito elevado de lugares vazios, afetou consideravelmente a média.

10
Exemplo 3 (exemplo da secção anterior)
Numa linha de produção são retiradas amostras do produto para avaliar o número de defeitos. O número de
defeitos por produto, numa amostra de 50 produtos, está sumariado a seguir.

Nº de defeitos por Frequência absoluta f Frequência relativa 𝑓𝑟 Frequência relativa


produto acumulada 𝐹𝑟
0 10 0,20 0,20
1 16 0,32 0,52
2 12 0,24 0,76
3 8 0,16 0,92
4 4 0,08 1

0×10+1×16+2×12+3×8+4×4
Média: 𝑋̅ = 50
=1,6 ou

𝑋̅ = 0 × 0,20 + 1 × 0,32 + 2 × 0,24 + 3 × 0,16 + 4 × 0,08 = 1,6

Exemplo 4 (exemplo da secção anterior)


O salário mensal dos 150 trabalhadores de uma empresa está descrito na seguinte tabela.

Salário mensal Ponto Médio Freq. absoluta Freq. Absoluta Freq. relativa Freq. Relativa
𝑀𝑖 𝑓 acumulada 𝐹 𝑓𝑟 (%) Acumulada 𝐹𝑟 (%)
[500; 1000[ 750 60 60 40 40
[1000; 1500[ 1250 65 125 43,3 83,3
[1500; 2000[ 1750 15 140 10 93,3
[2000;2500[ 2250 10 150 6,7 100

Média: 𝑋̅ ≈ 750 × 0,40 + 1250 × 0,433 + 1750 × 0,10 + 2250 × 0,067 = 1167

Mediana

A mediana (𝑀𝑒𝑑 ou 𝑋̃) é o valor que ocupa a posição central de uma série de observações ordenadas de uma
variável, dividindo o conjunto em duas partes iguais. Em termos práticos, a mediana é o valor que de um lado
tem 50% de observações com os valores mais baixos e do outro tem 50% das observações com os valores mais
elevados.
Note que, os dados têm que estar sempre dispostos por ordem crescente ou decrescente .

 Dados quantitativos não agrupados:


o Se o número de dados for ímpar: 𝑋̃ = 𝑥𝑛+1
2

𝑥𝑛 +𝑥𝑛
+1
o Se o número de dados for par: 𝑋̃ = 2
2
2

11
 Dados quantitativos organizados na tabela de frequências: é o valor que ocupa o centro da amostra,
ou seja, 50% dos elementos são menores e 50% dos elementos são maiores do que a mediana.

0.5−𝑓𝑎−
 Dado quantitativos organizados em classes: 𝑋̃ ≈ 𝐿𝐼 + ∆, onde:
𝑓𝑎 + −𝑓𝑎 −

𝐿𝐼 é o limite inferior da classe (ou célula) mediana


∆ é a amplitude dessa célula,
𝑓𝑎+ é a frequência relativa acumulada correspondente à célula mediana;
𝑓𝑎− é a frequência relativa acumulada correspondente à célula que precede a célula mediana.

A mediana apresenta a vantagem de ser robusta quando a amostra contém valores extremos ou outliers, ou
seja, não se deixa influenciar por esses valores.

Voltando aos exemplos que foram apresentados para a média…


Exemplo 1 (cont.)
Em primeiro lugar é necessário ordenar os dados (neste caso optou-se por ordem crescente). Assim, temos
1 2 2 3 3 3 3 3 3 4 4 4 4 5 6

Como 𝑛 = 15 (o nº total de observações é ímpar), então

𝑋̃ = 𝑥15+1 = 𝑥8 = 3
2

o que significa que esta loja em 50% dos dias teve no máximo 3 clientes por dia ou, visto de outra forma, nos
restantes 50% dos dias teve pelo menos 3 clientes por dia.

Exemplo 2 (cont.)
0 1 2 3 4 5 6 7 8 100

Como n=10 (nº total de observações é par), logo

(Relembre que neste exemplo a média era 13,6)

Exemplo 3 (cont.)
𝑥25 +𝑥26 1+1
Mediana: 1 (𝑋̃ = 2
= 2
= 1).

12
Exemplo 4 (cont.)
Classe mediana: [1000;1500[ (através da frequência relativa acumulada, verificamos que nesta classe atingimos 50% das
observações).

Moda

A moda (𝑀𝑜𝑑 ou 𝑋̂ ) é o valor da variável que apresenta a maior frequência de entre os valores observados.

Exemplo 1 (cont.)
Moda: 𝑋̂ = 3, que é o número de clientes por dia mais frequente.

Exemplo 2 (cont.)
Moda: não existe, pois todas os dados têm igual frequência. Neste caso dizemos que se trata de uma amostra
amodal.

Exemplo 3 (cont.)
Moda: 𝑋̂ = 1 pois é o valor mais frequente (verificado através da frequência absoluta ou frequência relativa)

Exemplo 4 (cont.)
Classe modal: [1000; 1500[

1.5.2. Medidas de partição


As medidas de partição são os valores que, num conjunto de dados ordenados, dividem o conjunto em partes
iguais.

Percentis

Os percentis dividem o conjunto de dados em 100 partes iguais.

Por exemplo, P5 significa o percentil de ordem 5, isto é, P5 é o valor que, num conjunto ordenado, se encontra
numa posição em que de um lado tem 5% das observações menores e no outro lado tem as restantes 95%.

Decis

Os decis dividem o conjunto de dados em 10 partes iguais.

13
Quartis

Os quartis, Q1 , Q2 e Q3, dividem o conjunto de dados em quatro partes iguais.

Assim, a mediana corresponde ao Q2, que é simultaneamente igual ao percentil de ordem 50.

Representando num gráfico os valores mínimo, máximo e quartis, obtemos a designada caixa-de-bigodes ou
diagrama de extremos e quartis ou boxplot. Este gráfico pode ser apresentado quer na horizontal quer na
vertical.

Exemplo 3 (cont.)
Numa linha de produção são retiradas amostras do produto para avaliar o número de defeitos. O número de
defeitos por produto, numa amostra de 50 produtos, está sumariado a seguir.

Nº de defeitos por Frequência absoluta f Frequência relativa 𝑓𝑟 Frequência relativa


produto acumulada 𝐹𝑟
0 10 0,20 0,20
1 16 0,32 0,52
2 12 0,24 0,76
3 8 0,16 0,92
4 4 0,08 1

Verificamos que:
Q1=1
Q2=Med=1
Q3=2

À direita está representada a caixa-de-


bigodes elaborado pelo software SPSS.
Note que neste gráfico existem valores,
representados com um círculo, “fora” da caixa-de-bigodes. Esses valores são as chamadas observações
extremas ou outliers. Assim, uma observação extrema ou um outlier é uma observação que fica
“anormalmente” distante dos outros valores do conjunto de dados.

14
1.5.3. Medidas de dispersão
As medidas de dispersão auxiliam as medidas de tendência central a descrever adequadamente o conjunto de
dados estudado. Permitem descrever o quanto os resultados observados se distribuem em torno dos valores
centrais, isto é, se estão muito concentrados (baixa dispersão), ou se estão afastados uns dos outros (grande
dispersão).

Amplitude (A)

𝐴 = 𝑥𝑚á𝑥𝑖𝑚𝑜 − 𝑥𝑚í𝑛𝑖𝑚𝑜
(A amplitude é a diferença entre os valores máximo e mínimo observados)

Amplitude Interquartil (AIQ)

𝐴𝐼𝑄 = 𝑄3 − 𝑄1
(A amplitude interquartil é a diferença entre o Quartil 3 e o Quartil 1)

Nota:
 Diz-se que uma observação é um outlier se o seu valor é superior a 𝑄3 + 1,5𝐴𝐼𝑄 ou inferior a
𝑄1 − 1,5𝐴𝐼𝑄
 Diz-se que uma observação é uma observação extrema ou outlier severo se o seu valor é superior a
𝑄3 + 3𝐴𝐼𝑄 ou inferior a 𝑄1 − 3𝐴𝐼𝑄

Variância

Esta medida de dispersão traduz a variação de um conjunto de dados em torno da média, ou seja, da maior
ou menor variabilidade dos valores observados. Esta medida só assume valores não negativos e quanto maior
o seu valor, maior a dispersão dos dados.
∑𝑛 ̅ 2
𝑖=1(𝑥𝑖 −𝑋)
Variância amostral: 𝑠 2 =
𝑛−1

∑𝑁
𝑖=1(𝑥𝑖 −𝜇)
2
(Nota: A variância populacional é dada por 𝜎 2 = )
𝑁

Desvio padrão

É a medida de dispersão mais utilizada. O valor desta medida é obtido através da raiz quadrada da variância.

∑𝑛 ̅ 2
𝑖=1(𝑥𝑖 −𝑋)
Desvio padrão amostral: 𝑠 = √𝑠 2 = √
𝑛−1

∑𝑁
𝑖=1(𝑥𝑖 −𝜇)
2
(Nota: Desvio padrão populacional é dado por 𝜎 = √𝜎 2 = √ )
𝑁

15
Coeficiente de variação

Esta medida de dispersão relativa não depende das unidades em que a variável é expressa, pelo que é útil
para comparar duas ou mais distribuições relativamente à dispersão. Mede o grau de concentração em torno
da média, em valor percentual:
𝑠
𝐶𝑉 = × 100
𝑋̅

Exemplo
Considere-se os salários anuais de duas PME (em milhares de euros):
Empresa A 44 45 50 51 60
Empresa B 5 5 30 100 110

Média: 𝑋̅𝐴 = 50 e 𝑋̅𝐵 = 50

O salário médio é igual em ambas as empresas. Por isso, esta medida estatística não é suficiente para descrever
as diferenças salariais nas duas empresas. Observando os salários em cada empresa, verificamos que na
empresa B há salários muito diferentes entre si. Surge a necessidade de usar as medidas de dispersão.

Amplitude: 𝐴𝐴 = 60 − 44 = 16 e 𝐴𝐵 = 110 − 5 = 105

Variância:

(44 − 50)2 +(45 − 50)2 + (50 − 50)2 + (51 − 50)2 + (60 − 50)2
𝑠𝐴2 = = 40,5
5−1

(5 − 50)2 +(5 − 50)2 + (30 − 50)2 + (100 − 50)2 + (110 − 50)2


𝑠𝐵2 = = 2637,5
5−1

Desvio padrão:

𝑠𝐴 = √𝑠𝐴2 = √40,5 ≈ 6,36 e 𝑠𝐵 = √𝑠𝐵2 = √2637,5 ≈ 51,36

Coeficiente de variação:
𝑆 𝑆
𝐶𝑉𝐴 = 𝑋̅𝐴 × 100 = 12,72 e 𝐶𝑉𝐵 = 𝑋̅𝐵 × 100 = 102,72
𝐴 𝐵

Apesar da média salarial de ambas as empresas ser igual, através das medidas de dispersão conseguimos
verificar que na empresa B existe uma grande variabilidade nos salários pagos.

16
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.

1. Um valor numérico usado como medida de resumo para uma amostra, como a média amostral, é
conhecido como:
(A) Parâmetro da população
(B) Parâmetro da amostra
(C) Estatística da amostra
(D) População média
(E) Nenhuma das anteriores

2. Qual das opções seguintes fornece uma medida de tendência central para um conjunto de dados?
(A) Desvio padrão
(B) Média
(C) Variância
(D) Amplitude
(E) 1º Quartil

3. Uma vez que o tamanho da população é sempre maior do que o tamanho da amostra, então a estatística
da amostra:
(A) Nunca pode ser maior do que o parâmetro da população
(B) Nunca pode ser igual ao parâmetro da população
(C) Nunca pode ser menor do que o parâmetro da população
(D) Tem de ser sempre igual ao parâmetro da população
(E) Pode ser menor, maior ou igual ao parâmetro da população

4. Qual das seguintes medidas não é uma medida de dispersão?


(A) Amplitude
(B) Percentil 50
(C) Desvio padrão
(D) Amplitude interquartil
(E) Coeficiente de variação

5. Qual das seguintes estatísticas não é afetada por outliers?


(A) Média
(B) Amplitude interquartil
(C) Desvio padrão
(D) Amplitude
(E) Variância

17
6. Se duas amostras de uma mesma população têm a mesma média, então:
(A) O desvio padrão tem de ser igual para ambas as amostras
(B) As medianas têm de ser iguais
(C) A moda tem de ser igual para ambas as amostras
(D) A amplitude tem de ser igual para ambas as amostras
(E) Nenhuma das restantes alternativas é correta

7. Considere a o conjunto de dados, referente a uma amostra de classificações de uma prova:


14, 24, 9, 12, 21, 18, 7. A amplitude e a variância são, respetivamente:
(A) 15 e 6,27
(B) 6 e 6,27
(C) 17 e 6,27
(D) 17 e 39,33
(E) 15 e 39,33

8. Numa semana, o preço de um saco de arroz esteve cotado da seguinte forma:


350, 280, 340, 290, 320, 310, 300. A amplitude é:
(A) 60
(B) 70
(C) 80
(D) 90
(E) 100

9. Considere o número de clientes de uma loja, por dia. A média e desvio Nº de clientes Frequência
padrão são, respetivamente: 0 8
(A) 2.19; 1.46 1 16
2 22
(B) 2.19; 2.10
3 14
(C) 3.42; 1.46
4 6
(D) 3.42; 2.17 5 4
(E) 1.91; 1.44 6 2

10. Durante 21 dias foi medida a humidade relativa de uma cidade. Teve uma média de 65% e uma mediana
de 68%. Infelizmente descobriu-se que um dos registos estava errado: tinha sido registado 35% quando
na verdade deveria ter sido 40%. Se for feita a correção desse dado, então:
(A) a média permanece a mesma, mas a mediana aumenta
(B) a média e a mediana permanecem as mesmas
(C) a mediana permanece a mesma, mas a média aumenta
(D) a média e a mediana aumentam
(E) média aumenta, mas a mediana diminui.

18
11. A seguinte tabela representa o número de telemóveis vendidos por dia numa loja.
Nº de telemóveis 0 1 2 3 4 ou mais
Frequência relativa 0.55 0.20 0.10 0.15 0
Das afirmações que se seguem, quais são as verdadeiras?
(i) A média e a moda são iguais
(ii) A média e a mediana são iguais
(iii) A mediana e a moda são iguais
(A) Apenas (i)
(B) Apenas (ii)
(C) Apenas (iii)
(D) Apenas (i) e (ii)
(E) Todas as afirmações são verdadeiras

12. A tabela representa o número de bactérias por amostra num rio, recolhidas Número de Número
durante 50 dias por uma empresa da de microbiologia. O valor médio de bactérias de
bactéria da amostra é: amostras
(A) 70 [50, 60[ 5
[60, 70[ 15
(B) 71
[70, 80[ 20
(C) 72
[80, 90[ 10
(D) 76
(E) 65

13. Considere a tabela do exercício 12. Qual das seguintes afirmações é falsa?
(A) A classe modal é [70, 80[.
(B) A classe mediana é [70, 80[.
(C) O ponto médio do segundo intervalo é 65.
(D) Q3 pertence ao intervalo [70, 80[
(E) Q1 pertence ao intervalo [50, 60[

14. Uma empresa faz um teste psicotécnico (cotado de 0 a 100) para um conjunto de potenciais candidatos
a um lugar na empresa. Os resultados foram os seguintes:
20, 35, 35, 45, 50, 55, 65, 75, 75, 75, 85, 85, 95, 95, 100.
Depois de calcular as medidas de tendência central destes resultados, descobriu-se que um dos testes
tinha sido mal cotado: um dos 75% era na realidade 85%. Quais as medidas estatísticas que sofreram
alteração?
(A) apenas a média
(B) apenas a moda
(C) apenas a mediana
(D) a média e a moda
(E) as três medidas

19
15. Considere as informações sobre o salário mensal Filial A Filial B
de duas filiais da mesma empresa. Tamanho da amostra 45 45
Qual das seguintes frase é necessariamente Média da amostra 1000€ 800€
verdadeira? Desvio Padrão da amostra 80€ 70€
(A) Os salários pagos em A são todos mais elevados que os salários pagos em B
(B) A variabilidade dos salários na filial A é menor que a variabilidade na filial B.
(C) A variância associada aos salários da filial B é 6400.
(D) A variabilidade dos salários na filial A é maior que a variabilidade na filial B.
(E) Não se pode tirar qualquer tipo de conclusão, pois não há dados suficientes.

16. Um conjunto de 78 crianças foram submetidas a um


conjunto de testes do qual resultou um relatório. Para o
QI (Coeficiente de Inteligência) foi apresentado a seguinte
caixa de bigodes.
Qual a amplitude interquartil, aproximadamente?
(A) 64
(B) 50
(C) 15
(D) 7.5
(E) 70

17. As caixas de bigodes sumarizam dois conjuntos de dados.


Qual das seguintes afirmações não pode ser justificada com a
representação gráfica apresentada?
(A) A amplitude do conjunto de dados (I) é igual à amplitude
do conjunto de dados (II).
(B) A amplitude interquartil do conjunto de dados (I) é igual
à amplitude interquartil do conjunto de dados (II)
(C) A mediana do conjunto de dados (I) é menor que a mediana do conjunto de dados (II)
(D) O conjunto de dados (I) e (II) têm o mesmo número de elementos.
(E) Cerca de 75% dos valores do conjunto de dados (II) são superiores ou iguais a cerca de 50% dos
valores do conjunto de dados (I)

18. Considere o conjunto de dados ordenados do menor para o maior: 2 12 y 15 15 18 18 19, com y
um número inteiro. Quais das seguintes afirmações são verdadeiras?
(i) A mediana e o primeiro quartil não são iguais.
(ii) A moda é 18.
(iii) 2 é o mínimo.
(A) Apenas (i)
(B) Apenas (ii)
(C) Apenas (iii)
(D) Apenas (i) e (iii)
(E) Todas

20
19. Considere o gráfico caixa de bigodes relativo ao peso (em Kg) dos bebés à nascença. Considere as
afirmações:
i) A média do peso dos bebés é
3,1 Kg
ii) 75% dos bebés têm peso
inferior ou igual a 3Kg

iii) Nenhum bebé tem peso


superior a 4 Kg
iv) 50% dos bebés têm uma variação de 400gr no seu peso.
Com base na análise gráfica, escolha a alínea necessariamente verdadeira
(A) Todas as afirmações são falsas
(B) Todas as afirmações são verdadeiras
(C) Só a alínea ii é verdadeira
(D) Só a alínea iii é verdadeira
(E) Só a alínea iv é verdadeira

👉 Soluções: 1.C | 2.B | 3.E | 4.B | 5.B | 6.E | 7.D | 8.B | 9.A | 10.C | 11.C | 12.C | 13.E |
14.D | 15.B |16.C | 17.D | 18.D | 19.E

São necessários mais exercícios?

📖 A. Afonso e C. Nunes (2019) Probabilidades e estatística – Aplicações e


soluções em SPSS. Universidade de Évora.
http://rdpc.uevora.pt/bitstream/10174/25959/3/ProbabilidadesEstatistica2
019.pdf

F. Mahaluça e A. Vilanculos (2019). Coletânea de exercícios resolvidos de


estatística.
https://www.researchgate.net/publication/339352708_Colectanea_de_Exer
cicios_Resolvidos_de_Estatistica

🔌 Medidas de https://www.youtube.com/watch?v=v8fo_hSpo-k
tendência
central

Medidas de https://www.youtube.com/watch?v=ie2few5B7ZU
partição

Medidas de https://www.youtube.com/watch?v=Za8SUxUNVIo
dispersão
https://www.youtube.com/watch?v=Js71WYZsy50

21
1.6. Software SPSS e Estatística descritiva

O SPSS (Statistical Package for Social Sciences) é uma ferramenta para análise estatística de dados, num
ambiente gráfico, com menus e caixas de diálogo de fácil utilização.

1.6.1. Extensões dos ficheiros e janelas do SPSS


Os ficheiros do SPSS podem ter as seguintes extensões:
 extensão .sav - ficheiro de dados;

 extensão .spv - ficheiro de resultados.

O SPSS é constituído por duas janelas principais:

 SPSS Editor de dados – onde são apresentados os dados em estudo e as caraterísticas das variáveis
definidas; esta janela apresenta dois separadores:
o visualização de dados, onde é possível visualizar e editar os dados;
o visualização da variável, onde é permitido definir ou alterar as características das variáveis.

 SPSS Visualizador – onde se apresentam os resultados dos estudos realizados; a janela está dividida
em duas partes, mostrando no lado esquerdo o título dos resultados obtidos e no lado direito os
resultados gerados.

22
1.6.2. Base de dados

No SPSS o ficheiro de dados é constituído por uma matriz na qual as colunas correspondem às variáveis e as
linhas aos indivíduos/casos. Cada célula corresponde a uma observação individual da variável correspondente.
Podemos criar uma nova base de dados ou usar uma já existente. Nesta secção os retângulos a cinza
descrevem os comandos usados no SPSS.

Criar uma nova base de dados

Menu: Arquivo  Novo  Dados

Abrir um conjunto de dados já existente

Menu Arquivo  Abrir  Dados  “Procurar o ficheiro pretendido”  “Botão” Abrir


Para além dos ficheiros criados pelo SPSS (*.sav), existem outros que são compatíveis, nomeadamente
ficheiros Excel (*.xls), os ficheiros gravados em dBase (*.dbf) e os ficheiros de texto (*.txt).
Para encontrar esses ficheiros terá que selecionar em “Arquivos do tipo” a extensão do ficheiro pretendido.

Na criação de uma base de dados tem que se preencher os dois separadores presentes no editor de dados:

No separador “Visualização de dados”, cada coluna corresponderá a uma variável, que será encimada pelo
nome, e os valores observados da variável terão que ser escritos, um a um, na coluna.

No separador “Visualização da variável”, cada linha contém a informação respeitante a cada variável:
 Nome - deve ser indicado o nome da variável, que aparecerá no topo da coluna na janela “Visualização
de dados”. Este nome deve seguir determinadas regras, das quais se destacam não haver espaços
entre palavras e ou números; o nome não pode iniciar-se com um número; alguns caracteres especiais
não são aceites; não são permitidos nomes em duplicado, isto é, o nome de uma variável é único na
base de dados.

 Tipo - deve ser indicado o tipo de variável, de uma escolha que o programa oferece; na maioria dos
casos os tipos utilizados são o tipo numérico ou a sequência de caracteres.

23
 Largura - este campo corresponde à dimensão da variável, isto é, define o nº máximo de algarismos
ou caracteres que o valor da variável pode tomar.

 Decimais - deve indicar-se o n.º de casas decimais que a variável pode tomar, caso seja do tipo
numérico.

 Rótulo - não é um campo obrigatório, mas pode ser de extrema utilidade. Por exemplo, pode conter
uma descrição mais completa da variável, descrição essa que aparecerá nas tabelas e gráficos
construídos.

 Valores - onde é indicado o código utilizado para definir valores da variável. Por exemplo: suponha
que, para simplificar, se definia o valor 1 para o género masculino e 2 para o género feminino. Então
é aqui que se deve informar o sistema deste “código”.

 Ausente/Omisso - onde se informa o sistema que um determinado valor representa uma situação
anómala e não um valor aceitável para a variável. Existem também system-missing, quando o sistema
não é informado sobre a situação (qualquer célula em branco).

 Colunas - indica a largura da coluna que conterá a informação da variável no separador “Visualização
de Dados”.

 Alinhamento - é onde se define qual o alinhamento da informação da coluna que conterá a


informação da variável no separador “Visualização de Dados”. Pode ser alinhamento à esquerda,
direita ou ao centro. Habitualmente alinha-se à esquerda as variáveis que se apresentam como
sequência de caracteres e à direita as variáveis numéricas.

 Medir - é onde se indica a escala de medida da variável, que pode ser Nominal ou Ordinal, para as
variáveis qualitativas, ou de Escala, para as variáveis quantitativas.
~

24
Exemplo
Considere os dados relativos à venda diária de um produto XYZ numa cadeia de supermercados.
Vendas diárias Posição na prateleira Loja
14 1 Norte
15 2 Norte
16 1 Centro
10 2 Centro
14 3 Centro
11 1 Norte
17 1 Centro
16 1 Norte
14 1 Centro
15 1 Norte
12 1 Centro
10 1 Norte
15 2 Centro
19 2 Norte
11 2 Norte
23 2 Norte
20 2 Centro
18 2 Norte
17 3 Centro
27 3 Norte
33 3 Centro
22 3 Centro
26 3 Centro
28 3 Norte

No SPSS obtemos a seguinte base de dados (supermercado.sav), onde na visualização dos dados temos…

… e na visualização da variável obtemos

Houve o cuidado de transformar a localização da loja num código para ser mais fácil tratar os dados
nominais posteriormente.
Assim, os dados podem ser visualizados com a localização (Norte ou Centro) ou com o valor
atribuído a cada localização (1 ou 2, respetivamente). Basta clicar no ícone seguinte para
trocar a visualização.

25
1.6.3. Transformação dos dados
Para além da introdução das variáveis no separador “Visualização dos dados”, o SPSS possibilita a criação de
novas variáveis através de transformações ou de cálculos numéricos entre as variáveis já existentes. As
ferramentas usadas para isso são:
 Cálculo de uma nova variável, recorrendo a fórmulas matemáticas e/ou lógicas;
 Transformação de uma variável existente, recodificando-a (por exemplo, agrupando os valores
numéricos em intervalos).

Calcular uma variável

Menu: Transformar  Calcular variável

Variável de resposta: escrever o nome da nova variável

Expressão numérica: escrever a fórmula que irá originar a nova variável


(Nota: ** significa expoente, que corresponde geralmente ao símbolo ^ da calculadora; ~= significa diferente. Atenção que na
calculadora do SPSS a vírgula é representada por “.”)

Exemplo (supermercado.sav)

Se cada produto XYZ tem um lucro unitário de 15


euros, então podemos criar uma nova variável
com o lucro diário da seguinte forma:

Lucro_diario=venda*15

Recodificar uma variável

A recodificação pode ser feita de três formas distintas:


 Recodificação na mesma variável, que transforma/recodifica os valores da variável, perdendo-se os
valores originais;

 Recodificação em variável diferente, que cria uma nova variável com a recodificação pretendida dos
valores da variável original (recodificação aconselhada);
 Recodificação automática, que recodifica variáveis do tipo sequência de caracteres ou do tipo
numérico em número inteiros consecutivos.

* Menu: Transformar  Recodificar em variáveis diferentes


* Selecionar a variável que pretende recodificar e arrastá-la para a caixa “Variável de entrada>variável de
saída” Variável de saída: escrever o novo nome para a variável  botão “Alterar”
* Botão “Valores antigos e novos…”
*Valor antigo: definir o valor ou amplitude do intervalo a selecionar  Novo valor: atribuir um valor
(Nota: a construção de intervalos abertos ou fechados depende da ordem pela qual iniciamos a codificação no SPSS)

26
Exemplo (supermercado.sav)
1) Vamos supor que precisamos de criar uma nova variável relativa às vendas, onde se pretende que os
dados estejam agrupados em intervalos de amplitude 5, da seguinte forma:
1=[10; 15[ 2=[15; 20[ 3=[20; 25[ 4=[25; 30[ 5=[30; 35]. Então devemos fazer:

Obtemos a seguinte transformação na base de dados

2) Suponhamos agora que se pretendia que os dados fossem agrupados nos seguintes intervalos:
1=[10; 15] 2=]15; 20] 3=]20; 25] 4=]25; 30] 5=]30; 35]. Então teríamos que fazer:

Obtemos agora a seguinte transformação na base de dados

27
3) Suponhamos, ainda, que se pretendia agora que os dados fossem agrupados nos seguintes intervalos:
1=[10; 15] 2=]15; 20[ 3=[20; 25] 4=]25; 30[ 5=[30; 35].
Neste caso a introdução da codificação seria:

1.6.4. Seleção de casos


Esta opção permite selecionar apenas um subconjunto dos dados existentes num ficheiro, aleatoriamente
ou especificando um atributo.

Menu: Dados  Selecionar casos…


Escolher “Se a condição for cumprida” (no caso de restringirmos com uma especificação)  botão “Se” Definir no
retângulo do lado direito a condição que permite selecionar os dados pretendidos

Exemplo (supermercado.sav)

Se o estudo pretender restringir a


análise às vendas da loja Norte (recorde
que à loja norte foi atribuído o valor 1),
podemos recorrer a esta ferramenta.

Nesta situação, a análise irá recair


apenas sobre as lojas do Norte sem
perder, no entanto, os dados da loja
Centro.

1.6.7. Análise estatística univariada


No SPSS existem várias formas de obter as várias ferramentas de estatística descritiva (tabelas de frequências,
medidas amostrais ou gráficos) para uma variável em estudo. Vamos apenas referir alguns considerados mais
relevantes.

28
Menu: Analisar  Estatística descritiva  Frequências
Caixa Variável: colocar a(s) variável(eis) que se pretende(m) estudar
Após esta seleção é possível obter-se:
* Tabela de frequências: manter selecionada a opção “Exibir tabela de frequências”
* Estatísticas descritivas: Botão “Estatísticas” Selecionar as estatísticas que se pretende  continuar
*Gráficos: Botão “Gráficos”  selecionar o tipo de gráfico pretendido (barras, circular – e se se pretende
frequências absolutas ou relativas – ou histograma)  continuar

Exemplo (supermercado.sav)

Relativamente à variável vendas, foram utilizados os quadros seguintes:

No ficheiro de resultados surgem as seguintes tabelas e gráficos:


venda diária
Porcentagem Porcentagem
Frequência Porcentagem válida acumulativa
Válido 10 2 8,3 8,3 8,3
11 2 8,3 8,3 16,7
12 1 4,2 4,2 20,8
14 3 12,5 12,5 33,3
15 3 12,5 12,5 45,8
16 2 8,3 8,3 54,2
17 2 8,3 8,3 62,5
18 1 4,2 4,2 66,7
19 1 4,2 4,2 70,8
20 1 4,2 4,2 75,0
22 1 4,2 4,2 79,2
23 1 4,2 4,2 83,3
26 1 4,2 4,2 87,5
27 1 4,2 4,2 91,7
28 1 4,2 4,2 95,8
33 1 4,2 4,2 100,0
Total 24 100,0 100,0

29
Estatísticas
venda diária
N Válido 24
Omisso 0
Média 17,63
Mediana 16,00
Modo 14a
Erro Desvio 6,114
Variância 37,375
Intervalo 23
Mínimo 10
Máximo 33
Percentis 25 14,00
50 16,00
75 21,50
a. Há vários modos. O menor valor é
mostrado

Existe um menu específico para a construção de gráficos, permitindo uma abordagem mais detalhada.

Menu: Gráficos  Caixa de diálogo legadas  Selecionar o tipo de gráfico que se pretende analisar, em
particular:

* Gráfico de barras  Simples e Resumo de grupos de casos  Colocar a variável que se quer estudar em
“Eixo de categoria” e selecionar a “Representação de barras” pretendida (ex.: frequência absolutas, relativas,
acumuladas, …)

* Caixa de bigodes ou Boxplot  Simples e Resumos para variáveis separadas  Em “Representação de


caixas” colocar a variável a estudar

*Histograma  Selecionar a variável que se pretende estudar

Exemplo (supermercado.sav)

Ainda sobre a variável vendas,


foi obtida a caixa de bigodes ao
lado.
De notar que esta variável
apresenta um outlier
(observação representada no
gráfico através do círculo .)
O número 21 significa que o
outlier se encontra na posição
21 da base de dados.)

Nota complementar:
A edição de título, legendas, eixos, cor, entre outras, podem ser feitas no editor de gráficos. Para isso, basta
clicar no ficheiro de dados, clicar duas vezes em cima do gráfico e abrirá uma janela com variadas opções.

30
1.6.7. Análise estatística bivariada
Por vezes surge a necessidade de estudar uma variável de forma mais pormenorizada, subdividindo os dados
tendo em conta um determinado fator, ou cruzar a informação dada por duas variáveis.
No exemplo do supermercado, podemos querer estudar as vendas tendo em conta a localização da loja (Norte
ou Centro) ou tendo em conta a localização do produto na prateleira (posição 1, 2 ou 3).

Devemos iniciar com uma tabela cruzada para entender melhor a distribuição dos dados
Menu: Analisar  Estatística descritiva  Tabela de referência cruzada
Caixa Linhas: selecionar uma variável
Caixa coluna: selecionar a outra variável
Para construir os gráficos selecionar:
“Exibir gráfico de barras agrupadas”
“Células”  Contagens (selecionar observado); Percentagens (selecionar pelo menos o total)

Exemplo (supermercado.sav)
Se se pretender analisar as vendas, tendo em conta a localização da loja, obtemos os quadros:

Com os resultados seguintes:

Tabulação cruzada venda diária * localização da loja


localização da loja
Norte Centro Total
venda diária 10 Contagem 1 1 2
% do Total 4,2% 4,2% 8,3%
11 Contagem 2 0 2
% do Total 8,3% 0,0% 8,3%
12 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
14 Contagem 1 2 3
% do Total 4,2% 8,3% 12,5%
15 Contagem 2 1 3
% do Total 8,3% 4,2% 12,5%

31
16 Contagem 1 1 2
% do Total 4,2% 4,2% 8,3%
17 Contagem 0 2 2
% do Total 0,0% 8,3% 8,3%
18 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
19 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
20 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
22 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
23 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
26 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
27 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
28 Contagem 1 0 1
% do Total 4,2% 0,0% 4,2%
33 Contagem 0 1 1
% do Total 0,0% 4,2% 4,2%
Total Contagem 12 12 24
% do Total 50,0% 50,0% 100,0%

Também é possível obter as estatísticas descritivas.

Analisar  Estatística descritiva  Explorar


Caixa Lista de Variáveis Dependentes: colocar a variável a estudar
Caixa Lista de fatores: colocar a variável pela qual queremos subdividir a amostra
Caixa Exibir: selecionar Ambos (se queremos estatísticas descritivas e gráficos)
Botão “Estatísticas”  selecionar Descritivas (surgirão as mais usuais)
Botão “Gráficos”  selecionar pelo menos o Diagrama em caixa (agrupar níveis de fatores)

32
Exemplo (supermercado.sav)
Se se pretender analisar as vendas, tendo em conta a localização da loja, surgem os seguintes quadros:

Obtemos os seguintes resultados:

localização da loja Estatística


venda Norte Média 17,25
diária 95% de Intervalo de Limite 13,42
Confiança para inferior
Média Limite 21,08
superior
5% da média aparada 17,06
Mediana 15,50
Variância 36,386
Erro Padrão 6,032
Mínimo 10
Máximo 28
Amplitude 18
Amplitude interquartil 10
Assimetria ,714
Curtose -,525
Centro Média 18,00
95% de Intervalo de Limite 13,91
Confiança para inferior
Média Limite 22,09
superior
5% da média aparada 17,61
Mediana 16,50
Variância 41,455
Erro Padrão 6,439
Mínimo 10
Máximo 33
Amplitude 23
Amplitude interquartil 8
Assimetria 1,253
Curtose 1,560

33
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.

1. Qual é a vantagem de usar o SPSS sobre o cálculo de estatísticas manualmente?


(A) Permite fazer cálculos mais rápidos com bases de dados de dimensões maiores
(B) Diminui a possibilidade de cometer erros de cálculos
(C) Permite ao utilizador aprender uma capacidade transferível para softwares similares
(D) Todas as opções anteriores
(E) Nenhuma das restantes opções

2. No SPSS, o que é "Visualização dos dados"?


(A) Uma tabela, resumindo as frequências de dados para uma variável
(B) Uma folha, na qual os dados podem ser inseridos
(C) Uma caixa de diálogo que permite escolher um teste estatístico
(D) Uma tela na qual as variáveis podem ser definidas e rotuladas
(E) Nenhuma das anteriores

3. Quando é utilizada a operação "Recodificar em variáveis diferentes” …


(A) Substituímos os dados ausentes por alguns valores aleatórios
(B) Invertemos a posição da variável independente e dependente num gráfico
(C) Redistribuímos uma gama de valores num novo conjunto de categorias e criamos uma nova
variável
(D) Representamos os dados na forma de um gráfico circular
(E) Redistribuímos uma gama de valores num novo conjunto de categorias mantendo a mesma
variável

4. (*). Duzentos alunos foram inquiridos sobre quantas horas passam por dia no
Horas Número
computador. A tabela seguinte traduz essa informação. A média e o desvio
de alunos
padrão são, respetivamente: 3 30
(A) 4,85 e 1,198 4 50
(B) 4,85 e 1,435 5 60
(C) 5 e 1,198
6 40
(D) 5 e 1,435
7 20
(E) 40 e 1,234

5. (*). Considere a tabela com o número de dias no hospital após uma cirurgia; referentes a 50 pacientes.
Qual das seguintes afirmações é verdadeira?
Nº dias 2 3 4 5 6 7
(A) O tempo médio de estadia é superior para o
género feminino. Feminino 0 3 6 8 4 1
(B) A mediana é igual para ambos os géneros. Masculino 2 3 6 8 3 6
(C) A amplitude é 5 para ambos os géneros.
(D) A variância para o género feminino é superior ao do género masculino.
(E) Não existe nenhum outlier quando é estudada a distribuição de dias no hospital agrupada
por género.
(*). Poderá construir a base de dados no SPSS para facilitar os cálculos.

👉 Soluções: 1.D | 2.B | 3.C | 4.A | 5.B


34
São necessários mais exercícios?

📖 A. Hall, C. Neves & A. Pereira (2011) Grande Maratona de Estatística no SPSS.


Lisboa: Escola Editora.

A. Pereira (2004), Guia Prático de utilização do SPSS Análise de dados para


ciências Sociais e Psicologia

A. Afonso e C. Nunes (2019) Probabilidades e estatística – Aplicações e soluções


em SPSS. Universidade de Évora.
http://rdpc.uevora.pt/bitstream/10174/25959/3/ProbabilidadesEstatistica2019
.pdf

🔌 Introdução ao https://www.youtube.com/watch?v=9pRpDy7Z8Lo
SPSS

Recodificar https://www.youtube.com/watch?v=53S6gpM3PHE&t=364s
variáveis
https://www.youtube.com/watch?v=l12KKfjXXGs

Calcular uma https://www.youtube.com/watch?v=WQcA25bPK2g


nova variável

Análise https://www.youtube.com/watch?v=eRIv7qxqY0M
univariada

Análise https://www.youtube.com/watch?v=NfHiHP_QPy0
bivariada
https://www.youtube.com/watch?v=4Y_OC2vP0vA

35
Ficha de trabalho nº1
1. Classifique cada uma das seguintes variáveis:
1.1. Nº de clientes que entram por dia numa loja de roupa;
1.2. Cor favorita;
1.3. Profissão desejada;
1.4. Velocidade do carro em km/h;
1.5. Temperatura ambiente;
1.6. Número de irmãos;
1.7. Nível cultural dos habitantes de uma região;
1.8. Temperaturas registadas por dia num posto de meteorologia.

2. Considere as seguintes observações, representando o número de pessoas por família.


Nº de Pessoas/Família 1 2 3 4 5 6 7
Frequência observada 324 673 967 542 423 324 56
2.1. Quantas famílias foram observadas?
2.2. Quantos habitantes foram observados?
2.3. Apresente uma tabela de frequências, incluindo frequências absolutas e relativas.
2.4. Apresente o gráfico de barras das frequências relativas e o gráfico de barras das frequências relativas.

3. Considere os dados apresentados no gráfico abaixo relativos ao número de reuniões realizadas pelos
clientes de uma empresa de marketing. Complete:
3.1. Variável em estudo: _________________________________
3.2. ______% de clientes
tiveram menos do que 4 25 23 23
reuniões.
20
frequência absoluta

3.3. 74% dos clientes tiveram


mais do que _______
reuniões. 15
12
3.4. 75% dos clientes tiveram
10 8
menos do que ______ 7
6 6
reuniões.
5 4 4
3
3.5. A empresa tem _____
clientes e realizou um
0
total de ____ reuniões. 1 2 3 4 5 6 7 8 9 10

nº de reuniões

36
4. O seguinte quadro estatístico refere-se ao número clientes numa loja de telemóveis por dia.
Nº de clientes Frequência Frequência Frequência Frequência
absoluta acumulada relativa relativa
acumulada
0 8
1 0,15
2 20
3 0,9
4 4
4.1. Qual a variável em estudo? Classifique-a.
4.2. Complete a tabela.
4.3. Apresente as medidas de tendência central.
4.4. Apresente o desvio padrão e a amplitude interquartil. Apresente a caixa de bigodes.

5. O responsável pela gestão hospitalar de uma unidade de cuidados Dias de internamento Nº de doentes
médicos intensivos, obteve a seguinte distribuição referente ao [0; 10[ 48
tempo de internamento dos doentes daquela unidade: [10; 20[ 33
5.1. Qual a variável em estudo? Classifique-a. [20; 30[ 27
[30; 40[ 18
5.2. Apresente a tabela de frequências absolutas e relativas.
[40; 50[ 15
5.3. Determine o número médio de dias de internamento. [50; 60[ 9
Total 150
5.4. Encontre a classe mediana e a classe modal.
5.5. Construa o histograma de frequências absolutas.

6. Considere o seguinte histograma de frequências relativas, referente à distribuição das pensões de 1000
reformados dentro do regime de Segurança Social.
Indique, justificando:
6.1. O número de reformados cuja
pensão é inferior a 26 dezenas de
euros, mas superior ou igual a 18
dezenas de euros.
6.2. A percentagem de reformados
cuja pensão é superior ou igual a
200 euros.
6.3. A percentagem de reformados
cuja pensão é de pelo menos 18
dezenas de euros.
6.4. O número de inválidos cuja pensão é inferior a 160 euros.
6.5. Construa o polígono de frequências correspondente ao histograma.

37
7. Admita que se realizou um inquérito a um grupo de compradores de 30 carros novos para determinar
quantas reparações ou substituições de peças foram feitas durante o primeiro ano de utilização dos carros,
tendo-se obtido os seguintes resultados:
1 5 2 1 2 1 2 2 1 3
3 4 1 3 2 4 0 3 1 2
7 1 1 4 0 2 3 1 3 2
7.1. Qual a variável em estudo? Classifique-a.
7.2. Apresente os dados numa tabela de distribuição de frequência. Apresente o respetivo gráfico de
barras respeitante às frequências relativas.
7.3. Calcule o número de compradores que realizaram no máximo 3 reparações ou substituições de peças
durante o primeiro ano de utilização do carro.
7.4. Indique o número de compradores que realizaram mais do que 5 reparações ou substituições de
peças durante o primeiro ano de utilização do carro.
7.5. Qual a percentagem de compradores que realizaram um número de reparações ou substituições de
peças inferior a 4.

8. Ao longo do ano de 2008, o número de empréstimos diários que o balcão de Maçores fez, numa amostra
de 40 dias escolhidos aleatoriamente, está registado na tabela que se segue:
7 6 9 9 10 5 3 1 5 0
2 7 10 11 3 5 9 10 5 3
0 4 11 10 7 8 9 9 10 8
7 8 6 9 8 6 3 5 2 5
8.1. Classifique a variável em estudo;
8.2. Apresente os dados numa tabela, apenas com frequências absolutas, sem agrupar os dados em
classes;
8.3. Calcule a média, a mediana e os quartis;
8.4. Calcule o desvio padrão e o intervalo interquartil;
8.5. Sabendo que numa amostra do balcão de Aceira se obteve uma média de 5 e variância de 6, indique
justificando em qual dos balcões a dispersão em torno da média desta variável é maior.

9. Registou-se os tempos de atraso de 200


voos, em minutos, durante o Verão de 2009
no Aeroporto XYZ. Deste estudo resultou o
polígono de frequências relativas
apresentado ao lado.
9.1. Construa a tabela de frequências.
9.2. Qual o número de voos realizados no
aeroporto XYZ cujo tempo de atraso
foi superior a 20 minutos e inferior a
40 minutos?
9.3. Determine a média, variância e desvio padrão da variável em estudo.

38
10. Os dados seguintes dizem respeito às cotações de 40 títulos da bolsa de valores de Novaterra (em
unidades monetárias):
174 178 175 168 161 156 174 189 170 172
168 174 181 176 176 171 171 183 186 173
177 172 173 178 161 188 181 169 164 172
171 168 170 163 171 167 170 163 172 167
10.1. Organize os dados em classes de igual amplitude.
10.2. Construa o histograma e o polígono de frequências referentes às frequências relativas ordinárias e
acumuladas.

11. Uma turma (A) com 30 alunos tem a Matemática uma classificação média de 11 valores. Uma outra turma
(B) com 25 alunos tem, na mesma disciplina, uma média de 13 valores. Dois alunos da turma A com notas
de 7 e 8 valores, trocaram com outros dois alunos da turma B com classificações de 13 e 17 valores. Nestas
condições qual passou a ser a classificação média em cada turma na disciplina de Matemática?

12. Calcule a mediana da seguinte amostra: 4, 4, 5, X, 5, 4, 4, onde X é um valor desconhecido. Justifique a sua
resposta.

13. Numa empresa, a distribuição dos salários é dada pela seguinte tabela:
Salário Nº de funcionários
100 150
500 15
1000 5
3000 1
13.1. Qual a variável em estudo? Classifique-a.
13.2. Calcule as medidas de tendência central.
13.3. Apresente a caixa de bigodes.
13.4. Calcule as medidas de dispersão.
13.5. Está numa negociação sindical. Que medida(s) de tendência central que usaria para negociar se
fosse o diretor da empresa? E se fosse o representante sindical? Justifique.

14. Perguntou-se o salário, em euros, aos operários de duas fábricas, tendo-se obtido os seguintes valores:
Fábrica A Fábrica B
700 900 800 750 1000 1050 800 750 950 700 850 800 900
Determine a média e o desvio padrão dos salários dos operários de cada uma das fábricas. Em qual das
fábricas é maior a dispersão dos salários dos operários? Justifique.

39
15. Uma concessionária de automóveis, com 20 trabalhadores, num determinado mês registou a seguinte
informação:
Anos na Número de Género
Idade Salário (em €)
empresa vendas
34 5 1100 10 Masculino
26 1 650 3 Feminino
35 10 1450 8 Masculino
43 4 1100 7 Feminino
27 3 800 15 Masculino
38 8 1300 11 Feminino
26 2 650 5 Masculino
37 5 1250 7 Feminino
24 3 700 10 Masculino
45 13 1700 13 Feminino
31 7 1200 6 Masculino
36 4 950 17 Feminino
25 3 1050 10 Masculino
32 8 1300 9 Feminino
24 2 700 4 Masculino
29 9 1300 5 Feminino
36 8 1250 12 Masculino
32 5 1150 6 Feminino
44 13 1700 7 Masculino
35 6 1200 18 Feminino
15.1. Construa a base de dados no SPSS, codificando 1=masculino e 2=feminino.

15.2. Sobre o número de carros vendidos no mês em questão:


15.2.1. Apresente uma tabela de frequências
15.2.2. Apresente graficamente as frequências relativas e frequências relativas acumuladas.
15.2.3. Determine as medidas de tendência central da variável em estudo.
15.2.4. Determine o percentil 30, os respetivos quartis, desvio-padrão e variância.
15.2.5. Apresente o gráfico da caixa de bigodes.

15.3. Sobre a variável salário:


15.3.1. Apresente as medidas de localização e de dispersão.
15.3.2. Apresente um histograma.
15.3.3. Recodifique a variável salário numa nova variável “salário_classes”, apresentando os
seguintes intervalos: [600; 900[ [900; 1200[ [1200; 1500[ [1500;1800[
15.3.4. Contrua um novo histograma com a variável salário_classes

15.4. Construa uma nova variável ”bónus salarial”, usando a seguinte fórmula:
Bónus_salarial = salário + 200 * anos na empresa

15.5. Cruze a variável salário, tendo em conta o fator género:


15.5.1. Apresente a tabela de referência cruzada com as percentagens totais.
15.5.2. Apresente o gráfico de barras agrupadas.
15.5.3. Apresente as medidas descritivas mais usuais. Comente os resultados obtidos.
15.5.4. Apresente a caixa de bigodes. Comente os resultados.

15.6. Selecione as mulheres da empresa.


15.6.1. Apresente gráfico de barras das frequências absolutas relativo ao número de anos na
empresa.
15.6.2. Qual a percentagem de mulheres que vende pelo menos 10 carros?

40
16. Foi elaborado um inquérito a 42 jovens. Os resultados encontram-se no ficheiro inquerito.sav.
16.1. Apresente a tabela de frequências para as variáveis Sexo e Cor.
16.2. Cruze as variáveis Sexo e Cor e determine:
16.2.1. o número de rapazes que responderam ao questionário
16.2.2. o número de meninas que responderam ao questionário
16.2.3. a percentagem total de homens e mulheres que gostam da cor azul
16.3. Para a variável Altura, determine:
16.3.1. A média e o desvio padrão.
16.3.2. os quartis e os percentis 10 e 90.
16.3.3. o valor máximo e valor mínimo.
16.3.4. Crie uma nova variável “altura em classes” que reescreva os dados nos seguintes intervalos:
[1,40; 1,50[, [1,50; 1,60[, [1,60; 1,70[ e [1,70; 1,80[
16.3.5. Apresente um histograma com esta nova variável.
16.3.6. Compare as alturas entre ambos os géneros.
𝑝𝑒𝑠𝑜
16.4. Crie uma nova variável, relativa ao índice de massa corporal: 𝐼𝑀𝐶 = 𝑎𝑙𝑡𝑢𝑟𝑎2, onde o peso tem de
ser medido em kg e a altura em metros.
16.5. Selecione apenas os homens desta amostra. Apresente a caixa de bigodes relativo ao peso.

17. O ficheiro empréstimo.sav diz respeito a dados de 100 clientes de um banco que fizeram um pedido de
empréstimo.
17.1. Relativamente à variável número de anos que está no mesmo emprego:
17.1.1. Apresente o gráfico de barras das frequências relativas. Qual o número de anos no mesmo
emprego mais frequente?
17.1.2. Apresente a tabela de frequências relativas e indique qual a percentagem de clientes que
continua no mesmo emprego há pelo menos 15 anos.
17.1.3. Apresente as medidas estatísticas mais usuais. Explique o significado das medidas de
tendência central.
17.1.4. Apresente a caixa de bigodes. Comente os resultados obtidos.
17.2. Relativamente à variável salário:
17.2.1. Apesente o histograma. Admita que o salário mínimo neste país é de 45 mil euros.
Apresente no histograma uma linha vertical com esse indicador e mude as barras para a
cor verde.
17.2.2. Apresente uma nova variável “salario_classes”, que apresenta os salários dos clientes
organizados pelos seguintes intervalos, em milhares de euros: 1=[10;50[, 2=[50;90[,
3=[90;130[ e 4=[130;190[. Na visualização da variável deve estar também codificada.
17.3. Relativamente à variável salário_classes, em função do incumprimento de empréstimos anteriores:
17.3.1. Apresente a tabela de referência cruzada e apresente a percentagem de clientes que tendo
um salário anual entre 50 e 90 milhares de euros, estiveram em incumprimento em
empréstimos anteriores.
17.3.2. Apresente o gráfico de barras agrupadas. Comente o gráfico obtido.
17.4. Crie uma nova variável “total de crédito”:
17.4.1. usando a seguinte expressão: Total de crédito=cartão de crédito + outros créditos
17.4.2. Apresente as medidas estatísticas mais usuais, tendo como fator de análise o
incumprimento de empréstimos anteriores. Comente os resultados.
17.5. Selecione apenas os clientes que têm licenciatura. Qual o valor médio do rácio entre o valor em
dívida e o salário ganho?

41
2. Probabilidades
_______________________________

2.1. Introdução
A noção de probabilidade é difícil de definir, caso não se usem conceitos matemáticos. A palavra probabilidade
deriva do Latim probare (provar ou testar). Assim, de forma genérica podemos identificar a “probabilidade de
um acontecimento” como o processo usado para medir o “grau de convicção” na sua realização.

Podemos classificar os acontecimentos em dois tipos: determinísticos ou aleatórios. O objetivo da Estatística


é analisar fenómenos aleatórios de modo a sistematizar o estudo de característica de interesse.

2.2. Conceitos fundamentais


Uma experiência aleatória designa uma experiência que pode ter diferentes resultados, mesmo quando é
repetida em circunstâncias análogas, ou seja, os resultados da experiência não são conhecidos
antecipadamente.

Define-se como espaço amostral ou espaço de resultados o conjunto de todos os resultados possíveis de
uma experiência aleatória. O espaço amostral é habitualmente representado por Ω ou U.

Exemplos
Considere a experiência aleatória lançamento de um dado e observar a face que fica voltada para cima. O
espaço amostral é Ω = {1, 2, 3, 4, 5, 6}.

2.2.1. Acontecimentos
Um acontecimento é um subconjunto do espaço de resultados. Um acontecimento pode ser classificado
como:

 Acontecimento elementar, quando contém apenas um resultado possível;


 Acontecimento composto, quando contém mais do que um resultado;
 Acontecimento certo, quando contém todos os elementos de um espaço amostral;
 Acontecimento impossível, quando não contém nenhum elemento do espaço amostral
(simbolicamente representamos por { } ou ∅ ).

Exemplo

42
Considere a experiência aleatória lançamento de um dado e observar a face que fica voltada para cima.
Temos por exemplo, os seguintes acontecimentos:

a) A: sair face menor que 2  A={1} , acontecimento simples


b) B: sair face maior do que 3  B={4, 5, 6}, acontecimento composto
c) C: sair face menor do que 1  C={ } , acontecimento impossível
d) D: sair face maior do 0  D={1, 2, 3, 4, 5, 6}= Ω, acontecimento certo

2.2.1. Relações entre acontecimentos


Considerem-se A e B dois acontecimentos. Podemos definir as seguintes operações:

Operação Representação em Diagrama de Venn

reunião de dois eventos, 𝑨 ∪ 𝑩


conjunto constituído por todos os elementos de A ou de B ou
de ambos

Interseção de dois eventos, 𝑨 ∩ 𝑩


conjunto constituído pelos elementos comuns de A e de B

̅ (ou Ac)
complementar do evento A, 𝑨
conjunto constituído pelos elementos do espaço amostral
que não pertencem a A

A exceto B, 𝑨\𝑩 (ou A-B)

conjunto constituído pelos elementos de A que não pertence


simultaneamente a B

A e B são incompatíveis ou mutuamente exclusivos

se 𝐴 ∩ 𝐵 = ∅ A B
A e B são contrários

se 𝐴 ∩ 𝐵 = ∅ e 𝐴 ∪ 𝐵 = ∅

Os acontecimentos satisfazem um conjunto de propriedades, das quais se destacam:

43
 Dupla negação: 𝐴̅ = 𝐴

 Distributiva: (𝐴 ∪ 𝐵) ∩ 𝐶 = (𝐴 ∩ 𝐶) ∪ (𝐵 ∩ 𝐶) e (𝐴 ∩ 𝐵) ∪ 𝐶 = (𝐴 ∪ 𝐶) ∩ (𝐵 ∪ 𝐶)

 Leis de Morgan: ̅̅̅̅̅̅̅̅


𝐴 ∩ 𝐵 = 𝐴̅ ∪ 𝐵̅ e ̅̅̅̅̅̅̅
𝐴 ∪ 𝐵 = 𝐴̅ ∩ 𝐵̅

Exemplo

Houve um sorteio de um prémio para o departamento de informática, que é composto por 10 funcionários.
A cada trabalhador foi atribuído um papel com um número (de 1 a 10). Todos os funcionários colocaram o
seu número num saco opaco.

O espaço amostral é composto por: Ω ={1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

Considere os acontecimentos:

A: sair um número par  A={2, 4, 6, 8, 10}

B: sair um número ímpar  B={1, 3, 5, 7, 9}

C: sair um número múltiplo de três  C={3, 6, 9}

D: sair um número superior a 10  D={ } (acontecimento impossível)

E: sair um número menor do que 11  E = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}= Ω (acontecimento certo)

Podemos fazer, por exemplo, fazer as seguintes operações:

a) 𝐴 ∪ 𝐵 = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} = Ω
b) 𝐴 ∩ 𝐵 = ∅, pelo que A e B são acontecimentos contrários
c) 𝐴 ∪ 𝐶 = {2, 3, 4, 6, 8, 9, 10}
d) 𝐴 ∩ 𝐶 = {6}
e) 𝐵 ∪ 𝐷 = 𝐵
f) 𝐵∩𝐷 ={}
g) 𝐵 ∪ 𝐸 = 𝐸 = Ω
h) 𝐵 ∩ 𝐸 = 𝐵
i) 𝐴̅ = {1, 3, 5, 7, 9}
j) 𝐶̅ = {1, 2, 4, 5, 7, 8, 10}
k) 𝐷̅=Ω
l) 𝐸̅ = ∅
m) 𝐴\𝐵 = ∅
n) 𝐵\𝐶 = {1, 5, 7}

44
2.3. Probabilidade
Existem diferentes conceitos de probabilidade. A formalização mais antiga é o conceito clássico.

Define-se probabilidade do acontecimento A à razão entre o número de resultados favoráveis à ocorrência


de A e o número de resultados possíveis da experiência aleatória.
𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠
𝑃(𝐴) =
𝑛º 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠

Exemplo

Considere-se uma agência bancária. Supondo que o crédito é atribuído aleatoriamente e que pelo histórico,
em 200 clientes, 140 conseguem crédito bancário. O Valério entra nessa agência bancária. A probabilidade do
Valério conseguir aprovação de um crédito é:
140
𝑃(𝑡𝑒𝑟 𝑐𝑟é𝑑𝑖𝑡𝑜) = = 0,7
200

Posteriormente surgiu o conceito frequencista que ultrapassa certas limitações do conceito clássico,
nomeadamente a restrição de o número de experiências a realizar serem finitas no conceito clássico.

Atualmente considera-se uma definição axiomática de probabilidade que permite trabalhar em qualquer
universo e que ultrapassa as limitações dos anteriores conceitos.

Propriedades das probabilidades

1) 0 ≤ 𝑃(𝐴) ≤ 1
2) 𝑃(Ω) = 1
3) 𝑃(∅) = 0
4) 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
5) Se A e B forem acontecimentos mutuamente exclusivos, então 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
6) 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)

7) 𝑃(𝐴̿) = 𝑃(𝐴)

8) 𝑃(𝐴̅) = 1 − 𝑃(𝐴)
̅̅̅̅̅̅̅
9) 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴̅ ∩ 𝐵̅)
̅̅̅̅̅̅̅
10) 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴̅ ∪ 𝐵̅)
11) 𝑃(𝐴\𝐵) = 𝑃(𝐴 ∩ 𝐵̅) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵)

45
Exemplo 1
Numa caixa há 40 peças, onde 10 das quais são pintadas à mão e as restantes ainda não têm cor.
Um operário extrai ao acaso uma peça. Qual a probabilidade de:
a) Sair uma peça pintada à mão?
10 1
Seja o acontecimento A: sair peça pintada à mão. Então 𝑃(𝐴) = 40 = 4
b) Sair uma peça sem cor?
10 3
𝑃(𝐴̅) = 1 − 𝑃(𝐴) = 1 − =
40 4

Exemplo 2
Duas lojas aceitam pagamento em dinheiro ou com cartões de débito. Na última semana, o histórico dos
pagamentos está definido na tabela ao lado. Considere os seguintes acontecimentos:
Loja Norte Loja Sul
A: pagamento efetuado na loja Norte
Pagamento a dinheiro 35 45
B: pagamento com dinheiro Pagamento com cartão de débito 50 70

Qual a probabilidade de, escolhendo um cliente ao acaso,


35+50 85 17
a) Ter efetuado o pagamento na loja Norte? 𝑃(𝐴) = = =
200 200 40
50+70 120 3
b) Ter efetuado o pagamento com cartão de débito? 𝑃(𝐵̅) = = =
200 200 5
35 7
c) Ter efetuado o pagamento na loja Norte com dinheiro? 𝑃(𝐴 ∩ 𝐵) = 200 = 40

Exemplo 3
Questionou-se um conjunto de 350 pessoas sobre os seus hábitos de leitura. Destas, 160 responderam que
gostam de ler romances, 130 policiais e 40 gostam de ambos os géneros literários.
Se definirmos R para as pessoas que leem romance e P para as pessoas
que leem policiais, podemos definir o seguinte diagrama de Venn para
representar a informação.
Escolhendo uma pessoa ao acaso, qual a probabilidade de:
160 16
a) Ler romances? 𝑃(𝑅) = 350 = 35
90 9
b) Ler apenas policiais? 𝑃(𝑎𝑝𝑒𝑛𝑎𝑠 𝑝𝑜𝑙𝑖𝑐𝑖𝑎𝑖𝑠) = 𝑃(𝑃\𝑅) = 350 = 35
120+40+90 5
c) Ler ambos os géneros? 𝑃(𝑅 ∪ 𝑃) = 350
=7
100 2
̅̅̅̅̅̅̅
d) Não ler qualquer livro? 𝑃(𝑅 ∪ 𝑃) = 350 = 7

46
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.

6. Num café estão 20 pessoas. Sabendo que 8 são mulheres, indique a probabilidade de ao escolher uma
das pessoas ao acaso, escolhermos um homem?
(A) 60%
(B) 0.4
(C) 12%
(D) 12
(E) 0.06

7. Uma caixa contém 10 bolas, 3 das quais são vermelhas, 2 são amarelas e 5 são azuis. Cinco bolas são
retiradas ao acaso, com reposição. Qual a probabilidade de no máximo 1 bola seja vermelha?
(A) 0.3601
(B) 0.5
(C) 0.5282
(D) 0.8369
(E) 0.3452

8. Uma caixa contém oito bombons, três dos quais são de laranja. Uma outra caixa contém cinco bombons,
dois dos quais são de laranja. Tira-se um bombom da primeira caixa e, em seguida, um bombom da
segunda caixa. A probabilidade de que apenas um seja de laranja é:
(A) 5/13
(B) 9/40
(C) 19/40
(D) 1/4
(E) 2/3

9. Sendo A e B acontecimentos do espaço amostral Ω tais que 𝐴 ∪ 𝐵 = Ω. Se 𝑃(𝐴̅ ) = 0.3 e 𝑃(𝐵) = 0.4,
então o valor de 𝑃(𝐴 ∩ 𝐵) é:
(A) 0
(B) 0.1
(C) 0.2
(D) 0.3
(E) Nenhuma das restantes opções

10. Uma empresa de cofres atribui ao acaso um código secreto a cada cofre que comercializa. Cada código
secreto é formado por quatro algarismos por uma ordem sequencial. Escolhendo-se um cofre ao acaso,
qual é a probabilidade de o código ter exatamente três zeros?
(A) 0.0004
(B) 0.0027
(C) 0.0036
(D) 0.004
(E) 0.1234

47
11. No lançamento de um dado viciado, a probabilidade de obtermos um nº par é o triplo da probabilidade
de obter um número ímpar. A probabilidade de sair ímpar é:
(A) 0.25
(B) 0.75
(C) 0.5
(D) 3
(E) 0.4

12. Numa empresa de 28 funcionários, 9 só praticam natação, 12 praticam apenas futebol e os restantes
praticam as duas modalidades. Escolhido um funcionário ao acaso, a probabilidade de:
(A) praticar natação é 4/7
(B) praticar natação é 9/28
(C) praticar futebol é 12/28
(D) não praticar natação é 19/28
(E) Nenhuma das restantes opções

13. Foi consultado um certo número de pessoas sobre as emissoras de TV que habitualmente assistem.
Obteve-se o resultado seguinte: 300 pessoas assistem ao canal A, 270 pessoas assistem ao canal B, das
quais 150 assistem a ambos os canais A e B e 80 assistem a outros canais distintos de A e B. O número
de pessoas entrevistadas foi:
(A) 800
(B) 720
(C) 570
(D) 500
(E) 1000

14. Num saco estão bolas azuis e vermelhas, num total de 50 bolas. Sabendo que a probabilidade de tirar
bola azul é 0,34 podemos concluir que o número de bolas vermelhas é:
(A) 16
(B) 33
(C) 25
(D) 17
(E) 20

15. Sabendo que 𝑃(𝐴 ∪ 𝐵) = 0.6 e 𝑃(𝐴 ∪ 𝐵̅ ) = 0.9, então 𝑃(𝐴) é:


(A) 0.1
(B) 0.2
(C) 0.3
(D) 0.4
(E) 0.5

16. A Sara construiu um dado desequilibrado em que a probabilidade de sair face ímpar é 6 vezes mais do
que a probabilidade de sair face par. Ao lançar uma vez o dado, a Sara apostou com o Paulo de que
sairia face par. Qual a probabilidade do Paulo ganhar a aposta?

48
(A) 1/5
(B) 3/4
(C) 1/3
(D) 6/7
(E) 5/6

17. Foi realizado um inquérito a um conjunto de clientes de uma marca desportiva sobre a modalidade
desportiva que seguiam na TV. Das respostas obtidas, obteve-se a seguinte informação:
 28% dos inquiridos viam ginástica
 29% dos inquiridos viam basebol
 19% dos inquiridos viam futebol
 14% dos inquiridos viam ginástica e basebol
 12% dos inquiridos viam basebol e futebol
 10% dos inquiridos viam ginástica e futebol
 8% dos inquiridos viam os três desportos.
Calcule a percentagem de inquiridos que não viam nenhum dos três desportos.
(A) 24%
(B) 36%
(C) 41%
(D) 42%
(E) 52%

18. Num saco existem 15 cartões: 8 desses cartões são azuis e numerados de 1 a 8; os restantes 7 cartões são
vermelhos e numerados de 1 a 7. Retirou-se um cartão ao acaso. Qual a probabilidade de ser um cartão
azul ou ter um número par?
(A) 8/15
(B) 7/15
(C) 12/15
(D) 11/15
(E) 9/15

19. Um saco contém 7 bolas verdes e 8 brancas. Se duas bolas são retiradas sucessivamente e sem
reposição, a probabilidade de ambas serem da mesma cor é:
(A) 8/15
(B) 10/21
(C) 11/21
(D) 15/21
(E) 7/15

20. A Lídia e o Miguel resolveram lançar uma moeda para decidir quem ia pagar o café. Embora não o
soubessem, a moeda estava desequilibrada, pois a face ocorre 4 vezes mais frequentemente que a
coroa. Sabendo que se sair face a Lídia terá que pagar o café, qual a probabilidade de ser o Miguel a
pagar?

49
(A) 1/5
(B) 3/4
(C) 1/3
(D) 6/7
(E) 5/6

21. Com base no histórico de corridas de três galgos, sabe-se que o galgo 1 tem o dobro de vitórias do
galgo 2 e o galgo 3 tem um terço das vitórias do galgo 2. Numa nova corrida com os três galgos, qual
a probabilidade de ser o galgo 3 a ganhar?
(A) 6/10
(B) 1/3
(C) 2
(D) 3/10
(E) 1/10

👉 Soluções: 1.A | 2.C | 3.C | 4.B | 5.C | 6.A | 7.A | 8.D | 9.B| 10.E | 11.D. | 12.E | 13.D |14. E | 15.A |16. E

São necessários mais exercícios?

📖 F. Mahaluça e A. Vilanculos (2019). Coletânea de exercícios resolvidos de


estatística.
https://www.researchgate.net/publication/339352708_Colectanea_de_Exercicio
s_Resolvidos_de_Estatistica

🔌 Definição clássica https://www.youtube.com/watch?v=pWpr53Lis3c


de probabilidade

Propriedades das https://www.youtube.com/watch?v=VsUsq_wSfrY


probabilidades

Diagrama de Venn https://www.youtube.com/watch?v=0fqEHgFVgCg

50
2.4. Probabilidade condicionada
A probabilidade de um acontecimento A condicionado à ocorrência de um acontecimento B, e escreve-se
P(A|B), é definida por
𝑃(𝐴∩𝐵)
𝑃(𝐴|𝐵) = 𝑃(𝐵)
, com 𝑃(𝐵) ≠ 0

Geralmente lê-se “probabilidade de A dado B” ou “probabilidade de A sabendo que ocorreu B”.

Exemplo

Da população jovem dos 16 aos 21 anos, que não frequentam o ensino superior, sabe-se que 13% estão
desempregados, 21% abandonaram a escola e 5% abandonaram a escola e estão desempregados. Qual a
probabilidade de um indivíduo estar desempregado, dado que abandonou a escola?

Considere-se os acontecimentos:
 D: estar desempregado
 A: abandonar a escola
Do texto podemos retirar a seguinte informação: 𝑃(𝐷) = 0.13, 𝑃(𝐴) = 0.21 e 𝑃(𝐷 ∩ 𝐴) = 0.05.
𝑃(𝐷∩𝐴) 0.05
Assim, 𝑃(𝐷|𝐴) = 𝑃(𝐴)
= 0.21 ≅ 0.24

2.5. Acontecimentos independentes


Os acontecimentos A e B são independentes, quando a ocorrência de um não afeta a probabilidade de
ocorrência do outro, isto é, 𝑃(𝐴|𝐵) = 𝑃(𝐴) e 𝑃(𝐵|𝐴) = 𝑃(𝐵) .

Em consequência, podemos dizer que


A e B são independentes se e só se 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) × 𝑃(𝐵).

Exemplo
Considere uma vila que tem 200 000 habitantes. A campanha publicitária na TV para um produto atingiu
50 000 habitantes; a campanha publicitária na rádio para o mesmo produto atingiu 30 000 habitantes; e ambas
as campanhas publicitárias conseguiram atingir 10 000 habitantes. Será que as campanhas publicitárias são
independentes?

Considerem-se os acontecimentos:
T: ser influenciado pela campanha publicitária na TV
R: ser influenciado pela campanha publicitária na rádio
50 000 1 30 000 3 10 000 1 1 3 3
𝑃(𝑇) = 200 000 = 4; 𝑃(𝑅) = 200 000 = 20; 𝑃(𝑇 ∩ 𝑅) = 200 000 = 20; 𝑃(𝑇) × 𝑃(𝑅) = 4 × 20 = 80

Como 𝑃(𝑇 ∩ 𝑅) ≠ 𝑃(𝑇) × 𝑃(𝑅), então podemos afirmar que as campanhas publicitárias não são
independentes.

51
O Teorema de Bayes surge como uma generalização, face à realização de determinando acontecimento A que
se supõe interferir na realização de Bn:
𝑃(𝐴|𝐵𝑛 )𝑃(𝐵𝑛 )
𝑃(𝐵𝑛 |𝐴) = 𝑛
∑𝑖=1 𝑃(𝐴|𝐵𝑖 )𝑃(𝐵𝑖 )

O diagrama em árvore pode ajudar a sintetizar informação que envolve probabilidades condicionadas.

Exemplo
Numa empresa de transportes, a probabilidade de que um camião tenha um acidente é igual a 0.1. Quando
há um acidente, a probabilidade de se perder a carga é 0.95. Por outro lado, se não houver um acidente, a
probabilidade de se perder a carga é de 0.04.

Considerem-se os acontecimentos: 0.95

A: ter acidente
C: perder a carga
0.1 0.05
Esta informação pode ser representada num diagrama em árvore.
a) Qual a probabilidade de um camião perder a carga?
𝑃(𝐶) = 𝑃(𝐴 ∩ 𝐶) + 𝑃(𝐴̅ ∩ 𝐶) = 0.04
0.9
𝑃(𝐴). 𝑃(𝐶|𝐴) + 𝑃(𝐴̅). 𝑃(𝐶|𝐴̅) =
= 0.1 × 0.95 + 0.9 × 0.04 = 0,131
0.96

b) Qual a probabilidade de um camião não ter tido um acidente e não perdeu a carga?
𝑃(𝐴̅ ∩ 𝐶̅ ) = 0.9 × 0.96 = 0.864

c) Se um camião perdeu a carga, qual é a probabilidade de ter sido devido a um acidente?


𝑃(𝐴 ∩ 𝐶) 𝑃(𝐴). 𝑃(𝐶|𝐴) 0,1 × 0,95
𝑃(𝐴|𝐶) = = = ≅ 0,725
𝑃(𝐶) 𝑃(𝐶) 0,131

52
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
1. A tabela seguinte dá informação das preferências, por género, do tipo de formato para guardar/ouvir
música.
CD MP3 Vinil
Feminino 146 106 48
Masculino 146 64 40
Relativamente aos acontecimentos “ser do género masculino” e “preferir vinil”, podemos afirmar:
(A) Os eventos são mutuamente exclusivos e independentes.
(B) Os eventos não são mutuamente exclusivos, mas são independentes.
(C) Os eventos são mutuamente exclusivos, mas não são independentes.
(D) Os eventos não são mutuamente exclusivos, nem independentes.
(E) Não é possível tirar qualquer conclusão.

2. No lançamento de um dado com as faces numeradas de 1 a 6, considere os acontecimentos:


A - “sair face 6”;
B - “Sair face com número múltiplo de 3”;
C - “sair face com número par”;
D -”sair número ímpar”.
Qual a afirmação verdadeira?
(A) B e C são acontecimentos complementares.
(B) A e C são acontecimentos incompatíveis.
(C) C e D são acontecimentos complementares
(D) A e B são acontecimentos incompatíveis.
(E) A e C são acontecimentos independentes.

3. Observou-se que 5/8 dos funcionários de uma empresa usavam jeans, 1/4 usavam t-shirt e, dos que
usavam t-shirt, metade usavam jeans. Escolheu-se aleatoriamente um funcionário da empresa. Qual a
probabilidade de ele não trazer jeans nem t-shirt?
(A) 1/2
(B) 1/3
(C) 1/4
(D) 3/4
(E) 1/5

4. Se P(A)=0.38 e P(B)=0.61, e A e B são acontecimento independentes, então P(AUB) é:


(A) 0.2318
(B) 0.99
(C) 0.7582
(D) 0.234
(E) nenhuma das restantes opções

53
5. Seja A um acontecimento possível e não certo. O valor de 𝑃(𝐴|𝐴̅) é:
A) 0
B) 1
C) P(A)
D) 1 - P(A)
E) Nenhuma das restantes opções.

6. Numa escola:
 36% dos alunos têm TV por fibra;
 dos alunos que têm TV por fibra, 22% também têm Internet móvel;
 30% dos alunos têm Internet móvel.
Escolhida um aluno ao acaso, qual a probabilidade desse estudante ter ambos os serviços (TV por fibra e
Internet móvel)?
(A) 0.06125
(B) 0.0660
(C) 0.0792
(D) 0.08125
(E) 0.0847

7. Sejam A, B e C eventos tais que P(A)=0.2, P(B)=0.1 e P(C)=0.3. Os eventos A e B são independentes, os
eventos B e C são independentes, e os eventos A e C são mutualmente exclusivos. Calcule P(A U B U C).
(A) 0.496
(B) 0.540
(C) 0.550
(D) 0.600
(E) 0.618

8. Use o diagrama de Venn para calcular P(A|B).


(A) 1/2
(B) 1/4
(C) 1/8
(D) 1/5
(E) 2/5

9. O Roberto está com febre e o médico suspeita que seja febre tifoide. Para ter certeza, o médico deseja
realizar o teste. O resultado do teste é positivo, quando o paciente realmente apresenta febre tifoide, em
80% das vezes. O teste é positivo quando o paciente não apresenta febre tifoide em 10% das vezes. Se
1% da população tem febre tifoide, qual é a probabilidade de que o Roberto tenha febre tifoide, desde
que tenha testado positivo?

54
(A) 12%
(B) 7%
(C) 25%
(D) 31.5%
(E) 10%

10. As forças armadas dos EUA testam seus recrutas quanto ao HIV quando são recrutados. Eles são
testados em três rodadas do teste Elisa (um teste de HIV) antes de serem considerados positivos. Pelo
histórico, sabe-se que a probabilidade de alguém ter HIV é 0,00148. A verdadeira taxa positiva (dar
positivo, sabendo que tem a doença) para Elisa é de 93% e a verdadeira taxa negativa (dar teste
negativo, sabendo que não tem a doença) é de 99%. Qual é a probabilidade de um recruta ter HIV, dado
que deu positivo no primeiro teste Elisa?
(A) 14%
(B) 80%
(C) 42%
(D) 12%
(E) 35%

11. Uma companhia de seguros distribui os seus assegurados por três classes, A, B e C, consoante o menor
ou maior risco que lhe atribui. Em dezembro, tinha 35000, 50000 e 15000 segurados nas classes A, B e
C, respetivamente. A probabilidade dos segurados de cada classe sofrerem um ou mais acidentes no
próximo ano é de 0.01, 0.04 e 0.15, respetivamente. Qual das seguintes afirmações é falsa?
(A) Sabendo que o cliente é da classe C, a probabilidade de ele ter pelo menos um acidente no próximo
ano é de 0.15.
(B) A probabilidade de um segurado ter pelo menos um acidente no próximo ano é de 0.046.
(C) A probabilidade de um segurado ser da classe C e ter pelo menos um acidente é de 0.0225
(D) A probabilidade de um segurado não ter acidentes no próximo ano é de 0.954.
(E) A probabilidade de um segurado ser da classe C ou ter pelo menos um acidente no próximo ano é
de 0.35.

12. Uma seguradora reuniu a seguinte informação sobre a sua carteira de clientes:
(i) Todos os clientes têm pelo menos um seguro (existem um grande conjunto de seguros associados
a esta seguradora).
(ii) 70% dos clientes fizeram um seguro a um carro.
(iii) 20% dos clientes fizeram um seguro de acidentes pessoal.
(iv) Dos clientes que seguram um carro, 15% fizeram um seguro de acidentes pessoal.
Calcule a probabilidade de que um cliente selecionado aleatoriamente, não tenha nem seguro de carro,
nem seguro de acidentes pessoal.
(A) 0.125
(B) 0.205
(C) 0.24
(D) 0.245
(E) 0.31

55
13. Considere os eventos:
V= extrair uma carta vermelha de um baralho de cartas
O=extrair um ouro de um baralho de cartas
Qual das afirmações abaixo é verdadeira?

(A) os acontecimentos são incompatíveis


(B) os acontecimentos são contrários
(C) os acontecimentos são independentes
(D) P(V U O)=1
(E) todas as restantes alíneas são falsas

14. Sejam A, B e C eventos tais que P(A)=0.2, P(B)=0.1 e P(C)=0.3. Os eventos A e B são independentes, os
eventos B e C são independentes, e os eventos A e C são mutualmente exclusivos. Calcule P(A U B U C).
(A) 0.496
(B) 0.540
(C) 0.550
(D) 0.600
(E) 0.618

👉 Soluções: 1.D | 2.C | 3.C | 4.C | 5.A | 6.C | 7.C | 8.E | 9.B | 10.D | 11.E. | 12.B | 13.E |14.C

São necessários mais exercícios?

📖 A. Afonso e C. Nunes (2019) Probabilidades e estatística – Aplicações e soluções


em SPSS. Universidade de Évora.
http://rdpc.uevora.pt/bitstream/10174/25959/3/ProbabilidadesEstatistica2019.
pdf

F. Mahaluça e A. Vilanculos (2019). Coletânea de exercícios resolvidos de


estatística.
https://www.researchgate.net/publication/339352708_Colectanea_de_Exercicio
s_Resolvidos_de_Estatistica

🔌 Teorema de Bayes https://www.youtube.com/watch?v=ASXUpzy7KCA


e probabilidade
condicionada

Diagrama em https://www.youtube.com/watch?v=1TDOLFVrX9o
árvore

56
Ficha de trabalho nº2
1. Para verificar a predisposição de um conjunto de pessoas a aderir a um novo tarifário de telemóvel, fez-
se um inquérito cujos resultados estão registados na tabela seguinte:
1.1. Indique o número de pessoas que responderam ao inquérito.
1.2. Quantas pessoas pensam aderir ao novo tarifário?
1.3. Determine a probabilidade de, escolhendo uma Sexo
pessoa ao acaso: F M
1.3.1. não pensar em aderir ao novo tarifário. Pensa mudar para este Sim 90 100
1.3.2. ser um homem que pensa aderir ao tarifário. novo tarifário? Não 60 30
1.3.3. ser uma mulher que não pensa aderir ao tarifário.

2. Num curso superior, perguntou-se quantos alunos tinham computador em casa e de que tipo: 70% dos
alunos afirmaram que têm computador em casa, 40% dos quais têm computador portátil e 30% têm os
dois (portátil e fixo). Escolhido um aluno ao acaso, calcule a probabilidade de:
2.1. Ter pelo menos um dos tipos de computadores.
2.2. Não ter computador.
2.3. Ter um e um só computador.

3. Numa pesquisa de mercado, verificou-se que 2000 pessoas utilizam os produtos A ou B. O produto B é
utilizado por 800 pessoas e 320 pessoas utilizam os dois produtos simultaneamente. Quantas pessoas
utilizam o produto A?

4. Numa empresa de desportos ao ar livre com 1260 clientes registados, constatou-se que 500 inscreviam-
se em atividades relacionadas com caminhadas, 420 inscreviam-se em atividades aquáticas e 180
inscreviam-se em ambos os tipos de atividades. Determine o número de clientes que:
4.1. Apenas praticam atividades relacionadas com caminhadas.
4.2. Apenas praticam caminhadas ou atividades aquáticas, e não ambas.
4.3. Não se tem inscrito em nenhuma atividade.

5. Num saco foram introduzidas algumas bolas numeradas. Sabe-se que algumas dessas bolas são azuis.
Retirou-se, ao acaso, uma bola e tem-se que:
 A probabilidade de essa bola ser azul é 0.5;
 A probabilidade de essa bola ter o número seis é 0.2;
 A probabilidade de essa bola ser azul ou ter o número seis é 0.6.
Mostre que a bola azul com o número seis está entre as bolas que estão no saco.

6. No frigorífico tínhamos iogurtes da mesma marca e de três sabores: morango, ananás e banana. A
probabilidade de tirar ao acaso um iogurte de morango é 1/5, de tirar um iogurte de banana é 1/3.
Sabendo que há 14 iogurtes de ananás, determine quantos iogurtes há ao todo no frigorífico.

57
7. Na extração ao acaso de uma carta de um baralho incompleto sabe-se que:
 A probabilidade de essa carta ser de espadas é 25%;
 A probabilidade de essa carta ser um ás é 5%;
 A probabilidade de essa carta ser de espadas ou ser um ás é 30%.
Extraindo uma carta do baralho, prove que não foi o ás de espadas a carta retirada.

8. Calcule 𝑃(𝐴 ∩ 𝐶), sabendo que A, B e C são acontecimentos tais que:


 𝐴∪𝐵∪𝐶 = Ω
 𝐴∩𝐵 = 𝐵∩𝐶 = ∅
 𝑃(𝐴) = 0.3, 𝑃(𝐵̅) = 0.7 e 𝑃(𝐶) = 0.5

9. Uma cidade com 50.000 habitantes possui apenas 3 jornais Nº de pessoas Compram o(s) jornal(ais)
diários, A, B e C. Uma investigação mostrou as compras
20000 A
diárias de cada jornal. Qual a probabilidade de que um
16000 B
habitante, escolhido ao acaso, compre:
10000 C
9.1. Somente C.
12000 AeB
9.2. A\B.
3000 BeC
9.3. Nenhum dos jornais.
7000 AeC
1000 A, B e C

10. Sendo 𝑃(𝐴) = 0.5 e 𝑃(𝐴 ∪ 𝐵) = 0.7, determine a probabilidade de ocorrência de B, quando:
10.1. A e B são mutuamente exclusivos;
10.2. A e B são acontecimentos independentes;

11. Sejam A e B dois acontecimentos associados a uma experiência aleatória. Seja 𝑃(𝐴 ∪ 𝐵) = 0.9,
𝑃(𝐵) = 0.6 e 𝑃(𝐴|𝐵) = 0.5. Verifique se os acontecimentos são independentes.

12. Sejam A e B dois acontecimentos, tais que 𝑃(𝐴) = 0.3 e 𝑃(𝐴 ∪ 𝐵) = 0.5
12.1. Se A e B forem mutuamente exclusivos, determine P(B).
12.2. Se 𝑃(𝐴|𝐵) = 0.4, determine P(B).

13. Seja 𝑃(𝐴) = 0.6, 𝑃(𝐴 ∩ 𝐵̅) = 0,55 e 𝑃(𝐴̅ ∩ 𝐵̅) = 0,2.
13.1. Determine a probabilidade de B.
13.2. Os acontecimentos A e B são independentes? Justifique.

14. Uma escola tem 100 alunos dos quais 55 estudam Estatística e 75 estudam Biologia, sendo que 35
alunos estudam ambas as disciplinas. Tendo-se escolhido um aluno ao acaso:
14.1. Qual a probabilidade de estudar Estatística ou Biologia?
14.2. Qual a probabilidade de não estudar nenhuma das duas disciplinas?
14.3. Se esse aluno estudar Estatística, qual a probabilidade de também estudar Biologia?

58
15. Uma empresa de embalagens tem duas máquinas a funcionar. A máquina A produz 60% do total das
embalagens. No entanto, 6% das embalagens produzidas pela máquina A têm defeito enquanto que a
máquina B produz apenas 3% com defeito.
15.1. Qual a probabilidade de escolhida uma embalagem ao acaso, ela ter defeito?
15.2. Qual a probabilidade de escolhida uma embalagem com defeito, ela ter sido produzida pela
máquina A?

16. Uma fábrica possui três máquinas que produzem o mesmo tipo de peças. A máquina 1, que produz 40%
das peças, produz 5% de peças defeituosas. A máquina 2, que produz 35% das peças, produz 10% de
peças defeituosas. A máquina 3 produz 15% de peças não defeituosas. Determine:
16.1. a percentagem total de peças defeituosas produzidas em tal fábrica.
16.2. a probabilidade de ser uma peça defeituosa, sabendo que foi fabricada pela máquina 1.
16.3. a probabilidade de uma peça defeituosa e ter sido fabricada pela máquina 1.

17. Uma companhia de seguros classifica alguns dos seus segurados de alto risco. Estudos da companhia
indicam que dos segurados de alto risco, 30% estarão envolvidos em algum acidente no próximo ano.
Sabe-se ainda que, dos seus segurados, 15% estarão envolvidos no próximo ano em algum acidente e
80% não são classificados de alto risco.
17.1. Determine a probabilidade de um segurado da companhia se envolver num acidente no próximo
ano e ser um segurado classificado de alto risco.
17.2. Qual a percentagem de segurados da companhia que pertencem ao grupo classificado de alto
risco ou estarão envolvidos em algum acidente no próximo ano.
17.3. Mostre que, de entre os segurados que estarão envolvidos no próximo ano em algum acidente,
40% pertencem ao grupo classificado de alto risco.

18. Um estudo feito a uma certa marca de iogurtes revelou que se um iogurte está dentro do prazo de
validade, a probabilidade de estar estragado é 0.005. Se um iogurte está fora do prazo de validade, a
probabilidade de estar estragado é 0.65. Considere que, num certo dia, uma mercearia tem dez iogurtes
dessa marca, dos quais dois estão fora do prazo. Escolhendo, ao acaso, um desses dez iogurtes, qual a
probabilidade de ele estar estragado?

19. Uma empresa está equipada com um sistema de alarme. A probabilidade de ocorrer um assalto é 0.1. Se
ocorrer um assalto, a probabilidade de o alarme funcionar é 0.95. A probabilidade do alarme funcionar e
não ter ocorrido um assalto é 0.03. Calcule:
19.1. A probabilidade de o alarme funcionar.
19.2. A probabilidade de que, não tendo funcionado o alarme, tenha ocorrido um assalto.

20. A e B são os dois únicos fornecedores de um artigo a uma empresa transformadora que o armazena num
contentor. Sabe-se que 5% dos artigos de A e 9% dos artigos de B são defeituosos, razão pela qual a
empresa compra quatro vezes mais à fornecedora A do que à fornecedora B.
20.1. Foi escolhido ao acaso um dos artigos do contentor. Qual a probabilidade de ser defeituoso?
20.2. Verificou-se que o artigo é defeituoso. Qual é a probabilidade de ter sido fornecido por A?

59
21. O Nuno vai ao Japão para tentar vender um produto. No entanto a reunião com os clientes foi agendada
em cima da hora, pelo que, a probabilidade de ele chegar a tempo é 0.6. Os japoneses gostam de
pontualidade assim, a probabilidade do Nuno conseguir vender o produto se não chegar atrasado é 0.8
mas, se chegar atrasado é apenas 0.4.
21.1. Calcule a probabilidade do Nuno conseguir vender o produto.
21.2. Sabendo-se que o Nuno conseguiu vender o produto indique a probabilidade de não ter chegado
atrasado.
21.3. Os acontecimentos “O Nuno vender o produto” e “O Nuno chegar atrasado” são dois
acontecimentos independentes?

👉 Soluções
1. 280 190 9/28; 5/14; 3/14 11. Não

2. 0.7 0.3 0.4 12. 0.2 1/3

3. 1520 13. 0.25 Não

4. 320 560 520 14. 0.95 0.05 0.64

5. acontecimento possível 15. 0.048 0.75 0.6574

6. 30 16. 26,75% 0.05 0.0748

7. acontecimento impossível 17. 0.06 0.29 0.40

8. 0.1 18. 0.134

9. 0.02 0.16 0.5 19. 0.125 0.0057

10. 0.2 0.4 20. 0.058 0.6897

21. 0.64 0.75 Não

60
3. Variáveis aleatórias
_______________________________

3.1. Noção de variável aleatória


Uma variável aleatória X, geralmente abreviada como v.a., é uma função que associa um número real 𝑥 a
cada resultado do espaço amostral de uma experiência aleatória.

Exemplos de variáveis aleatórias:


 Número de lâmpadas, numa amostra de 30 lâmpadas, que fundem antes de 10000 horas de uso;
 Número de acidentes num troço de uma autoestrada;
 Peso da bagagem dos 100 passageiros de um voo;
 Tempo entre avarias de uma máquina em funcionamento.

As variáveis aleatórias podem classificar-se como:

 Variáveis aleatórias discretas, onde assumem um número finito ou numerável de valores;


 Variáveis aleatórias contínuas, onde assume valores de um intervalo ou de uma coleção de intervalos.

Neste capítulo, a enfase será dada às v.a. discretas.

3.2. Caracterização e propriedades de variáveis aleatórias discretas

3.2.1. Função de probabilidade


Consideremos X uma variável aleatória discreta.
A função de probabilidade de X é uma função 𝒇 que associa a cada valor possível 𝑥 da v.a. X a sua
probabilidade

𝑓(𝑥) = 𝑃(𝑋 = 𝑥).

A função de probabilidade tem as seguintes propriedades:

(i) 𝑓(𝑥) ≥ 0 (não negatividade)


(ii) ∑∀𝑥 𝑓(𝑥) = 1

61
Exemplo (Lançamento de duas moedas)

Cada moeda tem uma face (F) e uma coroa(C).


Considere-se a v.a. X: número de coroas, no lançamento de duas moedas ao ar.
Temos quatro situações distintas que podem acontecer: FF, FC, CF e CC.
Assim, X pode assumir os valores: 0 (FF), 1 (FC e CF) e 2 (CC).
1 2 1 1
Logo, 𝑓(0) = 𝑃(𝑋 = 0) = 4; 𝑓(1) = 𝑃(𝑋 = 1) = 4 = 2; e 𝑓(2) = 𝑃(𝑋 = 2) = 4.

1
4
, 𝑥=0
1
, 𝑥=1
A função de probabilidade é 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 2
1
𝑥=2
4
,
{ 0, 𝑜. 𝑣.
Graficamente pode ser representada da seguinte forma: f(x)

Como é possível observar, 𝑓 satisfaz as propriedades de uma função de


probabilidade pois:

(i) 𝑓(0) ≥ 0; 𝑓(1) ≥ 0 𝑒 𝑓(2) ≥ 0


(ii) 𝑓(0) + 𝑓(1) + 𝑓(2) = 1

Exemplo (Peças defeituosas)

Uma caixa contém 5 parafusos defeituosos (D) e 5 não defeituosos. Extraem-se 2 parafusos sem reposição.
Considere X: número de peças defeituosas extraídas.
X pode assumir os valores 0 (𝐷 𝐷), 1 (𝐷 𝐷 𝑒 D 𝐷) e 2 (𝐷𝐷).

5 4 2 5 5 5 5 4 2
𝑓(0) = 𝑃(𝑋 = 0) = 10 × 9 = 9; 𝑓(1) = 𝑃(𝑋 = 1) = 10 × 9 × 2 = 9; e 𝑓(2) = 𝑃(𝑋 = 2) = 10 × 9 = 9

A função de probabilidade também pode ser representada numa tabela:


𝑥 0 1 2
𝑓(𝑥) 2 5 2
9 9 9

A função probabilidade pode ser representada como:

62
3.2.1. Função de distribuição
Consideremos X uma variável aleatória discreta.
A função de distribuição (acumulada) de 𝑿 é uma função 𝑭(𝒙) que fornece a probabilidade de 𝑋 assumir
valores menores ou iguais a 𝒙, isto é,

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥).

A função de probabilidade tem as seguintes propriedades:

(i) 𝐹 é uma função com descontinuidades em escada


(ii) 𝐹 é não decrescente, isto é, se 𝑥 ≤ 𝑦 então 𝐹(𝑥) ≤ 𝐹(𝑦)
(iii) 𝐹(−∞) = 0 e 𝐹(+∞) = 1

Exemplo (Lançamento de duas moedas – cont.)

Para cada valor de 𝑥, 𝐹 fornece o somatório das probabilidades até ao valor de 𝑋 = 𝑥 (inclusive).

A função de distribuição é definida como:

0, 𝑥<0
1
4
, 0≤𝑥<1
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 3 A sua representação gráfica é:
,
1≤𝑥<2
4
{1, 𝑥≥2

É possível observar que a função é definida no intervalo ] − ∞; +∞[, sempre em escada e não decrescente.
Os patamares são fechados à esquerda (exceto no −∞) e abertos à direita.

Exemplo (Peças defeituosas – cont.)

A função de distribuição é definida como:

0, 𝑥<0
2
, 0≤𝑥<1
9
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 7 A representação gráfica é:
, 1≤𝑥<2
9
{1, 𝑥≥2

63
3.3. Parâmetros associados às variáveis aleatórias discretas
Para cada variável aleatória pode-se definir parâmetros estatísticos que a caracterizam quanto à sua
localização ou dispersão. Nesta seção vamos centrar a atenção na média, variância e desvio padrão.

Tal como definido no capítulo 1, a média é um parâmetro de localização que nos dá ideia da tendência
central da distribuição. Se X é uma v.a. discreta, a média ou valor esperado pode ser calculado como

𝜇 = 𝐸[𝑋] = ∑ 𝑥𝑓(𝑥)
∀𝑥

A variância é a medida de dispersão que se baseia no quadrado da distância de cada valor da variável à sua
média. Assim, a variância é definida como

𝜎 2 = 𝑉𝑎𝑟[𝑋] = ∑(𝑥 − 𝜇)2 𝑓(𝑥)


∀𝑥

Como se sabe, o desvio padrão é calculado como 𝜎 = √𝑉𝑎𝑟[𝑋]

Exemplo (Lançamento de duas moedas – cont.)


1 1 1
 Média: 𝜇 = 𝐸[𝑋] = ∑∀𝑥 𝑥𝑓(𝑥) = 0 × + 1 × + 2 × = 1
4 2 4

1 1 1
 Variância: 𝜎 2 = 𝑉𝑎𝑟[𝑋] = ∑∀𝑥(𝑥 − 𝜇)2 𝑓(𝑥) = (0 − 1)2 × + (1 − 1)2 × + (2 − 1)2 × = 0.5
4 2 4

 Desvio padrão: 𝜎 = √0.5 ≈ 0.71

Exemplo

O controlo de qualidade de uma empresa de fabrico de pneus constatou que o número de pneus feitos por
dia, com defeito, é uma variável aleatória X, com a seguinte função de probabilidade:

𝑥 2 3 4 5 o.v.
𝑃(𝑋 = 𝑥) 0.48 0.36 0.12 0.04 0

a) A probabilidade de haver, num dia, pelo menos 3 pneus com defeito é:


𝑃(𝑋 ≥ 3) = 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5) = 0.36 + 0.12 + 0.04 = 0.52

64
b) Sabendo que a empresa apresentou mais de 2 pneus com defeito num dia, a probabilidade de ter
menos de 4 pneus com defeito é:
𝑃(𝑋 < 4 ∧ 𝑋 > 2) 𝑃(𝑋 = 3) 0.36
𝑃(𝑋 < 4 | 𝑋 > 2) = = = ≈ 0.69
𝑃(𝑋 > 2) 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5) 0.36 + 0.12 + 0.04

0, 𝑥<2
0.48, 2 ≤ 𝑥 < 3
c) A função de distribuição é definida como: 𝐹(𝑥) = 0.84, 3 ≤ 𝑥 < 4
0.96, 3 ≤ 𝑥 < 4
{ 1, 𝑥≥4

d) O número esperado de pneus com defeito é


𝜇 = 𝐸[𝑋] = 2 × 0.48 + 3 × 0.36 + 4 × 0.12 + 5 × 0.04 = 2.72

Exemplo

Seja X uma variável aleatória discreta com a seguinte função de probabilidade


𝑥 𝑚−1 𝑚 𝑚+3 𝑚+5 o.v.
𝑘+1 𝑘 𝑘−1 𝑘 0
𝑓(𝑥)
8 8 8 8
1
Determine k e m de modo que 𝐸(𝑋) = 4.

Dado que se trata de uma função de probabilidade, então a soma de todas as probabilidades tem de ser
igual a 1. Assim,
𝑘+1 𝑘 𝑘−1 𝑘
+ + + = 1 ⟺ 𝑘 + 1 + 𝑘 + 𝑘 − 1 + 𝑘 = 8 ⟺ 4𝑘 = 8 ⇔ 𝑘 = 2
8 8 8 8
Assim, a tabela pode ser reescrita como:

𝑥 𝑚−1 𝑚 𝑚+3 𝑚+5 o.v.


𝑓(𝑥) 3/8 2/8 1/8 2/8 0

1
Como 𝐸(𝑋) = 4, então

3 2 1 2 1
(𝑚 − 1) × + 𝑚 × + (𝑚 + 3) × + (𝑚 + 5) × = ⇔
8 8 8 8 4

⇔ 3𝑚 − 3 + 2𝑚 + 𝑚 + 3 + 2𝑚 + 10 = 2 ⇔

⇔ 𝑚 = −1

65
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.

1. O número de erros de impressão em folhetos de publicidade está descrito na seguinte tabela.


Número de erros 0 1 2 3 4 5 o.v.
Probabilidade 0,05 0,12 0,35 0,32 2m 2m 0
Admitindo que se trata de uma função de probabilidade, qual o valor de m?
(A) 0,08
(B) 0,04
(C) 0,02
(D) 0,01
(E) Nenhumas das outras opções

2. Seja X uma v.a. que representa o número de defeitos existentes em 100 metros de um cabo elétrico e
cuja função de probabilidade é:
x 0 1 2 3 4 5 o.v.
f(x) 0,10 0,35 0,25 0,15 0,10 0,05 0
Sabendo que nos 100 metros de cabo temos menos de 3 defeitos, determine a probabilidade de o
número de defeitos ser superior a 1.
(A) 0,3571
(B) 0,9091
(C) 0,3478
(D) 0,1176
(E) 1

3. Uma variável aleatória X tem a seguinte distribuição de probabilidade:


X 0 1 2 3 o.v.
P(X) 2k 3k 13k 2k 0
Onde k é uma constante positiva. A probabilidade P(X <2) é:
(A) 0.90
(B) 0.25
(C) 0.65
(D) 0.15
(E) 1

4. Uma pesquisa de mercado compilou informação sobre o número de computadores pessoais que há em
cada casa. Considere “X=número de computadores em cada casa” uma variável aleatória, que tem a
seguinte distribuição:
X 0 1 2 3 4 5 o.v.
P(X) 0.24 0.37 0.20 0.11 a 0.03 0

66
Considere a um número real. Qual a probabilidade de que uma casa escolhida ao acaso tenha pelo menos
2 computadores pessoais?
(A) 0.19
(B) 0.20
(C) 0.29
(D) 0.39
(E) 0.61

5. O número de dias de estadia num hotel, X, é uma variável discreta com função de probabilidade
6−𝑥
𝑓(𝑥) = 𝑃[𝑋 = 𝑥] = { 15 , 𝑥 = 1,2,3,4,5
0, 𝑜𝑢𝑡𝑟𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
Determine o número médio de dias que é expectável que cada cliente fique no hotel.
(A) 1
(B) 7/3
(C) 1/15
(D) 1/5
(E) 3

6. Considere X uma variável aleatória discreta com função de probabilidade dada por:
𝑥
𝑠𝑒 𝑥 = 1, 2, 3
10
𝑓(𝑥) = 4
𝑠𝑒 𝑥 = 12
10
{ 0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
Das alíneas abaixo, só uma é correta. Assinale-a.
(A) 𝑃(𝑋 = 3) = 0,03
(B) 𝑃(𝑋 = 3) + 𝑃(𝑋 = −1) = 0,4
(C) P(X ≥ 12) = 0
(D) O valor médio é 3,74
(E) Nenhum dos casos anteriores.

7. Considere a função de distribuição acumulada de uma v.a. discreta X.


0, 𝑥< 1
1/4, 1 ≤ 𝑥 < 2
𝐹(𝑥) = {
3/4, 2 ≤ 𝑥 < 3
1, 𝑥≥3
Qual das afirmações é falsa?
(A) 𝑃(𝑋 ≥ 2) = 3/4
(B) 𝑃(𝑋 ≤ 1) = 1/4
(C) 𝑃(𝑋 < 1) = 1/4
(D) 𝑃(𝑋 ≤ 5) = 1
(E) 𝑃(𝑋 ≥ 0) = 1

67
8. Dos gráficos seguintes, qual pode representar uma função distribuição F(x) de uma v.a. discreta:

(A) (i)
(B) (ii)
(C) (iii)
(D) (iv)
(E) (v)

9. O número de vendas diárias de eletrodomésticos de uma determinada marca é uma v.a. X com
distribuição de probabilidade dada pela seguinte tabela:
x 0 1 2 3 4 5 o.v.
P(x) 0.10 0.28 0.18 0.11 0.16 0.17 0
O número esperado de vendas num dia e o respetivo desvio padrão são, aproximadamente:
(A) 2.46 e 3.76
(B) 2.46 e 1.46
(C) 2.46 e 2.75
(D) 0.17 e 1.46
(E) 0.17 e 2.75

👉 Soluções: 1.B | 2.A | 3.B | 4.D | 5.B | 6.E | 7.C | 8.A | 9.C
São necessários mais exercícios?

🔌 Definição de https://www.youtube.com/watch?v=33J3ODB_22w
variável aleatória

Função de https://www.youtube.com/watch?v=gxqFgxp0hCA&list=PLNG6I1
probabilidade M7eOuxtORJqqgIkUUbwuddrirb6

Função de https://www.youtube.com/watch?v=F9fXrpqCttI
distribuição
Valor esperado
Média e variância https://www.youtube.com/watch?v=PeKE-72pv7o

68
Ficha de trabalho nº3
1. Considere a variável aleatória X que representa a soma das pintas que ficam voltadas para cima quando
se lançam dois dados.
1.1. Defina esta variável aleatória e determine a sua função de probabilidade.
1.2. Qual a probabilidade da soma das pintas dos dados ser inferior ou igual a 5?

2. Determine o valor 𝑎 para qual a tabela 𝑥𝑖 1 2 5 8 o.v.


pode definir a função de probabilidade
de uma variável aleatória discreta. 𝑃(𝑋 = 𝑥𝑖 ) 𝑎 3𝑎 2𝑎 4𝑎 0

3. Um grupo de 6 homens e 4 mulheres são candidatos à eleição para uma comissão de 2 elementos e
todos têm as mesmas hipóteses.
3.1 Determine as funções de probabilidade e de distribuição acumulada para o número de mulheres
eleitas para a comissão.
3.2 Determine a probabilidade da comissão ter uma mulher, sabendo que não é constituída só por
mulheres.

4. Uma caixa contém 15 canetas: 5 pretas, 5 azuis, 2 verdes e 3 vermelhas. Extraem-se sucessivamente e
sem reposição três canetas da caixa. Seja X a variável que representa o número de canetas pretas
retiradas da caixa.
4.1. Defina as funções de probabilidade e de distribuição acumulada da variável X.
4.2. Calcule o valor das seguintes probabilidades:
𝑃(𝑋 < 2); 𝑃(𝑋 ≥ 1); 𝑃(𝑋 < 2|1 ≤ 𝑋 ≤ 3).
4.3. Repita a alínea 4.1 para o caso em que se retiram as três canetas com reposição.

5. Suponha que o número de vendas mensais num stand


x 0 1 2 3 4 o.v.
de automóveis é uma v.a. com função de P(X=x) 1/20 r s 1/3 1/4 0
probabilidade
5.1. Sabendo que em 75% dos meses são vendidos pelo menos 2 automóveis, mostre que r=1/5 e
s=1/6.
5.2. Obtenha a função de distribuição acumulada de X.
5.3. Nos meses em que há pelo menos duas vendas, qual a probabilidade de haver 3 vendas?

69
5.4. Calcule o valor de E(X) e de Var(X).
6. O número de vendas diárias de eletrodomésticos da marca Baratinho é dado pela seguinte distribuição
de probabilidade:
x 0 1 2 3 4 5 o.v.
f(x) 0,10 0,28 0,18 0,11 0,16 0,17 0
6.1. Calcule a probabilidade de vender menos de 4 eletrodomésticos num dia.
6.2. Calcule a probabilidade de vender pelo menos 4 eletrodomésticos, sabendo que já vendeu mais
de 2 eletrodomésticos.
6.3. Calcule o valor esperado e o desvio padrão.

7. Considere a seguinte função:

1
 x , x  4, 5, 10

f ( x)   0.1, x  2, 3
0.25, x  1

 0, O.V .
7.1. Prove que se trata de uma função de probabilidades.
7.2. Indique a função distribuição correspondente.
7.3. Indique a probabilidade de a variável tomar um valor superior a 2,5.
7.4. Determine o valor de E(X) e de Var(X).

8. Indique, justificando, o valor lógico de cada uma das seguintes afirmações:

𝑥3
,
𝑥 = 1,2,3
8.1. A função 𝑓, definida como 𝑓(𝑥) = { 28
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
define uma função de probabilidade.
8.2. Se X é uma variável aleatória com função distribuição acumulada F e F(2)=1 então, a probabilidade
de encontrar um valor de X superior a 2 é nula.

9. Considere a função de distribuição acumulada de uma v.a. discreta X.


0 𝑥< 1
1
𝐹(𝑥) = { 1≤𝑥<3
4
1 𝑥≥3
Calcule:
9.1. P(0≤X≤2)
9.2. P(X>3)

70
9.3. P(0<X<5)

10. Sabendo que a v.a. X tem


função distribuição acumulada
F(x) dada pelo gráfico abaixo:
10.1. Determine a função
de probabilidade f(x).
10.2. Calcule:
10.2.1. P(X > 1)
10.2.2. P(0 ≤ X ≤ 3)
10.2.3. P(0 ≤ X ≤ 6 | X >2)

👉 Soluções

1. 5/18 6. 0.67 0.75 2.46; 1.66

2. 0.1 7. 7.3. 0.65 7.4. 3.75; 6.49

3. 8/13 8. F V

4. 4.2. 138/182; 134/182; 90/134 9. 1/4 0 1

5. 5.3. 4/9 5.4. 38/15; 1,49 10. 10.2. 0.8; 0.2; 5/8

71
4. Distribuições teóricas
de probabilidade
______________________________

A partir da definição de função de probabilidade do capítulo anterior, podemos constatar que existe uma
infinidade de possíveis funções para modelar as variáveis aleatórias. Contudo, quando aplicamos a Estatística,
verificamos que muitos dos problemas apresentam as mesmas características, o que nos permite estabelecer
um modelo teórico para determinação da solução dos problemas. Tratam-se de modelos matemáticos
(distribuições) que se adaptam bem a um vasto conjunto de situações e que, simultaneamente, têm um
tratamento matemático simples.

Há dois tipos de distribuições teóricas que correspondem a diferentes tipos de dados ou variáveis aleatórias:

 Distribuições discretas, onde vamos estudar a distribuição binomial e de Poisson;


 Distribuições contínuas, cujo nosso foco será a distribuição normal.

4.1. Distribuição Binomial


Esta distribuição utiliza-se para descrever os valores resultantes da repetição, sob as mesmas condições, de
uma experiência aleatória com apenas dois resultados possíveis. Assim, a distribuição Binomial aparece
associada a experiências de Bernoulli.

4.1.1. Experiências de Bernoulli


Uma experiência de Bernoulli é uma experiência aleatória, com apenas dois resultados possíveis: um
acontecimento designado “sucesso” e o acontecimento contrário, designado “insucesso”.
Assim, denomina-se de:
 Probabilidade de sucesso: P(sucesso)=p
 Probabilidade de insucesso: P(insucesso)= q =1-p

Numa sucessão de experiências de Bernoulli, verificam-se as seguintes condições:


 Em cada experiência só há dois resultados, mutuamente exclusivos, denominados por sucesso e
insucesso;
 As probabilidades dos acontecimentos mantêm-se inalteradas de experiência para experiência;

72
 O resultado de cada experiência de Bernoulli é independente dos resultados das experiências
anteriores e das seguintes, isto é, o resultado obtido numa determinada experiência não afeta os
resultados das experiências subsequentes nem se deixa afetar pelas anteriores.
Exemplo
a) Considere-se o lançamento de uma moeda ao ar. Se o sucesso for considerado “sair face”, então:
P(sucesso) = P(sair face) = 1/2
P(insucesso) = P(não sair face)=1/2

b) Considere-se agora uma caixa com bolas numeradas de 1 a 10. Se o sucesso for o resultado “sair
número menor que 4”, então:
P(sucesso) = P(sair número menor do que 4) = 3/10
P(insucesso) = P(não sair número menor do que 4)=7/10

4.1.2. Caraterização da Distribuição Binomial


Uma variável aleatória X segue uma distribuição Binomial se contabiliza o número de sucessos (com
probabilidade p) que ocorrem em N experiências de Bernoulli. Escreve-se X ~ B (N; p).

𝑁
A função de probabilidade é: 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = ( ) 𝑝 𝑥 𝑞 𝑁−𝑥 , com 𝑥 = 0, 1 ,2 ,3, … 𝑒 0 < 𝑝 < 1.
𝑥

Nota:
𝑁 𝑁 𝑁!
( ) = 𝐶𝑥𝑁 e lê-se “Combinações de N, x a x”. O valor de ( ) = 𝐶𝑥𝑁 = , sendo que
𝑥 𝑥 𝑥!×(𝑁−𝑥)!

𝑁! = 𝑁 × (𝑁 − 1) × (𝑁 − 2) × … × 3 × 2 × 1.

Por exemplo, 5!=5x4x3x2x1=120.

A v.a. X ~ B (N; p) tem os seguintes parâmetros associados:

 Média: 𝜇 = 𝐸[𝑋] = 𝑁𝑝
 Variância: 𝜎 2 = 𝑉𝑎𝑟[𝑋] = 𝑁𝑝𝑞

Exemplo
Uma das componentes para ingressar num emprego é fazer um teste de escolha múltipla com 10 questões.
Cada questão tem 5 respostas alternativas, sendo que apenas uma é correta. Suponha que a Matilde não se
preparou para este teste e, portanto, irá responder ao acaso a todas as questões.
a) Nesta situação, qual a probabilidade da Matilde acertar:
a1) exatamente em 4 questões?

73
a2) no máximo em 2 questões?
a3) pelo menos em 8 questões?
b) Quantas perguntas se espera que a Matilde acerte?

Num teste de escolha múltipla temos apenas duas situações para cada resposta: ou acerta ou falha. Se cada
questão tem 5 alternativas, em que apenas uma delas está correta, então a probabilidade de acertar é:
P(sucesso)=P(acertar na resposta)=1/5=0.2
Assim, podemos definir a seguinte variável aleatória:
X: nº de questões, em 10, que a Matilde acerta. X ~ B(10; 0.2)

Respondendo às alíneas do exemplo…


10
a1) 𝑃(𝑋 = 4) = 𝐶4 × 0,24 × 0,86 = 0,0881

a2) 𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) =

= 10𝐶0 × 0,20 × 0,810 + 10𝐶1 × 0,21 × 0,89 + 10𝐶2 × 0,22 × 0,88 =


= 0,1074 + 0,2684 + 0,3020 = 0,6778

a3) 𝑃(𝑋 ≥ 8) = 𝑃(𝑋 = 8) + 𝑃(𝑋 = 9) + 𝑃(𝑋 = 10) = 0,0001 + 0,0000 + 0,0000 = 0,0001

1
b) 𝐸[𝑋] = 𝑁𝑝 = 10 × 5 = 2 Espera-se que a Matilde, respondendo ao acaso, acerte em 2 questões.

Nota complementar
Se tiver dúvidas como calcular as combinações na sua calculadora, veja estes links para as principais marcas:
 Calculadora científica não gráfica: https://www.youtube.com/watch?v=gFZIN-_PRIY

 Calculadora científica gráfica TI: https://aborrecido.ru/eletrnicos-de-consumo/calculadoras-grficas/ti-


84-calculadora-grfica/14036-permutaes-e-combinaes-e-a-ti-84-plus.html
 Calculadora científica gráfica Casio: https://www.youtube.com/watch?v=tedwdYZn5M8

Exemplo
Para o modelo de calculadora XYZ, o fabricante sabe que 5% das calculadoras irão falhar nos primeiros dias de
uso e serão devolvidas para reparação. Admita que uma loja comprou 15 calculadoras do modelo XYZ.
a) Qual a probabilidade de, no máximo, três falharem?
b) Qual a probabilidade de pelo menos 2 falharem?
c) A Clara comprou uma calculadora e falhou após os primeiros dias. Foi à loja e entregaram-lha outra
do mesmo lote. Se a primeira calculadora falhou, qual a probabilidade da segunda calculadora falhar?

74
d) Qual o número de calculadoras que se espera que sejam devolvidas? E se tivessem sido compradas 60
calculadoras?

Facilmente podemos perceber que existe uma dicotomia (a calculadora falha ou não falha). Assim,
considerando como “sucesso” a calculadora falhar, p=P(sucesso)=5%=0.05. Podemos então escrever a seguinte
v.a.:
X: nº de calculadoras, em 15, que irão falhar nos primeiros dias de uso.
X~ B (15; 0.05)

a) 𝑃(𝑋 ≤ 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = 0,4633 + 0,3658 + 0,1348 + 0,0307 =


= 0,9946

b) 𝑃(𝑋 ≥ 2) = 1 − ⌊𝑃(𝑋 = 0) + 𝑃(𝑋 = 1)⌋ = 1 − [0,4633 + 0,3658] = 0,1709

c) A probabilidade da segunda calculadora falhar é exatamente 0,05, pois o funcionamento de cada


calculadora é independente das restantes.

d) 𝐸[𝑋] = 15 × 0,05 = 0,75


Se tivessem sido adquiridas 60 calculadoras, o número esperado de devoluções seria
𝐸[𝑋] = 60 × 0,05 = 3 calculadoras.

4.1.3. Tabela da Distribuição Binomial


Apesar da distribuição Binomial ser largamente utilizadas pela sua adequabilidade a diversas situações, os
cálculos das probabilidades podem ser morosos. Desta forma, existem tabelas que auxiliam esses cálculos.

Como utilizar a tabela da Distribuição Binomial:


1) Encontrar, na primeira
coluna, o valor de n
correspondente ao número
de experiências N;

2) No valor de n encontrado,
escolher o valor de x
apropriado;

3) Depois de selecionar a linha que contém o n e x anteriores, selecionar a coluna com o valor de p
(probabilidade do sucesso discriminado na primeira linha).
Na interseção da linha com a coluna, encontramos a probabilidade da v.a. X tomar o valor x.

75
Exemplo
A probabilidade de ocorrência de turbulência num determinado percurso a ser feito por um avião é de 0,4
num circuito diário. Seja X o número de voos com turbulência num total de 7 desses voos. Determine a
probabilidade de não haver turbulência em nenhum dos 7 voos?

Seja X: número de voos com turbulência, em 7 voos.


X ~B (7; 0,4)
Como não queremos qualquer voo com turbulência, então
𝑃(𝑋 = 0) = 7𝐶0 × 0,40 × 0,67 = 0,0280

Ou recorrendo à tabela

76
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.

10. Qual das seguintes condições não se verifica na distribuição binomial?


(A) Todas as experiências são independentes
(B) Cada experiência só pode ser classificada como sucesso ou insucesso
(C) Os resultados das experiências dependem uns dos outros
(D) O número de sucessos nas experiências é contabilizado
(E) A probabilidade do sucesso mantém-se inalterada de experiência para experiência

11. Qual dessas variáveis é uma variável aleatória binomial?


(A) Tempo que um aluno selecionado aleatoriamente leva a concluir um exame de escolha múltipla
(B) Número de livros que um indivíduo selecionado aleatoriamente comprou num ano
(C) Número de CD que uma pessoa escolhida ao acaso possui em casa
(D) Tempo de espera para ser atendido pelo consultor financeiro de uma empresa
(E) Número de pessoas com mais de 1,70m de altura numa amostra de 10 pessoas

12. Numa dada região, 11% da população usa a Netflix. Num encontro de 20 pessoas, qual a probabilidade
de exatamente 2 pessoas usarem a Netflix?
(A) 0,316
(B) 0,001
(C) 0,282
(D) 0
(E) 0,245

13. Numa repartição pública verificou-se que 10% das guias preenchidas estão incorretas. Qual a
probabilidade de, em doze guias, haver pelo menos duas guias incorretas?
(A) 0,341
(B) 0,889
(C) 0,111
(D) 0,659
(E) Nenhuma das anteriores

14. Foi instituído um programa de crédito subsidiado para a aquisição da casa própria destinado a famílias
de baixo rendimento de uma certa região. Porém, nem todos os beneficiários desse tipo de financiamento
de facto pagam o que devem. Sabe-se que 8% dos beneficiários ficam em incumprimento. Selecionou-se
um conjunto de 15 créditos. Qual a probabilidade de no máximo 2 famílias não cumprirem as obrigações
de pagamento?
(A) 0,943
(B) 0,917
(C) 0,887
(D) 0,853
(E) Nenhuma das anteriores

77
15. Numa grande empresa de produtos financeiros, 20% dos trabalhadores já admitiram ter tido uma
situação de ansiedade. Se se selecionar 10 trabalhadores aleatoriamente, a média e o desvio padrão
daqueles que já experienciaram ansiedade são, respetivamente:
(A) 1.6 e 1.414
(B) 1.6 e 1.265
(C) 2 e 1.6
(D) 2 e 1.414
(E) 2 e 1.265

16. A probabilidade de um set de ténis ir para um desempate é de 17%. Qual a probabilidade de em três sets,
irem dois para desempate?
(A) 0,029
(B) 0,072
(C) 0,170
(D) 0,351
(E) 0,500

17. Um estudo recente concluiu que 4% das mulheres ficam grávidas nos primeiros 12 meses de iniciação da
vida laboral. Considere que todas as gravidezes ocorrem de uma forma independente umas das outras.
Suponha que 15 mulheres, que ingressaram no mundo do trabalho há 12 meses, são escolhidas
aleatoriamente. Qual a probabilidade de estarem grávidas entre 3 e 5 mulheres, inclusive?
(A) 0.001
(B) 0.105
(C) 0.018
(D) 0.099
(E) 0.020

18. Um atirador fez uma aposta com um amigo: atiraria ao alvo 10 vezes e ganharia a aposta se conseguisse
acertar na mosca pelo menos 7 vezes. Sabe-se, com base no desempenho usual desse atirador, que ele
costuma acertar na mosca em 80% das vezes. Qual a probabilidade do atirador ganhar a aposta?
(A) 0,382
(B) 0,879
(C) 0,531
(D) 0,165
(E) 0,558

19. Das 220 crianças que frequentam o infantário "Os Traquinas", 44 têm menos de dois anos de idade. São
selecionadas, ao acaso, 25 crianças para irem assistir a uma peça de teatro. Qual o número de crianças
com menos de dois anos se espera ter no grupo?
(A) 1
(B) 2
(C) 3
(D) 4
(E) 5

78
20. Se X ~ B (100; 0,1), calcule a probabilidade de X ser igual à sua variância.
(A) ≈ 1
(B) 0,0059
(C) 0,1304
(D) ≈ 0
(E) 0,0638

21. Numa população, a probabilidade de uma pessoa ter contraído uma determinada doença é 0,10.
Determine quantas pessoas devem ser analisadas para que a probabilidade de encontrar pelo menos 1
pessoa com a doença seja superior a 0,5.
(A) N=14
(B) N=7
(C) N=5
(D) N=4
(E) Nenhuma das anteriores

👉 Soluções: 1.C | 2.E | 3.C | 4.A | 5.C | 6.E | 7.B | 8.E | 9.B | 10.E | 11. C | 12.B

São necessários mais exercícios?

🔌 Distribuição https://www.youtube.com/watch?v=P-
binomial oN6gQHWYU&list=PL7xT0Gz6G0-
QE_GjV3WevJC7zWyhKm77h&index=2

Média e Variância https://www.youtube.com/watch?v=UpBAYzs1y00

Exercícios https://www.youtube.com/watch?v=-mtmK8vBSZI
resolvidos https://www.youtube.com/watch?v=uis8mx98bzk

79
4.2. Distribuição de Poisson
Enquanto a distribuição binomial pode ser usada para encontrar a probabilidade de um número de sucessos
em N tentativas, a distribuição de Poisson é usada para encontrar a probabilidade de um número de eventos
ocorridos num intervalo. Este intervalo pode ser referente a tempo, área, volume, entre outros.

Exemplo

X: nº de chamadas telefónicas, por hora, num atendimento ao cliente de uma operadora.


X: nº de peixes apanhados, por dia, por um barco
X: nº de erros tipográficos, por página A4, num livro

Considera-se que:

 o número de ocorrências num qualquer intervalo depende somente da extensão do intervalo;


 os eventos ocorrem com uma média conhecida;
 a ocorrência do evento em cada intervalo é independente dos outros intervalos.

4.2.1. Caracterização da Distribuição de Poisson


Uma variável aleatória X segue uma distribuição de Poisson, se contabiliza o número de eventos
(independentes) que ocorrem num intervalo temporal ou espacial, com valor médio λ > 0.
Escreve-se 𝑋 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆) ou 𝑋 ~ 𝑃𝑜 (𝜆)

𝑒 −𝜆 𝜆𝑥
A função de probabilidade é: 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥!

Tem os seguintes parâmetros associados:

 Média: 𝜇 = 𝐸[𝑋] = 𝜆
 Variância: 𝜎 2 = 𝑉𝑎𝑟[𝑋] = 𝜆

4.2.2. Aditividade da Distribuição de Poisson

Se 𝑋1 , 𝑋2 , … , 𝑋𝑘 são v.a. discretas que seguem uma distribuição de Poisson, 𝑋𝑖 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆𝑖 ), então
𝑌 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑘 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆1 + 𝜆2 + ⋯ + 𝜆𝑘 )

80
Exemplo
Uma empresa de tintas recebe os pedidos dos seus vendedores por email, com uma média de 5 pedidos por
hora.

a) Qual a probabilidade de, numa hora, receber exatamente 3 pedidos?


b) Na hora de almoço, a empresa fica impossibilitada de atender a preparação de tintas para mais de 2
pedidos por hora. Na sua opinião, a empresa deveria aumentar o número de funcionários nesse
horário?
c) Num dia de trabalho (8 horas laborais), qual o número de pedidos esperados?
d) Num dia de trabalho (8 horas laborais), qual a probabilidade de haver 50 pedidos?

Seja X o número de pedidos por email, por hora, que a empresa de tintas recebe. X ~ Poisson (5)
𝑒 −5 53
a) 𝑃(𝑋 = 3) = = 0,1404
3!

𝑒 −5 50 𝑒 −5 51 𝑒 −5 52
b) 𝑃(𝑋 > 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)] = 1 − [ 0!
+ 1!
+ 2!
] =
1 – [0.0067 + 0.0337 + 0.0842] = 1 – 0.1246 = 0,8754.
Dado que a probabilidade de haver mais de 2 pedidos é bastante elevada, seria importante a empresa
aumentar o número de funcionários para o horário de almoço.

c) Se numa hora, a empresa atende em média 5 pedidos por email, espera-se que, em média, a empresa
atenda 40 (8x5 ou 5+5+5+5+5+5+5+5) pedidos nas oito horas.
Assim,
Y: número de pedidos por email, em 8 horas
Y~Poisson(40)
Logo, são esperados E[Y]=40

𝑒 −40 4050
d) 𝑃(𝑌 = 50) = 50!
= 0,0177.

4.2.3. Tabela da Distribuição de Poisson


Seja 𝑋~𝑃𝑜 (1,5). Se queremos calcular P(X=3), na tabela de Poisson devemos:
1) Encontrar o valor da média 𝜇.
2) Na coluna relativa ao valor 𝜇
escolhido, encontrar a linha
do X que se pretende.
Logo P(X=3)=0,1255.

81
Exemplo

O número de casas vendidas por um agente imobiliário segue uma distribuição de Poisson, com média 2 por
semana.
a) Calcule a probabilidade de na próxima semana, o agente imobiliário venda:
a1) Exatamente 3 casas
a2) No mínimo 6 casas
b) O agente imobiliário recebe um bónus, se vender mais do que 15 casas no próximo mês (4
semanas). Calcule a probabilidade do agente receber o bónus.
c) Quantas casas se espera que o agente venda num ano?

Seja X: número de casas vendidas, por semana.


X~Poisson(2)
Logo, e recorrendo à tabela de Poisson,
a1) 𝑃(𝑋 = 3) = 0,1804

a2) 𝑃(𝑋 ≥ 6) = 𝑃(𝑋 = 6) + 𝑃(𝑋 = 7) +


𝑃(𝑋 = 8) + 𝑃(𝑋 = 9) = 0.0120 +
0.0034 + 0.0009 + 0.0002 = 0.0165

c) Consideremos Y: número de casa vendidas, em 4 semanas


𝑌~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(4 × 2)
Assim
𝑃(𝑋 > 15) = 𝑃(𝑋 = 16) + 𝑃8𝑋 =
17) + 𝑃(𝑋 = 18) + 𝑃(𝑋 = 19) +
𝑃(𝑋 = 20) + 𝑃(𝑋 = 21) =
= 0.0045 + 0.0021 + 0.0009
+ 0.0004 + 0.0002
+ 0.0001
= 0.0082
A probabilidade do agente receber o
prémio é de 0.0082.

d) Considerando que um ano tem 52 semanas, e que em média ele vende 2 casas. Então espera-se que,
num ano, o agente venda 52 × 2 = 104 casas. (isto é, o número de casas vendidas em 52 semanas é
uma v.a. com distribuição de Poisson de média 104).

82
4.2.4. Aproximação da distribuição binomial à distribuição de Poisson
A distribuição Binomial converge/aproxima-se para a distribuição Poisson, quando N → ∞ e 𝑝 → 0,
mantendo-se constante 𝜆 = N𝑝. Na prática recorre-se a esta aproximação quando 𝑁 ≥ 20 e 𝑁. 𝑝 < 7.
Ou seja, se 𝑋~𝐵(𝑁, 𝑝), e 𝑁 ≥ 20 e 𝑁. 𝑝 < 7, então X pode aproximar-se por 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑁𝑝)

Exemplo
No caso de termos 𝑋~𝐵(30, 𝑝), vemos que a aproximação entre as duas distribuições acontece à medida
que o valor de p aumenta.

Exemplo
Numa empresa, sabe-se que 1% das peças produzidas saem com defeito.
a) O gabinete de qualidade da empresa seleciona aleatoriamente 15 peças produzidas nesse dia. Qual a
probabilidade de não haver qualquer peça com defeito?
b) Um hipermercado quer fazer uma grande encomenda, mas obrigada a um controlo de qualidade mais
apertado. Se em 300 peças escolhidas aleatoriamente, houver pelo menos 2 com defeito, o contrato
não será realizado. Qual a probabilidade da empresa ganhar o contrato?

a) Seja X: número de peças com defeito, em 15 selecionadas. 𝑋~𝐵(15, 0.01).


Logo 𝑃(𝑋 = 0) = 0.8601

b) Seja Y: número de peças com defeito, em 300 selecionadas. 𝑌~𝐵(300, 0.01).


Como 𝑁 = 300 (≥ 20) e 𝑁𝑝 = 300 × 0.01 = 3 (< 7), então podemos aproximar à distribuição de
Poisson.
Assim, 𝑌~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(3)
𝑃(𝑋 < 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) = 0.0498 + 0.1494 = 0.1992

83
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.

1. Em média, nascem 2 bebés por hora num hospital. A probabilidade de, na próxima hora, nascerem no
máximo 3 bebés é:
(A) 0.1429
(B) 0.1804
(C) 0.3233
(D) 0.6767
(E) 0.8571

2. Um livro tem, em média, 2 erros ortográficos por cada página. Determine a probabilidade de, numa
página, o número de erros ortográficos ser superior ao esperado?
(A) 0.5940
(B) 0.3233
(C) 0.2727
(D) 0.4080
(E) 0.6807

3. Calcule P(Y=12), sabendo que Y segue uma distribuição de Poisson de média 18


(A) 0.0055
(B) 0.0176
(C) 0.0238
(D) 0.0368
(E) 0.0331

4. O número de acidentes por dia num troço de 100 km de uma autoestrada segue a distribuição de Poisson
com parâmetro 2.2. Qual é a melhor aproximação da probabilidade de não haver acidentes nesta secção
durante 2 dias?
(A) 0.0123
(B) 0.0014
(C) 0.1108
(D) 0.0002
(E) 0.2043

5. Um livro contém 500 páginas. Se houver 200 erros de digitação distribuídos aleatoriamente por todo o
livro, use a distribuição Poisson para determinar a probabilidade de uma página conter exatamente três
erros.
(A) 0.1734
(B) 0.0129
(C) 0.0005
(D) 0.0072
(E) 0.1234

84
6. Uma loja de equipamentos de hardware vende em média 3 impressoras por dia. Sabendo que vendeu
pelo menos uma impressora, qual a probabilidade de ter vendido no máximo 4?
(A) 0.81
(B) 0.63
(C) 0.39
(D) 0.56
(E) 0.22

7. O número de chamadas telefónicas para um estabelecimento comercial é uma v.a. de Poisson, com média
de 7 chamadas por hora. Considere o período entre as 9:00 e as 9:30 de um dia qualquer da semana.
Determine a probabilidade de não serem recebidas chamadas no referido período.
(A) 0.1888
(B) 0.1850
(C) 0.0302
(D) 0.0771
(E) 0.2301

8. Em média chega a uma central telefónica 1 chamada por minuto. A telefonista costuma, de vez em
quando, fazer um intervalo de 5 minutos. Considere um desses intervalos. Calcule a probabilidade de,
durante a sua pausa, a telefonista deixar de atender 1 chamada.
(A) 0.0842
(B) 0.0337
(C) 0.1404
(D) 0.1755
(E) 0.1324

9. Se X e Y são variáveis aleatórias que seguem uma distribuição de Poisson, com parâmetros 𝜆1 e 𝜆2 , então
X+Y é também uma variável aleatória que segue uma distribuição de Poisson, com parâmetro:
(A) 𝜆1 − 𝜆2
(B) 𝜆1 × 𝜆2
(C) 𝜆1 /𝜆2
(D) 𝜆1 + 𝜆2
(E) 𝜆1 2 + 𝜆2 2

10. Sabe-se que X, v. a. que representa o número de automóveis que entram numa autoestrada num período
de 30 segundos, segue uma distribuição de Poisson com desvio-padrão 2. Em média quantos automóveis
entram na autoestrada num período de 3 minutos?
(A) 18
(B) 24
(C) 30
(D) 36
(E) 42

85
11. O proprietário de uma pequena loja de conveniência está a decidir se deve ou não interromper a venda
de revistas. O proprietário suspeita que apenas 5% dos clientes compram uma revista e acha que poderá
usar esse espaço para vender algo mais rentável. Ontem entraram 50 clientes na sua loja. Qual a
probabilidade de no máximo 5 dos seus clientes terem comprado revistas?
(A) 0.0042
(B) 0.8912
(C) 0.1088
(D) 0.0668
(E) 0.9580

12. Numa população, a probabilidade de uma pessoa ter contraído uma determinada doença é 0.001.
Determine a probabilidade de numa cidade de 5 mil habitantes, no mínimo 3 pessoas terem contraído a
doença.
(A) 0.8754
(B) 0.2650
(C) 0.7350
(D) 0.4405
(E) 0.3219

👉 Soluções: 1.E | 2.B | 3.D | 4.A | 5.D | 6.A | 7.C | 8.B | 9.D | 10.B | 11. E | 12.A

São necessários mais exercícios?

🔌 Distribuição de https://www.youtube.com/watch?v=C3pdH2NbuzU
Poisson
https://www.youtube.com/watch?v=86NBQhuK8r0

Exercícios http://www.bertolo.pro.br/FinEst/Estatistica/ExerciciosReso
resolvidos lvidosPoisson.pdf

86
4.3. Distribuição Normal
A distribuição normal é a distribuição contínua mais comum.

Um matemático relevante, Friedrich Gauss (1777 - 1855), estudou alguns eventos da natureza, e observou o
comportamento padrão entre as amostras. Desta forma, a curva da distribuição normal também é conhecida
como curva gaussiana.

A curva da distribuição normal representa o comportamento de diversos fenómenos, como por exemplo, peso
e altura de uma população, pressão sanguínea de um grupo de pessoas, tempo gasto de um conjunto de
indivíduos a executar uma tarefa, entre outras. Além disso, algumas distribuições discretas, como é o caso da
Binomial ou Poisson, podem ser aproximadas (sob certas condições) pela distribuição normal.

4.3.1. Caracterização da Distribuição Normal


A v.a. contínua X tem distribuição Normal, com média 𝜇 e variância 𝜎 2 , e escreve-se, 𝑋 ~ 𝑁( 𝜇 , 𝜎 2 ), se
tiver a função densidade de probabilidade dada pela expressão

1 𝑥−𝜇 2
1 − ( )
𝑓(𝑥) = 𝑒 2 𝜎 , com 𝑥 ∈ ℝ
√2𝜋𝜎 2

Tem os seguintes parâmetros associados:

 Média: 𝜇 = 𝐸[𝑋] = 𝜇
 Variância: 𝜎 2 = 𝑉𝑎𝑟[𝑋] = 𝜎 2

Características da curva da normal (ou curva gaussiana)


 Tem a forma de um sino
 Tem um único máximo, quando 𝑥 = 𝜇
 É simétrica relativamente ao eixo vertical que
passa por 𝑥 = 𝜇 (média).

 Pelo facto de ser simétrica, a mediana e a moda


ocorrem em 𝑥 = 𝜇.

87
Existem probabilidades bem conhecidas:

 𝑃(𝜇 − 𝜎 < 𝑋 < 𝜇 + 𝜎) ≈ 68%


 𝑃(𝜇 − 2𝜎 < 𝑋 < 𝜇 + 2𝜎) ≈ 95%
 𝑃(𝜇 − 3𝜎 < 𝑋 < 𝜇 + 3𝜎) ≈ 99,7%

As probabilidades de variáveis aleatórias contínuas são definidas como a área sob a curva da sua distribuição.
Assim, apenas as faixas de valores podem ter uma probabilidade diferente de zero. A probabilidade de que
uma variável aleatória contínua seja igual a algum valor é sempre zero. Assim:

𝑃(𝑋 = 𝑎) = 0 e 𝑃(𝑋 < 𝑎) = 𝑃(𝑋 ≤ 𝑎) (para outros intervalos o procedimento é similar)

4.3.2. Distribuição Normal Padronizada (ou estandardizada)

Uma vez que os parâmetros da distribuição podem tomar um número infinito de valores possíveis, existe uma
infinidade de distribuições normais diferentes. Tendo em conta que a função de densidade de probabilidade
envolve cálculo morosos, houve a necessidade de recorrer ao processo de padronização ou estandardização.
Desta forma:

𝑋−𝜇
𝑋~𝑁(𝜇, 𝜎 2 ) então 𝑍= ~𝑁(0, 1)
𝜎

4.3.3. Tabela da Distribuição Normal


A tabela que irá ser utilizada corresponde à área acumulada ou probabilidade à
esquerda, isto é, 𝑃(𝑍 ≤ 𝑧) = 𝑃(𝑍 < 𝑧).

Se queremos calcular 𝑃(𝑍 ≤ 0,45) devemos:

(i) Encontrar na primeira coluna o valor 0,4


(número inteiro e a primeira casa decimal)
(ii) Encontrar na primeira linha o valor 0,05
(segunda casa decimal)

Logo 𝑃(𝑍 ≤ 0,45) = 0,6736.

88
Exemplo
A variação diária da cotação de fecho de um determinado fundo transacionado na bolsa de valores, pode ser
aproximado por uma distribuição normal com valor esperado 0.3% e desvio padrão 2%. Qual a probabilidade
da próxima variação ser menor que 3%?

Considerando X: variação diária da cotação do fecho de um fundo


𝑋−0.3
Sabemos que 𝑋~𝑁(0.3, 22 ) . Padronizando, temos 𝑍 = 2
~𝑁(1,0).

3 − 0.3
𝑃(𝑋 < 3) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < 1.35) = 0.9115
2

Dado que a tabela traduz uma área abaixo da curva, então podemos observar as seguintes propriedades:

 𝑃(𝑍 < 0) = 𝑃(𝑍 > 0) = 0.5

 𝑃(𝑍 < −𝑎) = 𝑃(𝑍 > 𝑎)

 𝑃(𝑍 > 𝑎) = 1 − 𝑃(𝑍 ≤ 𝑎)

 𝑃(𝑎 < 𝑍 < 𝑏) = 𝑃(𝑍 < 𝑏) − 𝑃(𝑍 ≤ 𝑎)

89
Exemplo

a) 𝑃(𝑍 < 0.75) = 0,7734

b) 𝑃(𝑍 > −0.75) = 𝑃(< 0.75) = 0.7734

c) 𝑃(−0.6 < 𝑍 < 1.2) = 𝑃(𝑍 < 1.2) − 𝑃(𝑍 ≤ −0.6) =


= 𝑃(𝑍 < 1.2) − 𝑃(𝑍 ≥ 0.6) = 𝑃(𝑍 < 1.2) − (1 − 𝑃(𝑍 < 0.6)) =
= 0.8849 − 0.7257 = 0.1592

A tabela da normal também pode ser analisada no sentido inverso, isto é, dada uma certa probabilidade,
podemos calcular o valor da v.a. que a originou.

Exemplo

Suponhamos que 𝑋~𝑁(4,9) e queremos calcular 𝑎 de modo que


𝑃(𝑋 ≤ 𝑎) = 0.975.
𝑋−4
Em primeiro lugar devemos padronizar: 𝑍 = ~𝑁(0,1).
3

𝑎−4
Logo, 𝑃(𝑋 ≤ 𝑎) = 0.975 ⇔ 𝑃 (𝑍 ≤ 3
) = 0.975

Sabemos que se trata de uma área superior a 0.5 e por isso terá a representação ao lado.

Observando a tabela da distribuição normal


(valores que correspondem às
probabilidades), sabemos que

𝑎−4 𝑎−4
𝑃 (𝑍 ≤ ) = 0.975 ⇔ = 1,96
3 3

⇔ 𝑎 = 1,96 × 3 + 4 ⇔ 𝑎 = 9.88

90
Exemplo

Qual o valor de z?

a) 𝑃(𝑍 < 𝑧) = 0.9798 (repare que a área pretendida tem um


valor superior a 0.5, logo pode ser representada como a figura
ao lado).
𝑃(𝑍 < 𝑧) = 0.9798 ⇔ 𝑧 = 2.05

b) 𝑃(𝑍 < 𝑧) = 0.2546 (neste caso a área pretendida tem um valor


inferior a 0.5, logo está à esquerda do zero, na curva de Gauss).
𝑃(𝑍 < 𝑧) = 0.2546 ⇔ 𝑃(𝑍 > −𝑧) = 0.2546
⇔ 1 − 𝑃(𝑍 < −𝑧) = 0.2546 ⇔ 𝑃(𝑍 < −𝑧) = 0.7454 ⇔ −𝑧 =
0.66 ⇔ 𝑧 = −0.66

Exemplo

Uma máquina de refrigerantes está regulada de modo a servir uma média de 200ml por copo. Considere
também a quantidade servida por copo seguir uma distribuição normal com desvio padrão de 15 ml.

a) Qual a percentagem de copos que conterão mais do 230 ml?

Considere-se X: quantidade de refrigerante servida num copo pela máquina.


𝑋−200
𝑋~𝑁(200, 152 ). Padronizando obtemos 𝑍 = 15
~𝑁(0,1).

230−200
𝑃(𝑋 > 230) = 𝑃 (𝑍 > 15
) = 𝑃(𝑍 > 2) = 1 − 𝑃(𝑍 ≤ 2) = 1 − 0.9772 = 0.0228.

b) Determine acima de que valor estão 1% das bebidas com excesso de refrigerante.
𝑎 − 200
𝑃(𝑋 > 𝑎) = 0.01 ⇔ 𝑃 (𝑍 > ) = 0.01
15

𝑎 − 200
⇔ 𝑃 (𝑍 > ) = 0.01
15
𝑎 − 200
⇔ 1 − 𝑃 (𝑍 ≤ ) = 0.01
15
𝑎 − 200
⇔ 𝑃 (𝑍 ≤ ) = 0.99
15
𝑎 − 200
⇔ = 2.326
15
⇔ 𝑎 = 234.89

91
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.
1. O nível de colesterol da população de um determinado país segue uma distribuição normal com média
170 e desvio padrão 30. Níveis superiores a 200 são alvo de preocupação e vigilância. Qual a probabilidade
de um indivíduo ter colesterol superior a 200?
(A) 0.2514
(B) 0.2033
(C) 0.1587
(D) 0.1210
(E) Nenhuma das anteriores

2. O período de gestação de uma mulher é normalmente distribuído com uma média de 268 dias e uma
variância de 225. Qual a probabilidade da gravidez de uma mulher durar menos de 256 dias?
(A) 0.1151
(B) 0.2119
(C) 0.2743
(D) 0.3446
(E) Nenhuma das anteriores

3. Assuma que a altura da população masculina portuguesa é normalmente distribuída, com média 175cm
e desvio padrão 7cm. Para entrar nas forças armadas, a altura mínima é de 165cm e máxima de 198cm.
Escolhido um homem ao acaso, qual a probabilidade de ele ter os requisitos de altura para entrar nas
forças armadas?
(A) 0.9231
(B) 0.8707
(C) 0.7889
(D) 0.8800
(E) Nenhuma das anteriores

4. Admita que a distribuição da altura dos jogadores de basquetebol é uma Normal com média 195 cm e
desvio padrão 20 cm. Que percentagem dos jogadores tem menos de 1.80 m de altura?
(A) 15.77%
(B) 20.04%
(C) 22.66%
(D) 26.89%
(E) 30.85%

5. Considere X o lucro que uma loja faz por dia. Podemos considerar que X é aproximadamente normal com
média 360€ e variância 2500€. Qual o valor de P(X>400)?
(A) 0.2119
(B) 0.2881
(C) 0.5319
(D) 0.7881
(E) 0.8450

92
6. Se 𝑋~𝑁(25; 25), calcule a P(X>22)
(A) ≈ 0
(B) 0.4487
(C) 0.8325
(D) 0.7257
(E) ≈ 1

7. Se X segue uma distribuição normal de média 16 e variância 16, calcule a P(X> -1)
(A) ≈ 0
(B) 0.2287
(C) 0.7357
(D) 0.8325
(E) ≈ 1

8. Se X é uma v.a. Normal com média 160, indique qual das afirmações é verdadeira:
(A) P(X < 150) < 0.5
(B) P(X > 170) > 0.5
(C) P(X > 150) < 0.5
(D) P(X < 170) < 0.5
(E) nenhuma das outras alternativas

9. O tempo de encher um copo de refrigerante numa cadeia de fast food segue uma distribuição normal de
média 10 segundos e variância 16 segundos. Chega um novo pedido de refrigerante. Qual a probabilidade
do copo demorar a encher mais de 25 segundos?
(A) ≈ 1
(B) 0.8264
(C) 0.1736
(D) 0.2236
(E) ≈ 0

10. Dois testes psicotécnicos foram feitos em simultâneo a um conjunto de alunos de uma escola. O teste A
teve uma pontuação normalmente distribuída com média de 1026 com um desvio padrão de 209 pontos.
O teste B, que tem uma escala diferente, teve uma pontuação normalmente distribuída com média de
20,8 e um desvio padrão de 4.6. A Clara fez ambos os testes e teve as pontuações de 860 no teste A e 16
no teste B. Compare os resultados tendo por base os resultados da escola e escolha a afirmação correta.
(A) A pontuação de 860 no teste A é melhor.
(B) A pontuação de 16 no teste B é melhor.
(C) Não podemos determinar qual a melhor pontuação tendo por base a informação dada.
(D) Ambos os testes são estatisticamente iguais.
(E) A Clara foi a melhor da escola nos testes.

11. Uma máquina de corte de rolhas de cortiça opera para que o diâmetro das rolhas produzidas siga uma
distribuição normal com média 3 cm e desvio padrão 0,1cm. Qual a medida máxima da rolha
(arredondado a 2 casas decimais) a para abranger 90% das rolhas?

93
(A) 3,03
(B) 3,05
(C) 3,08
(D) 3,13
(E) Nenhuma das anteriores

12. Considere que o valor monetário que o Daniel faz semanalmente por fazer trabalhos de jardinagem na
vizinhança segue uma distribuição normal, de média 240€ e desvio padrão 60€. Qual o valor máximo que
o Daniel obteve numa semana, sabendo que a probabilidade foi de 0.6? (aproxime o valor às unidades)
(A) 30
(B) 114
(C) 216
(D) 255
(E) 360

13. O tempo de entrega de um pedido num restaurante de fast food, segue uma distribuição normal com
média de 5 minutos e desvio padrão de 1 minuto. A política do restaurante é que, se um cliente não for
servido dentro de um período de tempo máximo, ele não será cobrado pelo alimento pedido. A
administração deseja fornecer esse programa de incentivo para no máximo 10% dos clientes. O tempo
máximo de espera garantido deve ser definido em:
(A) 6.3
(B) 6.7
(C) 7.3
(D) 6.9
(E) nenhuma das anteriores

14. Numa distribuição normal com média 200, sabe-se que P(X > 225) = 0,1587. Qual a variância dessa
distribuição?
(A) 25
(B) 625
(C) 1
(D) 200
(E) Nenhuma das anteriores

👉 Soluções: 1.C | 2.B | 3.A | 4.C | 5.A | 6.D | 7.E | 8.A | 9.E | 10.A | 11.D | 12.D | 13.A | 14.B

São necessários mais exercícios?

🔌 Distribuição Normal https://www.youtube.com/watch?v=VFujwDtQmx0

https://www.youtube.com/watch?v=NkiOvuytah4

94
4.3.4. Aditividade da distribuição normal

Quando temos várias variáveis aleatórias normais, a combinação linear das mesmas é ainda uma variável
aleatória normal, ou seja,

Se 𝑋𝑖 ~𝑁(𝜇𝑖 , 𝜎𝑖2 ) então ∑𝑛𝑖=1 𝑎𝑖 𝑋𝑖 ~ N(∑𝑛𝑖=1 𝑎𝑖 𝜇𝑖 , ∑𝑛𝑖=1 𝑎𝑖 2 𝜎𝑖 2 )

Exemplo
A produção semanal das bebidas A, B e C na empresa XPTO podem ser consideradas variáveis independentes
e com distribuições normais: 𝐴~𝑁(551, 332 ) ; 𝐵~𝑁(250, 282 ) e 𝐶~𝑁(831, 422 ).

a) Considere Y=4A. Calcule P(Y>2500).


Se 𝐴~𝑁(551, 332 ) então 4𝐴~𝑁(4 × 551, 42 × 332 ), ou seja, 4𝐴~𝑁(2204, 1322 ). Logo
2500 − 2204
𝑃(𝑌 > 2500) = 𝑃(4𝐴 > 2500) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 2.24) = 1 − 𝑃(𝑍 ≤ 2.24)
132
= 1 − 0.9875 = 0.0125

b) Qual a probabilidade da totalidade de bebidas produzidos semanalmente pela empresa exceder as 1600
unidades de medida?

Sabemos que 𝐴~𝑁(551, 332 ) ; 𝐵~𝑁(250, 282 ) e 𝐶~𝑁(831, 422 ).

Logo, 𝑋 = 𝐴 + 𝐵 + 𝐶~𝑁(551 + 250 + 831, 332 + 282 + 422 ), ou seja , 𝑋~𝑁(1632, 3637)

1600−1632
𝑃(𝑋 > 1600) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −0.53) = 𝑃(𝑍 < 0.53) = 0.7019
√3637

4.3.5. Aproximação da distribuição binomial à distribuição normal


A distribuição normal, apesar de ser uma distribuição contínua, é frequentemente uma aproximação razoável
duma distribuição discreta, sob determinadas condições.

Quando N é suficientemente grande e p suficientemente elevado para que a distribuição binomial seja
aproximadamente simétrica (na prática N≥20 e N.p>7), então a distribuição binomial aproxima-se da normal
com parâmetros 𝜇 = 𝑁𝑝 e 𝜎 2 = 𝑁𝑝𝑞. Ou seja,

se 𝑋~𝐵(𝑁, 𝑝), e 𝑁 ≥ 20 e 𝑁. 𝑝 > 7, então X pode aproximar-se por uma distribuição 𝑁(𝑁𝑝, 𝑁𝑝𝑞)

Nota: a aproximação da distribuição binomial pela Normal também pode fazer-se quando se verificam as
condições 𝑁 ≥ 20; 𝑁𝑝≥5 e 𝑁𝑞≥5

95
4.3.6. Aproximação da distribuição de Poisson à distribuição normal

Sempre que 𝜆 > 20, a distribuição de Poisson pode ser aproximada à distribuição normal. Assim,

se 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆), e 𝜆 > 20, então X pode aproximar-se por uma distribuição 𝑁(𝜆, 𝜆)

Nota: outros autores consideram que para aproximar a distribuição de Poisson à Normal basta que 𝜆 ≥ 5.

4.3.7. Correção de continuidade

A aproximação de uma distribuição discreta (por exemplo, Binomial ou Poisson) para a distribuição contínua
(Normal) tem de ser feita com alguns ajustes. De facto, o acontecimento 𝑋 = 𝑥, no caso discreto, tem de ser
reescrito como 𝑥 − 𝜀 ≤ 𝑋 ≤ 𝑥 + 𝜀 no caso contínuo, uma vez que 𝑃(𝑋 = 𝑥) = 0, quando X é uma variável
aleatória contínua. Como os valores discretos consecutivos distam uma unidade entre si, escolhemos 𝜀 = 0.5.

Assim, sempre que aproximarmos uma variável aleatória discreta para a distribuição normal, devemos
recorrer à correção de continuidade:

 𝑃(𝑋 = 𝑥) = 𝑃(𝑥 − 0.5 ≤ 𝑋 ≤ 𝑥 + 0.5)


 𝑃(𝑋 ≤ 𝑎) = 𝑃(𝑋 ≤ 𝑎 + 0.5) (o valor de a está incluído no cálculo da probabilidade)
 𝑃(𝑋 < 𝑎) = 𝑃(𝑋 ≤ 𝑎 − 0.5) (o valor de a não está incluído no cálculo da probabilidade)
 𝑃(𝑋 ≥ 𝑏) = 𝑃(𝑋 ≥ 𝑏 − 0.5) (o valor de b está incluído no cálculo da probabilidade)
 𝑃(𝑋 > 𝑏) = 𝑃(𝑋 ≥ 𝑏 + 0.5) (o valor de b não está incluído no cálculo da probabilidade)
 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 − 0.5 ≤ 𝑋 ≤ 𝑏 + 0.5)

Exemplo

Admita que Y seja uma variável aleatória discreta.

Usando a distribuição discreta: 𝑃(𝑌 = 120)

Aproximando pela distribuição normal:

𝑃(120 − 0.5 ≤ 𝑌 ≤ 120 + 0.5) = 𝑃(119,5 ≤ 𝑌 ≤ 120.5)

96
Exemplo

Numa determinada vila, a taxa de desemprego situa-se nos 9%. Tendo-se recolhido uma amostra de 500
pessoas, calcule a probabilidade de haver no máximo 60 desempregados?

Seja X número de desempregados numa amostra de 500 pessoas.

𝑋~𝐵(500, 0.09).

Dado que 𝑁 = 500 (≥ 20) e 𝑁𝑝 = 500 × 0.09 = 45 (> 7) então pode-se aproximar X pela distribuição
Normal,

𝑋~𝑁(500 × 0.09, 500 × 0.09 × 0.91), ou seja, 𝑋~𝑁(45, 40.95),

60.5 − 45
𝑃(𝑋 ≤ 60) = 𝑃(𝑋 ≤ 60 + 0.5) = 𝑃(𝑋 ≤ 60.5) = 𝑃 (𝑍 ≤ ) = 𝑃(𝑍 ≤ 2.42) = 0.9922
√40.95

Exemplo

O número de avarias que uma máquina tem por dia é uma variável aleatória com distribuição de Poisson de
valor médio 0.2. Qual a probabilidade da referida máquina ter, durante um ano comum, pelo menos 100
avarias?

Seja X: número de avarias, por dia. Sabemos que 𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(0.2).

Se considerarmos um ano,

Y: numero de avarias, por ano. Então 𝑌~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(0.2 × 365), isto é, 𝑌~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(73).

Como 𝜆 = 73 (> 20) podemos aproximar à distribuição normal. Assim, 𝑌~𝑁(73,73).

99.5 − 73
𝑃(𝑌 ≥ 100) = 𝑃(𝑌 ≥ 100 − 0.5) = 𝑃(𝑌 ≥ 99.5) = 𝑃 (𝑍 ≥ ) = 𝑃(𝑍 ≥ 3.10)
√73
= 1 − 𝑃(𝑍 < 3.10) = 1 − 0.9990 = 0.001

97
Para rever… Para cada uma das seguintes questões apenas uma das
opções está correta. Selecione-a.

1. O montante de depósitos à ordem efetuados diariamente numa agência bancária é uma variável aleatória
com distribuição normal de média 120 unidades monetárias e desvio padrão 8. A agência bancária
cumpre os seus objetivos se o total depósitos efetuados em dois meses (40 dias laborais) exceder 5000
unidades monetárias. Qual a probabilidade da agência cumprir os seus objetivos?
(A) 0.7357
(B) 0.2643
(C) 0.5
(D) 0.5319
(E) 0.4681

2. Uma empresa, tem produção constante de 90 toneladas por dia. Sabe-se que a procura diária é uma v.a.
com distribuição Normal, com média 80 toneladas e desvio padrão 10 toneladas. Calcule a probabilidade
de, em 9 dias, a procura ser superior a 700 toneladas?
(A) 0.5871
(B) 0.4129
(C) 0.22
(D) 0.5080
(E) 0.4920

3. O salário mensal da cidade X é normalmente distribuído, com uma média de 800 euros e desvio padrão
de 400 euros. A cidade Y, também apresenta um salário mensal de média 700 euros e desvio padrão 500
euros. Assim, a diferença salarial entre as cidades X e Y (X-Y) pode ser descrita como normalmente
distribuída e com média e variância:
(A) 100 e 640, respetivamente
(B) 100 e 900
(C) 100 e 410 000
(D) 100 e 100
(E) Nenhuma das anteriores

4. Em qual das alternativas a seguir poderíamos usar uma distribuição normal para aproximar a distribuição
binomial?
(A) N = 15, p = 0.70
(B) N = 18, p = 0.90
(C) N = 22, p = 0.03
(D) N = 40, p = 0.10
(E) N = 24, p = 0.85

98
5. Selecione a seguinte probabilidade binomial, 𝑃(𝑋 < 25), com sua aproximação de probabilidade à
distribuição normal, após uma correção de continuidade.
(A) 𝑃(𝑋 > 25.5)
(B) 𝑃(𝑋 < 25.5)
(C) 𝑃(𝑋 > 24.5)
(D) 𝑃(𝑋 < 24.5)
(E) 𝑃(24 ≤ 𝑋 < 25)

6. Num estudo de mercado recente, verificou-se que 78% dos adultos com mais de 50 anos necessitam de
óculos para conduzir. Se se selecionar, aleatoriamente, 40 adultos com mais de 50 anos, qual a
probabilidade de pelo menos 30 necessitarem de usar óculos para conduzir?
(A) 0.2611
(B) 0.5987
(C) 0.4013
(D) 0.7389
(E) 0.6480

7. Se 62% de todos os adolescentes dizem que têm redes sociais, qual é a probabilidade de numa amostra de
200 adolescentes, menos de 124 adolescentes tenham redes sociais?
(A) 0.4721
(B) 0.5279
(C) 0.2140
(D) 0.5000
(E) 0.7860

8. Sabe-se que X, v. a. que representa o número de automóveis que entram numa autoestrada num período
de 30 segundos, segue uma distribuição de Poisson com desvio-padrão 2. Num período de 3 minutos,
qual a probabilidade de passarem exatamente 33 automóveis?
(A) 0.9738
(B) 0.0156
(C) 0.9582
(D) 0.0231
(E) Nenhuma das anteriores

👉 Soluções: 1.B | 2.A | 3.C | 4.E | 5.D | 6.D | 7.A | 8.B

São necessários mais exercícios?

🔌 Aditividade da distribuição normal https://www.youtube.com/watch?v=Z6vANdo1L68

Correção de continuidade https://www.youtube.com/watch?v=tVidcGd5XoE

99
Ficha de trabalho nº4
1. Numa cidade de milhares de pessoas, sabe-se que 20% estão contaminadas com o vírus W. Escolhendo 6
pessoas ao acaso para amostra, qual a probabilidade de:
1.1. nenhuma esteja contaminada. (R:0,2621)
1.2. metade ou mais estejam contaminadas. (R: 0,0989)
1.3. todas estejam contaminadas, sabendo-se que pelo menos uma pessoa está contaminada.

2. Uma empresa comercializa garrafas de vinho do Porto de 1 litro. Supõe-se, no entanto, que 40% dessas
garrafas contém realmente uma menor quantidade de líquido do que o volume indicado no rótulo. Tendo
adquirido 6 dessas garrafas, qual a probabilidade de:
2.1. Duas delas conterem menos de 1 litro? (R: 0,3110)
2.2. No máximo 2 delas conterem menos de 1 litro? (R: 0,5443)
2.3. Pelo menos 2 delas conterem menos de 1 litro? (R: 0,7667)
2.4. Todas conterem menos de 1 litro? (R: 0,0041)
2.5. Todas conterem o volume indicado no rótulo ou mais? (R: 0,0467)
2.6. Represente a função de probabilidade da v.a. em questão.

3. Numa linha de enchimento de frascos de compota, a falta de calibração da máquina origina diariamente
5% de frascos com menos produto do que o pretendido. Se for selecionada aleatoriamente uma amostra
de 15 frascos, determine a probabilidade de:
3.1. De nenhum frasco ter menos do que o pretendido. (R: 0,4633)
3.2. No máximo, 3 frascos terem menos do que o pretendido. (R: 0,9946)
3.3. Calcule o valor esperado e a variância da variável em estudo. (R: E(X)=0,75; Var(X)=0,7125)

4. Qual a probabilidade de em 10 lançamentos de um dado perfeito


4.1. Se obterem 5 faces par. (R: 0,2461)
4.2. Se obterem 5 faces superiores a 4. (R: 0,136)

5. Num centro comercial está instalado um sistema de 12 máquinas para utilização de Multibanco.
Considera-se que o sistema está em funcionamento se pelo menos metade dessas máquinas funcionar.
Suponha que cada máquina funciona independentemente das outras e que a probabilidade de
funcionamento de cada uma é de 0,6. Calcule a probabilidade de o sistema funcionar. (R: 0,8418)

100
6. Numa experiência biológica, para a qual a escolha das cobaias é bastante dispendiosa, verifica-se que a
experiência é bem-sucedida em 40% dos casos.
6.1. Se o investigador tiver 10 cobaias à sua disposição, qual a probabilidade de se verificarem pelo menos
2 experiências bem-sucedidas? (R: 0,9537)
6.2. Quantas cobaias são necessárias para que o número esperado de sucessos seja 24? (R: N=60)
6.3. Quantas cobaias serão necessárias para garantir que a probabilidade de obter pelo menos uma
experiência com sucesso seja superior a 0.95? (R: N≥6)

7. Numa escola primária foi feita uma grande campanha sobre a reciclagem do papel. Em cinco estudantes,
espera-se que quatro guardem escrupulosamente o papel usado para o colocar no papelão.
7.1. Calcule a probabilidade de que em 15 estudantes, mais de metade coloque o papel no papelão. (R:
0,9957)
7.2. Quantos estudantes devem ser selecionados de modo a que a probabilidade de encontrar pelo
menos três a cumprir esta exigência ambiental seja maior do que 99%. (R: N≥7)

8. Um armazenista controla a qualidade dos produtos que compra em lotes, inspecionando em cada lote de
10 peças e classificando-as em defeituosas ou perfeitas.
8.1. O armazenista tem por regra o seguinte: rejeita o lote e devolve-o ao fabricante se encontra mais de
duas peças defeituosas na amostra que retira em cada lote. Suponha que 5% das peças dum lote são
defeituosas.
8.1.1. Qual a probabilidade de o armazenista aceitar aquele lote? (R:0,9884)
8.1.2. Determine o número de peças defeituosas que o armazenista espera obter. (R: 0,5)
8.2. O seu fornecedor garante que o lote é de elevada qualidade pois apenas deverá ter 1% de peças
defeituosas. O fornecedor tem um sistema de controlo de qualidade que consiste em utilizar uma
amostra de 20 peças. Pretendendo que a probabilidade de aceitação de um lote seja de 0,999, qual
deverá ser o número máximo de peças defeituosas que o fornecedor pode admitir na sua amostra?
(R: 2)

9. Suponha que X tem distribuição binomial com parâmetros N e p. Sabendo que E(X)=5 e Var(X)=4,
determine N e p. (R: N=25, p=1/5)

10. O número de chamadas que chegam num período de 5 minutos a uma central telefónica de uma empresa
é uma v.a. com distribuição de Poisson de parâmetro λ=10.
10.1. Calcule a probabilidade de num período de 5 minutos:

101
10.1.1. Chegarem exatamente 8 chamadas. (R: 0,1126)
10.1.2. Chegarem menos de 5 chamadas. (R: 0,0293)
10.1.3. Chegarem no mínimo 3 chamadas. (R: 0,9972)
10.1.4. Chegarem pelo menos 20 chamadas. (R: 0,0035)
10.1.5. Não chegar nenhuma chamada. (R: 0)
10.2. Calcule agora a probabilidade de num período de 3 minutos chegarem à central da empresa:
10.2.1. No máximo 4 chamadas. (R:0.2851)
10.2.2. Menos de 15 chamadas. (R: 9987)
10.3. Qual o número esperado de chamadas em 10 minutos? E numa hora? (R:20 / 120)

11. Numa fábrica o número de acidentes por semana segue uma distribuição de Poisson de parâmetro igual
a 2. Calcule a probabilidade de que:
11.1. Numa semana haja pelo menos um acidente. (R: 0,8647)
11.2. Numa semana haja pelo menos um acidente, sabendo que na semana anterior não se tinha
registado nenhum acidente. (R: 0,8647)
11.3. Em duas semanas se verifiquem 4 acidentes. (R: 0,1954)
11.4. Numa semana haja 2 acidentes e na semana seguinte outros 2. (R: 0,0733)

12. O número de clientes que chega a uma caixa de supermercado num período de 10 minutos tem uma
distribuição de Poisson com média 5.
12.1. Calcule a probabilidade de num período de 5 minutos chegarem 2 ou mais clientes. (R: 0,7127)
12.2. Quantos lugares deverá ter a fila de modo a que todos os clientes que chegam num período de 5
minutos possam nela ter lugar com probabilidade pelo menos igual a 0,95. (R: 5)

13. O número de petroleiros que chega a uma certa refinaria, em cada dia, é uma v.a. X com distribuição de
Poisson de parâmetro 2. As atuais instalações portuárias da refinaria podem atender até 3 petroleiros por
dia. Se mais de 3 petroleiros chegam num dia, os petroleiros em excesso são enviados para outro porto.
13.1. Qual a probabilidade de, num dado dia, a refinaria ter de recusar petroleiros? (R: 0,1429)
13.2. Qual deverá ser a capacidade de atendimento da refinaria para permitir o acolhimento de todos os
petroleiros que chegam em cerca de 95% dos dias? (R: 5 petroleiros)
13.3. Qual o número esperado de petroleiros chegados por dia? (R: E(X)=2)
13.4. Qual o número mais provável de petroleiros chegados num dia? (R: 1 ou 2)
13.5. Qual a probabilidade de, em dois dias, chegarem 5 petroleiros? (R: 0,1563)

102
14. Um produtor de refrigerantes resolveu lançar uma campanha publicitária, oferecendo prémios impressos
nas cápsulas das garrafas. Durante a campanha, 5% das garrafas distribuídas para venda tinham prémio.
14.1. O Sr. João adquiriu 15 garrafas.
14.1.1. Qual a probabilidade de receber pelo menos 1 prémio? (R: 0,5367)
14.1.2. Qual probabilidade de receber no máximo 5 prémios? (R: 1)
14.1.3. Quantos prémios espera o Sr. João receber? (R: 0,75)
14.2. Um ATL vai fazer uma festa e comprou um lote de 100 refrigerantes. Qual a probabilidade de:
14.2.1. não receber qualquer prémio? (R:0.0067)
14.2.2. receber mais prémios que o esperado? (R: 0.384)

15. A procura diária do produto ZZZ numa determinada loja segue uma distribuição de Poisson. Sabendo que
a média diária é de 3 produtos e que o stock diário é mantido em 6 unidades, calcule:
15.1. a probabilidade de num dia serem procurados pelo menos 2 produtos. (R: 0,8008)
15.2. a probabilidade de se registar uma rutura de stock. (R: 0,0335)
15.3. o novo stock diário a assegurar de forma a que a probabilidade rutura seja no máximo de 0,004.
(R: s=8)
15.4. qual a procura média semanal esperada, sabendo que a loja está aberta todos os dias? Qual a
probabilidade da procura semanal ultrapassar os 20 produtos? (R: 0,5438)

👉 Soluções

1. 1.1.0.2621 1.2. 0.0989 1.3. 0.00014 9. N=25 e p=1/5

2. 2.1.0.3110 2.2. 0.5443 2.3. 0.7667 10. 10.1.1. 0.1126 10.1.2. 0.0293 10.1.3. 0.9972
10.1.4. 0.0035 10.1.5. 0
2.4. 0.0041 2.5. 0.0467 10.2.1. 0.2851 10.2.2. 0.9987 10.3. 20 e 120
3. 3.1. 0.4633 3.2. 0.9946 3.3. 0.75 e 0.7125 11. 11.1. 0.8647 11.2. 0.8647 11.3.0.1954

11.4. 0.0733

4. 4.1. 0.2461 4.2. 0.136 12. 12.1. 0.7127 12.2. 5

5. 0.8418 13. 13.1. 0.1429 13.2. 5 13.3. 2 13.3. 1 ou 2

13.5. 0.1563

6. 6.1. 0.9537 6.2. N=60 6.3. N≥6 14. 14.1.1. 0.5367 14.1.2. 1 14.1.3. 0.75

14.2.1. 0.0067 14.2.2.0.384

7. 7.1. 0.9957 7.2. N≥7 15. 15.1. 0.8008 15.2. 0.0335 15.3. 8 15.4. 0.5438

8. 8.1.1. 0.9884 8.1.2. 0.5 8.2. 2

103

Você também pode gostar