Escolar Documentos
Profissional Documentos
Cultura Documentos
Nele foi inserido toda a teoria sobre a matéria cobrada no certame, para facilitar a sua
compreensão, e marcações das partes mais importantes.
Assim, trabalharemos os assuntos mais importantes para a sua prova com foco na
banca Cesgranrio.
Caso tenha qualquer dúvida, você pode entrar em contato conosco enviando seus
questionamentos para o suporte: suporte@cadernomapeado.com.br e WhatsApp.
Bons Estudos!
Rumo à Aprovação!!
Pessoal!
CONTEÚDO
1. Conceitos gerais: variável, tipos de variáveis, população, amostra, frequências: absoluta e relativa,
frequências acumuladas, representações em gráficos e tabelas (linhas, colunas, setores e histogramas).
2. Medidas de tendência central (em dados brutos ou agrupados em classes): média aritmética, média
geométrica, média ponderada, moda e mediana.
4. Medidas de dispersão (em dados brutos ou agrupados em classes): amplitude, variância, desvio padrão
e coeficiente de variação.
1) Introdução
Gostaríamos de agradecer a confiança depositada em nosso material. Saiba que garantimos que
você terá o material mais adequado para conquista da sua aprovação. Não esqueça que o seu
empenho é fundamental; afinal, passar em um concurso público não é tarefa fácil, mas também não
é algo impossível. Mas não se esqueça: Nós acreditamos em você!
As variáveis em estatística são os atributos ou características que podem ser medidas, observadas
ou manipuladas em um estudo. Vejamos os modos de classificação das variáveis:
Quanto à natureza:
Tome nota!
O CPF (Cadastro de Pessoas Físicas) pode ser considerado uma variável qualitativa se for utilizado
como uma categoria para classificar indivíduos.
Ex.: Por exemplo, se estiver sendo usado para identificar diferentes grupos de pessoas, como
"possui CPF" e "não possui CPF", então é tratado como uma variável qualitativa nominal. Isso ocorre
porque não há uma ordem natural ou numérica inerente aos CPF’s que possa ser usada em cálculos
ou comparações numéricas.
Importante!
Portanto, o tratamento do CPF como variável qualitativa depende do contexto específico de uso na
pesquisa ou na análise em questão. O entendimento da banca CESPE/CEBRASPE é usar o CPF como
uma categoria qualitativa.
Quanto à função:
Variáveis Independentes: São aquelas que são manipuladas ou controladas pelo pesquisador e que
supostamente afetam outra variável, conhecida como variável dependente.
Variáveis Dependentes: São aquelas que são afetadas ou influenciadas pelas variáveis
independentes.
Ex.: Continuando com o exemplo acima, a saúde cardiovascular dos participantes (por exemplo,
medida pela pressão arterial, níveis de colesterol, etc.) pode ser uma variável dependente. Essa
variável é afetada ou influenciada pela quantidade de exercício físico realizado pelos participantes.
Quanto à mensuração:
Variáveis Discretas: Podem assumir apenas valores específicos e isolados dentro de um intervalo,
geralmente valores inteiros.
Ex.: O número de alunos em uma sala de aula é uma variável discreta. Você não pode ter um
número fracionário de alunos. Os valores são contados em números inteiros, como 20 alunos, 21
alunos, etc.
Já caiu em prova!
A idade é geralmente considerada uma variável discreta. Embora possa parecer uma variável
contínua em certos aspectos, já que pode assumir uma variedade de valores dentro de um intervalo
contínuo, na prática, costuma-se agrupar as idades em valores inteiros.
Variáveis Contínuas: Podem assumir qualquer valor dentro de um intervalo, geralmente valores
reais.
Ex.: A altura das pessoas é uma variável contínua. Ela pode variar dentro de um intervalo contínuo,
com valores reais. Por exemplo, uma pessoa pode ter 1,75 metros de altura, outros 1,76 metros e
assim por diante, incluindo valores decimais e uma gama infinita de possibilidades dentro do
intervalo de altura humana.
Ex.: escolaridade (ensino fundamental, ensino médio, ensino superior), estágio da doença (inicial,
intermediário, terminal), mês de observação (janeiro, fevereiro, ..., dezembro).
Ex.: sexo (masculino, feminino), cor dos olhos (azul, verde, castanho), fumante/não fumante,
doente/sadio.
Momento da Questão
Gabarito: Letra B.
Uma população é um conjunto de elementos que compartilham pelo menos uma característica em
comum, e é essencial delimitar claramente quais elementos pertencem e quais não pertencem a essa
população.
Para definir uma população, é importante considerar quem está incluído e quem está excluído,
levando em conta as características específicas que os elementos devem possuir.
Ex.: Se um analista é responsável pelos cursos de educação a distância de uma universidade, pode
ser que o desempenho dos alunos dos cursos presenciais não seja relevante para sua análise.
Ao definir a população, é crucial identificar as características que são relevantes para o analista dos
resultados, restringindo assim o escopo do estudo. Por exemplo, podemos considerar os alunos de
uma universidade em 2010 ou os alunos dos cursos a distância da universidade no mesmo ano. A
cada especificação, estamos refinando as características das pessoas a serem observadas e
restringindo a população objeto de estudo.
Já caiu em prova!
As populações podem ser classificadas como finitas, quando o número de unidades é contável e
limitado, como o número de alunos matriculados em uma escola pública ou o número de alunos
matriculados em uma disciplina específica em uma universidade. Por outro lado, as populações
infinitas são aquelas em que a quantidade de observações é ilimitada ou as unidades da população
não podem ser contadas, como o conjunto de medidas de comprimento ou gases.
4) Amostra
Tome nota!
É crucial garantir que a amostra seja selecionada de forma adequada e representativa, a fim de
evitar distorções nos resultados.
População
Amostra
Amostragem é uma técnica especial usada para recolher amostras que garante o acaso na escolha
de modo a garantir à amostra o caráter de representatividade. Vejamos três dos principais tipos de
amostragem.
10
5) Frequências
Frequências são medidas estatísticas que nos ajudam a entender a distribuição de dados em um
conjunto de observações. Existem diferentes tipos de frequências, cada uma fornecendo
informações específicas sobre os dados, vejamos:
Ex.: Por exemplo, se estamos analisando as idades de um grupo de pessoas e há 5 pessoas com
20 anos, a frequência absoluta para a idade de 20 seria 5.
Ex.: Por exemplo, se temos um total de 100 pessoas em nosso grupo e 20 delas têm 20 anos, a
frequência relativa para a idade de 20 seria 20/100 = 0.2 ou 20%.
Frequência Acumulada: É a soma das frequências absolutas até um determinado valor ou classe
de dados. É útil para visualizar a distribuição acumulada dos dados.
Ex.: Por exemplo, se estamos analisando as idades de um grupo de pessoas e queremos calcular
a frequência acumulada até a idade de 20 anos, somamos todas as frequências absolutas das idades
menores ou iguais a 20 anos.
As frequências absoluta e relativa nos fornecem uma visão detalhada da distribuição dos dados,
enquanto a frequência acumulada nos permite entender a distribuição cumulativa dos dados até
11
Os gráficos são uma ferramenta poderosa para visualizar e entender padrões, tendências e
distribuições nos dados. Eles podem ser usados para representar uma variedade de informações de
maneira clara, legível e interessante, proporcionando uma visão rápida do comportamento de um
fenômeno.
APROVADOS DO CM CURSOS
Carreira Tribunal Carreira Policial Carreira Saúde
80
75
80
60
60
40 25
20
15 15
20 5 5
0
1 Ano de estudo 2 Anos de 3 Anos de
estudos estudos
Neste tipo de gráfico, uma linha é utilizada para representar uma série estatística. Seu principal
propósito é destacar a tendência do fenômeno, mostrando como ele cresce ou decresce ao longo
de um período de tempo. A construção da linha leva em conta o eixo horizontal (eixo "x"), que
representa a escala de tempo, e o eixo vertical (eixo "y"), que representa a frequência observada dos
valores.
12
Gráfico de Setores: Conhecido também como gráfico de “pizza” é eficaz para mostrar a
distribuição de categorias dentro de um todo. Cada categoria é representada por uma fatia da
pizza, e a área de cada fatia é proporcional à sua frequência ou proporção.
APROVADOS DO CM CURSOS
3 Anos de
estudos
15%
2 Anos de
estudos 1 Ano de estudo
25% 60%
Um dos propósitos fundamentais da estatística é condensar os valores assumidos por uma ou mais
variáveis, permitindo uma compreensão global das variações. Para isso, a estatística utiliza tabelas
e gráficos, os quais oferecem de forma rápida e confiável informações sobre as variáveis em estudo.
Essa abordagem possibilita a tomada de decisões administrativas e pedagógicas mais
fundamentadas e científicas. Vejamos quais são elementos essenciais de uma tabela estatística:
13
Ex.:
Tome nota!
A tabela deve ser colocada em posição vertical, para facilitar a leitura dos dados. No caso em que
isso seja impossível, deve ser colocada em posição horizontal, com o título voltado para a margem
esquerda da folha. Se a tabela (ou quadro) não couber em uma página, deve ser continuado na
página seguinte; nesse caso, o final não será delimitado por traço horizontal na parte inferior, e o
cabeçalho será repetido na página seguinte.
14
1) Introdução
Medidas de tendência central são estatísticas que representam valores típicos ou centrais em um
conjunto de dados. Elas são usadas para resumir ou descrever a distribuição dos dados, ajudando a
entender onde a maioria dos valores se concentra. As principais medidas de tendência central são:
3) Média Aritmética
Média sem intervalo de classe: Quando os dados não estão agrupados em intervalos de classe,
podemos calcular a média aritmética utilizando a fórmula básica, que é a soma de todos os valores
dividida pelo número total de valores.
Fórmula: A média aritmética (xˉ) de n números é calculada somando todos os valores (x1,x2
x1+x2+...+xn
,...,xn) e dividindo pela quantidade de valores (n): xˉ= 5
10+15+20+25+30 100
Ex.: Considere o conjunto de dados: 10, 15, 20, 25, 30. A média aritmética é: xˉ= 5
=5
=20
15
Em certos conjuntos de dados, a média pode ser um valor que não existe na série de dados. Isso
ocorre especialmente quando os dados não estão uniformemente distribuídos em torno da média,
resultando em uma média que está além do alcance dos próprios dados.
Ex.: Com os valores 2, 4, 6 e 8, a média aritmética é de 5. No entanto, nenhum dos valores na série
de dados é realmente 5. Isso pode acontecer quando os dados não estão simetricamente distribuídos
em torno da média, fazendo com que a média seja puxada para longe dos próprios dados.
Importante!
Nesses casos, embora a média seja uma medida de tendência central útil para resumir os dados, é
importante interpretar o resultado com cautela e considerar outras medidas de tendência central,
como a mediana, que pode ser mais representativa em conjuntos de dados assimétricos ou com
valores discrepantes.
Média com intervalo de classe: Quando os dados estão agrupados em intervalos de classe, é
necessário ajustar a fórmula de cálculo da média para levar em conta os intervalos de classe e as
frequências.
Fórmula: A média aritmética (xˉ) para dados agrupados em intervalos de classe é calculada
∑f⋅m
usando a fórmula: xˉ=
∑f
Onde f é a frequência de cada intervalo de classe e m é o ponto médio de cada intervalo.
(2⋅5)+(5⋅15)+(8⋅25)+(4⋅35)+(1⋅45)
xˉ= 2+5+8+4+1
10+75+200+140+45 470
xˉ= 20
xˉ= 20 = 23,5
4) Média Geométrica
16
Ex.: Considere o conjunto de dados sem intervalo de classe: 2, 4, 8, 16, 32. A média geométrica é:
5
√2 x 4 x 8 x 16 x 32
5
√32768 ≈8
Média com intervalo de classe: Para calcular a média geométrica com dados agrupados em
intervalos de classe, você precisa usar os pontos médios dos intervalos de classe e as respectivas
frequências. A fórmula é a mesma que a de sem intervalo de classe, mas você deve usar os pontos
médios dos intervalos de classe e suas respectivas frequências no cálculo.
5) Média Ponderada
A média ponderada leva em consideração o peso de cada valor no cálculo da média. Cada valor é
multiplicado pelo seu respectivo peso (ou coeficiente) e a soma desses produtos é dividida pela
soma dos pesos. É útil quando alguns valores têm mais importância ou representatividade do que
outros no conjunto de dados.
Média sem intervalo de classe: A média ponderada é calculada multiplicando cada valor pelo
seu respectivo peso, somando os produtos e dividindo pela soma dos pesos.
Ex.: Considere um conjunto de dados sem intervalo de classe: 10 (peso 2), 20 (peso 3), 30 (peso
5).
(2×10)+(3×20)+(5×30) 20+60+150 230
A média ponderada é: = = = 23
2+3+5 10 10
17
A fórmula é a mesma que a de sem intervalo de classe, mas você deve usar os pontos médios
dos intervalos de classe e suas respectivas frequências no cálculo.
Intervalo de classe: 1-10 (frequência 3), 11-20 (frequência 5), 21-30 (frequência 2)
Ponto médio de cada intervalo: 5.5, 15.5, 25.5
6) Moda
A moda é o valor que ocorre com maior frequência em um conjunto de dados. É a medida de
tendência central mais simples de calcular e pode ser útil para identificar o valor mais comum ou
frequente em uma distribuição.
Para os dados não agrupados, simplesmente se observa o elemento (ou elementos) de maior
frequência.
Ex.: Considere o conjunto de dados: 5, 7, 7, 9, 9, 9, 11, 13, 13. Para encontrar a moda, observamos
quais valores se repetem com mais frequência. Aqui, o valor 9 ocorre com mais frequência (três
vezes), então a moda é 9.
7) Mediana
A mediana é o valor que divide um conjunto de dados ordenado ao meio, ou seja, 50% dos valores
estão acima da mediana e 50% estão abaixo dela. É menos sensível a valores extremos do que a
média aritmética e é frequentemente usada em distribuições assimétricas ou quando se deseja uma
medida de tendência central robusta.
Ex.: Considere o conjunto de dados: 15, 20, 25, 30, 35. Para encontrar a mediana, primeiro
ordenamos os dados: 15, 20, 25, 30, 35. Como o número de observações é ímpar (neste caso, 5), a
mediana é o valor central, que é 25.
18
MEDIDAS DE POSIÇÃO
1) Introdução
2) Percentil e Quartil
Percentil, como o próprio nome sugere, está relacionado a porcentagem, sendo uma medida que
divide um conjunto de dados em cem partes ordenadas da menor para a maior. Em outras palavras,
cada percentil representa uma proporção específica dos dados.
Para ilustrar esse conceito, imagine uma régua de um metro dividida em cem partes iguais, onde
cada divisão representa um percentil.
Ex.: o décimo percentil corresponde aos 10% menores valores do conjunto de dados, o vigésimo
percentil aos 20% menores valores, e assim por diante.
Importante!
É importante destacar que o percentil se refere aos valores menores e determina uma porcentagem
ordenada desses valores.
Tome nota!
Por vezes, você pode ouvir alguém mencionar que um valor não está contido no percentil 90. Isso
indica que esse valor está entre os 10% maiores valores do conjunto de dados, já que o percentil
90 representa os 90% menores valores.
19
Ex.: O primeiro quartil (Q1) divide os dados em 25% menores valores, o segundo quartil (Q2) em
50% menores valores, e assim por diante até o terceiro quartil (Q3), que divide os dados em 75%
menores valores. Essa divisão é útil para compreender a distribuição dos dados e identificar
tendências centrais e dispersões em um conjunto de dados.
Colocando em prática!
Analise o conjunto de dados abaixo que representa as notas de 0 a 100 que nove alunos tiraram em
uma prova:
A primeira coisa a ser feita para encontrar os quartis é ordenar esses valores do menor ao maior.
Teremos o conjunto abaixo:
Começaremos encontrando o quartil 2 (Q2), que representa o percentil 50, ou seja, está exatamente
no meio dos dados. Como os dados já estão ordenados, o Q2 também é a mediana, que é o número
que está no meio do conjunto de dados ordenados. Portanto, Q2=33.
Agora, para encontrar o quartil 1 (Q1), devemos considerar os dados à esquerda de Q2. Temos um
número par de dados nessa parte: 13,17,25,28. Nesse caso, a mediana será a média entre os dois
valores do meio deste subconjunto: (17+25)/2=21. Assim, Q1=21.
Para encontrar o quartil 3 (Q3), seguimos o mesmo procedimento, considerando os dados à direita
de Q2: 41,65,69,72. Novamente, temos um número par de dados nessa parte. A mediana desses
valores é a média de 65 e 69: (65+69)/2=67. Portanto, Q3=67.
Esses quartis nos fornecem informações sobre a distribuição das notas dos alunos, permitindo-nos
entender melhor a dispersão e a tendência central do conjunto de dados. No nosso caso, o ponto
Q1=21 indica que até esse valor estão agrupadas as 25% menores notas dos 9 alunos, o que sugere
que um quarto da turma obteve notas relativamente baixas. O ponto Q2=33 indica que até esse
valor estão as 50% menores notas, ou seja, metade da turma obteve notas abaixo desse ponto.
Finalmente, o ponto Q3=67 revela que até esse valor estão representadas as 75% menores notas da
turma.
Essas conclusões nos permitem entender a distribuição das notas e nos dão uma ideia do
desempenho geral dos alunos. No caso específico mencionado, se 75% dos alunos obtiveram notas
abaixo de 67 em um intervalo de 0 a 100, podemos inferir que a maioria das notas foi relativamente
baixa, sugerindo que pode ser necessário investigar as razões por trás desse desempenho e tomar
medidas para melhorar o aprendizado dos alunos.
20
1) Introdução
2) Amplitude
A amplitude total (AT) em dados não agrupados é simplesmente a diferença entre o maior e o menor
valor da série de dados. A fórmula é:
AT=Xmáximo−Xminímo
Onde:
Vamos exemplificar: Com os valores 30, 45, 48, 62 e 72, a amplitude total seria: AT=72−30=42
A amplitude total tem suas limitações. Ela apenas considera os dois valores extremos da série
de dados e não leva em conta a distribuição dos valores intermediários. Isso pode torná-la uma
medida de dispersão imprecisa em muitos casos.
Vejamos no caso em que os dados estejam agrupados sem intervalos de classe, ainda teremos:
𝑿𝒊 𝒇𝒊
0 2
1 6
3 5
4 3
Com intervalos de classe a amplitude total é a diferença entre o limite superior da última classe e o
limite inferior da primeira classe.
Classes Frequência
150├ 154 4
154├ 158 9
158├ 162 11
162├ 166 8
166├ 170 5
170├ 174 3
21
Quanto maior a amplitude total, maior é a dispersão ou variabilidade dos valores da variável. A
amplitude total é frequentemente empregada ao se quer determinar a variação da temperatura em
um dia ou ao longo de um ano, bem como no controle de qualidade. Ela serve como uma medida
rápida, embora não muito precisa, de variação nos dados.
A variância e o desvio padrão são medidas de dispersão que nos ajudam a entender o quão
espalhados os dados estão em relação à média. Vamos diferenciar esses conceitos:
A variância, representada por: 𝒔𝟐 , é calculada como a média dos quadrados dos desvios de cada
valor em relação à média aritmética.
Os desvios são simplesmente as diferenças entre cada valor individual e a média do conjunto
de dados. Ele leva em conta todos os valores da variável em estudo, o que o torna uma medida
robusta e estável de variabilidade.
A variância é especialmente útil quando queremos entender a dispersão dos dados em torno da
média e comparar essa dispersão entre diferentes conjuntos de dados.
No entanto, como a variância é uma medida de dispersão que envolve quadrados, sua unidade de
medida é o quadrado da unidade original dos dados, o que pode dificultar sua interpretação em
relação aos dados originais.
Por isso, frequentemente usamos o desvio padrão (𝒔), que é a raiz quadrada da variância, pois está
na mesma unidade dos dados originais e é mais facilmente interpretável.
Ex.: Como exemplo, consideremos que foi aplicado um teste a dois grupos com cinco alunos cada,
o grupo A obteve os seguintes pontos 6, 8, 7, 4, 10 e o grupo B 9, 7, 8, 5, 6. Utilizando a variância
vamos determinar o grupo mais regular:
Grupo A:
Pontos: 6, 8, 7, 4, 10
5+8+7+4+10 35
Média: ̅X̅̅A̅= 5
= =7
5
Desvios em relação à média: -1, 1, 0, -3, 3
Quadrados dos desvios: 1, 1, 0, 9, 9
22
Grupo B:
Pontos: 9, 7, 8, 5, 6
̅̅̅B = 9+7+8+5+6= =35=7
Média: X 5 5
Desvios em relação à média: 2, 0, 1, -2, -1
Quadrados dos desvios: 4, 0, 1, 4, 1
4+0+1+4+1 10
Variância s2B: = 5
= 5 =2
Comparando as variâncias dos dois grupos, observamos que a variância do grupo B é menor que a
do grupo A. Portanto, o grupo B é mais regular em relação à distribuição dos pontos obtidos no
teste.
Utilizando a desvio padrão, temos: O símbolo para o desvio padrão em um conjunto de dados
observados é s, e a fórmula para obter o desvio padrão é a seguinte:
̅h2
√|^Xi – X
2
Onde:
A fórmula anterior é utilizada quando estamos trabalhando com uma distribuição de dados não
agrupados. Considerando os valores 30, 45, 48, 62 e 72, vamos construir a tabela a seguir para facilitar
o cálculo do desvio padrão.
𝑿𝒊 ̅𝒊
𝑿 ̅h
^𝑿𝒊 – X ^𝑿𝒊 – ̅̅̅
𝑿𝒊 h
2
Como n = 5, temos:
√1047,2
s= = 14,47
5
Desvio Padrão para Dados Agrupados com Intervalo de Classe: Ao calcular o desvio padrão
para dados agrupados com intervalo de classe, é comum usar o ponto médio de cada classe como
o valor de 𝑿𝒊 na fórmula do desvio padrão.
23
99 33
√ -( )2 =√6,18-2,06 = 2,03
16 16
4) Coeficiente de Variação
O coeficiente de variação, conhecido como Pearson é uma medida estatística que expressa a
variabilidade dos dados em termos relativos ao valor médio da série. É calculado como a razão
entre o desvio padrão e a média dos dados.
6
Portanto, o coeficiente de variação de Pearson seria: Coeficiente de Variação =
3
≈ 0.182
Ex.: Consideremos o exemplo da tabela a seguir:
24
Essa medida nos permite comparar a dispersão ou variabilidade de diferentes conjuntos de dados,
mesmo que estejam em escalas diferentes. Quanto maior o coeficiente de variação, maior é a
dispersão relativa em relação à média. Isso nos permite avaliar a variabilidade dos dados de forma
mais contextualizada, levando em consideração o valor médio da série.
PROBABILIDADE
1) Introdução
2) Probabilidade
Uma pesquisa de opinião para determinar quantos eleitores votarão em um candidato específico
na próxima eleição ou quantos alunos almoçam no restaurante universitário.
Nos exemplos mencionados, a incerteza está sempre presente. Isso significa que, se esses
experimentos forem repetidos em condições idênticas, não podemos determinar com certeza qual
resultado ocorrerá. Tais experimentos são conhecidos como experimentos aleatórios. A incerteza
está associada à chance de ocorrência atribuída ao resultado de interesse.
Ex.: Para determinar a probabilidade de chover neste final de semana na Praia do Futuro, em
Fortaleza, podemos considerar o conjunto de possibilidades:
Para calcular essa probabilidade, podemos usar nossa intuição subjetiva ou usar a frequência
relativa dos últimos dez fins de semana em que choveu, fornecendo uma abordagem mais
objetiva.
25
Onde:
No caso do dado honesto e equilibrado, cada face tem a mesma probabilidade de ser sorteada,
então n(S)=6. E o número de casos favoráveis à ocorrência de você ganhar é n(F)=3, já que há três
faces pares (2, 4 e 6).
3 1
Portanto: P(ganhar)= =
6 2
Hora da História
Historicamente, a Teoria da Probabilidade teve origem no estudo de jogos de azar, como roleta e
cartas, desde o século XVI. A partir daí, desenvolveu-se para se tornar uma ferramenta fundamental
em diversas áreas, incluindo estatística, ciências naturais, economia e engenharia.
Ex.: Por exemplo, se S = {1, 2, 3, 4, 5, 6}, então um evento elementar seria um único número, como
o evento "sair o número 3".
26
Ex.: Por exemplo, se considerarmos o espaço amostral S = {chove, não chove}, um evento seria
"chove" ou "não chove". O evento "chove" seria um subconjunto de S, contendo apenas o elemento
"chove".
Ex.: Outro exemplo com o espaço amostral S = {1, 2, 3, 4, 5, 6}, poderíamos definir o evento B
como "sair uma face par", representado por B = {2, 4, 6}, que é um subconjunto de S.
Além disso, podemos definir eventos como o evento C, que seria "sair uma face ímpar", representado
por C = {1, 3, 5}, também um subconjunto de S.
Intersecção: A ∩ B é o
União: A ∪ B é o evento evento que ocorre se A e
que ocorre se A ocorre B ocorrem Complementar: AC ou A
ou B ocorre ou ambos simultaneamente. ocorrer é o evento que
ocorrem Se A ∩ B = ∅, então A e B ocorre se A não ocorrer.
simultaneamente. são mutuamente
exclusivos ou disjuntos.
B → D = sair uma face par e maior que 3. Então, B → D = {2, 4, 6} → {4, 5, 6} = {4, 6}
B → C = sair uma face par e ímpar. Então, B → C = {2, 4, 6} → {1, 3, 5} = ∅ (B e C são disjuntos).
CB=BC=∅
B ∪ D = sair uma face par ou maior que 3. Então, B ∪ D = {2, 4, 6} ∪ {4, 5, 6} = {2, 4, 5, 6}
B ∪ C = sair uma face par ou ímpar. Então, B ∪ C = {2, 4, 6} ∪ {1, 3, 5} = {1, 2, 3, 4, 5, 6}
3) Probabilidade de Laplace
27
Espaços Equiprováveis: Um espaço amostral onde todos os resultados possíveis têm a mesma
probabilidade de ocorrência é chamado de espaço equiprovável. Isso significa que cada resultado
é igualmente provável de ocorrer.
Ex.: Por exemplo, ao lançar uma moeda honesta, os resultados possíveis (cara ou coroa) têm igual
probabilidade de ocorrer.
Espaços Não Equiprováveis: Um espaço amostral onde os resultados possíveis não têm a
mesma probabilidade de ocorrência é chamado de espaço não equiprovável. Isso significa que
alguns resultados são mais prováveis do que outros.
5) Teorema do Produto
Ex.: Por exemplo, a probabilidade de obter cara em dois lançamentos consecutivos de uma moeda
justa é (1/2) * (1/2) = 1/4.
Ex.: Lançamento de uma moeda justa (A) e lançamento de um dado justo (B). A probabilidade de
obter cara na moeda não é afetada pelo resultado do lançamento do dado.
28
Onde:
O Teorema de Bayes permite atualizar as probabilidades à medida que novas evidências são obtidas.
Inicialmente, temos uma crença a priori sobre a probabilidade de um evento ocorrer (P(A)) e, em
seguida, utilizamos as probabilidades condicionais P(B|A) e P(A|B) para ajustar essa crença com base
nas informações adicionais fornecidas por B.
Tome nota!
O teorema é particularmente útil quando se lida com incertezas e informações incompletas. Ele
fornece uma estrutura formal para a atualização de probabilidades com base em novas evidências,
tornando-se uma ferramenta poderosa para a tomada de decisões em ambientes incertos.
O Teorema de Bayes tem uma ampla gama de aplicações em diversos domínios, incluindo medicina,
diagnóstico, processamento de sinais, aprendizado de máquina e análise estatística. É uma
ferramenta valiosa para inferência estatística e raciocínio probabilístico, permitindo que tomemos
decisões informadas com base em evidências disponíveis.
29
Ex.: Em uma fábrica de lâmpadas há uma linha de produção apenas para lâmpadas
incandescentes.
O embalamento é feito de forma que 10 unidades das lâmpadas são colocadas em cada
embalagem.
O gestor sabe que, dessa linha de produção, a probabilidade de sair uma lâmpada com
defeito corresponde a 5%.
O que ele deseja saber é qual a probabilidade de serem embaladas 3 lâmpadas com defeito
na mesma embalagem.
P = 0,05;
n = 10;
k = 3.
Mas atenção, P não será apresentada a probabilidade de não ser defeituosa a lâmpada, mas a
probabilidade de um defeito ocorrer.
30
31