Você está na página 1de 31

1

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Você acaba de adquirir o material de Noções de Probabilidade e Estatística para o
concurso da CAIXA ECONÔMICA FEDERAL.

Esse material é totalmente focado no certame e aborda ponto a ponto do edital da


disciplina de Noções de Probabilidade e Estatística.

Nele foi inserido toda a teoria sobre a matéria cobrada no certame, para facilitar a sua
compreensão, e marcações das partes mais importantes.

Assim, trabalharemos os assuntos mais importantes para a sua prova com foco na
banca Cesgranrio.

Caso tenha qualquer dúvida, você pode entrar em contato conosco enviando seus
questionamentos para o suporte: suporte@cadernomapeado.com.br e WhatsApp.

Bons Estudos!

Rumo à Aprovação!!

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


CONSIDERAÇÕES INICIAIS .......................................................................................................................... 5
CONCEITOS GERAIS ...................................................................................................................................... 6
1) Introdução.................................................................................................................................................. 6
2) Variável e Tipos de Variáveis ................................................................................................................. 6
3) População................................................................................................................................................... 9
4) Amostra ...................................................................................................................................................... 9
5) Frequências .............................................................................................................................................. 11
5) Representações em Gráficos e Tabelas ............................................................................................. 12
5.1) Representações em Gráficos ............................................................................................................ 12
5.2) Representações em Tabelas ............................................................................................................. 13
MEDIDAS DE TENDÊNCIA CENTRAL....................................................................................................... 15
1) Introdução................................................................................................................................................ 15
2) Medidas de Tendência Central ou Medidas de Posição................................................................ 15
3) Média Aritmética .................................................................................................................................... 15
4) Média Geométrica .................................................................................................................................. 16
5) Média Ponderada ................................................................................................................................... 17
6) Moda ......................................................................................................................................................... 18
7) Mediana .................................................................................................................................................... 18
MEDIDAS DE POSIÇÃO .............................................................................................................................. 19
1) Introdução................................................................................................................................................ 19
2) Percentil e Quartil .................................................................................................................................. 19
MEDIDAS DE DISPERSÃO .......................................................................................................................... 21
1) Introdução................................................................................................................................................ 21
2) Amplitude ................................................................................................................................................ 21
3) Variância e Desvio Padrão.................................................................................................................... 22
3.1) Propriedades do desvio padrão ...................................................................................................... 23
4) Coeficiente de Variação ........................................................................................................................ 24
PROBABILIDADE.......................................................................................................................................... 25
1) Introdução................................................................................................................................................ 25
2) Probabilidade .......................................................................................................................................... 25

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


2.1) Espaço Amostral e Eventos ............................................................................................................... 26
2.2) Operações com Eventos .................................................................................................................... 27
3) Probabilidade de Laplace ..................................................................................................................... 27
4) Espaços Equiprováveis e Não Equiprováveis ................................................................................... 28

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


CONSIDERAÇÕES INICIAIS

Pessoal!

Antes de iniciarmos o estudo de Noções de Probabilidade e Estatística, apresentaremos os


assuntos que deverão ser cobrados no edital da CAIXA ECONÔMICA FEDERAL.

CONTEÚDO

1. Conceitos gerais: variável, tipos de variáveis, população, amostra, frequências: absoluta e relativa,
frequências acumuladas, representações em gráficos e tabelas (linhas, colunas, setores e histogramas).

2. Medidas de tendência central (em dados brutos ou agrupados em classes): média aritmética, média
geométrica, média ponderada, moda e mediana.

3. Medidas de Posição: quartis e percentis.

4. Medidas de dispersão (em dados brutos ou agrupados em classes): amplitude, variância, desvio padrão
e coeficiente de variação.

5. Probabilidade: experimento aleatório, espaço amostral, evento; espaços equiprováveis; probabilidade de


Laplace; espaços não equiprováveis; teorema do produto; probabilidade condicional e independência;
distribuição binomial.

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


CONCEITOS GERAIS

1) Introdução

Iniciaremos os estudos do Concurso da Caixa Econômica Federal abordando conceitos gerais da


disciplina de estatística.

1 - Conceitos gerais: variável, tipos de variáveis, população, amostra, frequências: absoluta e


relativa, frequências acumuladas, representações em gráficos e tabelas (linhas, colunas,
setores e histogramas).

Gostaríamos de agradecer a confiança depositada em nosso material. Saiba que garantimos que
você terá o material mais adequado para conquista da sua aprovação. Não esqueça que o seu
empenho é fundamental; afinal, passar em um concurso público não é tarefa fácil, mas também não
é algo impossível. Mas não se esqueça: Nós acreditamos em você!

2) Variável e Tipos de Variáveis

As variáveis em estatística são os atributos ou características que podem ser medidas, observadas
ou manipuladas em um estudo. Vejamos os modos de classificação das variáveis:

Quanto à natureza:

Variáveis Qualitativas: Variáveis Quantitativas:

Representam características não numéricas ou Representam medidas numéricas ou quantidades.


categorias. Podem ser discretas, quando os valores são
Podem ser nominais, quando não há uma ordem contáveis e separados por intervalos (por exemplo,
específica entre as categorias (por exemplo, sexo, cor número de filhos, quantidade de itens vendidos) ou
dos olhos) ou ordinais, quando há uma ordem entre contínuas, quando os valores podem assumir
as categorias (por exemplo, nível de escolaridade, qualquer valor dentro de um intervalo (por exemplo,
classe social). altura, peso).

Tome nota!

O CPF (Cadastro de Pessoas Físicas) pode ser considerado uma variável qualitativa se for utilizado
como uma categoria para classificar indivíduos.

Ex.: Por exemplo, se estiver sendo usado para identificar diferentes grupos de pessoas, como
"possui CPF" e "não possui CPF", então é tratado como uma variável qualitativa nominal. Isso ocorre
porque não há uma ordem natural ou numérica inerente aos CPF’s que possa ser usada em cálculos
ou comparações numéricas.

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Porém, é importante mencionar que em algumas análises ou contextos, o CPF pode ser considerado
uma variável identificadora, que não é necessariamente usada como uma variável em si, mas sim
como um meio de identificar e distinguir indivíduos de forma única. Nesse caso, o CPF não seria
considerado uma variável nos termos tradicionais da análise estatística.

Importante!

Portanto, o tratamento do CPF como variável qualitativa depende do contexto específico de uso na
pesquisa ou na análise em questão. O entendimento da banca CESPE/CEBRASPE é usar o CPF como
uma categoria qualitativa.

Quanto à função:

Variáveis Independentes: São aquelas que são manipuladas ou controladas pelo pesquisador e que
supostamente afetam outra variável, conhecida como variável dependente.

Ex.: Em um estudo sobre os efeitos do exercício físico na saúde cardiovascular, a quantidade de


exercício semanal (medida em horas) pode ser uma variável independente. Nesse caso, o
pesquisador manipula ou controla a quantidade de exercício que os participantes realizam.

Variáveis Dependentes: São aquelas que são afetadas ou influenciadas pelas variáveis
independentes.

Ex.: Continuando com o exemplo acima, a saúde cardiovascular dos participantes (por exemplo,
medida pela pressão arterial, níveis de colesterol, etc.) pode ser uma variável dependente. Essa
variável é afetada ou influenciada pela quantidade de exercício físico realizado pelos participantes.

Quanto à mensuração:

Variáveis Discretas: Podem assumir apenas valores específicos e isolados dentro de um intervalo,
geralmente valores inteiros.

Ex.: O número de alunos em uma sala de aula é uma variável discreta. Você não pode ter um
número fracionário de alunos. Os valores são contados em números inteiros, como 20 alunos, 21
alunos, etc.

Já caiu em prova!

A idade é geralmente considerada uma variável discreta. Embora possa parecer uma variável
contínua em certos aspectos, já que pode assumir uma variedade de valores dentro de um intervalo
contínuo, na prática, costuma-se agrupar as idades em valores inteiros.

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Ex.: Por exemplo, uma pessoa pode ter 25 anos, 26 anos, 27 anos e assim por diante, sem a
possibilidade de ter uma idade como 25,5 anos. Portanto, é comum tratarmos a idade como uma
variável discreta em muitas análises estatísticas e estudos de pesquisa.

Variáveis Contínuas: Podem assumir qualquer valor dentro de um intervalo, geralmente valores
reais.

Ex.: A altura das pessoas é uma variável contínua. Ela pode variar dentro de um intervalo contínuo,
com valores reais. Por exemplo, uma pessoa pode ter 1,75 metros de altura, outros 1,76 metros e
assim por diante, incluindo valores decimais e uma gama infinita de possibilidades dentro do
intervalo de altura humana.

Variáveis Ordinais: Há uma ordem ou hierarquia entre as categorias.

Ex.: escolaridade (ensino fundamental, ensino médio, ensino superior), estágio da doença (inicial,
intermediário, terminal), mês de observação (janeiro, fevereiro, ..., dezembro).

Variáveis Nominais: Não há uma ordem ou hierarquia entre as categorias.

Ex.: sexo (masculino, feminino), cor dos olhos (azul, verde, castanho), fumante/não fumante,
doente/sadio.

Momento da Questão

CESPE/CEBRASPE (2024) – Considerando um formulário com as variáveis nome, altura, idade,


CPF e peso, julgue os itens a seguir.

I Nesse formulário, há quatro variáveis quantitativas e uma variável qualitativa.

II A altura e o peso são exemplos de variáveis quantitativas contínuas.

III Idade é um exemplo de variável qualitativa ordinal.

Assinale a opção correta.

a) Nenhum item está certo.

b) Apenas o item II está certo.

c) Apenas o item III está certo.

d) Apenas os itens I e II estão certos.

e) Apenas os itens I e III estão certos.

Gabarito: Letra B.

Comentário: A altura e o peso são exemplos de variáveis quantitativas contínuas.

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


3) População

Uma população é um conjunto de elementos que compartilham pelo menos uma característica em
comum, e é essencial delimitar claramente quais elementos pertencem e quais não pertencem a essa
população.

Ex.: Os alunos de uma universidade ou os clientes de um banco são exemplos de populações.

Para definir uma população, é importante considerar quem está incluído e quem está excluído,
levando em conta as características específicas que os elementos devem possuir.

Ex.: Se um analista é responsável pelos cursos de educação a distância de uma universidade, pode
ser que o desempenho dos alunos dos cursos presenciais não seja relevante para sua análise.

Ao definir a população, é crucial identificar as características que são relevantes para o analista dos
resultados, restringindo assim o escopo do estudo. Por exemplo, podemos considerar os alunos de
uma universidade em 2010 ou os alunos dos cursos a distância da universidade no mesmo ano. A
cada especificação, estamos refinando as características das pessoas a serem observadas e
restringindo a população objeto de estudo.

Já caiu em prova!

As populações podem ser classificadas como finitas, quando o número de unidades é contável e
limitado, como o número de alunos matriculados em uma escola pública ou o número de alunos
matriculados em uma disciplina específica em uma universidade. Por outro lado, as populações
infinitas são aquelas em que a quantidade de observações é ilimitada ou as unidades da população
não podem ser contadas, como o conjunto de medidas de comprimento ou gases.

4) Amostra

Depois de definir as características da população, o próximo passo é realizar o levantamento de


dados sobre as características do objeto em estudo. No entanto, nem sempre é viável ou
conveniente realizar o levantamento de dados de toda a população que se deseja analisar. Isso se
deve a uma série de fatores, tais como:

Custo: O processo de coleta,


Tempo: Muitas vezes, é
Precisão: É fundamental que as sistematização, análise e
necessário obter as informações
informações coletadas sejam interpretação dos dados pode ser
com rapidez para atender a
precisas e confiáveis. dispendioso.
prazos ou necessidades urgentes.
Entretanto, em populações muito Realizar o levantamento de
Coletar dados de uma população
grandes, garantir a precisão de dados de uma população inteira
inteira pode demandar um
cada dado coletado pode ser pode acarretar em custos
tempo considerável, tornando-se
desafiador e sujeito a erros. significativos, os quais podem ser
inviável em muitos casos.
impraticáveis ou não justificados.

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Portanto, em muitos casos, é mais prático e econômico realizar um levantamento por amostragem,
onde apenas uma parte representativa da população é selecionada para análise. Isso permite obter
uma estimativa precisa das características da população como um todo, ao mesmo tempo em que
economiza tempo e recursos.

Tome nota!

É crucial garantir que a amostra seja selecionada de forma adequada e representativa, a fim de
evitar distorções nos resultados.

Por impossibilidade ou inviabilidade econômica ou temporal, devemos, então, delimitar nossas


observações a uma parte da população, isto é, a uma amostra proveniente dessa população.

População

Amostra

Amostragem é uma técnica especial usada para recolher amostras que garante o acaso na escolha
de modo a garantir à amostra o caráter de representatividade. Vejamos três dos principais tipos de
amostragem.

10

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Amostragem Casual Simples Amostragem Sistemática Amostragem Estratificada

Também conhecida como


amostragem aleatória
Os elementos da população A população é dividida em
simples, consiste na seleção
são selecionados de acordo subgrupos distintos,
de elementos da população de
com um sistema pré- chamados de estratos, com
forma aleatória, garantindo
estabelecido, como uma base em características
que todos os elementos
ordem numérica, alfabética ou relevantes, como sexo, idade,
tenham a mesma
cronológica. renda ou região geográfica.
probabilidade de serem
escolhidos.

Isso pode ser feito através de


Em seguida, uma amostra é
sorteio, utilizando métodos
Por exemplo, pode-se selecionada de cada estrato de
como urnas, tabelas de
selecionar a cada décimo forma independente,
números aleatórios ou
elemento de uma lista garantindo representatividade
softwares especializados em
ordenada. para cada segmento da
geração de números
população.
aleatórios.

5) Frequências

Frequências são medidas estatísticas que nos ajudam a entender a distribuição de dados em um
conjunto de observações. Existem diferentes tipos de frequências, cada uma fornecendo
informações específicas sobre os dados, vejamos:

Frequência Absoluta: É o número de vezes que um determinado valor ocorre em um conjunto


de dados.

Ex.: Por exemplo, se estamos analisando as idades de um grupo de pessoas e há 5 pessoas com
20 anos, a frequência absoluta para a idade de 20 seria 5.

Frequência Relativa: É a proporção ou percentual de observações em relação ao total de


observações. É calculada dividindo a frequência absoluta de um valor pelo tamanho total da amostra.

Ex.: Por exemplo, se temos um total de 100 pessoas em nosso grupo e 20 delas têm 20 anos, a
frequência relativa para a idade de 20 seria 20/100 = 0.2 ou 20%.

Frequência Acumulada: É a soma das frequências absolutas até um determinado valor ou classe
de dados. É útil para visualizar a distribuição acumulada dos dados.

Ex.: Por exemplo, se estamos analisando as idades de um grupo de pessoas e queremos calcular
a frequência acumulada até a idade de 20 anos, somamos todas as frequências absolutas das idades
menores ou iguais a 20 anos.

As frequências absoluta e relativa nos fornecem uma visão detalhada da distribuição dos dados,
enquanto a frequência acumulada nos permite entender a distribuição cumulativa dos dados até

11

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


um determinado ponto. Essas medidas são fundamentais na análise estatística e são frequentemente
utilizadas para resumir e interpretar conjuntos de dados.

5) Representações em Gráficos e Tabelas

Os gráficos são uma ferramenta poderosa para visualizar e entender padrões, tendências e
distribuições nos dados. Eles podem ser usados para representar uma variedade de informações de
maneira clara, legível e interessante, proporcionando uma visão rápida do comportamento de um
fenômeno.

5.1) Representações em Gráficos

Gráfico em barras ou em colunas: Um gráfico de barras é uma representação visual onde os


dados são apresentados através de retângulos dispostos horizontalmente. Cada retângulo tem seu
comprimento proporcional à frequência de cada categoria ou valor dos dados. Esse tipo de gráfico
é altamente adequado para representar graficamente dados qualitativos, como categorias ou
grupos, mas também pode ser utilizado para dados quantitativos discretos.

APROVADOS DO CM CURSOS
Carreira Tribunal Carreira Policial Carreira Saúde
80
75
80
60
60

40 25
20
15 15
20 5 5
0
1 Ano de estudo 2 Anos de 3 Anos de
estudos estudos

Gráfico de Linhas: É usado para representar tendências ao longo do tempo ou em uma


sequência ordenada. Os pontos de dados são conectados por linhas, tornando mais fácil identificar
padrões e mudanças ao longo do tempo.

Neste tipo de gráfico, uma linha é utilizada para representar uma série estatística. Seu principal
propósito é destacar a tendência do fenômeno, mostrando como ele cresce ou decresce ao longo
de um período de tempo. A construção da linha leva em conta o eixo horizontal (eixo "x"), que
representa a escala de tempo, e o eixo vertical (eixo "y"), que representa a frequência observada dos
valores.

12

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


APROVADOS DO CM CURSOS
250
200
150
100
50
0
1 Ano de 2 Anos de 3 Anos de
estudo estudos estudos
Carreira Saúde 75 20 5
Carreira Policial 80 15 5
Carreira Tribunal 60 25 15

Carreira Tribunal Carreira Policial Carreira Saúde

Gráfico de Setores: Conhecido também como gráfico de “pizza” é eficaz para mostrar a
distribuição de categorias dentro de um todo. Cada categoria é representada por uma fatia da
pizza, e a área de cada fatia é proporcional à sua frequência ou proporção.

APROVADOS DO CM CURSOS
3 Anos de
estudos
15%

2 Anos de
estudos 1 Ano de estudo
25% 60%

1 Ano de estudo 2 Anos de estudos 3 Anos de estudos

5.2) Representações em Tabelas

Um dos propósitos fundamentais da estatística é condensar os valores assumidos por uma ou mais
variáveis, permitindo uma compreensão global das variações. Para isso, a estatística utiliza tabelas
e gráficos, os quais oferecem de forma rápida e confiável informações sobre as variáveis em estudo.
Essa abordagem possibilita a tomada de decisões administrativas e pedagógicas mais
fundamentadas e científicas. Vejamos quais são elementos essenciais de uma tabela estatística:

13

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Título: Uma descrição concisa Cabeçalho: A parte superior da
Corpo: A parte principal da tabela
que responde às perguntas: O tabela onde são designadas as
composta por linhas e colunas. É
que está sendo representado na naturezas do conteúdo de cada
onde os dados são organizados e
tabela? Onde ocorreu o coluna. É onde você encontra as
apresentados de maneira
fenômeno? Quando ocorreu o categorias ou variáveis que estão
sistemática.
fenômeno? sendo medidas.

Coluna Indicadora: Uma coluna


que contém as descrições Colunas: Sequências verticais de Linhas: Sequências horizontais de
correspondentes aos valores informações que representam as informações que representam as
distribuídos nas colunas diferentes categorias, variáveis ou observações individuais, casos ou
numéricas. Pode conter rótulos, medidas. unidades de análise.
códigos ou categorias.

Rodapé: O espaço abaixo da


Casa ou célula: O ponto de Fonte: A entidade responsável
tabela onde são incluídas notas
interseção entre uma linha e uma pela organização ou fornecimento
informativas, como fonte dos
coluna na tabela, onde os dados dos dados apresentados na
dados, notas explicativas e
específicos são inseridos. tabela.
chamadas.

Ex.:

Tome nota!

A tabela deve ser colocada em posição vertical, para facilitar a leitura dos dados. No caso em que
isso seja impossível, deve ser colocada em posição horizontal, com o título voltado para a margem
esquerda da folha. Se a tabela (ou quadro) não couber em uma página, deve ser continuado na
página seguinte; nesse caso, o final não será delimitado por traço horizontal na parte inferior, e o
cabeçalho será repetido na página seguinte.

14

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


MEDIDAS DE TENDÊNCIA CENTRAL

1) Introdução

Continuaremos os estudos do Concurso da Caixa Econômica Federal sobre Medidas de tendência


central.

1 - Medidas de tendência central (em dados brutos ou agrupados em classes): média


aritmética, média geométrica, média ponderada, moda e mediana.

2) Medidas de Tendência Central ou Medidas de Posição

Medidas de tendência central são estatísticas que representam valores típicos ou centrais em um
conjunto de dados. Elas são usadas para resumir ou descrever a distribuição dos dados, ajudando a
entender onde a maioria dos valores se concentra. As principais medidas de tendência central são:

Média: Também conhecida como Mediana: É o valor que divide o


Moda: É o valor que ocorre com
média aritmética, é calculada conjunto de dados ordenados ao
maior frequência em um
somando todos os valores do meio, ou seja, 50% dos valores
conjunto de dados.
conjunto de dados e dividindo estão acima da mediana e 50%
pelo número total de estão abaixo dela. Pode haver mais de uma moda
observações. (distribuição bimodal ou
A mediana é menos sensível a
multimodal) ou nenhum valor
A média é sensível a valores valores extremos e é útil quando
pode se repetir (distribuição sem
extremos e é mais apropriada os dados têm uma distribuição
moda).
para distribuições simétricas. assimétrica.

3) Média Aritmética

É a medida mais comum de tendência central e é calculada somando todos os valores em um


conjunto de dados e dividindo pelo número total de valores. A média aritmética é sensível a valores
extremos e é amplamente utilizada em diversas áreas, como estatística, economia e ciências sociais.

Média sem intervalo de classe: Quando os dados não estão agrupados em intervalos de classe,
podemos calcular a média aritmética utilizando a fórmula básica, que é a soma de todos os valores
dividida pelo número total de valores.

 Fórmula: A média aritmética (xˉ) de n números é calculada somando todos os valores (x1,x2
x1+x2+...+xn
,...,xn) e dividindo pela quantidade de valores (n): xˉ= 5

10+15+20+25+30 100
Ex.: Considere o conjunto de dados: 10, 15, 20, 25, 30. A média aritmética é: xˉ= 5
=5
=20

15

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Tome nota!

Em certos conjuntos de dados, a média pode ser um valor que não existe na série de dados. Isso
ocorre especialmente quando os dados não estão uniformemente distribuídos em torno da média,
resultando em uma média que está além do alcance dos próprios dados.

Ex.: Com os valores 2, 4, 6 e 8, a média aritmética é de 5. No entanto, nenhum dos valores na série
de dados é realmente 5. Isso pode acontecer quando os dados não estão simetricamente distribuídos
em torno da média, fazendo com que a média seja puxada para longe dos próprios dados.

Importante!

Nesses casos, embora a média seja uma medida de tendência central útil para resumir os dados, é
importante interpretar o resultado com cautela e considerar outras medidas de tendência central,
como a mediana, que pode ser mais representativa em conjuntos de dados assimétricos ou com
valores discrepantes.

Média com intervalo de classe: Quando os dados estão agrupados em intervalos de classe, é
necessário ajustar a fórmula de cálculo da média para levar em conta os intervalos de classe e as
frequências.

 Fórmula: A média aritmética (xˉ) para dados agrupados em intervalos de classe é calculada
∑f⋅m
usando a fórmula: xˉ=
∑f
 Onde f é a frequência de cada intervalo de classe e m é o ponto médio de cada intervalo.

Ex.: Considere um conjunto de dados agrupado em intervalos de classe:

 Intervalo de classe: 0-10, 10-20, 20-30, 30-40, 40-50


 Frequência: 2, 5, 8, 4, 1
 Ponto médio de cada intervalo: 5, 15, 25, 35, 45

Substituindo esses valores na fórmula, obtemos:

(2⋅5)+(5⋅15)+(8⋅25)+(4⋅35)+(1⋅45)
xˉ= 2+5+8+4+1

10+75+200+140+45 470
xˉ= 20
xˉ= 20 = 23,5

4) Média Geométrica

A média geométrica é calculada multiplicando todos os valores em um conjunto de dados e tirando


a raiz n-ésima do produto, onde n é o número total de valores. É frequentemente usada em situações
onde os valores crescem ou diminuem exponencialmente, como taxas de crescimento, taxas de
retorno financeiro ou medidas de proporção.

16

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


 Fórmula: A média geométrica = n√X1 x X2 x…x Xn
 Onde f é a frequência de cada intervalo de classe e m é o ponto médio de cada intervalo.

Ex.: Considere o conjunto de dados sem intervalo de classe: 2, 4, 8, 16, 32. A média geométrica é:
5
√2 x 4 x 8 x 16 x 32
5
√32768 ≈8

Média com intervalo de classe: Para calcular a média geométrica com dados agrupados em
intervalos de classe, você precisa usar os pontos médios dos intervalos de classe e as respectivas
frequências. A fórmula é a mesma que a de sem intervalo de classe, mas você deve usar os pontos
médios dos intervalos de classe e suas respectivas frequências no cálculo.

Ex.: Considere um conjunto de dados agrupado em intervalos de classe:

 Intervalo de classe: 1-10, 11-20, 21-30


 Frequência: 5, 8, 3
 Ponto médio de cada intervalo: 5.5, 15.5, 25.5

Substituindo esses valores na fórmula, obtemos:


3
Média Geométrica= √5.5 x 15.5 x 25.5
3
Média Geométrica≈ √21323.125 ≈22.77

5) Média Ponderada

A média ponderada leva em consideração o peso de cada valor no cálculo da média. Cada valor é
multiplicado pelo seu respectivo peso (ou coeficiente) e a soma desses produtos é dividida pela
soma dos pesos. É útil quando alguns valores têm mais importância ou representatividade do que
outros no conjunto de dados.

Média sem intervalo de classe: A média ponderada é calculada multiplicando cada valor pelo
seu respectivo peso, somando os produtos e dividindo pela soma dos pesos.

 Fórmula: Média ponderada =


w1 x X1 + w2 x X2 +… + Wn x Xn
w1 + w2 +wn

Ex.: Considere um conjunto de dados sem intervalo de classe: 10 (peso 2), 20 (peso 3), 30 (peso
5).
(2×10)+(3×20)+(5×30) 20+60+150 230
A média ponderada é: = = = 23
2+3+5 10 10

17

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Média com intervalo de classe: Para calcular a média geométrica com dados agrupados em
intervalos de classe, você precisa usar os pontos médios dos intervalos de classe e as respectivas
frequências.

 A fórmula é a mesma que a de sem intervalo de classe, mas você deve usar os pontos médios
dos intervalos de classe e suas respectivas frequências no cálculo.

Ex.: Considere um conjunto de dados agrupado em intervalos de classe:

 Intervalo de classe: 1-10 (frequência 3), 11-20 (frequência 5), 21-30 (frequência 2)
 Ponto médio de cada intervalo: 5.5, 15.5, 25.5

Substituindo esses valores na fórmula, obtemos:


(3×5.5)+(5×15.5)+(2×25.5) 16.5+77.5+51 145
Média ponderada= 3+5+2
= 10
= 10
= 14.5

6) Moda

A moda é o valor que ocorre com maior frequência em um conjunto de dados. É a medida de
tendência central mais simples de calcular e pode ser útil para identificar o valor mais comum ou
frequente em uma distribuição.

Para os dados não agrupados, simplesmente se observa o elemento (ou elementos) de maior
frequência.

Ex.: Considere o conjunto de dados: 5, 7, 7, 9, 9, 9, 11, 13, 13. Para encontrar a moda, observamos
quais valores se repetem com mais frequência. Aqui, o valor 9 ocorre com mais frequência (três
vezes), então a moda é 9.

7) Mediana

A mediana é o valor que divide um conjunto de dados ordenado ao meio, ou seja, 50% dos valores
estão acima da mediana e 50% estão abaixo dela. É menos sensível a valores extremos do que a
média aritmética e é frequentemente usada em distribuições assimétricas ou quando se deseja uma
medida de tendência central robusta.

 Fórmula: A mediana é calculada ordenando os dados em ordem crescente ou decrescente e


identificando o valor que está exatamente no meio da distribuição. Se o número de
observações for ímpar, a mediana é o valor central. Se o número de observações for par, a
mediana é a média dos dois valores centrais.

Ex.: Considere o conjunto de dados: 15, 20, 25, 30, 35. Para encontrar a mediana, primeiro
ordenamos os dados: 15, 20, 25, 30, 35. Como o número de observações é ímpar (neste caso, 5), a
mediana é o valor central, que é 25.

18

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Tome nota!

Se tivéssemos um conjunto de dados com um número par de observações, calcularíamos a média


dos dois valores centrais para encontrar a mediana.

MEDIDAS DE POSIÇÃO

1) Introdução

Continuaremos os estudos do Concurso da Caixa Econômica Federal sobre Medidas de Posição.

1 - Medidas de Posição: quartis e percentis.

2) Percentil e Quartil

Percentil, como o próprio nome sugere, está relacionado a porcentagem, sendo uma medida que
divide um conjunto de dados em cem partes ordenadas da menor para a maior. Em outras palavras,
cada percentil representa uma proporção específica dos dados.

Para ilustrar esse conceito, imagine uma régua de um metro dividida em cem partes iguais, onde
cada divisão representa um percentil.

Ex.: o décimo percentil corresponde aos 10% menores valores do conjunto de dados, o vigésimo
percentil aos 20% menores valores, e assim por diante.

Importante!

É importante destacar que o percentil se refere aos valores menores e determina uma porcentagem
ordenada desses valores.

Tome nota!

Por vezes, você pode ouvir alguém mencionar que um valor não está contido no percentil 90. Isso
indica que esse valor está entre os 10% maiores valores do conjunto de dados, já que o percentil
90 representa os 90% menores valores.

19

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Por sua vez, o conceito de quartil é uma representação ou delimitação dos percentis. Na prática,
existem três quartis que dividem um conjunto de dados em quatro partes iguais.

Ex.: O primeiro quartil (Q1) divide os dados em 25% menores valores, o segundo quartil (Q2) em
50% menores valores, e assim por diante até o terceiro quartil (Q3), que divide os dados em 75%
menores valores. Essa divisão é útil para compreender a distribuição dos dados e identificar
tendências centrais e dispersões em um conjunto de dados.

Colocando em prática!

Analise o conjunto de dados abaixo que representa as notas de 0 a 100 que nove alunos tiraram em
uma prova:

A primeira coisa a ser feita para encontrar os quartis é ordenar esses valores do menor ao maior.
Teremos o conjunto abaixo:

Começaremos encontrando o quartil 2 (Q2), que representa o percentil 50, ou seja, está exatamente
no meio dos dados. Como os dados já estão ordenados, o Q2 também é a mediana, que é o número
que está no meio do conjunto de dados ordenados. Portanto, Q2=33.

Agora, para encontrar o quartil 1 (Q1), devemos considerar os dados à esquerda de Q2. Temos um
número par de dados nessa parte: 13,17,25,28. Nesse caso, a mediana será a média entre os dois
valores do meio deste subconjunto: (17+25)/2=21. Assim, Q1=21.

Para encontrar o quartil 3 (Q3), seguimos o mesmo procedimento, considerando os dados à direita
de Q2: 41,65,69,72. Novamente, temos um número par de dados nessa parte. A mediana desses
valores é a média de 65 e 69: (65+69)/2=67. Portanto, Q3=67.

Esses quartis nos fornecem informações sobre a distribuição das notas dos alunos, permitindo-nos
entender melhor a dispersão e a tendência central do conjunto de dados. No nosso caso, o ponto
Q1=21 indica que até esse valor estão agrupadas as 25% menores notas dos 9 alunos, o que sugere
que um quarto da turma obteve notas relativamente baixas. O ponto Q2=33 indica que até esse
valor estão as 50% menores notas, ou seja, metade da turma obteve notas abaixo desse ponto.
Finalmente, o ponto Q3=67 revela que até esse valor estão representadas as 75% menores notas da
turma.

Essas conclusões nos permitem entender a distribuição das notas e nos dão uma ideia do
desempenho geral dos alunos. No caso específico mencionado, se 75% dos alunos obtiveram notas
abaixo de 67 em um intervalo de 0 a 100, podemos inferir que a maioria das notas foi relativamente
baixa, sugerindo que pode ser necessário investigar as razões por trás desse desempenho e tomar
medidas para melhorar o aprendizado dos alunos.
20

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


MEDIDAS DE DISPERSÃO

1) Introdução

Continuaremos os estudos do Concurso da Caixa Econômica Federal sobre Medidas de dispersão.

1 - Medidas de dispersão (em dados brutos ou agrupados em classes): amplitude, variância,


desvio padrão e coeficiente de variação.

2) Amplitude

A amplitude total (AT) em dados não agrupados é simplesmente a diferença entre o maior e o menor
valor da série de dados. A fórmula é:

AT=Xmáximo−Xminímo

Onde:

 Xmáximo é o maior valor na série de dados.


 Xminímo é o menor valor na série de dados.

Vamos exemplificar: Com os valores 30, 45, 48, 62 e 72, a amplitude total seria: AT=72−30=42

A amplitude total tem suas limitações. Ela apenas considera os dois valores extremos da série
de dados e não leva em conta a distribuição dos valores intermediários. Isso pode torná-la uma
medida de dispersão imprecisa em muitos casos.

Portanto, a amplitude total é geralmente considerada como uma indicação aproximada da


dispersão ou variabilidade, e outras medidas de dispersão, como o desvio padrão ou a variância, são
preferidas para análises mais detalhadas e precisas.

Vejamos no caso em que os dados estejam agrupados sem intervalos de classe, ainda teremos:
𝑿𝒊 𝒇𝒊
0 2
1 6
3 5
4 3

Calculando a amplitude: AT=4−0=4

Com intervalos de classe a amplitude total é a diferença entre o limite superior da última classe e o
limite inferior da primeira classe.

Logo, AT = L máximo - L mínimo, vejamos:

Classes Frequência
150├ 154 4
154├ 158 9
158├ 162 11
162├ 166 8
166├ 170 5
170├ 174 3
21

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Então, AT = 174 – 150 = 24

Quanto maior a amplitude total, maior é a dispersão ou variabilidade dos valores da variável. A
amplitude total é frequentemente empregada ao se quer determinar a variação da temperatura em
um dia ou ao longo de um ano, bem como no controle de qualidade. Ela serve como uma medida
rápida, embora não muito precisa, de variação nos dados.

3) Variância e Desvio Padrão

A variância e o desvio padrão são medidas de dispersão que nos ajudam a entender o quão
espalhados os dados estão em relação à média. Vamos diferenciar esses conceitos:

O desvio padrão é simplesmente a raiz


A variância é uma medida da dispersão
quadrada da variância.
dos valores de uma distribuição.
Ele fornece uma medida de dispersão
Ela é calculada como a média dos
mais facilmente interpretável, pois está na
quadrados das diferenças entre cada
mesma unidade que os dados originais.
valor e a média da distribuição. Quanto
Assim como a variância, quanto maior o
maior a variância, mais dispersos os
desvio padrão, mais dispersos os valores
valores estão em relação à média.
estão em relação à média.

A variância, representada por: 𝒔𝟐 , é calculada como a média dos quadrados dos desvios de cada
valor em relação à média aritmética.

Os desvios são simplesmente as diferenças entre cada valor individual e a média do conjunto
de dados. Ele leva em conta todos os valores da variável em estudo, o que o torna uma medida
robusta e estável de variabilidade.

A variância é especialmente útil quando queremos entender a dispersão dos dados em torno da
média e comparar essa dispersão entre diferentes conjuntos de dados.

No entanto, como a variância é uma medida de dispersão que envolve quadrados, sua unidade de
medida é o quadrado da unidade original dos dados, o que pode dificultar sua interpretação em
relação aos dados originais.

Por isso, frequentemente usamos o desvio padrão (𝒔), que é a raiz quadrada da variância, pois está
na mesma unidade dos dados originais e é mais facilmente interpretável.

Ex.: Como exemplo, consideremos que foi aplicado um teste a dois grupos com cinco alunos cada,
o grupo A obteve os seguintes pontos 6, 8, 7, 4, 10 e o grupo B 9, 7, 8, 5, 6. Utilizando a variância
vamos determinar o grupo mais regular:

Grupo A:

 Pontos: 6, 8, 7, 4, 10
5+8+7+4+10 35
 Média: ̅X̅̅A̅= 5
= =7
5
 Desvios em relação à média: -1, 1, 0, -3, 3
 Quadrados dos desvios: 1, 1, 0, 9, 9
22

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


1+1+0+9+9 20
 Variância s2A : = 5
= 5 =4

Grupo B:

 Pontos: 9, 7, 8, 5, 6
 ̅̅̅B = 9+7+8+5+6= =35=7
Média: X 5 5
 Desvios em relação à média: 2, 0, 1, -2, -1
 Quadrados dos desvios: 4, 0, 1, 4, 1
4+0+1+4+1 10
 Variância s2B: = 5
= 5 =2

Comparando as variâncias dos dois grupos, observamos que a variância do grupo B é menor que a
do grupo A. Portanto, o grupo B é mais regular em relação à distribuição dos pontos obtidos no
teste.

Utilizando a desvio padrão, temos: O símbolo para o desvio padrão em um conjunto de dados
observados é s, e a fórmula para obter o desvio padrão é a seguinte:

̅h2
√|^Xi – X
2
Onde:

 n é o número de observações na amostra;


 𝑿𝒊 é cada valor individual da amostra;
 x̅ é a média da amostra.

A fórmula anterior é utilizada quando estamos trabalhando com uma distribuição de dados não
agrupados. Considerando os valores 30, 45, 48, 62 e 72, vamos construir a tabela a seguir para facilitar
o cálculo do desvio padrão.
𝑿𝒊 ̅𝒊
𝑿 ̅h
^𝑿𝒊 – X ^𝑿𝒊 – ̅̅̅
𝑿𝒊 h
2

30 51,4 -21,4 457,96


45 51,4 -6,4 40,96
48 51,4 -3,4 11,56
62 51,4 10,6 112,36
72 51,4 20,6 424,36
Total 1047,2

Como n = 5, temos:

√1047,2
s= = 14,47
5

3.1) Propriedades do desvio padrão

Desvio Padrão para Dados Agrupados com Intervalo de Classe: Ao calcular o desvio padrão
para dados agrupados com intervalo de classe, é comum usar o ponto médio de cada classe como
o valor de 𝑿𝒊 na fórmula do desvio padrão.

Quando os dados estão agrupados, a fórmula do desvio padrão será:

23

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


√| 𝑓𝑖 𝑋2𝐼
√| 𝑓𝑖 𝑋𝑖 2
s= −( )
n 𝑛

Consideremos como exemplo a distribuição da tabela a seguir:


𝑿𝒊 𝒇𝒊 𝒇 𝒊 𝒙𝒊 𝒇 𝒊 – 𝒙𝒊 2
0 3 0 0
1 6 6 6
3 5 15 45
4 3 12 48
∑ = 16 ∑ = 33 ∑ = 99

99 33
√ -( )2 =√6,18-2,06 = 2,03
16 16

Adição ou Subtração de uma Constante: Se adicionarmos ou subtrairmos uma constante a


todos os valores de uma variável, o desvio padrão não se altera. Isso ocorre porque adicionar ou
subtrair uma constante de todos os valores não altera a dispersão dos dados em torno da média.

Multiplicação ou Divisão por uma Constante: Se multiplicarmos ou dividirmos todos os valores


de uma variável por uma constante (diferente de zero), o desvio padrão será multiplicado (ou
dividido) por essa constante. Isso ocorre porque a multiplicação ou divisão por uma constante altera
a escala dos dados, afetando a dispersão dos dados em relação à média.

4) Coeficiente de Variação

O coeficiente de variação, conhecido como Pearson é uma medida estatística que expressa a
variabilidade dos dados em termos relativos ao valor médio da série. É calculado como a razão
entre o desvio padrão e a média dos dados.

Ex.: Desvio padrão = 6


99
Média = = 33
3

6
Portanto, o coeficiente de variação de Pearson seria: Coeficiente de Variação =
3
≈ 0.182
Ex.: Consideremos o exemplo da tabela a seguir:

Discriminação Média Desvio padrão


Estaturas 165 cm 3,0 cm
Pesos 55 kg 2,5 kg
Calculando os coeficientes de variação, temos:
3
CVe = ) 100 = 1,81 %
165
2,65
CVp = ) 100 = 4,54 %
55

24

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Logo, nesse grupo de indivíduos, os pesos apresentaram maior grau de dispersão em relação às
estaturas.

Essa medida nos permite comparar a dispersão ou variabilidade de diferentes conjuntos de dados,
mesmo que estejam em escalas diferentes. Quanto maior o coeficiente de variação, maior é a
dispersão relativa em relação à média. Isso nos permite avaliar a variabilidade dos dados de forma
mais contextualizada, levando em consideração o valor médio da série.

PROBABILIDADE

1) Introdução

Continuaremos os estudos do Concurso da Caixa Econômica Federal sobre Noções de Probabilidade.

1 - Probabilidade: experimento aleatório, espaço amostral, evento; espaços equiprováveis;


probabilidade de Laplace; espaços não equiprováveis; teorema do produto; probabilidade
condicional e independência; distribuição binomial.

2) Probabilidade

Probabilidade é o estudo de experimentos aleatórios ou não determinísticos. Mas o que é um


experimento? Um experimento é qualquer processo de observação. Pode ser:

Uma observação meteorológica ou sísmica, representando experimentos naturais.

Uma pesquisa de opinião para determinar quantos eleitores votarão em um candidato específico
na próxima eleição ou quantos alunos almoçam no restaurante universitário.

Uma verificação de um exame de sangue ou o teste de fadiga de um material na construção civil,


representando experimentos controlados.

Nos exemplos mencionados, a incerteza está sempre presente. Isso significa que, se esses
experimentos forem repetidos em condições idênticas, não podemos determinar com certeza qual
resultado ocorrerá. Tais experimentos são conhecidos como experimentos aleatórios. A incerteza
está associada à chance de ocorrência atribuída ao resultado de interesse.

Ex.: Para determinar a probabilidade de chover neste final de semana na Praia do Futuro, em
Fortaleza, podemos considerar o conjunto de possibilidades:

S = {chove, não chove}.

 Para calcular essa probabilidade, podemos usar nossa intuição subjetiva ou usar a frequência
relativa dos últimos dez fins de semana em que choveu, fornecendo uma abordagem mais
objetiva.

25

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Ex.: No lançamento de um dado, onde você ganha se sair uma face par, o conjunto de
possibilidades é S = {1, 2, 3, 4, 5, 6}, e o conjunto de possibilidades favoráveis é F = {2, 4, 6}. Para
calcular a probabilidade de você ganhar, podemos usar a fórmula:
n (F)
P (ganhar) =
n (S)

Onde:

 P(ganhar) é a probabilidade de ganhar, n(F) é o número de casos favoráveis à ocorrência de


você ganhar, e n(S) é o número de casos possíveis do experimento, desde que sejam
igualmente prováveis.

No caso do dado honesto e equilibrado, cada face tem a mesma probabilidade de ser sorteada,
então n(S)=6. E o número de casos favoráveis à ocorrência de você ganhar é n(F)=3, já que há três
faces pares (2, 4 e 6).

3 1
Portanto: P(ganhar)= =
6 2

Assim, a probabilidade de você ganhar é de 50%.

Hora da História

Historicamente, a Teoria da Probabilidade teve origem no estudo de jogos de azar, como roleta e
cartas, desde o século XVI. A partir daí, desenvolveu-se para se tornar uma ferramenta fundamental
em diversas áreas, incluindo estatística, ciências naturais, economia e engenharia.

2.1) Espaço Amostral e Eventos

O espaço amostral, denotado por S, é o conjunto de todos os resultados possíveis de um


experimento. Um resultado específico em S é chamado de ponto amostral. Um evento é qualquer
subconjunto do espaço amostral S, ou seja, é um conjunto de resultados possíveis do experimento
aleatório. Quando um experimento aleatório é realizado e o resultado pertence a um evento A, diz-
se que o evento A ocorreu.

Um evento elementar é um evento que consiste em um único ponto amostral.

Ex.: Por exemplo, se S = {1, 2, 3, 4, 5, 6}, então um evento elementar seria um único número, como
o evento "sair o número 3".

26

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


O evento impossível é aquele que corresponde ao conjunto vazio (∅), ou seja, um evento que
não pode ocorrer. O evento certo é o evento que inclui todos os pontos amostrais do espaço
amostral S.

Ex.: Por exemplo, se considerarmos o espaço amostral S = {chove, não chove}, um evento seria
"chove" ou "não chove". O evento "chove" seria um subconjunto de S, contendo apenas o elemento
"chove".

Ex.: Outro exemplo com o espaço amostral S = {1, 2, 3, 4, 5, 6}, poderíamos definir o evento B
como "sair uma face par", representado por B = {2, 4, 6}, que é um subconjunto de S.

Além disso, podemos definir eventos como o evento C, que seria "sair uma face ímpar", representado
por C = {1, 3, 5}, também um subconjunto de S.

2.2) Operações com Eventos

Intersecção: A ∩ B é o
União: A ∪ B é o evento evento que ocorre se A e
que ocorre se A ocorre B ocorrem Complementar: AC ou A
ou B ocorre ou ambos simultaneamente. ocorrer é o evento que
ocorrem Se A ∩ B = ∅, então A e B ocorre se A não ocorrer.
simultaneamente. são mutuamente
exclusivos ou disjuntos.

Ex.: Considerando o lançamento de um dado e os eventos A, B, C, D e E definidos nos exemplos


anteriores:

 B → D = sair uma face par e maior que 3. Então, B → D = {2, 4, 6} → {4, 5, 6} = {4, 6}
 B → C = sair uma face par e ímpar. Então, B → C = {2, 4, 6} → {1, 3, 5} = ∅ (B e C são disjuntos).
 CB=BC=∅
 B ∪ D = sair uma face par ou maior que 3. Então, B ∪ D = {2, 4, 6} ∪ {4, 5, 6} = {2, 4, 5, 6}
 B ∪ C = sair uma face par ou ímpar. Então, B ∪ C = {2, 4, 6} ∪ {1, 3, 5} = {1, 2, 3, 4, 5, 6}

3) Probabilidade de Laplace

A probabilidade de Laplace é um método para calcular a probabilidade de um evento em um espaço


amostral equiprovável. É calculada dividindo o número de casos favoráveis pelo número total de
casos possíveis.

 Fórmula: P(A) = número de casos favoráveis a A / número total de casos possíveis.

27

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Ex.: Por exemplo, ao lançar um dado justo, a probabilidade de obter um número ímpar é 3/6 =
1/2.

4) Espaços Equiprováveis e Não Equiprováveis

Espaços Equiprováveis: Um espaço amostral onde todos os resultados possíveis têm a mesma
probabilidade de ocorrência é chamado de espaço equiprovável. Isso significa que cada resultado
é igualmente provável de ocorrer.

Ex.: Por exemplo, ao lançar uma moeda honesta, os resultados possíveis (cara ou coroa) têm igual
probabilidade de ocorrer.

 Fórmula: Probabilidade de cada evento = 1 / N, onde N é o número de resultados possíveis.

Espaços Não Equiprováveis: Um espaço amostral onde os resultados possíveis não têm a
mesma probabilidade de ocorrência é chamado de espaço não equiprovável. Isso significa que
alguns resultados são mais prováveis do que outros.

5) Teorema do Produto

O teorema do produto é usado para calcular a probabilidade de dois eventos independentes


ocorrerem juntos. Para eventos independentes A e B, a probabilidade de ambos ocorrerem é o
produto das probabilidades de cada evento individualmente.

 Fórmula: P(A ∩ B) = P(A) * P(B), para eventos independentes A e B.

Ex.: Por exemplo, a probabilidade de obter cara em dois lançamentos consecutivos de uma moeda
justa é (1/2) * (1/2) = 1/4.

6) Probabilidade Condicional e Independência

A probabilidade condicional é a probabilidade de um evento ocorrer dado que outro evento já


ocorreu. Dois eventos A e B são independentes se a ocorrência de um não afetar a probabilidade
do outro. A probabilidade de A dado B é igual à probabilidade de A, e vice-versa.

 Fórmula: P(A|B) = P(A ∩ B) / P(B), onde A é o evento de interesse e B já ocorreu.

Ex.: Lançamento de uma moeda justa (A) e lançamento de um dado justo (B). A probabilidade de
obter cara na moeda não é afetada pelo resultado do lançamento do dado.

28

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


6.1) Teorema de Bayes

O Teorema de Bayes é um princípio fundamental da teoria das probabilidades e descreve como


atualizar nossas crenças sobre um evento à luz de novas evidências. Ele é amplamente utilizado em
estatística, teoria da decisão e aprendizado de máquina, entre outros campos.

O teorema é baseado na ideia de probabilidade condicional, que é a probabilidade de um evento


A ocorrer, dado que outro evento B já ocorreu. A probabilidade condicional é denotada por P(A|B),
lida como "a probabilidade de A dado B". Ela representa a chance de um evento ocorrer sabendo
que alguma informação ou condição adicional está presente.

O Teorema de Bayes estabelece a relação entre as probabilidades condicionais P(A|B) e P(B|A). De


acordo com o teorema, podemos calcular a probabilidade de um evento A ocorrer, dado que o
evento B ocorreu, utilizando a seguinte fórmula:

P(A|B) = (P(B|A) * P(A)) / P(B)

Onde:

P(A|B) é a probabilidade de A ocorrer dado B.

P(B|A) é a probabilidade de B ocorrer dado A.

P(A) e P(B) são as probabilidades marginais de A e B, respectivamente.

O Teorema de Bayes permite atualizar as probabilidades à medida que novas evidências são obtidas.
Inicialmente, temos uma crença a priori sobre a probabilidade de um evento ocorrer (P(A)) e, em
seguida, utilizamos as probabilidades condicionais P(B|A) e P(A|B) para ajustar essa crença com base
nas informações adicionais fornecidas por B.

Tome nota!

O teorema é particularmente útil quando se lida com incertezas e informações incompletas. Ele
fornece uma estrutura formal para a atualização de probabilidades com base em novas evidências,
tornando-se uma ferramenta poderosa para a tomada de decisões em ambientes incertos.

O Teorema de Bayes tem uma ampla gama de aplicações em diversos domínios, incluindo medicina,
diagnóstico, processamento de sinais, aprendizado de máquina e análise estatística. É uma
ferramenta valiosa para inferência estatística e raciocínio probabilístico, permitindo que tomemos
decisões informadas com base em evidências disponíveis.

29

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


6.1) Distribuição Binomial

A distribuição binomial modela o número de sucessos em uma série de experimentos


independentes, onde cada experimento tem apenas dois resultados possíveis (sucesso ou fracasso).
Ela é caracterizada por dois parâmetros: o número de experimentos (n) e a probabilidade de sucesso
em um único experimento (p).
n!
 Fórmula: P(X=k) X! x (n-X)!
x px x (1-p)n-x
 Onde n é o número de experimentos;
 k é o número de sucessos desejados;
 p é a probabilidade de sucesso em um único experimento;

Ex.: Em uma fábrica de lâmpadas há uma linha de produção apenas para lâmpadas
incandescentes.

 O embalamento é feito de forma que 10 unidades das lâmpadas são colocadas em cada
embalagem.
 O gestor sabe que, dessa linha de produção, a probabilidade de sair uma lâmpada com
defeito corresponde a 5%.
 O que ele deseja saber é qual a probabilidade de serem embaladas 3 lâmpadas com defeito
na mesma embalagem.

Para resolver esse problema precisaremos utilizar a equação binomial:


n!
P(X=k) X! x (n-X)!
x px x (1-p)n-x

De acordo com o problema apresentado temos os seguintes dados:

 P = 0,05;
 n = 10;
 k = 3.

Mas atenção, P não será apresentada a probabilidade de não ser defeituosa a lâmpada, mas a
probabilidade de um defeito ocorrer.

Após essa explicação vamos realizar a troca dos valores na equação:


10!
P(X=3) 3! x (10-3)!
x (0.05)3 x (1-0.05)10-3

10! 10×9×8×7×6×5×4×3×2×1 10×9×8


 Coeficiente binomial: x ) = 120
3! x (10-3)! 3x2x1x7x6x5x4x3x2x1 3x2x1

 Probabilidade de sucesso: (0.05)3 =0.000125


 Probabilidade de fracasso: (1 − 0.05)7 (0.95)7 ≈0.698
 Agora, multiplicamos esses resultados: P (X=3)=120×0.000125×0.698≈0.01045

Portanto, a probabilidade de ocorrerem exatamente 3 eventos de sucesso em uma distribuição


binomial com n=10 e p=0.05 é de aproximadamente 0.01045 ou 1.045%.

30

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00


Parabéns por ter concluído o estudo da matéria!

Bora para cima!

31

MAXWILLER N BARBOSA - maxwiller.20@gmail.com - CPF: 052.369.063-00

Você também pode gostar