Estatística e Probabilidade

Estatística e
Probabilidade SEMANA 1
Reconhecer os principais objetivos da estatística descritiva e inferencial;
Compreender os conceitos de “população” e “amostra”, também os dois principais tipos de amostra que
podem ser estudadas – amostra aleatória simples e amostra estratificada;
Identificar, compreender e ser capaz de classificar os diferentes tipos de variáveis que são usados na
estatística e suas possíveis diferentes escalas de medida.
É a ciência que trata da coleta, organização, análise e

DEFINIÇÃO DE ESTATÍSTICA interpretação dos dados para tomada de decisão.
POPULAÇÃO AMOSTRA
É a coleção de todos os resultados, É um subconjunto ou parte de uma
respostas, medições ou contagens população.
que são de interesse.
PARÂMETRO: ESTATÍSTICA
Descrição numérica de uma característica Descrição numérica de uma característica
populacional. Constante para a população. amostral. Pode diferir de uma amostra para
outra.
DESCRITIVA INFERENCIAL
Envolve a organização, o resumo e Faz uso de amostra para chegar a

a representação de dados. conclusões sobre uma população
TIPOS DE DADOS
QUANTITATIVOS: QUALITATIVOS:
Consistem em atributos, rótulos ou entradas não numéricas. Consistem em atributos, rótulos ou
1. DISCRETAS: armazenam números que podem assumir entradas não numéricas.
somente um conjunto discreto de valores. Exemplos:
número de pessoas em uma fila, dias de férias
2. CONTÍNUAS: registram dados que podem assumir
valores em um intervalo real. Exemplos: preços, duração
de uma música, índice pluviométrico
MENSURAÇÃO ORDINAL:
Podem ser qualitativos ou quantitativos e tem
NOMINAL:
como característica a possibilidade de
Categorizados em nomes, rótulos ou
ordenação ou classificados, mas as entradas
qualidades que impossibilitam cálculos
não possuem característica numérica.
matemáticos.
RAZÃO:
INTERVALAR:
Um dado pode ser expresso
Podem ser ordenados e a significativamente como um múltiplo de
diferença entre eles calculada. outro.
construir uma distribuição de frequências para um conjunto de dados
quantitativos;
construir corretamente um histograma para representar a distribuição de
frequências através da escolha adequada do número e amplitude dos SEMANA 2
intervalos de classe;
descrever as principais medidas de posição (média, mediana e moda) e de
dispersão (amplitude total, desvio padrão) e realizar seu cálculo
diretamente a partir dos dados e das distribuições de frequências.
DISTRIBUIÇÃO DE FREQUÊNCIAS
Uma distribuição de frequências é uma tabela que mostra classes ou intervalos de valores com a
contagem do número de ocorrências em cada intervalo ou classe. A frequência f de uma classe é
o número de ocorrências de dados na classe. A diferença entre o valor máximo e mínimo dos
dados é chamada de amplitude.
PONTO MÉDIO: É a soma dos limites inferior e superior da classe dividida por dois. É
conhecida, também, por marca da classe (representante da classe).
FREQUÊNCIA RELATIVA: é a proporção ou fração de dados que está na classe. Para calculá-
la, a frequência deve ser dividida pelo tamanho n da amostra.
FREQUÊNCIA ACUMULADA: é a soma das frequências dessa classe com todas as anteriores. A
frequência acumulada da última classe é igual ao tamanho n da amostra. Um gráfico de ogiva é
um gráfico de linhas que mostra as frequências acumuladas até cada classe em sua fronteira
superior. As fronteiras superiores são marcadas no eixo horizontal e as frequências acumuladas
são marcadas no eixo vertical.
HISTOGRAMA:
3
É um gráfico para representar a distribuição de frequências. O histograma é um diagrama de

2
barras que representa a distribuição de frequências de um conjunto de dados. As propriedades

1
são: (1) a escala horizontal é quantitativa e indica os valores dos dados; (2) a escala vertical indica
0
10 12 14 16
as frequências das classes e (3) barras consecutivas devem estar encostadas umas nas outras.
MEDIDAS DE TENDÊNCIA CENTRAL

É um valor que representa uma observação típica ou central de um conjunto de dados. As três medidas
de tendência central mais usadas são:
MÉDIA é um conjunto de dados é a soma dos valores de dados dividida pelo número de observações.
MÉDIA PONDERADA
é a media de um conjunto de dados cujos valores tem pesos variados.
MEDIANA é um conjunto de dados é um valor que esta no meio dos dados quando o conjunto está
ordenado. A mediana indica o centro de um conjunto de dados ordenado, dividindo-o em
duas partes com quantidades iguais de valores. Quando o conjunto de dados tem um
número ímpar de observações, a mediana é o elemento do meio. Se o cojunto de dados
tem um número par de observaççoes , a mediana é a média dos dois elementos que
ocupam as posições centrais.
MODA de um conjunto de dados é o valor que ocorre com a maior frequência. Um conjunto de
dados pode ter uma moda, mais de uma moda, ou não ter moda. Quando nenhum valor se
repete, o conjunto de dados não tem moda. Quando dois valores ocorrem com a mesma
maior frequûencia, cada um é uma moda e o conjunto é chamado de bimodal.
FORMAS DE DISTRIBUIÇÃO
VARIÂNCIA E DESVIO PADRÃO
Interpretação: indica o quanto, em média,

os valores se desviam da média desse
conjunto.
CV: útil para comparar desvios em unidades

diferentes.
REGRA EMPÍRICA
Compreender os conceitos de experimento aleatório, espaço amostral,
probabilidade frequentista e enunciar os três axiomas da teoria das
probabilidades;
Descrever eventos em termos de conjuntos e aplicar os axiomas da teoria SEMANA 3
das probabilidades à resolução de problemas simples;
Compreender os conceitos de probabilidade condicional, eventos
mutuamente exclusivos e eventos independentes e aplicá-los à resolução
de problemas simples;
Conhecer o teorema de Bayes e a fórmula da probabilidade total e aplicá-
los à resolução de problemas simples.
Um experimento probabilístico é uma ação, ou tentativa sujeita à lei do acaso, pela qual
resultados específicos (contagens, medições ou respostas) são obtidos. O produto de uma
única tentativa em um experimento probabilístico é um resultado. O conjunto de todos os
resultados possíveis de um experimento probabilístico é o espaço amostral. Um evento é um
subconjunto do espaço amostral. Ele pode consistir em um ou mais resultados,
Um experimento aleatório é um experimento cujo resultado não podemos prever de
antemão.
Um espaço amostral (Ω) é um conjunto que contém todos os possíveis resultados do
experimento aleatório.
LANÇAMENTO DE UM DADO:
Experimento Probabilístico: Lançamento de um dado de seis faces.
Espaço amostral: {1,2,3,4,5,6}
Evento: Obter um número par {2,4,6}
Resultado: Obter um 2, {2}
Em alguns casos, um evento pode ocorrer de diversas maneiras diferentes, para isso é utilizado o
princípio fundamental da contagem: se um evento pode ocorrer de m maneiras e um segundo evento
pode ocorrer de n maneiras, o número de maneiras que os dois eventos podem em ocorrer em
sequencia é m. n. A regra pode ser estendida para qualquer número de eventos ocorrendo em
sequência.
ESCOLHENDO UM CARRO: O número de maneiras
Fabricantes: FORD, GM e HONDA (3) possível de escolher um
Tamanho: compacto, médio (2) carro é: 3 . 2 . 4=
Cores: branco, vermelho, preto e verde (4) 24
Probabilidade clássica (ou teórica) é usada
quando cada resultado em um espaço
amostral é igualmente possível de ocorrer. A
probabilidade clássica para um evento E é
dada por:
Probabilidade empírica (ou estatística) é
baseada em observações obtidas de
experimentos probabilísticos. A probabilidade
empírica de um evento E é a frequência
relativa de um evento E:
LEI DOS GRANDES NÚMEROS: conforme aumenta o número de vezes que um elemento probabilístico é
repetido, a probabilidade empírica (frequência relativa) de um evento aproxima-se de sua probabilidade
teórica.
AMPLITUDE DE PROBABILIDADES: A probabilidade de um evento E está entre 0 e 1. Ou seja, 0 ≤ P(E) ≤ 1.
AXIOMAS DA PROBABILIDADE:
(1) A probabilidade de um evento é um número real não negativo;

(2) A probabilidade de que algum evento elementar em todo o espaço da amostra irá ocorrer é 1. Mais
especificamente, não há eventos elementares fora do espaço amostral.
(3) Qualquer sequência contável de conjuntos disjuntos (sinônimo de eventos mutuamente exclusivos) é a
soma dos seus eventos independentes.
EVENTOS COMPLEMENTARES: a soma das probabilidades de todos os resultados em um espaço amostral

é 1. Desse modo, quando sabemos a probabilidade de um evento E, podemos encontrar a probabilidade do
complemento do Evento E (E').
Sabendo que o evento B ocorreu, PROBABILIDADE CONDICIONAL: é a probabilidade de um

qual é a probabilidade do evento A evento ocorrer, dado que outro evento já tenha ocorrido. A
ocorrer também? probabilidade condicional de o evento B ocorrer, dado que o
evento A tenha ocorrid, é denotado por P(B|A) e lê-se
∩
P(A|B) = P(A B) / P(B) "probabilidade de B, dado A".
EVENTOS INDEPENDENTES: dois eventos são independentes quando a ocorrência de um deles não afeta
a probabilidade de ocorrência de outro. Dois eventos A e B são independentes quando:
P(B|A) = P(B) ou quando P(A|B) = P(A).
Como encontrar a probabilidade de REGRA DA MULTIPLICAÇÃO: Se os eventos A e B forem

dois eventos ocorrendo em independentes, então a regra pode ser simplificada para P(A e B)
sequência? = P(A) . P(B). Essa regra simplificada pode ser estendida para
qualquer número de eventos independentes.
P(A e B) = P(A).P(B|A)
Como encontrar a probabilidade de REGRA DA ADIÇÃO: para quando A ocorre e B não ocorre, B
dois eventos mutuamente ocorre e A não ocorre ou A e B ocorrem. Se os eventos forem
exclusivos, ou seja, quando não mutuamente exclusivos a regra pode ser simplificada para P(A ou
podem ocorrer ao mesmo tempo? B) = P(A) + P(B).
P(A ou B) = P(A) + P(B) - P(A e B)
Como atualizar nossas estimativas TEOREMA DE BAYES: implica que a crença atualizada é resultado
da probabilidade de um evento A da crença inicial multiplicada pela sua atualização.
conforme vamos obtendo mais
informações sobre os eventos que
já ocorreram?
P(A|B) = P(A) . P(B|A)/P(B)
FUNÇÃO DE VEROSSIMILIHANÇA: a função de verossimilhança ou função de probabilidade é uma função

dos parâmetros de um modelo estatístico que permite inferir sobre o seu valor a partir de um conjunto de
observações. Num certo sentido, a probabilidade é uma versão inversa da probabilidade condicionada.
Conhecendo um parâmetro B, a probabilidade condicional de A é P(A|B), mas se o valor de A é conhecido,
pode-se realizar inferências sobre o valor de B graças ao teorema de Bayes.
Compreender o conceito de variável aleatória como uma função de Ω em
R;
Identificar uma variável aleatória a partir de sua descrição como uma
“medida” realizada sobre os possíveis resultados de um experimento SEMANA 4
aleatório;
Conhecer as distribuições de probabilidades para as variáveis aleatórias
discretas mais simples;
Compreender o conceito de valor esperado (ou esperança) e de variância
de uma variável aleatória discreta e ser capaz de calculá-los nos casos mais
simples.
VARIÁVEIS ALEATÓRIAS: uma variável aleatória x representa um valor numérico associado a cada
indica que x é determinado em função de um objeto escolhido ao acaso. As
resultado de um experimento probabilístico (ou aleatório). variáveis aleatórias podem ser discretas ou contínuas.
Discreta: quando tem um número finito ou contável de resultados que podem ser enumerados.
Contínua: quando tem um número incontável de resultados possíveis, representados por um intervalo
na reta numérica.
DISTRIBUIÇÃO DISCRETA DE PROBABILIDADES
Uma distribuição discreta de probabilidade lista cada
valor possível que a variável aleatória pode assumir, com
sua respectiva probabilidade. Uma distribuição de
probabilidade discreta deve satisfazer às seguintes
condições:
Construindo uma distribuição discreta de probabilidade:
Seja x uma variável aleatória discreta com resultados possíveis X1, X2, ..., Xn:
1. Construa uma distribuição de frequências para os resultados possíveis;
2. Calcule a soma das frequências;
3. Determine a estimativa da probabilidade de cada resultado possível dividindo sua frequência pela soma
das frequências;
4. Verifique que cada probabilidade esteja entre 0 e 1, inclusive, e que a soma seja 1.
Média de uma variável aleatória discreta:

A média de uma variável aleatória discreta é dada por:
μ = ∑xP(x)
Cada valor de x é multiplicado por sua correspondente
probabilidade e os produtos são adicionados.
Variância e desvio padrão de uma varável aleatória

discreta:
A variância é: σ² = ∑(x-μ)²P(x)
Desvio Padrão: √σ² = √(x-μ)²P(x)
Valor Esperado (Esperança): *pode ser um valor negativo

Valor esperado: E(x) = μ = ∑xP(x)
Em um sorteio, 1500 bilhetes são vendidos a $ 2 cada, para

prêmios de $ 500, $ 250, $ 150 e $ 75. Você compra um bilhete,
qual o valor esperado de ganho?
EXPERIMENTOS BINOMIAIS
São experimentos que podem ser reduzidos a dois
casos: sucesso ou fracasso. Desse modo, um
experimento binomial deve satisfazer as seguintes
condições:
1. O experimento tem um número fixo de tentativas,
em que cada tentativa é independente das
outras.
2. Há apenas dois resultados possíveis para cada
tentativa, que podem ser classificados como
Sucesso (S) ou Fracasso (F).
3. A probabilidade de sucesso é a mesma para cada
tentativa.
4. A variável aleatória x conta o número de
tentativas com sucesso.
DISTRIBUIÇÃO GEOMÉTRICA
Experimentos que são realizados até que o sucesso ocorra. Desse modo, uma distribuição geométrica é
uma distribuição discreta de probabilidade de uma variável aleatória x que satisfaz as seguintes condições:
1. Uma tentativa é repetida até que o sucesso ocorra;
2. As tentativas repetidas são independentes umas das outras;
3. A probabilidade de sucesso p é a mesma para cada tentativa;
4. A variável aleatória x representa o número de tentativas até ocorrer o primeiro sucesso.
Considere que um jogador acerte em 75% das vezes. Calcule o primeiro lance que ele acerte ocorra na
terceira ou na quarta tentativa.
DISTRIBUIÇÃO DE POISSON
Utilizada para determinar a probabilidade de um número específico de sucessos em um dado número de

tentativas.
1. O experimento consiste em contar o número de vezes, x, que um evento ocorre em um dado intervalo
contínuo. O intervalo pode ser de tempo, área, volume ou outro intervalo contínuo.
2. A probabilidade de um evento acontecer é a mesma para intervalos de mesmo tamanho.
3. O número de ocorrências em um intervalo é independente do número de ocorrências em outros
intervalos não sobrepostos.
4. A probabilidade de haver exatamente x ocorrências em um intervalo é:
O número de médio de acidentes por mês
em certo cruzamento é três. Qual é a
probabilidade de, em qualquer mês, quatro
acidentes ocorrerem nesse cruzamento?
Identificar as principais variáveis aleatórias contínuas (uniforme,

exponencial, normal e gama) através de suas funções de distribuição de
probabilidades e suas aplicações típicas;
Compreender a aproximação normal à distribuição binomial e saber aplicá- SEMANA 5
la na resolução de problemas em que a aproximação faz sentido.
VARIÁVEIS CONTÍNUAS
Uma variável aleatória 𝑿 é contínua se pode assumir qualquer valor num dado intervalo real: 𝑿: 𝛀 𝑰 → ⊆ℝ
Distribuição Contínua de Probailidade: a mais importante é a distribuição normal. Propriedades:
1. A média, a moda e a mediana são iguais.

2. Uma curva normal tem formato de sino e é simétrica em
torno da média.
3. A área total sob a curva normal é igual a 1.
4. A medida que a curva normal se distancia da média, ela se
aproxima do eixo x, mas sem tocá-lo.
5. Os pontos nos quais o gráfico muda a orientação da
concavidade são chamados de ponto de inflexão.
DISTRIBUIÇÃO NORMAL PADRÃO:

Transformar um valor x em escore-z usando a fórmula:
Quando uma variável aleatória é

normalmente distribuída, você pode
determinar a probabilidade de que x estará
em um intervalo, encontrando a área sob a
curva normal, para o intervalo. Para
encontrar a área de algum intervalo sob
qualquer curva normal, você deve:
1. Converta o(s) limite(s) do intervalo para

escores-z.
2. Use a distribuição normal padrão para
encontrar a área
Uma variável aleatória contínua 𝑿 está completamente caracterizada pela sua
distribuição de probabilidades:
DISTRIBUIÇÃO UNIFORME
DISTRIBUIÇÃO EXPONENCIAL
DISTRIBUIÇÃO GAMA
Compreender e aplicar as desigualdades de Markov e de Chebyshev à
estimativa de probabilidades.
Compreender e aplicar as leis fraca e forte dos grandes números;
Compreender e aplicar o teorema central do limite à estatística. SEMANA 6
DISTRIBUIÇÃO AMOSTRAL
afirma que a soma de 𝒏 variáveis aleatórias independentes pode ser aproximada por uma distribuição normal independentemente da
distribuição particular das 𝒏 variáveis aleatórias.
O TEOREMA CENTRAL DO LIMITE

A distribuição das médias amostrais
tem a mesma média que a
população, mas o seu desvio padrão
é menor que o desvio padrão da
população. Isso nos diz que a
distribuição das médias amostrais
tem o mesmo centro que a
população, porém é mais
concentrada. Além disso, a
distribuição das médias amostrais
torna-se cada vez menos dispersa
(maior concentração em relação à
média) conforme o tamanho n da
amostra aumenta.
APLICAÇÃO
Ao selecionar 50 motoristas com idade entre 15 e 19 anos (média de

25 minutos). Qual é a probabilidade de que o tempo médio que
passam dirigindo por dia esteja entre 24,7 e 25,5 minutos? Suponha
que o desvio padrão seja de 1,5 minuto.
é um teorema que garante que a média dos resultados obtidos a
LEI DOS GRANDES NÚMEROS partir de um grande número de experimentos aleatórios tende a se
aproximar do valor esperado da variável aleatória observada.
DESIGUALDADE DE MARKOV: Seja 𝑿 uma var. aleatória com
distribuição 𝒇𝑿 e seja 𝒉 ≥ 𝟎 uma função não-decrescente. Podemos
escrever o valor esperado:
DESIGUALDADE DE CHEBYSHEV: para qualquer distribuição de

variância finita, a proporção de observações que ficam até k desvios
padrões da média é pelo menos 1 – 1/k2 para todo k>1
LEI FRACA DOS GRANDES NÚMEROS: nos garante que dado um

tamanho 𝒏 da amostra, provavelmente o valor de 𝑿ഥ é próximo do
valor esperado 𝑬(𝑿), mas pode acontecer de uma ou outra amostra
cair longe. A lei forte dos grandes números nos garante que, para
valores de 𝒏 suficientemente grandes, isso quase nunca acontece.
Compreender os conceitos de distribuição amostral da média e da

variância;
Descrever e aplicar as distribuições amostrais da média e da variância em
casos simples;
Compreender os conceitos de estimador pontual e de intervalo de SEMANA 7
confiança e saber como estimá-los para uma população normal em casos
típicos.
INFERÊNCIA ESTATÍSTICA: objetiva estimar (inferir) o valor dos parâmetros de uma população a partir
dos dados obtidos de uma ou mais amostras, de maneira controlada.
Dois pontos centrais:
Teste de hipóteses: Dada uma população 𝑿, qual é o modelo que melhor a descreve?
Estimação de parâmetros: Dado um modelo, quanto valem seus parâmetros?
Qual é a distribuição de probabilidades da média
A DISTRIBUIÇÃO T amostral de uma população da qual não se conhece a
variância?
A DISTRIBUIÇÃO QUI-QUADRADO

Estatística e Probabilidade

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística e Probabilidade

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística e

É a ciência que trata da coleta, organização, análise e

Envolve a organização, o resumo e Faz uso de amostra para chegar a

É um gráfico para representar a distribuição de frequências. O histograma é um diagrama de

barras que representa a distribuição de frequências de um conjunto de dados. As propriedades

MEDIDAS DE TENDÊNCIA CENTRAL

VARIÂNCIA E DESVIO PADRÃO

Interpretação: indica o quanto, em média,

CV: útil para comparar desvios em unidades

(1) A probabilidade de um evento é um número real não negativo;

EVENTOS COMPLEMENTARES: a soma das probabilidades de todos os resultados em um espaço amostral

Sabendo que o evento B ocorreu, PROBABILIDADE CONDICIONAL: é a probabilidade de um

Como encontrar a probabilidade de REGRA DA MULTIPLICAÇÃO: Se os eventos A e B forem

P(A ou B) = P(A) + P(B) - P(A e B)

P(A|B) = P(A) . P(B|A)/P(B)

FUNÇÃO DE VEROSSIMILIHANÇA: a função de verossimilhança ou função de probabilidade é uma função

Média de uma variável aleatória discreta:

Variância e desvio padrão de uma varável aleatória

Valor Esperado (Esperança): *pode ser um valor negativo

Em um sorteio, 1500 bilhetes são vendidos a $ 2 cada, para

Utilizada para determinar a probabilidade de um número específico de sucessos em um dado número de

Identificar as principais variáveis aleatórias contínuas (uniforme,

1. A média, a moda e a mediana são iguais.

DISTRIBUIÇÃO NORMAL PADRÃO:

Quando uma variável aleatória é

1. Converta o(s) limite(s) do intervalo para

O TEOREMA CENTRAL DO LIMITE

Ao selecionar 50 motoristas com idade entre 15 e 19 anos (média de

DESIGUALDADE DE CHEBYSHEV: para qualquer distribuição de

LEI FRACA DOS GRANDES NÚMEROS: nos garante que dado um

Compreender os conceitos de distribuição amostral da média e da

Você também pode gostar