Você está na página 1de 16

Estatística e

Probabilidade SEMANA 1
Reconhecer os principais objetivos da estatística descritiva e inferencial;
Compreender os conceitos de “população” e “amostra”, também os dois principais tipos de amostra que
podem ser estudadas – amostra aleatória simples e amostra estratificada;
Identificar, compreender e ser capaz de classificar os diferentes tipos de variáveis que são usados na
estatística e suas possíveis diferentes escalas de medida.

É a ciência que trata da coleta, organização, análise e


DEFINIÇÃO DE ESTATÍSTICA interpretação dos dados para tomada de decisão.

POPULAÇÃO AMOSTRA
É a coleção de todos os resultados, É um subconjunto ou parte de uma
respostas, medições ou contagens população.
que são de interesse.
PARÂMETRO: ESTATÍSTICA
Descrição numérica de uma característica Descrição numérica de uma característica
populacional. Constante para a população. amostral. Pode diferir de uma amostra para
outra.

DESCRITIVA INFERENCIAL

Envolve a organização, o resumo e Faz uso de amostra para chegar a


a representação de dados. conclusões sobre uma população

TIPOS DE DADOS
QUANTITATIVOS: QUALITATIVOS:
Consistem em atributos, rótulos ou entradas não numéricas. Consistem em atributos, rótulos ou
1. DISCRETAS: armazenam números que podem assumir entradas não numéricas.
somente um conjunto discreto de valores. Exemplos:
número de pessoas em uma fila, dias de férias
2. CONTÍNUAS: registram dados que podem assumir
valores em um intervalo real. Exemplos: preços, duração
de uma música, índice pluviométrico

MENSURAÇÃO ORDINAL:
Podem ser qualitativos ou quantitativos e tem
NOMINAL:
como característica a possibilidade de
Categorizados em nomes, rótulos ou
ordenação ou classificados, mas as entradas
qualidades que impossibilitam cálculos
não possuem característica numérica.
matemáticos.
RAZÃO:
INTERVALAR:
Um dado pode ser expresso
Podem ser ordenados e a significativamente como um múltiplo de
diferença entre eles calculada. outro.
construir uma distribuição de frequências para um conjunto de dados
quantitativos;
construir corretamente um histograma para representar a distribuição de
frequências através da escolha adequada do número e amplitude dos SEMANA 2
intervalos de classe;
descrever as principais medidas de posição (média, mediana e moda) e de
dispersão (amplitude total, desvio padrão) e realizar seu cálculo
diretamente a partir dos dados e das distribuições de frequências.
DISTRIBUIÇÃO DE FREQUÊNCIAS
Uma distribuição de frequências é uma tabela que mostra classes ou intervalos de valores com a
contagem do número de ocorrências em cada intervalo ou classe. A frequência f de uma classe é
o número de ocorrências de dados na classe. A diferença entre o valor máximo e mínimo dos
dados é chamada de amplitude.
PONTO MÉDIO: É a soma dos limites inferior e superior da classe dividida por dois. É
conhecida, também, por marca da classe (representante da classe).
FREQUÊNCIA RELATIVA: é a proporção ou fração de dados que está na classe. Para calculá-
la, a frequência deve ser dividida pelo tamanho n da amostra.
FREQUÊNCIA ACUMULADA: é a soma das frequências dessa classe com todas as anteriores. A
frequência acumulada da última classe é igual ao tamanho n da amostra. Um gráfico de ogiva é
um gráfico de linhas que mostra as frequências acumuladas até cada classe em sua fronteira
superior. As fronteiras superiores são marcadas no eixo horizontal e as frequências acumuladas
são marcadas no eixo vertical.
HISTOGRAMA:
3

É um gráfico para representar a distribuição de frequências. O histograma é um diagrama de


2

barras que representa a distribuição de frequências de um conjunto de dados. As propriedades


1

são: (1) a escala horizontal é quantitativa e indica os valores dos dados; (2) a escala vertical indica
0
10 12 14 16

as frequências das classes e (3) barras consecutivas devem estar encostadas umas nas outras.

MEDIDAS DE TENDÊNCIA CENTRAL


É um valor que representa uma observação típica ou central de um conjunto de dados. As três medidas
de tendência central mais usadas são:
MÉDIA é um conjunto de dados é a soma dos valores de dados dividida pelo número de observações.
MÉDIA PONDERADA
é a media de um conjunto de dados cujos valores tem pesos variados.
MEDIANA é um conjunto de dados é um valor que esta no meio dos dados quando o conjunto está
ordenado. A mediana indica o centro de um conjunto de dados ordenado, dividindo-o em
duas partes com quantidades iguais de valores. Quando o conjunto de dados tem um
número ímpar de observações, a mediana é o elemento do meio. Se o cojunto de dados
tem um número par de observaççoes , a mediana é a média dos dois elementos que
ocupam as posições centrais.
MODA de um conjunto de dados é o valor que ocorre com a maior frequência. Um conjunto de
dados pode ter uma moda, mais de uma moda, ou não ter moda. Quando nenhum valor se
repete, o conjunto de dados não tem moda. Quando dois valores ocorrem com a mesma
maior frequûencia, cada um é uma moda e o conjunto é chamado de bimodal.
FORMAS DE DISTRIBUIÇÃO

VARIÂNCIA E DESVIO PADRÃO

Interpretação: indica o quanto, em média,


os valores se desviam da média desse
conjunto.

CV: útil para comparar desvios em unidades


diferentes.

REGRA EMPÍRICA
Compreender os conceitos de experimento aleatório, espaço amostral,
probabilidade frequentista e enunciar os três axiomas da teoria das
probabilidades;
Descrever eventos em termos de conjuntos e aplicar os axiomas da teoria SEMANA 3
das probabilidades à resolução de problemas simples;
Compreender os conceitos de probabilidade condicional, eventos
mutuamente exclusivos e eventos independentes e aplicá-los à resolução
de problemas simples;
Conhecer o teorema de Bayes e a fórmula da probabilidade total e aplicá-
los à resolução de problemas simples.

Um experimento probabilístico é uma ação, ou tentativa sujeita à lei do acaso, pela qual
resultados específicos (contagens, medições ou respostas) são obtidos. O produto de uma
única tentativa em um experimento probabilístico é um resultado. O conjunto de todos os
resultados possíveis de um experimento probabilístico é o espaço amostral. Um evento é um
subconjunto do espaço amostral. Ele pode consistir em um ou mais resultados,
Um experimento aleatório é um experimento cujo resultado não podemos prever de
antemão.
Um espaço amostral (Ω) é um conjunto que contém todos os possíveis resultados do
experimento aleatório.
LANÇAMENTO DE UM DADO:
Experimento Probabilístico: Lançamento de um dado de seis faces.
Espaço amostral: {1,2,3,4,5,6}
Evento: Obter um número par {2,4,6}
Resultado: Obter um 2, {2}
Em alguns casos, um evento pode ocorrer de diversas maneiras diferentes, para isso é utilizado o
princípio fundamental da contagem: se um evento pode ocorrer de m maneiras e um segundo evento
pode ocorrer de n maneiras, o número de maneiras que os dois eventos podem em ocorrer em
sequencia é m. n. A regra pode ser estendida para qualquer número de eventos ocorrendo em
sequência.
ESCOLHENDO UM CARRO: O número de maneiras
Fabricantes: FORD, GM e HONDA (3) possível de escolher um
Tamanho: compacto, médio (2) carro é: 3 . 2 . 4=
Cores: branco, vermelho, preto e verde (4) 24
Probabilidade clássica (ou teórica) é usada
quando cada resultado em um espaço
amostral é igualmente possível de ocorrer. A
probabilidade clássica para um evento E é
dada por:
Probabilidade empírica (ou estatística) é
baseada em observações obtidas de
experimentos probabilísticos. A probabilidade
empírica de um evento E é a frequência
relativa de um evento E:
LEI DOS GRANDES NÚMEROS: conforme aumenta o número de vezes que um elemento probabilístico é
repetido, a probabilidade empírica (frequência relativa) de um evento aproxima-se de sua probabilidade
teórica.
AMPLITUDE DE PROBABILIDADES: A probabilidade de um evento E está entre 0 e 1. Ou seja, 0 ≤ P(E) ≤ 1.
AXIOMAS DA PROBABILIDADE:

(1) A probabilidade de um evento é um número real não negativo;


(2) A probabilidade de que algum evento elementar em todo o espaço da amostra irá ocorrer é 1. Mais
especificamente, não há eventos elementares fora do espaço amostral.
(3) Qualquer sequência contável de conjuntos disjuntos (sinônimo de eventos mutuamente exclusivos) é a
soma dos seus eventos independentes.

EVENTOS COMPLEMENTARES: a soma das probabilidades de todos os resultados em um espaço amostral


é 1. Desse modo, quando sabemos a probabilidade de um evento E, podemos encontrar a probabilidade do
complemento do Evento E (E').

Sabendo que o evento B ocorreu, PROBABILIDADE CONDICIONAL: é a probabilidade de um


qual é a probabilidade do evento A evento ocorrer, dado que outro evento já tenha ocorrido. A
ocorrer também? probabilidade condicional de o evento B ocorrer, dado que o
evento A tenha ocorrid, é denotado por P(B|A) e lê-se

P(A|B) = P(A B) / P(B) "probabilidade de B, dado A".

EVENTOS INDEPENDENTES: dois eventos são independentes quando a ocorrência de um deles não afeta
a probabilidade de ocorrência de outro. Dois eventos A e B são independentes quando:
P(B|A) = P(B) ou quando P(A|B) = P(A).

Como encontrar a probabilidade de REGRA DA MULTIPLICAÇÃO: Se os eventos A e B forem


dois eventos ocorrendo em independentes, então a regra pode ser simplificada para P(A e B)
sequência? = P(A) . P(B). Essa regra simplificada pode ser estendida para
qualquer número de eventos independentes.
P(A e B) = P(A).P(B|A)

Como encontrar a probabilidade de REGRA DA ADIÇÃO: para quando A ocorre e B não ocorre, B
dois eventos mutuamente ocorre e A não ocorre ou A e B ocorrem. Se os eventos forem
exclusivos, ou seja, quando não mutuamente exclusivos a regra pode ser simplificada para P(A ou
podem ocorrer ao mesmo tempo? B) = P(A) + P(B).

P(A ou B) = P(A) + P(B) - P(A e B)

Como atualizar nossas estimativas TEOREMA DE BAYES: implica que a crença atualizada é resultado
da probabilidade de um evento A da crença inicial multiplicada pela sua atualização.
conforme vamos obtendo mais
informações sobre os eventos que
já ocorreram?

P(A|B) = P(A) . P(B|A)/P(B)

FUNÇÃO DE VEROSSIMILIHANÇA: a função de verossimilhança ou função de probabilidade é uma função


dos parâmetros de um modelo estatístico que permite inferir sobre o seu valor a partir de um conjunto de
observações. Num certo sentido, a probabilidade é uma versão inversa da probabilidade condicionada.
Conhecendo um parâmetro B, a probabilidade condicional de A é P(A|B), mas se o valor de A é conhecido,
pode-se realizar inferências sobre o valor de B graças ao teorema de Bayes.
Compreender o conceito de variável aleatória como uma função de Ω em
R;
Identificar uma variável aleatória a partir de sua descrição como uma
“medida” realizada sobre os possíveis resultados de um experimento SEMANA 4
aleatório;
Conhecer as distribuições de probabilidades para as variáveis aleatórias
discretas mais simples;
Compreender o conceito de valor esperado (ou esperança) e de variância
de uma variável aleatória discreta e ser capaz de calculá-los nos casos mais
simples.

VARIÁVEIS ALEATÓRIAS: uma variável aleatória x representa um valor numérico associado a cada
indica que x é determinado em função de um objeto escolhido ao acaso. As
resultado de um experimento probabilístico (ou aleatório). variáveis aleatórias podem ser discretas ou contínuas.
Discreta: quando tem um número finito ou contável de resultados que podem ser enumerados.
Contínua: quando tem um número incontável de resultados possíveis, representados por um intervalo
na reta numérica.
DISTRIBUIÇÃO DISCRETA DE PROBABILIDADES
Uma distribuição discreta de probabilidade lista cada
valor possível que a variável aleatória pode assumir, com
sua respectiva probabilidade. Uma distribuição de
probabilidade discreta deve satisfazer às seguintes
condições:
Construindo uma distribuição discreta de probabilidade:
Seja x uma variável aleatória discreta com resultados possíveis X1, X2, ..., Xn:
1. Construa uma distribuição de frequências para os resultados possíveis;
2. Calcule a soma das frequências;
3. Determine a estimativa da probabilidade de cada resultado possível dividindo sua frequência pela soma
das frequências;
4. Verifique que cada probabilidade esteja entre 0 e 1, inclusive, e que a soma seja 1.

Média de uma variável aleatória discreta:


A média de uma variável aleatória discreta é dada por:
μ = ∑xP(x)
Cada valor de x é multiplicado por sua correspondente
probabilidade e os produtos são adicionados.

Variância e desvio padrão de uma varável aleatória


discreta:
A variância é: σ² = ∑(x-μ)²P(x)
Desvio Padrão: √σ² = √(x-μ)²P(x)

Valor Esperado (Esperança): *pode ser um valor negativo


Valor esperado: E(x) = μ = ∑xP(x)

Em um sorteio, 1500 bilhetes são vendidos a $ 2 cada, para


prêmios de $ 500, $ 250, $ 150 e $ 75. Você compra um bilhete,
qual o valor esperado de ganho?
EXPERIMENTOS BINOMIAIS
São experimentos que podem ser reduzidos a dois
casos: sucesso ou fracasso. Desse modo, um
experimento binomial deve satisfazer as seguintes
condições:
1. O experimento tem um número fixo de tentativas,
em que cada tentativa é independente das
outras.
2. Há apenas dois resultados possíveis para cada
tentativa, que podem ser classificados como
Sucesso (S) ou Fracasso (F).
3. A probabilidade de sucesso é a mesma para cada
tentativa.
4. A variável aleatória x conta o número de
tentativas com sucesso.

DISTRIBUIÇÃO GEOMÉTRICA

Experimentos que são realizados até que o sucesso ocorra. Desse modo, uma distribuição geométrica é
uma distribuição discreta de probabilidade de uma variável aleatória x que satisfaz as seguintes condições:
1. Uma tentativa é repetida até que o sucesso ocorra;
2. As tentativas repetidas são independentes umas das outras;
3. A probabilidade de sucesso p é a mesma para cada tentativa;
4. A variável aleatória x representa o número de tentativas até ocorrer o primeiro sucesso.

Considere que um jogador acerte em 75% das vezes. Calcule o primeiro lance que ele acerte ocorra na
terceira ou na quarta tentativa.

DISTRIBUIÇÃO DE POISSON

Utilizada para determinar a probabilidade de um número específico de sucessos em um dado número de


tentativas.
1. O experimento consiste em contar o número de vezes, x, que um evento ocorre em um dado intervalo
contínuo. O intervalo pode ser de tempo, área, volume ou outro intervalo contínuo.
2. A probabilidade de um evento acontecer é a mesma para intervalos de mesmo tamanho.
3. O número de ocorrências em um intervalo é independente do número de ocorrências em outros
intervalos não sobrepostos.
4. A probabilidade de haver exatamente x ocorrências em um intervalo é:
O número de médio de acidentes por mês
em certo cruzamento é três. Qual é a
probabilidade de, em qualquer mês, quatro
acidentes ocorrerem nesse cruzamento?

Identificar as principais variáveis aleatórias contínuas (uniforme,


exponencial, normal e gama) através de suas funções de distribuição de
probabilidades e suas aplicações típicas;
Compreender a aproximação normal à distribuição binomial e saber aplicá- SEMANA 5
la na resolução de problemas em que a aproximação faz sentido.

VARIÁVEIS CONTÍNUAS
Uma variável aleatória 𝑿 é contínua se pode assumir qualquer valor num dado intervalo real: 𝑿: 𝛀 𝑰 → ⊆ℝ
Distribuição Contínua de Probailidade: a mais importante é a distribuição normal. Propriedades:

1. A média, a moda e a mediana são iguais.


2. Uma curva normal tem formato de sino e é simétrica em
torno da média.
3. A área total sob a curva normal é igual a 1.
4. A medida que a curva normal se distancia da média, ela se
aproxima do eixo x, mas sem tocá-lo.
5. Os pontos nos quais o gráfico muda a orientação da
concavidade são chamados de ponto de inflexão.

DISTRIBUIÇÃO NORMAL PADRÃO:


Transformar um valor x em escore-z usando a fórmula:

Quando uma variável aleatória é


normalmente distribuída, você pode
determinar a probabilidade de que x estará
em um intervalo, encontrando a área sob a
curva normal, para o intervalo. Para
encontrar a área de algum intervalo sob
qualquer curva normal, você deve:

1. Converta o(s) limite(s) do intervalo para


escores-z.
2. Use a distribuição normal padrão para
encontrar a área
Uma variável aleatória contínua 𝑿 está completamente caracterizada pela sua
distribuição de probabilidades:

DISTRIBUIÇÃO UNIFORME

DISTRIBUIÇÃO EXPONENCIAL

DISTRIBUIÇÃO GAMA
Compreender e aplicar as desigualdades de Markov e de Chebyshev à
estimativa de probabilidades.
Compreender e aplicar as leis fraca e forte dos grandes números;
Compreender e aplicar o teorema central do limite à estatística. SEMANA 6
DISTRIBUIÇÃO AMOSTRAL

afirma que a soma de 𝒏 variáveis aleatórias independentes pode ser aproximada por uma distribuição normal independentemente da
distribuição particular das 𝒏 variáveis aleatórias.

O TEOREMA CENTRAL DO LIMITE


A distribuição das médias amostrais
tem a mesma média que a
população, mas o seu desvio padrão
é menor que o desvio padrão da
população. Isso nos diz que a
distribuição das médias amostrais
tem o mesmo centro que a
população, porém é mais
concentrada. Além disso, a
distribuição das médias amostrais
torna-se cada vez menos dispersa
(maior concentração em relação à
média) conforme o tamanho n da
amostra aumenta.

APLICAÇÃO

Ao selecionar 50 motoristas com idade entre 15 e 19 anos (média de


25 minutos). Qual é a probabilidade de que o tempo médio que
passam dirigindo por dia esteja entre 24,7 e 25,5 minutos? Suponha
que o desvio padrão seja de 1,5 minuto.
é um teorema que garante que a média dos resultados obtidos a
LEI DOS GRANDES NÚMEROS partir de um grande número de experimentos aleatórios tende a se
aproximar do valor esperado da variável aleatória observada.
DESIGUALDADE DE MARKOV: Seja 𝑿 uma var. aleatória com
distribuição 𝒇𝑿 e seja 𝒉 ≥ 𝟎 uma função não-decrescente. Podemos
escrever o valor esperado:

DESIGUALDADE DE CHEBYSHEV: para qualquer distribuição de


variância finita, a proporção de observações que ficam até k desvios
padrões da média é pelo menos 1 – 1/k2 para todo k>1

LEI FRACA DOS GRANDES NÚMEROS: nos garante que dado um


tamanho 𝒏 da amostra, provavelmente o valor de 𝑿ഥ é próximo do
valor esperado 𝑬(𝑿), mas pode acontecer de uma ou outra amostra
cair longe. A lei forte dos grandes números nos garante que, para
valores de 𝒏 suficientemente grandes, isso quase nunca acontece.

Compreender os conceitos de distribuição amostral da média e da


variância;
Descrever e aplicar as distribuições amostrais da média e da variância em
casos simples;
Compreender os conceitos de estimador pontual e de intervalo de SEMANA 7
confiança e saber como estimá-los para uma população normal em casos
típicos.

INFERÊNCIA ESTATÍSTICA: objetiva estimar (inferir) o valor dos parâmetros de uma população a partir
dos dados obtidos de uma ou mais amostras, de maneira controlada.
Dois pontos centrais:

Teste de hipóteses: Dada uma população 𝑿, qual é o modelo que melhor a descreve?
Estimação de parâmetros: Dado um modelo, quanto valem seus parâmetros?
Qual é a distribuição de probabilidades da média
A DISTRIBUIÇÃO T amostral de uma população da qual não se conhece a
variância?
A DISTRIBUIÇÃO QUI-QUADRADO

Você também pode gostar