Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA
p o r Co n c u r se iro Fo ra d a C a i xa
Estatística
C o nc u rse i ro F o ra da C a i x a
Sumário
Estatística Descritiva ...................................................................................................................................................................... 2
Medidas de Dispersão................................................................................................................................................................................................3
Probabilidade................................................................................................................................................................................... 5
Variáveis Aleatórias........................................................................................................................................................................ 7
Amostragem................................................................................................................................................................................................................8
concurseiroforadacaixa.com.br | 01
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
ESTATÍSTICA DESCRITIV A
M ED I DA S D E P O SI ÇÃO
Tendênci a Centra l
Médias:
∑(𝑥𝑖 ∙ 𝑓𝑖 ) 𝒏 𝒏
√𝑥1 ∙ 𝑥2 … 𝑥𝑛 1 1 1 1
𝑛
𝑥1 + 𝑥2 + 𝑥3 … 𝑥𝑛
S e p a r a t ri z e s
Mediana:
Diagrama de Box-Plot:
• Divide a distribuição em 2 partes iguais
𝑛+1
• Número de elementos PAR (ROL):
2
Quartil:
• Para uma tabela – interpolação linear
Relação entre Média, Mediana e Moda para distribuições com assimetria positiva ou negativa:
concurseiroforadacaixa.com.br | 02
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
M ED I DA S D E D I SP ER SÃ O
A b so l u ta
Amplitude (h)
𝒉 = 𝑳𝒊𝒎𝒊𝒕𝒆𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓 − 𝑳𝒊𝒎𝒊𝒕𝒆𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓
Quando xi for multiplicado ou dividido por um valor, a variância é afetada com o quadrado.
Exemplo: se xi for multiplicado por 2 a variância fica multiplicada por 4, se por 3, fica multiplicada por 9.
Desvio Padrão (s | σ)
Rela tiv a
Variância Relativa
concurseiroforadacaixa.com.br | 03
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
CO M O SÃ O AF ET A DA S A S M ED ID A S P EL A S O EP R A ÇÕ ES M A T EM Á T CA S
Quando os valores observados forem multiplicados, divididos, somados ou diminuídos, as medidas estatísticas também têm
seus valores alterados. Eles são afetados da seguinte maneira:
Soma e Multiplicação e
Subtração Divisão
concurseiroforadacaixa.com.br | 04
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
PROBABILIDADE
P R O BA BIL ID A D E DA U N IÃ O
A probabilidade da união é a soma da probabilidade de ocorrer A ou B. Para que não haja contagem em duplicidade, elimina-se
o que há de interseção entre eles:
Exemplo: sendo A = {10, 11, 12, 13} e B = {10, 15, 20, 30, 31}, temos:
• P (B) = 5/8
• P (A ∩ B) = 1/8 (único elemento comum é o 10)
• Logo, P (A ∪B) = 4/8 + 5/8 - 1/8 = 1 (ou, 100%)
Um caso específico ocorre quando a interseção é um conjunto vazio (ou seja, não há elementos comuns entre os conjuntos). Isso
ocorrendo, dizemos que os eventos são mutuamente excludentes (ou exclusivos) ou que os conjuntos são disjunto. Nesse caso,
P (A ∩ B) = 0.
Atenção! As diretrizes acima também se aplicam a 3 ou mais conjuntos. A fórmula fica apenas maior, mas entendendo a
lógica, você não precisa decorá-la, basta pensar que devemos somar os elementos de todos os grupos individualmente, e
remover todas as intersecções possíveis (entre A e B, entre B e C, entre A e C e entre A, B e C).
P R O BA BIL ID A D E C ON D I CI ON AL
Basicamente, a probabilidade condicional trata da probabilidade de um determinado evento ocorrer, sabendo que um evento
condicionante já aconteceu. Matematicamente:
P(A ∩ B)
P(A|𝐁) =
P(𝐁)
Exemplo: ao lançar dois dados, qual a probabilidade de o resultado da soma das faces superiores ser igual a 6, sabendo que o
resultado do lançamento dos dados são dois números pares?
concurseiroforadacaixa.com.br | 05
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
Esquematizando, temos o quadro abaixo. Em amarelo estão os casos em comum (interseção), que ocorrem em A e em B:
Teorema da Multiplicação
Nada mais é do que uma forma diferente de olhar para a fórmula da probabilidade condicional:
EV EN T O S I ND EP END EN T ES
Eventos independentes são aqueles que não influenciam uns nos outros. Ou seja, não interessa o que ocorreu em B, pois ele
não tem influência sobre A. Matematicamente:
P(A|𝐁) = P(A)
Dessa forma, fazendo as substituições matemáticas necessárias, chegamos à fórmula abaixo, muito cobrada em prova:
Por exemplo, qual a probabilidade de, ao lançar uma moeda 3 vezes, ocorra 3 coroas?
• Um lançamento é independente do outro
• A chance de cara ou de coroa (para moedas não viciadas) é de 50% = ½
Dica! Questões que falam em “pelo menos um”, na resolução basta você fazer (1 – nenhum). Exemplo: em 3 lançamentos de uma
moeda, qual a chance de sair pelo menos uma cara?
• Chance de não sair nenhuma cara, é igual a dizer que só saiu coroa = 1/8, como calculamos acima.
• Logo a de sair pelo menos uma cara = 1 – 1/8 = 7/8 = 87,5%
concurseiroforadacaixa.com.br | 06
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
D I ST R I BUI ÇÕ ES D E P R O BA BI LI D AD E P AR A VA R IÁ V EI S DI SCR ET A S
Função Densidade de Probabilidade - f(X) Média μ Variância σ2 Função Distribuição Acumulada – F(X)
Observação
Função Densidade de Probabilidade - f(X) Média μ Variância σ2 Função Distribuição Acumulada – F(X)
Observação
Função Densidade de Probabilidade - f(X) Média μ Variância σ2 Função Distribuição Acumulada – F(X)
𝝀𝒙 ∙ 𝒆−𝝀
𝑷(𝒙) = 𝝀 𝝀 Calcular P(1), P(2), P(3),...., P(n) e somar
𝒙!
POISSON
Observação
λ geralmente é dado na forma “a média...” ou “a variância...”. Cuidado! Quando a questão fala “a média (λ) é de
5/h....qual a probabilidade de 10 em 3h? Transformar o λ = 5/h para λ = 15/h.
Função Densidade de Probabilidade - f(X) Média μ Variância σ2 Função Distribuição Acumulada – F(X)
𝟏 𝟏 − 𝒑(𝒔)
𝑷(𝒙) = 𝒑(𝒇) × 𝒑(𝒇) … × 𝒑(𝒔) Calcular P(1), P(2), P(3),...., P(n) e somar
GEOMÉTRICA
𝒑(𝒔) 𝒑(𝒔)𝟐
Observação
Situação: “fracasso, fracasso, ...sucesso”, ou seja, até se obter o 1º sucesso. A variável x é o número de tentativas.
Função Densidade de Probabilidade - f(X) Média μ Variância σ2 Função Distribuição Acumulada – F(X)
HIPERGEOMÉTRICA
𝑪𝑫,𝒌 × 𝑪(𝒏−𝑫),(𝒏−𝒌)
𝑷(𝒙 = 𝒌) = 𝒏𝒑 - Calcular P(1), P(2), P(3),...., P(n) e somar
𝑪𝑵,𝒏
Observação
concurseiroforadacaixa.com.br | 07
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
D I ST R I BUI ÇÕ ES D E P R O BA BI LI D AD E P AR A VA R IÁ V EI S CO N TÍ N UA S
Função Densidade de Probabilidade - f(X) Média μ Variância σ2 Função Distribuição Acumulada – F(X)
UNIFORME
1
, 𝑝𝑎𝑟𝑎 𝑎 ≤ 𝑥 ≤ 𝑏 𝒂+𝒃 (𝒃 − 𝒂)𝟐
𝒇(𝒙) = { 𝑏 − 𝑎 É a área abaixo da reta (base x altura)
0, 𝑝𝑎𝑟𝑎 𝑞𝑢𝑎𝑙𝑞𝑢𝑒𝑟 𝑜𝑢𝑡𝑟𝑜 𝟐 𝟏𝟐
EXPONENCIAL
𝟏 𝟏 𝑭(𝒙𝟎 ) = 𝟏 − 𝒆−𝜶𝒙𝟎
𝒇(𝒙) = 𝜶𝒆−𝜶𝒙
𝜶 𝜶𝟐 P(0 < x < x0)
NORMAL
A M O ST R A G EM
A MO S T R A G EM A L EA T ÓR I A S I M P LE S
Nessa forma de amostragem, os indivíduos de uma população têm uma chance igual ou maior que
zero de serem selecionados para a compor a amostra. A seleção de elementos é feita em forma de
sorteio, dessa forma, não há critério ou filtro.
Exemplo: pesquisa deve ser feita com 20 domicílios, mas o bairro possui 200. Assim, para se obter
uma amostra com 20 endereços, um sorteio entre os 200 endereços do bairro deve ser feito, dessa
maneira, todas as moradias têm a mesma chance de participar da pesquisa.
A MO S T R A G EM S I S TE MÁ T IC A
Exemplo: em uma pesquisa realizada em um bairro, podemos dividir 500 moradias em 50 grupos,
para obter uma amostragem com 50 residências, dessa maneira, a cada 10 domicílios 1 pesquisa será
realizada.
A MO S T R A G EM ES T R A TI F I CA DA
É realizada em duas etapas. Esse tipo de amostragem separa a população em grupos e subgrupos,
buscando assim, uma amostra mais representativa. Primeiro, deve-se dividir a população em grupos
distintos. Esses grupos devem ser segmentados com características da população que auxiliem o
tema estudado, podendo ser idade, sexo, trabalho, nível de escolaridade, entre outros.
A MO S T R A G EM PO R CO N G LO ME R A D OS
A amostra é realizada em mais de uma etapa, assim como a amostra estratificada. No primeiro
estágio, os grupos (ou conglomerados) são definidos. Assim, somente no último estágio os
indivíduos que participarão da entrevista serão sorteados.
concurseiroforadacaixa.com.br | 08
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
I N T ER V AL O D E CO N FI AN ÇA
C O N CE I T O
É uma amplitude de valores, derivados de amostras, que têm a probabilidade de conter o valor de um parâmetro populacional
desconhecido. Devido à sua natureza aleatória, é improvável que duas amostras de uma determinada população irão render
intervalos de confiança idênticos. Mas, se você repetir sua amostra várias vezes, uma determinada porcentagem dos
intervalos de confiança resultantes conteria o parâmetro populacional desconhecido.
Aqui, a linha preta representa o valor fixo da média desconhecida da população. Os intervalos de
confiança azuis contêm o valor da média da população. O intervalo de confiança vermelho
totalmente abaixo da linha horizontal não contém esse valor. Um intervalo de confiança de 95%
indica que 19 em 20 amostras (95%) da mesma população produzem intervalos de confiança
contendo o parâmetro da população.
I N T E R VA LO DE CO N F I A NÇA P A R A A MÉD I A
I N T E R VA LO DE CO N F I A NÇA P A R A A P RO P O RÇÃ O
𝒑𝟎(𝟏 − 𝒑𝟎 )
𝒑 = 𝒑𝟎 ± 𝒛√
𝒏
Quando a banca não der p0, supõe-se que a variância é máxima, de forma que p0 = 50%
concurseiroforadacaixa.com.br | 09
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
T EST E S D E H I P Ó T ESES
P R E L IM I N A R E S
H0 verdadeira H0 falsa
α: nível de significância, isto é, a probabilidade. de se cometer
NÃO HÁ ERRO ERRO um Erro Tipo I.
Aceitar H0
(DECISÃO CORRETA) TIPO II (β)
Pegadinha! A questão falar que há relação entre α e β,
ERRO NÃO HÁ ERRO ou que α + β = 1. Isso é ERRADO.
Rejeitar H0
TIPO I (α) (DECISÃO CORRETA)
T E S T E D E H I PÓ T ES E PA RA A MÉ D IA
Unilateral à esquerda
𝐻0: 𝜇 ≥ 𝜇0
{
𝐻1: 𝜇 < 𝜇0
Unilateral à direita
𝐻0: 𝜇 ≤ 𝜇0
{
𝐻1 : 𝜇 > 𝜇0
Bilateral
𝐻0: 𝜇 = 𝜇0
{
𝐻1 : 𝜇 ≠ 𝜇0
• O que determinar se o teste é à esquerda, direita ou bilateral é o SINAL da hipótese alternativa (H1)
T E S T E D E H I PÓ T ES E PA RA A P R O PO RÇ Ã O
P - V A L O R ( N ÍV EL DE S CR I T I VO O U PR OB A B I L IDA DE DE S IG N I F I CÂ N CIA )
o p-valor < α então rejeita-se H0 Portanto, α é o valor tabelado (área) de z ou t [população] já o p-valor é o valor
o p-valor > α - então NÃO rejeita H0 tabelado (área) do zCALC ou tCALC [amostra].
concurseiroforadacaixa.com.br | 10
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
CO R R EL A ÇÃ O E R EGR ESSÃ O
C O VA R IÂ N CI A
Definição: medida do grau de interdependência numérica entre duas variáveis aleatórias. Assim, variáveis independentes têm
covariância zero. Definição formal: 𝑐𝑜𝑣(𝑥, 𝑦) = 𝐸[(𝒙 − 𝑬(𝒙)) × (𝒚 − 𝑬(𝒚))] pouco utilizada. Para a prova levar:
Propriedades
2
• Relação de 2 variâncias com respeito à covariância: 𝜎𝑥±𝑦 = 𝜎𝑥2 ± 2𝑐𝑜𝑣(𝑥, 𝑦) + 𝜎𝑦2
R E T A DE R EG R ES S Ã O ( RE T A D OS M Í N IM O S Q U A D RA DO S )
MMQ: técnica de otimização matemática que procura encontrar o melhor ajuste para um conjunto de dados tentando
minimizar a soma dos quadrados das diferenças (resíduos) entre o valor estimado e os dados observados.
̂ 𝒙 𝒊 + 𝝐𝒊
𝒚𝒊 = 𝜶̂ + 𝜷
𝒄𝒐𝒗(𝒙,𝒚)
̂
1º) Encontrando 𝛽̂: formalmente temos que 𝜷 = , porém, para fins de prova, a fórmula que mais cai é:
𝝈𝟐𝒙
2º) Encontrando 𝛼̂: basta tirar a média de todos os termos da reta 𝒚𝒊 = 𝜶 ̂𝒙𝒊 + 𝝐𝒊, assim:
̂ +𝜷
̂ ⋅ 𝐸(𝑥)
̂ = 𝐸(𝑦) − 𝜷
𝜶
concurseiroforadacaixa.com.br | 11
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042
Estatística
C o nc u rse i ro F o ra da C a i x a
C OE F I C IE N T E DE DE T E RM I NA ÇÃ O ( R² )
R²: é um valor que varia entre 0 e 1 e indica, em percentagem, o quanto o modelo consegue explicar os valores observados.
Quanto maior o R², mais explicativo é o modelo, melhor ele se ajusta à amostra.
2
𝑐𝑜𝑣 2 (𝑥, 𝑦)
𝑅 = 2
𝜎𝑥 × 𝜎𝑦2
São questões de várias bancas (basta excluir das questões as bancas que não te interessam) e níveis (questões
simples às complexas). Complemente esse caderno com questões que você já selecionou como favoritas /
importantes, para revisar nas semanas anteriores à prova. Aliando este resumo com a resolução de questões
você certamente estará MUITO bem preparado(a)! Link: https://www.tecconcursos.com.br/s/Qb403
concurseiroforadacaixa.com.br | 12
Preparado exclusivamente para Germano Benedetti locatelli | CPF: 02675657042