Você está na página 1de 23

MEMOREX

ESTATÍSTICA

Por Vinícius Veleda


MEMOREX ESTATÍSTICA – Vinícius Veleda

E aí galera, tranquilo? Veleda aqui.

Preparei esse material com o intuito de disponibilizar para


vocês um compilado das fórmulas de estatística (em aproximada-
mente 20 páginas) para que vocês possam, sempre que precisar, ir a ele
e não até a teoria para sanar alguma dúvida sobre as equações na sua
reta final.

Para quem não me conhece, me chamo Vinícius Veleda e sou


Engenheiro de Petróleo formado pela Universidade Federal do Rio de
Janeiro – UFRJ e Engenheiro Geológico pela Universidade Politécnica de Madrid - UPM, tendo
estudado na juventude na Escola Preparatória de Cadetes do Exército migrando posterior-
mente para a Academia Militar das Agulhas Negras – AMAN. Comecei meus estudos para
concurso público (sempre focado em ser auditor) em meados de 2016, enfrentando todo o
“período de secas” dos concursos para a área fiscal. Mas não desisti e obtive minha aprovação
no ICMS RS na décima sexta posição, tendo ficado no CR tanto no ICMS GO quanto no ICMS SC.

O intuito desse material é ser um FORMULÁRIO MEMOREX de Estatística. Não tenho o


objetivo de demonstrar como se faz a questão nem como se aplica a fórmula nas questões (isso
eu gostaria de fazer posteriormente através de Lives e Video Aulas). Apenas transcrevi meu
caderno com minhas anotações, pelas quais eu estudava, para um PDF. Posso dizer que, após
estudar a teoria, eu mergulhava nas questões com essas anotações do lado e sempre foram de
grande valia. Não esgoto e muito menos abordo todo o conteúdo, estou apenas tentando de
alguma forma ajudá-los com aquilo que é mais cobrado e sendo de fácil acesso para vocês terem
em mãos enquanto se prepara para a reta final. Então repito mais uma vez, esse material é
apenas um compilado de fórmulas para sua reta final.

Agradeço ao Professor Manuel Martins, pois foi através de suas anotações e apostilas
que tirei a maioria das anotações que fazia em meus cadernos.

Estudar exatas é doloroso, exige tempo e, ao que parece, a tendência das bancas é pesar
a mão em estatística (e em TI, parece ser essa a moda). Então decore as fórmulas, entenda sua
aplicação nas questões e faça muitas e muitas questões.

Espero que esse material sirva de algum modo para vocês. Preparei ele com todo zelo
possível, inserindo as equações uma a uma e fazendo todos os gráficos no paint (menos o da
distribuição uniforme).

Críticas e sugestões são bem-vindas. Deixarei meus contatos abaixo, caso vocês
necessitem de alguma ajuda ou elucidação sobre o material.

Estarei na torcida, conte comigo! Sonhe, nunca desista, tenha fé, pois fácil não é e nem
vai ser. Tente até esgotar suas forças.... e assim a aprovação virá.

Email: v.veleda@poli.ufrj.br

Celular: (21) 997562567

2
MEMOREX ESTATÍSTICA – Vinícius Veleda

SUMÁRIO
1. MEDIDAS DE POSIÇÃO E DISPERSÃO..........................................................................5
1.1. MÉDIA ARITMÉTICA
1.2. DESVIO EM REALAÇÃO À MÉDIA
1.3. MEDIANA
1.4. MODA
1.4.1. MODA DE KING
1.4.2. MODA DECZUBER
1.4.3. MODA DE PEARSON
1.4.4. MODA BRUTA
1.5. POSIÇÃO RELATIVA DA MÉDIA, MODA E MEDIANA
1.6. VARIÂNCIA
1.7. DESVIO PADRÃO
1.8. COEFICIENTE DE VARIAÇÃO
1.9. VARIÂNCIA RELATIVA

2. PROBABILIDADE.......................................................................................................10
2.1. EVENTOS COMPLEMENTARES
2.2. EVENTOS INDEPENDENTES
2.3. EVENTOS MUTUAMENTE EXCLUSIVOS
2.4. PROBABILIDADE DA UNÃO DE EVENTOS
2.5. PROBABILIDADE CONDICIONAL
2.6. TEOREMA DE BAYES

3. DISTRIBUIÇÃO DE PROBABILIDADES DISCRETAS.......................................................12


3.1. DISTRIBUIÇÃO DE BERNOULLI
3.2. DISTRIBUIÇÃO BINOMIAL
3.3. DISTRIBUIÇÃO GEOMÉTRICA
3.4. DISTRIBUIÇÃO HIPERGEOMÉTRICA
3.5. DISTRIBUIÇÃO DE POISSON

4. DISTRIBUIÇÃO DE PROBABILIDADES CONTÍNUAS.....................................................14


4.1. DISTRIBUIÇÃO UNIFORME
4.2. DISTRIBUIÇÃO EXPONENCIAL
4.3. DISTRIBUIÇÃO NORMAL
4.4. DISTRIBUIÇÃO QUI-QUADRADO
4.5. DESIGUALDADE DE TCHEBYCHEV

5. INTERVALOS DE CONFIANÇA....................................................................................16
5.1. PARA A MÉDIA
5.2. PARA A PROPORÇÃO
5.3. ERRO PADRÃO

6. TESTE DE HIPÓTESES................................................................................................17

7. CORRELAÇÃO E REGRESSÃO.....................................................................................19
7.1. COEFICIENTE DE DETERMINAÇÃO

3
MEMOREX ESTATÍSTICA – Vinícius Veleda

7.2. COEFICIENTE LINEAR DE PEARSON OU COEFICIENTE DE CORRELAÇÃO

EXEMPLO

RESOLUÇÃO QUESTÃO FCC ICMS SC

4
MEMOREX ESTATÍSTICA – Vinícius Veleda

1. MEDIDAS DE POSIÇÃO E DISPERSÃO

1.1. MÉDIA ARITMÉTICA


𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ∑ 𝑋𝑖
𝑋= =
𝑁 𝑁
𝑋1 ∗ 𝑓1 + 𝑋2 ∗ 𝑓2 + ⋯ + 𝑋𝑛 ∗ 𝑓𝑛 ∑ 𝑋𝑖 ∗ 𝑓𝑖
𝑋= =
𝑓1 + 𝑓2 + ⋯ + 𝑓𝑛 ∑ 𝑓𝑖

Obs: Se os dados estiverem, na questão, agrupados em classes, trabalharemos com os pontos


médios (PM) de cada classe, sendo estes calculados pela média entre os limites da classe.
∑ 𝑃𝑀𝑖 ∗ 𝑓𝑖 𝑙𝑖𝑚𝑖𝑡𝑒𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + 𝑙𝑖𝑚𝑖𝑡𝑒𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
𝑋= , 𝑠𝑒𝑛𝑑𝑜 𝑃𝑀 =
∑ 𝑓𝑖 2

PROPRIEDADES DA MÉDIA ARITMÉTICA

1. A soma dos desvios em relação à média é igual a zero.


2. A média aritmética é um valor contido entre o valor mínimo e o valor máximo.
3. Multiplicando-se ou Dividindo-se todos os valores de um conjunto de dados por uma
constante, a média ficará multiplicada ou dividida por essa constante.
4. Somando-se ou Subtraindo-se todos os valores de um conjunto de dados por uma
constante, a média ficará aumentada ou diminuída dessa constante.

Obs: Além da média aritmética, as questões abordam também, a média geométrica e por
vezes também a harmônica.
𝑛
𝐺 = 𝑛√𝑋1 ∗ 𝑋2 … 𝑋𝑛 𝑒 𝐻=
1 1 1
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝐴 ≥ 𝐺 ≥ 𝐻 , 𝑎 𝑖𝑔𝑢𝑎𝑙𝑑𝑎𝑑𝑒 𝐴 = 𝐺 = 𝐻 𝑠ó é 𝑣á𝑙𝑖𝑑𝑎 𝑠𝑒 𝑡𝑜𝑑𝑜𝑠 𝑜𝑠 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑓𝑜𝑟𝑒𝑚 𝑖𝑔𝑢𝑎𝑖𝑠

1.2. DESVIO EM RELAÇAO À MÉDIA


É a diferença entre cada elemento e a média aritmética

𝑑𝑖 = 𝑋𝑖 − 𝑋

PROPRIEDADES DO DESVIO EM RELAÇAO À MÉDIA

1. A soma dos desvios em relação à média é igual a zero.


2. O somatório do módulo dos desvios é mínimo em relação à mediana.

5
MEMOREX ESTATÍSTICA – Vinícius Veleda

1.3. MEDIANA
Para número de dados Ímpar: Ordenamos os dados em sequência, e neste caso a mediana será
igual ao valor que ocupa a posição central.

Para número de dados Par: A mediana será dada pela média ente os valores que ocupam as
duas posições centrais.

PROPRIEDADES DA MEDIANA

1. O valor da Mediana pode ou não coincidir com um elemento da série. Quando o


número de elementos é ímpar ocorre a coincidência, porém quando for par, não
necessariamente haverá tal ocorrência.
2. A Mediana e a Média não tem necessariamente o mesmo valor.
3. A Mediana depende da posição e não dos valores dos elementos. Essa é uma diferença
entre a Mediana e a Média (esta que é muito influenciada pelos valores extremos)

Obs: Para os dados agrupados em classe, o melhor jeito de se fazer é usando o método da
Interpolação Linear da Ogiva (uma regra de três entre as classes). Tentei de todos os jeitos pensar
como eu colocaria esse método aqui no formulário, porém, acho melhor assistir uma vídeo aula
de um professor fazendo passo a passo e assim entrar no sangue de vez, pois fazendo uma vez,
na próxima é no automático. E deixarei também uma fórmula para o cálculo da Mediana em
dados agrupados em classes, mas como falei, seria desperdício de tempo decorar, fazer pela
Ogiva é mais tranquilo.
𝑛
− 𝐹𝑎𝑎
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + 2 ∗ ℎ , 𝑜𝑛𝑑𝑒
𝑓𝑚𝑑
𝑙𝑖𝑛𝑓 = 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑑𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝐹𝑎𝑎 = 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑑𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
ℎ = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑑𝑜 𝑖𝑛𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑑𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑓𝑚𝑑 = 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑠𝑖𝑚𝑝𝑙𝑒𝑠 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑑𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

1.4. MODA
É o valor que possui a maior frequência no conjunto.

1.4.1. MODA DE KING


𝑓𝑝𝑜𝑠𝑡
𝑀𝑜 = 𝑙𝑖𝑛𝑓 + ∗ ℎ , 𝑜𝑛𝑑𝑒
𝑓𝑎𝑛𝑡 + 𝑓𝑝𝑜𝑠𝑡

𝑙𝑖𝑛𝑓 = 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙


ℎ = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒
𝑓𝑝𝑜𝑠𝑡 = 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑖𝑚𝑒𝑑𝑖𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑒 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 à 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
𝑓𝑎𝑛𝑡 = 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑖𝑚𝑒𝑑𝑖𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 à 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙

6
MEMOREX ESTATÍSTICA – Vinícius Veleda

1.4.2. MODA DE CZUBER


𝐷1
𝑀𝑜 = 𝑙𝑖𝑛𝑓 + ∗ ℎ , 𝑜𝑛𝑑𝑒
𝐷1 + 𝐷2
𝐷1 = é 𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑒𝑛𝑡𝑟𝑒 𝑎 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑒 𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 à 𝑚𝑜𝑑𝑎𝑙
𝐷2 = 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑒𝑛𝑡𝑟𝑒 𝑎 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑒 𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 à 𝑚𝑜𝑑𝑎𝑙
ℎ = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
𝑙𝑖𝑛𝑓 = 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙

1.4.3. MODA DE PEARSON

𝑀𝑜 = 3 ∗ 𝑀𝑑 − 2 ∗ 𝑋

1.4.4. MODA BRUTA

É o ponto médio da classe modal

Obs: Quando o intervalo de classes possuírem amplitudes diferentes, a classe modal será aquela
que tiver maior densidade de frequência, que é obtida pela razão entre a frequência e a
amplitude de cada classe.

1.5. POSIÇÃO RELATIVA DA MÉDIA, MODA E MEDIANA


DISTRIBUIÇÃO SIMÉTRICA → 𝑋 = 𝑀𝑑 = 𝑀𝑜

DISTRIBUIÇÃO ASSIMÉTRICA POSITIVA (OU À DIREITA) → 𝑋 > 𝑀𝑑 > 𝑀𝑜

Obs: CUIDADO!! O maior valor é quem está mais pra direita na curva. Quem tem o maior valor
no eixo das abscissas (eixo “deitado”) e não quem “está mais alto”.

7
MEMOREX ESTATÍSTICA – Vinícius Veleda

DISTRIBUIÇÃO ASSIMÉTRICA NEGATIVA (OU À ESQUERDA) → 𝑋 < 𝑀𝑑 < 𝑀𝑜

1.6. VARIÂNCIA
É a média aritmética dos quadrados dos desvios em relação à média

1. Dados não Agrupados

∑(𝑋𝑖 − 𝑋)2 ∑ 𝑋𝑖2 2


𝜎2 = 𝑜𝑢 𝜎2 = −𝑋 𝑜𝑢 𝑎𝑖𝑛𝑑𝑎 𝜎 2 = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2
𝑛 𝑛
A Variância é “a média dos quadrados menos o quadrado da média”

2. Dados Agrupados

∑(𝑋𝑖 − 𝑋)2 ∗ 𝑓𝑖 ∑ 𝑓𝑖 ∗ 𝑋𝑖2 2


𝜎2 = 𝑜𝑢 𝜎 2 = −𝑋
∑ 𝑓𝑖 ∑ 𝑓𝑖

PROPRIEDADES DA VARIÂNCIA

1. Somando ou Subtraindo uma constante a todos os números de uma série, a Variância


não se altera.
2. Multiplicando ou Dividindo todos os números por uma constante (diferente de zero), a
variância fica Multiplicada ou Dividida pelo Quadrado da constante.

Obs: Quando for amostra, devemos usar a fórmula corrigida pelo fator de Bessel
2
2
∑(𝑋𝑖 − 𝑋)2 𝑛 ∑(𝑋𝑖 − 𝑋)
𝑆 = ∗ =
𝑛 𝑛−1 𝑛−1
𝑛
𝑜𝑛𝑑𝑒 = 𝑓𝑎𝑡𝑜𝑟 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒çã𝑜 𝑑𝑒 𝐵𝑒𝑠𝑠𝑒𝑙
𝑛−1

1.7. DESVIO PADRÃO


É a raíz quadrada da Variância

𝑆 = √𝑆 2

8
MEMOREX ESTATÍSTICA – Vinícius Veleda

PROPRIEDADES DO DESVIO PADRÃO

1. Somando ou Subtraindo uma constante a todos os números de uma série, o Desvio


Padrão não se altera.
2. Multiplicando ou Dividindo todos os números por uma constante (diferente de zero), o
Desvio Padrão fica Multiplicada ou Dividida por essa constante.

Obs: Em uma distribuição Normal:

Intervalo Percentual
[𝑋 − 1𝑆 ; 𝑋 + 1𝑆] ≅ 68% 𝑑𝑎𝑠 𝑂𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠
[𝑋 − 2𝑆 ; 𝑋 + 2𝑆] ≅ 95,5%
[𝑋 − 3𝑆 ; 𝑋 + 3𝑆] ≅ 99,7%

1.8. COEFICIENTE DE VARIAÇÃO


É o Desvio Padrão dividido pela Média
𝐷𝑃
𝐶𝑉 =
𝑋

PROPRIEDADES DO COEFICIENTE DE VARIAÇÃO

1. É Adimensional, isto é, não depende da unidade em que os dados são medidos.


2. Multiplicando ou Dividindo todos os números de uma série por uma constante, o CV
não se altera.
3. Somando-se uma constante positiva a todos os valores de um conjunto de dados, o CV
diminui.
4. Subtraindo-se uma constate positiva a todos os valores de um conjunto de dados, o CV
aumenta.
5. Quanto maior for o CV, mais heterogênea é a distribuição, isto é, os valores de Xi
estão mais dispersos em torno da média.

1.9. VARIÂNCIA RELATIVA


É o quociente entre a Variância e o quadrado da Média, ou ainda o quadrado do CV

𝑆𝑥2
𝑆𝑟2 = 2 𝑜𝑢 𝑆𝑟2 = 𝐶𝑉 2
𝑋
Obs: As propiedades da VR são as mesmas que as do CV

9
MEMOREX ESTATÍSTICA – Vinícius Veleda

2. PROBABILIDADE
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 𝑛(𝐴)
𝑃= =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑛(𝑆)

2.1. EVENTOS COMPLEMENTARES


Dois Eventos são ditos complementares quando, o resultado da união dos dois corresponde ao
espaço Amostral.

𝐸1 ∪ 𝐸2 = 𝑆 , 𝑜𝑛𝑑𝑒 𝑆 = 𝐸𝑠𝑝𝑎ç𝑜 𝐴𝑚𝑜𝑠𝑡𝑟𝑎𝑙


Obs: Espaço Amostral é o conjunto de todos os resultados possíveis de um experimento aleatório.
E Evento é qualquer subconjunto do Espaço Amostral S.

Obs: Sendo p a probabilidade que um evento ocorra (sucesso) e q a probabilidade que ele não
ocorra (insucesso), para um mesmo evento existe sempre a relação 𝑝 + 𝑞 = 1 → 𝑞 = 1 − 𝑝

2.2. EVENTOS INDEPENDENTES


Dois Eventos são ditos Independentes quando, a realização ou a não realização de um deles
não afeta a probabilidade de realização ou não do outro e vice-versa.

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵)

2.3. EVENTOS MUTUAMENTES EXCLUSIVOS


Dois ou mais Eventos são mutuamente exclusivos se a realização de um excluir a realização do
outro ou dos outros. Se dois Eventos são mutuamente exclusivos a probabilidade de que um ou
outro se realize é igual a soma das probabilidades para que cada um deles se realize e é dada
por:

𝑃 = 𝑃𝐴 + 𝑃𝐵
E, nos eventos mutuamentes exclusivos,

𝑃(𝐴 ∩ 𝐵) = 0

2.4. PROBABILIDADE DA UNIÃO DE EVENTOS

1. Para um conjunto de dois Eventos

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

2. Para um conjunto de três Eventos

𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)

10
MEMOREX ESTATÍSTICA – Vinícius Veleda

PROPRIEDADES DE PROBABILIDADE

1. A Probabilidade de um Evento A é um número maior ou igual a zero e menor ou igual a


1. 0 ≤ 𝑃(𝐴) ≤ 1
2. A Probabilidade de um Evento certo é igual a 1.
3. A Probabilidade de um Evento impossível é igual a 0.
4. Se B é o Evento Complementar, então 𝑃(𝐵) = 1 − 𝑃(𝐴)

2.5. PROBABILIDADE CONDICIONAL


Se A e B são Eventos de um espaço amostral S com 𝑃(𝐵) ≠ 0, então a probabilidade condicional
do Evento A, tendo ocorrido o Evento B é indicada por 𝑃(𝐴|𝐵) e dada por:
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴|𝐵) =
𝑃(𝐵)
Obs: Para os Eventos Independentes vimos que:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵) , 𝑠𝑢𝑏𝑠𝑡𝑖𝑡𝑢𝑖𝑛𝑑𝑜 𝑒𝑠𝑠𝑎 𝑒𝑞𝑢𝑎ç𝑎𝑜 𝑛𝑎 𝑑𝑒 𝑐𝑖𝑚𝑎 𝑡𝑒𝑟𝑒𝑚𝑜𝑠:


𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴) ∗ 𝑃(𝐵)
𝑃(𝐴|𝐵) = = , 𝑠𝑖𝑚𝑝𝑙𝑖𝑓𝑖𝑐𝑎𝑛𝑑𝑜 𝑓𝑖𝑐𝑎𝑚𝑜𝑠 𝑐𝑜𝑚 𝑃(𝐴|𝐵) = 𝑃(𝐴)
𝑃(𝐵) 𝑃(𝐵)

2.6. TEOREMA DE BAYES


A fórmula desse teorema pode assustar, e não é nada aconselhável decorá-la. Como eu expliquei
na Mediana pelo método da Ogiva, aqui eu digo a mesma coisa. Vendo uma resolução de
questão desse tipo por vídeo aula fica muito mais plausível para se aprender e entrar no sangue
a maneira de se resolver. Mas segue abaixo a fórmula:

Sejam 𝐸1 , 𝐸2 , … , 𝐸𝑛 Eventos Mutuamentes exclusivos tais que 𝐸1 ∪ 𝐸2 ∪ … ∪ 𝐸𝑛 = 𝑆. Sejam


𝑃(𝐸𝑖 ) as probabilidades conhecidas dos diversos exemplos, e B um evento qualquer de S para o
qual conhecemos todas as probabilidades condicionais 𝑃(𝐵|𝐸𝑖 ). Então para cada i temos:
𝑃(𝐸𝑖 ) ∗ 𝑃(𝐵|𝐸𝑖 )
𝑃(𝐸𝑖 |𝐵) =
∑ 𝑃(𝐸𝑖 ) ∗ 𝑃(𝐵|𝐸𝑖 )

11
MEMOREX ESTATÍSTICA – Vinícius Veleda

3. DISTRIBUIÇÃO DE PROBABILIDADES DISCRETAS

3.1. DISTRIBUIÇÃO DE BERNOULLI


Experimento aleatório com apenas dois resultados possíveis, sendo 𝑝 = 𝑠𝑢𝑐𝑒𝑠𝑠𝑜 e 𝑞 =
𝑓𝑟𝑎𝑐𝑎𝑠𝑠𝑜, 𝑜𝑛𝑑𝑒 𝑝 + 𝑞 = 1.

𝑃(𝑋 = 𝑘) = 𝑝𝑘 ∗ 𝑞1−𝑘 , 𝑘 ∈ {0,1}


𝐸(𝑋) = 𝑝

𝜎2 = 𝑝 ∗ 𝑞
𝐸(𝑋) = 𝑉𝑎𝑙𝑜𝑟 𝐸𝑠𝑝𝑒𝑟𝑎𝑑𝑜

𝜎 2 = 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎

3.2. DISTRIBUIÇÃO BINOMIAL → 𝐶𝑜𝑚 𝑅𝑒𝑝𝑜𝑠𝑖çã𝑜


É aplicada a uma variável aleatório X, quando temos vários experimentos independentes de
Bernoulli, e a cada um deles, associamos apenas dois resultados, Sucesso (p) e fracasso (q) de
modo que 𝑝 + 𝑞 = 1.
𝑛 𝑛 𝑛!
𝑃(𝑋 = 𝑘) = ( ) ∗ 𝑝𝑘 ∗ 𝑞 𝑛−𝑘 , 𝑜𝑛𝑑𝑒 ( )=
𝑘 𝑘 𝑘! ∗ (𝑛 − 𝑘)!
𝐸(𝑋) = 𝑛 ∗ 𝑝

𝜎2 = 𝑛 ∗ 𝑝 ∗ 𝑞
Obs: Os experimentos que seguem essa distribuição devem satisfazer as seguintes condições:

 O experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n)
 O resultado de uma tentativa não deve afetar os resultados seguintes.
 Em cada tentativa deve aparecer um dos dois possíveis resultados: sucesso ou
insucesso.
 No decorrer do experimento, a probabilidade 𝑝 de sucesso e a probabilidade 𝑞 de
insucesso deverão permanecer constantes.

3.3. DISTRIBUIÇÃO GEOMÉTRICA


Situações de fracasso até se atingir um sucesso.

Uma distribuição pode ser considerada Geométrica se satisfizer as seguintes condições:

1. Uma tentativa (correspondente a 1 ensaio de Bernoulli) é repetida até que um sucesso


ocorra, ou seja, ocorrem 𝑘 − 1 fracassos até que ocorra o primeiro sucesso na k-ésima
tentativa.
2. As tentativas são independentes uma das outras.
3. A probabilidade de sucesso 𝑝 é constante em todos os Ensaios de Bernoulli.

12
MEMOREX ESTATÍSTICA – Vinícius Veleda

𝑃(𝑋 = 𝑘) = (1 − 𝑝)𝑘−1 ∗ 𝑝
1
𝐸(𝑋) =
𝑝
1−𝑝
𝜎2 =
𝑝2

3.4. DISTRIBUIÇÃO HIPERGEOMÉTRICA


Seja uma população finita com N elementos dos quais 𝑟 são classificados como sucesso e 𝑁 − 𝑟
como fracasso. Dos 𝑁 elementos da população iremos selecionar uma amostra com 𝑛 elementos,
sem reposição. Vamos calcular quantos destes 𝑛 elementos possuem uma dada característica
(sucesso).

(𝑘𝑟 ) ∗ (𝑁−𝑟
𝑛−𝑘
)
𝑃(𝑋 = 𝑘) =
(𝑁
𝑛
)

𝐸(𝑋) = 𝑛 ∗ 𝑝
𝑁−𝑛
𝜎2 = 𝑛 ∗ 𝑝 ∗ 𝑞 ∗
𝑁−1

3.5. DISTRIBUIÇÃO DE POISSON


A explicação sobre essa distribuição não cairá em prova e você não precisa saber. A banca
geralmente diz que a distribuição é aproximada por Poisson, aproximada pois esta distribuição
nada mais é que o limite da distribuição Binomial quando 𝑛 → ∞ (n é grande e p pequeno).

𝜆𝑘 ∗ 𝑒 −𝜆
𝑃(𝑋 = 𝑘) = , 𝑜𝑛𝑑𝑒 𝑒 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑢𝑙𝑙𝑒𝑟 = 2,7182 …
𝑘!
𝐸(𝑋) = 𝜆

𝜎2 = 𝜆
𝜆 = 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜, 𝑜𝑢 𝑠𝑒𝑗𝑎, 𝑎 𝑡𝑎𝑥𝑎 𝑑𝑒 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎 𝑑𝑜 𝑓𝑒𝑛ô𝑚𝑒𝑛𝑜 𝑒𝑚 𝑒𝑠𝑡𝑢𝑑𝑜 𝑝𝑜𝑟 𝑢𝑛𝑖𝑑𝑎𝑑𝑒

Obs: As bancas geralmente fornecem a potência 𝑒 −𝜆 ou então o 𝐿𝑛 𝑒.

Obs: CUIDADO As bancas (principalmente a FCC) tentam enganar o candidato dando a média 𝜆
em certa unidade e pedindo o resultado em outra. Ex: a Banca fornece a quantidade de acidentes
no trabalho em 15 dias e pergunta qual seria a probabilidade de ocorrer tantos acidentes em 30
dias. Então muita atenção nesse pequeno detalhe.

Obs: Outro nome, menos comum, dado à Distribuição de Poisson é Distribuição dos Eventos
Raros.

13
MEMOREX ESTATÍSTICA – Vinícius Veleda

4. DISTRIBUIÇÃO DE PROBABILIDADES CONTÍNUAS

4.1. DISTRIBUIÇÃO UNIFORME

Obs: A Funçao de distribuição acumulada de uma Variável aleatória Uniforme Contínua é dada
por:

0, 𝑥<𝑎
𝑋−𝑎
𝑓(𝑥) = { , 𝑎≤𝑋≥𝑏
𝑏−𝑎
1, 𝑋>𝑏

4.2. DISTRIBUIÇÃO EXPONENCIAL

−𝜆𝑥
𝑓(𝑥) = {𝜆 ∗ 𝑒 , 𝑥≥0
0, 𝑥<0
1
𝐸(𝑋) =
𝜆
1
𝜎2 =
𝜆2

Obs: A Funçao de distribuição acumulada de uma Variável Aleatória Contínua de distribuição


Exponencial é dada por:

14
MEMOREX ESTATÍSTICA – Vinícius Veleda

−𝜆𝑥
𝐹(𝑥) = {1 − 𝑒 , 𝑥≥0
0, 𝑥<0

4.3. DISTRIBUIÇÃO NORMAL


Dizemos que a variável aleatória 𝑍 tem distribuição normal padrão quando 𝜇 = 0 e 𝜎 = 1, e
utilizamos a seguinte notação:
𝑋−𝜇
𝑍= , 𝑜𝑛𝑑𝑒 𝑋~𝑁(𝜇, 𝜎) 𝑒 𝑍~𝑁(0,1)
𝜎
Obs:
𝜎 1
𝐶𝑉(𝑍) = = =∄
𝜇 0
Obs: Conselho: Domine o uso da “tabela normal”. Irá te ajudar tanto nessa distribuição quanto
nos próximos tópicos (intervalo de confiança e teste de hipóteses). Não passe desse ponto sem
o pleno domínio e interpretação do uso dessa tabela.

4.4. DISTRIBUIÇÃO QUI-QUADRADO


Sempre que tivermos uma situação em que a variável envolvida puder ser expressa como uma
soma de quadrados de Variáveis Normais reduzidas, tal variável terá distribuição Qui-Quadrado.
𝑣

𝑋 = ∑ 𝑍𝑖2
2
, 𝑜𝑛𝑑𝑒 𝑣 = 𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒
𝑖=1

𝐸(𝑋) = 𝑣

𝜎2 = 𝑣2

A variável 𝑋 2 é igual a soma dos quadrados de 𝑣 variáveis normais reduzidas de Média zero e
Desvio Padrão unitário.

4.5. DESIGUALDADE DE TCHEBYCHEV

1 1
𝑃𝑓𝑜𝑟𝑎 ≤ , 𝑃𝑓𝑜𝑟𝑎 =
𝑘2 𝑀𝐴𝑋 𝑘2
1 1
𝑃𝑑𝑒𝑛𝑡𝑟𝑜 ≥ 1 − , 𝑃𝑑𝑒𝑛𝑡𝑟𝑜 𝑀𝐼𝑁 = 1 −
𝑘2 𝑘2

15
MEMOREX ESTATÍSTICA – Vinícius Veleda

5. INTERVALOS DE CONFIANÇA
𝑃(𝑋 − 𝑒𝑟𝑟𝑜 ≤ 𝜇 ≤ 𝑋 + 𝑒𝑟𝑟𝑜) = 1 − 𝛼

5.1. PARA A MÉDIA

5.2. PARA PROPORÇÕES


𝑝0 ∗ 𝑞0
𝑝 = 𝑝0 ± 𝑍 ∗ √
𝑛
𝑝0 ∗ 𝑞0
𝑝 = 𝑝0 ± 𝑒 , 𝑜𝑛𝑑𝑒 𝑒 = 𝑍 ∗ √
𝑛
Obs: 𝑝0 + 𝑞0 = 1

Obs: Variância Máxima → 𝑝𝑜 = 𝑞0 = 0,5

5.3. ERRO PADRÃO


𝜎
𝑒𝑝𝑎𝑑𝑟ã𝑜 = → 𝑝𝑎𝑟𝑎 𝑎 𝑚é𝑑𝑖𝑎
√𝑛
𝑝∗𝑞
𝑒𝑝𝑎𝑑𝑟ã𝑜 = √ → 𝑝𝑎𝑟𝑎 𝑎 𝑝𝑟𝑜𝑝𝑜𝑟çã𝑜
𝑛

Obs: Seja 𝑋 uma variável aleatória com média 𝜇 e variância 𝜎 2 , e seja 𝑋1 , 𝑋2 , … 𝑋3 uma
amostra aleatória simples de 𝑋, logo

𝜎2
𝐸(𝑋) = 𝜇 , 𝑉𝐴𝑅(𝑋) = → 𝑠𝑒 𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 𝑓𝑜𝑟 𝑟𝑒𝑡𝑖𝑟𝑎𝑑𝑎 𝑐𝑜𝑚 𝑟𝑒𝑝𝑜𝑠𝑖çã𝑜
𝑛

𝜎2 𝑁−𝑛
𝐸(𝑋) = 𝜇 , 𝑉𝐴𝑅(𝑋) = ∗√ → 𝑠𝑒 𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 𝑓𝑜𝑟 𝑟𝑒𝑡𝑖𝑟𝑎𝑑𝑎 𝑠𝑒𝑚 𝑟𝑒𝑝𝑜𝑠𝑖çã𝑜
𝑛 𝑁−1

16
MEMOREX ESTATÍSTICA – Vinícius Veleda

6. TESTE DE HIPÓTESES
𝐻0 = 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑁𝑢𝑙𝑎 𝑎 𝑠𝑒𝑟 𝑡𝑒𝑠𝑡𝑎𝑑𝑎

𝐸𝑟𝑟𝑜 𝑇𝑖𝑝𝑜 𝐼 = 𝛼 = 𝑁í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎

𝐸𝑟𝑟𝑜 𝑇𝑖𝑝𝑜 𝐼𝐼 = 𝛽
Obs: IMPORTANTE → Não há relação entre 𝜶 e 𝜷.

Colocarei agora um passo a passo de como se resolver um problema de teste de Hipóteses,


acompanhe esse procedimento com a resolução de um exercício feito em vídeo aula por um
professor que ficará melhor para entender. Em PDF é bastante complicado elucidar todo o
procedimento.

Primeiro Passo: Pelo enunciado do problema, estabelecer a Hipótese Nula (𝐻0 ) e a Hipótese
Alternativa 𝐻1 .

Segundo Passo: Também pelos dados do enunciado, definir a distribuição a ser utilizada: Normal
ou t-student. E como eu saberei? Indo naquele esquema colocado em folhas anteriores sobre
intervalo de confiança. Usamos t-student quando a 𝜎𝑝𝑜𝑝 é desconhecido e temos 𝑛 ≤ 30.

Tereiro Passo: Calcular a estatística teste (𝑡)

𝑋−𝜇
𝑍𝑐𝑎𝑙𝑐 = 𝜎 → 𝑆𝑒 𝑜 𝜎𝑝𝑜𝑝 𝑓𝑜𝑟 𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜
√𝑛

𝑋−𝜇
𝑍𝑐𝑎𝑙𝑐 = → 𝑆𝑒 𝑜 𝜎𝑝𝑜𝑝 𝑓𝑜𝑟 𝑑𝑒𝑠𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜 𝑒 𝑛 ≥ 30
𝑆
√𝑛

𝑋−𝜇
𝑡𝑐𝑎𝑙𝑐 = → 𝑆𝑒 𝑜 𝜎𝑝𝑜𝑝 𝑓𝑜𝑟 𝑑𝑒𝑠𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜 𝑒 𝑛 ≤ 30
𝑆
√𝑛

𝑆 = 𝐷𝑒𝑠𝑣𝑖𝑜 𝑃𝑎𝑑𝑟ã𝑜 𝑑𝑎 𝐴𝑚𝑜𝑠𝑡𝑟𝑎

17
MEMOREX ESTATÍSTICA – Vinícius Veleda

Caso o Teste de Hipóteses seja para a proporção, calculamos


𝑝0 − 𝑝
𝑍𝑐𝑎𝑙𝑐 =
𝑝∗𝑞

𝑛

Quarto Passo: Fazer o desenho da curva normal com nível de significância 𝛼 (geralmente
fornecido no problema)

Quinto Passo: Analisar onde o 𝑍𝑐𝑎𝑙𝑐 está no desenho comparando com o valor tabelado e concluir
se está dentro ou fora da região de rejeição.

Obs: 𝑝𝑣𝑎𝑙𝑜𝑟 = 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎 𝑝𝑎𝑟𝑎 𝑜 𝑞𝑢𝑎𝑙 𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟𝑒𝑚𝑜𝑠 𝐻0

𝛼 ≥ 𝑝𝑣𝑎𝑙𝑜𝑟 → 𝑅𝑒𝑗𝑒𝑖𝑡𝑎 − 𝑠𝑒 𝐻0

𝛼 < 𝑝𝑣𝑎𝑙𝑜𝑟 → 𝐴𝑐𝑒𝑖𝑡𝑎 − 𝑠𝑒 𝐻0

18
MEMOREX ESTATÍSTICA – Vinícius Veleda

7. CORRELAÇÃO E REGRESSÃO
Obs: Eu disse no início do material que não seria o propósito do material indicar como se aplicam
as fórmulas, mas nesse ponto da matéria eu abrirei uma exceção e mostrarei um “passo a passo”
de como calcular qualquer coisa que a banca possa pedir sobre esse item, pois é apenas decoreba
de formula que você não pode deixar de acertar, afinal a questão sobre isso vai ser tranquila
(ficou com raiva sobre o “vai ser tranquila”? hahaha sempre foi meu sonho falar isso. Quando eu
via um comentário do professor que começava dizendo que a questão era tranquila, e por mais
que ela fosse, eu me negava a ler o comentário e dava uma estrela). Então vamos lá,
primeiramente irei colocar as fórmulas e posteriormente explicarei.

Reta Ajustada

𝑌̂ = 𝑎 + 𝑏𝑋̂
Precisamos calcular 𝑎 e 𝑏:
𝐶𝑂𝑉(𝑋, 𝑌) 𝑛 ∗ ∑ 𝑋𝑌 − ∑ 𝑋 ∗ ∑ 𝑌
𝑏= 𝑜𝑢 𝑏=
𝜎𝑋2 𝑛 ∗ ∑ 𝑋2 − (∑ 𝑋)2

𝑎 = 𝑌−𝑏∗𝑋

Onde:
∑ 𝑋𝑌
𝐶𝑂𝑉(𝑋, 𝑌) = −𝑋∗𝑌 𝑜𝑢, 𝑒𝑚 𝑜𝑢𝑡𝑟𝑎 𝑛𝑜𝑡𝑎çã𝑜 𝐶𝑂𝑉(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋) ∗ 𝐸(𝑌)
𝑛
Covariância é “a média do produto menos o produto das médias”

PROPRIEDADES DA COVARIÂNCIA

Operação COV Exemplo


Somar uma constante a uma das variáveis Não se Altera 𝐶𝑂𝑉(𝑋 + 𝑘, 𝑌) = 𝐶𝑂𝑉(𝑋, 𝑌)

Subtrair uma constate a uma das variáveis Não se Altera 𝐶𝑂𝑉(𝑋 − 𝑘, 𝑌) = 𝐶𝑂𝑉(𝑋, 𝑌)

Multiplicar por uma constante Multiplicada pela 𝐶𝑂𝑉(𝑘 ∗ 𝑋, 𝑌) = 𝑘 ∗ 𝐶𝑂𝑉(𝑋, 𝑌)


constante
Dividir por uma constante Dividida pela 𝑋 1
𝐶𝑂𝑉 ( , 𝑌) = ∗ 𝐶𝑂𝑉(𝑋, 𝑌)
constante 𝑘 𝑘

7.1. COEFICIENTE DE DETERMINAÇÃO


𝐶𝑂𝑉 2 (𝑋, 𝑌) 𝑏 ∗ 𝜎𝑋2
𝜌2 = 𝑜𝑢 𝜌2 = , 0 ≤ 𝜌2 ≤ 1
𝜎𝑋2 ∗ 𝜎𝑌2 𝜎𝑌2

7.2. COEFICIENTE LINEAR DE PEARSON OU COEFICIENTE DE CORRELAÇÃO


𝐶𝑂𝑉(𝑋, 𝑌)
𝜌= , −1≤𝜌 ≤1
𝜎𝑋 ∗ 𝜎𝑌

19
MEMOREX ESTATÍSTICA – Vinícius Veleda

Obs: Questões teóricas podem abordar conceitos relacionados a COV, então saiba

𝑆𝑒 𝐶𝑂𝑉(𝑋, 𝑌) = 0 → 𝜌 = 0 𝑒 𝑖𝑠𝑠𝑜 𝑒𝑠𝑡𝑎𝑏𝑒𝑙𝑒𝑐𝑒 𝑑𝑢𝑎𝑠 𝑐𝑜𝑖𝑠𝑎𝑠


𝑷𝒓𝒊𝒎𝒆𝒊𝒓𝒂: 𝑄𝑢𝑒 𝑎𝑠 𝑣𝑎𝑟𝑖á𝑣𝑒𝑖𝑠 𝑠ã𝑜 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠 𝒐𝒖
𝑺𝒆𝒈𝒖𝒏𝒅𝒂: 𝑄𝑢𝑒 𝑎 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 é 𝑛ã𝑜 𝑙𝑖𝑛𝑒𝑎𝑟

Então atenção,

𝑄𝑢𝑎𝑛𝑑𝑜 𝑎 𝐶𝑂𝑉(𝑋, 𝑌) = 0 , 𝒏ã𝒐 𝒏𝒆𝒄𝒆𝒔𝒔𝒂𝒓𝒊𝒂𝒎𝒆𝒏𝒕𝒆 𝑎𝑠 𝑣𝑎𝑟𝑖á𝑣𝑒𝑖𝑠 𝑠𝑎𝑜 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠,


𝒎𝒂𝒔 𝒔𝒆 𝒂𝒔 𝒗𝒂𝒓𝒊𝒂𝒗𝒆𝒊𝒔 𝒔𝒂𝒐 𝒊𝒏𝒅𝒆𝒑𝒆𝒏𝒅𝒆𝒏𝒕𝒆𝒔, 𝒐𝒃𝒓𝒊𝒈𝒂𝒕𝒐𝒓𝒊𝒂𝒎𝒆𝒏𝒕𝒆 𝑎 𝐶𝑂𝑉(𝑋, 𝑌) = 0.

Obs: Trabalharemos agora alguns conceitos que não costumam cair em prova, mas colocarei as
formulas porque cada vez mais as bancas estão “pesando a mão” em estatística e pode ser que
comecem a cair.

𝑉𝐴𝑅(𝑋 + 𝑌) = 𝑉𝐴𝑅(𝑋) + 2 ∗ 𝐶𝑂𝑉(𝑋, 𝑌) + 𝑉𝐴𝑅(𝑌)


𝑉𝐴𝑅(𝑋 − 𝑌) = 𝑉𝐴𝑅(𝑋) − 2 ∗ 𝐶𝑂𝑉(𝑋, 𝑌) + 𝑉𝐴𝑅(𝑌)

𝑆𝑒 𝑋 𝑒 𝑌 𝑠ã𝑜 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠 → 𝐶𝑂𝑉(𝑋, 𝑌) = 0 𝑒


𝑉𝐴𝑅(𝑋 + 𝑌) = 𝑉𝐴𝑅(𝑋 − 𝑌) = 𝑉𝐴𝑅(𝑋) + 𝑉𝐴𝑅(𝑌)

Obs: Mais alguns conceitos

𝐶𝑂𝑉(𝑎 ∗ 𝑋 + 𝑏 , 𝑐 ∗ 𝑌 + 𝑑) = 𝑎 ∗ 𝑐 ∗ 𝐶𝑂𝑉(𝑋, 𝑌)
𝑉𝐴𝑅(𝑎 ∗ 𝑋 + 𝑏 ∗ 𝑌) = 𝑎2 ∗ 𝑉𝐴𝑅(𝑋) + 2 ∗ 𝑎 ∗ 𝑏 ∗ 𝐶𝑂𝑉(𝑋. 𝑌) + 𝑏 2 ∗ 𝑉𝐴𝑅(𝑌)
𝜌(𝑎 ∗ 𝑋 + 𝑏 , 𝑐 ∗ 𝑌 + 𝑑) = 𝜌

Agora colocarei um exemplo e calcularemos tudo referente a ele

Ex: Calcular (tudo que vimos) das Variáveis X e Y

X Y
2 10
4 8
6 6
8 10
10 12

Primeiro passo é colocar mais 3 colunas e 1 linha da seguinte forma representada abaixo,
sendo a última linha representada pelo somatório da respectiva coluna.

20
MEMOREX ESTATÍSTICA – Vinícius Veleda

X Y 𝑿𝟐 𝒀𝟐 X*Y
2 10
4 8
6 6
8 10
10 12

Completamos a tabela

X Y 𝑿𝟐 𝒀𝟐 X*Y
2 10 4 100 20
4 8 16 64 32
6 6 36 36 36
8 10 64 100 80
10 12 100 144 120
∑ = 30 ∑ = 46 ∑ = 220 ∑ = 444 ∑ = 288

Entao temos:

∑ 𝑋 = 30 ; ∑ 𝑌 = 46 ; ∑ 𝑋 2 = 220 ; ∑ 𝑌 2 = 444 ; ∑ 𝑋 ∗ 𝑌 = 288

Com isso conseguimos calcular tudo que a questão possa pedir. Claro, com esforço braçal,
afinal, para ganhar 20mil exige-se esforço, então não desista, vamos lá.

Reta ajustada 𝑌̂ = 𝑎 + 𝑏𝑋̂

Iremos calular o “b”


𝑛 ∗ ∑ 𝑋𝑌 − ∑ 𝑋 ∗ ∑ 𝑌
𝑏= 2 𝑠𝑢𝑏𝑠𝑡𝑖𝑡𝑢𝑖𝑛𝑑𝑜 𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
𝑛 ∗ ∑ 𝑋 − (∑ 𝑋)2
5 ∗ 288 − 30 ∗ 46
𝑏= = 0,3
5 ∗ 220 − (30)2
Calculando o “a”
𝑎 = 𝑌−𝑏∗𝑋
∑ 𝑌 46 ∑ 𝑋 30
𝑌= = = 9,2 𝑒 𝑋= = =6 𝑠𝑢𝑏𝑠𝑡𝑖𝑡𝑢𝑖𝑛𝑑𝑜 𝑒𝑚 𝑐𝑖𝑚𝑎 𝑡𝑒𝑚𝑜𝑠:
𝑛 5 𝑛 5
𝑎 = 9,2 − 0,3 ∗ 6 = 7,4

Como isso temos nossa reta ajustada → 𝑌̂ = 7,4 + 0,3 ∗ 𝑋̂

Podemos calcular também a 𝐶𝑂𝑉(𝑋, 𝑌)


∑ 𝑋𝑌 288
𝐶𝑂𝑉(𝑋, 𝑌) = −𝑋∗𝑌 = − 6 ∗ 9,2 = 57,6 − 55,2 = 2,4
𝑛 5

21
MEMOREX ESTATÍSTICA – Vinícius Veleda

Com a 𝐶𝑂𝑉(𝑋, 𝑌), podemos calcular o Coef. De Determinação

2
𝐶𝑂𝑉 2 (𝑋, 𝑌)
𝜌 =
𝜎𝑋2 ∗ 𝜎𝑌2

A 𝐶𝑂𝑉(𝑋, 𝑌) nós calculamos ai em cima, precisamos agora calcular a 𝜎𝑋2 e a 𝜎𝑌2 .

∑ 𝑋𝑖2 2 220
𝜎𝑋2 = −𝑋 = − 62 = 44 − 36 = 8
𝑛 5
∑ 𝑌𝑖2 2 444
𝜎𝑌2 = −𝑌 = − 9,22 = 88,8 − 84.64 = 4,16
𝑛 5
Substintuindo

2
2,42
𝜌 = = 0,173
8 ∗ 4,16
E se quisermos calcular o Coef. Linear de Pearson, basta tirarmos a raiz.

𝜌 = √0,173 = 0,416

Outra coisa que a banca poderia fazer seria pedir o valor de 𝑌para um dado valor de 𝑋, igual
caiu no último concurso da Sefaz SC. Vamos fazer?

FCC – Auditor Fiscal da Receita Estadual de Santa Catarina

A tabela a seguir indica o valor 𝑌 do salário, em número de salários mínimos (SM) e os


respectivos tempos de serviço, em anos, 𝑋, de cada funcionário.

X (anos) 2 3 5 3 2
Y (SM) 3 4 7 4 2

A questão fala mais algumas coisas e pede a previsão de salário para um funcionário com 4
anos de serviço.

Resolução: Primeiro passo é colocar essa tabela de uma forma mais “visível” na vertical.

X (anos) Y (SM)
2 3
3 4
5 7
3 4
2 2

Agora vamos repetir todo o procedimento feito no exemplo anterior. Começamos adicionando
mais 3 colunas e 1 linha, sendo essa linha dada pelo somatório de sua respectiva coluna.
Vamos adicionar e já preenche-las.

22
MEMOREX ESTATÍSTICA – Vinícius Veleda

X Y 𝑿𝟐 𝒀𝟐 X*Y
2 3 4 9 6
3 4 9 16 12
5 7 25 49 35
3 4 9 16 12
2 2 4 4 4
∑ = 15 ∑ = 20 ∑ = 51 ∑ = 94 ∑ = 69

Com isso temos:

∑ 𝑋 = 15 , ∑ 𝑌 = 20 , ∑ 𝑋 2 = 51 , ∑ 𝑌 2 = 94 , ∑ 𝑋 ∗ 𝑌 = 69

Nossa reta ajustada é dada por 𝑌̂ = 𝑎 + 𝑏𝑋̂, e precisamos então calcular 𝑎 e 𝑏.


𝑛 ∗ ∑ 𝑋𝑌 − ∑ 𝑋 ∗ ∑ 𝑌
𝑏= 𝑠𝑢𝑏𝑠𝑡𝑖𝑡𝑢𝑖𝑛𝑑𝑜 𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
𝑛 ∗ ∑ 𝑋2 − (∑ 𝑋)2
5 ∗ 69 − 15 ∗ 20 345 − 300 45
𝑏= = = → 𝑏 = 1,5
5 ∗ 51 − 152 255 − 225 30

E para calcular 𝑎, temos de calcular a média de 𝑋 e de 𝑌, pois a é dado pela fórmula abaixo:

𝑎 = 𝑌−𝑏∗𝑋
∑ 𝑋 15 ∑ 𝑌 20
𝑋= = =3 𝑒 𝑌= = =4
𝑛 5 𝑛 5
Substituindo na equação, ficamos com

𝑎 = 4 − 1,5 ∗ 3 → 𝑎 = −0,5
Nossa reta ajustada irá ficar

𝑌̂ = 𝑎 + 𝑏 ∗ 𝑋̂

𝑌̂ = −0,5 + 1,5 ∗ 𝑋̂
E no comando da questao ele pede o resultado de 𝑌 para 𝑋 = 4. Substituindo encontramos o
resultado final.

𝑌̂ = −0,5 + 1,5 ∗ 𝑋̂ = −0,5 + 1,5 ∗ 4 → 𝑌̂ = 5,5

Uma questão que não podemos deixar de acertar na prova. No TEC (hoje, dia 01 de Março de
2019) a questão tem 52% de acerto. É um diferencial para sua prova.

Bem, fico por aqui. Espero que de alguma forma esse compilado de fórmulas te ajude nas
resoluções das questões e te “automatize” para chegar na prova e não perder muito tempo.

23