Você está na página 1de 10

EDITAL

ESTATÍSTICA:
1 Estatística descritiva e análise exploratória de dados: gráficos, diagramas,
tabelas, medidas descritivas (posição, dispersão, assimetria e curtose).

2 Probabilidade. 2.1 Definições básicas e axiomas. 2.2 Probabilidade condicional e


independência. 2.3 Variáveis aleatórias discretas e contínuas. 2.4 Distribuição de
probabilidades. 2.5 Função de probabilidade. 2.6 Função densidade de
probabilidade. 2.7 Esperança e momentos. 2.8 Distribuições especiais.
2.9 Distribuições condicionais e independência. 2.10 Transformação
de variáveis. 2.11 Leis dos grandes números. 2.12 Teorema central do
limite. 2.13 Amostras aleatórias. 2.14 Distribuições amostrais.

3 Inferência estatística. 3.1 Estimação pontual: métodos de estimação,


propriedades dos estimadores, suficiência. 3.2 Estimação intervalar:
intervalos de confiança, intervalos de credibilidade. 3.3 Testes de
hipóteses: hipóteses simples e compostas, níveis de significância e
potência de um teste, teste t de Student, teste qui-quadrado.

4 Análise de regressão linear. 4.1 Critérios de mínimos quadrados e de máxima


verossimilhança. 4.2 Modelos de regressão linear. 4.3 Inferência sobre
os parâmetros do modelo. 4.4 Análise de variância. 4.5 Análise de
resíduos.
5 Técnicas de amostragem: amostragem aleatória simples, estratificada,
sistemática e por conglomerados. 5.1 Tamanho amostral.
Definições
Descritiva: Apresenta dados, gráficos com base numa pesquisa, por exemplo.
Estatística
Inferencial: Usa ferramentas para criar suposições a partir de uma amostra. (Teste de hipóteses)

População: Conjunto de indivíduos que possuem ao menos 1 característica em comum. (O todo)


População Amostra: Subconjunto de uma população.
e Amostra
O cálculo de média da amostra por exemplo é diferente da média da população.
Censo e Censo: Olha toda a população
Amostragem Amostragem: um subconjunto da população, utilizando uma técnica específica.

1. Dados isolados/brutos: 2, 2, 4, 5, 3, 8
2. Dados Agrupados
• Sem Intervalo de classe:
xi | fi
Apresentação 1 3
dos Dados 2 1
• Com intervalo de classe
xi fi
2|-4 2
4|-6 3

Rol
DADOS ORDENADOS.
Antes de fazer um cálculo, deve-se colocar os dados em ordem.
Outras
Apresentações Frequencia
Número de repetições
Frequência relativa: Porcentagem da frequência em relação ao todo.
Frequência acumulada: Acumula-se o valor anterior a cada classe.

Ramos Folhas
5 6
Diagrama de
6 235558
Ramos e
7 02
Folhas 9
Representa: 56, 62, 63, 65, 65, 65, 68, 70, 72,

(i) = Classe: Intervalos de variação da variável.


(k) = Número de classes.
Classe Limite inferior (Li): O menor valor do intervalo de uma classe.
Limite superior (Ls): O maior valor do intervalo de uma classe.
Amplitude: Diferença entre o limite inferior e superior.

Quantitativas: Contagem, medidas, números (podem ser comparados, somados)


• Discretas: 0, 1, 3, 5 (Número de eleitores por exemplo)
• Contínuas: Números quebrados, decimais. (valores em reais por exemplo)
Qualitativas: Características, palavras (sim, não) (Casado, Solteiro, Desquitado) (CEP 04553-333)
Variáveis
1. Dicotômicas: Apenas 2 resultados possíveis (Sim ou não, vivo ou morto, 0 ou 1)
2. Politômicas: Vários resultados possíveis.
• Ordinal: Existe Ordem (patentes de um militar)
• Nominal: Não há ordem (banana, cenoura, maçã, vendido, não vendido)
Estatística Descritiva
Medidas de • Médias (As 4)
Tendência • Mediana/separatriz
• Moda
Medidas de Central
• Medianas
Posição • Quartis 3 cortes que separam conjunto de dados
em 4
Separatrizes • Decis 9 cortes
em 10
• Centis/Percentis 99 cortes em 100
1. Média (X): (Valores 2 e 8)
Qts filhos vc tem?
Medida sensível!
• Aritmética (X): Soma e divide. (2+8 / 2 = 4) 2–1–3–0–1–2–3–0–1–2
• Ponderada (Peso): (Xp): Média aritmética com peso. (Divide td pela soma dos pesos)
• Geométrica(G): Raiz “x” da multiplicação dos valores (entre 2 e 8 é raiz de 16 = 4)
Xi Fi
• Harmônica (Hinversos): Qte valores/Soma dos inversos: n/ 1/2 + 1/8 = 3,2
0 2
Medidas de Relação entre médias: 1 3
Posição Aritmética X ≥ Geométrica G ≥ Harmônica H
2 3
Medidas de “X Good Half”
Tendência 3 2
2. Mediana/Separatriz (Me):
Central
Valor que ficou no centro das frequências listadas em ordem. Se ficarem 2 no meio, faz-se a média
das 2. No caso em questão: 0 0 1 1 1 2 2 2 3 3 (média entre 1 e 2, que é 1,5)

3. Moda (Mo):
Valor que mais se repete. ESTE SEMPRE ESTÁ PRESENTE NO CONJUNTO DE DADOS.
Se 2 valores se repetem, ambos são a moda (bimodal)! (1 e 2)
Se nenhum valor se repete, é amodal.
X Me
Mo

1. X = Me = Mo: Mo Me
X
Curva normal
Distribuição Simétrica. Gráfico espelhado.
50% 50%
Casos entre
2. X > Me > Mo: (X na frente do gráfico)
X, Me, Mo Distribuição assimétrica positiva. (ou à direita. Braço puxa pra direita).
X Me Mo
X < Me < Mo: (X antes dos demais)
Distribuição assimétrica negativa (ou à esquerda. Braço puxa pra esquerda) 50% 50%

Medidas de
Dispersão ou
de
Variabilidade

Variância
Estatística Descritiva 2

Outras
Medidas de
Dispersão ou
de
Variabilidade

Outliers
Desvio máx Lim. Superior (q3 +
q3 1,5iqr) Medida robusta, os outliers não a mudam.
Interquartílico: Porém, ela descarta 50% dos dados.
• Diagrama de q2
Caixas O bigodinho (laranja) que determina o valor
• Boxplot q1
máximo e mínimo, descarta os outliers. Só
• Diagrama de mín
Lim. Inferior (q1 - 1,5iqr) leva em consideração os dados dentro dos
Extremos e limites.
Quartis Outliers

Moda:
1º encontra-se o intervalo intermodal
Dados 2º acha o valor do meio deste intervalo, esta é a moda.
FREQUÊNCIA MODAL: quantidade de vezes que a moda aparece.
agrupados e Média aritimética:
ponderados 1º encontra-se a média de cada intervalo (50 -| 54) é 50+54/2 por exemplo.
2º Multiplca esta média dos intervalos pela frequência.
3º Divide este valor total encontrado pelo total de frequências.

Se tomarmos todos os elementos de um conjunto e os... (supondo 2 e 8), que a média é 5

...Somarmos a uma constante, ex: 3


Propriedades ...Multiplicarmos por uma constante
real
da Média,
Variância e A nova média será Também somada a Também multiplicada por
essa constante. essa constante
Desvio
Padrão O novo desvio Inalterado. Multiplicado por esta
padrão será constante (O módulo!!)
A nova variância Inalterado. Multiplicado pelo
será quadrado desta
constante.
Estatística Descritiva 3 - Avançado
Acha-se a classe modal
Acha-se o limite inferior
Moda King Acha-se a amplitude da classe modal
Acha-se a frequência da classe anterior e da posterior.
Mking = Li + (Amplitude x (fpost/fant+fpost)

Mczuber = Li + (amplitude x (var freq. Classe – classe anterior/ varfreqclasse – classe anterior
Moda
+ varfreqqclasse – classe posterior)
Czuber Rei pedindo uber: “O uber chega antes (ant), e o rei vem depois (post)”

Moda
3 Mediana – 2 Média
Pearson

Coeficientes PEAR SOMA (q3+q1)


de Pearsoma Coef. Assimetria, AKA Coeficiente de variação Quartil:
(Assimetria) Q3+Q1 - 2Q2 / Q3-Q1

Coeficiente
de Courtose
(Achatamento)
Estatística Inferencial - Teorias
Lei dos grandes números:
A média dos resultados da experiência tende a se aproximar do valor esperado a medida que
fizermos mais tentativas (qt mais vezes jogarmos uma moeda, mais a média se aproximará de 0,5)
Dela temos a Bernoulli,

Teorema do limite central:


Quanto mais uniforme/simétrica for uma distribuição, menos amostras temos que retirar para
chegarmos à media esperada.
Para isso, as variáveis devem ser independentes, e identicamente distribuídas.

Momentos:
Teorias 1º Tendência Central
diversas 2º Dispersão
3º Assimetria
4º Curtose

Correlação:
Associação positiva: Quando aumenta uma, aumenta a outra.

Graus de liberdade?
Quando há amostra pequena (menor que 30) usa-se o teste T de student.
Quando há amostra grande (maior que 30) usa-se o teste Normal (Z).
Estatística Inferencial - Probabilidade

Distribuição de
Probabilidade
Discreta

Binomial

Qual a probabilidade de um evento A acontecer, dado que um evento B aconteceu?


P(a|b) = P(a e b) / P(b)
Probabilidade
Condicional Eventos Independentes: P(aeb) = Pa . Pb ou
Pa|b = Pa
Exemplo: lançar uma moeda, dar cara, lançar denovo, dar cara denovo.

Condições:
1. Só há 2 possibilidades (1 Sim / 2 não)
2. Faz-se uma única tentativa de análise (só analisa 1 caso)
Distribuição
Bernoulli Características:
• É uma variável quantitativa DISCRETA (valor 0 ou 1, não assume 0,5)
• Sua média é a probabilidade de assumir valor 1.
• Sua variância é np . (1-p)

Distribuição
Poisson
Distribuições de probabilidade contínua

Varia-se entre um valor mínimo e máximo.


Distribuição A probabilidade de assumir qualquer valor nesse intervalo é igual/contínua/constante/uniforme.
Uniforme
(Constante) Média: (Máx+Min)/ 2
Variância: (Máx+Mín)² / 12

• Simétrica (Média = Mediana = Moda)


• Mesocúrtica
• Sem limite (vai do –infinito até 0, até +infinito.
• Definida pela média (μ) e desvio padrão (ϭ).
• Quanto maior o desvio padrão, mais larga é a curva.
• Qualquer acréscimo/redução em uma dist. normal, resulta numa dist. Normal diferente.

• Curva Normal PADRÃO tem média 0 e desvio padrão 1, e permite usar o Z:


Distribuição
Escore Padronizado (Z):
Normal: Z = (x – μx) / ϭx Resumindo: (variável – média) / desvio
padrão

Esse Z estará atrelado a uma probabilidade (Exemplo 0,233) numa tabela.

O intervalo de 1 desvio padrão representa 68% dos dados.


O intervalo de 2 desvios padrão representa 95% dos dados.
O intervalo de 3 desvios padrões representa 99,7% dos dados.

Usado para ver associações de variáveis NOMINAIS vs nominais, ou de nominais vs ordinal.

Pega várias distribuições normais padrão, eleva ao quadrado e soma.


Número de distribuições (n), chama-se GRAUS DE LIBERDADE.

Valor esperado/Média = número de distribuições.


Distribuição
Variância = 2N
Qui² Quanto mais graus de liberdade (n), mais a curva se parece com a curva normal.

Graus de liberdade na normal = n-1


Graus de liberdade de uma tabela = linhas-1 . Colunas-1

Valores esperados de diagonal: total linha . Total coluna / total da tabela


Deseja-se testar se uma afirmação é verdadeira.
Ho = Hipótese Nula
Ha = Hipótese Alternativa
Teste de X = Média amostral
μ = Média populacional
Hipóteses
Ϭ = Desvio padrão populacional
α = Nível de significância (1 - % de erro do tipo 1 (RV)) É tbm a probabilidade da H.a. no gráfico.
ou t de student Φ = Função acumulada, exemplo: Φ(1,96) = 0,975 (tudo da esquerda até o Z 1,96 é igual a 97,5%)

Zcalc = x – μ / dp pop/raiz de n
Se o zcalc cair na região de aceitação, Aceita-se a Ho.

Erros:
α = Erro tipo 1: RV (Rejeita Ho Verdadeira) AKA Significância do Teste.
Β = Erro tipo 2: AF (Aceita Ho Falso)

Nível de significância: α (RV)


Potência do teste/poder do teste: 1 – β (Complemento de AF)
Outros
Conceitos Atenção: Quanto mais aumenta-se a probabilidade de ALFA, mais diminui-se a probabilidade de BETA.

P valor (Probabilidade de significância)


Prob. de obter valor mais extremo do que na amostra (no Z calculado).
• Se Pvalor for maior que ALFA (Significância do teste), aceita-se Ho.
• Se Pvalor for menor que ALFA, rejeita-se Ho.

Coeficiente de
Correlação

Explica uma
relação de X
com Y

Cria uma
função.
Estatística Inferencial

Não científica. Seleção de forma subjetiva. (Cotas)

Amostragem não Amostragem por conveniência


probabilística ou Seleciona dados por serem mais fáceis de serem coletados/disponíveis.
não Casual
Amostragem por cotas
Sabe-se mais ou menos uma porcentagem para separar elementos por exemplo, e utiliza disso.

Técnica científica p/ calcular probabilidade de elemento fazer parte.

Amostragem simples:
Sorteio.
Amostragem
probabilística
Amostragem Estratificada
ou Casual Divide a população em subgrupos e aplica-se a amostragem simples sobre os indivíduos

Amostragem por conglomerados:


Divide a população em subgrupos e aplica-se a amostragem simples sobre os subgrupos.

Esperança

Estimador

Estimador da
Variância da
média
AMOSTRAL

Grau de liberdade = número de amostras – número de parâmetros observados.


Teste t de
student Teste T Estima só a média populacional, logo, possui n-1 graus de liberdade.
Logo se há 10 elementos, usaremos 9 graus de liberdade.

Amostrage
m Aleatória Precisa de um banco de dados já constituído.
Simples

Você também pode gostar