Você está na página 1de 2

Resumo Aula 10

Fundamentos da inferência estatística :

Através de dados temos uma conclusão, ou seja, através dos dados podemos fazer extimativas
de probabilidades de algo ocorrer.

Os teoremas dos grandes números garantem a inferência estatística.

Com ela obtemos intuições e razões, sendo que, respectivamente, a primeira é dado pelos
gráficos, onde visualizados os dados coletados, e a segunda pelos testes, que são cálculos
sobre esses dados.

Gráficos

Para se construir um bom gráfico o ideal é seguir a hierarquia de Cleveland, sendo do pior para
o melhor: Cor < Volume < Área < Ângulo/degrau < comprimento < Posição em uma escala não
alinhada < Posição em uma escala em comum.

Há diversos gráficos, como de dispersão, frequência, partes, faixas, linhas, barras, volunas,
densidade e outros.

Teste de hipóteses:

Em um teste estatísticos de duas médias é tomado uma hipótese nula (que é aquilo que você
acredita que não é verdadeiro) e uma hipótese alternativa (que é aquilo que você acredita ser
verdadeiro).

Ele pode ser bidirecional (quando a hipótese nula é uma identidade entre as médias),
direcional (quando há médias maiores que outras) e unidirecional (que é quando você tem
uma afirmação mais forte, sendo mais específico, necessitando mais informações).

Os dados dão a liberdade de rejeitar hipóteses, pois se algo é falso para uma amostra coletada
aleatoriamente, então tende a ser falso para a população, por contas dos teoremas
fundamentais. Ou seja, dado a hipótese nula, qual a probabilidade de eu obter dados que
confirmem essa hipótese nula, isso é chamado de “p-valor”, se ele for pequeno (normalmente
é adotado 5%) então é possível rejeitar a hipótese nula.

Ainda sim é possível errar, o primeiro erro é quando a hipótese nula é verdadeiro, sendo esse
um erro grave, pois ocorreu um erro de coleta. O segundo erro é quando a hipótese nula é
falsa, mas ela não é rejeitada, ou seja, quando o “p-valor” da algo acima do aceitável (5%), ou
seja, falta dados para refutar a hipótese nula.

Para evitar esses erros é utilizado a significância (alfa) e poder (beta), o alfa é a probabilidade
de cometer o primeiro erro, já o beta é a probabilidade de ocorrer o segundo erro.
Normalmente é adotado alfa < 5% e beta < 20%.
Do ponto de vista prático, primeiro de aplica o teste de Shapiro-Wilk, que ele testa a hipótese
nula de que as amostras vem de uma população com distribuição normal, se “p” for menor
que 5% rejeita-se a normalidade. Após isso se aplica o teste t-student, onde se o “p” for menor
de 5% rejeita-se a igualdade, ou seja, uma média é maior que a outra.

Se os dados não forem normais, então é necessário fazer um teste não paramétrico, que não é
baseado em uma fórmula estatística, mas em um procedimento de ordem dos dados,
tomando que ambas as variáveis possuem a mesma distribuição.

Você também pode gostar