Você está na página 1de 5

ESTATISTICA

População X amostra
População: é um conjunto de objetos com características em comum (vc pode
definir critérios para sua população)
Unidade amostral: entidade selecionada para amostragem

Variável:
Qualitativa- não quantificada, sem valor atribuído (sem quantidade)
Nominal: categorias sem grandeza (não existe maior ou menor)
Ordinal: categoria com grandeza
Quantitativa- Quantificada de alguma forma, com valor atribuído
Discreta: contagens/números inteiros
Continua: mensurações/números reais

Experimento ou ensaio: O conjunto de todos os tratamentos, aplicados de


forma repetida
Tratamento: Tratamento é o procedimento aplicado cujo efeito deseja-se medir
e comparar com o efeito dos outros tratamentos

Medidas de tendência central (quando for usar qualquer método abaixo, é


bom deixar ordenado do menor ao maior)
Média – Soma todos os valores e divide pela quantidade de itens
Mediana- Pega todos os números e coloca em ordem crescente. A mediana
será o valor do meio.
Ex: temos 11 numeros, a mediana sera o sexto, pois tem 5 numeros antes dele
e 5 depois. Mas se tiver um numero par, pega o quinto e sexto, faz a media
deles dois e terá a mediana.
Moda- É o valor que mais se repete.

Medida de dispersão (serve para analisar dados que variam muito)


Algumas medidas de dispersão: amplitude total, variância, desvio padrão,
coeficiente de variação, erro padrão da média.
Amplitude total : maior valor – menor valor. Pega o maior valor e subtrai pelo
menor, assim obtendo a amplitude.
Variância e desvio padrão:
Variância= SQD/gl (numero de itens - 1)
formula no excel: VAR.A
SQD: soma dos quadrados dos desvios (quando se tem a média de uma
tabela de dados, se pega cada dado e tira o desvio padrão dele (o dado
subtraído pela média) )
gl: grau de liberdade (numero de itens - 1)

Desvio padrão= √ S² (é a raiz quadrada da variância)


formula no excel: DESVPAD.A
um desvio padrão pra
cima e outro pra baixo da
media, é 68% dos dados.
Já dois pra cima e dois
pra baixo da media, é
95% dos dados.

Erro padrão da media: É baseado no desvio padrão. Muito usado quando tem um
volume muito grande de amostragem
Erro padrão = desvio padrão/ raiz quadrada do número de amostras.
Coeficiente de variação(SEMPRE EM PORCENTAGEM): Ele resolve o problema do
desvio padrão. Um problema do desvio padrão é comparar a variância dos dados para
duas variáveis diferentes.
Coeficiente de variação(em porcentagem %) = 100 * desvio padrão/ média

Distribuição de Probabilidade Normal


A distribuição normal tem um gráfico com curvatura/onda em forma de sino
Características: é unimodal (só tem uma onda/curvatura no gráfico)
Média = mediana = moda (vão ter valores aproximados)
Vão ter 50% de dados acima da média e 50% abaixo
Qnto mais longe da média,maior a chance de não encontrar nada

Teste de normalidade
Definindo o número de CLASSES(K) (classes são as barras do gráfico)
N° de itens coletados <= 25 --- K= 5 classes
N° de itens coletados >25 e <=100 --- K = raiz quadrada da qntd de itens
N° de itens coletados >100 -- K = 5log¹°n (5 * log na base 10 daquele n°)

Tamanho da classe (amplitude total)


- pega o maior valor do conjunto de dados
- pega o menor valor do conjunto de dados
amplitude total = maior valor – menor valor
Intervalo de classe
- o intervalo de classe é: amplitude total / n° de classes

Utilizando distribuição normal para aferir probabilidades

Devemos tranformar a média em 0 e cada desvio padrão em 1


Basicamente transformaremos media em 0 e desvio padrão em 1. Chamamos
essa distribuição de Z
Com isso fica mais fácil de fazer calculos de probabilidade.
- X --- valor do dado
- U --- média de todos os dados
- O --- desvio padrão
Formula para obter o Z:
Z = X–U/ O

Teste de hipoteses
Hipotese nula – ela estabelece a auseência de diferença entre os parâmetros.
É sempre a primeira a ser testada.
Ex: Não há diferença nos batimentos cardiacos de pessoas que tiveram COVID
Hipotese alternativa – é aquilo que você acredita que vai acontecer.
Ex: Há diferença nos batimentos cardiacos de pessoas que tiveram COVID
TESTES
Teste bicaudal (bilateral)– muito usado quando não tem certeza do que vai
acontecer.
Teste unicaudal (unilateral a esquerda) – usado quando acha que será menor
que a média
Teste unicaudal (unilateral a direita) – usado quando acha que será maior que
a média

Teste T para média


Pega a média do seu conjunto de dados (normalmente é uma amostragem) e
compara ele com algo geral (pode ser uma população, outra fonte de dados).
Se sua base de dados (amostra) tiver a média igual a geral, então se deve
aceitar a hipotese nula, mas se der médias diferente, se deve considerar a
hipotese alternativa.
Para saber se deve aceitar ou não
a hipotese nula, se usa essa
formula:
T = média da sua amostra – média
geral / (desvio padão da amostra /
raiz quadrada do número de
dados)
1° definir se usara teste unicaudal
ou bicaudal
2° fixar a significancia em 5%
3° definir gl que está na tabela(numero de dados da amostragem)
4° visualizar região critica (linha do gl e coluna dos 5%)

Se T > t.tabelado = rejeita hipotese nula


Se T < t.tabelado = aceita hipotese nula
Exemplo:

Você também pode gostar