Você está na página 1de 7

Poder observado é calculável e é 0,8 – erro tipo II.

Bioestatística descritiva: Fornecem um resumo coerente dos dados, apresentado-os de forma


organizada.

Bioestatística inferencial
Concluem com base em amostras para as informações serem expandidas para toda a
população (amostragem, estimativas, testes de hipóteses ou estatísticos).

Conceito de população:

Conjunto de indivíduos que compartilham de, pelo menos, uma característica comum.

Amostra:

Subconjunto de indivíduos extraídos de uma população.

Variável qualitativa: Resulta em uma classificação dos temas, é também chamada de


categórica.

Variável nominal: Rotula uma característica – ex: sexo, estado civil, tipo sanguíneo (não
existe hierarquia)

Variável ordinal: Nível de escolaridade, classe social, intensidade do exercício físico,


estágio de uma doença.

Variável quantitativa: São números, é chamada de numérica.

Discreta: Somente valores inteiros

Contínuas: Tem qualquer valor, pode ter vírgula (Não significa que vai ter vírgula, ex:
peso).

Amostragem probabilística e não probabilística

Deve ser coletada de forma a reproduzir as características da população que foi selecionada.

Probabilística: Alguma forma de sorteio não tendencioso de que qualquer pessoa da


população tenha probabilidade de participar da amostra.

Aleatória simples

Sistemática

Estratificada

Uniforme: A mesma quantidade de elementos da população nos extratos


igualmente.

Proporcional: A mesma quantidade de elementos da população nos extratos


proporcionalmente a participação deles na população.

Não probabilística: Não se conhece as respectivas probabilidades de seleção de cada indivíduo


da amostra (Não é pior).

Conveniência

Cotas

Dados dependentes e independentes


Dependentes: Dois grupos dos mesmos indivíduos em momentos diferentes.

Independentes: Dois grupos – Tratados ou não tratados com antibiótico

N: População

n: Amostra

Normalidade dos dados

São dados mais próximos da curva de Gauss.

Próximos da média: Normal ou homogêneo.

Dispersos da média: Não normal ou heterogêneo.

Teste de D’Agostino Pearson Omnibus

Teste de Shapiro-wilk: Menos de 50 elementos. – Perde poder estatístico com valores


repetidos.

Teste de Kolmogorov-smirnov: Maior ou igual a 50 elementos. – Substituido por Anderson


Darling.

- Não pode basear a decisão só nos testes clássicos de normalidade, existem testes numéricos
e testes gráficos.

Skewness entre +1 e -1.

95% da população em geral se concentra em 2,5 desvios padrões.

A curtose se relaciona com mais outliers

Medidas de posição:

Moda: Valor que aparece com maior frequência.

Média: Soma de todos os valores de um conjunto de dados dividido pelo número de valores do
conjunto.

Mediana: É o número que fica no meio da séria quando o número de observações é ímpar ou a
média aritmética de dois números do meio, quando o número de observações é par.

Desvio padrão:

Baixo: Dados próximos da média.

Alto: Dados distantes da média.

Não permite identificar o coeficiente de variação, mas a dispersão do preço dos produtos em
relação a média.
Média -> Desvios em relação a média -> Desvios ao quadrado -> Soma dos desvios ao
quadrado dividido por n-1 -> Variância -> Raiz quadrada da variância.

+/-: símbolo do desvio padrão.

O coeficiente de dispersão é importante para entender se a dispersão é alta, média ou baixa.

Coeficiente de variação:

Representa a variabilidade como uma fração em relação à média e o desvio padrão.

Quanto menor: Dados mais homogêneos.

Usado para analisar a mesma variável em duas ou mais amostras ou diferentes variáveis na
mesma amostra.

CV: desvio padrão * 100 / média.

Até 10%: Baixo.

Até 20%: Média

Até 30%: Alto

Mais de 30%: Muito alto.

Correlação linear:

Avalia a correlação entre duas variáveis quantitativas – não mostra causa e efeito.

Valor positivo: Diretamente proporcional.

Valor negativo: Inversamente proporcional.

Muito forte: 0,9 a 0,99

Forte: 0,7 a 0,89

Correlação positiva moderada: 0,5 a 0,69

Correlação positiva fraca: 0,01 a 0,49

Como calcular:

Começa com as colunas X e Y -> Cria as colunas X*Y, X² e Y² -> Soma todas as colunas -> Coloca
os valores na fórmula.

Coeficiente de determinação:

É um ajuste do modelo de correlação linear -> É o coeficiente de correlação ao quadrado.

Sempre vai ser um valor positivo.


Serve para explicar quais variáveis servem para influenciar em outra variável -> R² em
porcentagem.

Cálculo do n amostral depende do:

Teste estatístico

Nível de significância (>95%)

Poder observado (>80%)

Tamanho do efeito

Tipos de cálculo: A priori (Antes dos testes), criterion (para amostras muito grandes) ou post-
hoc (após os testes para saber o poder).

Hipóteses da pesquisa:

A hipótese nula se relaciona ao não.

É possível haver mais de uma hipótese alternativa (ex: aumenta ou diminui).

Critérios para escolha dos testes:

Normalidade dos dados.

Homogêneos: Testes paramétricos.

Heterogêneos: Testes não paramétricos.

Tipo de estudo: Observacional ou experimental.

Quantidade de grupos

Teste T: Compara a média entre dois grupos, com normalidade dos dados.

Teste T para uma amostra: Um n menor comparado para um n maior, serve para
comparar uma amostra com uma população (ex: crianças de uma cidade com crianças do
brasil). Para estudo observacional.

Teste T para amostras independentes: Comparar se existe diferença entre a média da


massa corporal entre homens e mulheres de uma universidade. Para estudos observacionais.

Amostras dependentes são variáveis do mesmo indivíduo, independentes são de


indivíduos diferentes.

Teste T pareado: Compara antes e depois. Para estudos experimentais.

Teste U de MANN Whitney: Teste para estudo observacional de até dois grupos e amostras
não normais.

Teste de Wilcoxon: Estudo experimental, até dois grupos e dados não normais, heteregeneos.
ANOVA: Análise de variância. Comparar 3 ou mais grupos em relação a uma variável
quantitativa.

- Os dados devem apresentar distribuição normal.

- Os grupos amostrais devem ser semelhantes.

- Quanto maior o N, mais confiável é a significância, não deve ser usada para amostras
pequenas.

Estudo observacional:

Anova one way:

Anova two way:

Dados heterogêneos: Teste de Kruskal Wallis

Estudo experimental:

Anova para amostras repetidas:

Dados heterogêneos: Teste de Friedman.

Escore padrão ou escore z:

Quanto que uma medida se afasta da média em termos de desvio padrão.

Permite identificar se um valor está à esquerda ou à direita do valor central.

Tabela Z: Observa o valor de Z na vertical e olha as casas após a vírgula na horizontal.

Consegue saber se está acima de 0,8, por exemplo, logo, está entre os 20% de maior valor.

Dá para fazer o cálculo inverso também para descobrir o valor de cada x para cada score z.

Outra forma que o score Z é utilizado é saber se o mesmo valor em conjuntos de dados
diferentes possui significados diferentes – Por exemplo: A partir da mesma nota em duas
matérias, calcular se foi melhor que quantas pessoas em cada grupo.

Você também pode gostar