Escolar Documentos
Profissional Documentos
Cultura Documentos
Saúde Coletiva 4
Bioestatística
Por: Thaís Gomes Mateus
Thais Gomes Mateus
Aula 01: Introdução a Bioestatística
1.1 Bioestatística
★ Pode ser usada somente para descrever os dados através de suas medidas mais
comuns (médias, frequências, distribuições, etc.)
★ A estatística descritiva provê resumos simples sobre as observações do estudo.
★ Exemplos: A prevalência de uma doença, a média de notas de uma turma.
3. Variáveis - Classificação
★ Variáveis são a expressão numérica dos dados de um estudo. Uma variável é o
elemento chave na análise estatística.
★ A estatística e a bioestatística só podem ser utilizadas e trabalhadas a partir de
eventos que possam ser quantificados.
4. Variáveis - Tipos
★ Variáveis dependentes: Sofrem influência de algum fator, como por exemplo, o
efeito de um tratamento depende da dosagem do medicamento utilizado.
★ Variáveis independentes: Não sofrem influência de outras variáveis que estão
sendo avaliadas na pesquisa.
Thais Gomes Mateus
Imagine a seguinte situação: Você vai fazer um estágio e terá sua remuneração de
acordo com o número de turnos que você consegue trabalhar por semana.
1. Definição
★ Depois de definir o melhor formato estatístico (estatística descritiva x analítica) e
as variáveis que serão estudadas, é preciso organizar as informações e tabular os
seus dados.
★ Mas, o que é tabular? Tabular significa simplesmente organizar os seus dados de
forma que eles possam ser lidos e gerar alguma informação. Sem uma tabulação
adequada dos dados, será impossível seguir com as análises estatísticas.
2. Como fazer?
Jamovi ou BioEstat
Feito o arquivo, o segundo passo é identificar cada informação como sendo uma variável
diferente.
Procure nomear a sua variável com um nome curto e simples. Por exemplo, a informação
‘acompanhamento psicológico’ pode ser representada apenas por “acompanhamento”.
Excluir dados repetidos. Exemplo: se houver duas colunas com a mesma variável (idade,
por exemplo), excluir uma das duas colunas.
Utilizar filtros para organizar as variáveis. Por exemplo: ordem alfabética, ordem
crescente ou decrescente.
É importante sempre padronizar as repostas que serão analisadas.
Thais Gomes Mateus
A planilha única criada no excel deverá ser importada para o aplicativo selecionado, nesse
caso será o Jamovi.
O software estatístico irá realizar o processamento (estatística descritiva) das informações
das unidades amostrais.
Feito isso, agora é hora de selecionar as variáveis que se deseja estudar ou analisar.
Thais Gomes Mateus
Definição
Frequência absoluta (Fa): definida como o número de vezes (n) que determinado dado
(𝑥) aparece na amostra, ou seja, quantas vezes aquele dado se repete.
Frequência relativa (Fr): será a razão entre a frequência absoluta e o número (N) total
de todos os dados (𝑥1, 𝑥2, 𝑥3, etc.). Assim, a Fr será o número de observações de um
elemento dividido pela quantidade total de elementos no meu banco.
K=5
L=4
Thais Gomes Mateus
As variáveis quantitativas/numéricas deverão ser distribuídas em frequências pelo
EXCEL. O Jamovi não realiza tal distribuição, apenas para as variáveis categóricas
como foi realizado na aula anterior.
Passo 1: Copiar e colar os dados de “idade” ou da variável quantitativa estudada
para uma nova planilha.
3.1Feito isso, deve-se colocar sempre nas linhas os dados referentes a variável que está
sendo quantificada (idade, neste caso) e a frequência no campo “valores” para gerar a
soma da frequência ou a frequência absoluta daquela variável. Como indica a imagem
abaixo:
Thais Gomes Mateus
Média ponderada
Cada valor tem um peso diferente.
Exemplo: Notas de uma prova. Deve-se multiplicar cada valor pelo seu respectivo peso,
somar todos os resultados e dividir pela soma dos pesos.
Deve-se encontrar o ponto médio (limite inferior + limite superior dividido por 2) de
cada classe. Feito isso, multiplica-se pelo peso (que é a frequência absoluta) e faz a
soma. E divide tudo por 30 (soma dos pesos ou das frequências absolutas).
Exemplo:
Thais Gomes Mateus
Variância
Indica o quão distantes estão aos dados em relação à média aritmética. Quanto maior a
variância, mais distantes os dados estão da média, ou seja, estão mais dispersos. E,
quanto menor a variância, menos distantes os dados estão da média, ou seja, menos
dispersos estes dados estão.
Variância
Mediana
Além de ser usada para variáveis numéricas, também pode ser utilizada para variáveis
categóricas ordinais.
Definida como o valor que ocupa a posição central de uma distribuição ordenada de
dados (numéricas e ordinais).
Box-plot
Representação gráfica, gerada pelo JAMOVI do valor mínimo e máximo da distribuição
dos dados, bem como da mediana e dos quartis 1, 2 e 3. Quando maior o gráfico, maior
será o grau de dispersão/variação dos dados em torno da mediana (medida de tendência
central).
Coeficiente de variação
Usada para avaliar a variabilidade relativa entre duas ou mais distribuições de dados com
médias diferentes ou unidades de medidas diferentes. Exemplo: média das idades da
população de jovens e idosos OU média da altura medida em metros e em cm.
Moda (Mo)
1. O campo de variação de X é de - ∞ a + ∞
2. A distribuição dos dados é simétrica em torno da média (m)
3. A média, a mediana e a moda são iguais
4. A distribuição possui dois pontos de inflexão, μ - σ e μ + σ
5. A área total sob a curva é igual à unidade, ou 100%
Thais Gomes Mateus
Distribuição normal padronizada
Ex. Qual a probabilidade de escolher uma pessoa com renda anual entre 4.000 e
7.000 dólares, morador de uma cidade, sendo a renda média desta cidade de 5.000
dólares e desvio-padrão de 1.500. A renda populacional tem distribuição normal.
Z1= 0,66
Z2= 1,33
Análise
Se o valor do valor de p, obtido pelo Shapiro-wilk, for maior que 0,05 (5%), que
é o valor da zona de rejeição, dizemos que não há diferença estatisticamente
significante entre a distribuição dos dados da minha variável e a distribuição dos
dados na curva de Gauss. Portanto, podemos afirmar que os nossos dados estão
distribuídos dentro da normal de Gauss.
Se o valor do valor de p, obtido pelo Shapiro-wilk, for menor que 0,05 (5%),
que é o valor da zona de rejeição, dizemos que há diferença estatisticamente
significante entre a distribuição dos dados da minha variável e a distribuição dos
dados na curva de Gauss. Portanto, podemos afirmar que os nossos dados não
estão distribuídos dentro da normal de Gauss.