Roteiro Bioestatística Thaís Gomes

Roteiro
Saúde Coletiva 4
Bioestatística
Por: Thaís Gomes Mateus
Thais Gomes Mateus
Aula 01: Introdução a Bioestatística
1. Conceito de estatística e aplicações

★ Estatística é um ramo do conhecimento científico que têm, por objeto a
observação, a classificação formal e a análise dos fenômenos coletivos ou de
massa (finalidade descritiva) e, por fim, investigar a possibilidade de fazer
inferências indutivas válidas a partir dos dados observados e buscar métodos
capazes de permitir esta inferência (finalidade indutiva).
★ A palavra estatística vem do termo “status”, significando situação.
1.1 Bioestatística
★ É o estudo da estatística aplicada às áreas de biologia e saúde. O conhecimento

dos fundamentos de bioestatística são requisitos para o entendimento de literatura
especializada, realização de experimentos de biologia, estudos clínicos na área
médica, farmacologia, fisioterapia, odontologia, etc.
★ Bioestatística é a aplicação de modelos e teorias para testar probabilidades e
inferências que permitem interpretar dados gerados nas ciências da saúde.
★ “Você pode ter dados sem informação, mas não pode ter informação sem dados”
- Daniel Keys Moran
2. Divisões da bioestatística e suas aplicações
2.2 Estatística descritiva ou dedutiva
★ Pode ser usada somente para descrever os dados através de suas medidas mais
comuns (médias, frequências, distribuições, etc.)
★ A estatística descritiva provê resumos simples sobre as observações do estudo.
★ Exemplos: A prevalência de uma doença, a média de notas de uma turma.
2.3 Estatística analítica
★ Busca comparar grupos, testar hipóteses e desfecho de situações.

★ Exemplo: Grupo experimental (usando selante resinoso) vs Grupo controle
(selante ionomérico).
★ Permite fazer inferências na população, ou seja, aceitar com certa segurança, que
um valor específico de uma amostra irá se repetir na população.
Thais Gomes Mateus
3. Variáveis - Classificação
★ Variáveis são a expressão numérica dos dados de um estudo. Uma variável é o
elemento chave na análise estatística.
★ A estatística e a bioestatística só podem ser utilizadas e trabalhadas a partir de
eventos que possam ser quantificados.
★ As variáveis podem ser definidas de acordo com o tipo e a classificação.
4. Variáveis - Tipos
★ Variáveis dependentes: Sofrem influência de algum fator, como por exemplo, o
efeito de um tratamento depende da dosagem do medicamento utilizado.
★ Variáveis independentes: Não sofrem influência de outras variáveis que estão
sendo avaliadas na pesquisa.
Thais Gomes Mateus
Trate a variável dependente como o resultado
Pense na variável independente como uma causa que

produz um efeito
“Na bioestatística a variável dependente é a sua variável

de interesse, aquela que você estará observando
mudanças ou o efeito causado pelas demais.”
“Uma variável dependente não pode alterar uma variável independente”
Imagine a seguinte situação: Você vai fazer um estágio e terá sua remuneração de
acordo com o número de turnos que você consegue trabalhar por semana.
A remuneração altera o número de turnos OU o número de turnos altera a

remuneração?
Certamente, é o número de turnos que altera a remuneração. Logo, a remuneração é a

minha variável dependente e o número de turnos a minha variável independente. Uma
vez que, a remuneração DEPENDE diretamente do número de turnos.
Thais Gomes Mateus
Aula 02: Banco de dados e tabulação 03.04.2023
1. Definição
★ Depois de definir o melhor formato estatístico (estatística descritiva x analítica) e
as variáveis que serão estudadas, é preciso organizar as informações e tabular os
seus dados.
★ Mas, o que é tabular? Tabular significa simplesmente organizar os seus dados de
forma que eles possam ser lidos e gerar alguma informação. Sem uma tabulação
adequada dos dados, será impossível seguir com as análises estatísticas.
2. Como fazer?
Jamovi ou BioEstat
3. Banco de dados - Excel
Passo 1: EXPORTAÇAÕ DOS DADOS PARA O EXCEL
Baixe os dados obtidos através da aplicação do “GOOGLE FORMS”. Crie um arquivo

no EXCEL, e mantenha todos os seus dados em uma única planilha. Essa planilha será
Thais Gomes Mateus
exportada para o software estatístico (JAMOVI), então se o seu banco tiver duas ou mais
planilhas diferentes, não será possível fazer a análise.
Passo 2: PADRONIZAÇÃO DAS VARIÁVEIS E DOS DADOS
Feito o arquivo, o segundo passo é identificar cada informação como sendo uma variável
diferente.
Procure nomear a sua variável com um nome curto e simples. Por exemplo, a informação
‘acompanhamento psicológico’ pode ser representada apenas por “acompanhamento”.
Excluir dados repetidos. Exemplo: se houver duas colunas com a mesma variável (idade,
por exemplo), excluir uma das duas colunas.
Utilizar filtros para organizar as variáveis. Por exemplo: ordem alfabética, ordem
crescente ou decrescente.
É importante sempre padronizar as repostas que serão analisadas.
Thais Gomes Mateus
Passo 3: EXPORTAR OS DADOS DO EXCEL PARA O JAMOVI
A planilha única criada no excel deverá ser importada para o aplicativo selecionado, nesse
caso será o Jamovi.
O software estatístico irá realizar o processamento (estatística descritiva) das informações
das unidades amostrais.
Passo 4: CLASSIFICAÇÃO DAS VARIÁVEIS
Cada variável deverá ser classificada, ou seja, configurada no software em nominal,

ordinal ou numérica. No Jamovi as variáveis numéricas que não possuam “ordem”
deverão ser marcadas como continuas.
Thais Gomes Mateus
As variáveis referentes a identificação ou nome, deverão ser classificadas como ID,
representando as unidades amostrais, uma vez que não serão avaliadas no estudo.
Passo 5: ANÁLISE DOS DADOS PELA ESTATÍSTICA DESCRITIVA

Por fim, será realizada a análise ou estatística descritiva. Para isso, deve-se utilizar a
função “análises”, seguida de “exploração” e, por fim, “estatística descritiva” no menu
superior do software.
Feito isso, agora é hora de selecionar as variáveis que se deseja estudar ou analisar.
Thais Gomes Mateus
Estatística descritiva 1: UTILIZANDO APENAS VARIÁVEIS NUMÉRICAS

Calcular N, omisso, média, mediana, moda, percentis, desvio padrão, máximo, mínimo,
intervalo de confiança para média.
Estatística descritiva 2: UTILIZANDO APENAS VARIÁVEIS CATEGÓRICAS

Thais Gomes Mateus
Realizar tabelas de frequência para as variáveis categóricas. Utilizar apenas: N, omisso
e mediana (para as variáveis categóricas como semestre que aceitam mediana, por
exemplo).
Estatística descritiva 3: realizar tabela de frequência de todos os dados, separando

por categoria: sexo, turma, semestre, etc.
Calcular N, omisso, média, mediana, desvio-padrão, mínimo e máximo de todas as
variáveis, separando por SEXO, por exemplo.
Thais Gomes Mateus
Thais Gomes Mateus
Aula 03: Distribuição de frequência 10.04.2023
Definição
Frequência: quantidade de vezes em que um dado aparece na sua pesquisa.
Frequência absoluta (Fa): definida como o número de vezes (n) que determinado dado
(𝑥) aparece na amostra, ou seja, quantas vezes aquele dado se repete.
Frequência relativa (Fr): será a razão entre a frequência absoluta e o número (N) total
de todos os dados (𝑥1, 𝑥2, 𝑥3, etc.). Assim, a Fr será o número de observações de um
elemento dividido pela quantidade total de elementos no meu banco.
Divisão e limites de intervalos de classe
No caso de muito elementos ou ainda no caso de elementos com grande variação

(característica comum de variáveis numéricas) é possível separá-los em intervalos de
classe, que nada mais são do que intervalos numéricos representando um conjunto de
dados.
Vamos a um exemplo. Considere os seguintes dados referentes a idade de alunos de uma

determinada turma de graduação. Cada número representa a idade de um aluno:
Como calcular intervalos de classe

Thais Gomes Mateus
Exemplo: tabela referente aos valores de uma variável quantitativa
Como calcular limites de intervalos de classe
K=5
L=4
Thais Gomes Mateus
As variáveis quantitativas/numéricas deverão ser distribuídas em frequências pelo
EXCEL. O Jamovi não realiza tal distribuição, apenas para as variáveis categóricas
como foi realizado na aula anterior.
Passo 1: Copiar e colar os dados de “idade” ou da variável quantitativa estudada
para uma nova planilha.
Passo 2: Organizar os dados em ordem crescente, utilizando o botão de filtro. Depois

de organizar em ordem crescente, inserir na coluna seguinte a denominação
“FREQUÊNCIA”.
Thais Gomes Mateus
Passo 3: ORGANIZAR O BANCO DE DADOS POR CLASSES.
No menu superior do EXCEL, clicar em “inserir”, seguido de “tabelas” e, por fim, “tabela
dinâmica”. Quando clicar em “tabela dinâmica”, selecionar a opção “nova planilha”.
3.1Feito isso, deve-se colocar sempre nas linhas os dados referentes a variável que está
sendo quantificada (idade, neste caso) e a frequência no campo “valores” para gerar a
soma da frequência ou a frequência absoluta daquela variável. Como indica a imagem
abaixo:
Thais Gomes Mateus
Passo 4: ORGANIZAR A TABELA DINÂMICA EM GRUPOS.

Deve-se selecionar os dados que estão sendo quantificados (os dados referentes a idade,
neste caso). Clicar com o botão direito do mouse, e selecionar a opção “agrupar” que
aparece no menu. Logo em seguida, deve-se indicar qual o valor mínimo e máximo dentro
dos dados e o limite (L) (que foi calculado previamente).
Lembrete: sempre realizar o cálculo da frequência relativa ao lado dos dados da
frequência absoluta que foram gerados automaticamente pelo EXCEL.
Passo 5: CRIAR GRÁFICO DOS DADOS DA TABELA

5.1 Para isso deve-se selecionar e copiar apenas os dados da tabela dinâmica e a
frequência absoluta (a frequência relativa não entra no gráfico). Feito isso, clicar em
“colar” na página inicial, seguido de “valores” (colar na parte inferior da tabela dinâmica).
5.2 Selecionar os valores da variável que está sendo quantificada, e clicar em “inserir”,
seguido de “gráficos recomendados” e, por fim, “colunas agrupadas” (que será o nosso
histograma).
Thais Gomes Mateus
Thais Gomes Mateus
Aula 04: medidas de tendência central e dispersão 17.04.2023
Além da distribuição de frequências, discutida na aula anterior, a distribuição dos dados

também pode ser analisada pela forma como se organizam no centro da distribuição
(medidas de tendência central) e como se distribuem em torno do centro de distribuição
(medidas de dispersão).
Média aritmética
Medida de tendência central mais comum para a descrição de variáveis quantitativas,
discretas ou contínuas, é a média.
É calculada pela divisão da soma de todos os valores pelo número total de valores (n).
Vamos supor que você tem 4 provas de saúde coletiva.

Suas notas foram: 1º prova (3,0) 2º prova (9,1) 3º prova (8,0) 4º prova (2,8)
3 + 9,1 + 8 + 2,8 ÷ 4 = 5,7
Média ponderada
Cada valor tem um peso diferente.
Exemplo: Notas de uma prova. Deve-se multiplicar cada valor pelo seu respectivo peso,
somar todos os resultados e dividir pela soma dos pesos.
Quando os dados estão agrupados
Deve-se encontrar o ponto médio (limite inferior + limite superior dividido por 2) de
cada classe. Feito isso, multiplica-se pelo peso (que é a frequência absoluta) e faz a
soma. E divide tudo por 30 (soma dos pesos ou das frequências absolutas).
Exemplo:
Thais Gomes Mateus
Variância
Indica o quão distantes estão aos dados em relação à média aritmética. Quanto maior a
variância, mais distantes os dados estão da média, ou seja, estão mais dispersos. E,
quanto menor a variância, menos distantes os dados estão da média, ou seja, menos
dispersos estes dados estão.
Variância
Além se de estudar a média, estuda-se como os dados se comportam em relação a essa

média aritmética.
O que influencia nessa dispersão ou variância: o tipo de dado e o tamanho da amostra,

amostragem e o tipo de dado.
Thais Gomes Mateus
Se o valor da subtração X1-X for negativo: a elevação ao quadrado modifica o sinal

negativo para positivo. Na variância não importa se distancia é maior ou menor, só
importa a distância.
Grau de liberdade: número de vezes em que podemos variar na escolha de dados
(N – 1)
Desvio-padrão:
É a raiz quadrada da variância. O conceito é o mesmo, ou seja, o desvio-padrão analisa
como os dados se comportam em torno da média.
̅ ± dp: calculamos a média, para somá-la e subtraí-la ao desvio-padrão. Dessa forma,

𝑿
observamos que os dados podem ir tanto para “mais” ou para “menos” em relação ao
centro (que é a média).
1º passo: ESTATÍSTICA DESCRITIVA NO JAMOVI
Selecionar apenas as variáveis quantitativas no Jamovi, e realizar a estatística descritiva.
Obs.: selecionar APENAS os itens: N, média e desvio-padrão e histograma.
Thais Gomes Mateus
2° passo: TABELA NO MICROSOFT WORD COM OS DADOS OBTIDOS
Variáveis ̅ (± dp)
𝑿
Idade 23,90 (± 4,35)
Ganho de peso 3,07 (± 4,07)
Tempo de deslocamento 1,26 (± 0,80)
Tempo para estudar 3,80 (± 1,66)
Matérias por dia 1,40 (± 0,57)
Peso 66,70 (± 13,50)
Altura 1,63 (± 0,10)
Mediana
Além de ser usada para variáveis numéricas, também pode ser utilizada para variáveis
categóricas ordinais.
Definida como o valor que ocupa a posição central de uma distribuição ordenada de
dados (numéricas e ordinais).
Exemplo: 8º (oitava posição da distribuição). Para distribuição em número ímpar.

Diferença entre média e mediana
Se a média de tempo de presa de determinado material bioquímico é de 4 minutos,
significa que o tempo de presa de uma amostra será em torno de 4 minutos. Se a
mediana for igual a 4 minutos, significa que metade das amostras tem presa inferior a 4
minutos e a outra metade toma presa acima deste tempo.
Quartil
Um vez que a mediana divide meus dados pela metade, é possível dividir essas metades
em outras metades e assim, por diante.
Quando dividimos nossos dados em quatro partes iguais, definimos os quartis de uma
amostra.
Intervalo interquartil
Quando a medida de tendência central usada é a mediana, a medida de dispersão
correspondente é o intervalo interquartil (IQR), calculado pela diferença entre o terceiro
e o primeiro quartis:
1º passo: ESTATÍSTICA DESCRITIVA NO JAMOVI
Selecionar apenas as variáveis quantitativas e as categóricas ordinais no Jamovi, e
realizar a estatística descritiva. Obs.: selecionar APENAS os itens: N, mediana, IQR e
Box plot.
Thais Gomes Mateus
2° passo: TABELA NO MICROSOFT WORD COM OS DADOS OBTIDOS
Variável Mediana IQR
Semestre 6,0 0,0
Rendimento 2,0 0,25
Frequência de exercício 1,0 1,0
físico
Alimentação em período 2 1,0
de prova
Idade 22,0 4,0
Ganho de peso 0,0 5,0
Tempo de deslocamento 1,0 1,5
Tempo para estudar 4,0 1,0
Matérias por dia 1,0 1,0
Peso 67,0 16,8
Altura 1,6 0,12
Box-plot
Representação gráfica, gerada pelo JAMOVI do valor mínimo e máximo da distribuição
dos dados, bem como da mediana e dos quartis 1, 2 e 3. Quando maior o gráfico, maior
será o grau de dispersão/variação dos dados em torno da mediana (medida de tendência
central).
Coeficiente de variação
Usada para avaliar a variabilidade relativa entre duas ou mais distribuições de dados com
médias diferentes ou unidades de medidas diferentes. Exemplo: média das idades da
população de jovens e idosos OU média da altura medida em metros e em cm.
Obs.: Um coeficiente de variação maior indica que há maior variabilidade relativa na

amostra. Um coeficiente de variação abaixo de 20% é considerado baixo, entre 20% e
50% moderado e acima de 50% alto.
Moda (Mo)
É uma medida de tendência central que indica o valor mais frequente em um

conjunto de dados. É útil quando se trabalha com dados categóricos, como cores.
É importante notar que a moda pode não ser uma medida tão robusta quanto a
mediana ou a média.
Não existe uma medida de dispersão direta para a moda, como existe para a média
e a mediana. Isso ocorre porque a moda é simplesmente o valor mais frequente
em um conjunto de dados, e não uma medida baseada em todos os valores do
conjunto.
Thais Gomes Mateus
É possível termos distribuições unimodais (distribuição normal ou gaussiana,
que é simétrica em torno da média e tem apenas um pico), bimodais e
multimodais, que possuem mais de dois modos.
Ex. venda de bolsas de cores variadas. Observou-se que a cor mais vendida foi rosa
(UNIMODAL).
Ex. venda de bolsas de cores variadas. Observou-se que a cor mais vendida foi rosa e azul
(BIMODAL).
Ex. distribuição dos salários de uma empresa, que pode apresentar picos correspondentes
a diferentes cargos ou departamentos (MULTIMODAL).
Curva Gaussiana: curva normal ou perfeita de Gauss
Essa curva nos dá a função densidade de probabilidade, ou seja, as chances de ocorrência
de um determinado dado na área abaixo da curva.
Essa função é útil quando se trabalha com amostra, população e inferência.
1. O campo de variação de X é de - ∞ a + ∞
2. A distribuição dos dados é simétrica em torno da média (m)
3. A média, a mediana e a moda são iguais
4. A distribuição possui dois pontos de inflexão, μ - σ e μ + σ
5. A área total sob a curva é igual à unidade, ou 100%
Thais Gomes Mateus
Distribuição normal padronizada
É a distribuição normal da estatística Z, onde eu posso transformar cada valor de X em

um valor de Z. E, a partir dessa transformação, calcular a área sob a curva, através de uma
tabela já definida.
Ex. Qual a probabilidade de escolher uma pessoa com renda anual entre 4.000 e
7.000 dólares, morador de uma cidade, sendo a renda média desta cidade de 5.000
dólares e desvio-padrão de 1.500. A renda populacional tem distribuição normal.
1º passo: Calcular Z1 e Z2, utilizando a fórmula acima
Z1= 0,66
Z2= 1,33
2º passo: encontrar os valores de Z1 e Z2 na tabela de área

sob a curva normal padronizada
Thais Gomes Mateus
Resultado final
Inferência e erro padrão
A estimação é um meio de se obter medidas representativas (estimativas) da

população, calculadas através de uma amostra.
Escolhemos estrategicamente uma amostra da população para fazermos uma
inferência, estimamos uma média com alta probabilidade de acerto... Mas
considerando também, algum erro.
Erro padrão é a medida de variação de uma média amostral em relação à
média populacional.
Thais Gomes Mateus
Quanto maior o desvio padrão, maior o erro; quanto maior a amostra, menor
vai ser esse erro. Vamos usar o erro padrão para fazer uma estimativa dos reais
valores da população, por exemplo.
Exemplo: tempo de cozimento entre feijão preto e feijão marrom

Thais Gomes Mateus
Usa-se o valor fixo abaixo para identificar que o meu

intervalo de confiança de 95% está entre 34,34 e 37,8
Obs.: o intervalo de confiança pode ser de 68%, 95% ou 99%. Vai

depender do tipo de estudo realizado.
Como realizar e interpretar um teste de normalidade?
Simples, basta realizar a estatística descritiva no Jamovi e selecionar as opções: média,

desvio padrão, intervalo de confiança para a média e Shapiro wilk.
Segue abaixo um exemplo
Thais Gomes Mateus
Análise
Se o valor do valor de p, obtido pelo Shapiro-wilk, for maior que 0,05 (5%), que
é o valor da zona de rejeição, dizemos que não há diferença estatisticamente
significante entre a distribuição dos dados da minha variável e a distribuição dos
dados na curva de Gauss. Portanto, podemos afirmar que os nossos dados estão
distribuídos dentro da normal de Gauss.
Se o valor do valor de p, obtido pelo Shapiro-wilk, for menor que 0,05 (5%),
que é o valor da zona de rejeição, dizemos que há diferença estatisticamente
significante entre a distribuição dos dados da minha variável e a distribuição dos
dados na curva de Gauss. Portanto, podemos afirmar que os nossos dados não
estão distribuídos dentro da normal de Gauss.

Roteiro Bioestatística Thaís Gomes

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Roteiro Bioestatística Thaís Gomes

Enviado por

Direitos autorais:

Formatos disponíveis

Roteiro

1. Conceito de estatística e aplicações

★ É o estudo da estatística aplicada às áreas de biologia e saúde. O conhecimento

2.2 Estatística descritiva ou dedutiva

2.3 Estatística analítica

★ Busca comparar grupos, testar hipóteses e desfecho de situações.

★ As variáveis podem ser definidas de acordo com o tipo e a classificação.

Trate a variável dependente como o resultado

Pense na variável independente como uma causa que

“Na bioestatística a variável dependente é a sua variável

“Uma variável dependente não pode alterar uma variável independente”

A remuneração altera o número de turnos OU o número de turnos altera a

Certamente, é o número de turnos que altera a remuneração. Logo, a remuneração é a

3. Banco de dados - Excel

Passo 1: EXPORTAÇAÕ DOS DADOS PARA O EXCEL

Baixe os dados obtidos através da aplicação do “GOOGLE FORMS”. Crie um arquivo

Passo 2: PADRONIZAÇÃO DAS VARIÁVEIS E DOS DADOS

Passo 3: EXPORTAR OS DADOS DO EXCEL PARA O JAMOVI

Passo 4: CLASSIFICAÇÃO DAS VARIÁVEIS

Cada variável deverá ser classificada, ou seja, configurada no software em nominal,

Passo 5: ANÁLISE DOS DADOS PELA ESTATÍSTICA DESCRITIVA

Estatística descritiva 1: UTILIZANDO APENAS VARIÁVEIS NUMÉRICAS

Estatística descritiva 2: UTILIZANDO APENAS VARIÁVEIS CATEGÓRICAS

Estatística descritiva 3: realizar tabela de frequência de todos os dados, separando

Frequência: quantidade de vezes em que um dado aparece na sua pesquisa.

Divisão e limites de intervalos de classe

No caso de muito elementos ou ainda no caso de elementos com grande variação

Vamos a um exemplo. Considere os seguintes dados referentes a idade de alunos de uma

Como calcular intervalos de classe

Como calcular limites de intervalos de classe

Passo 2: Organizar os dados em ordem crescente, utilizando o botão de filtro. Depois

Passo 4: ORGANIZAR A TABELA DINÂMICA EM GRUPOS.

Passo 5: CRIAR GRÁFICO DOS DADOS DA TABELA

Além da distribuição de frequências, discutida na aula anterior, a distribuição dos dados

Vamos supor que você tem 4 provas de saúde coletiva.

3 + 9,1 + 8 + 2,8 ÷ 4 = 5,7

Quando os dados estão agrupados

Além se de estudar a média, estuda-se como os dados se comportam em relação a essa

O que influencia nessa dispersão ou variância: o tipo de dado e o tamanho da amostra,

Se o valor da subtração X1-X for negativo: a elevação ao quadrado modifica o sinal

̅ ± dp: calculamos a média, para somá-la e subtraí-la ao desvio-padrão. Dessa forma,

Exemplo: 8º (oitava posição da distribuição). Para distribuição em número ímpar.

Obs.: Um coeficiente de variação maior indica que há maior variabilidade relativa na

É uma medida de tendência central que indica o valor mais frequente em um

É a distribuição normal da estatística Z, onde eu posso transformar cada valor de X em

1º passo: Calcular Z1 e Z2, utilizando a fórmula acima

2º passo: encontrar os valores de Z1 e Z2 na tabela de área

Inferência e erro padrão

A estimação é um meio de se obter medidas representativas (estimativas) da

Exemplo: tempo de cozimento entre feijão preto e feijão marrom

Usa-se o valor fixo abaixo para identificar que o meu

Obs.: o intervalo de confiança pode ser de 68%, 95% ou 99%. Vai

Como realizar e interpretar um teste de normalidade?

Simples, basta realizar a estatística descritiva no Jamovi e selecionar as opções: média,

Você também pode gostar