Você está na página 1de 28

Roteiro

Saúde Coletiva 4

Bioestatística
Por: Thaís Gomes Mateus
Thais Gomes Mateus
Aula 01: Introdução a Bioestatística

1. Conceito de estatística e aplicações


★ Estatística é um ramo do conhecimento científico que têm, por objeto a
observação, a classificação formal e a análise dos fenômenos coletivos ou de
massa (finalidade descritiva) e, por fim, investigar a possibilidade de fazer
inferências indutivas válidas a partir dos dados observados e buscar métodos
capazes de permitir esta inferência (finalidade indutiva).
★ A palavra estatística vem do termo “status”, significando situação.

1.1 Bioestatística

★ É o estudo da estatística aplicada às áreas de biologia e saúde. O conhecimento


dos fundamentos de bioestatística são requisitos para o entendimento de literatura
especializada, realização de experimentos de biologia, estudos clínicos na área
médica, farmacologia, fisioterapia, odontologia, etc.
★ Bioestatística é a aplicação de modelos e teorias para testar probabilidades e
inferências que permitem interpretar dados gerados nas ciências da saúde.
★ “Você pode ter dados sem informação, mas não pode ter informação sem dados”
- Daniel Keys Moran
2. Divisões da bioestatística e suas aplicações

2.2 Estatística descritiva ou dedutiva

★ Pode ser usada somente para descrever os dados através de suas medidas mais
comuns (médias, frequências, distribuições, etc.)
★ A estatística descritiva provê resumos simples sobre as observações do estudo.
★ Exemplos: A prevalência de uma doença, a média de notas de uma turma.

2.3 Estatística analítica

★ Busca comparar grupos, testar hipóteses e desfecho de situações.


★ Exemplo: Grupo experimental (usando selante resinoso) vs Grupo controle
(selante ionomérico).
★ Permite fazer inferências na população, ou seja, aceitar com certa segurança, que
um valor específico de uma amostra irá se repetir na população.
Thais Gomes Mateus

3. Variáveis - Classificação
★ Variáveis são a expressão numérica dos dados de um estudo. Uma variável é o
elemento chave na análise estatística.
★ A estatística e a bioestatística só podem ser utilizadas e trabalhadas a partir de
eventos que possam ser quantificados.

★ As variáveis podem ser definidas de acordo com o tipo e a classificação.

4. Variáveis - Tipos
★ Variáveis dependentes: Sofrem influência de algum fator, como por exemplo, o
efeito de um tratamento depende da dosagem do medicamento utilizado.
★ Variáveis independentes: Não sofrem influência de outras variáveis que estão
sendo avaliadas na pesquisa.
Thais Gomes Mateus

Trate a variável dependente como o resultado

Pense na variável independente como uma causa que


produz um efeito

“Na bioestatística a variável dependente é a sua variável


de interesse, aquela que você estará observando
mudanças ou o efeito causado pelas demais.”

“Uma variável dependente não pode alterar uma variável independente”

Imagine a seguinte situação: Você vai fazer um estágio e terá sua remuneração de
acordo com o número de turnos que você consegue trabalhar por semana.

A remuneração altera o número de turnos OU o número de turnos altera a


remuneração?

Certamente, é o número de turnos que altera a remuneração. Logo, a remuneração é a


minha variável dependente e o número de turnos a minha variável independente. Uma
vez que, a remuneração DEPENDE diretamente do número de turnos.
Thais Gomes Mateus
Aula 02: Banco de dados e tabulação 03.04.2023

1. Definição
★ Depois de definir o melhor formato estatístico (estatística descritiva x analítica) e
as variáveis que serão estudadas, é preciso organizar as informações e tabular os
seus dados.
★ Mas, o que é tabular? Tabular significa simplesmente organizar os seus dados de
forma que eles possam ser lidos e gerar alguma informação. Sem uma tabulação
adequada dos dados, será impossível seguir com as análises estatísticas.

2. Como fazer?

Jamovi ou BioEstat

3. Banco de dados - Excel

Passo 1: EXPORTAÇAÕ DOS DADOS PARA O EXCEL

Baixe os dados obtidos através da aplicação do “GOOGLE FORMS”. Crie um arquivo


no EXCEL, e mantenha todos os seus dados em uma única planilha. Essa planilha será
Thais Gomes Mateus
exportada para o software estatístico (JAMOVI), então se o seu banco tiver duas ou mais
planilhas diferentes, não será possível fazer a análise.

Passo 2: PADRONIZAÇÃO DAS VARIÁVEIS E DOS DADOS

Feito o arquivo, o segundo passo é identificar cada informação como sendo uma variável
diferente.

Procure nomear a sua variável com um nome curto e simples. Por exemplo, a informação
‘acompanhamento psicológico’ pode ser representada apenas por “acompanhamento”.

Excluir dados repetidos. Exemplo: se houver duas colunas com a mesma variável (idade,
por exemplo), excluir uma das duas colunas.
Utilizar filtros para organizar as variáveis. Por exemplo: ordem alfabética, ordem
crescente ou decrescente.
É importante sempre padronizar as repostas que serão analisadas.
Thais Gomes Mateus

Passo 3: EXPORTAR OS DADOS DO EXCEL PARA O JAMOVI

A planilha única criada no excel deverá ser importada para o aplicativo selecionado, nesse
caso será o Jamovi.
O software estatístico irá realizar o processamento (estatística descritiva) das informações
das unidades amostrais.

Passo 4: CLASSIFICAÇÃO DAS VARIÁVEIS

Cada variável deverá ser classificada, ou seja, configurada no software em nominal,


ordinal ou numérica. No Jamovi as variáveis numéricas que não possuam “ordem”
deverão ser marcadas como continuas.
Thais Gomes Mateus
As variáveis referentes a identificação ou nome, deverão ser classificadas como ID,
representando as unidades amostrais, uma vez que não serão avaliadas no estudo.

Passo 5: ANÁLISE DOS DADOS PELA ESTATÍSTICA DESCRITIVA


Por fim, será realizada a análise ou estatística descritiva. Para isso, deve-se utilizar a
função “análises”, seguida de “exploração” e, por fim, “estatística descritiva” no menu
superior do software.

Feito isso, agora é hora de selecionar as variáveis que se deseja estudar ou analisar.
Thais Gomes Mateus

Estatística descritiva 1: UTILIZANDO APENAS VARIÁVEIS NUMÉRICAS


Calcular N, omisso, média, mediana, moda, percentis, desvio padrão, máximo, mínimo,
intervalo de confiança para média.

Estatística descritiva 2: UTILIZANDO APENAS VARIÁVEIS CATEGÓRICAS


Thais Gomes Mateus
Realizar tabelas de frequência para as variáveis categóricas. Utilizar apenas: N, omisso
e mediana (para as variáveis categóricas como semestre que aceitam mediana, por
exemplo).

Estatística descritiva 3: realizar tabela de frequência de todos os dados, separando


por categoria: sexo, turma, semestre, etc.
Calcular N, omisso, média, mediana, desvio-padrão, mínimo e máximo de todas as
variáveis, separando por SEXO, por exemplo.
Thais Gomes Mateus
Thais Gomes Mateus
Aula 03: Distribuição de frequência 10.04.2023

Definição

Frequência: quantidade de vezes em que um dado aparece na sua pesquisa.

Frequência absoluta (Fa): definida como o número de vezes (n) que determinado dado
(𝑥) aparece na amostra, ou seja, quantas vezes aquele dado se repete.

Frequência relativa (Fr): será a razão entre a frequência absoluta e o número (N) total
de todos os dados (𝑥1, 𝑥2, 𝑥3, etc.). Assim, a Fr será o número de observações de um
elemento dividido pela quantidade total de elementos no meu banco.

Divisão e limites de intervalos de classe

No caso de muito elementos ou ainda no caso de elementos com grande variação


(característica comum de variáveis numéricas) é possível separá-los em intervalos de
classe, que nada mais são do que intervalos numéricos representando um conjunto de
dados.

Vamos a um exemplo. Considere os seguintes dados referentes a idade de alunos de uma


determinada turma de graduação. Cada número representa a idade de um aluno:

Como calcular intervalos de classe


Thais Gomes Mateus
Exemplo: tabela referente aos valores de uma variável quantitativa

Como calcular limites de intervalos de classe

K=5
L=4
Thais Gomes Mateus
As variáveis quantitativas/numéricas deverão ser distribuídas em frequências pelo
EXCEL. O Jamovi não realiza tal distribuição, apenas para as variáveis categóricas
como foi realizado na aula anterior.
Passo 1: Copiar e colar os dados de “idade” ou da variável quantitativa estudada
para uma nova planilha.

Passo 2: Organizar os dados em ordem crescente, utilizando o botão de filtro. Depois


de organizar em ordem crescente, inserir na coluna seguinte a denominação
“FREQUÊNCIA”.
Thais Gomes Mateus
Passo 3: ORGANIZAR O BANCO DE DADOS POR CLASSES.
No menu superior do EXCEL, clicar em “inserir”, seguido de “tabelas” e, por fim, “tabela
dinâmica”. Quando clicar em “tabela dinâmica”, selecionar a opção “nova planilha”.

3.1Feito isso, deve-se colocar sempre nas linhas os dados referentes a variável que está
sendo quantificada (idade, neste caso) e a frequência no campo “valores” para gerar a
soma da frequência ou a frequência absoluta daquela variável. Como indica a imagem
abaixo:
Thais Gomes Mateus

Passo 4: ORGANIZAR A TABELA DINÂMICA EM GRUPOS.


Deve-se selecionar os dados que estão sendo quantificados (os dados referentes a idade,
neste caso). Clicar com o botão direito do mouse, e selecionar a opção “agrupar” que
aparece no menu. Logo em seguida, deve-se indicar qual o valor mínimo e máximo dentro
dos dados e o limite (L) (que foi calculado previamente).
Lembrete: sempre realizar o cálculo da frequência relativa ao lado dos dados da
frequência absoluta que foram gerados automaticamente pelo EXCEL.

Passo 5: CRIAR GRÁFICO DOS DADOS DA TABELA


5.1 Para isso deve-se selecionar e copiar apenas os dados da tabela dinâmica e a
frequência absoluta (a frequência relativa não entra no gráfico). Feito isso, clicar em
“colar” na página inicial, seguido de “valores” (colar na parte inferior da tabela dinâmica).
5.2 Selecionar os valores da variável que está sendo quantificada, e clicar em “inserir”,
seguido de “gráficos recomendados” e, por fim, “colunas agrupadas” (que será o nosso
histograma).
Thais Gomes Mateus
Thais Gomes Mateus
Aula 04: medidas de tendência central e dispersão 17.04.2023

Além da distribuição de frequências, discutida na aula anterior, a distribuição dos dados


também pode ser analisada pela forma como se organizam no centro da distribuição
(medidas de tendência central) e como se distribuem em torno do centro de distribuição
(medidas de dispersão).
Média aritmética
Medida de tendência central mais comum para a descrição de variáveis quantitativas,
discretas ou contínuas, é a média.
É calculada pela divisão da soma de todos os valores pelo número total de valores (n).

Vamos supor que você tem 4 provas de saúde coletiva.


Suas notas foram: 1º prova (3,0) 2º prova (9,1) 3º prova (8,0) 4º prova (2,8)

3 + 9,1 + 8 + 2,8 ÷ 4 = 5,7

Média ponderada
Cada valor tem um peso diferente.
Exemplo: Notas de uma prova. Deve-se multiplicar cada valor pelo seu respectivo peso,
somar todos os resultados e dividir pela soma dos pesos.

Quando os dados estão agrupados

Deve-se encontrar o ponto médio (limite inferior + limite superior dividido por 2) de
cada classe. Feito isso, multiplica-se pelo peso (que é a frequência absoluta) e faz a
soma. E divide tudo por 30 (soma dos pesos ou das frequências absolutas).

Exemplo:
Thais Gomes Mateus

Variância

Indica o quão distantes estão aos dados em relação à média aritmética. Quanto maior a
variância, mais distantes os dados estão da média, ou seja, estão mais dispersos. E,
quanto menor a variância, menos distantes os dados estão da média, ou seja, menos
dispersos estes dados estão.

Variância

Além se de estudar a média, estuda-se como os dados se comportam em relação a essa


média aritmética.

O que influencia nessa dispersão ou variância: o tipo de dado e o tamanho da amostra,


amostragem e o tipo de dado.
Thais Gomes Mateus

Se o valor da subtração X1-X for negativo: a elevação ao quadrado modifica o sinal


negativo para positivo. Na variância não importa se distancia é maior ou menor, só
importa a distância.
Grau de liberdade: número de vezes em que podemos variar na escolha de dados
(N – 1)
Desvio-padrão:
É a raiz quadrada da variância. O conceito é o mesmo, ou seja, o desvio-padrão analisa
como os dados se comportam em torno da média.

̅ ± dp: calculamos a média, para somá-la e subtraí-la ao desvio-padrão. Dessa forma,


𝑿
observamos que os dados podem ir tanto para “mais” ou para “menos” em relação ao
centro (que é a média).
1º passo: ESTATÍSTICA DESCRITIVA NO JAMOVI
Selecionar apenas as variáveis quantitativas no Jamovi, e realizar a estatística descritiva.
Obs.: selecionar APENAS os itens: N, média e desvio-padrão e histograma.
Thais Gomes Mateus
2° passo: TABELA NO MICROSOFT WORD COM OS DADOS OBTIDOS
Variáveis ̅ (± dp)
𝑿
Idade 23,90 (± 4,35)
Ganho de peso 3,07 (± 4,07)
Tempo de deslocamento 1,26 (± 0,80)
Tempo para estudar 3,80 (± 1,66)
Matérias por dia 1,40 (± 0,57)
Peso 66,70 (± 13,50)
Altura 1,63 (± 0,10)

Mediana

Além de ser usada para variáveis numéricas, também pode ser utilizada para variáveis
categóricas ordinais.
Definida como o valor que ocupa a posição central de uma distribuição ordenada de
dados (numéricas e ordinais).

Exemplo: 8º (oitava posição da distribuição). Para distribuição em número ímpar.


Diferença entre média e mediana
Se a média de tempo de presa de determinado material bioquímico é de 4 minutos,
significa que o tempo de presa de uma amostra será em torno de 4 minutos. Se a
mediana for igual a 4 minutos, significa que metade das amostras tem presa inferior a 4
minutos e a outra metade toma presa acima deste tempo.
Quartil
Um vez que a mediana divide meus dados pela metade, é possível dividir essas metades
em outras metades e assim, por diante.
Quando dividimos nossos dados em quatro partes iguais, definimos os quartis de uma
amostra.
Intervalo interquartil
Quando a medida de tendência central usada é a mediana, a medida de dispersão
correspondente é o intervalo interquartil (IQR), calculado pela diferença entre o terceiro
e o primeiro quartis:
1º passo: ESTATÍSTICA DESCRITIVA NO JAMOVI
Selecionar apenas as variáveis quantitativas e as categóricas ordinais no Jamovi, e
realizar a estatística descritiva. Obs.: selecionar APENAS os itens: N, mediana, IQR e
Box plot.
Thais Gomes Mateus
2° passo: TABELA NO MICROSOFT WORD COM OS DADOS OBTIDOS
Variável Mediana IQR
Semestre 6,0 0,0
Rendimento 2,0 0,25
Frequência de exercício 1,0 1,0
físico
Alimentação em período 2 1,0
de prova
Idade 22,0 4,0
Ganho de peso 0,0 5,0
Tempo de deslocamento 1,0 1,5
Tempo para estudar 4,0 1,0
Matérias por dia 1,0 1,0
Peso 67,0 16,8
Altura 1,6 0,12

Box-plot
Representação gráfica, gerada pelo JAMOVI do valor mínimo e máximo da distribuição
dos dados, bem como da mediana e dos quartis 1, 2 e 3. Quando maior o gráfico, maior
será o grau de dispersão/variação dos dados em torno da mediana (medida de tendência
central).

Coeficiente de variação

Usada para avaliar a variabilidade relativa entre duas ou mais distribuições de dados com
médias diferentes ou unidades de medidas diferentes. Exemplo: média das idades da
população de jovens e idosos OU média da altura medida em metros e em cm.

Obs.: Um coeficiente de variação maior indica que há maior variabilidade relativa na


amostra. Um coeficiente de variação abaixo de 20% é considerado baixo, entre 20% e
50% moderado e acima de 50% alto.

Moda (Mo)

É uma medida de tendência central que indica o valor mais frequente em um


conjunto de dados. É útil quando se trabalha com dados categóricos, como cores.
É importante notar que a moda pode não ser uma medida tão robusta quanto a
mediana ou a média.
Não existe uma medida de dispersão direta para a moda, como existe para a média
e a mediana. Isso ocorre porque a moda é simplesmente o valor mais frequente
em um conjunto de dados, e não uma medida baseada em todos os valores do
conjunto.
Thais Gomes Mateus
É possível termos distribuições unimodais (distribuição normal ou gaussiana,
que é simétrica em torno da média e tem apenas um pico), bimodais e
multimodais, que possuem mais de dois modos.
Ex. venda de bolsas de cores variadas. Observou-se que a cor mais vendida foi rosa
(UNIMODAL).
Ex. venda de bolsas de cores variadas. Observou-se que a cor mais vendida foi rosa e azul
(BIMODAL).
Ex. distribuição dos salários de uma empresa, que pode apresentar picos correspondentes
a diferentes cargos ou departamentos (MULTIMODAL).
Curva Gaussiana: curva normal ou perfeita de Gauss
Essa curva nos dá a função densidade de probabilidade, ou seja, as chances de ocorrência
de um determinado dado na área abaixo da curva.
Essa função é útil quando se trabalha com amostra, população e inferência.

1. O campo de variação de X é de - ∞ a + ∞
2. A distribuição dos dados é simétrica em torno da média (m)
3. A média, a mediana e a moda são iguais
4. A distribuição possui dois pontos de inflexão, μ - σ e μ + σ
5. A área total sob a curva é igual à unidade, ou 100%
Thais Gomes Mateus
Distribuição normal padronizada

É a distribuição normal da estatística Z, onde eu posso transformar cada valor de X em


um valor de Z. E, a partir dessa transformação, calcular a área sob a curva, através de uma
tabela já definida.

Ex. Qual a probabilidade de escolher uma pessoa com renda anual entre 4.000 e
7.000 dólares, morador de uma cidade, sendo a renda média desta cidade de 5.000
dólares e desvio-padrão de 1.500. A renda populacional tem distribuição normal.

1º passo: Calcular Z1 e Z2, utilizando a fórmula acima

Z1= 0,66
Z2= 1,33

2º passo: encontrar os valores de Z1 e Z2 na tabela de área


sob a curva normal padronizada
Thais Gomes Mateus
Resultado final

Inferência e erro padrão

A estimação é um meio de se obter medidas representativas (estimativas) da


população, calculadas através de uma amostra.
Escolhemos estrategicamente uma amostra da população para fazermos uma
inferência, estimamos uma média com alta probabilidade de acerto... Mas
considerando também, algum erro.
Erro padrão é a medida de variação de uma média amostral em relação à
média populacional.
Thais Gomes Mateus
Quanto maior o desvio padrão, maior o erro; quanto maior a amostra, menor
vai ser esse erro. Vamos usar o erro padrão para fazer uma estimativa dos reais
valores da população, por exemplo.

Exemplo: tempo de cozimento entre feijão preto e feijão marrom


Thais Gomes Mateus

Usa-se o valor fixo abaixo para identificar que o meu


intervalo de confiança de 95% está entre 34,34 e 37,8

Obs.: o intervalo de confiança pode ser de 68%, 95% ou 99%. Vai


depender do tipo de estudo realizado.

Como realizar e interpretar um teste de normalidade?

Simples, basta realizar a estatística descritiva no Jamovi e selecionar as opções: média,


desvio padrão, intervalo de confiança para a média e Shapiro wilk.
Segue abaixo um exemplo
Thais Gomes Mateus

Análise

Se o valor do valor de p, obtido pelo Shapiro-wilk, for maior que 0,05 (5%), que
é o valor da zona de rejeição, dizemos que não há diferença estatisticamente
significante entre a distribuição dos dados da minha variável e a distribuição dos
dados na curva de Gauss. Portanto, podemos afirmar que os nossos dados estão
distribuídos dentro da normal de Gauss.
Se o valor do valor de p, obtido pelo Shapiro-wilk, for menor que 0,05 (5%),
que é o valor da zona de rejeição, dizemos que há diferença estatisticamente
significante entre a distribuição dos dados da minha variável e a distribuição dos
dados na curva de Gauss. Portanto, podemos afirmar que os nossos dados não
estão distribuídos dentro da normal de Gauss.

Você também pode gostar