Escolar Documentos
Profissional Documentos
Cultura Documentos
Nenhuma parte desta obra pode ser reproduzida sem a autorização, por escrito, da Fundação.
Em relação ao material de terceiros utilizado neste livro, o Centro de Desenvolvimento de
Materiais Didáticos e os colaboradores esforçaram-se para consultar e pedir a autorização dos
responsáveis pelos respectivos direitos autorais. Se, entretanto, for constatada qualquer
omissão não intencional, estamos à disposição para solucioná-la.
Araras – SP
2020
BIOESTATÍSTICA
1ª edição
Reitor
Prof. Dr. José Antonio Mendes
Pró-reitores
Prof. Dr. Olavo Raymundo Jr. (Graduação)
Prof. Dr. Marcelo A. M. Esquisatto (Pós-graduação e Pesquisa)
Diretor Administrativo-financeiro
Francisco Elíseo Fernandes Sanches
Coordenadora de Comunidade e Extensão
Profa. Ma. Cristina da Cruz Franchini
Desenvolvimento
Centro de Desenvolvimento de Materiais Didáticos – CEMAD
www.fho.edu.br
FICHA CATALOGRÁFICA
Elaborada pela Biblioteca “DUSE RÜEGGER OMETTO”
- UNIARARAS –
ISBN: 978-65-87752-11-2
CDD 570.15195
Capítulo 1 ................................................................................................................... 7
Introdução e conceitos básicos
1.1 População e amostra ............................................................................................................ 8
1.1.1 Algumas técnicas de amostragem ...................................................................................... 9
1.1.1.1 Amostra casual (aleatória) simples ................................................................................. 9
1.1.1.2 Amostra sistemática .......................................................................................................... 9
1.1.1.3 Amostra estratificada ........................................................................................................ 9
1.1.1.4 Amostra por conveniência ............................................................................................10
1.2 Variável ..................................................................................................................................10
1.3 Arredondamentos ...............................................................................................................11
Capítulo 2 .................................................................................................................. 12
Tabelas
2.1 Estrutura de tabelas ......................................................................................... 12
2.2 Tabelas de frequência para variáveis quantitativas discretas .......................... 14
2.3 Tabelas de frequências para varáveis quantitativas contínuas por classes ..... 15
2.4 Exercícios ........................................................................................................ 18
Capítulo 3 ................................................................................................................. 20
Gráficos
3.1 Tipos de gráficos ................................................................................................................20
3.1.1 De colunas...........................................................................................................................21
3.1.2 De barras .............................................................................................................................21
3.1.3 De linhas..............................................................................................................................22
3.1.4 De setores (pizza)...............................................................................................................23
3.1.5 Pictograma...........................................................................................................................24
3.1.6 Histograma e polígonos de frequências (tabelas de frequências) ...............................25
3.1.7 Gráficos sobrepostos.........................................................................................................27
3.2 Exercícios .............................................................................................................................28
Capítulo 4 ................................................................................................................. 30
Medidas de tendência central
4.1 Média aritmética .................................................................................................................30
4.2 Mediana ................................................................................................................................31
4.3 Moda ......................................................................................................................................32
4.4 Exercícios .............................................................................................................................33
Capítulo 5 ................................................................................................................. 34
Medidas de dispersão (ou variabilidade)
5.1 Variância ...............................................................................................................................35
5.2 Desvio padrão......................................................................................................................37
5.3 Coeficiente de variação ....................................................................................................37
5.4 Exercícios .............................................................................................................................38
Capítulo 6 .................................................................................................................. 41
A distribuição normal e o p-valor
6.1 Distribuição normal ......................................................................................... 41
6.2 Compreendendo o valor de p na análise estatística ....................................... 43
6.2.1 Importância da análise estatística.....................................................................................43
6.2.2 O que é o tal valor de p ou p-valor? ...............................................................................43
REFERÊNCIAS ...................................................................................................... 45
Capítulo 1
7
O avanço dessa ciência e, principalmente da informática, estende-se às
Ciências Biológicas como uma forma de aprimorar resultados. Segundo Vieira
e Hossne (2001, p. 5),
O emprego da análise estatística na pesquisa biomédica
constitui, sem dúvida alguma, um dos fenômenos mais
marcantes das últimas décadas. Este aprimoramento da
metodologia científica levou não só à maior objetividade na
análise dos resultados como também ao aprofundamento
do espírito crítico do pesquisador. Desse modo, procurou-
se substituir a impressão na base do “eu acho” pela
observação criteriosa dos achados.
8
1.1.1 Algumas técnicas de amostragem
Como foi dito anteriormente, muitas vezes é necessário tomar uma
amostra da população, porém é necessário também fazê-lo com critérios e
técnicas bem estabelecidos. Segundo Vieira (1980), as principais técnicas de
amostragem são:
9
1.1.1.4 Amostra por conveniência
Quando os elementos são escolhidos simplesmente porque são os
disponíveis. Por exemplo: a direção de uma instituição de ensino precisa tomar
um grupo de alunos, e só os alunos do 1o período ou de uma sala se dispuseram
a participar do grupo.
Os estatísticos têm muitas restrições ao uso de amostras de
conveniência. Mesmo assim, as amostras de conveniência são
comuns na área da saúde, onde se fazem pesquisas com
pacientes de uma só clínica ou de um só hospital. Mas ainda,
as amostras de conveniência constituem, muitas vezes, a
única maneira de estudar determinado problema. De
qualquer forma, o pesquisador que utiliza este tipo de
amostra precisa de muito censo crítico. (VIEIRA, 1980, p. 5).
1.2 Variável
10
Contínuas, as quais são mensuráveis, por exemplo, quando podemos
tomar altura, peso e idade.
Segundo Vieira (1980, p. 1), “uma variável é qualitativa quando os
dados podem ser distribuídos em categorias mutuamente exclusivas. Uma
variável é quantitativa quando é expressa por números.”
1.3 Arredondamentos
Regras:
✓ Se o dígito a ser suprimido for < 5, o algarismo precedente não é
alterado; por exemplo:
42,74 ⇔ 42,7
951,43 ⇔ 951,4
11
Capítulo 2
Tabelas
Segundo Vieira (1980), alguns itens básicos que uma tabela deve ter são:
Título: deve conter o que, quando, onde e com quem se pesquisa.
Corpo: deve ser disposto em linhas e colunas com cabeçalho.
Fonte: deve estar no rodapé e indicar a origem dos dados (quando os
dados foram coletados por meio de entrevista direta, a fonte é primária e
quando foram “inventados”, são chamados de hipotéticos ou “elaborados
pelo autor”).
Exemplo:
12
Tabela 2 Pesquisa sociocultural realizada com pessoas em determinado setor de
um hospital no período de um dia.
Indivíduo Sexo Religião Cidade
1 Feminino Católica Aguaí
2 Feminino Católica Americana
3 Feminino Católica Americana
4 Feminino Católica Analândia
5 Masculino não tem Araras
6 Feminino Católica Araras
7 Feminino Católica Araras
8 Masculino não tem Araras
9 Feminino Católica Araras
10 Feminino Católica Araras
11 Masculino não tem Araras
12 Feminino Católica Araras
13 Feminino Evangélica Araras
14 Feminino Católica Araras
15 Feminino Espírita Araras
16 Masculino Católica Campinas
17 Feminino Católica E. S. Pinhal
18 Masculino Evangélica E. S. Pinhal
19 Feminino Espírita Itu
20 Masculino Católica Itu
21 Feminino Católica Jacutinga
22 Feminino Católica Jacutinga
23 Feminino não tem Jundiaí
24 Masculino Católica Leme
25 Masculino Católica Leme
26 Masculino Católica Leme
27 Masculino Espírita Limeira
28 Feminino Católica Limeira
29 Feminino Católica Limeira
30 Feminino Católica Limeira
31 Masculino não tem Limeira
32 Feminino Espírita Mogi Guaçu
33 Masculino Evangélica Mogi Guaçu
34 Feminino Católica Mogi Mirim
35 Feminino não tem Mogi Mirim
36 Masculino Ateu Mogi Mirim
37 Feminino Católica Leme
38 Masculino não tem Leme
39 Feminino Católica Limeira
40 Feminino Católica Limeira
13
A Tabela 2 será transformada em tabelas de frequências.
Segue a tabela de frequências da variável sexo:
Exemplo:
14
Observação: para construção dessa tabela, a ordem deve ser feita na
ordem abordada.
15
Tabela 6 Frequências por classes dos dados da tabela 5.
Frequência relativa
Classes – notas
nessa classe)
6,7
0 |---- 2 2 6,7 = (2/30) × 100 2 (=2)
(=6,7)
26,7
2 |---- 4 6 20,0 = (6/30) × 100 8 (= 2+6)
(=6,7+20,0)
56,7
4 |---- 6 9 30,0 = (9/30) × 100 17 (=2+6+9)
(=6,7+20,0+30,0)
80
6 |---- 8 7 23,3 = (7/30) × 100 24 (=2+6+9+7)
(=6,7+20,0+30,0+23,3)
100
8 |---| 10 6 20,0 = (6/30) × 100 30 (=2+6+9+7+6)
(=6,7+20,0+30,0+23,3+20)
Total 30 100 ------- -------
16
Tabela 7 Distribuição em percentuais de notas, de 0 a 10,
de alunos em uma avaliação.
Notas Percentual
0 |------ 2 6,7%
2 |------ 4 20%
4 |------ 6 30%
6 |------ 8 23,3
8 |----|10 20%
Total 100%
17
2.4 Exercícios
18
2) São dadas as estaturas de 56 pessoas em metros, como mostra a
Tabela 10:
19
Capítulo 3
Gráficos
20
3.1.1 De colunas
O gráfico de colunas é construído no plano cartesiano – em que a
variável é representada no eixo horizontal, as frequências, no eixo vertical –,
composto por retângulos dispostos verticalmente; caracteriza-se por ter todos
os retângulos de mesma largura e cor e os comprimentos proporcionais às
frequências.
16
nº de pessoas
12
0
Futebol Vôlei Basquete Natação
Esporte
3.1.2 De barras
O gráfico de barras é construído no plano cartesiano – em que a variável
é representada no eixo vertical, e as frequências, no eixo horizontal –, composto
por retângulos dispostos horizontalmente; caracteriza-se por ter todos os
retângulos de mesma largura e cor e os comprimentos proporcionais às
frequências.
21
Figura 2 Gráfico de barras da Tabela 11.
Basquete 7
Esporte
Vôlei 13
Futebol 20
nº de pessoas
3.1.3 De linhas
O gráfico de linhas é construído no plano cartesiano – em que a variável
é representada no eixo horizontal, e as frequências, no eixo vertical –,
composto por uma linha poligonal (formada por segmentos de reta) que une
os pontos obtidos pelas marcações. A estrutura desse gráfico é mesma que o
de colunas, diferenciando-se pelo desenho final.
12
8
4
0
Futebol Vôlei Basquete Natação
Esporte
22
3.1.4 De setores (pizza)
O gráfico de setores, que ilustra variáveis qualitativas, tem formato de
círculo dividido em setores circulares, que representa, cada um, uma variação.
Dividimos os 360 graus do ângulo central do círculo proporcionalmente às
frequências. Como a soma das frequências em nosso exemplo é 45, faremos
corresponder esse número a 360o, então cada frequência corresponderá ao
ângulo central que dá origem ao setor circular.
Vôlei
29%
23
É importante ressaltar que, quando a quantidade de variações for muito
grande, não é recomendado utilizar o gráfico de setores, pois pode ficar
confuso. Isso acontece também quando é necessário fazê-lo em escala cinza,
já que pode ficar impreciso.
3.1.5 Pictograma
Uma forma interessante de representar dados em gráficos é o
pictograma, que nada mais é que um dos gráficos acima decorado. Na Figura 5
a seguir, por exemplo, o pictograma indica a Tabela 11 sobre a preferência
esportiva de um grupo de pessoas em um local e em um dia. Os pictogramas
não são cientificamente corretos, podem ser usados em publicações não
formalmente científicas.
Vôlei
29%
24
Figura 6 Projeção da população mundial até 2100.
25
Figura 7 Histograma da Tabela 7.
Distribuição de notas, de 0 a 10, do percentual
de alunos em uma avaliação.
30
30
25 23,3
20 20
20
percentual
15
10 6,7
5
0
0 |------ 2 2 |------ 4 4 |------ 6 6 |------ 8 8 |-----| 10
notas
25
20
15
10
5
0
0 2 4 6 8 10
notas
26
3.1.7 Gráficos sobrepostos
São vários gráficos em apenas um, ou seja, tem mais de uma série de
dados representados. Na Figura 9, tem-se três gráficos em um só ou três séries
(candidatos A, B e C). As linhas devem ser de cor diferentes e/ou ter traçados
diferentes, nesse caso traçados, pois temos escala cinza.
30
20
10
0
abril maio junho julho mês
candidato A candidato B candidato C
27
Construindo seu gráfico, tem-se a figura 10.
150
100
50
0
1950 1960 1970 1980 1990 2000 2010
ano Rural Urbana
3.2 Exercícios
28
2) Transforme o gráfico da Figura 11 em tabela estatisticamente correta
e completa.
Figura 11 Número de casos de doenças epidêmicas
em determinado local em dois anos.
Número de casos de doenças epidêmicas em
determinado local em dois anos ano 2002
700
600 ano 2003
500
nº de casos
400
300
200
100
0
Dengue Tuberculose AIDS Gripe Hanseniase
doenças
29
Capítulo 4
Para obter a média aritmética, basta somar todos os dados e dividir pelo
número de dados.
Ela é representada por X = soma dos dados/no de dados.
Por exemplo: a partir de idades de adolescentes, calcule a média de
idades.
10 11 12 14 15 10 11 12 14 10 11 12 14 10 11 11 14
X = 202 / 17 = 11,9 (aproximando) 12 anos.
Para melhor entendimento:
4 x 10 + 5 x 11 + 3 x 12 + 4 x 14 + 1 x 15 =40 + 55 + 36 + 56 + 15
= 202/17 = 11,9
30
4.2 Mediana
31
4.3 Moda
32
4.4 Exercícios
1,55 1,65 1,65 1,66 1,70 1,60 1,61 1,75 1,68 1,6 1,57 1,6
1,75 1,73 1,55 1,75
33
Capítulo 5
Exemplo:
Idades dos alunos turma A: 15, 15, 14, 14, 14, 13, 13
Média 14 anos
Idades dos alunos turma B: 18, 16, 15, 14, 13, 12, 10
Média 14 anos
34
Como no grupo B, os desvios são maiores, dizemos que o grupo tem
uma maior dispersão (o grupo é mais heterogêneo do que o grupo A). Por
outro lado, as idades dos alunos do grupo A estão mais concentradas nas
proximidades da média, portanto é mais homogêneo.
Observação: quando conhecemos a média de uma distribuição e os
desvios de cada um dos valores em relação a essa média, a soma desses desvios
é 0 (zero).
O cálculo da dispersão é importante, já que nos permite estabelecer
qual grupo é mais ou menos homogêneo.
Como vimos anteriormente, a soma dos desvios de uma série sempre
será igual a zero. Procurando contornar isso, os matemáticos decidiram elevar
ao quadrado cada um desses desvios e determinaram a “média dos mínimos
quadrados”. Esse processo (descrito a seguir) gera as três medidas mais
importantes e utilizadas de dispersão: a variância, o desvio padrão e o
coeficiente de variação.
5.1 Variância
35
Chamamos de variância amostral o quociente entre o valor dessa soma
dos desvios elevados ao quadrado e o número (n - 1) de elementos da série,
que é indicada pela letra v ou por s2. Portanto, a fórmula é:
v = soma dos (desvios)2/(n-1)
A variância é dada por 4/6 = 0,667 anos2, que não existe, portanto não
se utiliza a unidade de medidas para variância.
A variância tem um inconveniente: seu valor fica muito grande ou muito
pequeno. Além disso, a dispersão é dada no quadrado da unidade dos dados.
Assim, para obter um dado na mesma unidade de medida, definiu-se
uma outra medida de dispersão: o desvio padrão.
36
5.2 Desvio padrão
37
Tabela 15 Esquema dos cálculos para as medidas de dispersão do exemplo das
idades do grupo B (esquematizado na tabela fica mais organizado).
Idades desvios = idade - Variância
desvios2
(anos) média
18 18 – 14 = 4 42 = 16
v = 42/6 = 7
16 16 – 14 = 2 22 = 4
15 15 – 14 = 1 12 = 1 Desvio padrão
2
14 14 – 14 = 0 0 =0 𝐝𝐩 = √𝟕 = 2,65
2
13 15 – 14 = 1 1 =1
Coeficiente de variação
12 12 – 14 = -2 (-2)2 = 4
cv = (2,65/14)x100 = 18,9%
10 10 – 14 = -4 (-4)2 = 16
Soma --------------- 42
Comparando os grupos A e B:
A: média 14 anos; variância 0,667; desvio padrão 0,82 anos; e
coeficiente de variação 5,9%
B: média 14 anos; variância 7; desvio padrão 2,65 anos; e coeficiente de
variação 18,9%
Observamos a mesma média, porém desvios padrões diferentes, sendo
que do grupo B é maior, e podemos afirmar que o grupo B é mais disperso ou
heterogêneo, como havíamos observado e agora comprovado estatisticamente.
5.4 Exercícios
38
2) Calcule, em quilogramas (kg), as três medidas de dispersão dos pesos
de adolescentes.
41,5 56,2 60,2 80,5 71,9 56,2 71,9 52,7 55,8 61,9 52,7 50,8
20, 21, 25, 26, 26, 27, 28, 28, 28, 29,
29, 29, 29, 29, 30, 30, 31, 31, 32, 35
39
Tabela 16 Resumo estatístico do IMC de um grupo de pessoas
de um grupo de reeducação alimentar.
Resumo estatístico
o
N de dados
Valor máximo
Valor mínimo
Amplitude (intervalo)
Média
Mediana
Moda
Variância
Desvio padrão
Coeficiente de variação
40
Capítulo 6
41
Na Figura 13 a seguir, temos as barras nas verticais representando os
desvios padrões. Quanto mais afastadas do centro da curva normal, mais área
compreendida abaixo da curva haverá.
A um desvio padrão, temos 68,26% das observações contidas.
A dois desvios padrões, possuímos 95,44% dos dados compreendidos.
A três desvios, temos 99,73%.
Podemos concluir que, quanto maior a variabilidade dos dados em
relação à média, maior a probabilidade de encontrarmos o valor que buscamos
embaixo da normal.
42
6.2 Compreendendo o valor de p na análise estatística
43
acaso, e não dos fatores que estão sendo estudados. Também chamado de
nível de significância, o valor de p representa a probabilidade de observar
diferenças entre grupos.
A definição do valor limite de p é determinada antes de iniciar o estudo,
e, de um modo geral, foi convencionalmente estabelecido entre a comunidade
científica que o valor p < 0,05 é aceitável para avaliar a significância do
resultado obtido. Esse valor (ou valores menores) significa que o estudo
assumiu uma probabilidade de 5% de que diferenças entre os grupos sejam
encontradas. Portanto, quanto menor o valor de p, maior a evidência de que
diferenças ocorreram.
Para exemplificar, vamos supor que um pesquisador testou a aceitação
de dois tipos de adoçante – açúcar normal (sacarose) e aspartame – em um
suco de mesma fruta.
Foram oferecidas doses dos dois sucos para cada uma de dez pessoas.
Foi solicitado que fosse dada uma nota de zero a dez (0 para não gostou e 10
para gostou muito). As pontuações foram tabuladas, um teste estatístico foi
realizado, e foi encontrado um p-valor de 0,12.
O que isso significa? Significa que a chance dessa diferença entre as
médias ser ao acaso (e não um efeito dos tratamentos) é de 12%. Ou seja, se
o pesquisador afirmar que as diferenças entre as médias ocorreram por causa
dos tratamentos, ele tem 12% de chances de estar enganado.
Analisando sobre outro ponto de vista, é a probabilidade de as médias
serem iguais. Se essa probabilidade for menor que 0,05 (5%), não há chance
de elas serem iguais. Nesse caso, como se tem 12%, não há evidências para
dizer que as médias são diferentes. Resumindo, não há diferença significativa
entre as pontuações, portanto o adoçante não influi no sabor do suco.
44
REFERÊNCIAS
DICIONÁRIO ABERTO. Estatística. Disponível em: https://dicionario-
aberto.net/. Acesso em: 5 fev. 2020.
LEVIN, J., Estatística para ciências humanas. 9. ed. São Paulo: Prentice
Hall, 2004. 497p.
45
46