Escolar Documentos
Profissional Documentos
Cultura Documentos
1-Introdução À Bioestatística e Análise Exploratória de Dados
1-Introdução À Bioestatística e Análise Exploratória de Dados
Revisão Textual:
Prof. Me. Luciano Vieira Francisco
Introdução à Bioestatística
e Análise Exploratória de Dados
OBJETIVO DE APRENDIZADO
• Compreender os conceitos básicos da estatística descritiva, necessários para o desenvolvi-
mento do curso.
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Apresentação e Discussão
de Exemplos de Estudos Estatísticos
Um novo tratamento é descoberto e promete ter resultados excepcionais na cura
de uma doença. Isso acontece com muita frequência em diversas áreas da saúde,
como Psicologia, Farmácia, Odontologia, Enfermagem, Nutrição etc., mas como sa-
ber se esse tratamento é de fato efetivo? Existem interesses mercadológicos diversos
que influenciam na aceitação de um novo tratamento, como patrocínio de investi-
dores, status do pesquisador, potencial geração de receitas decorrentes da venda do
tratamento ou até a obsessão do paciente que anseia pela sua cura.
Imagine, por exemplo, que seu filho de apenas 3 meses de vida está com cólicas e
sua avó lhe aconselha o uso de chá de camomila. Provavelmente, esse conhecimento
empírico deve ter alguma lógica, pois é aceito por muitas gerações e “todos” que
usam sempre afirmam que se trata de um ótimo remédio. Para refletir um pouco
mais sobre o problema, vamos formular algumas perguntas:
• Será que a efetividade é devida exclusivamente ao chá de camomila, ou outros
chás também têm o mesmo efeito?
• Após dar chá ao bebê, os pais aguardam uma melhora ou continuam com ou-
tros tipos de tratamento (por exemplo, massagem na barriga, outro medicamen-
to antigases, flexão das pernas etc.)?
• O tratamento é efetivo para qualquer idade?
• Quanto chá e com que frequência deve ser utilizado no tratamento?
• Existem casos em que o tratamento não é efetivo? Se sim, ocorrem com
que frequência?
• Quanto tempo deve-se esperar para o chá fazer efeito?
• Será que o chá de camomila realmente faz efeito, ou o bebê poderia melhorar
ainda sem o chá?
8
No caso da quantidade de chá, poderíamos experimentar várias quantidades di-
ferentes (20 mL, 50 mL, 100 mL etc.) e verificar por meio de uma comparação
qual teve melhor efeito. No caso do tipo de chá, poderíamos experimentar diversos
(camomila, erva-doce, melissa etc.).
Agora que já temos uma ideia de como proceder, precisamos pensar em como
colocar em prática os testes que nos darão os dados para responder às perguntas
levantadas. Isso, em geral, é um problema um tanto quanto complexo. No caso da
pergunta: “O tratamento é efetivo para qualquer idade?”, poderíamos testar o trata-
mento com chá no mesmo bebê durante fases diferentes da vida (1, 3, 6 e 9 meses)
e avaliar os resultados, porém, dado um bebê escolhido para o experimento, existe
a possibilidade deste não ter crises de cólica coincidentemente aos 3 meses, por
exemplo, o que impossibilitaria a coleta de dados.
Estatística e Bioestatística:
Objetivos e Métodos
A estatística pode ter várias definições dependendo do livro consultado, mas nos
ateremos àquela sugerida por Robert Hogg. Em seu artigo científico, Hogg sugere
que a Estatística deve ser entendida como uma maneira de observar e analisar ques-
tões da natureza de forma científica. Tais observações nos levam à formulação de
questões que podem ser respondidas a partir da coleta e análise de dados.
9
9
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Estatística Descritiva
O primeiro passo quando se deseja trabalhar com dados brutos, isto é, sem ne-
nhum tratamento, é tentar resumi-los em forma de gráficos, tabelas e medidas esta-
tísticas (ou simplesmente estatísticas), de forma que fique mais clara a apresentação
do estudo. Posteriormente essas medidas serão a base para o estudo comparativo
por meio do teste de hipótese.
10
Quando realizamos a coleta de dados ou extraímos informação de grandes bancos de da-
dos, nem sempre eles vêm de forma organizada ou estruturada (em formato de tabelas).
Geralmente eles estão disponíveis na sequência em que foram registrados e de forma não
classificada. Como os dados ainda não foram processados, classificados e organizados, cha-
mamos de dados brutos.
É como se fosse uma “joia” que ainda precisa ser lapidada. Se você não aperfeiçoar os de-
talhes, classificar as pedras de forma correta e “lustrá-la” de forma que seu brilho apareça,
será mais difícil vendê-la ou mostrar todo o valor que ela tem. Mas então o que devo fazer?
Qual é o meu primeiro passo? Organizar! Disponível em: https://bit.ly/37Mg82K
Variáveis
Em estatística, definimos como variável uma característica de interesse do indivíduo,
ou objeto de estudo. Voltando ao estudo inicialmente exposto, sobre o chá de camo-
mila no tratamento de cólicas, temos várias características que podem ser descritas
como variáveis: a idade (em meses) do bebê, o tempo (em horas) para o tratamento
fazer efeito, a etnia do bebê, a característica do parto (tempo normal ou prematuro), a
quantidade de chá utilizada como dose (em mL), a periodicidade de acompanhamento
pediátrico da criança (mensal, somente quando doente, ou não existe).
Perceba que as características aqui descritas podem ser numéricas (idade, tempo,
quantidade de chá) ou categóricas (etnia, parto, periodicidade de acompanhamento).
Quando a variável é numérica, chamamos de variável quantitativa, uma vez que
expressa uma quantidade. Por outro lado, se a variável é categórica chamamos de
variável qualitativa, uma vez que expressa uma qualidade.
11
11
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
A Estatística nos dias de hoje é uma ferramenta indispensável para qualquer profissional
que necessita analisar informações em suas tomadas de decisões diárias, seja no seu tra-
balho ou na sua vida pessoal. Pode-se até pensar que suas técnicas nasceram neste mundo
contemporâneo em que se valoriza cada vez mais a rapidez e a agilidade das informações,
de um mundo onde o avanço tecnológico (através da criação de computadores que pro-
cessam uma imensa quantidade de dados em um “piscar de olhos”) é constante. Porém,
a utilização da estatística como suporte para a tomada de decisões é verificada também
no mundo antigo, e indícios de sua utilização são encontrados até na Era antes de Cristo.
O artigo tem por objetivo destacar os principais eventos relacionados com a história da Es-
tatística, bem como procura discutir os aspectos importantes para o futuro dessa ciência.
Disponível em: https://bit.ly/34BZocj
Quantitativa
Contínua
Sim
Variável A escala é
Quantitativa Contínua?
Exemplos: Idade,
Exemplos: Peso, altura, idade quantidade de filhos.
pressão, volume, tamanho, Não
Sim quantidade de filhos. Quantitativa
Discreta
A variável
é numérica?
Qualitativa
Não Ordinal
Sim Exemplos: Escolaridade.
Variável A ordenação
Qualitativa faz sentido?
Exemplos: Cidade, etnia,
sexo, espécie, cor, escolaridade, Não
uso de tabaco. Qualitativa
Nominal
Exemplos: Cidade.etnia,
sexo, espécie, cor, uso de tabaco.
12
de variáveis qualitativas. Veja o exemplo a seguir, retirado do boletim epidemiológico
feito pelo Ministério da Saúde do Brasil em fevereiro de 2020. O boletim traz dados
gerais sobre o sarampo e a seguinte tabela, extraída do texto e que mostra a quan-
tidade de casos para cada faixa etária. Veja que além da contagem absoluta de ca-
sos, é também apresentada a porcentagem de casos por faixa etária, conhecida em
Estatística como frequência relativa. A frequência relativa pode ser calculada por
meio da divisão da quantidade absoluta da faixa pelo total de casos. Por exemplo, a
frequência relativa na faixa de 1 a 4 anos de idade é 2529/18023 = 0,140 ou 14,0%.
Tabela 1 – Distribuição dos novos casos confirmados de sarampo no Brasil em 2019 por faixa etária
Faixa Etária (em anos) Números de Casos %
<1 3.194 17,7%
1a4 2.529 14,0%
5a9 447 2,5%
10 a 14 337 1,9%
15 a 19 2.310 12,8%
20 a 29 5.651 31,4%
30 a 39 2.351 13,0%
40 a 49 1.115 6,2%
> 50 89 0,5%
Total 18.023 100,0%
Fonte: Secretaria da Saúde das Unidades Federadas, 2020
Quando se apresentam dados em uma tabela deve-se ter a preocupação de não dei-
xar dúvidas ao leitor. Isso pode ser feito considerando os seguintes elementos essenciais:
• Descrição da tabela: informa ao leitor de forma resumida o que é apresentado
na tabela. Além disso, (se fizer sentido) a descrição deve trazer a localidade e
quando foram coletados os dados em questão. Nesse exemplo, os dados foram
coletados no território brasileiro (localidade) no ano de 2019 (quando);
• Fonte: qual a instituição ou pesquisador responsável pela coleta dos dados. No exem-
plo, os dados foram coletados pela Secretaria de Saúde das Unidades Federadas.
13
13
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
atingida”, veja a seguinte Tabela, que apresenta a população total (doentes e não
doentes) por faixa etária e o coeficiente de incidência para cada 100.000 habitantes,
além dos dados trazidos na Tabela 1:
Número de casos
Coeficiente de incidência =
População total
3.194 3.194
Coeficiente de incidência (< 1 ano
=) = = 0, 0022814
1, 4 milhões 1.400.000
O coeficiente de incidência costuma ser um número bem pequeno, como pode ser
visto no exemplo anterior. Para facilitar a leitura, é comum usar essa medida para cada
100.000 habitantes, o que pode ser obtido multiplicando o resultado por 100.000:
14
Assim, você poderá verificar que a principal preocupação deve recair sobre a faixa
etária “< 1 ano”, uma vez que acumula o maior número de casos por habitante.
15
15
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Representações Gráficas
Apesar de todo o conteúdo de um estudo estatístico poder ser descrito por meio
de tabelas de dados, muitas vezes as conclusões podem ser mais facilmente visualiza-
das por meio de gráficos. Existem diversos tipos de gráficos e veremos alguns deles
e suas aplicações mais comuns. É importante lembrar que, em geral, não existe certo
ou errado quando se trata de gráficos, mas a escolha do gráfico mais apropriado fará
com que o leitor entenda de forma mais clara a mensagem que se deseja passar.
Gráfico de Barras
O gráfico de barras é construído de forma que cada barra represente uma catego-
ria da variável a ser expressa e o tamanho da barra evidencie sua representatividade.
Este gráfico pode ser apresentado no formato vertical, normalmente empregado
quando as categorias são faixas de valores numéricos, ou no formato horizontal,
para facilitar a leitura quando as variáveis possuem nomes extensos.
Figura 2 – Distribuição dos casos confirmados de sarampo, por faixa etária (Brasil, 2019)
Fonte: Adaptado de Secretaria da Saúde das Unidades Federadas, 2020
Veja que ao contrário da Tabela que exigia certo esforço para identificar a faixa
de maior representatividade, por meio do gráfico de barras verticais facilmente se
identificam os picos de casos. É válido observar que se ao invés de representar a
quantidade de casos (frequência absoluta) no eixo Y, representássemos a frequência
relativa, teríamos exatamente o mesmo formato de gráfico (faça o teste usando um
software como o Microsoft Office Excel).
16
Figura 3 – Comparação entre o formato do gráfico de frequência absoluta e coeficiente
de incidência por 100.000 habitantes dos casos de sarampo no Brasil, em 2019
Fonte: Adaptado de Secretaria da Saúde das Unidades Federadas, 2020
Agora, fica evidente que a preocupação deve realmente estar voltada para a faixa
etária de menos de 1 ano de idade, uma vez que no gráfico do coeficiente de incidên-
cia essa faixa se apresenta com uma coluna muito maior que as demais.
Figura 4 – Proporção de não vacinados contra febre amarela por unidade Federativa (Brasil, 2019)
Fonte: Adaptada do Sistema de Informação do Programa Nacional de Imunizações, 2020
No caso de variáveis qualitativas nominais (em que não existe uma ordem entre
as categorias), como é o caso anterior, é interessante que se ordene a aparição das
barras da variável de menor frequência (no topo) para a de maior frequência (na base)
para facilitar a visualização do leitor.
Gráfico de Dispersão
Este tipo de gráfico é bastante útil quando se deseja demonstrar a relação entre
duas variáveis. Para a sua construção, os valores dos pares de variáveis são conside-
rados como pontos (x, y) em um plano cartesiano.
Considere os dados fictícios a seguir como uma amostra de peso e altura de 9 alunos:
17
17
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Primeiramente, deve-se definir em que eixo se deseja colocar cada uma das vari-
áveis. No nosso exemplo, consideraremos o peso (kg) no eixo Y (vertical) e a altura
no eixo X (horizontal). Cada linha da tabela de dados se tornará um ponto no gráfico
de dispersão. Neste caso, você deverá ler o par de valores de cada ponto por meio
da projeção deste nos eixos X e Y.
O importante neste tipo de gráfico, é tentar visualizar se os pontos formam uma
tendência (linear, exponencial, logarítmica etc.). Caso isso aconteça, o pesquisador
poderá inferir que existe alguma relação entre as duas variáveis estudadas.
No exemplo a seguir podemos verificar que existe uma tendência linear positi-
va, ou seja, à medida que a altura da criança cresce, seu peso também cresce de
forma proporcional.
Gráfico de Linhas
A lógica de construção do gráfico de linhas é parecida com o gráfico de barras
verticais, porém, ao invés das barras, marca-se apenas um ponto com altura relativa
18
à representatividade da variável. Em seguida, unem-se os pontos com uma linha.
Em geral, usa-se este tipo de gráfico quando se deseja mostrar a evolução de uma
variável ao longo do tempo.
Considere o seguinte exemplo, em que se possui a quantidade total de casos de
dengue no Brasil por ano:
Veja que, apesar de a Tabela conter todos os dados necessários para a análise da
evolução de casos, é difícil visualizar o que acontece mês a mês. O gráfico de linhas
pode ajudar a verificar a tendência da incidência ao longo dos anos (se crescente ou
decrescente) e a velocidade em que a mudança ocorre.
Você poderá verificar, na Figura 6, que de 1998 para 1999 a quantidade de casos
registrados caiu abruptamente, porém, começou a subir novamente em 2000 e a
partir de 2001 cresce a cada ano de maneira mais intensa:
Gráfico de Setores
O gráfico de setores é interessante quando se deseja comparar a proporção de ca-
sos de uma variável qualitativa nominal em relação ao todo. Considera-se um círculo
dividido em várias partes, sendo que cada parte deverá ter o tamanho representativo
da categoria em questão.
19
19
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
20
Exemplifiquemos a construção de um histograma por meio da análise do peso de
camundongos. Antes do preparo de um experimento com 50 camundongos mediu-
-se o peso de cada um deles em gramas para verificar se havia anormalidades no
grupo selecionado (camundongos doentes com sobrepeso/baixo peso). Os dados
coletados são mostrados na seguinte Tabela:
Classes
= n
= 50
= 7, 07 ~ 7
21
21
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
• Classe #2:
» Limite inferior: igual ao máximo da classe #1 (25,7 no exemplo anterior).
» Limite superior: mínimo da classe #2 + amplitude da classe:
Devemos proceder aos cálculos dos limites inferior e superior até que se cubram
todas as classes (em nosso exemplo, 7 classes). Após isso, colocam-se as classes
numa Tabela conforme a seguinte:
A Tabela de frequências deve ter linhas mutuamente exclusivas, de forma que uma
observação não possa ser classificada em mais de um intervalo diferente.
22
Vamos aos detalhes do histograma mencionados no começo do tópico:
• Não deve haver espaços entre as barras no histograma;
• Assim como a altura das barras deve ser proporcional à frequência absoluta da
classe, a largura da barra deve ser proporcional ao tamanho da classe. Normal-
mente, constrói-se o histograma com classes de igual tamanho, de forma que
as larguras também fiquem com igual tamanho. Se este não for o caso, deve-se
considerar a adaptação para classes menores ou maiores.
Os detalhes mencionados são importantes para que o histograma possa ser usado
a fim de estudar a forma da distribuição dos dados.
Figura 9 – Histograma e polígono de frequência para o peso (g) de uma amostra de 50 camundongos
Fonte: Acervo do conteudista
Todos os gráficos mencionados podem ser obtidos de forma fácil utilizando-se sof-
twares como o Office Excel, ou outros softwares estatísticos, de forma que o princi-
pal foco não deve ser em como construir um gráfico. Você deve se atentar em como
interpretar cada um deles, de modo a conseguir entender o que os dados mostram.
Outros exemplos:
Representação gráfica: como preparar uma pesquisa estatística para a representa-
ção gráfica?
Exemplo:
Pesquisa da idade de uma população de uma aldeia indígena com 2.000 habitantes.
1. Escolha uma amostra aleatória de 200 habitantes (10% da população da aldeia);
23
23
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Tabela 8
Frequência
Ordem da Limites Ponto Frequência Frequência
relativa
classe (anos) médio absoluta relativa (%)
acumulada (%)
1 0–9 4,5 25 12,5 12,5
2 10 – 19 14,5 15 7,5 20,0
3 20 – 29 24,5 20 10,0 30,0
4 30 – 39 34,5 35 17,5 47,5
5 40 – 49 44,5 40 20,0 67,5
6 50 – 59 54,5 30 15,0 82,5
7 60 – 69 64,5 20 10,0 92,5
8 70 – 79 74,5 10 5,0 97,5
9 80 – 89 84,5 5 2,5 100,0
Figura 10
Fonte: Acervo do conteudista
Construção de um gráfico de barras com frequências acumuladas:
Repetimos o gráfico anterior marcando, no eixo vertical, as frequências acumuladas.
24
Figura 11
Fonte: Acervo do conteudista
Construção de um gráfico de linha:
• O eixo horizontal será o eixo das classes sendo dividido em 9 partes iguais (exis-
tem 9 classes);
• O eixo vertical será o eixo das frequências sendo dividido em 4 partes iguais (a
frequência máxima é 40).
Cada parte será equivalente a 10 habitantes (40 / 4) ou 5% (20 / 4).
Figura 12
Fonte: Acervo do conteudista
Construção de um gráfico de linha com frequências acumuladas:
Repetimos o gráfico anterior marcando, no eixo vertical, as frequências acumuladas.
25
25
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Figura 13
Fonte: Acervo do conteudista
Construção de um gráfico de setores.
O menor valor da frequência relativa é 2,5%, que corresponderá a um setor de x
graus, calculado como: x/2,5% = 360oº/100% >>> x = 9º
Os valores da abertura dos setores em graus serão dados pela seguinte Tabela:
Tabela 9
Limites (anos) Frequência relativa (%) Graus do setor
0–9 12,5 45
10 – 19 7,5 27
20 – 29 10,0 36
30 – 39 17,5 63
40 – 49 20,0 72
50 – 59 15,0 54
60 – 69 10,0 36
70 – 79 5,0 18
80 – 89 2,5 9
nos
30
19 a
–3
9a
10 –
no
s os
9 an
0–
80 – 89 anos
70 – 7
9 ano
nos s
49 a
40 –
60
–6
50 – 59 anos
9a
no
s
Figura 14
Fonte: Acervo do conteudista
26
Medidas de Tendência Central
Para caracterizar um conjunto de dados em estatística, é comum usarmos uma
medida de resumo, que é capaz de fornecer, com apenas um valor numérico, uma
boa noção de todos os dados observados.
Média Aritmética
Dado um conjunto de N dados, a média aritmética pode ser obtida somando-se
todos os dados e após, dividindo-se o resultado pela quantidade N.
Apesar de ser um bom indicador para resumo de dados, a média aritmética nem
sempre é a melhor escolha. Existem situações em que alguns dados possuem valores
muito grandes ou muito pequenos em relação aos outros dados da amostra. Como
a média aritmética considera todos os valores da série de dados em seu cálculo, os
valores extremos acabam “puxando” a média para cima ou para baixo, deixando a
medida de resumo distorcida. Veja o Exemplo 2:
27
27
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
15, 0 + 15,3 + 15,1 + 14,9 + 15, 2 + 17, 0 + 15,1 + 15, 0 + 15,3 + 15, 2 152,9
xA =
10 10
x A =15,3segundos
Perceba que, exceto pela tomada 6, todas as outras tomadas ficaram entre 14,9 e
15,3. Porém, a média aritmética é de 15,3 quando consideramos o valor da tomada
6 de 17,0 segundos. Calcularemos a média aritmética novamente desconsiderando
a tomada 6( xB ) :
15, 0 + 15,3 + 15,1 + 14,9 + 15, 2 + 15,1 + 15, 0 + 15,3 + 15, 2 135,9
xB =
9 9
xB =15,1
Mediana
A mediana também é uma medida de tendência central, porém, ao invés de
considerar a soma dos dados, considera-se a sua ordenação. Após ordenar as obser-
vações, tomamos como mediana a observação que divide a série de dados ao meio.
28
Se a amostra de dados for par não haverá 1 observação central, mas sim 2. Neste
caso, a mediana será dada pela média das duas observações centrais.
Tabela 13
Tomada Tempo (s)
4 14,9
1 15,0
8 15,0
3 15,1
7 15,1
9 15,1
5 15,2
10 15,2
2 15,3
6 17,0
Como temos amostra par (N = 10 dados), verificamos dois dados centrais (toma-
das 7 e 9). Como explicado, a mediana será dada pela média desses valores:
Perceba que apesar de ter uma observação muito maior que as demais, a mediana
ainda retrata bem a posição central dos dados. Dessa forma, quando se tem dados
extremos que distorcem a distribuição dos dados em apenas um dos lados, é preferí-
vel o uso da mediana ao invés da média aritmética.
29
29
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Moda
Quando tratamos com variáveis qualitativas, os dados não são numéricos, de
forma que não é possível calcular a média aritmética ou a mediana. Neste caso, po-
demos usar a moda, que é dada pela observação de maior frequência.
Exemplo:
Foi feita uma pesquisa em um hospital para determinar qual era o principal sin-
toma descrito pelo paciente na triagem em casos de dengue confirmados posterior-
mente. Os dados são descritos na seguinte Tabela:
Veja que, neste caso, a moda é o sintoma sangramento na gengiva e nariz, que
apareceu 37 vezes na pesquisa.
30
Comprimido Lote 1 Lote 2
9 502 516
10 483 507
Média 493,7 502,3
Amplitude
Medida mais simples de variação de uma série de dados é dada pela subtração do
maior valor da série pelo menor valor:
Amplitude
= Máximo − Mínimo
Ainda que seja um indicador simples, espera-se que a amostra do lote 2 tenha varia-
bilidade muito maior que a do lote 1, uma vez que apresenta amplitude 4 vezes maior.
31
31
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Variância
A variância de uma série de dados é uma medida de variabilidade mais acurada,
uma vez que leva em consideração todos os dados da série. Basicamente, é feita a
subtração de cada um dos dados da série em relação à média aritmética; elevam-se
os valores ao quadrado e divide-se pela quantidade de dados menos 1.
32
Exemplificando o cálculo da diferença quadrática em relação à média para o com-
primido 1 (dados marcados em vermelho):
A variância pode, então, ser obtida pela divisão da soma das diferenças quadráti-
cas pela quantidade de dados menos 1.
642
s 2 ( Lote
= 1) = 71,3 g 2
10 − 1
9.642
s 2 ( Lote
= 2) = 1071,3 g 2
10 − 1
Desvio Padrão
O desvio padrão de uma série de dados (simbolizado pela letra ) é definido como
a raiz quadrada da variância da série. Esta operação traz a unidade da medida da
variância para a mesma dimensão da série de dados, sendo, dessa forma, mais fácil
de interpretar. No exemplo das cápsulas de dipirona sódica teríamos:
s = s2
s ( Lote
= 1) 71,3 8, 4 g
=
( Lote 2)
s= 1.071,3 32, 7 g
=
Coeficiente de Variação
O coeficiente de variação é uma forma de relativizar o desvio padrão, tornando
possível a comparação entre séries de dados distintas. Para calcular o coeficiente de
variação, divide-se o desvio padrão pela média aritmética e multiplica-se o resultado
por 100 (para apresentação em %).
s
Coeficiente de derivação %(CV )= ×100
x
33
33
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
8, 4
CV %( Lote1)= ×100= 1, 7%
493, 7
32, 7
CV %( Lote 2)= ×100= 6,5%
502,3
Em Síntese
Em seu estudo, Rodrigues, Lima e Barbosa (2017) apresentaram que o uso adequado da
estatística básica permite que o clínico possa sentir mais confiança nos resultados das
pesquisas e assim implantar novas intervenções ou fármacos na prática clínica. As prin-
cipais recomendações para minimizar os erros no relato de artigos científicos são: 7,8
descrever a hipótese da pesquisa; conceituar as variáveis usadas na pesquisa; resumir os
dados das variáveis por meio da estatística descritiva; descrever os métodos emprega-
dos na análise de cada variável e relacionar os métodos estatísticos empregados; verifi-
car a distribuição dos dados antes da execução das análises e relatar a técnica ou o teste
empregado; descrever os métodos de ajuste usados para múltiplas comparações; des-
crever como os valores discrepantes foram tratados; descrever o nível de significância;
descrever os parâmetros usados para a execução do cálculo do tamanho da amostra de
forma que os cálculos possam ser repetidos; descrever o programa ou pacote estatístico
usado na análise; usar a média e o desvio padrão para dados com distribuição normal;
usar a mediana e a amplitude interquartílica para dados com distribuição assimétrica;
não substituir o desvio padrão pelo erro padrão. Os maiores erros na interpretação de
dados provenientes de pesquisas científicas se devem ao uso inadequado da estatística
básica abordada nessa revisão narrativa. Os profissionais de saúde devem ser capazes
de avaliar criticamente os resultados de estudos para que as informações dispostas na
literatura possam influenciar positivamente nos cuidados aos pacientes. O entendi-
mento da validade das conclusões propicia a aplicabilidade dos achados aos pacientes.
A compreensão acerca do uso adequado da estatística básica propicia menores erros nos
relatos dos resultados de estudos executados e na interpretação das suas conclusões.
34
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Vídeos
Gráfico de barras horizontais (ou colunas)
https://youtu.be/jNBAy4mPoNc
Gráfico de barras verticais
https://youtu.be/6PHPLh0WPKY
Gráfico de linhas
https://youtu.be/ArjZJXEEa9o
Gráfico de dispersão
https://youtu.be/9k2-qCAqXWo
Histograma
https://youtu.be/jGbyMUy_vFI
Medidas estatísticas básicas
https://youtu.be/wIRzYpOxnTg
35
35
UNIDADE Introdução à Bioestatística e Análise Exploratória de Dados
Referências
BRASIL. Ministério da Saúde. Secretaria de Vigilância em Saúde. Boletim Epide-
miológico. v. 51, n. 6, mar. 2020a. Disponível em: <https://www.saude.gov.br/
images/pdf/2020/April/08/Boletim-epidemiologico-SVS-06-v2.pdf>. Acesso em:
25/02/2020.
Sites Visitados
G1. Casos de dengue aumentam sete vezes no Brasil em 2019. Disponível em:
<https://g1.globo.com/bemestar/noticia/2019/09/11/casos-de-dengue-aumentam-
-sete-vezes-no-brasil-em-2019.ghtml>. Acesso em: 26/02/2020.
36