Você está na página 1de 20

DESCRIÇÃO DE RESULTADOS

APRESENTAÇÃO DA UNIDADE

Na 1ª unidade desta disciplina foi mostrado que a bioestatística pode


ser dividida em descritiva ou inferencial. A descritiva, como o próprio nome já
entrega, visa descrever os resultados após as coletas de dados em uma
pesquisa. Geralmente é a primeira etapa após a coleta e organização do
banco de dados, sendo utilizada para resumir, expressas e compreender o
que foi obtido.

Sendo assim, nesta unidade iremos abordar os aspectos relacionados à


estatística descritiva. Veremos as principais formas de fazer descrição de
dados (medidas e indicadores), além de sua expressão tabular e gráfica. A
maioria dos estudos geralmente utiliza a estatística descritiva para fazer a
caracterização do grupo estudado, sendo fundamental que estudantes e
profissionais estejam aptos a construir e interpretar tais instrumentos.

Além disso, ainda vale ressaltar que esta apostila foi construída
utilizando-se de linguagem o mais simples, possível, para o melhor
aprendizado de vocês e vale salientar a importância de todos acessarem os
materiais complementares indicados ao longo de todo o material.

No mais, quaisquer dúvidas podem ser sanadas com auxílio do(a)


tutor(a). Bons estudos e um ótimo aproveitamento dos materiais.
SUMÁRIO

Introdução à descrição de resultados ..................................................................... 4

Frequências .................................................................................................................. 4

Intervalo de confiança ............................................................................................... 8

Medidas de tendência central ................................................................................ 11

Normalidade da distribuição de dados................................................................. 16

Arredondamento ....................................................................................................... 18

Expressão gráfica e tabular de dados ................................................................... 18

Referências ................................................................................................................. 20
4

Introdução à descrição de resultados

Após a coleta de dados por meio de formulários e questionários, o


próximo passo é organizar o que foi colhido em um único banco de dados
para que a análise seja feita posteriormente. Depois de coletados, os dados
são organizados, agrupados e resumidos em formatos que facilitem a
visualização e interpretação.

Material complementar
Clicando aqui você poderá assistir a um vídeo que faz
uma introdução sobre a construção de bancos de
dados para pesquisas científicas na área da saúde.

Geralmente as categorias das variáveis qualitativas são resumidas em


frequências (percentual, por exemplo) e as variáveis quantitativas são
resumidas em medidas de tendência central (média, mediana e moda).

Posteriormente, como forma de facilitar a visualização dos resultados,


esses indicadores (frequências e medidas de tendência central) podem gerar
tabelas e gráficos.

Frequências

As frequências são medidas utilizadas para a expressão dos resultados


obtidos da coleta de dados de variáveis qualitativas. Normalmente são
dispostas frequências para cada categoria das variáveis. Assim, além das
frequências acumuladas, há três principais tipos:
5

Frequência absoluta

Frequência relativa

Frequência relativa percentual

A primeira, chamada frequência absoluta, é simplesmente o número


de observações para cada classe ou categoria da variável qualitativa. Isso
quer dizer, em outras palavras, que se trata da contagem de elementos da
amostra ou população que estão enquadradas em cada categoria das
variáveis.

Exemplo
Um pesquisador coleta dados referentes a escolaridade de um grupo de
indivíduos. Havia 5 pessoas analfabetas, 9 pessoas com ensino
fundamental, 23 pessoas com ensino médio e 6 pessoas com ensino
superior.

Perceba que a variável escolaridade está dividida em quatro categorias


(analfabeto, ensino fundamental, ensino médio e ensino superior). Sendo
assim, o número de pessoas para cada categoria representa a frequência
absoluta de cada.
6

A segunda, chamada de frequência relativa, é a divisão da frequência


absoluta de cada categoria pela soma de todas as frequências absolutas.
Diante disso, observe o exemplo abaixo:

Exemplo
Ainda em relação ao pesquisador que coletou dados referentes a
escolaridade de um grupo de indivíduos, foi visto que havia 5 pessoas
analfabetas, 9 pessoas com ensino fundamental, 23 pessoas com ensino
médio e 6 pessoas com ensino superior, totalizando 43 indivíduos. Assim,
dividindo cada frequência absoluta pelo total nós teremos,
respectivamente, as frequências relativas: 0,12; 0,21; 0,53; e 0,14.

A terceira, chamada de frequência relativa percentual ou


simplesmente percentual, é o resultado da multiplicação de cada frequência
relativa por 100. Observe a seguir:

Exemplo
Seguindo no mesmo exemplo da escolaridade, as frequências relativas
obtidas para cada uma das quatro categorias da variável foram,
respectivamente: 0,12; 0,21; 0,53; e 0,14. Multiplicando cada frequência
dessa por 100 serão obtidos os percentuais: 12%; 21%; 53%; e 14%. Percebam
que a soma de todos as frequências relativas e percentuais devem ser 1 e
100%, respectivamente.

Observe outro exemplo de distribuição de frequências, sendo que


desta vez as mesmas estão dispostas em uma tabela:
7

Fonte: o próprio autor (dados fictícios)

Neste exemplo apresentado acima perceba que a variável renda está


dividida em três categorias: baixa, média e alta. Também note que além das
frequências absoluta, relativa e percentual há as frequências acumuladas.

As frequências acumuladas, as quais são mais comuns (mas não


exclusivamente) de serem utilizadas na descrição de variáveis qualitativas
ordinais, caracterizam o acumulado até aquela categoria. Note que a
frequência absoluta acumulada da categoria baixa renda é igual a
contagem de pessoas naquele mesmo grupo. Isso acontece, pois trata-se da
primeira categoria da variável e, dessa forma, só tem aquele valor para
acumular.

Já a frequência absoluta acumulada para a renda média é a soma da


frequência absoluta dela mesma com a anterior, ou seja, a baixa renda,
totalizando 1.616 indivíduos (129 + 1.487 = 1.616).

Por fim, a frequência absoluta acumulada da renda alta é a soma de


todas as categorias, considerando que se trata da última categoria da
variável. Observe que a mesma linha de raciocínio é aplicada às outras
frequências acumuladas dispostas na tabela (frequência relativa acumulada
e percentual acumulado).
8

Intervalo de confiança

Um dos aspectos abordados aqui nesta disciplina foi a generalização


de resultados quando usada a estatística inferencial. Isso significa que um
grupo menor de pessoas (amostra) pode fornecer dados e gerar informações
que são generalizadas para um grupo ainda maior (população). Entretanto,
será que o resultado que obtemos a partir do estudo de uma amostra
representativa é 100% igual ao resultado que obteríamos se tivéssemos
coletado dados da população inteira? Ainda que a amostra seja
representativa, a resposta é não.

A inferência (generalização de resultados) não significa 100% de


certeza (para a população) daquele resultado obtido na amostra. A
inferência configura um resultado com validade científica sim, porém para se
ter 100% de certeza de que aquele resultado é o exato para a população, o
correto é coletar dados de todos os elementos da mesma. Isso acontece nos
Censos, por exemplo, que teoricamente coletam dados de todos os
indivíduos de todas as cidades do país.

Assim, considerando a utilização de amostras e da estatística


inferencial, o ideal é acompanhar os indicadores descritivos com uma
informação chamada intervalo de confiança.

O intervalo de confiança é um intervalo de valores (mínimo e máximo)


em que se acredita (de acordo com determinado nível de confiança) estar
o verdadeiro resultado referente a uma variável em uma população que está
sendo representada por uma amostra. Observe o seguinte exemplo:
9

Exemplo
Uma pesquisa de intenção de votos que utilizou amostra representativa
revelou que o candidato X possui 18% de intenção de voto e o candidato
Y possui 25%. A pesquisa também revelou que os intervalos de confiança
eram de 16 – 20 e 23 – 27 para os candidatos X e Y, respectivamente. Isso
significa que na amostra foi encontrado 18% de intenção de voto para o
candidato X, mas que na população representada o verdadeiro valor de
intenção de voto pode ser qualquer número entre 16% e 20%. Já em
relação ao candidato Y foi visto que na amostra havia 25% de intenção de
voto, porém na população o real valor é qualquer número entre 23% e 27%.

Os intervalos de confiança podem acompanhar médias ou


percentuais, mas a maioria dos estudos na área da saúde utilizam este
parâmetro como acompanhamento e informação complementar de
percentuais para auxiliar na generalização dos resultados.

Esses intervalos são obtidos a partir da margem de erro, que é um índice


que estima o erro dos resultados em uma pesquisa quantitativa.

Exemplo
Ainda neste contexto das pesquisas de intenção de voto, provavelmente
você já ouviu falar na margem de erro em que, na descrição, geralmente
é dita como X pontos para mais e X pontos para menos. Assim, o valor de
18% de intenção de voto com margem de erro de 2 pontos para mais e
para menos vai resultar em um intervalo de confiança de 16% a 20%. Isso
foi obtido pois 18 – 2 = 16 e 18 + 2 = 20. Além da utilização disso em pesquisas
de intenção de voto, o mesmo raciocínio também é aplicado na
descrição de resultados de estudos da área da saúde.
10

Sendo assim, para obtenção de um intervalo de confiança é


necessária a realização do cálculo da margem de erro, a qual pode ser
obtida por meio da fórmula:

A fórmula apresentada acima fornece a margem de erro para


percentuais. Nela, o p significa percentual (referente ao percentual da
categoria que está sendo descrita); o valor de 1,96 representa o nível de
confiança (normalmente na área da saúde utiliza-se 95% de confiança); o
valor q corresponde a quanto falta para completar 100% em relação ao p; e
o valor n corresponde ao número de elementos contidos na amostra
coletada. Assim, após a obtenção da margem de erro, o intervalo de
confiança pode ser calculado e obtido, também.

Se liga!
Normalmente em pesquisas da área da saúde é quase um padrão utilizar
95% de confiança (na fórmula corresponde ao Z = 1,96). Então, se um
percentual apresenta intervalo de confiança de 95% igual a 18 – 22, isso
significa que há 95% de chance do valor real na população estar dentro
desse intervalo.

Além de tudo isso, é importante saber que quando houver


comparação dos intervalos de confiança de dois percentuais diferentes a
dinâmica obedece uma regra específica. Nesse caso, se acontecer dos
intervalos de confiança se sobrepuserem (tiverem valores em comum), a
interpretação é de que na população os percentuais são semelhantes. Por
11

outro lado, se os intervalos de confiança não se sobrepuserem (não houver


valores em comum), a interpretação é que os percentuais comparados são
diferentes, ou seja, uma categoria pode ser considerada maior que a outra.

Observe o seguinte exemplo de comparação de intervalos de


confiança:

Exemplo
Digamos que a variável sexo apresente como resultados os seguintes
percentuais e respectivos intervalos de confiança de 95%: 40% (30 – 50) para
o masculino e 60% (50 – 70) para o feminino. Perceba que os dois intervalos
tem um número em comum (50), sendo assim estes estão se sobrepondo e
a interpretação é que os percentuais de homens e mulheres na população
são semelhantes. Caso o resultado fosse o seguinte: 40% (35 – 45) para o
masculino e 60% (55 – 65) para o feminino, a interpretação seria que há um
percentual maior de mulheres na população, já que os intervalos não se
sobrepõem.

Medidas de tendência central

As medidas de tendência central são aquelas que indicam onde está


o centro do conjunto de dados, verificando a tendência de dados
quantitativos se agruparem ao redor de um valor central. Essas medidas são
conhecidas como média, mediana e moda.
12

Fonte: Portal Entre Símbolos

A principal e mais conhecida é a média. Esta medida é obtida


somando todos os valores e dividindo pela quantidade de elementos
somados, como mostra a fórmula a seguir:

Exemplo
Digamos que um educador físico anotou as idades de 15 participantes da
aula de treino funcional em um determinado dia da semana. As idades
anotadas foram: 32, 21, 19, 20, 35, 41, 45, 29, 28, 26, 22, 26, 22, 20, 37. Sendo
assim, ao somar todas as idades e dividir por 15 (número de elementos no
conjunto) a média é 28,2 anos.
13

Material complementar
Clicando aqui você poderá assistir a um vídeo que
explica a respeito da variância e desvio padrão, as
quais são as medidas de dispersão que normalmente
podem acompanhar as médias como informação
complementar. As medidas de dispersão indicam o
quão próximos os valores estão da medida de
tendência central, sendo que quanto maior o valor,
maior é a dispersão.

A outra medida de tendência central bastante conhecida é a


mediana, também conhecida como percentil 50. Essa medida vai indicar o
valor que ocupa a posição central do conjunto de dados ordenado. Observe
a imagem a seguir:

Fonte: Portal Educa Mais Brasil

Para obter a mediana, basta colocar o conjunto dos valores em ordem


crescente ou descrescente. O número que estiver exatamente no meio é a
mediana.

Exemplo
Observe o seguinte conjunto de dados: 9, 5, 2, 11, 22. O primeiro passo para
obter a mediana é colocar o conjunto na ordem (neste caso, ordem
crescente), ficando assim: 2, 5, 9, 11, 22. Perceba que o 9 é o valor que está
exatamente no meio, sendo esta a mediana do conjunto.
14

Perceba que esse conjunto de dados do exemplo descrito acima possui


cinco números, sendo cinco um valor ímpar. Dessa forma vai haver um único
valor no centro do conjunto de dados, sendo ele a mediana. Nos casos em
que o conjunto tiver uma quantidade par de elementos, a regra é obter a
média dos dois valores que estão exatamente no centro, sendo esta a
mediana.

Exemplo
Observe o seguinte conjunto de dados: 9, 5, 2, 11, 22, 1. O primeiro passo
para obter a mediana é colocar o conjunto na ordem (neste caso, ordem
crescente), ficando assim: 1, 2, 5, 9, 11, 22. Perceba que agora os valores
que estão exatamente no meio são o 5 e 9. Sendo assim, a mediana desse
conjunto vai ser 7, pois 5 + 9 = 7.

A terceira medida de tendência central é a moda, a qual também


pode indicar o centro do conjunto de dados. Quando algum modelo de
roupa se encontra ‘na moda’, por exemplo, significa que há muitas pessoas
utilizando aquele mesmo modelo, ou seja, repedindo aquela mesma peça.
Assim, essa roupa está se repetindo muitas vezes.

Material complementar
Clicando aqui você poderá assistir a um vídeo que
aborda à respeito dos percentis, os quais são as
medidas de dispersão utilizadas para complementar as
medianas.
15

Fonte: Portal GRATISPNG

Na matemática a moda significa algo parecido, correspondendo ao(s)


valor(es) do conjunto de dados que está(ão) aparecendo mais vezes.

Exemplo
Observe o seguinte conjunto de dados: 32, 20, 19, 20, 35, 41, 45, 19, 28, 26, 20,
27, 22, 37. Neste caso observe que o número 19 aparece duas vezes e o 20
aparece três vezes. Assim, a moda do conjunto é 20, pois é o valor que aparece
mais vezes.

Quando o conjunto de dados não possui moda, ou seja, não há


nenhum valor aparecendo pelo menos duas vezes, trata-se de um conjunto
amodal. Quando o conjunto possui moda, há três possibilidades de
classificação:
16

Unimodal

Bimodal

Multimodal

A primeira classificação significa que há apenas um valor que


corresponde a moda, já a segunda significa que dois valores representam a
moda e a última indica que há três ou mais valores indicando a moda.

Normalidade da distribuição dos dados

A distribuição normal é um modelo bastante utilizado na estatística,


indicando que os valores do conjunto de dados se distribuem de forma
normal, ou seja, sem muitas discrepâncias que poderiam prejudicar a
expressão do centro do conjunto de dados através da média. Essa
distribuição também é conhecida como Gaussiana, sendo muito comum ser
representada pela imagem a seguir:
17

Fonte: Portal ProEucacional

É recomendado que quando o conjunto de dados tiver distribuição


normal as medidas que devem ser utilizadas são média e desvio padrão. Já
quando o conjunto de dados tiver distribuição não normal, recomenda-se
utilizar a mediana e os percentis.

Os programas estatísticos oferecem alguns testes que indicam se o


conjunto de dados trabalhado tem distribuição normal ou não. Dois dos
principais são os testes de Kolmogorov-Smirnov e o de Shapiro-Wilk. A imagem
a seguir ilustra a diferença entre conjuntos de dados normais e não normais:

Fonte: Alvarez Soluções Digitais


18

Material complementar
Clicando aqui você poderá assistir a um vídeo que
explica mais detalhadamente sobre a distribuição
normal e sua relação com a média e desvio padrão.

Arredondamento

Por fim, é importante saber que durante a descrição dos resultados de


um trabalho muitas vezes é recomendado que se arredonde os valores com
muitas casas decimais. Isso acontece, pois muitos números com muitas casas
decimais pode deixar a descrição dos resultados muito pesada, então se
propõe a simplificação dos valores.

Se liga!
No Brasil, a regra de arredondamento é padronizada pela Associação
Brasileira de Normas Técnicas (ABNT), mais especificamente pela NBR
5891/2014. Através deste link você poderá fazer download de um material
explicativo que resume a regra de arredondamento de números de acordo
com a ABNT.

Expressão gráfica e tabular de dados

Gráficos e tabelas são instrumentos bastante indicados para descrever


resultados de uma forma mais organizada e ilustrativa. Estes facilitam a
interpretação de dados e trazem praticidade, especialmente quando há a
necessidade de descrever uma grande quantidade de valores.

Há vários tipos de gráficos, mas os mais conhecidos são os gráficos de


barras (podendo ser barras verticais ou horizontais) e de setores (conhecido
como gráfico de pizza).
19

Gráfico de barras verticais:

Fonte: Portal FM2S

Gráfico de setores:

Fonte: Portal FM2S


20

Material complementar
Clicando aqui você poderá assistir a um vídeo que explica como fazer
a geração de vários tipos de gráficos de forma gratuita e on-line.

Já as tabelas correspondem a uma forma de representação matricial,


ou seja, através da disposição dos dados em linhas e/ou colunas.

Material complementar
Clicando aqui você poderá assistir a um vídeo que explica como fazer
a geração de tabelas e como formatá-las no programa Microsoft
Word.

Referências

BERGAMASCHI, Denise Pimentel; SOUZA, José Maria Pacheco; BRAGA,


Patrícia Emília. Introdução à Bioestatística. São Paulo, 2005. [Material de
apoio Didático de Curso de Atualização do Programa de Verão da
Faculdade de Saúde Pública da Universidade de São Paulo].

DE OLIVEIRA FILHO, Petrúnio Fagundes. Epidemiologia e bioestatística –


fundamentos para uma leitura crítica. Editora Rubio, 2015.

VIEIRA, Sônia. Introdução à bioestatística. Elsevier Brasil, 2015.

_______. Bioestatística: tópicos avançados. Elsevier Brasil, 2018.

Você também pode gostar