Escolar Documentos
Profissional Documentos
Cultura Documentos
89242
RESUMO
Clin Biomed Res. 2018;38(4):414-418 A revista do HCPA (Clinical & Biomedical Research) está reabrindo a seção de
1 Unidade de Bioestatística, Grupo de Bioestatística com o intuito de apresentar artigos explicativos, conceituais ou tutoriais, de
Pesquisa e Pós-graduação (GPPG), modo a elucidar os leitores sobre os mais diversos temas estatísticos. Neste contexto,
Hospital de Clínicas de Porto Alegre este artigo será o primeiro de uma série que tem como objetivo responder algumas
(HCPA). Porto Alegre, RS, Brasil. das questões mais levantadas por pesquisadores da área da saúde. Começando pela
Estatística Descritiva, alguns conceitos são esclarecidos e diversas referências são
2 Departamento de Estatística, Instituto indicadas para o estudo do tema e para análises em SPSS ou R-project.
de Matemática, Universidade Federal
do Rio Grande do Sul (UFRGS). Porto Palavras-chave: Estatística descritiva; programa estatístico; desvio-padrão;
Alegre, RS, Brasil. erro‑padrão; SPSS; R-project
Entre os 140 respondentes, além de sugestões (devidamente identificados), mas não devem ser
de temas estatísticos, também surgiram muitas incluídos nas estatísticas descritivas das variáveis
perguntas, das quais grande parte versavam sobre quantitativas.
assuntos básicos de estatística ou já abordados Outro importante ponto a ser avaliado
na literatura. Diante desta realidade, uma série de é a presença de outliers (valores atípicos).
artigos será apresentada, respondendo e sugerindo Aconselha‑se, primeiramente, verificar se tal
referências para o melhor entendimento das principais valor foi corretamente registrado, posteriormente,
dúvidas observadas na enquete. No entanto, estes qual a possível causa desta anomalia e se deve
artigos não terão como objetivo ensinar como calcular ou não ser excluído. Esta qualificação deve ser
medidas estatísticas ou fazer testes, apenas auxiliar cautelosa, pois o mesmo pode viesar os resultados,
na interpretação e uso dos mesmos. mas também pode ser exatamente o que se está
Começando pelo que se entende ser a primeira procurando. O Boxplot (diagrama de caixas) é uma
análise estatística de qualquer estudo ou pesquisa das ferramentas mais conhecidas para auxiliar
desenvolvida, este artigo responde algumas das na detecção dos mesmos, mas muitos outros
principais questões levantadas sobre Estatística métodos e técnicas podem ser encontradas na
Descritiva: literatura. Hawkis 5 é uma referência nesta área
e Figueira 6 cita diferentes referências.
ANÁLISE DESCRITIVA: QUAIS OS PRINCIPAIS
PONTOS A SEREM AVALIADOS? COMO APRESENTAR OS RESULTADOS DA
ANÁLISE DESCRITIVA?
A análise descritiva, ou síntese numérica, é a
etapa inicial de qualquer estudo. Podendo também A primeira tabela do capítulo de resultados de
ser considerada a mais importante, visto que é a um artigo científico é, geralmente, a tabela que
partir dela que definimos como e qual análise será descreve a amostra estudada. Ou seja, a tabela
utilizada. Erros, nesta primeira etapa, podem invalidar que apresenta os resultados descritivos. No meio
todas as demais. acadêmico, ela é conhecida, carinhosamente, como
A descrição dos dados tem como objetivo básico “tabela 1”. A Tabela 1 apresenta um exemplo fictício
resumir uma série de valores de mesma natureza para os resultados descritivo de um ensaio clínico,
através de um conjunto de ferramentas e técnicas: por exemplo.
tabelas, gráficos, medidas (estatísticas) de variabilidade A Tabela 1 apresenta a média e o desvio padrão
e de tendência central que ajudam na produção de para a IDADE (variável simétrica), a mediana e os
uma visão global dos dados1. Bussab e Morettin2, intervalos interquartílicos (P25% - P75%) para o
Farber e Larson3 e Crespo4 apresentam algumas PESO (variável assimétrica) e a frequência absoluta
das principais medidas-resumo. e relativa para SEXO e TABAGISMOS (variáveis
No entanto, não basta resumir. Uma análise categóricas). Observa-se, também, que quando
cuidadosa destes resultados é crucial. Um dos existem apenas duas categorias em uma variável
principais pontos a serem avaliados é a existência é desnecessária a apresentação de ambas, visto
de erros de digitação. Nas variáveis categóricas é que é possível obter o percentual masculino, por
fácil detectá-los através da tabela de frequências, exemplo, através dos resultados feminino.
já nas variáveis quantitativas é importante A mesma tabela pode ser adaptada para os
verificar se o mínimo e o máximo observado estão demais delineamentos. Quando a amostra é única
conforme o esperado. Cabe salientar que valores e não existem grupos a serem comparados, basta
codificados como missings (dados faltantes) até excluir as duas colunas centrais e proceder de
podem estar inclusos nas tabelas de frequências forma análoga.
palavras, cerca de 95 indivíduos têm seu peso No entanto, se não é possível analisarmos
entre 55 kg e 75 kg (a média mais ou menos dois inúmeras amostras, como calcular o erro padrão?
desvios padrões). Já a variância nada mais é do Para tal, pode-se estimar o erro padrão (EP) através
que o quadrado do desvio padrão. No exemplo, a do desvio padrão (DP) e do tamanho (n) de uma
variância do peso será de 25 kg2. amostra, tal que . Portanto a magnitude
Contudo, geralmente o interesse não está na do erro padrão decresce à medida que o tamanho
média de uma particular amostra, e sim na média da amostra aumenta. Por outro lado, a magnitude
da variável para todos os indivíduos da população do desvio padrão não é influenciada pelo tamanho
de onde a amostra foi retirada. No entanto, um
da amostra.
censo (coleta de informações de toda a população
Voltando ao exemplo anterior de 100 indivíduos
em estudo) nem sempre é possível. Na prática, os
com média de 65 ± 5 kg, o erro padrão da média do
dados são coletados apenas de uma única amostra
desta população de interesse. Mas, inúmeras peso é= EP 5 / =
100 5= / 10 0, 5, logo em cerca de 95%
amostras diferentes de mesmo tamanho (n) podem das amostras de tamanho 100 da mesma população,
ser coletadas da mesma população e diferentes o peso médio estará entre 64 kg e 66 kg, a média
médias podem ser observadas. A Figura 1 ilustra um (65 kg) mais ou menos 2 erros padrões (1kg).
processo de selecionar amostras de uma população Uma melhor compreensão sobre a diferença
para o estudo do PESO. entre os termos também pode ser vista em Altman
Na Figura 2, percebe-se que diferentes amostras e Bland14 e Field12.
podem apresentar diferentes médias. Este conjunto
de diferentes médias é descrito pela chamada QUAIS AS PRINCIPAIS REFERÊNCIAS PARA
“Distribuição Amostral de Médias”. Esta distribuição ESTATÍSTICA BÁSICA E CONCEITOS INICIAIS:
amostral apresenta o comportamento das amostras MÉDIA, MEDIANA, DESVIO, ETC?
da população, com a média e o desvio padrão do
conjunto de médias, agora também tratado como Atualmente, o conhecimento de estatística
variável. No exemplo da Figura 1, 5 médias foram básica é fundamental para qualquer profissional,
observadas, cuja média (das médias) foi 70 kg e o seja ele da saúde ou não, seja do meio acadêmico
desvio padrão (das médias) foi 11,83 kg. E é este ou não. Desde notícias esportivas, manchetes em
desvio padrão da estimativa da média que chamamos jornais, revistas, bulas, etc à artigos acadêmicos,
de erro padrão (ou erro padrão da média). Como o os conceitos básicos tornam-se essenciais para a
erro padrão é um tipo de desvio padrão, a confusão correta compreensão dos mesmos. Até mesmo para
entre os dois termos é comum e compreensível12. a tomada de decisões.
Para tal, existem diversas referências: uma sobre o assunto, além de diversos canais com
bibliografia em inglês muito citada é Zar 15, com videoaulas no Youtube.
mais de 85 mil citações no Google Acadêmico.
Em Português, sugere-se os livros de Soares Conflitos de Interesse
e Siqueira 1 , Callegari-Jacques 16 e Vieira 17 .
E também é possível encontrar muitos blogs Os autores declaram não ter conflitos de interesse
REFERÊNCIAS
1. Soares JF, Siqueira AL. Introdução 7. R Foundation. The R Project for 12. Field A. Descobrindo a estatística
à estatística médica. Belo Horizonte: Statistical Computing. Vienna: R usando o SPSS. 2. ed. São Paulo:
Departamento de Estatística da Foundation [citado 2019 Jan 15]. Bookman; 2009.
UFMG; 2002. Disponível em: www.r-project.org 13. Hospital de Clínicas de Porto
Alegre (HCPA). Cursos de SPSS.
2. Bussab WO, Morettin PA. Estatística 8. Signorell A. DescTools: tools for Assessorias Estatísticas [citado 2019
básica. São Paulo: Saraiva; 2010. descriptive statistics. R package Jan 15]. Disponível em: sites.google.
version 0.99. Vol. 18. Vienna: R com/a/hcpa.edu.br/bioestatística
3. Farber L, Larson R. Estatística
Foundation; 2016.
aplicada. 4. ed. São Paulo: Pearson; 14. Altman DG, Bland JM. Standard
2010. deviations and standard errors. BMJ.
9. Field A, Miles J, Field Z. Discovering
2005;331(7521):903. http://dx.doi.
Statistics Using R. London: SAGE;
4. Crespo AA. Estatística fácil. São org/10.1136/bmj.331.7521.903.
Paulo: Saraiva; 2017. 2012. PMid:16223828.
5. Hawkins DM. Identification of outliers. 10. Mello MP, Peternelli LA. Conhecendo 15. Zar JH. Biostatistical analysis. Upper
Vol. 11. London: Chapman and Hall; o R: uma visão mais que estatística Saddle River: Prentice-Hall; 2009.
1980. http://dx.doi.org/10.1007/978- [dissertação]. Viçosa: Universidade
16. Callegari-Jacques SM. Bioestatística:
94-015-3994-4. Federal de Viçosa; 2013.
princípios e aplicações. Porto Alegre:
Artmed; 2009.
6. Figueira MMC. Identificação de 11. Jelihovschi E. Análise exploratória
outliers. Revista Millenium Online, de dados usando o R. Ilhéus: Editus; 17. Vieira S. Introdução à bioestatística.
Viseu, 12, 1998. 2014. São Paulo: Elsevier; 2015.