Você está na página 1de 4

Uma introdução à estatística descritiva

ilustrar o ponto, um exemplo de dados de intervalo seria

uma pontuação de teste de QI. As proporções dessas medições não podem ser

aplicado e um QI de 140 no sujeito 1 versus 70 no sujeito 2

não significa que o sujeito 1 é duas vezes mais inteligente do que o sujeito 2. Ligado

por outro lado, exemplos de dados de proporção mostram que todos eles

têm uma escala constante que inclui um zero, por ex. dois

cem metros é o dobro do comprimento de cem metros.

Esses dados podem ser plotados em um histograma e o ponto médio

da curva será novamente a medida da tendência central.

Se uma variável é normalmente distribuída (ou seja, ela produz

uma curva de sino simétrica) a média, mediana e a moda

o valor será aproximadamente igual. Se o pesquisador está indo

para realizar estatísticas inferenciais, ou seja, testes que permitem

o pesquisador para tirar inferências dos dados (coberto

em um artigo subsequente) deve ser decidido se o

os dados são normalmente distribuídos. Se for, então a média e

o desvio padrão será suficiente como estatísticas resumidas. Se o

os dados não são normalmente distribuídos, então as estatísticas de cinco ordens são usadas,
ou seja, mínimo, primeiro quartil, mediana, terceiro

quartil e máximo. O alcance e o interquartil

intervalo pode ser facilmente derivado destes, mas geralmente não são

usado explicitamente como estatísticas de resumo. O resultado de

testar isso irá determinar se o pesquisador pode usar

estatísticas paramétricas ou estatísticas não paramétricas. Para

intervalo / proporção de dados de uma escala contínua a faixa,

intervalo interquartil e desvio padrão são usados para

relatar a propagação ou largura dos dados. Dados do intervalo

ou escalas de razão são descritas como dados contínuos e, portanto,

fornece variáveis contínuas porque os dados representam

um continuum subjacente onde há potencialmente um


número infinito de valores.

Distribuição de dados

Este artigo enfoca a metodologia estatística que pode

ser aplicado para definir descritivamente os dados. Esses métodos

são procedimentos numéricos ou técnicas gráficas, e. Barra

gráficos, histogramas, polígonos de frequência e gráficos de pizza, usados

para organizar, apresentar e descrever as características de

uma amostra, por exemplo eles fornecem um resumo das medidas do

características. As estatísticas descritivas procuram descrever o

ponto médio de uma distribuição de pontuações, chamada de medida de

tendência central, e a propagação das pontuações que é chamada

a dispersão, da qual a variância é um exemplo. 14 Para

para entender isso, é necessário considerar os níveis de

medição, porque certos testes (subsequentes) apenas

trabalhar com níveis apropriados de medição. Se as medições forem feitas de uma grande
amostra aleatória, por exemplo, do

peso de pacientes adultos com TC com contraste e

um polígono de frequência é traçado dos resultados, é provável

uma curva em forma de sino é produzida, o que mostra que o

as variáveis de uma amostra são normalmente distribuídas. Este sino

forma é chamada de distribuição normal ou Gaussiana (Veja

Figura 1). A palavra 'normal' aqui significa que os dados

está em conformidade com um padrão de distribuição que matematicamente

permite a aplicação de testes estatísticos paramétricos.

Uma medição hipotética de uma artéria de 100

pacientes, apresentados através de um histograma, com sino gaussiano

curva destacando o padrão de distribuição normal.

Na radiografia, a distribuição normal das medições pode

ser visto ao traçar os tamanhos e volumes de certos

estruturas anatômicas, como o globo ocular, nervo óptico ou como


mostrado na Figura 1, estruturas vasculares. De um modo geral,

as medidas para tais estruturas não diferem muito

entre pessoas. No entanto, muitas vezes uma distribuição normal não é

alcançou; outliers podem ser comuns, o que dará o tom

curve uma 'cauda' no lado esquerdo ou direito.

Os exemplos aqui seriam um histograma do peso dos pacientes,

onde a curva de distribuição seria inclinada para

um peso maior (a curva seria descrita como positiva

enviesado) e veja também a Figura 2.

Os mesmos dados representados nos histogramas de

A Figura 1 é resumida.

Se os dados não exibirem uma distribuição normal, para

exemplo, quando há alguns outliers, a apresentação de

os dados podem ser alterados para atingir uma distribuição normal. UMA

procedimento matemático comum para realizar é transformar dados logaritmicamente; não


muda o real

dados, mas da forma como são distribuídos em um gráfico e

assim, facilita a análise dos dados como se fossem normalmente distribuídos. Se a


normalização não for possível, testes não paramétricos apropriados devem ser aplicados aos
dados.

Os testes não paramétricos levam em consideração o fato de que o

os dados estão distorcidos ou têm vários outliers e são, portanto,

mais conservador. Os estatísticos Altman e Bland

ilustram esses pontos muito claramente em uma série de curtas

artigos que publicaram ao longo dos anos no

British Medical Journal.15e18

O desvio padrão é uma medida de como espalhar o

os dados são, a variação disso. Quanto mais restrito o padrão

desvio quanto mais próximo do ponto médio dos dados, todos os resultados

será. 17 Sem citar a fórmula matemática

por trás dele, o desvio padrão permite expressar


variância usando as mesmas unidades usadas para as observações ou medições. De um modo
geral, cerca de 2/3 de todas as observações ou medições estão dentro

um desvio padrão da média (o topo do gráfico de distribuição na Figura 1), e 95% estão dentro
de dois padrões

desvios da média. O intervalo interquartil é

tornando-se mais comum em relatórios de estatísticas descritivas de dados contínuos. Esta


estatística representa o

meio 50% da amostra mostrando sua dispersão, e não é

influenciada por outliers.18 A Tabela 1 contém exemplos de

desvio padrão para os dois conjuntos de dados de exemplo, bem como.

Figura 1 Exemplo de dados com distribuição normal.

Figura 2 Exemplos de dados com distribuição normal e enviesada. Estas são distribuições de
dados hipotéticos para 60 pacientes

em relação ao volume de um globo ocular com distribuição normal (A) e peso corporal com
distribuição enviesada negativamente (B),

respectivamente.

Você também pode gostar