Você está na página 1de 21

Estatística Descritiva

Prof. Tiago Dias

Classificação de variáveis
Distribuição de frequências
Variáveis qualitativas
A cada característica observável que desejamos obter dados é
atribuída uma variável (perguntas em questionário, grandezas a
serem medidas), podendo esta ser classificada da seguinte
maneira:
• Qualitativa: nomes ou rótulos. Subdividida em:
– Nominais: não podem ser elencados em ordem específica.
• Exemplos: SIM/NÃO, BRANCO/NEGRO/PARDO.
– Ordinais: possuem uma gradação natural:
• Exemplos: ÓTIMO/BOM/REGULAR/RUIM, conceitos em geral, escala Likert.
Variáveis quantitativas
• Quantitativa: números representando contagens ou medidas.
Subdivida em:
– Variável discreta: assume valores enumeráveis, ou seja, pertencentes,
em geral, ao conjunto dos números inteiros, ou em bijeção com ele.
• Exemplos: DIAS, PESSOAS, RESIDÊNCIAS.
– Variável contínua: assume valores pertencentes ao conjunto dos
números reais.
• Exemplos: ALTURA, PESO, SALÁRIO.
Vamos classificar algumas variáveis?
Questionário de ESB aplicado em 2021/2
Cidade de Onde cursou Escolarização
Cidade de Peso atual Altura (em
Gênero Curso Idade residência o ensino máxima
nascimento (em kg) metros)
atual médio? completa

Número de Qual nota Você foi De 1 a 5,


pessoas que Renda total você obteve reprovado em Já cursou a como você
moram em Número de em sua Número da na disciplina alguma disciplina de classifica até
Religião
sua irmãos residência sorte Fundamentos disciplina no Estatística agora sua
residência (em R$) de semestre Básica? experiência
atual Matemática? anterior? com o ERE?
Questionário de ESB aplicado em 2021/2
Cidade de Onde cursou Escolarização
Cidade de Peso atual Altura (em
Gênero Curso Idade residência o ensino máxima
nascimento (em kg) metros)
atual médio? completa

Qualitativa Qualitativa Quantitativa Qualitativa Qualitativa Qualitativa Qualitativa Quantitativa Quantitativa


Nominal Nominal Contínua Nominal Nominal Nominal Ordinal Contínua Contínua

Número de Qual nota Você foi De 1 a 5,


pessoas que Renda total você obteve reprovado em Já cursou a como você
moram em Número de em sua Número da na disciplina alguma disciplina de classifica até
Religião
sua irmãos residência sorte Fundamentos disciplina no Estatística agora sua
residência (em R$) de semestre Básica? experiência
atual Matemática? anterior? com o ERE?
Quantitativa Quantitativa Quantitativa Qualitativa Qualitativa Quantitativa Qualitativa Qualitativa Qualitativa
Discreta Discreta Contínua Nominal Nominal Contínua Nominal Nominal Ordinal
O que fazer após coleta dos dados?

• Limpeza (pré-processamento);
• Organização;
• Tabelas;
• Gráficos;
• Medidas de resumo: posição e dispersão;
• Outras estatísticas: distribuição, simetria, curtose, entre
outros.
ESTATÍSTICA DESCRITIVA
Limpeza
• Dados inconsistentes;
• Dados duplicados;
• Formatação inadequada;
• Agrupar ou desagrupar variáveis.
Organização dos dados
• Dados brutos: dados tal qual coletados, sem qualquer
tratamento ou apresentação.
• Rol: organização dos dados em alguma ordem, podendo ser,
crescente ou decrescente. Não usada em variáveis qualitativas
nominais.
• Distribuição de frequências (tabela): registra a quantidade de
ocorrências cada valor da variável em questão. Em geral,
apresentada em forma de tabela.
Tipos de frequência
• Frequência absoluta (𝐹𝑖 ): representa o número de vezes que
determinado valor da variável (𝑥𝑖 ) aparece nos dados.
• Frequência relativa (𝑓𝑖 ): obtida pela divisão da frequência
absoluta pelo tamanho da amostra n. Esta pode ser
apresentada em representação decimal ou percentual.
• Frequência acumulada (𝐹𝑎𝑐 ): indica a soma da frequência
absoluta (ou relativa) de determinado 𝑥𝑖 com as frequências
absolutas (ou relativas) de todos os valores de 𝑥 tais que
𝑥 < 𝑥𝑖 . Não usada em variáveis qualitativas nominais.
Tipos de agrupamentos
• Dados não agrupados (pontual): quando os valores da variável
aparecem individualmente na distribuição de frequências;
– Usado para variáveis qualitativas e quantitativas discretas (poucos
valores).
• Dados agrupados (intervalar): quando os valores da variável
são registrados através de intervalos na distribuição de
frequências.
– Usado para variáveis quantitativas discretas (muito valores) e
quantitativas contínuas.
Construindo uma tabela
• Regra ouro: use o bom senso;
• Evite tabelas muito extensas, quando possível;
• Apresente os dados de forma clara e objetiva;
• Fique atento a formatação exigida pelo meio de divulgação:
“A informação central de uma tabela é o dado numérico. Todos os outros elementos que a
compõem têm a função de complementá-la e explicá-la. Com relação a formatação, a tabela
apresenta os seguintes elementos: título, cabeçalho, conteúdo, fonte e, se necessário, nota(s)
explicativa(s) (geral e/ou específica). É dividida por o mínimo possível de linhas na horizontal e as
bordas laterais não podem ser fechadas” (Norma tabular da ABNT).
Roteiro para tabela de dados agrupados

1. Determine o número de intervalos (classes) pela fórmula de Sturges:


𝑘 = 1 + 3,322 log 𝑛
Arredonde para o número inteiro imediatamente superior.

2. Calcule a amplitude total da amostra (range):


𝑅 = 𝑣𝑎𝑙𝑜𝑟 max − 𝑣𝑎𝑙𝑜𝑟 𝑚𝑖𝑛

3. Calcule a amplitude do intervalo:


𝑅
h=
𝑘
Arredonde para o número inteiro imediatamente superior.
EXEMPLOS
Dados brutos
Considere as respostas de um questionário aplicado a estudantes do IFMG em relação
à variável GÊNERO:
Tabela 1 – Dados brutos de Gênero – IFMG 2022
Feminino Feminino Masculino Masculino Feminino Masculino Feminino Masculino
Feminino Masculino Feminino Masculino Masculino Masculino Masculino Masculino
Feminino Feminino Feminino Masculino Feminino Masculino Feminino Feminino
Feminino Masculino Feminino Feminino Masculino Feminino Feminino Masculino
Feminino Feminino Feminino Feminino Feminino Masculino Feminino Masculino
Feminino Feminino Feminino Masculino Feminino Masculino Feminino Feminino
Masculino Feminino Masculino Masculino Feminino Masculino Masculino
Feminino Feminino Masculino Masculino Feminino Feminino Feminino
Feminino Feminino Masculino Feminino Feminino Feminino Masculino
Masculino Feminino Feminino Masculino Masculino Feminino Feminino

Fonte: base de dados do professor


Tabela (ou distribuição) de frequências

Tabela 2 – Distribuição de frequências de Gênero – IFMG 2022


Classes Freq. Absoluta – Fi Freq. Relativa – fi
Feminino 45 59%
Masculino 31 41%
Total 76 100%
Fonte: base de dados do professor
Dados brutos
Considere agora as respostas do mesmo questionário aplicado a estudantes do IFMG
em relação à variável IDADE:
Tabela 3 – Dados brutos de Idade– IFMG 2022
23 22 21 20 21 21 21 23
19 30 20 25 23 24 19 28
19 19 23 20 21 23 19 25
21 41 21 24 19 25 19 19
25 21 19 27 19 19 23 28
20 21 21 19 18 23 19 19
23 21 22 33 23 25 21
20 23 anos 21 19 20 20 23
21 22 19 19 22 20 21
24 20 21 22 26 23 19
Fonte: base de dados do professor
Rol
Tabela 4 – Rol das Idades – IFMG 2022
18 19 19 19 19 19 19 19 19 19
19 19 19 19 19 19 19 19 19 20
20 20 20 20 20 20 20 20 21 21
21 21 21 21 21 21 21 21 21 21
21 21 21 21 22 22 22 22 22 23
23 23 23 23 23 23 23 23 23 23
23 24 24 24 25 25 25 25 25 26
27 28 28 30 33 41
Fonte: base de dados do professor
Obtendo os intervalos (classes)
1) Número de intervalos (fórmula de Sturges):
𝑘 = 1 + 3,322 log 76 ≅ 7,25 (𝑎𝑑𝑜𝑡𝑒 𝑘 = 8)
2) Amplitude total da amostra:
𝑅 = 41 − 18 = 23
3) Amplitude de cada intervalo:
23
ℎ= = 2,88 (𝑎𝑑𝑜𝑡𝑒 ℎ = 3)
8
Limite inferior do primeiro intervalo: 18
Tabela (ou distribuição) de frequências
Tabela 5 – Distribuição de frequências de Gênero – IFMG 2022
Classes Freq. Absoluta Freq. Relativa Freq. Acumulada
18-20 28 37% 28
21-23 33 43% 61
24-26 9 12% 70
27-29 3 4% 73
30-32 1 1% 74
33-35 1 1% 75
39-41 1 1% 76
Total Geral 76 100%
Fonte: base de dados do professor

Você também pode gostar