Você está na página 1de 40

ESTATÍSTICA APLICADA À

EDUCAÇÃO

Análise Descritiva

Airlane P. Alencar - IME-USP


OBJETIVO

Informações
Dados
úteis

Tomada de Decisão

2
ESTATÍSTICA
Área da ciência que envolve desde a coleta de
dados até sua análise de modo a responder
aos objetivos do estudo.

3
FASES DE ESTUDO

Definir objetivos

Planejar o estudo e coletar dados

Definir população de interesse

Amostragem

Preparar planilha de dados

Resultados – Análise Estatística

Análise Descritiva: Descrever os dados

Análise Inferencial: Inferir sobre a população

4
TAREFAS
LEVINE et al. 2016. Capítulo 1.

Definir objetivo e variáveis para solucionar um
problema.

Coletar os dados correspondentes às referidas
variáveis a partir das fontes apropriadas.

Organizar os dados coletados por meio do
desenvolvimento de tabelas.

Visualizar os dados por meio do desenvolvimento
de gráficos.

Analisar os dados coletados de modo a tirar
conclusões e apresentar os referidos resultados.
5
ESTRUTURA DE RELATÓRIO

Título e Autores

Introdução com Objetivos

Metodologia: amostragem, fonte de dados

Métodos Estatísticos

Resultados

Discussão

Conclusão

Bibliografia
6
POPULAÇÃO E AMOSTRA
População: todos as unidades amostrais de
interesse
Amostra: subconjunto das unidades amostrais
Censo: pesquisa com todos os elementos
Amostragem:
probabilística: aleatória, estratificada,...
não probabilística: amostra não aleatória

7
USO DE MOCHILAS
Objetivo: Qual o tipo? Como usam a mochila?
Escoliose?
População de interesse: alunos de 7 a 11 anos
do ensino fundamental em escolas públicas
em São Paulo-SP
Sorteio escolas, classes, alunos
Meço peso das mochilas, escoliose...

8
ALEITAMENTO
Deve ficar bem clara a população de estudo.
Duarte, LS et al. Aleitamento materno e níveis de
hemoglobina em crianças menores de 2 anos em
município do estado de São Paulo, Brasil. Revista
de Nutrição, 2007, vol.20, n. 2.
OBJETIVO: Avaliar a relação entre aleitamento
materno e níveis de hemoglobina em crianças
menores de 2 anos residentes na cidade de Itupeva,
SP, Brasil.

9
BANCO DE DADOS
A fim de estudar o perfil das pessoas que
trabalham em certa empresa aplicamos um
questionário.
Variáveis: Salário, Sexo, Idade, Escolaridade,
Estado civil, ...

10
PLANILHA DE DADOS
Libre Calc
Gnumeric
Excel

Dados: Wooldridge. 1976 Current Population Survey.


11
TIPOS DE VARIÁVEIS

Quantitativas: numéricas

Discretas: número de filhos

Contínuas: nota, idade, renda,
concentração de glicose


Qualitativas ou categóricas

Ordinal: grau de instrução, dor forte,
moderada ou fraca, faixa etária

Nominal: sexo, estado civil, se tem
diabetes (s/n ou 1/0)
12
Análise Descritiva

Tabelas

Gráficos

Medidas resumos

Posição: Média, Mediana, Máximo

Variabilidade: Desvio Padrão, Amplitude

Associação: Correlação

13
VARIÁVEL QUALITATIVA
Tabela de frequências da Escolaridade
Escolaridade Frequência %
Fundamental 57 11%
Médio 257 49%
Superior 212 40%
Total 526 100%
Dados: Wooldridge. 1976 Current Population Survey.

Qual o gráfico?

14
ESCOLARIDADE
Gráfico de Setores,
57; Pizza
11%
212; Fundamental
40% Médio
257;
Superior
49%

Dados: Wooldridge. 1976 Current Population Survey.


15
ESCOLARIDADE SEGUNDO
GÊNERO
Fundamental Médio Superior Total

Feminino 23 142 87 252

Masculino 34 115 125 274

Total 57 257 212 526

Distribuição da Escolaridade segundo gênero


Fundamental Médio Superior Total

Feminino 9% 56% 35% 100%

Masculino 12% 42% 46% 100%

Total 11% 49% 40% 100%


16
ESCOLARIDADE SEGUNDO GÊNERO
Feminino Masculino Gráfico de Setores,
23; 9% Pizza
34;
87;
12%
35% 125;
46% 115;
142; 42%
56%

Dados: Wooldridge. 1976 Current Population Survey.


17
ESCOLARIDADE SEGUNDO GÊNERO

46% Gráfico de Barras


Masculino 42%
12%
35%
Feminino 56%
9%
0% 10% 20% 30% 40% 50% 60%
Fundamental Médio Superior

Dados: Wooldridge. 1976 Current Population Survey.


18
ESCOLARIDADE SEGUNDO GÊNERO
Gráfico de
Masculino 12% 42% 46% Barras
empilhadas
Feminino 9% 56% 35%

0% 20% 40% 60% 80% 100%


Superior Médio Fundamental

Dados: Wooldridge. 1976 Current Population Survey.


19
ESCOLARIDADE SEGUNDO GÊNERO
100%
Gráfico de
80% 35% 46% Colunas
60% empilhadas
40% 56% 42%
20%
0% 9% 12%
Feminino Masculino
Superior Médio Fundamental

Dados: Wooldridge. 1976 Current Population Survey.


20
AO LONGO DO TEMPO

Fonte: MC/Inep/Deed: Portal INEP


21
AO LONGO DO TEMPO
Temperatura média mensal na cidade de São Paulo

Fonte: INPE. Alencar 2020 SN Applied Sciences.


https://doi.org/10.1007/s42452-020-03819-3
22
VARIÁVEIS QUANTITATIVAS

Fazemos também tabelas de frequências para:


Variáveis com poucos valores possíveis:
número de linhas de celular por pessoa ou
número de filhos
Variáveis categorizadas como faixa etária

23
MEDIDAS DESCRITIVAS
Variáveis Quantitativas
 Posição:

 Média, Mediana, Máximo

 Variabilidade:

 Desvio Padrão, Amplitude

24
MÉDIA
Número de anos de estudo de n=7 funcionários
2 22 2 44 7 9 15
x1, x2, x3, x4, x5, x6, x7
Média Aritmética
n
∑ xi
i=1 x 1 +...+ x 7 2+...+15
x̄= = = =14,4
n 7 7
Esses funcionários têm, em média, 14,4 anos
de estudo.
Obs: Afetada por valores extremos. 25
MEDIANA
Número de anos de estudo de 7 funcionários
2 22 2 44 7 9 15
x1, x2, x3, x4, x5, x6, x7
A mediana é o valor central dos dados
ordenados. 2 2 7 9 15 22 44
Esses funcionários têm tempo mediano de 9
anos de estudo. Metade tem menos que 9 anos.
Obs: Pouco afetada por valores extremos.
Obs (n+1)/2, se n for ímpar
26
MEDIANA
Número de anos de estudo de 6 funcionários
2 22 2 44 7 9
x1, x2, x3, x4, x5, x6
A mediana é central dos dados ordenados.
2 2 7 9 22 44
Média de 7 e 9 = (7+9)/2= 8
Esses funcionários têm tempo mediano de 8
anos de estudo, ou seja, metade dos
funcionários possuem menos que 8 anos de
estudo.
27
MODA
Número de anos de estudo de 6 funcionários
2 22 2 44 7 9

A moda é o valor que mais se repete.

A moda é igual a 2 pois o valor 2 se repete mais


vezes.
Os dados podem ter mais que uma moda.

28
MEDIDAS DE DISPERSÃO
Medem a variabilidade:
Amplitude = Máximo – Mínimo
Número de anos de estudo de 7 funcionários
2 22 2 44 7 9 15
Amplitude= 44 – 2= 42
A amplitude é de 42 anos de estudo.
Outro exemplo é a amplitude térmica de 10
graus (15 a 25 graus).
29
VARIÂNCIA AMOSTRAL
2 22 2 44 7 9 15
Medem a variabilidade com relação à média
Variância =
7 2
∑ x −
( i )x̄
2 i=1 ( 2 − 14,4 )2 +...+ ( 15 −14,4 )2
s= = =220,95
n−1 6
Desvio padrão amostral = raiz de s2
s= √ s 2= √ 220,95=14,8

30
HISTOGRAMA
Gráfico para avaliar a distribuição de variável
quantitativa.
Ideia: Definir faixas e construir tabela de
frequências. Depois construir gráfico de
colunas grudadas.

Wooldridge: O salário em milhares dólares dos


526 empregados varia de 0,5 a 25,0.

31
HISTOGRAMA DO SALÁRIO

Início do 0 2 4 6 8 10 12 14 16 18 20 22 24
intervalo
Frequência 12 198 129 81 54 16 15 6 4 6 2 2 1

32
HISTOGRAMA DO NÚMERO DE ANOS DE
ESTUDO

Dados: Wooldridge. 1976 Current Population Survey.


33
HISTOGRAMA DO NÚMERO DE ANOS DE
ESTUDO - DENSIDADE

Dados: Wooldridge. 1976 Current Population Survey.


34
QUARTIS
2 2 7 9 15 22 44
Mediana = 2o Quartil = Quantil 50% = 9
Aprox.50% das obs. são menores que 9.

1o Quartil= Quantil 25%= 4,5


Posição 7*(1/4)=1,75 => média entre 2 e 7.

3o Quartil= Quantil 75%= 18,5


Posição 7*(3/4)=5,25 => média entre 15 e 22.
35
HISTOGRAMA DO SALÁRIO

Início do 0 2 4 6 8 10 12 14 16 18 20 22 24
intervalo
Frequência 12 198 129 81 54 16 15 6 4 6 2 2 1

36
QUARTIS E BOXPLOTS DOS SALÁRIOS
observações extremas ou outliers
Máximo = 24,98(y) Q3 +1.5* (Q3-Q1)
maior valor
3o Quartil = 6,88
Mediana = 4,65 Q3
1o Quartil = 3,33 Q2 (mediana)
Q1
Mínimo = 0,53
menor valor

Q1 -1.5* (Q3-Q1)

37
BOXPLOT DOS SALÁRIOS
Máximo = 24,98
3o Quartil = 6,88
Mediana = 4,65
1o Quartil = 3,33
Mínimo = 0,53

38
BOXPLOT DOS SALÁRIOS
SEGUNDO O SEXO

39
BIBLIOGRAFIA
BUSSAB e MORETTIN. Estatística Básica. 9a edição,
Saraiva, 2017.
LEVINE et al. 2016. Estatística: teoria e aplicações
com excel. (Amostragem em seção 1.4)
FÁVERO e BELFIORI. Manual de análise de dados.
2017.
Muito sobre amostragem em cap. 6.
R software. http://www.r-project.org/
Dados de WOOLDRIDGE. Introdução à econometria
básica.
40

Você também pode gostar