Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística Descritiva
INTRODUÇÃO
❑ Geralmente a quantidade de informação é grande, assim fica
difícil captar, intuitivamente, as informações que os dados
contêm;
População
Amostra
Inferência Estatística
População e Amostra
População
Amostra
Inferência Estatística:
• Estimação de quantidades desconhecidas
• Extrapolação dos resultados
• Teste de hipóteses
Classificação das Variáveis
Classificação das Variáveis
Variáveis Quantitativas
Continua – assume valores em um intervalo do conjunto dos Reais.
Resulta normalmente de mensurações.
Essenciais Complementares
❑ Título
❑ Corpo da tabela
❑ Fonte
❑ Notas
❑ Cabeçalho
❑ Chamadas
❑ Coluna Indicadora
Tabela
Tabela
❑ Algumas observações:
❑ Dados Brutos
0, 2 ,3, 7, 0, 2, 1, 3, 3, 2,
5, 6, 3, 2, 2, 0, 3, 1, 4, 3,
7, 6, 2, 1, 2 ,3 ,2, 4, 3, 5, 6
❑ Ordenando (ROL)
0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 2,
2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3,
4, 4, 5, 5, 6, 6, 6, 7, 7
Tabela
Tabela
Gráficos
❑ Os mesmos elementos essenciais e complementares utilizados na
tabela devem ser usados para os gráficos.
❑Veremos alguns tipos de gráficos:
❑ Colunas ❑ Pictogramas
❑ Colunas agrupadas
Gráfico de Linha
Gráfico de Linha
Gráfico de Barras
Gráfico de Coluna
Gráfico de Barras e Colunas Agrupadas
Gráfico de Colunas Sobrepostas
Gráfico de Pizza
Histograma
Gráfico Pictorial - Pictograma
Pictograma
Pictograma
Pictograma
Pictograma
❑ Dados Brutos
0, 2 ,3, 7, 0, 2, 1, 3, 3, 2,
5, 6, 3, 2, 2, 0, 3, 1, 4, 3,
7, 6, 2, 1, 2 ,3 ,2, 4, 3, 5, 6
❑ Ordenando (ROL)
0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 2,
2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3,
4, 4, 5, 5, 6, 6, 6, 7, 7
Frequência
❑Frequência Absoluta Simples (fi): é o número de vezes em que
um elemento se repete na amostra.
i Classe fi
1 Ruim 12
2 Médio 27
3 Bom 15
4 Ótimo 6
Total 60
Frequência
❑ Frequência Relativa (fri): expressa a proporção de elementos na
classe i, ou seja
fri = fi/n
sendo n o total de elementos da amostra.
fr1 = f1/n = 12/60 = 0,20
i Classe fi fri
1 Ruim 12 0,20
2 Médio 27 0,45
3 Bom 15 0,25
4 Ótimo 6 0,10
Total 60 1
Frequência
❑ Frequência Absoluta Acumulada (fai): é o número de elementos
acumulados até a classe i
150 1
151 1
152 1 Total de pontos (acertos) obtidos em
153 1
154 1 um teste de 175 questões por 40 alunos
155 4
156 3 Total de pontos Freqüência
157 1
150 |- 154 4
158
160
2
5
A apresentação
161 4 154 |- 158 9
162 2 ideal seria
163 2 158 |- 162 11
164 3 assim
165 1
162 |- 166 8
166 1
167 1
166 |- 170 5
168 2 170 |- 174 3
169 1
170 1 Total 40
172 1
173 1
total 40
Tabela com Intervalo de Classe
1. Ordenar os dados, ou seja, colocar os dados brutos em rol
2. Determinar o número de classes (k) da tabela.
3. Classes de frequência: são os intervalos de variação da variável,
representados por i, sendo i = 1,2,3,4,...,k, onde k é o número
total de classes.
❑ De modo geral, este valor não deverá ser inferior a 5 e nem
superior a 15.
❑ Existem dois métodos:
❑
Tabela com Intervalo de Classe
1. Voltando ao exemplo teremos:
e
❑
Ou seja k = 6 classes
Tabela com Intervalo de Classe
2. Determinar a amplitude do intervalo h
❑ No próximo passo teremos que determinar a amplitude
total (At)
❑ At = Ls – Li
onde Ls é o maior valor da amostra e Li o menor valor da
amostra
❑ Com a amplitude total podemos calcular a amplitude do
intervalo (h)
❑ h = At/k
Tabela com Intervalo de Classe
Do exemplo teremos que:
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
σ𝑛𝑖=1 𝑥𝑖 σ𝑛𝑖=1 𝑥𝑖 . 𝑝𝑖
𝑥ҧ = 𝑥ҧ = 𝑛
𝑛 σ𝑖=1 𝑝𝑖
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 𝑥1 . 𝑝1 + 𝑥2 . 𝑝2 + ⋯ + 𝑥𝑛. 𝑝𝑛
𝑥ҧ = 𝑥ҧ =
𝑛 𝑝1 + 𝑝2 + ⋯ + 𝑝𝑛
23,0 + 20,0 + 22,0 + 19,0 + 25,0 + 28,2 + 24,0 + 21,0 + 27,0 + 21,0
𝑥ҧ =
10
230
𝑥ҧ = = 23,0
10
EXEMPLO MÉDIA ARITMÉTICA SIMPLES
• Lembrando que a amostra se trata de pesos (em kg) de 10 crianças de 5 anos de idade
• Sendo assim o valor encontrado de 23,0 é interpretado como a média de peso dessas
crianças, ou seja, o peso médio dessas crianças é de 23,0 kg
• Quando estamos calculando o valor da média temos sempre que ter em foco a
variável de estudo, pois o resultado deve ser interpretado
𝑥ҧ =
0.3+1.2+2.4+3.2+4.1+5.1
13
𝑥 = 25
ഥ 13
= 1,923 ≈ 2
• Lembrando que para calcular o ponto médio será a soma dos limites dividido
por 2, ou seja, o ponto médio da primeira linha será (15+25)/2 que será 20
EXEMPLO MÉDIA ARITMÉTICA PONDERADA
• Considere o número de pessoas com HIV, segundo a faixa etária
𝑛+1
𝐸𝑚𝑑 =
2
12 15 17 18 19 20 21
EXEMPLO MEDIANA NÚMERO ÍMPAR
Audiência registrada pela emissora
12 15 17 18 19 20 21
Após ordenar devemos localizar a media através do cálculo:𝐸𝑚𝑑 = 𝑛+1
2
7+1 8
𝐸𝑚𝑑 = = =4
2 2
• Ou seja a mediana está localizada na posição de número 4
12 15 17 18 19 20 21
𝑛 𝑛
𝐸𝑚𝑑 = e 𝐸𝑚𝑑 = +1
2 2
15 10 12 20 14 13 18 14 15 19
10 12 13 14 14 15 15 18 19 20
EXEMPLO MEDIANA NÚMERO PAR
Quantidade de picolés vendida em dez dias
10 12 13 14 14 15 15 18 19 20 20
𝑛
𝐸𝑚𝑑 =
2
𝐸𝑚𝑑 − 𝐹𝑎𝑛𝑡
𝑀𝑑 = 𝑙 + .ℎ
𝑓𝑚𝑑
EXEMPLO MEDIANA PARA INTERVALO DE CLASSE
• Considere o número de pessoas com HIV, segundo a faixa etária
80
• Primeiro encontrar o elemento mediano 𝐸𝑚𝑑 = = 40, com o elemento mediano vamos
2
localizar na tabela a classe da mediana
• A localização é feita da mesma forma em que é realizada na tabela sem intervalo de classe,
sendo assim a 40ª posição se encontra na segunda classe
EXEMPLO MEDIANA PARA INTERVALO DE CLASSE
Como a moda leva em consideração a maior frequência, temos que a moda desses
dados é de 2⁰ C
MODA PARA INTERVALO DE CLASSE
• Determinação da Moda de Valores tabulados com intervalo de classe
• Para dados agrupados em tabelas com intervalo de classe, calcularemos
através da seguinte expressão:
f mo - f ant
Mo = l + .h
2f mo - (f an + f post )
Onde
• l = limite inferior da classe modal
• fmo = frequência simples da classe modal
• fant = frequência simples da classe anterior à da classe modal
• fpost = frequência simples da classe posterior à da classe modal
• h = amplitude da classe modal
EXEMPLO MODA PARA INTERVALO DE CLASSE
• Como a moda é determina pela expressão apresentada no slide anterior, temos que
determinar primeiro a classe da moda, que considera a maior frequência
σ𝑛 2
2
(𝑥
𝑖=1 𝑖 − 𝑥)
ҧ
𝑠 =
𝑛−1
EXEMPLO DE VARIÂNCIA
Se realizarmos a soma dos 𝑑𝑖𝑠 temos que essa some será
• dados não agrupados sempre zero, por isso devemos elevar ao quadrado, ou
seja, (𝑥𝑖 − 𝑥)ҧ 2
Considere o conjunto de dados A = 10, 12, 13, 20, 25,
34, 45 (𝑑1 )2 = (−12,714)2 = 161,643
• A média dos dados é de 22,71 (𝑑2 )2 = (−10,714)2 = 114,790
• Para saber a variância teremos que saber os desvios (𝑑3 )2 = (−9,714)2 = 94,362
𝑑𝑖 dosdados em relação a média, ou seja, 𝑥𝑖 − 𝑥.ҧ (𝑑4 )2 = (−2,714)2 = 7,366
𝑑1 = 10 − 22,71 = -12,714 (𝑑5 )2 = (2,286)2 = 5,226
𝑑2 = 12 − 22,71 = -10,714 (𝑑6 )2 = (11,286)2 = 127,374
𝑑3 = 13 − 22,71 = -9,714 (𝑑7 )2 = (22,286)2 = 496,666
𝑑4 = 20 − 22,71 = -2,714 Somando esses valores teremos, σ𝑛𝑖=1(𝑥𝑖 − 𝑥)ҧ 2 = 1.007,43
𝑑5 = 25 − 22,71 = 2,286 Assim,
𝑑6 = 34 − 22,71 = 11,286
𝑛 2
𝑑7 = 45 − 22,71 = 22,286 σ𝑖=1(𝑥𝑖 − 𝑥)
ҧ 1.007,43
𝑠2 = = = 167,905
𝑛 6
EXEMPLO DE VARIÂNCIA
• Outra maneira de calcular a variância para o conjunto de dados A = 10, 12, 13, 20, 25, 34 e 45, seria aplicando direto
na fórmula, considerando a média de 22,71
Lembrando que todas as vezes que calculamos a variância elevamos os valores ao quadrado, sendo assim, a medida de
variação não estará na mesma unidade em estudo, por isso, o desvio padrão é mais utilizado para uma interpretação
direta.
VARIÂNCIA
• Fórmula da variância para dados agrupados
σ𝑛 2𝑓
2
(𝑥
𝑖=1 𝑖 − 𝑥)
ҧ 𝑖
𝑠 =
𝑛−1
EXEMPLO DE VARIÂNCIA
• Dados agrupados em tabelas
• A variância é calculada da mesma maneira para tabelas com e sem intervalo de classes
Considere o consumo de energia elétrica em Kwh apresentado na tabela
σ𝑛 2𝑓
2 = 𝑖=1(𝑥𝑖 − 𝑥)
ҧ 𝑖 80.780
Assim, o cálculo da variância será dada por: 𝑠 = = 1.022,53
𝑛−1 79
Outra maneira de calcular é:
15 − 79,5 2 . 4 + 35 − 79,5 2 . 6 + 55 − 79,5 2 . 14 + 75 − 79,5 2 . 26 + 95 − 79,5 2 . 14 + 115 − 79,5 2 . 8 + 135 − 79,5 2 . 6 + 155 − 79,5 2 . 2
𝑠2 = = 1.022,53
79
DESVIO PADRÃO
• Visam descrever os dados no sentido de informar o grau de dispersão
ou afastamento dos valores observados em torno de um valor central
(média).
• Simbologia:
σ = população
S = amostra
• É uma das medidas mais úteis da variação de um grupo de dados.
• A vantagem do desvio padrão sobre a variância, é que este permite uma
interpretação direta da variação do grupo, pois o mesmo é expresso na
mesma unidade de medida em que estão expressas as variáveis
amostradas.
DESVIO PADRÃO
• O desvio padrão é a raiz quadrada da variância
• Para determinar o desvio padrão passa primeiramente pelo cálculo da
variância
• Depois de calculada a variância devemos tirar a raiz quadrada, assim
teremos o desvio padrão
Dados não agrupados Dados agrupados em tabelas
com e sem intervalo de classe
σ𝑛𝑖=1(𝑥𝑖 − 𝑥)ҧ 2 σ𝑛𝑖=1(𝑥𝑖 − 𝑥)ҧ 2 𝑓𝑖
𝑠= 𝑠=
𝑛−1 𝑛−1
DESVIO PADRÃO
• Comparação do desvio padrão
Amostra A Amostra B Amostra C
Média =15,5 Média =15,5 Média =15,5
s = 3,338 s = 0,9258 s = 4,57