Você está na página 1de 81

Universidade Federal de Sergipe

Departamento de Estatística e Ciências Atuariais

Disciplina: Estatística Aplicada a Química


Estatística Descritiva – Conceitos iniciais

Profa. Dra. Evelyn Souza Chagas Oliveira


evelynschagas@hotmail.com
OBJETIVOS
 Propor experiências de aprendizagem que propiciem ao aluno
familiarizar-se com os conhecimentos estatísticos fundamentais para
análise, interpretação e solução de problemas do cotidiano.

OUTRAS INFORMAÇÕES

 Encaminhamento Metodológico: Expositiva teórica e prática;

 Recursos Didáticos: Computador e quadro branco.

 Avaliação: Exercícios e prova (3).


CONTEÚDO

1. Estatística Descritiva
1.1. As fases do trabalho estatístico;
1.2. Classificação dos dados;
1.3. Séries estatísticas e sua representação tabular e gráfica;
1.4. Distribuição de frequência simples e em classe e sua representação gráfica;
1.5. Medidas de Posição: Média, Mediana e Moda;
1.6. Medidas de Dispersão: Variância, Desvio-padrão, coeficiente de variação.
CONTEÚDO

2. Probabilidade
2.1. Noções de conjuntos;
2.2. Conceitos de probabilidade: Experimento aleatório, espaço amostral e
eventos;
2.3. Eventos independentes;
2.4. Probabilidade condicional e Teorema de Bayes;
2.5. Variáveis aleatórias;
2.6. Esperança matemática, variância e desvio-padrão;
2.7. Distribuições discretas: Bernoulli, Binomial, Geométrica e Poisson;
2.8. Distribuições contínuas: Uniforme, Exponencial e Normal.
CONTEÚDO

3. Inferência
3.1. Noções de Amostragem;
3.2. Conceitos iniciais de inferência;
3.3. Distribuição da média e da proporção;
3.4. Intervalo de confiança para média e proporção;
3.5. Testes de hipóteses para média e proporção.
CONTEÚDO

4. Correlação e Regressão linear


4.1. Tipos de correlação;
4.2. Correlação linear de Pearson;
4.3. Regressão linear simples;
4.4. Estimativa de parâmetros e interpretação.
REFERÊNCIAS BIBLIOGRÁFICAS

Título: Estatística Básica. Autores: MORETTIN, P. A.; BUSSAB, W. de


O. 6a ed rev. e atual. São Paulo: Saraiva, 2010.

Título: Estatística Básica: probabilidade e inferência. Autor:


MORETTIN, L. G. São Paulo: Pearson, 2010.

Título: Probabilidade. Aplicações a Estatística. Autor: MEYER, P. L.


Livros Técn. Científicos, 1972.

Título: Noções de Probabilidade e Estatística. Autor: MAGALHÃES, M.


N.; LIMA, A. C. P. de. 7. ed. Atual. São Paulo, SP:EDUSP, 2010.

Título: Estatística Básica. Autor: VIEIRA, S. São Paulo: Cengage


Learning, 2012.
MOTIVAÇÃO DO ESTUDO

Por que utilizar


O que é estatística?
estatística?

Definição: É um conjunto de técnicas que permite, de forma


sistemática, coletar, organizar, descrever, analisar e interpretar dados
oriundos de estudos ou experimentos, realizados em qualquer área
do conhecimento.
Dados: um ou mais conjuntos de valores, sejam eles numéricos ou não.

Aplicações

Áreas da estatística
 Estatística Descritiva – conjunto de técnicas destinadas a descrever e
resumir dados, a fim de que possamos tirar conclusões a respeito de
características de interesse.
 Probabilidade – a teoria matemática utilizada para se estudar a incerteza
oriunda de fenômenos de caráter aleatório.

 Inferência Estatística – é o estudo de técnicas que possibilitam a


extrapolação, a um grande conjunto de dados, das informações e
conclusões obtidas a partir de subconjuntos de valores, de dimensão menor.
Etapas da análise estatística

Estatística descritiva
• Consistência dos dados
• Interpretações iniciais
População

Amostra

Via probabilidade
Inferência Estatística
• Estimação de quantidades desconhecidas
• Extrapolação dos resultados
• Testes de hipóteses
População: é o conjunto de todos os elementos (pessoas, animais, plantas,
objetos) que têm pelo menos uma característica de interesse comum.

finitas infinitas

tamanho da população conhecido tamanho da população desconhecido


• Eleitores de Aracaju • Conjunto de pesagens de
• Nascimento de crianças determinado corpo sólido
em um dia em Aracaju • consumidores de uma
determinada marca

Amostra: é qualquer subconjunto não-vazio de uma população.


Fases do trabalho estatístico

Definição do problema

Planejamento da pesquisa

direta
Coleta de dados
indireta

Crítica dos dados

Apuração dos dados

tabular
Apresentação dos dados
gráfica

Análise e interpretação dos dados


Classificação e Organização de dados
Variável – são características que mudam de valor para cada elemento
observado. Ex.: sexo, idade, altura.

Tipos de variáveis

Qualitativa Quantitativa

Nominal Ordinal Discreta Contínua

• Cor • Escolaridade • Idade • Peso


• raça • Nº de pipetas • Temperatura
A questão inicial é: Dado um conjunto de dados, como tratar os
valores numéricos ou não, a fim de extrair informações a respeito
de uma ou mais características de interesse?

Apresentação tabular

Tabela 1 – População residente no Brasil, segundo o


sexo, de acordo com o censo demográfico de 2000.
Sexo População residente
Feminino 83.576.015
Masculino 86.223.155
Total 169.799.170
Fonte: IBGE (2003)
Apresentação Gráfica
Séries estatísticas

É toda tabela que apresenta a distribuição de um conjunto de dados


estatísticos em função da época, local e fato observado

• Série temporal ou cronológica – quando a variável é o tempo,


permanecendo fixo o local e o fato observado.

Tabela 2 – Alunos matriculados nos cursos de


graduação da universidade A
Ano Alunos matriculados
2014 16300
2015 16500
2016 17837
2017 19200
Fonte: Dados hipotéticos.
• Série geográfica ou territorial – quando a variável é o local,
permanecendo fixo o tempo e o fato observado.

Tabela 3 – Alunos matriculados nas unidades do interior


nos cursos de graduação da universidade A – 2017.
Cidades Alunos matriculados
Cidade A 650
Cidade B 1.805
Cidade C 720
Fonte: Dados hipotéticos.

• Série específica ou categórica – quando a variável é o fato


observado, permanecendo fixo o tempo e o local.

Tabela 4 – Alunos matriculados na universidade A – 2017.


Alunos Alunos matriculados
Graduação 750
Pós-graduação 1.305
Fonte: Dados hipotéticos.
• Distribuição de frequência ou Série de Frequência – quando
permanece fixo tempo, o local e o fato observado. Podem ser
construídas por valores e intervalos de valores.

Tabela 5 – Distribuição de frequência da estatura de 40


alunos de uma universidade A no ano de 2017.
Classes Frequência
150 154 5
154 158 10
158 162 12
162 166 20
166 170 7
170 174 4
Fonte: Dados hipotéticos.
Distribuição de frequência
 É uma maneira de se dispor um conjunto de realizações,
para se ter uma ideia global sobre o comportamento da
variável de interesse, ou seja, da sua distribuição.

 A construção da distribuição de frequências exige que os


possíveis valores da variável sejam discriminados e seja
contado o número de vezes em que cada valor ocorreu no
conjunto de dados.
Exemplos (Tabelas)

Tabela 6 – Concentrações de íon cloreto 𝐶𝑙 , 𝑚𝑔/𝐿, medidos na água tratada em


dois municípios de Sergipe.
Observação 𝐶𝑙 Município Observação 𝐶𝑙 Município Observação 𝐶𝑙 Município
1 246 Boquim 15 262 Boquim 29 264 Boquim
2 254 Arauá 16 257 Boquim 30 264 Boquim
3 250 Arauá 17 254 Arauá 31 259 Boquim
4 269 Arauá 18 269 Arauá 32 268 Boquim
5 256 Boquim 19 260 Boquim 33 264 Boquim
6 261 Boquim 20 250 Boquim 34 261 Boquim
7 252 Arauá 21 265 Boquim 35 263 Boquim
8 261 Boquim 22 260 Boquim 36 256 Arauá
9 261 Boquim 23 269 Boquim 37 250 Arauá
10 255 Arauá 24 256 Arauá 38 246 Boquim
11 250 Arauá 25 267 Arauá 39 269 Arauá
12 263 Boquim 26 255 Arauá 40 258 Arauá
13 260 Boquim 27 269 Arauá 41 260 Arauá
14 265 Boquim 28 258 Boquim 42 269 Arauá
Apresentação para variáveis qualitativas

Exemplo:

Tabela 7 - Distribuição de frequência, por município, das


42 coletas de água tratada no município de Sergipe, para
avaliação de concentrações de íon cloreto , .
Municípios Frequência
Boquim 24
Arauá 18
Total 42
Apresentação para variáveis quantitativas

Tabela 6 – Concentrações de íon cloreto 𝐶𝑙 , 𝑚𝑔/𝐿, medidos na água tratada em


dois municípios de Sergipe.
Observação 𝐶𝑙 Município Observação 𝐶𝑙 Município Observação 𝐶𝑙 Município
1 246 Boquim 15 262 Boquim 29 264 Boquim
2 254 Arauá 16 257 Boquim 30 264 Boquim
3 250 Arauá 17 254 Arauá 31 259 Boquim
4 269 Arauá 18 269 Arauá 32 268 Boquim
5 256 Boquim 19 260 Boquim 33 264 Boquim
6 261 Boquim 20 250 Boquim 34 261 Boquim
7 252 Arauá 21 265 Boquim 35 263 Boquim
8 261 Boquim 22 260 Boquim 36 256 Arauá
9 261 Boquim 23 269 Boquim 37 250 Arauá
10 255 Arauá 24 256 Arauá 38 246 Boquim
11 250 Arauá 25 267 Arauá 39 269 Arauá
12 263 Boquim 26 255 Arauá 40 258 Arauá
13 260 Boquim 27 269 Arauá 41 260 Arauá
14 265 Boquim 28 258 Boquim 42 269 Arauá
Apresentação para variáveis quantitativas

1º Passo: Organizar o banco de dados em ordem crescente (rol).

2º Passo: Definir a forma de apresentação:

Distribuição de Distribuição de
frequência simples frequência por classe

Pequenas amostras Grandes amostras


Distribuição de frequência simples

Tabela 8 – Distribuição de frequência das concentrações de íon cloreto


𝐶𝑙 , 𝑚𝑔/𝐿, medidos na água tratada em dois municípios de Sergipe.
Estatura Frequência
246 2
250 4
252 1
254 2
255 2
256 3
257 1
258 2
259 1
260 4
261 4
262 1
263 2
264 3
265 2
267 1
268 1
269 6
Total 42
Distribuição de frequência por classe

1º Passo: Organizar o banco de dados (rol).


2º Passo: Amplitude total ( ) – é a amplitude entre o maior e menor valor do
conjunto de dados.

3º Passo: Número de classes ( ) – corresponde a quantidade de classes nas


quais serão agrupados os elementos do rol.

4º Passo: Intervalo de classe ( ) – corresponde aos intervalos em que o rol foi


subdividido.
Distribuição de frequência por classe

Tipos de intervalos

5º Passo: Ponto Médio – é a média aritmética entre o limite inferior e o limite


superior

6º Passo: Construir a tabela.


Exemplo - Distribuição de frequência por classe
para a variável estatura

1º Passo: Organizar o banco de dados (rol).

Observação 𝐶𝑙 Município Observação 𝐶𝑙 Município Observação 𝐶𝑙 Município


1 246 Boquim 16 257 Boquim 35 263 Boquim
38 246 Boquim 28 258 Boquim 29 264 Boquim
3 250 Arauá 40 258 Arauá 30 264 Boquim
11 250 Arauá 31 259 Boquim 33 264 Boquim
20 250 Boquim 13 260 Boquim 14 265 Boquim
37 250 Arauá 19 260 Boquim 21 265 Boquim
7 252 Arauá 22 260 Boquim 25 267 Arauá
2 254 Arauá 41 260 Arauá 32 268 Boquim
17 254 Arauá 6 261 Boquim 18 269 Arauá
10 255 Arauá 8 261 Boquim 23 269 Boquim
26 255 Arauá 9 261 Boquim 27 269 Arauá
5 256 Boquim 34 261 Boquim 4 269 Arauá
24 256 Arauá 15 262 Boquim 39 269 Arauá
36 256 Arauá 12 263 Boquim 42 269 Arauá
Distribuição de frequência por classe

2º Passo:

3º Passo:

4º Passo:
Distribuição de frequência por classe

5º Passo:
6º Passo:

Tabela 9 – Distribuição de frequência das concentrações de íon cloreto


, , medidos na água tratada em dois municípios de Sergipe.
Classe Estatura Frequência
246 250 2 248
250 254 5 252
254 258 8 256
258 262 11 260
262 266 8 264
266 270 8 268
Total 42
Tipos de Frequência

• Frequência simples absoluta – é o número de repetições de uma


valor individual ou de uma classe de valores da variável

• Frequência simples relativa – representa a proporção de


observações de um valor individual ou de uma classe, em relação ao
número total de observações.
Tipos de Frequência

• Frequência acumulada de uma classe – é a soma de frequências simples


(absoluta ou relativa) desta classe com as respectivas frequências simples
das classes anteriores.

Acumulada absoluta ( )

Acumulada relativa ( )

• Frequência percentual – é o número percentual de elementos por classe


de frequência.

Frequência percentual simples

Frequência percentual acumulada


Atividade

1ª) Os valores de concentrações de íons cloreto 𝐶𝑙 na água tratada em dois


municípios de Sergipe, medido em 42 coletas são apresentados na Tabela 6, em 𝑚𝑔/𝐿.

Tabela 6 – Concentrações de íon cloreto 𝐶𝑙 , 𝑚𝑔/𝐿, medidos na água tratada em


dois municípios de Sergipe.
Observação 𝐶𝑙 Município Observação 𝐶𝑙 Município Observação 𝐶𝑙 Município
1 246 Boquim 16 257 Boquim 35 263 Boquim
38 246 Boquim 28 258 Boquim 29 264 Boquim
3 250 Arauá 40 258 Arauá 30 264 Boquim
11 250 Arauá 31 259 Boquim 33 264 Boquim
20 250 Boquim 13 260 Boquim 14 265 Boquim
37 250 Arauá 19 260 Boquim 21 265 Boquim
7 252 Arauá 22 260 Boquim 25 267 Arauá
2 254 Arauá 41 260 Arauá 32 268 Boquim
17 254 Arauá 6 261 Boquim 18 269 Arauá
10 255 Arauá 8 261 Boquim 23 269 Boquim
26 255 Arauá 9 261 Boquim 27 269 Arauá
5 256 Boquim 34 261 Boquim 4 269 Arauá
24 256 Arauá 15 262 Boquim 39 269 Arauá
36 256 Arauá 12 263 Boquim 42 269 Arauá
a) Construa a distribuição de frequência por classe para a variável
concentrações de íons cloreto .

b) Construa a distribuição de frequências absoluta, relativa e acumuladas para


as distribuições de frequência simples e por classe da variável
concentrações de íons cloreto .

c) Quantas amostras (coletas) tem concentrações de íons cloreto menor


do que 262 ?

d) Qual a percentagem de amostras cujas concentrações de íons cloreto


são inferiores a 254 ?

e) Quantas amostras (coletas) tem concentrações de íons cloreto maior


ou igual a 254 ?

f) Quantas amostras (coletas) tem concentrações de íons cloreto entre


257 e 266 ?
b)

Tabela 9 – Distribuição de frequência das concentrações de íon cloreto ,


, medidos na água tratada em dois municípios de Sergipe.
Estatura
246 250 2 248 0.0476 2 0.0476
250 254 5 252 0.1190 7 0.1667
254 258 8 256 0.1905 15 0.3571
258 262 11 260 0.2619 26 0.6190
262 266 8 264 0.1905 34 0.8095
266 270 8 268 0.1905 42 1.0000
Total 42 1,0000

c) 26
d) 16,67%
e) 35 +
f) 19 + + ou
Atividade

3 – Os dados abaixo representam leituras de temperatura (°C) de um


pasteurizador de leite.

74,8 74,0 74,7 74,4 75,9 76,8 74,3 74,9 77,0 75,1 73,8 74,4
74,8 76,8 73,6 72,9 72,9 74,6 75,0 75,1 75,3 73,4 74,7 73,4
74,2 74,9 74,5 77,0

a) Construa a distribuição de frequências por classe.


b) Construa a distribuição de frequências absoluta, relativa, acumulada, acumulada
relativa e percentuais.
c) Considerando a terceira classe, quais seriam as interpretações das frequências:
absoluta, relativa, acumulada, acumulada relativa e percentuais?
Gráficos
Tipos de Gráficos

Tabela 11 – Tipos de gráficos mais utilizados para variáveis qualitativas e quantitativas.

Tipo de variável Gráfico

Qualitativa Barra, Coluna e setores

Quantitativa discreta Barra, coluna e setores

Quantitativa contínua Linhas e Histograma


Gráficos de colunas e barras

Representação de uma variável por meio de retângulos justapostos


horizontalmente (barras) ou verticalmente (colunas).

Vendas de frutas na mercearia X Vendas de frutas na mercearia X


no dia 24 de outubro de 2018 no dia 24 de outubro de 2018
18
16 limões
14
laranjas
12
Frequência

Frutas
10 Maçãs
8
6 Peras
4
2 Abacaxi
0
Abacaxi Peras Maçãs laranjas limões 0 5 10 15 20
Frutas Frequência
Gráficos de setores

Representa as partes de um todo por setores de um círculo, visando


comparar essas partes entre si em relação ao todo.

Vendas de frutas na mercearia X no dia 24


de outubro de 2018

Abacaxi
8% Peras
21% 11%
Maçãs
laranjas
limões
26% 34%
Diagrama de linhas

Este tipo de gráfico se utiliza da linha poligonal para representar a série


estatística. É indicado para mostrar a evolução temporal de variáveis
quantitativas

CO2 na atmosfera
390
Concentração de CO2

380
370
360
350
340
330
320
310
300
290
1960 1970 1980 1990 2000

Anos
Histograma

O histograma é uma representação gráfica na qual um conjunto de dados é


agrupado em classes uniformes, representado por um retângulo cuja base
horizontal são as classes e seu intervalo e a altura vertical representa a frequência
com que os valores desta classe estão presente no conjunto de dados.
Estatística Descritiva – Medidas Resumo
Medidas de posição

 Apresentação de um ou alguns valores que sejam representativos da série toda.


 Representam um valor central, em torno do qual os dados se concentram.

Medidas de tendência central

média mediana moda


Média ( )

É o valor que aponta para onde se concentram os dados de uma distribuição.

 Media aritmética simples – é a soma de todos os valores observados da


variável dividido pelo número total de observações

-> os valores da variável;


-> o número de observações;
Média ( )

Exemplo 1: Qual o tempo médio de reação de um processo químico, sabendo


que foram realizados seis ensaios com uma temperatura de 60ºC. Os resultados
do experimento foram: 29,7; 28,7; 30,2; 31,3; 31,2; 31,7. Obs: tempo em minutos.
Média ( )

 Media aritmética ponderada – é a razão entre as somas dos produtos de


cada valor pelos seus respectivos pesos e a soma total dos pesos.

ou

-> os valores da variável ou os pontos médios das classes;


-> ponderações atribuídas a valores da variável;
-> a frequência de valores.
Média ( )

Exemplo 1: Um professor realiza 4 provas por ano em sua matéria e atribui a


cada uma os seguintes pesos: 1, 2, 3 e 4. Qual a média final de um aluno com as
seguintes notas 8, 7, 9 e 9?

5
Média ( )

Exemplo 2: Qual a média do número de filhos em idade escolar que têm os


funcionários de um indústria química, considerando que a psicóloga dos
Recursos humanos obteve uma amostra de 20 funcionários? Os dados são
apresentados na tabela abaixo.

Nº de filhos
0 6
1 8
2 4
3 1
4 0
5 1
Total 20
Média ( )

Resolução:

Nº de filhos
0 6 0
1 8 8
2 4 8
3 1 3
4 0 0
5 1 5
Total 20 24
Média ( )

Exemplo 3: Qual a média da temperatura (°C) de 100 leituras de um


pasteurizador de leite?

Temperaturas
72,9 73,6 4
73,6 74,3 16
74,3 75,0 31
75,0 75,7 34
75,7 76,4 11
76,4 77,1 4
Total 100
Média ( )

Resolução:

Temperaturas
72,9 73,6 4 73,25 293,00
73,6 74,3 16 73,95 1183,20
74,3 75,0 31 74,65 2314,15
75,0 75,7 34 75,35 2561,90
75,7 76,4 11 76,05 836,55
76,4 77,1 4 76,75 307,00
Total 100 7495,80

7495,80
Moda

 É o valor que ocorre com maior frequência em qualquer conjunto de dados.

Ex.1: = 4, 5, 6, 5, 4, 8, 5 (unimodal)

Ex.2: = 4, 5, 6, 8, 9, 6, 8, 5, 9, 6, 7, 8 (bimodal)

Ex.3: = 5, 6, 8, 9, 7 Não há moda (amodal)

Ex.4: = 2, 2, 5, 6, 6, 7, 8, 7, 1, 1 7 (plurimodal)
Moda

 Moda para dados agrupados sem intervalos de classes: O valor


modal é o valor que possuir maior frequência.

Exemplo: Consideremos a distribuição relativa a 34 funcionários de um indústria


química, tomando como variável o número de filhos do sexo masculino.

Nº de Meninos
0 2
1 6
2 10
3 12 =3
4 4
Total 34
Moda

• Moda para dados agrupados em distribuição de frequência por classe:

1º passo: Encontrar a classe modal (a classe que possui maior frequência)


2º passo: Calcular a moda por (Método de CZUBER):

em que:
;
;
;

;
.
Moda

Exemplo: Temperatura (°C) de 100 leituras de um pasteurizador de leite.

Temperaturas
72,9 73,6 4
73,6 74,3 16
74,3 75,0 31
75,0 75,7 34
75,7 76,4 11
76,4 77,1 4
Total 100
Moda

Exemplo: Temperatura (°C) de 100 leituras de um pasteurizador de leite.

1º passo: Identifica-se a classe modal: 3ª classe (maior frequência = 34)

Temperaturas
72,9 73,6 4
73,6 74,3 16
74,3 75,0 31 Classe Modal
75,0 75,7 34
75,7 76,4 11
76,4 77,1 4
Total 100
Moda

Exemplo: Temperatura (°C) de 100 leituras de um pasteurizador de leite.

2º passo: Calcula-se a moda:


Temperaturas

72,9 73,6 4
73,6 74,3 16
74,3 75,0 31
75,0 75,7 34
75,7 76,4 11
76,4 77,1 4
Total 100
Mediana

 É o valor que divide o conjunto de dados em duas partes iguais.

1º passo: Organizar o conjunto de dados


2º passo: Calcular a mediana usando a seguinte regra:

• Se n é ímpar

• Se n é par
Mediana

Ex.1: = 1, 2, 7, 8, 20

Ex.2: = 1, 3, 5, 7, 8, 10
Mediana

 Mediana para dados agrupados sem intervalos de classes:



1ª Forma: Obter a posição em que a mediana se encontra: . E em
seguida, utilizar a frequência acumulada.

2ª Forma: Utilizar a frequência acumulada percentual ( ) para determinar


a classe que acumula o valor 50%.

Exemplo: : Consideremos a distribuição relativa a 34 funcionários de um indústria


química, tomando como variável o número de filhos do sexo masculino.

Nº de Meninos
0 2
1 6
2 10
3 12
4 4
Total 34
Mediana

Nº de Meninos
0 2 2 0,0588 0,0588 5,88
1 6 8 0,1765 0,2353 23,53
2 10 18 0,2941 0,5294 52,94
3 12 30 0,3529 0,8824 88,24
4 4 34 0,1176 1,0000 100,00
Total 34

Primeiro 𝐹 maior ou igual a 17


Mediana

 Mediana para dados agrupados em distribuição de frequência por classe

em que:

;
;
∗ ;
.
Mediana

Exemplo: Temperatura (°C) de 100 leituras de um pasteurizador de leite.

Temperaturas
72,9 73,6 4
73,6 74,3 16
74,3 75,0 31
75,0 75,7 34
75,7 76,4 11
76,4 77,1 4
Total 100
Mediana

Exemplo: Temperatura (°C) de 100 leituras de um pasteurizador de leite.

Temperaturas
72,9 73,6 4 Classe da Mediana
73,6 74,3 16
74,3 75,0 31
75,0 75,7 34
75,7 76,4 11 ∗
76,4 77,1 4
Total 100
Atividade

1 - Calcule, para cada caso abaixo, a respectiva média, moda, mediana.

a) 12, 8, 14, 7, 9 b) 6, 5, 10, 15, 5, 4

c) d) Classe
3 2 68 |- 72 8
4 5
72 |- 76 20
7 8
8 4 76 |- 80 35
12 3 80 |- 84 40
Medidas de dispersão
Medidas de dispersão

 São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou


dispersão, dos valores em torno da média.

Considere as amostras X, Y e Z:

X = 50, 50, 50, 50, 50

Y = 48, 49, 50, 51, 52

Z = 30, 40, 50, 60, 70


Medidas de dispersão

Medidas de
dispersão

Dispersão absoluta Dispersão relativa

Coeficiente de
variância Desvio padrão
variação

OBS: Quanto maior as medidas de dispersão, mais heterogêneos são os dados,


e ao contrário, quanto menor essas medidas, mais homogêneo o conjunto.
Variância

A variância baseia-se nos desvios em torno da média aritmética.

em que:
-> os valores da variável;
-> a média aritmética
-> o número de observações.
Variância

 Quando os dados estão agrupados em distribuição de frequência,


deve-se ponderar os somatórios pela frequência .

em que:
-> os valores da variável;
-> a média aritmética;
-> o número de observações;
-> é a frequência simples.
Desvio Padrão ( )

 É a raiz quadrada da variância. É a medida de quanto os valores


observados variam em torno da média.

em que:
-> os valores da variável;
-> a média aritmética;
-> o número de observações.
Coeficiente de variação ( )

 É uma medida relativa de dispersão.


 Utilizada para avaliar a homogeneidade de séries estatísticas, que é o
grau de concentração dos valores observados em torno da sua média
aritmética.

em que:
-> o desvio padrão
-> a média aritmética.
Medidas de dispersão

Exemplo:

X = 50, 50, 50, 50, 50 = 50


Medidas de dispersão

Exemplo:

Y = 48, 49, 50, 51, 52 = 50


Medidas de dispersão

Exemplo:

Z = 30, 40, 50, 60, 70 = 50


Medidas de dispersão

Exemplo: Resumo

Variável

X 0 0 0%

Y 2,5 1,58 3,16%

Z 250 15,81 31,62%

X é homogêneo, não possui dispersão;


Y apresenta uma dispersão de 1,58 em torno da média;
Z apresenta uma dispersão de 15,8 em torno da média
Medidas de dispersão

Exemplo: Consideremos a distribuição relativa a 34 funcionários de um


indústria química, tomando como variável o número de filhos do sexo
masculino.

Nº de Filhos
0 10
1 20
2 5
3 5
Total 40
Medidas de dispersão

Exemplo:

Nº de Filhos
0 10 0
1 20 20
2 5 10
3 5 15
Total 40 45 85

3
Medidas de dispersão

Exemplo: Temperatura (°C) de 100 leituras de um pasteurizador de leite:

Classe
72,9 73,6 4
73,6 74,3 16
74,3 75,0 31
75,0 75,7 34
75,7 76,4 11
76,4 77,1 4
Total 100

Você também pode gostar