Você está na página 1de 89

UNIVERSIDADE FEDERAL DO

MARANHÃO DEPARTAMENTO DE MATEMÁTICA


CENTRO DE CIÊNCIAS
EXATAS E TECNOLOGIA
DISCIPLINA – ESTATÍSTICA E PROBABILIDADE

 ESTATÍSTICA DESCRITIVA

PROFª ROSANI DIAS


Introdução
 Geralmente a quantidade de informação é
grande, assim fica difícil captar, intuitivamente,
as informações que os dados contêm;

 É necessário reduzir as informações até o


ponto em que se possa interpretá-las mais
claramente.
Papel da Estatística Descritiva
 Coleta de dados;

 Organização e classificação destes dados;

 Apresentação através de gráficos e tabelas;

 Cálculo de coeficientes (estatísticos), que permitem


descrever resumidamente os fenômenos.
Inferência Estatística
 Consiste em obter e generalizar conclusões; ou seja,
inferir propriedades para o todo com base na parte,
no particular.

 É tratada através de técnicas e métodos que se


fundamentam na Teoria de Probabilidades.

 Em estatística utilizaremos extensivamente os termos


população e amostra.
Fases do Trabalho Estatístico
Estatística Descritiva

População
Amostra

Inferência Estatística
População e Amostra
População

Amostra
Classificação das Variáveis
Classificação das Variáveis

Variáveis Quantitativas
Continua – assume valores em um intervalo do conjunto dos Reais.
Resulta normalmente de mensurações.

Ex: altura, peso, temperatura, etc.

Discreta - Pertencem ao conjunto finito ou enumerável. Resulta de


um processo de contagem.

Ex: Número de alunos, numero de filhos, etc.


Classificação das Variáveis

Variáveis Qualitativas
Ordinal - os valores representam atributos ou qualidades
mas incluem uma relações de ordem.

Ex: classe social, grau de instrução, etc.

Nominal - os valores representam atributos ou qualidades


mas não tem uma relação de ordem entre eles.
Ex: sexo, grupo sanguíneo, raça, etc.
Tipos de Séries Estatística

Série estatística é uma sucessão de dados


estatísticos que medem a intensidade do
fenômeno, segundo suas características
qualitativas ou quantitativas.
Tipos de Séries Estatística

 Série Histórica, cronológica ou temporal: dia, mês, ano.


Tipos de Séries Estatística

 Série Geográfica ou territorial: estados, municípios,


cidades.
Tipos de Séries Estatística

 Série Específica ou qualitativa: fato, espécie.


Tipos de Séries Estatística

 Série Mista: Mistura duas ou os três tipos de séries.


Tipos de Séries Estatística

 Série Mista: Mistura duas ou os três tipos de séries.


Apresentação de Dados
 Após a apuração dos dados, há necessidade de os dados e os
resultados obtidos a partir daqueles serem dispostos de uma forma
ordenada e resumida, a fim de auxiliar o pesquisador na análise e
facilitar a compreensão das conclusões apresentadas ao leitor.

 A tabela geralmente é utilizada para organizar esses dados,


além da tabela podemos utilizar outra forma de apresentação, os
gráficos.
Tabela
 Uma tabela é elaborada obedecendo à Resolução nº 886, de 26
de outubro de 1966, do Conselho Nacional de Estatística.
 Os elementos de uma tabela são:

Essenciais Complementares
 Título
 Corpo da tabela
 Fonte
 Notas
 Cabeçalho
 Chamadas
 Coluna Indicadora
Tabela
Tabela
 Algumas observações:

1. Nenhuma casa da tabela deve ficar me branco


2. As tabelas devem ser fechadas no alto e embaixo por linhas
horizontais, não sendo fechadas à direito ou à esquerda por
linhas verticais. É facultativo o emprego de traços verticais para
a separação de colunas do corpo da tabela
3. Em publicações com muitas tabelas, estas devem ser numeradas
4. Os totais e subtotais devem ser descartados
5. Deverá ser mantida a uniformidade da unidade decimal.
Tabela
 Como montar uma tabela:
 Exemplo: Votos do sociograma

 Dados Brutos

0, 2 ,3, 7, 0, 2, 1, 3, 3, 2,
5, 6, 3, 2, 2, 0, 3, 1, 4, 3,
7, 6, 2, 1, 2 ,3 ,2, 4, 3, 5, 6
 Ordenando (ROL)

0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 2,
2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3,
4, 4, 5, 5, 6, 6, 6, 7, 7
Tabela
Tabela
Tabela
Gráficos
 Os mesmos elementos essenciais e complementares utilizados na
tabela devem ser usados para os gráficos.
Veremos alguns tipos de gráficos:

 Linha  Setores (pizza)


 Barras  Histograma

 Colunas  Pictogramas

 Colunas agrupadas
Gráfico de Linha
Gráfico de Linha
Gráfico de Barras
Gráfico de Coluna
Gráfico de Coluna
Gráfico de Barras e Colunas
Agrupadas
Gráfico de Colunas Sobrepostas
Gráfico de Pizza
Histograma
Histograma
Gráfico Pictorial - Pictograma
Gráfico Pictorial - Pictograma
Pictograma
Pictograma
Pictograma
Pictograma
Pictograma

Mês de aniversário de meninos e meninas do curso


Tabela
 Como montar uma tabela:
 Exemplo: Votos do sociograma

 Dados Brutos

0, 2 ,3, 7, 0, 2, 1, 3, 3, 2,
5, 6, 3, 2, 2, 0, 3, 1, 4, 3,
7, 6, 2, 1, 2 ,3 ,2, 4, 3, 5, 6
 Ordenando (ROL)

0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 2,
2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3,
4, 4, 5, 5, 6, 6, 6, 7, 7
Frequência
 Frequência Absoluta Simples (fi): é o número de vezes em que um
elemento se repete na amostra.

Classe fi
Ruim 12
Médio 27
Bom 15
Ótimo 6
Total 60
Frequência
 Frequência Relativa (fri): expressa a proporção de elementos na
classe i, ou seja
fri = fi/n
sendo n o total de elementos da amostra.
fr1 = f1/n = 12/60 = 0,20

Classe fi fri
Ruim 12 0,20
Médio 27 0,45
Bom 15 0,25
Ótimo 6 0,10
Total 60 1
Frequência
 Frequência Absoluta Acumulada (fai): é o número de elementos
acumulados até a classe i

Classe fi fri fai


Ruim 12 0,20 12
Médio 27 0,45 39
Bom 15 0,25 54
Ótimo 6 0,10 60
Total 60 1
Frequência
 Frequência Relativa Acumulada (frai): é o número de elementos
acumulados da frequência relativa até a classe i

Classe fi fri fai frai


Ruim 12 0,20 12 0,20
Médio 27 0,45 39 0,65
Bom 15 0,25 54 0,90
Ótimo 6 0,10 60 1,00
Total 60 1
Tabela com Intervalo de Classe
1. Por que utilizar o intervalo de classe?
2. Quando a tabela é muito grande e com poucas frequências,
devemos utilizar o intervalo de classe.
Exemplo: considere o seguinte rol sobre o total de pontos (acertos)
obtidos em um teste de 175 questões por 40 alunos

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Se colocarmos em uma tabela sem intervalo de classe teríamos:
Tabela com Intervalo de Classe
Pontos Freqüência

150 1
151 1
152 1
Total de pontos (acertos) obtidos em
153 1 um teste de 175 questões por 40 alunos
154 1
155 4
Total de pontos Freqüência
156
157
3
1
A apresentação 150 |- 154 4
158 2
160 5 ideal seria 154 |- 158 9
161
162
4
2
assim 158 |- 162 11
163 2
164 3 162 |- 166 8
165 1
166 1 166 |- 170 5
167 1
168 2
170 |- 174 3
169 1
170 1
Total 40
172 1
173 1
total 40
Tabela com Intervalo de Classe
1. Ordenar os dados, ou seja, colocar os dados brutos em rol
2. Determinar o número de classes (k) da tabela.
3. Classes de frequência: são os intervalos de variação da
variável, representados por i, sendo i = 1,2,3,4,...,k, onde k é o
número total de classes.
 De modo geral, este valor não deverá ser inferior a 5 e nem
superior a 15.
 Existem dois métodos:

 k = 1 + 3,32 x log n (Fórmula de Sturgues)


Tabela com Intervalo de Classe
1. Voltando ao exemplo teremos:

Exemplo: considere o seguinte rol sobre o total de pontos


(acertos) obtidos em um teste de 175 questões por 40 alunos
De acordo com os dois métodos, teríamos:
 k = 1 + 3,32 x log n

 k = 1 + 3,32 x log 40 = 6,318


e

 Ou seja k = 6 classes
Tabela com Intervalo de Classe
2. Determinar a amplitude do intervalo h
 No próximo passo teremos que determinar a amplitude total
(At)
 At = Ls – Li
onde Ls é o maior valor da amostra e Li o menor valor
da amostra
 Com a amplitude total podemos calcular a amplitude do
intervalo (h)
 h = At/k
Tabela com Intervalo de Classe
Do exemplo teremos que:
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Ls será igual a 173 e Li será igual a 150


Assim a amplitude total (At), será:
 At = Ls – Li
 At = Ls – Li = 173 – 150 = 23
 Com a amplitude total podemos calcular a amplitude do
intervalo (h)
 h = At/k = 23/6 = 3,83; ou seja; aproximadamente 4
Tabela com Intervalo de Classe
4. Construindo a tabela de intervalos de classe:
 O limite inferior da classe da primeira classe será sempre o
menor valor do conjunto de dados.
 O limite superior da classe será o limite inferior acrescido do
valor da amplitude do intervalo de classe (h)
 A Simbologia para construção da tabela
 Limites da classe: são os extremos de cada classe.
Limite superior ls Limite inferior li

O símbolo li |- ls significa inclusão de li e exclusão de Li


Tabela com Intervalo de Classe
4. Construindo a tabela de intervalos de classe:
 Do exemplo, teremos:
 O limite superior da classe será o limite inferior acrescido do
valor da amplitude do intervalo de classe (h)
 li = 150 e ls = 150 + 4 = 154
 Assim a primeira classe seria:
 h1 = 150 l- 154
 Assim essa classe vai incluir todas as frequências de 150 a
153, o 154 entra na próxima classe.
Exemplo

Primeiramente vamos determinar o número de classes (k)

Como o número de classes deve ser interiro, vamos considerar k = 7


Exemplo

Com k = 7, vamos determinar o tamanho do intervalo da classe (h)


At = 39 – 16 = 23
Assim h será
h = 23/7 = 3,2857
Exemplo
Exemplo

i Classe fi fri fai frai


1 16,0 |- 19,3 7 0,12 7 0,12
2 19,3 |- 22,6 9 0,15 16 0,27
3 22,6 |- 25,9 15 0,25 31 0,52
4 25,9 |- 29,2 12 0,20 43 0,72
5 29,2 |- 32,5 9 0,15 52 0,87
6 32,5 |- 35,8 6 0,10 58 0,97
7 38,8 |- 39,1 2 0,03 60 1,00
Total 60 1
Medidas de Posição
 Média Aritmética
 Mediana
 Moda
Média Aritmética -
 Dados não agrupados

 Temos uma amostra de 10 crianças de 5 anos de idade, com


dados referentes a seus pesos (em kg): 23,0; 20,0; 22,0;
19,0; 25,0; 28,2; 24,0; 21,0; 27,0; 21,0. n = 10

 Isso significa que o peso médio é de 23,0 kg.


Média Aritmética
 Dados agrupados em tabelas sem intervalo de classe
Média Aritmética
 Dados agrupados em tabelas com intervalo de classe
Mediana - Md
 Mediana É definido como o valor que divide uma série
ordenada de tal forma que pelo menos a metade dos itens
sejam iguais ou maiores do que ela, e que a outra metade
dos itens sejam menores do que ela. Colocados em ordem
crescente, a mediana é o elemento que ocupa a posição
central.
 Como a mediana divide os dados ordenados ao meio, ela
não é sensível a valores discrepantes. A depender de como
estejam os dados, deve-se diferenciar a forma como
encontra-se a mediana.
Mediana
 Determinação da Mediana de Valores não-tabulados.
 Processa-se a partir de um rol ou lista ordenada dos dados.
Existem dois casos de observações n: ímpar ou par.
a) Número ímpar de observações:
 Requer, em primeiro lugar, que se determine a ordem em
que se encontra a mediana na série. Para isto encontramos:

 O passo seguinte será localizar a mediana na lista de


valores, de acordo com o resultado obtido no cálculo do
elemento mediano (Emd).
Mediana
Mediana
 Determinação da Mediana de Valores não-tabulados.
b) Número par de observações:
 Neste caso, o elemento mediano será determinado através
da expressão:

 A mediana será determinada pela média aritmética entre os


valores que ocupam a posição definida pelo elemento
mediano e a posição sucessora.
Mediana
Mediana
 Determinação da Mediana de Valores tabulados.
 Os dados geralmente já estão ordenados na tabela então o
processo para os dados agrupados em tabelas sem
intervalo de classe será o mesmo.
 Considera a seguinte tabela
Mediana
 Os dados já estão ordenados e o n é ímpar, então
aplicando na expressão abaixo, teremos:
=(13+1)/2 = 14/2 = 7, ou seja a mediana é a
que está na 7ª posição.
Md = 2 cáries
Mediana
 Determinação da Mediana de Valores tabulados com intervalo de
classe.
 Neste caso, encontramos o elemento mediano através da fórmula Emd
= n/2, não se fazendo distinção entre número par ou ímpar de
observações. A partir daí, determinaremos a classe mediana, através
da seguinte expressão:
Mediana
 Exemplo. Considere a seguinte tabela com intervalo de classe.

 Assim a mediana será dada por:


Moda - Mo
 A moda é outra medida de tendência central, sendo, no
entanto a menos importante. Sua vantagem é que pode ser
usada para variáveis qualitativas. Genericamente, pode-se
definir a moda como o valor mais frequente da distribuição.
Moda - Mo
 Considerando um conjunto ordenado de valores, a moda
será o valor predominante, o valor mais frequente desse
conjunto.
 A Moda é determinada da mesma maneira para dados não
agrupados em tabelas e para dados agrupados em tabelas
sem intervalo de classe.
 Nem sempre a moda existe (distribuição amodal) e nem
sempre é única.
 Se apresentar apenas uma moda diremos que é unimodal;
 se possuir duas modas diremos que é bimodal;
 se tiver várias modas (mais que duas) diremos que é
multimodal.
Moda - Mo
 Exemplo. Considere a tabela abaixo
Moda - Mo
 Para dados agrupados em tabelas com intervalo de classe,
calcularemos através da seguinte expressão:

f mo - f ant
Mo  l  .h
2f mo - (f an  f post )
onde
 l = limite inferior da classe modal
 fmo = frequência simples da classe modal
 fant = frequência simples da classe anterior à da classe modal
 fpost = frequência simples da classe posterior à da classe modal
 h = amplitude da classe modal
Moda - Mo
 Considere a seguinte tabela e determine a moda.

 Assim a moda será dada por:


f mo - f ant 11 - 9
Mo  l  . h  58  . 4  59,6
2f mo - (f an  f post ) 2.11 - (9  8)
Quartis

 (Q1) Primeiro Quartil – valor cuja posição na série


é tal que a quarta parte (25%) dos dados é menor
do que ele e as três quartas partes restantes (75%)
são maiores que ele.
 (Q2) Segundo Quartil – coincide com a mediana.
(Q2=Md)
 (Q3) Terceiro Quartil – valor cuja posição na série
é tal que três quartas partes (75%) dos termos são
menores que ele e uma quarta parte (25%) é maior.
Quartis
Para dados agrupados, o cálculo dos quartis se
dá pela substituição na formula da mediana de
f i por k  fi
2 4
onde k é o número de ordem do quartil.

  fi  *
  F (ant ) h
 2 
Md  l 
*

f*
Quartis
Para dados agrupados, o cálculo dos quartis se
dá pela substituição na formula da mediana de
f i
por k  fi
2 4
onde k é o número de ordem do quartil.

Prifmeiro quartil
  fi  *
  F (ant ) h
 4 
Q1  l 
*

f*
Quartis
onde k é o número de ordem do quartil.

Segundo quartil

 2 f i  *
  F (ant ) h
 4 
Q2  l 
*

f*
Quartis
onde k é o número de ordem do quartil.

 3 f i  *
  F (ant ) h
 4 
Q3  l 
*

f*
  fi  *
  F (ant ) h
 4  Primeiro Quartil
Q1  l 
*

f*
 2 f i  *
  F (ant ) h Segundo Quartil
 4 
Q2  l 
*

f*
 3 f i  * Terceiro Quartil
  F (ant ) h
 4 
Q3  l 
*

f*
Decil
 Decis ( P1, P2,...P9) são os 9 valores que separam
uma série de dados em 10 partes iguais.

 Observação: P5=Md

 Dados agrupados: o cálculo dos percentis se dá pela


substituição na formula da mediana de  f i
por
2
k  fi
onde k é o número de ordem do percentil.
10
Percentil
 Percentis ( P1, P2,...P99) são os 99 valores que
separam uma série de dados em 100 partes iguais.

 Observação: P50=Md P25=Q1 P75=Q3

 Dados agrupados: o cálculo dos percentis se dá pela


substituição na formula da mediana de  f por
i

2
k  fi
onde k é o número de ordem do percentil.
100
  fi  *
  F (ant ) h
 2 
Mediana
Md  l 
*
*
f
 k  fi  *
  F (ant ) h
 4 
Quartis
Qk  l 
*

f*
 k  fi  *
  F (ant ) h
 100 
Percentis
Pk  l 
*

f*
Desvio Padrão e Variância
Desvio Padrão e Variância
Coeficiente de Variação

 É uma medida de dispersão relativa, utilizada quando


se deseja comparar a variação de conjunto de dados
que apresentem diferentes unidades de medição e ou
tamanhos diferentes, pois o coeficiente de variação
independe da unidade de medida dos dados.

 É expresso sempre em porcentagem (100%)

 Fórmula:
Coeficiente de Variação

 Ação A:
 Preço médio do último ano = 50 u.m
 Desvio padrão = 5 u.m
 Ação B:
 Preço médio do último ano = 100 u.m
 Desvio padrão = 5 u.m.