Escolar Documentos
Profissional Documentos
Cultura Documentos
O que é a Estatística?
Estatística é a ciência dos dados. Envolve recolher, classificar, resumir,
organizar, analisar e interpretar informação numérica.
• Previsão.
• Tomada de decisão.
• Compreensão da realidade.
Tipos de dados
Tipos de
dados
Dados Dados
quantitativos qualitativos
Rodrigo Martins 3
Dados quantitativos
4
943
21 52
Medidos em escala numérica.
Rodrigo Martins 4
Dados qualitativos
Classificados em categorias.
$ Crédito
Rodrigo Martins 5
Os exemplos destacam que, para definir uma população, é necessário sempre estabelecer um ou mais
critérios (regras) que nos dizem quais os elementos a incluir e excluir dessa população.
Quando procedemos a um estudo estatístico, a população refere-se ao conjunto de elementos de
interesse na investigação.
Quando se pretender obter informação sobre todos os elementos da população, estamos em
presença de um censo.
Rodrigo Martins 6
[Amostra]
É obvio que ter acesso a dados relativos a todos os elementos de uma população é sempre melhor do
que estar reduzido a uma amostra.
Rodrigo Martins 7
Métodos estatísticos
Métodos
estatísticos
Estatística Estatística
descritiva inferencial
A distinção entre as duas está intimamente ligada aos conceitos de população e amostra.
Rodrigo Martins 8
$
1. Envolve 50
• Recolher os dados.
• Apresentar os dados. 25
2. Propósito 0
• Descrever os dados. Q1 Q2 Q3 Q4
X = 30,5 S2 = 113
Rodrigo Martins 9
A Estatística inferencial recorre à amostra para conhecer algo sobre uma determinada população,
envolvendo estimação e testes. A informação que extraímos da amostra serve para
melhor conhecer a população.
A análise inferencial é feita em ambiente de incerteza, logo recorre à teoria das probabilidades e
correspondentes técnicas estatísticas probabilísticas.
1. Envolve
• Estimar.
• Testar a hipótese.
2. Propósito
• Tomar decisões sobre as características da
população.
Na Estatística descritiva apresentamos factos estatísticos, enquanto que na Estatística inferencial
fazemos afirmações probabilísticas.
Rodrigo Martins 10
• População (Universo)
Todos os itens de interesse.
• Amostra
subconjunto de unidades de uma população.
• Parâmetro
Medida numérica com base na população
• Estatística
Medida numérica com base na amostra.
• Unidade experimental
Objecto (pessoa, coisa, evento…) a partir do qual
recolhemos dados.
• Variável
Característica ou propriedade da unidade experimental.
Rodrigo Martins 11
Amostragem
A amostragem é o processo pelo qual recolhemos dados.
A amostra dá-nos apenas uma imagem imprecisa da população em estudo.
Devemos sempre esperar algumas diferenças entre a amostra e a população.
Numa análise por amostragem, há sempre a considerar o chamado erro de amostragem.
TIPOS DE AMOSTRA:
• Amostras aleatórias: quando é dada igual e independente probabilidade de seleção a todos os
membros de um grupo (população).
• Amostras não aleatórias: A seleção dos elementos da amostra é feita através de escolha pessoal.
As amostras não aleatórias incluem:
o Amostras de conveniência quando escolhemos os elementos apenas por estarem mais
próximos de nós. (Exemplo: Quando fazemos um inquérito em Coimbra para conhecer a
realidade de Portugal)
o Amostras de quota quando os elementos que compõem a amostra são de determinadas
características. (Exemplo: Quando queremos inquirir 50 homens e 50 mulheres, cabendo
ao inquiridor escolher quem entrevista)
o Amostras de opinião. Exemplo: Quando o investigador recolhe dados numa freguesia
porque acha que essa freguesia é representativa do concelho à qual pertence) 12
Rodrigo Martins
Softwares estatísticos
1. Software típico
• SPSS.
• MINITAB.
• Excel.
2. Necessidade do entendimento
estatístico
• Suposições.
• Limitações.
Rodrigo Martins 13
70
60
50
Barras verticais
% 40
para variáveis
Valor total 30
qualitativas.
também é 20
usado. 10
0
Chrome Safari Firefox Explorer Edge Opera Outros
Browser
Ponto zero.
Exemplo: Amostra: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
Rodrigo Martins 16
Histograma
Classe Freq.
Contagem 15,5 – 25,5 3
5 25,5 – 35,5 5
35,5 – 45,5 2
4
Neste caso usamos
a Frequência total, 3
mas poderíamos
usar em alternativa 2 Contacto entre
a % de cada classe as barras
(freq. relativa) 1
0
Notação padrão
Média 𝑥̅ 𝜇
Desvio-padrão 𝑆 𝜎
Variância 𝑆 𝜎
Tamanho 𝑛 𝑁
Rodrigo Martins 18
Propriedades dos
dados numéricos
Rodrigo Martins 19
∑ 𝑋 𝑋 + 𝑋 + ⋯+ 𝑋
𝑋= =
𝑛 𝑛
Rodrigo Martins 20
∑ 𝑋 𝑋 + 𝑋 + ⋯+ 𝑋
𝑋= =
𝑛 𝑛
10 ,3 4,9 8,9 11,7 6,3 7,7
6
8,30
Rodrigo Martins 21
Mediana
1. Medida da tendência central.
2. Valor do meio em sequência ordenada.
• Se n é ímpar, m é o valor do meio.
• Se n é par, m é a média de 2 números inteiros.
3. Posição da mediana na sequência.
4. Não é afectada por valores extremos.
𝑛+1
Ponto de posicionamento:
2
Rodrigo Martins 22
n 1 5 1
Ponto de posicionamento: 3,0
2 2
Mediana 22,6
Rodrigo Martins 23
n 1 6 1
Ponto de posicionamento 3,5
2 2
Rodrigo Martins 24
Moda
Rodrigo Martins 25
Exemplo de moda
• Sem moda
Amostra: 10,3 4,9 8,9 11,7 6,3 7,7
• Uma moda
Amostra: 6,3 4,9 8,9 6,3 4,9 4,9
• Mais de 1 moda
Amostra: 21 28 28 41 43 43
Rodrigo Martins 26
(n 1) Valor do meio
Mediana Posição quando ordenado
2
Moda Nenhuma Mais frequente
Rodrigo Martins 27
Para reflexão
$400.000
$70.000
$20.000
Rodrigo Martins 28
Para reflexão
$400.000
$50.000
Rodrigo Martins 29
Medidas de dispersão
Amplitude
1. Medida de dispersão.
2. Diferença entre observações maiores e menores.
Amplitude = Xmaior – Xmenor.
3. Ignora como os dados são distribuídos.
7 8 9 10 7 8 9 10
amplitude = 10 – 7 = 3 amplitude = 10 – 7 = 3
Rodrigo Martins 30
Medidas de dispersão
Variância e desvio-padrão
X = 8,3
4 6 8 10 12
Rodrigo Martins 31
∑ 𝑋 −𝑋
𝑆 =
𝑛−1
𝑋 −𝑋 + 𝑋 −𝑋 +⋯+ 𝑋 −𝑋
𝑆 =
𝑛−1
O desvio-padrão (S) é a raiz
quadrada positiva da
variância: 𝑆 = 𝑆 n - 1 no denominador! (Use
N se estiver a calcular a
variância da população).
Rodrigo Martins 32
∑ 𝑋 −𝑋 ∑ 𝑋
𝑆 = 𝑋= = 8,3
𝑛
𝑛−1
2 2 2
2 (10,3 8,3 ) (4,9 8,3 ) … (7,7 8,3 )
S
6 1
6,368
S = 6,368 = 2,52
Rodrigo Martins 33
score-z
𝑋−𝑋 𝑋−𝜇
𝑧= 𝑧=
𝑠 𝜎
Rodrigo Martins 34
Exemplo de score-z
O tempo médio para montar um produto é 22,5 minutos, com um
desvio-padrão de 2,5 minutos.
1. Encontre o score-z de um item que demorou 20 minutos para ser
montado.
2. Encontre o score-z de um item que demorou 27,5 minutos para
ser montado.
1. 𝑿 = 𝟐𝟎 𝜇 = 22,5 𝜎 = 2,5
𝑋 − 𝜇 20 − 22,5
𝑧= = = −1
𝜎 2,5
𝑋 − 𝜇 27,5 − 22,5
𝑧= = =2
𝜎 2,5
Rodrigo Martins 35