Escolar Documentos
Profissional Documentos
Cultura Documentos
SUSANA ROSADO
JORGE M. TAVARES RIBEIRO
2008, 2013, 2018, 2020, 2021
FA - UL, LISBOA
Complementos de Matemática e Estatística – Introdução à Estatística
OBJECTIVOS
▪ Fundamentos e conceitos elementares de
Estatística
O que é a Estatística?
A palavra Estatística tem a sua origem no latim – status – designação esta que
significa Estado, no sentido político do termo. Segundo diversos autores, o termo
Estatística foi usado pela primeira vez em 1589 pelo historiador italiano Girolamo
Ghilini num estudo – “civile, politica, statistica e militare scienza”.
O que é a Estatística?
A obtenção de dados
A obtenção de dados
Inquirindo um número restrito de pessoas, com a condição de que
estas tenham sido corretamente escolhidas, é possível obter as
mesmas informações, com uma certa margem de erro (erro
quantificável), que se pode tornar suficientemente pequeno.
A obtenção de dados
Complementos de Matemática e Estatística – Introdução à Estatística
A obtenção de dados
Complementos de Matemática e Estatística – Introdução à Estatística
Dimensionamento de amostras
Recolher e tratar uma amostra grande de mais para os resultados que se
pretendem obter, constitui um evidente desperdício de recursos;
Dimensionamento de amostras
Complementos de Matemática e Estatística – Introdução à Estatística
O tratamento inicial
O tratamento inicial compreende a ordenação, o cálculo
de características amostrais, o agrupamento em classes,
as representações gráficas – em suma, aquilo que constitui um dos
ramos da Estatística – a estatística descritiva (ou estatística dedutiva) e análise
exploratória de dados.
O outro ramo da Estatística – a inferência estatística (ou estatística indutiva) – que tem por base a Teoria das
Probabilidades, permite induzir do que se verifica numa amostra para a população de que esta foi extraída, i.e.
tomar decisões sobre hipóteses, estimar parâmetros populacionais a partir das características amostrais
relevantes, comparar populações, relacionar uma variável resposta com variáveis controladas, etc., constituindo
um instrumento de previsão da evolução futura de um fenómeno em estudo.
Complementos de Matemática e Estatística – Introdução à Estatística
Classificações da Estatística
ESTATÍSTICA
ESTATÍSTICA INDUTIVA ou INFERÊNCIA ESTATÍSTICA
Variáveis
1 2 76.0 1 1 A 185.000
2 5 140.5 1 0 C 245.000
3 3 102.0 1 1 A 224.500
4 3 122.5 1 1 C 138.500
5 5 245.0 0 0 B 324.700
6 1 55.0 0 0 C 65.000
Complementos de Matemática e Estatística – Introdução à Estatística
Variáveis
CARACTERÍSTICAS VARIÁVEIS
• Var. QUANTITATIVAS DISCRETAS: os valores são observados somente em pontos isolados ao longo de
uma escala (Processos de Contagem);
• Var. QUANTITATIVAS CONTÍNUAS: podem assumir um valor qualquer numa gama de valores de uma
escala (Processos de Medição)
Complementos de Matemática e Estatística – Introdução à Estatística
• Escala NOMINAL: os dados são identificados por um nome que designa uma
classe, sendo as classes:
- Mutuamente exclusivas;
- Exaustivas;
- Não ordenáveis.
• Escala ORDINAL: possibilidade de estabelecer uma ordenação das classes;
• Escala de INTERVALO: os dados são diferenciados e ordenados por números
expressos numa escala com origem arbitrária;
• Escala ABSOLUTA: Tem origem fixa.
SUSANA ROSADO
JORGE M. TAVARES RIBEIRO
2007, 2013, 2021
FA - UL, LISBOA
Complementos de Matemática e Estatística – Estatística Descritiva
OBJECTIVOS
DEFINIÇÕES E GENERALIDADES
APLICAÇÕES:
• Engenharia • Física • Informática
• Gestão • Química • Urbanismo
• Medicina • História • Fonética
• Linguística • Psicologia • Agronomia
• Planeamento • Arquitectura • Etc.
Complementos de Matemática e Estatística – Estatística Descritiva
DEFINIÇÕES E GENERALIDADES
POPULAÇÃO ou UNIVERSO – Conjunto de seres (humanos ou não) que são
objecto do estudo estatístico.
Distribuições de Frequência
DADOS QUALITATIVOS
Distribuições de Frequência
DADOS QUALITATIVOS
Exemplo: Numa amostra constituída por 120 edifícios, constatou-se que 100
estavam em bom estado de conservação, 15 necessitavam de obras de recuperação
e 5 eram para demolir.
100
4%
Freq. Absolutas
Bom estado 100 83.3 13%
Bom estado de 80
conservação
60
Obras de recuperação 15 12.5
A necessitar de
40
recuperação
A demolir 5 4.2
20
A demolir
Totais 120 100.0 0
83%
Bom estado de A necessitar de A demolir
conservação recuperação
360 f
das K classes, e por consequência K
N = Nk
70
A= em que:
f – frequência; 10
N N 0
fr = k ou f r (%) = k 100 N – número de dados
Bom estado de A necessitar de A demolir
N N conservação recuperação
Complementos de Matemática e Estatística – Estatística Descritiva
Distribuições de Frequência
DADOS QUANTITATIVOS
Agrupamento dos dados em Classes ou Categorias,
juntamente com as frequências correspondentes
• Representações Tabular ou Gráfica;
• Estatísticos;
• Representação Gráfica de Estatísticos
Complementos de Matemática e Estatística – Estatística Descritiva
Distribuições de Frequência
TABELA DE FREQUÊNCIAS
Distribuições de Frequência
60 RELATIVAS ACUMULADAS
50
40
120
30
60
60
50 40
Freq. Relativas (%)
40
20
30
0
20 495 497 499 501 503 505 507 509
ConsumoPeso (g)
(kWh)
10
0
495-497 497-499 499-501 501-503 503-505 505-507 507-509
Consumo (kWh)
Peso (g)
Complementos de Matemática e Estatística – Estatística Descritiva
Curvas de Frequência
bimodal multimodal
Complementos de Matemática e Estatística – Estatística Descritiva
N
Dados não agrupados
x + x + + xN x x i
Dados agrupados
k
Sendo a amostra constituída por N
f A1 pm1 + f A2 pm2 + + f Ak pmk f Ai pmi
f pm = f pm
dados agrupados em k classes, x= = i =1
= A A
f Ai
f A N
respectiva frequência absoluta (fA) ou i =1
k
x = f r1 pm1 + f r2 pm2 + + f rk pmk = f ri pmi = f r pm
i =1
Complementos de Matemática e Estatística – Estatística Descritiva
Mediana
A Mediana de um conjunto de dados, organizados por ordem crescente ou
decrescente de grandeza, é o valor central ou a média aritmética dos dois valores
centrais, consoante o número de dados é ímpar ou par, respectivamente.
Moda
A moda é o valor que ocorre com maior frequência. A moda pode não existir, e se existir
pode não ser única.
d1
Mod = Linf + c
d1 + d 2
em que:
Linf limite inferior da classe que contém a moda;
c amplitude da classe modal;
d1 diferença entre as frequências absolutas da classe modal e da classe anterior;
d 2 diferença entre as frequências absolutas da classe modal e da classe seguinte.
Complementos de Matemática e Estatística – Estatística Descritiva
Média Geométrica
MG = N x1 x 2 x 3 x N = (x1 x 2 x 3 x N )
1
N
Média Harmónica
1 N
MH = N
=
1
x
1 1
N i =1 x i
Quando se trabalha com grandezas inversamente proporcionais
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Localização
Quantis: quartis, decis e percentis
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Localização
Quantis: quartis
1º Quartil, Q1 Posição:
N 1
+
4 2
Medidas de Localização
Quantis: decis
Medidas de Localização
Quantis: percentis
P50 Q2 M
P75 Q3
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Localização
Quantis: quartis
Quando os dados se referem a uma variável contínua e se apresentam agrupados, os
valores dos quantis podem ser aproximados por expressões idênticas à da mediana, com
as devidas adaptações.
Exemplo da expressão para o 3º quartil:
3N
− f AaA
Q3 = Linf + c 4
f AQ3
em que:
Medidas de Localização
Quantis: decis
Quando os dados se referem a uma variável contínua e se apresentam agrupados, os
valores dos quantis podem ser aproximados por expressões idênticas à da mediana, com
as devidas adaptações.
Exemplo da expressão para o 7º decil:
7N
− fAaA
D7 = Linf + c 10
fAD7
em que:
Medidas de Localização
Quantis: percentis
Quando os dados se referem a uma variável contínua e se apresentam agrupados, os
valores dos quantis podem ser aproximados por expressões idênticas à da mediana, com
as devidas adaptações.
Exemplo da expressão para o 83º percentil:
83 N
− f AaA
P83 = Linf + c 100
f AP83
em que:
Medidas de Dispersão
Descrevem o grupo de dados em termos da variabilidade existente no grupo
Amplitude Total
R = Máx. − min .
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Dispersão
Descrevem o grupo de dados em termos da variabilidade existente no grupo
Amplitudes Modificadas
Elimina-se uma certa percentagem de dados em cada um dos extremos da distribuição de
dados ordenados. O processo de cálculo inicia-se pela localização e determinação dos
valores dos quantis adequados, seguindo-se o cálculo da diferença entre os respectivos
quantis. As amplitudes modificadas mais usadas são:
Medidas de Dispersão
Desvio Médio
Média do valor absoluto da diferença entre cada valor do
conjunto de dados e a média aritmética da totalidade dos dados.
Dados não agrupados em classes, tem-se a Dados agrupados em classes, a expressão do desvio
expressão seguinte: médio assume as formas seguintes:
DM =
x−x
DM =
(f A pm − x )
ou DM = (f r pm − x )
N
N
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Dispersão
Variância
População 2 ou Amostra s2
(x − x ) 2
x 2
−N x2
s 2
= =
N −1 N −1
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Dispersão
Desvio Padrão
População ou Amostra s
Esta medida de dispersão pode interpretar-se como sendo o valor absoluto de um
desvio “típico” (padrão) dos dados em relação à média.
Dados não agrupados em classes, tem-se a expressão Dados agrupados em classes, a expressão do desvio
seguinte: padrão assume a forma seguinte:
( x − x ) 2
s=
N −1
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Dispersão
Coeficiente de Variação
s
Magnitude relativa do desvio padrão quando comparado com a média da distribuição. v =
x
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Assimetria
Coeficientes de Assimetria
Medem o afastamento da simetria
3 (x − M )
N
N (x i − x )
3
A= i =1
s A=
(N − 1) (N − 2) s 3
Complementos de Matemática e Estatística – Estatística Descritiva
Medidas de Kurtose
Coeficientes de Kurtose
Medida da concentração dos dados, dando indicação sobre a intensidade das
frequências na vizinhança dos valores centrais.
1
Coeficiente de Kurtose:
Q3 − Q1
N
N (N + 1) (x i − x )
4
(N − 1) 2 ou k=
2 (P90 − P10 )
i =1
k= − 3
2
(N − 1) (N − 2) (N − 3) s 4
(N − 2) (N − 3)