Você está na página 1de 46

Introdução à Estatística

SUSANA ROSADO
JORGE M. TAVARES RIBEIRO
2008, 2013, 2018, 2020, 2021
FA - UL, LISBOA
Complementos de Matemática e Estatística – Introdução à Estatística

OBJECTIVOS
▪ Fundamentos e conceitos elementares de
Estatística

▪ Bases para a recolha e análise de


informação usando a Estatística

▪ Sensibilização para a necessidade de


tomada de decisões informadas, com base
em estudos estatísticos
Complementos de Matemática e Estatística – Introdução à Estatística

O que é a Estatística?
A palavra Estatística tem a sua origem no latim – status – designação esta que
significa Estado, no sentido político do termo. Segundo diversos autores, o termo
Estatística foi usado pela primeira vez em 1589 pelo historiador italiano Girolamo
Ghilini num estudo – “civile, politica, statistica e militare scienza”.

INTERNATIONAL STATISTICAL INSTITUTE


A mais antiga organização científica não governamental do mundo
Complementos de Matemática e Estatística – Introdução à Estatística

O que é a Estatística?

a Estatística é a ciência que se dedica à obtenção de


dados e respectivo tratamento inicial, com a finalidade de,
através da aplicação adequada do cálculo de probabilidades,
inferir de uma amostra para a população, e eventualmente
mesmo prever a evolução futura de um fenómeno
(previsão).
Complementos de Matemática e Estatística – Introdução à Estatística

A obtenção de dados

A Amostragem é a disciplina que


se ocupa das questões
associadas à obtenção de
amostras convenientes,
nomeadamente no que respeita à
dimensão, que deve ser
adequada para a obtenção de
estimativas populacionais com a
precisão que interessa.

O Planeamento de Experiências é a disciplina complementar da Amostragem, no que respeita à obtenção dos


dados. Com efeito, quando se pretende estabelecer relações entre variáveis é mais importante ainda “produzir”
os dados que devem ser analisados, ou pelo menos controlar tudo quanto se possa controlar, aleatorizar o que
não for possível controlar.
Complementos de Matemática e Estatística – Introdução à Estatística

A obtenção de dados
Inquirindo um número restrito de pessoas, com a condição de que
estas tenham sido corretamente escolhidas, é possível obter as
mesmas informações, com uma certa margem de erro (erro
quantificável), que se pode tornar suficientemente pequeno.

A Amostra deve apresentar características


idênticas às da população, i.e., deve ser
representativa.
A amostra é representativa se os elementos que a constituem
forem escolhidas por um processo tal que todos os elementos da
população tenham a mesma probabilidade de fazer parte da
amostra.
Complementos de Matemática e Estatística – Introdução à Estatística

A obtenção de dados
Complementos de Matemática e Estatística – Introdução à Estatística

A obtenção de dados
Complementos de Matemática e Estatística – Introdução à Estatística

Dimensionamento de amostras
Recolher e tratar uma amostra grande de mais para os resultados que se
pretendem obter, constitui um evidente desperdício de recursos;

Recolher uma amostra cuja dimensão não é suficiente para se poderem


tirar conclusões, constitui um erro.

A dimensão requerida para as amostras aumenta , à medida que:

• A margem de erro melhora (um limite em que temos confiança na diferença


entre um valor estimado e o valor verdadeiro);
•O grau de confiança do intervalo aumenta (i.e. uma medida de quanta
confiança temos numa dada margem de erro).
Complementos de Matemática e Estatística – Introdução à Estatística

Dimensionamento de amostras
Complementos de Matemática e Estatística – Introdução à Estatística

O tratamento inicial
O tratamento inicial compreende a ordenação, o cálculo
de características amostrais, o agrupamento em classes,
as representações gráficas – em suma, aquilo que constitui um dos
ramos da Estatística – a estatística descritiva (ou estatística dedutiva) e análise
exploratória de dados.

O outro ramo da Estatística – a inferência estatística (ou estatística indutiva) – que tem por base a Teoria das
Probabilidades, permite induzir do que se verifica numa amostra para a população de que esta foi extraída, i.e.
tomar decisões sobre hipóteses, estimar parâmetros populacionais a partir das características amostrais
relevantes, comparar populações, relacionar uma variável resposta com variáveis controladas, etc., constituindo
um instrumento de previsão da evolução futura de um fenómeno em estudo.
Complementos de Matemática e Estatística – Introdução à Estatística

Classificações da Estatística

ESTATÍSTICA DESCRITIVA ou DEDUTIVA

ESTATÍSTICA
ESTATÍSTICA INDUTIVA ou INFERÊNCIA ESTATÍSTICA

Estatística Descritiva ou Estatística Dedutiva – corresponde às


técnicas sistemáticas de organização, classificação, sumarização,
redução e interpretação de dados.

Estatística Indutiva ou Inferência Estatística – é o método científico que


permite obter conclusões (inferir) para um conjunto de elementos –
designado por população ou universo – com base na análise de uma
parte ou amostra deste conjunto.
Complementos de Matemática e Estatística – Introdução à Estatística

Variáveis

Ident. do Estado Preço (103


N.º assoalhadas Área (m2) Garagem Zona
fogo ocupação €)

1 2 76.0 1 1 A 185.000
2 5 140.5 1 0 C 245.000
3 3 102.0 1 1 A 224.500
4 3 122.5 1 1 C 138.500
5 5 245.0 0 0 B 324.700
6 1 55.0 0 0 C 65.000
Complementos de Matemática e Estatística – Introdução à Estatística

Variáveis

CARACTERÍSTICAS VARIÁVEIS

VARIÁVEIS QUALITATIVAS: Não podem ser representadas numericamente

VARIÁVEIS QUANTITATIVAS: São representáveis numericamente

• Var. QUANTITATIVAS DISCRETAS: os valores são observados somente em pontos isolados ao longo de
uma escala (Processos de Contagem);

• Var. QUANTITATIVAS CONTÍNUAS: podem assumir um valor qualquer numa gama de valores de uma
escala (Processos de Medição)
Complementos de Matemática e Estatística – Introdução à Estatística

Escalas de Representação das Variáveis

• Escala NOMINAL: os dados são identificados por um nome que designa uma
classe, sendo as classes:
- Mutuamente exclusivas;
- Exaustivas;
- Não ordenáveis.
• Escala ORDINAL: possibilidade de estabelecer uma ordenação das classes;
• Escala de INTERVALO: os dados são diferenciados e ordenados por números
expressos numa escala com origem arbitrária;
• Escala ABSOLUTA: Tem origem fixa.

Grau crescente de “conhecimento”


Variáveis ESCALAS
Nominal Ordinal Intervalo Absoluta
Qualitativas X X
Quantitativas X X X X
Estatística Descritiva

SUSANA ROSADO
JORGE M. TAVARES RIBEIRO
2007, 2013, 2021
FA - UL, LISBOA
Complementos de Matemática e Estatística – Estatística Descritiva

OBJECTIVOS

▪ Fundamentos e conceitos elementares de


Estatística Descritiva

▪ Sensibilizar e proporcionar o conhecimento


das potencialidades de técnicas de
tratamento estatístico de dados de diferentes
naturezas e proveniências
Complementos de Matemática e Estatística – Estatística Descritiva

DEFINIÇÕES E GENERALIDADES
APLICAÇÕES:
• Engenharia • Física • Informática
• Gestão • Química • Urbanismo
• Medicina • História • Fonética
• Linguística • Psicologia • Agronomia
• Planeamento • Arquitectura • Etc.
Complementos de Matemática e Estatística – Estatística Descritiva

DEFINIÇÕES E GENERALIDADES
POPULAÇÃO ou UNIVERSO – Conjunto de seres (humanos ou não) que são
objecto do estudo estatístico.

AMOSTRA – sub-conjunto de indivíduos que serve os propósitos do


estudo estatístico, com vista a obter conclusões sobre
a população.

INDIVÍDUO ou UNIDADE AMOSTRAL – Cada um dos elementos


da população ou da amostra.
Complementos de Matemática e Estatística – Estatística Descritiva

Distribuições de Frequência
DADOS QUALITATIVOS

Distribuição dos dados por um conjunto de diferentes Categorias ou Classes:


• Tabelas de Frequência;
• Diagramas de Barras;
• Diagramas Circulares.
Complementos de Matemática e Estatística – Estatística Descritiva

Distribuições de Frequência
DADOS QUALITATIVOS

Exemplo: Numa amostra constituída por 120 edifícios, constatou-se que 100
estavam em bom estado de conservação, 15 necessitavam de obras de recuperação
e 5 eram para demolir.

Tabela de Frequências Absolutas e Relativas Diagrama Circular Diagramas de Barras

Categorias fA fr (%) 120

100
4%

Freq. Absolutas
Bom estado 100 83.3 13%
Bom estado de 80
conservação
60
Obras de recuperação 15 12.5
A necessitar de
40
recuperação
A demolir 5 4.2
20
A demolir
Totais 120 100.0 0
83%
Bom estado de A necessitar de A demolir
conservação recuperação

FREQUÊNCIA ABSOLUTA: Número de


indivíduos, Nk, pertencentes a cada uma 90
80

360  f
das K classes, e por consequência K
N =  Nk
70
A= em que:

Ferq. Relativas (%)


60
k =1 N 50
40
FREQUÊNCIA RELATIVA: Proporção
A – ângulo; 30
do número total de dados: 20

f – frequência; 10

N N 0
fr = k ou f r (%) = k  100 N – número de dados
Bom estado de A necessitar de A demolir

N N conservação recuperação
Complementos de Matemática e Estatística – Estatística Descritiva

Distribuições de Frequência
DADOS QUANTITATIVOS
Agrupamento dos dados em Classes ou Categorias,
juntamente com as frequências correspondentes
• Representações Tabular ou Gráfica;
• Estatísticos;
• Representação Gráfica de Estatísticos
Complementos de Matemática e Estatística – Estatística Descritiva

Distribuições de Frequência

Intervalos e limites de classe


Exemplo: Consumo mensal de energia eléctrica (em kWh) de uma série de 180
edifícios de uma cidade.

502.25 499.20 500.24 497.72


498.35 503.76 498.65 499.38
500.36 499.19 500.86 499.83
. . . .
. . . .
. . . .

TABELA DE FREQUÊNCIAS

Consumo (kWh) fA f Aa fr (%) f ra (%)


Intervalo da classe
497.00 – 499.00 39 39 21.7 21.7
Limite superior
499.00 – 501.00 88 127 48.9 70.6
Limite inferior 501.00 – 503.00 31 158 17.2 87.8
503.00 – 505.00 16 174 8.9 96.7
505.00 – 507.00 6 180 3.3 100.0

Totais 180 100.0

lim. superior + lim inferior


AMPLITUDE DA CLASSE: c = lim . superior − lim. inferior PONTO MÉDIO DA CLASSE: pm =
2
Complementos de Matemática e Estatística – Estatística Descritiva

Distribuições de Frequência

REGRAS PARA A ELABORAÇÃO DE DISTRIBUIÇÕES DE FREQUÊNCIAS:

• Determinação do Máximo, do Mínimo e Amplitude Total;


• Divide-se a Amplitude Total por um número razoável de classes (5 a 20);
• Determina-se o número de observações que pertencem a cada classe,
ou seja as frequências de cada classe. Nº de jovens Percentagem do nº de jovens
Classes de (frequências absolutas) (frequências relativas)
Peso (kg)
ni fi
52;55 9 0.45 (ou 45 %)
Exemplo: Numa amostra constituída por 20 jovens 55;58 5 0.25 (ou 25 %)
portugueses do sexo feminino, registaram-se os dados 58;61 4 0.20 (ou 20 %)
referentes ao peso (em kg), conforme o quadro seguinte. 61;64 2 0.10 (ou 10 %)
Totais 20 1.0 (ou 100 %)
52 55 58 54 54 53 64 58 52 54
Nº de jovens Percentagem do nº de jovens
classes de (frequências absolutas) (frequências relativas)
55 56 56 53 58 60 62 54 57 53 Peso (kg)
ni fi
52;55 11 0.55 (ou 55 %)
55;58 6 0.30 (ou 30 %)
58;61 1 0.05 (ou 5 %)
61;64 2 0.10 (ou 10 %)
Totais 20 1.0 (ou 100 %)
Complementos de Matemática e Estatística – Estatística Descritiva

Histogramas e Polígonos de Frequência


HISTOGRAMAS DE FREQUÊNCIAS ABSOLUTAS E RELATIVAS
E POLÍGONO DE FREQUÊNCIAS ABSOLUTAS
100
90
80
70 POLÍGONO DE FREQUÊNCIAS
Freq. Absolutas

60 RELATIVAS ACUMULADAS
50
40
120
30

Freq. Relativas Acumuladas (%)


20
10
100
0
495-497 497-499 499-501 501-503 503-505 505-507 507-509
80
Consumo Peso
(kWh)(g)

60
60

50 40
Freq. Relativas (%)

40
20
30
0
20 495 497 499 501 503 505 507 509

ConsumoPeso (g)
(kWh)
10

0
495-497 497-499 499-501 501-503 503-505 505-507 507-509

Consumo (kWh)
Peso (g)
Complementos de Matemática e Estatística – Estatística Descritiva

Curvas de Frequência

simétrica assimétrica positiva assimétrica negativa

forma J forma J invertido forma U

bimodal multimodal
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Tendência Central

Média aritmética População () ou Amostra X

N
Dados não agrupados
x + x +  + xN x x i

Sendo a amostra constituída por N dados: x= 1 2 = = i =1


N N N

Dados agrupados
k
Sendo a amostra constituída por N
f A1  pm1 + f A2  pm2 +  + f Ak  pmk f Ai  pmi
 f  pm =  f  pm
dados agrupados em k classes, x= = i =1
= A A

correspondendo a cada classe a f A1 + f A2 +  + f Ak k

f Ai
f A N
respectiva frequência absoluta (fA) ou i =1

frequência relativa (fr):


ou

k
x = f r1  pm1 + f r2  pm2 +  + f rk  pmk =  f ri  pmi =  f r  pm
i =1
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Tendência Central

Mediana
A Mediana de um conjunto de dados, organizados por ordem crescente ou
decrescente de grandeza, é o valor central ou a média aritmética dos dois valores
centrais, consoante o número de dados é ímpar ou par, respectivamente.

Deste modo, a Mediana divide os dados ordenados em duas partes iguais.


Quer para o caso de dados agrupados, quer para
o caso de dados não agrupados, a posição da
N 1
 + 
mediana é dada por:  2 2

Quando os dados se referem a uma variável contínua e se apresentam


agrupados, o valor da mediana é aproximadamente igual a:

Linf - limite inferior da classe que contém a mediana;


N 
 − f AA  - amplitude da classe que contém a mediana;
a c

M = Linf + c  2  em que: N - número de observações da distribuição de frequência;


 f AM 
  f AaA - frequência absoluta acumulada da classe anterior à classe que contém a mediana;
 
f AM - frequência absoluta da classe que contém a mediana.
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Tendência Central

Moda
A moda é o valor que ocorre com maior frequência. A moda pode não existir, e se existir
pode não ser única.

Quando os dados se referem a uma


variável contínua e se apresentam
agrupados, o valor da moda é
aproximadamente igual a:

 d1 
Mod = Linf + c   
 d1 + d 2 
em que:
Linf limite inferior da classe que contém a moda;
c amplitude da classe modal;
d1 diferença entre as frequências absolutas da classe modal e da classe anterior;
d 2 diferença entre as frequências absolutas da classe modal e da classe seguinte.
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Tendência Central

Relação entre Média, Mediana e Moda

Dá indicações sobre a assimetria da distribuição


Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Tendência Central

Média Geométrica

MG = N x1  x 2  x 3    x N = (x1  x 2  x 3    x N )
1
N

Para comparar medidas em diferentes escalas

Média Harmónica

1 N
MH = N
=
1
x
1 1

N i =1 x i
Quando se trabalha com grandezas inversamente proporcionais
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Localização
Quantis: quartis, decis e percentis
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Localização
Quantis: quartis

Quartis dividem os dados ordenados


em quatro partes iguais, existindo
portanto 3 quartis.

1º Quartil, Q1 Posição:
N 1
 + 
 4 2

2º Quartil, Q2  M Posição:   2N1


 + 
 4 2

3º Quartil, Q3 Posição:   3N1


 + 
 4 2
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Localização

Quantis: decis

Decis dividem os dados ordenados


em dez partes iguais, existindo
portanto 9 decis.
D1 ; D2 ; D3 ; ... ; D9,

sendo o D5 coincidente com a


Mediana.
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Localização

Quantis: percentis

Percentis dividem os dados


ordenados em cem partes iguais,
existindo portanto 99 percentis.
P1 ; P2 ; P3 ; ... ; P99,

sendo o P25 coincidente com o Q1, o


P50 coincidente com o Q2 e por
conseguinte com a Mediana, e o P75
coincidente com o Q3; ou seja:
P25  Q1

P50  Q2  M

P75  Q3
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Localização

Quantis: quartis
Quando os dados se referem a uma variável contínua e se apresentam agrupados, os
valores dos quantis podem ser aproximados por expressões idênticas à da mediana, com
as devidas adaptações.
Exemplo da expressão para o 3º quartil:

 3N 
 − f AaA 
Q3 = Linf + c  4 
 f AQ3 
 
 

em que:

Linf - lim. inf. da classe que contém o 3º quartil;

c - ampl. da classe que contém o 3º quartil;

N - nº de obs. da distribuição de frequência;

f AaA - freq. absol. acumulada da classe anterior


à classe que contém o 3º quartil;

f AQ3 -freq. absol. da classe que contém


o 3º quartil.
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Localização

Quantis: decis
Quando os dados se referem a uma variável contínua e se apresentam agrupados, os
valores dos quantis podem ser aproximados por expressões idênticas à da mediana, com
as devidas adaptações.
Exemplo da expressão para o 7º decil:

 7N 
 − fAaA 
D7 = Linf + c   10 
 fAD7 
 
 

em que:

Linf - lim. inf. da classe que contém o 7º decil;

c - ampl. da classe que contém o 7º decil;

N - nº de obs. da distribuição de frequência;

f AaA - freq. absol. acumulada da classe anterior


à classe que contém o 7º decil;

f AD7 -freq. absol. da classe que contém


o 7º decil.
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Localização

Quantis: percentis
Quando os dados se referem a uma variável contínua e se apresentam agrupados, os
valores dos quantis podem ser aproximados por expressões idênticas à da mediana, com
as devidas adaptações.
Exemplo da expressão para o 83º percentil:

 83  N 
 − f AaA 
P83 = Linf + c   100 
 f AP83 
 
 

em que:

Linf - lim. inf. da classe que contém o 83º percentil;

c - ampl. da classe que contém o 83º percentil;

N - nº de obs. da distribuição de frequência;


f AaA - freq. absol. acumulada da classe anterior
à classe que contém o 83º percentil;

fAP83 - freq. absol. da classe que contém o 83º


percentil.
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Dispersão
Descrevem o grupo de dados em termos da variabilidade existente no grupo

Amplitude Total
R = Máx. − min .
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Dispersão
Descrevem o grupo de dados em termos da variabilidade existente no grupo

Amplitudes Modificadas
Elimina-se uma certa percentagem de dados em cada um dos extremos da distribuição de
dados ordenados. O processo de cálculo inicia-se pela localização e determinação dos
valores dos quantis adequados, seguindo-se o cálculo da diferença entre os respectivos
quantis. As amplitudes modificadas mais usadas são:

50 % dos valores centrais, 80 % dos valores 90 % dos valores


ou amplitude interquartis centrais centrais

R 50 = Q3 − Q1 = P75 − P25 R 80 = D9 − D1 = P90 − P10 R 90 = P95 − P5


Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Dispersão
Desvio Médio
Média do valor absoluto da diferença entre cada valor do
conjunto de dados e a média aritmética da totalidade dos dados.

Dados não agrupados em classes, tem-se a Dados agrupados em classes, a expressão do desvio
expressão seguinte: médio assume as formas seguintes:

DM =
 x−x
DM =
 (f A  pm − x )
ou DM =  (f r  pm − x )
N
N
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Dispersão

Variância

População 2 ou Amostra s2

Dados não agrupados em classes, tem-se a Dados agrupados em classes, a expressão da


expressão seguinte: variância assume a forma seguinte:

 (x − x ) 2
 x 2
−N x2
s 2
= =
N −1 N −1
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Dispersão
Desvio Padrão
População  ou Amostra s
Esta medida de dispersão pode interpretar-se como sendo o valor absoluto de um
desvio “típico” (padrão) dos dados em relação à média.

Dados não agrupados em classes, tem-se a expressão Dados agrupados em classes, a expressão do desvio
seguinte: padrão assume a forma seguinte:

 ( x − x ) 2

s=
N −1
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Dispersão

Coeficiente de Variação
s
Magnitude relativa do desvio padrão quando comparado com a média da distribuição. v =
x
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Assimetria

Coeficientes de Assimetria
Medem o afastamento da simetria

Assimetria = 0 Distribuição simétrica


Assimetria > 0 Distribuição assimétrica positiva
Assimetria < 0 Distribuição assimétrica negativa

Coeficiente de Assimetria de Pearson: Coeficiente de Assimetria:

3  (x − M )
N
N   (x i − x )
3
A= i =1
s A=
(N − 1)  (N − 2)  s 3
Complementos de Matemática e Estatística – Estatística Descritiva

Medidas de Kurtose
Coeficientes de Kurtose
Medida da concentração dos dados, dando indicação sobre a intensidade das
frequências na vizinhança dos valores centrais.

1
Coeficiente de Kurtose:

Q3 − Q1
N
N  (N + 1)   (x i − x )
4

(N − 1) 2 ou k=
2  (P90 − P10 )
i =1
k= − 3
2
(N − 1)  (N − 2)  (N − 3)  s 4
(N − 2)  (N − 3)

k < 0.263 Distribuição leptocúrtica


k = 0.263 Distribuição mesocúrtica

k > 0.263 Distribuição platicúrtica

• Ambas as amostras são simétricas;


• N1 = N2;
• Ambas as amostras têm iguais medidas de
localização central e de dispersão.

Na amostra da distribuição 1 (Kurtose mais elevada) existe uma


maior concentração de dados no centro e nas caudas, e menor
concentração nos intervalos que separam aquelas zonas.

Você também pode gostar