Você está na página 1de 18

Introdução à Estatística 1-1

Rodrigo Almeida Martins


Email: rodrigom@fe.uc.pt
1

F.E.U.C. Estatística - MBA

O que é a Estatística?
Estatística é a ciência dos dados. Envolve recolher, classificar, resumir,
organizar, analisar e interpretar informação numérica.

Para que serve?

• Previsão.
• Tomada de decisão.
• Compreensão da realidade.

É utilizada em grande parte dos ramos da ciência, como por exemplo:


Economia, Medicina, Física, Gestão, Engenharia…
Rodrigo Martins 2

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-2

F.E.U.C. Estatística - MBA

Tipos de dados

Tipos de
dados

Dados Dados
quantitativos qualitativos

Rodrigo Martins 3

F.E.U.C. Estatística - MBA

Dados quantitativos

4
943
21 52
Medidos em escala numérica.

• Número de itens defeituosos em um lote. 120 12


• Salários dos directores de uma petrolífera.
• Idades dos funcionários de uma empresa. 8
71 3

Rodrigo Martins 4

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-3

F.E.U.C. Estatística - MBA

Dados qualitativos

Classificados em categorias.

• Tipo de especialização dos estudantes de uma turma.


• Sexo dos funcionários de uma empresa.
• Método de pagamento: dinheiro, cheque, cartão de
crédito.

$ Crédito

Rodrigo Martins 5

F.E.U.C. Estatística - MBA

Distinguir entre população e amostra


[População (ou Universo Estatístico)]

Conjunto de indivíduos, objetos ou unidades estatísticas que apresentam uma ou mais


características em comum e sobre os quais se efetua a análise estatística. A população pode
ser finita ou infinita.

• A população de Coimbra é definida pelo conjunto dos residentes em Coimbra.


• A população de desempregados em Portugal é definida pelo conjunto dos residentes
em Portugal sem emprego.
• A população de empresas portuguesas é definida pelo conjunto das empresas com
sede em Portugal.

Os exemplos destacam que, para definir uma população, é necessário sempre estabelecer um ou mais
critérios (regras) que nos dizem quais os elementos a incluir e excluir dessa população.
Quando procedemos a um estudo estatístico, a população refere-se ao conjunto de elementos de
interesse na investigação.
Quando se pretender obter informação sobre todos os elementos da população, estamos em
presença de um censo.
Rodrigo Martins 6

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-4

F.E.U.C. Estatística - MBA

Distinguir entre população e amostra


Quando se selecionam apenas alguns elementos da população, estamos em presença de uma amostra.

[Amostra]

Subconjunto de elementos da população, normalmente representativo da mesma.

É obvio que ter acesso a dados relativos a todos os elementos de uma população é sempre melhor do
que estar reduzido a uma amostra.

No entanto, grande parte da análise estatística é efetuada recorrendo a amostras.


Os motivos que levam a considerar apenas parte da população estão sobretudo relacionados com o
custo e tempo envolvidos no processo de recolha e análise de dados, devido à dimensão da população
ou à própria dificuldade do processo de recolha de dados.

Rodrigo Martins 7

F.E.U.C. Estatística - MBA

Métodos estatísticos

Métodos
estatísticos

Estatística Estatística
descritiva inferencial

Estatística inferencial e Estatística descritiva são os dois grandes ramos da Estatística.

A distinção entre as duas está intimamente ligada aos conceitos de população e amostra.

Rodrigo Martins 8

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-5

F.E.U.C. Estatística - MBA

Estatística descritiva vs Estatística inferencial


[Estatística descritiva]

Consiste no conjunto de métodos para organizar, descrever e sumariar a informação.

Na Estatística descritiva a população e a amostra são, em geral, uma e a mesma coisa,


portanto, quando calculamos uma qualquer medida descritiva estamos a relatar algo,
não existindo, assim, qualquer grau de incerteza na análise.

$
1. Envolve 50
• Recolher os dados.
• Apresentar os dados. 25

2. Propósito 0
• Descrever os dados. Q1 Q2 Q3 Q4

X = 30,5 S2 = 113

Rodrigo Martins 9

F.E.U.C. Estatística - MBA

Estatística descritiva vs Estatística inferencial


[Estatística inferencial]

Conjunto de métodos que permitem, a partir de informação amostral, estimar e medir a


fiabilidade das conclusões sobre as características de uma população.

A Estatística inferencial recorre à amostra para conhecer algo sobre uma determinada população,
envolvendo estimação e testes. A informação que extraímos da amostra serve para
melhor conhecer a população.
A análise inferencial é feita em ambiente de incerteza, logo recorre à teoria das probabilidades e
correspondentes técnicas estatísticas probabilísticas.
1. Envolve
• Estimar.
• Testar a hipótese.
2. Propósito
• Tomar decisões sobre as características da
população.
Na Estatística descritiva apresentamos factos estatísticos, enquanto que na Estatística inferencial
fazemos afirmações probabilísticas.
Rodrigo Martins 10

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-6

F.E.U.C. Estatística - MBA

Elementos fundamentais da Estatística

• População (Universo)
Todos os itens de interesse.
• Amostra
subconjunto de unidades de uma população.
• Parâmetro
Medida numérica com base na população
• Estatística
Medida numérica com base na amostra.
• Unidade experimental
Objecto (pessoa, coisa, evento…) a partir do qual
recolhemos dados.
• Variável
Característica ou propriedade da unidade experimental.

Rodrigo Martins 11

F.E.U.C. Estatística - MBA

Amostragem
A amostragem é o processo pelo qual recolhemos dados.
A amostra dá-nos apenas uma imagem imprecisa da população em estudo.
Devemos sempre esperar algumas diferenças entre a amostra e a população.
Numa análise por amostragem, há sempre a considerar o chamado erro de amostragem.

TIPOS DE AMOSTRA:
• Amostras aleatórias: quando é dada igual e independente probabilidade de seleção a todos os
membros de um grupo (população).

• Amostras não aleatórias: A seleção dos elementos da amostra é feita através de escolha pessoal.
As amostras não aleatórias incluem:
o Amostras de conveniência quando escolhemos os elementos apenas por estarem mais
próximos de nós. (Exemplo: Quando fazemos um inquérito em Coimbra para conhecer a
realidade de Portugal)
o Amostras de quota quando os elementos que compõem a amostra são de determinadas
características. (Exemplo: Quando queremos inquirir 50 homens e 50 mulheres, cabendo
ao inquiridor escolher quem entrevista)
o Amostras de opinião. Exemplo: Quando o investigador recolhe dados numa freguesia
porque acha que essa freguesia é representativa do concelho à qual pertence) 12
Rodrigo Martins

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-7

F.E.U.C. Estatística - MBA

Softwares estatísticos

1. Software típico
• SPSS.
• MINITAB.
• Excel.
2. Necessidade do entendimento
estatístico
• Suposições.
• Limitações.

Rodrigo Martins 13

F.E.U.C. Estatística - MBA

Apresentando graficamente dados qualitativos


Tradicionalmente, quando se trata de variáveis discretas, utilizamos o
gráfico de barras.
Exemplo:

Um analista quer mostrar as shares de mercado dos navegadores


de Internet em Portugal para o ano de 2018.

Navegador Share (%)


Chrome 68,11
Safari 12,4
Firefox 6,95
Explorer 3,28
Edge 3,29
Opera 1,55
Outros 4,42
Rodrigo Martins

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-8

F.E.U.C. Estatística - MBA

Solução do gráfico de barras


A altura da barra
As barras têm a
mostra a
mesma largura.
frequência ou %.

Share dos Browsers: Portugal 2018


80

70

60

50
Barras verticais
% 40
para variáveis
Valor total 30
qualitativas.
também é 20

usado. 10

0
Chrome Safari Firefox Explorer Edge Opera Outros
Browser
Ponto zero.

Diagrama de Pareto: É como o gráfico de barras, mas com as categorias dispostas


por altura, em ordem decrescente, da esquerda para a direita.
Rodrigo Martins 15

F.E.U.C. Estatística - MBA

Apresentando graficamente dados quantitativos


Tradicionalmente, quando se trata de variáveis continuas, utilizamos o
histograma.

Exemplo: Amostra: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38

Classe Ponto médio Frequência

15,5 – 25,5 20,5 3


Largura
25,5 – 35,5 30,5 5

35,5 – 45,5 40,5 2

Limites (Limite inferior + Limite superior) / 2

Rodrigo Martins 16

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-9

F.E.U.C. Estatística - MBA

Histograma

Classe Freq.
Contagem 15,5 – 25,5 3
5 25,5 – 35,5 5
35,5 – 45,5 2
4
Neste caso usamos
a Frequência total, 3
mas poderíamos
usar em alternativa 2 Contacto entre
a % de cada classe as barras
(freq. relativa) 1
0

0 15,5 25,5 35,5 45,5 55,5


classes
Rodrigo Martins 17

F.E.U.C. Estatística - MBA

Propriedades dos dados numéricos

Notação padrão

Medida Amostra População

Média 𝑥̅ 𝜇
Desvio-padrão 𝑆 𝜎

Variância 𝑆 𝜎

Tamanho 𝑛 𝑁

Rodrigo Martins 18

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-10

F.E.U.C. Estatística - MBA

Dados numéricos, propriedades e medidas

Propriedades dos
dados numéricos

Tendência Variação ou Posicionamento


central dispersão relativo

Média Amplitude Percentil

Mediana Amplitude interquartil Score-z


Moda Variância
Desvio-padrão

Rodrigo Martins 19

F.E.U.C. Estatística - MBA

Medidas de tendência central


Média
1. Medida da tendência central.
2. É a medida mais comum.
3. Age como um “ponto de equilíbrio”.
4. É afectada por valores extremos (outliers).
5. Fórmula (média da amostra):

∑ 𝑋 𝑋 + 𝑋 + ⋯+ 𝑋
𝑋= =
𝑛 𝑛

Rodrigo Martins 20

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-11

F.E.U.C. Estatística - MBA

Exemplo do cálculo da média

Amostra: 10,3 4,9 8,9 11,7 6,3 7,7

∑ 𝑋 𝑋 + 𝑋 + ⋯+ 𝑋
𝑋= =
𝑛 𝑛
10 ,3  4,9  8,9  11,7  6,3  7,7

6
 8,30
Rodrigo Martins 21

F.E.U.C. Estatística - MBA

Medidas de tendência central

Mediana
1. Medida da tendência central.
2. Valor do meio em sequência ordenada.
• Se n é ímpar, m é o valor do meio.
• Se n é par, m é a média de 2 números inteiros.
3. Posição da mediana na sequência.
4. Não é afectada por valores extremos.

𝑛+1
Ponto de posicionamento:
2

Rodrigo Martins 22

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-12

F.E.U.C. Estatística - MBA

Exemplo do cálculo da mediana.

Amostra de tamanho ímpar

• Amostra 24,1 22,6 21,5 23,7 22,6


• Ordenada 21,5 22,6 22,6 23,7 24,1
• Posição 1 2 3 4 5

n  1 5  1
Ponto de posicionamento:   3,0
2 2

Mediana  22,6

Rodrigo Martins 23

F.E.U.C. Estatística - MBA

Exemplo do cálculo da mediana.

Amostra de tamanho par

• Amostra 10,3 4,9 8,9 11,7 6,3 7,7


• Ordenada 4,9 6,3 7,7 8,9 10,3 11,7
• Posição 1 2 3 4 5 6

n  1 6  1
Ponto de posicionamento    3,5
2 2

Mediana  7,7  8,9  8,30


2

Rodrigo Martins 24

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-13

F.E.U.C. Estatística - MBA

Medidas de tendência central

Moda

1. Medida da tendência central.


2. Valores que ocorrem com mais frequência.
3. Não é afetada por valores extremos.
4. Pode não haver nenhuma moda ou várias.
5. Pode ser usada para dados quantitativos e qualitativos.

Rodrigo Martins 25

F.E.U.C. Estatística - MBA

Exemplo de moda

• Sem moda
Amostra: 10,3 4,9 8,9 11,7 6,3 7,7

• Uma moda
Amostra: 6,3 4,9 8,9 6,3 4,9 4,9

• Mais de 1 moda
Amostra: 21 28 28 41 43 43

Rodrigo Martins 26

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-14

F.E.U.C. Estatística - MBA

Resumo das medidas de tendência central

Medida Fórmula Descrição


Média  X i / n Ponto de equilíbrio

(n  1) Valor do meio
Mediana Posição quando ordenado
2
Moda Nenhuma Mais frequente

Rodrigo Martins 27

F.E.U.C. Estatística - MBA

Para reflexão

$400.000

$70.000

... Os empregados reclamam dos


$50.000 salários baixos.
... O presidente afirma que a média
$30.000 salarial na empresa é elevada.

$20.000
Rodrigo Martins 28

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-15

F.E.U.C. Estatística - MBA

Para reflexão

$400.000

$70.000 Média= 70 000

$50.000

$30.000 Mediana= 30 000

$20.000 Moda= 20 000

Rodrigo Martins 29

F.E.U.C. Estatística - MBA

Medidas de dispersão

Amplitude
1. Medida de dispersão.
2. Diferença entre observações maiores e menores.
Amplitude = Xmaior – Xmenor.
3. Ignora como os dados são distribuídos.

7 8 9 10 7 8 9 10
amplitude = 10 – 7 = 3 amplitude = 10 – 7 = 3

Rodrigo Martins 30

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-16

F.E.U.C. Estatística - MBA

Medidas de dispersão

Variância e desvio-padrão

1. Medidas mais comuns.


2. Considera como os dados são distribuídos.
3. Mostra a variação relativamente à média.

X = 8,3

4 6 8 10 12

Rodrigo Martins 31

F.E.U.C. Estatística - MBA

Fórmula de cálculo da variância da amostra

∑ 𝑋 −𝑋
𝑆 =
𝑛−1
𝑋 −𝑋 + 𝑋 −𝑋 +⋯+ 𝑋 −𝑋
𝑆 =
𝑛−1
O desvio-padrão (S) é a raiz
quadrada positiva da
variância: 𝑆 = 𝑆 n - 1 no denominador! (Use
N se estiver a calcular a
variância da população).

Rodrigo Martins 32

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-17

F.E.U.C. Estatística - MBA

Exemplo do cálculo da variância e desvio-padrão

Amostra: 10,3 4,9 8,9 11,7 6,3 7,7

∑ 𝑋 −𝑋 ∑ 𝑋
𝑆 = 𝑋= = 8,3
𝑛
𝑛−1

2 2 2
2 (10,3  8,3 )  (4,9  8,3 )  …  (7,7  8,3 )
S 
6  1

 6,368

S = 6,368 = 2,52
Rodrigo Martins 33

F.E.U.C. Estatística - MBA

Medidas numéricas de posicionamento relativo

score-z

• Descreve a posição relativa de uma medição comparada


com o resto dos dados.

Score-z de uma amostra Score-z de uma população

𝑋−𝑋 𝑋−𝜇
𝑧= 𝑧=
𝑠 𝜎

• Mede o número de desvios-padrão fora da média em que se


situa um determinado valor.

Rodrigo Martins 34

Rodrigo Martins MBA- FEUC


Introdução à Estatística 1-18

F.E.U.C. Estatística - MBA

Exemplo de score-z
O tempo médio para montar um produto é 22,5 minutos, com um
desvio-padrão de 2,5 minutos.
1. Encontre o score-z de um item que demorou 20 minutos para ser
montado.
2. Encontre o score-z de um item que demorou 27,5 minutos para
ser montado.

1. 𝑿 = 𝟐𝟎 𝜇 = 22,5 𝜎 = 2,5
𝑋 − 𝜇 20 − 22,5
𝑧= = = −1
𝜎 2,5

2. 𝑿 = 𝟐𝟕, 𝟓 𝜇 = 22,5 𝜎 = 2,5

𝑋 − 𝜇 27,5 − 22,5
𝑧= = =2
𝜎 2,5

Rodrigo Martins 35

Rodrigo Martins MBA- FEUC

Você também pode gostar