Você está na página 1de 39

Universidade Federal de Pelotas

Centro das Engenharias - Ceng

ESTATÍSTICA BÁSICA
Semestre 2013/2

Professora Luana de Melo Pereira

email: estatluana@gmail.com
Plano de ensino

Datas de avaliações

2
http://estatluana.blogspot.com.br

estatluana@gmail.com

3
Universidade Federal de Pelotas
Centro das Engenharias - Ceng

Unidade I – Introdução a estatística


1. CONCEITOS

Luana de Melo Pereira

Disciplina: Estatística Básica


INTRODUÇÃO

 Definição e Aplicações da Estatística


 Conceitos Básicos e a Divisão da Estatística
 Escalas de Medida
 Classificação de Variáveis
 Notação Somatório

5
Parte de perguntas/desafios

Questões relevantes:
 Como verificar a eficiência de uma nova vacina?

6
 Como saber que uma nova variedade de arroz é
melhor que as já existentes?

7
 Que tipo de pessoa consome drogas?

8
 Qual é a preferência eleitoral nas próximas
eleições?

9
 Como se comportam os preços?

10
 Como uma montadora de automóveis pode
verificar a qualidade de uma determinada peça
fabricada?

11
Aspectos comuns
 Todas essas questões buscam algum tipo de informação
relevante para algum tipo de situação;

 Não há possibilidade de examinar todos os casos


• Custo
• Tempo
• Desconhecimento dos efeitos
• Será que é necessário analisar todos os casos?

Necessidade de uma metodologia


que permita analisar alguns casos “Não é preciso beber
e generalizar as conclusões toda a garrafa para
Metodologia para fazer inferência saber se o vinho é
bom!”
12
Conceito de Estatística
 Sinônimo de dado numérico;
 A metodologia estatística se propõem ao planejamento,
coleta, organização, resumo, apresentação e análise de
dados;
 A estatística propicia uma tomada de decisão na presença
da incerteza provocada pela aleatoriedade;
 É parte do método científico

Compreender adequadamente a
metodologia estatística implica no
conhecimento do contexto de pesquisa.
13
ESTATÍSTICA - Divisão

ESTATÍSTICA INFERÊNCIA
DESCRITIVA ESTATÍSTICA

PROBABILIDADE
Trata do
resumo e da
apresentação Estudo de populações a
de dados partir de amostras

14
Limitações

 A estatística não corrige erros grosseiros e técnicas


defeituosas. Como toda informação está contida nos dados,
se estes forem falsos ou viciados será falsa qualquer
conclusão que deles for retirada;

 Não substitui o julgamento crítico do pesquisador;

15
Alguns conceitos básicos:

 População
 Amostra
 Amostragem

 Unidade de observação

16
 População: é o conjunto de TODAS as unidades
(elementos) de interesse que têm pelo menos uma
característica em comum.

 Amostra é parte de uma população, convenientemente


escolhida, que tem a finalidade de representá-la.
Deve apresentar as mesmas características da população.

 Amostragem é a metodologia de obtenção das amostras.

 Unidade de observação é o indivíduo onde são medidas


as variáveis de interesse. Exemplos: aluno, planta, animal

17
Unidades

Exemplo: Pesquisas eleitorais no RS


Característica definidora  votar no RS

População  conjunto de todos os eleitores que votam no RS

Unidade de pesquisa  o eleitor


18
Conceitos fundamentais

 Características e variáveis
 Escalas de medida
 Classificação de variáveis

19
Conceitos fundamentais
 Em geral, o interesse da pesquisa se limita a algumas
características da unidade da população que serão
mensuradas na unidade de pesquisa.

Escala de medida é a definição do modo como será


realizada a mensuração.

Variável é uma característica para a qual foi definida uma


escala de medida.

20
Escalas de medida

Estabelece a forma como os valores serão atribuídos às


alternativas das características. As variáveis podem ser
expressas em quatro escalas distintas:

Nominal

Ordinal

Intervalar

Racional (de razão)

21
Escala nominal
O máximo que se pode dizer de um objeto é que ele é
diferente de outros.
Exemplos
 Sexo de estudantes (0 - Masculino, 1 - Feminino);
 Religião (0 - Católico, 1 - Evangélico);
 Nomes de cidades (0 - Pelotas, 1 - Rio Grande, 2 - Porto Alegre).

 Não é possível estabelecer qualquer


relação de ordem entre eles;
Dados expressos
em escala nominal  Números não têm nenhum significado
para efeito de cálculos. Apenas a
contagem por categoria faz sentido.
22
Escala ordinal
O máximo que se pode dizer de um objeto é que ele é maior,
melhor, mais colorido, etc. que outros.
Exemplos
 Grau de instrução:
1 - fundamental, 2 - médio, 3 - graduação e 4 – pós-graduação
 Classificação de alunos num teste de estatística:
1 - ruim, 2 - regular, 3 - bom e 4 - muito bom
 Faixa etária:
0 - criança, 1 - jovem, 2 - adulto e 3 - idoso

Dados expressos  É possível associar a eles valores


em escala ordinal que representam as ordens.

23
Escala intervalar
O máximo que se pode dizer de um objeto é que ele é tantas
unidades maior que outros.
Exemplos
 Temperatura (em graus Celsius) : 5ºC, 10ºC e 20ºC
Se em 3 dias consecutivos a temperatura atingir 5ºC, 10ºC e 20ºC num
certo horário, não faz sentido dizer que o 3º dia esteve 2 vezes mais
quente que o segundo.

 Análogo à escala ordinal, mas possui


Dados expressos uma unidade de medida que permite
em escala determinar as diferenças entre os
dados.
intervalar
 Não possui um ponto de partida (zero é
uma convenção).
24
Escala racional
O máximo que se pode dizer de um objeto é que ele é tantas
vezes maior ou mais pesado que outros.
Exemplos
Pesos e estaturas
 Distância percorrida em km
 Duração de filmes
Se uma peça pesa 20Kg e outra pesa 10 Kg, então faz sentido dizer que
a primeira pesa o dobro da segunda.

 Análogo à escala intervalar, com a


Dados expressos
propriedade adicional de ter um ponto
em escala
de partida zero que significa ausência
racional de quantidade.
25
Escalas de medida

Metodologia Operações
Estatística realizadas

4º nível: escala racional

3º nível: escala intervalar

2º nível: escala ordinal

1º nível: escala nominal

A complexidade e a informação
aumentam com o nível.
26
Classificação de variáveis

Nominais
Categóricas
Ordinais
Variáveis
Discretas
Numéricas
Contínuas

27
 Variáveis categóricas

Seus valores representam categorias ou classes

Possuem um conjunto limitado de valores que se repetem


para todas as observações

Cada valor da variável é denominado nível

São subdivididas em variáveis categóricas nominais e


ordinais.

28
Nominais não há sentindo de ordem entre seus níveis.
Exemplos: sexo (masculino e feminino)
região geográfica (norte, sul, leste e oeste)
estado civil (solteiro, casado e divorciado)

Ordinais há sentido de ordem entre seus níveis


Exemplos: faixa etária (criança, adulto, idoso)
Intensidade de cor (claro, médio, escuro)
nível de instrução (fundamental, médio, universitário)

29
 Variáveis numéricas
Seus valores são números reais
São subdivididas em variáveis numéricas discretas e contínuas.

Discretas
 Descrevem dados discretas ou de enumeração.
(Obtidos por processo de contagem)
 Assumem valores inteiros não negativos (0,1,2,3,....)
Exemplos: número de sementes germinadas, de pacientes que se
recuperam, de filhos de um casal, etc.
Contínuas
 Descrevem dados contínuos ou de mensuração.
(Obtidos por processo de medição)
 Podem assumir qualquer valor dos reais (-10,0,π....)
Exemplos: peso, altura, tempo, teor de umidade, temperatura, etc.
30
Exercício
Classifique as variáveis abaixo e identifique suas escalas de medida:
a) Número de peças em uma montadora
b) Vazão de fluido em uma bomba
c) Valor gasto em um supermercado
d) Temperatura de uma caldeira
e) Número de geradores com defeito em uma usina
f) Modelo de uma motosserra
g) Grau de escolaridade
h) Consumo de óleo lubrificante em um pistão pneumático
i) Religião

Nominal Discreta escala intervalar


Categórica Numérica
Ordinal Contínua escala racional
31
Respostas

a) Variável numérica discreta – escala racional


b) Variável numérica contínua – escala racional
c) Variável numérica contínua – escala racional
d) Variável numérica contínua – escala intervalar
e) Variável numérica discreta – escala racional
f) Variável categórica nominal – escala nominal
g) Variável categórica ordinal – escala ordinal
h) Variável numérica contínua – escala racional
i) Variável categórica nominal – escala nominal

32
Um conjunto de dados com: 17 unidades ou observações; 1 variável
identificadora, 1 variável categórica e 3 variáveis numéricas contínuas

i Nome Sexo Idade Estatura Peso


1 Alfredo M 14 1,75 51,03
2 Carol F 14 1,60 46,49
3 Jane F 12 1,52 38,33
4 João M 12 1,50 45,13
5 Luísa F 12 1,43 34,93
6 Roberto M 12 1,65 58,06
7 William M 15 1,69 50,80
8 Bárbara F 13 1,66 44,45
9 Juca M 12 1,46 37,65
10 Joca M 13 1,59 38,10
11 Judite F 14 1,63 40,82
12 Felipe M 16 1,83 68,04
13 Tomas M 11 1,46 38,56
14 Alice F 13 1,44 38,10
15 Henrique M 14 1,61 46,49
16 Janete F 15 1,59 51,03
17 Joice F 11 1,30 22,91
33
Representação de variáveis

Variáveis  letras maiúsculas (X, Y, Z)

Valores da variável (dados)  letras minúsculas (x, y, z)

Exemplo: Se uma variável é representada por X, todos os


seus valores serão representados por x.

Diferenciação dos valores da variável  acrescenta-se


um índice i ao x
xi  conjunto de valores

Se i = 1, 2, ..., n, então, xi = x1, x2, x3, ..., xn


34
Notação somatório

 Variáveis numéricas estão presentes em quase todas as


pesquisas onde são aplicados métodos estatísticos;

 Como o processo de decisão é quase sempre obtido em


termos “médios” a notação soma adquire uma grande
importância na descrição das metodologias.

35
i é o número da observação, tal que i = 1, 2, ..., n
n é o número total de observações

i xi yi xi é o valor da variável X para a observação i, tal


1 1 2 que x1 = 1, x2 = 0, ... ,x5 = 4
2 0 1 yi é o valor da variável Y para a observação i, tal
3 2 -2
que y1 = 2, y2 = 1, ... ,y5 = 0
4 -1 1
5 4 0 x(i) é o valor da variável X para a observação i, tal
que x(1)  x(2)  ... x(n)
x(1) é o menor valor da variável X
x(n) é o maior valor da variável X

36
Somatório ()
 indica a soma sequencial de um conjunto de valores
5
x1  x 2  x3  x 4  x5   x i
i1
limite superior da soma
n
somatório  xi
i 1
Valores que estão sendo somados

número das observações


limite inferior da soma
n

A notação  inclui todos os valores do intervalo e pode


i1

ser simplificada por  37


Algumas quantidades de interesse:

5
x x x x x   x i2
2 2 2 2 2
1 2 3 4 5
i1
2
 
x1  x2  x3  x 4  x5 
5
   x i 
2

 i 1 
5
x1 y1  x 2 y 2  x3 y3  x 4 y 4  x5 y5   x i y i
i1

x1  x2  x3  x 4  x5 . y1  y2  y3  y 4  y5    xi .  yi
5 5

i1 i1

38
Próxima aula
- Ponto 2.1. Apresentação de Dados

- Ponto 2.2. Distribuição de frequências

39

Você também pode gostar