Você está na página 1de 58

Probabilidade e

Estatística III

fabiano@ime.uerj.br
Probabilidade e Estatística III

Ementa:

Fenômenos da Natureza. Conceitos Fundamentais.


Processo Estatístico. Tipos de Variáveis. Amostragem.
Estatística Descritiva. Análise de Dados. Introdução à
Teoria das Probabilidades. Distribuições Discretas de
Probabilidades. Distribuições Contínuas de
Probabilidades. Introdução à Inferência Estatística.
Probabilidade e Estatística III

Referências Bibliográficas:

- Meyer, P. L. Probabilidades Aplicações a Estatística, Ed LTC,


2000.
- Bussab, W; Moretin, P. Estatística Básica, Ed. Saraiva, 2003.
- Morettin, L. G. Estatística Básica, Ed. Pearson Education do Brasil,
1999.
- Montgomery, D.C. Runger, G.C. Hubele, N.F. Estatística Aplicada à
Engenharia, Ed. LTC, 2003.
- Costa Neto, P.L. Estatística - Rev. e Ampl. Ed. Blucher, 2002.
Fenômenos da Natureza

Determinísticos
x
Aleatórios
Alguns conceitos importantes

Método: é um conjunto de meios dispostos convenientemente


para se chegar a um fim que se deseja.

Método experimental: consiste em manter constantes todas as


causas (fatores), menos uma, e variar esta causa de modo que o
pesquisador possa descobrir seus efeitos, caso existam.

Método estatístico: diante da impossibilidade de manter as


causas constantes, admite todas essas causas presentes
variando-as, registrando essas variações e procurando
determinar, no resultado final, que influências cabem a cada uma
delas.
Alguns conceitos importantes

População: é um conjunto de indivíduos ou objetos que


apresentam pelo menos uma característica em comum. A
população pode ser finita ou infinita, dependendo do número de
elementos. Na prática, quando uma população é finita, com um
número grande de elementos, considera-se como população
infinita.

Amostra: considerando-se a impossibilidade, na maioria das


vezes, do tratamento de todos os elementos da população,
retiramos uma parcela da população, denominada amostra, desde
que essa amostra mantenha as características da população.
O que é estatística?

A Estatística basicamente se divide em 3 partes, a saber:

Estatística Descritiva: Essa parte da Estatística utiliza números


para descrever fatos. Compreende a coleta, a organização, o
resumo e, em geral, a simplificação de informações que podem
ser muito complexas.

Cálculo das Probabilidades: É utilizado para analisar situações


que envolvem o acaso (fatores aleatórios).

Inferência: Diz respeito a coleta, redução, análise e


interpretação de dados amostrais, a partir do que, tira-se
conclusões sobre a população na qual os dados (amostra) foram
obtidos.
Processo Estatístico

Observação:
Como as informações provêm de um conjunto menor que a população, é comum a existência de
erros ao se fazer uma inferência. Esses erros são quantificados por um valor numérico,
denominado probabilidade. O erro mencionado neste contexto não deve ser confundido com
engano, erro de mensuração. É consequência inevitável da tentativa de generalizações ou da
flutuação de amostra para amostra.
A Estatística

amostragem
POPULAÇÃO: todos os
possíveis consumidores
Amostra: um subconjunto dos
consumidores

inferência

A essência de uma análise estatística é tirar conclusões sobre


uma população, ou universo, com base em uma amostra de
observações.
A Estatística

1718
35 29
22
28 24 28
30 33
18 23 17
28
42 28 21 22
29 73 Distribuição das idades dos funcionários
22 36 33 18 14

12

número de funcionários
10

0
10 20 30 40 50 60 70
idade

A estatística fornece métodos para coletar, organizar, descrever,


analisar e interpretar dados, provenientes de experimentos ou vindos
de estudos observacionais, visando a tomada de decisão
Tipos de variáveis

Em Estatística, variável é atribuição de um número a


cada característica da unidade experimental de uma
amostra ou população.

Vários tipos de variáveis são encontradas no dia-a-dia,


sendo importante a distinção entre as mesmas.

Quando uma característica ou variável é não-numérica,


denomina-se variável qualitativa ou atributo.

Quando a variável é expressa numericamente, denomina-


se variável quantitativa.
Exemplos de variável qualitativa

a) Sexo
b) Educação
c) Estado Civil
d) Religião
e) Cor de olhos
f) Faixa etária

Uma variável qualitativa esta ligada a qualidade do


indivíduo pesquisado.
Exemplos de variável quantitativa

a) Peso
b) Idade
c) Número de filhos
d) Estatura
e) Salário

Uma variável quantitativa esta ligada a contagem ou


mensuração. Uma variável quantitativa pode ser discreta
ou contínua.
Variáveis
Variáveis

Nominal (Ex. cor dos olhos, sexo...)

Qualitativa

Ordinal (Ex. classificação...)

Variável

Discreta (ex. no de alunos, livros...)

Quantitativa

Contínua (Ex. peso, altura, litros...)


Amostragem

• Determinística x Aleatória

• Amostragens aleatórias:
• Amostragem aleatória simples

• Amostragem sistemática

• Amostragem estratificada

• Amostragem por conglomerados


Amostragem Aleatória Simples

• Também conhecida por amostragem casual ou randômica, a


amostragem aleatória simples destaca-se por ser um processo
de seleção bastante fácil e muito usado. Este tipo de
amostragem é equivalente a um sorteio lotérico. Neste
processo, todos os elementos da população têm igual
probabilidade de serem escolhidos, não só antes de ser
iniciado, como também até completar-se o processo de coleta.

• Procedimento:
1 - Numerar todos os elementos da população.
2 - Efetuar sucessivos sorteios com reposição até completar o
tamanho da amostra.
Amostragem Sistemática

• Trata-se de uma variação da amostragem aleatória simples, muito


conveniente quando a população está naturalmente ordenada, pois
quando os elementos da população já se acham ordenados, não há
necessidade de construir o sistema de referência.

• Procedimento:
1. Seja N o tamanho da população e n o tamanho da amostra. Então,
calcula-se o intervalo de amostragem N/n ou o inteiro mais próximo “a”.
2. Sortear um número x entre 1 e “a”.
3. Formar a amostra dos elementos correspondentes ao números: x; x +
a; x +2a:;...x + ( n-1 )a.

• Exemplo:
Seja N = 95 n = 10. Então, 95/10 = 9,5, ou a = 10.
Sorteia-se um número de 1 a 10. Seja 4 ( x = 4 ) o número sorteado.
Logo, os elementos numerados por 4; 14; 24; ... serão os componentes da
amostra.
Amostragem Estratificada

• A amostragem estratificada pressupõe a divisão da população em


subgrupos (estratos) de itens similares, procedendo-se então à
amostragem em cada subgrupo.
Estratificar uma população é dividi-la em L subpopulações
denominadas estratos, tais que: , onde os extratos são mutuamente
exclusivos. Após a determinação dos extratos, seleciona-se uma
amostra aleatória de cada subpopulação.

• Exemplo:
Obter uma amostra para a pesquisa da estatura de 90 alunos de uma
escola, onde 54 sejam meninos e 36 sejam meninas. Teremos dois
estratos ( sexo masculino e sexo feminino) e queremos uma amostra de
20% da população, assim:
Masculino = logo amostra: 11
Feminino = logo amostra: 07
total: 18
Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem
meninos e de 55 a 90, meninas. Efetuamos os sorteios até atingirmos 11
meninos e 07 meninas.
Outros tipos de Amostragem

• Amostragem por conglomerados: Quando é possível


identificar dentro da população subgrupos que representam
uma miniatura da população, podemos escolher um desses
subgrupos como a população e efetuarmos sorteios entre seus
elementos. Na verdade, cada conglomerado pode ser encarado
como uma minipopulação.

• Amostragem múltipla: É um tipo de amostragem bastante


utilizado em processos de Controle de Qualidade, nele retira-se
uma primeira amostra e, conforme o resultado obtido, tiramos
uma segunda amostra, uma terceira etc.
Tabelas Estatísticas

• A tabela é um quadro que resume um conjunto de


observações. Compõe-se de:

• corpo: linhas e colunas que contém os valores das variáveis em


estudo.
• cabeçalho: parte superior que especifica o conteúdo das colunas.
• coluna indicadora: coluna que indica o conteúdo das linhas.
• casa ou célula: espaço destinado a uma só informação.
• título: conjunto de informações sobre a tabela localizada no topo
da tabela.
Exemplo de tabela

PRODUÇÃO DE CAFÉ NO BRASIL


Produção
Anos
(1000 ton)
1991 1221

1992 2234

1993 1254

1994 1445

1995 1112

FONTE: IBGE.
Séries Estatísticas

• Séries históricas, cronológicas, temporais


• Descrevem os valores da variável, em determinado local,
discriminados segundo intervalos de tempo.
• Séries geográficas, espaciais
• Descrevem os valores da variável, em determinado
instante, discriminados segundo regiões.
• Séries específicas ou categóricas
• Descrevem os valores da variável, em determinado tempo e
local, discriminando segundo especificações ou categorias.
• Séries conjugadas
• Constituem-se da conjugação de uma ou mais séries.
Exemplos de Séries

Histórica Geográfiica

Categórica Conjugada
Índices, Coeficientes e Taxas

• Os índices são razões entre duas grandezas tais que uma não inclui a
outra.
• densidade demográfica = população / superfície
• renda per capita = renda / população

• Os coeficientes são razões entre o número de ocorrências e o


número total (ocorrências e não ocorrências).
• coeficiente de natalidade = número de nascimentos / população total
• coef de evasão escolar = número de evadidos / total inicial de matrículas

• As taxas são coeficientes multiplicados por uma potência de 10 (10,


100, 1000)
• taxa de mortalidade = coeficiente de mortalidade x 1000
Representação Gráfica

• O gráfico estatístico é uma forma de apresentação dos dados


estatísticos cujo objetivo é o de produzir uma impressão mais rápida e
viva do fenômeno em estudo.
Exemplo: suponha a série estatística da tabela abaixo.
Gráfico de Linha ou Curva

• Este tipo de gráfico usa uma linha poligonal para representar a


série estatística. Para ficar mais claro pode ser hachurado
(preenchido).
Gráfico em Colunas ou Barras

• Este tipo de gráfico usa colunas para representar a série


estatística. Podem ser verticais ou horizontais e conter barras
múltiplas.
Distribuição de Frequência

São dados agrupados de acordo com intervalos de valores das variáveis.

Estatura (cm) No de alunos

140 – 145 2

145 – 150 5

150 – 155 11

155 – 160 19

160 – 165 32

165 – 170 10

170 – 175 1

Total 100
Exemplo

Estatura de 40 Alunos da Escola A (cm)


166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168 Tabela Primitiva
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

Estatura de 40 Alunos da Escola A (cm)


150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170 Tabela Rol
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Exemplo

A simples organização dos dados em um rol de ordem crescente


já permite determinar o menor valor (x = 150 cm), o maior
valor (x = 173 cm), o valor que mais ocorre (x = 160 cm), e a
amplitude da variação (a distância entre o maior e o menor, Amp
= 173 - 150 = 23 cm).
Uma maneira mais concisa de mostrar os dados do rol é
apresentar cada um seguido pelo número de vezes que ocorre,
ao invés de repetí-los. O número de ocorrências de um
determinado valor recebe o nome de frequência absoluta (fi).
Por exemplo: a estatura de 155 cm ocorre 4 vezes ou seja
fi(155) = 4; a estatura de 150 ocorre 1 vez ou fi (150) = 1.
A tabela que contém todos os valores com a sua frequência
recebe o nome de distribuição de frequência.
Distribuição de Frequência

Est. Freq. Est. Freq.


150 1 162 2
151 1 163 2
152 1 164 3
153 1 165 1
154 1 166 1
155 4 167 1
156 3 168 2
157 1 169 1
158 2 170 1
160 5 172 1
161 4 173 1
Total 40
Número de Classes

• Quando dispomos de uma tabela rol, precisamos estabelecer a


quantidade e o intervalo das classes que vamos criar, de outro modo
a distribuição de frequência pode não ser útil para a nossa análise.

• Uma das maneiras de determinar o número de classes é usando a


Regra de Sturges que determina k em função de n:

k = 1 + 3,3 log(n)

onde k é o número de classes e n o número de dados. Da mesma


forma podemos usar outra regra que associa k e n de outra forma:

k = (n)1/2
• No nosso exemplo, usando a Regra de Sturges temos n = 40, logo k
= 1 + 3,3 log(40) = 6,28 portanto utilizamos 6 classes. Com a outra
regra, temos k = (40)1/2 = 6, 32, cujo resultado para o número de
classes é o mesmo.
Amplitude da Classe

• Sabendo o número de classes (k) que vamos usar, podemos


determinar o intervalo de classes (h) através da amplitude
total da distribuição (Amp).

h = Amp/k

• No exemplo: Amp = 23, K = 6 logo h = 23/6 = 3,8 = 4,0


Ou seja vamos agrupar elementos em classes de amplitude igual a 4.
Logo Classe 1 (150 — 154), Classe 2 (154 — 158), etc.
Distribuição de Frequência

Estatura (cm) fi

150 l– 154 4

154 l– 158 9

158 l– 162 11

162 l– 166 8

166 l– 170 5

170 l– 174 3

Total 40

Obs: Estatura = Variável Contínua


Frequências Relativa e Acumulada

• Frequência relativa (fri) é dada pela razão entre a frequência


absoluta de uma classe (fai) e o número de observações:
ex: fr3 = f3 / n = 11 / 40 = 0,275

• Frequência Acumulada é a soma das frequências absolutas de


todas as classes com intervalos inferiores a um determinada
classe
ex: F4 = f1 + f2 + f3 + f4 = 29

• Frequência Acumulada Relativa é a frequência acumulada da


classe dividida pela frequência total da distribuição:
ex: Fr4 =F4 / n = 29/40 = 0,725
Tabela de Distribuição de Frequência

Obs: Estatura = Variável Contínua


Histograma de Frequência

• O histograma é formado por um conjunto de retângulos


justapostos cujas bases se localizam sobre o eixo horizontal,
de tal modo que os seus pontos médios coincidam com os
pontos médios dos intervalos de classe e seus limites
coincidam com os limites da classe.
Polígono de Frequências

• Polígono de freqüências é o gráfico obtido unindo-se os pontos


médios dos patamares do histograma de frequências.
Obs: O Polígono de freqüências é um gráfico fechado no eixo das abscissas.
Então, sua elaboração, deve acrescentar à distribuição, uma classe à esquerda
e outra à direita, ambas com freqüências zero. Tal procedimento permite que a
área sob a linha de freqüências seja igual à área do histograma.
Medidas de Posição

• Média aritmética (x) é o quociente entre a soma dos valores


de uma variável pelo número total de valores.

Média simples: x = 1/n. Σ xi

Média Ponderada: x = 1/n. Σ fi.xi

Desvio da média: di = xi - x
Medidas de Posição

• Moda (Mo) é o valor que ocorre com mais frequência na


distribuição.
Quando os dados estão agrupados em classes, a moda correponde
a frequência simples mais alta e o valor da moda é tomado como o
ponto médio do intervalo da classe.

A distribuição de dados pode ser: modal, bimodal, amodal.

• Mediana (Md) é o valor que divide a série ordenada em dois


conjuntos com o mesmo número de valores.
Se a série tem um número ímpar de valores, a mediana é o valor
que está no meio (ponto mediano) da série. Se a série tem um
número par de valores, então utiliza-se como mediana o valor
médio entre os dois valores que estão no meio da série.
Posição relativa da Média,
Média, Mediana e Moda

• No caso de um distribuição simétrica (a), a média, a mediana


e a moda tem o mesmo valor. Entretanto, se a distribuição
apresenta alguma tendência para valores positivos ou
negativos, as medidas de posição poderão diferir. No caso de
uma distribuição assimétrica positiva (b) que Mo < Md < x.
Caso uma distribuição assimétrica negativa, que x < Md < Mo.
Cálculo da Média
Cálculo da Média p/ Dados Grupados

Obs: Dias chuvosos = Variável Contínua


Cálculo da Mediana p/ Dados Grupados
Cálculo da Moda p/ Dados Grupados
Medidas de Dispersão

• Variância
Medidas de Dispersão

• Desvio Padrão
Exemplo
Exemplo
Variância p/ Dados Grupados

Fi
Considerações
Coeficiente de Variação
Exercício

Obs: Molas não conformes = Variável Discreta


Exercício - Molas

Distribuição para Dados Grupados


K = 6 Amp = 19 – 3 = 16 h = 16/6 = 2,666 = 3
classe dados x fa F fr Fr
1 3 - 5 4 8 8 0,200 0,200
2 6–8 7 14 22 0,350 0,550
3 9 – 11 10 6 28 0,150 0,700
4 12 - 14 13 6 34 0,150 0,850
5 15 – 17 16 3 37 0,075 0,925
6 18 - 20 19 3 40 0,075 1,000
- - 40 - 1,000 -

Media = (32 + 98 + 60 + 78 + 48 + 57) / 40 = 9,325

Moda = 6 + ( 6 / 14 ) x 3 = 7,2857

Mediana = 6 + (12 x 3) / 14 = 8,571


Exercício - Molas

xi µ fi xi - µ (xi - µ)2 (xi - µ)2 fi

4 9.325 8 -5.325 28.35563 226.845

7 9.325 14 -2.325 5.405625 75.67875

10 9.325 6 0.675 0.455625 2.73375

13 9.325 6 3.675 13.50563 81.03375

16 9.325 3 6.675 44.55563 133.6669

19 9.325 3 9.675 93.60563 280.8169

∑ 800.775 ÷ 39 = 20.53 √2 = 4.53


Exercicio - Chuva

xi µ fi xi - µ (xi - µ)2 (xi - µ)2 fi

21.5 28.2 5 -6.7 44.89 224.45

24.5 28.2 8 -3.7 13.69 109.52

27.5 28.2 4 -0.7 0.49 1.96

30.5 28.2 4 2.3 5.29 21.16

33.5 28.2 6 5.3 28.09 168.54

36.5 28.2 3 8.3 68.89 206.67

∑ 732.3 ÷29 = 25.25 √2 = 5.025


Exercicio - Estatura

xi µ fi xi - µ (xi - µ)2 (xi - µ)2 fi

152 161 4 -9 81 324

156 161 9 -5 25 225

160 161 11 -1 1 11

164 161 8 3 9 72

168 161 5 7 49 245

172 161 3 11 121 363

∑ 1240 ÷39 = 31.79 √2 = 5.639

Você também pode gostar