Você está na página 1de 101

EST319 – Estatística para Engenharia de Materiais I – Profa.

Luciana Maria de
Oliveira

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIENCIAS EXATAS E DA TERRA

DEPARTAMENTO DE ESTATÍSTICA

NOTAS DE AULAS

DISCIPLINA: ESTATÌSTICA PARA ENGENHARIA DE MATERIAIS I

PROFESSORA: LUCIANA MARIA DE OLIVEIRA

NATAL/RN - 2010

1
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

UNIDADE I

ESTATISTICA DESCRITIVA

1.1 - NARUREZA E CAMPO DA ESTATÍSTICA

Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados quantitativos, de tal
forma que seja possível efetuar julgamentos sobre os mesmos.
Ramos da Estatística:
a) Estatística descritiva → trata da observação de fenômenos de mesma natureza, da coleta de
dados numéricos referentes a esses fenômenos, da sua organização e classificação através de
tabelas e gráficos, bem como da análise e interpretação.
b) Probabilidade estatística · utilizada para analisar situações que envolvem o acaso
(aleatoriedade).
c) Inferência estatística → estuda as características de uma população com base em dados obtidos
de amostras.

OBS: Estatística Indutiva pode ser denominada como inferência. Portanto, a estatística indutiva estuda as
características de uma população, com base em dados obtidos de amostras.

Inferência = Indução + Margem de Erro

1.2 - O MÉTODO ESTATÍSTICO


A realização de uma pesquisa deve passar, necessariamente pelas fases apresentadas abaixo:

Definição Coletas Crítica


Planejamento → dos → dos
do → Dados
problema Dados

Análise e
Apresentação Tabelas e interpretação
dos dados → Gráficos → dos dados

1) Definição do problema → Saber exatamente o que se pretende pesquisar, ou seja, definir


corretamente o problema.
2
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

2) Planejamento → determinar o procedimento necessário para resolver o problema, como levantar


informações sobre o assunto objeto do estudo. É importante a escolha das perguntas em um
questionário, que na medida do possível, devem ser fechadas.
 O levantamento de dados pode ser de dois tipos: Censitário e Amostragem.
 Outros elementos do planejamento de uma pesquisa são:
• Cronograma das atividades;
• Custos envolvidos;
• Exame das informações disponíveis;
• Delineamento da amostra.

3) Coleta de Dados → consite na busca ou compilação dos dados . Pode ser classificado, quanto ao
tempo em:
• Contínua (inflação, desemprego, etc);
• Periódica (Censo);
• Ocasional (pesquisa de mercado, eleitoral)

4) Crítica dos dados → objetiva a eliminação de erros capazes de provocar futuros enganos. Faz-
se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento.

5) Apresentação dos dados → a organização dos dados denomina-se “Série Estatística”. Sua
apresentação pode ocorrer por meio de tabelas e gráficos.

6) Análise e Interpretação dos Dados → consite em tirar conclusões que auxiliem o pesquisador a
resolver seu problema, descrevendo o fenômeno através do cálculo de medidas estatísticas,
especialmente as de posição e as de dispersão.

1.3 - REPRESENTAÇÃO TABULA E GRÁFICA


- REPRESENTAÇÃO TABULA
Consiste em dispor os dados em linhas e colunas , distribuídas de modo ordenado, segundo algumas
regras práticas e obedecendo à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho Nacional de
Estatística.

3
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

As tabelas devem apresentar:


a) Título → O quê? Onde? Quando?

b) Cabeçalho → especifica o conteúdo das colunas

c) Coluna indicadora → especifica o conteúdo das linhas

d) Corpo → caselas onde são registrados os dados

e) Rodapé → notas e identificação da fonte dos dados

Séries Estatísticas
São os dados organizados em forma de tabelas. De acordo com o fenômeno, local e a época de
ocorrência classificam-se, respectivamente, em : Temporal, Especificativa e Geográfica.
a) SérieTemporal (históricas ou cronológicas): os dados são observados segundo a época de sua
ocorrência

4
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

b) Série Geográfica (espaciais, territoriais ou de localização): os dados são observados segundo o local
onde ocorreram.

c) Série Especificativa (categóricas): os dados são agrupados segundo a modalidade (espécie) de


ocorrência.

d) Série Mista ou de Dupla Entrada: é a fusão de duas ou mais séries simples.

TELEFONES INSTALADOS - 1987-89


REGIÃO 1987 1988 1989
Norte 373.312 403.712 457.741
Nordeste 1.440.531 1.567.006 1.700.467
Sudeste 8.435.308 8.892.409 8.673.660
Sul 2.106.145 2.192.762 2.283.581
Centro -oeste 803.013 849.401 944.075
Total 13.158.309 13.905.290 14.059.524

5
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

- POPULAÇÃO E AMOSTRA

Inferência Obtenção de resultados para uma população com base em observações


Estatística extraídas a partir de uma amostra retirada desta população.

POPULAÇÃO:

É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada característica.
Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, como o número de
vezes que se pode jogar um dado.

AMOSTRA:

É qualquer subconjunto da população. A técnica de seleção desse subconjunto de elementos é


chamada de Amostragem.

- NOÇÕES DE AMOSTRAGEM

População (N) Amostra (n)

X X: determinada característica de
interesse da população;

θ θ: parâmetro populacional;

Como já vimos, a inferência estatística tem como objetivo a estimação de parâmetros para uma população
tendo como base as informações extraídas através de uma amostra. Neste contexto, o estudo dos mais
diversos tipos de procedimentos de amostragem se faz necessário.
As técnicas de amostragem podem ser classificadas em dois grandes grupos: a amostragem probabilística
e a amostragem não probabilística.

6
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

a) Amostragem Probabilística: neste grupo encontram-se os planos amostrais que utilizam mecanismos
aleatórios de seleção dos elementos da amostra, atribuindo a cada um deles uma probabilidade,
conhecida à priori, de pertencer a amostra.
b) Amostragem Não Probabilística: neste grupo encontram-se os planos amostrais que não utilizam
mecanismos aleatórios de seleção dos elementos da amostra, e dessa forma, não existe nenhuma
probabilidade associada a seleção desses elementos.

Ambos os procedimentos têm vantagens e desvantagens. A grande vantagem das amostras probabilísticas
é medir a precisão da amostra obtida. Tais medidas já são bem mais difíceis para os procedimentos do
outro grupo. Diante disso, amostras probabilísticas são comumente utilizadas na prática. Os tipos de
planos de amostragem probabilísticos são os seguintes:

1. Amostragem Aleatória Simples: cada elemento da população tem a mesma chance (ou
probabilidade) de ser selecionado. Os elementos são escolhidos através de sorteio. Para isso, tabelas
de números aleatórios são freqüentemente utilizadas. Por exemplo, selecionar 5 alunos de uma turma.
2. Amostragem Estratificada: a população é dividida em estratos (ou grupos) homogêneos, sendo
selecionada uma amostra aleatória simples de cada estrato. Por exemplo, selecionar alunos de 5ª a 8ª
série de uma determinada escola. Neste caso, cada série corresponde a um estrato, e de cada estrato
uma amostra aleatória simples dos alunos é extraída.
3. Amostragem Sistemática: os elementos são selecionados segundo um regra pré-definida. É bastante
utilizada quando os elementos da população estão arranjados um ordem. Por exemplo, selecionar um
aluno a cada 15 que forem sorteados.

É condição inerente a uma população natural existir variação quanto aos atributos que lhe podem ser
estudados. Portanto, a variabilidade é uma característica comum a dados de observação e experimentos.
Um atributo sujeito à variação é descrito em Estatística por uma variável.
Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua

7
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Variável Qualitativa: os dados podem ser distribuídos em categorias mutuamente exclusivas. Por
exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sangüíneo, etc..
Variável Quantitativa: os dados são expressos através de números. Por exemplo, idade, estatura, peso,
etc..

Exercícios

1. De acordo com informações do IBGE, em 31.12.99, o pessoal administrativo ocupado em


estabelecimentos públicos, era, segundo o tipo de ocupação: Administração, 41.371; Serviço pessoal,
6.067; Contabilidade, 2.989; Estatística, 5.481; Limpeza e Conservação, 26.520; Almoxarifado,
3.970; Serviços Gerais, 46.073; e Outros, 15.689. Nos estabelecimentos da rede particular, nas
mesmas ocupações anteriores, as quantidades respectivas eram: 45.392, 4.555, 6.627, 3.112, 42.155,
4.019, 49.038 e 17.302. Dispor os dados acima em uma tabela, utilizando valores absolutos e
percentuais
2. Os prontuários de um paciente de um hospital estão organizados por ordem alfabética, em um
arquivo. Qual é a maneira mais rápida de amostrar 1/3 do total de prontuários?
3. Um pesquisador tem dez gaiolas que contém , cada uma, seis ratos. Como o pesquisador pode
selecionar uma amostra de dez ratos?
4. Um pesquisador pretende levantar dados sobre o número de moradores por domicílio, usando
amostragem sistemática. O pesquisador visitará cada domicílio selecionado. Se não tiver nenhuma
pessoa na ocasião da visita, o pesquisador excluirá o domicílio da amostra. Este fato introduz
tendenciosidade?
5. Dada uma população de 8 elementos {A, B, C, D, E, F, G, H, G} descreva três formas diferentes de
obter uma amostra sistemática de 4 elementos.

- Distribuições de Freqüências
Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do
fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de distribuição de
freqüências.

8
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Distribuição de Freqüências: série estatística em que os dados são agrupados em classes, com suas
respectivas freqüências absolutas, relativas e percentuais, com o objetivo de
facilitar ao analista o seu estudo.

Construção de uma Distribuição de Freqüências:


Para a construção de uma distribuição de freqüências os seguintes componentes são necessários:

 Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados.
 Rol: são os dados apresentados em ordem crescente.

Os seguintes componentes são utilizados apenas em distribuição de freqüências em classes:


 Amplitude Total (A): é a diferença entre o maior valor do rol (LS) e o menor valor (LI).

A = LS - LI

 Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os elementos
do rol. Para determinar c, utiliza-se a fórmula de Sturges:

c = 1 + (3,33333.....).log(n)

onde n = número de elementos do rol.


 Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos através da
fórmula:

i = A/c

Outros elementos da tabela:

 Li = limite inferior de cada classe;


 Ls = limite superior de cada classe;
 x = ponto médio de cada classe x = Li + (i/2);
 f = freqüência absoluta = número de ocorrências de cada classe;
 fr = freqüência relativa fr = f / ∑f ;

9
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

 f % = freqüência percentual f % = 100.fr;


 F ↓ = freqüência absoluta acumulada "abaixo de";
 F ↑ = freqüência absoluta acumulada "acima de";
 F% ↓ = freqüência percentual acumulada "abaixo de";
 F% ↑ = freqüência percentual acumulada "acima de";

Exemplos
1) (Dados Simples) Numa pesquisa feita para detectar o número de filhos de empregados de uma
multinacional, foram encontrados os seguintes valores:

1 4 2 5 3 2 0 3 2 1
5 4 2 5 0 3 2 4 2 3
2 3 2 1 4 2 1 3 4 2
Solução:

 Rol (dados em ordem crescente):


0 0 1 1 1 1 2 2 2 2
2 2 2 2 2 2 3 3 3 3
3 3 4 4 4 4 4 5 5 5

 Tabela de Distribuição de Freqüências:

X f fr f% F↓ F↑ F% ↓ F% ↑
0 2 0,067 6,7 2 30 6,7 100
1 4 0,133 13,3 6 28 20 93,3
2 10 0,333 33,3 16 24 53,3 80
3 6 0,2 20 22 14 73,3 46,7
4 5 0,167 16,7 27 8 90 26,7
5 3 0,1 10 30 3 100 10
Total 30 1 100 - - - -
 Algumas considerações ou conclusões:

Quantos empregados têm "x" filhos? A resposta é dada através de f (freqüência absoluta simples).
a) Quantos empregados têm menos de "x" filhos? A resposta é dada através de F ↓ (freqüência absoluta
acumulada "abaixo de").
b) Quantos empregados têm mais de "x" filhos? A resposta é dada através de F ↑ (freqüência absoluta
acumulada "acima de").

10
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

2) (Dados Agrupados em Classes) Um determinado hospital está interessado em analisar a quantidade de


creatinina (em miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes
internados com problemas renais. Os dados são os seguintes:

1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02

Solução:
 Rol (dados em ordem crescente):
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68
1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86
1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34

 Amplitude Total (dá uma idéia do campo de variação dos dados):


A = LS - LI = (2,34) - (1,08) = 1,26
Analisando-se a quantidade creatinina encontrada na urina dos 84 pacientes verificou-se que, ocorreu a
variação de 1,26 no seu campo (de 1,08 a 2,34).

 Estabelecer o Número de Classes (c):


c = 1 + (3,3333.....).log(n) = 1 + (3,3333....).log(84) = 7,414 c=7

 Estabelecer o Intervalo de Classe (i): i = A / c = (1,26) / 7 = 0,18

11
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

 Construção da Tabela:
Classes fi Pm fr f% f%↓ f%↑ F↓ F↑
1,08 - 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 - 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 - 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 - 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 - 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 - 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 - 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
OBS:

(1) O melhor valor para representar cada classe é o ponto médio (Pm), o qual se obtém pela fórmula:
Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2

(2) fi : número de elementos de cada classe.


fr : mede o quanto cada valor significa e relação a unidade.
f%: mede o quanto cada valor significa com relação a 100.

(3) 1,08 -- 1,26, intervalo fechado à esquerda (pertencem a classe valores iguais ao extremo inferior) e
aberto à direita (não pertencem a classe valores iguais ao extremo superior).

Algumas considerações ou conclusões:

a) Quantos pacientes têm quantidade de creatinina no intervalo de "x"? A resposta é dada através de f
(freqüência absoluta simples). Ex.: Quantas pacientes tem quantidade de creatinina no intervalo [1,44;
1,62)? R.: 32 pacientes.
b) Quantas pacientes tem quantidade de creatinina inferior ao intervalo "x"? A resposta é dada através de
F↓ (freqüência absoluta acumulada "abaixo de"). Ex.: Quantas crianças tem quantidade de
creatinina inferior ao intervalo [1,80; 1,98)? R.: 68 pacientes.

12
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

c) Quantas pacientes tem quantidade de creatinina superior ao intervalo "x"? A resposta é dada através
de F ↑ (freqüência absoluta acumulada "acima de"). Ex.: Quantas crianças tem quantidade de
creatinina superior ao intervalo [1,80; 1,98)? R.: 5 pacientes.

3) Construir uma distribuição de freqüências, utilizando a fórmula de Sturges e analisá-la com base nos
elementos abaixo, correspondente ao faturamento bruto mensal (US$ mil) de 38 pequenas empresas:

2,1 4,4 2,7 32,3 9,9 9,0 2,0 6,6 3,9 1,6 14,7 9,6 16,7 7,4
8,2 19,2 6,9 4,3 3,3 1,2 4,1 18,4 0,2 6,1 13,5 7,4 0,2 8,3
0,3 1,3 14,1 1,0 2,4 2,4 18,0 8,7 24,0 1,4 8,2 5,8 1,6 3,5
11,4 18,0 26,7 3,7 12,6 23,1 5,6 0,4

– REPRESENTAÇÃO GRÁFICA

Gráfico é um recurso visual da Estatística utilizado para representar um fenômeno. Sua


utilização em larga escala nos meios de comunicação social, técnica e científica, devem-se tanto à sua
capacidade de refletir padrões gerais e particulares do conjunto de dados em observação, como à
facilidade de interpretação e a eficiência com que resume informações dos mesmos.
Embora os gráficos forneçam menor grau de detalhes que as tabelas, estes apresentam um
ganho na compreensão global dos dados, permitindo que se aperceba imediatamente da sua forma
geral sem deixar de evidenciar alguns aspectos particulares que sejam de interesse do pesquisador.
Uma representação gráfica coloca em evidência as tendências, as ocorrências ocasionais, os
valores mínimos e máximos e também as ordens de grandezas dos fenômenos que estão sendo
observados.
Todo gráfico, em sua versão final deve primar pela simplicidade, clareza e veracidade nas
informações. Para atingir tal objetivo, a construção de um gráfico exige muito trabalho e cuidados.
Segundo Silva (apud WALLGREN, 1996), a escolha da representação gráfica e, conseqüentemente, a
escolha do tipo de gráfico mais adequado para representar um conjunto de dados deve ser feita com
base nas respostas de questões como:
- Um gráfico realmente é a melhor opção?
- Qual é o público-alvo?
- Qual é o objetivo do gráfico?
- Que tipo de gráfico deve ser usado?
- Como o gráfico deve ser apresentado?
- Que tamanho o gráfico deve ter?
- Deverá ser usado apenas um gráfico?
- A qual meio técnico se deve recorrer?
Ao incluir um gráfico em um trabalho, sua identificação deve aparecer na parte inferior,
precedido pela palavra Gráfico seguida de seu número de ordem de ocorrência no texto (algarismos
arábicos), de seu respectivo título e/ou legenda explicativa de maneira breve e clara (dispensando a
leitura do texto) e da fonte de onde se extraiu os dados. Uma regra básica para a elaboração adequada
do título de qualquer gráfico, é verificar se o mesmo responde a três exigências: o quê, onde e quando.

13
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

- GRÁFICOS PARA TABELAS SIMPLES

a) Gráfico de barras
É um gráfico formado por retângulos horizontais de larguras iguais, onde cada um deles
representa a intensidade de uma modalidade ou atributo.
O objetivo deste gráfico é de comparar grandezas e é recomendável para variáveis cujas
categorias tenham designações extensas.

b) Gráfico de colunas
É o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico de barras por
serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando as
designações das categorias são breves. O número de colunas ou barras do gráfico não deve ser
superior a 12 (doze).

Ao se descrever simultaneamente duas ou mais categorias para uma variável, é conveniente


fazer uso dos gráficos de barras ou colunas justapostas (ou sobrepostas), chamados de gráficos
comparativos. De acordo com as normas contidas em Gráficos (UFPR, 2001), este tipo de gráfico só
deve ser utilizado quando apresentar até três elementos para uma série de no máximo quatro valores.

c) Gráfico de setores
Tipo de gráfico onde a variável em estudo é projetada num círculo, de raio arbitrário, dividido em
setores com áreas proporcionais às freqüências das suas categorias. São indicados quando se deseja

14
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

comparar cada valor da série com o total. Recomenda-se seu uso para o caso em que o número de
categorias não é grande e não obedecem a alguma ordem específica.
Para encontrarmos a medida dos ângulos (em graus) de cada setor do círculo (de cada fatia da
pizza), devemos estabelecer a seguinte regra de três:

1.1.1.1.1
Total observado 360º

1.1.1.1.2
Cada parcela X

De onde vem a relação:

Total observado X = (cada parcela) 360º

De onde obtemos que:


(cada parcela )
X= ⋅ 360 º
Total observado

d) Gráfico de linhas
Sua aplicação é mais indicada para representações de séries temporais sendo por tal razão,
conhecidos também como gráficos de séries cronológicas. Sua construção é feita colocando-se no eixo
vertical (y) a mensuração da variável em estudo e na abscissa (x), as unidades da variável numa ordem
crescente. Este tipo de gráfico permite representar séries longas, o que auxilia detectar suas flutuações
tanto quanto analisar tendências. Também podem ser representadas várias séries em um mesmo
gráfico.

- REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO(TABELAS COM INTERVALO DE


CLASSE)

15
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

a) Histograma:
Os histogramas são gráficos construídos para representar dados agrupados em
intervalos de classes e podem ser utilizados, considerando qualquer tipo de freqüência, simples
ou acumuladas, absolutas ou percentuais.
Assim, há histogramas com diversos contornos, informando sobre distintos aspectos do
comportamento dos dados.

Horas de Trabalho Nº de Crianças (fi) fi % F% Pm


10 |-- 15 4 10,52 10,52 12,5
15 |-- 20 5 13,15 23,67 17,5
20 |-- 25 8 21,10 44,77 22,5
25 |-- 30 12 31,56 76,33 27,5
30 |-- 35 6 15,78 92,11 32,5
35 |--| 40 3 7,89 100 37,5
Total 38 100,00 - -

14
12
10
8
6
4
2
0
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |--| 40

 Distribuição Simétrica: ocorre quando a concentração dos dados está no centro da figura.

12
10
8
6
4
2
0
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45

 Distribuição assimétrica: quando a concentração dos dados está localizada para a


direita ou para a esquerda da figura. Dividindo-se em:

16
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

12
10
8
6
4
2
0
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45

Assimetria positiva: quando a concentração dos dados se localiza à esquerda do centro da


figura e a cauda à direita é alongada.

Assimetria negativa: quando a concentração dos dados se localiza à direita do centro da


figura e a cauda à esquerda é alongada.

b) Polígono de freqüência
É um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de abscissas
correspondentes aos pontos médios de cada classe e as ordenadas, às freqüências absolutas ou
relativas dessas mesmas classes.
O polígono de freqüência é um gráfico que deve ser fechado no eixo das abscissas. Então, para
finalizar sua elaboração, deve-se acrescentar à distribuição, uma classe à esquerda e outra à direita,
ambas com freqüências zero. Tal procedimento permite que a área sob a linha de freqüências seja igual
à área do histograma.
Uma das vantagens da aplicação de polígonos de freqüências é que, por serem gráficos de
linhas, permitem a comparação entre dois ou mais conjuntos de dados por meio da superposição dos
mesmos.

12
10
8
6
4
2
0
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45

17
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

c) Gráfico da freqüência acumulada ou Ogiva de Galton


É um gráfico que permite descrever dados quantitativos por meio da freqüência acumulada.
A ogiva é um gráfico de linha que une os pontos cujas abscissas são os limites superiores das
classes, e, ordenadas suas respectivas freqüências acumuladas. Convém observa-se que o ponto
inicial desse gráfico é o limite inferior do primeiro intervalo, com freqüência acumulada zero, pois não
existe qualquer valor inferior a ele.

Exercício

Construa os gráficos representativos da distribuição de freqüência do exercício 2 (quantidade de


creatinina presente na urina de 84 pacientes).

 Construção da Tabela:
Classes fi Pm fr f% f%↓ f%↑ F↓ F↑
1,08 - 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 - 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 - 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 - 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34

18
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

1,80 - 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16


1,98 - 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 - 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema.
Mas é conveniente apresentar medidas que mostrem a informação de maneira resumida.

1.4 – MEDIDAS DE TENDÊNCIA CENTRAL, DISPERÇÃO E ACHATAMENTO


– Medidas de Tendência Central
São medidas que tendem para o centro da distribuição e têm a capacidade de representá-la como
um todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais são: Média
Aritmética, Mediana e Moda e algumas.

Média, Mediana e Moda


 Média Aritmética
A média aritmética pode ser definida em dois tipos: populacional ( µ) e amostral ( X ). Nos dois
casos existem três situações quanto aos cálculos.

1. Dados apresentados em forma de rol:


n

A média será: ∑x i
soma de todos os elementos do rol
X= i=1
=
n número de elementos do rol
Ex.: Peso em gramas de ratos (50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74) X = 67
Análise: o peso médio dos 12 ratos observados é de 67 gramas.

Exercício: Um gerente de supermercado quer estudar a movimentação de pessoas em seu


estabelecimento, constata que 195, 1.002, 941, 768, 1.283 pessoas entraram no seu estabelecimento nos
últimos cinco dias. Descubra o número médio de pessoas que entraram diariamente neste
estabelecimento nos últimos cinco dias.

2. Dados apresentados em forma de distribuição de freqüência simples:


n

∑x f i i

A média será: X =
i=1
n

∑f i =1
i

19
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Ex.: Número de cáries em crianças


X 0 1 2 3 4 Total
f 2 4 10 6 5 27
n

∑x f i i
(0).(2) + (1).(4) + (2).(10) + (3).(6) + (4).(5)
X= i=1
n
= = 2,3
27
∑f
i =1
i

Análise: Verifica-se que o número médio de cáries das 27 crianças observadas no estudo é de 2,3.

Exercício: As informações abaixo apresentam a idade dos usuários de drogas internos numa clínica para
tratamento. Determine a idade média dos internos.
Idade fi
17 6
18 4
19 8
20 12
21 10
22 7
23 3
Total 50

3. Dados apresentados em forma de distribuição de freqüência em classes:


n

∑P f
m i

A média será: X =
i =1
n

∑f i =1
i

Ex.: Nascidos vivos segundo o peso ao nascer, em kg.

Classes Pm fi
1,5 - 2,0 1,75 3
2,0 - 2,5 2,25 16
2,5 - 3,0 2,75 31
3,0 - 3,5 3,25 34
3,5 - 4,0 3,75 11
4,0 - 4,5 4,25 4
4,5 - 5,0 4,75 1
Total

20
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

∑P f
m i
(1,75).(3) + (2,25).(16 ) +  + (4,75).(1)
X= i=1
n
= =3
100
∑f i =1
i

Análise: Verifica-se que o peso médio dos 100 nascidos vivos observados é 3 kg.

 Mediana
Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é, é o
valor que ocupa o centro da distribuição, de onde conclui-se que 50% dos elementos ficam abaixo dela e
50% ficam acima.

Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou população,
em duas partes iguais.

0 Med 100%
a) Variável Discreta: os dados estão dispostos em forma de rol ou em uma distribuição de freqüência
simples.
 Se "n" for ímpar:
Med = elemento central (de ordem [(n + 1)/2]º)

 Se "n" for par:


Med = média aritmética dos dois elementos centrais (de ordem (n/2)º e [(n/2) + 1]º)
Ex1.: Seja a amostra: 1, 2, 3, 4, 5 Med = 3

Ex2.: Seja a amostra: 1, 2, 3, 4 Med = (2 + 3)/2 = 2,5

Ex3.: Suponha a seguinte distribuição de freqüência simples.

X fi F↓
1 1 1
2 3 4
3 5 9
4 2 11
Total 11 -

21
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

n = 11 (ímpar)
Elemento mediano: [(n+1)/2]º = 6º elemento
3ª classe contém o 6º elemento Med = 3

Ex4.: Suponha a seguinte distribuição de freqüência simples.


X fi F↓
82 5 5
85 10 15
87 15 30
89 8 38
90 4 42
Total 42 -
n = 42 (par)
Elemento mediano: (n/2)º = 21º elemento
(n/2)º + 1 = 22º elemento
3ª classe contém o 21º e o 22º elemento
Med = (87 + 87)/2 = 87

b) Variável Contínua: os dados estão agrupados em uma distribuição de freqüências em classes, então:
(1º Passo) Calcular a ordem (n/2)º. Como a variável é contínua não importa se é par ou ímpar.
(2º Passo) Através da F ↓ identificar a classe que contém a mediana, isto é, a posição da mediana.
(3º Passo) Utilizar a fórmula:
 PMed − F ↓− 
Med = LI Med +  .i Med

 f Med 

 LIMed = limite inferior da classe que contém a mediana;


 PMed = posição da mediana = ∑f i / 2 = xº elemento;

 F ↓- = freqüência absoluta acumulada "abaixo de" da classe anterior a classe que contém a mediana;
 fMe = freqüência absoluta da classe que contém a mediana;
 iMe = intervalo da classe que contém a mediana;

Ex.: No exemplo acima (nascidos vivos segundo peso ao nascer, em kg) a mediana é dada por:

Classes Pm fi F↓
1,5 - 2,0 1,75 3 3
2,0 - 2,5 2,25 16 19

22
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

2,5 - 3,0 2,75 31 50


3,0 - 3,5 3,25 34 84
3,5 - 4,0 3,75 11 95
4,0 - 4,5 4,25 4 99
4,5 - 5,0 4,75 1 100

PMe = 50º elemento 3ª classe: [2,5; 3,0)


 PMed − F ↓− 
.i Med = 2,5 + 
50 - 19 
Med = LI Med +   .( 0,5 ) = 3
 f Med   31 

 Moda

É o valor que ocorre com maior freqüência, ou seja, aquele que mais se repete.

Ex.: Na série 3, 4, 5, 7, 7, 7, 9, 9 Mo = 7

 Série Unimodal (tem uma única moda)


Ex.: Na série 3, 5, 6, 6, 6, 7, 8 Mo = 6

 Série Bimodal (ocorrem duas modas)


Ex.: Na série 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 Mo1 = 5 e Mo2 = 9

 Série Trimodal (ocorrem três modas)


Ex.: Na série 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 Mo1 = 4, Mo2 = 7 e Mo3 = 9

 Série Polimodal (ocorrem quatro ou mais modas)


Ex.: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13 M o1 = 0, Mo2 = 3, Mo3 = 9, Mo4 = 12 e Mo5
= 13
 Série Amodal (não existe moda)
Ex.: Na série 0, 1, 3, 4, 7, 8, não existe moda
a) Dados Apresentados em uma Distribuição de Freqüência Simples
Mo = elemento que tenha maior freqüência
Ex1.:
X f
1 13

23
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

3 15
6 25
10 8
Total 61
Mo = 6

Ex2.:
Tipo de Sangue f
O 547
A 441
B 123
AB 25
Total 1136

Mo = sangue do tipo "O"

b) Dados Apresentados em uma Distribuição de Freqüência Classes.

Nesse caso, a moda pode ser determinada através de quatro processos.

1. Moda Bruta (MoB)

Corresponde ao ponto médio da classe modal, ou seja, MoB = (li + ls)/2

Ex.: Quantidade de Creatinina


Classes fi
1,08 - 1,26 5
1,26 - 1,44 13
1,44 - 1,62 32
1,62 - 1,80 18
1,80 - 1,98 11
1,98 - 2,16 2
2,16 - 2,34 3

24
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

2. Moda de Pearson (MoP)

Utilizada mais especificamente, juntamente com X e Med, para mostrar o comportamento da


distribuição, em relação a concentração ou não de seus elementos.

Mo =3.Med - 2. X

Utiliza-se a MoP para a análise da assimetria.

 Assimetria à esquerda: X <Med < M oP (concentração à direita ou nos valores maiores)


 Assimetria à direita: M oP <Med < X (concentração à esquerda ou nos valores menores)
 Simétrica: M oP =Med = X (concentração no centro)

Ex.: Calcule a moda de Pearson para os seguintes dados X = 1,61 e Med = 1,57.

Mo =3.Med - 2. X = 3.(1,57) - 2.(1,61) = 1,49


Análise: M oP <Med < X , o que indica uma assimetria à direita, isto é, uma maior concentração à
esquerda (ou em direção aos valores menores).

3. Moda de King (MoK)


 f post 
M oK =li Mo + .i Med
 f +f 
 ant post 

 liMo = limite inferior da classe modal;


 fpost = freqüência absoluta da classe posterior à classe modal;
 fant = freqüência absoluta da classe anterior à classe modal;
 iMo = ls - li = intervalo da classe modal;

25
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

4. Moda de Czuber (MoC)

 d1  d 1 =f máx −f ant
M oC = li Mo + 
 d +d 
.i Med onde
 1 2  d 2 =f máx −f post

Ex.: Baseado no exemplo da distribuição de freqüência apresentada no primeiro processo (moda bruta)
calcule as modas de King e de Czuber.

Moda de King:

Classe Modal = 3ª classe [1,44; 1,62) com fi = 32


fant = 13
fpost = 18
iMo = (1,62) - (1,44) = 0,18

 f post 
M oK = li Mo +  .i Med =1,44 + 

18 
f +f  13 +18 
.0,18 =1,54
 ant post   

Análise: valores próximos ou iguais a 1,54 ocorrem com maior freqüência.

Moda de Czuber:

Classe Modal = 3ª classe [1,44; 1,62) com fi = 32


fant = 13 fmáx = 32
fpost = 18 d1 = 32 - 13 = 19
iMo = (1,62) - (1,44) = 0,18 d2 = 32 - 18 = 14

 d1   19 
M oC = li Mo +  .i Mo = 1,44 +  .0,18 = 1,54
 d1 + d 2   14 + 19 
Análise: valores próximos ou iguais a 1,54 ocorrem com maior freqüência.

26
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

– MEDIDAS DE DISPERSÃO

Introdução

Utilizaremos o termo dispersão para indicar o grau de afastamento de um conjunto de números em


relação a sua média, pois ainda que consideremos a média como um número que tem a faculdade de
representar uma série de valores ela não pode por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compõem o conjunto. O nosso objetivo é construir
medidas que avaliem a representatividade da média para isto usaremos as medidas de dispersão.

Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são
suficientes para caracterizar totalmente uma seqüência numérica.
Se observarmos as seguintes seqüências:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a média aritmética de cada um desses conjuntos, obtemos:

X=
∑x i
⇒X =
350
= 70
n 5

Y=
∑y i
⇒Y =
350
= 70
n 5

Z=
∑z i
⇒Z =
350
= 70
n 5
Observamos, então, que os três conjuntos apresentam a mesma média aritmética: 70.
No entanto, são seqüências completamente distintas do ponto de vista da variabilidade de dados.
Na seqüência X, não há variabilidade dos dados. A média 70 representa bem qualquer valor da série.
Na seqüência Y, a média 70 representa bem a série, mas existem elementos da série levemente
diferenciados da média 70.
Na seqüência Z, existem muitos elementos bastante diferenciados da média 70.
Concluímos que a média 70 representa otimamente a seqüência X, representa bem a seqüência Y, mas
não representa bem a seqüência Z.

27
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Nosso objetivo é construir medidas que avaliem a representatividade da média. Para isto,
usaremos as medidas de dispersão.
Observe que na seqüência X os dados estão totalmente concentrados sobre a média 70, não há
dispersão de dados. Na seqüência Y, há forte concentração dos dados sobre a média 70, mas há fraca
dispersão de dados. Já na série Z há fraca concentração de dados em torno da média 70 e forte dispersão
de dados em relação à média 70.

As principais medidas de dispersão absolutas são: amplitude total, variância, desvio padrão e
coeficiente de variação.

 Variância
È a medida de dispersão mais utilizada. É definida como sendo o quociente entre a soma dos
quadrados dos desvios e o número de elementos. É classificada em dois tipos:

∑(X ) ( X)
∑ − ∑N
2  2 
i −X 1  i 
Variância Populacional ( σ ) ⇒
2
2 σ = =  X i2 
N N  
 

∑(X −X ) 2
1 

(∑X ) 2 


i i
Variância Amostral (s )2
⇒ S2 =
n −1
= 
n −1 
X i2 −
n


 

Exemplo: Calcular a variância das notas obtidas por quatro alunos em cinco provas

∑(X −X )
2
1 

(∑X i )
Variância
2 


2 i
S = =  X2 −i 
n −1 n −1 
∑X i ∑X i 2 n 
Alunos Notas Amostral(S2)  
2
Antônio 5 5 5 5 5 25 =1/4 . [(125)-(25) /5] = 0
João 6 4 5 4 6 129 1
2
José 10 5 5 5 0 25 =1/4. [( 175) – (25) /5]= = 12,5
Pedro 10 10 5 0 0 225 25
(preencha os espaços em branco realizando os cálculos necessários)
Comentários:
• As notas de Antônio não variaram ⇒ s2 = 0;
• As notas de João variaram menos que as notas de José;
• As notas de Pedro variaram mais que as outras.

IMPORTANTE: Quando os dados estão dispostos em uma tabela de distribuição de freqüência, utiliza-
se a fórmula:

28
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

1º Caso – Freqüência Simples


( x ⋅f) ( x ⋅f)
∑ ⋅ f − ∑n ∑ ⋅ f − ∑N
 2   2 
1   1
σ =  
2 i i
s = xi2 2
xi2
n −1   N  

 
 
 

2º Caso – Freqüência em Classes

1 
 (∑Pm ⋅ f ) 2  
1  (∑Pm ⋅ f ) 2 
s2 =
n −1 ∑ Pm 2 ⋅ f −
n


σ2 =
N  ∑ Pm 2 ⋅ f −
N



 
 
 

ATENÇÃO: “Desvantagem” do uso da variância


No cálculo da variância, quando elevamos ao quadrado a diferença (x i − x) , a unidade de medida
da série fica também elevada ao quadrado.

Portanto, a variância é dada sempre no quadrado da unidade de medida da série.

Se os dados são expressos em metros, a variância é expressa em metros quadrados.

Em algumas situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo,
em que os dados são expressos em litros. A variância será expressa em litros quadrados.
Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja:
variância não tem interpretação.

Solução: Utilizar o DESVIO PADRÃO como medida

 Desvio Padrão
Medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de
medida dos dados. É a raiz quadrada da variância.
Notações: 1) Quando a seqüência de dados representa uma população a variância será denotada por σ 2 e
o desvio padrão correspondente por σ .
2) Quando a seqüência de dados representa uma amostra a variância será denotada por S 2 e o
desvio padrão correspondente por S .

∑( X ) 2
• Desvio Padrão Populacional ( σ ) ⇒ i −X
σ =
N

∑( X )
2
−X
• Desvio Padrão Amostral (s) ⇒ S =
i

n −1

OBS: Quanto maior o valor do desvio padrão significa que mais dispersos estão os elementos em torno da
média.
29
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Exemplo: Calcular o desvio padrão das notas obtidas por quatro alunos em cinco provas
Desvio padrão
Alunos Notas ∑X i ∑X i
2
amostral ( σ )
2
Antônio 5 5 5 5 5 25 =1/4 . [(125)-(25) /5] = 0 0
João 6 4 5 4 6 129 =1
=1/4. [(175) -
José 10 5 5 5 0 25 (25)2/5]=5
Pedro 10 10 5 0 0 225 =25 5
(preencha os espaços em branco realizando os cálculos necessários)

Interpretação do Desvio Padrão


O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.
É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados
da série. Quando uma curva de freqüência representativa da série é perfeitamente simétrica (
X = Md = Mo ), podemos afirmar que os intervalos

[ x −σ, x +σ] contém aproximadamente 68% dos valores da série.

[ x −2σ, x +2σ] contém aproximadamente 95% dos valores da série.

[ x −3σ, x +3σ] contém aproximadamente 99% dos valores da série.

Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas


variações para mais ou para menos, segundo o caso.
Exemplo: Suponha uma série com média x = 100 e desvio padrão σ = 5 , podemos interpretar estes
valores da seguinte forma:
1. Os valores da série estão concentrados em torno de 100.
2. O intervalo [95, 105] contém aproximadamente 68% dos valores da série.
O intervalo [90, 110] contém aproximadamente 95% dos valores da série.

30
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

3. O intervalo [85, 115] contém aproximadamente 99% dos valores da série.

 Coeficiente de Variação (CV)


Quando as medidas de duas ou mais variáveis são expressas em unidades diferentes como
peso/altura, capacidade/comprimento, etc. não se pode compara-las através do desvio padrão, por este ser
uma medida absoluta de variabilidade. Usa-se então o CV, que é uma medida relativa, que expressa o
desvio padrão como uma porcentagem da média aritmética. Quanto mais próximo de zero, mais
homogênea é a distribuição. Quanto mais distante, mais dispersas.
O CV mede a dispersão em relação à média. É a razão entre o desvio padrão e a média. O
resultado obtido dessa operação é multiplicado por 100, para que o coeficiente de variação seja dado em
porcentagem.
s
CV = 100
X

OBS.: um CV alto indica que a dispersão dos dados em torno da média é muito grande.

Exemplo: Calcule a média, o desvio padrão e o coeficiente de variação dos dados apresentados na tabela
abaixo. Comente os resultados, apontando quais os dados que apresentaram maior variabilidade, ou seja,
qual a variável mais homogênea (peso ou comprimento).
Peso (em kg) e comprimento (em cm) de 10 cães
Peso Comprimento X2 Y2
23,0 104 529 10816
22,7 107
21,2 103
21,5 105
17,0 100
28,4 104
19,0 108
14,5 91
19,0 102
19,5 99

Fonte: Araújo e Hossne (1997)

Solução:
a) Para a variável PESO (x)
Média

31
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Variância

1 
 (∑X ) 2 

∑ − n
2 i
S =  X i2 
n −1  
 

Desvio padrão

Coeficiente de variação

b) Para a variável COMPRIMENTO (y)


Média

Variância

1 
 (∑Y ) 2 


i
S2 =  Yi 2 − 
n −1  n 
 

Desvio padrão

Coeficiente de variação

Conclusão:

32
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

EXERCÍCIOS:
1 – Calcule a variância, o desvio padrão e o coeficiente de variação dos dados apresentados nas tabelas
abaixo:

Tabela 01 – Taxa de glicose, em miligramas por 100 ml de sangue,


em ratos machos da raça Wistar, com 20 dias de idade
100 97,5
100 85
97,5 85
80 80
Fonte: Guimarães et all (1979)

Tabela 02 – Peso fresco, em gramas, de pulmões de cobaias machos de 90 dias de idade


Pulmão
Direito Esquerdo
1,66 1,48
2,15 1,58
2,03 1,59
2,35 1,92
1,9 1,55
Fonte: HOSSNE et all (1990)

Medição
• MEDIÇÃO: conjunto de operações que tem por objetivo determinar um valor de uma
grandeza.
• Medição é fundamental para quem trabalha com movimento humano
• Avaliar um sujeito, um atleta, uma classe, uma equipe...
• Uma avaliação correta depende da seleção, aplicação e interpretação correta dos resultados
de uma medição...
Lembre-se, para tomar uma decisão adequada, primeiro obtenha informações válidas...

Metrologia
• METROLOGIA: Ciência da medição.
• GRANDEZA: Atributo de um fenômeno, corpo ou substância que pode ser qualitativamente
distinguido e quantitativamente determinado.

33
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

• PRINCÍPlO DE MEDIÇÃO: Base científica de uma medição.


• MÉTODO DE MEDIÇÃO: Seqüência lógica de operações, descritas genericamente, usadas
na execução das medições.
• PROCEDIMENTO DE MEDIÇÃO: Conjunto de operações, descritas especificamente, usadas
na execução de medições particulares, de acordo com um dado método.
• MENSURANDO: Objeto da medição. Grandeza específica submetida à medição.
• RESULTADO DE UMA MEDIÇÃO: Valor atribuído a um mensurando obtido por medição
(medida).

Unidades de medida
• UNIDADE DE MEDIDA: Grandeza específica, definida e adotada por convenção, com a qual
outras grandezas de mesma natureza são comparadas para expressar suas magnitudes em
relação àquela grandeza.
• O resultado da medição de uma grandeza é expresso pelo número de vezes que a unidade
de medida, tomada como referência, está contida na grandeza a ser determinada.
• O resultado da medição é composto por duas partes: o número e a unidade padrão em que a
grandeza foi expressa.
• Claramente, a informação de que uma pessoa saltou “15” de distância está incompleta,
porque se foram 15 cm, 15 polegadas ou até 15 m, é completamente diferente.

Sistema Internacional de Unidades


Sistema coerente de unidades adotado e recomendado pela Conferência Geral de Pesos e
Medidas (CGPM)

34
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Medida & erro


• Toda medida está sujeita à erro: erro instrumental, erro na aplicação do teste, variabilidade do
que está sendo medido (por exemplo, desempenho do sujeito).

35
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

• Para determinar corretamente um valor de uma grandeza é necessário então não só


conhecer o resultado da medição mas também o erro associado.

VALOR (DE UMA GRANDEZA): Expressão quantitativa de uma grandeza específica,


geralmente sob a forma de uma unidade de medida multiplicada por um número.
• VALOR VERDADEIRO (DE UMA GRANDEZA): Valor consistente com a definição de uma
dada grandeza específica.
• Idealmente, o objetivo de uma medição é determinar o valor verdadeiro de uma grandeza;
• Mas o resultado de uma medição é o valor observado;
• Devido ao erro no resultado da medição, o valor observado consiste no valor verdadeiro mais
o valor do erro.

• INCERTEZA DE MEDIÇÃO: Parâmetro, associado ao resultado de uma medição, que


caracteriza a dispersão dos valores que podem ser fundamentadamente atribuídos a um
mensurando.
Tipos de erro
• ERRO DE MEDIÇÃO: Resultado de uma medição menos o valor verdadeiro do mensurando.
• ERRO ALEATÓRlO: Resultado de uma medição menos a média que resultaria de um infinito
número de medições do mesmo mensurando efetuadas sob condições de repetitividade.
• ERRO SISTEMÁTICO: Média que resultaria de um infinito número de medições do mesmo
mensurando, efetuadas sob condições de repetitividade, menos o valor verdadeiro do
mensurando.

Medida e erro
Em geral em teoria de erros assume-se que:
1. O valor verdadeiro é independente do valor de erro;
2. A média dos valores de erro é zero (descontados os erros sistemáticos);
3. Os valores de erro de diferentes resultados de medição são independentes.

Como reportar o valor de uma medida


• Algarismos significativos: todos os algarismos do valor de uma medida dos quais se tem
certeza mais o primeiro algarismo de incerto da medida.
• Em geral, quantidade de algarismos significativos indica a precisão de uma medida.

36
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

– Por exemplo, é errado reportar a massa de uma pessoa determinada por uma balança
analógica (de ponteiro, com resolução de 1 kg) como sendo 70,215 kg. O correto seria 70,2 kg
(são 3 algarismos significativos e 2 é o algarismo de incerteza pois esse valor é estimado já
que não havia uma escala com essa resolução).
– A medida e o erro da medida poderia ser reportado como: 70,2±0,5 kg.

Como reportar o valor de uma medida II


• Suponha que foram feitas medidas da massa de vários indivíduos e pretende-se reportar o
valor central e a dispersão dessas medidas. Para tanto, é usual reportar média e desvio
padrão. Por exemplo, se as medidas foram 60,1; 65,0; 73,7; 68,5 kg, a média e desvio padrão
são: m = 66.8250 kg e dp = 5.7337 kg ou 66.8250±5.7337 kg.
• Esta forma de reportar média e dispersão de uma medida está errada. Não faz sentido
reportar tantos algarismos significativos considerando o erro da medida. Uma regra geral é
reportar a medida até a primeira casa decimal que já tem erro (desvio padrão nesse caso):
67±6 kg (com arredondamento).
• É aceitável reportar até a segunda casa decimal de erro e também seria correto: 66.8± 5.7 kg.

Repetitividade (de resultados de medição)


Grau de concordância entre os resultados de medições sucessivas de um mesmo
mensurando efetuadas sob as mesmas condições de medição.
Observações:
1. Estas condições são denominadas condições de repetitividade.
2. Condições de repetitividade incluem:
• mesmo procedimento de medição;
• mesmo observador;
• mesmo instrumento de medição, utilizado nas mesmas condições;
• mesmo local;
• repetição em curto período de tempo.
3. Repetitividade pode ser expressa, quantitativamente, em função das características da
dispersão dos resultados.

Reprodutibilidade (de resultados de medição)


Grau de concordância entre os resultados das medições de um mesmo mensurando
efetuadas sob condições variadas de medição.
Observações:

37
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

1. Para que uma expressão da reprodutibilidade seja válida, é necessário que sejam
especificadas as condições alteradas.
2. As condições alteradas podem incluir:
• Princípio, método e instrumento de medição;
• observador;
• padrão de referência;
• condições de utilização;
• local e tempo;
3. Reprodutibilidade pode ser expressa, quantitativamente, em função das características da
dispersão dos resultados.

Exatidão e Precisão
• EXATIDÃO (ACURÁCIA) DE MEDIÇÃO: Grau de concordância entre o resultado de uma
medição e um valor verdadeiro do mensurando. Exatidão é um conceito qualitativo.
• PRECISÃO DE MEDIÇÃO: Grau de concordância entre resultados de medição obtidos sob as
mesmas condições (repetitividade). Precisão é um conceito qualitativo.

Propriedades do resultado de uma medição


FIDEDIGNIDADE/CONFIABILIDADE (reliability) & VALIDADE
• Estas duas propriedades são comumente atribuídas como as mais importantes do resultado
de uma medição (ou da medição em si).
• Infelizmente, há várias definições diferentes para estas duas propriedades.

Boas definições são:


38
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

• FIDEDIGNIDADE: grau de repetitividade e reprodutibilidade do resultado de uma medição


(precisão).
• VALIDADE: grau de exatidão (acurácia) do resultado de uma medição (o quanto o resultado
se refere ao que se queria medir ou se pensava estar medindo).

Estimativas de fidedignidade/confiabilidade
• TESTE/RETESTE: aplicação do mesmo teste mais de uma vez nos mesmos sujeitos e
comparar os resultados.
• CONSISTÊNCIA INTERNA: aplicação de subgrupos do teste que medem o mesmo conceito.
Por exemplo, aplicar dois grupos de questões que avaliam o mesmo conceito e comparar os

resultados.

Tipos de validade
Validade pode ser dividida em:
1. Lógica
2. De conteúdo
3. De critério

4. De constructo

Validade lógica
• Diz-se de uma medição que utiliza na medição a própria variável que está sendo
determinada.
• Por exemplo, um teste de força muscular, que consiste em medir com um dinamômetro a
força que uma pessoa produz, tem validade lógica.

• Não há teste estatístico para esta propriedade.

Validade de conteúdo
• As medidas do teste devem estar relacionadas ao que se pretende avaliar.
• Exemplo: uma prova de um curso deve avaliar todo o conteúdo do curso. Uma peneira no
futebol deve ser um teste que avalie domínio de bola, posicionamento no campo, chute, e não
um teste que avalie número de flexões.

• Não há teste estatístico para esta propriedade.

39
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Validade de critério
• Relação do resultado de uma medição com um padrão ou critério reconhecidamente aceito
• Validade concorrente: validade de duas medidas que estão sendo aplicadas ao mesmo
tempo. Exemplo: validação do teste de cooper em relação ao teste de VO2 (referência, padrão
ouro).
• Validade preditiva: validade de uma medida como preditora de um resultado. Exemplo:
detecção de talento, predição da gordura corporal por dobras cutâneas.

Validade de constructo
• Grau que um teste mede uma variável que não pode ser observada diretamente, um
contructo (por exemplo, inteligência, ansiedade).
• A validade de constructo é estabelecida relacionando o resultado do teste com o
comportamento esperado.

40
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

UNIDADE II

INTRODUÇÃO A PROBABILIDADE

A Estatística está ligada à Teoria da Probabilidade e vice-versa. Ela se faz presente em várias
situações, como por exemplo, nas técnicas de amostragem. Na Estatística Indutiva, a probabilidade é um
ferramental indispensável, pois todo o processo de inferência ocorre com uma determinada margem de
incerteza. Sendo assim, se faz necessário aos usuários de Estatística adquirir pelo menos, noções básicas
sobre essa teoria.

1.1 – Conceitos fundamentais

a) Experimentos aleatórios e determinísticos.

Podemos distinguir dois tipos de experimentos. Observe as seguintes situações:

E.1) Experimentos do tipo 1:

i) Uma injeção contendo uma substância letal, altamente eficaz, que tem efeito em apenas 10 minutos, é
aplicada em 10 cobaias. Após duas horas, o número de sobreviventes é contado.

ii) Um recipiente com água é colocado para ferver, na cidade de Santos (ao nível do mar). A temperatura
de ebulição da água é registrada.

E. 2) Experimentos do tipo 2:

i) Jogar uma moeda e observar a face voltada para cima.

ii) Medir o tempo de sobrevida de um paciente com câncer, após aplicação de quimioterapia.

Podemos dizer que nos experimentos do tipo I, os resultados são conhecidos à priori, ou seja,
antes de se realizar o experimento. Assim, fatalmente não haverá sobreviventes no primeiro exemplo,
assim, como se sabe que água ferve a 100º C, ao nível do mar. Esses experimentos são chamados de
deterministicos e não são de interesse do ponto de vista da probabilidade. Já os experimentos do tipo 2,
são chamados aleatórios e, por mais que nos esforcemos em prever o resultado, ele só e determinado após
a realização do experimento. Portanto, os experimentos aleatórios são aqueles que repetidos sob as
mesmas condições podem, levar a resultados distintos. Estes sim, são objeto de interesse da Teoria da
Probabilidade.

41
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

b) Espaço Amostral e eventos

Embora nos experimentos aleatórios não seja possível identificar com exatidão o resultado à priori
, é possível descrever todos os possíveis resultados. A esse conjunto, da-se o nome de espaço amostral.
Aqui, denotaremos espaço amostral pela letra grega Ω .
i) E = jogar um dado e observar o número da face superior
Ω = { cara, coroa}
ii) Medir o tempo de sobrevida de um paciente com câncer, após aplicação de quimioterapia.
Ω = { t ∈ R / t ≥ 0}

Evento e qualquer subconjunto de Ω , incluindo Φ , evento impossível e o próprio Ω , evento


certo. Exemplos (relacionados com os experimentos anteriores).

Evento 1 – “ocorre cara”


A = {cara}
Evento 2 – “ o paciente não sobrevive”
B = { t ∈ R / t = 0}

Eventos complementares
Dado um evento A de Ω , o evento complementar de A, denotado A, é formado por todos os
elementos de Ω , que não estão em A .
Considerando os exemplos anteriores temos:
A = { coroa} , B = { t ∈ R / t > 0}

É imediato observar que: Ω


i) A ∪ A = Ω
A
ii) A ∩ A = φ AA

Esquema ilustrativo

42
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Eventos mutuamente exclusivos (ou excludentes)

Dois eventos A e B de um mesmo espaço amostral Ω , são considerados mutuamente exclusivos


se a ocorrência de um deles exclui a ocorrência do outro. Por outras palavras, os dois não podem ocorrer
simultaneamente, ou simplesmente se A ∩ B = φ .

Exemplo: No lançamento de um dado honesto, os eventos “número par” e “número ímpar” são
mutuamente exclusivos.

Utilizando operações com conjuntos, podem-se formar novos eventos:


i) (A ∪ B) → é o evento que ocorre se A ocorre ou se B ocorre ou ambos ocorrem;
ii) (A ∩ B) → é o evento que ocorre se A ocorre e B ocorre;
iii) ( A ) → é o evento que ocorre se A não ocorre;
iv) Dois eventos A e B são denominados mutuamente exclusivos, se eles não puderem ocorrer

simultaneamente, isto é, (A ∩ B) = ∅.
v) Eventos complementares são sempre mutuamente excludentes, mas a recíproca nem sempre é
sempre verdadeira.

c) Conceito clássico

Probabilidade – É o grau de confiança que se tem na ocorrência de um determinado evento.


Seja Ω um espaço amostral finito e A um evento qualquer, então a probabilidade de ocorrer A é:
#A
P( A ) = Onde, #A é o nº de maneiras que ocorre o evento "A"
#Ω
#Ω nº de maneiras que ocorre o espaço amostral

ou ainda,
N.C.F.
P ( A) = Onde, N.C.F. é o nº de casos favoráveis
N.T .C.
N.T.C. nº total de casos

Essa probabilidade deve satisfazer as seguintes condições:


a) 0 ≤ P(A) ≤ 1;
b) P (Ω ) = 1
c) Se A e B são eventos mutuamente exclusivos, então: P (A ∪ B) = P (A) + P (B)

43
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Exemplos:
1) Lança-se um dado. Qual é a probabilidade de sair um número ímpar? Qual é a probabilidade de sair o
número 2?
2) Uma carta é extraída ao acaso de um baralho com 52 cartas. Qual é a probabilidade de sair um às?

NOTAS:
a) A probabilidade varia entre 0 e 1 ou entre 0 e 100%;
b) Se é certo de ocorrer determinado evento, a P (desse evento) = 1 ou 100%. Se é impossível ocorrer
determinado evento a P (desse evento) = 0. Exemplo, lança-se um dado:
P (ocorrer um nº menor que 8) =
P (ocorrer um nº maior que 8) =

TEOREMAS:

1 – Se ∅ é o conjunto vazio, então P(∅) = 0


2 – Se A é complementar do evento A, então P( A ) =1 – P(A)
3 – Se A ⊂ B, então P(A) ≤ P(B)
4 – Teorema da soma: se A e B são dois eventos quaisquer, então,
P(A ∪ B) = P(A) + P(B) – P(A ∩ B)
P(A ∪ B ∪ C) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) + P(A ∩ B ∩ C)

Exercício: lance um dado.


Verifique o espaço amostral;
Considere os eventos: A = um nº par ocorre;
B = o número 5 ocorre;
C = um nº maior que 3 ocorre.

Calcule: P(A), P(B), P(C), P(A ∪ B), P(A ∪ C), P(B ∩ C),

44
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

1 2 - Probabilidade Condicional:

Definição: denomina-se probabilidade condicional à probabilidade de ocorrer determinado evento sob

uma dada condição. Sejam A e B dois eventos, denota-se P ( A\ B ) a probabilidade condicionada do


evento A quando B tiver ocorrido por,
P( A ∩ B ) N .C.F .( A ∩ B ) P( A ∩ B )
P( A\ B ) = ⇒ ou P( B\ A ) =
P( B ) N .C.F .( B ) P( A )

Exemplo:
Dois dados são lançados, registrando-se os resultados com (x1, x2 ). Considere os seguintes eventos:
A = { (x1, x2); x1 + x2 = 10} e B = { (x1, x2); x1 > x2}
Calcule P ( A ) , P ( B ) , P ( A\ B ) e P ( B\ A )
Espaço amostral:

Espaço amostral de A:

Espaço amostral de B:

Qual a P(A ∩ B) ?
Resp.: (A ∩ B) = { (x1, x2); x1 + x2 = 10 e x1 > x2}
Ω (A ∩ B) = {(6,4)} P(A ∩ B) = 1/36.

A partir da definição de "Probabilidade Condicional" pode-se enunciar o TEOREMA DO PRODUTO:


• P(A\B ) = P(A ∩ B) / P(B) ⇒ P(A ∩ B) = P(B) . P(A\B )
• P(B\A ) = P(A ∩ B) / P(A) ⇒ P(A ∩ B) = P(A) . P(B\A )

45
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

1 3 - Independência Probabilística
Dois eventos A e B, de Ω , são independentes se e somente se:

 P ( A\ B ) = P ( A )

 P ( B\ A ) = P ( B )
Ou seja, a ocorrência de um deles não condiciona a ocorrência do outro e vice-versa. Desse modo, temos
também que:
P ( A ∩ B ) = P ( A) ⋅ P ( B )

Como por exemplo, considere o experimento aleatório do lançamento simultâneo de um dado e


uma moeda e sejam os eventos:
A = {(cara, 1); (cara,3); (cara,4); (cara,4); (cara,5); (cara,6)} [“ocorrer cara”]
B = {(cara, 6); (coroa,6)} [“ocorrer número 6”]
Será que os eventos A e B são independentes?
É imediato verificar que P(A\B) = P(A) =1/2, assim como, P(B\A) =P(B) = 1/6, portanto os eventos A e B
são independentes. E, nesse contexto, a probabilidade de ocorrer a e B simultaneamente é dada por:
1 1 1
P ( A ∩ B ) = P ( A) ⋅ P ( B ) = ⋅ =
2 6 12

1 4 - Teorema de Bayes

Seja Ω o espaço amostral associado a um experimento aleatório e { C1 , C 2 ,L C k } uma partição de

Ω . De tal forma que C i ∩ C j = ∅, ∀ i ≠ j; ∪ Ci, s = Ω e seja A um evento qualquer de Ω . Suponha que

sejam conhecidas todas as probabilidades condicionais do tipo P ( A \ C i ) bem como todas as

probabilidades de cada um dos eventos da partição de Ω . Desejando-se saber qual é a probabilidade de

ocorrer C i dado que ocorreu A .

Esse resultado é dado pelo teorema da Bayes também conhecido como “regra das probabilidades
das hipóteses” e é uma das relações mais importantes envolvendo probabilidades condicionais:
P ( C i ) ⋅ P ( A \ Ci )
P ( Ci \ A) =
∑ P ( C ) gP ( A \ C )
j
j j

46
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Exemplo: Numa Faculdade funcionam três cursos C1, C2, C3. Sabe-se que a proporção de alunos
fumantes nos três cursos é de 0,25; 0,55 e 0,40; respectivamente. Um aluno é selecionado ao acaso e
sabe-se que ele é fumante. Nessas condições, qual é a probabilidade de que ele seja do curso C3?

Trata-se de um problema típico para a aplicação do Teorema de Bayes. Costuma ser elucidativo,
nesses casos, a árvore das possibilidades da situação descrita:

P (C1) Curso Fuma? (


P A /Ci )
1/3 Sim 1/4
C1
Não 3/4
1/3
C2 Sim 11/20
Não 9/20
1/3
C3 Sim
2/5
Não
3/5

Então;

P ( C i ) ⋅ P ( A \ Ci )
P ( Ci \ A) =
∑ P ( C ) gP ( A \ C )
j
j j

1 2

3 5 1
P ( CursoC3 \ que é fumante ) = =
1 1 1 11 1 2 3
⋅ + ⋅ + ⋅
3 4 3 20 3 5

C1 C2

C3

Esquema ilustrativo da partição do espaço amostral em 3 eventos exaustivo

47
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

UNIDADE III

PRINCIPAIS DISTRIBUIÇÕES DE PROBABILIDADE

Em muitas situações de interesse pratico que consideramos, queremos estudar o comportamento


de uma ou mais variáveis. Assim, podemos estar interessados em estudar a distribuição das alturas e
pesos de pessoas de uma população. Escolhida uma pessoa ao acaso, desta população, obtemos o seu peso
e a sua altura e estamos, pois considerando duas variáveis. Em muitas situações, como a descrita, a
associação pode ser arbitrária. Por exemplo, considere o caso de um questionário, em que uma pessoa é
indagada a respeito de uma proposição e as respostas possíveis são “sim” ou “não”, respectivamente.
(Mais adiante estudaremos com pormenores este tipo de variável).

2.1 - VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTINUAS

As variáveis aleatórias (que descrevemos de modo abreviado: v. a .) podem ser de dois tipos:
discretas ou continuas. Uma v.a. é dita discreta quando ela assume somente valores num conjunto
enumerável de pontos do conjunto real. Ela é uma v.a . continua se for do tipo que pode assumir qualquer
valor em um intervalo real.

2 .1 - Definição: Sejam ε um experimento e Ω um espaço amostral associado ao experimento. Uma

função X , que associe a cada elemento ω ∈ Ω um número real, X ( ω ) , é denominada variável aleatória.
É toda variável influenciada pelo acaso.

Ω R
X X ( ω) X
ω
(Ω )

Ex. 1: Consideremos o experimento aleatório: extraem-se duas bolas, sem reposição, de uma urna
que contem: 2 bolas brancas (B) e 3 vermelhas (V). Vamos definir a v. a . X como:

X = “o numero de bolas vermelhas obtidas nas duas extrações”. Portanto os valores possíveis que a v. a.
X pode assumir são :

X = 0, se ocorre o evento: “BB”, (duas bolas brancas)

48
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

X =1, se ocorre o evento: “VB” ou “BV” (Vermelha e branca ou branca e vermelha)

X = 2, se ocorre o evento: “VV” (Duas bolas Vermelhas)

2.2 - Valor Esperado de Variáveis Aleatórias Discretas

Definição: Se X 1 , X 2 ,L , X n são os possíveis valores de v. a. X , e P ( X 1 ) ,P ( X 2 ) ,L ,P ( X n )


são as respectivas probabilidades então o valor esperado, (ou esperança matemática ou media), de X ,

denotado por E ( X ) ou µ x , é definido por:

n n

E (X ) =∑X ⋅P
i X( i ) para v. a’ s discretas E ( X ) = ∫X ⋅i f ( X ) para v. a’ s contínuas
i =1 i =1

Ex. 4: Consideremos o novamente o exemplo da urna com 3 bolas vermelhas e 2 brancas, de onde se
extraem sem reposição duas bolas.

A v. a . X é definida como:
X = “o numero de bolas vermelhas obtidas nas duas extrações”.
Portanto: X ( Ω ) = { 0,1, 2}

O valor esperado ou média da v. a. X será:

1 6 12
E( X ) = 0⋅ + 1 ⋅ + 2 ⋅ = 1,2
10 10 10

Ex. 5: Consideremos o novamente o exemplo do lançamento de uma moeda “honesta” duas vezes. Seja a
v. a. Y , definida como:

Y = “nº de ”caras” obtidas nos dois lançamentos”. → Y = { 0,1,2} . Portanto temos:


Então que a média desta v.a. (seu valor esperado) será:
n
1 2 1 4
E ( Y ) = ∑ Yi ⋅ P ( Yi ) = E ( Y ) =0 ⋅ + 1 ⋅ + 2 ⋅ = = 1
i =1 4 4 4 4

49
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

2.3 – Propriedades
1) A média de uma constante é a própria constante:
E( K) = K

2) Multiplicando uma v.a. X por uma constante, sua média fica multiplicada por essa constante:
E ( KX ) = KE ( X )

3) Somando ou subtraindo uma constante a uma v.a. a sua média fica somada ou subtraída da mesma
constante.
E( X ± K) = E( X ) ± K

4) A média da soma ou da diferença de duas v. a.’s é a soma ou a diferença das médias.


E( X ±Y ) = E( X ) ± E(Y )

5) A média do produto de duas v. a’s independentes é o produto das médias.


E ( XY ) = E ( X ) ⋅ E ( Y )

Estas propriedades também são válidas para as variáveis contínuas.

Ex. 6: Seja o experimento: Lançar um dado “honesto” e observar o número que ocorre na face superior.

Então temos, Ω = { 1,2,3,4,5,6} . Sejam as variáveis aleatórias X e Y , definidas como:


X = “duas vezes o numero que aparece na face superior do dado” e,
Y = 1, se ocorre um número ímpar na face superior do dado.

Y = 3, se ocorre um número par na face superior do dado.

Portanto, X ( Ω ) = { 2,4,6 ,8,10,12} e Y ( Ω ) = { 1,3}

Então temos as distribuições de probabilidade e os respectivos cálculos de suas esperanças:

a) v. a. X b) v. a. Y

X P( X ) X ⋅P( X )
2 1/6 2/6
4 1/6 4/6
6 1/6 6/6
8 1/6 8/6
10 1/6 10/6
12 1/6 12/6
Σ 1 42/6=7

50
Y P(Y ) Y ⋅ P( Y )
1 1/2 1/2
3 1/2
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de 3/2
Oliveira Σ 1 42/6=7

42 4
Logo: E ( X ) = =7 e E(Y) = =2
6 2

 Seja a constante real K = 4 e v. a. Z dada por Z = K ⋅ Y , isto é, Z = 4 ⋅ Y . Segundo a propriedade (2)


devemos ter que:

E ( Z ) = E ( 4 ⋅ Y ) = 4E ( Y ) = 4 ⋅ 2 = 8, desde que E ( Y ) = 2 .

vamos confirmar se realmente E ( Z ) = 8 . Os valores possíveis da v. a. Z dada por Z = 4 ⋅ Y


serão:

Z ( 1) = Z ( 3 ) = Z ( 5 ) = 4 ⋅ 1 = 4

Z ( 2 ) = Z ( 4 ) = Z ( 6 ) = 4 ⋅ 3 = 12, portanto temos a distribuição e o respectivo calculo da media da v. a. Z.

Z P( Z) Z ⋅P( Z)
4 1/2 4/2
12 1/2 12/2
Σ 1 16/2 = 8

16
Logo, E ( Z ) = = 8, portanto , realmente o resultado as propriedade (2) foi verificado.
2

 Tomemos agora a v. a . V como sendo V = 4 + Y .

Pela propriedade (3) devemos ter que E ( V ) = E ( 4 + Y ) = 4 + E ( Y ) = 4 + 2 = 6

Vamos verificar se realmente E ( V ) = 6 . Analogamente ao procedimento anterior, temos que, se


V é definida como V = 4 + Y , então os possíveis valores da v. a V serão:

V ( 1) = V ( 3 ) = V ( 5 ) = 4 + 1 = 5

V ( 2) = V ( 4) = V ( 6 ) = 4 + 3 = 7

Portanto temos:

V P(V ) V ⋅ P(V )
5 1/2 5/2

51
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

7 1/2 7/2
Σ 1 12/2 = 6

12
Logo, E ( V ) = = 6. Desta forma se verifica o resultado da propriedade (3).
2

 Tomemos agora a v. a . T , definida como: T = X + Y .. Pela propriedade (4) devemos ter:

E ( T ) = E ( X +Y ) = E ( X ) + E( Y ) =7 + 2 = 9

Vamos verificar se, de fato, E ( T ) = 9 . Temos que, se T é dada por:

T = X + Y , então os possíveis valores da v.a T serão:

T ( 1) = 2 + 1 = 3
T ( 2) = 4 + 3 = 7
T ( 3) = 6 + 1 = 7
T ( 4 ) = 8 + 3 = 11
T ( 5 ) = 10 + 1 = 11
T ( 6 ) = 12 + 3 = 15

Assim, v. a. T tem distribuição e média conforme a tabela:

T P(T ) T ⋅P(T )
3 1/6 3/6
7 2/6 14/6
11 2/6 22/6
15 1/6 15/6
Σ 1 54/6 = 9

E, concluímos que o resultado da propriedade (4) se verifica para os valores deste exemplo.

2.4 – Variância de uma Variável Aleatória

Definição: Seja X uma v.a.. Definimos a variância de X , denotada por V ( X ) ou σ X , da seguinte


2

maneira:

V ( X ) = E( X − E( X ) ) = E( X 2 ) −( E( X ) )
2 2

2.5 – Propriedades

1) Se C for uma constante


52
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

V ( X +C) =V ( X )

2) Se C for uma constante

V ( CX ) = C 2V ( X )

3) Se X e Y for uma v. a. bidimensional, e se X e Y forem independentes então:

V ( X +Y ) = V ( X ) +V ( Y ) .

Em muitos problemas teóricos e aplicados, e a primeira vista, sob diversas condições, várias
funções de densidade (ou distribuição) de probabilidade aparecem com tanta freqüência que merecem ser
estudadas.

2.7 - Principais Distribuições Discretas

2.7.2 Distribuição Binomial

Consideremos n tentativas de um mesmo experimento aleatório. Cada tentativa admite apenas


dois resultados: fracasso com probabilidade q e sucesso com probabilidade p, p + q = 1. As
probabilidades de sucesso e fracasso são as mesmas para cada tentativa.

Seja X: nº de sucessos de n tentativas independentes.

Determine a função de probabilidades da variável X, isto é, P(X = k).

S
SS
...
 SF
FF
 ...
F
Um resultado particular (RP):
k n −k

Logo,

p.p... pqq ... q


P(RP) = P(SSS ... SFFF ... F) =    
k n −k

Considerando todas as n-úplas com k sucessos temos:

kn 
n −k
P(X = k) = 
k 
p .q
 

A variável X tem distribuição Binomial, com parâmetros n e p, e indicaremos pela notação X~B(n,p).

53
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Ex. Uma prova tipo teste tem 50 questões independentes. Cada questão tem 5 alternativas. Apenas uma
das alternativas é a correta. Se um aluno resolve a prova respondendo as questões, qual a probabilidade de
tirar nota 5, sabendo-se que a prova vale 10?

Solução: X = nº de acertos. X = 0, 1, .........., 50

p = P( acerto ) = 1/5 ⇒ X : B( 50, 1/5 )

22 55
 5   1  4 0
P( X = 25 ) =
 . .  = 0, 0 0 0 0 2
 2  5  5  5
• Esperança (média) e Variância

n n −k
Se X ~ B( n, p ) ⇒ P(X = k) = 
k 
k
p .q , logo ;
 

E(X) = n.p

Var(X) = n.p.q

2.7.3 Distribuição Hipergeométrica

Consideremos uma população com N elementos, dos quais r tem uma determinada característica
(a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição,
uma amostra de tamanho n.

Seja X: nº de sucessos na amostra (saída do elemento com a característica). Qual a P(X = k)?

N  r 
Podemos tirar 
n 
 amostras sem reposição. Os sucessos na amostra podem ocorrer de 
k 
 maneiras e
   

N − r 
fracassos de  
 modos.
n − k 

Logo,

54
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

 r  N − r 

k 
n − k 
P(X = k ) =   
,0≤ k≤ n e k≤ r
N
 
n 
 

A variável X assim definida tem distribuição Hipergeométrica.

• Esperança (média) e Variância

E( X ) = n.p

(N − n) r
Var( X ) = n.p.(1-p) ( N −1) onde p =
N

Ex.: Pequenos motores são guardados em caixas de 50 unidades. Um inspetor de qualidade examina cada
caixa, antes da posterior remessa, testando 5 motores. Se nenhum motor for defeituoso, a caixa é aceita.
Se pelo menos um for defeituoso, todos os 50 motores são testados. Há 6 motores defeituosos numa
caixa. Qual a probabilidade de que seja necessário examinar todos os motores dessa caixa?

Solução: X: nº de motores defeituosos da amostra.

N = 50; r = 6; n = 5

 6  44 

0 
5 
  
P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) = 1 - P(X = 0) = 50 = 1 – 0,5126 = 0,4874
 

5 
 

2.7.4 Distribuição de Poisson

Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo.

A probabilidade da ocorrência de um sucesso no intervalo é proporcional ao intervalo. A


probabilidade de mais de um sucesso nesse intervalo é bastante pequena com relação à probabilidade de
um sucesso. Por exemplo: automóveis que passam numa esquina. Poderemos num determinado intervalo
de tempo anotar o nº de carros que passaram, porém, o nº de carros que deixaram de passar pela esquina
não poderá ser determinado.

Seja X o nº de sucessos no intervalo então:

e −λ.λk
P( X = k ) =
k!

• Esperança (média) e Variância

55
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

E( X ) = λ

Var( X ) = λ

Ex.: Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade de que uma página
contenha pelo menos 3 erros?

Solução: X: nº de erros por página e λ = 1

P(X ≥ 3) = 1 – P(X < 3) = 1- {P(X = 0) + P(X = 1) + P(X = 2)} =

e −1.10 e −1.11 e −1.12 


=1-  + +  = 1 - {0,367879 + 0,367879 + 0,183940} =
 0! 1! 2! 

= 1 – 0,919698 = 0,080302

EXERCÍCIOS

1) A probabilidade de um menino ser daltônico e 6%. Qual é a probabilidade de serem daltônicos


todos os 4 meninos que se apresentaram, em determinado dia, para um exame oftalmológico?

2) Seja X uma v. a. correspondente ao número de caras em quatro lançamentos de uma moeda. Qual a
probabilidade de se obter:

a) exatamente duas caras?

b) Pelo menos uma cara?

c) Mais de uma cara?

2) Seja X uma v. a. correspondente ao número de caras em quatro lançamentos de uma moeda. Qual
a probabilidade de se obter:

d) exatamente duas caras?

e) Pelo menos uma cara?

f) Mais de uma cara?

3) Se o número de chamadas telefônicas que um operador recebe entre 9:00 e 9:05 segue uma
distribuição de Poisson com λ = 2, qual é a probabilidade de que o operador não receba nenhuma
chamada amanhã, no mesmo intervalo?
56
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

4) Em estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A
e 5 da espécie B. A evolução de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos
pesquisadores através de capturas periódicas. Determinar a probabilidade de, em três jacarés capturados
de uma vez, obtemos:

a) Todos da espécie ª

b) Nem todos serem da espécie B.

c) A maioria ser da espécie A.

5) Um laboratório estuda a emissão de partículas de certo material radioativo. Seja N: número de


partículas emitidas em 1 minuto. O laboratório admite que n tem função de probabilidade Poisson com
parâmetro 5, isto é,

e −5 5k
P(N = k ) = , k = 0,1,2,...
K!

a) Calcule a probabilidade de que em um minuto não hajam emissões de partículas.

b) Determine a probabilidade de que pelo menos uma partícula seja emitida em um minuto.

c) Qual a probabilidade que, em um minuto, o número de partículas emitidas esteja entre 2 e


5 (inclusive)?

2.8 - Principais Distribuições Contínuas


As variáveis aleatórias contínuas são muito usadas para descrever fenômenos físicos,
principalmente aqueles que envolvem o tempo. Este capítulo apresentará as distribuições de
probabilidade mais usadas para descrever a funcionalidade entre as variáveis aleatórias
contínuas.
As distribuições contínuas de probabilidade discutidas aqui são: distribuição normal ou
gaussiana, distribuição exponencial, distribuição uniforme

2.8.2 - A Distribuição Normal

A distribuição normal (ou Gaussiana) é a mais importante distribuição de probabilidade na


estatística. Isto porque para amostras grandes vários fenômenos estudados convergem para uma curva
normal.

57
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Como se sabe, as variáveis contínuas resultam, em geral, de mensurações (medidas) e podem


assumir quaisquer valores em um intervalo real. Assim, comprimento, área, altura, volume, peso,
pressão, renda familiar, etc, são alguns exemplos de variáveis contínuas. Vimos na Estatística Descritiva
que a apresentação gráfica dessas variáveis pode ser feita através de um histograma ou polígono de
freqüências. Em grande parte dos casos, esses gráficos têm aspecto similar, sugerindo uma distribuição
para os dados em foram de sino, como mostra a figura abaixo:

Distribuição da pressão sistólica dos


estudantes

20
nº de estudantes

15

10

0
pressão sistólica

A curva sob o gráfico acima pode ser interpretada como um limite teórico para a descrição dos
dados, pois à medida que aumentamos o tamanho da amostra mais as características amostrais se
aproximam dos parâmetros populacionais, de tal sorte que podemos supor uma linha totalmente polida,
simétrica e mesocúrtica para o verdadeiro tamanho da população. A essa curava dá-se o nome de curva
normal ou curava gausiana e os dados que aderem a ela seguem a chamada distribuição normal.
A distribuição normal, como já foi dito, é a principal distribuição de variável aleatória contínua.
A caracterização de distribuições contínuas se dá através de uma função densidade de probabilidade. É
através dessas funções, por exemplo, que podemos calcular a probabilidade de uma variável aleatória
pertencer a um determinado intervalo.

Dizemos que a v. a. X tem distribuição normal, com parâmetros µ e σ 2, − ∞ < µ < + ∞e


0 < σ 2 < +∞ , se sua f.d.p. é dada por:
( x −µ)2
para todo x ∈ R,
1 −
f (x) = .e 2σ
2
,
σ 2π

em que os parâmetros µ e σ 2 referem-se respectivamente a média e a variância da variável


aleatória X.

58
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Notação: X~N( µ , σ 2)

Gráfico: A figura abaixo ilustra uma particular curva normal, determinada por valores particulares
de µ e σ 2.

Pode-se demonstrar que:

a) E(X) = µ

b) Var(X) = σ 2

c) f(x) → 0 quando x → ±∞

d) µ - σ e µ + σ são pontos de inflexão de f(x);

1
e) x = µ é ponto de máximo de f(x), e o valor máximo é σ 2π ;

f) f(x) é simétrica ao redor de x = µ , isto é, f(µ + x) = f(µ - x), para todo −∞ < x < + ∞

g) a variável aleatória (x) pode assumir qualquer valor real.

h) o gráfico é uma curva em forma de sino, simétrica em torno da média µ .

i) a área total sob a curva vale 1, porque essa área corresponde à probabilidade de a variável
aleatória assumir qualquer valor real.

j) como a curva é simétrica em torno da média, os valores maiores do que a média e os valores
menores do que a média ocorrem com igual probabilidade.

59
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

PROBLEMAS para o cálculo das probabilidades:

1. integração de f (x), pois para o cálculo é necessário o desenvolvimento em séries;

2. elaboração de uma tabela de probabilidades, pois f (x) depende de 2 parâmetros , μ e μ, o que


acarretaria um grande trabalho para tabelar essas probabilidades considerando-se as várias
combinações de μ e μ.

SOLUÇÃO: transformação de variáveis (x em z)

A Normal-Padrão

Para o cálculo das probabilidades, surgem dois grandes problemas: primeiro, para integração de
f(x), pois para o cálculo é necessário o desenvolvimento em séries; segundo, seria a elaboração de uma
tabela de probabilidades, pois f(x) depende de dois parâmetros, fato este que acarretaria um grande
trabalho para tabelar essas probabilidades considerando-se as várias combinações de µ e σ 2.

Os problemas foram solucionados por meio de uma mudança de variável obtendo-se, assim, a
distribuição normal padronizada ou reduzida:

Quando µ = 0 e σ 2 = 1, temos uma normal padrão ou reduzida, e escrevemos: N(0,1).

Se X~N(µ , σ 2), então a v.a. Z definida por

X −µ
Z=
σ

terá uma distribuição N(0,1).

É fácil demonstrar que Z tem média 0 e variância 1. A normalidade de Z já não é imediata e não
será provada aqui. A figura abaixo ilustra a N(0,1).

60
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Suponha, então, que X~N(µ , σ 2) e queiramos determinar


( x −µ)2
b 1 −
P(a ≤ X ≤ b) = ∫ .e 2σ
2
dx . (Ver figura)
a σ 2π

A integral acima não pode ser calculada exatamente, por métodos numéricos. No entanto, para
cada valor de µ e cada valor de σ , teríamos que obter P(a ≤ X ≤ b) para diversos valores de a e b.

X −µ
Esta tarefa é facilitada através do uso de Z = , de sorte que somente é necessário construir uma
σ

tabela para a distribuição normal padrão N(0,1).

Vejamos, então, como obter probabilidades a partir da Tabela da Distribuição Normal Reduzida.
Esta tabela dá as probabilidades sob uma curva normal padrão que nada mais são do que as
correspondentes áreas sob a curva. A figura ao abaixo ilustra a probabilidade fornecida pela tabela , a
saber,

61
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

P(0 ≤ Z ≤ zc),

sendo Z~N(0,1). Assim, se zc = 1,73, segue-se que

P(0 ≤ Z ≤ 1,73) = 0,4582.

Exercícios:
1) Usando a tábua da Normal padrão, ou seja, se Z ~ N(0,1) estabeleça as seguintes probabilidades:
a) P (0<Z<2,13)
b) P (-2,13<Z<0)
c) P ((-2,13<Z<2,13)
d) P (Z ≥2,13)
e) P (Z< -2,13)

2) Numa população, o peso dos indivíduos é uma variável aleatória X que segundo estudos anteriores
segue o modelo normal com média 78 kg e desvio-padrão 10 kg. Uma pessoa é escolhida ao acaso
nessa população. Determine a probabilidade de que seu peso:

a) Seja maior que 60 kg;


b) Esteja entre 62kg e 72 kg
c) Seja inferior a 90 kg
d) Seja superior a 90 kg

62
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

DISTRIBUIÇÃO DE PROBABILIDADES GAMA

Seja X uma variável aleatória que representa o número de chegadas no intervalo de


tempo (0, t) e que segue uma distribuição de Poisson. Suponha que o tempo a v-ésima
chegada seja dada pela f.d.p.

para valores inteiros de ν.

Veja que quando ν = 1....

Ou seja, a Distribuição Exponencial é um caso particular da Distribuição Gama.

DISTRIBUIÇÃO GAMA:
Idéias gerais:
Muitas variáveis atmosféricas são distintamente assimétricas, e possuem uma
assimetria para a direita. Muitos de vocês encontraram essas distribuições quando analisaram
seus dados para o seminário. Um dos exemplos mais comuns dessa situação é a precipitação.
Sabemos que não existem precipitações negativas, certo? Então vamos analisar a seguinte
situação: suponha que uma certa localidade tenha uma média de precipitação diária de 1.96 in
e desvio-padrão de 1.12 in. Utilizando a tabela de distribuições acumuladas Gaussiana
podemos calcular a probabilidade de precipitações negativas como Pr { Z ≤ (0.00 – 1.96)/1.12}
= Pr{Z≤ -1.75} = 0.040. Esta probabilidae calculada não é especialmente grande, mas por outro
lado não pode ser considerada zero. AGORA, SABEMOS PELA NATUREZA QUE
PRECIPITAÇÕES NEGATIVAS SÃO IMPOSSÍVEIS!

Uma escolha comum para representar distribuições contínuas que são assimétricas é utilizar a
distribuição GAMMA. Esta distribuição é definida pela PDF:

63
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

( x / β)α−1 exp( −x / β)
f ( x) , onde x, α, β > 0
βΓ(α)

Os dois parâmetros da distribuição são α, chamado PARÂMETRO DE FORMA , e β O


PARÂMETRO DE ESCALA. A quantitdade Γ(α) é o valor da função matemática padrão
conhecida como FUNÇÃO GAMMA, definida pela integral:

Γ(α) = ∫t α−1e −t dt
0

Fig. 5.3. Funções densidade de probabilidade GAMMA para 4 valores do parâmetro de forma α
(adaptado de Wilks, cap 5)

Em geral, a função gamma precisa ser avaliada numericamente, ou aproximada usando


valores tabulados como os dados acima. A função gamma satisfaz a recorrência fatorial:

Γ(α +1) =αΓ(α)

Isto permite que a tabela distribuída em sala de aula seja utilizada indefinidamente. Por
exemplo, Γ(3.5)= Γ(2.5) Γ(2.5)=(2.5)(1.5) Γ(1.5)=(2.5)(1.5)(0.8862)=3.323.

A PDF da distribuição Gamma pode apresentar uma grande variedade de formas, dependendo,
portanto, do parâmetro de forma α. Para valores de α muito altos, a distribuição gamma tende à
Gaussiana

O parâmetro de escala β, tem a função de ESTICAR OU ENCOLHER (isto é escalonar) a


função de densidade gamma para a direita ou esquerda, dependendo das magnitudes gerais
dos valores dos dados representados.

64
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Existem 2 aproximações para os estimadores da distribuição Gamma que são fáceis de


calcular à mão. Ambas empregam a estatística:

1 n
D =ln( x ) −
n
∑ln( xi ) , (5.14)
i =1

1) A primeira das duas aproximações (conhecida por estimadores de Thom – Thom (1958))
para o parâmetro de forma é dada por:
1 + 1 + 4D / 3
αˆ = (5.15)
4D

x
βˆ = (5.16)
αˆ

2) A segunda aproximação é polinomial e utilizamos as seguintes equações:

0.5000876 + 0.1648852 D −0.0544274 D 2


α
ˆ = (5.17)
D

Para 0≤ D ≤0.5772,

Ou
8.898919 +9.059950 D +0.9775373 D 2
α
ˆ = (5.18)
17 .79728 D +11 .968477 D 2 + D 3

Para 0.5772 ≤ D ≤ 17

O parâmetro de escala é medido como na Eq. 5.16.

Como no caso da distribuição Gaussiana, a função densidade de probabilidade Gama não é


analiticamente integrável. A distribuição Gama precisa portanto ser obtida pelo calculo das
aproximações da CDF (isto é, a integral da 5.11) ou a partir das probabilidades tabuladas. A
tabela de distribuição de probabilidades Gama será fornecida em sala de aula (ou pode ser
encontrada no final do livro texto – tabela B-2). Em qualquer caso, a distribuição de
65
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

probabilidades gama será disponível para uma distribuição gama padrão com β=1. Portanto, é
sempre necessário fazer uma transformação para re-escalonar a variável X de interesse
(caracterizada por uma gama com parâmetro de escala arbitrário β) para a variável
x
ξ= (5.19)
β

Que segue uma distribuição gama com β=1. A variável padrão ζ é admensional (lembre-se que
β possui a dimensão de seus dados). O parâmetro de forma α será o mesmo para X ou para ζ.
Veja que este procedimento é equivalente à transformação para a variável padronizada z no
caso da distribuição Gaussiana.
Entretanto, as PROBABILIDADES CUMULATIVAS para a distribuição gama padrão são dadas
pela função matemática conhecida como “FUNÇÃO GAMMA INCOMPLETA, P(α,ζ )= Pr
{Θ≤ζ}=F(ζ). Esta é a função que foi utilizada para calcular as probabilidades que aparecem na
tabela B.2. Ou seja, as probabilidades cumulativas para a distribuição gama padronizada na
tabela B.2 estão arranjadas de forma INVERSA DO QUE É FEITO COM AS
PROBABILIADDES GAUSSIANAS. Quer dizer, os quantis (ou valores transformados ζ) é que
estão apresentados no corpo da tabela, enquanto as probabilidades cumulativa é que estão
sendo mostradas na primeira linha da tabela. Na primeira coluna da tabela, a entrada é o valor
de alfa.

Vamos analisar o exemplo dado pelo Wilks. Considere a tabela de dados da precipitação de
Janeiro para a cidade de Ithaca durante 50 anos (1933-1982). Queremos avaliar o quão ‘não
usual” foi a precipitação observada em Ithaca em 1987 (fornecida numa tabela separada). Para
esta finalidade, procedemos da seguinte maneira:
1) Calculamos a média aritmética como de costume (no presente caso, a média é igual a
1.96in)
2) Calculamos o valor da média dos logaritmos dos totais mensais (igual a 0.5346)
3) Obtemos o valor de D como na Eq. 5.14 (igual a 0.139)
4) O método de Thom (Eq. 5.15 e 5.17) estimam α=3.76 e β=0.52in.
5) Avaliamos qual usual foi a precipitação em janeiro de 1987 (=3.15in) com a ajuda da
Tab. B2 para os parâmetros da Gama que obtivemos anteriormente. Para esta
finalidade, vamos primeiro fazer a transformação de variáveis indicado na Eq. 5.19. No
presente caso, ζ=3.15in/0.52in= 6.06.

66
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

6) O passo seguinte é encontrar no corpo da tabela onde se encontra a probabilidade 6.06


para α=3.76. O valor mais próximo de entrada de α é α=3.75. Vamos olhar na linha
correspondente onde está a probabilidade 6.06. Esta se encontra entre os valores
tabulados F(5.214)=0.90 e F(6.354)=0.90. A interpolação nos dá F(6.06)=0.874. Ou seja,
a probabilidade de chover em janeiro menos ou igual a 3.15 in em Ithaca é de 0.874. O
complementar (1- 0.874) = 0.126 é a probabilidade de chover mais do que esse valor (a
qual é equivalente a aproximadamente 1 chance em 8 (1/8).
A tabela B2 pode também ser utilizada para inverter a CDF gama para encontrar valores de
precipitação correspondendo a probabilidades cumulativas ζ=F-1(p). Valores dimensionais de
precipitação são então recuperados para reverter a transformação na Eq. 5.19. Por exemplo,
vamos considerar a estimativa da mediana para a precipitação de janeiro em Ithaca. Esta
corresponderá ao valor de ζ satisfazendo F(ζ) =0.50, o qual, na coluna correspondente a α=3.5
na Tab. B2 é 3.425. O correspondente valor dimensional da precipitação é dado pelo produto ζ
β=(3.425)(0.52in)=1.78in. Por comparação, a mediana amostral da precipitação obtida da
tabela com os dados é igual a 1.72in. Não é surpresa que a mediana é menos que a média de
1.96in, uma vez que a distribuição é alongada para a direita. (positivamente alongada ou
skewed). O engraçado nesta idéia (o que está intimamente ligado às características de uma
distribuição Gama) é que valores mais baixos do que a média são mais prováveis de ocorrer do
que valores acima da média (ou normal).

67
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

68
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

69
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

UNIDADE IV

INFERENCIA ESTATÍSTICA

ESTATÍSTICA: Ciência que diz respeito à coleta, apresentação, análise e interpretação de dados
experimentais.

ESTATÍSTICA DESCRITIVA
PROBABILIDADE ESTATISTICA
INFERÊNCIA ESTATÍSTICA

1. Introdução

Nas últimas unidades vimos como construir modelos probabilísticos para descrever alguns fenômenos.
Nessa parte, iremos estudar um ramo muito importante da Estatística conhecido como Inferência
Estatística, ou seja, como fazer afirmações sobre características de uma população, baseando-se em
resultados de uma mostra.

Inferência Estatística é o ramo da Estatística que refere-se ao processo de obter informações sobre
uma população a partir de resultados observados na amostra.

POPULAÇÃO (N) AMOSTRA (n)

θ θ̂
Inferência Estatística

POPULAÇÃO: conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum observável.
Pode ser finita como o conjunto de alunos de uma escola em um determinado ano, ou infinita, como o
número de vezes que se pode jogar um dado.

AMOSTRA: qualquer subconjunto da população

70
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

CASOS GERAIS:
 Verificar o sabor de um bolo;
 Verificar a temperatura da água de uma piscina;
 Avaliar a qualidade de um livro;

A grande maioria das pesquisas realizadas nas mais variadas áreas do conhecimento humano são
feiras com amostras. O pesquisador, no entanto, almeja generalizar seus resultados, ou seja, saber se o
que obteve com amostras é válido para toda a população. Essa é, sem dúvida, a essência da inferência
estatística. Formalmente, a Inferência ou Estatística Indutiva é a parte da Estatística que estuda a
estimação e os testes sobre os parâmetros populacionais.

ALGUNS CONCEITOS IMPORTANTES

AMOSTRA ALEATÓRIA: Seja X uma variável populacional. Uma amostra aleatória é o

conjunto de n variáveis aleatórias independentes, ( x1 , x2 , , xn ) , extraídas de uma população, tal

que cada xi tem a mesma característica, ou distribuição da variável X.

PARÂMETRO: medida usada para descrever uma característica da população [ µ,σ 2 ( x ), σ( x ),... ].

ESTIMADOR (ESTATÍSTICA): medida usada para descrever uma característica da amostra [


X ,S 2 ( x ), S( x ),... ]
 ESTIMATIVA: é o valor numérico do estimador. Por exemplo, X =17 ,8 é uma estimativa da média
populacional µ.

ESTIMAÇÃO (Pontual e Intervalar)


INFERÊNCIA
ESTATÍSTICA
TESTES DE HIPÓTESES
(Paramétricos e Não-Paramétricos)

ESTIMAÇÃO PONTUAL

71
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

A partir da amostra procura-se obter um único valor de um certo parâmetro populacional.

 Em geral é INSUFICIENTE!

Exemplo: A média amostral ( x ) é um estimador pontual da média populacional ( µ ).

ESTIMAÇÃO INTERVALAR
A partir da amostra procura-se construir um intervalo de variação, θˆ1 ≤ θ ≤ θˆ2 , com uma certa
probabilidade de conter o verdadeiro parâmetro populacional.

TESTES PARAMÉTRICOS
A hipótese é formulada com respeito ao valor de um parâmetro populacional.

TESTES NÃO-PARAMÉTRICOS
A hipótese é formulada com respeito à natureza da distribuição da população.

ESTIMAÇÃO INTERVALAR

INTERVALOS DE CONFIANÇA

É um intervalo real, centrado na estimativa pontual que deverá conter o parâmetro com determinada
probabilidade.

A probabilidade de o intervalo conter o parâmetro estimado é denominado nível de confiança


associado ao intervalo. A notação mais usual para o nível de confiança associado ao intervalo é 1 - α .

Assim como as estimações pontuais, os intervalos de confiança podem ser vistos como uma técnica
para se fazer inferência estatística. Ou seja, a partir de um intervalo de confiança, construído com os
elementos amostrais, pode-se inferir sobre um parâmetro populacional.

 Fundamenta-se nas distribuições amostrais

72
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

 θ : Parâmetro populacional

 θ̂ : Estimador de θ

 A partir da distribuição de probabilidade de θ̂ é possível construir um intervalo θˆ1 ≤ θ ≤ θˆ2 ,

que contém θ , e exigir que a probabilidade do intervalo seja de (1 −α) .

O valor da probabilidade (1 −α) que usualmente assume os valores 90%, 95%, 98%, etc., é
denominado NÍVEL DE CONFIANÇA, e o valor α é chamado NÍVEL DE SIGNIFICÂNCIA, isto é,
representa o erro que se está cometendo quando se afirma que a probabilidade do intervalo, θˆ1 ≤ θ ≤ θˆ2 ,
conter o verdadeiro valor do parâmetro populacional é (1 −α) .

VANTAGEM:

Permite uma idéia da precisão com que foi calculada a estimativa do parâmetro, pois expressa o
erro aceito ao calculá-la.

1 - Intervalo muito pequeno  ALTA PRECISÃO DA ESTIMATIVA DO PARÂMETRO

2 - Quanto maior o grau de confiança  MENOR PRECISÃO DA ESTIMATIVA DO PARÂMETRO

Suponha,

n = 25, X = 12 e S =1.2

IC ( 95 %) = (11 .51 < µ < 12 .49 ) : amplitude = 0.98

IC ( 99 %) = (11 .31 < µ < 12 .67 ) : amplitude = 1.36

 INTERVALO DE CONFIANÇA PARA A MÉDIA

73
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

Neste caso, existem 2 métodos para estimativa de µ através do intervalo de confiança; as


utilizações desses métodos dependem do tamanho da amostra ou do fato de ter ou não conhecimento do
valor do desvio-padrão populacional. Se n ≥ 30 e a variância populacional é conhecida utiliza-se o
método da distribuição normal (a variável utilizada será a Z). No entanto, para amostras pequenas (n <
30) e variância populacional desconhecida utiliza-se o método da distribuição t-Student (a variável
utilizada será a t).

Métodos
Fatores
Distribuição Normal Distribuição t-Student
Tamanho da amostra n ≥ 30 n < 30
Variância conhecida σ2 S2
Variável utilizada Z T

A Distribuição t de Student

 Trata-se de um modelo de distribuição contínua que se assemelha à distribuição normal padrão, N(0,1).
É utilizada particularmente, quando se tem amostras com tamanhos inferiores a 30 elementos.
Possui um parâmetro chamado "grau de liberdade"
Se a distribuição de uma população é essencialmente normal (com a forma aproximadamente de
um sino), então a distribuição de

X −µ
t= , com (n-1) graus de liberdade,
s/ n

é essencialmente uma distribuição t de Student para todas as amostras de tamanho n. A distribuição t de


Student, geralmente conhecida como distribuição t, é utilizada na determinação de valores críticos
denotados por t α/ 2 .

A tabela da t relaciona valores da distribuição t juntamente com áreas denotadas por α . Os


valores de t α/ 2 são obtidos localizando o número adequado de graus de liberdade ((n-1) gruas de
liberdade).

74
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

OBS: O número de graus de liberdade para um conjunto de dados corresponde ao número de valores que
podem variar após terem sido impostas certas restrições a todos os valores.

PROPRIEDADES IMPORTANTES DA DISTRIBUIÇÃO t DE STUDENT:

1. A distribuição t de Student tem a mesma forma geral simétrica (curva em forma de sino)que a
distribuição normal, mas reflete maior variabilidade que é esperada em pequenas amostras.
2. A distribuição t de Student tem média t = 0 (tal como a normal padronizada, com média Z = 0).
3. O desvio-padrão da distribuição t de Student varia com o tamanho da amostra, mas é superior a 1 (ao
contrário da distribuição normal padronizada).
4. Na medida em que aumenta o tamanho da amostra, a distribuição t de Student se aproxima mais e
mais da distribuição normal padronizada. Para valores n > 30, as diferenças são tão pequenas que
podemos utilizar os valores críticos Z.
CONDIÇÕES PARA A UTILIZAÇÃO DA DISTRIBUIÇÃO t DE STUDENT:
1. O tamanho da amostra é pequeno n ≤ 30 ;
2. σ é desconhecido;
3. A população original tem distribuição essencialmente normal (como a distribuição da população
original normalmente é desconhecida, estimamo-la construindo um histograma dos dados amostrais).

GRAUS DE LIBERDADE DE UMA ESTATÍSTICA:

Sabe-se que, a variância de uma amostra deve ser calculada pr, s2 (x)= ∑(x i )  (n −1) . A
2
−x

necessidade dessa correção esta relacionada com o número de G.L, por exemplo: µ = x = ∑ xn e

σ2= [∑ ( x − µ ) ] ( n ) .
i
2

são estatísticas com "n" graus de liberdade, pois existem n valores xi livres que devem ser considerados
para podermos calcular o valor da estatística.
A estatística s2(x), por usar x ao invés de µ , tem um grau de liberdade a menos. Isso ocorre porque
para o cálculo de s2(x) é necessário que se tenha calculado x , ou seja, já utilizamos uma vez todo os
valores da amostra; estes estiram sendo usados pela Segunda vez para o cálculo de s2.

Exercício: Com base na tabela t de Student determine o valor da distribuição nos seguinte casos:
a) t (5; 1%) b) t (6; 2%) c) t (19; 5%)

75
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de
Oliveira

d) t (21; 10%)
e) t (28; 5%)
f) t (12; 1%)

76
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

CASO 1:

INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL COM A VARIÂNCIA


POPULACIONAL CONHECIDA

Seja X ~ N ( µ,σ 2 ) . Sabe-se que o estimador de µ , X (média amostral), tem distribuição de


probabilidade dada por:

X ~ N ( µ, σ 2 / n ) , para populações infinitas 

 σ2 N −n 
 µ, n . N −1 
X ~ N  , para populações finitas
 

X −µ
Então, Z = ~ N ( 0,1)
σ/ n

Fixando-se um nível de confiança (1 −α) tem-se:

P ( − Zα / 2 ≤ Z ≤ Zα / 2 ) = 1 − α

 X −µ 
P − Zα / 2 ≤ ≤ Zα / 2  = 1 − α
 σ/ n 

 σ σ 
P − Z α / 2 . − X ≤ −µ ≤ Zα / 2 . − X  = 1 −α
 n n 

www.estatistica.ccet.ufrn.br 78
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

 σ σ 
P X − Zα / 2 . ≤ µ ≤ X + Zα / 2 .  = 1 −α
 n n

Exemplo: O departamento de Recursos Humanos de uma grade empresa informa que o tempo de
execução de tarefas que envolvem participação manual varia de tarefa para tarefa, mas que o
desvio padrão permanece aproximadamente constante em 3 min. Uma nova tarefa está sendo
implantada na empresa. Uma amostra aleatória do tempo de execução de 50 dessas novas tarefas
forneceu o valor médio de 15 min. Determine o intervalo de confiança de 95% para o tempo
médio de execução dessa nova tarefa.

CASO 2:

INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL COM A VARIÂNCIA


POPULACIONAL DESCONHECIDA

www.estatistica.ccet.ufrn.br 79
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

 Estimar σ com base na amostra, S.


 Como S é uma variável aleatória a substituição só é verificada para amostras grandes (n

≥ 30)  S ≅ σ

 S é um estimador viesado para σ , mas aumentando o tamanho da amostra o viés tende a


desaparecer; portanto o IC para µ pode ser construído.

 Quanto menor a amostra mais necessária se torna a introdução de uma correção: t(n-1) ao
invés de Z.

X −µ
Sabe-se que, X ~ N ( µ, σ 2 / n ) e Z = ~ N ( 0,1)
σ/ n

X −µ
Então, t n−1 =
S/ n

P( − tα / 2 ≤ t ≤ tα / 2 ) = 1 − α

 X −µ 
P − tα / 2 ≤ ≤ tα / 2  = 1 − α
 S/ n 

 S S 
P − tα / 2 . − X ≤ −µ ≤ tα / 2 . − X  = 1 −α
 n n 

 S S 
P X − tα / 2 . ≤ µ ≤ X + tα / 2 .  = 1 −α
 n n

Para o caso de populações finitas, utilizar:

www.estatistica.ccet.ufrn.br 80
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

 S N −n S N − n 
P X − tα / 2 . . ≤ µ ≤ X + tα / 2 . . = 1 −α
 n N −1 n N −1 

OBS: Quanto menor o tamanho da amostra, mais necessário se torna a introdução de uma
correção, a qual consiste em usar a variável t-Student (t(n-1)) ao invés de usar a variável Z.

Exemplo: A amostra 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população normal.
Construir um intervalo de confiança para a média ao nível de 95%.

Solução:

Média amostral: X = 8.7

Desvio padrão amostral: S = 2

Variável: t(n-1) = t(9; 5%) = 2.2622

 S S 
P X − tα / 2 . ≤ µ ≤ X + tα / 2 .  = 1 −α
 n n

 2 2 
P8.7 − ( 2.2622 ). ≤ µ ≤ 8.7 + ( 2.2622 ).  = 95 %
 10 10 

P ( 7.27 ≤ µ ≤ 10 .13 ) = 95 %

Interpretação:

Podemos afirmar que o intervalo [7.27; 10.13] contém a verdadeira média com 95% de
confiança;

A precisão dessa estimativa nos permite afirmar , com 95% de certeza, de que não
estamos errando por mais de 1,43 nessa estimação.

www.estatistica.ccet.ufrn.br 81
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

 INTERVALO DE CONFIANÇA PARA A PROPORÇÃO

Sabendo que a distribuição amostral da proporção é:

^
p ~ N( p, p /qn ) , para populações infinitas. 

^
 p qN − n 
p ~ N  p, .  , para populações finitas.
 n N − 1

Quando n for grande, n ≥ 30 a distribuição binomial se aproxima da Normal, então:

^
p− p
Z= ~ N ( 0,1)
p q/ n

Fixando-se um nível de confiança (1 −α) tem-se:

www.estatistica.ccet.ufrn.br 82
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

 ^  ^  
 p q  p q  
    
^ ^
I.C= p− Zα/2. ≤ p + Zα/2.  = 1− α
n n
 
 
 
Exemplo: Uma pesquisa recente efetuada com 300 habitantes de uma grande cidade revelou que
128 pessoas apresentavam insuficiência respiratória. Determine um intervalo de confiança de
95% para a proporção de habitantes dessa cidade que apresentaram insuficiência respiratória.

TESTES DE HIPÓTESES

Suponha que numa determinada região, o peso de crianças aos 12 anos, seja modulado
pela distribuição normal, tal que X ~N (48, 16). Um pesquisador da área médica desconfia que
devido a mudanças nos hábitos alimentares, o peso médio seja maior. Para tentar comprovar sua
suposição o pesquisador seleciona, por processo aleatório, uma amostra de 100 crianças dessa
população, obtendo como peso amostral x = 51,3 kg. Será que ele tem razão? A resposta deve

www.estatistica.ccet.ufrn.br 83
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

ser analisada cuidadosamente e uma decisão mais segura só é possível depois de submeter seu
dados a um teste estatístico, também conhecido como teste de hipóteses.

Regra de decisão que permite aceitar ou rejeitar uma hipótese, decisão esta que é tomada
em função dos valores amostrais. Em outras palavras, formula-se uma hipótese quanto ao valor
do parâmetro populacional, e pelos elementos amostrais faz-se um teste que indicará a rejeição,
ou não, da hipótese nula (H0).

 HIPÓTESE ESTATÍSTICA

Suposição quanto ao valor de um parâmetro ou quanto à natureza da distribuição de uma


probabilidade de uma variável populacional.

 TIPOS DE HIPÓTESES

H 0 : é aquela que será testada, sendo sempre contrária ao resultado do experimento amostral;

hipótese nula. É formulada com base nos dados populacionais.

H 1 : é qualquer hipótese diferente da hipótese nula, sendo sempre a favor do resultado do

experimento amostral; hipótese alternativa.

OBS: a aceitação de H0 implica na rejeição de H1, e a rejeição de H0 implica na aceitação de H1.

 TIPOS DE TESTES

a) H 0 : µ = 1.65 m
(Teste bicaudal)
H 1 : µ ≠ 1.65 m

b) H 0 : µ = 1.65 m (Teste unicaudal à esquerda)

www.estatistica.ccet.ufrn.br 84
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

H 1 : µ < 1.65 m

c) H 0 : µ = 1.65 m
(Teste unicaudal à direita)
H 1 : µ > 1.65 m

 TIPOS DE ERROS:

Erro Tipo I (α) : P(rejeitar H 0 | H 0 é verdadeira)

Erro Tipo II ( β) : P(aceitar H 0 | H 0 é falsa)

Decisão
Realidade
Aceitar H 0 Rejeitar H 0
H 0 é verdadeira Decisão Correta (1 −α) Erro Tipo I (α)
H 0 é falsa Erro Tipo II ( β) Decisão Correta (1 − β)

ERRO TIPO I ⇒ cometido quando rejeitamos H0 , quando na verdade, ela é verdadeira. Esse
tipo de erro é o mais importante a ser evitado. A probabilidade de se cometer um erro tipo I é o
que se chama de nível de significância de um teste. α =P(erro tipo I)
ERRO TIPO II ⇒ cometido quando não rejeitamos H0, quando na verdade ela é falsa.

Deseja-se: reduzir ao mínimo as probabilidades dos erros.

TAREFA DIFÍCIL: para uma amostra de tamanho n a probabilidade de se incorrer em


um erro tipo II aumenta à medida que diminui a probabilidade do erro tipo I (vice-versa)

REDUÇÃO SIMULTÂNEA AUMENTO DO

DOS ERROS TAMANHO DE n

www.estatistica.ccet.ufrn.br 85
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

 PROCEDIMENTO PARA CONSTRUÇÃO DO TESTE DE HIPÓTESE:

1. Estabelecer as hipóteses de nulidade H 0 e alternativa H 1 ;

2. Escolhe um nível de significância α , em geral, usa-se: 0,05; 0,01 ou 0,001


3. Selecionar uma estatística apropriada e determinar as RA e RC para H 0 , com o auxílio
das tabelas estatísticas, considerando α e a variável do teste.

4. Com os elementos amostrais, calcular o valor da variável do teste.

5. Concluir pela aceitação ou rejeição de H 0 pela comparação do valor obtido no 4º passo


com RA e RC, ou seja, rejeitar Ho sempre que a estatística calculada pertencer à região
crítica, caso contrário, não rejeitar.

TESTES PARAMÉTRICOS

TESTES PARA A MÉDIA

1. Enunciar as hipóteses:

H 0 : µ = µ0
µ ≠ µ 0 (a )

H 1 :  µ > µ 0 (b)
 µ < µ (c )
 0

2. Fixar o nível de significância α . Admitindo σ 2 desconhecida, a variável do teste será


t ( n −1) .

3. Determinar RA e RC através da tabela t.

www.estatistica.ccet.ufrn.br 86
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

X −µ
4. Calcular a variável do teste t cal =
S/ n

5. Conclusões

a) Se − tα / 2 ≤ t cal ≤ tα / 2 , não se pode rejeitar H 0 .


Se tcal > tα / 2 ou tcal < −tα / 2 , rejeita-se H 0 .

b) Se t cal < tα , não se pode rejeitar H 0 .


Se t cal > tα , rejeita-se H 0 .

c) Se tcal > −tα , não se pode rejeitar H 0 .


Se tcal < −tα , rejeita-se H 0 .

Exemplo:
Os registros de um colégio atestam para calouros admitidos uma nota média de 115. Para testar a
hipótese de que a média de uma nova turma é a mesma, tirou-se ao acaso, uma amostra de 20
notas, obtendo-se média 118 e desvio padrão 20. Admitir α =5% para efetuar o teste.

Solução:

µ =115 , n = 20 , X =118 , S = 20 e α = 0.05


www.estatistica.ccet.ufrn.br 87
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

1. Enunciar as hipóteses

H 0 : µ = 115

 H1 : µ ≠ 115

2. α =5%
Variável: t ( n −1) = t (19 ) tα / 2 = 2.093

3. Determinar RA e RC:

X − µ 118 −115
4. Calcular a estatística do teste: t cal = = = 0.67
S/ n 20 / 20

5. Conclusão: como − 2.09 ≤ t cal ≤ 2.093 não se pode rejeitar H 0 com esse nível de
significância. Logo, a média da nova turma é a mesma.

TESTES PARA PROPORÇÕES


1. Enunciar as hipóteses:
H 0 : p = p0
 p ≠ p 0 (a )

H 1 :  p > p0 (b)
 p < p (c )
 0

2. Fixar o nível de significância α . A variável escolhida é Z, normal padrão.

3. Determinar RA e RC através da tabela da distribuição normal padrão.

www.estatistica.ccet.ufrn.br 88
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

^
p − p0
4. Calcular a variável do teste Zc a l =
p0 q 0 / n

5. Conclusões

a) Se − Zα / 2 ≤ Z cal ≤ Zα / 2 , não se pode rejeitar H 0 .

Se Z cal > Zα / 2 ou Z cal < −Zα / 2 , rejeita-se H 0 .

b) Se Z cal < Zα , não se pode rejeitar H 0 .

Se Z cal > Zα , rejeita-se H 0 .

c) Se Z cal > −Zα , não se pode rejeitar H 0 .

Se Z cal < −Zα , rejeita-se H 0 .

Exemplo:

As condições de mortalidade de uma região são tais que a proporção de nascidos vivos
que sobrevivem até 60 anos é 0.6. Testar essa hipótese ao nível de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos.

Solução:

^
p 0 = 0.6 , n = 1000 , α = 0.05 e
p = 5 3/ 1 0 0 = 00.50 3

1. Enunciar as hipóteses

H 0 : p = 0.6

 H1 : p ≠ 0.6

www.estatistica.ccet.ufrn.br 89
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

2. α = 0.05

Variável: Z ( 2.5% ) = 1.96

3. Determinar RA e RC:

4. Calcular a estatística do teste:

^
p− p0 0.5 3− 0.6
Zc a l = = = − 4. 4 2
p0q0 / n ( 0.6)( 0.4) / 1 0 0 0

5. Conclusão: como − Z cal < −1.93 , rejeita-se H 0 , concluindo-se ao nível de significância de


5% que p ≠ 0.6 .

TESTES NÃO-PARAMÉTRICOS

TESTE QUI-QUADRADO

Teste de Adequação do Ajustamento

Teste de Associação

CAS0 1: TESTE QUI-QUADRADO DE ADEQUAÇÃO

Suponha que em uma determinada amostra de tamanho n, observou-se que um conjunto


de eventos possíveis, E1 , E2 ,  , Ek , ocorreram com as freqüências observadas o1 , o2 ,  , ok ;

www.estatistica.ccet.ufrn.br 90
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

e que de acordo com as regras de probabilidade, era de se esperar que esses eventos ocorressem
com freqüências esperadas, e1 , e2 ,  , ek .

Eventos E1 E2 E3 ... Ek

Freqüências
o1 o2 o3 ok
Observadas ...
Freqüências
e1 e2 e3 ek
Esperadas ...
 Objetivo: verificar de modo significativo se as freqüências observadas diferem das
esperadas.

CONCEITOS IMPORTANTES:

EVENTO: qualquer ocorrência associada a um fenômeno aleatório.

 FREQÜÊNCIA OBSERVADA: é a freqüência que se observa através da realização de um


determinado experimento aleatório.

 FREQÜÊNCIA ESPERADA: é a freqüência que se espera que aconteça sem a realização de


determinado experimento aleatório.

PROCEDIMENTO PARA A CONSTRUÇÃO DO TESTE:

1. Enunciar as hipóteses
H 0 : não há discrepâncias entre as freqüências oi e ei .

H 1 : há discrepâncias entre as freqüências oi e ei .

2. Fixar o nível de significância α . A variável escolhida é χ(2k −1) , onde k é o número de


eventos.

3. Determinar RA e RC através da tabela χ2 .

www.estatistica.ccet.ufrn.br 91
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

4. Calcular a variável do teste

χ cal
2
=
( o1 − e1 ) 2 + ( o2 − e2 ) 2 +  + ( ok − ek ) 2 =∑
k
( oi − ei ) 2
e1 e2 ek i =1 ei

5. Conclusões
a) Se χcal < χsup , não se pode rejeitar H 0 .
2 2

Se χcal > χsup , rejeita-se H 0 .


2 2

Exemplo:
Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a hipótese de a moeda
ser honesta adotando-se α = 5%.

Solução:

1. Enunciar as hipóteses
H 0 : A moeda é honesta

H 1 : A moeda não é honesta

2. α = 5%.
Variável: χ( k −1) = χ( 2 ) χtab = 3.84
2 2 2

3. Determinar RA e RC através da tabela χ2 .

4. Calcular a variável do teste

Eventos Cara Coroa


Freq. Observada 35 65
Freq. Esperada 50 50

χ cal
2
=
( 35 − 50 ) 2 + ( 65 − 50 ) 2 =9
50 50

www.estatistica.ccet.ufrn.br 92
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

5. Conclusão: Como χcal > 3.84 , rejeita-se H 0 , concluindo-se com risco de 5%, que a
2

moeda não é honesta.

CASO 2: TESTE QUI-QUADRADO DE ASSOCIAÇÃO

 Objetivo: estudar a associação ou dependência, entre duas variáveis.


 Tabela de Contingência: representação das freqüências observadas.
 Cálculo das freqüências esperadas tem como base a definição de variáveis aleatórias
independentes.
(X e Y independentes: P(Xi, Yj) = P(Xi).P(Yj))

PROCEDIMENTO PARA A CONSTRUÇÃO DO TESTE:


1. Enunciar as hipóteses
H 0 : as variáveis são independentes (as variáveis não estão associadas).

H 1 : as variáveis são dependentes (as variáveis estão associadas).

2. Fixar o nível de significância α . A variável escolhida é χ(2L −1).(C −1) , onde L é o número
de linhas da tabela de contingência e C é o número de colunas.

3. Determinar RA e RC através da tabela χ2 .

4. Calcular a variável do teste

χ 2
L
= ∑∑
C (o ij − eij )
2

cal
i =1 j =1 eij

onde, eij = ((soma da linha i)(soma da coluna j))/(total de obs.)

www.estatistica.ccet.ufrn.br 93
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

5. Conclusões

a) Se χcal < χtab


2 2
, não se pode rejeitar H 0 .
Se χcal > χtab
2 2
, rejeita-se H 0 .
Exemplo:

Testar ao nível de 5% se há discrepância entre as preferências por sabor da pasta de dentes e o


bairro.

Bairros
Sabor da Pasta ∑
A B C
Limão 70 44 86 200
Chocolate 50 30 45 125
Hortelã 10 06 34 50
Outros 20 20 85 125
∑ 150 100 250 500

Solução:
1. Enunciar as hipóteses
H 0 : A preferência pelo sabor independe do bairro

H 1 : A preferência pelo sabor depende do bairro

2. α = 5%.
Variável: χ( L −1)( C −1) = χ( 6 ) χtab = 12 .6
2 2 2

3. Determinar RA e RC através da tabela χ2 .

www.estatistica.ccet.ufrn.br 94
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

4. Calcular a variável do teste

Tabela de Freqüências Esperadas

Bairros
Sabor da Pasta
A B C
Limão 60 40 100
Chocolate 37.5 25 62.5
Hortelã 15 10 25
Outros 37.5 25 62.5

χ cal
2
=
( 70 − 60 ) 2 + ( 50 − 37.5) 2 + +
( 85 − 62.5) 2 = 37.88
60 37 .5 62.5

5. Conclusão: Como χcal > 12 .6 , rejeita-se H 0 , concluindo-se com risco de 5%, que há
2

dependência entre o sabor da pasta de dentes e o bairro.

Distribuição Qui-Quadrado

Em uma população distribuída normalmente com variância σ2 , escolhemos aleatoriamente


amostras independentes de tamanho n e calculamos a variância amostral S2 para cada amostra. A
estatística amostral

χ2 =
( n − 1) s 2
σ2

tem uma distribuição chamada Distribuição Qui-quadrado, onde:


n = tamanho da amostra;
s2 = variância amostral;

www.estatistica.ccet.ufrn.br 95
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

σ2 = variância populacional;

Os valores críticos são encontrados a partir da tabela da distribuição qui-quadrado, cujo número
de graus de liberdade é definido como sendo (n-1).

PROPIREDADES DA DISTRIBUIÇÃO DA ESTATÍSTICA QUI-QUADRADO:

1. A distribuição qui-quadrado não é simétrica, ao contrário das distribuições normal e t de


Student. Na medida em que o número de graus de liberdade aumenta, a distribuição vai se
tornando menos assimétrica.
2. Os valores de qui-quadrado podem ser zero ou positivos; nunca podem ser negativos.
3. Há uma distribuição qui-quadrado diferente para cada número de graus de liberdade que é gl
= (n-1). À medida que o número de graus de liberdade aumenta, a distribuição qui-quadrado
tende para uma distribuição normal.

BIBLIOGRAFIA

MEYER, Paul L. Probabilidade: aplicações à estatística. 2ed. Rio de Janeiro, LTC S/A, 1984.
BUSSAB, W. O e MORETTIN, P. A Estatística Básica. São Paulo: Atual, ed. 4, 1987.
STONE, Hoel Port. Introduction to stochastic process. Boston, Houghton Misslyn Company,
1972.
VIEIRA, Sônia. Planejamento de Experimentos.
VIEIRA, Sônia. Princípios de estatística. São Paulo, pioneira, 1999.

www.estatistica.ccet.ufrn.br 96
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

LISTA DE EXERCÍCIOS

1. Um levantamento do tempo de execução de uma determinada tarefa manual realizadas por


idosos apontou, a partir de uma amostra de 100 idosos, um tempo médio de 2,40 min. Sabe-
se, por experiência anterior, que a variância para esse tipo de tarefa e aproximadamente
constante e valor 0,16. Construa um intervalo de confiança de 90% para o tempo médio
desta tarefa sabendo de que se trata de uma população normal.

2. Um psicólogo que trabalha com a situação do problema anterior deseja verificar qual é o
tempo máximo de realização dessa tarefa ao nível de confiança de 80%. Qual foi o valor
obtido por ele?

3. Uma revista semanal, em artigo sobre a participação das mulheres em curso superior de
Ciências Biológicas, afirmou que a proporção de mulheres neste curso é superior à dos
homens. Uma pessoa interessada em testar essa afirmação levantou uma amostra ao acaso de
100 estudantes de Ciências Biológicas e obteve na amostra uma porcentagem de 40% de
mulheres.
a) Qual é o IC para a proporção de mulheres não população ao nível de 98%?
b) Baseando-se nesse IC, a afirmação da revista é certamente falsa?

4. Para estudar o grau de satisfação com o setor de serviço em uma empresa, um consultor
levantou uma amostra aleatória de 50 pessoas na empresa. Sabe-se, por experiências
anteriores, que o desvio padrão para o grau de satisfação com o setor de serviço é
aproximadamente constante e igual a 40. O grau médio de satisfação amostral foi calculado
em 245. Determine um intervalo de confiança de 94% para o grau médio de satisfação nesta
empresa.

5. Uma amostra aleatória de 15 estudantes do curso de Biologia forneceu um desempenho


médio no curso de 20 pontos, com desvio padrão de 0,1 pontos. Supondo que o desempenho
no curso tem distribuição normal de probabilidades, determine um intervalo de confiança de
95% para o desempenho médio dos estudantes do curso de psicologia.

6. Uma amostra aleatória de 60 elementos obtidos de uma população normal apresentou média
de 46 e desvio padrão de 8. Calcular:

www.estatistica.ccet.ufrn.br 97
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

a) O erro padrão de estimação da média populacional, ao nível de 90%.


b) O intervalo de confiança para a média populacional ao nível de 98%.

7. Um guarda de trânsito vistoriou 200 carros em um bairro de uma cidade e constatou que 25
motoristas não estavam usando o conto de segurança no momento da vistoria. Determine um
intervalo de confiança de 95% para a proporção de motoristas que usam regularmente o
cinto de segurança neste bairro.

8. Uma amostra de 90 pessoas foi selecionada ao acaso de um grupo de 1.000 pessoas,


fornecendo uma proporção de fumantes equivalente a 0,24. Calcular o intervalo de confiança
ao nível de 92% para a proporção de fumantes nas 1.000 pessoas.

9. Um vendedor consegue entrevistar 120 pessoas num dia, e resolve testar a aceitação de um
novo produto. Para isso, escolheu 32 pessoas e mostrou o produto, conseguindo uma
proporção de respostas positivas de 25%. Qual seria a estimativa da proporção de respostas
positivas entre as 120 pessoas, ao nível de 85%?

10. Uma população normalmente distribuída apresenta média histórica de 6 unidades e desvio
padrão de 0,5 unidades. Uma amostra de 15 elementos selecionados ao acaso forneceu
média 4 e desvio padrão 1. Teste ao nível de 5% o valo da média histórica, contra a
alternativa em que a média diminuiu.

11. De uma população normal com média histórica de 18 unidades, 12 elementos forma
selecionados ao acaso, fornecendo média de 17 unidades e desvio padrão de 3 unidades.
Teste ao nível de significância 10% a hipótese µ =18.

Um fabricante de inseticida afirma no rótulo da embalagem que sua eficiência é de 70% contra
todos os tipos de insetos. Um agente da Secretaria de Defesa do Consumidor encomenda a um
laboratório um teste de toxicidade do inseticida, e quer testar a hipótese de que a eficiência é de
70% contra a alternativa de ser maior que 70%. O laboratório informou que de 120 insetos
tratados com este inseticida 32 sobreviveram. A toxicidade do inseticida está controlada ao nível
de 2,5% de significância?

www.estatistica.ccet.ufrn.br 98
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

www.estatistica.ccet.ufrn.br 99
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

www.estatistica.ccet.ufrn.br 100
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

www.estatistica.ccet.ufrn.br 101
Simétrica
Assimétric
a Positiva
Negativa
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de
Oliveira

www.estatistica.ccet.ufrn.br 102