Você está na página 1de 84

Professor Francisco Augusto de Freitas , MSc.

Estatística I
(Notas de aulas)

IGS - Instituto Superior Politecnico Gregorio Semedo


APCMN. – Academia de Pescas e Ciencias do Mar do Namibe

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Introdução

Para o matemático e filósofo francês René Descartes, na pesquisa e elucidação de verdades são
necessários, e suficientes, quatro princípios1:

1 – Princípio da Evidência
Jamais aceitar como exata coisa alguma que não se conheça à evidência como tal, incluindo em
juízos apenas aquilo que se mostre tão claro que não subsista razão alguma de dúvida.
2 – Princípio da Análise
Dividir cada dificuldade a ser examinada em tantas partes quanto possível e necessárias à sua
resolução.
3 – Princípio da Síntese
Pôr em ordem os pensamentos, começando pelos mais simples e de mais fácil resolução, até
atingir, gradativamente, o conhecimento de assuntos mais complexos, sem deixar de supor uma ordem.
4 – Princípio da Enumeração
Fazer, para cada caso, enumerações tão exatas e revisões tão gerais que se possa ter certeza de
não omitir nada.

Os quatro princípios acima acabaram por se tornar a base de qualquer método de investigação
científica aplicado a qualquer ciência experimental que necessite de um mecanismo de análise referente a
um processo de generalização a partir de um conjunto de observações individuais.
A palavra Estatística tem origem latina ( “status” ). Também denominada “métodos estatísticos”,
foi usada inicialmente para tratar de dados relativos a negócios de Estado, daí o seu nome. De acordo com
o matemático e estatístico inglês Ronald A. Fisher, a Estatística é uma ramo da Matemática Aplicada
dedicado à análise de dados de observação, constituindo-se, portanto, em um conjunto de métodos
destinados à coleta, organização, apresentação, descrição e análise de dados de natureza quantitativa.
Atualmente é de fundamental importância em praticamente qualquer ciência, notadamente as ciências
aplicadas, tais como psicologia, biologia e sociologia, por exemplo.
A Estatística é dividida em duas partes: descritiva e inferencial. A primeira é aplicada nas etapas
que vão da coleta até a descrição dos dados. A segunda parte é aplicada sobretudo na tomada de decisões
sob condições de incerteza. Como toda tomada de decisão está relacionada a uma relativa margem de
incerteza, já que normalmente é feita com base em apenas uma parte das possíveis observações, a
estatística inferencial utiliza em larga escala conceitos da Teoria das Probabilidades, tais como nível de
confiança, margem de erro e outros.
Na administração de empresas a Estatística tem se tornado cada dia mais útil como ferramenta.
Um dos efeitos da globalização é a necessidade de maior agilidade por parte dos tomadores de decisão,
exigindo, além da rapidez, confiabilidade dos resultados apresentados. Além disso, o uso da Estatística
acaba por dotar o trabalho efetuado de uma sólida base científica, aumentando a sua consistência.

1
Descartes, René – Discurso Sobre o Método – Livraria Exposição do Livro – São Paulo.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


0 – Conceitos e Definições

0.01 – Conceitos e Definições ..............................................................................................


0.01.01 – Estatística .............................................................................................................
0.01.02 – Séries Estatísticas .................................................................................................
0.01.03 – Apresentação Tabular ..........................................................................................
0.01.04 – Apresentação Gráfica ...........................................................................................
0.01.05 – Exercícios .............................................................................................................
0.02 – Notação por Índices ...................................................................................................
0.02.01 – Somatório .............................................................................................................
0.02.02 – Produtório .............................................................................................................
0.03 – Distribuições de Freqüências ....................................................................................
0.03.01 – Dados Brutos ........................................................................................................
0.03.02 – Rol ........................................................................................................................
0.03.03 – Amplitude Total ...................................................................................................
0.03.04 – Número de Classes ...............................................................................................
0.03.05 – Limites de Classe .................................................................................................
0.03.06 – Amplitude de Classe ............................................................................................
0.03.07 – Intervalo de Classe ...............................................................................................
0.03.08 – Freqüência ............................................................................................................
0.03.09 – Freqüência Acumulada .........................................................................................
0.03.10 – Freqüência Relativa ..............................................................................................
0.03.11 – Ponto Médio .........................................................................................................
0.03.12 – Histograma ...........................................................................................................
0.03.13 – Polígono de Freqüências .....................................................................................
0.03.14 – Curva de Freqüências ..........................................................................................
0.03.15 – Regras para Construção de uma Distribuição de Freqüências .............................
0.03.16 – Exercícios .............................................................................................................

1 – Medidas de Tendência Central, ou de Posição

1.01 – Média Aritmética .......................................................................................................


1.02 – Mediana ......................................................................................................................
1.03 – Moda ..........................................................................................................................
1.04 – Relação Entre Média, Mediana e Moda .....................................................................
1.05 – Separatrizes ................................................................................................................
1.05.1 – Percentil .................................................................................................................
1.06 – Exercícios ..................................................................................................................

2– Medidas de Dispersão, ou Variabilidade

2.01 – Variância ...................................................................................................................


2.02 – Desvio Padrão ...........................................................................................................
2.03 – Coeficiente de Variação ............................................................................................
2.04 – Escore Reduzido ........................................................................................................
2.05 – Exercícios ..................................................................................................................

3 – Medidas de Assimetria e de Curtose

3.01 – Definições e Conceitos ..............................................................................................


3.02 – Coeficientes de Pearson para Assimetria ..................................................................
3.03 – Coeficiente Percentílico de Curtose ..........................................................................
3.04 – Exercícios de Revisão ...............................................................................................

4 – Teoria da Probabilidade

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


4.01 – Conceitos ...................................................................................................................
4.02 – Experimento Aleatório e Evento ..............................................................................
4.03 – Teorema de Bayes......................................................................................................
4.04 – Variável Aleatória .....................................................................................................
4.05 – Distribuição de Probabilidade ...................................................................................
4.06 – Exercícios ..................................................................................................................

5 – Distribuições de Probabilidade Discreta

5.01 – Distribuição Binomial ...............................................................................................


5.05 – Distribuição de Poisson .............................................................................................
5.06 – Exercícios ..................................................................................................................

6 – Distribuições de Probabilidade Contínua

6.01 – Distribuição Normal ..................................................................................................


6.01.02 – Aproximação da Distribuição Binomial pela Distribuição Normal....................
6.02 – Distribuição Exponencial ........................................................................................
6.03 – Exercícios ..................................................................................................................

7 – Estimação de Parâmetros

7.01 – Conceitos ................................................................................................................


7.02 – Distribuição Amostral ............................................................................................
7.03 – Estimação por Ponto ..............................................................................................
7.04 – Estimação por Intervalos de Confiança ...................................................................
7.05 – Intervalos de Confiança para a Média .....................................................................
7.06 – Intervalos de Confiança para a Proporção ...............................................................
7.07 – Distribuição t, de Student ........................................................................................

8 – Controle Estatístico de Processo (CEP)

8.01 – Conceitos
8.02 – Gráficos de Controle por Variável
8.03 – Gráficos de Controle por Atributo
8.04 – Índices

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


0.01 - Conceitos e Definições

0.01.01 – Estatística

O termo Estatística, ou Estatística Aplicada, refere-se ao conjunto de técnicas destinadas à


coleta, organização, apresentação e análise de dados de natureza quantitativa. Sua aplicação mais
freqüente é no auxílio à tomada de decisões sob condições de incerteza.
No estudo da Estatística, é comum dividi-la em

Estatística Descritiva

Inclui as técnicas utilizadas na coleta, organização e descrição de dados quantitativos, ou


numéricos.

Estatística Indutiva

Inclui as técnicas utilizadas na tomada de decisões sobre uma população, utilizando algumas
vezes dados amostrais. Esta tomada de decisões está sujeita a condições de incerteza, o que acaba por
exigir o emprego de conceitos da Teoria das Probabilidades.

Tanto para o estudo como para a aplicação da Estatística, são úteis alguns conceitos.

0.01.01.01 – Atributo

Característica quantitativa, ou qualitativa, empregada na classificação de uma elemento. São


exemplos de atributos: Cor, idade, escolaridade, estado civil, tamanho, etc.

0.01.01.02 – População

Conjunto de elementos com pelo menos um atributo em comum. Também pode ser denominada
Universo.
Exemplo 0.1: Pessoas casadas do sexo feminino.

0.01.01.02.01 – População Finita

Quando possui um número limitado de elementos.

Exemplo 0.2: Veículo movidos a álcool vendidos em determinado ano.

0.01.01.02.02 – População Infinita

Quando possui um número ilimitado de elementos, ou observações.

Exemplo 0.3: Seja, por exemplo, o diâmetro de um eixo fabricado por certa empresa. Em princípio, não
limite para o número de medições efetuadas com o objetivo de determinar o valor para este diâmetro.
Desta forma, a população formada pelo número de medições pode ser considerada infinita.

0.01.01.03 – Amostra

É qualquer subconjunto de uma população.

0.01.01.03.01 – Amostra Com ou Sem Reposição

Na coleta de uma amostra deve-se determinar de antemão se os elementos observados serão, ou


não, recolocados na população. Uma amostragem sem reposição exige que cada elemento seja observado

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


uma única vez. Se esta condição não for estabelecida, tem-se uma amostra com reposição. É importante
ressaltar que a determinação referida acima caracteriza uma amostra como finita ou infinita.

0.01.02 – Séries Estatísticas

São conjuntos de dados envolvendo três fatores: Fenômeno, Local e Tempo, dos quais um é
variável e ou outros dois são fixos. São classificadas como:

0.01.02.01 – Séries Temporais

Têm como elemento variável o tempo. O local e o fenômeno são os elementos fixos. As séries
temporais também são chamadas Cronológicas, Históricas ou Marchas.

Exemplo 0.4:

Tabela 0.03 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX.


Mês Faturamento (R$ . 1000,00)
Janeiro 25,3
Fevereiro 28,7
Março 32,5
Abril 35,9
Maio 31,4
Junho 15,2
Total 169,0
Dados fictícios

0.01.02.02 – Séries Geográficas

O elemento variável é o local, ou região, e os elementos fixos são o tempo e o fenômeno.

Exemplo 0.5:

Tabela 0.04 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por
região.
Região Faturamento (R$ . 1000,00)
Sul 48,1
Sudeste 42,4
Centro Oeste 29,9
Nordeste 27,5
Norte 21,1
Total 169,0
Dados fictícios

0.01.02.03 – Séries Específicas

O tempo e o local são fixos. O elemento variável é o fenômeno.

Exemplo 0.6:

Tabela 0.05 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por
produto.
Produto Faturamento (R$ . 1000,00)
Queijo 48,8
Salame 39,7

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Presunto 32,5
Mortadela 31,8
Patê 16,2
Total 169,0
Dados fictícios

0.01.03 – Apresentação Tabular

A mesma atenção dispensada às fases de coleta e organização dos dados deve ser observada na
apresentação dos mesmos. Um conjunto de dados pode ser apresentado através de duas formas, que não
se excluem mutuamente: através de tabelas,ou quadros, e gráficos. A primeira forma deve ser usada
sempre que se desejar maior precisão na apresentação. A segunda, em que pese a maior facilidade de
visualização, não proporciona a mesma precisão observada para a forma anterior.

0.01.03.01 – Estrutura

Uma tabela, ou um quadro, deve não somente apresentar dados mas, também, identificá-los
quanto à origem, o quê representam e qual o período de tempo abrangido. É formada por três partes:

a) Cabeçalho: que deve identificar os dados da forma mais completa possível.


b) Corpo: onde são dispostos os valores e identificadas as categorias e variáveis utilizadas.
c) Rodapé: que deve indicar a fonte dos dados.

Outro ponto merecedor de destaque é a correta denominação da ferramenta utilizada. Uma tabela não
deve ser fechada nas laterais. Quando as laterais são fechadas a denominação correta é quadro, conforme
pode-se observar na figura abaixo.

Tabela Quadro

XXXXXYYYYY************** XXXXXYYYYY**********
********** **************

Figura 0.01 – Formatos de Tabela e Quadro

0.01.03.02 – Tabela, ou Quadro, Simples

Consiste basicamente de duas colunas, como nos exemplos 0.52, 0.53 e 0.54.

0.01.03.03 – Tabela, ou Quadro, de Dupla Entrada

É utilizada sempre que se deseja representar duas séries estatísticas simultaneamente.

Exemplo 0.7:

Quadro 0.02 – Faturamento (R$ .1000,00) da Empresa ABC no primeiro semestre do


ano XXXX por região e por produto.
Região Produto Total
Queijo Salame Presunto Mortadela Patê
Sul 12,4 8,2 14,2 9,8 3,5 48,1
Sudeste 10,6 6,4 10,1 12,5 2,8 42,4
Centro Oeste 9,5 7,4 4,3 4,8 3,9 29,9
Nordeste 10,1 10,5 2,1 2,2 2,6 27,5

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Norte 6,2 7,2 1,8 2,5 3,4 21,1
Total 48,8 39,7 32,5 31,8 16,2 169,0
Dados fictícios

0.01.03.04 – Tabela, ou Quadro, de Múltipla Entrada

É usada para representar mais de duas séries simultaneamente.

Exemplo 0.8:

Quadro 0.03 – Faturamento (R$ . 1000,00) da Empresa ABC nos dois primeiros
trimestres do ano XXXX, por região e por produto.
Região Produto Total
Queijo Salame Presunto Mortadela Patê
1o. tr 2o. tr 1o. tr 2o. tr 1o. tr 2o. tr 1o. tr 2o. tr 1o. tr 2o. tr
Sul 8,2 4,4 5,0 3,2 6,5 7,7 4,3 5,6 1,3 2,5 48,1
Sudeste 4,1 6,5 3,8 2,6 4,7 5,4 4,2 8,3 1,3 1,5 42,4
Centro Oeste 4,2 5,3 3,5 3,9 1,9 2,4 2,2 2,6 1,5 2,4 29,9
Nordeste 6,0 4,1 5,0 5,5 1,6 0,5 1,0 1,2 1,5 1,1 27,5
Norte 2,0 4,2 3,7 3,5 1,1 0,7 1,2 1,3 1,5 1,9 21,1
Total 24,5 24,3 21,0 18,7 15,8 16,7 12,9 18,9 7,1 9,1 169,0
Dados fictícios

0.01.04 - Apresentação Gráfica


Pode ser utilizada isoladamente ou em conjunto com a apresentação tabular. A principal
vantagem da apresentação gráfica é a facilidade de compreensão por parte dos leitores. Não se deve
esquecer, contudo, que esta facilidade acaba por comprometer a precisão das informações. Uma forma
“ideal” de apresentação pode combinar as duas ferramentas. Os principais tipos de gráficos, ou os mais
utilizados, são:

0.01.04.01 – Gráfico Linear


É o gráfico mais usado na representação de séries temporais.

Exemplo 0.9:
Tabela 0.03 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX.
Mês Faturamento (R$ . 1000,00)
Janeiro 25,3
Fevereiro 28,7
Março 32,5
Abril 35,9
Maio 31,4
Junho 15,2
Total 169,0
Dados fictícios

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Gráfico 0.01 – Faturamento da Empresa ABC no 1o. semestre do ano XXXX.

0.01.04.02 – Gráfico de Colunas

Neste tipo de gráfico, cada coluna representa uma categoria, sendo o valor observado indicado
pela altura da coluna.

Exemplo 0.10:
Tabela 0.04 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por
região.
Região Faturamento (R$ . 1000,00)
Sul 48,1
Sudeste 42,4
Centro Oeste 29,9
Nordeste 27,5
Norte 21,1
Total 169,0
Dados fictícios

Gráfico 0.02 – Faturamento da Empresa ABC por região.

0.01.04.03 – Gráfico de Setores.

É uma circunferência na qual cada setor corresponde a uma categoria. Também é chamado,
incorretamente, de “gráfico pizza”.

Exemplo 0.11:
Tabela 0.05 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por produto.

Produto Faturamento (R$ . 1000,00)


Queijo 48,8
Salame 39,7

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Presunto 32,5
Mortadela 31,8
Patê 16,2
Total 169,0
Dados fictícios

Gráfico 0.03 – Faturamento da Empresa ABC por produto.

0.01.04.03.01 – Construção do Gráfico Setorial.

Basta utilizar, para cada categoria, uma regra de três simples. O total deve corresponder a 360 o ,
determinando-se a seguir a quantos graus corresponde cada categoria.
No exemplo anterior,
169,0  360o
48,8  x

x  104o
0.01.04.04 – Gráfico de Colunas Sobrepostas

Pode ser utilizado para representar os dados de uma tabela, ou quadro, de dupla entrada. Cada
coluna corresponde a uma categoria, sendo cada categoria composta por subcategorias.

Exemplo 0.12
Quadro 0.02 – Faturamento (R$ .1000,00) da Empresa ABC no primeiro semestre do
ano XXXX por região e por produto.
Região Produto Total
Queijo Salame Presunto Mortadela Patê
Sul 12,4 8,2 14,2 9,8 3,5 48,1
Sudeste 10,6 6,4 10,1 12,5 2,8 42,4
Centro Oeste 9,5 7,4 4,3 4,8 3,9 29,9
Nordeste 10,1 10,5 2,1 2,2 2,6 27,5
Norte 6,2 7,2 1,8 2,5 3,4 21,1
Total 48,8 39,7 32,5 31,8 16,2 169,0
Dados fictícios

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Gráfico 0.03 – Faturamento da Empresa ABC por região e por produto.

0.01.04.05 – Gráfico de Barras

É equivalente ao gráfico de colunas. A diferença está na substituição das colunas (verticais) por
barras horizontais.

Exemplo 0.13:
Tabela 0.04 – Faturamento da Empresa ABC no primeiro semestre do ano XXXX, por
região.
Região Faturamento (R$ . 1000,00)
Sul 48,1
Sudeste 42,4
Centro Oeste 29,9
Nordeste 27,5
Norte 21,1
Total 169,0
Dados fictícios

Gráfico 0.04 - Faturamento da Empresa ABC por região.

0.05 – Exercícios

1) Uma empresa (fictícia) atua nos ramos de transporte, armazenagem e distribuição em três estados
diferentes. O quadro abaixo mostra o desempenho desta empresa durante quatro meses.

Quadro 0.03 – Faturamento (R$ . 1000,00) mensal, por ramo de atividade e por Estado.
Ramo Total
Transporte Armazenagem Logística
PR SC RS PR SC RS PR SC RS

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Janeiro 56,4 45,8 35,7 25,9 26,7 36,8 25,9 15,7 42,5
Fevereiro 45,6 25,8 36,9 42,8 32,0 41,7 54,2 19,7 23,4
Março 32,0 14,7 41,1 54,8 36,7 45,1 62,2 24,3 14,5
Abril 25,8 10,5 45,2 59,8 39,7 50,2 72,1 26,7 10,9
Total

Construir para os dados do quadro acima:


a) Uma série temporal.
b) Uma série geográfica.
c) Uma série específica.

Representar os dados:
d) da série temporal por um gráfico linear;
e) da série geográfica por um gráfico setorial;
f) da série específica por um gráfico de colunas.

2) Construir uma tabela, ou quadro, para classificar os funcionários de uma empresa com relação a sexo,
estado civil (solteiro, casado, viúvo e outros) e escolaridade (primeiro grau, segundo grau ou superior).

0.02 – Notação por Índices

A notação por índices é utilizada para representar os valores de um conjunto ordenado de dados.
Consiste simplesmente em acrescentar uma letra, normalmente i ou j, à direita da letra usada para
designar a variável, embora esta letra possa ser posicionada de modo diferente. Usualmente a forma
empregada é

( “ X índice i” )

Seja, por exemplo, o conjunto { 2 , 4 , 5 , 6 , 8 , 9 , 11 , 15 }. Então X1 = 2 , X4 = 6 , X6 = 9.

0.02.01 – Somatório

É o símbolo utilizado para representar a soma dos elementos de um conjunto. É representado por

Lê-se: “Somatório de X índice i, com i variando de 1 a n”.

0.02.01.01 – Propriedades:

P1:

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


P2:

P3:

P4: , k  IR .

P5:

Exemplo 0.14: Sejam os conjuntos X = { 1 , 2 , 4 , 5 , 6 } e Y = { - 3 , - 1 , 0 , 2 , 3 }. Calcular:

a)

b)

c)

d)

e)

f)

g)

0.02.02 – Produtório

É o símbolo utilizado para representar o produto dos elementos de um conjunto. É representado


por

Lê-se: “Produtório de X índice i, com i variando de 1 a n”.

Exemplo 0.15: Sejam os conjuntos X e Y do exemplo anterior. Calcular

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


a)

b)

c)

0.03 – Distribuições de Freqüências

São séries estatísticas nas quais tempo, local e fenômeno são fixos. Neste caso o fenômeno é
representado através de intervalos de valores, chamados classes ou categorias.

Exemplo 0.16 :
Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.
Salários (R$) Funcionários
200 – 400 20
400 – 600 36
600 – 800 60
800 – 1000 40
1000 – 1200 28
1200 – 1400 16
Total 200
Dados fictícios
No exemplo acima há seis categorias, ou classes, salariais. O número de funcionários pertencentes a cada
classe é a freqüência, ou freqüência simples, da mesma.

0.03.01 – Dados Brutos

São dados numéricos não organizados, seja numa distribuição de freqüências ou seguindo
qualquer outro critério, como ordem crescente, por exemplo.

0.03.02 – Rol

É um conjunto de dados numéricos organizados em ordem crescente.

0.03.03 – Amplitude Total ( R )

É a diferença entre o maior e o menor valores de um conjunto de dados numéricos, isto é


R = Xmáx – Xmín (0.11)

0.03.04 – Número de Classes ( n )

Ao se elaborar uma distribuição de freqüências deve-se definir inicialmente o número de classes


da mesma. Este número pode ser definido arbitrariamente ou pela expressão abaixo, conhecida como
Fórmula de Sturges.

(0.12)

onde N é o número de elementos do conjunto, também chamado freqüência total.


Na prática não são elaboradas distribuições de freqüências com menos de cinco classes nem para
menos de 50 elementos.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


0.03.05 – Limites de Classe

São os valores que delimitam os elementos que serão considerados como pertencentes à classe
em questão. Normalmente são representados por
Lsi = limite superior da i-ésima classe
Lii = limite inferior da i-ésima classe

0.03.06 – Amplitude de Classe ( hi )

É a diferença entre os limites da i-ésima classe, ou seja

(0.13)

0.03.07 – Intervalo de Classe

É estabelecido com a finalidade de determinar quais elementos serão considerados como


pertencentes à classe. Os quatro intervalos possíveis são representados por

“inclusive – exclusive”

“inclusive – inclusive”

“exclusive – exclusive”

“exclusive – inclusive”

0.03.08 – Freqüência ( fi )

A freqüência da i-ésima classe nada mais é que o número de elementos pertencentes à mesma.
Também é chamada freqüência simples da classe. Na prática, quando a freqüência de uma classe é muito
pequena em relação as demais, isto é, desprezível, costuma-se representá-la por “ – “ (traço). Isto não
significa que a freqüência é zero.

No exemplo 0.16: f1 = , f2 = , f3 = , etc.

0.03.09 – Freqüência Acumulada

A freqüência acumulada da i-ésima classe pode ser:

0.03.09.01 – Crescente ( faci )


É a soma da freqüência da i-ésima classe com as freqüências das classes anteriores. Então

(0.14)

0.03.09.02 – Decrescente ( fadi )


É a soma da freqüência da i-ésima classe com as freqüências das classes posteriores. Então

(0.15)

No exemplo 0.16: e

0.03.10 – Freqüência Relativa ( fri )

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


A freqüência relativa da i-ésima classe é dada pela divisão da freqüência desta classe pela soma
das freqüências. Isto é

(0.16)

0.03.10.01 – Freqüência Relativa Percentual ( fri % )

A freqüência relativa percentual da i-ésima classe é dada pela multiplicação da freqüência


relativa desta classe por 100 (cem). Então

(0.17)
0.03.11 – Ponto Médio ( Xi )

O ponto médio da i-ésima classe é

(0.18)

No exemplo 0.16, X1 = 300 , X2 = 500 e X5 = 1100.

0.03.12 – Histograma

É um gráfico de colunas justapostas, onde a largura de cada coluna representa a amplitude e a


altura corresponde à freqüência da respectiva classe.

Exemplo 0.17: O histograma correspondente aos dados da tabela 0.05.

Gráfico 0.05 – Histograma representativo dos dados da tabela 0.05.

O quadro à direita pode ser eliminado. Neste caso os valores são escritos abaixo do eixo das abscissas.
Também não são necessárias as linhas horizontais de escala.

0.03.13 – Polígono de Freqüências

É uma linha poligonal unindo os pontos ( Xi , fi ). Pode ser traçada sobre o histograma, como se
pode ver a seguir.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Gráfico 0.06 – Polígono de freqüências representativo dos dados da tabela 0.05.

0.03.14 – Curva de Freqüências

É uma curva que passa pelos pontos ( Xi , fi).

0.03.15 – Regras para Construção de uma Distribuição de Freqüências

Algumas regras gerais para a construção de uma distribuição de freqüências são apresentadas por
Spiegel 2 . De acordo o referido autor, as etapas são:

1) Determinar a amplitude total do rol.


2) Dividir a amplitude total em um número conveniente de intervalos de classes que tenham a
mesma amplitude. Caso isto não seja possível, usar intervalos com amplitudes diferentes ou
abertos. Estes intervalos também devem ser escolhidos de modo que os pontos médios
coincidam com valores efetivamente observados, de modo a diminuir o erro de agrupamento em
análises posteriores.
3) Determinar o número de observações que caem dentro de cada intervalo.

0.03.16 – Exercícios

1) Uma amostra de 144 pacotes de um certo produto teve seus pesos, em gramas, observados, e os valores
são mostrados a seguir. Elaborar uma distribuição de freqüências.

114 118 95 85 101 104 95 102 104 105 130 86


112 90 96 103 96 89 96 94 96 97 126 84
80 117 103 104 102 103 95 98 97 93 124 92
115 104 81 108 104 103 106 94 102 101 120 109
112 104 107 85 81 109 86 99 88 98 122 110
110 92 107 101 107 84 106 100 97 92 98 95
119 103 92 111 103 92 106 92 104 104 96 102
110 94 109 87 107 89 95 103 87 99 99 91
115 102 105 110 105 83 105 100 98 92 101 99
110 94 93 82 107 89 106 98 88 105 103 106
116 101 109 117 101 102 109 102 98 99 115 87
113 114 112 110 108 109 95 106 116 94 107 95

a) Amplitude total: R =

b) Número de classes: n =

2
Spiegel, Murray R. – Estatística - 3ª. Edição – São Paulo – Makron Books – 1993.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


c) Amplitude de classe: h =

d) Intervalo:

e) Distribuição:

f) Histograma:

g) Polígono de freqüências:

h) Curva de freqüências:

1 – Medidas de Tendência Central, ou de Posição

1.01 – Média Aritmética

Seja um conjunto de dados { x1 , x2 , x3 , ... , xn }. Então a média aritmética é

(1.01)

É importante ressaltar que a notação usada, , corresponde à média aritmética de dados


amostrais. A média aritmética de uma população é representada pela letra grega  , calculada da mesma
forma.

Exemplo 1.01: Calcular a média aritmética do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

OBS: Neste material, salvo menção em contrário, todo exercício considerará os dados como sendo
amostrais.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


1.01.01 – Propriedades:

P1: Se uma constante k for somada a cada um dos elementos do conjunto, a média aritmética do mesmo
será acrescida de k.

Exemplo 1.02: Sejam os conjuntos { 1 , 3 , 4 , 6 , 9 } e { 201 , 203 , 204 , 206 , 209 }. Calcular e
comparar as médias aritméticas para ambos.

P2: Se todos os elementos de um conjunto forem multiplicados por uma constante k, a média aritmética
dos mesmos também será multiplicada pelo mesmo valor.

Exemplo 1.03: Sejam os conjunto { 2 , 3 , 6 , 6 , 8 } e { 6 , 9 , 18 , 18 , 24 }. Calcular e comparar as


médias aritméticas para ambos.

P3: A soma dos desvios dos valores de um conjunto em relação à sua média é nula.

Exemplo 1.04: Verificar a soma dos desvios em relação à média aritmética dos valores do conjunto { 2 , 4
, 6 , 7 , 9 }.

1.01.02 – Média Aritmética para Dados Agrupados.

Sejam N valores agrupados em n classes, com pontos médios Xi e freqüências fi . Então a média
aritmética é

(1.02)

Exemplo 1.05: Calcular a média aritmética para os dados da distribuição de freqüências do exemplo 0.64.
Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.
Salários Funcionários Xi Xi fi
200 – 350 20
350 – 500 36
500 – 650 60
650 – 800 40
800 – 950 28
950 – 1100 16
Total
Dados fictícios

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Exemplo 1.06: Calcular a média aritmética para a distribuição de freqüências obtida no exercício
0.04.15.1.

1.02 – Mediana ( ou Me )

A mediana, ou valor mediano, de um conjunto de dados é o número que divide este conjunto em
duas partes iguais. É importante ressaltar que este valor não pertence necessariamente ao conjunto.

1.02.01 – Dados Simples.


Há dois casos a considerar:

1) Quantidade ímpar de valores: neste caso a mediana é o valor que ocupa a posição central,
quando os valores estão em ordem crescente.

Exemplo 1.14: Calcular a mediana do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

Como os valores já estão ordenados, basta verificar que elemento ocupa a posição central. Neste caso
= 8.

2) Quantidade par de valores: aqui a mediana é a média dos dois elementos centrais, quando os
valores estão em ordem crescente.

Exemplo 1.15: Calcular a mediana do conjunto { 2 , 3 , 5 , 6 , 7 , 9 , 10 , 13 , 14 , 15 }.

1.02.02 – Dados Agrupados

Para dados agrupados em uma distribuição de freqüências pode-se aplicar a fórmula dada a
seguir:

(1.09)

onde:
Li = limite inferior da classe que contém a mediana.
fc = freqüência acumulada crescente da classe anterior à classe que contém a mediana.
fme = freqüência simples da classe que contém a mediana.
h = amplitude da classe que contém a mediana.

A classe que contém a mediana é aquela cuja freqüência acumulada crescente é imediatamente superior,
ou igual, a .
Exemplo 1.16: Calcular a mediana para a distribuição de freqüências do exemplo 0.64.
Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.
Salários Funcionários Xi Xi fi
200 – 350 20
350 – 500 36
500 – 650 60
650 – 800 40
800 – 950 28
950 – 1100 16
Total
Dados fictícios

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


1o. passo: Determinar a classe que contém a mediana:

Então a mediana pertence à .......... classe.

2o. passo: Aplicar a fórmula 1.09:

Li =

fc =

fme =

h=

3o. passo: Interpretação: ...........................................................................................................


...................................................................................................................................................

Exemplo 1.17: Calcular a mediana para a distribuição de freqüências do exemplo 1.06.

1.03 – Moda ( Mo)

A moda, ou valor modal, de um conjunto de dados é o valor com maior freqüência. Este valor
pode não existir ou, caso exista, pode não ser único.

1.03.01 – Dados Simples

Basta verificar qual elemento possui a maior freqüência.

Exemplo 1.18: Para o conjunto { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 8 , 9 , 10 } a moda é 4.

Exemplo 1.19: Para o conjunto { 1 , 2 , 2 , 2 , 2 , 3 , 3, 5 , 5 , 5 , 5 , 6 , 7 , 8 , 8 } os valores modais são 2 e


5.

Exemplo 1.20: O conjunto { 2 , 3 , 4 , 5 , 7 , 8 , 9 , 10 , 11 , 13 , 15 } não possui moda.

1.03.02 – Dados Agrupados

Para valores agrupados em uma distribuição de freqüências pode-se aplicar a fórmula obtida a
seguir.
Suponha-se que a figura (1.01), a seguir, represente parte do histograma de uma distribuição de
freqüências cujo valor modal deseja-se calcular. O retângulo mais alto representa a classe modal, isto é, a
de maior freqüência.
A B

1 E I F 2

D
C

Li I’ Li + h

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


(Figura 1.01)

O valor modal, Mo, coincide com I’ , abscissa do ponto I , que é a intersecção dos segmentos e
BC. Os triângulos AIC e BID são semelhantes. Então

Como I’ = Mo

Simplificando-se, a expressão fica

(1.10)

onde:
Li = limite inferior da classe modal (com maior freqüência simples).
1 = diferença entre as freqüências simples da classe modal e da classe anterior.
2 = diferença entre as freqüências simples da classe modal e da classe posterior.
h = amplitude da classe modal.

Exemplo 1.21: Calcular a moda para a distribuição de freqüências do exemplo 0.64.


Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.
Salários Funcionários Xi Xi fi
200 – 350 20
350 – 500 36
500 – 650 60
650 – 800 40
800 – 950 28
950 – 1100 16
Total
Dados fictícios

Exemplo 1.22: Calcular a moda para a distribuição de freqüências do exemplo 1.06.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


1.04 – Relação Entre Média, Mediana e Moda

A assimetria de uma distribuição de freqüências é o grau de desvio dos valores em relação a um


valor central. A determinação do tipo de assimetria tem grande utilidade em algumas aplicações da
Estatística, como no Controle Estatístico de Processo (CEP), por exemplo.

1.04.01 – Tipos de Assimetria

Com relação ao tipo de assimetria, uma distribuição de freqüências pode ser:

1.04.01.01 – Assimétrica Positiva:

(Figura 1.02 – Distribuição Assimétrica Positiva)

1.04.01.02 – Simétrica, ou Normal:

(Figura 1.03 – Distribuição Simétrica, ou Normal)

1.04.01.03 – Assimétrica Negativa:

(Figura 1.04 – Distribuição Assimétrica Negativa)

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


1.05 – Separatrizes (Medidas de Posição)

Já foi visto que a mediana divide um conjunto de dados ordenados em duas partes iguais. De
forma análoga, há medidas estatísticas que dividem um conjunto em quatro, dez ou cem partes. Estas
medidas são chamadas separatrizes. A medida que divide o conjunto em 100 partes iguais é o percentil,
definido a seguir.

1.05.01 – Percentil ( Pn )

Também chamado centil , divide um conjunto em cem partes iguais.

1.05.01.01 – Dados Simples

Para um conjunto de dados simples os percentis podem ser determinados de forma análoga a
utilizada para a determinação da mediana.

1.05.01.02 – Dados Agrupados

Para dados agrupados em uma distribuição de freqüências pode-se utilizar a fórmula dada a
seguir

(1.13)

onde:
n = 1 , 2 , 3 , ... , 99 é o percentil que se deseja calcular.
N = soma das freqüências.
fc = freqüência acumulada crescente da classe anterior à classe que contém o n-ésimo percentil.
fP = freqüência simples da classe que contém o n-ésimo percentil.
h = amplitude da classe que contém o n-ésimo percentil.

A classe que contém o n-ésimo percentil é aquela cuja freqüência acumulada crescente é imediatamente
superior, ou igual, a .

Exemplo 1.28: Calcular o 20o. e o 75o. percentis para a distribuição de freqüências do exemplo 0.64.
Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.
Salários Funcionários Xi Xi fi
200 – 350 20
350 – 500 36
500 – 650 60
650 – 800 40
800 – 950 28
950 – 1100 16
Total
Dados fictícios

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Exemplo 1.29: Calcular o 35o. e o 80o. percentis para a distribuição de freqüências do exemplo 1.06.

1.05.02 – Quartil e Decil

O quartil é a medida que divide um conjunto em quatro partes iguais. Pode ser calculado pelas
seguintes relações:

Q1 = P25
Q2 = P50
Q3 = P75
O decil divide o conjunto em dez partes iguais. Assim, usando raciocínio análogo ao utilizado
para o cálculo do quartil, tem-se
D1 = P10
D2 = P20
D3 = P30

1.06 – Exercícios

Tabela 1.01 – Diâmetros (mm) observados em um amostra de tubos.


Classe Diâmetros (mm) Tubos
1 93 |- 95 16
2 95 |- 97 24
3 97 |- 99 36
4 99 |- 101 48
5 101 |- 103 36
6 103 |- 105 24
7 105 |- 107 16
Total
Dados fictícios

1) Para os dados da tabela 1.01:


1) Calcular o diâmetro médio.
2) Calcular o diâmetro mediano.
3) Calcular o diâmetro modal.
4) Calcular e interpretar o 10o. percentil.
5) Calcular e interpretar o 90o. percentil.
6) Determinar o tipo de assimetria da distribuição.
7) Construir o histograma.
8) Calcular a freqüência acumulada decrescente.

Tabela 1.02 – Distribuição por idades dos moradores de uma certa localidade.
Idade Moradores
0 -| 5 100
5 -| 10 150

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


10 -| 15 200
15 -| 20 250
20 -| 25 200
25 -| 30 150
30 -| 35 100
35 -| 40 75
40 -| 45 50
45 -| 50 35
50 -| 55 20
55 -| 60 10
60 -| 65 5
Dados fictícios.

2) Para o dados da tabela 1.02:


1) Calcular a idade média.
2) Calcular a idade mediana.
3) Calcular a idade modal.
4) Com base nos três valores acima, classificar a população como “Jovem”, “Normal” ou “Velha”.
Relacionar a classificação com o tipo de assimetria.
5) Construir o histograma.
6) Calcular o 10o. percentil.
7) Calcular o 90o. percentil.
8) Construir um histograma para as freqüências acumuladas decrescentes.

3) Tabela 1.03
Ponto médio Freqüência Acumulada Crescente
2 6
4 16
6 30
8 50
10 78
12 100
14 112
16 120
18 126

1) Calcular a média.
2) Calcular a mediana.
3) Calcular a moda.
4) Calcular o 1o. quartil.
5) Calcular o 3o. quartil.
6) Construir um histograma para as freqüências acumuladas crescentes.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


2 – Medidas de Dispersão, ou Variabilidade

Tão importante quanto o cálculo de uma medida de posição, geralmente a média aritmética, é a
determinação da variação dos valores em torno desta medida. Esta variação é denominada dispersão, e
suas principais medidas são dadas a seguir.

2.01 – Variância ( 2 ou s2 )

A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores em relação à sua
média. Isto é, dado um conjunto { x1 , x2 , x3 , ... , xn }, a variância é dada por

2.01.01 – Dados Populacionais:

(2.01)

2.01.02 – Dados Amostrais:

(2.02)

OBS: Neste material, salvo menção em contrário, os dados serão sempre considerados como amostrais.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


As fórmulas dadas acima podem ser substituídas, respectivamente, por

(2.03)

(2.04)

conhecidas como fórmulas reduzidas, e que (apesar da aparência) tornam os cálculos consideravelmente
mais rápidos.

Exemplo 2.01: Calcular a variância do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

2.01.03 – Variância para Dados Agrupados

Sejam N valores agrupados em n classes, com pontos médios Xi e freqüências fi . Então a


variância é

2.01.03.01 – Dados Populacionais

(2.04)

2.01.03.02 – Dados Amostrais

(2.05)

onde .

Da mesma forma que as fórmulas (2.01) e (2.02), as fórmulas acima também podem ser substituídas por
fórmulas reduzidas. Neste caso (2.04) e (2.05) ficam, respectivamente,

(2.06)

(2.07)

Exemplo 2.02: Calcular a variância para os dados da distribuição de freqüências do exemplo 1.28.
Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.
Salários Funcionários Xi Xi fi

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


200 – 350 20
350 – 500 36
500 – 650 60
650 – 800 40
800 – 950 28
950 – 1100 16
Total
Dados fictícios

Exemplo 2.03: Calcular a variância para a distribuição de freqüências do exemplo 1.29.

2.02 – Desvio Padrão (  ou s )

É a mais conhecida, e utilizada, medida de dispersão. O desvio padrão de um conjunto de dados


nada mais é que a raiz quadrada da variância do mesmo.

Exemplo 2.05: Calcular o desvio padrão do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

Exemplo 2.06: Calcular o desvio padrão para a distribuição de freqüências do exemplo 2.04.

OBS: A exemplo dos exercícios envolvendo a variância, todos os exercícios envolvendo o cálculo do
desvio padrão devem considerar os dados como amostrais, salvo menção em contrário.

2.02.01 – Propriedades

P1: Se uma constante k é somada a todos os valores de um conjunto, o desvio padrão não se altera.

P2: Se todos os valores de um conjunto são multiplicados por uma constante k, o desvio padrão também
fica multiplicado por k.

2.03 – Coeficiente de Variação

O coeficiente de variação é definido como a razão entre o desvio padrão e a média aritmética.
Então

(2.10)

Exemplo 2.07: Calcular o coeficiente de variação para o conjunto {3 , 4 , 6 , 8 , 9 , 10 , 10 , 11}.

Exemplo 2.08: Idem para a distribuição de freqüências do exemplo 2.04.

2.04 – Escore Reduzido ( z )

Seja um conjunto { x1 , x2 , x3 , ... , xn }. O escore reduzido do i-ésimo elemento é dado por

(2.11)

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Quando os dados estão agrupados em um distribuição de freqüências, calcula-se o escore
reduzido dos pontos médios.

Exemplo 2.09: Calcular o escore reduzido para o conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

Exemplo 2.10: Calcular o escore reduzido de cada ponto médio da distribuição de freqüências do
exemplo 2.04.

2.05 – Exercícios

Tabela 1.01 – Diâmetros (mm) observados em um amostra de 100 tubos.


Classe Diâmetros (mm) Tubos
1 93 |- 95 16
2 95 |- 97 24
3 97 |- 99 36
4 99 |- 101 48
5 101 |- 103 36
6 103 |- 105 24
7 105 |- 107 16
Total 200
Dados fictícios

1) Para os dados da tabela 1.01:


1) Calcular a variância.
2) Calcular o desvio padrão.
3) Calcular o coeficiente de variação.

Tabela 1.02 – Distribuição por idades dos moradores de uma certa localidade.
Idade Moradores
0 -| 5 100
5 -| 10 150
10 -| 15 200
15 -| 20 250
20 -| 25 200
25 -| 30 150
30 -| 35 100
35 -| 40 75

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


40 -| 45 50
45 -| 50 35
50 -| 55 20
55 -| 60 10
60 -| 65 5
Dados fictícios.

2) Para o dados da tabela 1.02.


1) Calcular o desvio padrão.
2) Calcular os escores reduzidos correspondentes aos pontos médios.

Tabela 1.03
Ponto médio Freqüência Acumulada Crescente
2 6
4 16
6 30
8 50
10 78
12 100
14 112
16 120
18 126

3) Calcular o desvio padrão.

4) Calcular o desvio padrão para os conjuntos:

a) {2 , 4 , 5 , 6 , 8 }
b) {102 , 104 , 105 , 106 , 108 }.

5) Calcular o coeficiente de variação para cada conjunto do exercício anterior.

3 – Medidas de Assimetria e Curtose

3.01 – Definições e Conceitos

O conceito de assimetria foi apresentado em 1.07 , p. 56. Ali também foi apresentada uma forma
de determinar o tipo de assimetria de um conjunto de dados. Em algumas aplicações, contudo, a simples
determinação do tipo de assimetria não é suficiente, fazendo-se necessário o cálculo do coeficiente de
assimetria.
A curtose de um conjunto de dados é o achatamento de uma curva de freqüências em relação a
uma curva simétrica, ou normal. Com relação à curtose, uma curva de freqüências pode ser classificada
como:

3.01.01 – Mesocúrtica:

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Figura 3.01 – Distribuição Mesocúrtica
3.01.02 – Leptocúrtica

Figura 3.02 – Distribuição Leptocúrtica


3.01.03 – Platicúrtica

Figura 3.03 – Distribuição Platicúrtica.

3.02 – Coeficientes de Pearson para Assimetria

O primeiro e o segundo coeficientes de Pearson para a assimetria são dados, respectivamente,


por

(3.01)

(3.02)

3.02.01 – Comentário

Na prática há situações nas quais as relações entre média, mediana e moda apresentadas em 1.07,
não se verificam. Isto é, a mediana ( ) não assume um valor intermediário entre a média ( )ea
moda ( Mo ). Neste caso pode-se aplicar uma “regra não escrita”, que consiste em desconsiderar o valor

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


da moda na determinação do tipo de assimetria. Para o cálculo do coeficiente de assimetria deve-se
adotar, portanto, o segundo coeficiente de Pearson (3.02). Por outro lado, independentemente da
ocorrência ou não deste fato, é consenso que o cálculo deste coeficiente deve ser feito sempre com base
em uma única fórmula, das duas dadas acima.

Exemplo 3.01: Calcular o coeficiente de assimetria para o conjunto { 3, 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }.

Exemplo 3.02: Calcular os dois coeficientes de Pearson para a distribuição de freqüências do exemplo
2.04.
Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.
Salários Funcionários Xi Xi fi
200 – 350 20
350 – 500 36
500 – 650 60
650 – 800 40
800 – 950 28
950 – 1100 16
Total
Dados fictícios

3.03 – Coeficiente Percentílico de Curtose

Uma medida de curtose muito usada na prática é o coeficiente percentílico de curtose, dado por

(3.03)

A determinação do tipo de curtose é feita com base nas relações a seguir:

k < 0,263  Leptocúrtica

k = 0,263  Mesocúrtica

k > 0,263  Platicúrtica

Exemplo 3.03: Calcular o coeficiente de curtose para a distribuição de freqüências do exemplo 3.02.

Tabela 0.05 – Distribuição de salários dos funcionários de uma certa empresa.


Salários Funcionários Xi Xi fi
200 – 350 20
350 – 500 36
500 – 650 60
650 – 800 40
800 – 950 28
950 – 1100 16
Total
Dados fictícios

3.03.01 – Comentário

Na prática, o coeficiente de curtose é calculado apenas para distribuições normais, ou simétricas.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


3.04 – Exercícios de Revisão.

Seja a distribuição de freqüências a seguir.

Tabela 3.01: Pesos (em gramas) observados em uma amostra de pacotes de um certo
produto.
Peso (g) Pacotes
90 – 92 12
92 – 94 18
94 – 96 24
96 – 98 36
98 – 100 48
100 – 102 40
102 – 104 34
104 – 106 22
106 - 108 14
Dados fictícios

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


1) Calcular a freqüência acumulada crescente para cada classe.
2) Calcular a freqüência acumulada decrescente para cada classe.
3) Calcular o peso médio.
4) Calcular o peso mediano.
5) Calcular o peso modal.
6) Construir o histograma.
7) Determinar o tipo de assimetria da distribuição.
8) Calcular o desvio padrão.
9) Calcular o primeiro coeficiente de Pearson.
10) Calcular o coeficiente percentílico de curtose.

Repetir o exercício anterior para a distribuição a seguir:


Tabela 1.03
Ponto médio Freqüência Acumulada Crescente
2 6
4 16
6 30
8 50
10 78
12 100
14 112
16 120
18 126

4 – Teoria Elementar da Probabilidade

4.01 – Conceitos

A teoria da probabilidade é aplicada à Estatística Indutiva, ou Inferencial, que tem se mostrado


uma importante ferramenta de apoio à tomada de decisões sob condições de incerteza. Embora não haja
uma definição precisa do que é probabilidade, o assunto pode ser estudado sob três enfoques, dados a
seguir.

4.01.01 – Enfoque Clássico

Seja um experimento com n possíveis resultados. Supondo-se que m destes resultados, m  n,


sejam favoráveis à ocorrência de um evento, então a probabilidade de ocorrência do evento é
(4.01)

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Interpretação: “A probabilidade de ocorrência de um evento é a razão entre o número de casos
favoráveis e o número de casos possíveis”.

4.01.02 – Enfoque Relativo

Sob este enfoque a probabilidade de ocorrência de um evento é determinada com base na


proporção de ocorrências deste evento em um certo número de observações, ou experimentos.

4.01.03 – Enfoque Subjetivo

É adotado quando há apenas uma oportunidade para a ocorrência do evento. Neste caso o que se
observa é um certo “grau de crença”3 , ou expectativa. Também é conhecido como enfoque
personalístico.

Um princípio muito importante no estudo da teoria da probabilidade é o Princípio Fundamental


da Contagem (PFC). De acordo com este princípio, se dois eventos sucessivos podem ocorrer de m e n
modos, respectivamente, então o número de modos pelos quais m e n podem ocorrer é dado por (m.n).

4.02 – Experimento Aleatório (  )

É todo experimento, ou observação, cujo resultado não seja previsível, estando sujeito
unicamente ao acaso. São exemplos de experimento aleatório: número de falhas apresentadas por um
equipamento, número de nascimentos em uma certa semana, número de clientes atendidos em um dia
qualquer em um estabelecimento comercial e o número de ganhadores de uma loteria, entre outros.
4.02.01 – Espaço Amostral ( S )

É o conjunto de todos os possíveis resultados de um experimento aleatório. Como é um conjunto,


está sujeito a todas as propriedades vistas no capítulo 0 , p. 6. Cabe acrescentar, ainda, que um espaço
amostral pode ser:
4.02.01.01 – Discreto: quando é um conjunto enumerável.

4.02.01.02 – Contínuo: quando não é conjunto enumerável.

4.02.02 – Evento ( E )

É um subconjunto de um espaço amostral, cujos elementos são os resultados favoráveis,


mencionados em 4.01.01. Dois, ou mais, eventos atendem a todas as propriedades e operações sobre
conjuntos já mencionadas, tais como união, intersecção, etc.

4.02.02.01 – Evento União

Sejam dois eventos, A e B. O evento união, ou A  B , ocorre sempre que se observar a


ocorrência de um resultado favorável a A ou a B.

4.02.02.02 – Evento Intersecção

Sejam dois eventos, A e B. O evento intersecção ocorre sempre que se observar a ocorrência de
um resultado favorável a A e a B.

4.02.02.03 – Evento Complementar

Seja um evento A. O evento complementar ocorre sempre que se observar a ocorrência de um


resultado desfavorável a A.

4.02.02.04 – Eventos Mutuamente Exclusivos

3
Kazmier, Leonard J. – Estatística Aplicada à Economia e Administração – Ed. Mc Graw Hill do Brasil – São Paulo – 1982.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Dois eventos, A e B, são mutuamente exclusivos quando não há possibilidade de ocorrência de
um resultado favorável a ambos, como no evento união. Isto significa dizer que
AB=

4.02.03 – Probabilidade de um Evento ( p ou P(E) )

É dada por

(4.02)

4.02.04 – Propriedades

Sejam A e B dois eventos quaisquer de um espaço amostral S. São válidas as seguintes


propriedades:
1) 0  P(A)  1
2) P( A  B) = P( A + B) = P(A) + P(B) – P(A  B)
3) P(S) = 1
4) Sejam A1 , A2 , ... , An todos os eventos de um espaço amostral S. Então

4.02.05 – Exemplos

Escrever e classificar o espaço amostral associado a cada experimento aleatório dado a seguir.

1) Uma moeda é lançada duas vezes.


2) Um dado é lançado após o lançamento de uma moeda.
3) Foguetes são lançados até que um lançamento seja bem sucedido. O número máximo de
lançamentos é 5 (cinco).
4) Número de defeitos apresentados por um veículo durante o período de garantia.
5) Número de cancelamentos de passagens para vôo em um avião com 20 lugares.

Calcular a probabilidade de cada um dos eventos dados a seguir.

1) Uma moeda é lançada duas vezes. Qual a probabilidade de se obter duas “caras” ?
2) Uma caixa contém cinco bolas brancas e cinco bolas pretas. São retiradas duas bolas. Qual a
probabilidade de que:

a) As duas sejam pretas ?


b) As duas sejam da mesma cor ?

3) Resolver o exemplo anterior considerando as retiradas com reposição.


4) Um dado é lançado duas vezes. Qual a probabilidade de que a soma dos resultados seja a) 8 ?
b) 5 ? c) 7 ?
5) Uma caixa contém dez rolamentos, dos quais dois estão estragados. São retirados quatro
rolamentos. Qual a probabilidade de que os dois rolamentos defeituosos estejam entre estes
quatro ?

4.02.06 – Eventos Independentes

Dois eventos, A e B, são chamados independentes quando a ocorrência de um não altera a


probabilidade de ocorrência do outro. Neste caso, para determinar a ocorrência do evento A e do evento
B, aplica-se a Regra do Produto, dada por

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


(4.03)

Exemplo 4.02.06: Um dado é lançado duas vezes. Qual a probabilidade de se obter os resultados 3 e 5 ?

4.02.07 – Probabilidade Condicional

Sejam A e B dois eventos consecutivos. Há casos nos quais a ocorrência, ou não, do evento A
altera a probabilidade de ocorrência do evento B. Nestes casos diz-se que a ocorrência de B está
condicionada à ocorrência de A. Assim, a probabilidade de ocorrência de B, após a ocorrência de A, é
dada por

(4.04)

Na equação acima, P(B | A) deve ser lido como “probabilidade de B ocorrer, dado que A
ocorreu”.

Exemplo 4.02.07: Uma caixa contém duas bolas brancas e três bolas pretas. São retiradas duas bolas
aleatoriamente e sem reposição. Qual a probabilidade de que a primeira seja branca e a segunda seja preta
?

Exemplo 4.02.08: No exemplo anterior, qual a probabilidade de que as duas bolas sejam da mesma cor ?

4.02.08 – Teorema da Probabilidade Total

Sejam A1 , A2 , ... , Ai , ... , An partições de um espaço amostral S , isto é,


. Seja B um evento qualquer de S. Então a probabilidade de ocorrência de
B é dada por

(4.05)

Exemplo 4.02.09: Uma indústria adquire um componente de três fornecedores, A, B e C. O fornecedor A


é responsável por 40% das unidades, enquanto os fornecedores B e C são responsáveis por 30% cada um.
A proporção de não conformidade (p.n.c.) do fornecedor A é igual a 3%, do fornecedor B é 5% e do
fornecedor C é 4%. Uma unidade do componente em questão é selecionada aleatoriamente. Qual a
probabilidade de ser não conforme ?

4.03 – Teorema de Bayes

Também conhecido como fórmula de probabilidades “a posteriori”, é aplicado na seguinte


situação. Sejam A1 , A2 , ... , Ai , ... , An partições de um espaço amostral S , isto é,
. Seja B um evento qualquer de S. Então

(4.06)

Exemplo 4.03.01: Seja o exemplo anterior. Uma unidade é selecionada aleatoriamente e verifica-se que é
não conforme. Qual a probabilidade de ter sido produzida por B ?

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


4.04 – Variável Aleatória (V.A.)

De um modo simplificado, pode-se dizer que uma variável é chamada aleatória quando seus
valores são determinados por processos aleatórios.

Exemplo 4.04.01: Seja  o experimento aleatório “lançamento de um dado”. Seja X a variável que
representa os possíveis resultados para este experimento. Isto significa que X  {1 , 2 , 3 , 4 , 5 , 6}.

4.04.01 – Tipos de Variável Aleatória.

Uma variável aleatória pode ser:

4.04.01.01 – Discreta: Quando o espaço amostral é um conjunto enumerável (página 8).

4.04.01.02 – Contínua: Quando o espaço amostral é um conjunto não enumerável.

4.05. – Função de Probabilidade

Seja X uma v. a. discreta. Uma função p( X ) é uma função de probabilidade se, para cada valor
de X:
a) 0  p( X )

b)

c) p( k ) = P( X = k )

4.05.01 – Função Densidade de Probabilidade

Seja X uma v. a. contínua. Uma função f( X ) é uma função densidade de probabilidade (fdp) se,
para cada valor de X:

a) 0  f (X)
b)

c) P( a  X  b) =

4.05.02 – Expectância ( E( X ) ou  )

É a média, ou valor esperado, de uma variável aleatória. É definida como

, v. a. discreta (4.07)

, v. a. contínua (4.08)

Exemplo 4.05.01 – A tabela abaixo mostra o número falhas observadas em uma linha de produção
durante um período de 50 dias. Calcular a expectância da v.a. discreta X.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Tabela 5.01 – Numero de falhas observado durante 50 dias em uma linha de produção.

Número de falhas (X) Dias


0 5
1 7
2 11
3 13
4 8
5 4
6 2
Total 50
Solução:

Número de falhas (X) Dias P( X ) XP( X )


0 5
1 7
2 11
3 13
4 8
5 4
6 2
Total 50

Exemplo 4.05.02: Um certo modelo de automóvel custa R$ 30000,00. As estatísticas mostram que 8%
dos veículos deste modelo são roubados no período de um ano. Qual o valor “justo” para o seguro contra
roubo ?

4.05.03 – Variância ( V( X ) ou 2 )

Seja uma v. a. X. A sua medida de dispersão, ou variabilidade, em torno da média é dada por

, v. a. discreta (4.09)

, v. a. contínua (4.10)

Exemplo 4.05.03: Calcular a variância para a v. a. discreta do exemplo 4.05.01.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Número de falhas (X) Dias
0 5
1 7
2 11
3 13
4 8
5 4
6 2
Total 50

Exemplo 4.05.04: A variância também pode ser calculada pela fórmula . Calcular a
variância da v. a. do exemplo anterior através da fórmula dada.

4.06 – Exercícios
Para cada um dos exercícios abaixo, escrever o espaço amostral, o evento estudado e calcular a
probabilidade do mesmo, quando solicitado.

1) Seja o seguinte jogo. De uma urna, contendo cinco bolas pretas e cinco bolas brancas, são
retiradas, com reposição, três bolas sucessivamente. A cada bola retirada é colocada outra da
mesma cor. Qual a probabilidade de que:

a) As três primeiras bolas sejam pretas ?


b) As três primeiras bolas sejam da mesma cor ?
c) No mínimo uma das três bolas retiradas seja preta ?

2) Um dado é lançado duas vezes. Qual a probabilidade de que a soma dos resultados seja:

a) dois ?
b) cinco ?
c) no mínimo nove ?
d) menos que nove ?

3) O fornecimento de um componente é feito por três empresas, C 1 , C2 e C3. As proporções de não


conformidade (pnc’s) destas empresas são, respectivamente, 3% , 8% e 9%. O fornecedor C 1
produz o dobro do fornecedor C2, cuja participação é igual à de C 3. Qual a probabilidade de que
uma unidade, selecionada aleatoriamente, seja:

a) produzida por C1 e não conforme ?


b) não conforme e produzida por C1 ?
c) conforme e produzida por C2 ou C3 ?

4) Um atirador tem o direito de disparar quatro tiros, até acertar o alvo. Se a probabilidade de
acertar o alvo é igual a p, calcular a probabilidade de que o atirador acerte na segunda tentativa.

5) Uma oferta de emprego é respondida por 100 pessoas. Destas 100 pessoas, 50 possuem
certificado técnico e 30 possuem apenas experiência. Há, ainda, 20 pessoas que preenchem
ambos os requisitos. Qual a probabilidade de que um candidato selecionado aleatoriamente:

a) possua certificado ?
b) possua experiência ?
c) possua certificado e experiência ?
d) possua certificado ou experiência ?
e) possua certificado ou experiência, mas não ambos ?

6) A pnc (proporção de não conformidade) de um produto é igual a 5%. Em um lote de cinco


unidades, qual a probabilidade de que:

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


a) duas estejam fora de conformidade ?
b) mais de duas estejam fora de conformidade ?
c) no mínimo duas estejam fora de conformidade ?
d) ao menos uma esteja fora de conformidade ?

7) A tabela a seguir mostra o número de caminhões que chegam para descarregar em um terminal
ao longo de 30 dias.

Número de caminhões (X) Dias


1 1
2 3
3 7
4 9
5 5
6 4
7 1
Total 30

a) Calcular a probabilidade de que o terminal receba, em um dia qualquer, no mínimo cinco


caminhões.
b) Qual o número esperado de caminhões em um dia qualquer ?
c) Qual a variância ?

8) Supondo que a chegada de cada caminhão represente uma receita de R$ 300,00, qual a receita
esperada para um período de 30 dias ?

9) Um dado é lançado após o lançamento de uma moeda. Qual a probabilidade de:


a) obter uma “cara” e um número par ?
b) obter uma “cara” ou um número par ?
c) obter um número par, se o resultado anterior foi uma “cara” ?

10) Um dado é lançado cinco vezes. Qual a probabilidade de obter três “quatro” ?
11) Uma urna contém quatro bolas brancas e seis bolas pretas. São retiradas quatro bolas. Seja X a v.
a. que representa o número de bolas brancas retiradas. Construir uma tabela para a função de
probabilidade de X.
12) Um dado é lançado duas vezes. Qual a probabilidade de obter:
a) Um “dois” e um “três” ?
b) Um “três” no segundo lançamento após a ocorrência de um “dois” no primeiro
lançamento ?

13) Com relação a um certo modelo de automóvel verificou-se que a taxa de roubos, no ano anterior,
foi de 5%. A taxa de envolvimento em acidentes foi de 7%. Se o veículo custa R$ 25000,00 ,
quanto deve ser cobrado por um seguro contra roubo e acidentes, de modo que o valor seja
“justo”?
14) Em um lote de 20 motores há dois defeituosos. Para fazer a inspeção de qualidade são testadas
três unidades de cada lote. Se mais de uma unidade defeituosa for encontrada, o lote é rejeitado.
Qual a probabilidade de que o lote seja aceito ?

5 – Distribuições de Probabilidade Discreta

5.01 – Distribuição Binomial

Seja um experimento aleatório com as seguintes propriedades:


1) A cada observação há somente dois resultados possíveis, denominados sucesso e fracasso.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


2) As observações constituem eventos independentes, isto é, o resultado de uma observação não
influencia o resultado da observação subseqüente.
3) A probabilidade de sucesso, representada por p, não se altera.

Um experimento aleatório com as referidas propriedades é denominado Experimento de Bernoulli4.

Seja um experimento de Bernoulli realizado n vezes, com probabilidade p de “sucesso”, e seja X


a v.a. discreta que representa o número de “sucessos”. Então a probabilidade de k “sucessos” é dada por

(5.01)

Exemplo 5.01: A pnc de um produto é igual a 4%. Em uma caixa com dez unidades deste produto, qual a
probabilidade de que:
a) três estejam fora de conformidade ?
b) no máximo duas estejam fora de conformidade ?
c) mais de duas estejam fora de conformidade ?

Exemplo 5.02: Suponha que o fabricante do produto acima deva pagar uma multa de R$ 5,00 por
caixa com mais de uma unidade não conforme. Qual o montante das multas para 20 caixas ?

Exemplo 5.03: Suponha agora que as caixas, cada uma com dez unidades, do produto acima sejam
acondicionadas em pacotes com cinco caixas. Qual a probabilidade de que um pacote contenha duas
caixas com mais de uma unidade fora de conformidade ?

5.01.01 – Propriedades da Distribuição Binomial

A média e a variância da distribuição binomial são dadas respectivamente por

(5.02)

(5.03)

5.02 – Distribuição de Poisson5

Sejam X, uma v. a. discreta que assume seu valores em um intervalo contínuo 6, e , um


experimento aleatório com as seguintes propriedades:

1) O número de “sucessos” em um intervalo independe do número de “sucessos” em qualquer outro


intervalo disjunto.
2) A probabilidade de ocorrência de um “sucesso” em um dado intervalo é proporcional ao
comprimento do mesmo e independente do número de “sucessos” fora deste mesmo intervalo.
3) A probabilidade de ocorrência de mais de um sucesso em um intervalo muito pequeno é
desprezível.

Um experimento aleatório com as propriedades acima é denominado Experimento de Poisson.

Seja X a v. a. que representa o número de ocorrências (“sucessos”) de um evento em um


Experimento de Poisson. A distribuição de probabilidade de X é dada por

4
Jacques Bernoulli (1654 – 1705). Matemático suíço.
5
Siméon Poisson (1781 – 1840) . Matemático francês.
6
Número de falhas por hora; número de defeitos por metro quadrado; quantidade de passageiros por dia; etc.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


(5.04)

onde  é o número médio de ocorrências no intervalo considerado.

Exemplo 5.09: Um caixa eletrônico atende em média dez clientes em oito horas. Qual a probabilidade de
atender cinco clientes em quatro horas ?

Exemplo 5.10: No exemplo anterior, qual a probabilidade de serem atendidos no mínimo dois clientes em
2 horas ?

5.05.01 – Propriedades da Distribuição de Poisson

A média e a variância da distribuição de Poisson são dadas respectivamente por

(5.05)
(5.06)

5.03 – Distribuição Geométrica

Seja um experimento de Bernoulli repetido até a ocorrência do primeiro sucesso, com


probabilidade p. Seja X a variável aleatória que representa o número de realizações necessárias. Então

(5.07)

Exemplo 5.06: A taxa de rejeição no processo de fabricação de um certo produto é de 40%. Qual a
probabilidade de se ter que produzir 5 unidades para obter uma aceitável ?

Exemplo 5.07: No exemplo acima, qual a probabilidade de se ter que produzir mais de 3 unidades até a
obtenção de uma aceitável ?

5.03.01 – Propriedades da Distribuição Geométrica

A média e a variância da distribuição geométrica são dadas respectivamente por

(5.08)

(5.09)

5.04 – Distribuição de Pascal

Seja um experimento de Bernoulli, com probabilidade p de sucesso, repetido de forma


independente até que se consigam n sucessos. Seja X a variável aleatória que representa o número de
realizações necessárias. Então

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


(5.10)

Exemplo 5.08: Em um processo de fabricação há um índice de aceitação de 70%. Qual a probabilidade de


se ter que produzir 10 unidades para obter 6 conformes ?

Exemplo 5.09: No exemplo acima, qual a probabilidade de se ter que produzir no máximo 10 unidades
para obter 7 conformes ?

5.04.01 – Propriedades da distribuição de Pascal

A média e a variância da distribuição de Pascal são dadas respectivamente por

(5.11)

(5.12)

5.05 – Distribuição Hipergeométrica

Seja um conjunto com N elementos, dos quais w apresentam determinada propriedade. Seja uma
amostra com n elementos, extraída do conjunto acima (n  N). Seja X a variável aleatória que representa
o número de elementos da amostra com a mencionada propriedade. Então

(5.13)

Exemplo 5.10: Um lote de 10 unidades de um componente contém 3 defeituosos. Qual a probabilidade de


que uma amostra de 6 unidades, extraída deste lote, contenha 2 defeituosas ?

Exemplo 5.11: No exemplo anterior, qual a probabilidade de que a amostra contenha no mínimo uma
unidade defeituosa ?

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


5.05.01 – Propriedades da Distribuição Hipergeométrica

A média e a variância da distribuição hipergeométrica são dadas respectivamente por

(5.14)

(5.15)

5.06 – Distribuição Multinomial

Seja um experimento com n resultados mutuamente exclusivos, com probabilidades p1 , ... , pn .


Sejam X1 , ... , Xn as ocorrências de cada um dos n resultados, respectivamente. Então

(5.16)

OBS: .

Exemplo 5.12: Das unidades produzidas por um certo processo de fabricação, 80% são conformes, 15%
reaproveitáveis e 5% rejeitadas. Em um lote de 10 unidades, qual a probabilidade de se encontrar 7
conformes, 2 reaproveitáveis e 1 rejeitada ?

5.06.01 – Propriedades da Distribuição Multinomial

A média e a variância para cada um dos n resultados são dadas respectivamente por

(5.17)

(5.18)

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


5.06 – Exercícios

1) Um produto, cuja p.n.c. é igual a 7%, é comercializado em caixas com 20 unidades. Os clientes
rejeitam qualquer caixa que contenha mais de uma unidade não conforme. Qual a probabilidade
de que uma caixa seja rejeitada ?
2) Supondo que, no exercício anterior, o fabricante tenha um custo de R$ 2,00 por caixa devolvida,
qual o custo total esperado para uma encomenda de 1000 caixas ?
3) Um equipamento costuma apresentar uma falha a cada dez horas de trabalho. Qual a
probabilidade de apresentar:
a) Uma falha em duas horas ?
b) Mais de uma falha em duas horas ?
c) Duas falhas em cinco horas ?
4) Em um lote de 15 unidades de um certo produto há três defeituosas. Qual a probabilidade de que
uma amostra de três unidades apresente todas com defeito ?
5) A p.n.c. de um produto é igual a 5%. Qual a probabilidade de que um lote com dez unidades
contenha três não conformes ?
6) A taxa de cancelamento de passagens verificada por empresa é igual a 15%. Para evitar que um
avião, com capacidade para 30 passageiros, decole com assentos vazios, a empresa aceita até 33
reservas. Qual a probabilidade de que haja excesso de lotação (“overbooking”) ?
7) Uma empresa utiliza o Controle Estatístico de Processo (CEP) na fabricação de um certo
componente mecânico. Para tanto, são tomadas amostras periódicas a fim de verificar possíveis
variações nos valores controlados. No processo de fabricação do componente em questão, a
probabilidade de que uma variação não seja detectada em uma amostragem é de 15%. Qual a
probabilidade de que o problema seja detectado apenas na décima amostragem ?
8) Um posto de gasolina atende em média seis carros por hora. Qual a probabilidade de atender
cinco carros em trinta minutos ?
9) Um aeroporto registra em média seis aterrissagens num período de doze horas. Qual a
probabilidade de registrar duas aterrissagens em uma hora ?
10) Um empresa fabrica placas de madeira compensada que são comercializadas em lotes de 20
unidades. Cada placa apresenta em média uma imperfeição. Um cliente desta empresa admite
que uma placa possua no máximo duas imperfeições. Qual a probabilidade de:
a) uma placa ser recusada pelo cliente ?
b) um lote ter no máximo cinco placas rejeitadas ?
11) Uma administradora de planos de saúde verificou que, para determinada faixa etária, a taxa
mensal média de utilização de consultas médicas pelos clientes é de 25%. A mensalidade é
calculada de modo a permitir até dez consultas por mês. Se o número de consultas ultrapassar
este limite a administradora terá prejuízos. Supondo que cada cliente possa solicitar uma
consulta mensal, qual a probabilidade de que a administradora tenha prejuízo em um grupo de
vinte pacientes ?
12) Um produto, que apresenta p.n.c. igual a 5%, é embalado em pacotes com 25 unidades. Estes
pacotes são acondicionados em caixas com 30 pacotes. Um pacote é rejeitado se apresentar mais
de uma unidade fora de conformidade. Qual a probabilidade de uma caixa apresentar:
a) nenhum
b) um
c) dois
d) mais de dois
pacote(s) rejeitado(s) ?
13) Supondo que o fabricante do produto mencionado no exercício anterior deva indenizar os
clientes em R$ 2,50 por pacote rejeitado, qual o montante esperado com indenizações em uma
encomenda de 200 pacotes ?
14) Entre os candidatos a um certo cargo, 15% possuem as qualificações exigidas pela empresa
contratante. Em um grupo de 15 candidatos qual a probabilidade de que cinco possuam os
requisitos necessários à contratação ?
15) Uma fábrica de autopeças adquire chapas de aço em bobinas de 20m. Cada bobina apresenta em
média duas imperfeições. Para seu uso a indústria corta as bobinas em segmentos de 2 m de
comprimento. Um segmento só é aprovado na inspeção de qualidade se não apresentar nenhuma
imperfeição. Qual a probabilidade de um segmento ser rejeitado ?

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


16) Por um cruzamento passam em média 5 carros por minuto. Qual a probabilidade de não passar
nenhum carro durante 30 segundos ?
17) No exercício acima, qual a probabilidade de passarem dez carros em dois minutos ?
18) Em uma indústria a p.n.c. de um produto é igual a 5%. Em um lote de vinte unidades, qual a
probabilidade de:
a) nenhuma ser defeituosa ?
b) duas serem defeituosas ?
c) no mínimo três serem defeituosas ?
19) Uma distribuidora de gás utiliza para entregas uma caminhonete com capacidade para vinte
botijões. Normalmente 10% dos clientes da rota não fazem nenhuma compra. Se há 25 clientes
na rota, qual a probabilidade de que a caminhonete deva fazer entregas extraordinárias ?
20) A taxa de respostas a um formulário enviado pelo correio é igual a 10%. Para um lote de 25
formulários, qual a probabilidade de se obter:
a) nenhuma resposta ?
b) duas respostas ?
c) cinco respostas ?
d) mais de duas respostas ?
21) No exercício acima, qual o número esperado de respostas ?
22) Ainda com relação ao exercício 28, se cada formulário custa R$ 3,00, qual o custo esperado com
formulários não respondidos ?
23) Um aluno acredita saber metade da matéria avaliada em um exame. Se o exame é formado por
dez questões, cada uma valendo um ponto, e a nota mínima para aprovação é cinco, qual a
probabilidade que o aluno tem de ser aprovado ?
24) Uma seguradora apurou que 5% dos clientes com um certo perfil envolvem-se em acidentes. Em
um grupo de 30 clientes com o referido perfil, qual a probabilidade de que:
a) nenhum se envolva em acidente ?
b) um se envolva em acidente ?
c) cinco se envolvam em acidente ?
25) Uma linha de produção apresenta em média cinco falhas a cada 100 horas de trabalho. Qual a
probabilidade de apresentar duas falhas em 20 horas de trabalho ?
26) Uma linha de montagem trabalhando continuamente costuma apresentar quatro falhas em cada
turno de 24 horas. Cada falha acarreta um interrupção média de 15 minutos. Ao receber uma
encomenda que demanda 36 horas de trabalho, a administração determina um prazo de 38 horas.
Qual a probabilidade de que este prazo seja insuficiente ?
27) Uma empresa adquire um certo componente de três fornecedores. O fornecedor X é responsável
por 40% das entregas, enquanto os fornecedores Y e Z respondem cada um por 30%. Em um lote
de dez unidades do referido componente, qual a probabilidade de que quatro tenham sido
entregues por X, três tenham sido entregues por Y e três tenham sido entregues por Z ?
28) Em um fábrica de automóveis verificou-se que cada veículo pronto apresenta em média quatro
defeitos. Qual a probabilidade de um veículo apresentar no máximo três defeitos ?
29) No exercício anterior, qual a probabilidade de um veículo apresentar no mínimo três defeitos ?
30) Ainda com relação ao exercício 28, qual a probabilidade de que, em dez veículos, quatro
apresentem no máximo dois defeitos cada um ?
31) No processo de fundição de uma certa peça, 35% das unidades produzidas são rejeitadas. A
empresa recebe uma encomenda de seis unidades da referida peça. Qual a probabilidade de se ter
que produzir dez unidades para atender a encomenda ?
32) Uma remessa de 20 motores contém dois defeituosos. Qual a probabilidade de que uma amostra
de cinco unidades contenha:
a) Nenhum motor defeituoso ?
b) Um motor defeituoso ?

6 – Distribuições de Probabilidade Contínua

6.01 – Distribuição Normal


Diz-se que uma v. a. contínua X tem distribuição normal com média  e variância 2, o que se
representa por X ~ N( , 2), quando a sua função densidade de probabilidade é dada por

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


(6.01)7


Figura 6.1 – Gráfico da Distribuição Normal

A curva normal, também chamada Gaussiana, tem área total igual a um, e é simétrica em relação
ao eixo vertical. A probabilidade de que o valor de X esteja entre a e b, P(a  X  b), correspondente à
área (Fig. 6.2) abaixo da curva limitada pelas retas X = a e X = b, é dada por

(6.02)

a b
Figura 6.2
É possível demonstrar que os intervalos
(-,+ )
(  - 2 ,  + 2 )
(  - 3 ,  + 3 )

compreendem, respectivamente, 68,27% , 95,45% e 99,73% da área total da curva, conforme mostrado
na figura 6.3.

7
exp( X ) = eX.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


68,27%

99,45%

99,73%

Figura 6.3

6.01.01 – Distribuição Normal Padronizada

Seja z a variável reduzida definida como

(6.03)

então z tem distribuição normal com média igual a 0 e variância igual a 1. A f.d.p. de z é dada por

(6.04)

O gráfico para f(z) tem a forma da figura 6.4. A probabilidade de que X assuma um valor entre a e b
corresponde à área limitada pela curva e pelas retas z = z1 e z = z2 , conforme a figura 6.5.

0
Figura 6.4 – Gráfico da Distribuição Normal Padronizada

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


z1 z2
Figura 6.5
As áreas limitadas pela curva normal e pelas retas z = z1 e z = z2 podem ser calculadas com o
auxílio da tabela dada no apêndice I.

Exemplo 6.1 – Seja X uma v. a. contínua, normalmente distribuída, com média igual a 20 e variância
igual a 4. Calcular a probabilidade de:
a) P(18  X  21)

b) P(19  X)

c) P(X  18)

d) P(X  23)

e) P(25  X)

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


f) P(21  X  24)

g) P(17  X  19)

Exemplo 6.2 – Uma máquina empacotadora embala um produto em pacotes cujo peso médio é igual a
500 g, e cujo desvio padrão é igual a 20 g. Qual a probabilidade de um pacote apresentar peso igual a:

a) No mínimo 510 g ?
b) No máximo 520 g ?
c) No mínimo 495 g e no máximo 520 g ?
d) No máximo 495 g ?
e) No mínimo 490 g e no máximo 495 g ?
f) No mínimo 500 g e no máximo 515 g ?

Exemplo 6.3 – Sejam os pacotes embalados pela máquina do exemplo anterior. Um cliente rejeita todos
os pacotes com menos de 495 g. Quantos pacotes de uma encomenda de 10000 serão rejeitados ?

Exemplo 6.4 – Para quanto deve ser ajustado o peso médio dos pacotes dos exemplos anteriores para que
a percentagem de rejeição seja reduzida à metade ? O desvio padrão também deve ser alterado ? Por quê ?

Exemplo 6.5 – Uma indústria produz tubos de concreto com diâmetro médio igual a 900 mm e desvio
padrão igual a 15 mm. Os tubos são vendidos de acordo o diâmetro, de acordo com a tabela abaixo. Qual
o faturamento esperado para uma produção mensal de 5000 unidades ?
Diâmetro (mm) Preço Unitário (R$)
Abaixo de 895 8,50
De 895 a 910 12,30
Acima de 910 6,50

Exemplo 6.6 – Um comprador dos tubos do exemplo anterior está rejeitando 8% das unidades adquiridas,
sob a alegação de que o diâmetro excede o seu limite superior de especificação. Quanto vale esta
especificação ?

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


6.01.02 – Aproximação da Distribuição Binomial pela Distribuição Normal

Seja um experimento de Bernoulli, conforme descrito em 5.01. Quando o número de


observações é muito grande, o cálculo da probabilidade de ocorrência de um evento pode ser
impraticável. Neste caso pode-se efetuar a aproximação da distribuição binomial pela distribuição normal.
Seja X o número de ocorrências (“sucessos”) em n observações. A probabilidade de X pode ser
calculada conforme os passos mostrados a seguir:

1) Efetuar a “correção de continuidade” para X. Isto significa:


a) adicionar 0,5 a X quando se desejar um número de ocorrências igual, ou inferior, a X.
b) subtrair 0,5 de X quando se desejar um número de ocorrências igual, ou superior, a X.

2) Calcular a média e a variância, dadas respectivamente por

(6.05)
(6.06)

3) Calcular o escore reduzido, z (fórmula 6.03).


4) Calcular a probabilidade com o auxílio da tabela do apêndice I.

6.02 – Distribuição Exponencial

Seja um experimento de Poisson, com parâmetro , conforme definido em 5.05. Seja T o


comprimento do intervalo entre duas ocorrências de um determinado evento, como o tempo decorrido
entre duas falhas, p. ex., ou o comprimento do intervalo até a primeira ocorrência. A v. a. T é contínua e
tem função densidade de probabilidade dada por

(6.05)

A fórmula acima dá o comprimento do intervalo até a próxima, ou primeira, ocorrência.

Exemplo 6.7 – Um aeroporto recebe em média dez aviões a cada oito horas. Após a aterrissagem de uma
aeronave, qual a probabilidade de que a próxima chegue em no máximo:
a) uma hora ?

b) 30 minutos ?

Para calcular a probabilidade de que um evento ocorra após um instante t pode-se utilizar a fórmula

(6.07)

Exemplo 6.8 – Um terminal portuário recebe em média dois navios por semana (cinco dias úteis). Após a
chegada de um navio, qual a probabilidade de que se passem dois dias até a chegada do próximo ?

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


6.02.01 – Propriedades da Distribuição Exponencial

A média e a variância da distribuição exponencial são dadas, respectivamente, por

(6.08)

(6.08)

6.03 – Exercícios

1) Um determinado componente tem duração de vida média igual a 2500 horas, com desvio padrão de
150 horas. Calcular a probabilidade de uma unidade selecionada aleatoriamente durar:
a) no máximo 2550 horas
b) no mínimo 2450 horas.
c) no mínimo 2400 e no máximo 2700 horas.
d) no mínimo 2700 horas

2) Supondo que o fabricante do componente acima deva pagar uma indenização de R$ 35,00 para cada
unidade com duração de vida inferior a 2400 horas, qual o montante com indenizações para um lote de
1000 unidades ?

3) Se o componente dos exercícios anteriores é embalado em caixas com dez unidades, qual a
probabilidade de que uma caixa contenha no máximo três unidades com duração de vida inferior a 2700
horas ?

4) O cliente de uma indústria de parafusos rejeita 10% das unidades entregues, alegando que os diâmetros
estão abaixo do limite inferior de especificação. Outros 4% são rejeitados sob a alegação de que os
diâmetros estão acima do limite superior de especificação. Se o diâmetro médio dos parafusos é igual a 12
mm, e o desvio padrão igual a 0,5 mm, quais são os limites de especificação do cliente ?

5) Os limites de especificação para o diâmetro de um tipo de eixo são 105  0,6 mm. Se o diâmetro médio
é igual a 105 mm, e o desvio padrão igual a 1 mm, qual a proporção de não conformidade ?

6) Um equipamento é dotado de quatro unidades de um componente. A duração de vida média deste


componente é igual a 1000 horas, com desvio padrão de 120 horas. Qual a probabilidade de pelo menos
duas unidades funcionarem no mínimo 1200 horas cada um ?

7) Um terminal de descarga recebe em média seis caminhões num período de doze horas. A operação
requer 20 minutos. Qual a probabilidade de não haver formação de fila ?

8) A p.n.c. de um componente é igual a 10%. Em uma remessa de 500 unidades, qual a probabilidade de
que no mínimo 450 sejam consideradas “conformes”?

9) Em uma oficina, o tempo para a realização de um conserto em um equipamento é normalmente


distribuído, com média igual a 40 minutos e variância igual a 25. A gerência informa que o equipamento
estará disponível em uma hora. Se o serviço é iniciado 15 minutos após a entrada do equipamento, qual a
probabilidade de que o prazo não seja suficiente ?

10) As bobinas de aço produzidas por uma siderúrgica têm comprimento de 50 m, e apresentam em média
3 imperfeições cada uma. Ao se desenrolar uma bobina, qual a probabilidade de que a primeira
imperfeição apareça após os primeiros 10 m ?

7 – Estimação de Parâmetros

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


7.01 – Conceitos

O termo parâmetro origina-se da língua grega, para (ao lado) + metron (medida). Um
parâmetro é representado geralmente por uma letra grega. Em Estatística é usado para designar uma
grandeza mensurável, que caracteriza uma população. Como exemplo de parâmetros pode-se citar a
média (  ) e a variância ( 2 ) . Na prática é comum que os parâmetros de uma população sejam
desconhecidos. Nestes casos os valores dos parâmetros são determinados através de um processo
conhecido como estimação. Um estimador, do latim aestimare (avaliar), é um valor característico de
uma amostra, de tamanho n, extraída de uma população, de tamanho N, sobre a qual deseja-se tirar
alguma conclusão. Os estimadores são representados por letras latinas e, algumas vezes, são designados
por estatísticas. Exemplos de estimadores são a média amostral ( ) e a variância amostral (s 2), que
foram estudados nos capítulos 1 e 2, respectivamente.
A principal finalidade da estimação de parâmetros é o estudo de uma população com base em
valores obtidos a partir de uma amostra extraída da mesma.


s2
2

População Amostra

Medida Parâmetro Estimador


Média 
Variância 2 s2
Desvio padrão  s
Proporção p

Quadro 7.01 – Parâmetros e estimadores

Um estimador é considerado eficiente quando apresenta as seguintes propriedades:

1) É não viciado, ou “não tendencioso”. Seja S o estimador de um parâmetro . Neste caso a média de S
deve ser igual ao parâmetro . Isto é
E( S ) = 
2) Deve possuir mínima variância.

3) Deve ser consistente. Isto significa que, a medida que o tamanho da amostra ( n ) aumenta, a diferença
entre o estimador e o parâmetro diminui.

4) Deve ser suficiente, isto é, deve ser função de uma estatística que resuma o máximo possível de
informações a respeito do parâmetro.

Um estimador que reúna as duas primeiras características é referido como sendo “uniformemente
não-viciado de variância mínima” (UNVM). A média e a variância amostrais são exemplos de
estimadores UNVM.

7.02 – Distribuição Amostral

Seja uma população, de tamanho N, da qual são extraídas todas as possíveis amostras, todas de
tamanho n. Seja  o parâmetro que se deseja estimar. Se, para cada uma das possíveis amostras, for

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


calculado o estimador S, ou , obtém-se um conjunto de valores denominado distribuição amostral do
estimador em questão.

7.03 – Distribuição Amostral da Média (DAM)

É a distribuição de probabilidade para os possíveis valores das médias das amostras de tamanho
n.

Exemplo 7.01 – Seja a população constituída dos números { 2 , 3 , 5 , 7 }.


a) Extrair todas as possíveis amostras de tamanho n = 2 , com reposição.
b) Calcular a média de cada amostra.
c) Calcular a média populacional.
d) Calcular a média da distribuição amostral da média (DAM)
e) Calcular o desvio padrão populacional.
f) Calcular o desvio padrão da distribuição amostral da média (DAM).
g) Comparar as médias encontradas em ( c ) e ( d ).
h) Comparar os desvios padrões encontrados em ( e ) e ( f ).
a) Neste caso N = 4 (tamanho da população), e n = 2 (tamanho das amostras). Os valores encontrados
são mostrados no quadro 7.02, a seguir.

Número da amostra ( i ) Amostra ( a ) Média (b)


1 2,2 2,0
2 2,3 2,5
3 2,5 3,5
4 2,7 4,5
5 3,2 2,5
6 3,3 3,0
7 3,5 4,0
8 3,7 5,0
9 5,2 3,5
10 5,3 4,0
11 5,5 5,0
12 5,7 6,0
13 7,2 4,5
14 7,3 5,0
15 7,5 6,0
16 7,7 7,0
Quadro 7.02 – Médias amostrais

c) A média populacional é dada por  =

d) A média da DAM é dada por =

e) O desvio padrão populacional é dado por  =

f) O desvio padrão da DAM é dado por =

g) Comparação das médias:

h) Comparação dos desvios padrões:

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Conclusão:

7.04 – Estimação por Ponto:

Também denominada Estimação Pontual, consiste em apresentar como estimador para um dado
parâmetro um valor numérico único. Isto significa, por exemplo, estimar a média populacional  como
igual a . Este procedimento, embora não seja incorreto, apresenta, contudo, um sério inconveniente: o
estimador pode não ser um valor suficientemente próximo do valor do parâmetro. Este fato pode
comprometer seriamente a qualidade do estimador.

7.05 – Estimação por Intervalos de Confiança:

Também denominada Estimação Intervalar, consiste em determinar um intervalo numérico. A


este intervalo está associada uma probabilidade () de que o mesmo contenha o valor efetivo do
parâmetro estimado. A referida probabilidade é denominada “Nível de Confiança”. O valor (1 - )
também é conhecido como “Margem de Erro”.

7.05.01 – Níveis de Confiança e Valores Críticos:

Para uma distribuição normal há uma probabilidade de 68,27% de que o valor do parâmetro
pertença ao intervalo (  -  ;  +  ). Para os intervalos dados por (  - 2 ;  + 2 ) e (  - 3 ; 
+ 3 ) as probabilidades são, respectivamente, 95,45% e 99,73%. Estas probabilidades são os níveis de
confiança para os respectivos intervalos. Os valores 1 , 2 e 3 são denominados “valores críticos”.
Os principais níveis de confiança, e os respectivos valores críticos, adotados na prática são
apresentados no quadro 7.03, adiante.

Nível de Confiança () 0,99 0,95 0,90 0,80


Valor Crítico (zc) 2,58 1,96 1,65 1,28
Quadro 7.03 – Níveis de Confiança e Valores Críticos

7.06 – Intervalos de Confiança para a Média

A primeira providência a ser tomada na construção de um intervalo de confiança para estimar a


média é verificar se o desvio padrão populacional (  ) é conhecido. Se a resposta for positiva, os valores
críticos são tomados com base na Distribuição Normal, sendo os valores do quadro 7.03 os mais
utilizados na prática. Os limites do intervalo são

(7.01)

para amostragem com reposição, e

(7.02)

para amostragem sem reposição, onde N é o tamanho da população.


Quando o desvio padrão populacional é desconhecido, o que se nota com mais freqüência na
prática, não é aconselhável o uso da Distribuição Normal. Para estes casos a distribuição mais apropriada
é a Distribuição t, de Student, que será estudada adiante.

Exemplo 7.02: Uma amostra de 50 rolamentos produzidos por uma indústria apresentou diâmetro médio
igual a 92,0 mm. O desvio padrão verificado para o processo é igual a 0,6 mm. Determinar um intervalo
de 95% de confiança para a o diâmetro médio dos rolamentos produzidos pela indústria.

n= = = zc =

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Exemplo 7.03: Em uma cidade há 3500 famílias. Sabe-se que o desvio padrão da renda familiar é igual a
3,5 SM. Uma amostra de 150 famílias apresentou renda familiar média igual a 9,7 SM. Determinar um
intervalo de 90% de confiança para a renda familiar média desta cidade.

N= n= = = zc =

7.06.01 – Comentários

Nos dois exemplos acima o desvio padrão populacional (  ) é conhecido. Como deve ser do
conhecimento do estudante, para a determinação deste valor deve-se conhecer a média. Neste caso, como
explicar que se conheça o valor do desvio padrão sem que o valor da média seja conhecido ? Considere-
se, por exemplo, uma máquina empacotadora. Os pacotes embalados pela referida máquina apresentam
um peso médio (  ) e um desvio padrão (  ). Se a regulagem da máquina for alterada, o peso de cada
pacote será alterado. Esta nova regulagem acarretará uma alteração no peso médio, mas não no desvio
padrão, conforme é possível verificar pelas propriedades da média e do desvio padrão. Nestas condições o
intervalo de confiança terá como finalidade estimar o novo peso médio, já que o desvio padrão
permanecerá o mesmo.

7.07 – Intervalos de Confiança para a Proporção

Seja p a proporção de “sucessos” em uma população. Um caso que pode ser tomado como
exemplo é a proporção de não conformidade (p.n.c.), que representa a percentagem de unidades
defeituosas. Neste caso a distribuição envolvida é a Binomial. Entretanto, como as populações, e também
as amostras, costumam ter um tamanho considerável, é utilizada a aproximação da distribuição Binomial
pela distribuição Normal, conforme visto em 6.01.02. Seja uma amostra de tamanho n, para a qual é
calculada a proporção amostral ( ). Desta forma, o intervalo de confiança para a proporção
populacional ( p ) é dado por

(7.03)

quando a amostragem é feita com reposição, e

(7.04)

quando a amostragem é feita sem reposição, onde N é o tamanho da população.

Nas fórmulas acima considera-se que a variância populacional é desconhecida.

Exemplo 7.04: Uma amostra de 50 unidades de um certo componente apresentou 4 não conformes.
Determinar um intervalo de 95% de confiança para a p.n.c. deste componente.

n= = zc =
Exemplo 7.05: Uma empresa emprega 300 funcionários. Uma pesquisa junto a 40 funcionários mostrou
que 15 estão propensos a aceitar um novo plano de cargos e salários. Determinar um intervalo de 99% de
confiança para a proporção de aceitação do novo plano entre os funcionários.

N= n= = zc =

7.08 – Distribuição t, de Student8

8
Pseudônimo do matemático inglês William Gosset, que não podia publicar seus trabalhos usando o próprio nome.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Conforme já foi mencionado, a Distribuição Normal só pode ser aplicada quando a variância
populacional é conhecida. Se esta condição não é verificada, o uso da referida distribuição não é
recomendado, sob pena de comprometer a confiabilidade dos resultados. A estatística t é definida como

(7.05)

Diz-se que a variável aleatória t acima tem “Distribuição t, de Student” com (n – 1) graus de
liberdade. A função densidade de probabilidade desta variável é dada por

(7.06)

onde (n) = (n – 1) ! e ( ½ ) = . Quando n   a distribuição t aproxima-se da Distribuição


Normal.
Os valores de t para diferentes graus de liberdade são dados por uma tabela apropriada, a
exemplo dos valores para a Distribuição Normal.

7.08.01 – Intervalo de Confiança para a Média, Usando a Distribuição t, de Student

Quando a variância populacional é desconhecida o intervalo de confiança para a média é dado


por

(7.07)

onde tc é calculado para (n – 1) graus de liberdade.

Exemplo 7.06: Uma amostra de 20 tubos de concreto apresentou média igual a 275 mm e desvio padrão
igual a 2 mm. Determinar um intervalo de 95% de confiança para o diâmetro médio.
n= = s= tc =

7.09 – Intervalo de Confiança para a Diferença de duas Médias

Sejam duas amostras, uma de tamanho n1, extraída de uma população com média 1, e outra de
tamanho n2 , extraída de uma população com média 2, sendo ambas as médias desconhecidas e as
variâncias populacionais, 12 e 22.

Sejam duas amostras nas condições acima. Então o intervalo de confiança para a diferença das
médias populacionais é dado por

(7.08)

onde Sp é a “variância ponderada”, calculada por

(7.09)

onde tc é calculado para (n1 + n2 – 2) graus de liberdade.

Exemplo 7.07: Uma amostra de 50 lâmpadas de uma certa marca apresentou duração de vida média igual
a 1750 horas, com desvio padrão igual a 245 horas. Outra amostra, de 60 lâmpadas de uma outra marca,
apresentou duração de vida média igual a 1698 horas, com desvio padrão igual a 197 horas. Determinar

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


um intervalo de 95% de confiança para a diferença entre as durações de vida médias das lâmpadas das
duas marcas.

7.10 – Intervalo de Confiança para a Diferença de Duas Proporções

Sejam duas amostras, uma de tamanho n1, extraída de uma população com proporção p1 de
“sucessos”, e outra de tamanho n2, extraída de uma população com proporção p2 de “sucessos”. Então o
intervalo de confiança para a diferença (p1 – p2) é dado por

(7.10)

onde

(7.11)

Exemplo 7.08: Uma amostra, de 50 mancais produzidos por uma máquina apresentou 3 fora de
conformidade. Outra amostra, de 70 mancais produzidos por uma segunda máquina, apresentou 5 fora de
conformidade. Construir um intervalo de 95% para estimar a diferença entre as p.n.c.’s .

7.10.01 – Comentários:

Ao se construir um intervalo de confiança para a proporção, pode-se obter para o limite inferior
um valor negativo. Neste caso pode-se interpreta-lo como 0 (zero). Para a diferença de duas proporções
não há necessidade de considerar o valor negativo como 0 (zero).

7.11 – Tamanho Mínimo da Amostra

Para a estimação da média  o tamanho mínimo da amostra deve ser calculado por

(7.12)

onde:
zc = valor crítico correspondente ao nível de confiança desejado.
 = desvio padrão populacional, ou seu estimador ( s ).
 = erro bilateral admitido.

Exemplo 7.09: Uma injetora produz garrafas com diâmetro médio igual a 145 mm e desvio padrão igual a
0,6 mm. Após uma modificação no equipamento, deseja-se estimar o novo diâmetro médio. O nível de
confiança desejado é de 95% e o erro admitido é de 0,2 mm, para mais ou para menos (tolerância
bilateral). Qual deve ser o tamanho mínimo da amostra?

= zc = =

Para a estimação da proporção populacional p o tamanho mínimo da amostra é dado por

(7.13)

Exemplo 7.10: Deseja-se estimar a p.n.c. de um componente produzido por uma certa máquina. O nível
de confiança necessário é igual a 95%, e a tolerância (bilateral) admitida é de 0,02, ou 1%. Qual deve ser
o tamanho da amostra ?

7.12 – Exercícios

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


1) Uma amostra de 60 pneus apresentou duração média igual a 45000 km, com desvio padrão igual a
4550 km. Determinar um intervalo de 95% de confiança para estimar a duração média.

2) Uma pesquisa sobre renda familiar em uma certa localidade apresentou os valores
mostrados na distribuição de freqüências abaixo. Determinar um intervalo de 90% de
confiança para a renda familiar média.
Renda (SM) Famílias
1–5 12
5–9 20
9 – 13 38
13 – 17 18
17 – 21 8
21 – 25 4

3) Uma amostra de 30 unidades de um certo produto apresentou 2 fora de conformidade. Determinar um


intervalo de 95% de confiança para a p.n.c. do mesmo.

4) Sabe-se que o salário de uma determinada categoria tem desvio padrão igual a R$ 220,00. Uma
pesquisa junto a 150 trabalhadores apresentou salário médio igual a R$ 458,00. Construir um intervalo de
90% de confiança para o salário médio da categoria.

5) Uma viga, fabricada com determinada liga metálica, apresenta tensão de ruptura média igual a 45
kgf/mm2, com desvio padrão igual a 7 kgf/mm 2. Uma amostra de 40 unidades, tomada após uma
modificação no processo de fabricação, mostrou tensão de ruptura média igual a 46,8 kgf/mm 2.
Determinar um intervalo de 99% de confiança para a tensão de ruptura média da viga após a modificação.

6) Uma amostra de 45 garrafas de cerveja apresentou conteúdo médio igual a 355 ml, e desvio padrão
igual a 2 ml. Uma outra amostra, de 60 garrafas de cerveja de outra marca, apresentou conteúdo médio
igual a 356 ml, e desvio padrão de 3,5 ml. Determinar um intervalo de confiança de 95% para a diferença
das duas médias.

7) Uma pesquisa junto a 150 eleitores de uma região mostrou que 87 estão propensos a votar em um
determinado candidato a prefeito. Construir um intervalo de 95% de confiança para a proporção de votos
a favor do referido candidato.

8) Deseja-se estimar a renda média, em salários mínimos, das famílias de um certo bairro. Estima-se a
variância populacional em 2,5. Deseja-se 95% de confiança e admite-se uma diferença de  1 SM. Qual
deve ser o tamanho da amostra a ser coletada ?

9) Qual a diferença entre parâmetro e estimador ?

10) Quais a características de um estimador eficiente ?

11) Em uma região estão instaladas 250 madeireiras. Um estudo efetuado junto a 50 destas empresas
apontou faturamento médio mensal de R$ 87000,00 , com desvio padrão igual a R$ 6700,00. Determinar
um intervalo de 90% de confiança para o faturamento médio mensal das empresas instaladas nesta região.

12) Uma pesquisa junto a 200 eleitores de certa localidade mostrou que 85 pretendem votar no candidato
da situação, enquanto os demais preferem o candidato da oposição. Construir um intervalo de 95% de
confiança para a diferença das proporções de votos para ambos os candidatos. OBS: Considerar n 1 = n2 =
200.

13) Partindo dos resultados do exercício anterior, interpretar o termo “empate técnico”, ouvido com
freqüência em períodos de eleição. Representar individualmente os intervalos encontrados.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


14) Uma amostra de 100 moldes produzidos por um operário apresentou 4 não conformes. Uma segunda
amostra, de 70 moldes produzidos por outro operário apresentou 3 não conformes. Construir um intervalo
de 95% de confiança para a diferença das p.n.c.’s dos dois operários.

15) Um lote de bois foi submetido a uma dieta à base de milho e sais minerais. O ganho de peso
observado é mostrado no quadro a seguir. Determinar um intervalo de 95% de confiança para o peso
médio do rebanho. OBS: @ = arroba (15 kg)

Peso ( @ ) Animais
18 – 20 8
20 – 22 10
22 – 24 20
24 – 26 26
26 – 28 18
28 – 30 14
30 – 32 4

8 – Controle Estatístico de Processo (CEP)

8.01 – Conceitos

8.01.01 – Qualidade

O conceito de “qualidade” é extremamente subjetivo, variando de indivíduo para indivíduo.


Todavia, não há como negar que o termo está diretamente relacionado à satisfação do cliente, ou usuário,
de um produto, ou serviço. Uma das definições mais utilizadas na prática é dada a seguir:

“ Qualidade é a capacidade que um produto apresenta de superar as expectativas do cliente “

Em qualquer aplicação das técnicas estatísticas de controle da qualidade é imprescindível que se


defina, em primeiro lugar, quais são os parâmetros de qualidade. Uma vez que se tenha isto em mente, os
trabalhos subseqüentes deverão ter tal parâmetro como foco.

8.01.02 – Processo

O conceito mais frequëntemente adotado na prática é conhecido por 6 M’s , e envolve os


seguintes elementos:

1) Material
2) Mão de obra
3) Máquina
4) Meio ambiente
5) Método
6) Meio de medição

8.01.03 – Controle

É um conjunto de técnicas adotadas com objetivo de garantir que determinados padrões,


previamente estabelecidos, sejam alcançados.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


8.01.04 – Tolerância

É a maior diferença admitida entre um padrão estabelecido e um padrão alcançado. A tolerância


pode ser:

8.01.04.01 – Bilateral: Quando admite tanto uma diferença positiva como negativa. O diâmetro de um
eixo, por exemplo, pode ser especificado como 105 mm  0,3 mm. Neste caso admite-se que o diâmetro
varie de 104,7 mm até 105,3 mm.

8.01.04.02 – Unilateral: Quando admite a diferença em apenas um sentido. No eemplo citado acima, a
especificação poderia ser 105 mm + 0,3 mm. Neste caso qualquer unidade com diâmetro inferior a 105
mm seria rejeitada.

8.01.05 – Característico

É o termo usado para designar qualquer elemento que esteja sendo estudado na busca da
qualidade. Assim, p. ex., o diâmetro de um eixo e o conteúdo de uma lata de refrigerante podem ser
considerados característicos de qualidade.

8.01.06 – Variação

No controle estatístico de processo (CEP) as variações são classificadas como:

8.01.06.01 – Aleatórias: São as variações inerentes ao processo de fabricação. Este tipo de variação não
pode ser eliminado. Neste caso o que se pretende é a manutenção de tais variações dentro de certos
limites. Diz-se que um processo está “sob controle” quando as variações aleatórias estão dentro dos
limites acima referidos.

8.01.06.02 – Causais: São as variações estranhas ao processo. A eliminação de tais variações é o principal
objetivo do CEP.

8.01.07 – Técnicas

As principais técnicas usadas no CEP para estudo de problemas são:

8.01.07.01 – Princípio de Pareto9

Ao estudar a distribuição de renda em sua época, Pareto concluiu que a maior parte das riquezas
era controlada pela minoria da população, cabendo à maioria a menor parcela das riquezas. Este princípio
foi incorporado ao estudo da qualidade por J. M. Juran, que o sintetizou como “poucos vitais e muitos
triviais”, referindo-se à ocorrência de defeitos. O princípio consiste em elaborar uma distribuição de
freqüências para os problemas verificados, por exemplo, em um produto. Os problemas verificados são
distribuídos de acordo com a freqüência, sempre em ordem decrescente.

Exemplo 8.01:
Quadro 8.1 – Defeitos observados no produto X.
Defeito Freqüência Freqüência relativa (%)
Risco na pintura 25 29,76
Porta desregulada 18 21,43
Dobradiça solta 15 17,86
Mancal com folga 10 11,90
Embalagem violada 6 7,15
Outros 10 11,90

9
Vilfredo Pareto (1848 – 1923), economista italiano .

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


O histograma correspondente é mostrado na figura 8.1, a seguir.

Figura 8.1

Com os dados da distribuição de freqüências é elaborado o “Diagrama de Pareto”, a partir das


freqüências acumuladas crescentes, conforme é mostrado na figura 8.2.

Figura 8.2

8.01.07.02 – Diagrama Causa-Efeito

Também conhecido como “Gráfico Espinha de Peixe”, é usado sobretudo no exame das
possíveis causas para uma problema. Tem a forma mostrada na figura 8.3, a seguir.

Máquina Mão de obra Matéria prima

Efeito

Meio de medição Meio ambiente Método

Figura 8.3 – Diagrama de Causa – Efeito

Exemplo 8.02: Construir um diagrama causa – efeito para estudar o problema “risco na pintura”, do
exemplo anterior.

Máquina Mão de obra Matéria prima

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Baixa Sem treino Baixa conformidade
Potência
Obsoleta Frágil

Efeito

Desregulado Difícil Escuro Difícil


interpretação compreensão

Meio de medição Meio ambiente Método

Figura 8.4 – Diagrama de Causa – Efeito

8.01.07.03 – Gráfico de Controle

Também chamado “carta de controle”, é formado por três linhas paralelas ao eixo das abscissas.
A intermediária é chamada “linha média” (LM). As outras duas são chamadas “limites de controle”. A
região compreendida entre os limites de controle é chamada “zona de controle”. As regiões abaixo do
limite inferior de controle (LIC) e acima do limite superior de controle (LSC) são denominadas “zonas de
ação”. Quando usados de forma adequada os gráficos de controle proporcionam benefícios como:
1) Auxiliar os operadores a atingir e manter o controle de um processo.
2) Proporcionar um linguagem comum para acompanhar a performance do processo.
3) Ajudar a tornar o processo mais consistente e previsível.

A forma geral de um gráfico de controle é mostrada na figura 8.5, a seguir.

Medidas

LSC

Zona de controle
LM

Zona de controle
LIC

Amostras
Figura 8.5 – Gráfico de Controle

Diz-se que um processo está “sob controle” quando nenhum ponto correspondente a uma medida
está fora da zona de controle.

8.02 – Gráfico de Controle por Variável

Este tipo de gráfico é amplamente utilizado quando se pretende avaliar grandezas mensuráveis,
como diâmetro, peso e comprimento, por exemplo. Os gráficos de variáveis podem ser considerados
como a mais típica das aplicações do CEP, e um dos seus principais atributos é a precisão das
informações fornecidas, uma vez que uma resposta do tipos “o diâmetro do rolamento é 23,5 mm” pode
ser muito mais útil que uma resposta como “o rolamento está fora das especificações”. Os principais
gráficos de controle por variável são apresentados a seguir.

8.02.01 – Gráfico da Média e da Amplitude ( )

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


É utilizado para representar os valores resultantes de medições, que devem ser efetuadas
periodicamente (p. ex. de hora em hora, a cada vinte minutos, etc). As etapas para elaboração são dadas a
seguir.

1) Determinar a quantidade ( k ) de amostras.


2) Determinar o tamanho ( n ) das amostras.
3) Para cada amostra calcular a média aritmética:

(8.01)

4) Para cada amostra calcular a amplitude:


(8.02)

5) Calcular a média das médias: (8.03)

6) Calcular a média das amplitudes: (8.04)

7) Calcular os limites de controle para o gráfico da média:

Limite Superior de Controle: (8.05)


Linha Média: (8.06)
Limite Inferior de Controle: (8.07)

8) Calcular os limites de controle para o gráfico da amplitude:

Limite Superior de Controle: (8.08)


Linha Média: (8.09)
Limite Inferior de Controle: (8.10)

As constantes A2 , D3 e D4 são dadas no quadro 8.2, a seguir:

n 2 3 4 5 6 7 8 9 10
D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78
D3 - - - - - 0,08 0,14 0,18 0,22
D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08
A2 1,88 1,02 0,73 0,58 0,48 0,42 0,37 0,34 0,31
Quadro 8.2 – Constantes Multiplicativas para o Gráfico

Para amostras com menos de sete unidades considera-se que não há limite inferior para o gráfico
da amplitude.

Exemplo 8.03: A seguir são mostrados os valores observados para um determinado característico de
qualidade. Por comodidade foram anotados apenas os valores decimais, isto é, se o valor observado foi
100,92 mm, anotou-se apenas “92”. Esta é uma prática bastante comum, e não compromete os resultados
finais. No total foram observadas 25 amostras, cada uma com cinco elementos. O objetivo é construir o
gráfico .

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Amostra X1 X2 X3 X4 X5 R
1 92 91 93 94 95 93 4
2 91 92 91 93 92
3 96 91 92 92 92
4 93 93 92 92 92
5 92 93 92 93 91
6 94 93 93 94 91
7 94 92 93 92 92
8 92 95 91 95 92
9 95 94 91 94 93
10 95 94 94 92 91
11 93 92 94 91 91
12 94 92 95 92 94
13 93 91 94 93 93
14 92 93 93 92 94
15 93 94 92 92 93
16 92 94 93 91 93
17 92 93 91 92 93
18 91 92 92 93 95
19 90 90 90 92 92
20 92 91 91 91 92
21 93 92 92 93 91
22 94 93 94 94 93
23 95 93 93 92 94
24 93 91 94 92 92
25 91 92 94 93 93

Quantidade de amostras: k = Tamanho das amostras: n=

Média das médias: Amplitude média:

A2 = D3 = D4 =

Limites de controle para o gráfico da média:

Limites de controle para o gráfico da amplitude:

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


8.02.01.01 – Interpretação do Gráfico

1) Pontos além dos limites de controle: A ocorrência de um ponto além dos limites de controle é
uma evidência de que o processo esteve fora de controle naquele ponto. Considerando que
pontos nesta situação devem ocorrer raramente, presume-se que houve uma variação causal.
Neste caso deve-se isolar a amostra correspondente a fim de investigar as possíveis causas.

Um ponto acima do limite superior de controle indica uma, ou mais, das causas a seguir:
 O limite superior de controle foi calculado, ou traçado, incorretamente.
 O ponto foi plotado incorretamente.
 A dispersão sofreu um acréscimo naquele ponto. Isto pode eventualmente indicar uma tendência.
 O meio de medição pode ter sido alterado.
 O meio de medição sofreu alterações na sua precisão.

Um ponto abaixo do limite inferior de controle indica uma, ou mais, das causas a seguir:
 O limite inferior de controle foi calculado, ou traçado, incorretamente.
 O ponto foi plotado incorretamente.
 A dispersão sofreu um decréscimo naquele ponto. Isto pode eventualmente indicar uma
tendência de melhoria no processo.
 O meio de medição pode ter sido alterado.
 O meio de medição sofreu alterações na sua precisão.

2) Padrões ou tendências entre os limites de controle: A ocorrência de padrões incomuns, com as


amplitudes sob controle, pode indicar uma alteração na dispersão do processo, ocorrida no
período de observação dos dados correspondentes.

3) Muitos pontos de um mesmo lado da linha média: Esta ocorrência pode indicar uma grande
dispersão, resultante de uma variação causal. Esta variação pode ter sido provocada por um
problema na máquina, p. ex.

4) Uma seqüência crescente de três pontos acima da linha média, ou uma seqüência decrescente de
três pontos abaixo da mesma. Neste caso o processo deve ser interrompido, pois há uma
tendência de que o mesmo fique fora de controle.

8.02.01.02 – Estimação do Desvio Padrão do Processo

A variabilidade dentro de cada amostra é representada pela amplitude da mesma. Desta forma a
estimação do desvio padrão pode se basear na amplitude média . Desta forma

(8.11)

onde o valor de D2 é dado no quadro 8.2.

Exemplo 8.04: Estimar o desvio padrão para o processo do exemplo 8.03.

8.02.01.03 – Capabilidade do Processo ( Cpk )

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


A capabilidade de um processo envolve a distância entre a média do mesmo e as especificações
para o característico avaliado. As especificações mencionadas também são denominadas “limites de
engenharia” ou “limites de especificação”. A referida distância é expressa em termos de escores
reduzidos. Há duas situações a considerar, ambas relativas à tolerância.

 Tolerância Bilateral

Deve-se calcular os escores reduzidos relativos aos limites de engenharia, tomando como parâmetros
a média ( ) e o desvio padrão do mesmo. Então

(8.12)

(8.13)
Onde LIE = Limite Inferior de Especificação
LSE = Limite Superior de Especificação

Deve-se considerar em seguida o menor valor entre os dois calculados acima, isto é

(8.14)
 Tolerância Unilateral

Neste caso há apenas um escore reduzido a ser calculado. Utiliza-se a fórmula apropriada entre as
duas acima, (8.12) e (8.13). Desta forma

ou

O índice Cpk , em ambas as situações, é dado por (8.15)

Os escores reduzidos calculados em (8.12) e (8.13) fornecem a proporção de não conformidade do


processo. Esta proporção é calculada com base nos valores da distribuição normal padronizada, estando
representada na figura 8.6, a seguir.

ZLIE ZLSE

Abaixo do LIE Acima do LSE

Figura 8.6

8.02.01.03.01 – Interpretação da Capabilidade

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Um processo pode ser classificado de acordo com o valor obtido para o índice C pk, conforme o
quadro a seguir:

Valor de Cpk Classificação


Cpk < 1,00 Processo inadequado. Controle e inspeção de 100%
1,00 < Cpk < 1,33 Adequado. Controle e inspeção por amostragem necessários
1,33 < Cpk Controle e inspeção desnecessários
Quadro 8.6 – Classificação de Processo com Base no Índice Cpk

Exemplo 8.05: Calcular o índice de capabilidade para o processo do exemplo 8.03, considerando
tolerância bilateral, sendo os limites inferior e superior de especificação iguais a 91,90 mm e 93,20 mm ,
respectivamente.

Exercício 8.01: No próximo quadro são mostrados os conteúdos observados em 20 amostras de latas de
óleo de soja. Por comodidade não foram anotados os valores correspondentes à centena, isto é, se o valor
observado foi “989,92 ml”, anotou-se apenas “89,92”.

a) Calcular os limites para o gráfico da média (“x barra”).


b) Idem para o gráfico da amplitude.
c) Traçar o gráfico, usando a carta dada nas próximas páginas.
d) Supondo que a tolerância do processo é de  1,5 ml, calcular o índice de capabilidade

Amostra X1 X2 X3 X4 X5 R
1 90,92 89,91 89,98 90,94 90,95
2 90,99 89,99 89,91 90,93 90,92
3 91,06 90,91 91,52 91,92 90,97
4 90,93 90,95 91,02 90,52 90,00
5 90,05 89,93 89,92 90,15 90,21
6 89,04 89,93 90,03 90,94 91,91
7 88,94 90,92 90,35 90,02 90,00
8 90,92 90,90 90,10 89,95 88,98
9 90,95 91,40 90,90 90,44 90,00
10 94,95 91,94 92,95 91,92 91,91
11 90,00 90,42 90,24 90,91 90,45
12 90,04 90,02 90,05 90,12 90,15
13 91,03 90,91 90,94 89,98 90,93
14 98,92 90,03 90,15 90,25 90,14
15 98,93 98,94 98,92 90,02 90,03
16 90,02 90,04 90,03 90,01 90,15
17 91,12 90,43 90,01 90,12 89,93
18 90,41 91,02 90,99 90,93 89,95
19 90,90 90,90 90,80 90,92 91,02
20 91,05 91,41 91,91 90,91 89,92

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


8.02.02 – Gráfico da Média e do Desvio Padrão ( )

No gráfico a amplitude é usada para avaliar a variabilidade do processo. A principal


vantagem desta prática reside na facilidade para obter o valor em questão. Esta vantagem é ainda maior
quando as amostras não são grandes, geralmente com menos de 10 elementos cada uma. Contudo, a
medida de dispersão mais precisa é o desvio padrão, embora o seu cálculo seja mais complexo. De
qualquer forma é aconselhável utilizar o desvio padrão como medida de dispersão, principalmente quando
se verifica pelo menos uma das condições a seguir:
 Amostras com tamanho igual ou superior a 10 (dez).
 Dados tratados computacionalmente.
 O funcionário responsável pelas observações dispõe de pelo menos uma calculadora científica.
As etapas para construção do gráfico são listadas a seguir.
1) Determinar a quantidade ( k ) de amostras.
2) Determinar o tamanho ( n ) das amostras.

3) Para cada amostra calcular a média aritmética:

(8.01)

4) Para cada amostra calcular o desvio padrão: (8.16)

5) Calcular a média das médias: (8.03)

6) Calcular a média dos desvios padrões: (8.17)

7) Calcular os limites de controle para o gráfico da média:


Limite Superior de Controle: (8.18)
Linha Média: (8.06)
Limite Inferior de Controle: (8.19)

8) Calcular os limites de controle para o gráfico do desvio padrão:

Limite Superior de Controle: (8.20)


Linha Média: (8.21)
Limite Inferior de Controle: (8.22)

As constantes A3 , B3 e B4 são dadas no quadro 8.3, a seguir:

8.02.02.01 – Estimação do Desvio Padrão do Processo

Aqui o desvio padrão é estimado por (8.23)

onde o valor de C4 é dado no quadro 8.3.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


n 2 3 4 5 6 7 8 9 10
B4 3,27 2,57 2,27 2,09 1,97 1,88 1,82 1,76 1,72
B3 - - - - 0,03 0,12 0,19 0,24 0,28
C4 0,798 0,886 0,921 0,940 0,952 0,959 0,965 0,969 0,973
A3 2,66 1,95 1,63 1,43 1,29 1,18 1,10 1,03 0,98
Quadro 8.3 – Constantes Multiplicativas para o Gráfico

8.02.02.02 – Capabilidade do Processo ( Cpk )

É estimada como apresentado em 8.02.01.03, apenas utilizando-se como estimador da


variabilidade o valor calculado em (8.23).
Exercício 8.02: Construir o gráfico para o processo do exercício 8.01.

Amostra X1 X2 X3 X4 X5 s
1 92 91 93 94 95 93
2 91 92 91 93 92
3 96 91 92 92 92
4 93 93 92 92 92
5 92 93 92 93 91
6 94 93 93 94 91
7 94 92 93 92 92
8 92 95 91 95 92
9 95 94 91 94 93
10 95 94 94 92 91
11 93 92 94 91 91
12 94 92 95 92 94
13 93 91 94 93 93
14 92 93 93 92 94
15 93 94 92 92 93
16 92 94 93 91 93
17 92 93 91 92 93
18 91 92 92 93 95
19 90 90 90 92 92
20 92 91 91 91 92
21 93 92 92 93 91
22 94 93 94 94 93
23 95 93 93 92 94
24 93 91 94 92 92
25 91 92 94 93 93

Quantidade de amostras: k = Tamanho das amostras: n =


Média das médias: Desvio padrão médio:
A2 = D3 = D4 =
Limites de controle para o gráfico da média: Limites de controle para o gráfico da amplitude:

8.02.03 – Gráfico da Mediana e da Amplitude ( )

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


O gráfico da mediana é uma alternativa ao gráfico da média, muito embora a mediana possa não
ser um estimador tão eficiente quanto a média. Apesar deste fato, o gráfico da mediana apresenta
conclusões semelhantes ao gráfico da média, não esquecendo o fato de que o cálculo da mediana é mais
fácil que o da média. As etapas para construção do gráfico da mediana são dadas a seguir:

1) Determinar a quantidade ( k ) de amostras.


2) Determinar o tamanho ( n ) das amostras.
3) Para cada amostra calcular a mediana. Os valores devem ser anotados, preferencialmente, em
ordem crescente. Neste caso, se a amostra tem tamanho ímpar, a mediana é o valor central. Se
tem tamanho par, a mediana é a média dos dois valores centrais, conforme já estudado em 1.02.

Normalmente os dados não são observados em ordem crescente. Para evitar o trabalho adicional de
ordená-los, basta que sejam representados (plotados) diretamente no gráfico. Desta forma o valor
mediano é facilmente identificável.

4) Para cada amostra calcular a amplitude: (8.02)

5) Calcular a média das medianas: (8.24)

6) Calcular a média das amplitudes: (8.04)

7) Calcular os limites de controle para o gráfico da mediana:

Limite Superior de Controle: (8.25)


Linha Média: (8.26)
Limite Inferior de Controle: (8.27)

8) Calcular os limites de controle para o gráfico da amplitude:

Limite Superior de Controle: (8.28)


Linha Média: (8.29)
Limite Inferior de Controle: (8.30)

As constantes Ã2 , D3 e D4 são dadas no quadro 8.4, a seguir:

n 2 3 4 5 6 7 8 9 10
D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78
D3 - - - - - 0,08 0,14 0,18 0,22
D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08
Ã2 1,88 1,19 0,80 0,69 0,55 0,51 0,43 0,41 0,36
Quadro 8.4 – Constantes Multiplicativas para o Gráfico

Para amostras com menos de sete unidades considera-se que não há limite inferior para o gráfico
da amplitude.

8.02.03.01 – Estimação do Desvio Padrão do Processo

Aqui o desvio padrão é estimado por (8.11)

onde o valor de C4 é dado no quadro 8.3.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


8.02.03.02 – Capabilidade do Processo ( Cpk )

É estimada como apresentado em 8.02.01.03, apenas utilizando-se como estimador da


variabilidade o valor calculado em (8.11).

Exercício 8.04: Construir o gráfico para o processo do exercício 8.01.

Amostra X1 X2 X3 X4 X5 s
1 92 91 93 94 95 93
2 91 92 91 93 92
3 96 91 92 92 92
4 93 93 92 92 92
5 92 93 92 93 91
6 94 93 93 94 91
7 94 92 93 92 92
8 92 95 91 95 92
9 95 94 91 94 93
10 95 94 94 92 91
11 93 92 94 91 91
12 94 92 95 92 94
13 93 91 94 93 93
14 92 93 93 92 94
15 93 94 92 92 93
16 92 94 93 91 93
17 92 93 91 92 93
18 91 92 92 93 95
19 90 90 90 92 92
20 92 91 91 91 92
21 93 92 92 93 91
22 94 93 94 94 93
23 95 93 93 92 94
24 93 91 94 92 92
25 91 92 94 93 93

Quantidade de amostras: k = Tamanho das amostras: n =


Média das medianas: Amplitude média:
A2 = D3 = D4 =
Limites de controle para o gráfico da mediana: Limites de controle para o gráfico da amplitude:

Exercício 8.05: Fazer a análise de capabilidade para o processo do exercício anterior.

8.02.04 – Gráfico da Amplitude Móvel ( X – MR )

Alguns processos podem ter seu controle baseado em observações individuais. Isto ocorre, p. ex.,
no controle do pH de produtos químicos armazenados em tanques; neste caso não há necessidade de se
coletar mais de uma observação por tanque. O mesmo se aplica a ensaios destrutivos, já que o alto custo
representado por certos tipos de ensaios pode inviabilizar os trabalhos. Uma outra situação na qual se
recomenda o uso deste tipo de gráfico é na produção de pequenas quantidades, quando não há
observações suficientes para se formar uma amostra.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


O gráfico X – MR pode ser utilizado nas situações acima, desde que sejam observados os
seguintes fatos:
 Observações individuais não têm a mesma eficiência que observações amostrais.
 Deve-se ter cuidado com as conclusões, principalmente se a distribuição de freqüências do
processo não for normal (simétrica).
 Como as observações são individuais, a média do processo e o seu desvio padrão podem
apresentar grande variabilidade.

As etapas para construção do gráfico são dadas a seguir.


1) Determinar a quantidade k de observações
2) A partir da segunda observação, determinar a diferença (amplitude) entre cada observação e a
observação anterior. Não levar em consideração o sinal.

, j = 2 , 3 , ... , k

3) Calcular a amplitude média (8.31)

4) Calcular a média do processo

5) Calcular os limites de controle para as observações individuais:

Limite Superior de Controle (8.32)


Linha Média (8.33)
Limite Inferior de Controle (8.34)

6) Calcular os limites de controle para o gráfico da amplitude

Limite Superior de Controle: (8.28)


Linha Média: (8.29)
Limite Inferior de Controle: (8.30)

As constantes E2 , D3 e D4 são dadas no quadro 8.5, a seguir:

n 2 3 4 5 6 7 8 9 10
D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78
D3 - - - - - 0,08 0,14 0,18 0,22
D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08
E2 2,66 1,77 1,46 1,29 1,18 1,11 1,05 1,01 0,98

Quadro 8.5 – Constantes Multiplicativas para o Gráfico X – MR

8.02.04.01 – Capabilidade ( Cpk )

A estimação da capabilidade segue os mesmos procedimentos adotados no gráfico .

Exercício 8.06: O quadro a seguir mostra as observações efetuadas para um processo industrial qualquer.
Os dados referem-se à concentração, em p.p.m., de uma certa substância. Construir o gráfico X – MR.

Obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Xi 10 15 13 10 15 16 18 14 10 12 8 10 9 12 13 10 11 9 8 10
Rj - 5 2 3 5 1 2 4

8.03 – Gráficos de Controle por Atributo

Embora sejam extremamente confiáveis como ferramentas de apoio à decisão, os gráficos de


controle por variável apresentam alguns inconvenientes de ordem prática, alguns dos quais listados a
seguir:

 Cada gráfico, ou carta, pode ser usado para apenas uma variável. Supondo que um produto tenha
cinco característicos a serem controlados. Neste caso serão necessários cinco gráficos.
 Em algumas etapas da produção o interesse resume-se à simples verificação de conformidade em
relação a algum parâmetro. Uma situação típica deste caso é a inspeção efetuada com o objetivo
de verificar se o diâmetro de um eixo está dentro dos limites de tolerância. Aqui não há interesse
em determinar o diâmetro, o que dispensa a coleta de amostra e os cálculos das medidas já
estudadas.
 Alguns componentes são inspecionados apenas com o objetivo de verificar a presença de algum
defeito. Nas indústrias automobilísticas as partes da carroceria de um veículo são inspecionadas
com a finalidade de verificar se apresentam riscos. A simples ocorrência de um risco na pintura é
suficiente para que a peça seja rejeitada, não importando a dimensão ou a quantidade de riscos.

O controle por atributo trabalha apenas com os conceitos “passa – não passa”, “presente –
ausente” e “conforme – não conforme”, entre outros referidos acima. É de grande utilidade nos trabalhos
de inspeção final, e também em setores industriais, como na indústria eletrônica, p. ex.

A estrutura de um gráfico de controle por atributo é igual à do gráfico de controle por variável,
isto é, possui dois limites de controle, que definem a zona de controle, e uma linha média, definida com
base na proporção de ocorrências do atributo.

Antes de se adotar o controle por atributo deve-se tomar alguns cuidados, entre os quais
destacam-se:

 Inspecionar cada unidade, de cada uma das amostras selecionadas.


 Criar um ambiente favorável, do ponto de vista do gerenciamento. Algumas empresas delegam a
elaboração de gráficos de controle por variável aos próprios operários responsáveis pela
fabricação dos componentes avaliados. Para o controle por atributo esta prática é um tanto
temerária, pois normalmente o item inspecionado é proveniente de um processo ao qual são
aplicadas técnicas de CEP. Neste caso o controle por atributo pode ser usado mais como
ferramenta de apoio à decisão, já que na inspeção de vários atributos pode-se detectar falhas não
identificadas anteriormente.
 Levar em consideração as necessidades do cliente/usuário ao definir os critérios de decisão.

Os gráficos de controle por atributo mais usados são dados a seguir.

8.03.01 – Gráfico da Proporção de Unidades Não Conformes ( p )

O gráfico p mostra a proporção de não conformidade, ou de itens não conformes, em um grupo


de amostras inspecionadas. Este gráfico pode apresentar tanto as variações para um atributo como para
vários deles. As etapas para elaboração são dadas a seguir.

1) O tamanho ( n ) das k amostras não precisa ser igual. Pode-se coletar amostras de tamanhos
diferentes. Este tipo de gráfico normalmente requer amostras grandes, geralmente de tamanho
não inferior a 50. Este detalhe pode se tornar uma desvantagem, pois em alguns setores

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


industriais, ou mesmo de serviços, a observação de uma amostra deste tamanho pode demandar
um período de tempo muito grande, o que acabaria por impedir a detecção de padrões que
podem evidenciar uma variação causal.

2) Para cada uma das k amostras, calcular a fração defeituosa, ou proporção de não conformidade,
que se obtém dividindo o número de itens defeituosos ( dj ) da amostra pelo tamanho ( nj ) da
mesma.

(8.31)

3) Calcular a fração defeituosa média, ou proporção média de não conformidade.

(8.32)

4) Se as amostras têm tamanhos diferentes, calcular o tamanho médio das amostras:

(8.33)

5) Calcular o desvio padrão do processo:

(8.34)

6) Calcular os limites de controle:

Limite Superior de Controle: (8.35)

Linha Média: (8.36)

Limite Inferior de Controle: (8.37)

Exercício 8.07: O quadro a seguir mostra o resultado das observações sobre 20 amostras formadas por um
determinado produto.

Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Tamanho 50 40 50 60 50 50 30 40 40 30 60 20 40 50 50 40 20 30 50 50
Defeituosos 3 2 2 3 3 2 1 1 2 0 3 3 1 0 2 3 2 1 4 0
pj

Construir o gráfico de controle da fração defeituosa (use o gráfico em branco da próxima página). Utilize
duas casas decimais.

Linha Média: Desvio padrão:

Limite Superior de Controle: Limite Inferior de Controle:

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


8.03.02 – Gráfico do Número de Unidades Não Conformes ( np )

Também conhecido como Gráfico do Número de Defeituosos, pode ser usado como alternativa
ao gráfico da fração defeituosa (8.03.01), apresentando as mesmas vantagens já mencionadas. Neste caso
as amostras devem ter todas o mesmo tamanho, ao contrário do gráfico anterior, que permite a observação
de amostras de diferentes tamanhos. As etapas para construção do gráfico np são dadas a seguir.

1) Selecionar k amostras, de tamanho n.

2) Calcular o número médio de unidades não conformes do processo:

(8.38)

3) Calcular o desvio padrão do processo:


(8.39)
4) Calcular os limites de controle:

Limite Superior de Controle: (8.40)


Linha Média: (8.41)
Limite Inferior de Controle: (8.42)

Exercício 8.08: Construir o gráfico do número de unidades não conformes para os dados a seguir. Os
valores apresentados referem-se à observação de 20 amostras, de tamanho 50, de um certo produto.

Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
n 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50
Defeituosos 2 3 1 0 3 4 0 0 2 2 3 5 4 2 3 3 0 1 3 4
p

8.03.03 – Gráfico do Número de Não Conformidades ( c )

Este gráfico é utilizado para avaliar o número de não conformidades, ou defeitos, em uma
amostra. A utilização deste gráfico requer tamanho constante para as amostras observadas. Algumas
aplicações são, p. ex., controle de bolhas em garrafas e riscos em peças estampadas.A principal diferença
com relação ao gráfico p, é que este último se utiliza da contagem de unidades defeituosas, não se
preocupando com a quantidade de defeitos. Uma idéia desta diferença é dada pela figura 8.7, a seguir.
Considerando cada quadro como uma unidade, e cada ponto em destaque como um defeito, nota-se que
há na amostra da esquerda quatro unidades defeituosas, e um total de sete defeitos. Na amostra da direita
há duas unidades defeituosas, e o mesmo número de defeitos da primeira.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Figura 8.7

As etapas para construção do gráfico c são dadas a seguir.


1) Selecionar k amostras com o mesmo tamanho, e determinar o número de defeitos, c , para cada
amostra.
2) Calcular o número médio de não conformidades, ou defeitos.

(8.43)

3) Calcular os limites de controle.

Limite Superior de Controle: (8.44)


Linha Média: (8.45)
Limite Inferior de Controle: (8.46)

Exercício 8.09: Os dados a seguir referem-se à observação de 20 amostras, cada uma com 10 camisas. A
cada amostra observada anotou-se o número de defeitos verificados (c). Construir um gráfico c para os
dados.

Amostra ( j ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
cj 3 2 5 4 2 0 3 4 5 1 1 2 0 3 4 3 2 2 0 3

8.03.04 – Gráfico do Número de Não Conformidades por Unidade ( u )

Este gráfico mede o número de não conformidades, ou defeitos, por unidade. Pode ser uma
alternativa ao gráfico c, quando as amostras não têm o mesmo tamanho. Também pode ser usado quando
a amostra é constituída de apenas uma unidade, mas que possui muitos componentes que devem ser
inspecionados, como um motor, p. ex.,.
As etapas para construção do gráfico u são dadas a seguir.
1) Selecionar k amostras, que podem ter tamanhos diferentes, e registrar o número de defeitos ( c )
encontrados em cada uma.
2) Para cada uma das k amostras, determinar o número de defeitos por unidade.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


(8.47)

onde cj é o número de defeitos encontrados na j – ésima amostra.

3) Calcular o número médio de defeitos por unidade:

(8.48)

4) Calcular o tamanho médio das amostras:

(8.49)

5) Calcular os limites de controle.

Limite Superior de Controle: (8.50)

Linha Média: (8.51)

Limite Inferior de Controle: (8.52)

Exercício 8.10: Os dados a seguir referem-se à observação de 15 amostras de um certo produto. A cada
amostra observada anotou-se o número de defeitos verificados. Construir um gráfico u para os dados.

Amostra ( j ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
nj 30 25 50 20 20 10 25 30 40 40 50 20 30 30 20
cj 3 2 5 4 2 0 3 4 5 1 1 2 0 3 4
uj

8.05 – Interpretação do Índice Cpk

Um processo pode ser classificado de acordo com o valor obtido para o índice C pk, conforme o
quadro a seguir:

Valor de Cpk Classificação


Cpk < 1,00 Processo inadequado. Controle e inspeção de 100%
1,00 < Cpk < 1,33 Adequado. Controle e inspeção por amostragem necessários
1,33 < Cpk Controle e inspeção desnecessários
Quadro 8.6 – Classificação de Processo com Base no Índice Cpk

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


8.06 – Capacidade de Processo

Embora a principal meta do CEP seja alcançar e manter um processo sob controle, esta condição
nem sempre é a mais satisfatória. Um processo, mesmo sob controle, pode não ser capaz de atender às
especificações do cliente. Para classificar um processo com relação à esta capacidade basta comparar os
limites de controle do mesmo com os limites de especificação, ou de engenharia, do cliente. A
comparação pode ser feita diretamente sobre o gráfico, ou carta, do processo, conforme mostrado nas
figuras a seguir. Nas figuras, os limites de controle são representados por linhas cheias e os limites de
especificação por linhas tracejadas .

Figura 8.8 – Processo Capaz Sob Controle

Figura 8.9 – Processo Capaz Fora de Controle

Figura 8.10 – Processo Incapaz Sob Controle

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Figura 8.11 - Processo Incapaz Fora de Controle

n 2 3 4 5 6 7 8 9 10
D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78
D3 - - - - - 0,08 0,14 0,18 0,22
D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08
A2 1,88 1,02 0,73 0,58 0,48 0,42 0,37 0,34 0,31
Quadro 8.2 – Constantes Multiplicativas para o Gráfico

n 2 3 4 5 6 7 8 9 10
B4 3,27 2,57 2,27 2,09 1,97 1,88 1,82 1,76 1,72
B3 - - - - 0,03 0,12 0,19 0,24 0,28
C4 0,798 0,886 0,921 0,940 0,952 0,959 0,965 0,969 0,973
A3 2,66 1,95 1,63 1,43 1,29 1,18 1,10 1,03 0,98
Quadro 8.3 – Constantes Multiplicativas para o Gráfico

n 2 3 4 5 6 7 8 9 10
D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78
D3 - - - - - 0,08 0,14 0,18 0,22
D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08
Ã2 1,88 1,19 0,80 0,69 0,55 0,51 0,43 0,41 0,36
Quadro 8.4 – Constantes Multiplicativas para o Gráfico

n 2 3 4 5 6 7 8 9 10
D4 3,27 2,57 2,28 2,11 2,00 1,92 1,86 1,82 1,78
D3 - - - - - 0,08 0,14 0,18 0,22
D2 1,13 1,69 2,06 2,33 2,53 2,70 2,85 2,97 3,08
E2 2,66 1,77 1,46 1,29 1,18 1,11 1,05 1,01 0,98

Quadro 8.5 – Constantes Multiplicativas para o Gráfico X – MR

8.07 – Exercícios

1) Da produção de uma máquina foram extraídas 20 amostras, cada uma com 50 unidades de um
componente. As unidades foram inspecionadas para a verificação da ocorrência de um certo
defeito. Calcular os limites de controle e construir o gráfico de controle .

Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Defeituosos 2 3 0 2 0 5 1 0 0 3 2 0 5 4 1 2 3 0 2 3

2) Um gráfico tem os seguintes valores: = 135 , = 2,5. Foram inspecionadas 25


amostras, com cinco unidades cada uma. As especificações do cliente são: LSE = 136,5 e LIE
= 133. Calcular o índice de capabilidade, Cpk.

3) Uma indústria química produz um certo tipo de solvente. Uma inspeção em 15 tonéis do produto
apresentou os valores dados no quadro abaixo, referentes à concentração de sal, em p.p.m.
Construir o gráfico de controle mais apropriado.

DOCENTE: FRANCISCO AUGUSTO DE FREITAS


Tonel 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
p.p.m. 15 20 16 18 22 14 17 13 22 15 19 25 20 18 14

4) Em uma confecção foram inspecionadas 15 amostras, cada uma com 20 calças. Registrou-se o
número de defeitos em cada amostra. Calcular os limites de controle e construir o gráfico.

Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Defeitos 6 4 8 4 5 4 2 8 4 3 4 4 2 6 4

5) Os gráficos de controle por variável devem ser construídos para processos normalizados, isto é,
quando a curva de freqüências é normal. O quadro a seguir mostra o resultado da inspeção em 20
amostras, cada uma com cinco unidades, de tubos de PVC. O característico avaliado é o
diâmetro.

a) Construir uma distribuição de freqüências para os valores observados. (Use amplitude


de classe igual a 0,2 mm para as oito classes).
b) Calcular a média, a mediana e a moda.
c) Verificar se o processo está normalizado.
d) Calcular os limites de controle para um gráfico .
e) Calcular o índice de capabilidade, supondo que as especificações do cliente são: LIE =
24,0 mm e LSE = 25,5 mm.
f) Classificar o processo quanto à sua capacidade.

Amostra X1 X2 X3 X4 X5 Média Amplitude


1 24,0 24,1 24,0 24,2 24,3
2 24,8 24,8 24,9 24,9 24,8
3 24,5 24,4 24,4 24,5 24,4
4 25,3 25,4 25,5 25,5 24,3
5 24,6 24,7 24,7 24,7 24,6
6 25,3 25,5 25,4 25,5 24,3
7 24,8 24,8 24,9 24,8 24,4
8 24,8 24,8 24,8 24,9 24,3
9 25,0 24,5 24,5 24,5 24,4
10 24,8 24,8 24,1 24,0 24,2
11 25,0 25,0 25,1 25,1 24,5
12 25,2 25,3 25,2 25,2 24,5
13 24,7 24,2 24,6 24,0 24,3
14 25,2 25,3 25,3 25,3 24,4
15 25,0 25,0 25,1 25,0 24,5
16 24,6 24,7 24,7 24,2 24,3
17 24,6 24,7 24,6 24,6 24,7
18 24,8 24,9 24,8 24,9 24,9
19 24,6 24,7 24,6 24,6 24,6
20 25,0 25,0 25,1 25,1 25,0

DOCENTE: FRANCISCO AUGUSTO DE FREITAS

Você também pode gostar