Você está na página 1de 184

1

Apostila

Probabilidade e Estatística
Para Engenharia e Arquitetura

Professor: Ms Cledinaldo Castro Araújo

2019.1 - Versão 7
2

“A normalidade é tão somente uma questão de estatística.”


Autor: Aldous Huxley
3

Sumário
1. Conceitos Básicos ............................................................................................................ 08

1.1 Divisão da Estatística ............................................................................................................... 08

1.2 Conceitos Fundamentais da Estatística .................................................................................... 08

1.3 Fases do Método Estatístico .................................................................................................... 10

2. Estudo dos Dados Estatísticos ................................................................................................. 11

2.1 Séries Estatísticas ...................................................................................................................... 11

2.2 Apresentação Tabular e Gráfica ................................................................................................ 12

2.2.1 Apresentação Tabular ......................................................................................................... 12

2.2.2 Apresentação Gráfica ............................................................................................................ 14

3. Distribuições de Frequências ................................................................................................... 21

3.1 Distribuições de Frequências para Dados Discretos ................................................................... 22

3.2 Distribuições de Frequências para Dados Contínuos ................................................................. 23

4. Medidas de Posição ................................................................................................................ 26

4.1 Pequenos Conjuntos de Dados .................................................................................................. 26

4.2 Grandes Conjuntos de Dados: Discretos .................................................................................... 29

4.3 Grandes Conjuntos de Dados: Contínuos .................................................................................. 30

4.4 Medidas Separatrizes ............................................................................................................. 33

4.4.1 O Box Plot ............................................................................................................................. 39

4.5 Interpolação Linear .................................................................................................................. 41

4.6 Outras Medidas de Posição ...................................................................................................... 43

5. Medidas de Dispersão ............................................................................................................. 46

5.1 Pequenos Conjuntos de Dados ................................................................................................ 46


4

5.2 Grandes Conjuntos de Dados: Discretos .................................................................................. 51

5.3 Grandes Conjuntos de Dados: Contínuos ................................................................................. 53

6. Medidas de Assimetria e Curtose ...................................................................................... 56

6.1 Medidas de Assimetria ...................................................................................................... 56

6.2 Medidas de Curtose ......................................................................................................... 57

7. Probabilidade .................................................................................................................. 59

7.1 Conceitos Iniciais ..................................................................................................................... 59

7.2 Operações com Eventos Aleatórios .......................................................................................... 60

7.3 Medida de Probabilidade ......................................................................................................... 63

7.4 Teorema da Soma .................................................................................................................... 64

7.5 Eventos Dependentes .............................................................................................................. 65

7.5.1 Probabilidade Condicional ..................................................................................................... 66

7.5.2 Teorema do Produto ou Regra do Produto ............................................................................ 66

7.6 Eventos Independentes ............................................................................................................ 67

7.6.1 Teorema do Produto ou Regra do Produto ......................................................................... 68

7.7 Regra de Bayes ...................................................................................................................... 69

8. Variáveis Aleatórias Unidimensionais ...................................................................................... 73

8.1 Classificação das Variáveis Aleatórias ...................................................................................... 73

8.1.1 Variáveis Aleatórias Discretas ............................................................................................... 73

8.1.2 Variáveis Aleatórias Contínuas.............................................................................................. 76

8.2 Propriedades da Esperança e Variância ................................................................................ 77

9 Distribuições de Probabilidade Discreta - Introdução ............................................................ 79

9.1 Distribuição Binomial ........................................................................................................... 79


5

9.2 Distribuição de Poisson ........................................................................................................ 82

9.3 Distribuição de Poisson como Aproximação da Binomial ...................................................... 84

9.4 Distribuição Hipergeométrica ............................................................................................... 81

9.5 Distribuição Binomial como Aproximação da Hipergeométrica ............................................ 87

10 Distribuição Normal (Gaussiana) .......................................................................................... 88

10.1 Combinação Linear de Normais Independentes ................................................................. 98

11 Amostragem ........................................................................................................................ 100

11.1 Conceitos Fundamentais em Amostragem ........................................................................... 100

11.2 Tipos de Amostragem .......................................................................................................... 103

11.2.1 Amostragem Aleatória Simples (AAS) .................................................................................. 103

11.2.2 Amostragem Aleatória Estratificada (AAE) ........................................................................... 104

11.2.3 Amostragem Sistemática (AS) .............................................................................................. 105

11.2.4 Amostragem por Conglomerados ........................................................................................ 106

11.3 Uso do Excel na Amostragem ................................................................................................. 107

12 Distribuições Amostrais ........................................................................................................ 108

12.1 Distribuição Amostral da Média ............................................................................................. 108

12.2 Teorema do Limite Central ..................................................................................................... 108

12.3 Distribuição Amostral da Proporção ...................................................................................... 110

13 Estimação ........................................................................................................................... 113

13.1 Conceitos Iniciais .................................................................................................................. 113

13.1.1 Estimação ............................................................................................................................ 113

13.1.2 Estimados e Estimativa ........................................................................................................ 114

13.1.3 Propriedade dos Estimadores .............................................................................................. 115


6

13.2 Estimativa Pontual ................................................................................................................. 115

13.3 Estimativa Intervalar ou Intervalo de Confiança para uma Amostra ....................................... 116

13.3.1 Intervalo de Confiança para  - Caso 1:  Conhecido ....................................................... 116

13.3.2 Intervalo de Confiança para  - Caso 2:  Desconhecido ................................................. 118

13.3.3 Intervalo de Confiança para a Proporção Populacional (P) ................................................... 122

13.3.4 Amostragem para População Finita .................................................................................... 124

13.4 Estimativa Intervalar ou Intervalo de Confiança para duas Amostras ...................................... 127

13.4.1 Intervalo de Confiança para Diferença de Médias (1-2) - Caso 1: 1 e 2 Conhecidos ..... 127

13.4.2 Intervalo de Confiança para Diferença de Médias (1-2) - Caso 1: 1 e 2 Desconhecidos e 128
Supostamente Diferentes ..........................................................................................................
13.4.3 Intervalo de Confiança para Diferença de Médias (1-2) - Caso 1: 1 e 2 Desconhecidos e 129
Supostamente Iguais ....................................................................................................................

13.4.4 Intervalo de Confiança para Diferença de Proporção (P1-P2) .............................................. 130

14 Análise de Correlação e Regressão ........................................................................................... 132

14.1 Gráfico de Dispersão ............................................................................................................. 132

14.2 Coeficiente de Correlação de Pearson (Rxy) ......................................................................... 132

14.3 Regressão Linear Simples ...................................................................................................... 135

14.3.1 Reta Estimada ..................................................................................................................... 135

14.3.2 Análise de Variância (ANOVA) ............................................................................................ 138

14.3.3 Coeficiente de Determinação (R2) ........................................................................................ 140

14.3.4 Modelos não Lineares por Anamorfose ............................................................................... 144

14.4 Regressão linear Simples com Excel ..................................................................................... 146

15 Critério de Arredondamento ............................................................................................... 148

15.1 Método Tradicional ................................................................................................................ 149

15.2 Método ABNT ......................................................................................................................... 149


7

15.3 Método do Truncamento ....................................................................................................... 150

16. Exercícios Propostos ................................................................................................................ 152

BIBLIOGRAFIA

APENDICES

ANEXOS
8

Capítulo 1
Conceitos Básicos em Estatística

1. Conceitos Básicos em Estatística

O cidadão comum acredita que a estatística se resume apenas a apresentar tabelas de números em colunas
esportivas e ou econômicas de jornais e revistas, ilustradas com gráficos, pilhas de moedas, etc. quando muito,
associam a estatística à previsão de resultados eleitorais. Mas estatístico de hoje não se limita a compilar tabelas
de dados e os ilustrar graficamente. Pois a partir de 1925, com os trabalhos de Fisher, a estatística iniciou-se
como método científico, então, o trabalho do estatístico passou a ser o de ajudara planejar experimentos,
interpretar e analisar os dados experimentais e apresentar os resultados de maneira a facilitar a tomada de
decisões razoáveis. Deste modo, podemos então definir estatística como sendo a ciência que se preocupa com a
coleta, organização, apresentação, análise e interpretação de dados. Didaticamente podemos dividir a estatística
em duas partes: a estatística descritiva e a inferência estatística. A estatística descritiva se refere à maneira de
apresentar um conjunto de dados em tabelas e gráficos, e ao modo de resumir as informações contidas nestes
dados a algumas medidas. Já a inferência estatística baseia-se na teoria das probabilidades para estabelecer
conclusões sobre todo um grupo (chamado população), quando se observou apenas uma parte (amostra) desta
população. É necessário ter em mente que a estatística é uma ferramenta para o pesquisador, nas respostas dos
“por quês" de seus problemas. E que para ela ser bem usada é necessário conhecer os seus fundamentos e
princípios, e acima de tudo que o pesquisador desenvolva um espírito crítico e jamais deixe de pensar. Pois "em
ciência é fácil mentir usando a estatística, o difícil é falar a verdade sem usar a estatística".

1.1 Divisão da Estatística

 ESTATÍSTICA DESCRITIVA é a parte da Estatística que trabalha com a organização e a apresentação dos
dados.
 ESTATÍSTICA INDUTIVA OU INFERÊNCIA ESTATÍSTICA é a parte da Estatística que trabalha com análise e
interpretação dos dados, com o objetivo de obter e generalizar conclusões para a população a partir de
uma amostra.

1.2 Conceitos Fundamentais


 ESTATÍSTICA é a ciência que estuda as técnicas necessárias para coletar, organizar, apresentar, analisar e
interpretar os dados, a fim de extrair informações a respeito de uma população.
 POPULAÇÃO é o conjunto de todos os elementos (pessoas ou objetos) que interessam ao estudo de um
fenômeno coletivo segundo alguma característica.
 AMOSTRA é qualquer subconjunto não vazio de uma população.
 PARÂMETRO é uma característica numérica estabelecida para toda uma população.
 ESTIMATIVA é uma característica numérica estabelecida para uma amostra.

Exemplo: Fenômeno coletivo: eleição para governador do Estado de Ceará. População: conjunto de todos os
eleitores do estado. Parâmetro: proporção de votos de um candidato X. Amostra: grupo de 10 eleitores
selecionados em todo o estado. Estimativa proporção de votos do candidato X, obtida na amostra. Dentre os
modelos estatísticos podemos destacar os seguintes:

 CENSO é um levantamento estatístico (pesquisa) que abrange todos os elementos de uma população.
9

Principais propriedades do Censo:

 Confiabilidade 100%;
 Custo elevado;
 Lento;
 Nem sempre é viável.

 AMOSTRAGEM é o processo de obter as amostras, com a finalidade de fazer generalizações sobre a


população sem precisar examinar cada um de seus elementos. Principais propriedades da Amostragem:

 Confiabilidade menor que 100%;


 Mais barata que o Censo;
 Mais rápida que o Censo;
 É sempre viável;

 VARIÁVEL é uma característica dos elementos de uma população ou de uma amostra, que pode assumir
diferentes valores, sejam numéricos ou não, e que interessa ao estudo. Classificação das Variáveis:

 Variável Qualitativa: tipo de variável que não pode ser medida numericamente. Exemplos: cor dos
cabelos, marca de refrigerantes, cor dos olhos, etc.

As variáveis qualitativas se classificam em dois tipos:

- Variável Qualitativa Ordinal: quando seus elementos têm relação de ordem. Exemplos: colocação –
primeiro lugar, segundo lugar, etc. conceito – ótimo, bom, regular, péssimo.

- Variável Qualitativa Nominal: quando seus elementos são identificados por um nome. Exemplos:
cor dos olhos, marcas de carro, etc.

 Variável Quantitativa: tipo de variável que pode ser medida numericamente. Exemplos: peso, altura,
número de faltas, número de gols, etc.

As variáveis quantitativas se classificam em dois tipos:

- Variável Quantitativa Discreta: tipo de variável que só pode assumir valores pertencentes a um
conjunto enumerável. Normalmente seus valores estão associados a característica de contagem.
Exemplos: número de carros vendidos, número de filhos, etc.

- Variável Quantitativa Contínua: tipo de variável que pode assumir qualquer valor num intervalo de
valores. Normalmente seus valores estão associados a característica de medidas. Exemplos: altura
das pessoas, peso dos recém-nascidos, etc. Em resumo:

Nominal
Qualitativa {
Ordinal
Variável
Discreta
Quantitativa {
{ Contínua

Observação: a variável idade, apesar de ser representada, geralmente, por números inteiros, é uma variável
contínua, pois está relacionada com o tempo, que é uma variável contínua.
10

 DADO ESTATÍSTICO é toda informação devidamente coletada e registrada. Todo dado se refere a uma
variável.

Quanto à coleta, temos:

 Direta – aquela feita no local da ocorrência onde o pesquisador faz uma visita ou envia um
instrumento de consulta para que seja obtida a informação. A coleta direta é também a que é feita
pelos equipamentos de uma estação meteorológica. Os dados resultantes da coleta direta são
chamados de dados primários;

 Indireta – quando os dados são obtidos por consulta a documentos existentes, como relatórios,
anuários, teses. São dados que já passaram por um tratamento estatístico e por esse motivo são
chamados de dados secundários.

Exemplo: Dado: as receitas cresceram 5%; Informação: Resultado ruim, a meta era crescer 20%

Importante: Dado ≠ Informação, dado é o registro da variável enquanto informação é o


significado do dado.

1.3 Fases do Método Estatístico

Toda pesquisa tem por objetivo gerar conhecimento sobre algo. Com a pesquisa estatística acontece o
mesmo, porém com a peculiaridade do conhecimento pretendido ser obtido através da análise de dados. O
processo de organização da pesquisa estatística é chamado de Fases do Método Estatístico.

Figura 1 – Fases do Método Estatístico

As fases principais são: Definição do problema, planejamento, coleta dos dados, apresentação dos dados,
análise e interpretação dos dados.

I. Definição do problema: Definir exatamente o que se pretende estudar. Consiste em delimitar a


pesquisar e levantar bibliografias;
II. Planejamento: consiste em determinar o procedimento necessário para resolver o problema.
Como levantar as informações? Quantos dados deverão ser obtidos? Que métodos serão
utilizados? Qual o cronograma? Qual o recurso disponível? Etc.
III. Coleta dos dados: Esta fase refere-se à obtenção, reunião e registro sistemático dos dados de
acordo com o objetivo determinado. Tipos de dados (primários e secundários).
IV. Apresentação dos dados: Apresentação dos dados obtidos. Esta apresentação pode ser através de
dados e tabelas.
V. Análise e interpretação dos resultados: esta fase está relacionada essencialmente ao cálculo de
mediadas estatísticas, cuja finalidade é descrever o fenômeno. Esta fase está focada em
compreender de forma crítica o fenômeno em estudo
11

Capítulo 2
Estudo dos Dados Estatísticos

2. Estudos dos Dados Estatísticos


Coletados os dados, não é conveniente apresentá-los para análise sob a forma a que se chegou pela
simples apuração. Na maioria das vezes, o conjunto de valores é extenso e desorganizado, e seu exame requer
maior atenção. Uma fase importante da análise destes dados é condensação em formatos mais simples e
objetivos. Essa condensação pode ser realizada através do emprego de tabelas e gráficos. Para entender como se
constrói uma tabela ou gráfico faz-se necessário analisar as séries estatísticas.

2.1 Séries Estatísticas


Uma série estatística é a representação de uma coleção de dados originados de um conjunto de dados, em uma
tabela ou gráfico.

 CARACTERÍSTICAS DE UMA SÉRIE ESTATÍSTICA:

 Fenômeno: é o fato que foi investigado e cujos valores numéricos estão sendo apresentados na
tabela ou gráfico.
 Local: É o espaço geográfico onde o fenômeno ocorreu.
 Época: Tempo em que o fenômeno foi analisado.

 TIPOS DE SÉRIES ESTATÍSTICAS

 Série Temporal, histórica ou cronológica: a variável é o tempo, permanecendo fixo o local e o


fenômeno investigado.

- Exemplo: Nascidos vivos registrados segundo o ano de registro


- Exemplo: Faturamento líquido da Indústria Química Brasileira, em bilhões US$, (2002 – 2006).

 Série Específica ou categórica: a ocorrência do fenômeno é variável, permanecendo fixos o local e o


tempo.

- Exemplo: Casos registrados de intoxicação humana, segundo a causa determinante. Brasil, 1993.
(Causas determinantes: Acidente, suicídio, ignorada e outras).

- Exemplo: Faturamento líquido da Indústria Química Brasileira (em bilhões US$), por produtos
químicos, no ano de 2006.

 Série Geográfica, espaciais, territoriais ou de localização: A variável é o local, permanecendo fixos o


tempo e o fenômeno.

- Exemplo: Suicídios ocorridos no Brasil em 2005, por regiões.

- Exemplo: Faturamento líquido da Indústria Química Brasileira, em US$, por regiões do Brasil, no ano
de 2006.
12

 Mista ou Conjugada: É a junção das séries temporal-específica, temporal-geográfica, específico-


geográfica e temporal-específico-geográfica em uma única tabela.

- Exemplo: Nascidos vivos registrados segundo o ano de registro e o sexo;

- Exemplo: Faturamento líquido da Indústria Química Brasileira (em bilhões US$), por produtos
químicos, nos anos de 2005 e 2006;

2.2 Apresentação Tabular e Gráfica


Neste modulo serão analisadas as principais estruturas para apresentação de dados estatísticos, as tabelas e
gráficos. Estas estruturas são amplamente utilizadas para apresentação de resultados de uma pesquisa,
trataremos aqui dos principais tipos, elementos e aplicações.

2.2.1 Apresentação Tabular


 TABELA ESTATÍSTICA: É uma representação matricial, isto é, em linhas e colunas, das séries Estatísticas. A
finalidade da tabela é poder apresentar os dados de modo organizado, simples e de fácil percepção.
Dessa forma, a tabela deve ser construída de modo a fornecer o máximo de esclarecimento.

 ELEMENTOS FUNDAMENTAIS DE UMA TABELA ESTATÍSTICA: As Tabelas não possuem linhas verticais
externas traçadas e as verticais internas são facultativas, enquanto os quadros podem apresentar laterais
fechadas.
Título
Zona Designativa ou cabeçalho

Zona Indicativa Zona Enumerativa

Fonte
Rodapé Notas
Chamadas

 Título: Deve responder os seguintes questionamentos: O quê? Ou Quem? Quando? Onde?


 Fonte: Indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração.
 Notas: São informações suplementares destinadas a conceituar ou esclarecer o conteúdo das tabelas
ou indicar a metodologia adotada no levantamento ou na elaboração dos dados.
 Chamadas: É o esclarecimento de dados específicos. Usar algarismos (* ou 1, 2, 3,...).
 Zona Designativa: Está colocado logo abaixo do título e compreendem o chamado cabeçalho, nessa
zona são colocadas as informações referentes ao conteúdo de cada coluna.
 Zona Indicativa: Situa–se ao lado esquerdo, nessa zona são colocadas as informações referentes ao
conteúdo de cada linha.
 Zona Enumerativa: São as expressões numéricas do fato estudado, compondo – se de colunas, linhas
e células ou casas.
13

 SINAIS CONVENCIONAIS

Todos os campos da tabela estatística devem ser preenchidos, desta forma adotam-se sinais:

 0; 0,0 ou 0,00: O dado é nulo ou muito pequeno para a unidade adotada. Resultado de
arredondamento;
 __: O dado não existe;
 ... : O dado existe, porém sua apresentação não está disponível;
 ?: Quando ha dúvida sobre a veracidade do dado.

 TIPOS DE TABELAS ESTATÍSTICAS

 Tabelas Simples ou Unidimensional: Apresentam dados ou informações relativas a uma única Variável.
 Tabela de Dupla Entrada, Cruzada (bidimensional) ou de Contingência: Apresentam dados ou
informações de mais de uma Variável.

Exemplo: Faturamento líquido da Indústria Química Brasileira (em bilhões US$), por produtos químicos,
no ano de 2006.
Produtos Químicos Faturamento (US$ bilhões)
Farmacêutico 9,2
Adubos e fertilizantes 5,3
Sabões e Detergentes 2,5
Tintas 1,9
Outros1 2
Total 20,9
Fonte: ABIQUIM – Associação Brasileira de Indústria Química
1
Produtos químicos com pouca aceitação

Exemplo: Estabelecimentos de saúde públicos e particulares, por espécie, Brasil, 1985.

População (milhões)
Estabelecimento
Públicos Particulares
Hospital 1.002 5.132
Pronto - socorro 150 156
Policlínicas* 1.531 6.136
Outros 14.393 472
Total 17.076 11.896
Fonte: IBGE (1988) (*) Incluem postos de saúde, centros de saúde e unidades mistas.

 BANCO DE DADOS: É um local onde ficam organizados conjuntos de dados de forma bem estruturada e
lógica a respeito de algo. O objetivo do banco de dados é apenas de repositório de dados permitindo
acesso rápido, e não de apresentar resultados de forma simplificada.

Exemplo, na secretaria de uma faculdade tem-se uma determinada quantidade de alunos cadastrados,
cada qual com sua pasta de documentos e informações, imagine precisar de alguma informação a
respeito de um destes alunos, para evitar ter que ir até um arquivo e pegar a pasta para ter acesso a esta
informação, existe um programa interno para cadastro de todos os alunos e assim através do banco de
dados onde se tem cadastrados todos os alunos pode-se verificar qualquer informação cadastrada tudo
organizado de tal forma que facilite essa busca.
14

Segue abaixo um banco de dados referente a 10 funcionários da empresa de Consultoria


Empresarial “X”, Fortaleza, Ceará, dezembro 2007.

Quadro 1 – Banco de Dados


Nº. Estado Civil Sexo Grau de instrução Salário (S.M*) Idade
1 Solteiro Feminino Ensino Médio 6 20
2 Solteiro Feminino Ensino Médio 7 23
3 Solteiro Masculino Superior 11 25
4 Solteiro Masculino Ensino Fundamental 4 26
5 Casado Feminino Superior 13 26
6 Solteiro Feminino Ensino Fundamental 8 27
7 Casado Feminino Ensino Fundamental 7 28
8 Casado Feminino Ensino Médio 15 29
9 Casado Masculino Ensino Médio 9 30
10 Casado Feminino Ensino Médio 11 30
Fonte: Recursos Humanos da Consultoria X (*) S.M: Salários Mínimos

2.2.2 Apresentação Gráfica.

O gráfico constitui um recurso importante para apresentação de dados estatísticos, pois consegue resumir as
informações através de recursos visuais, sua aplicação é quase sempre preferível a tabela estatística. No entanto,
quando o agrupamento dos dados é complexo, melhor utilizar a tabela, pois um importante atributo de um bom
gráfico é ser simples, auto-explicativo. A percepção visual é muito eficiente, mas é preciso atenção em alguns
pontos, vejamos as situações indicadas abaixo:

De acordo com os gráficos, os tratamentos T1 e T2 apresentam desempenhos bem distintos nas duas situações.
Na situação A os tratamentos apresentam desempenhos muito próximos, já no B os desempenho de T1 é bem
superior ao de T2 (mais que o dobro).

Questionamento: Seria possível que os dois gráficos (A e B) se refiram a mesma situação?

Sendo sim a resposta, então um dos gráficos está errado. É o que está de fato ocorrendo, os dois gráficos
correspondem a mesma situação, a diferença está no ponto de corte dos dados, no caso A o ponto de corte é 0
(zero) enquanto no B é 45,4. Este erro pode ser intencional ou não, o que importa é revela resultados bem
distorcidos, como a eficiência dos gráficos é visual, sua valia ficou comprometida. Por isso atenção para o campo
de variação dos dados.

Segue abaixo os principais tipos de Gráficos:

 GRÁFICOS: São representações visuais dos dados investigados que transmitem a informação de forma
direta. Os gráficos devem ser simples, auto-explicativo.
15

 ELEMENTOS ESSENCIAIS DOS GRÁFICOS: Título e fonte, em alguns casos, a legenda.


 TIPOS DE GRÁFICOS:

 Setor ou Pizza, torta (Pie Chart): São usados para representar valores absolutos ou percentuais de
variáveis qualitativas. É uma opção ao gráfico de barras quando se pretende dar ênfase à comparação
das percentagens de cada categoria. A construção do gráfico de setores segue uma regra de 3
simples, onde as frequências de cada classe correspondem ao ângulo que se deseja representar em
relação a frequência total que representa o total de 360°. Sugere-se ser empregado quando há no
máximo sete informações;

Exemplo:

Fonte: Dados fictícios

 Barra Vertical e horizontal: Para representar séries específicas ou mistas de variáveis qualitativas.

Exemplo: Faturamento líquido da Indústria Química Brasileira (em bilhões US$), por produtos
químicos, no ano de 2005.

Fonte: ABIQUIM – Associação Brasileira da Indústria Química

Exemplo:

Fonte: site do IBGE


16

 Colunas Sobrepostas: É um tipo utilizado estratificando as categorias (gráfico comparativo).

Exemplo: População Urbana do Brasil por Região de 1940 a 1980 (x 1000)

 Por linha: É um gráfico utilizado para mostrar a evolução ou tendências dos dados ao longo do tempo.

Exemplo:

 Por ponto: Para representar variáveis quantitativas;

Exemplo:

Fonte: Colégio “X”


17

 Histograma: O histograma é a representação gráfica de dados contínuos agrupados em distribuições


de frequências com intervalos. Corresponde a um gráfico de colunas juntas.

Exemplo:
Concentração de Cádmio (mg/kg), Rio Bonito, 2010
25 23

20

14
15

10 8

5 3
2

0
4,0 |---- 6,0 6,0 |---- 8,0 8,0 |---- 10,0 10,0 |---- 12,0 12,0 |----|14,0

Fonte: Dados Fictícios

 Polígono de Frequência: é uma linha poligonal que une os pontos médios dos intervalos, seu objetivo é
modelar a forma da distribuição, enquanto o gráfico de linha objetiva mostrar o comportamento de uma
variável ao longo do tempo.

Exemplo:

Fonte: Dados Fictícios

 Gráfico polar ou Radar: É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda a
série que apresenta uma determinada periodicidade. Pode também ser empregado para avaliar o
atendimento de várias categorias a seus respectivos padrões.
Passos para Construção:

I. Traça-se uma circunferência de raio arbitrário (preferencialmente, a um raio de comprimento


proporcional a média dos valores da série);
II. Constrói-se uma semi-reta (de preferência horizontal) partindo do ponto 0 (pólo) e com uma
escala (eixo polar);
III. Divide-se a circunferência em tantos arcos forem às unidades temporais;
IV. Traçam-se semi-retas a partir do ponto 0 (pólo) passando pelos pontos de divisão;
V. Marca-se os valores correspondentes da variável, iniciando pela semi-reta horizontal (eixo polar);
VI. Ligam-se os pontos encontrados com segmentos de reta;
VII. Para fechar o polígono obtido, emprega-se uma linha interrompida.
18

Precipitação Pluviométrica do Município de Santa Maria - RS - 1999.

Meses Precipitação (mm)


Janeiro 174,8
Janeiro
Fevereiro 36,9 600,0
Dezembro Fevereiro
Março 83,9 500,0
Abril 462,7 400,0
Novembro 300,0 Março
Maio 418,1
200,0
Junho 418,4 100,0
Julho 538,7 Outubro 0,0 Abril
Agosto 323,8
Setembro 39,7
Setembro Maio
Outubro 66,1
Novembro 83,3
Agosto Junho
Dezembro 201,2
Julho

Fonte: Base Aérea de Santa Maria

 Cartograma: É a representação de um fenômeno com auxílio de um mapa geográfico em estudo. Este


recurso é muito utilizado para densidade demográfica, criminalidade, etc.

Exemplo:

 Organograma: Representa distribuição de funções de uma empresa, através de retângulos, que


representa o nível hierárquico.

Exemplo:
19

 Fluxograma: É um esquema para descrever a ordem de um programa de computador, de uma ordem de


uma linha de montagem em uma empresa
Exemplo:

 Pictogramas: Usam-se desenhos à variável em questão. A desvantagem do pictograma é que apenas


mostra uma visão geral do fenômeno, e não os detalhes minuciosos. A vantagem é despertar atenção do
público leigo, por isso, largamente utilizados pela mídia.
20

 Colunas e Barras Múltiplas: Gráfico adequado para representar séries mistas.

Exemplo: Destino do Lixo por Grau de Instrução do Mantenedor da Família, Fortaleza, 2010.

19

14
13
11

Ensino Fundamental Ensino Médio Superior

Não Sim

Fonte: Dados Fictícios

 Estereograma: Qualquer um dos tipos anteriores desenhado em três dimensões.

Exemplo: Produção de Soja do Município X – 1991 a 1005

Fonte: Dados Fictícios


21

Capítulo 3
Distribuição de Frequências

3. Distribuição de Frequências
Muitas vezes, ao coletar dados, o pesquisador se depara com uma grande massa de valores numéricos,
que se repetem algumas vezes, dificultando sua análise e interpretação. Surge então a necessidade de organizar
esses dados em uma tabela onde os valores observados se apresentam associados individualmente ou em classes
com os números de suas repetições, isto é, com suas respectivas frequências. Esta tabela recebe o nome de
Distribuição de Frequências. Outra forma de conceituar a distribuição de frequências é: a série estatística que
organiza os resultados numéricos de uma variável quantitativa com suas respectivas frequências. Temos então
que a distribuição de frequências é um tipo particular de série estatística, e é representada graficamente por um
gráfico de colunas chamado Histograma. Quais as informações podem ser obtidas com a distribuição de
frequências?

Vejamos os exemplos:

Efetuando-se 50 medições do ponto de fusão de uma substância, foram anotados os resultados, que seguem
abaixo:
Distribuição de Frequências Histograma
Nº de 28
Ponto de fusão (°C)
medições
49,50 |---- 50,00 5
50,00 |---- 50,50 7
50,50 |---- 51,00 28
7 8
51,00 |---- 51,50 8 5
51,50 |----|52,00 2 2

TOTAL 50
49,50 |---- 50,00 50,00 |---- 50,50 50,50 |---- 51,00 51,00 |---- 51,50 51,50 |----|52,00

Pela leitura da tabela, o pesquisador pode observar que faixas de temperaturas apresentam maior frequência,
que faixas apresentam menores frequências. Pela análise do histograma, o pesquisador também pode analisar a
forma da distribuição.
Dependendo do tipo da variável contínua, a distribuição pode agrupar dados discretos ou contínuos, que também
caracterizará o histograma, de forma que: para dados discretos, o histograma terá colunas separadas, já para
dados contínuos o histograma terá colunas juntas.
Adotaremos as seguintes nomenclaturas para os tipos de frequências:

 FREQUÊNCIA ABSOLUTA SIMPES – fi: corresponde a frequência ou contagem efetiva de cada valor da
variável no conjunto de dados;

 FREQUÊNCIA RELATIVA SIMPLES – fi%: corresponde à frequência absoluta em termos percentuais ou


relativos. Algumas bibliografias trazem as notações fr (decimal) e fr% (percentual);
22

𝑓𝑖
𝑓𝑖% = 𝑥100
𝑛

 FREQUÊNCIA ACUMULADA CRESCENTE - faci: Para um valor considerado, corresponde ao acumulado das
frequências de todos os valores anteriores ao valor considerado até ele, seria o “teto”. Algumas
bibliografias trazem a notação Fi

 FREQUÊNCIA ACUMULADA DESCRESCENTE - fadi: Para um valor considerado, corresponde ao acumulado


das frequências de todos os valores posteriores ao valor considerado a partir dele, seria o “piso”.

Importante: As frequências acumuladas faci e fadi apresentadas na forma absoluta mas também podem ser
expressas em termos relativos, o cálculo é semelhante ao da frequência fi%

3.1 Distribuição de Frequências para Dados Discretos

Sendo a variável em estudo quantitativa discreta, a distribuição de frequências pode ser construída
apenas listando as categorias de valores em ordem, atribuir às respectivas frequências. Vejamos um exemplo:
Os dados abaixo correspondem ao número de apartamentos vendidos pela construtora GM Branco nos
últimos vinte meses.

Dados brutos:

0 0 1 4 5 3 2 4 1 4
2 2 4 5 2 1 1 1 5 3

Variável: Nº de apartamentos vendidos – quantitativa discreta

Passos para elaboração da Distribuição:

 Listam-se as categorias de valores diferentes que ocorreram no conjunto: 0, 1, 2, 3, 4, 5;


 Indicam-se as respectivas frequências absolutas ou quantas vezes cada valor aparece no conjunto;
 Indicam-se as demais frequências (relativas e acumuladas).

fi =5: existem 5
valores iguais a 1
Nº de apartamentos
fi fi% faci fadi faci =7: é soma de 2
no conjunto
vendidos
+5 (fis de 0 e 1)
0 2 10% 2 20
1 5 25% 7 18
2 4 20% 11 13
3 2 10% 13 9
fi% =25%: é 4 4 20% 17 7 fadi =18: é soma de
(5/20)*100 5 3 15% 20 3 5+4+2+4+3. (fis de
Total 20 100% - - 1,2,3,4 e5)

O Gráfico correspondente apresenta colunas separadas:


23

4 4

2 2

1 2 3 4 5 6

3.2 Distribuição de Frequências para Dados Contínuos

Uma variável continua, de forma geral, pode apresenta uma grande variedade de categoria de valores. Imagine
listar todas as categorias de valores de uma amostra das alturas de 100 (cem) pessoas. Mesmo utilizando apenas
uma casa decimal, existe uma tendência de haverem muitos valores distintos para serem listados
individualmente. Normalmente, utilizam-se intervalos de dados e não os dados individuais, de forma que a
minúcia de pequenas diferenças seja alocada dentro dos intervalos. Alguns tipos de intervalos podem
empregados na construção deste tipo de série estatística.

Vejamos:
: semi-abertos à direita
: semi-abertos à esquerda

: fechados

: abertos

Além da definição do tipo de intervalo, existem outras definições a serem tomadas:

 O nº de intervalos (K) e
 O tamanho dos intervalos (h).

O pesquisador tem autonomia para tomar estas decisões, utilizando-se do seu conhecimento empírico sobre a
variável estudada. Porém, existem alguns critérios para a definição do número de classes, vejamos:
Roteiro para elaboração da distribuição de frequências:

i. Amplitude total (At): maior distância entre os valores do conjunto

At = Ximáx. – Xi mín. (diferença entre o maior e menor valor do conjunto)

ii. Número de Classes (k): número de intervalos utilizados

5, 𝑠𝑒 𝑛 ≤ 25
 Regra da raiz quadrada: 𝐾 = {
√𝑛, 𝑠𝑒 𝑛 > 25

 Regra de Sturges: 𝐾 = 1 + 3,3. log 𝑛


24

Nos dois casos deve-se arredondar para o inteiro mais próximo. A regra da raiz quadrada é normalmente
mais utilizada, mas independente da regra, o bom senso deve ser considerado, não é interessante utilizar muitas
classes.

iii. Amplitude de classe (h): o comprimento ou largura de cada intervalo

𝐴𝑡
ℎ=
𝑘

Caso seja necessário arredondar, o arredondamento deve ser realizado sempre para “mais”. Cada classe
apresentará dois limites: inferior – Linf (esquerda) e superior – Lsup (direita), sendo que Lsup = Linf +h

Vejamos um exemplo:

Para estudo da melhoria do conforto de automóveis, uma montadora realizou uma pesquisa quantitativa com 40
pessoas. Uma das variáveis estudada foi a altura (m) das pessoas. Os dados seguem abaixo:
Dados brutos
1,40 1,45 1,56 1,78 1,87 1,76 1,89 2,00 1,75 1,65
1,50 1,40 1,58 1,70 1,45 1,67 1,56 1,78 1,47 1,85
1,56 1,59 2,00 1,79 1,87 1,90 1,89 1,67 1,56 1,45
1,78 1,68 1,67 1,58 1,56 1,89 1,90 1,67 1,75 1,56
Passos:
i. Amplitude total: At =2,00 – 1,40 = 0,60 m (“maior menos o menor”)
ii. Número de classes: como n= 40 (n>25), temos: 𝑘 = √40 = 6,32 ≅ 6,0 (“inteiro mais próximo”)
iii. Amplitude de Classe: h = 0,60 / 6 =0,10 m;

Neste caso serão 6 classes de comprimento 0,10 m. Tomando como limite inferior da 1ª classe o menor
conjunto, temos:

 Linf =1,40 m
 Lsup= Linf+h=1,40+0,10 = 1,50 m

1ª Classe: 1,40 I--- 1,50, siga com o processo até completar o total de classes. Segue abaixo resultado:

Altura (m) fi fi% faci fadi


1,40 I---1,50 6 15% 6 40
1,50 I---1,60 10 25% 16 34
1,60 I---1,70 6 15% 22 24
1,70 I---1,80 8 20% 30 18
1,80 I---1,90 6 15% 36 10
1,90 I---I2,00 4 10% 40 4
Total 40 100% - -

Histograma: Assim como no caso discreto, também podemos traçar o histograma.


25

10

6 6 6

1,40 I---1,50 1,50 I---1,60 1,60 I---1,70 1,70 I---1,80 1,80 I---1,90 1,90 I---I2,00

Polígono de Frequência.

Para histogramas de dados contínuos, podemos traçar o Polígono de Frequências, que corresponde a uma
poligonal que une os pontos médios de cada classe. Apesar de haver semelhança com o gráfico de linha, o
polígono de frequências tem por objetivo apresentar a forma da distribuição dos dados. Observando-se o
polígono de frequências para um grande conjunto de dados, o perfil do polígono de frequências tende à de curva
Gauss. Esta será estudada mais adiante nos modelos probabilísticos contínuos. Além do polígono de frequências,
existem outras poligonais, chamadas Ogivas de Galton. Estas correspondem ao polígono de frequências, porém
utilizam as frequências acumuladas.

10

6 6 6

1,40 I---1,50 1,50 I---1,60 1,60 I---1,70 1,70 I---1,80 1,80 I---1,90 1,90 I---
I2,00

Pode-se dizer que o Polígono de frequências é o “embrião” da curva de Gauss. A medida que o n tende ao infinito
(𝑛 → ∞) o polígono de frequência suaviza como na figura abaixo:
26

Capítulo 4
Medidas de Posição

4. Medidas de Posição

Para a maioria das pessoas, estatística significa descrever números da forma mais entendível possível,
como por exemplo, as taxas mensais de desemprego no Brasil após a alta do dólar no mercado atual, o índice de
falências empresariais ocorridas no Brasil de 2010 para cá, a proporção de eleitores que votarão em um
determinado candidato nas próximas eleições, o nível de satisfação de clientes de uma determinada loja de
conveniência de um determinado Shopping Center, dentre outros.
Todos esses exemplos representam descrições estatísticas de um conjunto de dados coletados sobre
algum fenômeno e para isso não é preciso usar a inferência estatística ainda, pois o objetivo aqui é apenas
descrever estatisticamente essas informações.
A descrição estatística dos dados verifica a localização central e a variabilidade destes dados através de
médias, medianas, modas, variâncias, desvios-padrão e coeficientes de variação.
A descrição dos dados se dá em duas formas, tanto para dados agrupados em classes como para dados
não agrupados.

4.1 Pequenos Conjuntos de Dados


As chamadas medidas de tendência central têm por objetivo verificar o centro da distribuição dos
dados, ou seja, verificar através de medidas específicas o centro do conjunto de dados. As medidas de tendência
central mais utilizada são a média aritmética, a moda e a mediana. As usadas com menos frequências são as
médias geométricas, harmônicas, quadráticas, cúbicas e biquadráticas.
As outras medidas de posição usadas com menos intensidade são as separatrizes, que englobam: a
própria mediana através dos decis, dos quartis e dos percentis.

Importante: Adotaremos como definições de Pequenos Conjuntos de Dados e Grandes Conjuntos de Dados:
 Pequenos conjuntos de dados: conjunto de dados cuja análise não requer uma organização prévia.
 Grandes conjuntos de dados: conjunto de dados cuja análise requer uma organização prévia.
Algumas literaturas consideram a partir de 30 unidades,

 MÉDIA ARITMÉTICA: É o ponto de equilíbrio do conjunto de dados, de forma simples é definido como
sendo o quociente da soma de todos os valores de um conjunto de dados pelo total de valores deste
conjunto.

Média amostral Média populacional

xi x
n N
i
X i1   i1 , Onde
n N
xi: Valores da variável
n: Número de valores da amostra
N: Número de valores da população

 MODA (Mo ou x̂ ): Na linguagem coloquial, moda é algo que está em evidência, ou seja, algo que se vê
bastante. Na Estatística, como o próprio nome sugere, a Moda é aquele elemento que mais vezes aparece no
conjunto de dados. Não é muito sensato dizer que a moda é uma medida de tendência central, pois nem
27

sempre ela representa o centro do conjunto de dados, visto que ela identifica o(s) valor(es) que ocorre(m)
com maior frequência, podendo ser único, se existir, como pode também não existir. Nesse caso, é mais
correto chamá-la de medida de posição.

Quando dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda. Das diferentes
medidas de tendência central, a moda é a única medida que pode ser usada com dados em nível nominal de
mensuração.

Exemplo: Um estudo sobre os tipos de falhas em estruturas metálicas indicou: 30 casos de corrosão, 50 casos
de deformação e 20 assimetria. Embora não possamos tomar a média numérica dessas características,
podemos afirmar que a moda é deformação, que é o tipo de falha com maior frequência.

Quando no conjunto há apenas um valor que se repete além dos demais de forma máxima, chama-se este
conjunto de unimodal, bem como se tiver dois valores que se repete além dos demais, de forma máxima e na
mesma quantidade é bimodal, assim acima de 2 modas é multimodal. Se o conjunto de dados não tiver
nenhum valor que se repete além dos demais de forma máxima, o conjunto de dados é amodal.

 MEDIANA (Md ou ~ x ): A mediana é uma medida de tendência central que ocupa a posição central dos
dados observados, quando estes estão ordenados em ordem crescente ou decrescente (rol), tendo uma
mudança na sua realização se a quantidade de dados é par ou ímpar.

Desta forma, definiremos a mediana para n par e n ímpar.

I. n ímpar: neste caso a série apresenta um único elemento central, a mediana é este valor.

𝑀𝑑 = 𝑋(𝑛+1)
2

II. n par: neste caso a série apresenta dois elementos centrais, a mediana é dada pela média destes
valores.
𝑋(𝑛) + 𝑋(𝑛+1)
𝑀𝑑 = 2 2
2
Exemplo: Determinar a mediana das notas nos seguintes casos:

a) Notas de alunos de uma determinada disciplina: 8, 7, 3, 4, 8

 n = 5 (ímpar)
 Rol: 3, 4, 7, 8, 8
X3
Com n ímpar, a mediana é igual ao elemento central, Md = 7
Com uso da fórmula:
𝑀𝑑 = 𝑋(𝑛+1) = 𝑋(5+1) = 𝑋3 ⇒ 𝑀𝑑 = 7
2 2

b) Notas de alunos de uma determinada disciplina: 8, 7, 3, 4, 8, 9

 n = 6 (par)
 Rol: 3, 4, 7, 8, 8, 9
X3 X4
7+8
Com n par, a mediana é igual à média dos centrais, assim 𝑀𝑑 = 2 ⇒ 𝑀𝑑 = 7,5
28

Com uso da fórmula:


𝑋(𝑛) + 𝑋(𝑛+1) 𝑋(6) + 𝑋(6+1)
2 2 2 2
𝑋3 + 𝑋4 7 + 8
𝑀𝑑 = = = = ⇒ 𝑀𝑑 = 7,5
2 2 2 2
Depois de verificado as três medidas de tendência central que são utilizadas com maior frequência,
dentre as três, a média aritmética é a medida mais usada na tomada de decisão, pois a mesma é encontrada
com uso de todos os valores do conjunto de dados, ao passo que a mediana e a moda não utiliza todos eles, e
sim alguns ou nenhum dos valores (amodal), apresentado resultados “distorcidos” da realidade dos dados
apresentados.
Quando se descreve os dados, além das medidas de tendência central, é necessário analisar a
variabilidade dos dados, pois através destas pode-se tirar algumas conclusões mais consistentes na tomada de
decisão. Assim, o próximo item mostrar as medidas de variabilidades mais utilizadas no campo estatístico.

 PROPRIEDADES DAS MEDIDAS DE POSIÇÃO: As medidas de posição apresentam propriedades


importantes. Destacaremos aqui as principais propriedades da média, moda e mediana.

Sejam xi cada valor do conjunto e c uma constante não nula, temos que:

Propriedades da Média Aritmética

I. A média de um grupo de dados sempre será única, independente da sua localização;

II. A média é influenciada por valores extremos

III. A soma algébrica dos desvios tomados em relação à média é sempre nula (ponto de equilíbrio):

∑𝑛
𝑖=1 𝑥𝑖 𝑛𝑥
 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥) = ∑𝑛𝑖=1 𝑥𝑖 − ∑𝑛𝑖=1 𝑥 = ∑𝑛𝑖=1 𝑥𝑖 − 𝑛𝑥 ⇒ 𝑑𝑖𝑣𝑖𝑑𝑖𝑛𝑑𝑜 𝑜𝑠 𝑚𝑒𝑛𝑏𝑟𝑜𝑠 𝑛 ⇒ − =0
𝑛 𝑛

IV. A soma algébrica das distâncias quadráticas de cada valor em relação à média é mínima:

 Seja W a soma dos desvios quadráticos em torno de a, W= ∑𝑛𝑖=1(𝑥𝑖 − 𝑎)2 . O mínimo de W é dado
pela derivada de W igual a zero.
𝑛 𝑛 𝑛 𝑛
𝑑𝑤
∑(𝑥𝑖 − 𝑎)2 = 0 ⇒ ∑ 2(𝑥𝑖 − 𝑎) = 0 ⇒ 2 ∑(𝑥𝑖 − 𝑎) = 0 ⇒ ∑(𝑥𝑖 − 𝑎) = 0
𝑑𝑎
𝑖=1 𝑖=1 𝑖=1 𝑖=1

𝑛 𝑛 𝑛
∑𝑛𝑖=1 𝑥𝑖
⇒ ∑ 𝑥𝑖 − ∑ 𝑎 = 0 ⇒ ∑ 𝑥𝑖 − 𝑛𝑎 = 0 ⇒ 𝑎 = ⇒ 𝑎=𝑥
𝑛
𝑖=1 𝑖=1 𝑖=1

O mínimo de W ocorre para a igual a média.

V. O resultado de multiplicar a média pela quantidade “n” de valores da variável x é igual a soma dos “n”
valores da variável;

∑𝑛
𝑖=1 𝑥𝑖
 𝑥= 𝑛
⇒ ∑𝑛𝑖=1 𝑥𝑖 = 𝑛. 𝑥

VI. Somando-se ou subtraindo-se uma constante c (valor invariável) a todos os valores de uma variável,
a média do conjunto ficará aumentada ou diminuída dessa constante, respectivamente, de forma
análoga, se multiplicar ou dividir, a média ficará multiplicada ou dividida, respectivamente.
29

∑𝑛
𝑖=1(𝑥𝑖 ±𝑐)
 𝑥𝑖 ± 𝑐 ⇒ 𝑋 = 𝑛
⇒ 𝑋±𝑐
∑𝑛
𝑖=1(𝑥𝑖 .𝑐)
 𝑥𝑖 . 𝑐 ⇒ 𝑋 = 𝑛
⇒ 𝑋. 𝑐
𝑥𝑖
𝑥𝑖 ∑𝑛
𝑖=1( ) 𝑋
 ⇒𝑋= 𝑐

𝑐 𝑛 𝑐

Propriedades da Moda

I. A moda nem sempre é única e nem sempre existe (amodal, bimodal e multimodal);
II. A moda é a única medida de posição que pode ser definida para dados qualitativos;
III. A moda não é influenciada por valores extremos;
IV. Pode estar afastada do centro dos dados;
V. Não utiliza todos os dados da amostra;
VI. Difícil de incluir em funções matemáticas.

Propriedades da Mediana

I. A mediana sempre existe e é única;


II. A mediana não é influenciada por valores extremos;
III. Não utiliza todos os dados da amostra;
IV. Difícil de incluir em funções matemáticas.

4.2 Grandes conjuntos de dados: Discretos


Referem-se a conjuntos de dados em que sua análise requer o agrupamento em tabelas de frequências. Tem-
se como referencia 30 valores. Os conceitos e propriedades já apresentados anteriormente continuam válidos.

 MÉDIA ARITMÉTICA: É o ponto de equilíbrio do conjunto de dados, simplificadamente é definida como


sendo o quociente da soma de todos os valores de um conjunto de dados pelo total de valores deste
conjunto.
A diferença na fórmula corresponde à inclusão da frequência absoluta simples, assim:

∑𝑛𝑖=1 𝑥𝑖 . 𝑓𝑖
𝑋=
𝑛
xi: Valores da variável
n: Número de valores da amostra
fi: Frequência absoluta simples

 MODA (Mo ou x̂ ): Continua sendo o valor mais frequente do conjunto, este valor pode agora ser
visualizado pela maior, ou maiores frequências na distribuição de frequências.

 MEDIANA (Md ou ~ x ): continua sendo o valor que o divide o conjunto ordenado em duas partes de igual
frequência. A organização em rol também pode ser vizualizado através da distribuição de fraequências. A
identificação do valor central ainda depende da quantidade de valores do conjunto ser par ou impar.

Vejamos um exemplo:

Os dados abaixo correspondem ao número de apartamentos vendidos pela construtora GM Branco nos
últimos vinte meses.
30

Nº de apartamentos vendidos fi (meses)


Maior fi =5:
0 2 corresponde ao
1 5 valor 1

2 4
3 2
4 4
5 3
Total 20

Calcular Média, Moda e Mediana.

∑𝑛 𝑥 .𝑓
 Média: 𝑋 = 𝑖=1𝑛 𝑖 𝑖: Somatório de cada valor vezes sua respectiva frequência dividido pelo número de
valores, assim:

∑𝑛𝑖=1 𝑥𝑖 . 𝑓𝑖 0.2 + 1.5 + 2.4 + 3.2 + 4.4 + 5.3 50


𝑋= = = ⟹ 𝑋 = 2,5 𝑎𝑝𝑎𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑜𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠
𝑛 20 20

Observação: embora a leitura de 2,5 apartamentos vendidos por mês não pareça coerente, o valor deve
ser utilizado assim mesmo. Uma leitura alternativa seria: 25 apartamentos vendidos a cada 10 meses.

 Moda: basta identificar na tabela o valor de maior frequência, este será a moda, vejamos:

Maior frequência 5: Mo = 1 apartamento vendido


𝑥𝑛 𝑥𝑛
( )+ ( +1)
 Mediana: 𝑀𝑑 = 2 2
. Como n é par, devemos buscar os dois elementos centrais, que são os de
2
𝑛 𝑛
posição e + 1, assim:
2 2
𝑛 𝑛
= 10º 𝑒 + 1 = 11º
2 2

Podemos notar pela distribuição de frequências que os valores procurados são 2 e 2. Verificando pelo rol:

0 0 1 1 1 1 1 2 2 2 2
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11

Logo:
𝑥10+ 𝑥11 2 + 2
𝑀𝑑 = = ⇒ 𝑀𝑑 = 2 𝑎𝑝𝑎𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑜𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠
2 2

4.3 Grandes conjuntos de dados: Contínuos


Análogo aos dados discretos, considerando a análise de variáveis contínuas. Os conceitos e propriedades já
apresentados anteriormente continuam válidos, porém, as medidas são calculadas por princípios de
interpolação.

 MÉDIA ARITMÉTICA: É o ponto de equilíbrio do conjunto de dados, simplificadamente é definida como


sendo o quociente da soma de todos os valores de um conjunto de dados pelo total de valores deste
31

conjunto. Porém, no caso dos intervalos de dados, parte-se da suposição que a distribuição dos dados é
uniforme dentro dos intervalos, assim a fórmula sofre a seguinte alteração:

∑𝑘𝑖=1 𝑥𝑖𝑚 . 𝑓𝑖 𝑙𝑖𝑛𝑓 + 𝑙𝑠𝑢𝑝


𝑋= , 𝑜𝑛𝑑𝑒 𝑥𝑖𝑚 =
𝑛 2
Xim :ponto médio da classe i
n :número de valores da amostra
fi :frequência absoluta simples

 MODA (Mo ou x̂ ): Continua sendo o valor mais frequente do conjunto, porém nesta fase o valor é
calculado por interpolação, segue fórmula de Czuber:

∆1
𝑀𝑜 = 𝑙𝑖 + ( )∗ℎ
∆1 + ∆2
Primeiro passo: Identificar a classe MODAL, esta classe será a classe de maior frequência.
Em seguida, identificar os seguintes elementos:

 li: limite inferior da classe modal (o limite da esquerda)


 ∆1: diferença entre a frequência absoluta da classe modal (a maior) e a da classe imediatamente
anterior;
 ∆2: diferença entre a frequência absoluta da classe modal (a maior) e a da classe imediatamente
posterior;
 h: amplitude de classe, em geral este valor é fixo, mas caso a distribuição apresente tamanhos variados,
será a amplitude da classe modal.

Importante:
1. Sendo a classe modal a primeira, adota-se como classe anterior uma classe de frequência nula. Analogamente,
se a classe modal for a última, adota-se como classe posterior uma classe de frequência nula;
2. Caso existam duas ou mais classes modais, o processo deve ser repetido para estas classes.

 MEDIANA (Md ou ~ x ): continua sendo o valor que o divide o conjunto ordenado em duas partes de igual
frequências. Porém nesta fase o valor é calculado por interpolação, segue fórmula:

𝑛
2
− 𝑓𝑎𝑐 ↑
𝑀𝑑 = 𝑙𝑖 + ( )∗ℎ
𝑓𝑀𝑑
Primeiro passo: Identificar a classe MEDIANA, esta classe será a classe que contém o elemento mediano, que
dado por:
𝑛+1 𝑜
I. n impar: a classe mediana será a classe que contém o elemento de ordem ( 2
)
𝑛 𝑜
II. n par: a classe mediana será a classe que contém o elemento de ordem (2 )

Em seguida, identificar os seguintes elementos:

 li: Limite inferior da classe mediana (o limite da esquerda)


 fac↑: Frequência acumulada crescente da classe anterior à classe mediana;
 fmd: Frequência absoluta simples da classe mediana;
 h: amplitude de classe, em geral este valor é fixo, mas caso a distribuição apresente tamanhos variados,
será a amplitude da classe mediana.
32

Vejamos um exemplo:

Uma amostra de 80 corpos de prova de concreto forneceu a seguinte distribuição de resistências de ruptura:

Resistência (psi*) Nº de medições


50 |---- 60 2
60 |---- 70 15
70 |---- 80 50
80 |---- 90 10
90 |----|100 3
TOTAL 80
(*) Psi (pound force per square inch) ou libra força por polegada quadrada

Calcular média, moda e mediana para distribuição acima:

 Média: é necessário calcular o ponto médio para cada classe e aplicar na fórmula abaixo, assim:

Resistência (psi*) Nº de medições Xim


50 |---- 60 2 55 (Linf +Lsup)/2
60 |---- 70 15 65
70 |---- 80 50 75
80 |---- 90 10 85
90 |----|100 3 95
TOTAL 80 -

∑𝑘𝑖=1 𝑥𝑖𝑚 . 𝑓𝑖 55.2 + 65.15 + 75.50 + 85.10 + 95.3


𝑋= = ⇒ 𝑋 = 74,6 𝑝𝑠𝑖
𝑛 80
 Moda: o primeiro passo é identificar a classe moda, esta será a classe de maior frequência, a partir
dela indicam-se as demais informações:

Resistência (psi*) Nº de medições


50 |---- 60 2
60 |---- 70 15
Classe Modal:
70 |---- 80 50 maior frequência
80 |---- 90 10
90 |----|100 3
TOTAL 80

Da classe modal identificamos:

 li: 70 (limite da esquerda)


 ∆1: 50 – 15 = 35
 ∆2: 50 – 10 = 40
 h: 80 – 70 = 10 (diferença entre os limites do intervalo)

Aplicando na fórmula, temos:


33

∆1 35
𝑀𝑜 = 𝑙𝑖 + ( ) ∗ ℎ = 70 + ( ) ∗ 10 ⇒ 𝑀𝑜 = 74,7 𝑝𝑠𝑖
∆1 + ∆2 35 + 40

 Mediana: o primeiro passo é identificar a classe mediana esta será a classe que contém o elemento
mediano, a partir dela indicam-se as demais informações:
Vejamos:

Resistência (psi*) Nº de medições faci fac↑ = 17 (anterior) e


50 |---- 60 2 2 fmd =50 (mediana)
60 |---- 70 15 17
70 |---- 80 50 67
80 |---- 90 10 77
90 |----|100 3 80
TOTAL 80 -
Classe Mediana:
contém o 40º valor
Como o experimento examinou 80 corpos de prova, ou seja, n=80 (par),
 
 n   80
O elemento mediano será dado:   =   = 40º (classe que contém o 40º valor).
 2  2 
A referida classe é 70 |---- 80.

Observe que até a primeira classe acumula 2, até a segunda acumula 17 e até a terceira acumula 67, ou seja, a
classe 70 |---- 80 contém do 17º ao 67º valor, consequentemente o 40º.
Da classe mediana, identificamos:

 li =70 (limite da esquerda)


 fac↑ =17 (frequência acumulada crescente da classe anterior à classe mediana);
 fmd = 50 (frequência absoluta simples da classe mediana);
 h = 80 -70 = 10

Aplicando na fórmula, temos:

𝑛 80
− 𝑓𝑎𝑐 ↑ − 17
2
𝑀𝑑 = 𝑙𝑖 + ( ) ∗ ℎ = 70 + ( 2 ) ∗ 10 ⇒ 𝑀𝑑 = 74,6 𝑝𝑠𝑖
𝑓𝑀𝑑 50

4.4 Medidas Separatrizes


As medidas de Posição e dispersão proporcionam uma análise quanto ao comportamento da tendência e
variabilidade de conjunto de dados. Além destas existe outra categoria de medidas, são as medidas separatrizes.
Estas medidas proporcionam outra forma de análise da dispersão e assimetria da distribuição. O critério utilizado
por estas medidas é o de separar (por isso separatrizes) o conjunto de dados em intervalos com frequências
iguais. A conceituação da medida é definida de acordo com a frequência considerada para os intervalos. Uma
destas medidas já está entre as medidas de posição, trata-se da mediana. Veja conceito:

Mediana: Valor que divide o conjunto ordenado em duas partes de igual frequência. Ou seja, o conjunto está
divido em dois intervalos de frequência 50%.
34

As medidas separatrizes proporcionam uma alternativa quando a média não for a medida adequada, calma! A
moda é uma alternativa, porém não analítica, por exemplo: a moda de notas de uma classe é 5,0. Quantos alunos
tiraram 5,0? Outro cenário para aplicação: quando um grupo de valores com baixa frequência apresentarem alta
magnitude.

Exemplo: A maioria dos açudes de uma região é pequena, existindo alguns poucos de médio porte e apenas um de
grande porte.

No caso da mediana, já foi visto anteriormente que:


Não agrupados ou Isolados: Graficamente, temos:

X n Xn
( )+ ( +1)
 n par: Md = 2 2
2

 n ímpar: Md = X (n+1)
2

Agrupados em intervalos:
n
−fac ↑
 Md = li + (2 )∗h
fMd

Exemplo: Determine a mediana para o conjunto de dados: 1, 3, 3, 2, 4, 2, 3.


Ordenando o conjunto, temos:

Rol: 1, 2, 2, 3, 3, 3, 4.
X4

Como n = 7 (ímpar), Md = X (n+1) = X (7+1) = X 4 (4º valor) ⇒ Md = 3 u. v.


2 2

As medidas separatrizes são: Quartil, Decil e Percentil. Seus valores são obtidos de forma análoga ao da
mediana. Assim como na mediana, será mantida a divisão dos casos em:

I. Não agrupados em intervalos ou classes;


II. Agrupados em intervalos ou classes.

Vejamos:

 Quartil (Qj): O conjunto ordenado é divido em quatro partes. Os quartis são:

 Q1: valor que determina o limite superior para os 25% primeiros valores;
Professor Cledinaldo Castro Araújo
 Q2: valor que determina o limite superior para os 50% primeiros valores. Este valor corresponde à
mediana;
 Q3: valor que determina o limite superior para os 75% primeiros valores;

Graficamente:

I. Não agrupados em intervalos ou classes;

A partir dos dados ordenados o quartil de posição j será dado genericamente por:

Q 𝑗 = X j∗(n+1)
4

𝑗∗𝑛
Observação: algumas literaturas usam como posição apenas
4

𝐣∗(𝐧+𝟏)
O quartil procurado é valor do conjunto de posição 𝟒 . Este pode ser inteiro ou não, caso não
seja inteiro, o valor do quartil será obtido a partir da interpolação:

Q 𝑗 = X 𝑖 + α(X 𝑖+1 − X 𝑖 )
Onde:
 X 𝑖 e X 𝑖+1 são os valores que delimitam o quartil procurado (posição antes e depois)
 α: parte fracionária entre as posições que delimitam o quartil;

𝑗∗(𝑛+1)
Exemplo: = 2,75 ⇒ ∝= 0,75
4

Observação: o recurso da interpolação linear será abordado no próximo tópico.

Uma opção mais simples é tomar a média aritmética entre os valores que estão nas posições que
delimitam a posição (posições inteiras antes e depois).

X 𝑖 + X 𝑖+1
Q𝑗 =
2

Exemplo: considere um conjunto de dez valores, o primeiro quartil (n=10 e j=1) é obtido da seguinte
forma:
Dados: 5 8 7 7 9 8 10 7 8 6
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Rol: 5 6 7 7 7 8 8 8 9 10

𝑄1 = 𝑋1.(10+1) = 𝑋2,75
4

2,75º é uma posição entre o 2º e o 3º valor, logo Q1 será dado por:

35
Professor Cledinaldo Castro Araújo
Q 𝑗 = X 𝑖 + α(X𝑖+1 − X 𝑖 )
Q1 = X 2 + 0,75 ∗ (X 3 − X 2 ) = 6 + 0,75 ∗ (7 − 6) ⇒ Q1 = 6,75 𝑢𝑣

Este critério será utilizado para o cálculo das demais medidas separatrizes do caso não agrupado em
intervalos.

II. Agrupados em intervalos ou classes.

Assim como na mediana, para dados agrupados em intervalos, o quartil é calculado a partir de uma
interpolação dada por:
𝑗∗𝑛
4
− 𝑓𝑎𝑐 ↑
𝑄𝑗 = 𝑙𝑖 + ( )∗ℎ
𝑓𝑄𝑗
Onde:
 𝑙𝑖 : Limite inferior da classe que contém o quartil 𝑄𝑗 ;
 𝑓𝑎𝑐 ↑: Frequência acumulada crescente da classe anterior à classe que contém o quartil 𝑄𝑗 ;
 𝑓𝑄𝑗 : Frequência absoluta simples da classe que contém o quartil 𝑄𝑗 ;
 ℎ: Amplitude da classe que contém o quartil 𝑄𝑗 ;

Exemplo: Determinar Q1 e Q3 para os seguintes dados:

Altura (m) fi fi% faci fadi


1,40 I---1,50 6 15% 6 40
2ª Classe 1,50 I---1,60 10 25% 16 34
1,60 I---1,70 6 15% 22 24
4ª Classe 1,70 I---1,80 8 20% 30 18
1,80 I---1,90 6 15% 36 10
1,90 I---I2,00 4 10% 40 4
Total 40 100% - -

Primeiro quartil: Q1

j∗n 1∗40

Identificação da classe que contém Q1 (j=1): 4 = 4 = 10 (10º valor) ⇒ 2ª classe;

𝑙𝑖 = 1,50 𝑚;

𝑓𝑎𝑐 ↑= 6;

𝑓𝑄𝑗 = 10;

ℎ = 0,10 𝑚;
10 − 6
𝑄1 = 1,50 + ( ) ∗ 0,10 ⇒ 𝑄1 = 1,54 𝑚
10
Primeiro quartil: Q3

j∗n 3∗40
 Identificação da classe que contém Q3 (j=3): 4
= 4
= 30 (30º valor) ⇒ 4ª classe;
 𝑙𝑖 = 1,70 𝑚;
 𝑓𝑎𝑐 ↑= 22;
 𝑓𝑄𝑗 = 8;
 ℎ = 0,10 𝑚;

36
Professor Cledinaldo Castro Araújo
30 − 22
𝑄1 = 1,70 + ( ) ∗ 0,10 ⇒ 𝑄3 = 1,80 𝑚
8

 Decil (Dj): O conjunto ordenado é divido em dez partes. Os decis são:

 D1: valor que determina o limite superior para os 10% primeiros valores;
 D2: valor que determina o limite superior para os 20% primeiros valores;
 Segue-se de forma sucessiva até D9. O valor D5 corresponde à mediana.

Graficamente:

I. Não agrupados em intervalos ou classes;

Analogamente, a partir dos dados ordenados o decil de posição j será dado genericamente
por:
D𝑗 = X j∗(n+1)
10

𝐣∗(𝐧+𝟏)
O decil procurado é valor do conjunto de posição 𝟏𝟎 . Este pode ser inteiro ou não, caso não seja
inteiro, o valor do decil será obtido a partir da interpolação:

D𝑗 = X 𝑖 + α(X 𝑖+1 − X 𝑖 ).
Onde:
 X 𝑖 e X 𝑖+1 são os valores que delimitam o quartil procurado (posição antes e depois)
 α: parte fracionária entre as posições que delimitam o quartil;

𝑗∗(𝑛+1)
Exemplo: = 3,3 ⇒ ∝= 0,3
10

II. Agrupados em intervalos ou classes.

Analogamente, para dados agrupados em intervalos, o decil é calculado a partir de uma interpolação
dada por:
𝑗∗𝑛
− 𝑓𝑎𝑐 ↑
10
𝐷𝑗 = 𝑙𝑖 + ( )∗ℎ
𝑓𝐷𝑗
Onde:
 𝑙𝑖 : Limite inferior da classe que contém o decil 𝐷𝑗 ;
 𝑓𝑎𝑐 ↑: Frequência acumulada crescente da classe anterior à classe que contém o decil 𝐷𝑗 ;
 𝑓𝐷𝑗 : Frequência absoluta simples da classe que contém o decil 𝐷𝑗 ;

37
Professor Cledinaldo Castro Araújo

 ℎ: Amplitude da classe que contém o decil 𝐷𝑗 ;

 Percentil ou Centil (Pj): O conjunto ordenado é divido em cem partes. Os percentis são:

 P1: valor que determina o limite superior para os 10% primeiros valores;
 P2: valor que determina o limite superior para os 20% primeiros valores;
 Segue-se de forma sucessiva até P99. O valor P50 corresponde à mediana.

Graficamente:

I. Não agrupados em intervalos ou classes;

Analogamente, a partir dos dados ordenados o percentil de posição j será dado genericamente
por:
P𝑗 = X j∗(n+1)
100

𝐣∗(𝐧+𝟏)
O percentil procurado é valor do conjunto de posição 𝟏𝟎𝟎 . Este pode ser inteiro ou não, caso não
seja inteiro, o valor do percentil será obtido a partir da interpolação:

P𝑗 = X 𝑖 + α(X 𝑖+1 − X 𝑖 ).

Onde:
 X 𝑖 e X 𝑖+1 são os valores que delimitam o quartil procurado (posição antes e depois)
 α: parte fracionária entre as posições que delimitam o quartil;

𝑗∗(𝑛+1)
Exemplo: 100
= 2,75 ⇒ ∝= 0,75

II. Agrupados em intervalos ou classes.

Analogamente, para dados agrupados em intervalos, o percentil é calculado a partir de uma


interpolação dada por:
𝑗∗𝑛
100
− 𝑓𝑎𝑐 ↑
𝑃𝑗 = 𝑙𝑖 + ( )∗ℎ
𝑓𝑃𝑗
Onde:
 𝑙𝑖 : Limite inferior da classe que contém o percentil 𝑃𝑗 ;
 𝑓𝑎𝑐 ↑: Frequência acumulada crescente da classe anterior à classe que contém o percentil 𝑃𝑗 ;
 𝑓𝑃𝑗 : Frequência absoluta simples da classe que contém o percentil 𝑃𝑗 ;
 ℎ: Amplitude da classe que contém o percentil 𝑃𝑗 ;

38
Professor Cledinaldo Castro Araújo

A partir da análise das medidas separatrizes pode-se definir uma categoria de gráficos amplamente
utilizados em métodos quantitativos, os Box Plots. Este gráfico apresenta grande aplicação na análise de
processos de gestão.

4.4.1 O Box Plot

O Box Plot ou diagrama de caixa é um recurso gráfico utilizado para analisar a variação de dados quantitativos.
Este gráfico proporciona uma análise similar ao histograma, porém com a informação dos quartis e da
identificação de valores discrepantes ou ouliers.

Estrutura do Box Plot:

Identificação dos elementos:

 𝑄1 ; 𝑄2 (𝑚𝑒𝑑𝑖𝑎𝑛𝑎) 𝑒 𝑄3
 Limite inferior: 𝑚𝑎𝑥{mín(𝑑𝑎𝑑𝑜𝑠) ; 𝑄1 − 1,5(𝑄3 − 𝑄1 )}
 Limite superior: 𝑚𝑖𝑛{máx(𝑑𝑎𝑑𝑜𝑠) ; 𝑄3 + 1,5(𝑄3 − 𝑄1 )}
 Outliers: são todos os pontos abaixo ou acima dos limites inferior ou superior respectivamente.
Trata-se de valores atípicos cuja ocorrência é considerada anômala ao comportamento dos dados.
A identificação é de suma importância uma vez que pode distorcer as análises ou pode chamar a
atenção para uma característica dos dados ainda não estudada. Exemplo: Suponha que uma pessoa
tenha conseguido viver até 150 anos, certamente trata-se de um outlier, porém abre o seguinte
precedente: como ela conseguiu? No entanto, a maioria dos casos apenas indicam anomalias
(“raridades”) ou erros de medição.
 Whisker ou fio de bigode: segmentos que ligam a caixa aos limites. Indicam a variabilidade dos
dados.

Uma aplicação interessante é a comparação entre vários grupos através do Box Plot.

Exemplo:

Os dados abaixo são as medidas da altura de 20 hastes de um processo de usinagem. Determine o Box Plot.
Para facilitar a construção os dados já estão ordenados.

39
Professor Cledinaldo Castro Araújo

860,41 903,88 915,38 934,52 936,78 941,83 950,38 993,45 1.011,26 1.014,53
1.020,70 1.036,92 1.039,19 1.066,12 1.086,98 1.097,79 1.098,04 1.120,19 1.144,94 1.214,08

Determinação dos Quartis: 𝑄𝑗 = 𝑋𝑗∗(𝑛+1) com interpolação linear.


4
 𝑄1 = 𝑋1∗(20+1) = 𝑋5,25 = 𝑋5 + 0,25 ∗ (𝑋6 − 𝑋5 ) = 936 + 0,25 ∗ (941,83 − 936,76) ⇒ 𝑄1 =
4
938,04 𝑚𝑚
 𝑄2 = 𝑋2∗(20+1) = 𝑋10,5 = 𝑋10 + 0,5 ∗ (𝑋11 − 𝑋10 ) = 1.014,53 + 0,5 ∗ (1.014,53 − 1.020,70) ⇒
4
𝑄2 = 1.017,62 𝑚𝑚
 𝑄3 = 𝑋3∗(20+1) = 𝑋15,75 = 𝑋15 + 0,75 ∗ (𝑋15 − 𝑋16 ) = 1.086,98 + 0,75 ∗ (1.086,98 −
4
1.097,79) ⇒ 𝑄3 = 1.095,09 𝑚𝑚

Determinação dos limites:


 Limite inferior:

 𝑄1 − 1,5(𝑄3 − 𝑄1 ) = 938,04 − 1,5 ∗ (1.095,09 − 938,04) = 702,47 𝑚𝑚


 Menor valor do conjunto: 860,41 mm

𝐿𝑖𝑚𝑖𝑡𝑒 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 𝑚á𝑥{860,41; 702,47} = 860,41 𝑚𝑚

 Limite Superior:

 𝑄3 + 1,5(𝑄3 − 𝑄1 ) = 1.095,09 − 1,5 ∗ (1.095,09 − 938,04) = 1.330,67 𝑚𝑚


 Maior valor do conjunto: 1.214,08 mm

𝐿𝑖𝑚𝑖𝑡𝑒 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 𝑚í𝑛{1.214,08; 1.330,67} = 1.214,08 𝑚𝑚

Construção do Box Plot:

Uma sugestão de interpretação:

O conjunto é aproximadamente simétrico, 50% dos valores se distribuem de forma homogênea na caixa,
ou seja, a mediana encontra-se aproximadamente no centro da caixa. O Whisker superior é levemente
mais alongado que o inferior o que indica uma “leve” assimetria superior. O conjunto não apresenta
outliers.

Observação: o ponto marcado no centro do retângulo (caixa) é a média.

40
Professor Cledinaldo Castro Araújo

4.5 Interpolação Linear

O cálculo das medidas de posição e medidas separatrizes para distribuições de frequências em intervalos de
classes utiliza o critério da interpolação linear. Com efeito, podemos concluir que estas medidas apresentam
valores aproximados. No caso das medidas separatrizes, busca-se um valor tal que se conheça a frequência
acumulada até ele, por exemplo: Qual valor da distribuição é o teto para 75% dos valores? Este valor é o 3º quartil
(Q3). Apresentaremos aqui a interpolação como recurso que possibilita este cálculo e para a obtenção da
frequência acumulada até um valor especificado, algumas literaturas se referem a este caso com interpolação da
ogiva de Galton. Este problema é muito comum em concursos, em especial os federais. Em engenharia, na
interpolação de indicadores de desempenho quando há atribuição de escores.

A estruturação geral consiste em inserir um valor entre dois outros. Neste caso é ignorada a linearidade ou não da
função entre os pontos considerados.

(𝑥2 , 𝑦2 )

(𝑥, 𝑦)

(𝑥1 , 𝑦1 )

O objetivo é Interpolar um ponto (𝑥, 𝑦) entre dois pontos dados (𝑥1 , 𝑦1 ) e (𝑥2 , 𝑦2 ) conhecendo-se uma das
coordenadas do ponto (𝑥 𝑜𝑢 𝑦). Assim:
𝑦 − 𝑦1 𝑦2 − 𝑦1
=
𝑥 − 𝑥1 𝑥2 − 𝑥1

Dependendo de qual coordenado do ponto a inserir seja conhecida, a expressão pode assumir as seguintes
formas:
(𝑦2 −𝑦1 )(𝑥−𝑥1 )
 X conhecido: 𝑦 = 𝑦1 + 𝑥2 −𝑥1
(𝑥2 −𝑥1 )(𝑦−𝑦1 )
 Y conhecido: 𝑥 = 𝑥1 + 𝑦2 −𝑦1
Este recurso é utilizado em algumas fórmulas já estudadas. Vamos considerar mais uma vez os seguintes dados:
Altura (m) fi fi% faci fadi
1,40 I---1,50 6 15% 6 40
1,50 I---1,60 10 25% 16 34
1,60 I---1,70 6 15% 22 24
1,70 I---1,80 8 20% 30 18
1,80 I---1,90 6 15% 36 10
1,90 I---I2,00 4 10% 40 4
Total 40 100% - -

a) Determinar o valor que acumula 75% dos valores


b) Determinar a frequência relativa acumulada crescente até o valor 1,75 m.

Resolução:
a) O valor procurado acumula até ele 25%, ou seja, 25% de 40. A frequência procurada é 10. Este valor
corresponde ao quartil Q1. Pela fórmula, este valor é Q1= 1,54 m. Agora utilizaremos a interpolação
linear para obter o mesmo valor. Vejamos o histograma da distribuição:

41
Professor Cledinaldo Castro Araújo
A frequência 10 abrange 6 da 1ª classe e 4 da 2ª classe.

10

6 6 6

1,40 I---1,50 1,50 I---1,60 1,60 I---1,70 1,70 I---1,80 1,80 I---1,90 1,90 I---I2,00

De acordo com o histograma, temos que:

} Frequências

} Alturas
10 1,60 − 1,50
= ⇒ (𝑥 − 1,50) ∗ 10 = 4 ∗ (1,60 − 1,50) ⇒ 𝑥 = 1,54 𝑚
4 𝑥 − 1,50

b) A frequência relativa acumulada crescente até 1,75 m é dada pela soma das frequências das classes
anteriores e mais a frequência de 1,70 a 1,75, ou seja:

(6 + 10 + 6 + 𝑓)
𝑓𝑖% = ∗ 100, 𝑜𝑛𝑑𝑒 𝑓 é 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 1,70 𝑒 1,75 𝑚
40
Analogamente:

} Frequências

} Alturas
8 1,80 − 1,70
= ⇒ 𝑓 ∗ (1,80 − 1,70) = 8 ∗ (1,75 − 1,70) ⇒ 𝑓 = 4, 𝑙𝑜𝑔𝑜:
𝑓 1,75 − 1,70

42
Professor Cledinaldo Castro Araújo
(6 + 10 + 6 + 4)
𝑓𝑖% = ∗ 100 ⇒ 𝑓𝑖% = 65%
40

4.6 Outras Medidas de Posição


De acordo com as situações analisadas anteriormente, a média aritmética é amplamente utilizadas.
Porém, ela não é adequada para todos os tipos de dados, não pode ser empregada, por exemplo, para média de
crescimento ou proporções de velocidades, ou ainda quando os dados são medidas que apresentam crescimento
onde uma medida subsequente depende uma medida prévia, por exemplo, crescimento de populações. As
situações descritas acima são aplicações de outras medidas de posição, respectivamente a média harmônica e a
média geométrica. Além destas, também abordaremos neste capítulo a média ponderada.

 Média Harmônica: A média aritmética é adequada para caso em que as grandezas relacionadas são
diretamente proporcionais, por exemplo: peças vendidas por semana, acidentes por dia, etc. A média
harmônica, também chamada de média subcontrária, está relacionada ao cálculo matemático das situações
envolvendo as grandezas inversamente proporcionais. Por exemplo, velocidade de um móvel em relação ao
tempo. A média harmônica de um conjunto de dados é o inverso da média aritmética dos inversos, assim:
𝑛
𝑋ℎ = 1 1 1 1
𝑥1
+𝑥 + 𝑥 + ⋯+ 𝑥
2 3 𝑛

Ou ainda:
𝑛
𝑋ℎ = 1
∑𝑛𝑖=1
𝑥𝑖

A média aritmética é muitas vezes utilizada erroneamente em locais que exigem a média
harmônica. Um exemplo é o cálculo da velocidade média em um percurso de ida e volta em uma mesma via, em
que a ida é percorrida a 60 km/h e a volta a 40 km/h a média aritmética de 50 está incorreta. A velocidade
média no percurso total é a média harmônica de 40 e 60, ou seja, 48 km/h. Isto se deve ao fato de que, como os
dois trechos tem o mesmo comprimento, quanto menor for a velocidade, mais do tempo total é despendido
àquela velocidade e, então, ela tem um peso maior na composição da velocidade média. Vejamos:

2 2 2 120
𝑋ℎ = 1 1 = 2+3 = 5 = 2. ⟹ 𝑋ℎ = 48 𝑘𝑚/ℎ
+ 5
60 40 120 120

Importante: A média harmônica é utilizada para determinar a média de proporções como preços por
Exemplo:
quantidade e velocidade.

Suponhamos que o leitor compra uma dúzia de laranjas ao preço de R$ 1,00 cada, uma semana depois,
compra outra dúzia R$ 2,00 cada. É comum afirmar, erroneamente, que o preço médio foi R$ 1,50. Este é o
preço médio por reais gastos, mas o preço médio por dúzia de laranja comprada é dado pela média
harmônica, assim:

 Semana 1: R$ 1,00 /dúzia;


 Semana 1: R$ 2,00 /dúzia;

2 2 2 2
𝑋ℎ = 1 1 = 2+1 = 3 = 2. ⟹ 𝑋ℎ = 𝑅$ 1,33
+ 3
1 2 2 2

43
Professor Cledinaldo Castro Araújo

 Média Geométrica: Além das médias de proporções e preços, há também os casos de crescimentos onde
uma medida subsequente depende uma medida prévia, por exemplo, crescimento populacional aumenta
proporcionalmente ao número de habitantes; aumentando-se o número de nascimentos, aumenta a
população, o que por sua vez leva a mais nascimentos. Foi esse o problema que preocupou Malthus, que
visualizou a população mundial excedendo as fontes de alimentos e morrendo de fome.

A média geométrica de um conjunto de números positivos é definida como o produto de todos os membros
do conjunto elevado ao inverso do número de membros. Indica a tendência central ou o valor típico de um
conjunto de números usando o produto dos seus valores (diferente da média aritmética, que usa a soma dos
valores). A média geométrica é definida como n-ésima raiz (onde n é a quantidade de termos)
da multiplicação dos termos. Assim:

𝑋𝐺 = 𝑛√𝑥1 . 𝑥2 . 𝑥3 … . 𝑥𝑛
Ou ainda:
𝑛 𝑛
𝑋𝐺 = √∏ 𝑥𝑖
𝑖=1
A média geométrica é usada, por exemplo, para calcular a variação percentual média após variações
percentuais sucessivas de determinado valor. Por exemplo, se o valor de uma ação no trimestre teve
aumentos mensais consecutivos de 5%, 4% e 2%. A variação mensal média no trimestre pode ser calculada por
meio da média geométrica dos fatores multiplicativos de cada variação mensal, assim:

 Mês 1: x + 5% de x = 1,05x
 Mês 2: x + 4% de x = 1,04x
 Mês 3: x + 2% de x = 1,02x

3
𝑋𝐺 = √1,05.1,04.1,02 ⟹ 𝑋𝐺 = 1,0366

Assim, o aumento mensal médio dessa ação foi de aproximadamente 3,66%.

A média geométrica é muito utilizada na composição de índices, por exemplo, os índices de Fisher de preço e
quantidade. Vejamos:
𝐼0,𝑡 = 2√𝐿0,𝑡 . 𝑃0,𝑡

Importante: A média Geométrica é utilizada para determinar a média de uma série com comportamento
próximo ao de
A média uma progressão
harmônica geométrica,
é uma das comode
três médias aumentos sucessivos
Pitágoras. em os
Para todos queconjuntos
um valor de
depende
dados do
valor do seu antecessor e na composição de índices preços.

Propriedade:
A média geométrica é menor ou igual a média aritmética, que por sua vez a maior ou igual a média
harmônica. Assim:
𝑋𝐻 ≤ 𝑋𝐺 ≤ 𝑋
Demonstração:

1. Média aritmética e média geométrica:

Tomando dois valores: 𝑥1 𝑒 𝑥2 𝑒 partindo de (𝑥1 −𝑥2 )2 ≥ 0, temos:

44
Professor Cledinaldo Castro Araújo

𝑥1 2 − 2. 𝑥1 . 𝑥2 +𝑥2 2 ≥ 0 ⟹ 𝑥1 2 +𝑥1 2 + 2. 𝑥1 . 𝑥2 − 2. 𝑥1 . 𝑥2 − 2. 𝑥1 . 𝑥2 ≥ 0
(𝑥1 +𝑥2 )2 − 4. 𝑥1 . 𝑥2 ≥ 0 ⟹ (𝑥1 +𝑥2 )2 ≥ 4. 𝑥1 . 𝑥2 ⟹ 𝑥1 +𝑥2 ≥ √4. 𝑥1 . 𝑥2
𝑥1 +𝑥2
𝑥1 +𝑥2 ≥ 2. √𝑥1 . 𝑥2 ⟹ ≥ √𝑥1 . 𝑥2 ⟹ 𝑋 ≥ 𝑋𝐺
2

2. Média geométrica e média harmônica:

Da demonstração anterior, temos que:

𝑛 𝑛 ∑𝑛𝑖=1 𝑦𝑖
√∏ 𝑦𝑖 ≤
𝑖=1 𝑛
1
Fazendo 𝑦𝑖 = e substituindo na expressão acima, temos:
𝑥𝑖

𝑛 1 𝑛 1
𝑛 𝑛1 ∑𝑖=1 𝑥𝑖 1 ∑𝑖=1
𝑥𝑖 𝑛 𝑛 𝑛
√∏ ≤ ⟹𝑛 𝑛 ≤ ⟹ 1 ≤ √∏ 𝑥𝑖 ⟹ 𝑋𝐻 ≤ 𝑋𝐺
𝑖=1 𝑥𝑖 𝑛 √∏𝑖=1 𝑥𝑖 𝑛 ∑𝑛𝑖=1 𝑖=1
𝑥𝑖

Logo: 𝑋𝐻 ≤ 𝑋𝐺 ≤ 𝑋

A propriedade acima pode também ser verificada da seguinte forma: A média harmônica é uma das
três médias de Pitágoras. Para todos os conjuntos de dados positivos que contêm, pelo menos um par de
valores distintos, a média harmônica é sempre a mínima das três médias, enquanto que a média aritmética é
sempre a maior das três e a média geométrica está sempre no meio. (Se todos os valores de um conjunto de
dados não vazio são iguais, as três médias são sempre iguais umas às outras. Por exemplo, as médias
harmônica, geométrica e aritmética de {2, 2, 2} são todas iguais a 2.

Graficamente:

Fonte: https://pt.wikipedia.org/wiki/Media_harmonica

A figura acima é uma construção geométrica das três médias de Pitágoras de dois números a e b. A média
harmônica é denotada por H na cor roxa. O Q denota a quarta média, a média quadrática.

 Média Ponderada: Na média aritmética simples, os valores são somados e divididos pela quantidade de
termos adicionados. A média ponderada é calculada por meio do somatório das multiplicações entre valores
e pesos divididos pelo somatório dos pesos. Os pesos indicam que cada valor do conjunto apresenta um nível
de importância diferente dentro da composição da média. Na média simples os valores apresentam o mesmo
nível de importância. Assim:

𝑎1 . 𝑥1 + 𝑎2 . 𝑥2 + 𝑎3 . 𝑥3 + ⋯ + 𝑎𝑛 . 𝑥𝑛
𝑋𝑃 =
𝑎1 + 𝑎2 + 𝑎3 + ⋯ + 𝑎𝑛

Onde: 𝑎1 , 𝑎2 , 𝑎3 , … , 𝑎𝑛 : 𝑠ã𝑜 𝑜𝑠 𝑝𝑒𝑠𝑜𝑠 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑥1 , 𝑥2 , 𝑥, … , 𝑥𝑛

45
Professor Cledinaldo Castro Araújo
Ou ainda:
∑𝑛𝑖=1 𝑎𝑖 . 𝑥𝑖
𝑋𝑃 =
∑𝑛𝑖=1 𝑎𝑖

Exemplo: A nota final dos alunos da Universidade de Fortaleza (Unifor) é dada pela composição das avaliações
AV1, AV2 e AV3 calculada da seguinte forma:

𝑨𝑽𝟏+𝑨𝑽𝟐
2
+ 𝑨𝑽𝟑
𝑁𝑜𝑡𝑎 =
2
O que equivale a:
𝑨𝑽𝟏+𝑨𝑽𝟐 𝑨𝑽𝟏+𝑨𝑽𝟐+2.𝑨𝑽𝟑
2
+ 𝑨𝑽𝟑 2 𝟏. 𝑨𝑽𝟏 + 𝟏. 𝑨𝑽𝟐 + 𝟐. 𝑨𝑽𝟑
𝑁𝑜𝑡𝑎 = = =
2 2 𝟒
Com:
 AV1: Peso 1;
 AV2: Peso 1;
 AV3: Peso 2;

E que também pode ser escrito assim:

𝑁𝑜𝑡𝑎 = 𝟎, 𝟐𝟓. 𝑨𝑽𝟏 + 𝟎, 𝟐𝟓. 𝑨𝑽𝟐 + 𝟎, 𝟓𝟎. 𝑨𝑽𝟑

Considerando que um aluno que tirou: AV1 = 8,0; AV2 = 8,0 e AV3 = 6,0. A sua nota final será:

𝑁𝑜𝑡𝑎 = 0,25.8,0 + 0,25.8,0 + 0,50.6,0 = 2,0 + 2,0 + 3,0 ⟹ 𝑁𝑜𝑡𝑎 = 7,0

O índice Geral de Preços é considerado como medida padrão (ou oficial) da inflação do país. Trata-se de
um índice híbrido, publicado pela revista Conjuntura Econômica da FGV. Este índice é a composição da média
ponderada de outros índices, vejamos:

𝑰𝑮𝑷 = 𝟎, 𝟔. 𝐼𝑃𝐴 + 𝟎, 𝟑. 𝐼𝐶𝑉𝑅𝐽 + 𝟎, 𝟏. 𝐼𝐶𝐶𝑅𝐽


Ou ainda:
𝟔. 𝐼𝑃𝐴 + 𝟑. 𝐼𝐶𝑉𝑅𝐽 + 𝟏. 𝐼𝐶𝐶𝑅𝐽
𝑰𝑮𝑷 =
𝟏𝟎
Onde:

 Índice de Preços ao Consumidor (IPA) com peso 6;


 Índice do Custo de Vida com peso 3;
 Índice do Custo da Construção com peso 1;

46
Professor Cledinaldo Castro Araújo

Capítulo 5
Medidas de Dispersão

5 Medidas de Dispersão

Ao se fazer a descrição dos dados, além de verificar o centro da distribuição deles através das medidas
de tendência central é prescindível verificar também se os dados se comportam de forma homogênea ou
heterogênea, e isso será possível através das medidas de dispersão.
Essa verificação é importante, pois através delas podem-se tomar decisões mais consistentes e eficazes.
Um exemplo disso eram que os bancos, há a alguns anos atrás, costumavam exigir que os clientes formassem filas
separados para os diversos guinches, mas atualmente passaram adotar a fila única. O motivo dessa modificação
foi que o tempo médio de espera era o mesmo para ambos os formatos de filas, não afetando a eficiência dos
caixas, mas a adoção de fila única ocorreu ao fato de os clientes preferirem tempos de espera com menor
variação. Assim, é que milhares de bancos efetuaram essa modificação que resultou em uma variação menor (e
clientes mais satisfeitos), mesmo que a média de tempo de atendimento não tenha sido afetada.
Com isso, pode-se concluir que as medidas de dispersão avaliam a variabilidade dos dados com relação à
sua média. As medidas de dispersão mais usadas são a amplitude total, variância, desvio padrão e coeficiente de
variação.
A primeira medida de dispersão a ser analisada nesta nota de aula será amplitude total, como segue no
tópico seguinte:

5.1 Pequenos Conjuntos de dados

 AMPLITUDE TOTAL (At): A amplitude total é a medida mais simples de variação que existe, e é obtida
através da diferença entre o maior e o menor dos valores da série. A ressalva para esta medida simples de
dispersão é que por não levar em consideração os valores intermediários, essa medida não possibilitará
analisar como os dados estão distribuídos e/ou concentrados, visto que só é feita uma análise dos extremos deste.

At = Xmáx – Xmin

Pelo exemplo abaixo é possível verificar que se não for levado em consideração os valores em si,
pode-se tomar conclusões bastante equivocadas, pois amplitude total é a mesma para ambas as turmas, mas
os valores de cada uma delas são visivelmente diferentes.

Exemplo: Notas de provas de duas turmas de 9 alunos

a) Turma 1: 1, 1, 1, 2, 2, 2, 3, 3, 3

 At = 3 - 1 = 2

b) Turma 2: 8, 8, 8, 9, 9, 9, 10, 10, 10

 At = 10 - 8 = 2

Observação: A amplitude total é uma medida simples, porém limitada uma vez que analisa somente a
amplitude de dois valores do conjunto de dados. Quanto maior for a quantidade de dados, menos
recomendado será sua utilização.

47
Professor Cledinaldo Castro Araújo

A amplitude total é utilizada na construção de uma distribuição de frequências por intervalos, tal
como foi estudado em tópico anterior. Outra aplicação comum da amplitude total é em cartas de controle
para medidas de individuais. Este assunto não será tratado nesta nota de aula.
Assim, a segunda medida de dispersão que realmente pode ser utilizada para análise é a variância,
como segue.

 VARIÂNCIA (S²): A variância é uma medida de dispersão que mensura a variabilidade dos dados, através
da soma do quadrado dos desvios pela quantidade de valores da variável menos um (n-1) no caso
amostral, e por N se for populacional. Uma justificativa desta diferenciação nas expressões está no
APENDICE 6.
Pela propriedade da média aritmética, verifica-se que a soma dos desvios será sempre zero, não
sendo possível analisar a variabilidade. Para que esse problema seja contornando, os desvios são elevados
ao quadrado. Com isso, a notação matemática da variância é:

Variância amostral Variância populacional

x  X x 


n n
2 2
i i
S2  i1 2  i1 , onde
n1 N
xi : Valores da variável xi :Valores da variável
X : Média aritmética simples µ: Média populacional
n :Número de valores da amostra N: Número de valores da população

Fórmula reduzida:

∑𝑛
𝑖=1(𝑥𝑖 −𝑥)
2
Partindo de 𝑆 2 = , podemos utilizar a fórmula reduzida, obtida da seguinte forma:
𝑛−1
2 2
𝑇𝑒𝑚𝑜𝑠 𝑞𝑢𝑒: (𝑥𝑖 − 𝑥)2 = 𝑥𝑖 − 2. 𝑥𝑖 𝑥 + 𝑥
2 2
2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2 ∑𝑛𝑖=1(𝑥𝑖2 − 2𝑥𝑖 𝑥 + 𝑥 ) ∑𝑛𝑖=1 𝑥𝑖2 − 2𝑥 ∑𝑛𝑖=1 𝑥𝑖 − ∑𝑛𝑖=1 𝑥
𝑆 = = =
𝑛−1 𝑛−1 𝑛−1
2
∑𝑛𝑖=1 𝑥𝑖2 − 𝑛. 𝑥
𝑆2 =
𝑛−1
Uma medida alternativa à variância é o desvio médio, dados pela média dos desvios absolutos em
torno da média:
∑𝑛𝑖=1|𝑥𝑖 − 𝑥|
𝐷𝑀 =
𝑛

Apesar de ser uma medida interessante, o desvio médio é um estimador viciado ou tendencioso da
variabilidade populacional.
Observe que no cálculo da variância amostral (S²), deve-se dividir a soma dos quadrados dos desvios por “n-
1”e não por “n” apenas. Isso se dá, pois através de estudos que serão vistos em Estimação de Parâmetros,
a variância amostral (S²) tende a estimar de forma distorcida a variância populacional (²) se for dividido
apenas por “n”, então para que S² seja um estimador não viciado ou não tendencioso de ² deve-se dividir
por “n-1”.
Pode-se demostrar que E(S²) = ², ou seja, a esperança da variância amostral é igual a variância
populacional, ou seja, a variância amostral com divisão da sua fórmula por “n-1” representa de forma eficaz
e inferencial a variância populacional, sem ter analisado a população em si (Apêndice).

Importante: Quando o tamanho da amostral é suficientemente grande (é usual considerar um valor de n


superior a 30) não há praticamente diferença entre S² e ²
48
Professor Cledinaldo Castro Araújo

Após, as observações anteriores, faz-se necessário verificar a medida de dispersão realmente


utilizada na tomada de decisão, o desvio padrão.

 DESVIO PADRÃO (S): O desvio padrão é uma medida de variabilidade dos valores com relação à média
deles, mas ao contrário da variância, esta medida utiliza-se à mesma unidade de medida dos dados
originais, por isso esta é utilizada com maior frequência que a variância (S²). A notação matemática do
desvio padrão, que é a raiz quadrada da variância é como segue:

∑𝑛 (𝑥𝑖 − 𝑥)2
𝑆 = √ 𝑖=1 𝑜𝑢 𝑠𝑖𝑚𝑝𝑙𝑒𝑠𝑚𝑒𝑛𝑡𝑒 𝑆 = √𝑆 2
𝑛−1

A última medida de dispersão a ser analisada é o coeficiente de variação, como segue no próximo
tópico.

 COEFICIENTE DE VARIAÇÃO DE PEARSON (CV): O coeficiente de variação é uma medida de dispersão


relativa que avalia o quanto o desvio padrão representa com relação à média aritmética de um conjunto
de dados. Assim, quanto menor for o CV, mais homogêneo será o conjunto de dados, ou seja, com menor
variabilidade entre eles, caso contrário haverá uma grande variabilidade. Assim, a notação do coeficiente
de variação é a seguinte:
𝑆
𝐶𝑉 = ∗ 100
𝑥

Uma alternativa ao Coeficiente Variação de Pearson é o Coeficiente de Thorndike, dada por:

𝑆
𝐶𝑉 = ∗ 100
𝑀𝑑

No caso, não é correto comparar a dispersão relativa utilizando medidas diferentes, ou seja, deve-se
compara grupos de dados com o uso da mesma medida. Mas para afirmar se os dados são ou não passíveis
de grandes ou pequenas variabilidades, adota-se o ponto de corte percentual como segue:

Importante: Se CV ≤ 30% (Há baixa dispersão entre os dados, ou seja, eles são considerados homogêneos)

Apesar destes pontos de cortes poderem ser utilizados como referências, é bem verdade que a
homogeneidade depende muito da variável, por exemplo: em mecânica de precisão 30% de desvio é uma
exorbitância. De qualquer forma à medida que o CV aumenta, a homogeneidade diminui. Alguns autores
consideram outros valores para este ponto de corte, os mais comuns são 10% e 50%.

 PROPRIEDADES DAS MEDIDAS DE DISPERSÃO: As mediadas de dispersão apresentam propriedades


importantes. Segue abaixo as principais propriedades para a variância, desvio padrão e coeficiente de
variação.

Sejam xi cada valor do conjunto e c uma constante não nula, temos que:

Propriedades da Variância:

49
Professor Cledinaldo Castro Araújo
As propriedades da variância são verificadas a partir de propriedades de somatório, assim:

I. A variância de uma lista de constantes c é igual a zero;

∑𝑛
𝑖=1(𝑐−𝑐)
2
 𝑥𝑖 = 𝑐 ⇒ 𝑆 2 = 𝑛−1
⇒ 𝑆2 = 0

II. Ao somar ou subtrair uma mesma constante c a todos os valores do conjunto de dados, o valor da
variância não altera;
2
2
∑𝑛
𝑖=1(𝑥𝑖 ±𝑐−(𝑋±𝑐)) ∑𝑛
𝑖=1(𝑥𝑖 −𝑋)
 𝑥𝑖 ± 𝑐 ⇒ 𝑆 = 2
𝑛−1
⇒ 𝑛−1
⇒ 𝑆2

III. Se multiplicar ou dividir cada valor do conjunto de dados por uma mesma constante c, a variância
ficará multiplicada ou dividida, respectivamente, pela constante ao quadrado (c²).

2 2 2
∑𝑛
𝑖=1(𝑥𝑖 .𝑐−𝑋.𝑐) ∑𝑛 2
𝑖=1 𝑐 .(𝑥𝑖 −𝑋) 𝑐 2 .∑𝑛
𝑖=1 (𝑥𝑖 −𝑋)
 𝑥𝑖 . 𝑐 ⇒ 𝑆 2 = 𝑛−1
⇒ 𝑛−1
⇒ 𝑛−1
⇒ 𝑐2. 𝑆2
2 2
𝑥𝑖 𝑋 𝑥𝑖 𝑋 2
∑𝑛
𝑖=1( −. ) ∑𝑛
𝑖=1( − ) ∑𝑛
1
𝑖=1𝑐2 (𝑥𝑖 −𝑋) ∑𝑛
2
𝑥𝑖 1 𝑖=1(𝑥𝑖 −𝑋) 1
 2 𝑐 𝑐 𝑐 𝑐
𝑐
⇒𝑆 = 𝑛−1
⇒ 𝑛−1
⇒ 𝑛−1
⇒ 𝑐2 . 𝑛−1
⇒ 𝑐2 . 𝑆2

Propriedades do Desvio Padrão

As propriedades do desvio padrão decorrem das propriedades I, II e III da variância, assim:

I. O desvio padrão de uma lista de constantes c é igual a zero;

 𝑥𝑖 = 𝑐 ⇒ 𝑆 2 = 0 ⇒ 𝑆 = √0 ⇒ 𝑆 = 0

I. Ao somar ou subtrair uma mesma constante c a todos os valores do conjunto de dados, o valor do
desvio padrão não altera;

 𝑥𝑖 ± 𝑐 ⇒ 𝑆 2 ⇒ 𝑆 = √𝑆 2

II. Ao multiplicar ou dividir cada valor do conjunto de dados por uma mesma constante c, o desvio
padrão ficará multiplicada ou dividida, respectivamente, pela constante c.

 𝑥𝑖 . 𝑐 ⇒ 𝑐 2 . 𝑆 2 ⇒ √𝑐 2 . 𝑆 2 = 𝑐. 𝑆

𝑥𝑖 𝑆2 𝑆2 𝑆
 𝑐
⇒ 𝑐 2 = √𝑐 2 = 𝐶

Propriedade do Coeficiente de Variação de Pearson

Uma propriedade do coeficiente de variação de Pearson pode ser verificada a partir das propriedades I, II e
III da média e desvio padrão, assim:

I. O coeficiente de variação de Pearson de uma lista de constantes c é igual a zero;

𝑆 0
 𝑥𝑖 = 𝑐 ⇒ 𝑋 = 𝑐 𝑒 𝑆 = 0 ⇒ 𝐶𝑉 = 𝑋 . 100 = 𝑐 . 100 ⇒ 𝐶𝑉 = 0%

50
Professor Cledinaldo Castro Araújo
II. Ao somar ou subtrair uma mesma constante c a todos os valores do conjunto de dados, o valor do
coeficiente de variação de Pearson sofre as seguintes alterações;

𝑆 𝑆
 𝑥𝑖 ± 𝑐 ⇒ 𝑋 ± 𝑐 𝑒 𝑆 𝑖𝑛𝑎𝑙𝑡𝑒𝑟𝑎𝑑𝑜 ⇒ 𝐶𝑉 = . 100 ⇒ 𝐶𝑉 = . 100
𝑋 𝑋±𝑐

III. Ao multiplicar ou dividir cada valor do conjunto de dados por uma mesma constante c, o coeficiente
de variação fica inalterado.

𝑆 𝑆.𝑐 𝑆
 𝑥𝑖 . 𝑐 ⇒ 𝑋. 𝑐 𝑒 𝑆. 𝑐 ⇒ 𝐶𝑉 = . 100 = ⇒ 𝐶𝑉 = . 100 (𝑖𝑛𝑎𝑙𝑡𝑒𝑟𝑎𝑑𝑜)
𝑋 𝑋.𝑐 𝑋

𝑆
𝑥𝑖 𝑋 𝑆 𝑆 𝑆
 𝑐
⇒ 𝑐
𝑒 𝑐
⇒ 𝐶𝑉 = 𝑋 . 100 = 𝑐
𝑋
. 100 ⇒ 𝐶𝑉 = 𝑋
. 100 (𝑖𝑛𝑎𝑙𝑡𝑒𝑟𝑎𝑑𝑜)
𝑐

5.2 Grandes conjuntos de dados: Discretos

 AMPLITUDE TOTAL (At): Não há alteração no cálculo da amplitude total. Assim:

At = Xmáx – Xmin

 VARIÂNCIA (S²):A definição e as propriedades da variância continuam válidas, a mudança na estrutura da


fórmula é a inclusão da frequência absoluta. Com isso, a notação matemática da variância passa a ser:

Variância amostral Variância populacional

x  X . fi x  . fi


k k
2 2
i i
S2  i1 2  i1 , onde
n1 N
xi : Valores da variável xi :Valores da variável
X : Média aritmética simples µ: Média populacional
n: Número de valores da amostra N: Número de valores da população
fi: frequência absoluta do valor i fi: frequência absoluta do valor i

Fórmula reduzida:

∑𝑛 2
𝑖=1(𝑥𝑖 −𝑥) .𝑓𝑖
Partindo de 𝑆 2 = 𝑛−1
, podemos utilizar a fórmula reduzida, obtida da seguinte forma:

2
𝑇𝑒𝑚𝑜𝑠 𝑞𝑢𝑒: (𝑥𝑖 − 𝑥)2 . 𝑓𝑖 = 𝑥𝑖2 . 𝑓𝑖 − 2. 𝑥𝑖 𝑥. 𝑓𝑖 + 𝑥 . 𝑓𝑖
2 2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2 . 𝑓𝑖 ∑𝑛𝑖=1(𝑥𝑖2 − 2𝑥𝑖 𝑥 + 𝑥 ). 𝑓𝑖 ∑𝑛𝑖=1 𝑥𝑖2 . 𝑓𝑖 − 2𝑥 ∑𝑛𝑖=1 𝑥𝑖 . 𝑓𝑖 − ∑𝑛𝑖=1 𝑥 . 𝑓𝑖
𝑆2 = = =
𝑛−1 𝑛−1 𝑛−1
2
2
∑𝑛𝑖=1 𝑥𝑖2 . 𝑓𝑖 − 𝑛. 𝑥
𝑆 =
𝑛−1
 DESVIO PADRÃO (S): A definição de Desvio Padrão continua a mesma, a mudança na estrutura da fórmula
é a inclusão da frequência absoluta. Com isso, a notação matemática do Desvio Padrão passa a ser:

51
Professor Cledinaldo Castro Araújo

∑𝑛 (𝑥𝑖 − 𝑥)2 𝑓𝑖
𝑆 = √ 𝑖=1 𝑜𝑢 𝑠𝑖𝑚𝑝𝑙𝑒𝑠𝑚𝑒𝑛𝑡𝑒 𝑆 = √𝑆 2
𝑛−1

 COEFICIENTE DE VARIAÇÃO DE PEARSON (CV): Não há alteração nas formas de cálculo do coeficiente de
variação de Pearson. Todas as propriedades também continuam válidas, assim:

𝑆
𝐶𝑉 = ∗ 100
𝑥

Uma alternativa ao Coeficiente Variação de Pearson é o Coeficiente de Thorndike, dada por:

𝑆
𝐶𝑉 = ∗ 100
𝑀𝑑
Vejamos um exemplo:

Os dados abaixo correspondem ao número de apartamentos vendidos pela construtora GM Branco em


vinte meses.
Nº de apartamentos vendidos fi (meses)
0 2
1 5
2 4
3 2
4 4
5 3
Total 20

Calcular: Amplitude Total, Variância, Desvio Padrão e Coeficiente de Variação de Pearson.

 Amplitude Total: At = Ximá - Ximin = 5 - 0 =5 apartamentos vendidos ⇒ At = 5 apartamentos vendidos


 Variância:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2 . 𝑓𝑖
𝑆2 =
𝑛−1

Para o cálculo da variância, é necessário antes calcular a média. Incluindo na Distribuição de Frequências as
colunas com os cálculos, temos:

Nº de apartamentos vendidos fi (meses) Xi.fi (𝑥𝑖 − 𝑥)2 . 𝑓𝑖

0 2 0.2=0 (0-2,5)2.2=12,5
1 5 1.5=5 (1-2,5)2.5=11,3
2 4 2.4=8 (2-2,5)2.4=1,0
3 2 3.2=6 (3-2,5)2.2=0,5
4 4 4.4=16 (4-2,5)2.4=9,0
5 3 5.3=15 (5-2,5)2.3=18,8
Total 20 50 53

Assim:

52
Professor Cledinaldo Castro Araújo

 Média Aritmética:

∑𝑘𝑖=1 𝑥𝑖 . 𝑓𝑖 0.2 + 1.5 + 2.4 + 3.2 + 4.4 + 5.3 50


𝑋= = = ⇒ 𝑋 = 2,5 𝐴𝑝𝑎𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑜𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠
𝑛 20 20

∑𝑘 2
𝑖=1(𝑥𝑖 −𝑥) .𝑓𝑖
 Variância: 𝑆 2 = 𝑛−1

(0 − 2,5)2 . 2 + (1 − 2,5)2 . 5 + (2 − 2,5)2 . 4 + (3 − 2,5)2 . 2 + (4 − 2,5)2 . 4 + (5 − 2,5)2 . 3 53


= =
20 − 1 19

𝑆 2 = 2,8 (𝑎𝑝𝑎𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑜𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠)2

 Desvio Padrão: 𝑆 = √𝑆 2 = √2,8 ⇒ 𝑆 = 1,7 𝑎𝑝𝑎𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑜𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠

𝑆 1,7
 Coeficiente de Variação de Pearson: 𝐶𝑉 = ∗ 100 = . 100 ⇒ 𝐶𝑉 = 66,8%
𝑥 2,5

5.3 Grandes conjuntos de dados: Contínuos

 AMPLITUDE TOTAL (At): Não há alteração no cálculo da amplitude total. Assim:

At = Xmáx – Xmin

 VARIÂNCIA (S²): A definição e as propriedades da variância continuam válidas, a mudança na estrutura da


fórmula é a inclusão da frequência absoluta. Com isso, a notação matemática da variância passa a ser:

Variância amostral Variância populacional

x  X . fi x  . fi


k k
2 2
im im
S2  i1 2  i1 , onde
n1 N
xi m: Ponto Médio da Classe i xi m: Ponto Médio da Classe i
X : Média aritmética simples µ: Média populacional
n : Número de valores da amostra N: Número de valores da população
fi: frequência absoluta do valor i fi: frequência absoluta do valor i

Fórmula reduzida:

∑𝑘 2
𝑖=1(𝑥𝑖𝑚 −𝑥) .𝑓𝑖
Partindo de 𝑆 2 = 𝑛−1
, podemos utilizar a fórmula reduzida, obtida da seguinte forma:

2 2
𝑇𝑒𝑚𝑜𝑠 𝑞𝑢𝑒: (𝑥𝑖𝑚 − 𝑥)2 . 𝑓𝑖 = 𝑥𝑖𝑚 . 𝑓𝑖 − 2. 𝑥𝑖𝑚 𝑥. 𝑓𝑖 + 𝑥 . 𝑓𝑖
2 2
2
∑𝑘𝑖=1(𝑥𝑖𝑚 − 𝑥)2 . 𝑓𝑖 ∑𝑛𝑖=1(𝑥𝑖𝑚
2
− 2𝑥𝑖𝑚 𝑥 + 𝑥 ). 𝑓𝑖 ∑𝑛𝑖=1 𝑥𝑖𝑚
2
. 𝑓𝑖 − 2𝑥 ∑𝑛𝑖=1 𝑥𝑖𝑚 . 𝑓𝑖 − ∑𝑛𝑖=1 𝑥 . 𝑓𝑖
𝑆 = = =
𝑛−1 𝑛−1 𝑛−1
2
∑𝑘𝑖=1 𝑥𝑖𝑚
2
. 𝑓𝑖 − 𝑛. 𝑥
𝑆2 =
𝑛−1

53
Professor Cledinaldo Castro Araújo

 DESVIO PADRÃO (S): A definição de Desvio Padrão continua a mesma, a mudança na estrutura da fórmula
é a inclusão da frequência absoluta. Com isso, a notação matemática do Desvio Padrão passa a ser:
∑𝑘 (𝑥𝑖 − 𝑥)2 𝑓𝑖
𝑆 = √ 𝑖=1 𝑜𝑢 𝑠𝑖𝑚𝑝𝑙𝑒𝑠𝑚𝑒𝑛𝑡𝑒 𝑆 = √𝑆 2
𝑛−1

 COEFICIENTE DE VARIAÇÃO DE PEARSON (CV): Não há alteração nas formas de cálculo do coeficiente de
variação de Pearson. Todas as propriedades também continuam válidas, assim:

𝑆
𝐶𝑉 = ∗ 100
𝑥

Uma alternativa ao Coeficiente Variação de Pearson é o Coeficiente de Thorndike, dada por:

𝑆
𝐶𝑉 = ∗ 100
𝑀𝑑
Vejamos um exemplo:
Uma amostra de 80 corpos de prova de concreto forneceu a seguinte distribuição de resistências de ruptura:

Resistência (psi*) Nº de medições


50 |---- 60 2
60 |---- 70 15
70 |---- 80 50
80 |---- 90 10
90 |----|100 3
TOTAL 80
(*) Psi (pound force per square inch) ou libra força por polegada quadrada

Calcular: Amplitude Total, Variância, Desvio Padrão e Coeficiente de Variação para distribuição acima:

 Amplitude Total: At = Ximáx.-Ximin = 100 - 50=50 psi ⇒ At = 50 psi

Observação: quando o limite superior da última classe está incluso (fechado), o At será dado pela diferença
entre o limite superior da classe e o limite da primeira classe.

Para o cálculo da variância, é necessário antes calcular a média, assim:

Incluindo na Distribuição de Frequências as colunas com os cálculos, temos:

Resistência (psi*) Nº de medições (fi) Xim Xim.fi (𝑥𝑖 − 𝑥)2 . 𝑓𝑖


50 |---- 60 2 55 55.2=110 (55-74,6)2.2=768,3
60 |---- 70 15 65 65.15=975 (65-74,6)2.15=1382,4
70 |---- 80 50 75 75.50=3750 (75-74,6)2.50=8,0
80 |---- 90 10 85 85.10=850 (85-74,6)2.10=1081,6
90 |----|100 3 95 95.3=285 (95-74,6)2.3=1248,5
TOTAL 80 - 5970 4.488,8

Assim:

54
Professor Cledinaldo Castro Araújo

 Média Aritmética:

∑𝑘𝑖=1 𝑥𝑖𝑚 𝑓𝑖 55.2 + 65.15 + 75.50 + 85.10 + 95.3 5.970


𝑋= = = ⇒ 𝑋 = 74,6 𝑝𝑠𝑖
𝑛 80 80
∑𝑛 2
𝑖=1(𝑥𝑖𝑚 −𝑥) .𝑓𝑖
 Variância: 𝑆 2 = 𝑛−1

(55 − 74,6)2 . 2 + (65 − 74,6)2 . 15 + (75 − 74,6)2 . 50 + (85 − 74,6)2 . 10 + (95 − 74,6)2 . 3
=
80 − 1

4.488,8
𝑆2 = ⇒ 𝑆 2 = 56,8 𝑝𝑠𝑖 2
79

 Desvio Padrão: 𝑆 = √𝑆 2 = √56,8 ⇒ 𝑆 = 7,5 𝑝𝑠𝑖

𝑆 7,5
 Coeficiente de variação de Pearson: 𝐶𝑉 = ∗ 100 = . 100 ⇒ 𝐶𝑉 = 10,1%
𝑥 74,6

55
Professor Cledinaldo Castro Araújo

Capítulo 6
Medidas de Assimetria e Curtose
6 Medidas de Assimetria e Curtose

As medidas de posição e dispersão possibilitam uma análise da tendência e da variabilidade do conjunto. Um


aspecto importante da análise do comportamento dos dados é a forma da distribuição. As medidas de assimetria
e curtose, as medidas de assimetria e curtose complementam a análise dos dados no que diz respeito à forma da
distribuição.

6.1 Medidas de Assimetria


Estas medidas tratam da análise da concentração dos dados em relação ao centro da distribuição. Desta forma,
pode-se analisar se há maior concentração dos dados à esquerda, à direita ou há uma uniformidade na
distribuição.

Exemplos:
 A distribuição das rendas de uma região apresenta maior concentração em valores baixos, em torno de
um salário mínimo;
 Os diâmetros de peças de uma linha de produção.

A distribuição dos dados pode apresentar formas diversas, no entanto apenas três formas serão usadas como
referencia: Simétrica, Assimétrica à direita e Assimétrica à esquerda.

Figura 3 – Classificação da assimetria


Simétrica Assimétrica à Direita Assimétrica à Esquerda

A referência nestas três formas não é por acaso, além do aspecto descritivo dos dados, as formas também darão
suporte ao emprego de modelos probabilísticos na fase de inferência, tais como o modelo gaussiano, t-Student e
F Snedocor e Qui-quadrado. Em especial o modelo gaussiano.

Com base nas seguintes informações: A média é valor de equilíbrio, a moda é o valor de maio frequência e a
mediana é o valor que divide o conjunto em duas partes de igual frequência, temos que:

 Simétrica: O valor central é o de maior frequência e está no meio da distribuição: 𝑋 = 𝑀𝑑 = 𝑀0


 Assimétrica à direita: O ponto de equilíbrio está deslocado para à direita: 𝑀0 < 𝑀𝑑 < 𝑋
 Assimetria à esquerda: O ponto de equilíbrio está deslocado para à esquerda: 𝑋 < 𝑀𝑑 < 𝑀0

56
Professor Cledinaldo Castro Araújo
Figura 4 – Posições relativas das medidas de posição em distribuições unimodais

Fonte: Nota de Aula - Rinaldo Artes Insper

Claro que esta análise só faz sentido para conjuntos de dados com tamanhos significativos, para tanto são
empregadas algumas medidas. Person propôs duas medidas:

 PRIMEIRO COEFICIENTE DE ASSIMETRIA DE PEARSON: Medida que avalia o nível de assimetria considerando
a relação entre média, moda desvios padrões. Esta medida informa o nível de deformação (assimetria) em
número de desvios padrões.
𝑋 − 𝑀0
𝐶𝐴 =
𝑆

 SEGUNDO COEFICIENTE DE ASSIMETRIA DE PEARSON: Na segunda mediada a alternativa é usar a relação


entre média, mediana e desvio padrão.
3(𝑋 − 𝑀𝑑 )
𝐶𝐴 =
𝑆
A classificação da distribuição é dada por:

 CA = 0: distribuição simétrica
 CA > 0: distribuição assimétrica à direita ou positiva
 CA < 0: distribuição assimétrica à esquerda ou negativa

Observação: para distribuições unimodais tem-se a seguinte relação empírica: 𝑿 − 𝑴𝟎 ≅ 𝟑(𝑿 − 𝑴𝒅 )

Importante: na prática é difícil identificar uma distribuição perfeitamente simétrica, ao invés é comum falar-se
em distribuições aproximadamente simétricas.

6.2 Medidas de Curtose

Curtose ou grau de “achatamento” de uma distribuição de frequências, em geral unimodal, trata-se da relação
dos dados à distribuição normal (de Gauss ou gaussiana), que é tomada como padrão. O grau de achatamento da
distribuição é também uma análise do grau de concentração de valores da distribuição em torno do centro desta
distribuição. Quanto maior for a concentração dos dados em torno do centro, maior será a curtose. O nível de
achatamento da distribuição apresenta as seguintes classificações:

 Mesocúrtica: quando apresenta uma medida de curtose igual à da distribuição normal.


 Platicúrtica: quando apresenta uma medida de curtose menor que a da distribuição normal.
 Leptocúrtica: quando apresenta uma medida de curtose maior que a da distribuição normal.

57
Professor Cledinaldo Castro Araújo
Figura 5 – Classificação do nível de achatamento
Mesocúrtica Platicúrtica Leptocúrtica

Assim como as medidas de assimetria, há na literatura algumas medidas. Apresentaremos aqui o Coeficiente
Percentílico de Curtose.
𝑄3 −𝑄1
( 2
)
𝐶𝑝 =
𝑃90 − 𝑃10

O valor deste coeficiente para a curva normal é 0,26367...

Assim sendo, ao calcularmos o coeficiente percentílico de curtose de uma distribuição qualquer teremos:

 Mesocúrtica: Cp ≅ 0,263;
 Platicúrtica: Cp < 0,263;
 Leptocúrtica: Cp > 0,263.

Exemplo: As leituras das correntes de fuga (µA) em dado período do ensaio para 36 cabos testados estão
apresentados abaixo. Caracterize a distribuição abaixo quanto a assimetria e a curtose. Para facilitar os dados
já estão ordenados.

40,0 40,1 40,1 40,2 40,5 40,5 40,7 42,2 43,2


44,1 45,2 45,5 45,5 45,7 45,8 45,9 45,9 45,9
45,9 46,0 46,0 46,1 46,2 46,2 46,3 46,4 46,9
47,5 47,6 47,8 48,1 48,2 48,3 49,0 52,0 52,0
Resolução:

Assimetria:
Usaremos o primeiro coeficiente de assimetria de Pearson, assim:

40+40,1+⋯+52,0
 𝑋= 36
= 45,4 µ𝐴
 𝑀𝑜 = 45,9 µ𝐴
 𝑆 = 3,1 µ𝐴
𝑋 − 𝑀0 45,4 − 45,9
𝐶𝐴 = = ⇒ 𝐶𝐴 = −0,16 (𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑎 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎 𝑜𝑢 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎)
𝑆 3,1
Curtose:
Usaremos Coeficiente Percentílico de Curtose, assim:

 𝑄1 = 𝑋1∗(36+1) = 𝑋9,25 = 43,2 + 0,25 ∗ (44,1 − 43,2) = 43,4 µ𝐴


4
 𝑄3 = 𝑋3∗(36+1) = 𝑋27,75 = 46,9 + 0,75 ∗ (47,7 − 46,9) = 47,5 µ𝐴
4
 𝑃10 = 𝑋10∗(36+1) = 𝑋3,7 = 40,1 + 0,7 ∗ (40,2 − 40,1) = 40,2 µ𝐴
100
 𝑃90 = 𝑋90∗(36+1) = 𝑋33,3 = 48,8 + 0,3 ∗ (49,2 − 48,8) = 48,9 µ𝐴
100
𝑄3 −𝑄1 47,5−43,4
( 2
) ( 2
)
𝐶𝑃 = = ⇒ 𝐶𝑃 = 0,21 (𝑃𝑙𝑎𝑡𝑖𝑐𝑢𝑟𝑡𝑖𝑐𝑎)
𝑃90 − 𝑃10 48,9 − 40,2

58
Professor Cledinaldo Castro Araújo

Capítulo 7
Probabilidade

7 Probabilidade

Qual o significado da palavra probabilidade? Uma das respostas seria: o grau de segurança com que se
pode esperar a realização de um evento, ou ainda a medida da possibilidade de algo acontecer. O estudo das
probabilidades teve origem nos jogos de azar, Blaise Pascal-Matemático Francês (1623-1662) e Pierre Fermat-
Matemático Francês (1601-1665) realizaram diversas contribuições nesta área. Foi então que a partir dos “jogos
de azar”, no século XVII, que surge um novo ramo da Matemática, que mais tarde viria a ser chamado de Teoria
das Probabilidades. A quantidade de exemplos relacionados a jogos de azar se justifica pela origem deste ramo
de estudo, e também pela simplicidade e clareza com que exemplos com jogos trazem a essência da
probabilidade. Mas qual a utilidade prática do estudo das probabilidades?
Do ponto de vista cientifico, o controle e a tangibilidade de algo demanda aplicação de uma medida,
desta forma, a probabilidade pode ser encarada como a medida da possibilidade de algo ocorrer. Importante
salientar que “possibilidade” de ocorrência de algo é diferente da “chance” de ocorrência, sendo esta a
probabilidade de acontecer dividido pela probabilidade de não acontecer (r= p/(1-p)). Todas as situações que
envolvam elementos de incerteza, demandam cálculos de probabilidades, seja lançar um novo medicamento no
mercado (é necessário provar estatisticamente que ele funciona), seja medir a confiabilidade de um sistema; seja
identificar falhas em um processo produtivo; seja quantificar o valor de um prêmio para uma carteira de seguro,
entre outros. De forma geral, todas as situações de tomada de decisão em situações de incertezas, demandam
tratamento probabilístico. Em se tratando de decisão, a estatística considera o que acontece é o tem maio
probabilidade; caso uma decisão seja feita em favor de algo com probabilidade menor, não se trata de uma
decisão cientifica.

7.1 Conceitos iniciais

 EXPERIMENTO ALEATÓRIO: São aqueles que não são previsíveis, mesmo que repetido em idênticas
condições, ou seja, ocorrem ao acaso. As situações mais simples correspondem a lançamentos de moedas,
lançamentos de dados, retiradas de bolas de urnas entre outros.

Ex1: Lançamento de uma moeda honesta


Ex2: Lançamento de um dado não viciado
Ex3: Sorteio de uma bolinha no bingo
Ex4: Determinação da vida útil de um aparelho eletrônico.

 ESPAÇO AMOSTRAL (): É o conjunto de todos os resultados possíveis de um experimento aleatório, ou


seja, é o conjunto-universo do experimento.

Ex: Seja o experimento “Lançar uma moeda honesta”. Os resultados possíveis são:

 = {C, K}, onde C: Cara e K: Coroa

 EVENTO (E): É o subconjunto do espaço amostral que contém os resultados que nos interessam.

Ex: Lançam-se uma moeda e um dado. Enumere o seguinte evento: E1: Sair cara na moeda e E2: face par no
dado.

59
Professor Cledinaldo Castro Araújo
Moeda:
 1 = {C, K}, onde C: Cara e K: Coroa.
 E1 = {C}
Dado:
 2 = {1, 2, 3, 4, 5, 6}
 E2 = {2, 4, 6}

 EVENTO CERTO: É o evento que ocorre com certeza. O espaço amostral pode ser considerado como
evento certo, já que fatalmente sempre ocorre um elemento do espaço amostral. Do ponto de vista
prático, os eventos categorizados como “certos” não são foco de estudo da probabilidade.

Ex: Sair face menor que 7 no lançamento de um dado.

 EVENTO IMPOSSÍVEL: É o evento que nunca ocorre (). Analogamente, eventos categorizados como
impossíveis também não são foco do estudo de probabilidade.

Ex: Obter soma maior que 12 no lançamento de dois dados.

7.2 Operações com Eventos Aleatórios


Correspondem às combinações com eventos. De forma geral, é mais comum análise da probabilidade da
combinação de eventos do que a de eventos isolados.

 EVENTO UNIÃO: Evento que ocorre se, e somente se, pelo menos um dos eventos ocorre.

Sejam eventos A e B:

A  B: “ocorre A ou ocorre B ou ocorre ambos”, ou seja, pelo menos um ocorre.

Caso geral: 𝑨𝟏 ∪ 𝑨𝟐 ∪ 𝑨𝟑 ∪ … ∪ 𝑨𝒏 = ⋃𝒏𝒊=𝟏 𝑨𝒊

Ex: Seja o experimento: “Lançar um dado honesto”. Então,  = {1, 2, 3, 4, 5, 6}, sejam os eventos:

 A: Ocorrer face par, A = {2, 4, 6}


 B: Ocorrer número menor que 3, B= {1, 2}
 Então, A  B = {1, 2, 4, 6}

Observe que: Quando ocorrer 2, 4 ou 6, ocorre o evento A; quando ocorre 1 e 2, ocorre o evento B; quando
ocorre 2 ocorrem A e B.

Representação esquemática pelo diagrama de Venn:

4
2 1
6

60
Professor Cledinaldo Castro Araújo

 EVENTO INTERSEÇÃO: Evento que ocorre se, e somente se todos os eventos ocorrem.

Sejam eventos A e B:
A  B: “ocorre A e ocorre B”

Caso geral: 𝑨𝟏 ∩ 𝑨𝟐 ∩ 𝑨𝟑 ∩ … ∩ 𝑨𝒏 = ⋂𝒏𝒊=𝟏 𝑨𝒊

Ex: Seja o experimento “Lançar um dado honesto”. Então,  = {1, 2, 3, 4, 5, 6}, sejam os eventos:

 A: Ocorrer face par, A = {2, 4, 6}


 B: Ocorrer um número primo, B = { 2, 3, 5}
 A B = {2}

Observação: O conceito de número primo utilizado aqui é: todo número com exatamente dois divisores
positivos, ele mesmo e a unidade. Desta forma, o 1 não é primo.

O evento interseção é formado pelos elementos que pertencem simultaneamente aos eventos A e B.
Observe que: quando ocorre o 2, ocorre o evento A e ocorre o evento B.

Representando pelo diagrama de Venn:

4 3
2
6
3
3 5
3

 EVENTOS MUTUAMENTE EXCLUSIVOS: São eventos que não ocorrem simultaneamente, ou seja, a
ocorrência de um deles anula a ocorrência do(s) outro(s). Assim:

𝐴𝑖 ∩ 𝐴𝑗 = ∅, 𝑐𝑜𝑚 𝑖 ≠ 𝑗

Ex: Seja o experimento “Lançar um dado honesto”. Então,  = {1, 2, 3, 4, 5, 6}, sejam os eventos:

 A: Ocorrer face par


 B: Ocorrer face ímpar
 Então, A  B = ,

 EVENTOS COLETIVAMENTE EXAUSTIVOS: São eventos mutuamente exclusivos e que geram o espaço
amostral. São também chamados de partições. Assim:

𝐴𝑖 ∩ 𝐴𝑗 = ∅, 𝑐𝑜𝑚 𝑖 ≠ 𝑗
𝑛

⋃ 𝐴𝑖 = , 𝑐𝑜𝑚 𝑖 = 1,2, … , 𝑛
𝑖=1

61
Professor Cledinaldo Castro Araújo

Ex: Seja o experimento “Lançar um dado honesto”. Então,  = {1, 2, 3, 4, 5, 6}, sejam os eventos:

 A={1, 2}
 B={3, 4}
 C={5, 6}
 Temos que: A  B = , B  C = , A  C =  e A  B  C = 

 EVENTOS COMPLEMENTARES (𝐀 𝐨𝐮 𝐀𝐜 ): O complemento de um evento “A”, denotado por A , consiste


em todos os resultados em que o evento “A” não ocorre, ou seja, é o acontecimento complementar de A.
Eventos complementares é um caso particular de eventos coletivamente exaustivos.

𝐴∩ 𝐴=∅
𝐴∪ 𝐴 =  ⇒ 𝐴 = −𝐴

Dizemos que A e A são complementares se, e somente se sua união é o espaço amostral e sua interseção é
vazia.

 Ex1: Cara ou coroa na jogada de uma moeda


 Ex2: Feridos e não feridos num acidente
 Ex3: Seja o experimento: “Resultado final de uma disciplina”: Aprovado ou não aprovado

Representando pelo diagrama de Venn:

A B

 PROPRIEDADES QUE RELACIONAM UNIÃO, INTESEÇÃO E COMPLEMENTAR: As operações de união e


interseção definidas acima podem ser estendidas para qualquer quantidade de eventos. Desta forma definem-
se as seguintes propriedades:

 𝐴 ∪ 𝐵 ∪ 𝐶 = (𝐴 ∪ 𝐵) ∪ 𝐶 𝑜𝑢 (𝐴 ∪ 𝐵) ∪ 𝐶
 𝐴 ∩ 𝐵 ∩ 𝐶 = (𝐴 ∩ 𝐵) ∩ 𝐶 𝑜𝑢 (𝐴 ∩ 𝐵) ∩ 𝐶
 𝐴∪𝐵 =𝐵∪𝐴
 𝐴∩𝐵 =𝐵∩𝐴
 𝐴 ∪ (𝐵 ∩ 𝐶) = (𝐴 ∪ 𝐵) ∩ (𝐴 ∪ 𝐶)
 𝐴 ∩ (𝐵 ∪ 𝐶) = (𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶)
 𝐴 ∪ 𝐵 = 𝐴𝐵
 𝐴𝐵 =𝐴∪B
 𝐴=𝐴

62
Professor Cledinaldo Castro Araújo

7.3 Medida de Probabilidade:

De acordo a Lei de Laplace: Seja  um espaço amostral equiprovável (quando todos tem a mesma
probabilidade de ocorrer), de um experimento aleatório e A um evento desse espaço amostral finito, a
medida da probabilidade de do evento A será definida por:

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 𝑑𝑒 𝐴 𝑛(𝐴)


𝑃(𝐴) = , 𝑎𝑠𝑠𝑖𝑚 𝑃(𝐴) =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑑𝑒 𝐴 𝑛()

Pode-se considerar que a probabilidade de um evento equivale à frequência relativa deste evento se o
mesmo fosse repetido infinitas vezes. Considere o seguinte experimento hipotético: Lançar repetidas vezes
uma moeda e registrar o número de resultados cara. Qual a tendência para o número de caras e coros á
medida que o número de lançamento aumenta? Sendo uma moeda honesta, o número de caras tende a ser
igual ao número de coroas. Desta forma, em modelos equiprováveis, a probabilidade de um evento A pode
ser expresso como:
𝑛𝐴
𝑃(𝐴) = lim 𝑓𝐴 = lim (𝑙𝑖𝑚𝑖𝑡𝑒 𝑑𝑎 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎)
𝑛→∞ 𝑛→∞ 𝑛

Exemplo: Segue abaixo uma simulação para o nº de caras em n lançamentos de uma moeda não viciada. O
objetivo é analisar a convergência da probabilidade para 0,5 á medida que n aumenta.

Figura 6 – Probabilidade como limite da frequência Relativa

P(cara)


𝑛

Assim:
𝑛𝐴 𝑛º 𝑑𝑒 𝑐𝑎𝑟𝑎𝑠
𝑃(𝐴) = 𝑙𝑖𝑚𝑛→∞ 𝑛
= 𝑛º 𝑑𝑒 𝑙𝑎𝑛ç𝑎𝑚𝑒𝑛𝑡𝑜𝑠 = 0,5

 PROPRIEDADES: decorrem da definição anterior as seguintes propriedades:

I. A probabilidade de do espaço amostral é igual a 1, isto é, P() = 1


II. O  P(A)  1: A medida da probabilidade de um evento ocorrer é sempre maior ou igual a zero e
menor ou igual a 1.
III. 𝑃(𝐴) = 1 − 𝑃(𝐴) ⇔ 𝑃(𝐴) + 𝑃(𝐴) = 𝑃()
IV. P() = 0

63
Professor Cledinaldo Castro Araújo

7.4 Teorema da Soma

O principal objetivo da regra da adição é encontrar a probabilidade de ocorrência do evento A, ou do evento B,


ou de ambos, ou seja, pelo menos um deles. Segue as expressões para os casos básicos: dois e três eventos.

I. Dois eventos: A e B: 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + P(B) − P(A ∩ B)

Esta expressão pode também ser escrita na forma: P(A ∪ B) = P(A ∩ B) + P(A ∩ B) + P(A ∩ B).

Representando pelo diagrama de Venn:

P(AB)

Se os eventos forem mutuamente exclusivos, ou seja, não ocorrem simultaneamente, isto é, A  B = 


então: P (A  B) = 0, assim:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + P(B)

Quando as probabilidades de eventos mutuamente exclusivos somam 1, diz-se que os eventos são
coletivamente exaustivos, nesse caso não existem outros resultados possíveis.

II. Três eventos A, B e C:

𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + P(B) + P(C) − P(A ∩ B) − P(B ∩ C) − P(A ∩ C) + P(A ∩ B ∩ C)

Representando pelo diagrama de Venn:

Pode-se perceber que quando se contabiliza os elementos de A, B e C, as interseções dois a dois são
duplicadas, por exemplo: AB é contabilizada uma vez com A e outra vez com B. A ideia é subtrair todas as

64
Professor Cledinaldo Castro Araújo
interseções dois a dois para correção do excesso. Por outro lado, as interseções três a três também são
contabilizadas três vezes, uma com A, outra com B e outra com C, entretanto são subtraídas três vezes,
uma com AB, outra com AC e outra com BC, ou seja, ficou vazio, por isso corrige-se somando a
interseção três a três (ABC). De forma geral, Adicionam-se as interseções impares e subtraem-se as
interseções pares. O teorema da soma pode ser generalizado pelo princípio da Inclusão – Exclusão (PIE).

O Princípio da Inclusão-Exclusão (PIE)

Seja Ω um conjunto e 𝐴1 , 𝐴2 , … , 𝐴𝑛 subconjuntos de Ω

𝑆0 = #(Ω)
𝑛

𝑆1 = ∑ #(𝐴𝑖 )
𝑖=1
𝑛

𝑆2 = ∑ #(𝐴𝑖 ∩ 𝐴𝑗 )
𝑖≤1<𝑗≤𝑛
𝑛

𝑆3 = ∑ #(𝐴𝑖 ∩ 𝐴𝑗 ∩ 𝐴𝑘 )
𝑖≤1<𝑗<𝑘≤𝑛

I) O número de elementos que pertencem a exatamente um dos conjuntos é dado por:


𝑛−𝑝
𝑘
𝑎𝑝 = ∑(−1)𝑘 𝐶𝑃+𝑘 𝑆𝑝+𝑘
𝑘=0

II) O número de elementos que pertencem a pelos menos um dos conjuntos é dado por:
𝑛−𝑝
𝑘
𝑏𝑝 = ∑(−1)𝑘 𝐶𝑃+𝑘−1 𝑆𝑝+𝑘
𝑘=0

Exemplo: Considere um experimento aleatório e os eventos A e B associados, tais que:

1 1 1
𝑃(𝐴) = , 𝑃(𝐵) = 𝑒 𝑃(𝐴 ∩ 𝐵) =
2 3 4
Determine a probabilidade de:
a) Pelo menos um dos eventos ocorrer

1 1 1 6+4−3 7
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = + − = =
2 3 4 12 12

b) Nenhum dos eventos ocorrerem.

O complementar de pelo menos 1 é nenhum, ou seja, 1- P (A B)


7 5
𝑃(𝐴 ∪ 𝐵) = 1 − 𝑃(𝐴 ∪ 𝐵) = 1 − =
12 12

7.5 Eventos Dependentes

Dois eventos A e B associados a um espaço amostral  são ditos dependentes quando a ocorrência de um
influencia ou está vinculada a ocorrência do outro.

65
Professor Cledinaldo Castro Araújo

Ex: Considere um grupo de pessoas categorizadas pelo sexo e pelo uso ou não de certo produto.

Sexo Usa Não usa Total


Masculino 20 10 30
Feminino 15 5 20
Total 35 15 50

Estabeleça os seguintes eventos:

A: Pessoa que usa o produto


B: Pessoa do sexo masculino

Selecionando-se ao acaso uma pessoa deste grupo, as probabilidades de A e B são:

35
 P(A) = 50 (nº de pessoas que Usam o Produto pelo total de pessoas)

30
 P(B) = 50 (nº de pessoas do Sexo Masculino pelo total de pessoas)

Qual seria a probabilidade de uma pessoa usar o produto considerando apenas as pessoas do sexo masculino?
Podemos perceber que foi imposta uma condição, e que esta condição alterou o total de casos possíveis. Esta
situação será definida como probabilidade condicional.

7.5.1 Probabilidade Condicional


A probabilidade procurada será denotada por P(A \ B): “Probabilidade de uma pessoa usar o produto dado
que esta pessoa é do sexo masculino”. E será dado por:

20
P(A \ B) =
30
Onde:
 n(A  B) = 20: (pessoas que usam o produto dentre as pessoas do sexo masculino)
 n(B) = 30: (pessoas do sexo masculino)

Desta forma geral, a probabilidade de ocorrência do evento A condicionada à ocorrência do evento


B, é denotada por P (A\ B) e definida pela relação:

𝑛(𝐴 ∩ 𝐵)
P(A \ B) =
𝑛(𝐵)

A probabilidade condicional também pose ser expressa da seguinte forma:

𝑛(𝐴∩𝐵)
𝑛() 𝑃(𝐴 ∩ 𝐵)
P(A \ B) = 𝑛(𝐵)
⇒ P(A \ B) = , 𝑐𝑜𝑚 𝑃(𝐵) > 0
𝑃(𝐵)
𝑛()

7.5.2 Teorema do Produto ou Regra do Produto

66
Professor Cledinaldo Castro Araújo

A regra produto corresponde à relação que permite encontrar a probabilidade de ocorrência do evento (A  B).
Partindo-se da Probabilidade Condicional, temos que:

𝑃(𝐴 ∩ 𝐵) = P(B). P(A \ B) 𝑜𝑢 𝑃(𝐴 ∩ 𝐵) = P(A). P(B \ A)


Assim:

Importante: “A probabilidade de A e B ocorrerem é o produto da probabilidade do primeiro evento vezes a


probabilidade do segundo condicionada a ocorrência do primeiro”.

No caso geral a esta regra pode ser escrita da seguinte forma:

𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 … ∩ 𝐴𝑛 ) = P(𝐴1 ). P(𝐴2 \ 𝐴1 ). P(𝐴3 \ 𝐴1 ∩ 𝐴2 ) … . P(𝐴𝑛 \ 𝐴1 ∩ 𝐴2 … 𝐴𝑛−1 )

7.6 Eventos Independentes

Dois eventos A e B associados a um espaço amostral  são ditos dependentes quando a ocorrência NÃO
influencia da ou não está vinculada a ocorrência do outro.

 P(A\B) = P(A): “A ocorrência de B não interfere na ocorrência de A”


 P(B\A) = P(B): “A ocorrência de A não interfere na ocorrência de B”

Ex: Em dois lançamentos consecutivos de uma moeda, qual a probabilidade do segundo lançamento resultar
em cara, sabendo-se que foi cara no primeiro lançamento? Pode-se notar que o conhecimento imposto pela
condicional (primeiro lançamento) não altera a probabilidade do evento.

7.6.1Teorema do Produto ou Regra do Produto


Analogamente, o principal objetivo da regra do produto é encontrar a probabilidade de ocorrência do
evento (A  B). Neste caso considerando A e B eventos independentes. Temos que:

Partindo de 𝑃(𝐴 ∩ 𝐵) = P(A). P(B \ A) e considerando P(B \ A) = 𝑃(𝐵), O Teorema do Produto ou Regra do
Produto pode ser rescrita da seguinte forma:

𝑃(𝐴 ∩ 𝐵) = P(A). P(B)

Importante: “Se A e B são eventos independentes, a probabilidade de A e B ocorrerem é dado pelo produto das
probabilidades de A e B”.

No caso geral a esta regra pode ser escrita da seguinte forma:

𝑛
𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 … ∩ 𝐴𝑛 ) = P(𝐴1 ). P(𝐴2 ). P(𝐴3 ) … . P(𝐴𝑛 ) = ∏ P(𝐴𝑖 )
𝑖=1

Onde: ∏𝑛𝑖=1 P(𝐴𝑖 ) é “produtório” ou produto das probabilidades dos eventos de A1, A2, ..., An

A regra da multiplicação é extremamente importante em virtude de suas inúmeras aplicações, vejamos alguns
exemplos:

67
Professor Cledinaldo Castro Araújo
1) Os resultados do lançamento de uma moeda e de um dado são exemplos de eventos independentes, porque o
resultado da moeda não afeta a probabilidade do resultado do dado. Por outro lado, os eventos “conseguir
dar partida no carro” e “chegar à aula no horário” são dependentes, por que o resultado da operação de dar
partida no carro influi na probabilidade de chegar à aula no horário.

2) A confiabilidade de um sistema aéreo: Os aviões têm dois sistemas elétricos independentes e dois rádios. Um
avião deve levar dois transceptores de radar, porque se um único falhar o avião se torna invisível na tela do
radar. Se a probabilidade de um desses componentes falhar é de 0,001, ou seja, 1/1000 (um para cada mil), a
probabilidade de dois falharem simultaneamente é de apenas 0,001², ou seja, 1/1.000.000 (um para cada um
milhão).

3) Em uma caixa existem 5 bolas brancas e 8 bolas azuis. Duas bolas são retiradas uma após a outra da caixa,
aleatoriamente. Determine a probabilidade de saírem duas bolas brancas nos seguintes casos:

a) Sem reposição
b) Com reposição

Resolução: Considere os eventos:

 B1: Primeira bola branca


 B2: Segunda bola branca

a) Sem reposição: significa que a primeira bola sorteada não volta para a caixa, ou seja, a retirada da
primeira bola interfere na probabilidade da segunda, caracterizando B1 e B2 com eventos dependentes.
Além disso, correrem duas bolas brancas em duas retiradas corresponde a probabilidade 𝑃(𝐵1 ∩ 𝐵2 ):

5 4 5
𝑃(𝐵1 ∩ 𝐵2 ) = 𝑃(𝐵1 ). 𝑃(𝐵2 \𝐵1 ) = . =
12 11 33

b) Com reposição: significa que a primeira bola sorteada volta para a caixa, ou seja, a retirada da primeira
bola não interfere na probabilidade da segunda, caracterizando B1 e B2 como eventos independentes.
Analogamente, correrem duas bolas brancas em duas retiradas, corresponde a probabilidade 𝑃(𝐵1 ∩ 𝐵2 ):

5 5 25
𝑃(𝐵1 ∩ 𝐵2 ) = 𝑃(𝐵1 ). 𝑃(𝐵2 ) = . =
12 12 144

De forma resumida, temos as seguintes relações:

Importante: Em se tratando da retirada de objetos de uma urna, caixa, lote, entre outros, temos que:
 “Sem reposição ⇒ Eventos Dependentes”.
 “Com reposição ⇒ Eventos Independentes”.

68
Professor Cledinaldo Castro Araújo
Exercício: A montagem de um sistema é formada de dois subsistemas A e B. De procedimentos de ensaios
anteriores, as seguintes probabilidades se admitem: P (A falhe) = 0,20, P (A e B falhem) = 0,15 e P (B falhe
sozinho) = 0,15. Calcule:

b) P (A falhe dado que B falhou)


c) P(A falhe sozinho)

Resolução:

𝑃(𝐴∩𝐵)
a) 𝑃(𝐴\𝐵) = =?
𝑃(𝐵)
A probabilidade de B falhar sozinho corresponde a probabilidade B falhar e A não, assim:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) ⇒ 0,15 = 𝑃(𝐵) − 0,15 ⇒ 𝑃(𝐵) = 0,15 + 0,15 = 0,30
𝑃(𝐴 ∩ 𝐵) 0,15
𝑃(𝐴\𝐵) = = ⇒ 𝑃(𝐴\𝐵) = 0,50
𝑃(𝐵) 0,30
b) Analogamente
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵) = 0,20 − 0,15 ⇒ 𝑃(𝐴 ∩ 𝐵) = 0,05

Exercício: Determine a confiabilidade do sistema representado pelo diagrama abaixo, assuma que cada
componente funciona independentemente.

Resolução:

Para que o sistema continue operando é necessário que seja possível fluxo do primeiro terminal até o
segundo, chamaremos de I e II, para tanto a primeira componente e pelo menos uma das duas em paralelo
estejam operando. Chamaremos nessa ordem de componentes A, B e C, assim: 𝑃[𝐴 ∩ (𝐵 ∪ 𝐶)]. Aplicado às
regras do produto e soma:

𝑃[𝐴 ∩ (𝐵 ∪ 𝐶)] = 𝑃(𝐴). 𝑃(𝐵 ∪ 𝐶) = 𝑃(𝐴). [𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐵 ∩ 𝐶)] = 0,9. [0,85 + 0,9 − 0,85.0,9]

= 0,8865 𝑜𝑢 88,65%

7.7 Teorema de Bayes

Também conhecido como fórmula de probabilidades “a posteriori”, é aplicado na seguinte


situação: Sejam A1, A2, ... , Ai , ... ,An Eventos coletivamente exaustivos ou partições de um espaço
amostral , isto é, 𝐴𝑖 ∩ 𝐴𝑗 = ∅, ∀ 𝑖 ≠ 𝑗. Seja B um evento qualquer de . Então:

𝑃(𝐴𝑗 ). 𝑃(𝐵 \ 𝐴𝑗 )
𝑃(𝐴𝑗 \𝐵) = 𝑛
∑𝑖=1 𝑃(𝐴𝑖 ). 𝑃(𝐵 \𝐴𝑖 )
Onde:
O denominador ∑𝑛𝑖=1 𝑃(𝐴𝑖 )𝑃(𝐵\ 𝐴𝑖 ) é chamado de Teorema da Probabilidade Total.

69
Professor Cledinaldo Castro Araújo
Corresponde a probabilidade de ocorrência do evento B condicionada a ocorrência de cada evento Ai.

Esquematicamente, seria:

 A2
A1
A4

A3
...Aj

Vejamos um exemplo:
Considere a disposição das urnas U1, U2 e U3, cada uma delas contendo 10 bolas de mesmo tamanho, porém
nas cores Branca, Preta e Vermelha cujas quantidades totais são respectivamente iguais a 8, 13 e 9,
conforme indicado na tabela abaixo:

Urnas
Cores das bolas Total
U1 U2 U3
Branca 4 2 2 8
Azul 2 6 5 13
Vermelha 4 2 3 9
Total 10 10 10 30

O procedimento consiste em sortear uma urna e desta urna sortear uma bola. Sorteando-se uma urna e em
seguida uma bola-se, verifica-se que esta bola é branca. Qual a probabilidade dela ter vindo da urna 2?

Resolução: sejam os eventos:

 A1: A urna 1 é sorteada;


 A2: A urna 2 é sorteada;
 A3: A urna 3 é sorteada;
 B: A bola sorteada é branca;

O sorteio das urnas pode ser considerado equiprovável, ou seja, qualquer urna tem 1/3 de probabilidade de ser
sorteada, assim:

P(A1) = 1/3; P(A2) = 1/3 e P(A3) = 1/3;

Qual a probabilidade de se obter bola branca de cada uma das urnas?

 P(B \ A1) = 4/10 (“4 brancas em A1 sobre o total de bolas de A1”);


 P(B \ A2) = 2/10 (“2 brancas em A2 sobre o total de bolas de A2”);
 P(B \ A3) = 2/10 (“2 brancas em A3 sobre o total de bolas de A3”);

A probabilidade procurada é P(A2 \ B) =? (“Urna 2 dado que a bola é branca”)


Aplicando na fórmula, temos:

𝑃(𝐴2 ). 𝑃(𝐵 \ 𝐴2 ) 𝑃(𝐴2 ). 𝑃(𝐵 \ 𝐴2 )


𝑃(𝐴2 \𝐵) = 𝑛 =
∑𝑖=1 𝑃(𝐴𝑖 ). 𝑃(𝐵 \𝐴𝑖 ) 𝑃(𝐴1 ). 𝑃(𝐵 \ 𝐴1 ) + 𝑃(𝐴2 ). 𝑃(𝐵 \ 𝐴2 ) + 𝑃(𝐴3 ). 𝑃(𝐵 \ 𝐴3 )

70
Professor Cledinaldo Castro Araújo

1 2
.
3 10 2
𝑃(𝐴2 \𝐵) = 1 4 1 2 1 2 = ⇒ 𝑃(𝐴2 \𝐵) = 0,25
. + . + . 8
3 10 3 10 3 10

Pelo diagrama de árvore, temos:

B
4
10 1 4 4
A1 A . =
3 10 30
1
3
V

B
1 2
3 10 1 2 2
A2 A . =
3 10 30

1
B
3
2
10 1 2 2
2 A3 A . =
3 10 30
30 2
𝑃(𝐴2 \𝐵) = 4 2 2 = ⇒ 𝑃(𝐴2 \𝐵) = 0,25 𝑜𝑢 25%
+ + 8
30 30 20 V

Podemos Perceber que o cálculo se restringe a identificar o total de bolas brancas oriundas da urna 2 sobre o
total de bolas brancas.

Exemplo: Uma companhia multinacional tem três fábricas que produzem o mesmo tipo de produto. A fábrica
I ́é responsável por 30% do total produzido, a fábrica II produz 45% do total, e o restante vem da fábrica III.
Cada uma das fábricas, no entanto, produz uma proporção de produtos que não atendem aos padrões
estabelecidos pelas normas internacionais. Tais produtos são considerados “defeituosos” e correspondem a
1%, 2% e 1,5%, respectivamente, dos totais produzidos por fábrica. No centro de distribuição, é feito o controle
de qualidade da produção combinada das fábricas.

a) Qual é a probabilidade de encontrar um produto defeituoso durante a inspeção de qualidade?


b) Se durante a inspeção, encontramos um produto defeituoso, qual é a probabilidade que ele tenha sido
produzido na fábrica II?
Resolução

 P(I) = 30%; P(II) = 45%e P(II) = 25%;


 Probabilidade de Defeituosa (D) em cada uma das fábricas:
 P(D \ I) =1%
 P(D \ II) = 2%

71
Professor Cledinaldo Castro Araújo
 P(D \ III) = 3%

a) Qual é a probabilidade de encontrar um produto defeituoso durante a inspeção de qualidade?


Pelo teorema da probabilidade total, temos:

𝑃(𝐷) = 𝑃(𝐼). 𝑃(𝐷 \ 𝐼) + 𝑃(𝐼𝐼). 𝑃(𝐷\ 𝐼𝐼) + 𝑃(𝐼𝐼𝐼). 𝑃(𝐵 \ 𝐼𝐼𝐼)

𝑃(𝐷) = 0,30.0,01 + 0,45.0,02 + 0,25.0,03 ⇒ 𝑃(𝐷) = 0,01575 𝑜𝑢 1, 575 %

b) Se durante a inspeção, encontramos um produto defeituoso, qual é a probabilidade que ele tenha sido
produzido na fábrica II?
𝑃(𝐼𝐼). 𝑃(𝐷\ 𝐼𝐼)
𝑃(𝐼𝐼\𝐷) =
𝑃(𝐼). 𝑃(𝐷 \ 𝐼) + 𝑃(𝐼𝐼). 𝑃(𝐷\ 𝐼𝐼) + 𝑃(𝐼𝐼𝐼). 𝑃(𝐵 \ 𝐼𝐼𝐼)

0,45.0,02
𝑃(𝐼𝐼\𝐷) = ⇒ 𝑃(𝐼𝐼\𝐷) = 0,5714 𝑜𝑢 57,14%
0,01575

72
Professor Cledinaldo Castro Araújo

Capítulo 8
Variáveis Aleatórias Unidimensionais

8 Variáveis Aleatórias

Nas análises anteriores, enquadradas na fase descritiva de um conjunto de dados, foram realizados
estudos sobre o comportamento de variáveis tais como: Peso, Altura, Tensão de Ruptura de Blocos de Concreto,
Número de Filhos, Número de quedas em uma rede de transmissão, entre outras. A característica desta fase era
trabalhar com dados de uma amostra já realizada, ou seja, de valores cujas ocorrências já foram verificadas. O
estudo das variáveis aleatórias consiste em analisar a probabilidade de ocorrências destas variáveis, ou seja, a
probabilidade de ocorrência dos seus valores. Assim, de uma maneira simplificada, podemos definir variável
aleatória como sendo:

Uma variável quantitativa cujo valor depende de fatores aleatórios. Matematicamente, variável aleatória é uma
função que associa elementos de um espaço amostral a valores numéricos, ou seja, 𝑿:  → 𝑹.

Figura 7 – Diagrama Geral de uma Variável Aleatória


R
 X

X)
Variável Aleatória

De maneira simplificada, pode-se também entender como Regra que atribui um valor numérico a cada
possível resultado de um experimento aleatório. Com esta visão, pode-se verificar que o espaço amostral pode
ser quantitativo ou não, a Variável aleatória sempre atribuirá quantidades, por isso definida como variável
quantitativa.

8.1 Classificação das Variáveis Aleatórias

As variáveis aleatórias são classificadas de acordo com a caracterização do conjunto de valores que ela pode
assumir, assim:

8.1.1Variáveis Aleatórias Discretas


Uma variável é dita discreta quanto o conjunto de valores assume apenas valores pontuais, assim:

X(Ω): Assume finitos valores em um intervalo finito ou ainda, é um conjunto finito ou infinito enumerável.

Exemplos:

X1: Número de caras em dois lançamentos de uma moeda não viciada X1(Ω) = {0, 1, 2}
X2: Número de navios que chegam em um porto em um dado dia X2(Ω) = {0, 1, 2, 3, ..., ∞}

73
Professor Cledinaldo Castro Araújo

 DISTRIBUIÇÃO DE PROBABILIDADE: Para uma V.A. discreta a distribuição de probabilidade é uma tabela
contendo os pares ordenados [x, P(X=x)], onde X é variável aleatória e x corresponde a cada valor
particular da variável.

Exemplo:

Seja X a v. a. discreta número de caras em dois lançamentos de uma moeda não viciada. Determine:

a) Ω (espaço amostra)
b) X(Ω) (conjuntos de valores da variável)
c) A distribuição de Probabilidade.

Resolução:

a) Espaço amostra corresponde ao conjunto de todos os possíveis resultados para um experimento


aleatório. Para dois lançamentos de uma moeda não viciada podemos ter os seguintes resultados
possíveis:

Ω = {KK, CK, KC, CC} onde: C: resultado cara e K: resultado coroa.

b) Para X: nº de caras em dois lançamentos de uma moeda não-viciada:

 KK: X=0 caras


 CK ou KC: X=1 cara
 CC: X=2 caras

Assim X(Ω) = {0, 1, 2}

c) A Distribuição de Probabilidade é a tabela contendo todos os valores da variável com as suas


respectivas probabilidades, assim:
d)
x 0 1 2

1 2 1
P(X=x)
4 4 4

Como os resultados das moedas são independentes, podemos aplicar a regra do produto, assim:
1 1 1
 𝑃(𝑋 = 0) = 𝑃(𝐾1 ∩ 𝐾2 ) = 𝑃(𝐾1 ). 𝑃(𝐾2 ) = 2 . 2 = 4
1 1 1 1 2
 𝑃(𝑋 = 1) = 𝑃(𝐶1 ∩ 𝐾2 ) + 𝑃(𝐾1 ∩ 𝐶2 ) = 𝑃(𝐶1 ). 𝑃(𝐾2 ) + 𝑃(𝐾1 ). 𝑃(𝐶2 ) = 2 . 2 + 2 . 2 = 4
1 1 1
 𝑃(𝑋 = 2) = 𝑃(𝐶1 ∩ 𝐾𝐶2 ) = 𝑃(𝐶1 ). 𝑃(𝐶2 ) = 2 . 2 = 4

 FUNÇÃO DE PROBABILIDADE: Função de probabilidade corresponde ao modelo matemático que permite


atribuir probabilidade aos valores da variável aleatória discreta.

A Função de Probabilidade P(X=x) obedece as seguintes Propriedades:

I. P(X=x) ≥ 0
II. ∑𝑥𝜖𝑋(Ω) 𝑃(𝑋 = 𝑥) = 1

74
Professor Cledinaldo Castro Araújo
Como valores x correspondem ao antigo espaço amostral, a soma das probabilidades de todos os valores
deve ser igual a 1. A condição informa que a probabilidade de para qualquer x é sempre não negativa. Com
estas condições temos que 0 ≤ P(X=x) ≤ 1

Exemplo:

Uma V.A discreta possui Função de Probabilidade dada pela expressão abaixo:

1
𝑃(𝑋 = 𝑥) = , 𝑥 = 1, 2, 3, … , ∞
2𝑥

Calcule a probabilidade de que um número escolhido ao acaso, nesse conjunto seja Par:
Resolução:

P(X par) = P(X=2)+ P(X=4)+ P(X=6)+.....


1 1 1 1 1 1
𝑃(𝑋 𝑝𝑎𝑟) = 2
+ 4+ 6… = + + +⋯
2 2 2 4 16 64

Pode-se perceber que a série corresponde a soma dos termos de uma PG infinita de razão 1/4:
Lembrete:
𝑎1
𝑆∞ = , 𝑐𝑜𝑚 |𝑞| < 1
(1 − 𝑞)
Logo:
1 1
4 4 1
𝑃(𝑋 𝑝𝑎𝑟) = 1
= 3 ⇒ 𝑃(𝑋 𝑝𝑎𝑟) =
(1 − ) 3
4 4

 ESPERANÇA MATEMÁTICA, VALOR MÉDIO OU VALOR ESPERADO: Define-se como Esperança


Matemática de uma varável aleatória discreta o número dado por:

𝐸[𝑋] = ∑ 𝑥. 𝑃(𝑋 = 𝑥)
𝑥𝜖𝑋(Ω)

 VARIÂNCIA: Define-se variância como o número dado por:

𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2

Onde:
𝐸[𝑋 2 ] = ∑ 𝑥 2 . 𝑃(𝑋 = 𝑥)
𝑥𝜖𝑋(Ω)

As caracterizações da Esperança e da variância são as mesmas da média aritmética e da variância da análise


descritiva, a diferença reside no fato da esperança matemática usar probabilidades como frequências. Desta
forma, a leitura de média vai para “valor médio esperado”.

Exemplo:
Calcular Esperança e Variância para a variável X: nº de caras em dois lançamentos de uma moeda não viciada.

Resolução:

1 2 1
 Esperança: 𝐸[𝑋] = 0 ∗ 2 + 1 ∗ 4 + 2 ∗ 4 ⇒ 𝐸[𝑋] = 1 𝑐𝑎𝑟𝑎
 Variância: 𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2

75
Professor Cledinaldo Castro Araújo
1 2 1 6 6 1
𝐸[𝑋] = 02 ∗ + 12 ∗ + 22 ∗ = ⇒ 𝑉[𝑋] = − 12 ⇒ 𝑉[𝑋] = 𝑐𝑎𝑟𝑎𝑠 2
2 4 4 4 4 2

8.1.2 Variáveis Aleatórios Contínuas


Uma variável é dita discreta quanto o conjunto de valores assumem quaisquer valores na reta, assim:

X(Ω): Assume infinitos valores em um intervalo finito ou ainda, é um conjunto infinito não enumerável.

Exemplo:

X1: Duração de um equipamento eletrônico em horas X1(Ω) = {x1 ε IR / x1 ≥ 0}


X2: Concentração de uma substância em um leito de esgoto X1(Ω) = {x2 ε IR / 0 ≤ x2 ≤ 1}

 FUNÇÃO DENSIDADE DE PROBABILIDADE (FDP)

Para uma V.A. contínua a Função Densidade de Probabilidade é função que atribui probabilidades à
intervalos da variável. Uma vez que a probabilidade neste caso é numericamente igual sob à curva no
intervalo considerado. Assim:

Figura 8 – A probabilidade como a área sob a curva

A Função Densidade de Probabilidade obedece às seguintes Propriedades:

I. f(x) ≥0
+∞
II. ∫−∞ 𝑓(𝑥)𝑑𝑥 = 1
III. Se a função satisfaz as propriedades acima, então f(x) representa uma variável aleatória
contínua X, de modo que:
𝑏
𝑃(𝑎 < 𝑋 < 𝑏 ) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎
Exemplo:
O tempo de vida de um componente eletrônico tem distribuição exponencial com tempo médio de vida de 2
anos e cuja Função Densidade de Probabilidade (FDP) é dada por:
𝑥
1
𝑓(𝑥) = 2 𝑒 −2 , 𝑥 ≥ 0.

76
Professor Cledinaldo Castro Araújo
Qual a probabilidade de que um destes equipamentos dure menos que 18 meses?

Resolução:

X: Duração do componente em anos

18 meses corresponde a 18 / 12 = 1,5 anos, logo:

1,5 1 −𝑥 𝑥 1,5 0
𝑃(𝑋 < 1,5) = ∫0 𝑒 2 𝑑𝑥 = −𝑒 −2 = − (𝑒 − 2 − 𝑒 −2 ) = −(𝑒 −0,75 − 𝑒 0 ) =0,5276
2

 ESPERANÇA MATEMÁTICA, VALOR MÉDIO OU VALOR ESPERADO: Define-se como Esperança Matemática
para uma variável aleatória contínua o número dado por:

+∞
𝐸[𝑋] = ∫ 𝑥𝑓(𝑥)𝑑𝑥
−∞

 VARIÂNCIA: Define-se variância como o número dado por:

𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2


Onde:
+∞
𝐸[𝑋 2 ] = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥
−∞

Analogamente ao caso discreto, as caracterizações da Esperança e da variância são as mesmas da média


aritmética e da variância da análise descritiva, a diferença reside no fato da esperança matemática usar
probabilidades como frequências. Desta forma, a leitura de média vai para “valor médio esperado”.
Exemplo:

Seja X a v.a. contínua que modela a concentração de uma substância no leito de um esgoto.

A f.d.p de x é dada por f(x) = 2x, 0< x < 1. Determine Esperança, Variância e Desvio Padrão. Resolução:

1 1
𝑥3 (13 − 03 ) 2
𝐸[𝑋] = ∫ 𝑥. 2𝑥𝑑𝑥 = 2 ∫ 𝑥 2 𝑑𝑥 = 2. = 2. ⇒ 𝐸[𝑋] = = 0,67
0 0 3 3 3

𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2


1 1
𝑥4 (14 − 04 ) 1
𝐸[𝑋 2 ] = ∫ 𝑥 2 2𝑥𝑑𝑥 = 2 ∫ 𝑥 3 𝑑𝑥 = 2.
= 2. =
0 0 4 4 2
1 2 2 1 4 1
𝑉[𝑋] = − ( ) = − ⇒ 𝑉[𝑋] = = 0,06
2 3 2 9 18

𝐷𝑃[𝑋] = √𝑉[𝑋] = √0,06 ⇒ 𝐷𝑃[𝑋] = 0,24

8.2 Propriedades da Esperança e da Variância

Para variáveis aleatórias discretas ou contínuas, a Esperança e Variância apresentam as seguintes


propriedades:

77
Professor Cledinaldo Castro Araújo

Propriedades da Esperança

 Esperança de uma constante: 𝐸[𝐶] = 𝐶


 Esperança da variável somando ao subtraindo uma constante: 𝐸[𝑋 ± 𝐶] = 𝐸[𝑋] ± 𝐶
 Esperança da variável multiplicada por uma constante: 𝐸[𝑋. 𝐶] = 𝐶. 𝐸[𝑋]
 Esperança de uma combinação linear de variáveis:
𝐸[𝑎1 𝑋1 ± 𝑎2 𝑋2 ±𝑎3 𝑋3 ± ⋯ ± 𝑎𝑛 𝑋𝑛 ] = 𝑎1 𝐸[𝑋1 ] ± 𝑎2 𝐸[𝑋2 ] ± 𝑎3 𝐸[𝑋3 ]± ⋯ ± 𝑎𝑛 [𝐸𝑋𝑛 ]

Propriedades da Variância

 Variância de uma constante: 𝑉[𝐶] = 0 (𝑧𝑒𝑟𝑜)


 Variância da variável somando ao subtraindo uma constante: 𝑉[𝑋 ∓ 𝐶] = 𝑉[𝑋]
 Variância da variável multiplicada por uma constante: 𝑉[𝑋. 𝐶] = 𝐶 2 . 𝑉[𝑋]
 Variância de uma combinação linear de variáveis:
𝑉[𝑎1 𝑋1 ± 𝑎2 𝑋2 ±𝑎3 𝑋3 ± ⋯ ± 𝑎𝑛 𝑋𝑛 ] = 𝑎12 𝑉[𝑋1 ] + 𝑎22 𝑉[𝑋2 ] + 𝑎32 𝑉[𝑋3 ] + ⋯ + 𝑎𝑛2 𝑉[𝑋𝑛 ]

Exemplo: O salário de um vendedor é dado por um salário fixo S0=R$ 1200,00 de acordo com a formula:

S = S0 + 0,15.V, onde S0: Salário fixo e V: Valor das vendas (R$).

Se a venda média mensal é R$ 1000,00 com variância de (R%)2 8100,00. Determine:

a) A média do salário
b) O desvio padrão do salário

Resolução:

Dados do problema: E[V] = R$ 1000,00 V[V] = (R$)2 8100,00

a) E[S] = E[S0 + 0,15.V ]=E[S0]+ E[0,15.V ]=E[S0]+ 0,15.E[V ]=1200 + 0,15.1000 ⇒ E[S]=R$ 1350,00
b) V[S] = V[S0 + 0,15.V ]=V[S0 ]+ V[0,15.V ]= V[S0 ]+ 0,152.V[V ]= 0+0,0225.8100 ⇒ V[S]= (R$)2 182,25.
Logo DP[S] = √𝑉[𝑆] = √182,25⇒ DP[S]=R$ 13,50

78
Professor Cledinaldo Castro Araújo

Capítulo 9
Distribuições de Probabilidade Discretas

9 Introdução

São variáveis cujo conjunto de valores que a ela pode assumir é finito de ou infinito enumerável, ou seja,
que se pode atribuir uma contagem. Estas distribuições modelam diversas situações práticas, como por exemplo:
Nº de peças defeituosas em uma linha de montagem, nº acidentes por hora em uma empresa, nº clientes
satisfeitos em uma carteira de clientes. Esta nota de aula abordará somente as distribuições: Binomial, Poisson e
Hipergeométrica.

9.1 Distribuição Binomial.


Distribuição Binomial é uma distribuição de probabilidade discreta que analisa o número de sucessos em uma
sequência de “n” tentativas, tais que as tentativas sejam independentes, e que cada tentativa resulte apenas em
dois grupos de resultados, um de interesse do pesquisador (sucesso) ou seu complementar (fracasso). Esta forma
de tentativa é chamada de tentativa de Bernoulli. Além disso, a probabilidade de cada tentativa em sucesso “p”
permaneça constante, onde:

P (Sucesso) = p e
P (Fracasso) = 1-p

Se a variável aleatória X: nº de sucessos obedece às condições indicadas, tem-se uma distribuição de


probabilidade Binomial com parâmetros n e p. Então:

𝑋 ~ 𝐵 (𝑛; 𝑝) (“X segue ou se enquadra no modelo Binomial”)

 FUNÇÃO DE PROBABILIDADE DA BINOMIAL

Para uma V.A discreta X, a função de probabilidade e função que associa probabilidade a cada valor x da
variável aleatória X. Para a distribuição Binomial temos:

Observe que em n repetições do experimento podemos ter como resultado a série:

S S F S S F F F S S S S S ... S F F

n resultados
Onde S: Sucesso e F: fracasso.

Considerando que em n repetições do experimento tem-se x sucessos e n-x fracassos. Cada sucesso com
probabilidade p e cada fracasso com probabilidade 1-p, temos então:

𝑛
𝑃(𝑋 = 𝑥) = ( ) . 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥 , 𝑥 = 0, 1, 2, 3, … , 𝑛
𝑥
Onde:

 n: Número de repetições do experimento;


 x: número de sucessos;

79
Professor Cledinaldo Castro Araújo
 p: Probabilidade de sucesso em cada repetição;
 1-p: Probabilidade de fracasso em cada repetição;
 (𝑛𝑥): é o coeficiente binomial,e que conta a quantidade de filas com x sucessos e n-x fracassos, e seu
valor é dado por:
𝑛 𝑛!
( )=
𝑥 𝑥! (𝑛 − 𝑥)!
Importante lembrar que: 0! =1 e 1! =1

Importante: A maioria das calculadoras científicas apresenta a função que calcula o valo do coeficiente
binomial: (𝑛𝑥)
A função é nCr, onde n corresponde ao número de tentativas e r ao número de sucessos na amostra (x)

 ESPERANÇA E VARIÂNCIA DO MODELO BINOMIAL

Partindo do caso geral da Esperança de uma variável aleatória 𝐸[𝑋] = ∑𝑋 𝑥. 𝑃(𝑋 = 𝑥), aplicando
propriedades do Binômio de Newton, obtemos para a Esperança da Binomial a seguinte expressão:

𝐸[𝑋] = 𝑛𝑝

Analogamente, partindo do caso geral da Variância de uma variável aleatória𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 ,
aplicando propriedades do Binômio de Newton, obtemos para a Variância da Binomial a seguinte
expressão:
𝐸[𝑋] = 𝑛𝑝(1 − 𝑝)

Vejamos um exemplo:

Seja X a V.A. nº de sucessos em 5 lançamentos de uma moeda não - viciada. Determinar:

a) A probabilidade de ocorrer nenhuma cara


b) A probabilidade de ocorrer exatamente uma cara
c) A probabilidade de ocorrer pelo menos uma cara
d) A probabilidade de ocorrer menos de três caras
e) O número médio de caras ou esperança do número de caras.

Resolução:

Inicialmente, vamos verificar se este exemplo se enquadra em um modelo binomial verificado as três
condições que caracterizam o modelo:

I. Existem n repetições de um experimento? Sim, n=5 lançamentos da moeda;


II. Cada repetição leva a dois resultados, um sucesso e um fracasso? Sim, cara e coroa, sendo o
sucesso resultado igual a cara;
III. As probabilidades de sucesso e fracasso são constantes ao longo das repetições? Sim, em
qualquer lançamento as probabilidades de cara e coroa são mantidas.

Desta forma, a X: nº de caras é uma autentica variável aleatória com distribuição binomial e seus
parâmetros são: n=5 e p=0,5. Assim:

X: nº de caras

80
Professor Cledinaldo Castro Araújo
X ~ B (5;0,5)

a) A probabilidade de ocorrer nenhuma cara corresponde a P(X=0), assim:

5
𝑃(𝑋 = 0) = ( ) . 0,50 . (1 − 0,5)5−0 = 1.1. 0,955 = 0,03125 𝑜𝑢 3,12%
0

5 5! 5!
( )= = =1
0 0! (5 − 0)! 5!

b) A probabilidade exatamente uma cara corresponde a P(X=1), assim:

5
𝑃(𝑋 = 1) = ( ) . 0,51 . (1 − 0,5)5−1 = 5. 0,51 . 0,54 = 0,15625 0𝑢 15,62%
1

5 5! 5!
( )= = =5
1 1! (5 − 1)! 4!

c) A probabilidade de ocorrer pelo menos uma cara corresponde a P (X ≥ 1), vejamos:

Como as probabilidades estão em pontos, a probabilidade procurada pode ser calculada da


seguinte forma:

P (X ≥ 1) = P(X=1) + P(X=2) + P(X=3) + P(X=4) + P(X=5)

Outra forma seria raciocinar da seguinte forma: Qual o complementar de pelo menos um ? A
resposta é nenhum! Vejamos;

 P (X ≥ 1) = 1-P(X<1), como tratam-se de inteiros não negativos equivale a:


 P (X ≥ 1) = 1-P(X=0), logo:
 P (X ≥ 1) = 1-0,03125 = 0,96875 ou 96,88%

d) A probabilidade de ocorrer menos de três caras corresponde a P(X<3), vejamos:

Como são inteiros não negativos P (X < 3) = P (X ≤ 2) = P(X=0) + P(X=1) + P(X=2)


Aplicando a função de probabilidade obtemos:

 P(X=0) = 0,03125
 P(X=1) = 0,15625
 P(X=2) = 0,31250

Finalmente, P (X < 3) = P (X ≤ 2) = 0,03125+0,15625+0,31250 = 0,5000 ou 50%

e) O número médio de caras ou esperança do número de cara Aplicando em 𝐸[𝑋] = 𝑛. 𝑝, obtemos:

𝐸[𝑋] = 5.0,5 = 2,5 𝑐𝑎𝑟𝑎𝑠

 PROBABILIDADE DO MODELO BINOMIAL COM USO DO EXCEL

As probabilidades do modelo Binomial podem ser calculadas no Excel de acordo com a sintaxe abaixo:

Sintaxe: “= DISTR.BINOM (núm_s; tentativas; probabilidade_s; cumulativo)” onde:

81
Professor Cledinaldo Castro Araújo

 Núm_s: o número de sucessos (x);


 Tentativas: número de repetições do experimento (n);
 Probabilidade_s: probabilidade de sucesso (p);
 Cumulante: corresponde a opção de calcular a probabilidade acumulada (VERDADEIRO) ou apenas
probabilidade do ponto (FALSO).

9.2 Distribuição de Poisson


Seja X a v.a. nº de sucessos em um intervalo contínuo, cuja taxa de ocorrências de sucesso λ é constante.
Apresentando ainda as seguintes características:

 O número de ocorrências de um evento em um intervalo de tempo (espaço) é independente do


número de ocorrências do evento em qualquer outro intervalo disjunto;
 A probabilidade de duas ou mais ocorrências simultâneas é praticamente zero;
 O número médio de ocorrências por unidade de tempo (espaço) é constante ao longo do tempo
(espaço);
 Ocorrências distribuídas uniformemente sobre o intervalo considerado;
 O número de ocorrências durante qualquer intervalo depende somente da duração ou tamanho do
intervalo;

Então:
X: nº de sucessos
𝑋 ~ 𝑃(𝜆)

 FUNÇÃO DE PROBABILIDADE DO MODELO POISSON

A função de probabilidade para o modelo de Poisson é dado por:

𝑒 −λ . λ𝑥
𝑃(𝑋 = 𝑥) = , 𝑥 = 0, 1, 2, 3, … , ∞
𝑥!

 X: valor da v. a. nº de ocorrências do evento em um intervalo


 λ: taxa de ocorrência do evento x (nº esperado de eventos no intervalo)
 e ≅2,71828 (constante natural)

Observação: É comum as bibliografias utilizarem a notação genérica λt em lugar de λ.

 ESPERANÇA E VARIÂNCIA DO MODELO POSSON

Partindo do caso geral da Esperança de uma variável aleatória 𝐸[𝑋] = ∑𝑋 𝑥. 𝑃(𝑋 = 𝑥), obtemos para a
Esperança da Poisson a seguinte expressão:

𝐸[𝑋] = 

Analogamente, partindo do caso geral da Variância de uma variável aleatória𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 ,
obtemos para a Variância da Poisson a seguinte expressão:

𝑉[𝑋] = 

82
Professor Cledinaldo Castro Araújo
Observação: A demonstração das expressões da esperança e variância encontra-se nos apêndices.
Vejamos um exemplo:

Sabe-se que a cada dia chegam, em média, 2 navios em um porto. Considerando a chegada de um navio em
qualquer dia é independente. Determine a probabilidade de chegarem a este porto em dia qualquer:

a) Nenhum navio;
b) Pelo menos um navio;
c) Menos de três navios

Resolução:
Inicialmente, vamos verificar as condições do modelo;

I. O número de ocorrências de um evento em um intervalo de tempo é independente do número de


ocorrências do evento em qualquer outro intervalo disjunto? sim, as chegadas dos navios em
qualquer dia são independentes;
II. A probabilidade de duas ou mais ocorrências simultâneas é praticamente zero? A probabilidade
de dois navios chegarem ao mesmo tempo no decorrer de um dia pode ser considerada remota;
III. O número médio de ocorrências por unidade de tempo (espaço) é constante ao longo do tempo
(espaço)? Sim, está sendo considerado que o número médio de navios que chegam por dia é
constante e igual a dois;
IV. Ocorrências distribuídas uniformemente sobre o intervalo considerado? Pode-se considerar, sem
perca de generalidade, que possibilidade dos navios chegarem ao porto é a mesma ao longo do
dia, ou seja, não há uma previsão que seja mais provável um navio chegar pela manhã ou pela
tarde, por exemplo.
V. O número de ocorrências durante qualquer intervalo depende somente da duração ou tamanho
do intervalo? Sim, a taxa de chegada é de dois navios por dia, quantos navios chegariam em
uma semana?

Então a v.a X: nº de navios que chegam ao porto é uma autentica distribuição de Poisson, logo;

𝑋 ~ 𝑃(2)

a) Nenhum navio, corresponde a P(X=0), assim;

𝑒 −2 . 20 𝑒 −2 . 1
𝑃(𝑋 = 0) = = = 0,1353 𝑜𝑢 13,53%
0! 1

b) Pelo menos um navio, corresponde a P(X≥1), assim:

Aplicando o complementar P(X≥1) =1- P(X<1) = 1-P(X=0), logo P(X≥1) =1-0,1353=0,8647 ou 86,47%

c) Menos de três navios, corresponde a P(X<3), assim:

Como são inteiros não-negativos, P(X<3)= P(X≤2), logo: P (X<3) = P(X=0) + P(X=1) + P(X=2)

 𝑃(𝑋 = 0) = 0,1353
𝑒 −2 .21 𝑒 −2 .2
 𝑃(𝑋 = 0) = 1!
= 1
= 0,2707 𝑜𝑢 27,07%
𝑒 −2 .22 𝑒 −2 .4
 𝑃(𝑋 = 0) = 2!
= 2
= 0,2707 𝑜𝑢 27,07%

P (X<3) = 0,1353+0,2707+0,2707 = 0,6767 ou 67,67%

83
Professor Cledinaldo Castro Araújo

Observação: os valores parciais foram arredondados para quatro casas pelo método tradicional.

 PROBABILIDADE DO MODELO POISSON COM USO DO EXCEL

As probabilidades do modelo Poisson podem ser calculadas no Excel de acordo com a sintaxe abaixo:

Sintaxe: “= DIST.POISSON(x; média; cumulativo)” onde:

 x: o número de sucessos (x);


 Média: taxa de ocorrências de sucesso (λ)
 Cumulante: corresponde a opção de calcular a probabilidade acumulada (VERDADEIRO) ou apenas
probabilidade do ponto (FALSO).

9.3 Distribuição de Poisson como Aproximação da Binomial

Em muitas situações nos deparamos com a situação em que o número de repetições n é grande 𝑛 → ∞ e p é
pequeno (𝑝 → 0), no cálculo da função binomial, o que nos leva a algumas dificuldades, pois, como podemos
analisar, para n muito grande e p pequeno, fica relativamente difícil calcularmos a probabilidade de sucessos a
partir do modelo binomial, isto é, utilizando a função de probabilidade.
𝑛
𝑃(𝑋 = 𝑘) = ( ) . 𝑝𝑘 . (1 − 𝑝)𝑛−𝑘
𝑘
Observamos que podemos reescrever a expressão acima da seguinte forma:
𝑛! 𝑛𝑘 𝑛𝑝 𝑛! (𝑛𝑝)𝑘 𝑛𝑝 𝑛−𝑘
𝑃(𝑋 = 𝑘) = . 𝑝𝑘 𝑘 . (1 − )𝑛−𝑘 = . 𝑘 . (1 − )
𝑘! (𝑛 − 𝑘)! 𝑛 𝑛 𝑘! (𝑛 − 𝑘)! 𝑛 𝑛
e, tomando λ = 𝑛𝑝, segue que:
𝑛−𝑘
𝑛(𝑛 − 1) … (𝑛 − 𝑘 + 1) λ𝑘 λ λ𝑘 1 k−1 λ
𝑃(𝑋 = 𝑘) = . 𝑘 . (1 − )𝑛−𝑘 = . 1. (1 − ) … (1 − ) (1 − )
𝑘! 𝑛 𝑛 𝑘! 𝑛 𝑛 𝑛
Se tomarmos o limite quando 𝑛 → ∞ , obtemos que:
1 k−1
lim𝑛→∞ 1. (1 − 𝑛) … (1 − 𝑛
)= 1 e
λ 𝑛−𝑘 λ 𝑛
lim (1 − ) = lim (1 − ) = 𝑒 −λ
𝑛→∞ 𝑛 𝑛→∞ 𝑛
(Estes resultado está simulado com Excel no APÊNDICE)

Assim temos que:


𝑒 −λ . λ𝑘
lim 𝑃(𝑋 = 𝑘) =
𝑛→∞ 𝑘!
Empiricamente, considera-se apropriada a aproximação para:

Importante: Condições para a aproximação:


Esta é apenas uma das proposições, importante destacar que quanto maior o n e quanto menor o
Regra Empírica: n ≥100 e np ≤ 5
p, melhor será a aproximação.

Ao utilizarmos Poisson como aproximação da Binomial, de acordo com o exposto acima, o valor de λ é obtido pela
fórmula: λ= np.

Significa que, dentro destas condições, uma probabilidade dada pelo modelo Binomial de parâmetros n e p se
aproxima do valor dado pela Poisson de parâmetro λ= np.

84
Professor Cledinaldo Castro Araújo
Por exemplo:

Considere a v.a 𝑋 ~ 𝐵(200; 0,01)

Com a Binomial:

200
𝑃(𝑋 = 0) = ( ) . 0,010 . (1 − 0,01)200−0 = 1.1. 0,99200 = 0,1339797
0

Como n =200 ( ≥ 100) e n.p=2 (≤5), podemos aproximar o cálculo da Binomial pela Poisson parâmetro 2,
logo:

Considere a v.a 𝑋 ~ 𝑃(2)

Com a Poisson
𝑒 −2 . 20 𝑒 −2 . 1
𝑃(𝑋 = 0) = = = 0,1353353
0! 1

Observamos um “erro” de -0,00134, que pode ser considerado pequeno.

9.4 Distribuição Hipergeométrica

Seja X a v.a. nº de sucessos obtidos em uma amostra de n retirada sem reposição de população de N, dos
quais r elementos apresentam a característica de interesse (sucesso). Então:

X: nº de sucessos
𝑋 ~ 𝐻𝑖𝑝(𝑁; 𝑛; 𝑟)

Este modelo difere do modelo binomial pela não reposição das peças, veja que se as retiradas forem com
reposição, a probabilidade de sucesso torna-se constante, e temos então um modelo binomial.

 FUNÇÃO DE PROBABILIDADE

A probabilidade de x sucessos consiste em calcular quantos grupos de tamanho n podemos montar com x
sucessos obtidos entre r sucessos disponíveis e n-x fracassos obtidos entre N-r fracassos disponíveis e dividir
este quantitativo pelo total de grupos possíveis de tamanho n entre N elementos disponíveis.

(𝑥𝑟 )(𝑁−𝑟
𝑛−𝑥
)
𝑃(𝑋 = 𝑥) = , 𝑥 = 0, 1,2, 3, … . , min(𝑟; 𝑛)
(𝑁
𝑛
)

 ESPERANÇA E VARIÂNCIA DA HIPERGEOMÉTRICA

Partindo do caso geral da Esperança de uma variável aleatória𝐸[𝑋] = ∑𝑋 𝑥. 𝑃(𝑋 = 𝑥), obtemos para a
Esperança da Hipergeométrica a seguinte expressão:
𝑛𝑟
𝐸[𝑋] =
𝑁
Analogamente, partindo do caso geral da Variância de uma variável aleatória𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 ,
obtemos para a Variância da Hipergeométrica a seguinte expressão:

𝑁−𝑛 𝑟 𝑟
𝑉[𝑋] = ( ) . 𝑛. ( ) . (1 − )
𝑁−1 𝑁 𝑁

85
Professor Cledinaldo Castro Araújo
Vejamos um exemplo:

Seja X a v.a. nº de peças defeituosas entre 5 peças retiradas sem reposição de um grupo contando 20 peças,
das quais a 8 são defeituosas. Qual a probabilidade de apenas uma das peças ser defeituosa?
Resolução:

Neste caso, basta identificar os parâmetros da distribuição e a não reposição dos elementos, assim:
X: nº de peças defeituosas

N=20 (total de peças)


n=5 (tamanho da amostra)
r=8 (total de defeituosas na população)

A probabilidade procurada é P(X=1) (“uma peça defeituosa”)


Quantos grupos (amostras) de tamanho 5 podemos formar com “1”(x) peça defeituosa e “4”(n-x) não
defeituosas?

Devemos escolher 1 defeituosa entre as 8 defeituosas (r) e 4 entre as 12 não defeituosas (N-r), isso pode ser
feito da seguinte forma:
𝑟 𝑁−𝑟 8 20 − 8 8 12
( )( ) = ( )( ) = ( )( )
𝑥 𝑛−𝑥 1 5−1 1 4
Calculando:
8! 8! 8.7!
(81) = 1!(8−1)! = 1!7! = 1!7! = 8 (formas de escolher 1 entre 8)
12! 12! 12.11.10.9.8!
(12
4
) = 4!(12−4)! = 4!8! = 4.3.2.1!8!
= 495 (formas de escolher 4 entre 12)

Logo existem 8x495 =3.960 amostras

Esta contagem corresponde ao número de casos favoráveis, para o cálculo da probabilidade precisamos do
número de casos possíveis, qual seria este número?

O total de grupos possíveis de se formar de 5 (n) peças escolhidas entre 20(N), assim:

𝑁 20
( )=( )
𝑛 5
Calculando:
20 20! 20! 20.19.18.17.16.15!
( )= = = = 15.504
5 5! (20 − 5)! 5! 15! 5.4.3.2.1.15!

3.960
𝑃(𝑋 = 1) = = 0,255418 𝑜𝑢 25,54%
15.504

Aplicando diretamente na função de probabilidade, temos:

(𝑥𝑟 )(𝑁−𝑟
𝑛−𝑥
) (81)(20−8
5−1
) (81)(12
4
) 8𝑥495
𝑃(𝑋 = 𝑥) = = = = = 0,255418 𝑜𝑢 25,54%
(𝑁
𝑛
) (20
5
) (20
5
) 15.504

 PROBABILIDADE DO MODELO HIPERGEOMÉTRICO COM USO DO EXCEL

As probabilidades do modelo Hipergeométrico podem ser calculadas no Excel de acordo com a sintaxe
abaixo:

86
Professor Cledinaldo Castro Araújo

Sintaxe: “=DIST.HIPERGEOM.N(amostra_s; amostra_núm; população_s; núm_população; cumulativo)”


Onde:

 Amostra_s: O número de sucessos em uma amostra (x)


 Amostra_núm: O tamanho da amostra (n)
 População_s: O número de sucessos na população(r)
 Núm_população: O tamanho da população (N)
 Cumulativo: corresponde a opção de calcular a probabilidade acumulada (VERDADEIRO) ou apenas
probabilidade do ponto (FALSO).

9.5 A Distribuição Binomial como Aproximação da Hipergeométrica


Já identificamos que a diferença básica entre a distribuição Hipergeométrica e Binomial é a não reposição dos
elementos selecionados, ou seja, na Hipergeométrica a probabilidade de sucesso muda a cada retirada. Mas o
que aconteceria com esta variação quando 𝑁 → ∞? Por exemplo: de um grupo com 10.000, das quais 2.000 são
defeituosas, seleciona-se ao caso e sem reposição 5 peças. A probabilidade de se encontrar peças defeituosas
seria muito afetada pela não reposição? Não, e a medida que N é grande com relação a n esta aproximação é
melhor. Vejamos:
𝑟 𝑁−𝑛
lim𝑁→∞ = 𝑝 e lim𝑁→∞ ( ) =1
𝑁 𝑁−1
Onde:

 r: nº de sucessos na população
 p: probabilidade de sucessos (Binomial)
 N:tamanho da população
 n: tamanho da amostra
Logo:

𝑛𝑟
lim 𝐸[𝑋] = lim = 𝑛𝑝
𝑁→∞ 𝑁→∞ 𝑁

𝑁−𝑛 𝑟 𝑟
lim 𝑉[𝑋] = lim ( ) . 𝑛. ( ) . (1 − ) = 𝑛𝑝(1 − 𝑝)
𝑁→∞ 𝑁→∞ 𝑁−1 𝑁 𝑁

Desta forma, quando 𝑁 → ∞ a probabilidades de sucesso tende a permanecer constante e igual a p. Esperança e
variância da Hipergeométrica se aproximam da esperança e variância da Binomial.
Em situações de amostragem, um dos requisitos é que cada elemento da população tenha igual probabilidade de
participar da amostra. O que quase sempre não é possível, uma vez que a maioria das pesquisas é realizada sem
reposição, imagine se uma pessoa vai responder duas vezes o mesmo questionário. Nestes casos a distribuição
adequada seria a Hipergeométrica, contudo, quando o tamanho da população é grande em relação ao tamanho
da amostra, a distribuição binomial pode ser empregada sem nenhum problema. Em termos de amostragem, um
critério para aplicação da Binomial como aproximação da Hipergeométrica será:

Importante: Condições para a aproximação:


Para amostragens sem reposição: n não exceder 5% de N.

87
Professor Cledinaldo Castro Araújo

Capítulo 10
Distribuição Normal (Gaussiana)

10 Distribuição Normal

Quando uma variável aleatória X segue uma distribuição binomial, fica restrita a assumir somente valores inteiros.
Em diferentes circunstâncias, no entanto, os resultados de uma v.a. podem não estar limitados a inteiros ou a
contagens. Suponha que X represente a altura de um indivíduo. Raramente um indivíduo tem exatamente 1,67
cm ou 1,68 cm de altura. Teoricamente X, pode assumir um número infinito de valores intermediários, como
1,6704 cm ou 1,6832 cm. Trata-se de uma v.a contínua em que se os números de valores possíveis de X se
aproximam do infinito, a largura do intervalo se aproxima de zero, o gráfico paulatinamente se parecerá com uma
curva suave, que é usada para representar a distribuição de probabilidade de uma v.a. contínua, chamada de
função densidade de probabilidade. A distribuição contínua mais comum é a distribuição normal. O conhecimento
desta distribuição de probabilidade se deve a Abraham de Moivre (1667-1754) que, em 1733, apresentou a
função que a representa. Tratava-se até então de um exercício teórico, sem aplicação prática. J. Bernoulli (1654-
1705) acreditava que poderia haver aplicação na área da economia, no entanto, o uso desses conhecimentos na
prática se deve a Pierre-Simon Laplace (1749-1827) na França e a Johan K.F. Gauss (1777-1855) na Alemanha. A
distribuição normal é também conhecida como “distribuição Gaussiana” pela suposição de que Gauss foi a
primeira pessoa a reafirmar o papel fundamental proposta por Moivre. Sua aplicação na análise de dados na área
da biomedicina é grande, pois muitas variáveis numéricas contínuas de estudos anteriores comprovaram que têm
distribuição normal ou aproximadamente normal. Como por exemplo, podemos citar a altura, o peso, o índice de
massa corporal (IMC), dentre outras. Alguns dos principais métodos empregados na análise estatística (Teste t de
Student, Análise de Variância, Análise de Regressão, dentre outros) exigem que os dados tenham distribuição
normal para sua realização.

A distribuição normal é uma das mais importantes distribuições contínuas de probabilidade, pois muitos
fenômenos aleatórios comportam-se de forma próxima a essa distribuição, ou seja, apresentam um
comportamento que adere a curva de Gauss. Diz-se que a variável “segue” modelo normal ou
“aproximadamente” Normal. Exemplos:

1. altura;
2. pressão sanguínea;
3. peso;

Então, a distribuição normal é uma distribuição de probabilidade usada para variáveis aleatórias contínuas
(obtidas por mensuração), com a seguinte notação:

88
Professor Cledinaldo Castro Araújo

𝑋~𝑁(𝜇; 𝜎 2 ).

 CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL

I. A variável X pode assumir qualquer valor real (−∞ 𝑎 + ∞);


II. O gráfico da distribuição Normal tem uma curva simétrica (média = moda = mediana) e unimodal na
forma de um sino e é apresentado um ponto de inflexão à esquerda (𝜇 − 1𝜎) e outros à direita
(𝜇 + 1𝜎);
III. É completamente determinada por 𝜇 e 𝜎 2 , onde 𝜎 2 representa a quantidade de dispersão ao redor da
média.

 FUNÇÃO DENSIDADE DA DISTRIBUIÇÃO NORMAL

A função densidade de probabilidade dada por:

1 1 𝑥−𝜇 2
− ( )
𝑓(𝑥) = 𝑒 2 𝜎 , −∞ < 𝑥 < +∞
𝜎√2𝜋
Onde:
 X: Variável aleatória contínua analisada
 x : Valor qualquer da variável aleatória X
 𝜇 : Média populacional
 𝜎: Desvio padrão populacional
 𝜋 =3,1416...
 e =2,7182...

Temos que:

I. 𝑓(𝑥) ≥ 0
+∞
II. ∫−∞ 𝑓(𝑥)𝑑𝑥 = 1 (a área sob curva é igual a 1)

 ESPERANÇA E VARIÂNCIA

A Esperança e a Variância são os parâmetros da Distribuição Normal

 𝐸[𝑋] = 𝜇
 𝑉[𝑋] = 𝜎 2

 DISTRIBUIÇÃO NORMAL PADRÃO

Como foi colocado anteriormente, as probabilidades em modelos contínuos correspondem à área sob a curva
da Função Densidade de Probabilidade (fdp). Contudo, uma característica importante da distribuição Normal é
que a área sob a curva é a mesma para o mesmo número de desvios padrões.

Uma regra que auxilia a interpretação de um desvio padrão é a regra chamada de Regra Empírica, aplicável
somente a conjunto de dados com distribuição normal ou aproximadamente em forma de sino, pois mostra como

89
Professor Cledinaldo Castro Araújo
a média e o desvio padrão estão relacionadas com a proporção dos dados que se enquadram em determinados
limites. A regra é a seguinte:

 Cerca de 68% dos valores estão a menos de 1 desvio padrão a contar da média;
 Cerca de 95% dos valores estão a menos de 2 desvios padrão a contar da média;
 Cerca de 99,7% dos valores estão a menos de 3 desvios padrão a contar da média.

Figura 9 – Probabilidades do Modelo Normal em Função do número de desvios padrões

Desta forma, qualquer que sejam os valores de 𝜇 𝑒 𝜎 a distribuição pode ser convertida em outra distribuição
normal. Esta distribuição é chamada de Distribuição Normal Padrão cuja média é 0 (zero) e a variância 1(um). A
transformação é realizada da seguinte forma:
𝑋−𝜇
𝑍=
𝜎

Onde Z corresponde ao número de desvios padrões a partir da média, por exemplo, se Z=2 significa de a distância
de X até 𝜇 é duas vezes o 𝜎.

Aplicando esta transformação temos:

𝑃𝑎𝑑𝑟𝑜𝑛𝑖𝑧𝑎çã𝑜
𝑋~𝑁(𝜇; 𝜎 2 ) → 𝑋~𝑁(0; 1)

De forma resumida, a distribuição Normal padrão é uma distribuição de média 0 (zero) e variância (um), obtida a
parir de qualquer distribuição normal através da transformação indicada acima. Segue abaixo a função densidade
de probabilidade da distribuição Normal Padrão:

 FUNÇÃO DENSIDADE DE PROBABILIDADE DA DISTRIBUIÇÃO NORMAL PADRÃO

Com a transformação indicada (z), a média é igual a zero e variância igual a um, desta a função densidade
de probabilidade assume a seguinte forma.

1 1 2
𝑓(𝑧) = 𝑒 −2𝑧 , −∞ < 𝑧 < +∞
√2𝜋

 TABELA NORMAL PADRÃO


A partir da densidade da Normal Padrão foram calculadas probabilidades para diversos valores de Z, cuja
precisão é de duas casas decimais para Z e quatro casas decimais para a área (probabilidade), todos estes
valores foram organizados em uma tabela chamada Tabela Normal Padrão.

90
Professor Cledinaldo Castro Araújo
Existem outras versões para estas tabelas, as alterações consistem basicamente na forma de apresentação dos
valores, as principais variações consideram:

I. A probabilidade entre 0 e um valor positivo de z: P(0<Z<z); “Probabilidade do zero ao ponto”


II. A probabilidade acumulada abaixo de z: P(Z<z);” Probabilidade de menos infinito ao Ponto”.

Assim como a tabelas Normal Padrão, existem outras tabelas estatísticas para outras distribuições e que
também apresentam versões diferentes. Uma sugestão é que sejam conhecidas as principais versões de cada
tabela, desde que não haja confusão em sua aplicação. Segue abaixo duas versões da tabela Normal:

91
Professor Cledinaldo Castro Araújo

Quadro 2 – Tabela: Normal Padrão - P(0<Z<z) “Probabilidade do zero até o ponto”

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

92
Professor Cledinaldo Castro Araújo
Forma de consulta para o modelo de tabela I:

A tabela apresenta precisão para duas casas decimais para Z, sendo a primeira casa indicada na coluna (em
azul) e a segunda na linha (em azul). As probabilidades estão indicadas nos cruzamentos das primeiras e
segundas casas decimais. Por exemplos:

1. Z=1,12 (1,1 – coluna e 0,02 – linha) ⇒ P(0<Z<1,12) = 0,3685


2. Z=1,00 (1,0 – coluna e 0,00 – linha) ⇒ P(0<Z<1,00) = 0,3413
3. Z=0,54 (0,5 – coluna e 0,04 – linha) ⇒ P(0<Z<0,54) = 0,2954

Vejamos um exemplo:

As medidas da corrente elétrica em pedaço de fio seguem um modelo a distribuição Normal, com uma
média de 10 mA e uma variância de 4 mA2. (mA: miliamperes)

a) P(10<X<12) b) P(X<13) c) P(9<X<13) d) P(12<X<15) e) P(X< a) = 0,9772, a=?

Resolução:

Inicialmente, vamos identificar os parâmetros do modelo:

𝜇 = 10𝑚𝐴 e 𝜎 2 = 4𝑚𝐴2
X: Corrente elétrica em miliamperes.
𝑋~𝑁(10; 4)

Se a variância é 4 mA2, então o desvio padrão é 2mA.

a) P(10<X<12), significa a probabilidade da medida da corrente está entre 10 e 12 mA, assim:

P(10<X<12) =?
𝑋−𝜇
O processo consiste em aplicar a padronização 𝑍 = 𝜎 e verificar o valor padronizado na tabela normal
padrão:
10 − 10 𝑋 − 10 12 − 10
𝑃(10 < 𝑋 < 12) = 𝑃 ( < < ) = 𝑃(0 < 𝑍 < 1) =?
2 2 2

Observação: na padronização, a variável X se transforma diretamente na variável Z.


Para Z=1: 0,3413

𝑃(0 < 𝑍 < 1) = 0,3413 𝑜𝑢 34,13%

93
Professor Cledinaldo Castro Araújo

b) P(X<13), significa a probabilidade da medida da corrente ser menor que 13 mA, assim:

P(X<13) =?

𝑋−𝜇
Aplicando a padronização: 𝑍 = 𝜎

𝑋 − 10 13 − 10
𝑃(𝑋 < 13) = 𝑃 ( < ) = 𝑃(𝑍 < 1,5) =?
2 2
Metade da Curva:0,5 Para Z=1,5: 0,4332

𝑃(𝑍 < 1,5) = 0,5 + 0,4332 = 0,9332 𝑜𝑢 93,32%

c) P(9<X<13), significa a probabilidade da medida da corrente está entre 9 e 13 mA, assim:

P(9<X<13) =?

𝑋−𝜇
Aplicando a padronização: 𝑍 = 𝜎

9 − 10 𝑋 − 10 13 − 10
𝑃(9 < 𝑋 < 13) = 𝑃 ( < < ) = 𝑃(−0,5 < 𝑍 < 1,5) =?
2 2 2

Para Z=-0,5: 0,1915


Para Z=1,5: 0,4332

𝑃(−0,5 < 𝑍 < 1,5) = 0,1915 + 0,4332 = 0,6247 𝑜𝑢 62,47%

Observação: A tabela não fornece probabilidade para valores negativos de Z, para tanto usa-se a simetria
da distribuição. Ex: P(-0,5<Z<0) = P(0<Z<0,5).

d) P(12<X<15), significa a probabilidade da medida da corrente está entre 12 e 15 mA, assim:

P(12<X<15) =?

𝑋−𝜇
Aplicando a padronização: 𝑍 =
𝜎

12 − 10 𝑋 − 10 15 − 10
𝑃(12 < 𝑋 < 15) = 𝑃 ( < < ) = 𝑃(1 < 𝑍 < 2,5) =?
2 2 2

94
Professor Cledinaldo Castro Araújo

Para Z=1: 0,3413

Para Z=2,5: 0,4939

Como a tabela fornece a probabilidade entre 0 e Z, basta fazer a diferença entre a maior área e a maior,
assim:

𝑃(1 < 𝑍 < 2,5) = 0,4939 − 0,3414 = 0,1526 𝑜𝑢 15,26%

e) P (X< a) = 0,9772, qual o valor da medida da corrente tal que a probabilidade abaixo dele é de 0,9772
? assim:

P (X< a) = 0,9772, a=?

𝑋−𝜇
Aplicando a padronização: 𝑍 = 𝜎

𝑋 − 10 𝑎 − 10 𝑎 − 10
𝑃(𝑋 < 𝑎) = 𝑃 ( < ) = 𝑃 (𝑍 < ) = 0,9772
2 2 2

Metade da curva:0,5
Para Z=?: 0,4772

A probabilidade abaixo de a é igual a 0,4772, sendo que 0,5 está abaixo da média e o restante (0,4772)
entre a média e o valor a. Desta forma, qual o valor de Z tal que a área entre ele e a média é de 0,4772?

Observando na parte interna da tabela, verificamos que este valor é 2, logo:

𝑎 − 10
= 2 ⇒ 𝑎 − 10 = 4 ⇒ 𝑎 = 14 𝑚𝐴
2

95
Professor Cledinaldo Castro Araújo

Forma de consulta para o modelo de tabela II:


Quadro 3 –Tabela II: Normal Padrão - P(Z<z) “Probabilidade de menos Infinito até o ponto”

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,0 0,0013 0,0010 0,0007 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001 0,0000
-2,9 0,0019 0,0018 0,0017 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0020 0,0020 0,0019
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,2 0,0139 0,0136 0,0132 0,0129 0,0126 0,0122 0,0119 0,0116 0,0113 0,0110
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0238 0,0233
-1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0.0307 0,0300 0,0294
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0570 0,0559
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0722 0,0708 0,0694 0,0681
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,7 0,2420 0,2389 0,2358 0,2327 0,2297 0,2266 0,2236 0,2206 0,2177 0,2148
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7703 0,7734 0,7764 0,7794 0,7823 0,7853
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

96
Professor Cledinaldo Castro Araújo

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9278 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9430 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9648 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9700 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9762 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9874 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 1,0000

O processo de padronização é o mesmo, a forma de consulta na tabela é o mesmo, o inteiro e o primeiro


dígito encontra-se na coluna Z, o segundo dígito após a vírgula está na linha superior (azul). Porém, a tabela
fornece a probabilidade acumulada abaixo do valor x, ou seja, P(Z≤z). Tomando por base o exemplo anterior,
vamos calcular a probabilidade de P(X<13).
Temos que:

𝜇 = 10𝑚𝐴 e 𝜎 2 = 4𝑚𝐴2
X: Corrente elétrica em miliamperes.

Assim:
P(X<13) =?
𝑋−𝜇
Aplicando a padronização: 𝑍 = 𝜎

𝑋 − 10 13 − 10
𝑃(𝑋 < 13) = 𝑃 ( < ) = 𝑃(𝑍 < 1,5) =?
2 2

Para Z=1,5: 0,9332

𝑃(𝑍 < 1,5) =? (a tabela indica o valor já acumulado), logo:

𝑃(𝑍 < 1,5) = 0,9332 𝑜𝑢 93,32%


Vejamos no recorte abaixo:

97
Professor Cledinaldo Castro Araújo

 PROBABILIDADE DO MODELO NORMAL COM USO DO EXCEL

As probabilidades do modelo Normal podem ser calculadas no Excel de acordo com a sintaxe
abaixo. Assim como nas demais distribuições, o Excel fornece a probabilidade acumulada de
−∞ 𝑎𝑡é 𝑥, ou seja, P(X<x). O critério de cálculo de probabilidades para o modelo normal está
de acordo com o critério da tabela II.

Probabilidades:
Sintaxe: “= DIST.NORM.N(x; média; desv_padrão; cumulativo)”, onde:

 x: valor da variável
 Média: média da distribuição (𝜇);
 Desv-padrão: Desvio padrão da distribuição (𝜎);
 Cumulante: corresponde a opção de calcular a probabilidade acumulada (VERDADEIRO) ou apenas
probabilidade do ponto (FALSO). No caso das distribuições contínuas, não faz sentido a
probabilidade pontual, desta deve-se marcar sempre a opção acumulada.

Função Inversa

Para se determinar um valor, digamos a, tal que a probabilidade abaixo deste valor seja definida, existe
a função INV.NORM.N, segue:

Sintaxe: “=INV.NORM.N(probabilidade; média; desv_padrão)”

 Probabilidade: probabilidade acumulada até o ponto procurado (P(X≤a));


 Média: média da distribuição (𝜇);
 Desv-padrão: Desvio padrão da distribuição (𝜎);

10.1 Combinação Linear de Normais Independentes

Combinação linear é uma expressão definida da seguinte forma:

𝑎1 𝑥1 + 𝑎2 𝑥2 +𝑎3 𝑥3 +𝑎4 𝑥4 … 𝑎𝑛 𝑥𝑛 , 𝑜𝑛𝑑𝑒 𝑎𝑖 𝑠ã𝑜 𝑒𝑠𝑐𝑎𝑙𝑎𝑟𝑒𝑠 𝑒 𝑥𝑖 𝑠ã𝑜 𝑣𝑒𝑡𝑜𝑟𝑒𝑠, 𝑖 = 1, . . , 𝑛.

A combinação linear de distribuições normais considera cada um dos vetores da combinação linear como uma
variável aleatória com modelo normal.
Sejam:
𝑋1 ~𝑁(𝜇1 ; 𝜎12 ), 𝑋2 ~𝑁(𝜇2 ; 𝜎22 ), 𝑋 3 ~𝑁(𝜇3 ; 𝜎32 ), … , 𝑋𝑛 ~𝑁(𝜇𝑛 ; 𝜎𝑛2 )

98
Professor Cledinaldo Castro Araújo

Variáveis aleatórias independentes seguindo modelo normal.

A distribuição de 𝑎1 𝑥1 ± 𝑎2 𝑥2 ±𝑎3 𝑥3 ±𝑎4 𝑥4 … 𝑎𝑛 𝑥𝑛 é também normal. Considerando:

𝑌 = 𝑎1 𝑋1 ± 𝑎2 𝑋2 ±𝑎3 𝑋3 ±𝑎4 𝑋4 … 𝑎𝑛 𝑋𝑛
Então 𝑌~𝑁(𝜇𝑌 ; 𝜎𝑌2 )

Observação: Este resultado pode ser demostrado através da definição das funções geradoras de momentos de
cada distribuição.

Utilizando as propriedades da esperança e variância, temos que:

 Média: 𝝁𝒀 = 𝑬[𝒀] = 𝑬[𝒂𝟏 𝑿𝟏 ± 𝒂𝟐 𝑿𝟐 ± … ± 𝒂𝒏 𝑿𝒏 ] = 𝒂𝟏 𝝁𝟏 ± 𝒂𝟐 𝝁𝟐 ± ⋯ ± 𝒂𝒏 𝝁𝒏


 Variância: 𝝈𝟐𝒀 = 𝑽[𝒀] = 𝑽[𝒂𝟏 𝑿𝟏 ± 𝒂𝟐 𝑿𝟐 ± ⋯ ± 𝒂𝒏 𝑿𝒏 ] = 𝒂𝟐𝟏 𝝈𝟐𝟏 + 𝒂𝟐𝟐 𝝈𝟐𝟐 + ⋯ +𝒂𝟐𝒏 𝝈𝟐𝒏

Exemplo: O custo unitário de um produto segue modelo aproximadamente normal com média R$ 10,00 e
variância (R$)2 1,50. O preço de venda é também normalmente distribuído com média R$ 25,00 e variância (R$)2
2,50. Determine:

a) A distribuição de probabilidade do lucro unitário;


b) A probabilidade do lucro unitário exceder R$ 17,00.

Sejam L, V e C respectivamente Lucro, preço de Venda e Custo relativos a uma unidade do produto (unitários).
Temos que: 𝐿 = 𝑉 − 𝐶

a) Distribuição do lucro L:
𝐶~ 𝑁(10; 1,50) 𝑒 𝑉~ 𝑁(25; 2,50)

 Média: 𝜇𝐿 = 𝐸[𝐿] = 𝐸[𝑉 − 𝐶] = 𝜇𝑉 − 𝜇𝐶 = 25 − 10 ⇒ 𝜇𝐿 = 𝑅$15,00


 Variância: 𝜎𝐿2 = 𝑉[𝐿] = 𝑉[𝑉 − 𝐶] = 𝜎𝑉2 + 𝜎𝐶2 = 2,5 + 1,5 ⇒ 𝜎𝐿2 = (𝑅$)4,00

Logo: 𝐿~ 𝑁(15; 4)

b) Probabilidade do lucro exceder R$ 17,00, P(X > 17) =?

17 − 15
𝑃(𝑋 > 17) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1) = 0,5 − 0,3413 ⇒ 𝑃(𝑍 > 1) = 0,1587 𝑜𝑢 15,87%
2

99
Professor Cledinaldo Castro Araújo

Capítulo 11
Amostragem

11 Amostragem

O pesquisador, na grande maioria das vezes, trabalha com limitações de tempo e escassez de recursos
humanos, materiais e financeiros, fatores estes que acabam impedindo o estudo de um universo de grande
dimensão.
Por outro lado, na maioria das vezes não é preciso estudar toda uma população, bastando analisar uma
parcela da mesma para atender às necessidades da pesquisa.
Assim, quando se deseja estudar o comportamento de determinada população, o pesquisador tem duas
formas possíveis: realizar um censo, o que exige a observação de todos os elementos que formam essa
população, ou observar apenas uma amostra que a represente.
A finalidade da amostragem é permitir fazer inferências e generalizações acerca de características de
uma população com base na análise de apenas alguns de seus elementos.
A técnica de amostragem é amplamente utilizada em diversas situações do dia-a-dia das empresas. Por
exemplo, no caso das empresas industriais, na verificação da qualidade de seus produtos, é impossível analisar
todos os produtos fabricados, pois isto implica em prejuízo para a empresa, portanto recorrer a um estudo de
amostragem é o indicado neste caso.
Outro exemplo é no trabalho de auditoria onde não se faz a verificação de todos os lançamentos
contábeis, mas de parte deles, pelo processo de amostragem. Na área financeira, a avaliação do tempo médio de
recebimento de duplicatas faz-se por amostragem. Também em pesquisas científicas, o pesquisador muitas vezes
não precisa estudar toda a população, pois estatisticamente há procedimentos de amostragem que garante uma
análise da população sem tem que analisá-la literalmente.
Esta nota de aula trata dos procedimentos básicos aplicáveis à realização de estudos estatísticos por
amostragem. São apresentados os diversos tipos de amostras e seus processos, os cálculos para seu
dimensionamento, bem como os tratamentos estatísticos necessários à minimização dos erros amostrais no
resultado de uma pesquisa. Para se inteirar do assunto, alguns conceitos iniciais são necessários:

Figura 10 – Etapas para a Análise Estatística

11.1 Conceitos Fundamentais em Amostragem

 Estatística Inferencial: É o processo de generalização, a partir de resultados particulares, ou seja,


consiste em obter e generalizar conclusões para o todo com base no particular, isso quer dizer que a
partir de amostras tiram-se conclusões para a população.

100
Professor Cledinaldo Castro Araújo

 População (N): É o conjunto de todos os indivíduos (elementos) que possuem em comum determinadas
características de interesse para uma pesquisa. Por exemplo: Pessoas, Animais, Canteiro de Plantas,
Rios, Soluções Químicas, dentre outros.

 Parâmetro: É a medida usada para descrever uma característica numérica da população. Como é
baseado em observações na população, seu valor é quase sempre desconhecido.

Exemplo: Idade média de todos os alunos de uma sala de aula.

Quanto ao tamanho, a população pode ser classificada em finita ou infinita. São finitas as que
possuem um tamanho limitado em que é possível identificar do primeiro até o último elemento, e
considerada infinita aquelas cujo número de elementos é ilimitado, ou seja, impossível de identificar o
último elemento populacional. Em outras palavras, a população, nesse caso é tão grande que é
dificultoso a sua identificação com precisão.
A conveniência da realização de um censo (análise de 100% da população) depende do tipo de
pesquisa e das condições ambientais com as quais o pesquisador se deparar. Quando a população é
considerada pequena, o censo é o ideal, pois a utilização de fatores humanos, materiais e econômicos
serão mínimos. Apesar de que, o tamanho e o custo, são relativos, pois, depende de pesquisador para
pesquisador.
Por incluir todos os elementos de uma população na pesquisa, o censo parece proporcionar
precisão incontestável. No entanto, essa precisão pode ser afetada por diversos fatores dentre eles, as
mudanças comportamentais dos elementos da população (nos casos em que a pesquisa demanda
período longo) ou por erros de coleta de dados. Então, para se abster desses fatores que o censo pode
causar de forma implícita e, muitas das vezes, explícita, a utilização da amostragem é uma solução. Para
isso, é necessário entender estatisticamente o que é uma parcela amostral.

 Amostra (n): É um subconjunto de uma população que possa representá-la de forma significativa.

 Estimativa: É o valor numérico obtido com base nos resultados amostrais.

Exemplo: Idade média de uma parte dos alunos de uma sala de aula.

A amostra deve ser tão representativa quanto possível da população que se pretende estudar,
uma vez que vai ser a partir dela que serão obtidas conclusões para esta população.
Geralmente, a população-alvo é definida por características demográficas. Por exemplo: Todos
os adolescentes com asma.
A população acessível é um subconjunto geográfico e temporalmente bem definido da
população-alvo disponível para estudo. Por exemplo: Adolescentes com asma que atualmente moram
na cidade do investigador.
A amostra do estudo é o subconjunto da população acessível que de fato participa do estudo.
A expressão “pesquisa por amostragem” é usada em conjunto com a amostragem de
populações.
Pesquisas por amostragem custam tempo e dinheiro e algumas vezes são quase impossíveis de
realizar. Por exemplo, suponha que deseja-se obter uma estimativa da proporção de residências no
Brasil que planejam comprar novos aparelhos de televisão LCD no próximo ano. Por questões óbvias, é
impossível realizar um censo, portanto, a saída mais plausível é fazer uma amostragem. Assim, uma vez
decidido o que e quem pesquisar e que delineamento será usado, é preciso decidir quantos sujeitos
deverão compor a amostra, mas o tamanho amostral deve ser significativo também, pois até mesmo o
estudo mais rigorosamente executado poderá não responder a questão de pesquisa se o tamanho de

101
Professor Cledinaldo Castro Araújo
amostra for insuficiente. Por outro lado, um estudo com amostra muito grande traz mais dificuldades e
custos que o necessário.
Portanto, há quatro razões que justificam o uso de amostragem em levantamentos de grandes
populações ao invés do censo: Economia de Recursos, Economia de Tempo (consequentemente rapidez
nos resultados), Confiabilidade dos dados (com a redução dos elementos, pode-se dar mais atenção aos
casos individuais, ou seja, maior controle) e Testes destrutivos (O controle de qualidade que as
empresas fazem para assegurar a qualidade de um produto, a amostra apresenta-se como o único meio
a ser empregado).
Mas antes de definir a quantidade amostral, é necessário definir se a amostra será com ou sem
reposição. Tratando-se de uma população finita, é preciso decidir se haverá ou não reposição do
elemento selecionado antes de proceder à extração do segundo elemento. Uma amostragem é dita
“com reposição” quando o elemento selecionado volta a compor a população para ser analisado
novamente, e “sem reposição” quando o elemento não retorna à população. A decisão influenciará na
probabilidade de seleção de cada um dos elementos subsequentes.
Caso ocorra a reposição do elemento selecionado, o tamanho da população torna-se
constante e, desse modo, em todas as extrações, cada elemento permanece com a mesma
probabilidade de ser selecionado, ou seja, teremos sempre a probabilidade igual a 1/N, onde N é o
tamanho da população.
Se não ocorrer a reposição, a cada extração o tamanho da população ficar reduzido, alterando,
com isso a probabilidade de cada elemento remanescente vir a ser selecionado. Na primeira extração, a
probabilidade é igual para todos os elementos, correspondendo a 1/N. Na segunda, será 1/(N-1), na
terceira, 1/(N-2), e assim por diante.
Para entender e montar um planejamento amostral é primordial que o pesquisador saiba
realmente o que quer dizer margem de erro.

 Margem de Erro (e):Uma pesquisa não é feita encima de valores absolutos e sim em estimativas
(estatísticas), sendo assim, sempre apresentará erro embutido nas suas análises. Esse erro é
conhecido no meio estatístico como “margem de erro” ou erro amostral.
A margem de erro irá depender do tamanho da amostra e dos resultados que foram obtidos
com a pesquisa. E isso acontece porque não é possível analisar toda a população, somente uma fração
dela (amostra). Um exemplo disso é a pesquisa eleitoral, onde a margem de erro varia dependendo do
candidato a ser eleito, pois tudo pode variar mediante a distribuição geográfica do seu eleitorado, o
sexo, a idade, dentre outras. Assim, é preciso que esse tipo de pesquisa seja realizado dentro de um
intervalo com uma determinada confiabilidade definida de forma arbitrária entre o pesquisador que
encomenda a pesquisa e o instituto que executará o estudo.
Por causa dessa margem de erro, ao anunciar a queda ou a subida de um candidato, é
aconselhável que sejam feitas sucessivas pesquisas, pois além da inevitável margem de erro, existe
também a não confiabilidade da pesquisa, quem tem uma forte relevância nos resultados.
Estatisticamente falando, margem de erro é a diferença entre um resultado amostral
(estimativa) e o verdadeiro resultado populacional (parâmetro), baseado na seguinte relação oposta:

Importante: Amostra  Margem de Erro ou  Amostra  Margem de Erro

A relação é inversamente proporcional. Quanto maior for quantidade de elementos


pesquisados, menor a quantidade de erros cometidos, ou seja, menor a margem de erro, mas em contra
partida, maior o custo financeiro da mesma.
São diversos os tipos de amostras existentes. A composição das amostras é feita com base em
dois processos básicos: as não-probabilísticas e as probabilísticas.

102
Professor Cledinaldo Castro Araújo

11.2 Tipos de Amostragem

A técnica de amostragem define o melhor caminho para a escolha dos elementos que irão compor a
amostra possibilitando a inferência. São elas:

 Probabilístico: quando há um processo aleatório para obtenção dos elementos da amostra, ou seja, cada
elemento tem uma probabilidade de pertencer a amostra;

 Não Probabilísticas: quando não há um processo aleatório para obtenção dos elementos da amostra. Por
não ser possível realizar inferências, este tipo de amostragem não será estudado neste material.

As técnicas de amostragem probabilística consistem em aleatória simples, estratificada, sistemática e


conglomerado.
Figura 11- Técnicas de Amostragem
Aleatória Simples
(AAS)

Sistemática (AS)
Amostragem
Probabilística
(Aleatória)
Estratificada (AAE)

Por
Conglomerados
(AC)
Tipos de
Amostragem
A Esmo

Intencional (Por
Julgamento)
Amostragem Não
Probabilística
(Não Aleatória)
Por Cotas

Bola de Neve

Nesta nota de aula será analisada somente Técnicas Probabilísticas, assim:

11.2.1 Amostragem Aleatória Simples (AAS)

Selecionado por um processo ao qual a probabilidade de escolha de todos os elementos é a mesma


para todos, ou seja, a população de origem é consideração homogênea, pois os seus elementos têm
características parecidas entre si.

Hipótese: O comportamento da variável (ou variáveis) é HOMOGENEO na população.

103
Professor Cledinaldo Castro Araújo

Figura 12- Amostragem Aleatória Simples (AAS)

O processo consiste em selecionar ao acaso n elementos para compor a amostra entre os N elementos da
população.

11.2.2 Amostragem Aleatória Estratificada (AAE):

Muitas vezes a população se divide em subpopulações, em subconjuntos, em grupos ou estratos,


sendo razoável supor que em cada estrato a variável de interesse analisada apresenta um comportamento
substancialmente diverso, ou seja, a população é heterogênea entre si, mas por outro lado, pode-se supor que
o comportamento é razoavelmente homogêneo dentro de cada estrato.
Em tais casos, se o sorteio dos elementos da amostra for realizado sem levar em consideração a
diferença existente em cada um dos grupos que compõem a população, pode acontecer que os diversos
estratos não sejam significativamente representados na amostra, o que influenciará o resultado pelas
características dos estratos mais favorecidos pelo sorteio. Evidentemente, a tendência à ocorrência desta
influência será tanto maior quanto menor for o tamanho da amostra. Para evitar este efeito, pode-se adotar
um tipo de amostragem que represente bem as diferentes características dentro de cada grupo, a amostra
aleatória estratificada.
A amostragem aleatória estratificada consiste essencialmente em pré-determinar quantos elementos
da amostra serão retirados de cada estrato. A pré- determinação pode ser feita de várias formas, sendo as
mais comuns chamadas de uniforme, onde se sorteia um número igual de elementos em cada estrato, e após
isso, calcula-se o tamanho da margem de erro. A amostragem estratificada uniforme será recomendável se os
estratos da população forem pelo menos aproximadamente do mesmo tamanho. A outra forma, mais usual no
meio estatístico, é a de forma proporcional, em que após fixar a margem de erro, calcula-se o número de
elementos sorteados em cada estrato, sendo este proporcional ao número de elementos em cada estrato.

Hipótese: O comportamento da variável (ou variáveis) é HETEROGENEO na população, ou seja, a


população é naturalmente dividida em extratos.

Figura 13 - Amostragem Aleatória Estratificada (AAE)

104
Professor Cledinaldo Castro Araújo

n = n1+n2+...+nk
Exemplo: Uma empresa de consultoria apresenta uma carteira de clientes empresas constituída de 1.000
empresas, distribuídas da seguinte forma: Pequenas: 300; Médias: 600 e Grandes: 100. Considerando que o porte
das empresas influencia fortemente as variáveis de análise da pesquisa, desta forma o tipo indicado de
amostragem é a Aleatória Estratificada. Qual seria a configuração de uma amostra de 100 empresas?

Solução:

A população é estratificada pelo porte:

 Pequenas: 300 (30%)


 Médias: 600 (60%)
 Grandes: 100 (10%)
 Total (N): 1.000

A amostra deve apresentar a mesma proporção de cada porte, assim:

 Pequenas: 30 (30%)
 Médias: 60 (60%)
 Grandes: 10 (10%)
 Total (n): 100.

11.2.3 Amostragem Sistemática (AS)

Quando a lista de respondentes for muito grande a utilização de amostragem aleatória simples pode
ser um processo moroso. Utiliza-se então uma variação, a amostragem sistemática, que também supõe que a
população é homogênea em relação à variável de interesse, mas que consistem em retirar elementos da
população a intervalos regulares, até compor o total da amostra. A amostragem sistemática somente pode ser
retirada se a ordenação da lista não tiver relação com a variável de interesse: imagine que queremos obter
uma amostra de idades de uma listagem justamente ordenada desta forma, neste caso a amostragem
sistemática não seria apropriada (a não ser que reordenássemos a lista).

Hipótese: A população pode ser enumerada de 1 a N e não apresentar ciclos.


Procedimento:

1- Verificar a numeração dos elementos da população (1 a N);


2- Determinar o período (P)

𝑁
= 𝑃 (𝑝𝑒𝑟í𝑜𝑑𝑜)
𝑛

Onde: N: tamanho da População e n: tamanho da amostra

3- Seleciona-se ao acaso um dos elementos da população,


4- A escolha dos demais elementos ocorrerá de acordo om o período P.

Importante: Um procedimento de escolha aleatória é a TABELA DE NÚMEROS ALEATÓRIOS


(APÊNDICE). O Excel também realiza a montagem de uma lista de valores aleatórios. A sintaxe a
função é “=ALEATÓRIOENTRE ( )”
105
Professor Cledinaldo Castro Araújo
Exemplo: A carteira de clientes empresas de uma empresa de consultoria é formada por 100 empresas do
mesmo ramo e porte. Deseja-se obter uma amostra de 10 destas empresas para realizar uma pesquisa sobre
satisfação. O processo a ser utilizado é a amostra Sistemática, assim:

Solução:
Considerando os passos:

1- Numeração: 1, 2, 3, 4, 5, ..., 99, 100.


2- Como N=100 e n = 10, temos:
𝑁 100
= = 10 (𝑝𝑒𝑟í𝑜𝑑𝑜)
𝑛 10
3- Sorteio: elemento sorteado: 3.
4- Amostra: 3, 13, 23, 33, 43, 53, 63, 73, 83, 93

11.2.4 Amostragem por Conglomerados (AC)

Primeiramente, na amostra por conglomerado, a população-alvo é dividida em subpopulações


mutuamente exclusivas e coletivamente exaustivas. Depois uma amostra aleatória qualquer é escolhida com
base em uma técnica de amostragem probabilística. Para cada grupo escolhido, todos os elementos são
incluídos na amostra ou uma amostra dos elementos é extraída probabilisticamente. Caso todos os elementos
(censo) em cada grupo selecionado sejam incluídos na amostra, o procedimento é chamado amostragem por
conglomerado de único estágio. Se for tirada uma amostra de elementos de forma probabilística (AAS, AAE ou
AS) de cada grupo selecionado, o procedimento é uma amostra por conglomerado de duplo estágio.

Hipótese: Os Conglomerados são heterogêneos mas homogêneos entre si.


Figura 14 - Amostragem por Conglomerados (AC)

De maneira simples, entende-se por Conglomerados subpopulações homogêneas. São exemplos de


Conglomerados:
Elementos Conglomerados
Eleitores Domicílios
Trabalhadores Empresas
Alunos Escolas

Quando são selecionados todos os elementos dos Conglomerados sorteados para a pesquisa, o procedimento é
em estágio único.

Exemplo mais complexo, amostragem por Conglomerado em quatro estágios:

106
Professor Cledinaldo Castro Araújo

O objetivo é obter uma amostra de famílias por Conglomerado, vejamos:

1. Selecionar primeiro uma amostra de cidades;


2. Selecionar bairros das cidades sorteadas;
3. Selecionar quarteirões dos bairros sorteados;
4. Selecionar domicílios dos quarteirões sorteados.

Amostragem por Conglomerado de um estágio (AC1) versus Amostragem Aleatória Estratificada (AAE)

 Em geral, AAE produz estimativas mais eficientes que AAS, principalmente se:
 Dentro dos estratos há homogeneidade;
 Entre os estratos há heterogeneidade.
 AC1 produz estimativas menos eficientes que AAS, mas o plano fica melhor se:
 Dentro dos conglomerados há heterogeneidade;
 Entre os conglomerados há homogeneidade.

11.3 Uso do Excel na amostragem


O Excel apresenta função para obtenção de amostras aleatórias Simples e Sistemáticas a partir de uma lista de
valores que corresponde a POPULAÇÃO.

Caminho: Dados, Análise de Dados, Amostragem, seleciona-se os dados e em seguida o tipo de amostragem,
como mostram as figuras abaixo:

107
Professor Cledinaldo Castro Araújo

Capítulo 12
Distribuições Amostrais

12. Distribuições Amostrais


Considere todas as possíveis amostras de tamanho n que se pode extrair de uma determinada população.
Se para cada uma das amostras for calculado o valor de uma medida (ou estimador), tem-se uma distribuição
amostral desta medida ou estimador. Por exemplo, extraindo-se várias amostras de tamanho 10 de uma
população e calculando-se a média aritmética para estas amostras, podemos perceber que estas médias tendem
a diferir seus valores para cada amostra selecionada, tal variação é conhecida como variabilidade amostral. Pode-
se então considerar que o estimador é uma variável aleatória, e o objetivo é determinar o modelo probabilístico
para estes estimadores. Mas qual seria a utilidade de modelar este comportamento aleatório? Pelo que já foi
apresentado, todas as análises serão realizadas a partir da amostra, as medidas estatísticas como medidas de
posição e dispersão e as tomadas de decisão baseadas em probabilidades, para isto, é necessário mensurar a
probabilidade de uma amostra apresentar determinado valor ou comportamento.

Importante: Uma distribuição amostral é uma distribuição de probabilidade que indica até que ponto uma
estatística amostral tende a variar devido a variações casuais na amostragem aleatória.

12.1 Distribuição Amostral da Média

Seja X uma variável aleatória de média µ e variância σ2, da qual se extrai uma amostra aleatória de n
elementos: (X1, X2, X3, ..., Xn). Sabe-se que:

x
n
i
X  i1
n
Representa a média amostral, se a amostra é aleatória Xi tem a mesma distribuição que a população, isto é:

E [Xi] = µ e V[Xi] = σ2

Tem-se também que X1, X2, X3, ..., Xn são independentes, pois a amostra foi escolhida ao acaso. Aplicando
propriedades da média e variância, temos:
𝑛 𝑛
∑𝑛𝑖=1 𝑥𝑖 1 1 𝑛. 𝜇
𝐸[𝑋] = 𝐸 [ ] = ∑ 𝐸[ 𝑋𝑖 ] = ∑ 𝜇 = =𝜇
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1

𝑛 𝑛
∑𝑛𝑖=1 𝑥𝑖 1 1 𝑛. 𝜎 2 𝜎 2
𝑉[𝑋] = 𝑉 [ ] = 2 ∑ 𝑉[ 𝑋𝑖 ] = 2 ∑ 𝜎 2 = 2 =
𝑛 𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1

12.2 O Teorema do Limite Central

A capacidade de usar amostras para fazer inferências sobre parâmetros populacionais depende do conhecimento
da distribuição amostral. Acabamos de como se determinam as média e o desvio padrão, mas é necessária outra

108
Professor Cledinaldo Castro Araújo
informação: Qual a forma da distribuição? No caso da distribuição amostral da média, pode-se demonstrar
matematicamente que se a população sob amostragem for normal, a distribuição amostral da média das
amostras extraídas também é normal. Além disso, mesmo que a população não seja normal, a distribuição das
médias amostrais será aproximadamente normal, desde que a amostra seja grande, n ≥ 30.
Estes resultados são conhecidos como o Teorema do Limite Central e representam talvez o conceito mais
importante da Inferência Estatística.

Importante: O Teorema do Limite Central

1. Se a população sob amostragem for normal, a distribuição das médias amostrais também será
normal para todos os tamanhos de amostra;
𝝈𝟐
𝑿 ~ 𝑵(𝝁; 𝝈𝟐 ) ⇒ 𝑿 ~ 𝑵 (𝝁; )
𝒏
2. Se a população sob amostragem é não normal, a distribuição de médias amostrais será
aproximadamente normal para grandes amostras.

𝝈𝟐
𝑿 ≅ 𝑵 (𝝁; ), para n ≥ 30.
𝒏

Como extensão deste resultado, é que tanto no caso 1 quanto no caso 2, a padronização fica:

𝑋− 𝜇
𝑍= 𝜎 ~𝑁(0; 1)
⁄ 𝑛

Figura 10 – Simulações da convergência para alguns tamanhos de amostras em populações não normais

Exemplo:

109
Professor Cledinaldo Castro Araújo
Os diâmetros de cabos feitos por um processo de manufatura são conhecidos ser normalmente distribuídos
com média 2,5 cm e desvio padrão 0,009 cm. Para amostras de 9 deste cabos selecionados aleatoriamente,
determine:

a) A distribuição da média amostral;


b) A probabilidade de uma das médias exceder 2,505 cm.

Solução:

 Temos que X: diâmetro dos cabos (cm)


 µ = 2,5 cm e σ = 0,009 cm ⇒ σ2 = 0,0092 = 0,000081

𝝈𝟐
a) A distribuição da média amostral é dada por: 𝑿 ~ 𝑵 (𝝁; 𝒏
), assim:

0,000081
𝑋 ~ 𝑁 (2,5; )⇒𝑋 ~ 𝑁(2,5; 0,000009)
9

b) A probabilidade da media amostral exceder 2,505 cm, ou seja, 𝑷(𝑿 > 2,505) =?
Aplicando a padronização, temos:

2,505 − 2,5
𝑃(𝑋 > 2,505) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1,67)
√0,000009
Verificando este valor na tabela normal obtemos P(Z>1,67) = 0,5- 0,4525 = 0,0475 ou 4,75%

12.3 Distribuição Amostral da Proporção


Já vimos que a capacidade de usar amostras para fazer inferências sobre parâmetros populacionais depende do
conhecimento da distribuição amostral. Assim como a média amostral é usada para estimar a média da
população, a proporção amostral serve para estimar a proporção da população. Quando a amostragem é
aleatória, há elevada probabilidade de que a estatística amostral se aproxime se aproxime do parâmetro
populacional. Assim, populações com pequenas porcentagens de determinado item tendem a gerar amostras
com pequenas porcentagens do item e populações com elevadas porcentagens gerarão tipicamente amostras
com grandes porcentagens. Note-se, todavia, que sempre há certo grau de variação; as estatísticas amostrais não
são necessariamente iguais ao parâmetro populacional.

Importante: Uma distribuição de proporções amostrais indica quão provável é um determinado conjunto de
proporções amostrais, dados o tamanho da amostra (n) e a proporção populacional (p)

Quando o tamanho da amostra é maior ou iguala 20, a aproximação da Binomial à Normal apresenta resultados
bastante satisfatórios, possibilitando a utilização do Teorema do Limite Central, que no sentido mais restrito, só
se aplica a médias amostrais.

Temos então:

X: nº de sucessos, segue modelo Binomial, com 𝐸[𝑋] = 𝑛. 𝑝 e 𝑉[𝑋] = 𝑛. 𝑝. (1 − 𝑝)


Para n ≥ 20 ⇒𝐵 ≅ 𝑁, ou seja, 𝑋 ≅ 𝑁[𝑛. 𝑝; 𝑛. 𝑝(1 − 𝑝)]

𝑥𝑖
Se 𝑓𝑖 = 𝑛
(proporção amostral), aplicando propriedades da média e variância, temos:

110
Professor Cledinaldo Castro Araújo
𝑋 𝑛. 𝑝
𝐸[𝑓] = 𝐸 [ ] = =𝑝
𝑛 𝑛

𝑋 𝑛. 𝑝. (1 − 𝑝) 𝑝. (1 − 𝑝)
𝑉[𝑓] = 𝑉 [ ] = =
𝑛 𝑛2 𝑛

Desta forma tem-se que:

𝑝(1 − 𝑝)
𝑓 ≈ 𝑁 (𝑝; )
𝑛

Como extensão da padronização, temos:

𝑓− 𝑝
𝑍= ~𝑁(0; 1)
𝑝(1−𝑝)

𝑛

A média (proporção ou porcentagem média) da distribuição amostral é sempre igual a proporção populacional,
isto é: f = P,

Onde: f: proporção amostral


P: Proporção populacional.

Exemplo:

Um lojista compra lâmpadas diretamente da fábrica em grandes lotes, que vêm embaladas individualmente.
Periodicamente, o lojista inspeciona os lotes para determina a proporção de lâmpadas quebradas. Se um grande
lote contêm 10% de quebradas. Para amostras de tamanho 100, determine:

a) A distribuição da proporção amostral;


b) A probabilidade de uma amostra apresentar menos que 17% de quebradas.

Solução:
 X: nº de lâmpadas queimadas
 P= 10%
 n = 100

a) Distribuição da proporção amostral

𝐸[𝑓] = 𝑝 = 0,10

𝑝. (1 − 𝑝) 0,10. (1 − 0,10)
𝑉[𝑓] = = = 0,0009
𝑛 100

Como:
𝑝(1 − 𝑝)
𝑓 ≅ 𝑁 (𝑝; )
𝑛
Temos:
𝑝(1 − 𝑝)
𝑓 ≅ 𝑁 (𝑝; ) ⇒ 𝑓 ≅ 𝑁(0,10; 0,0009)
𝑛

111
Professor Cledinaldo Castro Araújo
b) A probabilidade de menos que 17% de lâmpadas quebradas na amostra corresponde a P(f <17%)
ou P (f < 0,17) = ?

P (f < 0,17) =?

𝑋−𝜇
Aplicando a padronização: 𝑍 = 𝜎

𝑓 − 0,10 0,17 − 0,10


𝑃(𝑋 < 0,17) = 𝑃 ( < ) = 𝑃(𝑍 < 2,33) =?
√0,0009 √0,0009

Metade da Curva:0,5
Para Z=2,33: 0,4901

𝑃(𝑍 < 1,5) = 0,5 + 0,4901 = 0,9901 𝑜𝑢 99,01%

112
Professor Cledinaldo Castro Araújo

Capítulo 13
Estimação

13. Estimação

Em muitas situações práticas o pesquisador está interessado em conhecer uma característica numérica da
população, por exemplo: o tempo médio de execução de uma tarefa, o tempo médio de reação de um novo
medicamento, a resistência mecânica de blocos de concreto, a concentração média de um poluente em um rio,
consumo médio de energia elétrica por residência em uma região, entre outras situações. Caso o pesquisador não
tenha como obter estas informações verificando diretamente na população ou apenas pelo conhecimento do
histórico do comportamento da variável, ele deverá utilizar uma amostra para obter tais informações, este
processo é chamado Estimação. Este processo é útil para obter conhecimento ou estimativas a partir de amostras
em situação novas em que não se pode verificar diretamente na população ou mesmo para verificar se o valor
conhecido ainda é válido.
Figura 15 - Estimação

Venham,
não é
muito
fundo

Fonte:Estatística aplicada à administração - William J. Stevenson -

Exemplos:

 Na fabricação de determinada peça, o diâmetro é uma característica conhecida e que deve ser mantido
para garantir a qualidade desta peça, porém o processo pode sofrer algum tipo de problema (falta de
manutenção, alto aquecimento da broca, etc) que alteram o diâmetro das peças. Para verificar se o
processo está atuando com algum tipo de descontrole, são verificadas periodicamente amostras;
 Com a onda de calor que acomete todo o Brasil, o consumo de energia aumentou sensivelmente, em
contrapartida as reservas hídricas estão operando abaixo do limite mínimo. Para uma projeção do
colapso energético em uma região verifica-se o consumo médio por residência a partir de uma amostra.

13.1 Conceitos Fundamentais em estimação

13.1.1Estimação

113
Professor Cledinaldo Castro Araújo
O processo de indução que se pretende fazer sobre uma população pode ser feito, a partir de uma amostra, de
duas maneiras:
𝟏) 𝐏𝐨𝐧𝐭𝐮𝐚𝐥
I. Estimação de Parâmetros{
𝟐) 𝐏𝐨𝐫 𝐈𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨

𝟏) 𝐏𝐚𝐫𝐚𝐦é𝐭𝐫𝐢𝐜𝐨𝐬
II. Teste de Significância {
𝟐) 𝐍ã𝐨 − 𝐩𝐚𝐫𝐚𝐦é𝐭𝐫𝐢𝐜𝐨𝐬

Já foi dito, anteriormente que para se fazer Inferência Estatística há necessidade de que o processo seja
probabilístico, pois neste caso poderemos avaliar a probabilidade de erro. E ao utilizarmos o processo de
amostragem aleatória simples ou ao acaso, as informações obtidas serão uteis para produzir inferências sobre
a população original.

I. Estimação de Parâmetros: É o processo que usa os resultados da amostra produzir para produzir
inferências sobre a população da qual foi extraída, aleatoriamente, a amostra. Existem dois tipos de
estimação:

1) Pontual: quando, a partir da amostra, procura-se obter um único valor para o parâmetro
populacional;

̅ (média amostral) é uma estatística usada para fazer uma estimativa por ponto de µ (média
Exemplo: 𝒙
populacional);

2) Por Intervalo: quando, a partir da amostra, procura-se construir um intervalo de variação [𝜃̂1 ; 𝜃̂2 ] ,
com uma certa probabilidade de conter o parâmetro populacional 𝜃.

Exemplo: Obter um intervalo que contenha P (proporção populacional), com 90% de probabilidade a
partir de f (proporção amostral).

Observações:
1) Os testes de significância não serão abordados nesta nota de aula;
2) O “^” sobre uma letra informa que se trata de um estimador.

II. Teste de Hipótese: não será abordado nesta versão do material.

13.1.2Estimador e Estimativa

I. Estimador (𝜽 ̂ ) de um parâmetro populacional 𝜽: é uma variável aleatória função dos elementos


amostrais xi.
𝜃̂ = 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 )

II. Estimativa: é o valor numérico obtido pelo estimador para uma dada amostra.

114
Professor Cledinaldo Castro Araújo

13.1.3Propriedades dos Estimadores

I. Não tendenciosidade: Um estimador é dito não tendencioso (imparcial, justo, não viciador ou não
viezado) se a média do estimador é o parâmetro.

𝐸[𝜃̂] = 𝜃
II. Coerência ou consistência: Um estimador é dito consistente se é não tendencioso e sua variância
diminui à mediada que n aumenta, assim:

𝐸[𝜃̂] = 𝜃 𝑒 lim 𝑉[𝜃̂] = 0


𝑛→∞

III. Eficiência ou Precisão: Sejam dois estimadores 𝜃̂1 𝑒 𝜃̂2 do mesmo parâmetro, dizemos que 𝜃̂1 é mais
eficiente que 𝜃̂2 se:
𝑉[𝜃̂1 ] < 𝑉[𝜃̂2 ]

Exemplo: A média aritmética amostral é um importante estimador da média populacional. Já foi visto
anteriormente que:

 𝐸[𝑋] = 𝜇
𝜎2 𝜎2
 𝑉[𝑋] = 𝑛
⇒ lim𝑛→∞ 𝑉[𝜃̂] = lim𝑛→∞ 𝑛
=0

Desta forma, a média amostra é um estimador não viciado e consistente para à média populacional.

13.2 Estimativa Pontual

A estimativa pontual trata-se do valor numérico de um estimador  para dada amostra de tamanho n, X1, X2, ...
,Xn. Por exemplo, a média para uma amostra aleatória. Apesar de prático este método não possibilita a
mensuração do erro de estimativa.

Exemplos:
1) O parâmetro populacional µ pode ser estimado pelo estimador 𝑥̅ , onde:

x
n
i
X i1
n
2) O parâmetro populacional 𝜎 2 pode ser estimado pelo estimador S2, onde:

x  X
n
2
i
S2  i1
n1
Principais estimadores e estimativas:

115
Professor Cledinaldo Castro Araújo
Figura 16 – Principais Estimadores e Estimativas

𝜇
𝑋
𝜎2
𝑆2

𝜎 𝑆

𝑃 𝑝̂ 𝑜𝑢 𝑓

13.3 Estimativa Intervalar ou Intervalo de Confiança para uma Amostra


O intervalo de confiança tem por objetivo a mensuração do erro de estimativa. Formalmente, seja X1, X2, ... ,Xn
uma amostra aleatória de tamanho n e  um parâmetro desconhecido da população. Um intervalo de confiança
para  é um intervalo construído a partir das observações da amostra, de modo que ele inclui o verdadeiro e
desconhecido valor de , com uma específica, e geralmente alta, probabilidade. Esta probabilidade, denotada por
1 - , é tipicamente tomada como 0,90, 0,95 ou 0,99. Indica-se por:

𝑃(𝑎 < 𝜃 < 𝑏) = 1−∝

Então, o intervalo] a, b [ é chamado intervalo com 100 (1 -)% de confiança para o parâmetro , onde: 1 - é o
nível de confiança associado ao intervalo e a e b são os limites de confiança, inferior e superior, respectivamente,
do intervalo

13.3.1Intervalo de Confiança para  - Caso 1:  Conhecido


O desenvolvimento de intervalos de confiança para é baseado na distribuição amostral de X. Sabe-se que,
pelo Teorema Limite Central, se o tamanho da amostra (n) é grande,
𝑋−𝜇
𝑍=𝜎 ~ 𝑁(0,1)
⁄ 𝑛

Usando-se a tabela da distribuição N(0,1), pode-se determinar um valor 𝑍𝛼⁄ , tal que:
2

𝑃 (−𝑍∝⁄ < 𝑍 < 𝑍∝⁄ ) = 1−∝


2 2

𝑋− 𝜇
𝑃 (−𝑍∝⁄ < 𝜎 < 𝑍∝⁄ ) = 1−∝
2 2
⁄ 𝑛

𝑋− 𝜇
𝑃 (−𝑍∝⁄ < 𝜎 < 𝑍∝⁄ ) = 1−∝
2 2
⁄ 𝑛

𝜎 𝜎
𝑃 (−𝑍∝⁄ <𝑋− 𝜇< 𝑍∝⁄ ) = 1−∝
2 √𝑛 √𝑛 2

116
Professor Cledinaldo Castro Araújo
𝜎 𝜎
𝑃 (−𝑋 − 𝑍∝⁄ < − 𝜇 < −𝑋 +𝑍∝⁄ ) = 1−∝
2 √𝑛 √𝑛 2

𝜎 𝜎
Finalmente: 𝑃 (𝑋 − 𝑍∝⁄ < 𝜇 < 𝑋 + 𝑍∝⁄ ) = 1−∝
2 √𝑛 2 √𝑛

Onde:
𝜎 𝜎
𝑋 − 𝑍∝⁄ = 𝑎 𝑒 𝑋 + 𝑍∝⁄ =𝑏
2 √𝑛 2 √𝑛

𝜎
= 𝜎𝑋 : 𝑒𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑑𝑎 𝑚é𝑑𝑖𝑎
√𝑛
Denomina-se: {
𝜎
𝑍∝⁄ : 𝑒𝑟𝑟𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑖𝑣𝑎 𝑑𝑎 𝑚é𝑑𝑖𝑎
2 √𝑛

 ERRO DE ESTIMATIVA: Pela estrutura da expressão do Intervalo de confiança pode-se notar que trata de
uma região determinada a partir da estimativa pontual + ou – o erro, ou seja, X e, onde:

𝜎
𝑒 = 𝑍∝⁄
2 √𝑛
 TAMANHO DA AMOSTRA
Consiste em encontrar o tamanho de amostra dimensionado pelo limite do erro e (erro) com a
significância α(significância). Partindo da expressão do erro de estimativa, obtemos:

2
𝜎 𝑍𝛼⁄2.𝜎
𝑒 = 𝑍∝⁄ ⇒𝑛=( )
2 √𝑛 𝑒

Observação: o tamanho da amostra deve ser arredondado sempre para “mais”.


Exemplo: Sabe-se que resistência mecânica de um material segue um modelo normal com variância 4
Kgf / cm2. Uma mostra de tamanho n=25 indicou resistência média de 16 Kgf / cm2. Usando um α = 5%,
determine:
a) O erro de estimativa para esta amostra;
b) O I.C. para a verdadeira resistência média (µ)
c) Qual deveria ser o tamanho da amostra suficiente para um erro de apenas 0,4 Kgf / cm2 ?
Solução:
 Variância (população): σ2 = 16 Kgf / cm2.
 Média: 𝑋 = 16 𝐾𝑔𝑓/𝑐𝑚2
 n = 25 corpos de prova.
a) Erro de estimativa. Para o erro de estimativa precisamos identificar: n, σ e 𝒁∝⁄
𝟐
𝜎
𝑒 = 𝑍∝⁄
2 √𝑛
Já temos n e σ, falta somente o 𝑍∝⁄ :
2

Qual o valor de Z que deixa entre ele e 0 (zero) a probabilidade de 0,4750?

117
Professor Cledinaldo Castro Araújo
Z∝⁄ = Z0,025 = 1,96
2
Busca na tabela Normal Padrão:

Observação: como 5% é um padrão, importante guardar o valor Z = 1,96.

𝜎 2
𝑒 = 𝑍∝⁄ = 1,96. ⇒ 𝑒 = 0,784 𝐾𝑔𝑓 /𝑐𝑚2
2 √𝑛 √25

b) Intervalo de Confiança para a verdadeira resistência média:

𝜎 𝜎
𝑃 (𝑋 − 𝑍∝⁄ < 𝜇 < 𝑋 + 𝑍∝⁄ ) = 1−∝
2 √𝑛 2 √𝑛

Como já temos o valor do erro de estimativa, basta subtrair e somar à estimativa pontual, assim:

P (16 – 0,784 ≤ µ ≤ 16 + 0,784) = 1 – 0,05 ⇒ P (15,216 ≤ µ ≤ 16,784) = 0,95

c) Qual deveria ser o tamanho da amostra suficiente para um erro de apenas 0,4 Kgf / cm2?

Tomando as especificações:

 e = 0,4 Kgf / cm2


 para α = 5% já obtemos que o Z = 1,96, assim:

2
𝑍𝛼⁄2.𝜎 1,96𝑥 2 2
𝑛=( ) =( ) = 96,04 ⇒ 𝑛 ≅ 97 𝑐𝑜𝑟𝑝𝑜𝑠 𝑑𝑒 𝑝𝑟𝑜𝑣𝑎
𝑒 0,4

Observação: no caso do tamanho da amostra, o arredondamento deve ser realizado sempre para
“mais”.

13.3.2Intervalo de Confiança para  - Caso 2:  Desconhecido

Quando  é desconhecido, como é tipicamente o caso, uma aproximação intuitiva é substituir  por s, seja,
utilizar a estimativa pontual do desvio padrão. A distribuição de probabilidade utilizada para este caso trata-se
da distribuição t, segue abaixo:
𝑋−𝜇
𝑡= ~ 𝑡(𝑛 − 1)𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒
𝑆⁄
√𝑛
Essa substituição, embora, não altere consideravelmente a distribuição em amostras grandes, ela causa uma
considerável diferença se a amostra for pequena. A notação t é requerida porque a variável aleatória no
denominador (s) aumenta a variância de t para um valor maior do que um (1,0), de modo que a razão não é
padronizada. A distribuição da razão t, quando é razoável assumir que a distribuição da população é normal, é

118
Professor Cledinaldo Castro Araújo
conhecida como distribuição t de Student com r = n – 1 graus de liberdade. A qualificação “n “– 1 graus de
liberdade” é necessária porque para cada diferente tamanho de amostra (n) ou valor n – 1, há uma diferente
distribuição t.

Grau de liberdade (gl) é conceituado como o número de valores independentes de uma estatística. Tomando
como exemplo o estimador s2 de 2, foi visto anteriormente que a quantidade (n – 1) é o divisor que aparece
na fórmula de s2. Isto significa que para um tamanho amostral n:
2
2
∑𝑛𝑖=1(𝑥𝑖 − 𝑋)
𝑆 =
𝑛−1
é baseado em (n – 1) graus de liberdade, ou seja, calculando-se (n – 1) desvios (independentes). Entretanto,
com o aumento de r, a distribuição t se aproxima da distribuição N (0, 1), pois a Var(t) tende a um (1,0). Assim,
𝑋−𝜇
quando n é grande (n  30), a razão 𝑡 = 𝑆 , como mencionado anteriormente, é aproximadamente normal

√𝑛
padrão. A equivalência entre as distribuições t e N (0, 1) quando n é grande, pode ser verificada comparando
os valores da distribuição t, com infinitos (∞) graus de liberdade, com os da normal padrão. Pode-se concluir
da distribuição t, que:
𝑋−𝜇
𝑃 (−𝑡(𝑛−1);∝⁄ < < 𝑡(𝑛−1);∝⁄ ) = 1−∝,
2 𝑆⁄ 2
√𝑛
Em que t/2 é obtido na tabela da distribuição t com r = n – 1 graus de liberdade, a qual fornece valores t/2, tais
que P (-t/2< t < t/2) = 1 - , para alguns valores de . Rearranjando os termos dentro dos parênteses da
expressão, obtemos:
𝑆 𝑆
𝑃 (𝑋 − 𝑡(𝑛−1);∝⁄ < 𝜇 < 𝑋 + 𝑡(𝑛−1);∝⁄ ) = 1−∝,
2 √𝑛 2 √𝑛

 ERRO DE ESTIMATIVA

Analogamente, a estrutura da expressão do Intervalo de confiança também corresponde a uma região


determinada a partir da estimativa pontual + ou – o erro, ou seja, X e, onde:
𝑠
𝑒 = 𝑡(𝑛−1); ∝
⁄2 √𝑛

 TAMANHO DA AMOSTRA

Consiste em encontrar o tamanho de amostra dimensionado pelo limite do erro e (erro) com a
significância α(significância). No caso do desvio padrão desconhecido pressupõe-se a convergência de t
para Z. Partindo da expressão do erro de estimativa, obtemos:
𝑠 𝑍𝛼⁄2.𝜎 2
𝑒 = 𝑡(𝑛−1); ∝ , para t ≅ Z ⇒ 𝑛 = ( )
⁄2 √𝑛 𝑒

Observação: o tamanho da amostra deve ser arredondado sempre para “mais”.

119
Professor Cledinaldo Castro Araújo

Quadro 4 - Tabela t – Student

Área na Cauda Superior – P(T>t)


G.L. (n-1) 0,25 0,20 0,15 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
1 1,000 1,376 1,963 3,078 6,314 12,710 31,820 63,660 127,300 318,300 636,600
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 14,090 22,330 31,600
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 7,453 10,210 12,920
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015
17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850
21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,767
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646
40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
50 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496
60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460
80 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,416
100 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,390
120 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 2,860 3,160 3,373
{Infinito} 0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 2,807 3,090 3,291

120
Professor Cledinaldo Castro Araújo
Forma de busca na tabela t- Student

Área na cauda superior (α/2)


gl 0,250 0,100 0,050 0,025 0,010 0,005 0,003 0,001 0,001
1

6 2,447

Exemplo:
 n=7
 α = 5%
 t=?

Solução:

 g.l. = n -1 = 7-1= 6
 α/2 = 0,05/2 = 0,025
 Basta cruzar g.l. com α/2, logo t = 2,447

Exemplo: O peso de pacotes de café produzidos por uma empresa apresenta-se normalmente distribuído.
Uma amostra de 25 pacotes apresentou peso médio de 248 g, com desvio padrão de 8 g.

a) Qual a estimativa pontual do peso médio de todos os pacotes de café?


b) Qual o erro de estimativa para esta amostra? Use α = 5%
c) Qual o intervalo de confiança para o peso médio de todos os pacotes de café?
d) Quantos pacotes deveriam ser amostrados, para que, com uma confiança de 95% o erro máximo
admitido seja de apenas 5%?
Solução:
 n = 25
 𝑋 = 248𝑔
 S=8g

a) Qual a estimativa pontual do peso médio de todos os pacotes de café?

A estimativa pontual corresponde ao valor amostral utilizado para substituir o parâmetro populacional,
neste caso a média amostral, ou seja, 𝑋 = 248𝑔

b) Qual o erro de estimativa para esta amostra? Use α = 5%

Para n = 25 e α = 5%, temos:


𝑡(𝑛−1); ∝ = 𝑡(25−1);0,05⁄ = 𝑡24;0,025=?
⁄2 2
Busca na tabela t- Student:

121
Professor Cledinaldo Castro Araújo

Com a consulta da tabela, obtemos:


𝑡24; 0,025=2,064

𝑠 8
𝑒 = 𝑡(𝑛−1); ∝ = 2,064. = 3,3024 ≅ 3,30𝑔
⁄2 √𝑛 √25

c) Qual o intervalo de confiança para o peso médio de todos os pacotes de café

𝑆 𝑆
O intervalo de confiança para este caso é dado por: 𝑃 (𝑋 − 𝑡(𝑛−1);∝⁄ < 𝜇 < 𝑋 + 𝑡(𝑛−1);∝⁄ )=
2 √𝑛 2 √𝑛
1−∝. Porém, já calculamos o erro de estimativa, assim:

P (248 – 3,30 ≤ µ ≤ 248 + 3,30) = 1- 0,05 ⇒ P (244,7 ≤ µ ≤ 251,3) = 0,95

d) Quantos pacotes deveriam ser amostrados, para que, com uma confiança de 95% o erro máximo
admitido seja de apenas 5 g?

Tomando as especificações:

 e=5g
 para α = 5% já obtemos pela aproximação, Z = 1,96, assim:

2
1,96 ∗ 8 2
𝑍𝛼⁄2.𝑆
𝑛=( ) =( ) = 9,8 ⇒ 𝑛 ≅ 10 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠
𝑒 5

13.3.3Intervalo de Confiança para a Proporção Populacional (P)

Lembramos que:
𝑝(1 − 𝑝)
𝑝̂ = 𝑓 ≅ 𝑁 (𝑝; )
𝑛
Quando n for grande (n ≥ 20), Logo:

𝑝̂ − 𝑝
𝑍= ~𝑁(0; 1)
𝑝(1−𝑝)

𝑛
Façamos a seguinte construção:
𝑃 (−𝑍∝⁄ ≤ 𝑍 ≤ 𝑍∝⁄ ) = 1 − 𝛼
2 2

122
Professor Cledinaldo Castro Araújo

𝑝̂ − 𝑝
𝑃 −𝑍∝⁄ ≤ ≤ 𝑍∝⁄ =1−𝛼
2 𝑝(1−𝑝) 2

( 𝑛 )
Finalmente:
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑃 (𝑝̂ − 𝑍∝⁄ √ ≤ 𝑝 ≤ 𝑝̂ + 𝑍∝⁄ √ )=1−𝛼
2 𝑛 2 𝑛
Como p é desconhecido, utilizamos sua estimativa 𝑝̂ , assim:

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑃 (𝑝̂ − 𝑍∝⁄ √ ≤ 𝑝 ≤ 𝑝̂ + 𝑍∝⁄ √ )=1−𝛼
2 𝑛 2 𝑛

 ERRO DE ESTIMATIVA
𝑝̂ (1 − 𝑝̂ )
𝑒 = 𝑍∝⁄2 √
𝑛

 TAMANHO DA AMOSTRA

Consiste em encontrar o tamanho de amostra dimensionado pelo limite do erro e (erro) com a significância
α (significância). Partindo da expressão do erro de estimativa, obtemos:

2
𝑝̂ (1 − 𝑝̂ ) 𝑍∝⁄
𝑒 = 𝑍∝⁄ √ ⇒ 𝑛 = ( 2 ) 𝑃̂(1 − 𝑝̂ )
2 𝑛 𝑒

Onde 𝑃̂ é a estimativa pontual para a amostra PILOTO.

Importante: Em muitas situações práticas quando não se tem uma estimativa prévia (amostra piloto ou
outra estimativa) usa-se ̂𝑷 = 𝟎, 𝟓. Esta simplificação despreza a utilização da estimativa inicial
proveniente de amostra piloto, porém maximiza o tamanho da amostra, ou seja, de todas as amostras
possíveis, toma-se a de maior tamanho.

Exemplo: Em uma pesquisa levada a 200 cientes de uma prestadora de serviços, 40 se mostraram
insatisfeitos coma qualidade do serviço. Para um α = 5%, determine:

a) O limite do erro de estimativa;


b) O IC para a verdadeira proporção de insatisfeitos na população;
c) Qual deveria ser o tamanho da amostra para que se estivesse confiante que o erro de estimativa não
excedesse 4%?

Solução:
 n = 200 clientes
𝑥 40
 x = 40 insatisfeitos, logo 𝑃̂ = 𝑛 = 100 = 0,20 𝑜𝑢 20%

123
Professor Cledinaldo Castro Araújo

 Para α = 5%, temo que 𝑍∝⁄ = 1,96


2

a) O limite do erro de estimativa

𝑝̂ (1 − 𝑝̂ ) 0,2. (1 − 0,2)
𝑒 = 𝑍∝⁄ √ = 1,96. √ ⇒ 𝑒 ≅ 0,06
2 𝑛 200

b) O IC para a verdadeira proporção de insatisfeitos na população;

Analogamente, O IC é dado pela estimativa pontual + ou – o erro de estimativa, assim:

P ( 0,20 – 0,06 ≤ P ≤ 0,20 + 0,06 ) = 1- 0,05 ⇒P( 0,14 ≤ P ≤ 0,26 )= 0,95

c) Qual deveria ser o tamanho da amostra para que se estivesse confiante que o erro de estimativa
não excedesse 4%?
Tomando as especificações:

 e = 4% ou 0,04
 para α = 5% obtemos Z = 1,96, assim:

2
𝑍∝⁄
2 1,96 2
𝑛=( ) 𝑃̂(1 − 𝑝̂ ) = ( ) 0,2(1 − 0,2) ⇒ 𝑛 ≅ 385 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑒 0,04

13.3.4Amostragem para População Finita

Enquanto o tamanho da amostra for pequeno em relação ao tamanho da população, a amostragem sem
reposição dará entre as amostras essencialmente a mesma variabilidade da amostragem com reposição.
Entretanto, se o tamanho da amostra representa percentagem apreciável da população ( ≥ 5%), os resultados
dos dois tipos de amostragem começa a diferir, pelo fato de na amostragem sem reposição, a probabilidade de
extração de itens variar de uma para outra extração. Neste caso é necessário aplicar uma modificação
hipergeométrica no desvio padrão, que tem uma fórmula simples:

𝑁−𝑛

𝑁−1
Com esta correção o desvio padrão amostral para fins de inferência assumem as seguintes formas:

Desvio padrão amostral:

𝜎 𝑁−𝑛
 𝑀é𝑑𝑖𝑎 𝑐𝑜𝑚 𝜎 𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜: 𝜎𝑋 = √
√𝑛 𝑁−1
𝑆 𝑁−𝑛
 𝑀é𝑑𝑖𝑎 𝑐𝑜𝑚 𝜎 𝑑𝑒𝑠𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜: 𝑆𝑋 = √
√𝑛 𝑁−1
𝑝̂(1−𝑝̂) 𝑁−𝑛
 𝑃𝑟𝑜𝑝𝑜𝑟çã𝑜: 𝜎𝑝̂ = √ 𝑛

𝑁−1

Desta forma, o cálculo do tamanho da amostra fica da seguinte forma:

Fórmula para determinação do tamanho da amostra (n) om base na estimativa da média populacional: A
partir do erro de estimativa com desvio padrão corrigido, dado por:

124
Professor Cledinaldo Castro Araújo

𝜎 𝑁−𝑛
𝑒 = 𝑍∝⁄ √
2 √𝑛 𝑁−1
Isolando-se n na equação do erro de estimativa com desvio padrão corrigido, obtém-se:

𝑁. 𝜎 2 . 𝑍∝2⁄
2
𝑛=
(𝑁 − 1). 𝑒 2 + 𝜎 2 . 𝑍∝2⁄
2
Onde:
 N: Tamanho da população;
 2: Variância populacional;
 Z: Valor padronizado (Normal padrão);
 e: Limite do erro de estimativa.

Fórmula para determinação do tamanho da amostra (n) com base na estimativa da proporção populacional:
Analogamente,
𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛
𝑒 = 𝑍∝⁄ √ √
2 𝑛 𝑁−1

Isolando-se n na equação do erro de estimativa com desvio padrão corrigido, obtém-se:

𝑁. 𝑝̂ . (1 − 𝑝̂ ). 𝑍∝2⁄
2
𝑛=
(𝑁 − 1). 𝑒 2 + 𝑝̂ . (1 − 𝑝̂ ). 𝑍∝2⁄
2
Onde:
 N: Tamanho da população;
 𝑝̂ : Estimativa piloto para a proporção amostral de sucessos. Algumas literaturas utilizam 𝑞̂ = 1 − 𝑝̂ ;
Análogo ao caso anterior, também pode ser utilizado 𝑃̂ = 0,5;
 Z: Valor padronizado (Normal padrão);
 e: Limite do erro de estimativa.

Exemplo:
Uma empresa que trabalha com manutenção ar condicionado apresenta uma carteira de 500 clientes
empresas. Qual deveria ser o tamanho da amostra suficiente para um erro máximo de 5% e com
significância de α = 5%?

Solução:

 n=?
 N = 500
 e = 2% = 0,02
 Para α = 5%, temo que 𝑍∝⁄ = 1,96
2

Aplicando na fórmula, temos:

𝑁. 𝑝̂ . (1 − 𝑝̂ ). 𝑍∝2⁄ 500.0,5. (1 − 0,5). 1,962


2
𝑛= =
(𝑁 − 1). 𝑒 2 + 𝑝̂ . (1 − 𝑝̂ ). 𝑍∝2⁄ (500 − 1). 0,022 + 0,5. (1 − 0,5). 1,962
2

𝑛 = 329,03 ⇒ 𝑛 ≅ 330

125
Professor Cledinaldo Castro Araújo

Observação: O valor do n ficou elevado devido à utilização 𝑃̂ = 0,5. Caso fosse utilizada um valor prévio
para 𝑃̂ (amostra piloto ou outra estimativa) o tamanho da amostra seria menor.

Fórmula simplificada para determinação do tamanho da amostra (n) com base na estimativa da
proporção populacional:

Partindo da fórmula acima, adotando 𝑃̂ = 0,5 e fixando o nível de confiança em 95%, o que leva a
um𝑍∝2⁄ = 1,96, que arredondado para o inteiro mais próximo fica 1,96 ≅ 2,0, temos:
2

𝑁. 0,5. (1 − 0,5). 22 𝑁
𝑛= 2 2
=
(𝑁 − 1). 𝑒 + 0,5. (1 − 0,5). 2 (𝑁 − 1). 𝑒 2 + 1

Tomando no = 1/e2 e considerando que para tamanhos de amostras “razoáveis” resultados obtidos com
N - 1 se aproxima dos resultados obtidos com N, a fórmula fica:

𝑁. 𝑛0
𝑛=
𝑁 + 𝑛0
O tamanho da população N funciona como correção do tamanho de amostra.

Importante:
1. no é a Primeira Estimativa do tamanho de amostra que deve ser corrigida pelo tamanho da
população;
2. Se o tamanho da população N é muito grande, a estimativa do tamanho da amostra é dada
diretamente por no = 1/e2.

Exemplos:

1) Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certa
proposta de horário de trabalho. Qual deve ser o tamanho da amostra aleatória simples que garanta
um erro amostral não superior a 5%?

Como o tamanho da população (1000) não é “muito” grande, temos que:

N = 1000 empregados
e = erro amostral tolerável = 5% (e = 0,05)
n0= 1/(0,05)2= 400 empregados
n= 1000x400/(1000+400) = 286 ⇒n = 286 empregados

2) Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma amostra aleatória
simples, se se deseja garantir um erro amostral não superior a 2%?

Como o tamanho da população é “muito” grande, temos:

n = n0= 1/(0,02)2 = 1/0,0004 = 2500 ⇒ n = 2.500 eleitores

126
Professor Cledinaldo Castro Araújo

13.4 Estimativa Intervalar ou Intervalo de Confiança para Duas Amostras

Na análise anterior o objetivo era estimar através de um intervalo de confiança a média ou a proporção de
uma população a partir de uma amostra de tamanho n. Nesta fase o objetivo é estimar a diferença entre as
médias ou proporções de sucessos a partir duas amostras n1 e n2.

Exemplos para diferença de médias:

 Resistencia média de blocos de concreto em dois procedimentos de secagem;


 Tempo de reação de dois medicamentos diferentes;
 Tempo médio de execução do processo em dois layouts em estudo

Exemplos para diferença de proporções:

 Proporção de defeituosas em dois turnos;


 Proporção de reclamações antes e depois da implantação de um projeto do Seis Sigma;
 Proporção de clientes satisfeitos com o produto antes de pois de um plano de melhoria.

13.4.1 Intervalo de Confiança para Diferença de Médias (1-2) - Caso 1: 1 e 2


Conhecidos

Sejam 1 e 2 duas população em que se pretende analisar uma característica comum através da média, para
tanto são selecionadas aleatoriamente amostras n1 e n2. Temos que as médias das amostras seguem os
seguintes modelos:
𝜎12 𝜎22
𝑋1 ≅ 𝑁 (𝜇1 ; ) 𝑒 𝑋2 ≅ 𝑁 (𝜇2 ; )
𝑛1 𝑛2

Já sabemos que uma combinação linear de normais independentes é uma normal, assim:

𝜎12 𝜎22
𝑋1 ± 𝑋2 ~ 𝑁 (𝜇1 ±𝜇2 ; + )
𝑛1 𝑛2

Da combinação linear acima focaremos na diferença. Desta forma, o intervalo de confiança para a diferença de
média com desvio padrões conhecido é dado por:

𝜎12 𝜎22 𝜎12 𝜎22


𝑃 [(𝑋1 − 𝑋2 ) − 𝑍∝⁄ √ + ≤ 𝜇1 −𝜇2 ≤ (𝑋1 − 𝑋2 ) + 𝑍∝⁄ √ + ] = 1−∝
2 𝑛 𝑛2 2 𝑛 𝑛2
1 1

Análogo a caso de uma amostra, o valor subtraído e adicionado à média é o erro de estimativa.

Exemplo:

Em ensaio de blocos de concreto, duas misturas foram analisadas. As distribuições da característica do


concreto seguem modelos aproximadamente normais com desvios padrões σ2=5 e σ2=2 respectivamente.
Uma amostra de tamanho 12 da mistura 1 apresentou média 34, enquanto 8 blocos da mistura 2
apresentou média 9,4. Determine o intervalo de confiança de 95% para a diferença 𝜇1 −𝜇2 .

127
Professor Cledinaldo Castro Araújo
Resolução:

14 Mistura 1: 𝑛1 = 12 𝑒 𝑋1 = 34
15 Mistura 2: 𝑛2 = 8 𝑒 𝑋2 = 9,4
16 σ2=5 e σ2=2 conhecidos.

Aplicando na fórmula, temos:

52 22 52 22
𝑃 [(34 − 9,4) − 1,96√ + ≤ 𝜇1 −𝜇2 ≤ (34 − 9,4) + 1,96√ + ] = 1 − 0,05
12 8 12 8

Finalmente:

𝑃(21,4 ≤ 𝜇1 −𝜇2 ≤ 27,8) = 0,95

13.4.2 Intervalo de Confiança para Diferença de Médias (1-2) - Caso 2: 1 e 2


Desconhecidos e Supostamente Diferentes

Análogo ao caso de uma amostra, a distribuição utilizada é a t-Student. Assim:

𝑆12 𝑆22 𝑆12 𝑆22


𝑃 [(𝑋1 − 𝑋2 ) − 𝑡(𝑣; ∝⁄ ) √ + ≤ 𝜇1 −𝜇2 ≤ (𝑋1 − 𝑋2 ) + 𝑡(𝑣; ∝⁄ ) √ + ] = 1−∝
2 𝑛1 𝑛2 2 𝑛1 𝑛2

Segundo Aspin-Welch, a distribuição para este caso apresenta os graus de liberdade v dados por:

2
𝑆2 𝑆2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2 −2
𝑆2
2 𝑆2
( 1) (𝑛2 )
𝑛1 2
𝑛1 +1
+ 𝑛2 +1
Exemplo:

Uma amostra de 15 operadores que não passaram por um processo de capacitação apresentou média
de execução de 25 mim e desvio padrão 4 mim. Enquanto uma amostra de 10 operadores selecionados
ao acaso dos que passaram pela capacitação apresentou média 18 mim com desvio padrão 3 mim.
Determine o intervalo de confiança para a diferença nas médias dos tempos dos capacitados e não
capacitados. Use confiança de 95% e considere que as características de variabilidade são diferentes
entre os operadores capacitados e não capacitados.

Resolução:

14 Não Capacitados: 𝑛1 = 15, 𝑋1 = 25 𝑚𝑖𝑚 𝑒 𝑆1 = 4 𝑚𝑖𝑚


15 Capacitados: 𝑛2 = 10, 𝑋2 = 18 𝑚𝑖𝑚 𝑒 𝑆2 = 3 𝑚𝑖𝑚
16 Desvios padrões supostamente distintos.

Graus de liberdade Aspin-Welch:

128
Professor Cledinaldo Castro Araújo
2 2
𝑆12 𝑆22 42 32
( + ) ( + )
𝑛1 𝑛2 15 10
𝑣= 2 = 2 2 ⇒ 𝑣 ≅ 23
2 𝑆2 42 32
𝑆2 (𝑛2 ) ( ) ( )
( 1) 15 10
𝑛1
+
2
15−1
+ 10−1
𝑛1 −1 𝑛2 −1

Na tabela t-Student obtém-se:

𝑡(𝑣; ∝⁄ = 𝑡(24;0,025) = 2,069


2)

Aplicando na fórmula:

42 32 42 32
𝑃 [(25 − 18) − 2,069√ + ≤ 𝜇1 −𝜇2 ≤ (25 − 18) − 2,069√ + ] = 1 − 0,05
15 10 15 10

𝑃(4,1 ≤ 𝜇1 −𝜇2 ≤ 9,9) = 0,95

13.4.3 Intervalo de Confiança para Diferença de Médias (1-1) - Caso 2: 1 e 2


Desconhecidos e Supostamente Iguais

Neste caso os desvios padrões são desconhecidos e supostamente iguais. O valor das variâncias das amostras
será considerado igual a variância conjugada das amostras, Assim:

𝜎12 = 𝜎22 = 𝜎 2
A estimativa de 𝜎 2 é dada por:

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22


𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

Assim como no caso anterior, a distribuição utilizada é a t-Student. Os graus de liberdade são dados por
𝑣 = 𝑛1 + 𝑛2 − 2.

O intervalo de confiança será dado por:

1 1 1 1
𝑃 [(𝑋1 − 𝑋2 ) − 𝑡(𝑣; ∝⁄ ) √𝑆𝑝2 ( + ) ≤ 𝜇1 −𝜇2 ≤ (𝑋1 − 𝑋2 ) + 𝑡(𝑣; ∝⁄ ) √𝑆𝑝2 ( + )] = 1−∝
2 𝑛1 𝑛2 2 𝑛1 𝑛2

Exemplo:

Um estudo sobre a duração de pilhas elétricas de duas marcas (A e B). Uma amostra com 20 pilhas da
marca A e examinadas a duração. Para a marca B foi realizado o mesmo procedimento. Determine o
intervalo de confiança para a diferença das médias das marcas A e B. Use α=5%.Da amostragem
resultou os seguintes resultados:

14 Marca A: 𝑛𝐴 = 20, 𝑋𝐴 = 152,1 𝑑𝑖𝑎𝑠 𝑒 𝑆𝐴 = 14,5 𝑑𝑖𝑎𝑠


15 Marca B: 𝑛𝐵 = 18, 𝑋𝐵 = 169,8 𝑑𝑖𝑎𝑠 𝑒 𝑆𝐵 = 14,9 𝑑𝑖𝑎𝑠
Resolução:

129
Professor Cledinaldo Castro Araújo
Inicialmente precisamos verificar em qual dos casos se enquadra o problema. A partir de uma análise
dos desvios padrões amostrais, parece coerente supor que as variâncias amostrais vêm de uma
população de variâncias iguais.

Observação: Um fato importante a ser levantado é que a definição de igualdade das variâncias deve ser
realizada através de teste de hipótese adequado e não por mera análise descritiva.

Aplicando nas fórmulas temos:

(𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22 (20−1)∗14,52 +(18−1)∗14,92


 𝑆𝑝2 = 𝑛1 +𝑛2 −2
= 20+18−2
= 215,8
 Na tabela t-Student obtém-se:𝑡(𝑛1 +𝑛2 −2; ∝⁄ = 𝑡(36;0,025) = 2,021
2)
Observação: Foi tomado na tabela o valor cujo grau de liberdade mais se aproxima (40).
 Por conveniência vamos tomar 𝜇𝐵 −𝜇𝐴 .

1 1
𝑃 [(169,8 − 152,1) − 2,021√215,8 ( + ) ≤ 𝜇𝐵 −𝜇𝐴
20 18

1 1
≤ (169,8 − 152,1) − 2,021√215,8 ( + )] = 1 − 0,05
20 18
𝑃(8,1 ≤ 𝜇𝐵 −𝜇𝐴 ≤ 27,3) = 0,95

13.4.4 Intervalo de Confiança para a Diferença de Proporções (P1-P2)

Sejam 1 e 2 duas populações tal que se pretende analisar uma característica comum através da proporção de
sucessos, para tanto são selecionadas aleatoriamente amostras n1 e n2. Temos que as proporções de sucessos
em cada amostra seguem os seguintes modelos:

𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
𝑝̂1 ≅ 𝑁 (𝑃1 ; ) 𝑒 𝑝̂2 ≅ 𝑁 (𝑃2 ; )
𝑛1 𝑛2

Já sabemos que uma combinação linear de normais independentes, assim:

𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
𝑝̂1 ± 𝑝̂1 ~ 𝑁 (𝑃1 ±𝑃2 ; + )
𝑛1 𝑛2
Da combinação linear acima focaremos na diferença. Desta forma o intervalo de confiança para a diferença de
proporções é dado por:

𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂ 2 (1 − 𝑝̂2 ) 𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂2 (1 − 𝑝̂ 2 )


𝑃 [(𝑝̂1 − 𝑝̂1 ) − 𝑍∝⁄ √ + ≤ 𝑃1 − 𝑃1 ≤ (𝑝̂1 − 𝑝̂1 ) + 𝑍∝⁄ √ + ]
2 𝑛1 𝑛2 2 𝑛1 𝑛2
=1−𝛼

Exemplo:

O objetivo de uma pesquisa era avaliar o desempenho dos alunos com dificuldades em uma disciplina. A
pesquisa considerou os seguintes grupos: 1: buscaram apoio na monitoria frente e 2: Não buscaram apoio

130
Professor Cledinaldo Castro Araújo
na monitoria. Dos 40 que buscaram apoio na monitoria, 75% conseguiram ser aprovados na disciplina,
enquanto apenas 35% dos 50 que não buscaram foram aprovados. Determine o intervalo de confiança para
diferença de proporção entre os grupos. Use α=5%.

Resolução:

 Grupo 1: Buscaram apoio na monitoria: 𝑛1 = 40 𝑒 𝑝̂1 = 75%


 Grupo 2: Não buscaram apoio na monitoria: 𝑛2 = 50 𝑒 𝑝̂1 = 35%

Aplicando na expressão acima, temos:

0,75(1 − 0,75) 0,35(1 − 0,35)


𝑃 [(0,75 − 0,35) − 1,96√ + ≤ 𝑃1 − 𝑃1
40 50

0,75(1 − 0,75) 0,35(1 − 0,35)


≤ (0,75 − 0,35) + 1,96√ + ] = 1 − 0,05
40 50

0,75 ∗ 0,25 0,35 ∗ 0,65 0,75 ∗ 0,25 0,35 ∗ 0,65


𝑃 [0,4 − 1,96√ + ≤ 𝑃1 − 𝑃1 ≤ 0,4 + 1,96√ + ] = 1 − 0,05
40 50 40 50

Finalmente:
𝑃(0,21 ≤ 𝑃1 − 𝑃1 ≤ 0,59) = 0,95

Importante: De forma conveniente usar a diferença entre o maio e o menor. Caso o limite inferior fique
negativo, também é conveniente indicar valor igual zero.

131
Professor Cledinaldo Castro Araújo

Capítulo 14
Análise de Correlação e Regressão

14. Análise de Correlação e Regressão

O estudo de correlação mostra uma forma de medir quanto e de que maneira se relacionam duas
variáveis, por exemplo: o frio está para o setor farmacêutico, assim como o dia das mães está para o comércio.
Pois as vendas de medicamentos não controlados, como analgésicos, antigripais e vitaminas, disparam. Outro
exemplo, é o faturamento das empresas de energia elétrica nos Estado Unidos é diretamente influenciada pela
temperatura, especialmente no inverno. Um inverno brando reduz a demanda de energia para calefação e pode
diminuir drasticamente o lucro. Em Fortaleza, nos meses que ocorre o verão (dezembro até meados de março), o
consumo de água nas residências aumenta de forma significativa.
Essa relação pode ser verificada com auxílio de um gráfico de dispersão e de um coeficiente de
correlação linear (que mede a intensidade da associação linear entre duas variáveis, de caráter quantitativo e que
mostre uma relação de causa de efeito).

14.1 Gráfico de dispersão

O diagrama de dispersão é um gráfico bidimensional, por meio do qual podemos analisar a relação existente das
variáveis em estudo, ou seja, qual alteração deve esperar em uma das variáveis, como consequência de
alterações sofridas pela outra variável. Ao construir o gráfico deve-se definir a variável que será representada no
eixo x (causa) e y (efeito).

 INTERPRETAÇÃO SUBJETIVA DO GRÁFICO DE DISPERSÃO

132
Professor Cledinaldo Castro Araújo

No caso anterior, foi apresentada uma situação de total falta de correlação, entretanto, existem casos em que
existe correlação, porém uma correlação não linear, como mostra o gráfico de dispersão abaixo:

Pelo gráfico podemos notar que a vaiável Y cresce com a varável X até certo ponto (inflexão), a partir de então Y
começa a decrescer, ou seja, há uma correlação, porém não linear. Um exemplo a oferta de um produto (Y) com o
percentual de impostos (X).
A importância da determinação da correlação entre duas variáveis está no fato de que a presença de uma
correlação pode conduzir-nos a um método para estimar a variável y (efeito) utilizando a variável x (causa).

Importante:
Outlier: São os pontos discrepantes, ou seja, observações extremas que não são condizentes com o restante
da massa de dados.

As causas mais prováveis da ocorrência de outliers pode ser o registro incorreto dos dados, algum
defeito no instrumento de medição utilizado, dentre outros. Caso isso ocorra, o outlier deve ser, se possível,
corrigido, em extremo caso eliminado. Deve-se dar a devida atenção à causa de tais anomalias, pois esses dados
discrepantes podem ser úteis para descobrir a causa dessa ocorrência.
Outra saída é coletar mais dados para verificar se ainda ocorrerá valores próximos dos outliers, pois os mesmos
podem ser obtidos mesmo que não exista um erro de coleta ou digitação.

Outlier

Como as conclusões tiradas de gráficos de dispersão tendem a ser subjetivas, necessita-se de métodos
mais precisos e objetivos. Então se utiliza o coeficiente de correlação linear para detectar padrões lineares.

133
Professor Cledinaldo Castro Araújo

14.2 Coeficiente de Correlação de Pearson (Rxy)


A correlação mede a força do relacionamento entre duas variáveis em termos relativos. O conceito
de correlação não implica causa e efeito de uma variável sobre a outra, mas somente o relacionamento
matemático entre elas.
Dizemos que existe associação positiva entre as variáveis quando valores baixos ou altos da variável x
correspondem também valores baixos ou altos da variável y, respectivamente. No caso de uma associação
negativa, valores baixos de uma variável correspondem valores altos da outra; e a valores altos de uma,
valores baixos da outra.
∑𝑛 𝑛
𝑖=1 𝑥𝑖 .∑𝑖=1 𝑦𝑖
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 −
𝑛
𝑅𝑋𝑌 =
𝑛 2 𝑛 2
√(∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑖=1 𝑥𝑖) ) (∑𝑛𝑖=1 𝑦𝑖2 − (∑𝑖=1 𝑦𝑖) )
𝑛 𝑛

Comumente também é utilizada a fórmula a seguir:

∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑋 𝑌
𝑅𝑋𝑌 =
2 2
√(∑𝑛𝑖=1 𝑥𝑖2 − 𝑛𝑋 ) (∑𝑛𝑖=1 𝑦𝑖2 − 𝑛𝑌 )

Observação: A mudança consiste em multiplicar e dividir parte da fórmula por n.

 PROPRIEDADES:

O valor de Rxy deve pertencer ao intervalo -1  Rxy  1. A sua interpretação é a seguinte:

 0,00  Rxy  0,69: dependência fraca


 0,70  Rxy  1,00: dependência forte Diretamente proporcional: x y

 -0,69  Rxy  0,00: dependência fraca Inversamente proporcional: x y


 -1,00  Rxy  -0,70: dependência forte

Contudo, em geral, uma correlação forte não é sinônimo de relação causa – e - efeito entre as amostras
ou variáveis. Há situações em que um coeficiente de correlação próximo de um ou de um menos um não significa
que a maioria dos pares de valores esteja contida em uma reta (veremos isso em regressão linear). O simples
conhecimento do coeficiente de correlação não é suficiente devido a anomalias na dispersão dos dados, por isso é
recomendada a construção do gráfico de dispersão das amostras para melhor compreender o resultado, pois em
alguns casos, a relação causa-efeito pode ser provocada por um ou mais fatores ocultos, uma variável não
considerada na análise. Por exemplo, suponha que o número de vendas diárias de um jornal e a produção diária
de ovos tenha uma forte correlação positiva. Não se pode afirmar que o aumento do número de jornais vendidos
resulte no aumento da produção de ovos. Para compreender a forte correlação positiva, deve-se procurar fatores
ocultos, por exemplo, o aumento de riqueza da população que resulta em aumento de demanda dos dois
produtos ao mesmo tempo, jornais e ovos.

I. O valor de Rxy não varia se todos os valores de qualquer uma das variáveis são convertidos para uma
escala diferente. Por exemplo, se o peso for em kg e transformá-la em libra (medida inglesa), o valor
de Rxy não se modificará;
II. O valor de Rxy não é afetado pela escolha de localização de x ou y. Permutando todos os valores de x
e y, Rxy permanecerá inalterado;

134
Professor Cledinaldo Castro Araújo
III. Rxy mede a intensidade, ou o grau, de um relacionamento linear. Não serve para medir a intensidade
de um relacionamento não - linear.

14.3 Regressão Linear Simples


Como visto anteriormente, o coeficiente de correlação (Rxy) apenas não mede com segurança a relação
causa-efeito entre duas variáveis, apesar de essa relação poder estar presente. Por exemplo, uma correlação
fortemente positiva entre as variáveis x e y não autoriza afirmar que variações da variável x provocam variações
na y, ou vice-versa. Entretanto, em uma regressão linear, a relação causa-efeito deve ser definida no início da
análise.
Em muitas pesquisas estatísticas, o objetivo principal é estabelecer relações que possibilitem predizer
uma ou mais variáveis em termos de outras. Assim, é que se fazem estudos para predizer os seguintes exemplos:

 Vendas futuras de um produto em função do seu preço;


 Perda de peso de uma pessoa em decorrência do número de semanas que se submete a uma dieta de
800 calorias-dia;
 Despesa de uma família com médico e com remédio em função de sua renda;
 Consumo per capita de certos alimentos em função do seu valor nutritivo e do gasto com propaganda
na TV;
 Taxa de juros em função da inflação;
 Salário em função da escolaridade do trabalhador.

Naturalmente, o ideal seria que pudéssemos predizer uma quantidade exatamente em termos de outra,
mas isso raramente é possível. Na maioria dos casos, devemos contentar-nos com a predição de médias, ou
valores esperados. Portanto, a predição do valor médio de uma variável em termos dos valores conhecidos de
outra variável, constitui o problema da regressão.
Na regressão linear simples, utilizam-se duas amostras ou duas variáveis, e será deduzida e analisada a
reta que melhor explica essa relação, tendo previamente definido a variável independente ou (resposta) e a
variável dependente (ou preditora).
A origem do termo “regressão” remonta a Francis Galton (1822 a 1911), que por volta de 1855,
investigava relações entre características antropométricas de sucessivas gerações. Uma de suas constatações era
de que “cada peculiaridade de um homem é transmitida aos seus descendentes, mas, em média, numa
intensidade menor”. Por exemplo: embora pais com baixa estatura tendem a ter filhos também com baixa
estatura, estes têm altura média do que a altura média de seus pais. O mesmo ocorre, mas em direção contrária,
com pais com estatura alta. A esse fenômeno de a altura dos pais mover-se em direção à altura média de todos os
homens ele chamou de regressão.

14.3.1Reta Estimada
Uma vez que o comportamento entre as variáveis tende para uma relação linear, o próximo passo
consiste em buscar determinar a respectiva equação de regressão linear simples.
Toda reta pode ser representada pela seguinte expressão matemática y = α + βx, onde x e y são as
variáveis e α e β, seus respectivos coeficientes.

Importante:
 α: Coeficiente linear ou ponto que intercepta o eixo vertical y, ou seja, valor de y para x = 0
 β: Coeficiente angular ou Declividade da reta, ou seja, a variação de y por unidade de variação de x.

Desta forma, o Modelo de Regressão Linear Simples é da forma:

135
Professor Cledinaldo Castro Araújo
𝑌𝑖 =∝ + 𝛽𝑥𝑖 + 𝜀𝑖 onde:

 Yi: Variável dependente


 Xi: Variável independente
 εi: Erro aleatório

Pressuposições do Modelo:

No modelo descrito acima à expressão ∝ + 𝛽𝑋𝑖 é o componente de 𝑌𝑖 cuja variação linear depende de 𝑋𝑖 e
𝜀𝑖 o componente aleatório. Admite-se que os 𝜀𝑖 são variáveis aleatórias não-correlacionadas entre si com
distribuição normal de média zero e variância constante 𝜎 2 . Essas pressuposições sobre o termo 𝜀𝑖 podem
ser apresentadas a seguir:

 𝐸[𝜀𝑖 ] = 0
 𝑉[𝜀𝑖 ] = 𝜎 2
 𝐶𝑜𝑣[𝜀𝑖 , 𝜀𝑗 ] = 0, 𝑝𝑎𝑟𝑎 𝑖 ≠ 𝑗
 𝜀𝑖 ~ 𝑁(0, 𝜎 2 )

Admitindo-se que 𝑋𝑖 são fixos, aplicando a esperança, temos:

𝐸[𝑌] = 𝐸[ ∝ + 𝛽𝑥𝑖 + 𝜀𝑖 ] =∝ + 𝛽𝑋𝑖


O modelo estatístico de uma regressão linear pode ser expresso da seguinte forma:

𝑓(𝑌𝑖 \𝑋𝑖 )

𝐸[𝑌𝑖 ] =∝ + 𝛽𝑥𝑖
𝑌𝑖

𝑋𝑖
Modelo Estimado

Considere uma amostra de valores X e Y representados na figura abaixo:

Reta Estimada:
Yi = α + βXi

Amostras de pares ordenados:


(xi, yi)

136
Professor Cledinaldo Castro Araújo
O gráfico da equação 𝑌𝑖 =∝ + 𝛽𝑥𝑖 é uma linha reta. Os valores de α e β são estimados a partir de da
amostra de pares ordenados (𝑥𝑖 , 𝑦𝑖 ). Para obter os valores dos coeficientes α e β, recorre-se ao método dos
mínimos quadrados e ao Cálculo Diferencial.

Método dos Mínimos Quadrados

Este método consiste em determinar a equação da reta que minimize o quadrado dos erros, assim:

Para dada amostra, muitas são as retas que se pode ajustar para o conjunto de pares ordenados
(𝑥𝑖 , 𝑦𝑖 ), porém apenas uma delas minimiza a soma dos quadrados dos erros dos pontos até ela. Desta
forma:

De 𝑌𝑖 =∝ + 𝛽𝑥𝑖 + 𝜀𝑖 obtemos:

 𝐼𝑠𝑜𝑙𝑎𝑟 𝑜 𝑒𝑟𝑟𝑜: 𝜀𝑖 = 𝑌𝑖 −∝ − 𝛽𝑥𝑖


 𝐸𝑙𝑒𝑣𝑎𝑟 𝑜𝑠 𝑑𝑜𝑖𝑠 𝑚𝑒𝑚𝑏𝑟𝑜𝑠 𝑎𝑜𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜: 𝜀𝑖2 = (𝑌𝑖 −∝ − 𝛽𝑥𝑖 )2
 𝐴𝑝𝑙𝑖𝑐𝑎𝑟 𝑠𝑜𝑚𝑎𝑡ó𝑟𝑖𝑜 𝑒𝑚 𝑎𝑚𝑏𝑜𝑠 𝑜𝑠 𝑚𝑒𝑚𝑏𝑟𝑜𝑠: ∑𝑛𝑖=1 𝜀𝑖2 = ∑𝑛𝑖=1(𝑌𝑖 −∝ − 𝛽𝑥𝑖 )2

Determinar α e β de modo que ∑𝑛𝑖=1 𝜀𝑖2 seja mínimo, para tanto devemos derivar uma vez em
relação a α e outra vez com relação a β, assim:

Com relação a α
𝑛
𝜕 ∑𝑛𝑖=1 𝜀𝑖2
= 0 ⇒ ∑ 2(𝑦𝑖 −∝ −𝛽𝑥𝑖 ) = 0
𝜕∝
𝑖=1
𝑛 𝑛 𝑛 𝑛

∑(𝑦𝑖 −∝ −𝛽𝑥𝑖 ) = 0 ⇒ ∑ 𝑦𝑖 − ∑ ∝ − ∑ 𝛽𝑥𝑖 = 0


𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛
∑𝑖=1 𝑦𝑖 − 𝛽 ∑𝑛𝑖=1 𝑥𝑖
∑ 𝑦𝑖 − 𝑛 ∝ −𝛽 ∑ 𝑥𝑖 = 0 ⇒ ∝=
𝑛
𝑖=1 𝑖=1
∝= 𝑦 − 𝛽𝑥 (𝐸𝑞𝑢𝑎çã𝑜 1)
Com relação a β
𝑛
𝜕 ∑𝑛𝑖=1 𝜀𝑖2
= 0 ⇒ ∑ 2(𝑦𝑖 −∝ −𝛽𝑥𝑖 )(−𝑥𝑖 ) = 0
𝜕𝛽
𝑖=1
𝑛 𝑛 𝑛 𝑛

∑(𝑥𝑖 𝑦𝑖 −∝ 𝑥𝑖 − 𝛽𝑥𝑖2 ) = 0 ⇒ ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∝ − ∑ 𝛽𝑥𝑖2 = 0


𝑖=1 𝑖=1 𝑖=1 𝑖=1

137
Professor Cledinaldo Castro Araújo
𝑛 𝑛 𝑛

∑ 𝑥𝑖 𝑦𝑖 −∝ ∑ 𝑥𝑖 − 𝛽 ∑ 𝑥𝑖2 = 0 (𝐸𝑞𝑢𝑎çã𝑜 2)
𝑖=1 𝑖=1 𝑖=1
Substituindo a equação1 na equação 2, temos:
𝑛 𝑛 𝑛

∑ 𝑥𝑖 𝑦𝑖 − (𝑦 − 𝛽𝑥) ∑ 𝑥𝑖 − 𝛽 ∑ 𝑥𝑖2 = 0
𝑖=1 𝑖=1 𝑖=1
Multiplicando e dividindo por n:
𝑛 𝑛
2
∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦 + 𝑛𝛽𝑥 − 𝛽 ∑ 𝑥𝑖2 = 0
𝑖=1 𝑖=1
Obtêm-se:
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦
𝛽= 2
∑𝑛𝑖=1 𝑥𝑖2 − 𝑛𝑥
Os parâmetros da reta são dados por:

Coeficiente Linear:

∝= 𝑦 − 𝛽𝑥 𝑒
Coeficiente Angular:

∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦
𝛽= 2
∑𝑛𝑖=1 𝑥𝑖2 − 𝑛𝑥

A reta estimada será então 𝑌̂𝑖 = 𝛼̂ + 𝛽̂ . 𝑋𝑖

14.3.2Análise de Variância (ANOVA)


A análise de variância trata da análise do modelo. Esta análise baseia-se nas variabilidades do modelo e erro,
denotado aqui de resíduo.

A soma de quadrados total pode ser desmembrada da seguinte forma:

I. 𝑌𝑖 =∝ + 𝛽𝑥𝑖 + 𝜀𝑖 ⇒ 𝑌𝑖 = 𝑌̂𝑖 + 𝜀𝑖
II. Subtrai-se a média do total e da regressão: 𝑌𝑖 − 𝑌 𝑒 𝑌̂𝑖 − 𝑌
III. Elevando-se cada membro ao quadrado e aplica-se somatório
𝑛 𝑛 𝑛 𝑛 𝑛 𝑛

∑(𝑌𝑖 − 𝑌) = ∑(𝑌̂𝑖 − 𝑌 + 𝜀𝑖 ) = ∑(𝑌̂𝑖 − 𝑌) + 2 ∑(𝑌̂𝑖 − 𝑌) ∑ 𝜀𝑖 + ∑ 𝜀𝑖2


2 2 2

𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1

Como ∑𝑛𝑖=1(𝑌̂𝑖 − 𝑌) = 0 (𝑝𝑟𝑜𝑝𝑟𝑖𝑒𝑑𝑎𝑑𝑒 𝑑𝑎 𝑚é𝑑𝑖𝑎), obtemos:


𝑛 𝑛 𝑛

∑(𝑌𝑖 − 𝑌) = ∑(𝑌̂𝑖 − 𝑌)2 + ∑ 𝜀𝑖2


2

𝑖=1 𝑖=1 𝑖=1

𝑺𝑸𝒕𝒐𝒕𝒂𝒍 = 𝑺𝑸𝑹𝒆𝒈𝒓𝒆𝒔𝒔ã𝒐 + 𝑺𝑸𝑹𝒆𝒔í𝒅𝒖𝒐


Onde:
 Soma de quadrados total, mede a variabilidade total dos dados em relação à média:

138
Professor Cledinaldo Castro Araújo
𝑛 𝑛
2
𝑆𝑄𝑡𝑜𝑡𝑎𝑙 = ∑(𝑌𝑖 − 𝑌) = ∑ 𝑌𝑖2 − 𝑛𝑌 2

𝑖=1 𝑖=1

 Soma de quadrados da Regressão, mede a variabilidade explicada pelo modelo;


𝑛 𝑛 𝑛 𝑛

𝑆𝑄𝑅𝑒𝑔 = ∑(𝑌̂𝑖 − 𝑌)2 = ∑(∝ + 𝛽𝑥𝑖 − 𝑌)2 = ∑(𝑌 − 𝛽𝑋 + 𝛽𝑋𝑖 − 𝑌)2 = 𝛽 2 ∑(𝑋𝑖 − 𝑋)2
𝑖=1 𝑖=1 𝑖=1 𝑖=1

∑𝑛
𝑖=1 𝑥𝑖 𝑦𝑖 −𝑛𝑥𝑦
Outra forma: substituindo 𝛽 = 2 na expressão anterior obtém-se:
∑𝑛 2
𝑖=1 𝑥𝑖 −𝑛𝑥

𝑛 𝑛 𝑛
2 2 2
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦
𝑆𝑄𝑅𝑒𝑔 = 𝛽 ∑(𝑋𝑖 − 𝑋) = 𝛽 ∑(𝑋𝑖 − 𝑋) . 2 = 𝛽 (∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦)
𝑖=1 𝑖=1
∑𝑛𝑖=1 𝑥𝑖2 − 𝑛𝑥 𝑖=1

 𝑆𝑄𝑅𝑒𝑠 = ∑𝑛𝑖=1 𝜀𝑖2 : Soma de quadrados do resíduo (erro), mede a variabilidade não explicada
pelo modelo.
𝑛 𝑛
2
𝑆𝑄𝑅𝑒𝑠 = ∑ 𝑌𝑖2 − 𝑛𝑌 − 𝛽 (∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦)
𝑖=1 𝑖=1

Para cada soma de quadrados define-se o quadrado médio ou variância, basta dividir cada soma de
quadrados pelos respectivos graus de liberdade.

2
∑𝑛
𝑖=1(𝑌𝑖 −𝑌)
 𝑄𝑀𝑇𝑜𝑡𝑎𝑙 𝑜𝑢 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑑𝑒 𝑌 = 𝑛−2
, 𝑔𝑙 = 𝑛 − 1(𝑢𝑚 𝑔𝑟𝑎𝑢 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 𝑑𝑎 𝑚é𝑑𝑖𝑎).

2
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌)
 𝑄𝑀𝑅𝑒𝑔 = 𝑛−2
, 𝑔𝑙 = 𝑛 − 2 (𝑢𝑚 𝑔𝑟𝑎𝑢 𝑑𝑒𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 𝑑𝑒 ∝ 𝑒 𝑜𝑢𝑡𝑟𝑜 𝑑𝑒 𝛽)

 𝑄𝑀𝑅𝑒𝑠 = ∑𝑛𝑖=1 𝜀𝑖2 , 𝑔𝑙 = 1, 𝑔𝑙𝑡𝑜𝑡𝑎𝑙 − 𝑔𝑙𝑅𝑒𝑔 = (𝑛 − 1) − (𝑛 − 2) = 1

Observação: O quadrado médio do resíduo é variabilidade do modelo, assim 𝐸[𝑄𝑀𝑅𝑒𝑔 ] = 𝜎 2

Quadro de Análise de Variância - ANOVA

Fontes de Soma de
Graus de Liberdade Quadrado Médio F
Variação Quadrados

𝑄𝑀𝑅𝑒𝑔
Regressão 1 𝛽(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦) 𝛽(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦)/1 𝐹=
𝑄𝑀𝑅𝑒𝑠

2 2
Resíduo n-2 ∑𝑛𝑖=1 𝑌𝑖2 − 𝑛𝑌 − (∑𝑛𝑖=1 𝑌𝑖2 − 𝑛𝑌 −
𝛽(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦) 𝑛
𝛽(∑𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦))/(𝑛 − 2)

2
Total n-1 ∑𝑛𝑖=1 𝑌𝑖2 − 𝑛𝑌 -

A distribuição F

139
Professor Cledinaldo Castro Araújo
A distribuição F Snedecor é utilizada para avaliar a validade do modelo encontrado. Esta distribuição
𝑄𝑀
compara as variâncias do modelo e com a do resíduo (erro). O valor dado por 𝐹 = 𝑄𝑀𝑅𝑒𝑔 Testa as seguintes
𝑅𝑒𝑠
hipóteses:

 𝐻0 : 𝛽 = 0 (𝐴 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 𝑛ã𝑜 é 𝑣á𝑙𝑖𝑑𝑎)


 𝐻0 : 𝛽 ≠ 0 (𝐴 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 é 𝑣á𝑙𝑖𝑑𝑎)

O valor F é comparado com o F tabelado com graus de liberdade da regressão / graus de liberdade do resíduo.

𝐹𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 𝑇𝑎𝑏𝑒𝑙𝑎: 𝑔𝑙 𝑑𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 (𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟) 𝑝𝑜𝑟 𝑔𝑙 𝑑𝑜 𝑟𝑒𝑠í𝑑𝑢𝑜 (𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟)

Teste:
Se F > F tabelado: Rejeita H0
Se F ≤ F tabelado: Não Rejeita H0

Quadro 4 – Tabela F com V1 graus de Liberdade do numerador e V2 graus de Liberdade


do denominador. P(F>Ftabelado)=0,05

14.3.3Coeficiente de Determinação (R²)


Indica a proporção da variação total da variável dependente que é explicada pela variação da variável
independente, ou seja, quanto o modelo consegue explicar do comportamento da variável. Quanto maior for
o R², melhor será o poder de explicação da reta de regressão.
O valor do R2 é dado por:

140
Professor Cledinaldo Castro Araújo
𝑛
𝑆𝑀𝑅𝑒𝑔 𝛽(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦) ∑𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦 (∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦)
𝑅2 = = 2 = 2
. 2 =
𝑆𝑀𝑇𝑜𝑡𝑎𝑙 ∑𝑛 𝑌 2 − 𝑛𝑌 ∑𝑛 𝑥2 − 𝑛𝑥 ∑𝑛 𝑌 2 − 𝑛𝑌
𝑖=1 𝑖 𝑖=1 𝑖 𝑖=1 𝑖
2
(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦)2
𝑅 = 2 2
(∑𝑛𝑖=1 𝑥2𝑖 − 𝑛𝑥 )(∑𝑛𝑖=1 𝑌𝑖2 − 𝑛𝑌 )
Como
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦
𝑅𝑥𝑦 =
2
√(∑𝑛𝑖=1 𝑥2𝑖 − 𝑛𝑥2 )(∑𝑛𝑖=1 𝑌𝑖2 − 𝑛𝑌 )

Temos que:
𝑅2 = (𝑅𝑥𝑦 )2

A diferença do coeficiente de correlação (Rxy) para o coeficiente de determinação (R²), é que o


primeiro mede a força da relação linear entre as variáveis, enquanto que o R² mede a explicação da reta de
regressão.
Dessa maneira, para apreciar o ajuste de uma reta, é melhor utilizar o coeficiente de
determinação que mede o sucesso da regressão em explicar y, ou seja, o R² verifica quantos por centos de y
pode ser explicado por x, o restante (%) é atribuído ao erro.

Exemplo: Segundo o ranking elaborado pelo Instituto Brasileiro de Executivos de Varejo e Mercado de
Consumo (IBEVAR), o Grupo Pão de Açúcar segue sendo a maior empresa de varejo no Brasil. O ranking usa
como base o faturamento das redes em 2013, ano em que o Pão de Açúcar faturou aproximadamente 57
bilhões de reais, seguido do Carrefour (31 bilhões de reais) e o Walmart (26 bilhões de reais). O objetivo do
diretor de vendas do Grupo Pão de Açúcar é analisar a relação entre o investimento realizado em
propaganda e as vendas (ambas em milhões de Reais) das lojas da rede no Município de Fortaleza, para
realizar projeções de vendas baseados em futuros investimentos em propaganda nos próximos anos. O
Quadro a seguir registra o histórico de 10 lojas na Capital de Fortaleza com os valores de propaganda e
vendas em milhões de reais, no ano de 2013:

Loja Propaganda (R$ milhões) Vendas (R$ milhões)


Parque Manibura 30 430
Edson Queiroz 21 335
Fátima 35 520
Dionísio Torres 42 490
Antônio Sales 37 470
Engenheiro Santana Júnior 20 210
Santos Dumont 8 195
Dom Luiz 17 270
Abolição 35 400
Bárbara de Alencar 25 480

Para os dados acima, determine:

a) Gráfico de Dispersão ou diagrama de dispersão.


b) A reta estimada;
c) A interpretação dos parâmetros

141
Professor Cledinaldo Castro Araújo
d) O coeficiente de Determinação e sua interpretação
e) A estimação das vendas (R$) para um investimento em propaganda de R$ 43 milhões
f) Monte a tabela ANOVA
g) Analise a validade do modelo através do teste F

Resoluções:
a) Com o uso do Excel, basta selecionar a opção Gráfico de Dispersão XY

600
500
400
300
200
100
0
0 5 10 15 20 25 30 35 40 45

b) De acordo com os dados da tabela, temos:


Propaganda (R$ Vendas (R$
Loja xi.yi x2i y2i
milhões) milhões)
Parque Manibura 30 430 12.900 900 184.900
Edson Queiroz 21 335 7.035 441 112.225
Fátima 35 520 18.200 1.225 270.400
Dionísio Torres 42 490 20.580 1.764 240.100
Antônio Sales 37 470 17.390 1.369 220.900
Engenheiro Santana Júnior 20 210 4.200 400 44.100
Santos Dumont 8 195 1.560 64 38.025
Dom Luiz 17 270 4.590 289 72.900
Abolição 35 400 14.000 1.225 160.000
Bárbara de Alencar 25 480 12.000 625 230.400
Total - - 112.455 8.302 1.573.950

Sendo 𝑋 = 27 𝑒 𝑌 = 380, temos:

∑𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖 −𝑛.𝑋.𝑌 112455−10.27.280
 𝛽= ∑𝑛 2 2 = ⟹ 𝛽 = 9,7381 ⟹ 𝛽 ≅ 9,74
𝑖=1 𝑥 𝑖 .−𝑛.𝑋. 8302−10.272
 𝛼 = 𝑌 − 𝛽. 𝑋 = 380 − 9,74.27 ⟹ 𝛼 = 117,07

Logo a reta estimada é 𝑌̂𝑖 = 117,07 + 9,74. 𝑋𝑖

c) Interpretação dos parâmetros:

 Coeficiente Linear: α=117,07, para X=0, ou seja, para investimento zero em propaganda, estima-se
vendas, em milhões de reais, em torno de R$ 117,07. Um ponto de atenção com relação a esta
interpretação é quando este valor foi negativo. Para alguns casos, o valor negativo não faz sentido na
prática.

142
Professor Cledinaldo Castro Araújo

 Coeficiente Angular: β=9,74, para cada unidade de X incrementa-se em Y 9,74, ou seja, para cada um
milhão de reais investido em propaganda, acrescenta-se R$ 9,74 milhões em vendas.

d) O coeficiente de Determinação será dado por:

Antes de calcularmos o coeficiente de Determinação, devemos calcular o coeficiente de Correlação,


assim:

∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑋 𝑌 112.455 − 10 ∗ 27 ∗ 380


𝑅𝑋𝑌 = = ⇒
2
√(∑𝑛𝑖=1 𝑥𝑖2 − 𝑛𝑋 ) (∑𝑛𝑖=1 𝑦𝑖2 − 𝑛𝑌 )
2 √(8.302 − 10 ∗ 272 ) ∗ (1.573.950 − 10 ∗ 3802 )

𝑅𝑋𝑌 = 0,8594
Assim:
𝑅 2 = (𝑅𝑋𝑌 )2 = 0,85942 ⇒ 𝑅 2 = 0,7385 𝑜𝑢 73,84%

Interpretação: O investimento em Propaganda explica cerca de 73,85% das vendas.

e) Considerando a reta estimada é 𝑌̂𝑖 = 117,07 + 9,74. 𝑋𝑖 , para um investimento de X = R$ 43 milhões,


temos uma previsão de vendas de 𝑌̂𝑖 = 117,07 + 9,74 ∗ 43 = 𝑅$ 535,89 𝑚𝑖𝑙ℎõ𝑒s

f) Soma de Quadrados:

2
 𝑆𝑄𝑡𝑜𝑡𝑎𝑙 = ∑𝑛𝑖=1 𝑌𝑖2 − 𝑛𝑌 = 1.573.950 − 10 ∗ 3802 = 129.950
 𝑆𝑄𝑅𝑒𝑔 = 𝛽(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦) = 9,73814 ∗ (112.455 − 10 ∗ 27 ∗ 380) = 95.969,39
2
 𝑆𝑄𝑅𝑒𝑠 = ∑𝑛𝑖=1 𝑌𝑖2 − 𝑛𝑌 − 𝛽(∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦) = 129.950 − 95.969,39 = 33.980,61

Fontes de Soma de
Graus de Liberdade Quadrado Médio F
Variação Quadrados

Regressão 1 95.969,39 95.969,39 22,59

Resíduo 10-2=8 33.980,61 4.247,58

Total 10-1=9 129.950,00 -

g) Calcular a estatística F, Ftabelado e concluir o teste do modelo.

𝑄𝑀𝑅𝑒𝑔 95.969,39
 𝐹= 𝑄𝑀𝑅𝑒𝑠
= 4.247,58
= 22,59

 𝐹𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 5,32

Forma de Consulta na tabela:

143
Professor Cledinaldo Castro Araújo

 𝐻0 : 𝛽 = 0 (𝐴 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 𝑛ã𝑜 é 𝑣á𝑙𝑖𝑑𝑎)


 𝐻0 : 𝛽 ≠ 0 (𝐴 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 é 𝑣á𝑙𝑖𝑑𝑎)

Conclusão:

Se F (22,59) > F tabelado (5,32): Rejeita-se a hipótese H0, ou seja, podemos concluir que o modelo é válido
ao nível de significância de 5%

14.3.4Modelos não Lineares por Anamorfose

A regressão linear proporciona a análise de vários fenômenos através do ajuste de um modelo linear. Até aqui
o modelo experimental é obtido diretamente dos dados. No entanto há várias situações em que o
comportamento do fenômeno é não linear. Neste caso, os pontos experimentais são obtidos a partir de uma
transformação dos dados ou linearização (anamorfose). Consiste em aplicar uma função que nos dados
originais e em seguida aplicar o método de mínimos quadrados.

Exemplo: Considere que as quantidades vendidas (Y) e o preço de um produto (X) estão relacionados da
seguinte forma:
𝛽
𝑌𝑖 = 𝛼𝑋𝑖 𝜀𝑖

Pode-se observar que a expressão acima é não linear. Para estimar os parâmetros (𝛼 𝑒 𝛽) é necessário aplicar
uma função que torne a função linear.

Aplicando a função logarítmica, temos:

𝛽
𝑙𝑜𝑔𝑌𝑖 = 𝑙𝑜𝑔𝛼𝑋𝑖 𝜀𝑖
⇒ 𝑙𝑜𝑔𝑌𝑖 = 𝑙𝑜𝑔𝛼 + 𝛽𝑙𝑜𝑔 𝑋𝑖 + 𝑙𝑜𝑔𝜀𝑖
Fazendo:
𝑙𝑜𝑔𝑌𝑖 = 𝑌𝑖∗ , 𝑙𝑜𝑔𝛼 = 𝛼 ∗ , 𝑙𝑜𝑔 𝑋 = 𝑋𝑖∗ 𝑒 𝑙𝑜𝑔𝜀𝑖 = 𝜀𝑖∗

Assim, obtemos o seguinte modelo linear:

𝑌𝑖∗ = 𝛼 ∗ + 𝛽𝑋𝑖∗ + 𝜀𝑖∗

Exemplo: Distribuição das pessoas economicamente ativas de uma cidade de acordo com a renda mensal
(Fonte: Rodolfo Hoffman)

144
Professor Cledinaldo Castro Araújo
Dados originais Forma da distribuição original: Potência
𝑋𝑖 𝑌𝑖 600.000

1 262.144 500.000

2 131.072 400.000

300.000
4 8.192
200.000
8 1.024
100.000
16 256
0
32 8 0 5 10 15 20 25 30 35

A estimação do modelo pelo método dos mínimos quadrados requer que os dados sejam linearizados através
de uma transformação aplicar uma transformação. A transformação adequada à potência é o logaritmo. Pode-
se utilizar o log ou ln (logaritmo natural ou Neperiano). Como os dados são potências de base 2, será utilizado
𝑋 𝑌
o log na base 2. Assim: 𝑋𝑖∗ = 𝑙𝑜𝑔2 𝑖 𝑒 𝑌𝑖∗ = 𝑙𝑜𝑔2 𝑖

Dados Transformados Forma da distribuição: Linear


𝑋 𝑌
𝑋𝑖∗ = 𝑙𝑜𝑔2 𝑖 𝑌𝑖∗ = 𝑙𝑜𝑔2 𝑖 20

0 18
15
1 17
10
2 13
3 10 5

4 8
0
5 3 0 1 2 3 4 5 6

Estimativa do modelo linear:


∗ ∗
 𝑋 = 2,5 𝑒 𝑌 = 11,5

∑𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖 −𝑛.𝑋.𝑌 120−6∗2,5∗11,5
 𝛽= ∑𝑛 2 2 = ⟹ 𝛽 = −3
𝑖=1 𝑥 𝑖 .−𝑛.𝑋. 55−6.2,52

 𝛼 ∗ = 𝑌 − 𝛽. 𝑋 = 11,5 − (−3) ∗ 2,5 ⟹ 𝛼 = 19

Logo a reta estimada é 𝑌̂𝑖∗ = 19 − 3. 𝑋𝑖∗

Estimativa do modelo original (Potência):

É importante lembrar que a transformação leva a:

𝑌 𝑋 𝜀
𝑙𝑜𝑔2 𝑖 = 𝑙𝑜𝑔2𝛼 + 𝛽𝑙𝑜𝑔2 𝑖 + 𝑙𝑜𝑔2𝑖
Com:
𝑋
 𝑋𝑖∗ = 𝑙𝑜𝑔2 𝑖
𝑌
 𝑌𝑖∗ = 𝑙𝑜𝑔2 𝑖
 ∝∗ = 𝑙𝑜𝑔2∝ .

145
Professor Cledinaldo Castro Araújo

Para retornar o valor de α no modelo original (potência) deve-se retornar a transformação, assim:
∝ ∗
2log2 = 2∝ ⇒∝= 219 ⇒ ∝= 524.288

Observação: O valor de 𝛽 para a transformação indicada não necessita retorno da transformação, uma
vez que o valor não foi alterado.

Modelo original (Potência):


𝛽
𝑌𝑖 = 𝛼𝑋𝑖 ⇒ 𝑌𝑖 = 524.288𝑋𝑖−3

Os demais casos de modelos não lineares podem ser analisados de forma análoga. O importante é a
identificação da forma da distribuição e a transformação adequada. Uma forma de avaliar a e melhor
escolha é comparara os coeficientes de determinação (R2) para os modelos testados, o maior coeficiente
de determinação é critério para a escolha do melhor modelo. O Microsoft Excel possibilita algumas
propostas de delineamentos com respectivos coeficientes de determinação.

14.4 Regressão Linear Simples com Excel


1. Com o uso do excel a Correlação pode ser calcuada aplicando as fórmuas, ou utilizando a função
“=CORREL(matriz1;matriz2)” onde: Matriz1 corresponde a coluna X e Matriz2 corresponde a Coluna do
Y. Para o cálculo da Correlação não há problemas em trocar X por Y.

2. Os parâmetros do modelo (α e β)

 β: Coeficiente angular: “=INCLINAÇÃO(val_conhecidos_y; val_conhecidos_x)”;


 α: Intercepto ou coeficiente linear: “=INTERCEPÇÃO(val_conhecidos_y; val_conhecidos_x)”;

3. Com o uso do excel, pode-se determinar os parâmetros do modelo através das fórmulas ou utilizando
opções de gráfico no diagrmama de Dispersão, veja:

Caminho: inserir gráfico de Dispersão, em seguinda selecione os pontos, clique com o botão direito e
selecione a opção Adiocionar Linha de Tendência, escolha o tipo de modelo (linear, exponencial, etc),
finalmente marque as opções Exibir Equação no Gráfico e Exibir valor de R-quadrado no Gráfico.

146
Professor Cledinaldo Castro Araújo

O excel retornará o Gráfico de Dispersão como segue:

600

500

400

300 y = 9,7381x + 117,07


R² = 0,7385
200

100

0
0 5 10 15 20 25 30 35 40 45

4. Os parâmetros do modelo e a ANOVA podem ser obtidos com o seguinte caminho: Dados, Análise
de Dados, Regressão. Em seguida preencha os campos dos intervalo de X e Y e marque as opções de
saída desejadas.

Exemplo: Retomando o exercício anterior, temos:

Figura 10 - Output do Excel

147
Professor Cledinaldo Castro Araújo

Capítulo 15
Critérios de Arredondamento

15. Critérios de arredondamentos


Em situações do dia-a-dia somos obrigados a utilizar números com poucas casas decimais. Exemplo:
costumamos trabalhar apenas com centésimos em nossa unidade monetária, ex: R$ 0,10 reais (preço do Big Big).
Algumas formas de apresentar uma quantidade não são práticas, por exemplo: você não vai na venda do Sr.
Raimundo e pede √3 𝑘𝑔 de feijão. Além disso, existem muitas expressões matemáticas, como cálculos de áreas,
volumes, entre outros, que recaem em números com infinitas casas decimais que, obviamente, só podemos
utilizar uma parte delas, ou seja, precisamos realizar um ARREDONDAMENTO. Em processos indústrias há
equipamentos que trabalham com alta precisão e que são obrigados a tratarem com muitas casas decimais,
mesmo assim faz-se necessário o arredondamento. Desta forma, podemos definir Arredondamento como o
processo de utilizar um número com quantidade de casas decimais menores que a do número original.
Utilizar menos casas decimais implica em utilizar um número maior ou menor que o número original. O objetivo é
que esta diferença ou discrepância seja a menor possível. Os principais critérios de arredondamento utilizam a
ideia do número mais próximo.

Exemplos: Arredondar para o inteiro mais próximo:

a) 10,1

A grande questão é: Qual o inteiro mais próximo? Claramente é 10 (perde-se 0,1).


Então 10,1 ≅10, veja que estamos utilizando um número menor que o original, ou
seja, arredondamento por FALTA.

b) 10,8

Novamente, a grande questão é: Qual o inteiro mais próximo? Claramente é 11 (ganha-se 0,2).
Então 10,8 ≅ 11, veja que estamos utilizando um número maior que o original, ou seja, arredondamento
por EXCESSO.

O critério do número mais próximo pode ser estendido para qualquer quantidade de casas, vejamos outros
exemplos:

Arredondar para décimos (uma casa)

a) 1,371 ≅ 1,4 (mais próximo de 1,4 do que 1,3)


b) 4,724 ≅ 4,7 (mais próximo de 4,7 do que 4,8)
c) 3,917 ≅ 3,9 (mais próximo de 3,9 do que 4,0)

De forma geral, para se deixar um número com determinada quantidade de casas (após a vírgula) digamos x,
toma-se como referência a casa seguinte x+1.
Exemplos:

a) X=0 (zero casas), arredondar para inteiro, toma-se a casa 1


b) X=1 (uma casa), arredondar para décimos, toma-se a casa 2
c) X=3, (duas casas) arredondar para centésimos, toma-se a casa 3

148
Professor Cledinaldo Castro Araújo

Observação: O símbolo “≅” significa aproximadamente

15.1 Método Tradicional

Critério de arredondamento utilizado pelo Excel, consiste em considerar a quantidade de casas significativas (x),
partindo da casa seguinte (x+1) de acordo com o critério:

 Casa seguinte < 5: a última casa a permanecer fica inalterada (falta)


 Casa seguinte ≥ 5: a última casa a permanecer fica adicionada de 1 (excesso)

Exemplo: Arredondar para décimos (uma casa após a vírgula)

17
a. 12
= 1,41666 ….

Veja que para arredondar para décimos, toma-se a segunda casa de 1,41667, como esta casa é igual a “1”
(<5), a primeira casa (décimos) fica então inalterada. Assim:

1,4166... ≅1,4

b) √10 = 3,16227 ….

Neste caso, a segunda casa de 3,162278 é igual a “6”( ≥ 5), a primeira casa recebe então “1”. Assim:

3,16227... ≅3,2

Observação 1: No Excel este arredondamento pode ser realizado com a função ARRED, cuja sintaxe é:
”=ARRED (núm;núm_dígitos)”.

Onde:
 núm: número(endereço) a ser arredondado
 núm_dígitos: número de dígitos a permanecer após a vírgula

Observação 2: o botão aumentar número de casas e diminuir número de casas não arredonda o número,
apenas apresenta uma visualização com mais ou menos casas decimais (print abaixo)

15.2 Método ABNT

Critério de arredondamento utilizado pela Associação Brasileira de Normas Técnicas. Este critério está regido
pela Norma NBR 5891 de Dezembro de 1977 que dispõe de Regras de Arredondamento na Numeração Decimal e

149
Professor Cledinaldo Castro Araújo
em conformidade com a resolução nº 886/66 do IBGE – Instituto Brasileiro de Geografia e Estatística. O critério
consiste em considerar a quantidade de casas significativas (x), partindo da casa seguinte (x+1) de acordo com o
critério:

 Casa seguinte < 5: a última casa a permanecer fica inalterada


 Casa seguinte > 5: a última casa a permanecer fica adicionada de 1
 Casa seguinte = 5:

i) Ao 5 seguir, em qualquer casa, um algarismo diferente de 0 (zero), a última casa a permanecer fica
adicionada de 1
ii) O 5 for o último dígito ou se a ele só seguirem dígitos iguais a 0 (zero), a última casa a permanecer só
será adicionada de 1 se for ímpar.

Veja que este critério diferencia-se do tradicional quando a casa de referência é igual 5, para os casos em
que a casa é maior ou igual a 5, os critérios convergem.

Exemplo: Arredondar para décimos (uma casa após a vírgula)

5
a) = 0,5555 ….
9

Neste caso, a segunda casa de 0,55555... é igual a “5” e ale precede-se dígitos diferentes de 0 (zero), a
primeira casa recebe então “1”. Assim:

0,55555... ≅0,6

250
b) 1000
= 0,250

Neste caso, a segunda casa de 0,250 é igual a “5”, ale precede-se dígitos iguais a 0(zero), a primeira casa é
PAR, esta fica então inalterada. Assim:

0,250≅0,2

350
c) 1000
= 0,350

Neste caso, a segunda casa de 0,350 é igual a “5”, ale precede-se dígitos iguais a 0(zero), a primeira casa é
ÍMPAR, esta fica então adicionada de 1. Assim:

0,350≅0,4

Observação: O critério de considerar dígitos pares ou impares como desempate para realizar
arredondamento por excesso ou falta está no fato de haverem iguais quantidades de dígitos pares e
impares, ou seja, há igual possibilidade de arredondamentos por excesso ou falta.

15.3 Método do Truncamento

Critério de arredondamento que consiste em considerar a quantidade de casas significativas (x), simplesmente
desconsiderando todas as casas a partir da casa seguinte (x+1), ou seja, a última casa a permanecer fica sempre
inalterada.

Exemplo: Arredondar para décimos (uma casa após a vírgula)

150
Professor Cledinaldo Castro Araújo

17
a) 12 = 1,41666 … . ≅ 𝟏, 𝟒
b) √10 = 3,16227 … . ≅ 𝟑, 𝟏

Observação: No Excel este arredondamento pode ser realizado com a função TRUNCAR, cuja sintaxe é
”=TRUNCAR(núm;núm_dígitos)”.

Onde:
 núm: número (endereço) a ser arredondado por truncamento
 núm_dígitos: número de dígitos a permanecer após a vírgula

151
Professor Cledinaldo Castro Araújo

Capítulo 16
Exercícios Propostos

16 Exercícios Propostos

16.1 Análise Descritiva

1. Considerando a série estatística indicada abaixo:


Estabelecimentos de saúde públicos e particulares, por espécie, Brasil, 1985.
Quantidade
Estabelecimento
Públicos Particulares
Hospital 1.002 5.132
Pronto-socorro 150 156
Policlínicas* 1.531 6.136
Outros 14.393 472
Total 17.076 11.896
Fonte: IBGE (1988) (*) Incluem postos de saúde, centros de saúde e unidades mistas.
Determine:
a) A classificação da série estatística (temporal, geográfica, específicas ou mistas);
b) A classificação das variáveis: Estabelecimento de saúde e quantidade de Estabelecimentos (qualitativa – nominal
/ordinal ou quantitativa – discreta /contínua);
c) Identificação dos elementos de uma tabela estatística.

2. A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem tirar
conclusões sobre um grupo maior denomina-se:

a) Estatística de População; b) Estatística de Amostra; c) Estatística Inferencial d)Estatística Descritiva;

3. Assinale a alternativa verdadeira

a) Tanto a nota quanto a chamada são usadas para esclarecimento geral sobre um quadro e uma tabela;
b) Tanto a nota quanto a chamada são usadas para esclarecer detalhes em relação à casa, linhas ou colunas de um
quadro ou uma tabela;
c) A nota é usada para esclarecer detalhes em relação a casas, linhas ou colunas enquanto a chamada é usada para
um esclarecimento geral sobre um quadro ou uma tabela;
d) A nota é usada para esclarecimento geral sobre um quadro ou tabela enquanto a chamada é usada para
esclarecer detalhes em relação a casas, linhas ou colunas.
e) Todas as afirmativas anteriores são falsas.

4. Qual a diferença entre dado e informação?

5. Classifique as variáveis abaixo:


a) População: Construtoras existentes em Fortaleza
 Variável 1: nº de edificações
 Variável 2: áreas das edificações
 Variável 3: qualidade das edificações
 Variável 4: Local onde está sediada
b) População: Ceará – computadores ligados à internet – 2015
 Variável 1: nº de usuários

152
Professor Cledinaldo Castro Araújo
 Variável 2: nome do provedor
 Variável 3: preço das mensalidades
 Variável 4: ordem de inscrição na rede.

6. Para a série abaixo, Determine:

a) A representação gráfica; b) A classificação da série estatística; c)A classificação da variável orçamento ($ 1000).

Brasil – Evolução das Despesas de Manutenção nas IFES – 2008 a 2010

Ano Orçamento (R$ 1000)


1998 20,0
1999 30,3
2000 25,2
2001 39,5
2002 50,0

7. Um administrador do G.M. Branco (Fortaleza), em dezembro de 2001, obteve junto ao departamento de recursos
humanos dessa empresa, informações de uma amostra de 500 funcionários, onde foram analisadas as variáveis: sexo e
grau de instrução. A pesquisa mostrou que:

 40% dos funcionários têm apenas o 1 grau;


 Os de sexo feminino representam 75% do total de funcionários;
 Dentre os de sexo feminino, 233 têm o 2 grau, enquanto que, dentre os de sexo masculino, 52% têm o 1  grau;
 Apenas 5% dos funcionários têm nível superior.

Faça uma tabela estatística que mostre a distribuição conjunta entre as duas variáveis. Observação: Dados fictícios.

8. Efetuando-se 50 medições do ponto de fusão de uma substância, foram anotados os resultados, que abaixo são dados:

Ponto de fusão (°C) Nº de medições


49,50 |---- 50,00 5
50,00 |---- 50,50 6
50,50 |---- 51,00 28
51,00 |---- 51,50 9
51,50 |----|52,00 2
TOTAL 50

a) Determine as frequências relativas e acumuladas;


b) Em que porcentagem das medições, verificou-se um ponto de fusão de pelo menos a 51C?
c) Indique o histograma e faça um comentário sobre o resultado da pesquisa;
d) Que percentual das medições foi inferior a 51° C?
e) Interprete todas as frequências da classe 50,00 |---- 50,50

De um lote de resistores do mesmo tipo foram escolhidos ao acaso 10 resistores. A medição do afastamento da
resistência nominal em KΩ (Kilo-ohms) forneceu a tabela abaixo. Ache 𝑥̅ e s.

Nº do Resistor 1 2 3 4 5 6 7 8 9 10
Desvio do Valor nominal 1 3 -2 2 4 2 5 -2 4 3

9. Uma amostra de 80 corpos de prova de concreto forneceu a seguinte distribuição de resistências de ruptura:

153
Professor Cledinaldo Castro Araújo

Resistência (psi*) Nº de medições


50 |---- 60 2
60 |---- 70 15
70 |---- 80 50
80 |---- 90 10
90 |----|100 3
TOTAL 80
(*) Psi (pound force per square inch) ou libra força por polegada quadrada

a) A especificação para este tipo de material exige que a resistência média de ruptura esteja compreendida entre 70
e 80 psi e que o coeficiente de variação seja inferior a 20%. Qual dessas exigências parece não está sendo
satisfeita no presente estudo? Justifique.
b) Determinar moda e mediana.

10. Uma cerâmica fabrica tijolos de acordo com a norma de um grande cliente. A norma estabelece que os tijolos devem
2
suportar no mínimo uma força de compressão média de 10 kg/cm e que o desvio padrão não deve ser superior a 5% da
média. Num ensaio realizado em um lote de tijolos pelo Engenheiro da Qualidade do cliente, foram registrados os
2
seguintes dados de uma amostra de 6 tijolos, para sua resistência à compressão em kg/cm : 12; 11; 10; 9; 8,5 e 11,5.
Nestas condições, o Engenheiro da Qualidade aprovará ou reprovará o lote de tijolos?

11. Considere o conjunto de medições: 1, 2, 3, 2, 2, 3, 4, 4, 3, 1, 0, 0 e 20. Para estes dados, qual a medida de posição mais
adequada? Justifique.

12. Uma máquina para empacotamento de sacas de cimento não está calibrada, de modo a acrescentar 200g a cada
pesagem. Se o peso médio das sacas de cimento deve ser 50 kg, qual será o peso médio final? Justifique.

13. Um órgão do governo do estado está interessado em determinar padrões sobre o investimento em saneamento básico,
por habitante, realizado por prefeituras. De um levantamento de 10 cidades. Foram obtidos os valores (codificados)
abaixo:
Cidade A B C D E F G H I J
Investimento 20 16 14 8 19 15 15 16 19 18

Nesse caso, será considerado como investimento básico da média final das observações acima, calculada da seguinte forma:

a) Obter a média inicial


b) Eliminar do conjunto aquelas observações que forem superiores à média inicial mais duas vezes o desvio-padrão
ou inferiores à média menos duas vezes o desvio-padrão.
c) Calcular a média final com o novo conjunto de observações.

14. Os dados abaixo referem ao número de apartamentos vendidos pela Construtora Pais & Filhos.

a) Montar a distribuição de frequências adequada;


b) Calcular média, moda e mediana;
c) Calcular variância, desvio-padrão e coeficiente de variação. Montar o histograma e fazer um comentário sobre o
resultado da pesquisa.

0 0 1 4 5 3 2 4 8 4
6 7 4 5 2 1 1 1 5 3
6 4 5 6 1

15. Considere a distribuição de frequências relacionada às idades (anos) de um grupo de funcionários de uma empresa:

154
Professor Cledinaldo Castro Araújo
Idade dos funcionários da Empresa K&M, 2017.
Idade (Anos) Xim fi fi% faci fadi faci% fadi%
|--- 25 81
|--- 111
|--- 45
|--- 16
|--- 4
Total - 150 - - - -
Fonte: Núcleo de Recursos Humanos
Sobre os dados determine:

a) As informações não indicadas na tabela;


b) A interpretação de todas as frequências da 3ª classe;
c) Média, moda e mediana.
d) Variância, desvio padrão e coeficiente de variação.
e) Se a população dos funcionários apresentar 30% de homens e a média das idades das mulheres for de 25 anos,
Qual a média das idades dos homens?

16. Analisando a distribuição dos salários dos empregados de uma empresa em número de salários Mínimos (SM), obteve-se
o histograma de frequências absolutas abaixo com os intervalos de classe fechados à esquerda e abertos à direita.
Considere que:

 𝑋 é a média aritmética dos salários, calculada levando em conta que todos os valores incluídos num certo
intervalo de classe são coincidentes com o ponto médio deste intervalo;
 Md é a mediana dos salários, calculada por meio do método da interpolação linear;
 Mo é a moda dos salários, calculada com a utilização da fórmula de King.

𝒇∗∗
𝑴𝒐 = 𝑳 + 𝒙𝒉
𝒇∗ +𝒇∗∗
Em que L é o limite inferior da classe modal (classe que se verifica, no caso, a maior frequência). 𝑓 ∗ é frequência da classe
anterior à classe modal, 𝑓 ∗∗ é a frequência da classe posterior à classe modal e h é amplitude do intervalo de classe
correspondente.

O valor de (𝑋 + Md + Mo) é, em SM, igual a:

a) 18,6 b) 19,7 c) 19,2 d) 18,7 e) 18,5

17. Considerando Insalubridade como a situação ou condição (notoriamente ambiental) que afeta, ao menos de forma
potencial, a saúde das pessoas ali presentes, tais como: ruído, poeira, radiação, calor, insolação, etc. Os dados abaixo
referem aos índices de insalubridade de uma amostra de construtoras cearenses durante o ano de 2014.

0,21 0,20 0,24 0,24 0,35 0,38 0,41 0,49 0,50 0,53
0,48 0,65 0,25 0,28 0,34 0,45 0,47 0,58 0,62 0,66
0,70 0,54 0,67 0,26 0,64

Determine:

155
Professor Cledinaldo Castro Araújo
a) A organização dos dados em uma distribuição de frequências adequada;
b) Construção do histograma;
c) A média, moda e mediana para a distribuição de frequências;
d) A variância, desvio-padrão e coeficiente de variação;
e) Que percentual de construtoras apresentou um índice inferior a 0,40?
f) Que número de construtoras apresentou um índice de no mínimo 0,30?
g) Se outra amostra, de empresas metalúrgicas, apresentou uma dispersão relativa de 24%. Em que grupo de
atividade a insalubridade é mais homogênea?

18. Uma população possuía 100 mil habitantes em 31 de dezembro de 2017. Um pesquisador mediu a idade média desta
população nesta data e encontrou um valor x. Suponha que não houve nascimento, não houve mortes e que ninguém se
mudou da ou para a cidade durante um ano. Um ano depois, em 31 de dezembro de 2018, demonstre que a idade média
desta população torna-se 1 ano maior.

19. Acredita-se que a concentração de um ingrediente ativo em um detergente líquido para lavagem de roupas seja afetado
pelo tipo de catalizador usado no processo. Dez medições são realizadas na concentração (gl/l) para dois tipos de
catalizadores.
57,9 66,2 65,4 65,4 65,2
Catalisador 1
62,6 67,6 63,7 67,2 71,0

66,5 71,7 70,4 69,3 64,8


Catalisador 2
69,8 68,6 69,4 65,3 68,8
16.1.1 Calcule média e CV para os dois catalisadores
16.1.2 Construa um gráfico em colunas para as concentrações médias dos dois catalisadores;
16.1.3 O que se pode concluir, descritivamente, sobre a hipótese testada?

20. Quatro estudantes dirigem de Fortaleza até a Guaramiranga a uma velocidade de 40 km por hora. Eles voltam a uma
velocidade média de 60 km por hora. Qual a velocidade média deles durante a viagem?

21. Em uma empresa do ramo Têxtil 60% dos funcionários são do sexo feminino. O salário médio das mulheres é de R$ 600,
enquanto a dos homens R$ 450,00. Se a empresa tem 400 funcionários, qual o salário médio de todos os funcionários?

22. Prove que a soma dos quadrados dos desvios dos valores de um conjunto de dados com relação média é menor que a
soma dos quadrados dos desvios com relação a qualquer outro valor arbitrário.

23. Uma prova consta de três questões com pesos iguais a 3,2 e 1, respectivamente, para a primeira, a segunda e terceira
questão. Se um aluno obteve 8,0 na prova 8,5 na primeira questão e 6,5 na segunda, que grau ele conseguiu na terceira
questão?

24. Examinando a figura abaixo, podemos dizer:

a) O desvio padrão da distribuição A é maior do que o da distribuição B, e as médias são iguais.


b) O desvio padrão de A é menor do que o de B e as médias são diferentes.
c) O desvio padrão de A é igual ao de B, independentemente do valor da média.
d) As distribuições possuem o mesmo coeficiente de variação.

25. Um censo realizado em duas empresas Alfa e Beta revelou que os coeficientes de variação correspondentes dos salários
de seus empregados foram 10% e 5%, respectivamente. Sabe-se que a soma das médias aritméticas dos salários das

156
Professor Cledinaldo Castro Araújo
duas empresas é igual a R$ 3.400,00 e o desvio padrão da empresa Beta é igual a 9/16 do desvio padrão da empresa
2
Alfa. A soma dos respectivos valores das variâncias, em (R$) , das duas empresas, é igual a:

a) 33.700. b) 35.000 c) 43.100 d) 51.200 e) 62.500

26. Dois grupos de pessoas foram submetidos a um teste de habilidades manuais. Os resultados do primeiro grupo podem
ser expressos por: µx = 80 pontos e σx = 4 pontos. Sabendo-se que a relação entre as duas populações pode ser
representada por Y = (3X/4) – 2. Qual a média e o coeficiente de variação dos pontos do segundo grupo?

27. A Estatística é bastante utilizada em diversos ramos da sociedade, no intuito de realizar pesquisas, colher dados e
processá-los, analisar informações, apresentar situações por meio de gráficos de fácil compreensão. O CRA-AC, por
exemplo, ao elaborar um relatório ou ao apresentar um projeto, pode utilizar gráficos estatísticos que tornam as
informações mais palpáveis e a leitura mais atraente. Um dos conceitos fundamentais da estatística é a mediana, que
pode ser definida como:

a) Valor representado através de porcentagem, divisão entre a frequência absoluta de cada variável e o somatório
das frequências absolutas;
b) Medida central em uma determinada sequência de dados numéricos
c) Medida de tendência central. Somatório dos valores dos elementos, dividido pelo número de elementos;
d) Somatório dos valores dos elementos multiplicado por seus respectivos pesos, dividido pela soma dos pesos
atribuídos;
e) Valor de maior frequência em uma série de dados, o que mais se repete.

16.2 Probabilidade

28. Considere os eventos A e B tais que: P(A) = 1/4; P(B \ A) = ½; P(A \ B) = ¼


C C C
a) Os eventos A e B são independentes? b) Os eventos A e B são mutuamente exclusivos? Calcule P(A /B ) e P(A/B )
(R: 3/4 e 1/4).

29. A probabilidade de uma mulher e de seu marido estarem vivos daqui a trinta anos é, respectivamente, 3/4 e 3/5. Qual a
probabilidade de apenas o marido está vivo nesse mesmo período? (R: 3/20)

30. A montagem de um sistema é formada de dois subsistemas A e B. De procedimentos de ensaios anteriores, as seguintes
probabilidades se admitem: P (A falhe) = 0,20, P (A e B falhem) = 0,15 e P (B falhe sozinho) = 0,15. Calcule: (R: 0,5 e 0,05)

a) P(A falhe \ B falhou) b) P( A falhe sozinho)

31. Um estudo realizado entre motoristas adultos sobre a relação existente entre o nível de renda (B= baixa, M = média e A
= alta) e a preferência por um dos três fabricantes de automóveis (X, Y e Z) resultou na tabela das probabilidades
conjuntas:
Renda
Fabricante P(F=f)
B M A
X 10 13 2 25
Y 20 12 8 40
Z 10 15 10 35
P(R=r) 40 40 20 100
Use esta tabela para encontrar as seguintes probabilidades condicionais: (R: 2/5, 3/7, 27/40, 27/75 e 27/75)
C C
a) P (Y \ A) b) P(M \ Z) c) P(X \M) d) P(M \X ) e) P(M \ YUZ)

32. Para um determinado telefone, a probabilidade de se conseguir linha é ¾ em dias normais e ¼ em dias de chuva. A
probabilidade de chover em um dia é 1/10, além disso, tendo-se conseguido linha, a probabilidade de que o número
chamado esteja ocupado é de 11/21. (R: 1/3, 4/9 e 1/28)

157
Professor Cledinaldo Castro Araújo
a) Qual a probabilidade de que o telefone tenha sua ligação completada?
b) Qual a probabilidade de que em dois telefonemas apenas um seja completado?
c) Dado que um telefonema foi completado, qual a probabilidade de está chovendo?

33. Determine a confiabilidade de cada dos sistemas representados pelos diagramas abaixo, assumindo que cada
componente funciona independentemente. (R: 88,65% e 96,39%)

a) b)

34. Consumidores são utilizados para avaliar projetos iniciais de produtos. No passado, 95% dos produtos altamente
aprovados recebiam boas críticas, 60% dos produtos moderadamente aprovados recebiam boas críticas e 10% dos
produtos ruins recebiam boas críticas. Além disso, 40% dos produtos tinham sido altamente aprovados, 35% tinham sido
moderadamente aprovados e 25% tinham sido produtos ruins. Com base nessas informações e escolhido um produto ao
acaso, que foi submetido aos consumidores, determine a probabilidade de que ele seja um produto altamente aprovado,
caso o produto não tenha recebido uma boa crítica.

35. Um mecanismo robótico de inserção contém 10 componentes primários. A probabilidade de que qualquer um dos
componentes falhe durante o período de garantia é de 0,03. Assume que as falhas dos componentes são independentes
e o mecanismo falha se qualquer um dos componentes falharem. (R: 0,2626 e 0,0051 ).

a) Qual a probabilidade de que o mecanismo falhe durante o período de garantia?


b) Qual deveria ser a probabilidade individual de falha dos componentes para que a probabilidade de falha do
mecanismo seja de 0,05?

36. Quantas vezes, no mínimo, se deve lançar um dado não tendencioso para que a probabilidade de obter algum 6 seja
superior a 0,9? (R: n ≥13)

37. Se a voltagem é baixa, a probabilidade de ocorrência de falha em um dispositivo é 0,6 e se a voltagem é normal, a
probabilidade é de 0,1. Em 20% dos casos a voltagem é baixa. Qual a probabilidade de não ocorrer falha com voltagem
baixa? (R: 0,4)

38. Em um teste múltipla escolha, marca-se uma alternativa em cada uma de quatro questões, cada uma com cinco
alternativas da qual apenas uma é correta. Qual a probabilidade de um indivíduo acertar por mero acaso alguma
questão? (R: 0,59)

39. Uma nave espacial tem mil componentes em série. Se a confiabilidade da nave deve ser de 0,9, e se todos os
componentes têm o mesmo grau de confiabilidade, qual deve ser a confiabilidade de cada componente? (R: 0,99985).

40. Um empreiteiro apresentou orçamentos separados de dois projetos, um para a execução da parte elétrica e outro da
parte de encanamento de um edifício. Ele acha que a probabilidade de ganhar a concorrência da parte elétrica é de 1/2.
Caso ele ganhe a parte elétrica, a chance de ganhar a parte de encanamento é de 3/4; caso contrário, essa probabilidade
é de 1/3. Qual a probabilidade de ele: (R: 1/3 e 7/24)

a) Não ganhar qualquer projeto. b) Ganhar apenas um projeto

41. Considere que a definição do preço total de um frete depende de 5 fatores: distância da origem ao destino, preço do
combustível, tipo de mercadoria, valor do seguro e condições das estradas. Suponha que o peso da distância na
composição do preço seja duas vezes mais que o tipo de mercadoria, este por sua vez três vezes mais que as condições
das estradas; por outro lado preço de combustível e valor do seguro, individualmente, igual ao tipo de mercadoria.
Determine a probabilidade de cada fator na composição do preço do frete.

158
Professor Cledinaldo Castro Araújo
42. Um grupo de consumidores foi informado sobre a possibilidade da ocorrência sistemática de falha na pesagem (peso
abaixo do discriminado na embalagem) no departamento de carne de um supermercado. Um representante é
encarregado de comprar 5 pacotes de 1 kg de carne cada um no referido supermercado. Se existem 20 pacotes na
vitrine e oito deles realmente apresentam peso abaixo do informado, qual é a probabilidade de que pelo menos três dos
5 pacotes comprados estejam com problemas de pesagem?

43. Uma companhia de circuitos integrados tem sua produção dividida em 3 fábricas (A, B e C). A fábrica A produz 50% dos
circuitos, a fábrica B produz 30% e a fábrica C o restante da produção. Através de análises anteriores verificou-se que a
probabilidade de que um circuito produzido pelas fábricas A, B e C não funcione é de 0,01, 0,04 e 0,03, respectivamente.

a) Qual a probabilidade de que um circuito produzido pela companhia, escolhido ao acaso, seja defeituoso?
b) Se o vendedor dos circuitos faz o teste num deles e verifica ser o mesmo defeituoso, qual a probabilidade de que
ele tenha sido produzido pela fábrica A? E pela fábrica B?

44. Um estudante responde a uma questão de múltipla escolha com 4 alternativas das quais apenas uma é correta. Suponha
que a probabilidade do estudante saber a resposta correta é de 0,8 e que caso ele não saiba responderá aleatoriamente,
isto é, ele “chutará” a questão. Sabendo que o estudante acertou a questão, qual a probabilidade do mesmo não ter
“chutado”?

45. Em uma escola, foram consultados 800 alunos sobre a realização de uma oficina extra turno. Desses, 385 optaram por
oficina de música, 428 optaram por oficina de pintura e 47 não opinaram. Selecionando, ao acaso, um desses alunos,
qual é a probabilidade de ele ter optado pelas duas oficinas?

46. Os indivíduos S1, S2, S3 e S4, suspeitos da prática de um ilícito penal, foram interrogados, isoladamente, nessa mesma
ordem. No depoimento, com relação à responsabilização pela prática do ilícito, S1 disse que S2 mentiria; S2 disse que S3
mentiria; S3 disse que S4 mentiria. A partir dessa situação, julgue o item a seguir. Considerando que a conclusão ao final
do interrogatório tenha sido a de que apenas dois deles mentiram, mas que não fora possível identificá-los, escolhendo-
se ao acaso dois entre os quatro para novos depoimentos, a probabilidade de apenas um deles ter mentido no primeiro
interrogatório é superior a 0,5 ? Justifique.

47. De acordo com dados do IBGE [disponível em: www.ibge.-gov.br/agencia-noticias, acesso em: 12 mar. 2018, adaptado] o Brasil tinha 67
milhões de domicílios particulares em 2014, sendo que 97,1% deles possuíam aparelho de TV, e 39,8% dos domicílios
com TV tinham TV digital aberta. Além disso, cerca de 15,1 milhões de domicílios com aparelhos de TV, no país, ainda
tinham TV analógica aberta. Desta forma, escolhendo ao acaso um domicílio particular brasileiro no ano de 2014, a
probabilidade de que ele possuísse aparelho de TV analógico aberto era, aproximadamente, de:

48. Uma operação policial será realizada com uma equipe de seis agentes, que têm prenomes distintos, entre eles André,
Bruno e Caio. Um agente será o coordenador da operação e outro, o assistente deste; ambos ficarão na base móvel de
operações nas proximidades do local de realização da operação. Nessa operação, um agente se infiltrará, disfarçado,
entre os suspeitos, em reunião por estes marcada em uma casa noturna, e outros três agentes, também disfarçados,
entrarão na casa noturna para prestar apoio ao infiltrado, caso seja necessário. Se os dois agentes que ficarão na base
móvel forem escolhidos aleatoriamente, determine a probabilidade de André e Bruno serem os escolhidos.

49. O ano de 2017 inicia com um bom índice pluviométrico (chuva), mesmo assim insuficiente para afastar o período de seca
pelo qual o Brasil vem passando. A crise na gestão dos recursos hídricos está relacionada a este período de seca, mas
também a graves falhas no planejamento e na manutenção destes recursos. Além disso, há o processo de ocupação de
forma não planejada, o que provoca impactos ambientais graves, como assoreamento dos mangues, desmatamentos,
aterramentos, impermeabilizações do solo, erosão, contaminação da água, inundações entre outros. Uma importante
ação a ser tomada é o acompanhamento do processo de contaminação das fontes hídricas, com vistas a combater a
contaminação dos reservatórios. Dentro deste contexto, analise a situação abaixo e responda as questões a seguir. Um
reservatório recebe água de quatro fontes diferentes. A primeira tem 3% de probabilidade de apresentar alguma
contaminação, a segunda tem 2,5%, a terceira tem 3% e a quarta tem 6%. Considerando que o reservatório estará
contaminado se pelo menos uma das fontes estiver contaminada e que as contaminações ocorrem de forma
independente, qual a probabilidade de:

a) O reservatório não ser contaminado? b) O reservatório ser contaminado?

159
Professor Cledinaldo Castro Araújo
50. Em matemática, a probabilidade condicionada refere-se à probabilidade de um evento A ocorrer sabendo que ocorreu
outro evento B ocorreu. Sobre o conceito de probabilidade condicional, considere a seguinte questão: Em determinado
período letivo, cada estudante de um curso universitário tem aulas com três professores, esses identificados pelas letras
X, Y e Z. As quantidades de estudantes (homens e mulheres) que têm aula com cada professor é apresentada na tabela
de contingência abaixo: (Fonte: ENADE 2011).

Distribuição dos alunos por Sexo e professor


Sexo Professor X Professor Y Professor Z
Estudantes homens 45 5 32
Estudantes mulheres 67 2 4

A partir do grupo de estudantes desse curso universitário, escolhe-se um estudante ao acaso. Qual a probabilidade de
que esse estudante seja mulher, dado que ele tem aulas apenas com o professor X ?

61 61 67 22 67
𝑎) b) c) d) e)
73 155 155 112 112

51. Um número entre 1 e 200 é sorteado aleatoriamente. Calcular a probabilidade de que seja divisível por 5, 4 ou 7. (R:
97/200).

52. O rito processual de análise de determinado tipo de processo segue as três seguintes fases:

 Instrução: após a apresentação da representação e das provas, o juiz decide pela admissibilidade ou não do
caso;
 Julgamento: admitido o caso, o juiz analisa o mérito para decidir pela culpa ou não do representado;
 Apenação: ao culpado o juiz atribui uma pena, que pode ser ou o pagamento de multa, ou a prestação de
serviços à comunidade.

A partir das informações acima, considerando que a probabilidade de que ocorra erro de decisão na primeira fase seja de
10%, na segunda, de 5% e, na terceira, de 3%, e que a ocorrência de erro em uma fase não influencie a ocorrência de erro
em outras fases, julgue os próximos itens. A probabilidade de que ocorram erros de decisão em todas as fases do
processo é inferior a 0,1%?

16.3 Variáveis Aleatórias

53. Com relação ao problema anterior, sabe-se que, para cada peça processada, o operário ganha uma quantia de fixa de R$
2,00, mas se ele processar em menos de 6 minutos, ganhará R$ 0,50 por minuto poupado. Por exemplo, se ele processar
a peça em 4 minutos, receberá a quantia adicional de R$ 1,00. Considere G a v.a representando o ganho do operário por
peça. Determine: (R: R$ 2,75)

a) A distribuição de probabilidade de G; O valor esperado de G

54. Uma linha de produção é segmentada em lotes de tamanho N=1.000. O processo de inspeção é baseado em amostra
única de tamanho n = 40. Sendo o nível de qualidade igual a 2% e nº de aceitação 2, determine: (R: 83; 70,55)

a) O nº médio de itens analisados por lote


b) Considerando custo total apenas o valor destinado à inspeção, cujo valor unitário é de R$ 0,85. Qual o custo por
lote?
Observação: Nível de qualidade: % de defeituosa e nº de aceitação é nº máximo de defeituosas na amostra para que
a mesma seja aceita.

55. O custo de reparo de um produto é categorizado de acordo com a tabela abaixo. Determine o custo de reparo médio em
R$. (R$ 0,85).

160
Professor Cledinaldo Castro Araújo
Tratamento R - Custo de Reparo (R$) %
Retificação das peças R$ 0,50 70%
Sucatear as peças R$ 2,50 05%
Vender como 2ª qualidade R$ 1,50 25%

56. As empresas A e B são especializadas na instalação de aparelhos de ar condicionado. O número X de pedidos de


atendimento que a empresa A recebe em uma semana segue uma distribuição de Poisson com parâmetro λ = 4,5. O
número Y de pedidos de atendimento que a empresa B recebe em uma semana obedece ao seguinte perfil de
probabilidades: (R: E[XB]=2,97).

k 0 1 2 3 4 5 6 7
P(K=k) 0,05 0,15 0,22 0,22 0,17 0,12 0,05 0,02

Qual das duas empresas recebe em média o maior volume de pedidos em uma semana? Por que?

57. Em um processo de fabricação, 10% das peças são consideradas defeituosas. As peças são acondicionadas em caixas com
5 unidades cada uma. Se a empresa paga um a multa de R$ 10,00 por caixa em que houver alguma peça defeituosa, qual
o valor esperado da multa num total de 1000 caixas? (R: 4.095,10)

58. Em uma loteria, 7 em cada 10 vezes não se ganha nada, 2 em cada 10 vezes ganha-se R$ 100, e 1 em cada 10 vezes
ganha-se R$ 1.000. O valor que pode ser ganho é uma variável aleatória X. (R: R$ 120,00)

a) Determine a distribuição de probabilidade; b) Determine o ganho médio

Observação: A distribuição de probabilidade é uma tabela com os pares ordenados (x;P(X=x))

59. A Inspeção Total Média (ITM) mede o número médio de itens inspecionados, devido ao uso de um programa de
inspeção por retificação (inspeção total com substituição dos itens defeituosos). Para inspeção simples seu valor é dado
por:
𝑰𝑻𝑴 = 𝒏 + (𝟏 − 𝒑𝒂 )(𝑵 − 𝒏)

Onde: 𝒑𝒂 : Probabilidade de aceitação - 𝒑𝒂 = P(X ≤ a)

Sendo N = 1000, n= 30, p = 5% e a=1 (nº de aceitação), determine o valor do ITM e sua interpretação (R: 464).

60. Um produto alimentício é ensacado automaticamente, sendo o peso médio de ensacamento de 50 Kg por saca e desvio
padrão de 1,6 Kg. Os clientes exigem que, para saca fornecida com menos de 48 Kg, o fornecedor pague uma multa de R$
5,00. Calcular: (R: R$ 105,65; 50,62 Kg; 1,06 Kg)

a) O custo médio com multa para 200 sacas fornecidas;


b) Qual a nova regulagem média da máquina, para que o custo médio do item anterior seja reduzido para R$ 50,50?
c) Como o fornecedor acha que, no custo global, é desvantajoso aumentar a regulagem da máquina, e deseja
comprar uma nova máquina. Qual deve ser o desvio padrão dessa nova máquina para que, trabalhando com o
peso médio de 50 Kg, apenas 3% das sacas sejam multadas?

61. O tempo T, em minutos, necessários para um operário processar certa peça é uma V.A. (variável aleatória) com a
seguinte distribuição de probabilidade:

T 2 3 4 5 6 7
P(T=t) 0,1 0,1 0,3 0,2 0,2 0,1

a) Determine o tempo médio de processamento de uma peça (4,6 min);


b) Qual a probabilidade de um operário processar uma peça, no máximo, em 5 minutos? (70%)

62. Um casal planeja ter filhos até conseguir pelo menos um de cada sexo. Qual a probabilidade de que para tanto, precise
ter: (R: 0,0625; 0,25 e 3)

161
Professor Cledinaldo Castro Araújo

a) 5 filhos b) mais de três filhos c) Qual o número esperado de filhos?

63. Uma pessoa joga 3 moedas não viciadas e ganha R$ 12,00 se ocorrer somente caras ou somente coroas. Se perder,
quanto deverá pagar para o jogo ser justo? (Sugestão: considere E[X] = 0) (R: R$ 4,00).

64. Uma firma precisa decidir entre dois projetos de investimento. O projeto A terá ganho de R$ 20.000,00 se for bem
sucedido ou uma perda de R$ 2.000,00 se fracassar; ao passo que o projeto B terá ganho e perda de R$ 25.000,00 e R$
5.000,00 respectivamente. Sabendo que a probabilidade de um projeto ser bem sucedido é p, para quais valores de p
você escolheria o projeto A? (R: p <3/8)

65. Uma Organização financeira verificou que o lucro unitário (L) obtido numa operação financeira é dado pela expressão:
L = 1,1.V - 0,9.C - 4,5
Sabendo-se que o preço de venda unitário (V) tem distribuição de média R$ 50,00 e desvio padrão R$ 2,00 e que o preço
do custo unitário (C) tem distribuição média R$ 45,00 e desvio padrão de R$ 1,50. Qual a média e o desvio padrão do
lucro unitário? (R:R$ 10,00; R$ 2,58).

66. Três componentes, que funcionam independentemente, são ligados em um sistema único, de acordo com a figura
abaixo. Suponha que a confiabilidade de cada um dos componentes, para um período de operação de t horas, seja
-0,03t.
definido da seguinte forma: f(t) = 0,03e t ≥0. Se t for a duração até falhar, o sistema completo (em horas). Qual será
a confiabilidade do sistema? (R: 2(1 − 𝑒 −0,03t )2 − (1 − 𝑒 −0,03t )3 )

67. Num determinado processo de fabricação, 10% as peças são consideradas defeituosas. As peças são acondicionadas em
caixas com 5 unidades cada uma. (R: 0,0081; 0,0815 e R$ 4.095,10)

a) Qual a probabilidade de haver exatamente 3 peças defeituosas numa caixa?


b) Qual a probabilidade de haver 2 ou mais peças defeituosas numa caixa?
c) Se a empresa paga um a multa de R$ 10,00 por caixa em que houver alguma peça defeituosa, qual o valor
esperado da multa num total de 1000 caixas?

68. O diâmetro de um cabo elétrico supõe-se uma variável aleatória contínua com fdp dada por f(x) = 6x(1-x), 0<x<1. Calcule
P[X≤1/2 \ 1/3<X<2/3] (R: 1/2)

1 ln(2)
69. Atribuindo-se aos inteiros de 1 à 2n probabilidades proporcionais aos seus logaritmos: (R: ln(2n)! 𝑒 𝑛.ln(2)+ln(n)!)
a) Determine a constante de proporcionalidade
b) Mostre que a probabilidade condicional do inteiro 2, sabendo-se que um inteiro par ocorre é: ln2 / (n.ln2 + ln n!)

70. Estimativas de mercado indicam que um novo instrumento para análise de amostras de solo será pleno sucesso, sucesso
moderado ou insucesso com probabilidades 0,3; 0,6 e 0,1; respectivamente. O retorno anual associado com cada um
destes resultados é de 10 milhões, 5 milhões e 1 milhão, respectivamente. Seja X1 uma variável aleatória que denote o
retorno anual do produto.

b) Determine a distribuição de probabilidade de X1 Qual o retorno anual esperado?

16.4 Distribuições Discretas

71. Caracterizar as variáveis aleatórias como Binomial, Poisson e Hipergeométrica e identificar os parâmetros:

a) Nº de pessoas insatisfeitas com um produto em uma amostra de 5 pessoas selecionadas ao acaso de uma
população onde o percentual de insatisfação com o produto é de 5%;

162
Professor Cledinaldo Castro Araújo
2 2
b) Nº de defeitos por m de reboco onde a taxa média de defeitos é 2 defeitos a cada 2m ;
c) Nº de peças defeituosas entre 10 peças defeituosas escolhidas ao acaso e sem reposição de um lote contendo
200 peças, das quais 80 são defeituosas;
d) A variável anterior considerando a reposição;
e) Nº de acidentes por dia em uma empresa onde a taxa de ocorrência é de 1 acidente/dia;
f) Considerando o contexto da questão anterior, Nº de dias com zero acidente entre 10 dias observados;

72. Uma empresa foi contratada para perfurar poços artesianos no município X. Por experiências passadas, a empresa julga
que 20% dos poços que perfura apresentam vasão maior ou igual a 40.000 litros por hora. Se ela perfura 8 poços,
determine a probabilidade de (R: 0,0011; 0,2030; 0,0011).

a) Exatamente 6 apresentarem vasão maior ou igual a 40.000 litros;


b) Entre 2 e 7 apresentarem vasão maior ou igual a 40.000 litros;
c) Exatamente 2 apresentarem vasão inferior a 40.000 litros.

73. Uma prova tipo teste tem 10 questões independentes. Cada questão tem 5 alternativas das quais apenas uma é correta.
Se um aluno resolve a prova respondendo a esmo as questões, qual a probabilidade de tirar 5,0? (R: 0,0467).

74. Uma pesquisa realizada por uma ONG indicou que apenas 40% dos novos prédios de uma cidade apresentavam
equipamentos de acessibilidade adequados (Rampas, Elevadores, Sinalização em relevo, etc). Tomando ao acaso uma
amostra de 10 prédios desta cidade, qual a probabilidade de (R: 0,0001; 0,0060):

a) Todos apresentarem acessibilidade adequada; b) Nenhum apresentar acessibilidade adequada;

75. De acordo com experiências passadas, sabe-se que 10% dos usuários do Parque do Cocó (Fortaleza) estão insatisfeitos
com acessibilidade do Parque. Para uma amostra de 10 pessoas tomadas ao acaso em dado dia, determine a
probabilidade de: (R: 0,3487; 0,9298; 0,6513; 0,0015; 1 e 0,9).

a) Nenhuma pessoa insatisfeita com a acessibilidade;


b) Menos de três pessoas insatisfeitas com a acessibilidade;
c) Pelo menos uma pessoa insatisfeita com a acessibilidade;
d) Exatamente cinco pessoas insatisfeitas com a acessibilidade;
e) O número médio e variância para o número de pessoas insatisfeitas com a acessibilidade

76. Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica têm alergia aos poluentes
lançados ao ar. Admitindo que este percentual de alérgicos é real (correto), calcule a probabilidade de que pelo menos 4
moradores tenham alergia entre 13 selecionados ao acaso. (R: 25,26%)

77. Suponha que Xt, o nº de partículas emitidas em t horas por uma fonte radioativa, tenha uma distribuição de Poisson com
parâmetro 20t. Qual será a probabilidade de que exatamente 5 partículas sejam emitidas durante um período de15 min?
(R: 17,54%)

78. A oficina de manutenção de uma indústria pode atender, no laboratório normal, 4 casos de quebras de máquinas por
dia. Em média, quebram-se 3 máquinas por dia. Se quebrarem mais de 4 em um dia a oficina deverá fazer horas extras
para atender essas ocorrências. Qual a probabilidade de, em uma semana (6 dias), fazerem-se horas extras em 2 ou dias?
(Sugestão: utilize Poisson para máquinas e Binomial para os dias).

79. Uma remessa de 800 estabilizadores de tensão é recebida pelo controle de qualidade de uma empresa. São
inspecionados 20 aparelhos da remessa, que será aceita se ocorrer no máximo um defeituoso. Há 80 defeituosos no lote.
Considerando análise com reposição, qual a probabilidade de o lote ser aceito? (R: 39,17%)

80. O nº médio de aviões que aterram num determinado aeroporto é de 3 em cada 2 minutos. Sabe-se que o nº de aviões
que aterram no aeroporto é bem modelado por uma distribuição de Poisson.

a) Calcule a probabilidade de num período de 2 minutos aterrarem no máximo 2 aviões.


b) Calcule a probabilidade de num período de 6 minutos não aterrar qualquer avião
c) Qual a probabilidade aproximada de que numa hora, selecionada ao acaso, ocorram pelo menos 75 aterragens?

163
Professor Cledinaldo Castro Araújo

81. Uma fábrica de motores para máquinas de lavar roupas separa de sua linha de produção diária de 350 peças uma
amostra de 30 itens para inspeção. O número de peças defeituosas é de 14 por dia. Qual a probabilidade de que a
amostra contenha pelo menos 3 motores defeituosos?

a) Considerando a análise com reposição b) Considerando a análise sem reposição

82. Um processo de produção produz 10 itens defeituosos por hora. Encontre a probabilidade de 4 ou menos itens sejam
defeituosos numa retirada de uma hora.

83. A Detroit Auto Supply Company produz um lote de 50 filtros de combustível, dos quais 6 são defeituosos. Escolhem-se
aleatoriamente e testam-se 2 filtros do lote. Determine a probabilidade de ambos serem bons, se os filtros são
selecionados:

a) Com reposição; b) Sem reposição

84. A probabilidade de ocorrência de turbulência em um determinado percurso a ser feito por uma aeronave é de 0,4 em
um circuito diário. Seja X o número de vôos com turbulência em um total de 7 desses vôos (ou seja, uma semana de
trabalho). Qual a probabilidade de que: (R: 2,8%; 58%; 74,5% e 24,9%)

a) Não haja turbulência em nenhum dos 7 vôos?


b) Haja turbulência em pelo menos 3 deles?
c) X esteja entre E(X) – DP(X) e E(X) + DP(X)?
d) Num total de 5 semanas, tenha havido duas delas com turbulência em pelo menos 3 dias?

85. Cinco lâmpadas são escolhidas aleatoriamente dentre 15 lâmpadas, das quais 5 são defeituosas. Encontre a
probabilidade de (com reposição)

a) Nenhuma seja defeituosa; b) Exatamente uma seja defeituosa; c) Pelo menos uma seja defeituosa

86. A possibilidade de transmissão de um bit com erro num canal digital é de 9,1% e pode ser modelado por uma variável
aleatória discreta binomial. Considere a transmissão de 50 bits, qual a probabilidade de que ocorram pelo menos três
bits com erros transmitidos?

87. Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica tem alergia aos poluentes
lançados ao ar. Admitindo que este percentual de alérgicos é real (correto), calcule a probabilidade de que pelo menos 4
moradores tenham alergia entre 13 selecionados ao acaso.

88. O gerente de um almoxarifado informa que 30 % das peças tipo W estão com defeitos. Numa inspeção de auditoria,
calcule qual a probabilidade de que em 5 sorteios, sejam sorteados os seguintes eventos:

 X: Nº de peças com defeito, em um total de 5.


 X ~ Binomial (5; 0,3)

a) Nenhuma peça com defeito b) Exatamente duas peças com defeito c) Pelo menos duas peças com defeito

89. As empresas A e B são especializadas na instalação de aparelhos de ar condicionado. O número X de pedidos de


atendimento que a empresa A recebe em uma semana segue uma distribuição de Poisson com parâmetro λ = 4,5. O
número Y de pedidos de atendimento que a empresa B recebe em uma semana obedece ao seguinte perfil de
probabilidades:

k 0 1 2 3 4 5 6 7
P(K=k) 0,05 0,15 0,22 0,22 0,17 0,12 0,05 0,02

a) Qual das duas empresas recebe em média o maior volume de pedidos em uma semana? Por que?
b) Em qual das duas é maior a variabilidade do volume semanal de atendimentos? Por que?

164
Professor Cledinaldo Castro Araújo

(Sugestão: utilizar as expressões 𝐸[𝑋] = ∑𝑋 𝑥. 𝑃(𝑋 = 𝑥) e 𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 )

90. Um lote de 100 peças é entregue ao controle de qualidade de uma firma. O responsável pelo setor seleciona 5 peças
sem reposição. O lote será aceito se forem observadas 0 ou 1 defeituosas. Há 20 defeituosas no lote. Qual a
probabilidade de o lote ser aceito

91. Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica têm alergia aos poluentes
lançados ao ar. Admitindo que este percentual de alérgicos é real (correto), Determine: (R: 25,26%; 2,6; 2,08)

a) O modelo aleatório e os parâmetros para a V.A X: Nº de pessoas com alergia


b) A probabilidade de que pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso;
c) A média (esperança) e Variância para o nº de pessoas com alergia.

92. Na fabricação de peças de determinado tecido aparecem defeitos ao acaso, um a cada 250 m. Supondo-se a distribuição
de Poisson para os defeitos, qual a probabilidade de que na produção de 1000m: (R: 1,83%; 76,19%; 6,57 dias)

a) Não haja defeito


b) Aconteçam pelo menos três defeitos
c) Num período de 80 dias de trabalho a produção diária é de 625m. Em quantos dias podemos esperar uma
produção sem defeito?

93. O número de navios petroleiros, digamos N, que chega a uma determinada refinaria cada dia tem média igual a 2. As
instalações do porto podem atender a três petroleiros por dia. Se mais de três petroleiros aportarem por dia, o
excedente a três deverá seguir para outro porto. (R: 0,145; 4; 1 ou 2;

a) Em um dia, qual é a probabilidade de se mandar petroleiros para outro porto?


b) De quanto deverão ser aumentadas as atuais instalações para permitir manobrar todos os petroleiros em,
aproximadamente, 90 por cento dos dias?
c) Monte um histograma e indique qual é o número de petroleiro mais provável a chegar por dia?

94. Suponha que uma aplicação de tinta em um automóvel e feita de forma mecânica, e pode produzir defeitos de
fabricação, como bolhas ou áreas mal pintadas, de acordo com uma variável aleatória x que segue uma distribuição de
Poisson de parâmetro lâmbda ʎ =1. Suponha que sorteamos um carro ao acaso para que sua pintura seja inspecionada,
qual a probabilidade de encontrarmos:

a) Nenhum defeito na pintura deste carro; b) Pelo menos 1 defeito? c) De 2 a 4 defeitos

95. Sabe-se que em um sistema de transmissão de dados, uma tempestade causa, em média, a falha de transmissão de um
pacote em cada 200. Transmitindo 500 pacotes nestas condições, qual a probabilidade que: (R: 0,7578; 0,0816)

a) No máximo três pacotes não sejam transmitidos b) Todos sejam transmitidos

96. Vazamentos de tanques de gasolina subterrâneos em postos de gasolina podem poluir o meio ambiente. Estima-se que
15% desses tanques apresentam vazamento. Você examina 20 tanques escolhidos ao acaso, independentes entre si.
Qual é a probabilidade de:

a) Zero destes tanques apresente vazamento


b) Menos de 5 apresente vazamento
c) De pelo menos 10 tanques apresentarem vazamento?
d) No máximo 5 tanques apresentarem vazamentos?

16.5 Distribuição Normal

97. Suponha que as medidas da corrente elétrica em pedaço de fio sigam a distribuição Normal, com uma média de 10 mA e
2
uma variância de 4 mA . (mA: miliamperes) (R: 6,68%; 38,29%; 14,1mA)

165
Professor Cledinaldo Castro Araújo

a) Qual a probabilidade de a medida exceder 13 mA?


b) Qual a probabilidade de a medida da corrente estar entre 9 e 11 mA?
c) Determine o valor para o qual a probabilidade de uma medida da corrente estar abaixo desse valor seja 0,9798.
2
98. Se X ~ N (µ;σ ), calcule:

a) P(X≤ µ+2σ) b) P(│X- µ│ ≤ σ) c) O número “a”, tal que P(µ -aσ ≤ X≤ µ+aσ) d) O número “b”, tal que P(X>b) = 90%

99. Uma pessoa necessita tomar um trem que parte dentro de 20 min, podendo chegar a estação optando por dois trajetos:
T1 e T2. Sabe-se que, em T1, o tempo de deslocamento segue uma distribuição normal com média 18 min e desvio padrão
5 mim, e idem para T2, com uma média de 20 min e desvio padrão 2 mim.

a) Qual a melhor escolha de trajeto? b) Se a pessoa sabe que o trem está atrasado 3 min, qual a melhor opção?

100.Os capacitores da marca A têm capacitância média de 49,5 µF com desvio padrão de 1,8 µF, e os da marca B têm vida
média 50,6 µF com desvio padrão 2,5 µF. Em ambos os casos, as capacitâncias seguem modelo normal, e o preço
unitário é também o mesmo. Sendo C0 o valor mínimo desejável para a capacitância, para que valores de C 0 é preferível
os capacitores da marca A? (R: C0 < 46,5 µF).

101.Uma máquina de enlatar sardinha preenche as latas do respectivo produto segundo, aproximadamente, uma
2
distribuição normal com média 160g e variância 16g .

a) Sabendo-se que na lata é informado 150g, qual a probabilidade, aproximada, do produto conter menos do que foi
informado?
b) Qual a probabilidade, aproximada, de uma lata qualquer, tomada aleatoriamente entre os enlatados por essa
máquina, apresentar entre 162g e 172g?
c) Caso a média do peso de sardinha seja regulável, em quanto esta máquina deveria ser regulada para que somente
1% dos enlatados, aproximadamente, contenha menos de 150g?

102.Numa distribuição Normal, 31% dos elementos são maiores que 45 e 8% são maiores que 64. Calcule os parâmetros da
distribuição (média e variância).

103.As lâmpadas fabricadas por uma indústria têm vida média de 2060 h e desvio padrão de 150 h, seguindo uma
distribuição normal. Calcule a probabilidade de:

a) Uma lâmpada queimar com mais de 1900h;


b) Idem, entre 1800 e 1900h;
c) No máximo uma lâmpada, de um conjunto de 4 lâmpadas, pegas ao acaso e com reposição, queimar com mais de
1800h;
d) Exatamente 2 lâmpadas, de um conjunto de 5 lâmpadas, pegas ao caso e com reposição queimarem com menos
de 2060h.

104.Uma fábrica de pneus fez um teste para medir o desgaste dos mesmos e verificou que a duração tem distribuição normal
com média 52.000 km e desvio padrão 2.000 km. Qual a probabilidade de que um pneu escolhido ao acaso, durar mais
de 50.000 Km?

105.O gerente da Loja Consul do “Shopping do Vale do Aço” fez uma coleta aleatória do tempo de permanência de clientes
na fila de pagamento e descobriu que o tempo médio é igual a 6 minutos e o desvio-padrão igual a 1 minuto. Para
diminuir a ansiedade de seus clientes na fila, ele deseja dispor um quadro indicativo com o tempo previsto para o
atendimento. Supondo que este tempo tenha uma distribuição normal, se for disposto que o tempo de atendimento
será de 8 minutos, qual a percentagem máxima de clientes que poderão reclamar com o gerente? (R: 2,28%)

106.A concentração de um poluente em água liberada por uma fábrica tem distribuição N (8;2,25). Qual a chance, de que
num dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm? (0,09) (ppm: partes por milhão)

166
Professor Cledinaldo Castro Araújo
107.Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média 150.000 km e desvio-
padrão de 5.000 km. Qual a probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa firma, tenha um
motor que dure: (R: 0,9999; 0,9759; 135.600 Km)

a) Menos de 170.000 km?


b) Entre 140.000 km e 165000 km?
c) Se a fábrica substitui o motor que apresenta duração inferior à garantia, qual deve ser esta garantia para que a
porcentagem de motores substituídos seja inferior a 0,2%?

108.O diâmetro de um eixo de um drive óptico de armazenagem é normalmente distribuído, com média 0,2508 polegadas e
desvio-padrão de 0,0005 polegadas. As especificações do eixo são 0,2500±0,0015 polegadas. Que proporção de eixos
obedece às especificações? (R: 0,9192)

109.Uma enchedora automática de refrigerantes está regulada para que o volume médio de líquido em cada garrafa seja de
3 3
1000 cm e desvio padrão de 10 cm . Admita que o volume siga uma distribuição normal. (R: 15,9%; 95,44%; 58,04%)
3
a) Qual é a porcentagem de garrafas em que o volume de líquido é menor que 990 cm ?
b) Qual é a porcentagem de garrafas em que o volume de líquido não se desvia da média em mais do que dois
desvios padrões?
c) Se 10 garrafas são selecionadas ao acaso, qual é a probabilidade de que, no máximo, 4 tenham volume de líquido
3
superior a 1002 cm ?

110.Dois estudantes foram informados de que alcançaram as notas padronizadas 0,8 e -0,4 e as notas brutas 88 e 65,
respectivamente, em um exame de múltipla escolha de inglês. Supondo distribuição normal, determinar a média e o
desvio padrão (R: 72; 20)

111.Um avião de turismo de 4 lugares pode levar uma carga útil de 350 kg. Sabe-se que os pesos dos passageiros segue
2 2
N(70Kg; 10Kg ) e os pesos da bagagens N(12Kg; 6Kg ). Determinar: (R: 328 kg; 8 Kg; 0,3%)

a) A média e o desvio padrão para a carga total transportada pelo avião;


b) A probabilidade de haver sobrecarga ao transportar 4 passageiros.

112.Se X é uma v.a. contínua com distribuição N(80; 36), determine o valor de A, B, C e D nos seguintes casos: (R: 68; 69,2;
7,2; 1)

a) P(X>A) = 0,9772 b) P(X<B) = 0,0359 c) P(IX-80I<C) = 0,7698 d) P(80-12D<X<80+12D) = 0,9544

113.Uma peça cromada resiste a um ensaio de corrosão, em média, por três dias e com um desvio padrão de 5 horas.
Supondo distribuição Normal, calcular a probabilidade de uma peça resistir: (R: 0,82%; 0%; 64,72%; 0,82%; 65h; 62,5h)

a) A mais de 3,5 dias b) A mais de 5 dias c) Entre 60 e 84 horas d) A menos de 60 horas e) Se 8,08% das peças
resistem a, no máximo, t1 hora, quanto vale t1? f) Se 97% das peças resistem a, pelo menos, t2 hora, quanto vale
t2?

114.Uma peça de cerâmica é produzida em moldes de gesso. Por problemas de desgaste, calcinação, etc. o molde produz
peças cada vez maiores. As peças têm, em média, 30 cm de diâmetro com desvio padrão de 0,2cm, e são considerados
fora de medida se tiverem mais de 30,5cm. O molde aumenta o diâmetro da peça em 0,004cm a cada moldada. Quantas
vezes devemos utilizar o molde para que a porcentagem de peças fora da medida não ultrapasse 10,03% (R: 61).

115.De acordo com experiências passadas, sabe-se que o tempo de permanência dos usuários no Parque do Cocó (Fortaleza)
2
Segue um modelo aproximadamente Normal com média 90 minutos e variância 100 minutos . Determine as seguintes
probabilidades: (R: 0,3085; 0,3072; 0,0014; 0,9935; 50).

a) Um usuário permanecer menos de 85 minutos;


b) Um usuário permanecer menos de 60 a 85 minutos;
c) Um usuário permanecer entre duas horas e duas horas e meia;
d) Para um grupo de 5 pessoas, a probabilidade de todos eles permanecerem até duas horas;

167
Professor Cledinaldo Castro Araújo
e) O número esperado de usuários que permanecerão até 90 minutos para um grupo de 100 pessoas tomadas ao
acaso.

116.Sabe-se que o diâmetro médio de uma peça é normalmente distribuído com média 50 mm e desvio padrão de 0,4 mm. A
especificação do processo impõe que as peças serão consideradas perfeitas se o diâmetro estiver entre 49,5 mm e 50,5
mm. Peças com diâmetro fora desta faixa são consideradas defeituosas, porém, caso o diâmetro da peça não supere os
limites de especificação por mais de 1 mm, (48,5 a 49,5 mm ou 50,5 a 51,5 mm) a peça pode ser aproveitada como de
segunda qualidade. (R: 45,15%; 451,5)

a) Observando uma peça ao acaso da linha de produção, verifica-se que ela é defeituosa, qual a probabilidade de
que a mesma possa ser classificada como segunda qualidade?.
b) Observando um lote de 1000 peças defeituosas, qual o número esperado de peças que podem ser classificadas
como segunda qualidade?

117.Sabe-se que o contato com o sulfeto de carbono interfere na concentração do ácido xaturênico no corpo humano. A
quantidade de ácido xanturênico excretado na urina de trabalhadores de uma indústria, que usa sulfeto de carbono
como solvente, segue uma distribuição Normal com média 4,38 mg/15ml e desvio padrão 1,15mg/15ml. Determinar: (R:
0,3420; 0,1650; 3,41).

a) A proporção de trabalhadores com quantidade de ácido xanturênico:


i. Entre 2,20 e 4,00 mg/15ml;
ii. Acima de 5,50mg/15ml;
b) Quantidade de ácido xanturênico que é superada por 80% dos trabalhadores (mg/15ml).

118.Um fabricante de baterias sabe, por experiências passadas, que vida média de suas baterias de é 600 dias e desvio
padrão de 100 dias, sendo que a duração tem aproximadamente uma distribuição Normal. Oferece uma garantia de 312
dias, isto é, troca às baterias que apresentarem falhas nesse período. Fabrica 10.000 baterias mensalmente. Quantas
baterias deverão trocar pelo uso da garantia mensalmente? (R: 20)

119.Uma máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com média μ e desvio
padrão 10g. (R: 512,8 g; 0; 0,9544; 12)

a) Em quanto deve ser fixado o peso médio para que apenas 10% dos pacotes tenham menos de 500g?
b) Com a máquina assim regulada, qual é a probabilidade de que o peso de um pacote exceda 600g?
c) Com a máquina assim regulada, qual a porcentagem de pacotes em que o peso não se afasta da média em mais
que dois desvios padrão?
d) Com a máquina assim regulada, para uma amostra de 120 pacotes, qual é o número espera do de pacotes com
menos de 500 g?

120.Um elevador tem suporte máximo de 700 kg para uma lotação de n= 10 pessoas. Sabendo que o peso médio de um
humano é de µ= 62 kg e cujo desvio padrão é igual a σ= 10 kg, responder as seguintes questões, assumindo que o peso
possui distribuição normal: (R: 21,19%; 0,57%)

a) Qual é a probabilidade de uma pessoa pesar mais de70 kg?


b) Qual é a probabilidade de o elevador ter sua carga máxima ultrapassada para um grupo aleatório de n= 10
pessoas que o utilizam?
c) Com base na resposta dada no item (b), você julga que a carga de suporte máximo está bem especificada para
este elevador? Justifique

Sugestão: Defina Y: Peso de 10 pessoas e use as seguintes propriedades:

I. E[X1+X2+...+Xn] = E[X1]+ E[X2]+...+ E[Xn] e


II. V[X1+X2+...+Xn] = V[X1]+ V[X2]+...+ V[Xn], para X1, X2,..., Xn independentes

121.As vendas de determinado produto têm distribuição aproximadamente normal, com média de 500 e desvio padrão de
50. Se a empresa decide fabricar 600 unidades no mês em estudo, qual é a probabilidade de que não possa atender a
todos os pedidos desse mês, por estar com a produção esgotada? (R: 2,28%)

168
Professor Cledinaldo Castro Araújo

122.Sabe-se que a distribuição das rendas (mensais) das famílias de uma comunidade que residem em uma área que será
desapropriada para a construção de um parque ecológico segue um modelo aproximadamente normal com média R$
900,00 e desvio padrão de R$ 100,00. Determine:

a) O percentual de famílias com renda inferior a R$ 1.000,00;


b) O percentual de famílias com renda superior a R$ 1.200,00;
c) O percentual de famílias com renda de R$ 800,00 a R$ 1.000,00;
d) Não há consenso sobre qual critério deve ser adotado como linha de pobreza. O critério mais aceito, no tempo
presente, é o do Banco Mundial, que, em seu Relatório de Desenvolvimento Mundial de 1990 estabeleceu que a
linha de pobreza mundial é de menos de 1 dólar por dia. Considerando o mês comercial de 30 dias, o preço atual
do dólar de R$ 3,40 e que as famílias desta região tem em média 6 pessoas, qual o percentual de famílias na linha
de pobreza?

123.Suponha que as amplitudes de vida de dois aparelhos elétricos D 1 e D2, tenham distribuições N(42; 6) e N(45; 3),
respectivamente. Se o aparelho é para ser utilizado por um período de 45 horas, qual aparelho deve ser preferido? E se
for por um período de 51 horas? (R:50%; 6.68%)

124.O número de pedidos de compra de certo produto que uma cia recebe por semana distribui-se normalmente, com
média 125 e desvio padrão de 25. Se em uma dada semana o estoque disponível é de 150 unidades, qual é a
probabilidade de que todos os pedidos sejam atendidos? Qual deveria ser o estoque para que se tivesse 99% de
probabilidade de que todos os pedidos fossem atendidos? (R: 84,13%; 184)

125.A duração de certo componente eletrônico tem média de 850 dias e desvio padrão de 40 dias. Sabendo-se que a duração
é normalmente distribuída, calcule a probabilidade de um componente durar: (R: 0,9998; 0,8944; 0,0062).

a) Entre 700 e 1.000 dias; b) Mais de 800 dias; c) Menos de 750 dias.

126.Uma pesquisa analisou a satisfação dos usuários do Parque do Cocó sobre vários aspectos, tais como segurança, limpeza,
acessibilidade, conservação, entre outros, por fim uma avaliação global do parque. Esta pesquisa identificou que o nível
de satisfação global dos usuários do Parque do Cocó apresentou escore médio de 7,5 com desvio padrão de 2,0. Para a
análise, foi utilizada a escala Phrase Completion que utiliza critério de graduação similar ao tradicional sistema de notas
escolares /acadêmicas. Além disso, foi montada a tabela de conceitos abaixo para categorizar os níveis de escores para
os conceitos: Péssimo, Ruim, Regular, Bom e Ótimo. Considerando que a distribuição dos escores se enquadra no
modelo normal ou Gaussiano, determine: (R: 0,003; 0,0279; 0,121; 0,1974; 0,2266; 0,3184)

a) O percentual de pessoas que analisam o Parque em cada um dos conceitos;


b) A probabilidade de uma pessoa considerar o parque bom ou regular

Escala de Conceito:
Escore ≤2 3a4 5a6 7a8 ≥9
Conceito Péssimo Ruim Regular Bom Ótimo

127. A unidade de ensacamento de uma fábrica de cimento é pressuposto encher os sacos com um peso médio de µ=50 kg. É
obvio que nem todos os sacos ficam exatamente com a quantidade 50 kg, havendo alguns que ficam com mais, outros
que ficam com menos cimento, devido a diversos fatores aleatórios que ocasionam variabilidade no processo. Um
2 2
estudo desta variabilidade ou dispersão quantificou a variância do processo em σ =0,25 kg ou desvio padrão de 0,5 kg.
2 2
Admitindo-se que o processo de ensacamento segue a lei de distribuição Normal com média µ=50 kg e σ =0,25 kg (X~N
(50; 0,25)). Calcule a probabilidade de um saco, selecionado aleatoriamente, contenha: (R: 47,72%; 34,13%; 95,44%;
0,13%; 0,62%; 15,74%; 0,26%; 683; (X ε [49,18; 50,82])

a) Entre 50 kg e 51 kg b) Entre 49,5 kg e 50 kg c) Entre 49 kg e 51 kg d) Acima de 51,5 kg e) Abaixo de 48,75 kg


f) Entre 50,5 kg e 51,5 kg g) Abaixo de 48,5 kg ou acima de 51,5 kg h) Em 1.000 sacos saídos desta unidade de
ensacamento, quantos serão esperados com peso entre 40,5 kg e 51,5 kg? i) Calcule os limites, inferior e
superior, do intervalo central onde existem 90% dos sacos saídos desta linha de ensacamento.

169
Professor Cledinaldo Castro Araújo

16.6 Distribuições Amostrais


128.O diâmetro de mancais produzidos por um processo de manufatura é uma variável aleatória normalmente distribuída
com a média de 4,035 mm e desvio-padrão de 0,005 mm. O procedimento de inspeção requer uma amostra de 25
mancais a cada hora. Determinar:

a) A distribuição amostral da média;


b) Dentro de qual intervalo deveriam cair 95% dos diâmetros?

129.O controle tecnológico do concreto é essencial em todas as obras que utilizam o concreto armado. Em muitos casos é
deixado de lado por ser considerado caro, ou então por falta de esclarecimento da importância de controlar a qualidade
dos materiais que são utilizados em obra. Sobre o controle tecnológico do concreto, alguns parâmetros são
considerados, tais como a resistência à compressão simples, denominada fc, que é uma característica mecânica muito
importante. Para estimá-la em um lote de concreto, são moldados corpos de prova para ensaio segundo a NBR 5738
(Moldagem e cura de corpos de prova cilíndricos ou prismáticos de concreto). O ensaio é realizado segundo a NBR 5739
(Ensaio de compressão de corpos de prova cilíndricos) para corpos de prova padrão de formato cilíndrico de 150 mm de
diâmetro por 300 mm de altura. O tempo de cura é de 28 dias.

Curva de Gauss para a resistência do concreto à compressão

Fonte: http://www.fec.unicamp.br

O fcm é a média aritmética dos valores de fc para o conjunto de corpos de prova ensaiados. O fck é a resistência
característica do concreto a compressão e é utilizado no cálculo estrutural. O valor de fck delimita os 95% maiores valores
de compressão de concretos. Dessa forma, há uma garantia de que 95% do concreto utilizado na obra tenha resistência
maior do que a resistência característica, fc > fck. Para um valor médio de compressão de 45,0 mPa e desvio padrão 9,0
mPa, calcule:

a) De uma amostra de 12 cilindros de concreto ter resistência mínima de 41,5 mPa;


b) De uma amostra de 12 cilindros de concreto ter resistência média entre 33,5 mPa e 44,7 mPa;

16.7 Amostragem e Estimação

130.Uma pesquisa será conduzida para uma população composta de 600 empresas, das quais 50 são grandes, 200 médias e
350 são pequenas. Além disso, todas as grandes, 80% das médias e 20% das pequenas são do ramo indústria, as demais
são do ramo serviços. Determine:

a) O tipo de amostragem adequada, considerando que a análise não é influenciada nem pelo porte e nem pelo ramo
de atividade;
b) O tipo de amostragem adequada, considerando que a análise é influenciada tanto pelo porte quanto pelo ramo de
atividade;
c) A configuração de uma amostra composta por 20% destas empresas estratificada pelo porte;
d) A configuração de uma amostra composta por 10% destas empresas estratificada pelo ramo;

131.Uma das grandes necessidades das empresas atualmente é o estabelecimento de uma sistemática que permita a
melhoria continua dos produtos, aumento da produtividade e redução de custos, no sentido de se manterem
competitivas no mercado globalizado. Esses objetivos podem ser alcançados, por exemplo, pela Gestão da Qualidade
Total (GQT). Um cenário comum nas empresas cearenses é não utilização ou utilização inadequada das ferramentas da

170
Professor Cledinaldo Castro Araújo
qualidade. Com o objetivo de abordar esta problemática, uma pesquisa foi realizada em 2010 com 90 indústrias
cearenses, das quais 34 indicaram não utilizar nenhum programa formal de qualidade. Para a pesquisa, responda as
questões a seguir utilizando α= 5%:

a) Determine o erro de estimativa da pesquisa;


b) Determine o intervalo de confiança para a verdadeira proporção de empresas industriais que não utilizam
programas de qualidade;
Ciclo PDCA

132.Explique quando se deve utilizar a distribuição t –Student

133.Deseja-se estimar o diâmetro médio dos parafusos produzidos por uma fábrica. Para esta finalidade extraiu-se uma
amostra de 30 parafusos da produção e os mesmos apresentaram os seguintes diâmetros (mm):

10,0 11,0 11,0 11,0 12,0 12,0 12,0 12,0 13,0 13,0
13,0 13,0 13,0 13,0 13,0 13,0 13,0 13,0 13,0 13,0
14,0 14,0 14,0 14,0 14,0 15,0 15,0 15,0 16,0 16,0
Responda as questões a seguir:

a) Determine as estimativas de µ e σ;
b) Construa intervalos de confiança de 95% e 99% para o diâmetro dos parafusos produzidos pela fábrica. (R: 12,6
mm << 13,6 mm; 12,4mm<<13,8mm)

134.Um pesquisador precisa determinar o tempo médio gasto para perfurar três orifícios em uma peça de metal. Qual deve
ser o tamanho da amostra para que a média amostral esteja a menos de 15 seg da média populacional? Por experiência
prévia, pode-se supor o desvio padrão em torno de 40 seg. Considere também, que a estimação será realizada com nível
de confiança de 95%. (R: n=28)

135.Uma unidade fabril da Intel produziu 500.000 chips Pentium IV em certo período. São selecionados, aleatoriamente, 400
chips para testes.

a) Supondo que 20 chips não tenham a velocidade de processamento adequada, construir o intervalo de confiança
para a proporção de chips adequados. Use nível de confiança de 95%. (R: 95%  2,1%)
b) Verificar se essa amostra é suficiente para obter um intervalo de 99% de confiança, com erro amostral máximo de
0,5%, para a proporção de chips adequados. Caso contrário, qual deveria ser o tamanho da amostra? (R:
n=12.298)

136.Um analista de sistemas está avaliando o desempenho de um novo programa de análise numérica. Forneceu como
entrada do programa 14 operações similares e obteve os seguintes tempos de processamento (em milissegundos):

12,0 13,5 16,0 15,7 15,8 16,5 15,0


13,1 15,2 18,1 18,5 12,3 17,5 17,0

a) Calcule a média e o desvio padrão da amostra do tempo de processamento. (R: 15,44; 2,07)
b) Construir um intervalo de confiança para o tempo médio de processamento, com nível de confiança de 95%. (R:
15,44  1,09)
c) c) Qual deve ser o tamanho da amostra para garantir um erro amostral máximo de 0,5 milissegundos, na

171
Professor Cledinaldo Castro Araújo
estimação do tempo médio de processamento, com nível de confiança de 99%? (R: n=144)

137.Seja a construção de um plano para garantir a qualidade dos parafusos vendidos em caixas com 100 unidades. Um dos
requisitos é controlar o comprimento médio dos parafusos. Quer-se saber quantos parafusos deve-se examinar em cada
caixa, para garantir que a média amostral (𝑋) não difira do comprimento médio dos parafusos da caixa (μ) em mais que
0,8 mm. Considere que a estimação seja realizada com nível de confiança de 95%. Análises feitas na linha de produção
2
indicam variância em tomo de 2 mm . (R: n=11).

138.Uma empresa que trabalha com manutenção ar condicionado apresenta uma carteira de 500 clientes empresas. Qual
deveria ser o tamanho da amostra suficiente para um erro máximo de 5% e com significância de α = 5%?

139.Uma firma está convertendo as máquinas que aluga para uma versão mais moderna. Até agora foram convertidas 40
máquinas. O tempo médio de conversão para as máquinas já convertidas foi de 24 horas, com desvio padrão de 3 horas.
Determine:

a) O erro de estimativa para o tempo médio de conversão;


b) Um intervalo de 98% de confiança para o tempo médio de conversão.

140.A polícia rodoviária fez recentemente uma pesquisa secreta sobre as velocidades desenvolvidas na rodovia no período
de 2 às 4 horas da madrugada. No período de observação 50 carros passaram por um aparelho de radar a uma
velocidade média de 70 km/h, com desvio padrão de 15 km/h.

a) Estime a verdadeira média (pontual) da população


b) Construa um intervalo de 99% de confiança para a média da população

141.Em uma amostra de 200 eleitores, 114 são favoráveis a determinado projeto de lei. Com base nessas informações,
determinar:

a) Um IC, com α = 4,56%, para a proporção de pessoas favoráveis ao projeto de lei;


b) O nível de confiança, se o IC for dado por [0,52; 0,62], com n=400;
c) A amostra n necessária, para um IC [0,54; 0,60], com α = 4,56%.

142.As válvulas fabricadas por uma indústria possuem desvio padrão 100 h. Retirando-se aleatoriamente 400 válvulas entre
as 50.000 produzidas, obtêm-se para vida média 800 h. Com base nessas informações, determinar:

a) Um IC, com α = 2,78% para a média populacional;


b) Com qual confiabilidade dir-se-ia que o intervalo 800 ± 9,8 contém a média µ ?
c) O tamanho n da amostra para obtermos um IC 800 ± 8 com α = 5%

143.Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos favoráveis a certa proposta de horário de
trabalho. Qual deve ser o tamanho da amostra aleatória simples que garanta um erro amostral não superior a 5%?

144.Uma entrevista revelou que 50 dentre 80 pessoas consumiriam determinado produto se o mesmo fosse lançado no
mercado. Qual é o tamanho da amostra, para estimar a proporção de pessoas que consumiriam o produto, com erro
máximo de 2%, admitindo-se um nível de confiança de 95%? (R: 2.251 pessoas).

145.O valor de face dos títulos depositados em um banco para cobrança simples tem distribuição normal com variância 400
2
(u.m.) . Uma amostra de 10 títulos escolhidos ao acaso forneceu os seguintes valores: (𝑅: 𝑃(10,93 < 𝑋 < 121,67) = 0,90)

80, 120, 71, 120, 140, 200, 180, 70, 45, 87.

a) Qual é o intervalo de confiança de 90% para o valor médio dos títulos da carteira? O responsável pela carteira
afirma, com 95% de confiança, que o valor médio dos títulos é de 125. Ele pode estar correto?

146.Os dados abaixo referem-se as alturas das pessoas que participaram de uma pesquisa sobre dimensionamento e
ergonomia de móveis domésticos. Sobre os dados, responda as questões a seguir:

172
Professor Cledinaldo Castro Araújo
Distribuição das alturas (m) – Fortaleza - 2016

410

220
184

90 80
6 10

1,40 I---1,50 1,50 I---1,60 1,60 I---1,70 1,70 I---1,80 1,80 I---1,90 1,90 I---2,00 2,00 I---I2,10

Fonte: Pesquisa do autor

a) Determine as estimativas pontuais da média e desvio padrão (µ e σ);


b) Obtenha um intervalo de confiança para a verdadeira média das alturas;

147.A Pesquisa de Satisfação tem como objetivo conhecer a opinião de seus consumidores e clientes a respeito dos serviços
prestados por sua empresa. Dessa forma é possível descobrir a imagem passada pela companhia em cada um dos pontos
de contato com seus clientes, gerando relatórios específicos para as diversas áreas de atuação como SAC, Vendas, Pós
Vendas, Atendimento Pessoal, Atendimento Online, entre outros. Uma pesquisa levada à 200 usuários de um produto
em uma cidade, 40 se mostraram insatisfeitos com o produto. Sobre a pesquisa, responda as questões a seguir. Use α =
5%. (R: 20%; 5,54%; P(14,46% ≤ µ≤ 25,54%)=95%; 400)

a) Determine a estimativa pontual para o percentual de clientes insatisfeitos;


b) Determine o limite do erro de estimativa;
c) Determine IC (intervalo de confiança) para a verdadeira proporção de clientes insatisfeitos;
d) Considerando uma carteira de 1.500 clientes, qual deveria ser o tamanho da amostra para que se estivesse
confiante que o erro de estimativa não excedesse 4%? Considere que você está no inicio da pesquisa e não será
utilizada amostra piloto.

148.As estruturas metálicas espaciais de cobertura apresentam aspectos diferenciados de projeto. Existem diversos arranjos
geométricos possíveis para estas estruturas, cuja escolha está associada, entre outros fatores, às formas e dimensões do
contorno, aos pontos de apoio e aos sistemas de conexões empregados. O emprego desse tipo de estrutura contribui
para redução do tempo de execução de obras e com excelente desempenho de custos. Tal desempenho está relacionado
à tecnologia dos materiais e configurações utilizados nas estruturas. Uma viga, fabricada com determinada liga metálica,
2
apresenta tensão de ruptura média igual a 45 kgf/mm . Uma amostra de 25 unidades, tomada após uma modificação no
2 2
processo de fabricação, mostrou tensão de ruptura média igual a 46,8 kgf/mm e desvio padrão 7 kgf/mm .

a) O erro de estimativa para a tensão de ruptura média após a modificação. Use α=5%.
b) Um intervalo de 95% de confiança para a tensão de ruptura média da viga após a modificação;
2
c) O tamanho da amostra necessário para um erro máximo de 0,85 kgf/mm . Use α=5%.

149.A gestão de Saúde e Segurança do Trabalho (SST) do setor de construção civil tem um grande desafio: melhorar os
índices de acidentes deste setor. O setor é, até hoje, um dos que ostenta os índices mais trágicos em relação aos
acidentes de trabalho. Essa realidade está relacionada à qualidade e a utilização dos Equipamentos de Proteção
Individual (EPI), bem como a participação efetiva dos trabalhadores nos programas de SST, por exemplo: o PPRA
(Programa de Prevenção de Riscos Ambientais).Suponha que o SESI - Serviço Social da Indústria realizou uma pesquisa
por amostragem tendo foco as empresas cearenses que não utilizam efetivamente os programas de SST. A amostra
utilizada foi de 400 empresas, destas 120 não tenham ou não utilizavam os programas de SST. Sobre a pesquisa,
responda as questões a seguir:

a) Determine a estimativa pontual da verdadeira proporção de empresas que não tinham ou não utilizavam
programas de SST;
b) Determine o erro de estimativa da pesquisa. Use α = 4,56%

16.8 Análise de Correlação e Regressão

173
Professor Cledinaldo Castro Araújo
150.Os dados a seguir provêm de um experimento para testar o desempenho de uma máquina industrial. O experimento
utilizou uma mistura de óleo diesel e gás, derivados de materiais destilados orgânicos. O valor da capacidade da máquina
em cavalo vapor (HP) foi coletado a diversas velocidades medidas em rotações por minuto (rpm×100).

X Y X Y X Y X Y
22 64,03 15 46,85 18 52,9 15 45,79
20 62,47 17 51,17 16 48,84 17 51,17
18 54,94 19 58 14 42,74 19 56,17
16 48,84 21 63,21 12 36,63 21 62,61
14 43,73 22 64,03 10,5 32,05 23 65,31
12 37,48 20 62,63 13 39,68 24 63,89

Onde: X = velocidade e Y = capacidade


Admitindo-se que as variáveis X e Y estão relacionadas de acordo com o modelo Yi=β0+β1Xi +ei, pede-se:

a) Obter a equação ajustada e traçar seu gráfico. Mostre também o diagrama de dispersão;
b) Calcule o coeficiente de determinação e interprete;
c) Interprete a estimativa obtida para β1;
d) Determine a estimativa de Y para X = 15,5;
e) Monte a tabela de Análise de variância (ANOVA)

151.Uma cadeia de supermercados financiou um estudo dos gastos realizados por família de quatro pessoas com renda
mensal líquida entre oito e vinte salários mínimos. A pesquisa levou a equação de regressão 𝑌̂𝑖 = −1,2 + 0,4𝑋𝑖 , onde
𝑌̂𝑖 representa a despesa mensal estimada através do modelo e X a renda mensal líquida expressa em numero de salários
mínimos.

a) Estime a despesa mensal de uma família com renda líquida mensal de 15 salários mínimos.
b) A equação parece sugerir que uma família com renda mensal de 3 salários mínimos nada gasta com mercadorias.
O que você tem a dizer sobre isso?
c) A equação em questão serve para estimar a despesa mensal de uma família de 5 pessoas com renda líquida de 12
salários mínimos? Justifique.

152.Um reator químico é um dos equipamentos de grande importância em indústrias químicas onde grande variedade de
engenheiros, além do químico, podem atuar: engenheiros mecânicos, eletricistas, civis, ambientais e de produção. A
figura 1 mostra um reator químico gigante sendo transportado, tal equipamento é utilizado na indústria petroquímica.
Um engenheiro químico estuda o efeito da temperatura (°C) de reação de operação do processo sobre o resultado de
rendimento (%) da reação. Os resultados estão na tabela abaixo: (Hines, Montgomery, Goldsman e Borror Probabilidade e Estatística
na Engenharia. 2012).

Temperatura (°C) 100 110 120 130 140 150 160 170 180 190
Rendimento (%) 45 51 54 61 66 70 74 78 85 89

a) Faça o diagrama de dispersão;


b) Encontre a equação entre os parâmetros rendimento e temperatura;
c) Calcule o coeficiente de determinação;
d) Qual seria o valor estimado de rendimento para uma temperatura de 155 °C?
e) Qual seria o valor estimado de rendimento para uma temperatura de 200 °C?
f) Qual a taxa de variação estimada entre o rendimento em relação a variação da temperatura?

153.Uma empresa que produz bens de alta tecnologia está preocupada com a produtividade de funcionários que exercem
funções repetitivas e procura descobrir como algumas variáveis podem influenciar no rendimento dessas pessoas.
Para isso implementa em cada uma de suas três fábricas um programa específico: alimentação especial sugerida
pelos nutricionistas; intervalos para exercícios de relaxamento sugerido pelos fisioterapeutas; rodízio de funções
sugerido pelos psicólogos. A tabela a seguir mostra o resultado da produtividade para diversos níveis implementados
no programa.

174
Professor Cledinaldo Castro Araújo

Produtividade (menor=100%) 100 102 105 108 112 120


Alimentação (frequência semanal) 4 5 1 3 6 2
Exercícios (frequência semanal) 1 3 2 4 5 6
Rodízio (frequência semanal) 3 1 2 6 4 5

a) Construa o diagrama de dispersão da produtividade contra cada uma das variáveis explicativas. Qual variável
parece manter melhor correlação com a produtividade?
b) Calcule o coeficiente de correlação linear de Pearson nos três casos. O coeficiente confirma a impressão visual dos
diagramas?

154.Foi realizada uma análise de regressão para investigar a existência de ralação linear simples entre a temperatura
superficial de uma estrada (X) medida em graus F e a deformação da pavimentação (Y) medida segundo uma técnica
especial. Baseado nas seguintes informações pede-se:

yi12,75; y2i 8,86; xi1.478; x2i 143.215,8; e xiyi1.083,67


n n n n n
n = 20;
i1 i1 i1 i1 i1
a) Calcule as estimativas dos parâmetros da regressão. Apresente a equação ajustada em um gráfico;
b) Use a equação para estimar qual deformação haveria na pavimentação quando a temperatura superficial fosse de
85 graus F.
c) Qual seria a mudança esperada na deformação da pavimentação para uma mudança de 1º F na temperatura
superficial?
d) Teste a validade do modelo obtido.

𝛽
155.Admita que as variáveis Z e W estão relacionadas de acordo com o modelo 𝑊𝑖 = 𝜃𝑍𝑖 𝜀𝑖 , onde os 𝜀𝑖 são erros
multiplicativos tais que 𝑢𝑖 = 𝑙𝑜𝑔𝜀𝑖 são variáveis aleatórias independentes com distribuição normal de média zero e
variância 𝜎 2 . É dada a seguinte amostra com 5 pares de valores: (R: 2,297; 0,5; 0,1; 0,893).

𝑍𝑖 𝑊𝑖
8 8
64 16
16 8
4 4
32 16
a) Que anamorfoses devem ser aplicadas para que se obtenha o modelo regressão linear simples?
b) Obtenha as estimativas de 𝜃 𝑒 𝛽;
c) Determine a estimativa não tendenciosa de 𝜎 2 ,
d) Calcule o coeficiente de determinação da regressão.

156. Na sua forma mais simples o modelo estatístico da curva de Pareto é:


𝜃
𝑊𝑖 = 𝛾 𝜀𝑖
𝑍𝑖
Onde 𝑊𝑖 é o número de pessoas renda igual ou maior do que 𝑍𝑖 , 𝜃 𝑒 𝛾 são parâmetros e 𝜀𝑖 são erros multiplicativos.
Com base nos seguintes abaixo, determine: (R: 602.249; 1,8; 0,953).

a) As estimativas de 𝜃 𝑒 𝛾 b) o coeficiente de determinação

𝑍𝑖 𝑊𝑖
1 262.144
4 65.536
16 16.384
64 256
256 16

175
Professor Cledinaldo Castro Araújo

BIBLIOGRAFIA
 BUSSAB, W. DE O.; MORETIN, P. A. Estatística Básica. 5 ed. São Paulo: Saraiva, 2003.

 COSTA NETO, P. L. DE O. Estatística. 2 ed. São Paulo: Edgar Blucher, 2002.

 Douglas C. Montgomery &amp; George C. Runger &amp; Norma Faris Hubele . Estatística Aplicada à
Engenharia. 2ª Edição. LTC.

 FARIAS, A.A.; CESAR, C.C.; SOARES, J.F. Introdução à Estatística. 2 ed. LTC, 2003.

 FERREIRA, D. F. Estatística Básica. Lavras: UFLA, 2005.

 FONSECA, J. S.; MARTINS, G. A. Curso de Estatística. 4. ed. São Paulo: Atlas, 1994.

 FREUND, John E.; SIMON, Gary A. Estatística aplicada – economia, administração e contabilidade. Porto
Alegre: Bookman, 2000.

 MAYER, P. L. Probabilidade: Aplicações à Estatística. 2 ed. Rio de Janeiro: LTC, 2000.

 SPIEGEL, Murray R. Estatística. 4 ed. São Paulo: Makron, 1994.

 TRIOLLA, M.F. Introdução à Estatística. 7 ed. Rio de Janeiro: LTC, 1999.

 Douglas C. Montgomery &amp; George C. Runger &amp; Norma Faris Hubele . Estatística Aplicada à
Engenharia. 2ª Edição. LTC.

 William Navidi. Probabilidade e Estatística para Ciências Exatas. Editora MCgraw Hill, 2012

 Associação Brasileira de Normas Técnicas. ABNT NBR 5891:1977. Regras de arredondamento na


numeração decimal. 1ª ed., 1p., ABNT, 1977.

 TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística Básica. 2. ed. São Paulo: Atlas, 1985.

 STEVENSON, William J. Estatística aplicada à administração, São Paulo: Harbra, 1981

 LIMA, Paulo Demétrio Silva. Nota de Aula – Trabalhando com Números.

 Hoffman, Rodolfo. Regressão Linear – Introdução à Econometria. Edição do Autor, 2016.

176
Professor Cledinaldo Castro Araújo

APENDICES
1. Demonstração da expressão da Moda para Dados Agrupados em classes:

Para valores agrupados em uma distribuição de frequências pode-se aplicar a fórmula obtida a seguir. Suponha-se
que a figura 1, a seguir, represente parte do histograma de uma distribuição de frequências cujo valor modal
deseja-se calcular. O retângulo mais alto representa a classe modal, isto é, a de maior frequência.

O valor modal, Mo, coincide com I’, abscissa do ponto I, que é a intersecção dos segmentos AD e BC. Os triângulos
AIC e BID são semelhantes. Então:

∆1 . ℎ
𝑀𝑜 = 𝐿𝑖 +
∆1 + ∆2
Onde:
 Li: limite inferior da classe modal;
 ∆1 : Diferença entre frequência simples da classe modal e da classe anterior;
 ∆2 : Diferença entre frequência simples da classe modal e da classe posterior;
 h: amplitude de classe.

2. Demonstração da expressão da Mediana para Dados Agrupados em classes:


Para valores agrupados em uma distribuição de frequências pode-se aplicar a fórmula obtida a seguir.

177
Professor Cledinaldo Castro Araújo
Suponha-se que a figura 2, a seguir, represente o histograma de uma distribuição de frequências cujo valor
Mediano deseja-se calcular. Temos que, por hipótese, a distribuição dos valores dentro dos intervalos é
uniforme, o método trata de interpolar o valor da mediana proporcionalizando a largura do intervalo com a
frequência. Assim:

Temos então que fmd está h, assim como (n/2 - 𝒇𝒂𝒄 ↑) está para (Md - li), assim:

𝑛 𝑛 𝑛
𝑓𝑚𝑑 (2 − 𝑓𝑎𝑐 ↑) ( − 𝑓𝑎𝑐 ↑) . ℎ ( − 𝑓𝑎𝑐 ↑) . ℎ
= ⇒ 𝑀𝑑 − 𝑙𝑖 = 2 ⇒ 𝑀𝑑 = 𝑙𝑖 + 2
ℎ (𝑀𝑑 − 𝑙𝑖) 𝑓𝑚𝑑 𝑓𝑚𝑑
Onde:

 li: limite inferior da classe mediana;


 𝑓𝑎𝑐 ↑: frequência acumulada da classe anterior à classe mediana;
 fmd: frequência absoluta da classe mediana.
 h: amplitude de classe.

3. Demonstração da Esperança e Variância da Binomial

Função de probabilidade: 𝑃(𝑋 = 𝑥) = (𝑛𝑥). 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥 , 𝑥 = 0, 1, 2, 3, … , 𝑛

Esperança da Binomial:

Partindo do caso geral da Esperança de uma variável aleatória:

𝐸[𝑋] = ∑𝑋 𝑥. 𝑃(𝑋 = 𝑥), temos que:


𝑛 𝑛
𝑛 𝑛!
𝐸[𝑋] = ∑ 𝑥. ( ) . 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥 = ∑ 𝑥. . 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥
𝑥 𝑥! (𝑛 − 𝑥)!
𝑥=0 𝑥=1

Como a primeira parcela (x=0) é zero, podemos iniciar o somatório a partir de 1, em seguida dar um passo no
fatorial e somar e subtrair 1 no expoente de p para completar um binômio de Newton, assim:
𝑛
𝑛(𝑛 − 1)!
𝐸[𝑋] = ∑ 𝑥. . 𝑝 𝑥−1+1 . (1 − 𝑝)𝑛−𝑥 =
𝑥(𝑥 − 1)! (𝑛 − 𝑥)!
𝑥=1

178
Professor Cledinaldo Castro Araújo
𝑛
𝑛(𝑛 − 1)!
𝐸[𝑋] = 𝑛𝑝 ∑ . 𝑝 𝑥−1 . (1 − 𝑝)𝑛−𝑥 = 𝑛𝑝(𝑝 + 1 − 𝑝)𝑛−1 = 𝑛𝑝. (1)𝑛−1
(𝑥 − 1)! (𝑛 − 𝑥)!
𝑥=1

𝐸[𝑋] = 𝑛. 𝑝

Variância da Binomial

Partindo do caso geral da Variância de uma variável aleatória𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 , temos: Já temos
𝐸[𝑋] = 𝑛. 𝑝, falta encontrar 𝐸[𝑋 2 ], assim:
𝑛
𝑛
𝐸[𝑋 2 ] = ∑ 𝑥 ´2 ( ) . 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥
𝑥
𝑥=0

Escrevendo x2=x(x-1)+x (momento fatorial), temos:


𝑛
2]
𝑛
𝐸[𝑋 = ∑[(𝑥(𝑥 − 1) + 𝑥] ( ) . 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥
𝑥
𝑥=0

𝑛 𝑛
2]
𝑛 𝑛
𝐸[𝑋 = ∑ 𝑥(𝑥 − 1) ( ) . 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥 + ∑ 𝑥 ( ) . 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥
𝑥 𝑥
𝑥=0 𝑥=0

Analisando por partes, temos:

Parcela I: ∑𝑛𝑥=0 𝑥(𝑥 − 1)(𝑛𝑥). 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥

Parcela II: ∑𝑛𝑥=0 𝑥(𝑛𝑥). 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥

Temos que a segunda parcela corresponde à esperança, ou seja, np. Operando apenas com a primeira, temos:
𝑛 𝑛
𝑛 𝑛(𝑛 − 1)(𝑛 − 2)!
∑ 𝑥(𝑥 − 1) ( ) . 𝑝 𝑥 . (1 − 𝑝)𝑛−𝑥 = ∑ 𝑥(𝑥 − 1) . 𝑝 𝑥−2+2 . (1 − 𝑝)𝑛−𝑥
𝑥 𝑥(𝑥 − 1)(𝑥 − 2)! (𝑛 − 𝑥)
𝑥=0 𝑥=2

As duas primeiras parcelas do somatório são nulas (x=0 e x=1), podemos então iniciar o somatório a partir do
terceiro (x=2), abrir o fatorial de n até n-2 e somar e subtrair 2 no expoente de p para completar o binômio de
Newton, assim:

𝑛−2
2
(𝑛 − 2)!
= 𝑛(𝑛 − 1)𝑝 ∑ . 𝑝 𝑥−2 . (1 − 𝑝)𝑛−𝑥
(𝑥 − 2)! (𝑛 − 𝑥)
𝑥−2=0

= 𝑛(𝑛 − 1)𝑝2 (𝑝 + 1 − 𝑝)𝑛−2 = 𝑛(𝑛 − 1)𝑝2 (1)𝑛−2 = 𝑛(𝑛 − 1)𝑝2

Retornado os valores de I e II, temos:

𝐸[𝑋 2 ] = 𝑛(𝑛 − 1)𝑝2 + 𝑛𝑝

𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 = 𝑛(𝑛 − 1)𝑝2 + 𝑛𝑝 − (𝑛𝑝)2

179
Professor Cledinaldo Castro Araújo
Colocando np em evidência, temos:

𝑉[𝑋] = 𝑛𝑝[(𝑛 − 1)𝑝 + 1 − 𝑛𝑝] = 𝑛𝑝[𝑛𝑝 − 𝑝 + 1 − 𝑛𝑝] = 𝑛𝑝(1 − 𝑝), 𝑓𝑖𝑛𝑎𝑙𝑚𝑒𝑛𝑡𝑒:

𝑉[𝑋] = 𝑛. 𝑝. (1 − 𝑝)

4. Demonstração da Esperança e Variância da Poisson

𝑒 −λ .λ𝑥
Função de probabilidade: 𝑃(𝑋 = 𝑥) = , 𝑥 = 0, 1, 2, 3, … , ∞
𝑥!

Esperança da Poisson:

Partindo do caso geral da Esperança de uma variável aleatória:

𝐸[𝑋] = ∑𝑋 𝑥. 𝑃(𝑋 = 𝑥), temos que:

∞ ∞
𝑒 −λ λ𝑥 𝑒 −λ λ𝑥−1+1
𝐸[𝑋] = ∑ 𝑥 = ∑𝑥
𝑥! 𝑥(𝑥 − 1)!
𝑥=0 𝑥=1

Como a primeira parcela do somatório é nula, podemos iniciar da segunda (x=1), desta forma podemos
simplifica x com x!. Além disso, podemos somar e subtrair 1 do expoente de λ, assim:
∞ ∞
𝑒 −λ λ𝑥−1+1 λ𝑥−1
𝐸[𝑋] = ∑ 𝑥 = 𝑒 −λ λ ∑
𝑥(𝑥 − 1)! (𝑥 − 1)!
𝑥=1 𝑥=1
De acordo com a série de Taylor, temos que:

𝑘
𝑘 0 𝑘1 𝑘 2 𝑘𝑖
𝑒 = + + +⋯=∑
0! 1! 2! 𝑖!
𝑖=0

Fazendo y= x-1, temos:

∞ ∞
λ𝑥−1 λ𝑦
∑ =∑ = 𝑒λ
(𝑥 − 1)! 𝑦!
𝑥−1=0 𝑦=0

Logo:

−λ
λ𝑥−1
𝐸[𝑋] = 𝑒 λ∑ = 𝑒 −λ λ𝑒 λ = λ𝑒 0 = λ ⇒ 𝐸[𝑋] = λ
(𝑥 − 1)!
𝑥=1

Variância da Poisson:

Partindo do caso geral da Variância de uma variável aleatória𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 , Já temos a expressão
para a esperança, falta para 𝐸[𝑋 2 ], assim:

180
Professor Cledinaldo Castro Araújo

2]
𝑒 −λ . λ𝑥
𝐸[𝑋 = ∑ 𝑥2
𝑥!
𝑥=0

Análogo ao que foi realizado com a variância da Binomial, podemos escrever 𝑥 2 = 𝑥(𝑥 − 1) + 𝑥, temos:
∞ ∞ ∞
2]
𝑒 −λ . λ𝑥 𝑒 −λ . λ𝑥 𝑒 −λ . λ𝑥
𝐸[𝑋 = ∑[𝑥(𝑥 − 1) + 𝑥] = ∑ 𝑥(𝑥 − 1) + ∑𝑥
𝑥! 𝑥! 𝑥!
𝑥=0 𝑥=0 𝑥=0

Analisando por partes, temos:



𝑒 −λ . λ𝑥
Parcela I: ∑ 𝑥(𝑥 − 1)
𝑥!
𝑥=0

𝑒 −λ . λ𝑥
Parcela II: ∑ 𝑥
𝑥!
𝑥=0

Temos que a segunda parcela corresponde à esperança, ou seja, λ. Trabalhando com a primeira parcela:
∞ ∞
𝑒 −λ . λ𝑥 𝑒 −λ−2+2 . λ𝑥
∑ 𝑥(𝑥 − 1) = ∑ 𝑥(𝑥 − 1)
𝑥! 𝑥(𝑥 − 1)(𝑥 − 2)!
𝑥=0 𝑥=2

Como a primeira e segunda parcela são nulas (x=0 e x=1), podemos iniciar o somatório da terceira (x=2),
abrindo também o fatorial de x até x-2 e somando-se e subtraindo-se 2 do expoente de λ, temos:
∞ ∞
𝑒 −λ . λ𝑥−2+2 λ𝑥−2
∑ 𝑥(𝑥 − 1) = λ2 𝑒 −λ ∑
𝑥(𝑥 − 1)(𝑥 − 2)! (𝑥 − 2)!
𝑥=2 𝑥=2

Utilizando mais uma vez o argumento da série de Taylor e fazendo z=x-2, temos:
∞ ∞ 𝑧
λ𝑥−2 λ
∑ = ∑ = 𝑒λ
(𝑥 − 2)! 𝑧!
𝑥−2=0 𝑦=0

Logo:

−λ 2
λ𝑧
𝐸[𝑋] = 𝑒 λ ∑ = 𝑒 −λ λ2 𝑒 λ = λ2 𝑒 0 = λ2
𝑧!
𝑧=0

Retornado as parcelas I e II, temos:

𝐸[𝑋 2 ] = λ2 + λ, Finalmente:

𝑉[𝑋] = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 = λ2 + λ − ( λ)2 = λ ⇒ 𝑉[𝑋] = λ

5. Verificação da Convergência

𝑛−𝑘 𝑛
 
lim (1 − ) = lim (1 − ) = 𝑒 −
𝑛→∞ 𝑛 𝑛→∞ 𝑛

181
Professor Cledinaldo Castro Araújo
Segue um exemplo de convergência para  = 5

Tabela 2 – Simulação para 𝝀 = 𝟓

6. Graus de Liberdade na variância amostral


Uma questão bastante levantada nos cursos básicos de estatística é a diferença entre as expressões do
cálculo da variância amostral e populacional.

Variância Amostral Variância Populacional

∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2 ∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝑆2 = 𝜎2 =
𝑛−1 𝑁
O questionamento recai sobre a o denominador amostra ser “n-1”. A razão do “-1” ou grau de liberdade se
relaciona com três fatos:

 A expressão 𝑆 2 é estimador coerente ou consistente para 𝜎 2 , para tanto é necessário verificar duas
propriedades:

 𝑆 2 é não viciado para 𝜎 2 , ou seja, a média ou esperança é o valor populacional:

𝐸[𝑆 2 ] = 𝜎 2

 À medida que n aumenta sua variância tende a zero:

lim 𝑉[𝑆 2 ] = 0
𝑛→∞

 A distribuição de 𝑆 2 é uma distribuição Qui-Quadrado com n-1 graus de liberdade, denotada


2
por 𝜒𝑛−1 . A função densidade de probabilidade é dada por:

1 𝑛−1 𝑥
𝑓(𝑥) = 𝑛−1 𝑛−1 𝑥 2 exp (− ) , 𝑥 ∈ (0, ∞)
𝛤( ) 2
2 2 2

Esta distribuição representa a soma dos quadrados de variáveis independentes com distribuição
normal padrão, assim:
𝑛
𝑥𝑖 − 𝑥
𝜒𝑛−1 = ∑ 𝑍𝑖2 , 𝑜𝑛𝑑𝑒 𝑍𝑖 =
2
𝜎
𝑖=1
Tomando:

182
Professor Cledinaldo Castro Araújo

𝑛 2
2
𝑥𝑖 − 𝑥
𝜒𝑛−1 = ∑( ) , 𝑐𝑜𝑚𝑜 𝜎 é 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒, 𝑡𝑒𝑚𝑜𝑠 𝑞𝑢𝑒:
𝜎
𝑖=1

𝑛
2
𝜎 2 𝜒𝑛−1 = ∑(𝑥𝑖 − 𝑥)2 (𝐓𝐞𝐨𝐫𝐞𝐦𝐚 𝐝𝐞 𝐅𝐢𝐬𝐡𝐞𝐫)
𝑖=1

Substituindo em:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2 2
𝜎 2 𝜒𝑛−1 𝜎2 2
𝑆2 = = ⇒ 𝑆2 = ( ) 𝜒𝑛−1
𝑛−1 𝑛−1 𝑛−1

 Esperança e variância da distribuição Qui-Quadrado:

2 ]
 𝐸[ 𝜒𝑛−1 = 𝑛 − 1 ("é 𝑖𝑔𝑢𝑎𝑙 𝑎𝑜𝑠 𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑎𝑑𝑎𝑑𝑒")
2 ]
 𝑉[ 𝜒𝑛−1 = 2(𝑛 − 1) ("é 𝑖𝑔𝑢𝑎𝑙 𝑎𝑜 𝑑𝑜𝑏𝑟𝑜 𝑑𝑜𝑠 𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑎𝑑𝑎𝑑𝑒")

A partir destes fatos, temos que:

𝜎2 2
𝜎2 2 ]
𝜎2
𝐸[𝑆 2 ] = 𝐸 [( ) 𝜒𝑛−1 ]=( ) 𝐸[ 𝜒𝑛−1 =( ) (𝑛 − 1) ⇒ 𝐸[𝑆 2 ] = 𝜎 2
𝑛−1 𝑛−1 𝑛−1

2
2
𝜎2 2
𝜎2 2 ]
𝜎4 2𝜎 4
lim 𝑉[𝑆 ] = lim 𝑉 [( ) 𝜒𝑛−1 ] = lim ( ) 𝑉[ 𝜒𝑛−1 = lim 2(𝑛 − 1) = lim =0
𝑛→∞ 𝑛→∞ 𝑛−1 𝑛→∞ 𝑛 − 1 𝑛→∞ (𝑛 − 1)2 𝑛→∞ 𝑛 − 1

Observação: Outra forma de analisar a esperança de 𝑆 2 é dada da seguinte forma:

𝑛
∑𝑛𝑖=1(𝑥𝑖 − 𝑥)2 1 2 1 2
𝐸[𝑆 2]
= 𝐸[ ] = 𝐸[ (∑ 𝑋𝑖2 − 𝑛𝑋 )] = 𝐸 [ (𝑛𝐸[𝑋𝑖2 ] − 𝑛𝐸 [𝑋 ])]
𝑛−1 𝑛−1 𝑛−1
𝑖=1
Como
2
𝑉[𝑋] = 𝜎 2 , 𝐸[𝑋] = 𝜇 𝑒 𝑉[𝑋] = 𝐸[𝑋𝑖2 ] − (𝐸 [𝑋 ])

Temos que:
1 2 1 𝜎2 1
(𝑛𝐸[𝑋𝑖2 ] − 𝑛𝐸 [𝑋 ]) = (𝑛(𝜎 2 + 𝜇2 ) − 𝑛( + 𝜇2 )) = (𝑛𝜎 2 + 𝑛𝜇2 − 𝑛𝜎 2 − 𝑛𝜇2 )
𝑛−1 𝑛−1 𝑛 𝑛−1

1 𝜎 2 (𝑛 − 1)
𝐸[𝑆 2 ] = (𝑛𝜎 2 + 𝑛𝜇2 − 𝑛𝜎 2 − 𝑛𝜇2 ) = ⇒ 𝐸[𝑆 2 ] = 𝜎 2
𝑛−1 𝑛−1

183
Professor Cledinaldo Castro Araújo

ANEXOS

1. Modelo de tabela de números aleatórios


EXEMPLO DE UMA TABELA DE NÚMEROS ALEATÓRIOS
(Retirada de: STEVENSON, William J. Estatística aplicada à administração, São Paulo: Harbra, 1981)

184

Você também pode gostar