Você está na página 1de 84

Métodos Quantitativos

4º PERÍODO

Marcos Antonio Dozza

PALMAS-TO/ 2009
FUNDAÇÃO UNIVERSIDADE DO TOCANTINS
Reitoria
Jucylene Maria de Castro Santos Borba

Vice Reitoria
Lívio William Reis de Carvalho

Pró-Reitoria de Graduação
George França dos Santos

Diretoria de EaD e Tecnologias Educacionais


Antônio Luiz Maya Júnior

Diretoria de Ensino
Patrícia Martins Bühler Tozzi

Coordenadoria de Planejamento Pedagógico e Midiático


Rodrigo Barbosa e Silva

Coordenador do Curso
André Pugliese da Silva

MATERIAL DIDÁTICO
Organização de Conteúdos Acadêmicos
Marcos Antônio Dozza

Coordenação Editorial
Maria Lourdes F. G. Aires

Revisão Linguístico-Textual
Eli Pereira da Silva

Revisão Didático-Editorial
Kyldes Batista Vicente

Revisão Didático-Pedagógica
Kyldes Batista Vicente

Gerente de Divisão de Material Impresso


Katia Gomes da Silva

Revisão Digital
Márcio da Silva Araújo

Projeto Gráfico
Albânia Celi Morais de Brito Lira
Katia Gomes da Silva
Márcio da Silva Araújo
Rogério Adriano Ferreira da Silva
Vladimir Alencastro Feitosa

Ilustração
Geuvar S. de Oliveira

Capa
Rogério Adriano Ferreira da Silva
Apresentação

A disciplina de métodos quantitativos pretende fornecer aos acadêmicos


uma visão bastante prática de conceitos e modelos determinísticos (racional e
lógico) e econômicos, especialmente para vocês que precisam entender como se
tomam decisões de caráter estatístico; além de outras decisões de maior
aplicação no estudo de informações específicas para as atividades de análise e
planejamento nas empresas e organizações.
O estudo da análise financeira e variações de mercados nos coloca de
frente com uma grande incógnita, ou seja, o que vai ocorrer no futuro, se
determinado negócio apresenta baixo ou elevado risco, e, ainda, como obter o
máximo de retorno nos investimentos.
As questões acima citadas e outras mais, relacionadas com a
previsibilidade e análise do comportamento dos mercados e seus riscos e
respectivas consequências, são o campo de aplicação dos métodos quantitativos.
Para responder a tais questões típicas do dia-a-dia empresarial, os métodos
quantitativos se valem de uma série de ferramentas de ciência estatística, como
distribuição de probabilidade, distribuição amostral, testes de hipóteses, entre
outras.
Nesse universo, as características dos métodos quantitativos são a base
para a tomada de decisão e elementos fundamentais na elaboração do
planejamento estratégico empresarial.
O foco da disciplina será na apresentação das possibilidades de aplicação,
bem como na correta interpretação dos resultados dos modelos estudados.
Espera-se, a partir do enfoque adotado, que vocês possam compreender os
fundamentos envolvidos, adquirindo autonomia e segurança na utilização das
técnicas que serão apresentadas.

Marcos Antonio Dozza


PLANO DE ENSINO
CURSO: Administração.
PERÍODO: 4º
DISCIPLINA: Métodos Quantitativos

EMENTA
Introdução à probabilidade. Distribuições de probabilidade. Distribuições
amostrais. Estimação. Testes de significância. Análise de variância. Análise de
diagrama de decisão. Aplicativos estatísticos.

OBJETIVOS
• Apresentar as principais técnicas e ferramentas dos métodos quantitativos
utilizadas na gestão empresarial moderna.
• Proporcionar aos acadêmicos a aplicação e análise de informações
estatísticas específicas.
• Compreender os fundamentos estatísticos envolvidos nas atividades
empresariais para a tomada de decisão.

CONTEÚDO PROGRAMÁTICO
• Introdução à probabilidade e distribuição de probabilidade
• Tipos de amostragem e distribuição amostral da média e proporcional
• Processo de estimação e intervalo de confiança
• Hipóteses estatísticas e tipos de testes de hipóteses
• Características da Estimativa “Entre” e Estimativa “Dentro” e Utilização da
Tabela F
• Análise de regressão linear múltipla, modelos de séries temporais e
números-índices

BIBLIOGRAFIA BÁSICA
FREUND, J.E., SIMON, J. A. Estatística Aplicada à Economia Administração e
Contabilidade. 9. ed. São Paulo: Ed. Bookman, 2000.
SILVA, Ermes M. da. et al. Estatística para os cursos de economia,
administração e ciências contábeis. São Paulo: Atlas, 1999.
SARTORIS, Alexandre. Estatística e introdução à econometria. São Paulo:
Saraiva, 2003.

BIBLIOGRAFIA COMPLEMENTAR
ANDERSON, David R. Estatística aplicada à administração e economia. 2. ed.
São Paulo: Pioneira. 2002.
BUSSAB, Wilton O. Análise de variância e regressão. São Paulo: Saraiva, 2005.
CORRAR, Luiz J. THEÓPHILO, Carlos R. et al. (org.). Pesquisa Operacional
para decisão em contabilidade e administração. São Paulo: Atlas, 2004.
DOWNING, Douglas; FARIAS, Alfredo Alves de; CLARK, Jeffrey. Estatística
aplicada. 2. ed. São Paulo: Saraiva, 2003.
STEVENSON, Wiliam J. Estatística aplicada à administração. São Paulo:
Harbra, 2001.
Sumário

Capítulo 1 - Probabilidade e Distribuição Amostral


Capítulo 2 - Estimação e Intervalo de Confiança I
Capítulo 3 - Intervalos de Confiança II
Capítulo 4 - Teste de Significância I
Capítulo 5 - Teste de Significância II e Diagrama de Decisão
Capítulo 6 - Análise de variância
Capítulo 7 - Aplicativos Estatísticos
Capítulo 1 - Probabilidade e Distribuição Amostral

Introdução
Iniciaremos o estudo deste capítulo com os elementos estatísticos
fundamentais aplicáveis à probabilidade e distribuição de probabilidade.
A probabilidade é um conceito de que a grande maioria da população, para
não dizer toda, tem entendimento. Vejamos um exemplo: quando uma moeda
qualquer é jogada para cima (evento), ao cair existe a possibilidade
(probabilidade) de se obter cara ou coroa. Nestas condições, falamos
tecnicamente que em se tratando de uma moeda “honesta” (equilibrada) e um
jogador isento de qualquer tipo de vício, a chance de ocorrer cara ou coroa é igual
para ambas.
Em seguida, ainda neste capítulo, abordaremos a distribuição amostral,
quando qualquer evento ocorre repetidamente numa população, os mesmos
determinam uma lei matemática de sua ocorrência que denominamos de
distribuição de ocorrência, distribuição amostral ou distribuição de probabilidade.
O objetivo da amostragem é ter indicação do valor de alguns parâmetros da
população como, por exemplo, a média e o desvio padrão. Assim, a média
amostral é usada para estimar a média da população, e o desvio padrão amostral
é usado para estimar o desvio padrão da população.
Nossa intenção, neste capítulo, é também responder a uma pergunta muito
importante: o quanto a estatística amostral se aproxima do verdadeiro valor do
parâmetro populacional. Neste sentido, precisamos entender como usar a
amostragem para analisar os parâmetros populacionais e, assim, termos
condições de aprender como as características de uma única amostra podem ser
usadas para fazer análise sobre os parâmetros de uma população. Entre as
principais distribuições amostrais, destacam-se: distribuição normal da média e
proporcional.
O propósito deste capítulo é apresentar os elementos básicos para o estudo
e aplicação matemática da probabilidade, para que você compreenda as técnicas
de amostragem, com suas diferentes aplicações, na coleta de amostras de uma
determinada população. E, para um bom desempenho no estudo deste capítulo, é
necessário que você tenha conhecimentos básicos de probabilidade, funções de
primeiro e segundo grau e também interpretação gráfica. Esses conteúdos você
encontrará no livro de Pedro Morettin e Wilton Bussab, Estatística básica. É
necessário, ainda, que você compreenda os conceitos e as diferenças entre
população e amostra e também ter compreendido os conceitos de média, desvio
padrão e os tipos de amostragens.

1.1 Introdução à Probabilidade


Podemos conceituar probabilidade de acordo com Sartoris (2003, p.1)
como “evento que está sempre presente em nosso dia-a-dia. Qual a probabilidade
de que o meu time seja campeão? Qual é a probabilidade de que eu passe
naquela disciplina? Qual é a probabilidade de que eu ganhe na loteria”.
Probabilidade é uma espécie de medida associada a um evento (A). No
caso específico da primeira pergunta do parágrafo anterior, o evento em questão é
meu time será campeão. Se esse evento é impossível de ocorrer, dizemos que a
probabilidade é zero, porém, se ocorrerá com certeza, sua probabilidade é igual a
um ( ou 100%).

Podemos escrever esse evento, na função de:


Se o evento (A) é impossível de ocorrer, então P(A) = 0
Se o evento (A) ocorrer com certeza, então P (A) = 1

Matematicamente, podemos demonstrar a função P (A) através das duas


formas abaixo, tanto uma como outra demonstra o mesmo resultado.
Número de vezes que ocorre o evento (A)
P(A)= ____________________________________________
Número de vezes em que todos os eventos ocorrem

ou

Número de casos favoráveis o evento (A)


P(A)= ____________________________________________
Número de casos possíveis

À parte do universo (U) dá-se o nome de espaço amostral (E), e é


definido como sendo o conjunto de pontos que represente as possíveis
ocorrências de um determinado experimento (evento).

Qualquer ocorrência do evento em um universo pode ser classificada em:


a) probabilidade do evento simples: aquele formado por um único elemento do
universo.

b) probabilidade do evento composto: aquele formado por dois ou mais


elementos do espaço amostral.

c) probabilidade de eventos certo: aquele que ocorre sempre, ou seja, em


todas as realizações do experimento. P (U) = 1

d) probabilidade de eventos impossíveis: aquele que nunca ocorre.


P (Ø) = 0
e) probabilidade de eventos soma( OU): aquele que consiste na realização de
pelo menos um dos eventos, a soma ou união das ococrrências.
(A1+A2+A3+....An) ou (A1 U A2 U A3 U....An)

f) probabilidade de eventos produto (E): aquele que consiste na realização


simultânea de dois ou mais eventos, ou seja, o produto ou a intersecção das
ocorrências (∩) . (A1 . A2 . A3 .....An) ou (A1 ∩ A2 ∩ A3 ∩....An)
g) probabilidade de eventos condicionados: aquele evento que para ocorrer
depende da realização do evento anterior. P( A ∩ B ) = P (A/B) . P (B)

h) probabilidade de eventos mutuamente excludentes: aqueles que ocorrem


simultaneamente, a ocorrência de um evento exclui a ocorrência do outro
evento.
P (A U B) = P(A) + P(B)
P (A ∩ B) = P(A) . P(B) = 0

i) probabilidade de eventos complementares: aquele oposto ao que ocorreu, e


composto por todos os demais eventos possíveis de ocorrer no espaço
amostral.
P(A) + P(Ä) = 1 onde P(Ä) é a probabilidade de não ocorrer o evento A

j) probabilidade de eventos independentes: aquele em que a ocorrência de


um não interfere a do outro, ou seja, não estão condicionadas.
P(A/B) = P(A) e P(A ∩ B) = P(A) . P(B)
Obs.: o conceito de independência pode ser entendido para 3 ou mais eventos.
Sejam dados os eventos A, B e C, esses eventos são independentes se e
somente se:
P(A ∩ B) = P(A) . P(B)
P(A ∩ C) = P(A) . P(C)
P(B ∩ C) = P(B) . P(C)
P(A ∩ B ∩ C) = P(A) . P(B) . P(C)

k) probabilidade de eventos quaisquer:


P(A U B) = P(A) + P(B) – P(A ∩ B)
P(A U B) = P(A) +P(B) – P(A/B) . P(B)
OBS: ∩ ► (interseção) = E ► ( multiplicação)
U ► (união) = OU ► (somatório)

Com esses elementos acima classificados, podemos entender melhor o


conceito de probabilidade:
Probabilidade é possibilidade matemática definida da ocorrência de um
evento (A), pertencente ao espaço amostral (U), ou seja, a função P(A) com o
domínio em união de conjuntos (U) que assume valores no conjunto dos
números reais (R) de 0 a 1 ou em percentuais 0 a 100%, que satisfaça as suas
propriedades.

Vejamos a seguir alguns exemplos práticos sobre probabilidade:


Exemplo um (resolvido)
a) No lançamento de um dado não viciado, qual a probabilidade de cair a face
número 4?
Números de eventos favoráveis ou desejados = 1 (só há uma face 4)
Número de eventos possíveis = 6 (há seis faces no dado)

Número de casos favoráveis o evento (A)


P(A)= _______________________________________
Número de casos possíveis

1
P(A) = ► Análise: A probabilidade é de que em seis faces do dado saia
6
uma vez o número 4.

b) Qual a probabilidade de sair a face 3 ou 6 em um único lançamento de dois


dados?
(eventos mutuamente excludentes, a ocorrência de um impede a ocorrência
do outro)
1 1
P(3) = ; P(6) =
6 6
P(3 ou 6) = P(3) + P(6) ► = 33,33%

Análise: A probabilidade é de que, em cada 100 jogadas, pode sair o número


3 ou 6 é de 33,33% ou aproximadamente 33 vezes.

c) Qual a probabilidade de caírem duas faces 5 no lançamento de dois dados?


(dois eventos são independentes quando a ocorrência de um não tem
influência na ocorrência do outro é dada pela multiplicação das probabilidades)
1
P(4) =
6
P(4 E 4) = P(4) . P(4)
P(4 E 4) = 0,02777 ► 2,77%

Análise: A probabilidade é de que em cada 100 jogadas, a chance de sair


duas vezes a face 5 é de 2,77% ou aproximadamente 3 vezes.

d) Qual a probabilidade de se retirar uma dama de um baralho previamente


embaralhado?
(a probabilidade de eventos mutuamente excludentes)
1
P( dama de copa) = P(DC) =
52
1
P(dama de ouro) = P(DO) =
52
1
P(damas de espada) = P(DE) =
52
1
P(damas de paus)= P(DP) =
52

P(damas) = P(DC) + P(DO) + P(DE) + P(DP)


4 1
P(DA) = = = 0,0769% ou 7,69%
52 13
Análise: A probabilidade de retirar uma dama é de 1/13, ou seja, de 7,69%,
isto é, em 100 jogadas a chance de retirar uma dama é de 7,69%.

e) Duas caixas (C1 e C2) contêm, em seus interiores, bolas brancas (B) e pretas
(P), a caixa (C1) contendo 2 (duas) bolas brancas (B1) e 1(uma) bola preta
(P1), e a caixa (C2) contendo 2 (duas) bolas brancas (B2) e 2 (duas) bolas
pretas (P2).
Escolhendo ao acaso uma das caixas (C1) ou (C2), retira-se 1 (uma) bola da
caixa escolhida. Se a bola retirada é branca, qual a probabilidade que esta bola
tenha vindo da caixa (C1). (é um evento condicionado)

A probabilidade das caixas: P (caixas) = P(C1) = P(C2) = 1/2 ou 50%


Para a caixa C1
P(probabilidade das bolas brancas) = P(B1) = 2/3
P(probabilidade da bola preta) = P(P1) = 1/3
Para a caixa C2
P(probabilidade das bolas brancas) = P(B2) = 2/4
P(probabilidade das bolas pretas) P(P2) = 2/4
P(B1 / C1) = 2/3 . 1/2 = 1/3
P(B2 / C2) = 2/4 . 1/2 = 2/8 = 1/4
[P(B1 / C1) + P(B2 / C2)] = [1/3 + 1/4] = 7/12
P(B1) / [P(B1 / C1) + P(B2/C2)] = (1/3) / (7/12) = 4/7 ►57,14%

Análise: A probabilidade de que a bola branca seja retirada da caixa 1 (C1) é


de 57,14%

1.2 Teorema de Bayes


Este teorema é uma das relações mais importantes envolvendo
probabilidade condicional, o qual expressa-se por meio de outras probabilidades
condicionais.
A principal resposta que esse teorema fornece é: supondo que o
evento (B) tenha ocorrido, qual a probabilidade de que o evento (A) anterior
ao evento (B) tenha sido causador do mesmo.
Todo esse processo pode ser reduzido em uma única etapa, por meio do
chamado teorema de Bayes que matematicamente podemos demonstrar o
exemplo 5, através da fórmula a seguir:

P ( Ai ). P ( Bj )
P (Ai / Bj) =
∑ P ( An ). P (Bm )
Ou
P ( A ).P (B )
P (A E B) =
∑ P ( A ).P (B )

P(Ai) = probabilidade de ocorrência do evento A


P(Bj) = probabilidade de ocorrência do evento Bj
P(An) = probabilidade de ocorrência de todos os eventos An
P(Bm) = probabilidade de ocorrência de todos os eventos Bm

Aplicação do teorema de Bayes no exemplo (1.E) anterior.

Evento A = C1 e Evento B = C2

P ( A ).P (B ) 2 / 3.1 / 2 2/6


P (A E B) = = =
∑ P ( A ).P (B ) 7 / 12 7 / 12
2 12 24 4
. = = = 57,14%
6 7 42 7

Observação: o resultado obtido pelo teorema de Bayes é o mesmo calculado


pela forma convencional.

1.3 Distribuição de Probabilidade


Vamos iniciar o nosso estudo analisando um exemplo, para que possamos
dar algumas definições essenciais para a continuidade da apresentação desta
unidade.
Considerando uma distribuição de frequências que se referem ao número
de ocorrências policiais diárias em um determinado bairro de uma cidade
hipotética:

0
N DE OCORRÊNCIAS FREQUÊNCIAS
0 29
1 11
2 6
3 4
∑ = 50

A probabilidade de em um dia:

Número de vezes que ocorre o evento (A)


P(A)= ____________________________________________
Número de vezes em que todos os eventos ocorrem

29
• Não registrar ocorrências é: p = = 0,58
50
11
• Registrar uma ocorrência é: p = = 0,22
50
6
• Registrar duas ocorrências é: p = = 0,12
50
4
• Registrar três ocorrências é: p = = 0,08
50

Reescrevendo a tabela anterior, temos:

0
N DE OCORRÊNCIAS PROBABILIDADES
0 0,58 = 58%
1 0,22 = 22%
2 0,12 = 12%
3 0,08 = 8%
∑ = 1 = 100%

Esta tabela é denominada distribuição de probabilidade.

Seja X uma variável aleatória que pode assumir os valores x1, x2, ..., xn. A
cada valor xi correspondem pontos do espaço amostral. Associamos a cada valor
xi a probabilidade pi de ocorrência de tais pontos dentro do espaço amostral.

Como vimos no exemplo anterior, vamos ter: ∑p i =1


Assim os valores x1, x2, ..., xn e seus correspondentes p1, p2, ..., pn
definem uma distribuição de probabilidade.
Depois de definirmos a distribuição de probabilidade, estamos, então,
estabelecendo uma correspondência entre os valores da variável aleatória X e os
valores da variável P.
Fica, assim, definida uma função: F ( x ) = P ( X = x i )

1.3.1 Distribuição Normal de Probabilidade


Esta distribuição teórica é uma das mais utilizadas em pesquisas
socioeconômicas. Para melhor entendê-la, vamos descrever algumas de suas
características principais a seguir:
• valores da variável aleatória X mais próximos da média x ocorrem com
maior frequência;
• valores da variável aleatória X simétricos em relação à média ocorrem com
a mesma frequência;
• a região definida pelo gráfico tem área unitária;
• como a curva é simétrica em torno de x , a probabilidade de ocorrer valor
maior que a média é igual à probabilidade de ocorrer valor menor que a
média, ou seja, ambas as probabilidades são iguais a 0,5. Então,
P ( X > x ) = P( X < x ) = 0,5
A curva que representa essas características é a curva de Gauss, que é
mostrada abaixo:

Nosso maior interesse, quando estamos analisando uma variável aleatória


com distribuição normal, é obter a probabilidade dessa variável assumir um valor
em um determinado intervalo.
A probabilidade de p [a < x < b] é a área da região sob a curva definida
pelo intervalo [a , b].

Como o cálculo da área dessa figura é muito complicado, iremos utilizar


uma distribuição normal z com média x = 0 e desvio–padrão v = 1.
Uma tabela contendo os valores positivos de z e a área compreendida sob
a curva entre 0 e z foi construída.
A escolha desta distribuição se dá pelo fato de apresentar os parâmetros
mais simples. Qualquer outra distribuição normal x, com média x e desvio padrão
v, pode ser transformada, para o efeito do cálculo de áreas, na distribuição normal
padrão z, através da mudança de variável, dada pela equação abaixo:

x−x
z=
V
Se conhecermos a área específica na tabela, qualquer tipo de área pode
ser calculada, usando a simetria da curva.

Exemplo dois (resolvido)


1 – Seja X uma variável aleatória que representa o comprimento de pregos
produzidos por certa máquina. Supondo que essa variável tenha distribuição
normal com média x = 2 cm e v = 0,04 cm, queremos descobrir qual a
probabilidade de um prego ter um comprimento de valor entre 2 e 2,05 cm.
P(2 < X < 2,05)

Para fazermos a mudança de variável, podemos afirmar que:

P( x < X < x) = P(0 < Z < z)

x−x 2 ,05 − 2 0 ,05


z = = = = 1,25
V 0 ,04 0 ,04
Portanto:
P(2 < X < 2,05) = P(0 < Z < 1,25)
Vamos procurar na tabela o valor de z = 1,25, para descobrirmos a probabilidade.
O valor encontrado será 0,3944. Assim, a probabilidade de um prego fabricado
pela máquina ter o comprimento entre 2 e 2,05 cm é de 0,3944 ou 39,44 %.

2 – Determine as probabilidades abaixo:


a) P( - 1,3 < Z < 0)

Pela simetria da curva, temos:


P( - 1,3 < Z < 0) = P(0 < Z < 1,3) = 0,4032

b) P( - 0,5 < Z < 1,48)

P( - 0,5 < Z < 1,48) = P( - 0,5 < Z < 0) + P(0 < Z < 1,48)
P( - 0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915
P(0 < Z < 1,48) = 0,4306
Portanto:
P( - 0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221

1.3.2 Tipos de amostragem


A amostragem pode ser definida como o ato de retirar elementos de uma
população, é uma parte da população retirada segundo uma regra conveniente e é
um dos principais fatores para obtermos resultados confiáveis e representativos de
uma população, com base na análise de uma amostra.
As regras para amostragem são classificadas didaticamente em duas
grandes categorias, ou seja, amostragem probabilística e amostragem não
probabilística.

a) Técnicas de Amostragem Probabilística


• Amostragem aleatória ou randômica: é aquela em que todos os
elementos da população têm a mesma chance (probabilidade conhecida e não
nula) de pertencer à amostra, ou seja, trata-se de uma seleção aleatória
indiscriminada.
Se considerarmos uma população de (n) elementos e se todos os
elementos desta população possuem probabilidades iguais, teremos que (1/n) é a
probabilidade de cada elemento participar da amostra.

• Amostragem Simples ao Acaso: também conhecida como ocasional,


acidental, casual, randômica, entre outras, destaca-se por ser um processo de
seleção bastante fácil e muito usado. Nesse procedimento, todos os elementos da
população têm igual probabilidade de ser escolhidos do início ao final do processo.
O procedimento se desenvolve por meio da indicação de um número para
todos os elementos da população. Fixando o número da amostra em (n), retira-se
com reposição os n elementos, examinando a propriedade estudada e devolvendo
o elemento para a população, até completar todo o número de elementos
especificado para a amostra. Um exemplo muito utilizado neste tipo de
amostragem é a tabela de números aleatórios.
Exemplo: Seja uma caixa contendo 10 (dez) bolas numeradas de 0 a 9. Se
procede a retirada de 3 pares de bolas, obtendo-se os resultados abaixo: (0;1),
(3;4) e (6;7).

• Amostragem Sistêmica: as amostras são retiradas em etapas sucessivas


e, em função dos resultados obtidos em cada etapa, pode-se saber ou não se será
necessário outra(s) etapa(s). Podemos obter uma amostra aleatória de n
elementos, dividindo o número de elementos da população N pelo tamanho da
amostra n.
Exemplo: Seja N = 500 (tamanho da população)
n = 50 (tamanho da amostra);

Dividindo o tamanho da população pelo tamanho da amostra, temos:

N 300
a= = =15
n 20
Sorteia-se um número de 1 a 15 obtém-se 5 (x = 5), os elementos enumerados por
(5; 20; 35; 50; ...) serão os componentes da amostra.

• Amostragem Conglomerada: Quando a população apresenta uma


subdivisão em grupos menores, denominados conglomerados, sorteia-se um certo
número de conglomerados e todos os elementos sorteados comporão a amostra.
Esses conglomerados devem traduzir aproximadamente a composição da
população.

Exemplo: Seja um colégio composto de salas de aula onde estudam meninos e


meninas. Sorteiam-se 02 alunos de cada sala, que no conjunto representam a
população do colégio.

• Amostragem Estratificada: Quando a população é composta de


subpopulações (estratos), no qual o comportamento da variável em estudo é
razoavelmente homogêneo, mas substancialmente diferente de estrato para
estrato.
Nesse caso, determina-se o tamanho (n elementos) em cada estrato a ser
sorteado para assim formar a amostra.

Exemplo: A população em uma cidade está dividida em classes sociais. Extrai-se,


por sorteio, várias pessoas de cada classe social em número proporcional à
quantidade de pessoas de uma das classes.

b) Amostragem Não Probabilística


É aquela em que a escolha é feita de maneira justificada e com
determinado objetivo, ou seja, há uma escolha deliberada dos elementos da
amostra com o intuito de se fazer “inferências estatísticas”. Obtêm-se conclusões
específicas sobre a população, a partir de observações feitas na amostra.

1.3.3 Distribuição amostral da Média


Vamos considerar um exemplo para fazermos nosso estudo e relembrar
algumas equações vistas em Estatística Aplicada:

Média ( X ) ► X = ∑
X i ( )
Variância V2 ►
2 ∑ (x i −x )
2

n V =
n

Exemplo três (resolvido)


Seja X uma população constituída dos seguintes elementos {2; 3; 4; 5}
(N = 4). Extrai-se aleatoriamente e com reposição, amostras de 2 elementos (n =
2), tem-se 42 = 16, o número de amostras possíveis representada pelos pares
abaixo:

(2; 2) (3; 2) (4; 2) (5; 2)


(2; 3) (3; 3) (4; 3) (5; 3) 16 amostras (pares de 2 números)
(2; 4) (3; 4) (4; 4) (5; 4)
(2; 5) (3; 5) (4; 5) (5; 5)
Calcula-se a média dos dois números, obtendo-se:
2,0 2,5 3,0 3,5
2,5 3,0 3,5 4,0
3,0 3,5 4,0 4,5
3,5 4,0 4,5 5,0

Observem que temos:

• Média da amostra ( X ) = 3,5 e variância da amostra (V


A
2
A) = 0,625

• Como a população é {2; 3; 4; 5}

• Média da população ( X ) = 3,5


P

• Variância da população (V2P) = 1,25

Saiba mais
Observamos que as médias são iguais e a variância da amostra é metade
da variância da população, pois o tamanho da amostra é 2.

Daí concluímos que:

(X )= (X )
A P e (V2A) = (V2P) / n

Dessa forma, a média da amostra tem distribuição igual à da população e


variância da amostra igual ao quociente da variância da população, dividido pelo
tamanho da amostra. Podemos afirmar, também, que o desvio padrão será:

2 ( V 2P ) (V )
(V A ) = ⇔ ( VA ) = P
n n
1.3.4 Distribuição Amostral Proporcional
Ao longo do nosso estudo, as experiências relatadas nos mostram que a
média e a proporção são as medidas estatísticas de tendência central mais
importantes. Vamos verificar, agora, como podemos estimar os parâmetros de
uma população, através dos parâmetros de uma amostra proporcional.
Seja X uma população infinita, p a probabilidade de sucesso de um evento e q
= 1 – p a probabilidade de fracasso.

Relação entre os parâmetros populacional e amostral:

PARÂMETRO RELAÇÃO
Proporção
(X )=(X )
A P

Variância
p.q
(V2A ) =
n
Desvio padrão
p.q
(VA ) =
n

Exemplo quatro (resolvido):


1 – Uma indústria de biscoitos quer lançar uma novidade de seus produtos e para
testar a qualidade de sua novidade, realizou uma pesquisa de mercado em que
20% dos que provaram o produto afirmaram que seriam seus consumidores.
Como a indústria só lança produtos que interessem a mais de um quarto dos
prováveis consumidores, qual a probabilidade de que, em uma amostra de 200
pessoas, mais de 50 demonstrarem real interesse pelo produto?
• Proporção média da distribuição amostral:

p = (
X A = 20 % )
q = 1 − p = 1 − 20 %
q = 80 %

• Desvio padrão da distribuição amostral:

p . q 20 . 80
(V A ) = = = 2 , 83 %
n 200
• Mudança de variável:
p − xA 25 − 20
z = = = 1,77
VA 2 ,83
Probabilidade:
p(p > 25) = p(p > 1,77) = 50 % - 46,16 % = 3,84 %
No próximo capítulo vamos continuar nossos estudos, abordando os
aspectos do processo de estimação de parâmetros e os intervalos de confiança

Resumo
Vimos, neste capítulo, que as distribuições de probabilidade, usadas para
descrever variáveis aleatórias, são dadas em termos de áreas, sob uma curva
entre dois pontos. Vale lembrar também que distribuição normal é uma distribuição
em forma de sino (curva de Gauss). Também vimos a importância da escolha
certa no tipo de amostragem para garantir a qualidade na análise da amostra. E
ainda as formas de distribuição amostral mais comuns dos eventos que ocorrem
na prática.

Atividades
1. Descreva as características que representam de distribuição amostral de
probabilidade através do gráfico da curva de Gauss abaixo.
2. Os salários mensais dos funcionários de uma empresa são distribuídos
normalmente, em torno da média de R$ 500,00, com desvio – padrão de R$
40,00. Encontre a probabilidade de um funcionário ter u m salário mensal entre R$
430,00 e R$ 590,00. Assinale a alternativa correta.
a) 94,77% c) 90,35%
b) 78,27% d) 89,13%

3. A variável aleatória X admite distribuição normal com média 20 e desvio –


padrão 2. Com as informações a seguir encontre a probabilidade correta de: P(
16 < x < 22) ; P( 18 < x < 26) ; P( 14 < x < 28)
a) 90,55% ; 89,34% ; 91,56% c) 81,85% ; 84,00% ; 99,87%
b) 78,57% ; 77,67% ; 85,25% d) 84,15% ; 97,77% ; 87,12%

4. Uma pesquisa de opinião pública, numa comunidade, mostrou que 46% das
pessoas são favoráveis a um projeto de lei. Determine a probabilidade de que a
maioria das pessoas de um conjunto amostral de 1.000 pessoas seja favorável a
tal projeto?
a) 87,67% c) 75,66%
b) 68,90% d) 99,92%

Comentário das atividades


Na atividade 1, é necessário descrever algumas de suas características
observando o gráfico da curva de Gauss.
Valores da variável aleatória X mais próximos da média x ocorrem com maior
frequência.
Valores da variável aleatória X simétricos em relação à média ocorrem com a
mesma frequência.
A região definida pelo gráfico tem área unitária.
Como a curva é simétrica em torno de x , a probabilidade de ocorrer valor
maior que a média é igual à probabilidade de ocorrer valor menor que a média,
ou seja, ambas as probabilidades são iguais a 0,5. Então,
P ( X > x ) = P( X < x ) = 0,5
Na atividade 2, você deve encontrar a probabilidade de um funcionário ter
um salário mensal entre R$ 430,00 e R$ 590,00, aplicando as regras de
probabilidade. Portanto, a alternativa correta a assinalar é (a), ou seja, em
94,77%.
Na atividade 3, a variável aleatória X admite distribuição normal com média
20 e desvio – padrão 2. Com as informações a seguir, você deverá encontrar a
probabilidade para os três intervalos, isto é, para a P( 16 < x < 22) ; P( 18 < x <
26) ; P( 14 < x < 28), Sendo assim, encontrará a alternativa (c) como correta, ou
seja, 81,85% ; 84,00% ; 99,87%
Na atividade 4, uma pesquisa de opinião pública, numa comunidade,
mostrou que 46% das pessoas são favoráveis a um projeto de lei. Determine a
probabilidade de que a maioria das pessoas de um conjunto amostral de 1.000
pessoas seja favorável a tal projeto? Neste caso, você encontrará a alternativa (d)
como correta, ou seja, 99,02%

Referências
SARTORIS, Alexandre. Estatística e introdução à econometria. São Paulo:
Saraiva, 2003.
STEVENSON, Wiliam J. Estatística aplicada à administração. São Paulo:
Harbra, 2001.
Capítulo 2 – Estimação e Intervalo de Confiança I

Introdução
Para um bom desempenho no estudo deste capítulo, é necessário ter
compreendido o conceito de estimação e ter o domínio da utilização das
distribuições amostrais, na hora de estimar parâmetros populacionais e boas
noções de intervalos de confiança.
Como diferentes amostras levam, geralmente, a valores diferentes dos
estimadores, faz sentido pensarmos na diferença entre o valor do estimador e o
parâmetro.
Essa diferença é chamada de erro de estimativa (e). A relação entre o
nível de confiança e erro de estimativa caracteriza a precisão de uma estimativa.
Usaremos nas aplicações um nível de confiança de um intervalo fixado, que
irá controlar a precisão na determinação do erro de estimativa.
Esta indução (inferência) que fazemos, a partir de uma amostra da
população, pode ser feita de duas maneiras básicas, ou seja, por estimação e por
teste de hipótese.
Neste capítulo, estudaremos o método da estimação que serve para inferir
características de determinada população, por meio do estudo da amostra desta
população e os intervalos de confiança. Os principais intervalos de confiança são
definidos para os vários operadores estatísticos.
Indicar como o tamanho da amostra, a dispersão amostral e o nível de
confiança afetam o erro possível de uma estimativa e construir intervalos de
confiança, utilizando dados amostrais e utilizar gráficos para construir intervalos de
confiança constituem os objetivos deste capítulo. Então vamos lá.

2.1 Processo de Estimação


É o processo de estimar características (parâmetros) desconhecidas de
uma população com base em dados amostrais.
O processo de estimação numa amostra pode ser feito de duas maneiras:
a) Por Ponto: quando, a partir da amostra, procura-se obter um único valor
estimativo do parâmetro populacional.
Exemplo: Um carro popular (1.0) consome 1 litro de combustível a cada 12 Km
rodados.
b) Por intervalo: quando, a partir da amostra, procura-se construir um
intervalo de variação, com certa probabilidade de conter verdadeiramente o
parâmetro da população.
Exemplo: Um carro popular (1.0) consome 1 litro de combustível entre 10 e 14 Km
rodados.

2.1.1 Propriedades do Estimador (E)

a) Não tendenciosidade (justeza): diz-se que o estimador E (Ô) é justo,


quando sua média é o próprio valor do parâmetro populacional (Ô).

( ) ( )
E XA = XP ►(estimador médio da amostra é igual a média da população).

b) Consistência: diz-se que o estimador (Ô) é consistente, se, além de justo, sua
variabilidade (variância) tende a zero, quando se tem uma amostra
suficientemente grande.
Lim V 2 (Ô ) = 0
( ) ( )
E X A = XP e
n→∞
► lê-se o limite da variância quando o

número de elementos da amostra tendem ao infinito.

c) Eficiência: dados dois estimadores Ô1 e Ô2 de um mesmo parâmetro


populacional, é mais eficiente àquele que tem menor variabilidade (variância).
► [ V2 (Ô1) < V2 (Ô2) ]
V2(Ô)A = 0,5 e V2(Ô)B = 0,8, logo o estimador (Ô)A é mais eficiente que o
estimador (Ô)B pois tem menor variância

2.2 Intervalos de Confiança (IC)

2.2.1 Intervalo de Confiança para a Média Populacional Conhecida X P ( )

Quando a variância populacional é conhecida (V2P) numa amostra de


distribuição normal, X = N( X P ,V2P ), sabe-se que, para uma distribuição normal:
X A (média amostral) = X P (média da população).
Como vimos nas unidades anteriores, para transformar uma distribuição
normal x em uma distribuição padrão z, utilizamos a mudança de variável:

x A − x P
z =
Vp
n

O nível de confiança é a probabilidade de o intervalo conter o parâmetro


estimado. Em termos da variável padrão z, isto representa a área central sob a
curva normal entre os pontos − zα/ 2 e zα/ 2 , como mostra a figura a seguir:

α α
2 2

1–α

z
−zα / 2 zα / 2
Observando que a área total sob a curva normal é unitária, e que a área
central é 1 – α, então a notação − zα/ 2 representa o valor de z que deixa a sua
esquerda a área α/2, e a notação zα/ 2 representa o valor de z que deixa a sua
direita a área α/2. Portanto, temos que:

p(− zα / 2 < z < zα/ 2 ) = 1− α


Substituindo nesta equação o valor de z temos:

 V V 
p xA − zα/ 2 . P < xP < xA + zα/ 2 . P  = 1− α
 n n
O erro padrão é encontrado através da equação a seguir:

VP
e = zα /2 .
n
Podemos concluir que os limites dos intervalos são estabelecidos pelos valores:
(estimativa – erro ; estimativa + erro)

Exemplo um (resolvido)
1 – O departamento de estatística de uma indústria de brinquedos informou que o
tempo de montagem de seu principal produto de venda varia de funcionário para
funcionário, mas que o desvio padrão permanece em aproximadamente 3 minutos.
Uma certa quantidade de novos funcionários está sendo contratada, e para saber
o tempo médio de montagem do seu produto pelos novos funcionários, observou-
se uma amostra de 50 funcionários com tempo médio de montagem de 15
minutos. Encontre um intervalo de confiança de 95 % para o tempo de montagem
do brinquedo.

n = 50 VP = 3
x A = 15 1 – α = 95 %
0,95

−zα / 2 zα / 2

Observação: Note que, na tabela da distribuição, z normal fornece o valor da


probabilidade entre 0 e zα/ 2 , o que é a metade da área total (0,95). Logo, temos

que procurar na tabela normal o valor de z associado à probabilidade 0,95/2 =


0,475. Na tabela o valor correspondente de zα/ 2 = 1,96.

O intervalo de confiança será:

 V V 
p x A − z α / 2 . P ≤ x P ≤ x A + z α / 2 . P  = 1 − α
 n n
 3 3 
p 15 − 1,96 . ≤ x P ≤ 15 + 1,96 .  = 0,95
 50 50 
p (15 − 0,83 < x P < 15 + 0,83 ) = 0,95
p (14 ,17 < x P < 15 ,83 ) = 0,95
Análise: Podemos concluir, com 95 % de confiança, que o tempo médio de
montagem do brinquedo é um valor entre 14,17 minutos e 15,83 minutos.
No próximo capítulo, vamos estudar os conceitos e os cálculos do intervalo
de confiança para a média populacional com variância desconhecida e a
proporção populacional.

Resumo
Os estimadores são variáveis aleatórias contínuas e descontínuas também
chamadas de discretas, e em muitos casos as estimativas obtidas são
provavelmente diferentes do valor do parâmetro. Em outras palavras: podem sair
fora do limite absoluto de ocorrência.
Por essa razão, a estatística trabalha com os chamados intervalos de
confiança, os quais apresentam uma faixa, na qual, com determinado grau de
certeza, o valor estimado por inferência estatística pode estar contido.
No capítulo anterior, estudamos as várias formas de se obter uma amostra,
com vistas nas informações sobre a população origem dessa amostra num
processo denominado inferência.
Vimos, neste capítulo, que existem métodos para a obtenção de
estimadores, de acordo com a sua propriedade.
Também, neste capítulo, foram apresentados os principais métodos de
determinação de intervalos de confiança para amostras de populações com
parâmetros populacionais conhecidos e desconhecidos.

Atividades
1. Em cada afirmativa abaixo, classifique quanto ao tipo de estimativa (pontual ou
intervalar) e justifique sua resposta.
a) O brasileiro consome 30 Kg de carne por ano.
b) Entre 34 % e 42 % da população se opõe a um aumento no limite de
velocidade.
c) O desvio padrão da duração de um pneu radial está entre 2400 e 4000
quilômetros.
d) A proporção de estudantes fumantes é 13 %.
e) O consumo médio de carne no país está entre 20 e 40 Kg por pessoa em um
ano.
f) 38% da população se opõem a um aumento no limite de velocidade.
g) A proporção de estudantes fumantes está entre 10 % e 16 %.
h) O desvio padrão da duração de um pneu radial é de 3200 quilômetros.
2. Suponha que uma amostra de n = 100 de uma distribuição normal N forneceu
2
X A = 510,6 . Supondo (V P) conhecido e igual a 16, obtenha um intervalo de

confiança para X P com coeficiente de confiança de α = 0,95.


a) P( 510,57 < Xp >510,62)

b) P( 509,00 < Xp >511,00)

c) P( 509,81 < Xp >511,38)

d) P( 510,30 < Xp >510,30)

3. Seja a duração de vida de uma lâmpada em horas, a qual tem distribuição


normal e seu desvio padrão de 90 horas. Num dado lote qualquer da produção
foram amostradas 1000 lâmpadas, cuja vida média foi de 500 horas. Deseja-se
obter um intervalo de confiança para a média populacional com grau de confiança
de 90%
a) P( 490,10 < Xp >495,62)

b) P( 495,30 < Xp >504,69)

c) P( 505,57 < Xp >510,62)

d) P( 500,65 < Xp >507,78)

4. Num dado lote qualquer foram ensaiadas 100 peças cuja vida média foi de 300
horas..A distribuição normal apresentou variabilidade de 5 horas. Seja a duração
de vida de uma peça em horas, deseja-se obter um intervalo de confiança para a
média populacional das peças com nível de confiança de 95%.
a) P( 299,02 < Xp >300,98)

b) P( 290,18 < Xp >305,70)

c) P( 299,10 < Xp >300,62)

d) P( 298,05 < Xp >305,22)


Comentário das atividades
Na atividade 1, você somente deverá pontuar em cada afirmativa a devida
classificação quanto ao tipo de estimativa (pontual ou intervalar) e justificar a sua
resposta. Com isso, conseguirá alcançar o objetivo proposto que é indicar como o
tamanho da amostra, a dispersão amostral e o nível de confiança afetam o erro
possível de uma estimativa.
Na atividade 2, suponha que uma amostra de n = 100 de uma distribuição
normal N forneceu X A = 510,6 . Supondo (V2P) conhecido e igual a 16, obteve-se

um intervalo de confiança para X P com coeficiente de confiança de α = 0,95. Para


a solução dessa atividade, você, com certeza, assinalou a alternativa (c) como
correta, ou seja, P( 509,81 < Xp >511,38).
Na atividade 3, uma amostra de n = 1000 lâmpadas de uma distribuição
normal N forneceu X A = 500 . Supondo (V2P) conhecido e igual a 90, o intervalo de

confiança para X P com coeficiente de confiança de α = 0,90, certamente você


assinalou a alternativa (b) como correta, ou seja, o intervalo de confiança de P(
495,30, < Xp >504,69).
Na atividade 4, uma amostra de n = 100 peças de uma distribuição normal
N forneceu X A = 300 . Supondo (V2P) conhecido e igual a 5, o intervalo de
confiança para X P com coeficiente de confiança de α = 0,95, certamente você
assinalou a alternativa (a) como correta, ou seja, o intervalo de confiança de P(
299,02, < Xp >300,98).
Com as atividades dois, três e quatro você alcançou o objetivo proposto
que é construir intervalos de confiança utilizando dados amostrais.
Capítulo 3 - Intervalos de Confiança II
Introdução

Para entender o conceito e o cálculo do intervalo de confiança para a média


populacional com variância desconhecida e compreender o conceito e o cálculo do
intervalo de confiança para a proporção populacional, objetivos deste capítulo, é
necessário ter compreendido os conceitos de intervalo de confiança, estudados no
capítulo anterior, e ter o domínio da utilização das distribuições amostrais, na hora
de estimar parâmetros populacionais. Para reforçar estes cálculos, você poderá
buscar aprofundamento no livro de Ermes M. da Silva Estatística para os cursos
de economia, administração e ciências contábeis.
O nível de significância que representa a probabilidade de erro que se
comete quando se afirma que a probabilidade do intervalo Ô1 ≤ O ≤ Ô2 contenha
o verdadeiro valor do parâmetro populacional O, entende-se por intervalo de
confiança em torno de uma estimativa por ponto, para que com a probabilidade
conhecida (1 – α) contenha o verdadeiro valor do parâmetro estimado.
Neste capítulo, estudaremos basicamente os cálculos de intervalos de
confiança para média populacional em que se desconhece a variância
populacional, bem como para proporção da população.

3.1 Intervalo de Confiança para a Média Populacional X P ( )


Quando a variância populacional (V2P) é desconhecida, neste caso
deve-se estimar (V2P) por meio de um operador estatístico(V2A), como foi visto em
unidades anteriores. Quando substituímos o desvio padrão populacional (VP) pelo
desvio padrão amostral (VA), esta aproximação conduz a uma margem de erro
mínima e fazendo a substituição na equação de z, temos:
x A − xP
t =
VA
n
Esta equação acima é conhecida como a distribuição ( t ) student com (n – 1)
graus de liberdade (GL).

Vejamos, a seguir, uma comparação gráfica entre as distribuições ( t e z).


Quando aumentamos o número de elementos da amostra a distribuição ( t ) se
aproxima da distribuição normal ( z )

Para o intervalo de confiança, temos:

α α
2 2
1–α

t
− t α/ 2 tα / 2
Como p(− t α / 2 < t < t α / 2 ) = 1 − α , temos:
Fórmula a ser utilizada:

 V V 
p  x A − t α / 2 . A < x P < x A + t α / 2 . A  = 1 − α
 n n 

Exemplo um ( resolvido):
1 – De uma população normal com parâmetros desconhecidos, retira-se uma
amostra de 25 elementos para se estimar a média de idade da população X P , ( )
( )
obtendo X A = 15 e (V2A) = 36. Encontrar um intervalo de confiança para a média
ao nível de 5 %.
O valor de tα /2 é identificado na tabela pelos graus de liberdade e pelo
nível de confiança.

n – 1 = 25 – 1 = 24
α/2 = 2,5 %
t α / 2 = 2,0639

 V V 
p  x A − t α / 2 . A < x P < x A + t α / 2 . A  = 1 − α
 n n
 6 6 
p  15 − 2 ,0639 . < x P < 15 + 2 ,0639 .  = 0 ,95
 25 25 
p (15 − 2 , 477 < x P < 15 + 2 ,0639 ) = 0 ,95
p (12 ,523 < x P < 17 , 477 ) = 0 ,95

Análise: Podemos afirmar com 95 % de confiança que a média de populacional


de idade encontra-se entre 12,523 e 17,477 .

3.2 Intervalo de Confiança para Proporção (p) Populacional


Vamos considerar uma população com N elementos, e uma determinada
propriedade. Esta propriedade divide a população em duas partes: uma são os
elementos que satisfazem esta propriedade e a outra são os elementos que não
satisfazem esta propriedade.
Para estimar o valor de (p) selecionamos uma amostra aleatória de (n)
elementos dessa população.
População Amostra

elementos elementos elementos elementos


que que não que que não
satisfazem satisfazem satisfazem satisfazem
X N–X x n–x
Matematicamente, vamos ter as seguintes proporções de elementos que
satisfazem e não satisfazem à propriedade da população e da amostra.

População Amostra
X N−X x n−x
P= e Q= p = e q=
N N n n

Lembrando que p é um estimador por ponto do parâmetro P, o intervalo para a


proporção será:

Fórmula a ser utilizada:

 p.q p.q 
p p − z α / 2 . < P < p + zα/2 .  = 1− α
 n n 

Exemplo dois ( resolvido)


1 – Em uma grande cidade, uma pesquisa, com 300 habitantes, revelou que 128
deles consideram que a corrupção é o principal problema da cidade. Encontre um
intervalo de confiança de 95 % para a proporção dos habitantes desta cidade que
consideram a corrupção o seu principal problema.
n = 300 128
x = 128
p= = 0,4267
300
1− α = 0,95⇒zα/ 2 =1,96
O intervalo de confiança para a proporção é:
 p.q p.q 
p p − z α / 2 . < P < p + zα/2 .  = 1− α
 n n
 
 0,4267 .0,5733 0,4267 .0,5733 
p 0,4267 − 1,96 . < P < 0,4267 + 1,96 .  = 0,95

 300 300 
p(0,4267 − 0,056 < P < 0,4267 + 0,056 ) = 0,95
p(0,3707 < P < 0,4827 ) = 0,95

Análise: Podemos afirmar, com 95 % de confiança, que a proporção de


habitantes desta cidade que consideram a corrupção como o seu principal
problema, está entre 37,07 % e 48, 27 %.
No próximo capítulo, vamos estudar os diferentes testes de significância,
isto é, teste de hipóteses, que é o resultado do estudo estatístico aplicado em
determinada amostra.

Resumo
Neste capítulo, tivemos a oportunidade de calcular vários exemplos do
intervalo de confiança para a média populacional com variância desconhecida, é
conhecida como a distribuição (t) student com (n – 1) graus de liberdade( GL).
Através desta distribuição, é possível afirmar com certo nível de confiança um
intervalo para a média populacional. Também estudamos os conceitos e cálculos
da proporção populacional que matematicamente temos proporções de elementos
que satisfazem e não satisfazem à propriedade da população e da amostra.

Atividades
1. Quando substituímos o desvio padrão populacional (VP) pelo desvio padrão
amostral (VA), esta aproximação conduz a uma margem de erro mínima e fazendo
a substituição na equação de z, temos a equação de student (t): Justifique esta
afirmação em síntese.

2. Calcule o intervalo de confiança para a média em cada um dos casos abaixo:


MÉDIA TAMANHO DA DESVIO PADRÃO COEFICIENTE
AMOSTRAL (CM) AMOSTRA DA AMOSTRA (CM) DE
CONFIANÇA
170 100 15 90
165 184 30 95
180 225 30 99

a) P( 167,51 < Xp >172,49) ; P( 160,68< Xp >169,32) ; P( 174,84 < Xp >185,15)

b) P( 168,51 < Xp >173,49) ;P( 165,68< Xp >167,32) ; P( 172,84 < Xp >180,15)

c) P( 169,51 < Xp >170,49) ; P( 161,68< Xp >168,32) ; P( 170,84 < Xp >183,15)

d) P( 165,51 < Xp >171,49) ; P( 163,68< Xp >165,32) ; P( 171,84 < Xp >182,15)

3- Em um determinado tempo, efetivou-se uma pesquisa com 500 habitantes, e


que revelou somente 150 deles consideram que o time de futebol local
correspondeu às expectativas. Encontre o intervalo com 95% de nível de
coeficiente confiança para saber essa proporção dos habitantes.
a) P( 0,37513 < Xp >0,42492)

b) P( 0,35513 < Xp >0,40490)

c) P( 0,25983 < Xp >0,34017)

d) P( 0,27519 < Xp >0,35049)

4- Calcule o intervalo de confiança de 90% para a proporção dos habitantes que


consideram a falta de saneamento básico a causa das doenças, considerando
uma amostra de 1200 habitantes com 678 que revelaram positivamente ser esta a
causa das doenças. (proporção populacional)
a) P( 0,53513 < Xp >0,55492)

b) P( 0,54139 < Xp >0,58861)

c) P( 0,57513 < Xp >0,59492)

d) P( 0,51513 < Xp >0,57492)


Comentário das atividades
Nessas atividades, procure reler a teoria e fixar bem os exemplos dados,
assim conseguirá resolver com facilidade.
Para justificar a atividade 1, há necessidade de abordar que quando a
variância populacional (V2P) é desconhecida, neste caso deve-se estimar (V2P) por
meio de um operador estatístico (V2A), como foi visto em unidades anteriores.
E, na atividade 2, você deve utilizar a fórmula de intervalo de confiança,
quando a variância populacional é desconhecida; portanto, a fórmula a ser
utilizada é a seguir.

 V V 
p  x A − t α / 2 . A < x P < x A + t α / 2 . A  = 1 − α
 n n 
Ao aplicar esta fórmula, e calculando os intervalos, irá encontrar a
alternativa (a) como correta, ou seja, P( 167,51 < Xp >172,49) ; P( 160,68< Xp

>169,32) ; P( 174,84 < Xp >185,15) e as outras como incorreta, pois os


intervalos de confiança para a média amostral irão corresponder somente à
alternativa (a).
Na atividade 3, calculando o intervalo pela fórmula para a proporção
populacional seguir:

 p.q p.q 
p p − z α / 2 . < P < p + zα/2 .  = 1− α
 n n 
Certamente encontrará o intervalo que coincide com a alternativa (c) isto é,
o P( 0,25983 < Xp >0,34017), colocando 25,98% a 34,01% a proporção que
consideram que o time de futebol local correspondeu às expectativas.
Na atividade 4, calculando o intervalo pela fórmula para a proporção
populacional seguir:
 p.q p.q 
p p − z α / 2 . < P < p + zα/2 .  = 1− α
 n n 
Com certeza encontrará o intervalo que coincide com a alternativa (c), isto
é, o, P( 0,54139 < Xp >0,58861), colocando 54,14% a 58,86% a proporção que
consideram que o time de futebol local correspondeu às expectativas.
Com essas atividades, você atingirá os objetivos propostos neste capítulo.
Capítulo 4 - Teste de Significância I

Introdução
O estudo realizado neste capítulo irá se somar ao desenvolvimento do
estudo anterior, no uso dos elementos do teste de hipóteses, o qual é importante
ferramenta para avaliar, com determinado nível de confiança, o resultado do
estudo estatístico aplicado em determinada amostra, fornecendo a segurança
necessária para a tomada de decisão, em relação ao resultado que deverá ser
aplicado na prática, ou seja, na população.
Os objetivos deste capítulo são: conceituar e diferenciar os tipos de
hipóteses estatísticas e formular hipóteses sobre determinada ocorrência, visando
à comparação com elementos esperados da população. E, para um bom
desempenho neste capítulo, é necessário dominar o trabalho com os intervalos de
confiança e saber usar as tabelas de distribuição padrão z e de t student. Para
melhor entendimento a este conteúdo, você deve aprofundar sua pesquisa a partir
do livro de Wiliam J. Stevenson, Estatística aplicada à administração. Ele
certamente o ajudará no entendimento a este capítulo.

4.1 Hipóteses Estatísticas


Como no desenvolvimento da estimação por intervalo, os testes de
hipóteses também são baseados nas distribuições estatísticas dos estimadores.
Dessa forma, as distribuições de probabilidade da média amostral ( X A ) e da
proporção (p)serão utilizados para os respectivos testes sobre a média e a
proporção da população.
A hipótese estatística é uma suposição que se faz quanto ao valor de um
parâmetro populacional que será verificado por um teste paramétrico, ou uma
afirmação quanto à natureza da população que será verificado por um teste de
aderência.
Podemos ter como exemplo de hipóteses estatísticas as afirmações abaixo:
a) A média populacional da altura dos brasileiros é 1,65 m ( X P = 1,65 m);
b) A variância populacional do salário vale R$ 5.000,00 (V2P = 5.000);
c) A proporção de brasileiros com determinada doença é 40%, ou seja, p = 0,40;
d) A distribuição dos pesos dos alunos da universidade é uma normal.

O teste de hipótese é uma regra de decisão para aceitar ou rejeitar uma


hipótese estatística com base nos elementos amostrais.

Para se testar hipóteses, duas situações devem ser formuladas:


Hipótese Nula (H0): é a hipótese testada; quando confirmada, mostra que a
diferença observada entre o valor estimado (pela amostra) e o parâmetro
populacional é devido exclusivamente ao acaso.
Hipótese Alternativa (H1): é qualquer hipótese diferente de H0, que, uma
vez aceita, contraria a hipótese nula, é geralmente a suposição que o pesquisador
quer provar, e a H0 formulada com o expresso propósito de ser rejeitada.
Ao tomarmos a decisão pela aceitação ou rejeição de uma hipótese nula,
estamos sujeitos a acertos e também a erros. Quando se testa H0, pode-se
cometer 2 tipos de erros, conforme mostra a tabela a seguir:
DECISÃO
REALIDADE
Rejeitar H0 Aceitar H0
H0 é verdadeira Decisão correta Decisão Correta
H0 é falsa Erro tipo I Erro tipo II

Erro tipo I: quando se rejeita uma hipótese H0, e H0 é verdadeira.


Erro tipo II: quando se aceita uma hipótese H0, e H0 é falsa.

Região crítica (Rc) e região de aceitação (Ra) de uma hipótese


Seja s o valor real do parâmetro de uma população e α o nível de
significância, vamos ter três possibilidades de testes. Como será descrito a seguir:

H 0 : parâmetro = s
a
1 possibilidade: 
 H1 : parâmetro > s
Nesta primeira possibilidade, se a amostra fornece uma estimativa menor
ou igual a (s) aceitamos (H0). Se (H0) for verdadeira, tomamos a decisão certa;
mas se o valor da estimativa for bem maior que (s), rejeitamos (H0) Se (H0) for
verdadeira, estamos cometendo um erro do tipo I.

Ra
A α

s a Rc

Se (A) é distribuição amostral do parâmetro (s), então a região de aceitação (Ra)


de H0 está a esquerda de (a), e a região crítica (Rc) para H0 está a direita de (a).

H 0 : parâmetro = s
a
2 possibilidade: 
 H1 : parâmetro < s
Nesta segunda possibilidade, se a amostra fornece uma estimativa maior
ou igual a (s) aceitamos (H0). Se (H0) for verdadeira, tomamos a decisão certa;
mas se o valor da estimativa for bem menor que (s), rejeitamos (H0). Se (H0) for
verdadeira, estamos cometendo um erro do tipo I.

Ra
α A

Rc a s
A
Se (A) é distribuição amostral do parâmetro (s), então a região de aceitação
(Ra) de H0 está a direita de (a), e a região crítica (Rc) para H0 está a esquerda de
(a).

H0 : parâmetro = s
a
3 possibilidade: 
 H1 : parâmetro ≠ s
Nesta última possibilidade, se a amostra fornece uma estimativa com valor
bem próximo ao de (s) aceitamos H0. Se H0 for verdadeira, tomamos a decisão
certa; mas se o valor da estimativa for bem menor ou bem maior (diferente) que
(s), rejeitamos H0. Se H0 for verdadeira, estamos cometendo um erro do tipo I.

Ra
α α
2 2

Rc a1 s a2 Rc

Procedimentos básicos para efetuar um teste de hipótese:

1. Enunciar H0 e H1 e os erros I e II;


2. Fixar α (nível de significância) e identificar a variável do teste;
3. Determinar a região crítica em função da variável tabelada;
4. Calcular o valor da variável do teste obtido da amostra;
5. Aceitar ou rejeitar a hipótese nula, com base na região crítica e o no valor obtido
da amostra.

4.2 Tipos de Testes de Hipótese


4.2.1 Teste para a média populacional ( X P )
A melhor maneira de se estimar a média populacional ( X P ) é através da
média amostral ( X A ). Portanto, com a mudança de variável, com VP conhecido e
VP desconhecido, temos, respectivamente:

xA − xP xA − xP
z teste = t teste =
VP VA
n n
Para tanto, basta usar uma das três possibilidades descritas anteriormente
e seguir os procedimentos básicos para fazer um teste de hipóteses.

Exemplo um (resolvido)
1 – Uma fábrica de vinhos anuncia que a quantidade de álcool de um de seus
produtos apresenta um valor abaixo de 26 mg por garrafa. Um laboratório realizou
análises em 10 garrafas e obteve os seguintes resultados, em mg: 26, 22, 28, 24,
25, 27, 23, 28, 26, 24. A quantidade de álcool em cada garrafa de vinho se
distribui normalmente, com variância de 5,36 mg. Com essas informações,
podemos aceitar a afirmação do fabricante, ao nível de 5 %?

H 0 : x P = 26 x A − x P 25,3 − 26 − 0,7
 z teste = = = = − 0,959
 H1 : x P < 26 VP 2,31 0,73
α=5%
n 10
n = 10

xA = ∑ x = 253 = 25,3
n 10
zα = z5% =1,64

Ra
α = 5% 95%

Rc z

z5% = −1,64 z teste = − 0,959


Análise: Diante dos resultados aceita-se H0, ao nível de 5 %, e podemos afirmar
que a afirmação da fábrica é falsa.

4.2.2 Teste para a proporção populacional (P):


A melhor maneira de se estimar a proporção populacional (P) é através da
proporção amostral p. Portanto, com a mudança de variável, temos:

p−P
z teste =
P•q
n
Região crítica (Rc) e região de aceitação (Ra) de uma hipótese

Seja (s) o valor real da proporção de uma população e (α) o nível de


significância, vamos ter três possibilidades de testes. Como será descrito a seguir:

H 0 : P = s
1a possibilidade: 
H1 : P > s

Nesta primeira possibilidade, se a amostra fornece uma estimativa menor


ou igual a s aceitamos H0. Se H0 for verdadeira, tomamos a decisão certa; mas se
o valor da estimativa for bem maior que s, rejeitamos H0.

Se H0 for verdadeira, estamos cometendo um erro do tipo I.

Ra
A α

s a Rc
Se (A) é distribuição amostral da proporção (s), então a região de aceitação
(Ra) de H0 está a esquerda de a, e a região crítica (Rc) para H0 está a direita de
(a).

H 0 : P = s
a
2 possibilidade: 
 H1 : P < s
Nesta segunda possibilidade, se a amostra fornece uma estimativa maior
ou igual a s aceitamos H0. Se H0 for verdadeira, tomamos a decisão certa; mas se
o valor da estimativa for bem menor que s, rejeitamos H0. Se H0 for verdadeira,
estamos cometendo um erro do tipo I.

Ra
α A

Rc a s

Se A é distribuição amostral da proporção s, então a região de aceitação


(Ra) de H0 está a direita de a, e a região crítica (Rc) para H0 está a esquerda de a.

H 0 : P = s
a
3 possibilidade: 
H1 : P ≠ s
Nesta última possibilidade, se a amostra fornece uma estimativa com valor
bem próximo ao de s aceitamos H0. Se H0 for verdadeira, tomamos a decisão
certa; mas se o valor da estimativa for bem menor ou bem maior (diferente) que s,
rejeitamos H0. Se H0 for verdadeira, estamos cometendo um erro do tipo I.
A

Ra
α α
2 2

Rc a1 s a2 Rc

Vimos que, na construção de um teste de hipótese, procuramos encontrar o


Erro do Tipo I, fixando o valor de α. Com relação ao Erro do Tipo II, na maioria
dos casos, não é possível de se calcular, isto porque a hipótese H1 alternativa,
não específica um valor para o parâmetro ou para a proporção, mas sim várias
possibilidades alternativas.

Exemplo dois (resolvido)


1 – Sabemos, por experiência, que 5 % da produção de uma determinada peça é
defeituosa. Na contratação de um novo funcionário, verificamos que, das 600
peças que ele produziu, 82 eram defeituosas. Ao nível de 15 %, verificar se o novo
funcionário produz peças com maior índice de defeitos que o existente.
H 0 : P = 0,05

 H1 : P > 0,05 0,137 − 0,05 0,087
n = 600 z teste = = = 9,775
x = 82 0,05 • 0,95 0,0089
82 600
p= = 0,137
600
zα = z15% = 1,03

Ra
85 %
α = 15 %
Rc

z15 % = 1,03
z teste = 9,775
Como o zteste encontra-se na região crítica, rejeitamos H0, ou seja, com 15
% de risco, podemos levantar suspeitas quanto à habilidade do novo funcionário
na fabricação das peças, sendo sua proporção de defeitos superior à dos demais.
Para o próximo capítulo, vamos, ainda, exercitar mais exemplos de teste de
hipóteses, para solidificar os conhecimentos adquiridos neste capítulo que
acabamos de estudar.

Resumo
Neste capítulo, procuramos apresentar os procedimentos para avaliar o
resultado obtido de uma amostra com a fixação de um nível de segurança quanto
aos valores inferiores ou superiores a este resultado sobre a população em
estudo, através do método denominado de teste de hipóteses.
Percebemos também a importância da aplicação dos testes de hipóteses na
tomada de decisão de aceitação ou rejeição na estimação de um parâmetro.

Atividades
1. A hipótese estatística é uma suposição que se faz quanto ao valor de um
parâmetro populacional que será verificado por um teste paramétrico, ou uma
afirmação quanto à natureza da população que será verificado por um teste de
aderência. Descreva os exemplos de hipóteses estatísticas.

2. Uma fábrica de tijolos de cimento introduz um novo material em sua fabricação


e acredita que aumentará a resistência média, que é 206 Kg. A resistência dos
tijolos tem distribuição normal com desvio padrão de 12 Kg. Retira-se uma
amostra de 30 tijolos, obtendo x A = 210 Kg . Ao nível de 5%, pode o fabricante
aceitar que a resistência média de seus tijolos tenha aumentado?
a) Zc = 1,60 ►aceita-se H0
b) Zc = 1,74 ►rejeita-se H0
c) Zc = 1,54 ►aceita-se H0
d) Zc = 1,83 ►rejeita-se H0
3. Uma indústria de fabricação de motos anuncia que suas motos consomem, em
média, 11 litros de combustível a cada 100 km, com desvio padrão de 0,5 litro.
Uma revista especializada decide verificar esta afirmação e analisa 10 motos
dessa marca, obtendo 11,5 litros por 100 km, como consumo médio. Admitindo
que o consumo tenha distribuição normal, ao nível de 5 % o que a revista
concluirá sobre o anúncio da fábrica?
a) Zc = 2,53 ►rejeita-se H0
b) Zc = 1,60 ►aceita-se H0
c) Zc = 2,84 ►rejeita-se H0
d) Zc = 1,54 ►aceita-se H0

4. Uma máquina produz 4% de peças defeituosas, quando está bem regulada.


Uma amostra aleatória de 50 peças apresentou 7 peças defeituosas. Ao nível de
5% de significância teste a hipótese de que a máquina está regulada.
a) Zc = 1,44 ►aceita-se H0
b) Zc = 1,74 ►rejeita-se H0
c) Zc = 1,35 ►aceita-se H0
d) Zc = 1,80 ►rejeita-se H0

Comentário das atividades


Na atividade 1, para descrever os exemplos de hipóteses estatísticas,
pode-se ter como exemplo de hipóteses estatísticas as afirmações abaixo: a
média populacional da altura dos brasileiros é 1,65m ( X P = 1,65 m); a variância
populacional do salário vale R$ 5.000,00 (V2P = 5.000); a proporção de brasileiros
com determinada doença é 40%, ou seja, p = 0,40; a distribuição dos pesos dos
alunos da universidade é uma normal. Certamente, você descreveu, com esses
exemplos, e assim alcançou o objetivo proposto para este capítulo que é de
conceituar e diferenciar os tipos de hipóteses estatísticas.
Na atividade 2, pelos cálculos você encontrará tem valor de Zc = 1,8349,
ou seja, valor maior que Z tabelado para 5% de nível de significância em 1,65,
portanto, pelo gráfico, identifica-se que está dentro de região critica (Rc), isto é, a
alternativa correta a ser assinalada é (d), pois rejeita-se a hipótese nula (H0) que a
resistência média de seus tijolos tenha aumentado. As outras alternativas não
condizem com o teste de hipóteses efetuados.
Na atividade 3, os cálculos você encontrará o valor de Zc = 2,5298, ou
seja, valor maior que Z tabelado para 5% de nível de significância em 1,65,
portanto, pelo gráfico, identifica-se que está dentro de região critica (Rc), isto é,
alternativa correta a ser assinalada é (a), pois rejeita-se a hipótese nula (H0) que o
consumo médio das motos seja de 11 litros para cada 100 km.. As outras
alternativas não condizem com o teste de hipóteses efetuados.
Na atividade 4, ao resolver os cálculos, você encontrará o valor de Zc =
1,44337, ou seja, valor menor que Z tabelado para 5% de nível de significância em
1,65; portanto, pelo gráfico, identifica-se que está dentro de região de aceitação
(Ra), isto é, alternativa correta a ser assinalada é (a), pois aceita-se a hipótese
nula (H0) em que a máquina está regulada com 4% de peças defeituosas. As
outras alternativas não condizem com o teste de hipóteses efetuados.

Referência
SILVA, Ermes M. da. et al. Estatística para os cursos de economia,
administração e ciências contábeis. vol.1 e 2. São Paulo: Atlas, 1999
Capítulo 5 - Teste de Significância II e Diagrama de Decisão

Introdução
Resolver os exercícios propostos sobre teste de hipóteses para a média
populacional ( X P ) e para a proporção populacional (P) e discutir a forma de
tomada de decisão sobre determinado evento com base em probabilidades,
custos e retornos constituem os objetivos deste capítulo E, para melhor
entendimento deste conteúdo, você deve consultar o livro Estatística aplicada à
administração, além de retomar os conteúdos do capítulo anterior.
Os exercícios propostos neste capítulo irão solidificar o estudo anterior no
uso dos elementos do teste de hipóteses tanto para a média populacional ( X P )
como para a proporção populacional (P).
Os cálculos efetivados serão aplicados e fornecerão a segurança
necessária para a tomada de decisão em relação ao resultado que deverá ser
aplicado na prática, ou seja, na população.
A tomada de decisão sobre determinado evento, sob condições de
incerteza, é uma situação que acompanha os profissionais de várias áreas no seu
dia-a-dia. A questão é qual caminho devo seguir, devo correr um risco grande ou
pequeno, a dúvida e a insegurança são grandes no mundo dos negócios, a
decisão deve ser tomada de uma forma intuitiva ou envolvendo sentimentos
particulares ou coletivos.
É por meio de uma série de ferramentas estatísticas que esta condição
estritamente sentimental se transforma numa ação calculada e com seus limites
definidos sobre riscos e vantagens; portanto, neste tema, veremos alguns destes
componentes que nos auxiliarão na tomada de decisão.

5.1 Exercícios Propostos de Teste de Hipóteses


5.1.1 Teste para a média populacional ( X P )
1. Uma amostra aleatória de 40 elementos retirados de uma população normal
com desvio-padrão da população de 3 anos, apresentou um valor médio igual a 60
anos. Teste a hipótese, ao nível de significância de 5% de que a média de idade
populacional seja igual a 59 anos, supondo a h1 maior que 59 anos.

H0 = 59 X A = 60 = 5% → pela tabela de Z = 1,65

H1 > 59 X p = 59 VA = 3 n = 40

− −
x A − xP 60 − 59 1
zC = zC = zC = = 2 ,108
VP 3 3
n 40 6 ,32

Análise: Zc = 2,108 está na RC, ou seja, > 1,65 (valor limite para RC), portanto,
rejeita-se Ho e aceita-se H1, isto é, a média de idade da população é maior que 59
anos.

2. Uma amostra de 12 barras de aço retiradas ao acaso de uma população


normal, apresentou média de 100 kg e desvio-padrão da população de 5 kg. Teste
ao nível de significância de 5%, a hipótese de que a média populacional seja 102
kg, supondo a h1 menor que 102 kg.
H0 = 102 X A = 100 α = 5% → pela tabela de Z = -1,65

H1 < 102 X p = 102 VA = 5 n = 12

− −
x A − x P 100 − 102 −2
zC = zC = zC =
5
= − 1,384
VP 5
12 3 , 46
n

Análise: Z calculado = -1,38 está na região de aceitação; portanto, aceita-se H0 e


rejeita-se H1, ou seja, a média das barras de aço é de 102kg.

5.1.2 Teste para a proporção populacional (P):


1. Uma máquina está regulada quando produz 3% de peças defeituosas. Uma
amostra aleatória de 80 peças selecionadas ao acaso apresentou 3 peças
defeituosas. teste ao nível de 5% a hipótese de que a máquina está regulada.
Análise: Z calculado = 0,39 situa-se a esquerda do valor de Z tabelado de 1,65,
portanto, está na região de aceitação, ou seja, aceita-se H0 e rejeita-se H1, isto é,
concluímos que, ao nível de 5% de significância, a máquina é considerada
regulada para 3% de peças defeituosas.

2. Uma secretaria de estado afirma que 40% dos trabalhadores registrados


mantêm convênio com empresas particulares de assistência médica. com a
finalidade de testar esta afirmação, uma amostra aleatória de 90 trabalhadores
revelou que 27 mantinham convênio com estas empresas. teste a afirmação da
secretaria ao nível de significância de 5%
H0 = 0,40 ou 40%
H1 < 0,40 ou 40% (27/90 = 0,30 . 100= 30% portanto menor que 40%)
Análise: Zc = -1,94 menor que Z tabelado = -1,65, portanto está na RC, ou seja,
rejeita-se H0 e aceita-se H1 porque a proporção de trabalhadores que mantêm
convênio com a empresa é menor que 40%.

5.2 Diagrama de decisão


5.2.1 Análise de Decisão Bayesiana
Duas dessas ferramentas estatísticas, usadas como auxílio na tomada de
decisão, são conhecidas como tabela e árvore de decisão que identificam o ganho
ou perda de um determinado evento condicional associado com uma possível
combinação de atos de decisão sobre o objeto de decisão. Estes instrumentos
também indicam a probabilidade de ocorrência para cada uma das alternativas, as
quais geralmente devem ser mutuamente exclusivas.
Para entender fundamentalmente o processo de tomada de decisão é
necessário definir alguns elementos fundamentais na construção deste processo,
são eles:
a) Eventos – ocorrências que estão fora de controle do tomador de decisões e
que determinam o nível de sucesso de cada ato. Tais eventos são frequentemente
chamados de “estados da natureza”, ou simplesmente “estados” e ainda
“resultados”. Os eventos são mutuamente exclusivos e em sua enumeração
devem ser incluídos todos os eventos possíveis.
Por exemplo: nível de demandas de mercado para um item particular,
durante um período de tempo especificado.

b) Probabilidade – é uma medida da ocorrência de determinado evento, a


qual na teoria Bayesiana deve ser sempre disponível. A sua disposição pode ser
feita com base em dados objetivos ou subjetivos, baseados em julgamentos
pessoais.
Como os eventos são mutuamente exclusivos e exaustivos, a soma dos
valores da probabilidade das ocorrências deve ser igual a 1,0.
Por exemplo: um determinado produto apresenta uma demanda de
mercado D1, D2, D3, D4, e D5 , conforme a tabela a seguir. Sabe-se que um
revendedor pretende adquirir lotes mínimos deste produto de 5 unidades até o
limite máximo da demanda do mercado, e ainda que a venda de cada unidade
gere um ganho de R$ 300,00 e a não venda uma despesa de R$ 200,00. Monte a
tabela de decisão do problema acima com base na probabilidade de demanda.

GANHO POR LOTES DE AQUISIÇÃO


DEMANDA PROBABILIDADE
EM (R$) POR UNIDADE
(UNID) (%)
5 10 15 20
5 10 1500 500 -500 -1500
10 30 1500 3000 2000 1000
15 40 1500 3000 4500 3500
20 20 1500 3000 4500 6000

5.2.2 Formas de tomada de decisão


a) Tomada de decisão baseada na probabilidade
É aquela que ocorre com base na mais provável ocorrência, ou seja, o
evento de maior probabilidade. Por Exemplo: considerando o exemplo anterior em
que o melhor evento é aquele de maior probabilidade (P = 40 %), ou seja, espera-
se uma demanda de 15 unidades de produto e um ganho máximo de R$ 4500,00.
b) Tomada de decisão baseada no maior ganho
Trata-se da decisão baseada apenas em consequências econômicas
associados aos possíveis eventos. Nessa condição, surgem os critérios de
maximin, maximax e do arrependimento minimax.

Critério maximin – máximo ganho com a menor quantidade;


Critério maxmax – máximo ganho com a maior quantidade;
Arrependimento minimax – relação econômica entre o ato e a melhor relação
econômica da correspondente classe do ato.

Exemplo um (resolvido)
Ainda com relação ao exemplo inicial temos:

GANHO POR LOTES DE AQUISIÇÃO (R$)


DEMANDA
Lote 5 unid Lote 10 unid Lote 15 unid Lote 20 unid
(UNIDADES)
Abs Dif Abs Dif Abs Dif Abs Dif
(1500-1500) 1500-500 1500-(-500) 1500-(-1500)
5 1500 0 500 -500 -1500
1000 2000 3000
(3000-1500) (3000-3000) 3000-2000 3000-1000
10 1500 1500 3000 2000 1000
0 1000 2000
(4500-1500) 4500-3000 4500-4500 4500-3500
15 1500 3000 3000 4500 3500
1500 0 1000
(6000-1500) (6000-3000) 6000-4500 6000-6000
20 1500 4500 3000 4500 6000
3000 1500 0
Mínimo
1500 500 -500 -1500
(minimax)
Máximo
1500 3000 4500 6000
(maximax)
Arrependimento
4500 3000 2000 3000
Máximo

5.2.3 Tomada de decisão baseada na probabilidade e no ganho ou critério do


valor esperado (VE)
Trata-se de um método que combina a possibilidade da ocorrência com a
oportunidade de ganho para todos os diversos atos e eventos.
Cria-se, com esse mecanismo, o chamado valor esperado que é igual à
soma do produto do valor condicional de cada evento por probabilidade de
ocorrência.

Exemplo dois (resolvido)


Com base no exemplo inicial, construa a tabela abaixo e calcule o valor esperado
(VE) elegendo o melhor.

GANHOS POR LOTE DE AQUISIÇÃO


PROBABILIDADE
DEMANDA 5 10 15 20
P(X)
R$ R$ . P(x) R$ R$ . P(x) R$ R$ . P(x) R$ R$ . P(x)

5 0,10 1500 150 500 50 -500 -50 -1500 -150


10 0,30 1500 450 3000 900 2000 600 1000 300
15 0,40 1500 600 3000 1200 4500 1800 3500 1400
20 0,20 1500 300 3000 600 4500 900 6000 1200
Valor Esperado (VE) 1500 2750 3250 2750

No próximo capítulo, vamos estudar a análise de variância que consiste


num conjunto de técnicas estatísticas utilizadas para a descoberta de fatores que
produzem mudanças sistemáticas em alguma variável de interesse.

Resumo
Neste capítulo, tivemos a oportunidade de exercitar os exemplos de teste
de hipóteses e também foram desenvolvidas as ferramentas básicas para uso no
diagrama de decisão e as suas formas de aplicação no cotidiano da vida prática.

Atividades
1. Em uma determinada amostra de 30 pneus de trator retirados de uma
população normal, com desvio padrão de calibragem de VP = 2 libras apresentou
um valor médio igual a 40. Teste, ao nível de significância de 5%, a hipótese de
que a média populacional de calibragem dos pneus seja igual a 39 libras, supondo
a hipótese alternativa x P > 39 .
a) Zc= 1,10 aceita-se H0
b) Zc= 2,80 rejeita-se H0
c) Zc= 2,74 aceita-se H0
d) Zc= 2,5,0 aceita-se H0

2. Em uma determinada população normal com média histórica de 18 anos de


idade, 12 elementos foram selecionados ao acaso, fornecendo média de 17 anos
de idade e desvio-padrão de 3 anos de idade. Teste ao nível de significância de
5% a hipótese de média de idade da população seja de 18 anos.
a) Zc= -1,15 aceita-se H0
b) Zc= -1,10 aceita-se H0
c) Zc= -1,75 rejeita-se H0
d) Zc= -1,95 rejeita-se H0

3. Com base em uma nova tecnologia, uma fabricante desenvolveu um aparelho


de TV em cores com tela de imagem de 36 polegadas. O proprietário de uma
pequena loja de eletrodomésticos estima que o preço de venda é de R$ 1.800,00,
os valores de probabilidades associados com vendas de 2, 3, 4, ou 5 aparelhos,
durante 3 meses sob estudo são 0,30; 0,40; 0,20 e 0,10 respectivamente. Com
base apenas nestes valores de probabilidade, que número de aparelhos o lojista
deve encomendar, supondo que não possam se feitas novas encomendas durante
o período de aquisição?
a) Três aparelhos com probabilidade de 50% de venda no período
b) Dois aparelhos com probabilidade de 30% de venda no período
c) Três aparelhos com probabilidade de 40% de venda no período
d) Quatro aparelhos com probabilidade de 40% de venda no período
4. Para a decisão do problema anterior, a margem de lucro para cada aparelho
vendido é R$ 200,00. Se qualquer aparelho não for vendido durante 3 meses, a
perda total por aparelhos para o lojista será de R$ 300,00. Determine as melhores
ações do ponto de vista dos critérios do valor esperado.(VE)
a) Quatro aparelhos com VE de R$ 300,00
b) Três aparelhos com VE de R$ 450,00
c) Três aparelhos com VE de R$ 300,00
d) Quatro aparelhos com VE de R$ 450,00

Comentário das atividades


Na atividade 1, através dos cálculos, você encontrará o valor de
Zc = 2,74, ou seja, valor maior que Z tabelado para 5% de nível de significância
em 1,65, portanto, pelo gráfico, identifica-se que está dentro de região aceitação
(Ra), isto é, alternativa correta a ser assinalada é (c), pois aceita-se a hipótese
nula (H0) que a média populacional de calibragem dos pneus seja igual a 39
libras. As outras alternativas não condizem com o teste de hipóteses efetuados.
Na atividade 2, pelos cálculos, você encontrará o valor de Zc = -1,15, ou
seja, valor menor que Z tabelado para 5% de nível de significância em 1,65,
portanto, pelo gráfico, identifica-se que está dentro de região aceitação (Rc), isto
é, alternativa correta a ser assinalada é (a), pois rejeita-se a hipótese nula (H0) de
que a média de idade da população seja de 18 anos. As outras alternativas não
condizem com o teste de hipóteses efetuados.
Na atividade 3, baseado apenas nas probabilidades apresentadas, o lojista
deverá comprar 3 aparelhos de TV, pois a maior probabilidade de vendas no
período seria de 40%, ou 0,40. Portanto a alternativa correta a ser assinalada é (c)
Na atividade 4, pelo maior valor esperado, a ação seria a aquisição de 3
aparelhos de televisão pelo o lojista, dado o melhor resultado, considerando as
probabilidades e a melhor oportunidade de ganho, com VE de R$450,00. Portanto,
a alternativa a ser assinalada como correta é a (b).
Referências
SILVA, Ermes M. da. et al. Estatística para os cursos de economia,
administração e ciências contábeis. vol.1 e 2. São Paulo: Atlas, 1999.
STEVENSON, Wiliam J. Estatística aplicada à administração. São Paulo:
Harbra, 2001.
Capítulo 6 - Análise de Variância

Introdução
O propósito deste capítulo é apresentar a metodologia de aplicação do
estudo de comparação entre duas amostras a partir do uso de suas médias para
que se possa calcular a estimativa dentro da variância entre as médias de duas ou
mais populações são iguais. Para um bom desempenho no estudo deste assunto,
é necessário ter clareza do conceito e análise de variância: esses conhecimentos
você poderá adquirir, com mais profundidade, consultando o livro de Wilton O.
Bussab, Análise de variância e regressão. Certamente, após essa pesquisa,
você estará mais apto a compreender o conteúdo que será apresentado neste
capítulo.
Aplica-se a análise de variância para determinar se as médias de duas ou
mais populações são iguais. Como por exemplo, quando verificamos se a média
de rendimento trimestral de determinada aplicação é diferente ao longo do ano.
O conjunto de conceitos e equações que vimos, no capítulo anterior, nos
servirão de base para o desenvolvimento desta unidade.
Vamos, primeiramente, aprender como utilizar a tabela F para identificar o
valor que devemos comparar com aquele calculado pela razão entre a estimativa
“entre” e “dentro”, que chamamos na unidade anterior de Fteste. E, por último,
vamos resolver alguns exemplos com o intuito de fixar os conceitos que foram
vistos na unidade anterior, e os que serão vistos nesta unidade.

6.1 Características da Estimativa “Entre” e Estimativa “Dentro”


Trata-se de uma generalização do teste para a diferença de duas médias
populacionais, quando se comparam, simultaneamente, médias de populações
com distribuição normais e independentes; portanto, trata-se de um teste de
hipótese mais elaborado, ou seja, com mais controle sobre o estudo.

Os pressupostos básicos da análise de variância são:


• as amostras são aleatórias e independentes;
• as populações são normais;
• as variâncias populacionais são iguais.

As hipóteses a serem testadas são as seguintes:

 = é    
 
 = é   

A variância é estimável pela variância das médias amostrais e pela média


das variâncias amostrais. A variância das médias amostrais é chamada de
estimativa entre. A média das variâncias amostrais é chamada de estimativa
dentro.
A relação entre a estimativa entre e a dentro é denominada de razão F.
Como os parâmetros relacionados são quadráticos, F é sempre positivo. De
maneira análoga aos outros testes, aceita-se H 0 quando o Fteste < Ftabelado.

Procedimentos básicos para o cálculo de ( F )


a) Estimativa Dentro (denominador)
Calcular a variância de cada amostra, utilizando a fórmula;

=∑
2
2 (x i − x)
V
n −1
Determinar a variância amostral média, pela fórmula:

s12 +s22 +s32 +...+s2k ∑S


2
2
S= =
k k
onde:
k = número de amostras.
S2 = estimativa dentro da variância.

b) Estimativa Entre (numerador)


Calcular a variância das médias amostrais. Para isso, somamos as médias
amostrais e dividimos pelo número de amostras para obter x G , média global. Use

a fórmula a seguir:

=∑
2
2 (x − x ) G
s
k −1
Multiplicar a variância das médias por n:

n • s2
Encontramos a razão F através da seguinte equação:

n • s2
Fteste =
∑S2 / k ou S2
Gráfico da distribuição F

Rejeito H0

Aceito H0
α
F
F (α)

6.2 Utilização da Tabela F


Quando fazemos a análise da variância, utilizamos as duas estimativas
amostrais da variância para calcular a razão Fteste. Comparamos o valor
encontrado com um valor F da tabela. Se o valor calculado for maior que o
tabulado, rejeitamos H0; mas, se o valor calculado for menor que o tabulado,
aceitamos H0.
Para identificar um valor F na tabela, é necessário determinar os graus de
liberdade. O valor tabulado entra-se na intersecção da coluna de graus de
liberdade do numerador (k – 1) com a linha de graus de liberdade do denominador
k(n – 1). É importante lembrar que o número de graus de liberdade do numerador
consta da linha superior da tabela, e que o número de graus de liberdade do
denominador consta da coluna à esquerda.

Exemplo um (resolvido)
1 – Em um ensaio de tração, se mede a qualidade de uma solda, a fim de
determinar se há um defeito na solda em relação ao tipo de máquina que a
produziu. Foram feitos testes com soldas de 3 maquinas, obtendo os resultados
abaixo.
Com base nos resultados, verifique se há diferença significativa entre as maquinas
com um nível de significância de 10 %.

Teste de tração
Amostras
Maquina 1 2 3 4 5
A 3,2 4,1 3,5 3,0 3,1
B 4,9 4,5 4,5 4,0 4,2
C 3,0 2,9 3,7 3,5 4,2

H0 : x A = xB = xC
Hipóteses:  −
H1 : x A ≠ xB ≠ xC

k = 3 (maquina A, B e C)
Graus de liberdade:
Numerador: k – 1 = 3 – 1 = 2
Denominador: k(n – 1) = 3(5 – 1) =12
n = 5 (total de ensaios)
O valor de F tabelado com nível de significância (α ) igual a 10 % é:
F(10 %) = 2,81
Agora precisamos encontrar o Fteste:

MAQUINAS
ENSAIOS A B C
XA 2 XB 2 Xc
(x − x A ) (x − x B ) (x − x C )2
1 3,2 0,0324 4,9 0,2304 3,0 0,2116
2 4,1 0,5184 4,5 0,0064 2,9 0,3136
3 3,5 0,0144 4,5 0,0064 3,7 0,0576
4 3,0 0,1444 4,0 0,1764 3,5 0,0016
5 3,1 0,0784 4,2 0,0484 4,2 0,5476
Soma 16,9 0,788 22,1 0,468 17,3 1,132
nen–1 5 4 5 4 5 4
2
Média e S 3,38 0,197 4,42 0,117 3,46 0,283

a) Estimativa Dentro (denominador)

s12 + s22 + s32 + ... + s2k 0,197 + 0,117 + 0,283 0,597


2
S = = = = 0,199
k 3 3
b) Estimativa Entre (numerador)
3,38 + 4 , 42 + 3, 46
xG = = 3, 75
3

=∑
2
2 (x − x ) (3,38−3,75) + (4,42−3,75) + (3,46−3,75)
G
2 2 2
s = = 0,33495
k −1 3−1
Cálculo do Fteste

n • s2 5 • 0,33495
Fteste = = = 8,41
∑ S 2
/ k ou S 2
0 ,199

Como Fteste > Ftabelado rejeitamos H0

Fteste = 8,41

Aceito H0

α = 10%
F
F(10 %) = 2,81
Nestas condições, rejeitamos H0, e podemos afirmar que as máquinas
produzem soldas diferentes a um nível de significância de 10%, ou seja, na
análise de 100 peças, apenas em 10 peças nós poderemos errar ao afirmar
que são diferentes.
No próximo capítulo vamos trabalhar com Aplicativos Estatísticos, isto é,
modelos de séries temporais; Análise de regressão linear múltipllas e números-
Índices.

Resumo
Neste capítulo, estudamos o conceito de análise de variância que serve
para comparar resultados de experimentos e inferir sobre eles as duas
hipóteses, ou seja, para a hipótese nula (Ho) as médias populacionais são
iguais e para a hipótese alternativa (H1) a média populacional são diferentes.

Atividades
1. Qual a finalidade da análise de variância? indicando as características das
hipóteses nula e alternativa usadas na análise de variância.

2. A que se refere as expressões estimativa “entre” e “dentro” da variância? e o


que é razão F?

3. Com base nas amostras de três populações diferentes (1,2e 3) com


distribuição normal sobre a variável estudada, testar a hipótese de que as
médias populacionais do jato em litros por minuto são as mesmas para os três
equipamentos de pintura para um nível de significância de 5%.

N° DE AMOSTRAS 1 2 3
EQUIPAMENTOS
A 3,7 3,8 3,2
B 3,5 3,9 3,5
C 3,3 3,6 3,4

a) Fteste = 0,5184 = aceita-se Ho


b) Fteste = 5,1844 = rejeita-se Ho
c) Fteste = 0,5394 = aceita-se Ho
d) Fteste = 5,1555 = rejeita-se Ho

4. A tabela abaixo apresenta preços reais, em determinado mercado, de três


marcas de um produto em três anos diferentes. Faça a análise de variância
com nível de significância de 5% para:
a) Ho: os preços reais médios para as três marcas são iguais;
b) Ho: os preços reais médios nos três anos são iguais;
Marca 2004 2005 2006
Y 1 1 1
Z 2 3 2
T 2 3 3
a) Fteste = 15,18 = rejeita-se Ho ; Fteste = 0,518 = aceita-se Ho
b) Fteste = 11,51 = rejeita-se Ho ; Fteste = 0,378 = aceita-se Ho
c) Fteste = 10,50 = rejeita-se Ho ; Fteste = 0,375 = aceita-se Ho
d) Fteste = 9,520 = rejeita-se Ho ; Fteste = 0,488 = aceita-se Ho

Comentário das atividades


Na atividade 1, aplica-se a análise de variância para determinar se as
médias de duas ou mais populações são iguais. Como por exemplo, quando
verificamos se a média de rendimento trimestral de determinada aplicação é
diferente ao longo do ano. E quanto as características das hipóteses, temos
que para a hipótese nula (Ho) a média populacionais são iguais, e para a
hipótese alternativa (H1) a média populacional são diferentes.
Na atividade 2, a variância das médias amostrais é chamada de
estimativa entre. A média das variâncias amostrais é chamada de estimativa
dentro. A relação entre a estimativa entre e a dentro é denominada de razão
F. Como os parâmetros relacionados são quadráticos, F é sempre positivo. De
maneira análoga aos outros testes, aceita-se H 0 quando o Fteste < Ftabelado.
Na atividade 3, pelos cálculos apurados, você encontrará o valor Fteste
= 0,5184, ou seja, valor menor que F tabelado para 5% de nível de significância
em 5,14, portanto, pelo gráfico identifica-se que está dentro de região aceitação
(Ra), isto é, alternativa correta a ser assinalada é (a), pois aceita-se a hipótese
nula (H0) de que as médias populacionais do jato em litros por minuto são as
mesmas para os três equipamentos de pintura As outras alternativas não
condizem com o teste de hipóteses efetuados.
Na atividade 4, pelos cálculos apurados, você encontrará para a
situação (a) o valor Fteste = 10,50, ou seja, valor maior que F tabelado para
5% de nível de significância em 5,14; portanto, pelo gráfico, identifica-se que
está dentro de região aceitação (Rc), e para a situação b) o valor o valor Fteste
= 0,375, ou seja, valor menor que F tabelado para 5% de nível de significância
em 5,14, portanto, pelo gráfico identifica-se que está dentro de região aceitação
(Ra), isto é, alternativa correta a ser assinalada é (c), pois rejeita-se para a
situação (a) e aceita-se a para a situação b) hipótese nula (H0) de que os
preços se apresentam reais na situação a) e irreais na situação b), em
determinado mercado, de três marcas de um produto em três anos diferentes e
também As outras alternativas não condizem com o teste de hipóteses
efetuados.

Referência
FREUND, J.E., SIMON, J. A. Estatística Aplicada à Economia
Administração e Contabilidade. 9. ed. São Paulo: Bookman, 2000.
Capítulo 7 - Aplicativos Estatísticos

Introdução
Em algumas situações, fica difícil analisar a dependência de uma
variável, quando confrontamos a sua relação com apenas mais uma variável.
Esse tipo de situação nos indica que a utilização de uma ou mais
variáveis irá ajudar a predizer se a relação entre essas variáveis é realmente
linear.
Vamos tentar ilustrar uma situação para exemplificar uma situação típica
em que poderíamos usar três ou mais variáveis em uma análise de regressão.
Se estamos tentando definir a projeção para a safra agrícola de
2006/2007, sabemos que a mesma não depende apenas da quantidade de
fertilizante utilizado na planta. Para isso, devemos introduzir novas variáveis
para tentar amenizar o problema, como, por exemplo, a qualidade do solo, a
quantidade de chuva, o uso de defensivos agrícolas, entre outros.
Riscos e incertezas são manifestações de uma mesma forma
fundamental, ou seja, a aleatoriedade da ocorrência de eventos.
Nos investimentos empresariais, as atividades revelam certo risco e um
grau de incerteza, e difícil diferenciar risco e incerteza e como fazer do ponto
de vista empresarial para minimizar os efeitos diante de uma situação de risco
ou de incerteza. Neste sentido, o assunto será abordado com clareza neste
capitulo.
Apresentaremos também o estudo dos números-índices e veremos que
podemos avaliar e comparar o comportamento (preço, quantidade e valor) de
um produto ao longo de vários períodos e, também, os vários tipos de índices
econômicos, sua determinação, aplicação e interpretação, os quais são de
grande valia na análise econômica e financeira.
Para um bom desempenho no estudo deste capítulo, é preciso ter
conhecimento de correlação e regressão linear simples. Já para ter um
desempenho satisfatório sobre risco e incertezas, precisamos de
conhecimentos básicos sobre probabilidades e estimação. E para ser
alcançado os resultados previstos sobre números índices, você deve ter
conhecimento de razão, proporção e porcentagem. Para aprofundar esses
conhecimentos, consulte Estatística Aplicada à Economia Administração e
Contabilidade.
A intenção é reforçar a diferença entre risco e incerteza, e aplicação dos
métodos quantitativos na previsão de riscos financeiros e no cálculo de
números-índices econômico, também reforçar o conceito correlação e
regressão e a aplicação prática da equação de regressão linear múltipla.
Os objetivos deste capítulo são: apresentar a metodologia de aplicação
da análise de regressão linear múltipla e interpretar a relação entre três ou
mais variáveis; diferenciar risco e incerteza no campo dos negócios e
apresentar os tipos de avaliação e medidas de risco; e apresentar o que são
números-índices e elaborar números-índices simples e compostos.

7.1 Análise de Regressão Linear Múltipla


Para essa análise, temos por objetivo encontrar uma equação
matemática que nos ajude a predizer os possíveis valores de y para diferentes
variáveis independentes. Como podemos observar no exemplo dado acima, o
intuito de se usar variáveis aleatórias adicionais é melhorar a capacidade de
predição de um determinado valor (y).
Diferente da regressão linear simples, a regressão múltipla oferece
soluções complicadas, que, de maneira mais prática, podem ser resolvidas
com a ajuda do computador. Devido a esse fator de complicação, vamos nos
limitar apenas ao estudo superficial da análise de regressão linear múltipla, em
complemento ao que vimos sobre regressão linear simples e estatística
aplicada.

A equação de regressão terá a seguinte forma:


Onde y é a variável dependente, a é uma constante, x1, x2, ..., xn são as
variáveis independentes e b1, b2, ..., bn são denominados de coeficientes
parciais de regressão.

Exemplo um (resolvido)
1 – Estamos tentando definir o preço de venda de motos usadas. Para isso,
vamos usar, como base, o seu preço fixo de venda, quando nova, que era de
R$8.000,00. Haverá uma desvalorização de R$500,00 para cada ano de
utilização dessa moto. A outra variável é a condição geral da moto, que inclui
itens como: pintura, banco, pneus entre outros. Como essa última variável é
difícil de ser quantificada, vamos definir uma escala de 0 a 1 para quantificar
este estado geral que a valoriza em R$ 800,00 pelo seu estado de
conservação. Nessa escala, o (0) qualifica uma moto em péssimas condições,
e o (1,0) indica uma moto em ótimas condições. Qual será o valor de venda y
de uma moto com 3 anos de uso e que foi qualificada por suas condições
gerais com 0,7?
x1 = anos de utilização.
x2 = estado geral de conservação.
y = a − b 1x 1 + b 2 x 2
y = 8000 − 500 x 1 + 800 x 2
y = 8000 − 500 . (3) + 800 . (0,7)
y = 8000 − 1500 + 560
y = 7060
O preço de venda dessa moto será de R$ 7.060,00.

7.2 Número – Índices


Números-índices também chamados simplesmente de índices, são
aplicados geralmente em estudo estatístico de períodos sucessivos e podem
ser expressos por meio de relações diretas ou em porcentagens, assumindo
valores relativos ao do período escolhido como referência, que também pode
ser chamado de período base.
Os índices ou números-índices dividem-se em vários tipos, os quais
servem para determinadas funções ou aplicações.
No Brasil, os mais importantes índices econômicos são aqueles
publicados mensalmente pela Fundação Getúlio Vargas na revista “conjuntura
econômica”, tais como: índice geral de preços no atacado, índices recebidos
pelos agricultores, índices de custo de vida em várias cidades do Brasil, entre
outros.
É uma proporção direta ou percentual pela qual uma medida, em um
dado período, é expressa por meio de uma razão entre um período base
(fixado) e medidas sucessivas. O número-índice assume o valor unitário ou
100% no período base.
Quando estamos analisando apenas um produto em comparação com o
ano base, temos, neste caso, o número-índice simples; mas, se estivermos em
uma comparação que apresente um grupo de itens, vamos trabalhar com o
número-índice composto (que será visto na próxima unidade).

7.2.1 Números-índices simples


De um modo geral, há três classificações de números-índices: índices de
preços, quantidades e valor. A construção dos números-índices simples é feita
de acordo com a seguintes equações, para preço, quantidade e valor,
repectivamente:

pn qn pn • q n
Ip = x 100 Iq = x 100 Iv = x 100
po qo po • q o

Onde:
Ip – índice do preço;
Iq – índice da quantidade;
Iv – índice de valor.
pn – preço de determinado elemento num dado período;
po – preço de determinado elemento no período base;
qn – quantidade de determinado elemento num dado período;
qo – quantidade de determinado elemento no período base.
Exemplo dois (resolvido)
1 – Dada a Tabela1 a seguir, indicando os preços e as quantidades de 3
produtos vendidos em certa região do país, no período de 2002, 2003, 2004 e
2005. Com base nos valores apresentados, calcule o índice simples de preço,
quantidade e valor com base no ano de 2002.

Tabela 1: Preços praticados para os produtos A, B e C, no período de 2002 a 2005, em


determinada região do Brasil.
A B C
ANO
PREÇO QTDE PREÇO QTDE PREÇO QTDE
2002 12 3 5 7 20 3
2003 15 4 10 9 25 4
2004 18 5 20 8 35 5
2005 24 5 30 7 45 6

p 03 15
IpA (03 / 02 ) = x 100 = x 100 = 125
p 02 12
q 03 4
IqA ( 03 / 02 ) = x 100 = x 100 = 133
q 02 3
p .q 15 .4
I vA (03 / 02 ) = 03 03 x 100 = x 100 = 167
p 02 .q 02 12 .3

Com as informações da tabela 2, podemos concluir que para o produto A


teve seu preço aumentado em 50%, entre os anos de 2002 e 2004, por outro
lado, a quantidade aumentou em 67 % e o valor (receita) em 150 %.

Tabela 2: Índice de preços, quantidade e valor dos produtos A, B e C, no período de 2002 a


2005, com base no ano de 2002.
A B C
ANO
PREÇO QTDE VALOR PREÇO QTDE VALOR PREÇO QTDE VALOR
2002 100 100 100 100 100 100 100 100 100
2003 125 133 167 200 129 257 125 133 167
2004 150 167 250 400 114 457 175 167 292
2005 200 167 333 600 100 600 225 200 450

7.2.2 Números-índices compostos


Usando o método dos agregados ponderados, temos várias fórmulas
conhecidas, como por exemplo, a de Laspeyres, de Paasche, e de Fisher
entre outros.
Nossa investigação será feita com base na fórmula de Laspeyres, que
trata de índices ponderais em relação à quantidade de cada item, sendo
calculado com base nas quantidades do período base. As equações que nos
permite calcular o preço, a quantidade e o valor desse tipo de índice são as
que vamos apresentar a seguir:

INDICE DE PRECO INDICE DE QTIDADE INDICE DE VALOR

Ip =
∑p n • qo
x 100 Iq =
∑qn • po
x 100 Iv =
∑p n • qn
x 100
∑p o • qo
∑po • qo ∑p o • qo

Por meio de um exemplo, fica fácil o entendimento desse índice, vejamos a


seguir:

Exemplo três (resolvido)


1 – Usando ainda os dados da Tabela 1, e o ano base 2002, podemos calcular
os índices de preço, quantidade e valor com relação ao ano de 2005 para os
três produtos A, B e C.
Produtos, preços (R$) e quantidades
A B C
ANO
PREÇO QTDE PREÇO QTDE PREÇO QTDE
2002 12 3 5 7 20 3
2003 15 4 10 9 25 4
2004 18 5 20 8 35 5
2005 24 5 30 7 45 6
Com essas informações, podemos concluir que para o grupo de
produtos (A, B e C) tivemos seu preço aumentado em 218 % entre os anos de
2002 e 2005, a quantidade aumentou em 64 % e o valor (receita) em 358 %.
Como podemos observar, o índice de Laspeyres é a média ponderal dos
valores relativos dos produtos considerados, servindo, portanto, para avaliar a
evolução qualitativa de valores com base no ano de referência (base) e no ano
de estudo (objeto) respectivamente.

7.2.3 Índice de preços


Para finalizarmos, destacamos o índice de custo de vida (ICV) ou índice
de preços ao consumidor (IPC), que serve para medir o quanto as variações de
preços afetam as despesas de uma família típica, por meio dos preços de
mercadorias consumidas (alimentos, vestuário, habitação, mobiliário,
medicamentos, artigos de limpeza, entre outros) e de serviços (transportes,
fornecimento de água, energia, educação, médico, dentista, entre outros).
Existem muitas aplicações para esse índice. A principal delas é seu uso
para avaliar o poder aquisitivo de uma unidade monetária, que nada mais é
do que o inverso do IPC, ou seja:

1
Poder aquisitivo = .100
IPC

Como um exemplo, podemos citar o IPC de dezembro de 1995, com base em


novembro que foi de 101,24:
1 1
Poder aquisitivo = .100 = .100 = 0,98
IPC 101,24
Se tivéssemos nesta época um salário de R$ 1.000,00, o seu poder aquisitivo

seria: 1000 .0,98 = R $ 980 ,00

Esse mesmo raciocínio pode ser usado para analisar o poder aquisitivo
ou a renda real de um salário base entre épocas diferentes. Se dividirmos o
salário pelo valor do IPC em qualquer ano, temos a renda real daquele ano,
como vimos no exemplo acima, ou ainda a comparação entre dois anos.
Para exemplificar essa situação, vamos considerar o que a renda anual
de um funcionário no ano de 2003 foi de R$ 10.000,00 e que o IPC daquele
ano foi de 116,3. No ano de 2005, o seu rendimento anula foi de R$ 12.600,00
e o IPC deste ano foi de 147,7. Portanto, temos:

ANO RENDA (R$) IPC CÁLCULO RENDA REAL (R$)

10000
2003 10.000,00 116,3 • 100 8.598,45
116,3
12600
2005 12.600,00 147,7 • 100 8.530,80
147,7

A situação financeira do funcionário piorou em 2005, em relação a 2003,


apesar de a renda ter aumentado, os preços avaliados pelo IPC subiram mais
que a renda do trabalhador.
Para concluir este capitulo, a regressão linear múltipla difere da
regressão linear simples, apenas pelo fato de analisar a relação de três ou
mais varáveis, enquanto que a simples, vista em estatística aplicada, analisa a
relação entre duas variáveis.
E muito comum ouvirmos frases do tipo “o futuro é incerto” e “o
negócio é duvidoso”, as quais revelam certo risco e um grau de incerteza.
Sob este aspecto, sabemos a diferença entre risco e incerteza e como
fazer do ponto de vista empresarial, diante de uma situação de risco ou de
incerteza, como buscar a solução que implique menor risco e diminuição do
grau de incerteza. Nesse sentido, vamos descrever os aspectos inerentes ao
risco e incerteza. E, finalizando, o risco é uma incerteza que pode ser
mensurada (através de probabilidades) e a incerteza é um risco que não pode
ser medido.

Resumo
Neste capítulo, estudamos o conceito de análise de regressão linear
múltipla, e percebemos que devemos analisar três ou mais variáveis para
predizer com mais capacidade a relação entre variáveis.
Por outro lado, o estudo dos números-índices simples nos ajudam a
analisar a evolução de preços, quantidade e valor em certa época de cada
produto em separado, mas, às vezes, temos a necessidade de analisar um
grupo de produtos e não apenas um só. Para isso, temos que levar em
consideração o peso de cada produto dentro do grupo. Na determinação desse
tipo de números-índices, vamos usar o método dos agregados ponderados ou
números-índices compostos.

Atividades
1. Números-índices também chamados simplesmente de índices, são aplicados
geralmente em estudo estatístico de períodos sucessivos e podem ser
expressos por meio de relações diretas ou em porcentagens, assumindo
valores relativos ao do período escolhido como referência ou base. Com base
no seu entendimento, conceitue em síntese o índice de preço ao consumidor
(IPC).

2. Dada a equação da regressão linear múltipla, Y= 600 – 1,5x1 + 6,5x2,


encontre o valor de “Y” para: 1) x1 = 9 e x2 = 850 ; 2) x1 = 3,9 e x2 = 8,5 ; 3) x1
= 7 e x2 = 17.
a) 6111,5; 649,4; 700
b) 6125,7; 657,4; 760
c) 5111,9; 639,4; 720
d) 5134,5; 619,0; 710

3. A tabela a seguir traz informações anuais sobre o preço, quantidade e valor


da venda de motocicletas, entre os anos de 2001 a 2005. Com base nos
valores apresentados pela tabela, calcule o índice simples de preço com base
no ano de 2001.
ANO PREÇO DE VENDA (R$) QTDE VENDIDA
2001 3.000,00 60
2002 3.300,00 63
2003 3.900,00 60
2004 4.500,00 66
2005 4.800,00 72

a) Ip = R$100,00 ; R$115,00 ; R$135,00 ; R$155,00 ; R$165,00


b) Ip = R$100,00 ; R$118,00 ; R$138,00 ; R$158,00 ; R$169,00
c) Ip = R$100,00 ; R$112,00 ; R$132,00 ; R$152,00 ; R$162,00
d) Ip = R$100,00 ; R$110,00 ; R$130,00 ; R$150,00 ; R$160,00

4. Com os dados da tabela abaixo, calcule o índice de preços composto


estudado neste capítulo, usando como base o ano de 2002, em relação ao ano
de 2003 e 2004.

PRODUTOS (PREÇO E QUANTIDADE)


ANOS A B C
Preço Qtde Preço Qtde Preço Qtde
2002 1,20 5 5,60 3 7,00 5
2003 2,00 3 8,40 1 7,50 15
2004 2,00 1 8,90 0 7,90 20

a) R$115,00 ; R$122,00
b) R$120,00 ; R$130,00
c) R$126,00 ; R$132,00
d) R$116,00 ; R$142,00

Comentário das atividades


Na atividade 1, certamente você respondeu conceituando o Índice de
Preço ao Consumidor, ou IPC, é um índice composto pelos preços das
principais mercadorias consumidas e serviços utilizados por uma família típica.
Desta maneira, captando as variações destes preços no mercado, é possível
medir o impacto nas despesas de uma família típica. Com esse conceito, você
pode alcançar o objetivo proposto.
Na atividade 2, dada a seguinte equação da regressão linear múltipla
como sendo: Y= 600 – 1,5x1 + 6,5x2, o valor encontrado para o valor de “Y”
foi de 6125,7; 657,4; 760; portanto, a alternativa correta a ser assinalada é
(b).
Na atividade 3, com base nos valores apresentados pela tabela, o
cálculo do índice simples de preço de 2001 a 2005, com base no ano de 2001
foi os apurados como: Ip = R$100,00 ; R$110,00 ; R$130,00 ; R$150,00 ;
R$160,00. Portando a alternativa correta é (d).
Na atividade 4, com os dados da tabela, a apuração do índice de preços
composto, usando como base o ano de 2002, em relação ao ano de 2003 e
2004, foi de R$126,00; R$132,00; portanto, a alternativa correta a ser
assinalada foi (c).

Referência
ANDERSON, David R. Estatística aplicada a administração e economia. 2.
ed. São Paulo: Pioneira. 2002.

Você também pode gostar