Escolar Documentos
Profissional Documentos
Cultura Documentos
Marcelo Tavares
Estatstica Aplicada
Administrao
Estatstica Aplicada
Administrao
Copyright 2007. Todos os direitos desta edio reservados ao Sistema Universidade Aberta do Brasil. Nenhuma parte deste material
poder ser reproduzida, transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por escrito,
do autor.
PRESIDENTE DA REPBLICA
Luiz Incio Lula da Silva
MINISTRO DA EDUCAO
Fernando Haddad
SECRETRIO DE EDUCAO A DISTNCIA
Carlos Eduardo Bielschowsky
DIRETOR DO DEPARTAMENTO DE POLTICAS EM EDUCAO A DISTNCIA DPEAD
Hlio Chaves Filho
SISTEMA UNIVERSIDADE ABERTA DO BRASIL
Celso Costa
COMISSO EDITORIAL DO PROJETO PILOTO UAB/MEC
Marina Isabel Mateus de Almeida (UFPR)
Teresa Cristina Janes Carneiro (UFES)
Antonio Roberto Coelho Serra (UEMA)
Jonilto Costa Sousa (UnB)
Vicente Chiaramonte Pires (UEM)
Ozrio Kunio Matsuda (UEM)
Anderson de Barros Dantas (UFAL)
ORGANIZAO DO CONTEDO
Prof. Marcelo Tavares
PROJETO GRFICO
Annye Cristiny Tessaro
Mariana Lorenzetti
DIAGRAMAO
Annye Cristiny Tessaro
Victor Emmanuel Carlson
REVISO DE PORTUGUS
Renato Tapado
Patrcia Regina da Costa
Sumrio
Introduo.....................................................................................07
UNIDADE 1 Estatstica descritiva
Estatstica descritiva....................................................................................11
UNIDADE 2 Introduo a probabilidades
Introduo a probabilidades........................................................................41
UNIDADE 3 Amostragem
Amostragem............................................................................73
UNIDADE 4 Testes de Hipteses
Testes de Hipteses..............................................................................103
Referncias.....................................................................................133
Anexos.....................................................................................135
Uma sugesto de
referncia
NEUFELD, John L.
Estatstica Aplicada
Administrao usando
Excel. v.1. So Paulo:
Prantice Hall, 2003
Para saber mais v ao
site www.ibge.gov.br
Introduo
O cidado comum pensa que a estatstica se resume apenas a
apresentar tabelas de nmeros em colunas esportivas e/ou econmicas
de jornais e revistas, ilustradas com grficos, pilhas de moedas, etc.,
ou quando muito associam a estatstica previso de resultados eleito-
rais. A estatstica no se limita somente a compilar tabelas de dados e
os ilustrar graficamente. Sir Ronald Fisher (1890-1962), em seus tra-
balhos, iniciou a estatstica como mtodo cientfico. Desta forma, o
trabalho do estatstico passou a ser o de ajudar a planejar a obteno
de dados, interpretar e analisar os dados obtidos e apresentar os resul-
tados de maneira a facilitar a tomada de decises razoveis.
Didaticamente, podemos dividir a estatstica em duas partes: a
estatstica descritiva e a inferncia estatstica.
A estatstica descritiva preocupa-se com a forma pela qual pode-
mos apresentar um conjunto de dados em tabelas e grficos, e tambm
resumir as informaes contidas nestes dados mediante a utilizao de
medidas estatsticas.
J a inferncia estatstica baseia-se na teoria das probabilidades
para estabelecer concluses sobre todo um grupo (chamado popula-
o), quando se observou apenas uma parte (amostra) representativa
desta populao.
Uma grande quantidade de informaes importantes que auxili-
am na tomada de decises est no site do Instituto Brasileiro de Geo-
grafia e Estatstica (IBGE). Todo o clculo das estatsticas pode ser
feito por meio de calculadoras cientficas e tambm softwares estats-
ticos. As planilhas eletrnicas permitem o clculo de diversas estatsti-
cas e confeco de grficos de forma mais rpida e eficiente.
necessrio ter em mente que a estatstica uma ferramenta
para o gestor ou executivo, nas respostas dos porqus de seus pro-
blemas que podem ser explicados por uma anlise de dados. Para ela
ser bem usada, necessrio conhecer os seus fundamentos e princpi-
os, e acima de tudo que o gestor ou executivo desenvolva um esprito
crtico e jamais deixe de pensar. Pois fcil mentir usando a estatsti-
ca, o difcil falar a verdade sem usar a estatstica.
Atualmente, as empresas tm procurado profissionais como exe-
cutivos que tenham um nvel de conhecimento de estatstica alto, pois
este conhecimento tem feito uma diferena grande nos processos
decisrios em empresas.
Este livro ser dividido em quatro Unidades:
Unidade 1 Estatstica Descritiva (Descrio de amostras
por meio de distribuies de freqncias, e medidas de posi-
o e disperso);
Unidade 2 Probabilidades (Conceitos bsicos de probabili-
dades, variveis aleatrias uni e bidimensionais) e Distribui-
es de Probabilidades (discretas e contnuas);
Unidade 3 Amostragem (probabilstica e no probabilstica),
Distribuies Amostrais (Distribuies t de Student, qui-qua-
drado e F) e Intervalos de Confiana (mdia, proporo); e
Unidade 4 Processos Decisrios (Testes de Hipteses).
UNIDADE
1
Estatstica descritiva
Estatstica descritiva
10
Curso de Graduao em Administrao a Distncia
Objetivo
Esta Unidade tem por objetivo fazer com que voc tenha condies
de descrever e apresentar os resultados de um conjunto de observaes
de forma clara, objetiva e passando o mximo de informaes possveis.
Para tal objetivo, sero abordadas as distribuies de freqncias, anlises
grficas, medidas de posio e disperso.
Mdulo 4
11
Estatstica descritiva
Qualquer conjunto de dados, tais como o tempo de uma ligao
telefnica, a velocidade de processamento de um computador, a pro-
poro de participao no mercado das empresas de um determinado
setor, suscetibilidade de empresas a uma determinada mudana no
mercado, opinio dos alunos quanto didtica de um professor, etc.,
contm informao sobre algum grupo de indivduos. As possveis
diferenas entre indivduos determinam a variao que est sempre
presente na anlise de dados.
Uma caracterstica que pode assumir diferentes valores de indi-
vduo para indivduo denominada varivel, pois de outra forma se-
ria denominada constante.
A classificao das variveis em qualitativas e quantitativas foi
apresentada na disciplina de Metodologia de Pesquisa. Caso no se
lembre, reveja o material de Metodologia de Pesquisa.
Desta forma, apenas para relembrar, como voc faria a classifi-
cao das seguintes variveis?
a) Nmero de pginas desta unidade;
b) peso dos funcionrios do setor de marketing de uma
empresa;
c) tipos de empresas em relao a adoo de determina-
da tcnica; e
d) tamanho de empresas (pequena, mdia e grande).
Respostas: a) quantitativa discreta; b) quantitativa contnua;
c) qualitativa nominal; d) qualitativa ordinal.
Os dados qualitativas so divididos em nominais e ordinais;
enquanto os dados quantitativas so divididos em discretas e
contnuas.
12
Curso de Graduao em Administrao a Distncia
Quando voc coleta os dados para uma pesquisa, estas observa-
es so chamadas de dados brutos. Um exemplo de dados brutos
corresponde ao tempo em minutos que consumidores de uma determi-
nada operadora de telefonia celular utilizariam em um ms (dados simu-
lados pelo autor a partir de um caso real). Os dados foram obtidos em uma
pesquisa de mercado e apresentados na forma em que foram coletados
(Tabela 1), por este motivo so denominados dados brutos*.
Geralmente, este tipo de dado traz pouca ou nenhuma informa-
o ao leitor, sendo necessrio organizar os dados, com o intuito de
aumentar sua capacidade de informao.
GLOSSRIO
*Dados Brutos:
dados na forma em
que foram coletados,
sem nenhum trata-
m e n t o . F o n t e :
Lacombe (2004)
GLOSSRIO
*Rol a mais sim-
ples organizao
numrica. a orde-
nao dos dados em
ordem crescente ou
decrescente.
*Amplitude Total
corresponde dife-
rena entre o maior
e o menor valor ob-
servado em um con-
junto de dados. No-
taremos por A.
Tabela 1: Tempo (T) em minutos de uso de telefone celular por consu-
midores (C) de uma determinada operadora
Como voc pode observar na Tabela 1, a simples organizao
dos dados em um rol* aumenta muito a capacidade de informao
destes. Na Tabela 2, voc pode verificar que o menor tempo observa-
do foi 82 minutos, e o maior, 210 minutos, o que nos fornece uma
amplitude total* de variao da ordem de 128 minutos.
Outra informao que podemos obter nos dados por meio da
Tabela 2 (organizada em rol crescente) que alguns tempos, como
122 min, 132 min, 138 min e 142 min, foram os mais freqentes, ou
seja, os mais citados na pesquisa.
C
1
2
3
4
5
6
7
8
T
104
108
138
101
163
141
90
154
C
9
10
11
12
13
14
15
16
T
122
142
106
201
169
120
210
98
C
17
18
19
20
21
22
23
24
T
129
138
122
161
167
189
132
127
C
25
26
27
28
29
30
31
32
T
144
151
146
82
137
132
172
87
C
33
34
35
36
37
38
39
40
T
183
138
115
179
142
111
140
136
Mdulo 4
13
Ento surge uma pergunta:
Como voc pode organizar os dados de uma forma mais efi-
ciente, na qual se possa apresentar uma quantidade maior
de informaes?
Uma maneira de organizar um conjunto de dados para voc
melhor represent-lo por meio de uma tabela de distribuio de
freqncias (tabela onde so apresentadas as freqncias de cada uma
das classes).
Distribuindo-se os dados observados em classes* e contando-se
o nmero de observaes contidas em cada classe, obtm-se a fre-
qncia de classe. Veja que a disposio tabular dos dados agrupa-
dos em classes, juntamente com as freqncias correspondentes, se
denomina distribuio de freqncias.
Por exemplo, para o caso do tempo em minutos do uso de
celulares, pode-se desejar incluir em uma nica classe todos
os indivduos que possuam tempo entre 128 e 138 minutos
assim, a classe ir variar de 128 a 138 minutos.
GLOSSRIO
*Classes: Interva-
los nos quais os va-
lores da varivel
analisada so agru-
pados.
Tabela 2: Tempo em minutos de uso de telefone celular por consumido-
res de uma determinada operadora (dados em rol crescente).
82
87
90
98
101
104
106
108
111
115
120
122
122
127
129
132
132
136
137
138
138
138
140
141
142
142
144
146
151
154
161
163
167
169
172
179
183
189
201
210
14
Curso de Graduao em Administrao a Distncia
, para
n s 100; ,
para n > 100
Este tipo de intervalo
o mais utilizado.
Para identificar uma classe, deve-se conhecer os valores dos limites
inferior e superior da classe, que delimitam o intervalo de classe.
Neste ponto, surge uma dvida.
Indivduos que apresentem tempo exatamente iguais a 128 ou
a 138 minutos pertencem ou no a esta classe? (128 a 138)
Deste modo, surge a necessidade de definir a natureza do inter-
valo de classe, se aberto ou fechado. Portanto, podemos ter exem-
plo de notao dos diferentes tipos de intervalos: Intervalos abertos*
128 min 138 min; Intervalos fechados* 128 min ||
138 min. Pode-se ter ainda intervalos mistos*, como por exemplo:
128 min | 138 min.
Vamos, ento, a partir dos dados do exemplo relativo ao tem-
po de utilizao dos celulares, construir uma distribuio de
freqncia e ao longo deste exerccio identificar conceitos
presentes em uma distribuio de freqncias.
Ento, vamos exercitar.
Para elaborar uma distribuio de freqncias necessrio que
primeiramente, se determine o nmero de classes (k) em que os da-
dos sero agrupados. Por questes de ordem prtica e esttica, sugere-
se utilizar de 5 a 20 classes. O nmero de classes (k) a ser utilizado,
pode ser calculado em funo do nmero de observaes (n).
Na pesquisa, como temos n = 40 consumidores, teremos, ento,
o nmero de classes definido por = = 6,32, e como o
nmero de classes inteiro, usaremos 6 classes. O arredondamento
utilizado neste material o padro de algarismos significativos (como
foi aprendido no Ensino Mdio). O nmero de classes pode tambm
ser definido de uma forma arbitrria sem o uso desta regra.
GLOSSRIO
*Intervalos abertos
os limites da classe
(inferior e superior)
no pertencem a ela.
*Intervalos fecha-
dos os limites de
classe (superior e
inferior) pertencem
classe em questo.
*Intervalos mistos
um dos limites per-
tence classe, e o
outro, no.
Mdulo 4
15
onde:
c = amplitude de
classe; A = amplitude
total; e k = nmero de
classes.
PM = onde:
LI: Limite inferior; e
LS: Limite superior
Aps voc determinar o nmero de classes (k) em que os dados
sero agrupados, deve-se, ento, determinar a amplitude do interva-
lo de classe (c).
Para calcularmos a amplitude do intervalo de classe, vamos pri-
meiramente calcular a amplitude total dos dados (A), que
corresponde diferena entre o maior valor observado e o menor
valor observado. No nosso caso, teremos A = 210 82 =128 mm.
Com base neste valor da amplitude total (A) calculado, vamos
obter a amplitude do intervalo de classe (c), como mostrado a seguir:
Deve ficar claro para voc, que existem outros procedimentos
para determinao da amplitude do intervalo de classe que podem ser
encontrados na literatura.
Conhecida a amplitude de classes, voc deve determinar os in-
tervalos de classe. O limite inferior e o superior das classes devem ser
escolhidos de modo que o menor valor observado esteja localizado no
ponto mdio (PM) da primeira classe.
Partindo deste raciocnio, ento, o limite inferior da primeira
classe ser:
Limite inf. 1 = menor valor .
No nosso caso, temos: Limite inf. 1 = 82 = 69,2 min
Definindo, ento, o limite inferior da primeira classe, para obter-
mos as classes da nossa distribuio, basta que somemos a amplitude
do intervalo de classe a cada limite inferior.
Assim, teremos:
69,2 | 94,8 primeira classe
94,8 | 120,4 segunda classe
20,4 | 146,0 terceira classe
146,0 | 171,6 quarta classe
171,6 | 197,2 quinta classe
197,2 | 222,8 sexta classe
16
Curso de Graduao em Administrao a Distncia
Ento, voc pode obter uma tabela como a apresentada a seguir.
A freqncia absoluta (fa) corresponde ao numero de ob-
servaes que temos em uma determinada classe ou em um
determinado atributo de uma varivel qualitativa e a freqn-
cia relativa (fr) corresponde proporo do nmero de ob-
servaes em uma determinada classe em relao ao total
de observaes que temos.
Esta freqncia pode ser expressa em termos porcentuais. Para
isto, basta multiplicar a freqncia relativa obtida por 100.
Tabela 3: Distribuio de freqncias do tempo em minutos de uso de
telefone celular por consumidores de uma determinada operadora
Na tabela, aparece uma nova denominao chamada freqn-
cia. Podem ter freqncias chamadas de freqncia absoluta (fa),
freqncia relativa (fr) e freqncia acumulada (discutida posterior-
mente).
O clculo da freqncia relativa obtido por meio da seguinte
expresso:
, com fa
i
= freqncia absoluta da classe i.
Apresentando os dados na forma de distribuio de freqncia,
voc consegue sintetizar as informaes contidas neles, alm de facili-
Classes (mm)
69,2 | 94,8
94,8 | 120,4
120,4 | 146,0
146,0 | 171,6
171,6 | 197,2
197,2 | 222,8
Total
Freqncia
?
?
?
?
?
?
Mdulo 4
17
tar sua visualizao. Na Tabela apresentada a seguir, temos as freqn-
cias (fa e fr) relacionadas ao tempo de utilizao do aparelho celular.
Como ficaria, ento, a interpretao da distribuio de freqncias?
Pode-se verificar claramente na Tabela 4 que os tempos de utili-
zao do celular das 40 pessoas avaliadas em questo esto concen-
trados nas classes segunda, terceira e quarta, decrescendo em direo
s classes do incio e do fim da tabela. A apresentao dos dados em
forma de distribuio de freqncia facilita ainda o clculo manual de
vrias medidas estatsticas de interesse e sua apresentao grfica.
Alm das freqncias absolutas e relativas, muitas vezes pode-
se estar interessado na quantidade de observaes que existe acima ou
abaixo de um determinado ponto na distribuio.
Desta forma, podemos trabalhar com a freqncia acumulada*.
A ttulo de ilustrao, voc pode visualizar nas Tabelas 4 e 5,
respectivamente, as freqncias acumuladas para cima e para baixo
dos tempos de utilizao das 40 pessoas avaliadas na pesquisa. A fre-
qncia acumulada apresentada na Tabela 4 pode ser obtida da se-
guinte forma: abaixo do limite superior da primeira classe, temos trs
pessoas que esto presentes nesta classe, como pode ser visto na Ta-
bela 3 da distribuio de freqncias absoluta. Quando consideramos
a segunda classe, a freqncia acumulada corresponde ao nmero de
Tabela 4: Distribuio de freqncias do tempo em minutos de uso de
telefone celular por consumidores de uma determinada operadora
GLOSSRIO
*Freqncia Acu-
mulada Freqn-
ci a Acumul ada
corresponde soma
da freqncia da-
quela classe s fre-
qncias de todas as
classes abaixo dela.
Classes (mm)
69,2 | 94,8
94,8 | 120,4
120,4 | 146,0
146,0 | 171,6
171,6 | 197,2
197,2 | 222,8
Total
fa (consumidores)
3
8
16
7
4
2
40
fr (proporo de consumidores)
0,075
0,200
0,400
0,175
0,100
0,050
1,000
18
Curso de Graduao em Administrao a Distncia
pessoas que temos abaixo do limite superior desta classe, ou seja, as
oito pessoas da segunda classe mais as trs pessoas da primeira classe,
totalizando 11 pessoas abaixo de 120,4 minutos. Para as outras clas-
ses, o raciocnio semelhante.
Um bom exemplo de aplicao das distribuies de freqncias
acumuladas corresponde identificao de uma determinada freqn-
cia abaixo ou acima de um determinado valor que no corresponde ao
limite superior ou inferior de uma classe qualquer.
Podemos, ento, querer verificar qual a porcentagem de pessoas
que utilizam o celular por um tempo inferior a 146 minutos, e para
isto, basta consultar diretamente a Tabela 4 e verificar a freqncia
acumulada abaixo deste valor (6,75%), pois o valor 146 minutos
corresponde a um dos limites de classe apresentados nesta tabela.
E se voc quiser saber a proporo de pessoas que utilizam
o celular por menos de 150 minutos?
Para podermos obter esta freqncia, necessrio que venha-
mos a pressupor que os tempos de utilizao estejam uniformemente
Tabela 5: Distribuio de freqncia acumulada do tempo em minutos
de uso de telefone celular por consumidores de uma determinada
operadora
Tempo (mim)
69,2 | 94,8
94,8 | 120,4
120,4 | 146,0
146,0 | 171,6
171,6 | 197,2
197,2 | 222,8
Total
Freq. acumulada
0
3
11
27
34
38
40
Freq. acumulada (relativa)
0,000
0,075
0,275
0,675
0,850
0,950
1,000
Mdulo 4
19
distribudos dentro das classes. O clculo baseado nos dados da Ta-
bela 4 e so apresentados a seguir.
Freq. acumulada relativa abaixo da classe imediatamente
inferior a 150 (abaixo de 146) = 0,675; e
Freq. acumulada relativa abaixo da classe imediatamente
superior a 150 (abaixo de 171,6) = 0,850;
Proporo de consumidores com tempo de uso abaixo de
146,0 min = 0,675
Proporo de consumidores com tempo de uso abaixo de
171,6 min = 0,850
Freq. entre 146,0 e 171,6 min = 0,175
de 146,0 a 171,6 min so 25,6 min
de 146,0 a 150,0 min so 4,0 min
assim,
(diferena) no tempo variao (diferena) na proporo
25,6 min -------------------------------------------- 0,175
4,0 min ------------------------------------------------- x
Portanto, fazendo o clculo da regra de trs apresentada anteri-
ormente, teremos o valor de x.
Portanto, como abaixo de 140,0 min existe uma proporo
de 0,675 e entre 140,0 e 150 min existe uma proporo de
0,0273, conclui-se, ento, que abaixo de 150 min existe uma
proporo de 0, 7023 (0, 675 + 0, 0273). Em termos
porcentuais, isto corresponde a 70,23% dos consumidores.
20
Curso de Graduao em Administrao a Distncia
importante ressaltar que este resultado aproximado, devido
perda de informao pelo fato de a tabela ser intervalar, ou seja, as
classes esto em intervalos.
Quando voc trabalha com variveis qualitativas, os atributos
so as variaes nominativas da varivel. A construo da tabela con-
siste em contar as ocorrncias de cada atributo. O resultado da conta-
gem define a freqncia absoluta do atributo. Para podermos entender
isto, tomemos como exemplo uma pesquisa na qual se procurou avali-
ar o nmero de pessoas de diferentes sexos em uma determinada em-
presa. Estes resultados so apresentados na Tabela 6.
Tomando, por exemplo, o caso de uma varivel aleatria dis-
creta (conceito visto em Metodologia de Pesquisa), realizou-se no
SAC (Servio de Atendimento ao Consumidor) de uma empresa um
estudo referente ao nmero de reclamaes (N.R.) atendidas diaria-
mente, durante um certo ms, obtendo os seguintes resultados:
Tabela 6: Distribuio de freqncias do nmero de
funcionrios em relao ao seu sexo em 2006
Sexo
Masculino
Feminino
Total
fa
20
30
50
fr
0,40
0,60
1,00
N.R.
0
2
1
5
3
2
Dia
7
8
9
10
11
12
N.R.
1
2
2
3
0
3
Dia
13
14
15
16
17
18
N.R.
0
0
1
2
3
5
Dia
19
20
21
22
23
24
N.R.
1
0
0
2
0
4
Dia
25
26
27
28
29
30
N.R.
0
3
4
0
2
1
Mdulo 4
21
Dispondo estes dados em um rol (crescente), tem-se:
0 0 0 0 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 4 4 5 5
Podemos, ento, apresentar a seguir estes dados em uma distri-
buio de freqncias. Neste caso, no necessrio definir intervalos
de classes, porque a variao dos valores pequena.
Verificamos que os valores da varivel discreta correspondem a
cada uma das classes.
Surge, ento, uma pergunta:
As tabelas de distribuio de freqncias so a nica forma
que voc tem de apresentar um conjunto de dados?
Para responder a esta pergunta, vamos falar um pouco sobre al-
gumas formas de representao grfica de tabelas de freqncia.
Logicamente, dependendo do tipo de varivel, temos um grfico mais
adequado. Os diferentes tipos de grfico, (histogramas, polgonos de
freqncia, ogivas, grficos de setores, pictogramas e outros) permi-
tem uma melhor visualizao de resultados. Estes grficos podem ser
obtidos utilizando planilhas eletrnicas, como por exemplo, o Excel.
Tabela 7: Nmero de reclamaes atendidas diariamente,
durante certo ms
Numero de reclamaes por dia
0
1
2
3
4
5
Total
Nmero de dias (fa)
9
5
7
5
2
2
30
Freq. Relativa
0.3
0.17
0.23
0.17
0.07
0.07
1
22
Curso de Graduao em Administrao a Distncia
Os histogramas* so grficos utilizados para representar tabe-
las intervalares.
GLOSSRIO
* h i s t o g r a m a
Histogramas: so
constitudos por um
conjunto de retn-
gulos, com as bases
assentadas sobre um
eixo horizontal, ten-
do o centro da mes-
ma no ponto mdio
da classe que repre-
senta, e cuja altura
proporcional fre-
qncia da classe.
*Polgono de fre-
qncias um gr-
fico de anlise no
qual as freqncias
das classes so loca-
lizadas sobre per-
pendiculares levan-
tadas nos pontos
mdios das classes.
J o polgono de freqncia*, voc pode obter pela simples
unio dos pontos mdios dos topos dos retngulos de um histograma.
Completa-se o polgono unindo as extremidades da linha que ligam os
pontos representativos das freqncias de classe aos pontos mdios
das classes, imediatamente, anterior e posterior s classes extremas,
que tm freqncia nula.
Figura 1: Histograma representativo da distribuio de
freqncias do tempo em minutos de uso de telefone celular
por consumidores de uma determinada operadora
Figura 2: Polgono de Freqncias do tempo em minutos de uso de telefone celular
por consumidores de uma determinada operadora
Mdulo 4
23
Quando temos uma tabela de varivel qualitativa, um tipo de
grfico adequado para apresentar os resultados corresponde ao grfi-
co de setores, tambm popularmente conhecido como grfico tipo
pizza. Sua construo simples: sabe-se que o ngulo de 360 equiva-
le a 100% da rea da circunferncia; assim, para obter-se o ngulo do
setor cuja rea representa uma determinada freqncia, basta resolver
uma regra de trs simples, como a apresentada a seguir:
360 ---------------- 100%
x ------------------- Freq. Relativa (Porcentual)
Os grficos chamados de ogivas correspondem a um polgono
de freqncias acumuladas, nas quais estas freqncias so localiza-
das sobre perpendiculares levantadas nos limites inferiores ou superi-
ores das classes, dependendo se a ogiva representar as freqncias
acumuladas.
Figura 3: Grfico do sexo de pessoas que trabalham em
uma determinada empresa
24
Curso de Graduao em Administrao a Distncia
Aps o estudo da construo de distribuies de freqncias e
grficos que as representam, voc deve ser capaz de organizar um
conjunto de dados, por meio de uma distribuio de freqncias (ab-
soluta, relativa, e acumuladas) e represent-lo graficamente.
Saiba mais...
Visite o site de como usar a planilha Cal, do pacote
OpenOffice, nas estatsticas descritivas, em: http://www2.ufpa.br/
dicas/open/oo-ind.htm
Vamos, ento, fazer um exerccio para fixar os conhecimentos
adquiridos. (As respostas esto no final do livro.)
-
Figura 4: Ogiva "abaixo de" do tempo em minutos que consumidores
de uma determinada operadora de telefonia celular utilizariam em um
ms se houvesse uma reduo na tarifa de 20%
Mdulo 4
25
-
Exerccio 1: tem-se a seguir o tempo em minutos de reunies
em um setor de uma empresa.
GLOSSRIO
*A mdia aritmti-
ca, ou simplesmen-
te mdia de um con-
junto de n observa-
es, x
1
, x
2
,...,x
n
definida como:
O somatrio ()
corresponde soma
de todos os valores
obtidos.
a) Construa a distribuio de freqncias absoluta, relativa e
acumulada; e
b) Determine o nmero de reunies em que o tempo foi me-
nor do que 50, a partir da distribuio de freqncias.
Medidas de posio
As medidas de posio ou de tendncia central constituem uma
forma mais sinttica de apresentar os resultados contidos nos dados
observados, pois representam um valor central, em torno do qual os
dados se concentram. As medidas de tendncia central mais emprega-
das so a mdia, a mediana e a moda.
A mdia aritmtica* a mais usada das trs medidas de posi-
o mencionadas, por ser a mais comum e compreensvel delas, bem
como pela relativa simplicidade do seu clculo, alm de prestar-se bem
ao tratamento algbrico.
Considerando o caso do nmero de reclamaes em um SAC
(ver em distribuies de freqncia), se voc somar todos os valores
do nmero de reclamaes e dividir pelo nmero de dias, voc ter
ento a mdia aritmtica ( ) do nmero de reclamaes.
Ento, o valor obtido ser: = 1,73 reclamaes por dia.
45
50
42
41
52
51
44
41
50
46
50
46
60
54
52
58
57
58
60
51
26
Curso de Graduao em Administrao a Distncia
Voc pode interpretar este resultado da mdia como sendo o
nmero de reclamaes mdio por dia, que de 1,73, po-
dendo ocorrer dias em que o nmero de reclamaes pode
ser maior ou menor que o valor mdio encontrado.
Portanto, de uma forma mais geral, podemos interpretar a mdia
como sendo um valor tpico do conjunto de dados. Pode ser um valor
que no pertence ao conjunto de dados.
Se os dados estiverem agrupados na forma de uma distribuio
de freqncia em classes, lana-se mo da Hiptese Tabular Bsica*
para o clculo da mdia.
Ento, voc vai calcular a mdia por meio da seguinte expresso:
sendo x
i
: ponto mdio da classe i; fa
i
: freqncia absoluta da classe i;
fr
i
: freqncia relativa da classe i.
Considerando o caso do tempo de uso em minutos do celular
(ver no item distribuies de freqncias), a mdia ser dada por:
O valor de 82 apresentado na expresso corresponde ao ponto
mdio da primeira classe, o qual foi obtido pela soma dos limites supe-
rior e inferior, dividido por dois, ou seja, a mdia aritmtica. Os pon-
tos mdios das outras classes so obtidos de forma similar.
GLOSSRIO
*Hiptese Tabular
Bsica todas as
observaes conti-
das numa classe so
consideradas iguais
ao ponto mdio da
classe.
Mdulo 4
27
Existem outros tipos de mdia que podem ser utilizados, como
por exemplo, mdia ponderada (utilizada quando existe algum fator
de ponderao), mdia geomtrica (quando os dados apresentam uma
distribuio que no simtrica) e outras.
s vezes, associam-se s observaes x
1
,x
2
,...,x
n
determinadas
ponderaes ou pesos w
1
,w
2
,...,w
n
, que dependem da importncia atri-
buda a cada uma das observaes; neste caso, a mdia ponderada
dada por:
Como exemplo, voc pode considerar um processo de avaliao
de um funcionrio em trs etapas. Um funcionrio apresentou as se-
guintes notas durante a avaliao: 1 etapa = 90; 2 etapa = 70; 3 etapa
= 85, e os pesos de cada etapa so 1, 1 e 3, respectivamente. Qual o
score mdio final do funcionrio?
Outro tipo de mdia corresponde geomtrica (Mg). Ela cal-
culada pela raiz n-sima do produto de um conjunto de n observaes,
x
1
,x
2
,...,x
n
, associadas s freqncias absolutas f
1
,f
2
,..., f
n
, e, respecti-
vamente, dada por:
Este tipo de mdia, voc vai trabalhar na disciplina de Ma-
temtica Financeira.
Em algumas situaes, voc ver que necessria a informao
do nmero de observaes que mais ocorre em um conjunto de dados.
28
Curso de Graduao em Administrao a Distncia
No caso do nmero de reclamaes no SAC, verifica-se que o que
mais ocorre zero, ou seja, em vrios dias no ocorre nenhuma recla-
mao. Assim, podemos, ento, definir a moda (Mo) como sendo o
valor em um conjunto de dados que ocorre com maior freqn-
cia. Um conjunto de dados pode ser unimodal (uma moda) ou amodal
(no possuir moda, pois no existe nenhum valor que ocorre com mai-
or freqncia) ou multimodal (possui mais de uma moda).
Quando os dados no esto em intervalos de classes, basta olhar
o valor que ocorre com maior freqncia.
Para dados agrupados em intervalos de classes, voc pode cal-
cular a moda por meio do mtodo de Czuber, que se baseia na influn-
cia das classes adjacente na moda, deslocando-se no sentido da classe
de maior freqncia. A expresso que voc utilizar :
onde:
L
i
: limite inferior da classe modal;
d
1
: diferena entre a freqncia da classe modal e a imediata-
mente anterior;
d
2
: diferena entre a freqncia da classe modal e a imediata-
mente posterior; e
c: amplitude da classe modal.
No caso do tempo de uso de aparelhos celulares (ver a tabela no
item distribuio de freqncias), teremos que a classe modal a ter-
ceira, pois apresenta maior freqncia. Utilizando a expresso mostra-
da anteriormente, teremos:
Uma caracterstica importante da moda que ela no afetada
pelos valores extremos da distribuio, desde que estes valores no
constituam a classe modal.
Mdulo 4
29
Desta forma, a moda deve ser utilizada quando desejamos obter
uma medida rpida e aproximada de posio ou quando a medida deva
ser o valor mais freqente da distribuio.
Outra medida de posio que voc pode utilizar a mediana (Md).
Em um conjunto de valores dispostos segundo uma ordem
(crescente ou decrescente), o valor situado de tal forma no
conjunto que o separa em dois subconjuntos de mesmo n-
mero de elementos, ou seja, 50% dos dados so superiores
mediana, e 50% so inferiores.
O smbolo da mediana dado por Md ou . A posio da medi-
ana dada por meio da expresso: E (elemento central) = (n+1) / 2.
Considerando um conjunto de dados com nmero mpar de ele-
mentos como (1, 2, 5, 9, 10, 12, 13), a posio da mediana ser dada
por (7 + 1)/2 = 4 posio. Portanto, a partir dos dados ordenados, o
nmero que se encontra na 4 posio o 9, e assim a mediana ser
igual a 9. (Temos trs valores abaixo e trs valores acima ou 50%
acima da mediana, e 50% abaixo)
Caso o nmero de elementos do conjunto de dados for par, como
por exemplo, (1, 2, 6, 8, 9, 12, 11, 13), encontra-se a posio da medi-
ana (( 8 + 1)/2 = 4,5 posio). Como a posio 4,5 est entre a 4 e a
5 posio, calcula-se a mdia entre os valores que ocupam estas posi-
es. O valor encontrado de 8,5 corresponde mediana.
Quando os dados esto agrupados na mediana devemos encon-
trar a classe mediana.
Se os dados esto agrupados em intervalos de classe, como no
caso do tempo de utilizao do telefone, utilizaremos a seguinte ex-
presso:
30
Curso de Graduao em Administrao a Distncia
onde: l
i
: limite inferior da classe mediana; n: nmero total de elemen-
tos; f
antac
: freqncia acumulada anterior classe mediana; f
med
: fre-
qncia absoluta da classe mediana e a amplitude da classe mediana.
Portanto, resolvendo o caso do tempo de utilizao dos celula-
res, teremos que a posio da mediana ser dada por E = 40/2 = 20
elemento, o qual est na terceira classe (120,4 | 146), que corresponde
classe mediana.
Em um conjunto de dados, a mediana, a moda e a mdia no
necessariamente devem apresentar o mesmo valor. Uma informao
importante de que a mediana no influenciada pelos valores extre-
mos. Comparando os resultados encontrados para uma amostra em
relao s medidas de posio estudadas e verificando a inter-relao
entre elas, voc pode concluir que seus valores podem nos dar um
indicativo da natureza da distribuio dos dados, em funo das re-
gras definidas a seguir:
Outras medidas de posio denominadas separatrizes sero de-
finidas a seguir.
A principal caracterstica das medidas separatrizes consiste na
separao da srie em partes iguais que apresentam o mesmo nmero
de valores.
As principais so os quartis, decis e percentis.
Os quartis so valores de um conjunto de dados ordenados, que
os dividem em quatro partes iguais. necessrio, portanto, trs quartis
Mdulo 4
31
(Q
1
, Q
2
e Q
3
) para dividir um conjunto de dados ordenados em quatro
partes iguais.
Q
1
: deixa 25% dos elementos abaixo dele.
Q
2
: deixa 50% dos elementos abaixo dele e coincide com a
mediana.
Q
3
: deixa 75% dos elementos abaixo dele.
A figura abaixo mostra bem o quartis:
Se considerarmos o exemplo do nmero de reclamaes por dia
em um SAC, teremos de forma semelhante a figura anterior:
Para valores no tabelados, pode ser dito que o primeiro quartil
pode ser obtido como a mediana da primeira metade dos dados, e para o
terceiro quartil, como a mediana da segunda metade. Para dados tabela-
dos, a frmula da mediana pode ser adaptada para os demais quartis.
Medidas de disperso
Como foi visto anteriormente, podemos sintetizar um conjunto
de observaes em alguns valores representativos como mdia, medi-
ana, moda e quartis. Em vrias situaes, torna-se necessrio visualizar
como os dados esto dispersos. Tomando como exemplo vrias em-
presas que apresentem salrios mdios iguais, podemos concluir, en-
to, que a contribuio social (% do salrio) ser a mesma? Somente
32
Curso de Graduao em Administrao a Distncia
O termo amplitude
total foi visto anterior-
mente na construo
de uma distribuio de
freqncia em classes.
Relembrando, a
diferena entre o
maior e o menor valor
observados.
com base no salrio mdio, sim, mas estaramos chegando a uma con-
cluso errada. A variao em termos de faixas salariais pode ser dife-
rente, apesar de apresentarem a mesma mdia. Pensando no que foi
dito anteriormente, considere o valor (em reais) ganho por dia de trs
grupos de empregados (A: 70, 70, 70, 70, 70; B: 50, 60, 70, 80, 90; C:
5, 15, 50, 120, 160).
Podemos verificar que, apesar de apresentarem a mesma mdia
(70), os trs grupos apresentam comportamento diferenciado, pois o
grupo A o mais homogneo, e o grupo C o que apresenta maior
variao de ganho por dia. Portanto, devemos sempre inserir junto a
uma medida de posio uma medida que avalie esta distribuio, ou
seja, a variabilidade de um conjunto de dados. Portanto, quanto maior
a variabilidade, maior ser a disperso das observaes.
Uma primeira medida de disperso que vamos comentar a
amplitude total. No caso dos ganhos dirios, podemos obter os se-
guintes resultados:
A
A
= 70 70 = 0 A
B
= 90 50 = 40 A
C
= 160 5 = 155
Verificamos, ento, que o grupo C o que apresenta maior vari-
abilidade, e que o grupo A corresponde ao de menor variabilidade.
Deste modo, o grupo C corresponde quele que teve maior vari-
abilidade em torno da mdia.
No caso de dados agrupados, a amplitude total calculada por
meio da diferena entre o ponto mdio da ltima classe e o ponto m-
dio da primeira classe.
A amplitude total tem a desvantagem de s levar em conta os
dois valores extremos, por isso apenas uma indicao aproximada
da disperso. Outra desvantagem que a amplitude total apresenta
muita variao de uma amostra para outra, mesmo que ambas sejam
extradas da mesma populao.
Portanto, voc deve trabalhar com uma medida que leve em con-
siderao todas as observaes. Desta forma, podemos querer verifi-
car o quanto um conjunto de observaes est mais prximo ou mais
distante de uma medida, que no caso ser a mdia. Ento, voc pode
Mdulo 4
33
calcular o desvio de cada valor em relao mdia ( ), e se
fizermos o somatrio destes desvios, o resultado ser igual a zero. Se
voc elevar este desvio ao quadrado e somar, teremos o que chama-
mos de soma de quadrado dos desvios. Dividindo este somatrio pelo
total de observaes, teremos uma idia da disperso das observaes
em relao mdia. Esta medida que acabamos de visualizar de forma
intuitiva corresponde varincia. Portanto, voc pode concluir que a
varincia sempre assumir valores positivos.
Quando o nosso interesse o de tirar inferncias vlidas para
toda a populao a partir de uma amostra (poro repre-
sentativa da populao), deve-se trocar na frmula da
varincia N por n 1, onde:
N corresponde ao tamanho da populao; e
n corresponde ao tamanho da amostra utilizada.
As expresses para clculo das varincias populacional e amostral
so apresentadas a seguir.
Quando temos os dados agrupados em intervalos de classes, o x
i
corresponde ao ponto mdio da classe, e f
i
freqncia da classe.
Como a varincia calculada a partir dos quadrados dos desvi-
os, ela um nmero que apresenta a unidade elevada ao quadrado em
relao varivel que no est elevada ao quadrado; isto se torna um
inconveniente em termos de interpretao do resultado. Por isso, defi-
niu-se uma nova medida, o desvio-padro, que a raiz quadrada da
varincia, com mais utilidade e interpretao prticas, representada por
34
Curso de Graduao em Administrao a Distncia
s ou o. A varincia uma medida que tem pouca utilidade na Estats-
tica Descritiva, mas ser extremamente importante na Inferncia Esta-
tstica e em combinaes de amostras. Tambm importante frisar
que, na grande maioria das situaes, trabalhamos com amostras, en-
to devemos utilizar o desvio-padro amostral.
No caso dos ganhos dirios, calculando a varincia de cada um
dos grupos que correspondem a uma amostra, encontramos os seguin-
tes resultados:
s
A
= 0 reais; s
B
= 15,81 reais; s
C
=67,54 reais.
O desvio-padro, quando analisado isoladamente, no d mar-
gem a muitas concluses. Por exemplo, para uma distribuio cuja
mdia 300, um desvio-padro de 2 unidades pequeno, mas para
uma distribuio cuja mdia 20, ele j no to pequeno.
Importante!
Condies para se usar o desvio-padro ou varincia para com-
parar a variabilidade entre grupos:
mesmo nmero de observaes;
mesma unidade; e
mesma mdia.
Alm disso, se quisermos comparar duas ou mais amostras de
valores expressas em unidades diferentes, no poder ser possvel fa-
zer a comparao por meio do desvio-padro, pois ele expresso na
mesma unidade dos dados. Tambm necessrio que os conjuntos de
observaes tenham o mesmo tamanho. Podemos, ento, considerar a
situao na qual se avaliou o custo indireto de fabricao (CIF) de um
produto em reais e o tempo gasto em uma mquina para fabricao
deste produto em segundos.
CIF
Tempo
x
175 reais
68 segundos
S
5 reais
2 segundos
Mdulo 4
35
A princpio, voc poderia concluir que o CIF apresenta maior
variabilidade. Entretanto, as condies citadas anteriormente deveriam
ser satisfeitas para que se pudesse utilizar o desvio-padro para compa-
rar a variabilidade. Como as condies no so satisfeitas, devemos ten-
tar expressar a disperso dos dados em torno da mdia, em termos
porcentuais. Ento, utilizaremos uma medida estatstica chamada de
coeficiente de variao (CV). O coeficiente ser dado por meio da ex-
presso:
, onde s e foram definidos anteriormente
Para a situao do CIF e tempo, teremos:
Portanto, nesse grupo de indivduos, o tempo de horas, mquina
apresenta maior disperso do que o custo indireto de fabricao (CIF),
mudando, assim, a concluso anterior.
Ao final desta parte de medidas de posio e disperso, voc
deve ser capaz de calcular as medidas de posio e disperso, e
interpret-las.
Caso no consiga, voc deve voltar ao texto e fixar melhor os
conceitos.
Seguem abaixo exerccios para fixao dos conhecimentos ad-
quiridos nos assuntos de medida de posio e de disperso. Voc deve
resolver todos eles.
Exerccio 2: a tabela abaixo apresenta uma distribuio de fre-
qncias das reas de 400 lotes:
A partir da tabela acima, calcule:
36
Curso de Graduao em Administrao a Distncia
a) mdia, mediana e moda;
b) desvio padro e coeficiente de variao;
c) o ponto mdio da stima classe;
d) a amplitude do intervalo da segunda classe;
e) a freqncia relativa da sexta classe;
f) a freqncia acumulada da quinta classe;
g) o n de lotes cuja rea no atinge 700 m
2
;
h) o n de lotes cuja rea atinge e ultrapassa 800 m
2
; e
i) a classe do 72 lote.
Exerccio 3: os dez funcionrios de uma pequena empresa rece-
beram os seguintes salrios, em reais:
230, 210, 100, 140, 160, 120, 390, 450, 100 e 200
Calcule as medidas de posio e disperso em relao aos salrios
reas (m
2
)
300 | 400
400 | 500
500 | 600
600 | 700
700 | 800
800 | 900
900 | 1000
1000 | 1100
1100 | 1200
N de lotes
14
46
58
76
68
62
48
22
6
Mdulo 4
37
Exerccio 4: uma loja vende cinco produtos bsicos A, B, C, D
e E. O lucro por unidade comercializada destes produtos vale, res-
pectivamente $ 200,00; $ 300,00; $ 500,00; $ 1.000,00; $ 5.000,00. A
loja vendeu em determinado ms 20; 30; 20; 10; 5 unidades, respectiva-
mente. Qual foi o lucro mdio por unidade comercializada por esta loja?
Exerccio 5: uma empresa tem duas filiais praticamente idnticas
quanto s suas caractersticas funcionais. Um levantamento sobre os
salrios dos empregados dessas filiais resultou nos seguintes valores:
Filial A: x
A
= 400 e S
A
= 20
Filial B: x
B
= 500 e S
B
= 25
Podemos afirmar que as duas filiais apresentam a mesma disperso?
Saiba mais...
Sobre clculo de mdias e funes em planilhas, visite o site:
http://www.juliobattisti.com.br/tutoriais/celsonunes/
openoffice007.asp
Mais exerccios referentes ao assunto esto no site:
http://www.famat.ufu.br/prof/marcelo/exercicios.htm
UNIDADE
2
Introduo a probabilidades
Introduo a probabilidades
40
Curso de Graduao em Administrao a Distncia
Mdulo 4
41
Introduo a probabilidades
Quando estamos falando de probabilidade, queremos identificar
a chance de ocorrncia de um determinado resultado de interesse, em
situaes nas quais no possvel calcular com exatido o valor real
do evento. Desta forma, trabalhamos com chances ou probabilidades.
Uma situao, para exemplificarmos este fato, est associada
seguinte pergunta: meu vendedor poder cumprir sua meta de venda
na semana que vem? O espao amostral* simbolizado por S ou O
nesta situao ser atinge a meta e no atinge a meta. Para calcular a
probabilidade de cumprir a meta, voc pode usar a intuio (subjeti-
vo) ou usar a freqncia relativa das ltimas dez semanas em que o
vendedor esteve trabalhando (objetivo).
Portanto, para calcularmos uma probabilidade, necessrio que
tenhamos um experimento aleatrio*, que apresenta as seguintes ca-
ractersticas: a) cada experimento pode ser repetido indefinidamente
sob as mesmas condies (n); b) no se conhece a priori o resultado
do experimento, mas podem-se descrever todos os possveis resulta-
dos; e c) quando o experimento for repetido um grande nmero de
vezes, surgir uma regularidade do resultado, isto , haver uma esta-
bilidade da frao (freqncia relativa) da ocorrncia de um par-
ticular resultado, onde r corresponde ao nmero de vezes que um de-
terminado resultado aconteceu.
Nos experimentos ou situaes mencionadas, voc pode notar
que a incerteza sempre est presente, o que quer dizer que, se estes
experimentos forem repetidos em idnticas condies, no se pode
determinar qual o resultado ocorrer.
A incerteza est associada chance de ocorrncia que atribu-
mos ao resultado de interesse.
Consideremos, como exemplo, os funcionrios que trabalham
no setor de marketing de uma determinada empresa. Sabe-se que nes-
GLOSSRIO
*Espao amostral
conjunto de possibi-
lidades, ou seja, os
possveis resultados
associados a um ex-
perimento aleatrio.
*Experimento alea-
trio qualquer pro-
cesso que venha a
gerar um resultado
incerto ou casual.
42
Curso de Graduao em Administrao a Distncia
te setor trabalham seis funcionrios. Um experimento ao acaso seria a
escolha aleatria de um dos funcionrios. Podemos considerar como
evento de interesse o sexo do funcionrio escolhido. Voc, ento, vai
aplicar os conceitos vistos acima e novos conceitos associados a pro-
babilidades.
Conjunto de possibilidades (Espao amostral): S = {Carlos,
Jackeline, Giulyana, Girlene, Cludio, Larissa}.
Conjunto de possibilidades favorveis (Funcionrios do
sexo masculino que correspondem a um evento*): {Carlos,
Cludio}.
Qual a probabilidade de escolher um funcionrio ao acaso e
ele ser do sexo masculino? (Sugesto: verificar o nmero de
funcionrios do sexo masculino).
Dados trs eventos, A (funcionrio ser do sexo feminino) e B
(seu nome comea com a letra G) e C (seu nome comea com a letra
C) dos funcionrios do setor de marketing apresentado anteriormente:
A B o evento em que A e B ocorrem simultaneamente:
{Giulyana, Girlene}.
A . C o evento em que A ocorre ou C ocorre (ou ambos):
{Carlos, Jackeline, Giulyana, Girlene, Cludio, Larissa}.
A o evento em que A no ocorre (complementar de A):
{Carlos, Claudio}.
Dois eventos so considerados mutuamente exclusivos, se a
ocorrncia de um exclui a ocorrncia do outro.
Voc pode, ento, definir a probabilidade como uma funo que
atribui um nmero real aos eventos de O (se A um evento de O,
P(A) a probabilidade de A), que satisfaz:
1. P(C) = 0, P(O) = 1
GLOSSRIO
*Evento qualquer
subconjunto de um
espao amostral.
Mdulo 4
43
2. 0 s P(A) s 1
3. Regra da soma: dados dois eventos mutuamente exclusi-
vos A e C de O,
P(A.C) = P(A) + P(C)
O smbolo C corresponde ocorrncia de um evento impos-
svel, ou seja, que no pode ocorrer no espao amostral con-
siderado.
OBS: Caso os eventos no sejam mutuamente exclusivos, na
regra da soma, devemos considerar que a interseco ser contada duas
vezes. Ento, devemos retirar na regra da soma a interseco.
P(A.B) = P(A) + P(B) P(AB)
Considerando os eventos A, B e C definidos anteriormente, cal-
cule as probabilidades mencionadas na pgina anterior para fixao
dos conceitos.
Para inserirmos outros conceitos de probabilidade, voc deve
considerar os dados a seguir referentes ao acesso e cadastro em dois
sites, por pessoas em uma determinada regio. O site 1 segue o padro
normal, enquanto o site 2 corresponde a uma nova proposta de apre-
sentao de informaes.
Site 1
Site 2
Total
Acessa e cadastra
no site
39.577
46.304
85.881
Total
48.249
53.601
101.850
Acessa e no
cadastra no site
8.672
7.297
15.969
Um acesso a um dos sites escolhido ao acaso. Podemos consi-
derar, ento, que o nosso espao amostral (O) corresponder ao con-
junto de 101.850 acessos.
H os seguintes eventos de interesse:
S1 = nmero de acessos feitos no site 1.
44
Curso de Graduao em Administrao a Distncia
S2 = nmero de acessos feitos no site 2.
AC = o site acessado, e o cadastro feito pelo internauta.
S1 AC = o internauta acessa o site 1 e faz o cadastro no site.
S1 . AC = o internauta acessa o site 1 ou faz o cadastro no site.
Voc pode obter, ento, algumas probabilidades como:
S2 =
1 S
= P(S2) =
527 , 0 473 , 0 1 ) 1 P( 1 ) 1 P( S S
P(S1 . AC) = P(S1) + P(AC) P(S1 AC)
= 0,473 + 0,843 0,388
= 0,928
Se voc relembrar a interpretao da probabilidade, consideran-
do A um evento de um espao amostral associado a um experimento
aleatrio, voc pode ter duas formas de atribuir probabilidades aos
eventos de um espao amostral:
P{A} uma intuio (subjetiva) que se deposita na ocorrn-
cia de A.
Interpretao freqntista (objetiva).
Quando n cresce: f
n
(A) se aproxima da P(A), por isso foram rea-
lizadas n repeties independentes do experimento.
No exemplo anterior, se voc souber que um acesso sorteado do
site 1, qual a probabilidade de que ocorra a efetuao do cadastro?
Mdulo 4
45
Temos uma informao parcial: o acesso do site 1.
Vamos designar a probabilidade de AC, quando se sabe que o
acesso ocorreu no site 1, que chamaremos de P(AC /S1) e denomin-
la probabilidade (condicional) de AC dado S1 (lembre-se que o
smbolo / no corresponde a uma diviso).
natural atribuirmos:
Note que:
Portanto, voc pode generalizar para dois eventos A e B quais-
quer de um experimento aleatrio. Desta forma, podemos dizer que a
probabilidade condicional de A dado B (nota-se por P (A / B)) defi-
nida como:
Podemos, ento, definir a regra do produto, ou seja, a partir da
probabilidade condicionada definida anteriormente, obteremos a cha-
mada regra do produto para a probabilidade da interseo de dois even-
tos A e B de um espao amostral:
Passe a probabilidade de ocorrncia de B na probabilidade
condicionada e multiplique pela probabilidade de ocorrn-
cia de A sabendo que B j aconteceu.
46
Curso de Graduao em Administrao a Distncia
P (A B) P (A / B) . P (B)
Se dois eventos A e B so independentes, ento P{A / B} = P{A}
ou P{B / A} = P(B).
Deste modo, se A e B forem independentes, voc pode verificar que:
Veja esta outra situao, utilizando os conceitos de probabilida-
de condicionada e independncia de eventos. Considere a tabela a se-
guir, representativa da distribuio da renda anual de produtores ru-
rais e duas cooperativas em uma determinada regio.
Observando-se os dados acima, se verifica que a probabilidade
de um cooperado aleatoriamente escolhido ser:
a) da cooperativa A: P(A) = 115/200 = 0,575
b) da cooperativa B: P(B) = 85/200 = 0,425
c) de ter renda entre R$ 15.000,00 e R$ 20.000,00:
P(R1) = 110/200 = 0,550
d) da cooperativa B e ter renda entre R$ 15.000,00 e
R$ 20.000,00: P(B R1) = 40/200 = 0,20
e) ter renda entre R$ 15.000,00 e R$ 20.000,00 dado que
da cooperativa B: P(R1/B) = 40/85 = 0, 4706 ou
Faixa de renda anual (em R$1.000)
15 a 20 (R1)
20 a 25 (R2)
25 a 30 (R3)
30 a 35 (R4)
Total
A
70
15
10
20
115
B
40
15
20
10
85
Total
110
30
30
30
200
Cooperativas
Mdulo 4
47
Para que sejam consi-
derados independen-
tes, a relao de
independncia deve
ser vlida para todas
as interseces presen-
tes na Tabela 11.
Como P(R1)
1
= d
0
Onde:
1
: mdia da populao 1 e
2
: mdia da populao 2.
J d
o
corresponde a uma diferena qualquer que voc deseje tes-
tar. Geralmente, quando queremos saber se as mdias das duas popu-
laes so estatisticamente iguais, utilizamos o valor de d
o
igual a zero.
As hipteses alternativas seguem a mesma linha de raciocnio.
Abaixo temos um quadro que nos auxiliar a visualizar estas conside-
raes.
H
o
1
2
= d
0
H
1
1
2
< d
0
1
2
> d
0
1
2
d
0
importante ressaltar que, se as hipteses alternativas forem
unilaterais, o sinal da hiptese H
o
ser menor ou igual, maior ou
igual, dependendo da hiptese alternativa, apesar de utilizarmos a
notao de igual (conforme comentado anteriormente).
Todas as outras consideraes em relao aos testes de hiptese
permanecem as mesmas. Vamos, ento, procurar entender cada situa-
o para os testes de hipteses para diferena entre mdias.
1 situao: amostras independentes e grandes (n>30).
Como estamos trabalhando aqui com amostras grandes, ou quan-
do se conhecem os desvios-padro populacionais, devemos trabalhar
com a distribuio amostral de Z (raciocnio semelhante ao utilizado
Mdulo 4
113
no teste de hiptese para uma mdia). Portanto, a estatstica do teste
ser dada por:
Onde: x
1
: mdia da amostra 1; x
2
: mdia da amostra 2
1
: mdia
da populao 1;
2
: mdia da populao 2; o
1
2
: varincia da popula-
o 1; o
2
2
: varincia da populao 2; n
1
: tamanho da amostra 1 e n
2
tamanho da amostra 2.
OBS: se trabalharmos com amostras grandes podere- OBS: se trabalharmos com amostras grandes podere- OBS: se trabalharmos com amostras grandes podere- OBS: se trabalharmos com amostras grandes podere- OBS: se trabalharmos com amostras grandes podere-
mos subst i t ui r as vari nci as popul aci onai s pel as mos subst i t ui r as vari nci as popul aci onai s pel as mos subst i t ui r as vari nci as popul aci onai s pel as mos subst i t ui r as vari nci as popul aci onai s pel as mos subst i t ui r as vari nci as popul aci onai s pel as
vari nci as amostrai s. vari nci as amostrai s. vari nci as amostrai s. vari nci as amostrai s. vari nci as amostrai s.
Vamos, ento, ver como podemos aplicar o teste de hiptese
para a diferena entre mdias nesta situao.
Foram retiradas amostras de aparelhos usados de duas marcas, e
os resultados so apresentados na tabela a seguir. Verifique se as duas
marcas tm uma mesma durabilidade ou se so diferentes, com uma
significncia de 0,05.
Marcas
Mdia
Desvio-padro
tamanho amostra
A
1.160
90
100
B
1.140
80
100
114
Curso de Graduao em Administrao a Distncia
2 situao: amostras independentes e pequenas, mas que apre-
sentam varincias populacionais estatisticamente iguais.
Como as amostras com que estamos trabalhando so pequenas,
e as varincias populacionais, desconhecidas, ento, voc deve traba-
lhar com a distribuio t de Student.
Aqui consideraremos que as varincias populacionais so esta-
tisticamente iguais, pois esta situao influenciar nos clculos e, con-
seqentemente, no processo decisrio. Para saber se as varincias po-
dem ser consideradas iguais, deve-se fazer um teste da razo de duas
varincias (teste F) mostrado anteriormente.
A estatstica do teste ser dada por:
Aqui aparece um termo novo (Sp). Ele corresponde ao desvio-
padro ponderado pelos graus de liberdade, ou seja, calculamos um
novo desvio-padro, no qual o fator de ponderao corresponde ao
grau de liberdade de cada amostra. Veja a seguir:
Para voc encontrar o valor tabelado que limita as regies de
aceitao e rejeio na tabela t de Student (revise na Unidade 3), o
nmero de graus de liberdade (v) ser dado por:
Vamos agora resolver um exemplo.
Um treinamento na rea contbil de um grupo empresarial mi-
nistrado a 12 profissionais pelo mtodo convencional. Um segundo
grupo de dez profissionais recebeu o mesmo treinamento por um m-
todo programado. Os resultados de notas dos dois mtodos so apre-
sentados na tabela a seguir. Determine se h diferena entre os dois
mtodos considerando uma significncia de 0,01.
Mdulo 4
115
OBS: no teste F, no foram encontradas diferenas entre as
varincias populacionais.
Mtodo
Mdia
Desvio-padro
Convencional
85
4
Programado
81
5
Agora voc deve resolver o seguinte exerccio:
Exerccio 2: duas tcnicas de venda so aplicadas em dois gru-
pos de vendedores. A tcnica A foi aplicada em um grupo de 12 ven-
dedores, resultando em um nmero de vendas efetivadas em mdia de
76 e uma varincia de 50. J a tcnica B foi aplicada em um grupo de
15 vendedores, resultando em um nmero de vendas efetivadas em
mdia de 68 e uma varincia de 75. Considerando as varincias esta-
tisticamente iguais, e com uma significncia de 0,05, verifique se as
mdias so estatisticamente iguais.
3 situao: amostras independentes e pequenas, mas que apre-
sentam varincias populacionais estatisticamente desiguais. A diferena
desta situao para a anterior que voc considera que as populaes
apresentam varincias estatisticamente desiguais. Tambm utilizare-
116
Curso de Graduao em Administrao a Distncia
mos a estatstica do teste a partir da distribuio t de Student. A esta-
tstica-teste ser dada por:
Outra diferena esta no clculo do nmero de graus de liberda-
de, pois nesta situao utilizaremos uma aproximao que dada pela
expresso a seguir:
Se este valor calculado apresentar valores decimais, deve ser feito
o arredondamento para um nmero inteiro. Vamos a um exemplo.
Para estudar o efeito da certificao ambiental no valor de em-
presas, consideraram-se amostras de empresas da mesma rea, com e
sem certificao ambiental. Obtiveram-se os seguintes resultados. Aps
ter sido testado, verificou-se que as populaes apresentam varincias
desiguais. Teste a hiptese de que os dois padres de empresas apre-
sentam mdias de valor diferentes.
Mtodo
Mdia
Desvio-padro
N
Com certificao ambiental
24,0
1,7
8
Semcertificao ambiental
13,3
2,7
21
Mdulo 4
117
Resolva agora este exerccio:
Exerccio 3: um empresrio deseja saber se h futuros profissio-
nais mais promissores em escolas de regies pobres e de regies ricas.
Uma amostra de 16 estudantes de uma zona pobre resultou em um
teste especfico, uma mdia de 107 pontos e um desvio-padro de 10
pontos. J 14 estudantes de regio rica apresentaram uma mdia de
112 pontos e um desvio-padro de 8 pontos. Voc deve verificar se a
mdia dos pontos dos dois grupos diferente ou igual, para que o
empresrio possa saber se ele pode investir em qualquer uma das re-
as ou uma das reas mais promissora (primeiro, verifique se as
varincias so estatisticamente iguais ou diferentes).
4 situao: amostras dependentes.
Relembrando, amostras dependentes ocorrem quando se faz uma
interveno e se deseja saber se os resultados antes da interveno so
iguais aos resultados depois da interveno.
Um ponto importante nesta situao que so calculadas pri-
meiramente as diferenas de antes e depois. Esta diferena chamada
de d
i
. Ento, voc pode ver que:
d
i
= valor antes - valor depois
Com base nestas diferenas (d
i
) voc vai calcular a mdia (D) e
o desvio- padro destas diferenas (SD)
e
Veja que estas frmulas so iguais s de clculo da mdia e des-
vio-padro apresentados na Unidade 1. Neste caso, no lugar da vari-
vel x, so utilizados os valores de d
i
(diferenas).
Com estes valores, a estatstica teste ser dada por:
118
Curso de Graduao em Administrao a Distncia
O valor de n corresponde ao nmero de diferenas calculadas, e
o grau de liberdade para ser olhado na tabela t de Student ser dado
por n - 1.
Em um estudo, procurou-se investigar a no-eficcia de uma
propaganda na percepo de clientes. O Quadro a seguir d os resul-
tados de pessoas selecionadas anteriormente. No nvel de 5% de
significncia, teste a afirmao de que as percepes sensoriais so
inferiores aps a propaganda, ou seja, a propaganda no eficaz. (Os
valores se referem a antes e depois da propaganda; medidas em uma
escala de zero a doze.)
Pessoa
Antes
Depois
A
6,6
6,8
B
6,5
2,4
C
9,0
7,4
D
10,3
8,5
E
11,3
8,1
F
8,1
6,1
G
6,3
3,4
H
11,6
2,0
Teste de hiptese para diferena entre propores
Em diversas situaes, o que nos interessa saber se a propor-
o de sucessos (evento de interesse) em duas populaes apresenta a
mesma proporo ou no. Neste caso, os dados seguem uma distribui-
o de Bernoulli (vista na Unidade 2) com mdia p e varincia pq.
Portanto, a expresso da estatstica-teste (no caso utilizaremos a distri-
buio de Z) ser dada por:
Mdulo 4
119
Nesta expresso, voc tem:
correspondem proporo de sucesso nas amostras 1
e 2, respectivamente.
p
1
e p
2
correspondem proporo de sucesso nas populaes
1 e 2, respectivamente.
Voc deve se lembrar que a proporo de fracasso (q) dada
por um, menos a proporo de sucesso.
Vejamos, ento, como aplicar o teste da diferena de propores.
Uma questo de teste considerada boa, se permitir discriminar
entre estudantes preparados e estudantes no preparados. A primeira
questo de um teste foi respondida corretamente por 62, dentre 80
alunos preparados, e por 23, dentre 50 alunos no preparados. Com
um nvel de 5% de significncia, teste a afirmao de que esta questo
foi respondida corretamente por uma proporo maior de estudantes
preparados.
Teste do qui-quadrado de independncia
O teste do qui-quadrado de independncia est associado a duas
variveis qualitativas, ou seja, uma anlise bidimensional (visto na
Unidade 2). Voc se lembra que as tabelas de contingncia permitem
verificar a relao de dependncia entre as duas variveis analisadas.
120
Curso de Graduao em Administrao a Distncia
Neste caso, procura-se calcular a freqncia de ocorrncia das
caractersticas dos eventos a serem estudados. Por exemplo, podemos
estudar a relao entre o sexo de pessoas (masculino e feminino) e o
grau de aceitao do governo (ruim, mdio e bom). Ento, voc vai
obter, por exemplo, o nmero de pessoas (freqncia) que so do sexo
feminino e que acham o governo bom. Todos os cruzamentos das duas
variveis so calculados.
Vamos apresentar a voc, como exemplo, os possveis resulta-
dos da situao apresentada anteriormente (dados simulados).
Masculino
Feminino
Total
Bom
74
10
84
Total
258
216
474
Mdio
27
0
27
Ruim
157
206
363
Funo
Sexo
Podemos, ento, querer determinar o grau de associao entre
essas duas variveis, ou seja, se o grau de aceitao do governo de-
pende do sexo ou existe uma relao de dependncia.
As hipteses a serem testadas so:
H
o
: varivel linha independe da varivel coluna
H
1
: varivel linha est associada com a varivel coluna
A estatstica de qui-quadrado ser dada por meio da seguinte
expresso:
Onde o valor k corresponde ao nmero de classes (freqncias
encontradas). Voc pode verificar que fo corresponde freqncia
observada, ou seja, o valor encontrado na tabela de contingncia.
J fe corresponde freqncia esperada caso as variveis no
tenham nenhuma relao de dependncia, ou seja, as duas variveis
Mdulo 4
121
sejam independentes. Em funo desta definio, a freqncia espera-
da (fe) ser obtida por:
Neste caso, os graus de liberdade (v), para que possamos olhar a
tabela de qui-quadrado, so dados por:
v = (h-1) (k-1) nas tabelas com h linhas e k colunas
Ento, para cada clula da tabela de contingncias, voc vai cal-
cular a diferena entre fe e. fo. Esta diferena elevada ao quadrado
para evitar que as diferenas positivas e negativas se anulem. A divi-
so pela freqncia esperada feita para obter diferenas em termos
relativos.
Para entendermos melhor o teste de qui-quadrado do tipo inde-
pendncia, vamos trabalhar com a seguinte situao: para testar se
determinada droga era capaz de inibir a absoro de lcool pelo orga-
nismo humano, realizou-se um experimento com a participao de 60
voluntrios (homens saudveis, idade entre 25 e 28 anos). Metade dos
voluntrios tomou a droga, e a outra metade no tomou. Todos os
voluntrios tomaram duas doses de usque. Uma hora mais tarde, sele-
cionou-se uma amostra do sangue de cada sujeito, observando-se os
resultados a seguir. Usando 5% de significncia, pode-se concluir que
o resultado do teste est associado ingesto da droga?
Teste Droga
Tomaram
No tomaram
Presena de lcool
8
16
Ausncia de lcool
32
40
H
o
: Presena ou ausncia de lcool independe de tomar droga
H
1
: Presena ou ausncia de lcool est associado a tomar droga
122
Curso de Graduao em Administrao a Distncia
14
96
24 . 56
o
d
e
2
a
o
n
v
e
l
d
e
p
r
o
b
a
b
i
l
i
d
a
d
e
138
Curso de Graduao em Administrao a Distncia
T
a
b
e
l
a
4
:
L
i
m
i
t
e
s
u
n
i
l
a
t
e
r
a
i
s
d
a
d
i
s
t
r
i
b
u
i
o
F
d
e
F
i
s
h
e
r
-
S
n
e
d
e
c
o
r
a
o
n
v
e
l
d
e
1
0
%
d
e
p
r
o
b
a
b
i
l
i
d
a
d
e
Mdulo 4
139
T
a
b
e
l
a
5
:
L
i
m
i
t
e
s
u
n
i
l
a
t
e
r
a
i
s
d
a
d
i
s
t
r
i
b
u
i
o
F
d
e
F
i
s
h
e
r
-
S
n
e
d
e
c
o
r
a
o
n
v
e
l
d
e
5
%
d
e
p
r
o
b
a
b
i
l
i
d
a
d
e
140
Curso de Graduao em Administrao a Distncia
Mdulo 4
141
T
a
b
e
l
a
6
:
L
i
m
i
t
e
s
u
n
i
l
a
t
e
r
a
i
s
d
a
d
i
s
t
r
i
b
u
i
o
F
d
e
F
i
s
h
e
r
-
S
n
e
d
e
c
o
r
a
o
n
v
e
l
d
e
2
,
5
%
d
e
p
r
o
b
a
b
i
l
i
d
a
d
e
142
Curso de Graduao em Administrao a Distncia
T
a
b
e
l
a
7
:
L
i
m
i
t
e
s
u
n
i
l
a
t
e
r
a
i
s
d
a
d
i
s
t
r
i
b
u
i
o
F
d
e
F
i
s
h
e
r
-
S
n
e
d
e
c
o
r
a
o
n
v
e
l
d
e
1
,
0
%
d
e
p
r
o
b
a
b
i
l
i
d
a
d
e