Você está na página 1de 27

Universidade Federal do Cariri - UFCa

INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
1. Para cada uma das afirmaes a seguir, diga se ela est correta e justifique sua resposta:
(a) Para inferir sobre a moda de uma varivel contnua a partir de uma amostra de
observaes, basta destacar aquele valor que mais se repete. (b) Em se tratando de
variveis contnuas, o cmputo do IQV (ndice qualitativo de variao) no faz uso de
distribuies de frequncias. (c) A distribuio de frequncias acumuladas de uma
varivel pode ser util para a obteno da sua mediana. (d) Grficos de Pareto so uteis
para melhor esboar a distribuio de frequncias de variveis qualitativas nominais. (e)
Histogramas so uteis para esboar a distribuio de frequncias de variveis
qualitativas.
2. De maneira a administrar o problema da aftosa do rebanho de dado agricultor, seus 10
bovinos foram estudados, resultando nos dados a seguir:
Indivduo
N de reincidncias de vrus
Peso (Kg)

10

208.3 157.5 98.7 121.2 134.9 216.5 136.7 66.2 139.1 130.5

Idade (meses)

38.8

26.6 10.9

17.1

20.8

40.7

21.3

1.0

21.9

19.6

Gnero

Nvel de estresse

Atual condio

Gnero:
0 - Feminino,
1 - Masculino

Legenda
Nvel de estresse:
1- desprezvel, 2 - baixo, 3 - moderado, 4 - elevado, 5
alarmante

Atual condio:
0 - sem aftosa,
1 - com aftosa

Pergunta-se: (a) Qual a mdia e varincia do peso dos animais selecionados? (b)
Baseando-se no coeficiente de variao, voc diria que o peso dos animais envolve um nvel
de incerteza maior que o da idade? (c) Baseando-se no IQV, voc diria que a incerteza
envolvendo a atual condio dos animais maior que aquela envolvendo seu nvel de
estresse? (d) Baseando-se em uma medida de posio, preveja o gnero e o peso de um 11
animal a compor a amostra. (e) Baseando-se na distribuio bivariada de frequncias
relativas, voc diria que h uma relao de dependncia entre o gnero e a atual condio
dos animais?
3. De maneira a administrar uma loja de artigos infantis, um gestor montou o seguinte
conjunto de dados, envolvendo o atendimento a 10 clientes:
Cliente
Instante de entrada na loja (horas)
Instante de sada da loja (horas)
Atendente
Quantia consumida (R$)
Legenda
Atendente: 0 - Ccera; 1 Maria

1
8.6
8.7
1
10.9

2
9.4
10
0
1.3

3
9.5
9.8
1
12.1

4
10.2
10.7
1
30

5
11.5
11.9
0
1.3

6
12.4
12.8
0
1

7
12.5
12.6
0
1.5

8
13.4
13.5
1
17.3

9
13.6
13.8
0
1.9

10
14
14.8
0
1.6

Pergunta-se: (a) Baseando-se no coeficiente de variao, voc diria que o tempo de


permanncia dos clientes na loja envolve um nvel de variabilidade maior que o da quantia
consumida nas compras? (b) Baseando-se no IQV, voc diria que a variabilidade
envolvendo o atendente elevada? (c) Baseando-se na distribuio bivariada de frequncias
relativas, voc diria que Ccera atende os clientes mais rapidamente que Maria? (d) A partir
de um histograma, esboce a variabilidade do tempo de permanncia dos clientes na loja.

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
4. Um Cientista Social estuda o perfil scio-econmico das pessoas de certa regio. Para
tanto, 1000 famlias foram sorteadas e entrevistadas quanto renda familiar (em R$) e
ao n de pessoas que dependem diretamente desta renda. Os resultados esto
sintetizados a seguir:
Faixa de
Frequncia
N de dependentes Frequncia
renda (R$) absoluta
da renda familiar
absoluta
[0, 200)
300
[1, 3)
200
[200, 400)
400
[3, 5)
500
[400, 600)
200
[5, 7)
200
[600, 800)
60
[7, 9)
60
[800, 1000] 40
[9, 11]
40
Total
1000
Total
1000
Pergunta-se: (a) Qual a renda familiar mdia na regio? (b) Mais comumente, quantas
pessoas dependem da mesma renda familiar? (c) Caso deseje-se determinar duas classes
sociais na regio, ambas com o mesmo percentual de famlias, qual seria a renda que
separa as duas classes? (d) E quanto variabilidade da renda familiar na regio, ela
maior que a do n de dependentes?
5. Para cada uma das afirmaes a seguir, diga se ela est correta e justifique sua
resposta: (a) A idade de uma pessoa uma varivel qualitativa ordinal. (b) O nvel
de escolaridade de uma pessoa uma varivel qualitativa nominal. (c) A mdia pode
ser aplicada a qualquer tipo de varivel. (d) A moda s pode ser aplicada a variveis
qualitativas. (e) A varincia pode ser aplicada a qualquer tipo de varivel. (f) O n
de dependentes de uma famlia uma varivel quantitativa contnua. (g) A classe
social de uma pessoa uma varivel qualitativa nominal. (h) A mediana pode ser
aplicada a qualquer tipo de varivel. (i) A idade, em meses, de um ruminante uma
varivel cujo espao de possveis resultados dado pelo conjunto {0, 1, 2, 3, ...}. (j)
Considere uma amostra de n observaes de uma varivel qualitativa que possui k
categorias. Esta varivel envolver o maior nvel de disperso (variabilidade, incerteza)
quando todos os resultados da amostra se concentrarem em exatamente uma das k
categorias. (k) Nos casos em que se envolve o menor nvel de incerteza, o ndice
qualitativo de variao equivale a 100%. (l) Diante de uma distribuio de frequncias
absolutas envolvendo k categorias de uma varivel, a respectiva distribuio de
frequncias relativas resulta da diviso de cada frequncia absoluta por k. (m) A mdia,
a exemplo da mediana, no sofre influncia de valores extremos da amostra. (n) A
elaborao da distribuio de frequncias de uma varivel contnua to simples
quanto aquela de uma varivel qualitativa. (o) A distribuio de frequncias
acumuladas de uma varivel pode ser util para a obteno da sua mediana.
6. Um mdico precisa informar quanto vai custar (em R$) o tratamento contra dada doena
que acometeu um dado indivduo. Para tanto, ele teve acesso ao custo de tratamento de
15 indivduos anteriormente acometidos pela doena. A amostra destes custos,
convenientemente ordenada, apresentada abaixo. O estudo do mdico se dar a partir
de uma anlise descritiva destes dados. Na posio do mdico, responda sempre
apresentando justificativas tcnicas: (a) pouco provvel que o custo do tratamento do
indivduo doente seja superior a R$ 370.00? (b) Baseando-se em uma medida de
posio, quanto voc prev que ser gasto com o tratamento do doente? (c) Baseando-se
em uma medida de disperso, argumente sobre o nvel de incerteza associado previso
realizada no quesito anterior. (d) Esboce a variabilidade dos custos de tratamento da
doena a partir de um grfico.

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva

Indivduo

Custo (R$) 160.4


Indivduo
Custo (R$)

10

213.8

235.4

250.8

263.5

274.7

285.1

295.1

304.9

12

13

14

15

11

314.9 325.3
336.5
349.2
364.6
439.6
7. A tabela abaixo exibe o n de falhas em 100 demandas a cada um de 20 servidores
semelhantes, projetados e mantidos pela mesma equipe de profissionais. Na tabela os
dados foram oportunamente ordenados e envolvem-se um total de 23 falhas. Baseie-se
na abordagem frequentista da probabilidade e responda: Se um 21 servidor semelhante
aos que compem a amostra for posto em operao: (a) Qual a probabilidade de que
ele falhe quando demandado? (b) Se d-se uma garantia de no mximo uma falha nas
primeiras 100 demandas, qual a probabilidade de que o servidor satisfaa tal garantia?
(c) A partir de uma medida de posio, quantas falhas voc prev que ocorrero nas 100
primeiras demandas do servidor? (d) Baseando-se no ndice qualitativo de variao
(IQV) da varivel amostrada (n de falhas em 100 demandas), voc diria que sua
previso em (c) envolve um nvel de incerteza relativamente pequeno?
Servidor
n de falhas em
100 demandas

7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 1 1 1

8. A tabela abaixo exibe o n de demandas at a falha de 20 servidores semelhantes,


projetados e mantidos pela mesma equipe de profissionais. Na tabela os dados foram
oportunamente ordenados e envolvem-se um total de 1897 demandas. Baseie-se na
abordagem frequentista da probabilidade e responda: Se um 21 servidor semelhante aos
que compem a amostra for posto em operao: (a) Qual a probabilidade de que ele
falhe quando demandado? (b) Se deseja-se atribuir uma garantia baseada no n de
demandas at a falha deste servidor, onde a probabilidade de no ocorrer falha durante a
garantia (confiabilidade) seja de 80%, qual seria a garantia? (c) A partir de uma medida
de posio, quantas demandas voc prev que sero necessrias at que este servidor
falhe? (d) Qual o experimento subjacente varivel sob estudo em (c): Binomial,
Normal, Uniforme, Geomtrico ou de Poisson?
Servidor
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
n de demandas
at a falha
10 19 21 24 25 30 33 37 48 53 62 63 66 72 84 188 198 215 258 390

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva

GABARITO
1) Esta questo relaciona-se a conceitos bsicos necessrios anlise descritiva de dados.
1.a) A moda de um conjunto de observaes uma funo que estima aquele valor mais
provvel, verossmil, para a varivel de interesse. Em se tratando de variveis qualitativas,
tal funo opera simplesmente sobre o processo de contagem da frequncia de cada um dos
possveis resultados da varivel; nesta situao a moda retorna aquela categoria mais
frequente na amostra.
Por outro lado, em se tratando de variveis contnuas, uma abordagem mais sofisticada
necessria, devido a amostras de variveis contnuas tenderem a no apresentar valores
repetidos, por um lado, e, por outro, devido ao fato de que a eventual repetio de algum
valor no implicar em este ser necessariamente o mais provvel. De fato, para uma varivel
contnua, a moda se confunde matematicamente com o ponto de mximo da funo que
modelaria o histograma associado distribuio de frequncias da amostra, conhecida como
funo de densidade de probabilidade (FDP). Caso haja conhecimento sobre a FDP da
varivel, sua moda ser um ponto de mximo da FDP. Por outro lado, caso tenha-se acesso
apenas distribuio de frequncias da amostra da varivel, h aproximaes tais como a
moda de Czuber, onde a classe modal o intervalo que apresenta a maior frequncia
absoluta (ou relativa) da distribuio e sugere-se um valor para a moda dentro deste
intervalo:

sendo,
l - limite inferior da classe modal
freqm - freq da classe modal (mais frequente)
freqa - freq da classe anterior modal
freqp - freq da classe posterior modal
a = freqm freqa e p = freqm freqp
h - amplitude da classe modal.
Logo, a afirmao est INCORRETA.
1.b) O ndice qualitativo de variao (IQV) dado pela funo
k

IQV =

k (n 2 ni2 )

i =1
, onde
n 2 (k 1)
k nmero de classes (ou categorias) envolvidas na distribuio de frequncias de interesse;
n nmero de observaes envolvidas
ni frequncia absoluta da categoria i.

V-se que o IQV sempre opera sobre as frequncias, independentemente da natureza das
classes (categorias) relacionadas a tais frequncias. Logo, tal medida pode ser aplicada a
qualquer tipo de varivel, j que para qualquer tipo pode-se obter uma distribuio de
frequncias diante de uma amostra.
Portanto, a afirmao est INCORRETA.

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
1.c) A mediana de um conjunto de observaes relativas a uma varivel X, (x1, x2, ..., xn)
uma medida de localizao que permite, por exemplo, que se faa previses sobre o valor
de X. Ela uma estatstica de ordem dada matematicamente pelo valor que se encontraria
no centro dos dados ordenados; isto , trata-se daquele valor que acumularia metade das
observaes abaixo e metade acima dele; isto , 50% das observaes ordenadas. Por outro
lado, a distribuio de frequncias acumuladas permite associar a cada valor xi a frequncia
de valores menores ou iguais a xi.
Desta forma, pode-se considerar que o valor cuja frequncia acumulada relativa de 50%
na distribuio de frequncias acumuladas a mediana. Logo, v-se que a operao de
ordenao necessria obteno da mediana tambm intrnseca elaborao de uma
distribuio de frequncias acumuladas. De fato, no apenas a mediana pode ser obtida a
partir da distribuio de frequncias acumuladas mas, tambm, outras estatsticas de ordem
ou quantis (tais como o valor que acumula at ele 25% ou 75% dos dados).
Logo, a afirmao est CORRETA.
1.d) O intuito de qualquer grfico o de gerar informao a partir de um conjunto de dados.
Por exemplo, diante de um grfico de barras, o grfico de Pareto permite destacar categorias
mais e menos frequentes da varivel. Ele faz isso ao aplicar uma ordenao decrescente das
barras e suas respectivas categorias a partir da frequncia destas categorias. Logo, a
sequncia inicialmente adotada para as categorias durante o cmputo da distribuio de
frequncias pode ser alterada ao se adotar Pareto. Destaque-se que quando a varivel
qualitativa nominal suas categorias no tm qualquer relao de ordenao. Desta forma, as
variveis qualitativas nominais so as nicas onde uma rearrumao das categorias sem
importncia, permitindo a adoo irrestrita do grfico de Pareto.
Assim, a afirmao est CORRETA.
1.e) Histogramas so uma alternativa grfica que permitem esboar em duas dimenses a
distribuio de frequncias de uma varivel quantitativa (isto , uma varivel cujos
possveis resultados so, de fato, nmeros, provenientes de um processo de contagem ou
mensurao, por exemplo). Desta forma, como ambas as dimenses do grfico contemplam
nmeros, histogramas no devem ser aplicados a variveis qualitativas; a estas reservam-se
os grficos de barras e de setor, por exemplo. Assim, a afirmao INCORRETA.

2) Esta questo trata estritamente do suporte a tomada de deciso fornecido pela estatstica
descritiva quando diante de um conjunto de dados.
2.a) Pede-se a mdia e a varincia do peso dos animais estudados. Seja xi "o peso do i
animal avaliado (em kg)", onde i varia entre 1 e 10 (estuda-se n=10 animais).
Pede-se
n

208.3 + 157.5 + ... + 130.5 1409.6


=
= 140.96 kg. Assim, o peso mdio
n
10
10
dos animais selecionados de 140.96 kg.
Sobre a varincia do peso:
x peso =

i =1

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
n

(x
s

2
peso

x) 2

i =1

n 1

(208.3 140.96) 2 + (157.5 140.96) 2 + ... + (130.5 140.96) 2


=
= 2049.74 (kg ) 2 .
10 1

Note-se que a unidade de medida para a varincia o quadrado da da varivel sob


estudo.
2.b) O coeficiente de variao (cv) uma medida adimensional que permite a
mensurao da incerteza refletida no desvio padro (s) em relao mdia, de tal forma
que, para variveis que assumem valores no negativos, quanto mais prximo de zero
for o cv menor ser a incerteza sobre a varivel. O cv tambm til para comparar a
disperso/incerteza intrnseca a variveis no negativas. Matematicamente, trata-se da
razo entre desvio-padro e mdia. Para o caso do peso dos animais, tem-se:
s peso
2049.74 45.274
=
=
= 0.321. Assim, considera-se um nvel de
cv peso =
140.96
140.96
x peso
incerteza de cerca de 32.1% em relao mdia em se tratando da varivel Peso.

J em relao idade dos animais, tem-se para a mdia e varincia:


n

x
x idade =

i =1

n
n

(x

38.8 + 26.6 + ... + 19.6 218.7


=
= 21.87 meses;
10
10

x) 2

(38.8 21.28) 2 + (26.6 21.28) 2 + ... + (19.6 21.28) 2


= 138.76 (meses) 2 .
n 1
10 1
Para o respectivo coeficiente de variao, tem-se

2
s idade
=

i =1

cv idade =

s idade
x idade

138.76 11.78
=
= 0.539.
21.87
21.87

Logo, baseando-se no coeficiente de variao, conclui-se que o peso dos animais


envolve um nvel de incerteza menor que o da idade. Em outros termos, seria mais
difcil prever a idade de um dado animal do que seu peso.
2.c) Para fazer a comparao da variabilidade das variveis "atual condio dos
animais" e "nvel de estresse", pode-se recorrer ao ndice qualitativo de variao (IQV),
j que tratam-se de variveis qualitativas e o IQV uma medida relativa util nessas
situaes. Para tanto, tem-se que
k

IQV =

k (n 2 ni2 )
i =1

, onde
n (k 1)
k nmero de classes (ou categorias) envolvidas na distribuio de frequncias;
n nmero de observaes envolvidas
ni frequncia absoluta da categoria i.
2

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
As respectivas distribuies de frequncias so dadas abaixo
Atual condio
0 sem aftosa
1 com aftosa
Total

Frequncia
6
4
10

Nvel de
Estresse
1 - desprezvel
2 - baixo
3 moderado
4 elevado
5 alarmante
Total

Frequncia
3
3
2
1
1
10

2(10 2 (6 2 + 4 2 ))
= 0.96 .
10 2 (2 1)
Logo, como o IQV assume valores entre 0 (nenhuma variao observada) a 1 (a maior
variao observvel), considera-se que a varivel "condio atual" apresenta uma
variabilidade relativamente elevada.

Para a atual condio, tem-se: IQVcondio =

5(10 2 (32 + 32 + 2 2 + 12 + 12 ))
= 0.95 .
10 2 (5 1)
Considera-se assim que a variabilidade associada ao "nvel de estresse" relativamente
elevada. Contudo, conclui-se tambm que esta variabilidade menor que a da atual
condio observada entre os animais.

Para o nvel de estresse, tem-se: IQVestresse =

2.d) Dentre as principais medidas de posio, destacam-se a mdia, mediana e moda. O


quesito pede apenas uma destas medidas.

Sobre a varivel gnero, esta de natureza qualitativa nominal e, assim, a nica


medida de posio irrestritamente aplicada a moda. Em se tratando de variveis
qualitativas, a moda reflete aquele resultado que mais se observou na amostra. Assim,
ela opera sobre a distribuio de frequncias da varivel. Para a amostra de gnero, temse a seguinte distribuio de frequncias:
Gnero
0 Feminino
1 Masculino
Total

Frequncia
6
4
10

Da moda da distribuio, prev-se que mais provavelmente o gnero de um novo animal


a ser estudado ser feminino.
Sobre a varivel peso, esta de natureza quantitativa contnua e, assim, tanto a moda
quanto a mediana e a mdia podem ser usadas. Por simplicidade dos clculos, poder-seia adotar a mediana, j que esta envolve como operao mais custosa a ordenao dos
dados. De fato, a mediana trata-se apenas do valor que se encontra na posio central
dos dados ordenados. A tabela abaixo exibe a amostra de pesos ordenada de forma
crescente:
7

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
ndice (i)

Peso ordenado
(yi)

66.2

98.7

121.2

130.5

134.9

136.7

139.1

157.5

9
208.3

10
216.5

Como a questo envolve um n par de (n=)10 indivduos, a mediana seria o valor que se
encontraria entre as posies n/2=5 e n/2+1=6 dos dados ordenados (y5 e y6). Tal valor
representado pelo ponto mdio entre os valores ordenados y5 e y6:
Mediana = (y5 + y6)/2 = (134.9 + 136.7)/2 = 135.8 kg.

Assim, sem tantos clculos, pode-se prever que o peso do animal ser algo em torno de
135.8 kg.
Note-se as complicaes adicionais caso opte-se por recorrer mdia ou moda. A
primeira envolveria a soma das 10 observaes e a segunda necessitaria da elaborao
da distribuio de frequncias da varivel de interesse em face aos dados. De qualquer
forma, a ttulo de ilustrao, ter-se-ia a seguinte previso baseando-se na mdia ( x ),
como visto no quesito (a):
n

208.3 + 157.5 + ... + 130.5 1409.6


=
= 140.96 kg. Assim, espera-se um
n
10
10
peso de 140.96 kg para o novo animal.
x peso =

i =1

J em se tratando da moda (Mo) outras operaes so necessrias. O primeiro passo


elaborar a distribuio de frequncia dos dados, cujo algoritmo para variveis contnuas
baseia-se nas medidas apresentados abaixo:

n O n de observaes
min O valor mnimo observado
max O valor mximo observado

k O n de categorias (intervalos) a adotar: k= Int

Int(x) representa o nmero inteiro mais prximo de x


hO tamanho (amplitude) de cada intervalo: h=(max-min)/k

( n)

A partir das medidas acima, o intuito elaborar a distribuio de frequncias de k


intervalos de comprimento h, desde min at max: [min, min+h), [min+h, min+2h), ...,
[max-h, max]. Tais intervalos so ilustrados na figura abaixo.
min

min+h

min+2h

...

max-h

max

Dos dados do quesito, convenientemente ordenados para o clculo da mediana, temos que
n=10, min=66.2, max=216.5, k = Int n =Int(3.33)=3, h=(216.5-66.2)/3=50.1. Isto leva
seguinte distribuio de frequncias:
ndice da categoria
/ intervalo (i)
Intervalo
Frequncia(ni)
1
[66.2, 116.3) 2
2
[116.3, 166.4) 6

( )

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
3
Soma

[166.4, 216.5] 2
10

Da distribuio de frequncias, ainda em busca da moda, pode-se recorrer frmula de Czuber


(Mo):

a
h
Moda = l +
a + p
Onde Czuber sugere um valor para a moda dentro do intervalo (classe) modal. O intervalo
modal aquele que apresenta uma maior frequncia (absoluta ou relativa). Neste caso, o
intervalo modal dado por [116.3, 166.4). Alm disso,
l limite inferior da classe modal: l = 116.3
nm freq da classe modal (mais frequente): nm = 6
na freq da classe anterior modal na = 2
np freq da classe posterior modal: np = 2
a = nm na e p = nm np (a = 6 - 2 = 4, p = 6 - 2 = 4)
h amplitude da classe modal: h = 166.4 116.3= 50.1.
Logo, Mo = 116.3+ (4/8) 50.1=141.35 kg. Assim, prev-se que mais provavelmente o peso do
animal ser algo em torno de 141.35 kg.

2.e) Este quesito permite o uso de conceitos da Estatstica Descritiva, bem como do Clculo
de Probabilidades, para argumentar sobre a (in)dependncia entre duas variveis.
Especificamente, tratam-se aqui das variveis gnero (G) e atual condio (A) dos
animais estudados. Estatisticamente, caso a distribuio de frequncias relativas de A se
mantiver semelhante ao longo das classes de G, ento pode-se inferir que independente do
gnero, as incertezas sobre a atual condio se mantm semelhantes. Probabilisticamente, se
houver independncia P(A|G) = P(A). Em ambos os casos, descreve-se matematicamente
que, caso sejam independentes, o gnero no interfere na atual condio do animal.
As distribuies bivariadas de frequncias absolutas e relativas destas variveis encontramse abaixo. Sobre a montagem da distribuio bivariada de frequncias absolutas, note-se
que em quatro casos observou-se o evento A=0G=0 (os indivduos de n 1, 3, 8 e 9), em
dois casos observou-se o evento A=1G=0 (os indivduos 4 e 10), e assim por diante.
Sobre a distribuio bivariada de frequncias relativas, trata-se apenas da razo entre as
respectivas frequncias absolutas e o n de indivduos estudados (n=10).
Distribuio Bivariada: Frequncias
absolutas

Distribuio Bivariada: Frequncias


relativas

Gnero (G)
Atual
Condio Feminino Masculino
(A)
(0)
(1)
Total

Gnero (G)
Atual
Condio Feminino Masculino
(A)
(0)
(1)
Total

Sem
aftosa (0) 4

Sem
aftosa (0) 0.4

0.2

0.6

4
10

Com
aftosa (1) 0.2
Total
0.6

0.2
0.4

0.4
1

Com
aftosa (1) 2
Total
6

2
2
4

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva

Da distribuio bivariada de frequncias relativas acima, note-se que as incertezas sobre


a atual condio se alteram, a depender do gnero do indivduo. Por exemplo, se o
Gnero feminino (G=0) tem-se, pela regra do produto, a seguinte probabilidade de o
indivduo estar sem aftosa (A=0):
P(A=0|G=0) = P(A=0G=0)/P(G=0) = 0.4/0.6 0.667,
enquanto que se o Gnero masculino (G=1) tem-se, pela regra do produto,
P(A=0|G=1) = P(A=0G=1)/P(G=1) = 0.2/0.4 = 0.5.
Note-se assim que as incertezas sobre A se alteram a depender do Gnero (G). De fato,
tem-se que P(A=0) = 0.6 P(A=0|G=1)=0.5. Assim, infere-se que h uma relao de
dependncia entre o gnero e a atual condio dos animais, onde a chance de estar sem
aftosa (A=0) maior dentre os animais do gnero feminino (G=0), do que dentre aqueles do
Gnero masculino (G=1).

3) Esta questo trata estritamente do suporte a tomada de deciso fornecido pela estatstica
descritiva e da probabilidade quando diante de um conjunto de dados.
3.a) O coeficiente de variao (cv) uma medida adimensional que permite a mensurao
da incerteza refletida no desvio padro (s) em relao mdia, de tal forma que, para
variveis que assumem valores no negativos, quanto mais prximo de zero for o cv menor
ser a incerteza sobre a varivel. Por ser adimensional o cv facilita a comparao de
variabilidade entre variveis quantitativas. Matematicamente, trata-se da razo entre desviopadro e mdia:
s
cv = .
x
Para o caso da varivel tempo de permanncia do cliente na loja, que trata-se da diferena
entre os instantes de entrada e sada do cliente na loja, tem-se o seguinte conjunto de
observaes:
Cliente (i)
Instante de entrada na loja (horas) (yi)
Instante de sada da loja (horas) (wi)
Tempo de permanncia em horas
(xi=wi-yi)

1
8.6
8.7

2
9.4
10

3
9.5
9.8

4
10.2
10.7

5
11.5
11.9

6
12.4
12.8

7
12.5
12.6

8
13.4
13.5

9
13.6
13.8

10
14
14.8

0.1

0.6

0.3

0.5

0.4

0.4

0.1

0.1

0.2

0.8

Para o cmputo da mdia da varivel tempo de permanncia, seja xi o tempo de


permanncia do i cliente (em horas), tem-se
n

0.1 + 0.6 + 0.3 + ... + 0.8 3.5


=
= 0.35 horas. Ou seja, em mdia,
n
10
10
o tempo de permanncia de um cliente na loja de 0.35 horas (ou 21 minutos).
Para o desvio-padro, recorre-se primeiramente varincia do tempo de permanncia:
x tempo permanencia =

i =1

10

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
n

( x
s

2
tempo permanncia

x) 2

i =1

n 1

(0.1 0.35) 2 + (0.6 0.35) 2 + (0.3 0.35) 2 + ... + (0.8 0.35) 2


=
=
10 1

0.505
= 0.056 (horas) 2 .
9
s tempo

0.056
= 0.676. Assim, considera-se que a
0.35
x tempo permanncia
variabilidade do tempo de permanncia dos clientes na loja elevada, cerca de 67.6% em
relao mdia.
Logo, cv tempo

permanncia

permanncia

Por outro lado, considerando a varivel quantia consumida, tem-se:


n

x
x quantia consumida =

n
n

(x
2
s quantia
consumida =

10.9 + 1.3 + 12.1 + ... + 1.6 78.9


=
= R $ 7.89 ;
10
10

i =1

x) 2

i =1

n 1

(10.9 7.89) 2 + (1.3 7.89) 2 + (12.1 7.89) 2 + ... + (1.6 7.89) 2


=
10 1

854.789
= 94.977 (R$) 2 .
9
s quantia

94.977
= 1.235. Assim, considera-se que a
7.89
x quantia consumida
variabilidade do tempo de permanncia dos clientes na loja bastante elevada, 123.5% em
relao mdia.
Logo, cv quantia

consumida

consumida

Conclui-se assim que, baseando-se no coeficiente de variao, o tempo de permanncia dos


clientes na loja envolve um nvel de variabilidade menor que o da quantia financeira
consumida em suas compras.
3.b) Para estudar o nvel de variabilidade da varivel Atendente", o quesito sugere o uso
do ndice qualitativo de variao (IQV), util tanto para variveis qualitativas quanto
quantitativas, j que opera sobre distribuies de frequncias. Matematicamente,
k

IQV =

k (n 2 ni2 )

i =1
, onde
n 2 (k 1)
k nmero de classes (ou categorias) envolvidas na distribuio de frequncias;
n nmero de observaes envolvidas
ni frequncia absoluta da categoria i.

A distribuio de frequncias da varivel atendente dada abaixo


Atendente

Frequncia

11

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva

Ccera (0)
Maria (1)
Total

(ni)
6
4
10

Sobre o IQV desta varivel, tem-se:


2(10 2 (6 2 + 4 2 )) 2(100 52)
IQVatendente =
=
= 0.96.
100
10 2 (2 1)
Considera-se assim que a variabilidade associada ao "atendente" bastante elevada, j que o
maior valor assumido pelo IQV 100%, envolvendo casos de variabilidade mxima.
3.c) Este quesito permite o uso de conceitos da Estatstica Descritiva, bem como do Clculo
de Probabilidades, para argumentar sobre a (in)dependncia entre duas variveis.
Especificamente, tratam-se aqui das variveis Atendente da loja (A) e tempo de
permanncia do cliente na loja (T), cujos dados so apresentados pareados abaixo.
Cliente
1
Tempo de permanncia em horas (T) 0.1
Atendente (A)
1

2
3
0.6 0.3
0
1

4
0.5
1

5
0.4
0

6
0.4
0

7
0.1
0

8
0.1
1

9
0.2
0

10
0.8
0

Estatisticamente, se a distribuio de frequncias relativas de T se mantiver semelhante ao


longo das classes de A, ento pode-se inferir que independente da atendente, as incertezas
sobre o tempo de permanncia dos clientes se mantm semelhantes. Probabilisticamente,
tem-se que se houver independncia, P(T|A) = P(T). Em ambos os casos, descreve-se
matematicamente que, caso sejam independentes, a atendente no interfere no tempo de
permanncia do cliente na loja.
As distribuies bivariadas de frequncias absolutas e relativas destas variveis encontramse abaixo.
Frequncias absolutas
Frequncias relativas
Tempo de
Permanncia (T)
[0.1,0.333) (T=0)
[0.333,0.567) (T=1)
[0.567,0.8] (T=2)
Total

Atendente (A)
Ccera (0) Maria (1)
2
3
2
1
2
0
6
4

Total
5
3
2
10

Tempo de
Permanncia (T)
[0.1,0.333) (0)
[0.333,0.567) (1)
[0.567,0.8] (2)
Total

Atendente (A)
Ccera (0) Maria (1)
0.2
0.3
0.2
0.1
0.2
0.0
0.6
0.4

Total
0.5
0.3
0.2
1

Sobre a montagem da distribuio bivariada de frequncias absolutas, note-se que em dois


casos observou-se o evento T=0A=0 (os indivduos de n 7 e 9), em trs casos
observou-se o evento A=1T=0 (os indivduos 1, 3 e 8), e assim por diante. Sobre a
distribuio bivariada de frequncias relativas, trata-se apenas da razo entre as respectivas
frequncias absolutas e o n de indivduos estudados (n=10). Vale destacar que pode-se
inferir sobre a probabilidade de ocorrncia de um dado evento a partir de sua frequncia
relativa. Trata-se da abordagem frequentista para a inferncia sobre probabilidades.
Da distribuio bivariada de frequncias relativas acima, note-se que as incertezas sobre o
tempo de permanncia dos clientes se alteram, a depender da atendente da loja. Por

12

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
exemplo, se a atendente Ccera (A=0) tem-se, pela regra do produto, a seguinte
probabilidade de o cliente permanecer por mais tempo, isto , entre 0.567 e 0.8 horas (T=2):
P(T=2|A=0) = P(A=0T=2)/P(A=0) = 0.2/0.6 = 0.333,
enquanto que se a atendente Maria (A=1) tem-se, pela regra do produto,
P(T=2|A=1) = P(A=1T=2)/P(A=1) = 0.0/0.4 = 0.0.
Note-se assim que as incertezas sobre T se alteram a depender da atendente (A). De fato,
tem-se que P(T=2) = 0.2 P(T=2|A=1)=0.0. Assim, infere-se que h uma relao de
dependncia entre a atendente e o tempo de permanncia do cliente na loja, onde a chance
de uma maior permanncia do cliente (T=2) maior dentre os clientes atendidos por Ccera
(A=0), do que dentre aqueles atendidos por Maria (A=1).
3.d) Um histograma trata-se apenas de um esboo da distribuio de frequncias de uma
varivel contnua, onde no eixo das abscissas encontram-se os intervalos que agrupam os
valores observados da varivel e no eixo das ordenadas as frequncias (ou densidades)
destes intervalos. Entre as ltimas tabelas apresentadas para o quesito anterior encontra-se a
distribuio de frequncias absolutas da varivel tempo de permanncia. O histograma
associado encontra-se abaixo. Do histograma, pode-se perceber que mais comum que os
consumidores permaneam por menos tempo na loja e que medida que o tempo de
permanncia aumenta, a frequncia de clientes diminui.

4) Para esta questo, temos as seguintes distribuies de frequncia para a renda familiar:
Faixa de renda
(R$)
I
1
2
3

Faixa
[0, 200)
[200, 400)
[400, 600)

ponto mdio da
faixa i

Frequncia
absoluta

Frequncia Frequncia
relativa
acumulada
relativa

x*i
100
300
500

ni
300
400
200

fi
0.30
0.40
0.20

Fi
0.30
0.70
0.9

13

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
4 [600, 800)
5 [800, 1000]
Total

700
900
-

60
40
1000

0.06
0.04
1.00

0.96
1
-

4.a) Pede-se a mdia de renda, que para os dados agrupados se d por


k

n x

*
i i

100 300 + 300 400 + 500 200 + 700 60 + 900 40


= 328.00.
1000
n
Logo, estima-se que a renda familiar na regio de em mdia R$ 328.00.

x=

i =1

4.b) Pede-se a moda do n de dependentes da renda, isto , aquele valor que representa a
maioria das observaes. A moda pode ser obtida a partir da frmula de Czuber:

onde,
A classe modal aquela que apresenta uma maior frequncia absoluta (ou relativa).
Sugere-se um valor para a moda dentro deste intervalo. Neste caso, o intervalo modal
dado por [3, 5).
l - limite inferior da classe modal (l = 3)
freqm - freq da classe modal (mais frequente) (freqm = 500)
freqa - freq da classe anterior modal (freqa = 200)
freqp - freq da classe posterior modal (freqp = 200)
a = freqm freqa e p = freqm freqp (a = 500 - 200 = 300, p = 500 - 200 =
300)
h - amplitude da classe modal(h = 5 - 3 = 2).
Logo, Mo = 3 + (300/600)2 = 4. Assim, mais comumente, cerca de 4 pessoas
dependem da mesma renda.
4.c) Pergunta-se sobre a mediana da renda familiar, isto , aquele valor que se localizaria no
centro dos dados ordenados. Da distribuio de frequncias acumuladas relativas, v-se que
o valor que acumula abaixo dele 50% das rendas estar no intervalo [200, 400). Para dados
agrupados, a mediana ser obtida a partir da igualdade
0.5 Fa
, onde
Md = l + h
f
md

Classe mediana: aquela que envolve a mediana. Trata-se da classe cuja frequncia
relativa acumulada at o seu incio no ultrapassa os 50% e a frequncia relativa
acumulada at o seu final ultrapassa os 50%. Disto, v-se que a classe mediana do
problema em questo o intervalo [200, 400).
l limite inferior da classe mediana (l = 200)
h amplitude (comprimento) da classe mediana (h = 400 - 200 = 200)
Fa frequncia relativa acumulada da classe anterior classe mediana (Fa = 0.3)

14

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
fmd frequncia relativa da classe mediana (fmd = 0.4).
Logo, Md = 200 + 200 (0.5 - 0.3) / 0.4 = 300.

Assim, o valor que separaria ambas as classes sociais seria R$ 300.00.


4.d) Para fazer a comparao das variveis renda e n de dependentes, pode-se recorrer,
por exemplo, ao coeficiente de variao ou ao ndice qualitativo de variao (IQV).
Usando o ltimo, tem-se que
k

IQV =

k (n 2 ni2 )
i =1

, onde
n (k 1)
k nmero de classes (ou categorias) envolvidas na distribuio de frequncias;
n nmero de observaes envolvidas
ni frequncia absoluta da categoria i.
2

Para a renda, tem-se:


5(1000 2 (300 2 + 400 2 + 200 2 + 60 2 + 40 2 ))
IQVrenda =
= 0.881 .
1000 2 (5 1)
Logo, como o IQV assume valores entre 0 (nenhuma variao observada) a 1 (a maior
variao observvel), considera-se que a renda apresenta uma variabilidade
relativamente elevada.
Para o n de dependentes, tem-se:
5(1000 2 (200 2 + 500 2 + 200 2 + 60 2 + 40 2 ))
IQVn dep =
= 0.831 .
1000 2 (5 1)
Considera-se assim que a variabilidade associada ao n de dependentes relativamente
elevada. Contudo, conclui-se tambm que esta variabilidade menor que a da renda
familiar.

5) Esta questo relaciona-se natureza de variveis aleatrias e sobre as operaes


matemticas que a elas podem ser aplicadas, a depender de tal natureza. Podem-se
destacar ao menos 4 tipos de variveis: (i) as qualitativas nominais, onde os possveis
resultados so categorias ou atributos; (ii) as qualitativas ordinais, onde os possveis
resultados, embora que categorias (ou atributos), permitem que se realize uma
ordenao nos mesmos; (iii) as quantitativas discretas, onde os possveis resultados so
quantidades numricas discretas; isto , compem um conjunto enumervel onde
qualquer operao matemtica pode ser aplicada sobre seus elementos. Usualmente,
variveis discretas advm de um processo de contagem. Por fim, tem-se (iv) as variveis
quantitativas contnuas, geralmente provenientes de um processo de mensurao, onde
os possveis resultados compem um conjunto contnuo, sendo representado por
nmeros reais. Em suma, pode-se aplicar qualquer operao matemtica sobre variveis
quantitativas, enquanto que sobre as qualitativas aplica-se a contagem (o n de
ocorrncias) dos seus atributos e, no mximo, uma ordenao dos resultados (para o
caso das ordinais).

15

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
5.a) Como a idade de uma pessoa pode assumir qualquer valor real maior que zero, por
um lado, e, por outro, medida a partir de algum processo de mensurao do tempo,
conclui-se que trata-se de uma varivel quantitativa contnua. Logo, a afirmao
incorreta.
5.b) Como o nvel de escolaridade um atributo ou, mais especificamente, um ttulo,
v-se que trata-se de uma varivel qualitativa. Alm disso, v-se que pode-se aplicar
uma ordenao aos possveis resultados desta varivel. Por exemplo, pode-se concluir
que o ttulo do ensino mdio "superior" ao do fundamental. Logo, trata-se de uma
varivel ordinal. Assim, a afirmao incorreta.
5.c) A mdia de um conjunto de observaes (x1, x2, ..., xn) dada pela funo
n

x=

x
i =1

.
n
V-se, com isso, que apenas variveis quantitativas permitem a sua aplicao; j que tal
funo envolve operaes de soma e diviso, incompatveis, por sua vez, aos resultados
categricos das variveis qualitativas; isto , as observaes (x1, x2, ..., xn) devem ser
quantidades e no qualidades. Logo, a afirmao est incorreta.
5.d) A moda representa o valor mais frequente de um conjunto de observaes (x1, x2,
..., xn). Logo, como trata-se basicamente de uma operao de contagem de ocorrncias,
que independe de as observaes serem qualidades ou quantidades, a moda pode ser
aplicada a qualquer tipo de varivel. Logo, a afirmao est incorreta.
5.e) A argumentao aqui assemelha-se do quesito 5.c, sobre a mdia. A varincia de
n

uma amostra de observaes (x1, x2, ..., xn) dada pela funo s 2 =

(x
i =1

x) 2

.
n 1
V-se, com isso, que apenas variveis quantitativas permitem a sua aplicao; j que tal
funo envolve operaes de soma, subtrao, potncia e diviso, incompatveis, por
sua vez, aos resultados categricos das variveis qualitativas; isto , as observaes (x1,
x2, ..., xn) devem ser quantidades e no qualidades. Logo, a afirmao est incorreta.
5.f) Como o n de dependentes de uma famlia pode assumir qualquer valor inteiro nonegativo, por um lado, e, por outro, medido a partir de um processo de contagem,
conclui-se que trata-se de uma varivel quantitativa discreta. Logo, a afirmao
incorreta.
5.g) Como a classe social um atributo, v-se que trata-se de uma varivel qualitativa.
Alm disso, v-se que pode-se aplicar uma ordenao aos possveis resultados desta
varivel. Por exemplo, pode-se concluir que a classe A representa um patamar de renda
mais elevado que o da B. Logo, trata-se de uma varivel ordinal. Assim, a afirmao
incorreta.

16

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
5.h) A mediana de um conjunto de observaes (x1, x2, ..., xn) dada pelo valor que se
encontraria no centro dos dados ordenados; isto , trata-se daquele valor que acumula
50% das observaes ordenadas. V-se, com isso, que variveis qualitativas nominais
no permitem a sua aplicao; j que tal funo envolve ordenao, incompatvel, por
sua vez, aos resultados das variveis qualitativas nominais; isto , as observaes (x1,
x2, ..., xn) devem ser ordenveis. Logo, a afirmao est incorreta.
5.i) A varivel idade, a exemplo das demais que se prestam a medir o tempo,
intrinsecamente quantitativa contnua. Este tipo de varivel emerge frequentemente de
processos de mensurao. A mensurao do peso, volume, comprimento e rea so
alguns exemplos de processos que resultam em variveis quantitativas contnuas. Os
possveis valores que uma varivel quantitativa contnua pode assumir so
representados matematicamente por algum conjunto dos nmeros reais. Por exemplo, os
possveis resultados da varivel idade de um ruminante em meses (X) podem ser
representados pelo conjunto X = {x |x 0}. Sobre a possibilidade de que X assuma
o valor 0, pode-se argumentar que {X=0} expressa os casos em que o ruminante morre
ainda durante sua gestao. De qualquer forma, excluir {X=0} de X pode ainda ser
considerado vlido, a depender de como se define a idade (X). Por exemplo, caso X seja
entendido como o tempo de vida desde a gestao, isto fatalmente elimina qualquer
possibilidade de ocorrer {X=0} e conduz a X = {x |x > 0}. Outra condio que
excluiria {X=0} seria descartar do estudo aqueles ruminantes que morrem durante a
gestao. Em complemento, destaque-se ainda que o conjunto X no apresenta um
limite superior para X. Isto decorre do fato de que a definio de um valor mximo para
X trata-se de um desafio to grande quanto o do prprio estudo da variabilidade de X.
Desta forma, mostrar-se-ia um trabalho desnecessrio e demasiadamente custoso definir
tal mximo.

Por outro lado, note-se que o conjunto apresentado pelo enunciado X ={0, 1, 2, ...}
envolve apenas os valores inteiros contidos nos reais no negativos. Por exemplo, tal
conjunto no envolve como possvel resultado para X o valor 2.5 meses, isto , a idade
dois meses e meio. Desta forma X no seria adequado para representar todos os
possveis resultados de X. Logo, a afirmao est INCORRETA.
5.j) Neste quesito destaca-se que todas as n observaes da amostra estariam
concentradas em uma s categoria, diga-se a categoria j. Dessa forma, baseando-se na
amostra, no seria to incerta a previso sobre o resultado de uma futura observao: a
previso certamente apontaria para a categoria j.

Por exemplo, consideremos a varivel Xi"o estado de sade do i indivduo


selecionado de um local". Neste caso, o n de categorias da varivel poderia ser (k=)2,
onde cada Xi poderia assumir os valores 0 (se o indivduo est sadio) e 1 (se o indivduo
est doente). Se sortearmos (n=)100 indivduos do local e observamos a amostra (x1=0,
x2=0, ..., x100=0), ento certamente preveremos, da amostra, que o 101 indivduo a ser
sorteado estar tambm sadio, ou seja, que ocorrer {X101 = 0}.
Perceba que nos casos onde todas as observaes da amostra se concentram em um s
resultado, verifica-se o menor nvel de disperso (variabilidade) dos dados e que isto
17

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
minimiza nossas incertezas ao fazermos previses, por exemplo. No exemplo
mencionado, a ttulo de ilustrao, o IQV assumiria o valor zero, refletindo incerteza
mnima. Desta maneira, a afirmao est INCORRETA.
k

5.k) O ndice qualitativo de variao (IQV) dado pela funo IQV =

k (n 2 ni2 )
i =1

n 2 (k 1)

onde
k nmero de classes (ou categorias) envolvidas na distribuio de frequncias de
interesse;
n nmero de observaes envolvidas
ni frequncia absoluta da categoria i.
De maneira a responder ao quesito, estudemos o caso onde a amostra apresenta a menor
variabilidade possvel, tal como descrito no quesito anterior: quando todas as
observaes se concentram em uma das categorias da varivel, diga-se a categoria j.
Nesses casos, ni=n, se i=j, e ni=0 caco contrrio (se ij), isto , a distribuio de
frequncias absolutas dada pela tabela abaixo:
Categoria (i) Frequncia absoluta (ni)
1
0
2
0
...
...
j-1
0
j
n
j+1
0
...
...
k
0
soma
n
k (n 2 n 2 )
= 0. Logo, o caso de
n 2 (k 1)
i =1
incerteza mnima a partir dos dados reflete-se em um IQV igual a zero, ou 0%. Assim, a
afirmao est INCORRETA.

Nestes casos, obtemos

ni2 = n 2 e IQVmnimo =

5.l) Na verdade, a frequncia relativa de dada categoria de uma varivel se d pela diviso
de sua frequncia absoluta pelo n de observaes da amostra sob estudo. Em outros termos,
tratam-se de frequncias relativas ao tamanho amostral e no ao nmero de categorias da
varivel. Matematicamente, seja ni a frequncia absoluta (o n de ocorrncias) da categoria i
na amostra, onde i=1, 2,..., k. Seja n o tamanho da amostra sob estudo. Ento,
k

n=

n
i =1

e a frequncia relativa da categoria i dada por fi = ni/n. De fato, o resultado ni/k

no possui um significado imediatamente intuitivo. Logo, a afirmao incorreta.

18

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
5.m) A mdia de um conjunto envolvendo n observaes x= (x1, x2, ..., xn) dada pela
1 n
funo x = x i . Por outro lado, a mediana o valor que se encontra na posio central
n i =1
dos dados ordenados, diga-se y=(y1, y2, ..., yn), onde y1 o mnimo de x, yn o mximo de x
e os demais valores de y so o restante de x dispostos de forma no decrescente. Por
exemplo, caso trate-se de um conjunto envolvendo um n mpar de observaes, a mediana
ser o valor y(n+1)/2. Por outro lado, caso trate-se de um n par de observaes, a mediana
pode se dar pelo ponto mdio entre os valores centrais, yn/2 e yn/2+1, caso a varivel seja
quantitativa contnua. De qualquer forma, pode-se destacar que a funo mdia, por
envolver a soma de todos os valores da amostra, sofre grande influncia de pontos extremos
(isto , pontos estranhos, aberrantes, discrepantes), enquanto que a mediana insensvel a
tais valores, j que envolve apenas os valores centrais da amostra ordenada. Logo, a
afirmao est incorreta.
5.n) Um dos primeiros passos de uma anlise descritiva a elaborao de distribuies que
sintetizem os dados disponveis. Destaque-se neste sentido as distribuies de frequncias,
que exibem a frequncia de ocorrncia de cada um dos possveis resultados da varivel a
partir da amostra.
Quando os dados envolvem uma varivel qualitativa (ou seja, uma varivel cujos possveis
resultados permitem como operao matemtica direta sobre eles, no mximo, a
ordenao), a elaborao da distribuio de frequncia relativamente simples: Basta
computar a frequncia de ocorrncias de cada possvel resultado na amostra. Por exemplo,
se a varivel envolve o gnero do indivduo, computa-se da amostra a frequncia de
ocorrncias de cada gnero (masculino e feminino).
Por outro lado, caso trate-se de uma varivel contnua (cujos resultados pertencem aos
nmeros reais), a elaborao de uma distribuio de frequncias requer maiores
sofisticaes. De fato, caso adote-se a mesma regra direcionada a variveis qualitativas, ser
possvel que a distribuio de frequncias coincida com os prprios dados da amostra. Isto
porque bem provvel que os valores da amostra de uma varivel contnua no se repitam
e, tambm, mesmo se ocorrer repeties, isto no implica em tal valor ser o mais privvel
(verossmil). Neste sentido, antes da contagem, ser preciso construir intervalos (classes,
categorias), para que da elabore-se a distribuio de frequncia destes. Um algoritmo
simples a ser adotado a partir da amostra envolve
1. O valor mnimo observado na amostra: min;
2. O valor mximo observado na amostra: max;
3. O n de categorias (intervalos): k;
4. O tamanho (amplitude) de cada intervalo: h = (max-min)/k.
A partir dos itens de 1 a 4 acima, constroem-se os k intervalos:
1. [min, min+h),
2. [min+h, min+2h), ...,
k. [min+(k-1)h, max]
De posse dos intervalos construdos acima, computa-se o n de elementos da amostra que
pertencem a cada intervalo, configurando-se assim em uma distribuio de frequncias.

19

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
Percebe-se assim que a elaborao da distribuio de frequncias de uma varivel contnua
NO to simples quanto aquela de uma varivel qualitativa. Assim, a afirmao est
INCORRETA.
5.o) A mediana de um conjunto de observaes relativa a uma varivel X, (x1, x2, ..., xn),
uma medida de localizao que permite, por exemplo, que se faa previses sobre o valor
de X. Ela uma estatstica de ordem dada matematicamente pelo valor que se encontraria
no centro dos dados ordenados; isto , trata-se daquele valor que acumularia 50% das
observaes ordenadas. Por outro lado, a distribuio de frequncias acumuladas permite
associar a cada valor xi a frequncia de valores menores ou iguais a xi.
Desta forma, pode-se considerar que o valor cuja frequncia acumulada relativa de 50%
na distribuio de frequncias acumuladas a mediana. Logo, v-se que a operao de
ordenao necessria obteno da mediana tambm intrnseca elaborao de uma
distribuio de frequncias acumuladas. De fato, no apenas a mediana pode ser obtida a
partir da distribuio de frequncias acumuladas mas, tambm, outras estatsticas de ordem
(tais como o valor que acumula at ele 25% ou 75% dos dados). Logo, a afirmao est
CORRETA.

6) Nesta questo busca-se ilustrar a utilidade da estatstica descritiva para o suporte


deciso racional sob incerteza. Aqui, o termo racional tambm sinnimo de tcnico
ou mesmo cientfico.
6.a) Neste quesito, pode-se fazer uso da abordagem frequentista da probabilidade. Tal
abordagem baseia-se no teorema, tambm conhecido como a Lei dos Grandes Nmeros,
que afirma que medida que o tamanho amostral cresce, a frequncia relativa do evento de
interesse (E) aproxima-se da sua probabilidade de ocorrncia. Matematicamente, a
frequncia relativa de E dada por
fE = nE/n
onde n tamanho da amostra e nE n de vezes em que E ocorre dentre as n
observaes da amostra.
No quesito, o evento de interesse E X>370, onde Xcusto do tratamento do indivduo
de interesse. Por outro lado, v-se que n=15 indivduos e que nE=1, isto , dentre os (n=)15
indivduos da amostra, apenas (nE=)1 envolveu um (E) custo de tratamento superior a
R$370.00. Logo, temos como estimativa para P(E), ou seja para a probabilidade de que o
tratamento envolva um custo superior a R$370.00, a frequncia relativa
fE=1/15=0.067=6.7%.
Assim, para um decisor propenso a risco o custo do tratamento ultrapassar R$350.00 pode
ser considerado como um evento pouco provvel, estimado em cerca de 6.7% de
probabilidade de ocorrncia.
6.b) Dentre as principais medidas de posio, destacam-se a mdia, mediana e moda. O
quesito pede apenas uma destas medidas. Por simplicidade dos clculos, poder-se-ia adotar
a mediana, j que os dados j encontram-se ordenados. De fato, a mediana trata-se apenas
do valor que se encontra na posio central dos dados ordenados. Como a questo envolve

20

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
um n impar de (n=)15 indivduos, a mediana seria o valor que se encontra na posio
(n+1)/2=8 dos dados ordenados. Assim, sem tantos clculos, obtm-se como mediana o
valor R$ 295.1. Logo, pode-se prever que o custo de tratamento do doente ser algo em
torno de R$ 295.1.
Note-se as complicaes adicionais caso opte-se por recorrer mdia ou moda. A primeira
envolveria a soma das 15 observaes e a segunda necessitaria da elaborao da
distribuio de frequncia da varivel de interesse em face aos dados. De qualquer forma, a
ttulo de ilustrao, ter-se-ia a seguinte previso baseando-se na mdia ( x ):
n

x=

x
i =1

160.4 + 213.8 + ... + 364.6 + 439.6 4413.8


=
= 294.3 .
15
15

J em se tratando da moda (Mo) outras operaes so necessrias. O primeiro passo


elaborar a distribuio de frequncia dos dados, cujo algoritmo para variveis contnuas
baseia-se nas medidas apresentados abaixo:
n O n de observaes
min O valor mnimo observado
max O valor mximo observado

k O n de categorias (intervalos) a adotar: k= Int

( n)

Int(x) representa o nmero inteiro mais prximo de x


hO tamanho (amplitude) de cada intervalo: h=(max-min)/k
A partir das medidas acima, o intuito elaborar a distribuio de frequncias de k intervalos
de comprimento h, desde min at max, [min, min+h), [min+h, min+2h), ..., [min+(k-1)h,
max]. Tais intervalos so ilustrados na figura abaixo.

min

min+h

min+2h

...

max-h

max

Dos dados do quesito, convenientemente ordenados, temos que n=15, min=160.4,


max=439.6, k = Int 15 =Int(3.87)=4, h=(439.6-160.4)/4=69.8. Isto leva seguinte

( )

distribuio de frequncias:
ndice da
categoria (i)
1
2
3
4

Frequncia
Intervalo absoluta (ni)
[160.4, 230.2) 2
[230.2, 300.0) 6
[300, 369.8) 6
[369.8, 439.6) 1
Soma
15
Da distribuio de frequncia, ainda em busca da moda, pode-se recorrer moda de Czuber
(Mo):
a
Mo = l +
h'
a p

Onde Czuber sugere um valor para a moda dentro do intervalo (classe) modal. O intervalo
modal aquele que apresenta uma maior frequncia (absoluta ou relativa). Neste caso, o

21

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
intervalo modal dado por [230.2, 369.8), j que ambos os intervalos [230.2, 300.0) e
[300.0, 369.8) so vizinhos entre si e possuem a maior frequncia. Alm disso,
l limite inferior da classe modal: l = 230.2
nm freq da classe modal (mais frequente): nm = 12
na freq da classe anterior modal na = 2
np freq da classe posterior modal: np = 1
a = nm na e p = nm np (a = 12 - 2 = 10, p = 12 - 1 = 11)
h' amplitude da classe modal: h = 369.8 230.2 = 139.6.
Logo, Mo = 230.2 + (10/21).139.6 =296.68.
Assim, espera-se (seguindo a mdia) que o custo com o tratamento seja algo em torno de R$
294.3, enquanto que mais provavelmente (seguindo a moda) prev-se que tal custo ser de
cerca de R$ 296.68.
6.c) Para este quesito, poder-se-ia recorrer a medidas tais como o ndice qualitativo de
variao (IQV), a amplitude, a varincia, o desvio-padro ou o coeficiente de variao.
Contudo, como a amplitude, a varincia e o desvio-padro requerem maior esforo para a
elaborao de argumentos racionais acerca do nvel de incerteza inerente varivel, adotase aqui uma medida de variabilidade relativa, tal como o IQV ou o coeficiente de variao.
Devido simplicidade dos clculos do IQV em face distribuio de frequncias montada
no quesito anterior para o custo de tratamento da doena, adota-se aqui esta medida:
k

k n 2 n i2
IQV = 2 i =1 , onde
n (k 1)

k nmero de classes (ou categorias) envolvidas na distribuio de frequncias: k=4


n nmero de observaes envolvidas: n=15
ni frequncia absoluta da categoria i.
4(152 (22 + 62 + 62 + 12 )) 4(225 77)
=
= 0.877 .
152 (4 1)
675
Logo, baseando-se no IQV pode-se concluir que a previso feita a partir do quesito anterior
envolve um elevado nvel de incerteza, j que o IQV assume valores entre 0 e 1 e quanto
maior seu valor maior a disperso presente na distribuio de frequncias. Em outros
termos, baseando-se no IQV o decisor no deve ficar surpreso caso o custo do tratamento
no seja to prximo do valor previsto.
IQV =

Assim como no quesito anterior, apresentam-se tambm medidas alternativas ao IQV para
responder ao atual quesito:
Amplitude = max-min = R$ 279.16
Varincia:
n

s2 =

(x

x) 2

=
n 1
(106.4 294.3) 2 + (213.8 294.3) 2 + ... + (439.6 294.3) 2
= 4539.14(R$) 2
15 1
i =1

22

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
4539.14 = R$67.37
s 67.37
Coeficiente de variao: cv = =
= 0.23 =23%.
x 294.3
Destaque-se o valor obtido para o coeficiente de variao (cv) que, a exemplo do IQV,
uma medida relativa. Contudo, particularmente, o cv apresenta uma medida de disperso
relativa mdia. Vale ressaltar que o cv sugere um nvel de disperso baixo relativamente
mdia. Assim, baseando-se no cv o decisor deveria considerar natural que o custo do
tratamento no esteja to prximo da mdia adotada como previso, j que esta assume um
valor razoavelmente elevado.
Desvio-padro: s =

Em resumo, tanto o IQV quanto o cv sugerem que o decisor encare como natural um
eventual distanciamento entre o valor previsto e o observado: o IQV baseando-se na
disperso relativa distribuio de frequncias e o cv baseando-se na disperso relativa
mdia.
6.d) Para este quesito, como trata-se de uma varivel quantitativa contnua, recorre-se a um
histograma. Um histograma nada mais que o esboo da distribuio de frequncias de uma
varivel quantitativa, onde no eixo das abscissas (x) encontram-se os intervalos da
distribuio de frequncias e no das ordenadas (y) as respectivas frequncias. O histograma
destaca que a maior parte dos dados encontra-se no intervalo [230, 370). Dentre as 15
observaes, apenas 3 observaes encontram-se fora deste intervalo.
Vale destacar que no haveria sentido adotar grficos tais como o de pares, uma vez que
como trata-se de uma varivel contnua, a frequncia de cada valor da amostra seria sempre
equivalente a 1 e o grfico seria o esboo dos prprios dados, gerando pouca ou nenhuma
informao. Da mesma forma, um grfico onde o eixo das abscissas seria o rtulo do
indivduo e o das ordenadas o custo requer cautela, j que de acordo com o enunciado os
dados foram apresentados ordenadamente apenas por convenincia, para facilitar os
clculos estatsticos demandados pelos quesitos, por um lado, e, por outro, tal grfico requer
maiores sofisticaes para a leitura da variabilidade.

23

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva

7) Esta questo destina-se relao entre distribuies de frequncias e de


probabilidades,diante de uma amostra sobre dada varivel aleatria. Na Estatstica, tal
relao formalmente apresentada atravs da abordagem frequentista para modelar
probabilidades. Nesta abordagem, a probabilidade de ocorrer o evento de interesse E, P(E),
pode ser aproximada pela frequncia relativa de ocorrncias de E na amostra:
f(E) = n(E)/nT,
onde nT n de oportunidades para a ocorrncia ou no de E e
n(E) n de vezes em que E ocorreu nas nT oportunidades.
7.a) Estuda-se a probabilidade de ocorrer o evento EDado servidor falha em uma
demanda.
Da amostra tem-se que nT=20.100=2000 demandas (j que cada um dos 20 servidores foi
demandado por 100 vezes) e que n(E)=23 (dessas 2000 demandas observaram-se 23 falhas).
Logo, P(E) pode ser aproximada por 23/200000.0115. Logo, a probabilidade de que ocorra
de um servidor semelhante aos envolvidos na amostra (tal como o 21) falhar quando
demandando de aproximadamente 1.15%.
Raciocinando de outra maneira, vale perceber que, em mdia, ocorrem 1.15 falhas em 100
demandas, de acordo com a amostra, levando a uma frequncia relativa de 1.15/100=1.15%.
O clculo para tal mdia encontra-se mais frente, na resoluo do quesito (c).
7.b) Para esta questo, considere a varivel Xn de falhas nas 100 primeiras demandas de
um dado servidor. Deseja-se saber P(X 1), j que d-se a garantia de, no mximo, 1 falha
em 100 demandas. Isto , deseja-se a probabilidade de que o n de falhas em 100 demandas
no ultrapasse 1. Intuindo de maneira frequentista, deseja-se a frequncia relativa do evento
E2X 1.
Note-se que tal quantidade facilmente estimada a partir da distribuio de frequncias
acumuladas de X (j que os dados esto ordenados). Da amostra v-se que P(X 0) 5/20,

24

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
j que dos 20, 5 no falharam quando demandados por 100 vezes. Seguindo o mesmo
raciocnio frequentista, tem-se que P(X 1) 14/20=70%. Logo, a probabilidade de que o
21 servidor satisfaa a garantia de no mximo 1 falha nas 100 primeiras demandas de
aproximadamente 70%.
7.c) Para responder a este quesito uma de ao menos trs medias estatsticas poderia ser
adotada: a moda, a mediana ou a mdia. Para tanto, considere x= (x1, x2, ..., xn) como sendo
o vetor de observaes na amostra (n=20).
A moda se destina a calcular o valor mais frequente (mais provvel) da amostra e envolve a
distribuio de frequncias da amostra:
I

N de falhas em 100 demandas


Frequncia absoluta da categoria i (ni)

0
5

1
9

2
4

3
2

Da distribuio de frequncias v-se que o valor mais frequente 1. Logo, baseando-se na


moda prev-se que mais provavelmente ocorrer uma falha em 100 demandas do novo
servidor.
Por sua vez, a mediana seria de fcil obteno, j que trata-se do valor que separa os dados
ordenados ao meio (veja os elementos de x j so apresentados ordenados no enunciado).
Como se envolve um n par de observaes (n=20 servidores), deve-se aproximar a mediana
pelo ponto mdio dos valores que se encontram nas posies centrais (xn/2=x10 e xn/2+1=x11):
Md = (xn/2 + xn/2+1)/2. Dos dados, Md = (x10 + x11)/2 = 1. Logo, recorrendo mediana,
prev-se que ocorrer uma falha nas primeiras 100 demandas do 21 servidor.
1 n
Por fim, a mdia dada pela funo x = x i =23/20=1.15. Como a varivel de interesse
n i =1
de natureza discreta, arredonda-se a mdia para seu inteiro mais prximo (1). Logo,
recorrendo mdia, prev-se que ocorrer uma falha nas primeiras 100 demandas do 21
servidor.
V-se assim que neste caso, tanto a moda quanto a mediana e a mdia apontam para a
ocorrncia de uma falha nas 100 primeiras demandas do servidor.
7.d) Pede-se a interpretao da incerteza sobre o n de falhas em 100 demandas a partir do
IQV:
k

IQV =

k (n 2 n i2 )

i =1
, onde
n 2 (k 1)
k nmero de classes (ou categorias) envolvidas na distribuio de frequncias;
n nmero de observaes envolvidas (tamanho da amostra)
ni frequncia absoluta da categoria i.

Para a distribuio de frequncia da amostra (tabela anterior em (c)), tem-se que


4(20 2 (5 2 + 9 2 + 4 2 + 2 2 ))
IQV =
= 0.9133.
20 2 (4 1)

25

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
Logo, baseando-se no IQV conclui-se que a previso realizada a partir de (c) envolve um
nvel de incerteza relativamente alto, uma vez que o IQV assume valores entre zero e um
onde quanto maior o IQV, maior o nvel de incerteza associado varivel amostrada.

8) Esta questo destina-se relao entre distribuies de frequncias e de


probabilidades,diante de uma amostra sobre dada varivel aleatria. Na Estatstica, tal
relao formalmente apresentada atravs da abordagem frequentista para modelar
probabilidades. Nesta abordagem, a probabilidade de ocorrer o evento de interesse E, P(E),
pode ser aproximada pela frequncia relativa de ocorrncias de E na amostra:
f(E) = n(E)/nT,
onde nT n de oportunidades para a ocorrncia ou no de E e
n(E) n de vezes em que E ocorreu nas nT oportunidades.
8.a) Estuda-se a probabilidade de ocorrer o evento EDado servidor falha em uma
demanda.
Da amostra tem-se que nT=1896 e que n(E)=20. Para este ltimo vale notar que cada
servidor da amostra falhou exatamente por uma vez. Logo, P(E) pode ser aproximada por
20/18960.0105. Logo, a probabilidade de que ocorra de um servidor semelhante aos
envolvidos na amostra (tal como o 21) falhar quando demandado de aproximadamente
1.05%.
8.b) Para esta questo, considere a varivel Xn de demandas at a falha de um dado
servidor. Deseja-se saber a garantia em termos do n de demandas at a falha, x, para a
qual P(X > x)=0.8. Isto , a probabilidade de que o n de demandas ultrapasse x deve
equivaler a 0.8. Intuindo de maneira frequentista, deseja-se o x para o qual a frequncia
relativa do evento E2n de demandas at a falha ultrapasse x seja de 80%.
Note-se que P(X > x) = 1 P(X x) = 0.2, isto , deseja-se tambm que a probabilidade de
falha durante a garantia seja de 20%. Dessa forma, x o quantil 20% associado a X,
facilmente estimado a partir da distribuio de frequncias acumuladas de X (j que os
dados esto ordenados). Da amostra v-se que P(X 10) 1/20, j que dos 20 servidores
apenas 1 apresentou um n de demandas at a falha menor ou igual a 10. Seguindo o mesmo
raciocnio frequentista, tem-se que P(X 19) 2/20, P(X 21) 3/20 e que P(X 24)
4/20=20%. Por outro lado, veja que P(X > 24)15/20=80%, isto , que o valor 24 acumula
acima dele 15 das 20 observaes da amostra. Logo, o quantil 20% da distribuio de
frequncias acumuladas relativas (x=24 demandas) uma boa aproximao para a garantia
do servidor baseada em uma confiabilidade de 80%. A garantia seria, assim, de 24
demandas.
8.c) Para responder a este quesito uma de ao menos trs medidas estatsticas poderia ser
adotada: a moda, a mediana ou a mdia. Para tanto, considere x= (x1, x2, ..., xn) como sendo
as observaes na amostra (n=20).
A moda se destina a calcular o valor mais frequente (mais provvel) da amostra e
envolveria certamente maior esforo uma vez que seria necessrio o cmputo da
distribuio de frequncias da amostra (veja que no h qualquer observao mais frequente
na amostra).

26

Universidade Federal do Cariri - UFCa


INTRODUO ESTATSTICA
Prof. Paulo Renato Alves Firmino
Lista de exerccios resolvidos Estatstica Descritiva
Por sua vez, a mediana de fcil obteno, j que trata-se do valor que separa os dados
ordenados ao meio (veja que os elementos de x j so apresentados ordenados no
enunciado). Como se envolve um n par de observaes (n=20 servidores), deve-se
aproximar a mediana pelo ponto mdio dos valores que se encontram nas posies centrais
(xn/2=x10 e xn/2+1=x11):
Md = (xn/2 + xn/2+1)/2. Dos dados, Md = (x10 + x11)/2 = 57.5. Como a varivel de interesse
de natureza discreta, arredonda-se Md para seu inteiro mais prximo (Md58). Logo,
recorrendo mediana, prev-se que sero necessrias cerca de 58 demandas at a
ocorrncia da falha do 21 servidor.
1 n
Por fim, a mdia dada pela funo x = x i =1897/20=94.85. Como a varivel de
n i =1
interesse de natureza discreta, arredonda-se a mdia para seu inteiro mais prximo (95).
Logo, recorrendo mdia, prev-se que sero necessrias cerca de 95 demandas at a
ocorrncia da falha do 21 servidor.
8.d) Tanto da tabela quanto do enunciado em (c) v-se que a varivel de interesse Xn
de demandas do servidor at a falha. Tal varivel reflete um processo de contagem de um
tipo de experimento onde, genericamente, tenta-se o sucesso at que ele ocorra. Neste
especfico caso, o sucesso seria evento falha do servidor na demanda. Trata-se, assim, de
um experimento Geomtrico.

27