Escolar Documentos
Profissional Documentos
Cultura Documentos
29
1.2.2 FREQUNCIA ACUMULADA (Fac): a soma das frequncias anteriores ou iguais a
uma determinada frequncia absoluta observada. Por exemplo, na tabela
abaixo o valor 8 da coluna das frequncias acumuladas(Fac), representa a soma
das frequncias absolutas(Fi) 3 e 5
Voc deve observar que a ltima frequncia acumulada dever ser igual ao n
de observaes. No Ex. das notas dos alunos, teramos
Notas N de alunos (Fi) Fac
0 2
2 4
4 6
6 8
8 10
03
05
11
15
06
03
08
19
34
40
40
Agora vejamos o que so frequncias relativas.
1.2.3.FREQUNCIA RELATIVA ( fi ): a porcentagem representativa de cada observao
ou intervalo de observaes. Ser obtida por .100
Fi
fi
n
= . Assim, no nosso exemplo, a
primeira frequncia relativa ao intervalo 0 2 , seria dada por
3
100 7, 5
40
fi = = .
Desta forma, aluno voc j poderia construir a tabela de distribuio de frequncia do
exemplo das notas, da seguinte forma:
Notas N de alunos (Fi) Fac fi(%)
30
0 2
2 4
4 6
6 8
8 10
03
05
11
15
06
03
08
19
34
40
7,5
12,5
27,5
37,5
15
40 100
Aps ter visto e aprendido a organizar os dados em tabelas de frequncias,
voc ir para o prximo tpico. E nesta segunda parte de nossa aula, voc aprender a
calcular e interpretar as principais medidas de posio, que so as medidas as quais
nos forneceram as primeiras informaes sobre o comportamento das variveis.
TPICO 2 MEDIDAS DE POSIO OU DE TENDNCIA CENTRAL
As medidas de posio podem apresentar-se de vrias formas, dependendo do
que se pretende conhecer a respeito dos dados. Geralmente os dados resultantes das
medidas de posio se concentram em torno do centro da distribuio, por isso so
tambm chamadas de medidas de tendncia central.
Objetivo:
- Encontrar e analisar o resultado da mdia aritmtica, mediana e moda, bem
como os resultados das separatrizes: quartis, decis e percentis.
Daremos incio ento com a mais conhecida das medidas de posio, que a mdia
aritmtica, vamos l ento:
2.1 MDIA ARITMTICA ( X )
: Definio
a representao de um conjunto de dados, o qual poder estar de forma
no-agrupada ou agrupada, atravs de um nico valor.
31
A seguir, voc ir ver as definies para o clculo de dados no-agrupados e
agrupados. Haver exemplos para melhor compreenso do assunto. Iniciaremos com o
clculo para dados no-agrupados.
2.1.1 MDIA ARITMTICA PARA DADOS NO-AGRUPADOS
Chamaremos de dados no-agrupados, ao conjunto de dados em que nenhum
elemento se repete, no havendo assim a necessidade de agrupar estes dados por
frequncias, visto que todos teriam frequncia igual a 1, conforme veremos no ex.
abaixo.
Assim, se X uma varivel quantitativa que assume os valores
1 2
, ,...,
n
X X X
no agrupados, poderemos encontrar a mdia aritmtica de X, atravs da seguinte
relao.
1 2 1
...
n
i
n i
X
X X X
X
n n
=
+ + +
= =
Exemplo: o n de jornais vendidos em uma determinada semana em uma banca ocorre
na seguinte grandeza: 39, 18, 24, 20, 27, 19, 25. Assim, teramos o seguinte n mdio
de jornais vendidos:
39 18 24 20 27 19 25 172
24, 6
7 7
X
+ + + + + +
= = =
Vejamos agora o clculo para dados agrupados. Voc ir perceber que, ao
contrrio dos dados no-agrupados, esses dados podero ser agrupados por
frequncias, visto que aparecem elementos repetidos dentro do conjunto.
2.1.2 MDIA ARITMTICA PARA DADOS AGRUPADOS
Se os valores da varivel forem agrupados em uma distribuio de frequncia,
usaremos
1
n
i
i
X Fi
X
n
=
=
32
Em que termos as seguintes legendas:
i
X : valores observados da varivel discreta, ou ponto mdio das classes no caso
contnuo.
Fi : frequncias absolutas simples
n (n de observaes)
1
n
i
Fi
=
=
.
Nos exemplos anteriores das variveis n de faltas e notas, teramos
N de faltas (Xi) N de alunos (Fi) XiFi
0
1
2
3
4
5
13
7
8
5
4
3
0
7
16
15
16
15
40 69
Obs: O preenchimento da terceira coluna foi resultante do produto entre cada
resultado da primeira e cada resultado da segunda. Ok! Aluno, assim poderemos
calcular o n mdio de faltas, da seguinte forma:
1
232
5,8
40
n
i
i
X Fi
X
n
=
= = =
11 1
6
2
+
= elemento de ordem, ou seja:
2, 2, 2,3,3,3, 4,5,5, 6, 7 3 Md =
35
2caso: Quando n (n de observaes) for par a mediana ser a mdia aritmtica entre
os elementos de ordem:
2
n
e 1
2
n
+
.
Vejamos ento o exemplo a seguir.
Exemplo: Seja a seguinte srie de valores: 4, 2, 6, 3, 7, 5, 5, 4, 2, 3 . Ento 10 n = (par).
Assim, teramos
10
5
2
= e
10
1 6
2
+ = . Ou seja: 2, 2, 3, 3, 4, 4, 5, 5, 6, 7 . Desta forma a
mediana seria dada por
4 4
4
2
+
=
2.2.2 MEDIANA PARA VARIVEL CONTNUA
Usaremos o seguinte processo de identificao da mediana
2
n
f xh
Md
Fmd
| |
|
\ .
= +
,
em que teremos a seguinte legenda.
limite inferior da classe mediana.
2
n
elemento identificador da classe mediana.
f
|
\ .
= +
.
1) vamos identificar a classe mediana, pois todos os elementos se referem a ela.
0
40
20
2 2
n
= = O qual pela Fac podemos verificar que se encontra na classe 6 8.
2) a partir da classe mediana iremos identificar todos os elementos que compem a
frmula de identificao, da seguinte maneira:
( ) 20 19 2
6 6,13
15
x
Md
= + = . Ou seja, 50% dos alunos tiveram nota no mximo igual a
6,13 e outros 50% tiveram nota no mnimo igual a 6,13.
Agora voc vai conhecer mais um conceito de medida de posio: a moda.
37
2.3 MODA (Mo)
: Definio Trata-se do elemento mais comum em qualquer conjunto de dados, ou
seja aquele elemento que mais se repete neste conjunto.
Analogamente a mediana, teremos duas situaes: uma quando a varivel for
discreta e outra quando a varivel for contnua.
2.3.1 MODA PARA VARIVEL DISCRETA
Neste caso, iremos apenas identificar o elemento modal.
Exemplo: Seja a seguinte srie de dados, referentes a uma determinada varivel
discreta:1, 4, 2,5, 4, 6, 2, 4, 7, 5, 5, 4,1, 4
.
Teramos como resultado 4 Mo = , pois o valor mais frequente na srie.
Voc Sabia?
Uma srie de dados pode ser do tipo unimodal (uma nica moda), bimodal(duas
modas), trimodal (trs modas) e multimodal(a partir de quatro modas).
2.3.2 MODA PARA VARIVEL CONTNUA
Usaremos o seguinte processo de de identificao da moda:
1
1 2
Mo xh
A
= +
A + A
, na qual teremos as seguintes legendas:
limite inferior da classe modal.
1
A diferena entre a frequncia simples da classe modal e a frequncia simples da
classe anterior.
2
A diferena entre a frequncia simples da classe modal e a frequncia simples da
classe posterior.
h amplitude da classe modal.
Obs: Classe modal trata-se da classe de maior frequncia absoluta
38
Ento, vamos agora encontrar a nota modal no nosso Ex. das notas. Ok?
Notas N de alunos
0 2
2 4
4 6
6 8
8 10
3
5
11
15
6
40
1) vamos identificar a classe modal, pois todos os elementos se referem a ela.
Ateno!
A classe modal a classe de maior frequncia simples. Ento, no exemplo, a classe
modal ser de 6 8
2) a partir da classe modal iremos identificar todos os elementos que compem o
processo de Czuber, da seguinte maneira:
4
6 2 6, 6
4 9
Mo x = + =
+
.Ou seja, a nota mais comum entre os 40 alunos foi 6,6.
Vamos finalizar as medidas de posio, conhecendo as separatrizes.
2.3 SEPARATRIZES
39
Dependendo do elemento limite do conjunto de dados que estivermos querendo
encontrar, podemos necessitar dos quartis, decis ou dos percentis
2.3.1 QUARTIS
: Definio So medidas estatsticas que dividem um conjunto de dados em quatro
partes iguais.
Assim, temos o 1 , 2
e 3
|
\ .
= +
, em que teremos as legendas a seguir:
limite inferior da classe quartlicaQi
4
in
elemento identificador da classe Qi
f
|
\ .
= + = + =
. Ou seja,
No exemplo das notas, podemos afirmar que 75% dos alunos tiraram no mximo nota
igual a 7,5 e que 25% da turma tirou nota no mnimo igual a 7,5.
2.3.2 DECIS
40
: Definio So medidas estatsticas que dividem um conjunto de dados em dez partes
iguais. Assim, teremos o 1 , 2 ,...., 9
decil ,ou seja:
10% 20% 30% 90%
------
1
D ------
2
D ------
3
D ....------
9
D ------
Todos os decis podero ser encontrados atravs da seguinte relao:
10
in
f xh
Di
FDi
| |
|
\ .
= +
, onde:
limite inferior da classe declica
i
D
.
10
in
elemento identificador da classe
i
D
.
f
|
\ .
= + = + =
. Ou seja,
No exemplo das notas, podemos afirmar que 80% dos alunos tiraram no mximo nota
igual a 7,7 e que 20% da turma tirou nota no mnimo igual a 7,7.
Finalizaremos as separatrizes, mostrando a voc o ltimo conceito estudado aqui: os
percentis. Veja a seguir.
41
2.3.3 PERCENTIS
: Definio So medidas estatsticas que dividem um conjunto de dados em cem
partes iguais.
Assim, teremos o 1 , 2 ,...., 99
percentil, ou seja:
1% 2% 3% 99%
---
1
P ---
2
P ---
3
P ....---
99
P ---
Assim, poderemos encontrar qualquer destes percentis atravs da seguinte relao:
100
in
f xh
Pi
FPi
| |
|
\ .
= +
.
Aplicaremos a seguir, encontrando no exemplo das notas o quadragsimo percentil.
( )
40
40
40
16 8 2
100
4 6, 4
11
n
f xh
x
P
FP
| |
|
\ .
= + = + =
b) Como a varivel contnua, podemos encontrar o resultado da mediana da
maneira seguinte:
50
18 3
2 2
8 10, 3
9
n
f xh x
Md
FMd
| | | |
| |
\ . \ .
= + = + =
|
\ .
= + = + =
Nesse tpico, voc conheceu as principais medidas de posio e agora
continuar a estudar as medidas estatsticas, conhecendo as principais medidas de
disperso. Vamos l?
TPICO 3 MEDIDAS DE DISPERSO
Objetivos:
- Encontrar e analisar o resultado do desvio-mdio, da varincia e do desvio-
padro.
45
- Com base nos resultados de algumas medidas de disperso iremos aprender
como verificar se um conjunto de dados possui uma baixa, uma mdia, ou uma
alta disperso.
Ento aluno, voc ir primeiramente reconhecer o desvio mdio como uma
importante medida de disperso.
3.1 DESVIO MDIO (DM)
: Definio
Podemos dizer que o desvio-mdio trata-se da mdia das distncias
que existe entre cada observao de um conjunto, e a mdia aritmtica deste
conjunto.
Poderemos encontrar o desvio-mdio, atravs da seguinte relao:
1
.
N
i
Xi X
DM Fi
N
=
.
Vejamos uma utilidade do desvio-mdio atravs do seguinte exerccio:
EXERCCIO RESOLVIDO 1
Qual das duas sries seguinte est sendo representada da melhor forma por
sua mdia aritmtica?
SRIE-A: 3, 5, 9, 3, 6, 6, 5, 3( 5
A
X =
).
SRIE-B: 7,8,8, 6, 9, 7, 7, 4 ( 8
B
X =
).
Soluo:
Atravs dos desvios-mdios iremos verificar qual das duas sries melhor representa a
sua mdia. Assim teremos:
Na Srie-A, a seguinte distribuio:
( )
i
X ( )
i
F |
i
X X
A
|
i
xF
3
5
3
2
6
0
46
6
9
2
1
2
4
8 12
Ento, turma, iremos encontrar o DM da srie-A, da seguinte forma:
1
.
N
i
Xi X
DM Fi
N
=
12
1, 5
8
= =
Na Srie-B, a seguinte distribuio:
( )
i
X ( )
i
F
i B
X X
i
xF
4
6
7
8
9
1
1
3
2
1
4
2
3
0
1
8 10
1
.
N
i
Xi X
DM Fi
N
=
10
1, 25
8
= = . Assim, como ( ) ( ) DM B DM A < , ento a srie B
melhor representa a sua mdia aritmtica.
A seguir conheceremos a varincia como uma das mais importantes medidas de
disperso
47
3.2 VARINCIA
: Definio
uma mdia dos quadrados dos desvios da mdia
X . O seu valor alm de
analisar a disperso de um conjunto, utilizado para realizar algumas inferncias
estatsticas.
Ateno!
Iremos ver o conceito de Inferncias Estatsticas com mais profundidade a partir da
aula 7.
Teoricamente, podemos encontrar a varincia tanto para uma populao, como
para uma amostra. Assim, podemos usar dos seguintes procedimentos:
3.2.1 VARINCIA POPULACIONAL (
2
o )
Usaremos:
2
o =
1
1
( )
1
N
N
i
i
XiFi
Xi Fi
N N
=
=
(
(
(
(
(
Voc Sabia?
Podemos calcular a varincia atravs de outros processos de frmulas tericas.
O modelo escolhido acima facilita os clculos se lembrarmos de que os dados, tanto
para variveis discretas como para variveis contnuas, estaro organizadas em tabelas
de distribuies de frequncias, as quais nos possibilitam encontrar os somatrios
necessrios com uma maior facilidade.
3.2.2 VARINCIA AMOSTRAL (S)
48
Usaremos: S =
1
1
( )
1
1
N
N
i
i
XiFi
Xi Fi
n n
=
=
(
(
(
(
(
Obs: Os somatrios que aparecem nas duas frmulas acima, sero encontrados
atravs das tabelas de distribuies de frequncias, conforme veremos no ex.abaixo
Exemplo: Considerando a srie de dados a seguir como sendo uma amostra de 14
valores referentes a uma varivel discreta qualquer: 4, 2, 5, 3, 4, 3, 3, 2, 5, 6, 5, 3, 2, 4;
poderemos encontrar a varincia desta srie da seguinte maneira:
(Xi) (Fi) XiFi
XiFi
2
3
4
5
6
3
4
3
3
1
6
12
12
15
6
12
36
48
75
36
14 10 207
Perceba aluno que:
i
X So os valores que apareceram na srie de dados
i
F So as frequncias com que cada observao aparece na srie
i i
X F So resultantes do produto entre a coluna do
i
X pela coluna do
i
F
2
i i
X F So resultantes do produto entre a coluna do
i
X pela coluna do
i i
X F
Assim, poderemos substituir na frmula os resultados dos somatrios
encontrados na tabela de distribuio de frequncia acima, da seguinte maneira:
S =
1
1
( )
1
1
N
i i N
i
i i
i
X F
X F
n n
=
=
(
(
(
(
(
=
1 (51)
207
14 1 14
(
=1,63
49
3.3 DESVIO PADRO
O desvio-padro um resultado consequente da varincia. uma das medidas
de disperso mais utilizadas. Atravs do desvio-padro, podemos ter algumas
informaes iniciais a partir de um conjunto de dados. Tambm poderemos ter o
desvio padro tanto para populao, como para amostra. Iniciaremos pelo desvio
padro populacional.
3.3.1 DESVIO PADRO POPULACIONAL (o )
Pela prpria representao do desvio-padro, percebemos que o desvio-padro
resultante da raiz quadrada da varincia, ou seja:
2
o o =
3.3.2 DESVIO PADRO AMOSTRAL ( S )
De maneira semelhante iremos encontrar o desvio padro amostral, atravs da
raiz quadrada da varincia amostral, ou seja:
2
S S =
Voc Sabia?
60% a 80% das observaes de um conjunto de dados encontram-se no intervalo de
um desvio padro em torno da mdia do conjunto. Ainda 100% das observaes do
conjunto se encontram no intervalo de trs desvios em torno da mdia aritmtica do
conjunto, ou seja, X
3S.
Finalizaremos as aplicaes das medidas de disperso, conhecendo o
coeficiente de variao, para que possamos atribuir uma classificao ao conjunto de
dados.
3.4 COEFICIENTE DE VARIAO (C.V)
: Definio
O Coeficiente de Variao trata-se da relao entre uma medida de
disperso (o desvio padro) e uma medida de posio (a mdia aritmtica).
Atravs do resultado do coeficiente de variao, poderemos ainda atribuir uma
classificao a um conjunto de dados da seguinte forma
Quando C.V 10% BAIXA DISPERSO
50
10% <C.V < 20% MDIA DISPERSO
C.V 20% ALTA DISPERSO
em que usaremos CV =
S
X
. 100. Aplicaremos a seguir esta medida.
EXERCCIO RESOLVIDO 3
Voltando ao Ex. dos preos da mercadoria cobradas em 50 estabelecimentos
comerciais:
Preos Fi Xi XiFi XiFi
2 5
5 8
8 11
11 14
14 17
8
10
9
12
11
3,5
6,5
9,5
12,5
15,5
28
65
85,5
150
170,5
98
422,5
812,25
1875
2642,75
50 496 5850,5
a) Classifique a disperso dos preos.
b) Encontre o intervalo que garante os preos cobrados por 60% a 80% dos
estabelecimentos.
Soluo:
a) Conforme vimos anteriormente, podemos classificar a disperso dos preos,
atravs do resultado do Coeficiente de Variao. Assim, teramos
51
C.V =
S
X
.100 . Sabemos que X . E ainda:
2
S S = . A varincia amostral ser dada por:
S =
1
1
( )
1
1
N
N
i
i
XiFi
Xi Fi
n n
=
=
(
(
(
(
(
=
=
1 (496)
5850, 5
49 50
(
(
= 18,98 S = 18, 98 = 4,4 .Assim, teramos:
CV =
4, 4
9, 98
100 44,1% x = (os preos so cobrados com uma alta disperso entre os
estabelecimentos comerciais).
b) Como vimos anteriormente, o intervalo que garante 60% a 80% ser dado por
| | 9, 98 4, 4 $5, 58 $14, 38 X S R R = =
.
Nesta aula, aprendemos a organizar dados quantitativos em tabelas de
distribuies de frequncias, para posteriormente usarmos diversos mtodos de
estatstica descritiva, para sintetizar a posio e a variabilidade da distribuio e
conseguirmos fazer uma leitura descritiva com uma maior qualidade.
Na aula3, aplicaremos exerccios que serviro para recordarmos o que foi visto
nas aulas anteriores, relembrando com detalhes os tpicos explorados nessas aulas.
Esta reviso com exerccios nos qualificar para uma melhor compreenso e facilitar
o incio do estudo da Inferncia Estatstica, assunto da aula 4.
52
ATIVIDADES DE APROFUNDAMENTO
01) Crie uma varivel discreta, simule 40 resultados dessa varivel e em seguida:
a) Organize os dados em uma tabela de frequncia absoluta, acumulada e relativa
b) Encontre e interprete o resultado de duas medidas de posio e duas de disperso
02) Considere os mesmos valores da questo anterior como sendo relativos a uma varivel
contnua e em seguida:
a) Organize os dados em uma distribuio de frequncia com amplitude de cada classe
com tamanho 3
b) Interprete o resultado do septuagsimo percentil
03) Qual das duas variveis criadas anteriormente melhor representam a sua mdia
aritmtica?
04) Qual das duas distribuies de frequncias anteriores possuem uma maior disperso?
53
Aula 3 Miscelnea de exerccios resolvidos
Ol caro (a) aluno (a),
Nesta aula, recordaremos, atravs de exerccios resolvidos, as principais informaes
das ltimas duas aulas. Elas envolvero desde as sries estatsticas e suas
representaes at os conceitos e aplicaes da estatstica descritiva.
Ento, vamos fazer uma reviso?
Objetivos
- Diferenciar os principais tipos sries estatsticas e usar situaes para organizar dados
em distribuies de frequncias
- Calcular e interpretar as principais medidas estatsticas de posio e de disperso.
TPICO 1 EXERCCIOS: SRIES ESTATSTICAS
Objetivos
- Recordar a forma correta de representar as sries atravs de tabelas e de diferenciar
os principais tipos de sries estatsticas atravs de exerccios.
- Lembrara forma correta de escolher os grficos para realizar as representaes das
sries.
Aluno, iniciaremos este tpico com as aplicaes dos principais modelos de
sries, para posteriormente representarmos estes modelos atravs de tabelas e
grficos, assunto que foi estudado na aula 3. Aqui, veremos exerccios que nos
lembrem como diferenciar os principais tipos de sries estatsticas e como
represent-las atravs de tabelas ou grficos da melhor forma possvel.
Saiba Mais!
54
Para obter mais detalhes acerca desse assunto e estudar mais sobre grficos e
tabelas, visite o site http://www.somatematica.com.br/estat/basica/pagina5.php.
EXERCCIO RESOLVIDO 1
Crie uma situao que envolva o nosso curso a distncia. Ela deve ser identificada
como uma srie estatstica do tipo categrica-geogrfica.
Soluo:
Voc deve est lembrado que o conceito da srie estatstica geogrfica ou de
localizao foi definido como uma srie em que, na sua representao, s ocorre
variao na localidade da ocorrncia. Ou seja, neste tipo de srie, os dados sero
agrupados, segundo localidades distintas da ocorrncia. Notaremos tambm que a
poca da ocorrncia e o fenmeno ocorrido ficaro fixos (Aula 1 tpico 1).
E ainda, temos o conceito de srie categrica ou especfica em que: aquela em que a
variao s ocorre no prprio fenmeno ocorrido. Ou seja, nesta srie estatstica, a
poca e o local da ocorrncia permanecero fixos, enquanto os dados que se referem
ao fenmeno ocorrido sero agrupados de acordo com a modalidade da ocorrncia do
fenmeno
Sabemos que, podemos combinar as sries estatsticas. E como o enunciado pede para
fazer uma identificao das sries categrica-geogrfica. Ento teremos a seguinte
situao:
N DE ALUNOS POR CLASSIFICAO DAS NOTAS EM CADA POLO (2011.1)
CLASSIFICAO DAS
NOTAS
POLOS
A B C D E
BAIXA
... ... ... ... ...
55
MDIA
ALTA
... ... ... ... ...
... ... ... ... ...
Veja que, na srie existiriam alunos para as trs categorias de notas, por isso
ela categrica. E tambm existem resultados para mais de uma localidade(polos), por
isso ela tambm se classifica como Geogrfica.
EXERCCIO RESOLVIDO 2
Realize alterao na srie estatstica anterior, de tal forma que passemos a ter uma
srie que tambm assuma uma caracterstica de uma srie cronolgica.
Soluo:
N DE ALUNOS POR CLASSIFICAO DAS NOTAS EM CADA POLO
(2009-2010)
CLASSIFICAO
DAS NOTAS
POLOS
A B C D E
2009-2010 2009-2010 2009-2010 2009-2010 2009-2010
BAIXA
MDIA
ALTA
... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ..
56
Note que, agora alm da variao das categorias das notas e da localidade
destas, tambm temos na srie resultados para mais de um perodo, ou seja, tambm
temos uma variao de poca.
EXERCCIO RESOLVIDO 3
Simule valores para a srie estatstica anterior e escolha um grfico para em seguida
represent-la.
Vamos l!
N DE ALUNOS POR CLASSIFICAO DAS NOTAS EM CADA POLO
(2009-2010)
CLASSIFICAO
DAS NOTAS
POLOS
A B C D E
2009-2010 2009-2010 2009-2010 2009-2010 2009-2010
BAIXA
MDIA
ALTA
49 21 25 30 08 15 04 02 10 05
25 12 06 12 13 06 28 20 19 09
10 05 02 09 12 10 07 02 06 14
Como se trata de uma srie mista, usaremos o grfico de coluna para
representao mostrado na Figura 1.
57
Figura 1 - Grfico de coluna representando os dados da tabela
EXERCCIO RESOLVIDO 4
Verifique, na srie estatstica abaixo, quais foram os erros cometidos nas
representaes.
Soluo:
N DE VENDAS DO PRODUTO-X (2007-2010).
ANOS N DE VENDAS
2006
2007
2008
2009
2010
450
543
602
716
512
58
Figura 2 - Grfico representando os dados da tabela
Verificamos que o ttulo est incompleto tanto no quadro (visto que as tabelas
no devem conter o fechamento nas laterais), como no grfico. E ainda, por se tratar
de uma srie cronolgica, o grfico correto seria um grfico em linha.
Neste tpico, recordamos a forma correta de representarmos as sries
estatsticas, bem como as diferenas entre os principais tipos de sries. Os exerccios
resolvidos foram direcionados a grficos e tabelas, dos quais trabalhamos com dados
fictcios. No prximo e ltimo tpico, iremos abordar exerccios resolvidos que
envolvam o assunto de estatstica descritiva.
TPICO 2 EXERCCIOS: ESTATSTICA DESCRITIVA
Objetivos
- Lembrar, atravs de aplicaes, a forma correta de representarmos dados
quantitativos em tabelas de distribuies de freqncias.
- Aplicar problemas que envolvam as principais medidas de posio e de disperso.
Nesse tpico, voc ver a exposio de exerccios resolvidos que envolvam
conceitos como tipos de variveis, medidas de posio e de disperso que iro
descrever algum fenmeno estudado. Ento vamos aos exerccios.
59
EXERCCIO RESOLVIDO 1
Simule 35 valores referentes ao n de vendas realizadas em um determinado
estabelecimento comercial durante 40 dias observados, e em seguida:
a) Organize os dados em uma tabela de distribuio de freqncia.
b) Encontre o n mdio de vendas realizadas.
c) Interprete o resultado da mediana.
Faremos da seguinte forma:
a) Supondo que os 40 valores fossem os abaixo informados:
2, 5, 4, 1, 3, 2, 2, 7, 3, 5, 6, 2, 7, 2, 3, 1, 7, 5, 2, 6
5, 7, 4, 5, 3, 2, 5, 4, 1, 2, 4, 6, 7, 5, 4, 2, 1, 2, 1, 4.
Assim, poderemos dispor da seguinte forma:
N de vendas N de dias(Fi) Fac fi
1
2
3
4
5
6
7
5
10
4
6
7
3
5
5
15
19
25
32
35
40
0,125
0,250
0,100
0,150
0,175
0,075
0,125
35 1
b) Iremos encontrar o n mdio de vendas da seguinte forma:
60
1
n
i
i
X Fi
X
n
=
=
.
Na distribuio de frequncia, como a varivel discreta, chamaremos os valores da
varivel de Xi, ento iremos inserir uma nova coluna na tabela de distribuio:
N de vendas(Xi) N de dias(Fi) XiFi fi
1
2
3
4
5
6
7
5
10
4
6
7
3
5
5
20
12
24
35
18
35
0,143
0,286
0,114
0,171
0,200
0,085
40 149 1
1
n
i
i
X Fi
X
n
=
=
149
4, 2
35
= =
c) Como a varivel discreta e observamos um n impar de observaes, a mediana
ser o elemento que assuma a ordem
1
2
n +
, ou seja,
35 1
18
2
+
= o qual pela
coluna das frequncias acumuladas ser igual a 3, logo podemos dizer que em 50%
dos dias observados foram realizadas no mximo 3 vendas.
EXERCCIO RESOLVIDO 2
Tomando o exerccio1anteriormente resolvido como base , criamos esta nova situao:
qual seria o n de vendas mximo para 80% dos dias?
61
Aluno, como queremos um ponto que ir limitar um percentual, iremos aplicar
a separatriz. Para isso, deveremos calcular
80
? P =
Usaremos a seguinte relao:
( ) ( )
80
1 1 40 1 1 32, 2 32 5
100 100
p
X n x x
= + = + = ~ =
EXERCCIO RESOLVIDO 3
Supondo os dados do exerccio1 como sendo referentes s taxas de juros cobradas por
35 instituies financeiras e, em seguida, organize os dados em uma distribuio de
frequncia. Depois interprete o resultado do sexagsimo terceiro percentil.
Vamos resolver?
Os dados so os seguintes:
2, 5, 4, 1, 3, 2, 2, 7, 3, 5, 6, 2, 7, 2, 3, 1, 7, 5, 2, 6
5, 7, 4, 5, 3, 2, 5, 4, 1, 2, 4, 6, 7, 5, 4, 2, 1, 2, 1, 4.
Como a varivel Taxa de juros contnua, ento deveremos primeiro organizar
os dados em uma tabela de frequncia. Para isso, deveremos encontrar a amplitude
que definir os intervalos de classes. Usaremos o 1 mtodo visto na aula-4 da
seguinte forma: 40 25 40 7 n k = > ~ ~
t
h A k ~ 7 1 6
t
A = = 6 7 1 h ~ ~ . Assim, poderemos realizar a
representao:
Taxas N de instituies
(Fi)
Fac
62
1 2
2 3
3 4
4 5
5 6
6 7
7 8
5
10
4
6
7
3
5
5
15
19
25
32
35
40
40
Agora poderemos encontrar o sexagsimo terceiro percentil, assim:
63
100
63
n
f xh
Pi
FP
| |
|
\ .
= +
.
Iremos primeiramente identificar a classe percentlica, atravs do elemento
63 63 40
25, 2
100 100
n
= = . Pela coluna da Fac, vimos que esse elemento se encontra na
classe5 6
Ento agora iremos identificar na tabela de distribuio de frequncia todos os
elementos que compem a frmula. Assim, teramos
( ) 25, 2 25 1
63 5 5, 03
7
x
P
= + = .
Podemos dizer que 63% das instituies cobram no mximo 5,03% de juros ou
ainda que 37% das instituies possuem as maiores taxas de juros e cobram no
mnimo 5,03% de juros.
EXERCCIO RESOLVIDO 4
Seja a seguinte distribuio de frequncia das velocidades mdias apresentadas por 50
veculos em certo percurso observado:
63
Velocidade Fi
60 65
65 70
70 75
75 80
80 85
3
15
20
10
2
50
a) Qual a velocidade mdia apresentada pela maioria dos veculos?
b) As velocidades ocorreram com uma alta disperso?
Bom, caro aluno, vamos s solues:
Ateno!
Os conceitos de mediana; moda e separatrizes foram estudados por voc no tpico 2
da aula 4. Caso tenha alguma dvida, retorne a essa aula e estude com mais ateno
esses conceitos.
a) Vimos durante o estudo das principais medidas de posio que por definio a moda
o elemento que mais ocorre. Neste exemplo, a velocidade apresentada pela maioria
encontrada da seguinte maneira:
1
1 2
Mo xh
A
= +
A + A
Primeiro vamos identificar a classe modal, para depois encontrarmos os
elementos que compem a frmula. Assim, a classe modal a de maior frequncia
70 75. Ento teramos
1
1 2
5
70 5 71, 7
5 10
Mo xh
A
= + = + =
A + A +
, em que
64
limite inferior da classe
1 A 20-15=05
2 A 20-10=10
h Diferena entre os limites da classe(75-70=5)
b) Para classificarmos a disperso de uma distribuio, faz-se necessrio encontrar o
coeficiente de variao(CV), ento escreveremos
Velocidade Fi Xi XiFi
60 65
65 70
70 75
75 80
80 85
3
15
20
10
2
62,5
67,5
72,5
77,5
82,5
187,5
1012,5
1450
775
165
50 3590
C.V =
S
X
. 100, em que
1
n
i
XiFi
X
n
=
= =
3590
71,8
50
=
2
S s = , em que
2
S =
1
1
( )
1
1
N
N
i
i
XiFi
Xi Fi
n n
=
=
(
(
(
(
(
=
1 (496)
5850, 5
49 50
(
(
=18, 98
18, 98 4, 4 S = = . Assim,
4, 4
6,13%
71,8
CV = = .
65
Como 10% CV s , temos uma baixa disperso das velocidades mdias dos veculos.
EXERCCIO RESOLVIDO 5
Ainda com base nos dados do exerccio anterior, e sabendo-se que outro grupo de 30
veculos apresentou um desvio-mdio de 1,2,pergunta-se: qual dos dois grupos de
veculos melhor representa a sua velocidade mdia?
Vamos resposta:
Vimos no tpico3 da aula4 que ,quanto menor o resultado do desvio-mdio, melhor
ser a representao de seu resultado mdio, ento vamos calcular o desvio-mdio do
grupo dos 50 veculos:
Velocidade Fi Xi
Xi X Fi
60 65
65 70
70 75
75 80
80 85
3
15
20
10
2
62,5
67,5
72,5
77,5
82,5
27,9
64,5
14
57
21,4
50 184,8
1
.
N
i
Xi X
DM Fi
N
=
184,8
3, 7
50
= = .
Assim, como 1,2 <3,7, podemos dizer que o grupo de 30 veculos melhor representa a
sua velocidade mdia.
66
Bom, caro aluno, com esta aplicao, recordamos de toda parte da organizao
de dados em tabelas de distribuio de frequncia e tambm dos objetivos das
principais medidas de posio e de disperso.
Assim, com esta aula 3, fizemos um resumo das duas primeiras aulas que
envolveram desde as sries estatsticas at o resumo da estatstica descritiva, tais
como a organizao das informaes em tabelas de distribuies, os clculos de
medidas e as anlises destas medidas.
Na prxima aula, daremos incio ao estudo da inferncia estatstica que ir
inferir sobre parmetros populacionais, tomando por base as noes de probabilidade
e os conhecimentos da estatstica descritiva.
Aula 4 A INFERNCIA ESTATSTICA
Ol aluno(a),
67
At este momento, conseguimos realizar o estudo das sries estatsticas e da
estatstica descritiva, o qual ir contribuir bastante para uma melhor compreenso do
estudo da inferncia estatstica.
Com o apoio da estatstica descritiva e das noes de ocorrncias
probabilsticas realizaremos estimaes de parmetros populacionais com base em
levantamentos amostrais.
Objetivos
- Estimar propores populacionais desconhecidas.
- Estimar mdias populacionais desconhecidas
TPICO 1 ESTIMAES DE MDIAS POPULACIONAIS
Objetivo
- Investigar levantamentos amostrais, para realizarmos estimaes de mdias
populacionais desconhecidas com certa confiabilidade.
Iremos com base em levantamentos amostrais realizar estimaes de mdias
populacionais desconhecidas, atravs de intervalos que iro nos proporcionar
estas mdias estimadas
1.1 INTERVALO DE CONFIANA PARA MDIA
Uma maneira de expressarmos a preciso da estimao mostrarmos os limites
com os quais incluiro o verdadeiro valor do parmetro populacional. Chamamos esses
limites de limites de confiana, os quais iro determinar a formao do intervalo de
confiana. Na sequncia iremos aprender como construir estes intervalos, e
realizaremos exemplos de aplicaes dos mesmos
A aplicao do intervalo de confiana adequado se faz a partir de dois critrios:
1 critrio:
68
Quando conhecemos o valor da varincia populacional
2
o , iremos aplicar o seguinte
intervalo de confiana para estimao:
x
X Z
o
o , em que
X a mdia da amostra.
Z
o
o valor de Z da tabela da normal padro (estudado na aula 2 dessa disciplina),
cujo valor de probabilidade o mais prximo de 1
2
o
, no qual o nvel de
significncia.
Como ns estamos realizando estimao para um parmetro populacional,
atravs de dados amostrais, temos sempre uma margem probabilstica de confiana
para os limites de estimao do intervalo de estimao. Assim, chamaremos de nvel de
significncia o o complemento desta confiabilidade.
Por exemplo: se estivermos estimando com uma confiabilidade de 95%, o valor
do nvel de significncia o ser de 5%. Logo, neste caso, teramos que
1
2
o
0, 05
1 0, 975
2
= = .
Ento, olhando este valor na tabela da normal padro, veremos que o valor de
1, 96 Z
o
= .
x
o o desvio padro estimado para a mdia, que ser obtido da seguinte forma:
Quando ( ) 0, 05 n N s , ou seja, quando o tamanho da amostra que est sendo
trabalhada for menor do que 5% do tamanho da populao, teremos que
x
n
o
o = , em
queo o desvio padro populacional
Quando( ) 0, 05 n N > , ou seja, quando o tamanho da amostra for maior do que
5% do tamanho da populao, teremos que
1
x
N n
N n
o
o
| |
=
|
\ .
.
69
Ateno!
Quando no soubermos o tamanho da populao N, temos que considerar que a
amostra no ir ultrapassar 5% da populao.
Ateno!
Os parmetros que aparecem no texto X ,
2
o e o so medidas estatsticas que
voc, caro aluno(a), conheceu na Aula4.
Vamos ento a uma aplicao deste primeiro critrio:
Exerccio Resolvido 1
Desejando estimar o n mdio semanal de acesso ao sistema virtual Moodle dos alunos
da EaD do curso de Matemtica, selecionamos uma amostra de 40 alunos e verificamos
que estes tiveram um acesso mdio de 19,4 acessos ao sistema. Sabendo-se que os
acessos semanais de todos os alunos deste curso ocorrem com uma varincia de 2,2,
realize a estimao desejada com uma confiabilidade de 90%.
Soluo:
Primeiramente, vamos retirar do problema os dados fornecidos:
Tamanho da amostra 40 n =
Mdia da amostra 19, 4 X =
Varincia populacional
2
2, 2 o =
Nvel de significncia 10% 0,1 o = = .
Agora, vamos aplic-los no intervalo de confiana de estimao da mdia que
dado por
x
X Z
o
o .
Z
o
= ?
Primeiramente calcularemos a relao1
2
o
0,1
1 0, 95
2
= = .Depois iremos procurar na
tabela da normal padro (aula2) o valor de Z, cuja probabilidade seja a mais prxima de
70
0, 95. Assim teremos
0, 04
1 1 0, 98
2 2
o
= =
Tabela da Distribuio Normal Padro
P(Z<z)
0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1
0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2
0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3
0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4
0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5
0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6
0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7
0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8
0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9
0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0
0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1
0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2
0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3
0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4
0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5
0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6
0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7
0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
Fonte: www.pucrs.br/format/rossana/psicologia/tabela_normal.pdf
Ento, vimos que o valor de Z correspondente 1,65, logo 1, 65 Z
o
= .
Na sequncia, vamos encontrar o desvio padro estimado para mdia
x
o .
Considerando que a amostra no ultrapassa 5% do tamanho da populao, teremos
que
2, 2
0, 23
40
x
n
o
o = = = .
Agora vamos substituir os valores no intervalo de
estimao
x
X Z
o
o 19, 4 1, 65 0, 23 19, 4 0,38 = . Ento subtraindo e depois
somando 0, 38 de 19, 4 , teremos os seguintes limites do intervalo de estimao:
| | 19, 02 19, 78 at .
Assim, podemos concluir com 90% de confiana que o n mdio de acesso semanal ao
sistema virtual Moodle de no mnimo 19,02 e de no mximo 19,78.
2 critrio:
71
Quando no conhecemos o valor da varincia populacional
2
o e tivermos uma amostra
considerada pequena ( ) 30 n < ,iremos aplicar o seguinte intervalo de confiana para
estimao:
( 1) n
x
X T S
o
, em que
X a mdia amostral
( ) 1 n
T
o
o valor de T da tabela da distribuio T-Student, em que
o o nvel de significncia
( ) 1 n o grau de liberdade a ser visto na tabela
x
S o valor do desvio padro estimado da mdia quando no conhecemos o desvio
padro populacional o , e segue o mesmo critrio do
x
o .
Assim, quando ( ) 0, 05 n N s , ou seja, o tamanho da amostra que est sendo trabalhada
for menor do que 5% do tamanho da populao, teremos que
x
S
S
n
= , na qual S o
desvio padro populacional
Quando( ) 0, 05 n N > , ou seja, o tamanho da amostra for maior do que 5% do
tamanho da populao, teremos que
1
x
S N n
S
N n
| |
=
|
\ .
.
Vamos ento a uma aplicao desse critrio.
Exerccio Resolvido 2
Suponha agora que estamos interessados em estimar o n mdio semanal de acesso ao
sistema virtual Moodle dos alunos da EaD do curso de Matemtica com uma
confiabilidade de 90% e que, para isso, tivssemos apenas uma amostra de 26 alunos
acusando um acesso mdio ao sistema de 18,7 e um desvio padro do n de acesso
semanal de 1,35. Assim, realizemos a nova estimao intervalar.
Soluo:
Primeiro, retiremos as informaes do novo problema:
Nvel de significncia 0,1 o =
72
Tamanho da amostra 26 n =
Mdia amostral 18, 7 X =
Desvio padro amostral 1, 35 S = .
Assim, teremos
( 1) n
x
X T S
o
, em que
( )
0,1(26 1) 0,1(25) 1 n
T T T
o
= = .
Logo, poderemos encontrar na tabela da distribuio T- de Student abaixo
que
0,1(25)
1, 708 T =
Tabela t (student)
gl/o 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001
01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619
02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598
03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924
04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,365 3,499 5,408
08 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073
16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015
17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
73
19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850
21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,767
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,726
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,127 0,256 0,389 0,531 0,684 0,856 1,057 1,314 1,703 2,052 2,473 2,771 3,690
28 0,127 0,256 0,389 0,530 0,683 0,856 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,659
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646
40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551
60 0,126 0,254 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660 3,460
120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373
i 0,126 0,253 0,385 0,524 0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,291
Fonte: http://www.somatematica.com.br/estat/tabelat.php
Agora, vamos encontrar o desvio padro estimado para mdia
x
S . Seguindo o mesmo
critrio de determinao de
x
o , encontraremos
x
S
S
n
=
1, 35
26
= 0, 265 = .
Substituindo os valores encontrados no intervalo de estimao para mdia,
teremos
( 1) n
x
X T S
o
| | 18, 7 1, 708 0, 265 18, 7 0, 4 18, 3 19,1 at = = = .
Assim, podemos concluir com 90% de confiana que o n mdio de acesso semanal ao
sistema virtual Moodle de no mnimo 18,3 e de no mximo 19,1.
74
TPICO 2 ESTIMAES DE PROPORES POPULACIONAIS
Objetivo
- Investigar levantamentos amostrais, para realizarmos estimaes de propores
populacionais desconhecidas com certa confiabilidade.
Iremos com base em levantamentos amostrais realizar estimaes de
porcentagens populacionais desconhecidas, atravs de intervalos que iro nos
proporcionar estas propores estimadas
1.1 INTERVALO DE CONFIANA PARA MDIA
Agora, iremos realizar estimaes de propores (porcentagens) populacionais
desconhecidas, atravs de levantamentos amostrais, que ser o nosso tema do
prximo tpico.
75
TPICO 2 ESTIMAES DE PROPORES POPULACIONAIS
Objetivo
- Investigar levantamentos amostrais a fim de estimarmos propores
populacionais desconhecidas com certa confiabilidade.
Neste tpico aprenderemos a estimar propores populacionais
desconhecidas, atravs de intervalos de confianas, tomando por base
levantamentos amostrais. Vamos a aula do tpico!!
2.1 INTERVALO DE CONFIANA PARA PROPORO
Como geralmente no conseguimos investigar uma populao completa, iremos
com base em levantamentos amostrais, encontrar os limites de um intervalo que iro
incluir o verdadeiro valor da porcentagem populacional desconhecida. Para tanto,
aplicaremos o seguinte intervalo de confiana para a estimao:
p
p Z S
o
, em que
p a proporo amostral
x
p
n
= .
Saiba que
x o n de casos na amostra
n o tamanho da amostra
Z
o
o valor de Z da tabela normal padro
p
S o desvio estimado para proporo, obtido por
p
pq
S
n
= (para populaes infinitas)
Ou
76
1
p
pq N n
S
n N
| |
=
|
\ .
(para populaes finitas)
E ainda: 1 q p =
Ento, vamos ver como funciona esta estimao de propores populacionais
desconhecidas a partir do prximo exerccio resolvido:
Exerccio Resolvido 5
Em uma amostra de 400 famlias de uma cidade-X, verifica-se que 128 utilizam da
assinatura do servio de internet. Determine o intervalo de confiana de 90% para a
verdadeira proporo de famlias desta cidade que utilizam do servio de internet.
Soluo:
p
p Z S
o
.
Primeiro vamos encontrar os trs valores que compem o intervalo, ok?
1)
128
0, 32
400
x
p
n
= = =
2) ? Z
o
=
Como vimos no tpico1, devemos primeiro calcular
0,1
1 1 0, 95
2 2
o
= = . Agora iremos
procurar na tabela normal padro (visto no tpico passado) a probabilidade mais
prxima a 0,95, depois verificaremos que esta probabilidade assumida pelo o valor
1, 65 Z
o
=
3) Como no temos uma populao definida das famlias da cidade-X, iremos
considerar a populao como infinita, assim o desvio estimado para proporo
ser dado por
p
pq
S
n
=
77
0, 32 0, 68
0, 023
400
p
S
= =
Vamos ento substituir os trs valores no intervalo de estimao:
p
p Z S
o
| | 0, 32 1, 65 0, 023 0, 32 0, 04 0, 28 0, 36 at = = = , ou seja, a proporo de
famlias do municpio-X que possuem servio de internet, estimada com 90% de confiana,
de no mnimo 28% e de no mximo 36% das famlias do municpio.
Espero que tenha compreendido. Vejamos outro exemplo:
Exerccio Resolvido 6
Numa amostra de 310 escolas de uma cidade que possui um total de 1030 escolas,
verificamos que 97 delas contam exclusivamente com professores graduados ou ps-
graduados. Determine o intervalo de confiana de 95% para a real proporo de
escolas desta cidade, que possuem o seu quadro contando somente com professores
com as referidas qualificaes.
Soluo: Como a estimao de proporo usaremos o referido intervalo de estimao
p
p Z S
o
.
Primeiro vamos encontrar os trs valores que compem o referido intervalo:
1)
97
0, 31
310
x
p
n
= = =
2) ? Z
o
=
Como vimos no tpico1, devemos primeiro calcular
0, 05
1 1 0, 975
2 2
o
= = . Agora
iremos procurar na tabela normal padro (visto no tpico passado) a probabilidade
mais prxima a 0,975, ento poderemos observar que a referida probabilidade
assumida pelo o valor 1, 96 Z
o
=
78
3) Como temos uma populao definida de 1030 escolas na cidade, iremos
considerar a populao como finita, assim o desvio estimado para proporo
ser
dado por
0, 31 0, 69 1030 310
0, 022
1 310 1029
p
pq N n
S
n N
| | | |
= = =
| |
\ . \ .
Vamos ento substituir os trs valores no intervalo de estimao:
p
p Z S
o
| | 0, 31 1, 96 0, 022 0, 31 0, 04 0, 27 0, 35 at = = = , ou seja, a proporo de
escolas da cidade que contam com o quadro de professores possuidores de graduao ou de
ps-graduao, estimada com uma confiabilidade de 95%, de no mnimo 27% e de no
mximo 35% das escolas da cidade.
Ento, nesta aula voc conheceu e aplicou os mais importantes tipos de estimaes de
parmetros populacionais desconhecidos.
ATIVIDADES DE APROFUNDAMENTO
1. Em uma populao normal de uma varivel X com varincia populacional igual a 16,
retiramos uma amostra de 27 observaes, obtendo-se uma mdia de 8,03. Determine o
intervalo de confiana para a mdia populacional , adotando um nvel de significncia
de 90%.
2. Considere que a varincia informada no exerccio anterior tenha sido referente as 27
observaes. Encontre o novo intervalo de confiana ao nvel de 95%.
3. A durao de um equipamento de determinada marca ocorre com um desvio padro de
1,2 anos. Sabendo-se que foram amostrados 120 equipamentos desta marca, obtendo-se
uma mdia no tempo de durao de 13 anos, estime com 99% de confiabilidade o real
tempo de durao dos equipamentos desta marca.
4. Calcule um intervalo de confiana de 97% para a proporo de itens produzidos com
defeito por uma mquina, sabendo-se que uma amostra de 150 itens produzidos por esta
mquina apresentou 13 itens com defeitos.
79
Desta forma, finalizamos o estudo da inferncia estatstica, concluindo assim o nosso
material para disciplina de Estatstica e Probabilidade, a qual foi composta de trs partes: o
estudo dos clculos das probabilidades, o estudo da estatstica descritiva e o estudo da
inferncia estatstica.
Esperamos que aproveitem ao mximo todo o material elaborado e que obtenham sucesso no
decorrer da disciplina, na concluso de seu curso e no caminhar de sua vida
80
REFERNCIAS
ANDERSON, David R; SWEENEY Dennis J; WILLIAMS Thomas A. Estatstica Aplicada Administ-
rao e Economia. 2 edio.
SPIEGEL, Murray R. Probabilidade e Estatstica, coleo Schaum, ed. Makron Books do Brasil,
1993.
HAZZAN, Samuel. Fundamentos de matemtica elementar: combinatria, probabilidade. Vol
5. So Paulo: Atual, 1993.
MORETTIN, Luiz Gonzaga. Estatstica Bsica. Vol 1. 7 Edio. So Paulo: Pearson Education do
Brasil, 1999.
SIMON, J. Fonseca. Curso de Estatstica. 5 Edio. So Paulo: Pioneira Thomson Learning,
1995.
WALPOLE, Ronald E; MYERS, Raymond H; MYERS, Sharon L; YE Keying. Probabilidade &
Estatstica para engenharia e cincias. 8 Ed.
EstatisticaeProbabilidade.
81
CURRCULO
PAULO MAIA FERREIRA graduado em Estatstica pelo Departamento de Estatstica e
Matemtica Aplicada (DEMA) da Universidade Federal do Cear (UFC), ps-graduado em
Didtica do Ensino Superior pela Universidade de Fortaleza (Unifor). Atuou como estatstico na
Federao das Indstrias do Estado do Cear (FIEC), como professor de graduao na
Universidade de Fortaleza e na Universidade do Vale do Acara e de ps-graduao na
Universidade Federal do Cear em convnio com o Instituto Federal de Educao, Cincia e
Tecnologia do Cear (IFCE). Atualmente, professor de Estatstica e de Probabilidade no IFCE
campus Fortaleza.