Você está na página 1de 17

ESTATSTICA APOSTILA 1

CURSO DE ENGENHARIA DE PRODUO

Prof. Jorge Santana

Montes Claros
Julho/2010

1 OS MTODOS ESTATSTICOS: finalidade e aplicaes; conceitos bsicos de Estatstica.


1.1 - O que Estatstica?
Todas as cincias tm suas razes na histria do homem.
A Matemtica, que considerada a cincia que une clareza do raciocnio a sntese da
linguagem, originou-se do convvio social, das trocas, da contagem, com carter prtico, utilitrio,
emprico.
A Estatstica, ramo da Matemtica Aplicada, teve origem semelhante.
Desde a antiguidade, vrios povos j registravam o nmero de habitantes, de nascimentos, de
bitos, faziam estimativas das riquezas individual e social, distribuam equitativamente terras ao povo,
cobravam impostos e realizavam inquritos quantitativos por processos que, hoje, chamaramos de
estatsticas.
Na Idade Mdia colhiam-se informaes, geralmente com finalidades tributrias ou blicas.
A partir do sculo XVI comearam a surgir as primeiras anlises sistemticas de fatos sociais,
como batizados, casamentos, funerais, originando as primeiras tbuas e tabelas e os primeiros nmeros
relativos.
No sculo XVIII o estudo de tais fatos foi adquirindo, aos poucos, feio verdadeiramente
cientfica. Godofredo Achenwal batizou a nova cincia (ou mtodo) com o nome de Estatstica,
determinando o seu objetivo e suas relaes com as cincias.
As tabelas tornaram-se mais completas, surgiram as representaes grficas e o clculo das
probabilidades, e a Estatstica deixou de ser simples catalogao de dados numricos coletivos para se
tornar o estudo de como chegar a concluses sobre o todo (populao), partindo da observao de partes
desse todo (amostras).
Atualmente, o pblico leigo (leitor de jornais e revistas) posiciona-se em dois extremos
divergentes e igualmente errneos quanto validade das concluses estatsticas: ou cr em sua
infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os objetivos, o campo e o
rigor do mtodo estatstico; ignoram a Estatstica, quer terica quer prtica, ou a conhecem muito
superficialmente.
Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e, com seus processos
e tcnicas, tm contribudo para a organizao dos negcios e recursos do mundo moderno.
(...) Exprimindo por meio de nmeros as observaes que se fazem de elementos com pelo menos
uma caracterstica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os
chamados dados referentes a esses elementos.
Podemos dizer, ento, que:
A Estatstica uma parte da Matemtica Aplicada que fornece mtodos para coleta, organizao,
descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.
A coleta, a organizao e a descrio dos dados esto a cargo da Estatstica Descritiva, enquanto a
anlise e a interpretao desses dados ficam a cargo da Estatstica Indutiva ou Inferencial.
Em geral, as pessoas quando se referem ao termo estatstica, o fazem no sentido da organizao e
descrio dos dados (estatstica do Ministrio da Educao, estatstica dos acidentes de trfego, etc.),
desconhecendo que o aspecto essencial da Estatstica o de proporcionar mtodos inferenciais que
permitam concluses que transcendam os dados obtidos inicialmente.
Assim, a anlise e a interpretao dos dados estatsticos tornam possvel o diagnstico de uma
empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condies de funcionamento,
produtividade), a formulao de solues apropriadas e um planejamento objetivo da ao. (CRESPO,
1997).

1.2 Conceitos bsicos de Estatstica


1.2.1 Populao
uma coleo completa de todos os elementos (valores, pessoas, medidas, etc.) a serem estudados.
1.2.2 Censo
uma coleo de dados relativos a todos os elementos da populao.
1.2.3 Amostra
um subconjunto da populao.
1.2.4 Um parmetro
uma medida numrica que descreve uma caracterstica da populao.
1.2.5 Uma estatstica
uma medida numrica que descreve uma caracterstica de uma amostra.
1.2.6 Estudo observacional
Tipo de estudo em que se verificam e se medem caractersticas especficas, mas no se manipulam nem se
modificam os elementos a serem estudados.
1.2.7 Experimento
Tipo de estudo em que se aplica determinado tratamento e observa-se seu efeito sobre os elementos a
serem pesquisados.

2 VARIVEIS: qualitativa (ou categrica) e quantitativa; nveis de mensurao de variveis.


2.1 Varivel qualitativa (ou categrica)
expressa por atributos e pode ser separada em diferentes categorias, como por exemplo: sexo
(masculino, feminino); cor da pele (branca, preta, amarela, parda); religio (catlica, evanglica,
esprita...); etc.
2.2 Varivel quantitativa
expressa por nmeros que representam contagens ou medidas, como por exemplo: salrios, altura, peso,
idade, etc.
2.2.1 Varivel quantitativa discreta
Resulta de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores. (Ou
seja, o nmero de valores possveis 0, ou 1, ou 2, etc.)
2.2.2 Varivel quantitativa contnua
Resulta de um nmero infinito de valores possveis que podem ser associados a pontos em uma escala
contnua de tal maneira que no haja lacunas ou interrupes.

Exemplos: o nmero de operrios de uma grande construo uma varivel quantitativa discreta porque
representa uma contagem; j o peso desses operrios uma varivel quantitativa contnua porque
representa mensuraes que podem tomar qualquer valor em um intervalo contnuo.
2.3 Nveis de mensurao de variveis
uma forma adicional de se classificarem os dados. H quatro nveis de mensurao de variveis:
nominal, ordinal, intervalar e razo.
2.3.1 Nvel nominal
Caracterizado por dados que consistem apenas de nomes, rtulos ou categorias. Os dados no podem ser
dispostos segundo um esquema ordenado (como de baixo para cima).
Exemplos:
Respostas do tipo sim, no ou indeciso.
O sexo dos estudantes em uma turma de matemtica.
2.3.2 Nvel ordinal
Envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores desses
dados no podem ser determinadas, ou no tem sentido.
Exemplos:
Um editor classifica alguns originais como excelentes, alguns como bons e alguns como maus.
(No podemos determinar uma diferena quantitativa entre bom e mau, por exemplo).
Nas olimpadas de matemtica, Joo foi classificado em 3; Carlos em 7 e Joana em 10 lugar.
(Podemos determinar a diferena entre os 3 e 7 lugares, mas a diferena de 4 no tem qualquer
significado).
2.3.3 Nvel intervalar
anlogo ao nvel ordinal, com a propriedade adicional de que podemos determinar diferenas
significativas entre os dados. Todavia, no existe um ponto de partida zero inerente, ou natural (onde no
haja qualquer quantidade presente). As temperaturas 98,2F e 98,6F so exemplos de dados nesse nvel
intervalar de mensurao. Os valores se apresentam ordenados, e podemos determinar diferenas entre
eles (em geral chamadas distancias entre os dois valores). Entretanto, no h ponto de partida natural. O
valor 0F pode parecer um ponto de partida, mas inteiramente arbitrrio, e no representa ausncia de
calor. um erro dizer que 50F duas vezes mais quente que 25F.
Exemplos:
Os anos 1000, 2000, 1776 e 1944. (O tempo no comeou no ano zero e, assim, o 0 arbitrrio, e no
um ponto de partida zero natural).
As temperaturas anuais mdias (em graus Celsius) das capitais brasileiras.
2.3.4 Nvel razo
o nvel de intervalo modificado de modo a incluir o ponto de partida zero inerente (onde o zero
significa nenhuma quantidade presente). Para valores nesse nvel, tantos as diferenas como as razes tm
significado.
Exemplos:
Pesos dos artigos de material plstico descartado pelas residncias (0 kg indica que nenhum plstico
foi descartado, e 10 kg representa duas vezes 5 kg).
Durao (em minutos) de filmes.
4

Distncias (em km) percorridas por carros em um teste de consumo de consumo de combustvel.
3 AMOSTRAGEM
So as tcnicas utilizadas para se extrair a amostra da populao. A amostragem pode ser probabilstica ou
no probabilstica. Na amostragem probabilstica so realizados sorteios para alocao dos elementos da
amostra, j na amostragem no probabilstica no se procede ao sorteio. O tamanho da populao ,
geralmente, designado por N e o tamanho da amostra por n.
3.1 Amostragem probabilstica
Este tipo de amostragem garante o acaso na escolha. Assim, cada elemento da populao tem a mesma
chance ser selecionado. Isto garante a representatividade da amostra e a validade das inferncias que
sero feitas a partir dela. Sero discutidos aqui, sucintamente, quatro tipos de amostragem probabilstica.
3.1.1 Amostragem casual ou aleatria simples
Equivale a um sorteio dos indivduos que faro parte da amostra
Procedimento:
Enumera-se a populao de 1 a N
Sorteiam-se os indivduos.
Antigamente, os sorteios eram feitos por meio de tabelas de nmeros aleatrios. Hoje em dia, utilizase uma calculadora cientfica ou, o que mais comum, um software estatstico.
Exemplo
Uma populao composta de 200 indivduos. Retire uma amostra de tamanho 10, utilizando sua
calculadora cientfica.
Amostra:

____

____ ____ ____ ____ ____ ____ ____ ____ ____

3.1.2 Amostragem casual estratificada proporcional


Utilizada quando a populao se subdivide em estratos (subpopulaes).
Procedimento:
Calcula-se a frao de amostragem dada por: f

n
N

Calcula-se o tamanho da amostra em cada estrato, fazendo-se: ni f N i


Sorteiam-se os indivduos em cada estrato.
Exemplo
Uma populao composta por 7820 indivduos distribudos em trs estratos que apresentam as seguintes
quantidades de elementos: N1 = 3270; N2 = 2680 e N3 = 1870. Se se deve retirar uma amostra de tamanho
n = 1564, qual deve ser a quantidade de indivduos a ser sorteada em cada estrato?
f

n 1564

0,20
N 7820

n1 f N 1 0,20 3270 654


n 2 f N 2 0,20 2680 536
n 3 f N 3 0,20 1870 374

Sorteiam-se, em cada estrato, as quantidades de indivduos calculadas acima.


5

3.1.3 Amostragem sistemtica


Utilizada preferencialmente quando a populao j se encontra ordenada, como por exemplo: as casas de
uma rua, pronturios mdicos, nmero de registros de matrcula, etc.
Procedimento:
Calcula-se o fator de sistematizao ou intervalo de seleo, dado por: F

N
n

Sorteia-se um indivduo no intervalo [1 ; F], que ser o primeiro elemento da amostra.


Os demais elementos so obtidos somando-se sucessivamente o valor do intervalo de seleo
Exemplo
Retirar uma amostra de tamanho n = 10 de uma populao ordenada composta de 80 elementos.
F

N 80

8
n 10

1 elemento = n. aleatrio multiplicado por 8.


Amostra:

____

____ ____ ____ ____ ____ ____ ____ ____ ____

3.1.4 Amostragem por conglomerado em 1 estgio


semelhante amostragem aleatria simples, porm, cada unidade de amostragem equivale a um grupo
ou conglomerado de elementos. Este tipo de amostragem utilizado quando se encontram dificuldades
para obter uma lista dos indivduos da populao.
Procedimento:
Especifica-se o sistema de referncia (conglomerados)
Sorteiam-se alguns conglomerados
Pesquisam-se todos os indivduos dos conglomerados sorteados.
Exemplo
Estimar o nmero mdio de domiclios com aquecedor solar em uma grande cidade.
Como a amostragem aleatria simples, neste caso, necessita de uma listagem de todas as casas, ela se
torna invivel. A amostragem estratificada tambm invivel, pois necessitaria da listagem dos
domiclios. A melhor escolha a amostragem por conglomerado que pode ser realizada do seguinte
modo:
Sistema de referncia (conglomerado): os quarteires da cidade.
Extrai-se a amostra de conglomerados (quarteires)
Pesquisa-se a existncia de aquecedor solar em todos os domiclios dos conglomerados (quarteires)
sorteados.

4 ESTATSTICA DESCRITIVA E ANLISE EXPLORATRIA DE DADOS


4.1 -Tratamento estatstico de variveis quantitativas

A fim de descrever uma amostra (ou uma populao), conveniente o clculo de algumas medidas que a
caracterizam. Estas medidas quando bem interpretadas fornecem informaes valiosas sobre o conjunto
de dados.
A rigor, tais medidas so calculadas com o objetivo de produzir uma sntese numrica que represente o
conjunto de dados. Por exemplo, quando dizemos que a nota mdia de uma turma, em uma prova, foi 70
pontos; esta mdia, se consistente, equivale ao valor que sintetiza satisfatoriamente a nota da turma como
um todo.
Essas medidas se classificam em dois grandes grupos: as medidas de tendncia central (mdia, mediana e
moda) e as medidas de disperso ou variabilidade (varincia, desvio padro, coeficiente de variao).
Alm destas, h o escore padronizado que uma medida que tenta captar a posio relativa de um
indivduo dentro de um grupo.
Cada uma dessas medidas ser discutida aqui com mais detalhes.
4.2 Medidas de tendncia central
4.2.1 Mdia aritmtica simples ( x )
Para calcular a mdia aritmtica simples ( x ) l-se: xis barra de um conjunto de dados, basta somar
todos os valores e dividir pela quantidade deles, assim:
x

Exemplo: amostra de pesos (kg) de 7 alunos de uma turma.


Pesos:

x
n

90

94

80

70

92

70

72

90 94 80 70 92 70 72 568

81 kg
7
7

4.2.2 Mediana (Md)


A mediana o valor que ocupa a posio central da amostra. Para calcular a mediana, os dados devem
estar ordenados (geralmente do menor para o maior valor). Para realizar o clculo da mediana,
necessrio verificar se o tamanho da amostra (n) par ou mpar.
1 caso: n mpar
Neste caso, a mediana o valor que ocupa exatamente a posio central. Em linguagem matemtica, este
valor pode ser designado por

x n 1
2

n 1
. Ou seja, a medida do indivduo que ocupa a posio

. Para o

exemplo anterior, como n = 7, tem-se:


Pesos:

70

Termo central:

70

72

x n1 x 7 1 x4
2

80

90

92

94

(Observe que os dados esto ordenados) n = 7

Portanto, o valor da mediana a medida do indivduo que est

exatamente na quarta posio. Assim, a mediana : Md = 80 kg.


Interpretao da mediana
7

Como a mediana ocupa a posio central, podemos no presente exemplo dizer que 50% dos alunos
tiveram pesos menores ou iguais a 80 kg e os outros 50% pesos maiores ou iguais a 80 kg.
2 caso: n par
Neste caso, preciso identificar os dois termos centrais e calcular a mdia entre eles. O valor obtido
considerado a mediana. Matematicamente, as ordens (posies) dos dois termos centrais so dadas por: o
x
primeiro n e o segundo por x n .
2

Exemplo: amostra de pesos em kg de 6 alunos de uma turma.


Pesos:

70

72

80

90

92

94

(Observe que os dados esto ordenados)

n=6

Primeiro termo central: x n x 6 x3 que equivale ao valor 80


2

Segundo termo central: x n 1 x 6 1 x4 que equivale ao valor 90


2

Portando: Md =

80 90
Md = 85 kg
2

4.2.3 Moda (Mo)


A moda o valor que ocorre com maior freqncia no conjunto de dados. Retomando o exemplo da
amostra dos pesos de 7 alunos, tem-se:
Pesos:

70

70

72

80

90

92

94

Como o peso que mais se repete 70, pode-se dizer que: Mo = 70 kg


Caso existissem dois valores distintos com maior freqncia (por exemplo: 70, 70 e 90, 90), dir-se-ia que
a srie bimodal com modas 70 e 90.
Quando cada valor da amostra ocorre com a mesma freqncia, dizemos que no h moda (a srie
amodal).
Breve comentrio sobre as medidas de tendncia central
Tabela resumo sobre as medidas de tendncia central do exemplo
Pesos:

90

94

80

70

92

70

72

Medidas de tendncia central da amostra do exemplo


Medida
Valor
Mdia ( x )
81 kg
Mediana (Md)
80 kg
Moda (Mo)
70 kg
A questo que se coloca aqui a seguinte: qual das trs medidas de tendncia central deve ser utilizada
para sintetizar o conjunto de dados?
A medida mais utilizada a mdia aritmtica simples, principalmente porque o seu clculo envolve todos
os valores do conjunto de dados; enquanto a mediana envolve um, no mximo dois, valores da amostra.
Assim, se no houver nenhuma assimetria acentuada nos dados, utiliza-se a mdia. Quando a assimetria
muito forte, significa dizer que h alguns poucos indivduos na amostra cujos valores so muito altos (ou
8

muito baixos) e a mdia tende a ficar superestimada (ou subestimada) e, portanto, no sintetizando ou
representando bem a amostra. Neste caso, recomendvel utilizar a mediana. J a moda uma medida
que capta um valor tpico dos dados.
No exemplo em questo, h uma ligeira assimetria nos dados, pois, a moda menor que a mediana que,
por sua vez, menor que a mdia. Entretanto, como mdia e mediana so relativamente prximas (81 e
80, respectivamente), a princpio, pode-se optar por sintetizar a amostra de pesos dos alunos com a mdia
aritmtica simples.
O tpico seguinte (medidas de disperso) avalia melhor a representatividade da mdia.

4.3 Medidas de disperso ou variabilidade


As medidas de disperso ou variabilidade servem para avaliar a concentrao dos valores da amostra em
torno da mdia. Neste sentido, elas auxiliam no estudo sobre a representatividade da mdia aritmtica
simples em um conjunto de dados, na medida em que quanto menor for a disperso aqui entendida
como o afastamento das medidas dos indivduos tomando como referncia a mdia , maior a
representatividade desta. Em outras palavras: se a medida de variabilidade for pequena, ento realmente
a maioria dos valores da amostra se concentra em torno da mdia, fazendo com que esta represente ou
sintetize bem o conjunto de dados.
4.3.1 - varincia amostral (s2)
uma mdia das distncias calculada a partir dos quadrados dos desvios em relao mdia aritmtica
simples. Ou seja, calculamos a diferena entre cada indivduo da amostra e a mdia aritmtica simples e
elevamos ao quadrado. Em seguida, somamos todos os valores obtidos e dividimos pelo tamanho da
amostra menos uma unidade. A frmula matemtica da varincia :
s

n 1

A rigor, o denominador desta expresso deveria ser n. Entretanto, por razes relacionadas inferncia
estatstica, pode-se mostrar que conveniente dividir a soma dos quadrados das diferenas por n 1.
Retomando o exemplo da amostra dos pesos de 7 alunos, e lembrando que x 81, a varincia :
Pesos:

90

s2

n 1

94

80

70

92

70

72

90 81 2 94 81 2 80 81 2 70 81 2 92 81 2 70 81 2 72 81 2
7 1

9 2 13 2 1 2 11 2 11 2 11 2 9 2
6

81 169 1 121 121 121 81 695

116 kg2
6
6

4.3.2 Desvio padro amostral (s)


a raiz quadrada da varincia. O desvio padro possui a mesma unidade de medida dos dados e a
medida que, efetivamente, utilizada como sntese da disperso ou variabilidade. ela que mede a
concentrao dos valores dos indivduos da amostra em relao mdia aritmtica simples. Em outros
termos, pode-se dizer que quanto menor for o desvio padro, mais representativa a mdia aritmtica
simples; pois, neste caso, a baixa disperso indica que a maioria das medidas dos indivduos da amostra
9

esto razoavelmente prximas da mdia e, portanto, esta representa bem o conjunto de dados. A frmula
do desvio padro :
s

n 1

Para o exemplo anterior, como a expresso sob o radical j foi calculada, o desvio padro :
s

116 kg 2 10,8

kg

Concluso: a amostra revelou uma mdia foi de 81 kg com um desvio padro de 10,8 kg.
4.3.3 Coeficiente de variao (CV)
Coeficiente de variao (CV): ... conveniente exprimir a variabilidade em termos relativos, isto porque,
por exemplo, um desvio padro de 10 pode ser insignificante se a observao tpica 10.000, mas
altamente significativo para uma observao tpica 100. Toma-se ento uma medida relativa da
variabilidade, comparando o desvio padro com a mdia. Esta medida o coeficiente de variao. J
vimos que o desvio padro tem a mesma unidade de medida que os dados, de modo que o coeficiente de
variao adimensional. A grande utilidade do coeficiente de variao permitir a comparao das
variabilidades de diferentes conjuntos de dados. (SOARES, 1991).
O coeficiente de variao dado por: CV

s
x

. Esta expresso pode ser multiplicada por 100 de modo

que o CV possa ser expresso em percentagem.


Exemplo 1: As turmas A e B do 1 perodo de Engenharia Civil apresentaram as estatsticas abaixo em
uma prova de Clculo I (dados na tabela abaixo). Qual das duas turmas se mostrou mais homognea na
prova?
Estatsticas das notas de uma prova de clculo I
Estatsticas
Turmas
s
x

A
B

78
92

8
15

CV

?
?

Chamando de CVA e CVB os coeficientes de variao das turmas A e B, tem-se:


CV A

8
0,10
78

CV B

15
0,16 .
92

Estes valores, se multiplicados por 100, correspondem a 10% e 16%.


Concluso: como o coeficiente de variao da turma A menor que o da turma B, conclui-se que os
alunos da turma A mostraram notas mais homogneas. Assim, embora a turma B possua uma mdia
maior, as notas dos alunos so mais heterogneas. Isto pode ter ocorrido, por exemplo, devido a presena
de algumas notas altas que tendem a aumentar a mdia.
Comentrio: o valor do coeficiente de variao, em termos de identificar alta ou baixa homogeneidade,
vai depender muito das caractersticas do estudo que est sendo desenvolvido. Entretanto, na maioria dos
casos, pode-se avaliar a disperso do seguinte modo:
10

CV 0,10
0,10 CV 0,20
0,20 CV 0,30
CV 0,30

: Baixa disperso
: Disperso moderada
: Disperso alta
: Disperso muito alta

4.4 Estudo do escore padronizado (Zi)


No contexto de um nico conjunto de dados, o desvio padro pode ser interpretado intuitivamente como
unidade natural de disperso dos dados. Essa interpretao utilizada na construo de escores
padronizados, de larga aplicao em medidas educacionais. O problema o seguinte: em uma escala de
0 a 10, a nota 6 em uma prova em que a nota mxima foi 6 muito mais do que a mesma nota 6 em uma
prova em que a nota mxima foi 9. Uma forma de captar essa diferena considerar a nota do aluno como
a sua posio relativa no grupo. (SOARES, 1991)
Deste modo, enquanto o coeficiente de variao compara grupos, o escore padronizado capta a posio da
medida de um indivduo dentro do grupo. O escore padronizado dado por:
Zi

xi x
.
s

Onde x i a medida do i-esimo indivduo.

Retomando o exemplo das notas da prova de Clculo I das turmas A e B do 1 perodo de Engenharia
Civil, suponha que o Joo aluno da turma A e tirou 85 pontos na prova; j a Maria aluna da turma B e
tirou 90 pontos no teste. A questo : em termos relativos, qual dos dois alunos, Joo ou Maria, obteve
melhor desempenho?
Estatsticas das notas de um teste de lngua portuguesa
Estatsticas
Turmas
s
x

A
B

78
92

8
15

Chamando de ZJ o escore do Joo e ZM o escore da Maria, tem-se:

ZJ

85 78
0,875
8

ZM

90 92
0,133
15

Concluso: embora Maria tenha uma nota superior do Joo, em termos relativos a pontuao obtida por
Joo melhor do que a de Maria, pois (0,875 > 0,133).
5 ESTATSTICA DESCRITIVA, ANLISE EXPLORATRIA DE DADOS (CONTINUAO)
5.1 Distribuio de freqncia (variveis quantitativas)
As distribuies de freqncias so tabelas que descrevem os dados estatsticos a fim de facilitar sua
compreenso. Hoje em dia, com a expanso dos softwares, essas tabelas so obtidas com muita facilidade
e, portanto, no so construdas manualmente.
5.1.1 Distribuio de freqncia sem intervalos de classe
Notao:
11

i: so as classes
xi: valores assumidos pela varivel
fi: freqncia simples ou absoluta
fri: freqncia relativa simples
Fi: freqncia acumulada
n: equivale ao fi
Exemplo: amostra das idades (em anos) de uma amostra de alunos.
TABELA 1
Distribuio de freqncia das idades em anos de uma amostra de alunos
i
xi
fi
fri
Fi
1
19
8
0,121
8
2
20
12
0,182
20
3
22
17
0,258
37
4
25
13
0,197
50
5
27
12
0,182
62
6
30
4
0,060
66

66
1,000

5.1.2 Distribuio de freqncia com intervalos de classe


Alm da notao anterior, usa-se o smbolo | para designar o intervalo fechado esquerda e aberto
direita. Alm disso, o xi o ponto mdio da classe.
Para determinar o nmero de classes, i, e a amplitude do intervalo no h um critrio fixo. Entretanto,
comum, para determinar o nmero de classes, usar-se a frmula: i = 1 + 3,3(logn). E para determinar a
amplitude do intervalo, h, pode se utilizar: h

AA
, onde AA a amplitude amostral e corresponde
i

diferena entre o maior e o menor valor do rol (o rol so os dados ordenados).


Exemplo: Rol das estaturas (em cm) de 40 alunos do colgio A. (Retirado do livro Estatstica Fcil)
150
151
152
153

154
155
155
155

155
156
156
156

157
158
158
160

160
160
160
160

161
161
161
161

162
162
163
163

164
164
164
165

166
167
168
168

169
170
172
173

Determinao do nmero de classes e da amplitude do intervalo:


Classes: i = 1 + 3,3(logn) = 1 + 3,3log40 = 1 + 3,3(log40) = 1 + 3,3(1,602059991) = 6,286797971 = 6
Amplitude amostral: AA = 173 150 = 23
Amplitude do intervalo: h

AA 23

3,83333 4
i
6

A tabela de distribuio de freqncia ser:


TABELA 2
Distribuio de freqncia das estaturas (em cm) de uma amostra de 40 alunos
i
Intervalo
xi
fi
fri
Fi
12

1
2
3
4
5
6

150 |
154 |
158 |
162 |
166 |
170 |

154
158
162
166
170
174

152
156
160
164
168
172

4
9
11
8
5
3
40

0,100
0,225
0,275
0,200
0,125
0,075
1,000

4
13
24
32
37
40

6 Estudo dos percentis (Pk)


Os percentis dividem o rol em 100 partes iguais. Os percentis so medidas de posio.
|__________|__________|____________________|____________________|__________|____________|
P1
P2
P50
P98
P99
Min
Max
k n
Para calcular um percentil qualquer, devemos encontrar a odem do percentil do seguinte modo:

100

Exemplo - Altura (cm) de uma amostra de 40 estudantes.


150,2 154,2 155,9 157,4 160,2 161,0 162,1 164,2 166,8 169,5
151,3 154,6 156,1 158,5 160,5 161,2 162,9 164,4 167,9 170,7
152,4 155,3 156,5 158,9 160,7 161,5 163,3 164,9 168,1 172,4
153,5 155,7 156,8 160,1 160,9 161,9 163,8 165,0 168,8 173,5
Calcular:
a)

P10

b)

P25

c)

P67

d)

P97

Resoluo
k n

k n
b)
100

k n

c)
100

10 40
100

25 40

100

a)
100

67 40
100

4 termo. Portanto: P10 = 153,5

10 termo. Portanto: P25 = 156,1

26,8 . Portanto, o P67 ser a mdia entre o 26 e 27 termos. Logo;

P67

162,9 163,3 326,2

163,1
2
2
13

k n

97 40
100

d)
100

38,8 . Portanto, o P97 ser a mdia entre o 38 e 39 termos. Logo;

P97

170,7 172,4 343,1

171,55
2
2

6.1 Percentis especiais: Quartis (Qk)


Os quartis dividem a srie estatstica em 4 partes iguais. So eles: primeiro quartil (Q 1), segundo quartil
(Q2) e terceiro quartil (Q3). O primeiro quartil corresponde ao percentil 25; o segundo quartil o percentil
50 (que coincide com a mediana) e o terceiro quartil o percentil 75.
|__________|__________|__________|__________|
Min

Q1

Q2

Q3

Max

Para o exemplo Q1 = 156,1 (que corresponde ao P25) e Q3 = 164,4 (que equivale ao P75 confira!).
7 Mdia pondera x p
A media pondera utilizada quando se atribuem pesos distintos para os valores da varivel. dada por:

xp

x p
p
i

Onde xi so os valores da varivel e pi so os pesos. A mdia aritmtica simples uma mdia ponderada
onde os pesos so iguais.

EXERCCIOS LISTA 01
1) Para cada uma das descries abaixo, indique o seu significado escolhendo um dos seguintes
conceitos: populao, um parmetro, censo, variveis quantitativas, variveis qualitativas, variveis
discretas, experimento, uma estatstica, estudo observacional.
a)

b)
c)
d)
e)
f)
g)

h)

Coleo completa de todos os elementos, com pelo menos uma caracterstica comum, a serem
estudados.
Consistem em nmeros que representam contagens ou medidas.
Medida numrica que descreve uma caracterstica numrica de uma populao.
Resultam de um conjunto finito de valores possveis, ou de um conjunto enumervel desses valores.
Coleo de dados relativos a todos os elementos de uma populao.
Medida que descreve uma caracterstica numrica de uma amostra.
Dados que podem ser separados em diferentes categorias que se distinguem por alguma caracterstica
no numrica.
Situao em que verificamos e medimos caractersticas especficas, mas no modificamos os
elementos a serem estudados.
14

i)

Situao em que modificamos as caractersticas de elementos a fim de verificar o efeito desta


modificao.

2) D um exemplo para cada um dos seguintes nveis de mensurao de variveis: nominal, ordinal e
razo.
3) Nos itens a, b, c, d abaixo, indique se a descrio dada corresponde a um estudo observacional ou a
um experimento.
a)

b)

c)

d)

Uma pesquisa tenta captar a opinio da populao sobre sua preferncia em morar em casa ou
apartamento. _______________________________________
Em uma turma de educao fsica, estuda-se o efeito dos exerccios fsicos sobre a presso sangunea,
determinando-se que metade dos estudantes ande mil metros cada dia, enquanto a outra metade corra
mil metros diariamente. ______________________________________________________________
Em determinada cidade, faz-se um levantamento do nmero de pessoas contaminadas com o vrus
HIV, de acordo com o sexo. ___________________________________________________________
A fim de aumentar a produtividade de tomate de sua plantao, um produtor faz um rgido controle
sobre a irrigao (quantidade de gua diria) e a luminosidade (incidncia de raios solares) nos
tomateiros de sua produo. ___________________________________________________________

4) Deve-se extrair uma amostra de tamanho n=600 de uma populao de tamanho N=5.000, que consiste
de quatro estratos com as seguintes quantidades de elementos: N 1=3.000, N2=1.000, N3=800 e
N4=200. Se a alocao deve ser proporcional, qual o tamanho da amostra em cada estrato?
5) Retire uma amostra de tamanho n=10 de uma populao ordenada composta de 200 elementos,
utilizando o processo de amostragem sistemtica. Explique todo o procedimento adotado.
6) Explique o que amostragem por conglomerados e exemplifique.
7) Construir uma tabela de distribuio de freqncia com intervalos de classe para os dados abaixo que
representam uma amostra de pesos (kg) do curso de Engenharia (veja exemplo da tabela 2 acima).
Utilizar as frmulas vistas no contedo para definir o nmero de classes (i) e a amplitude do intervalo
(h).
42,1
52,1
57,1
63,7
75,0

43,7
52,7
58,3
63,9
75,2

45,1
53,0
59,7
65,8
75,8

46,2
53,8
60,1
66,9
76,0

47,1
54,0
60,1
67,0
78,2

47,8
54,7
60,1
67,9
79,3

49,3
55,8
61,0
68,0
80,2

50,2
55,9
62,1
70,2
82,7

50,4
56,7
62,9
72,1
84,1

51,3
56,9
63,0
74,5
90,1

8) Nos itens de a at f abaixo, calcule a mdia, a mediana, a moda, o desvio-padro e o coeficiente de


variao.
a)

b)

Medidas do dimetro (em mm) interno de anis forjados de pisto de um motor de automvel. Os
dados so: 1; 3; 15; 0; 5; 2; 5 e 4.
Tempo de esgotamento de um fluido isolante entre eletrodos a 34 kV. Os tempos em minutos so:
0,19; 0,78; 0,96; 1,31; 2,78; 3,16; 4,15; 4,67; 4,85; 6,50; 7,35; 8,01; 8,27; 12,06; 31,75; 32,52; 33,91;
36,71 e 72,89.
15

c)

d)

e)

f)

Medida da espessura de xido em pastilhas que so estudas para verificar a qualidade em um processo
de fabricao de semicondutores. Os dados, em angstroms, so: 1264; 1280; 1301; 1300; 1292; 1307 e
1275.
Experimento para testar a resistncia resultante em tubos circulares com calotas soldadas nas
extremidades. Os resultados em kN so: 96; 96; 102; 102; 102; 104; 104; 108; 126; 126; 128; 128;
140; 156; 160; 160; 164 e 170.
Dados sobre acomodao visual (uma funo do movimento do olho), quando reconhecendo um
padro de mancha em um vdeo CRT de alta resoluo. Os dados so: 36,45; 67,90; 38,77; 42,18;
26,72; 50,77; 39,30 e 49,71.
Dados referentes a medidas de intensidade solar direta (watts/m 2), em dias diferentes, no sul da
Espanha: 562; 869; 708; 775; 704; 809; 856; 655; 806; 878; 909; 918; 558; 768; 870; 918; 940; 946;
661; 820; 898; 935; 952; 957; 693; 835; 905; 939; 955; 960; 498; 653; 730 e 753.

9) Abaixo se encontra uma amostra dos pesos (kg) de uma turma de matemtica, ao final do 2 semestre
de 2006 e ao final do 1 semestre de 2007.

Nmero do aluno
Peso ao final do 2 semestre/2006
Peso ao final do 1 semestre/2007
Escore padronizado do 2 semestre
Escore padronizado do 1 semestre

01
66
64

02
70
66

03
68
68

04
71
63

05
69
66

06
67
67

07
70
62

08
69
64

09
71
63

10
70
68

a) Calcule os coeficientes de variao e diga em qual momento os pesos so mais homogneos.


b) Complete a tabela com os escores padronizados de todos os alunos, nos dois momentos.
c) A partir dos escores padronizados, em que momento os alunos de nmeros 01 e 08 apresentam maior
excesso relativo de peso?
10) Mostrar que se todos os valores de um conjunto de dados forem aumentados de b, a mdia e a
mediana tambm ficaro aumentadas de b. E o desvio padro tambm ficar aumentado de b?
11) A contagem de bactrias numa cultura aumentou de 2.500 para 9.200 em trs dias. Qual o acrscimo
percentual dirio mdio?
12) Tibrcio prestou recentemente um concurso e obteve as notas nas disciplinas listadas na tabela abaixo.
Disciplinas
Portugus
Matemtica
Tcnicas Bancrias
Informtica
Ingls
Contabilidade
a)
b)
c)

Nota do Tibrcio
72
91
85
70
84
92

Peso
3,6
1,1
2,1
2,5
1,8
1,6

Calcule a mdia aritmtica simples x do Tibrcio.


Calcule a mdia ponderada x p do Tibrcio.
Considerando que a nota mnima para ser aprovado 82 pontos, e que o concurso utiliza a mdia
ponderada para efeito de classificao, o Tibrcio foi aprovado?

13) Os dados abaixo mostram a resistncia compresso de 80 corpos de prova da liga alumnio-ltio,
medidas em psi (medida de presso ou libra por polegada quadrada).
16

76
87
97
101
105
110
115
118
120
121

123
131
133
133
134
135
135
141
142
143

145
146
148
149
149
150
150
151
153
154

154
156
157
157
158
159
160
161
163
164

Calcule:
a)
b)
c)
d)
e)
f)
g)

P20, P44, P67, P80 e P91


Q1 e Q3
Mdia
Desvio-padro
Coeficiente de variao
Moda
Mediana

17