Você está na página 1de 83

UNIVERSIDADE DO OESTE DE SANTA CATARINA -

UNOESC
JOAÇABA

APOSTILA BÁSICA
ESTATÍSTICA

JOAÇABA, FEVEREIRO - 2010


O material apostilado deste curso é para uso exclusivamente didático, sem intenção
comercial. Nenhuma parte desta publicação pode ser reproduzida ou transmitida, sob
qualquer forma – fotocópia, gravação – ou por qualquer meio – eletrônico, mecânico – sem
a permissão da UNOESC - Joaçaba e do autor/organizador do material.

Disciplina:
ESTATÍSTICA e PROBABILIDADE COMPUTACIONAL

Adaptação para Curso de Engenharia


Professor FABIANO PASQUAL D´AGOSTINI
dagos@softline.com.br

2
A ESTATÍSTICA NA ENGENHARIA

Logo após a revolução Industrial, métodos estatísticos foram incorporados


nos processos industriais para garantir a qualidade dos produtos. Amostras de itens
produzidos eram avaliadas sistematicamente para inferir se o processo estava sob
controle. Mais recentemente, a avaliação da qualidade passou a ser feita ao longo
de todo o processo produtivo como forma de corrigir eventuais falhas no sistema
assim que elas aparecessem. Isso levou a um aumento da qualidade do produto
final a redução de curtos, pois se reduziram drasticamente as perdas por defeitos.
Além do acompanhamento estatístico da qualidade, as indústrias costumam
fazer experimentos estatisticamente planejados para encontrar a combinação dos
níveis dos fatores do processo que levem a melhor qualidade possível. Na outra
ponta, as empresas levantam dados de amostras de consumidores para realizar
pesquisas de marketing direcionadas ou para adequar os produtos aos clientes. O
planejamento dessas amostras e a análise dos dados necessitam de técnicas
estatísticas.
Muitas vezes, a relação entre estatística e engenharia é ainda mais estreita.
Os próprios métodos de engenharia costumam incorporar intrinsecamente
procedimentos probabilísticos ou estatísticos. Assim, para que um aluno possa
entender certos métodos de engenharia, é necessário que tenha conhecimento de
probabilidade e estatística.
BARBETTA, Pedro Alberto, São Paulo: Atlas, 2004.

3
DEFINIÇÕES

Estatística é ciência quando estuda populações; é método quando serve de


instrumento a uma outra ciência. É também arte, ciência-método e método-ciência,
segundo vários tratadistas, daí advindo uma variedade de definições. Eis algumas:

“Conjunto dos processos que têm por objeto a observação, a classificação


formal e a análise dos fenômenos coletivos ou de massa, e por fim a indução das
leis a que tais fenômenos obedecem globalmente” ( Milton da Silva Rodrigues).

“Apresentação numérica, tabular ou gráfica dos resultados da observação


dos fenômenos de massa.”

“A estatística é a parte da matemática aplicada que se ocupa em obter


conclusões a partir de dados observados” (Ruy Aguiar da Silva Leme).

“A estatística é o estudo numérico dos fatos sociais” (Levasseur).

“É observação metódica, e tão universal quanto possível, dos fatos


considerados em globo, reduzidos a grupos homogêneos e interpretados mediante a
indução matemática” (Ferraris).

“Dados quantitativos sujeitos em larga escala à influência de uma


multiplicidade de causas” (Yule e Kendall).

“Conjunto do que é realmente notável em um Estado ou a descrição da


situação atual de um Estado” (Achenwall).
“O método que tem por objeto o estudo quantitativo dos dados ou fatos que
se apresentam em massa e a pesquisa de suas relações” (Authus Pagano).

“É um ramo de matemática aplicada e pode ser considerada como a


Matemática aplicada a dados observados” (R.A. Fischer).

“A Estatística não é senão a História em repouso; a História não é senão a


Estatística em movimento” (Schlozer).

“Em uma palavra, se a Economia sabe indicar como produzir, a Estatística


pode dizer quanto produzir. Aquela ensina a movimentar a máquina econômica das
nações, esta regula a velocidade conveniente.”

“A Estatística é coleta, apresentação, análise e interpretação de dados


numéricos” (Croxton e Cowden).

“Deve-se considerar a Estatística, de um lado como método aplicado em


todos os domínios das ciências concretas particulares onde se encontram
fenômenos coletivamente típicos, e, de outro lado, como ciência concreta de caráter

4
geral que estuda os fenômenos coletivamente típicos como tais, independentemente
do domínio particular a que pertencem” (Giorgio Mortara).

Algumas frases célebres têm sido arquivadas pelos estatísticos, entre as


quais:

“Estatística é o orçamento das coisas e sem orçamento não há salvação”


(Napoleão).

“Sem adequado conhecimento de Estatística, o investigador das Ciências


Sociais sente-se, freqüentemente, como um cego, tateando num quarto escuro, à
procura de um gato preto que lá não está” (Croxton e Cowden).

“Faça o Brasil a Estatística que deve ter e a Estatística fará o Brasil como
deve ser” (Teixeira de Freitas).

CONCEITOS PRELIMINARES

O QUE É ESTATÍSTICA?
Vários autores têm procurado definir a Estatística, porém a que vamos seguir
é a enunciada por DUGÉ DE BERNONVILLE, e que julgamos ser simples e fácil de
ser memorizada:

“Estatística é um conjunto de métodos e processos quantitativos que


serve para estudar e medir os fenômenos coletivos”.

POPULAÇÃO E AMOSTRA
Conforme ficou claro na definição, a Estatística tem por objetivo o estudo dos
fenômenos coletivos e das relações que existem entre eles. Entende-se como
fenômeno coletivo aquele que se refere à POPULAÇÃO, ou universo, que
compreende um grande número de elementos, sejam coisas ou pessoas. Portanto,
para a Estatística só interessam fatos que englobem um grande número de
elementos.

A POPULAÇÃO pode ser, segundo seu tamanho, finita ou infinita, porém, na


prática nunca encontraremos populações com infinitos elementos, (populações com
grande número de componentes), populações muito grandes são estudadas por
amostragem.

AMOSTRA: é uma parte representativa de todo ou do universo; ou, em outros


termos, “é o grupo de elementos selecionados com a intenção de descobrir algo a
respeito da população de que fazem parte”. Todo subconjunto não vazio e menor do
que a população constitui uma amostra dessa população.

5
POR QUE ESTUDAR ESTATÍSTICA?
Não seria fora de propósito o estudante perguntar “por que devo estudar
Estatística?”. Certamente isso exigirá um esforço da parte do mesmo, que desejará
saber o benefício que daí lhe advirá. Por ora, vamos sugerir algumas respostas:

1. O raciocínio estatístico é largamente utilizado no governo e na administração;


assim, é possível que, no futuro, um empregador venha a contratar ou promover
um funcionário por causa de seu conhecimento de Estatística.

2. Os administradores necessitam do conhecimento da Estatística para bem tomar


sua decisões e para evitar serem iludidos por certas apresentações viciosas.
3. Cursos subseqüentes utilizam a análise Estatística.
4. A maioria das revistas profissionais e outras contém referências freqüentes a
estudos estatísticos.

5. A imprensa, tanto quanto muitas experiências cotidianas, oferece amplas


oportunidades para a interpretação Estatística.

RAMOS PRINCIPAIS DA ESTATÍSTICA


Teoria das probabilidades, Estatística Descritiva ou Dedutiva e Estatística
Indutiva ou Inferência Estatística.

TEORIA DAS PROBABILIDADES


A teoria das probabilidades proporciona uma base racional para lidar com
situações influenciadas por fatores relacionados com o acaso.

ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INDUTIVA


ESTATÍSTICA DESCRITIVA OU DEDUTIVA: É aquela que tem por objeto
descrever e analisar determinada população, sem pretender tirar conclusões de
caráter mais genérico (geral – que tem caráter de generalidade).

ESTATÍSTICA INDUTIVA OU INFERÊNCIA ESTATÍSTICA: É a parte da


Estatística que, baseando-se em resultados obtidos da análise de uma amostra da
população procura inferir (deduzir por meio de raciocínio; tirar por conclusão), induzir
(persuadir, instigar) ou estimar as leis de comportamento da população da qual a
amostra foi retirada. Através da ESTATÍSTICA INDUTIVA podemos aceitar ou
rejeitar hipóteses.

6
METODOLOGIA DA PESQUISA
DEFINIÇÃO DOS OBJETIVOS:
Definir com exatidão o objetivo:

• Da pesquisa;
• Setores geográficos;
• Grau de precisão;
• Tipo de amostragem;
• Amplitude de tamanho;
• Tempo e custo previsto.

OBJETIVOS MAIS COMUNS DE UMA PESQUISA:

• Dados pessoais  grau de instrução, religião, dados econômicos, etc.;


• Dados sobre vizinhança  relações familiares, habitat, como vivem os vizinhos
do indivíduo, etc.;
• Dados sobre comportamento  ex.: comportamento dos operários diante da
mudança de local do refeitório;
• Níveis de informação  aspirações, esperanças e angústias em relação a
determinado assunto;
• Atitudes e modificações que motivam para ação  representa a causa dos
comportamentos.

PREPARAÇÃO DO PLANO
“Máximo de informações com o mínimo de custo e tempo”.

FORMA DE COLETA

• Observação Direta  através de uma pessoa, câmera de TV ou cinema.


• Entrevista  é o método mais eficiente, porém mais caro.
• Auto-entrevista  sem entrevistador, custo baixo feito pelo correio ou mala-
direta. De 10% a 20% são devolvidos.

QUESTIONÁRIO
Na entrevista e na auto-entrevista, o acessório principal é o questionário, se
mal formulado resultará em dados inaproveitados.

7
UM BOM QUESTIONÁRIO DEVE SER:

• Completo: conter todas as informações que pretendemos obter;


• Concreto: formulação das perguntas dever ser clara e objetiva;
• Secreto: sem identificação;
• Discreto: evitar perguntas que possam ferir a suscetibilidade do
pesquisado.

8
ARREDONDAMENTO DE NÚMEROS

A norma NBR 5891 da Associação Brasileira de Normas Técnicas (ABNT) estabelece as


regras fixas de arredondamento na numeração decimal, em uso na atualidade. Essas regras
estão de acordo com a Resolução 886/66 do IBGE.
O arredondamento de um número à unidades mais próximas (décimo ou decimal,
centésimo, milésimo, etc) reduz seus dígitos significativos ao número de dígitos
exigidos pelo cálculo realizado.

A estatística convencionou adotar um critério para o arredondamento: a metade dos


dados possíveis será arredondado para maior e a outra metade arredondado para
menor, desta forma resulta as seguintes regras:

1 – Sempre que o algarismo a abandonar for inferior a 5 (1, 2, 3, 4), faz-se o


arredondamento para menor (mantendo-se o algarismo anterior), abandonando-o
simplesmente.
Ex: 95,34 (arredondar para uma casa após a vírgula)=

2 - Sempre que o algarismo a abandonar for superior a 5 (6, 7, 8, 9), arredonda-se o


algarismo anterior para maior.
Ex: 54,367 (arredondar para 2 casas após a vírgula)=

3 – Sempre que o algarismo a abandonar for exatamente 5, a convenção é fazer o


arredondamento para o par mais próximo.

3.1 – Se o algarismo anterior ao 5 for ímpar (1, 3, 5, 7 , 9) arredonda-se para maior


= arredondamento para o par mais próximo.
Ex: 9,35 (arredondar para uma casa após a vírgula) =

3.2 - Se o algarismo anterior ao 5 for par (2, 4, 6, 8) abandona-se o 5


(arredondamento para menor (mantendo-se o algarismo anterior).
Ex: 7,65 (arredondar para uma casa após a vírgula)=

3.3 – Se após o 5 houver qualquer número significativo, arredonda-se para maior.


Ex: 9,5001 (arredondar para uma casa após a vírgula) = 9,6
Ex: 28,50003 (arredondar para uma casa após a vírgula) = 28,6

Esta prática faz com que, ao longo das operações, as diminuições e acréscimos
devido aos arredondamentos tendam a se compensar.

Obs: Nos softwares de computadores (como o Excel) e calculadoras científicas, porém, não
é aplicado o critério indicado no item 3. Nesses casos, se o primeiro algarismo a ser
abandonado for o algarismo 5, o arredondamento será feito com aumento de uma unidade
ao algarismo que antecede o 5.
TIBONI, Conceição Gentil Ribeiro, 2003: 16-17

9
EXERCÍCIOS DE ARREDONDAMENTO CONFORME NBR 5891 E RES. 886/66 DO IBGE

1- 38,83134 (arredondar para 2 casas) = 23 – 53,02 (arredondar para número inteiro)=


2 – 16,8971 ( arredondar para número inteiro)= 24 – 33,5 (arredondar para número inteiro)=
3 - 16,8971 (arredondar para 3 casas)= 25 – 99,9 (arredondar para número inteiro)=
4 – 132,5 (arredondar para número inteiro)= 26 – 26,5 (arredondar para número inteiro)=
5 – 15,25 (arredondar para uma casa)= 27 – 1,008 (arredondar para número inteiro)=
6 – 27,1275 (arredondar para 3 casas )= 28 – 108,5 (arredondar para número inteiro)=
7 – 6,865476 (arredondar para 2 casas)= 29 – 128,53 (arredondar para número inteiro)=
8 – 18,758 (arredondar para o décimo mais próximo)= 30 – 739,5 (arredondar para número inteiro)=
9 – 15,449 (arredondar para 2 casas )= 31 – 53,02 (arredondar para número inteiro)=
10 – 18,05 (arredondar para uma casa)= 32 – 20,742 (arredondar para o décimo mais próximo)=
11 – 89,1750 (arredondar para 2 casas)= 33 – 205,2384 (arredondar para o décimo mais próximo)=
12 – 5,789 (arredondar para uma casa)= 34 – 5,385 (arredondar para o décimo mais próximo)=
13 – 6,601 (arredondar para número inteiro)= 35 – 39,49 (arredondar para o décimo mais próximo)=
14 – 130,055 (arredondar para número inteiro)= 36 – 45,097 (arredondar para o décimo mais próximo)=
15 – 28,65 (arredondar para uma casa )= 37 – 28,255 (arredondar para o décimo mais próximo)=
16 – 19,95 (arredondar para número inteiro)= 38 – 12,352 (arredondar para o décimo mais próximo)=
17 – 32,505 (arredondar para uma casa)= 39 – 0,7500 (arredondar para o décimo mais próximo)=
18 – 1459,3333 (arredondar para o milésimo mais próximo)= 40 – 15,545 (arredondar para o centésimo mais próximo)=
19 – 15,523 (arredondar para o décimo mais próximo)= 41 – 18,575 (arredondar para o centésimo mais próximo)=
20 – 15,5569 (arredondar para o centésimo mais próximo)= 42 – 11,550 (arredondar para o centésimo mais próximo)=
21 – 15,505 (arredondar para duas casas)= 43 – 5,445 (arredondar para o centésimo mais próximo)=
22 – 88,502 (arredondar para duas casas)= 44 – 0,546 (arredondar para o centésimo mais próximo)=

45. Uma transportadora entregou em um mês:


6,19655 toneladas de produtos eletrônicos;
15,8561 toneladas de brinquedos;
13,6455 toneladas de alimentos;
09,7450 toneladas de papel;
10,3400 toneladas de remédio;
12,2350 toneladas de tecidos.
Calcule quanto a transportadora entregou nesse mês, em toneladas:
a) sem arredondar;

b) arredondando para o centésimo mais próximo (um a um)

10
46 – Calcular a soma para as duas situações abaixo:
1º Utilizando as regras de arredondamento para uma casa após a vírgula em cada
elemento individualmente e depois somar.
2º Utilizando a regra de arredondamento somente após a soma (arredondar uma
casa após a vírgula).

9,35 + 8,65 + 3,25 + 3,15 + 2,95 + 0,75 + 6,85 + 7,85 =

11
CÁLCULO PARA DETERMINAÇÃO DO ERRO AMOSTRAL
ERRO AMOSTRAL: é a diferença entre o valor que a estatística pode acusar e o
verdadeiro valor do parâmetro que se deseja estimar.

Para a determinação do tamanho da amostra, o pesquisador precisa


especificar o erro amostral tolerável, ou seja, o quanto ele admite errar na avaliação
dos parâmetros de interesse.

Ex. Na divulgação de pesquisas eleitorais, é comum encontrar, no relatório, algo


como: a presente pesquisa tolera um erro amostral de 2%. Isto quer dizer que
quando a pesquisa aponta determinado candidato com 20% de preferência do
eleitorado, está afirmando, na verdade, que a preferência por este candidato é um
valor do intervalo de 18% a 22% (ou seja 20% ± 2%).

A especificação erro amostral tolerável deve ser feita sob um enfoque


probabilístico, pois, por maior que seja a amostra, existe sempre o risco do sorteio
gerar uma amostra com características bem diferentes da população de onde está
sendo extraída. Portanto o erro amostral não inclui distorções que decorrem do mau
planejamento ou má aplicação da pesquisa.

UMA FÓRMULA PARA O CÁLCULO DO TAMANHO MÍNIMO DA AMOSTRA

Um primeiro cálculo do tamanho da amostra pode ser feito, mesmo sem


conhecer o tamanho da população, através da seguinte expressão:

1
n0 =
E 02
onde: n0 = primeira aproximação para o tamanho da amostra
E0 = erro amostral tolerável

Conhecendo o tamanho da população, N, pode-se corrigir o cálculo anterior,


por:

N .n0
n=
N + n0

12
Exercício:
1) Sabendo-se que a população de Joaçaba é 24.066 habitantes, calcular a
amostragem necessária para realização de uma pesquisa sócio econômica com um
erro amostral de 3,5 %. (duas casas após a virgula).

Exercícios:

1) Sabendo-se que a população de Joaçaba é 24.066 habitantes, calcular a


amostragem necessária para realização de uma pesquisa sócio econômica com um
erro amostral de 5%. (duas casas após a virgula).

2) Sabendo-se que o número de eleitores de Joaçaba é 18.156, calcular a


amostragem necessária para realização de uma pesquisa de intenção de voto com
um erro amostral de 4%. (duas casas após a virgula). (dados fictícios)

3) Sabendo-se que a população da Região da AMMOC é 125.456 habitantes,


calcular a amostragem necessária para obter-se um erro amostral de 7% para
realização de uma pesquisa eleitoral. (dados fictícios)

4) Sabendo-se que a população de São Paulo é 10.434.252 habitantes, calcular a


amostragem necessária para obter-se um erro amostral de 4% para realização de
uma pesquisa eleitoral. (fonte: Atlas de desenvolvimento humano no Brasil, 2000)

5) A Rede de Hotéis Guanabara possui 2.359 funcionários, calcular o número de


funcionários que deverão ser pesquisados para realização de uma pesquisa de
clima organizacional, sendo determinado um erro amostral admissível de 3%. (dados
fictícios)

6) Sabendo-se que a população de Itapiraquara é 302.962 habitantes, calcular a


amostragem necessária para realização de uma pesquisa sócio econômica com um
erro amostral de 2%. (duas casas após a virgula). (dados fictícios)

13
7) Qual o erro amostral (em percentual) de pesquisa realizada em um Município com
89.984 habitantes, sabendo-se que foram entrevistados 645 habitantes? (dados
fictícios)

8) Qual o erro amostral (em percentual) de pesquisa realizada em uma Empresa


com 1.240 funcionários, sabendo-se que foram entrevistados 320 funcionários?
(dados fictícios)

DADOS BRUTOS
Quando se faz n observações diretas em um fenômeno coletivo ou observa-se as
respostas a uma pergunta em uma coleção de n questionários, obtém-se uma
seqüência de n valores numéricos. Tal seqüência é denominada dados brutos.
Representando por X a característica observado no fenômeno coletivo ou na
pergunta do questionário, estão x1 representa o valor da característica obtida na
primeira observação do fenômeno coletivo ou o valor da característica observado no
primeiro questionário; x2 representa o valor da característica X na Segunda
observação do fenômeno coletivo ou o valor da característica X observada no
segundo questionário e assim sucessivamente.
Desta forma, os dados brutos podem ser representados por X: x1, x2, x3, ..., xn.
Esta seqüência de valores assim obtidas apresenta-se completamente desordenada.
De modo geral, pode-se afirmar que:
Dados Brutos é uma seqüência de valores numéricos não organizados, obtidos
diretamente da observação de um fenômeno coletivo.

ROL
É o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente.

Ex: No final do ano o Hotel Primavera calculou o grau de satisfação de seus clientes
com as seguintes notas 7, 5, 9, 8, 7, 6, 9.
Neste exemplo, X representa as notas e pode ser apresentada na forma:

X: 7, 5, 9, 8, 7, 6, 9 (Dados Brutos)

Ou X: 5, 6, 7, 7, 8, 9, 9 (Rol) ou X: 9, 9, 8, 7, 7, 6, 5 (Rol)

14
EXERCÍCIOS

Construa o Rol para a seqüência de dados brutos:

1- X: 5, 6, 3, 8, 2, 7, 4

2 – Y: 2,4 ; 3,1 ; 5,3 ; 2,9 ; 4,5 ; 0,8 ; 3,6

3 – W: 3, 3, 6, 5, 5, 7, 8, 6, 6, 5

4 – Z: 125, 127, 134, 138, 147, 145, 149, 158, 161

5 – B: 2, 4, 4, 6, 8, 8, 6, 9, 12

6 – J: 9, 11, 12, 8, 10, 9, 12, 15, 16, 19

NOTAÇÃO SIGMA – Σ

n é o último elemento a ser somado


n

∑x
Lê-se: “somatório
de xi, para i Σ é a instrução para somar
variando de 1 a n”
ou “soma de xi, i
para i variando de
1 a n“ i =1 i é uma observação individual da série.
x é o nome dos termos a serem somados
O primeiro elemento dos
termos a serem somados

Muitos dos processos estatísticos (a maioria) exigem o cálculo da soma de


um conjunto de números. Usa-se a letra maiúscula grega Σ para denotar a soma.
Assim, se uma variável x tiver os valores 1, 5, 6 e 9, então Σ x= 21. Analogamente, se
as despesas y com um produto forem $8,82 em janeiro, $12,01 em fevereiro e $2,10
em março, então Σ y= $22,93

Exemplo 1 - Se os valores de x são 2, 4, 5 e 9 calcule: a) Σx; b) Σx2; c) (Σ x)2.

Escores
Cada número de x é um escore

Solução:

15
a) Σ x =

b) Σx2=

c) (Σ x)2=

Se apenas uma parte dos valores é que deve ser somada, usam-se índices
5

para indicá-los. Assim, ∑x


i =1
i significa a soma dos valores da variável x começando

com o primeiro (i=1) e terminando com o quinto (i=5): ∑x


i =1
i = x1 + x2 + x3 + x4 + x5

∑x
i =1
i significa que devemos somar n (todas) observações; costuma-se

escrever abreviadamente como Σ Xi ou Σ X.

Exemplo 2 – Utilizando os dados apresentados, calcule:


Dados:
i xi 2 4
1
2
8
2
a)
i =1
xi ∑ b)
i =2
∑x i

3 3
11

∑x
4 6
5
6
7
8
c)
i =7
xi ∑ d) i

7 9
8 4
9 5
10 4
11 1

Solução: a) ∑x
i =1
i

16
4

b) ∑x
i =2
i

11

c) ∑x
i =7
i

d) ∑x i

Propriedade Importante:
A soma de uma soma (ou diferença) de duas variáveis é igual à soma (ou diferença) das
somas individuais das duas variáveis:
n n n

∑ (x
i =1
2
i + yi ) = ∑ x
i =1
2
i + ∑y
i =1
i

n n n

∑ ( xi2 − yi ) = ∑ xi2
i =1 i =1
– ∑y
i =1
i

Por exemplo:

i x y (x-y)
1 8 5 Σ (x-y) =
2 3 2 Σx - Σy =
3 4 0
4 5 4

STEVENSON, Willian, 1981: 13-18

17
EXERCÍCIOS

1) Calcule cada uma das quantidades seguintes para os dados abaixo: (n é o


número de observações)

a) ∑Y
y
15
10 b) ∑Y 2

5
9 2
 
c)  ∑ Y 
14
20
6
 
17

2) Sendo x: 3 5 8 9 10 13 15 17
y: 2 3 7 8 9 13 14 14

Calcular:

a) ∑x
b) ∑y
c) ∑ xy
d) ∑x 2

e) ∑ (x − y )
f) ∑ (x − 1)

18
MEDIDAS DE TENDÊNCIA CENTRAL

As medidas de tendência central são usadas, para indicar um valor que tende
a tipificar, ou a representar melhor, um conjunto de números. As três medidas mais
usadas são a média, a mediana e a moda.

A MÉDIA
A média aritmética é a idéia que ocorre a maioria das pessoas quando se
fala em “média”. E como ela possui certas propriedades matemáticas convenientes,
é a mais importante das três medidas que estudaremos. Calcula-se a média
aritmética determinando-se a soma dos valores do conjunto e dividindo-se esta
soma pelo número de valores no conjunto.

Assim, a média dos valores 70,80 e 120 é:

Se um estudante fez 4 provas e obteve as notas 83, 94, 95 e 86, sua média
será:

A média de uma amostra é representada pelo símbolo X (lê-se “x barra”), e


seu cálculo pode expressar-se em notação sigma como segue:
n
x = ∑ xi ∑x
i =1 ou simplesmente x=
n
n

O processo de cálculo da média aritmética é o mesmo, quer se trate de um


conjunto de valores que traduzem representações amostrais, quer se trate de todos
os valores de uma população. Não obstante, utiliza-se o símbolo µ para a média de
uma população, e Ν para o número de itens da população.

µ=
∑x
N
A média tem certas propriedades interessantes e úteis que explicam por que
é ela a medida de tendência central mais usada:

1) a média de um conjunto de números pode ser calculada;


2) para um dados conjunto de números, a média é única;

19
3) a média é sensível a ( ou afetada por) todos os valores do conjunto. Assim se um
valor se modifica, a média também se modifica;
4) somando-se uma constante a cada valor do conjunto, a média ficará aumentada
do valor dessa constante. Assim, somando-se 4,5 a cada valor de um conjunto, a
média ficará aumentada de 4,5. Analogamente, subtraindo-se de cada valor do
conjunto uma constante, ou multiplicando-se ou dividindo-se por ela cada valor
do conjunto, a média fica reduzida dessa constante, ou multiplicada ou dividida
por ela;
5) a soma dos desvios dos números de um conjunto a contar da média é zero:
2+4+6
∑ ( xi − x) = 0 Por exemplo: A média dos números 2, 4 e 6 é 4: x = 3 = 4
subtraindo 4 de cada um dos números , obtemos:
2− =
4− =
6− =
0 → é zero

Ex1) Calcular a média aritmética:


a) X: 12, 23, 34, 11, 16, 18

b) W: 78, 89, 65, 66, 78, 92, 77, 89

c) Y: 12,4; 13,0; 11,8; 15,1; 12,1; 16,7; 10,3; 14,6; 12,0

20
EX2) Calcular a média aritmética em US$ do mês de janeiro/2004 referente aos
produtos importados pelo Estado de Santa Catarina.
OBS: Dados verdadeiros, porém de somente uma amostragem.

Ministério do Desenvolvimento
Indústria e Comércio Exterior UF42_E4
IMPORTAÇÃO BRASILEIRA 23/02/10

SANTA CATARINA
Principais Produtos Importados
DEPLA / GEREST

Ord Descrição 2004 (Jan/Jan) 2003 (Jan/Jan) Var%


US$
US$ F.O.B. Part% Kg Líquido Part% Kg Líquido 04/03
F.O.B.

1 OUTROS POLIMEROS DE ETILENO,EM FORMAS 8.987.655 9,17 11.803.421 2.052.417 2,44 3.404.749
2 OUTROS POLIETILENOS S/CARGA,D>=0.94,EM 7.362.453 7,52 9.917.745 2.831.783 3,36 4.849.750
3 4.666.821
MALTE NAO TORRADO,INTEIRO OU PARTIDO................................ 4,76 15.556.071 238.560 0,28 840.000
4 FARINHAS E "PELLETS",DA EXTRACAO DO 4.549.839 4,64 19.872.000 4.249.328 5,05 25.011.260
5 FIO TEXTURIZADO DE POLIESTERES ................................2.853.281 2,91 2.227.828 1.136.505 1,35 893.727
6 UREIA COM TEOR DE NITROGENIO>45% EM 1.707.055 1,74 9.767.496 70.312 0,08 662.524
7 OUTRAS PREPARACOES PARA ALIMENTACAO 1.696.184 1,73 1.172.550 272.363 0,32 241.020
8 MILHO EM GRAO,EXCETO PARA SEMEADURA ..............................
1.494.723 1,53 19.299.650 4.152.625 4,93 42.367.630
9 ARROZ 1.302.725 1,33 6.139.500 --- --- ---
10 GARRAFOES,GARRAFAS,FRASCOS,ARTIGOS 1.302.161 1,33 963.509 1.072.908 1,27 872.107
11 BONITOS- 1.175.800 1,20 1.490.300 --- --- ---
12 SARDINHAS,SARDINELAS,ETC.CONGELADAS, 1.117.268 1,14 2.324.004 899.085 1,07 2.477.572
13 TRIPAS DE 1.024.348 1,05 204.727 747.322 0,89 161.740
14 TEARES 967.991 0,99 33.490 --- --- ---
15 OUTROS PNEUS NOVOS PARA ONIBUS OU 966.989 0,99 589.487 --- --- ---
16 TEARES P/TECIDO DE 919.933 0,94 59.320 --- --- ---
17 901.449
OUTRAS METIONINAS ................................................................ 0,92 420.000 447.561 0,53 220.000
18 OUTRAS LUVAS DE BORRACHA 840.536 0,86 529.740 474.654 0,56 302.566
19 LAMIN.FERRO/ACO,L>=6DM,GALVAN.OUTRO 802.036 0,82 1.551.316 --- --- ---
20 OUTS.CHAPAS,FOLHAS,TIRAS,ETC.AUTO- 754.873 0,77 138.165 287.931 0,34 107.512

Média U$ .............................

21
A MÉDIA PONDERADA
Nos cálculos envolvendo média aritmética simples, todas as ocorrências têm
exatamente a mesma importância ou o mesmo peso. Dizemos então que elas têm o
mesmo peso relativo. No entanto, existem casos onde as ocorrências têm
importância relativa diferente. Nestes casos, o cálculo da média deve levar em conta
esta importância relativa ou peso relativo. Este tipo de média chama-se média
aritmética ponderada.
Ponderar é sinônimo de pesar. No cálculo da média ponderada, multiplicamos
cada valor do conjunto por seu "peso", isto é, sua importância relativa.

A fórmula para o cálculo é:


n

∑w x
i =1
i i
onde: wi é o peso da observação
n
de ordem i.
∑w
Média ponderada =
i
i =1

Exemplo: Um estudante que obtém 8,0 no primeiro exame, 9,0 no segundo, e 9,6 no
exame final, sendo os pesos estipulados pela Universidade os seguintes: para o primeiro
exame 30%, para o segundo exame 30% e para o exame final peso de 40%. Qual será a
média ponderada deste Estudante?
Exame Nota (xi) Peso(wi) (xi. wi )
nº 1
nº 2
Final
Σ= Σ=

∑ xiwi
Mp=
∑ wi

Mp=

22
Ex1) Calcular a média ponderada de um aluno da UNOESC onde obteve as
seguintes notas: G1=6,5 e G2= 7,5 sabendo-se que G1 e G2 possuem
respectivamente peso 6 e 4.

Ex2) Calcular a média ponderada de um aluno da UNOESC onde obteve as


seguintes notas: G1=8,5 e G2= 5,5 sabendo-se que G1 e G2 possuem
respectivamente peso 6 e 4.

Ex3) Na Distribuidora e importadora de equipamentos eletrônicos Savaris


Ltda é utilizado a média ponderada para distribuição final da comissão para seus
vendedores devido questões de mercados diferenciados. Sabendo-se que as
vendas realizadas na Região 01 tem peso 25%; na Região 02 tem peso 35% e na
Região 03 peso 40%. Pergunta-se: Qual a comissão final (média ponderada)
recebida pelo vendedor que comercializou na Região 01 = R$ 2.340,00; na Região
02 = R$ 1.890,00 e na Região 03 = R$ 4.780,00?

Ex4) Um estudante obteve as seguintes notas: 8, 5, 7 e 4, onde os pesos


das notas são os seguintes, respectivamente: 25; 30; 35 e 10. Calcular a média
ponderada das notas. (duas casas após a virgula).

Ex5) Um estudante obteve as seguintes notas: 8, 5, 9 e 4, onde os pesos


das notas são os seguintes, respectivamente: 25; 30; 35 e 10. Calcular a média
ponderada das notas. (duas casas após a virgula).

MÉDIA HARMÔNICA
Sejam x1, x2, x3, ... , valores de X, associados às freqüências absolutas
F1, F2, F3, ... , Fn, respectivamente.
A média harmônica de X é definida por:

n n
Mh = = n
F1 F2 F3 F Fi
+ + + ... + n
x1 x2 x3 xn

i =1 xi

onde

n
n = ∑ Fi
i =1

Em particular, se F1 = F2 = F3 = ... = Fn = 1, teremos:

n n
Mh = = n
1 1 1 1 1
+ + + ... +
x1 x2 x3 xn
∑x
i =1 i

23
Exemplo1: Calcular a média harmônica para 3, 5, 8;
Então:
Mh=

Exemplo2: Encontre a média harmônica para as séries:

Xi 2 3 4 5 6
Fi 3 4 6 5 2

n n
Mh = = n
F1 F2 F3 F Fi
+ + + ... + n
x1 x2 x3 xn

i =1 xi

Observação1: A média harmônica é particularmente recomendada para


série de valores que são inversamente proporcionais, como para o cálculo da
velocidade média, custo médio de bens comprados com uma quantia fixa.

Propriedades da média harmônica


A média harmônica é menor que a média geométrica para valores da variável
diferentes de zero.

e por extensão de raciocínio podemos escrever :.

OBS2: A média harmônica não aceita valores iguais a zero como dados de uma
série.

A igualdade só ocorrerá quando todos os valores da série forem


iguais.

OBS3: Quando os valores da variável não forem muito diferentes, verifica-se


aproximadamente a seguinte relação:

24
Demonstraremos a relação acima com os seguintes dados:

z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 }

Média aritmética = 51,3 / 5 = 10,2600

Média geométrica = 10,2587

Média harmônica = 5 / 0,4874508 = 10,2574

Comprovando a relação: 10,2600 + 10,2574 / 2 = 10,2587 = média geométrica

Média Geométrica

É a raiz n-ésima do produto de todos eles.

Média Geométrica Simples:

ou

Exemplo - Calcular a média geométrica dos seguintes conjuntos de números:

a) { 10, 60, 360 }........ no excel : =(10*60*360)^(1/3) ....R: 60

b) { 2, 2, 2 }........ no excel : =(2*2*2)^(1/3) ....R: 2

c) { 1, 4, 16, 64 }........ no excel : =(1*4*16*64)^(1/4) ....R: 8


.
Obs: Se, para uma determinada empresa, se deseja estabelecer uma relação do
tipo capital/dívida que seja independente da dívida ou do capital das diferentes
empresas envolvidas, é recomendável o uso da média geométrica. Se o que se
deseja saber é a relação capital/dívida de um certo número de empresas, após a
consolidação, a cifra correta será obtida através da média aritmética.

25
MÉDIA QUADRÁTICA
É a raiz quadrada da média aritmética dos quadrados

Média Quadrática Simples: (para dados não agrupados)

Exemplo - Calcular a média quadrática simples do seguinte conjunto de números:


a = { 2 , 3 , 4 , 5 } ....Resp: 3,67
.

A média quadrática é largamente utilizada em Estatística, principalmente quando se retende


calcular a média de desvios ( x - X .) , em vez de a média dos valores originais.
Neste caso, a média quadrática é denominada desvio-padrão, que é uma importante
medida de dispersão.

A MEDIANA
Uma segunda medida do meio de um conjunto de números é a mediana.
Sua característica principal é dividir um conjunto ordenado de dados em dois grupos
iguais; a metade terá valores inferiores à mediana, a outra metade terá valores
superiores à mediana. Para calcular a mediana, é necessário primeiro ordenar os
valores (comumente) do mais baixo ao mais alto. Em seguida, conta-se até a
metade dos valores para achar a mediana.

Por exemplo: a mediana do conjunto 5, 6, 8 é 6→ 6 está no meio.

(n + 1)
Em geral, a mediana ocupa a posição .
2

(3 + 1)
Logo, para três números, a posição = 2 , ou seja, a segunda posição.
2

Outro exemplo: Determinar a mediana dos valores 7, 8, 9, 10. De acordo com


nossa fórmula, a posição da mediana ( 4 + 1) ⁄ 2 = 2,5; que está a meio caminho
dos dois valores médios, ou seja, 8,5 neste caso, este valor deixa dois valores
abaixo e dois acima.
O processo para determinar a mediana é:

O processo para determinar a mediana é:

1) ordenar os valores (ROL);


2) verificar se há um número ímpar ou par de valores;
3) para um número ímpar de valores, a mediana é o valor do meio. Para um número par
de valores, a mediana é a média aritmética dos dois valores do meio. 26
Outros exemplos:
Par Mediana

a) 2, 3, 3, 4

b) 1; 18; 19, 20

c) 5,1 ; 6,5 ; 8,1 ; 9,1; 10,1 ; 15,5

d) 5, 6, 7, 4, 6, 8, 9, 7, 4, 5, 8, 9, 3, 6

e) 100, 121, 118, 120, 115, 116, 118, 115

Ímpar Mediana

a) 1 ; 1 ; 3 ; 3; 4 ; 7; 8

b) 9 ; 40; 80; 81; 100

c) 3,6; 9,2; 10,1; 11,8; 12,8

d) 6, 7, 5, 6, 8, 7, 9

e) 1, 3, 2, 3, 1, 4, 3, 2, 5, 3, 5, 4, 6

SEPARATRIZES
Além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas
relativamente à sua característica de separar a série em duas partes que
apresentam o mesmo numero de valores.

QUARTIS

A mediana de um conjunto de números é maior que uma metade dos valores e menor que a
outra metade.
Uma medida estreitamente relacionada com a mediana é o quartil. Os quartis
dividem conjuntos ordenados em 4 partes iguais: 25% dos valores serão inferiores ao 1º
quartil (Q1), 50% serão inferiores ao segundo quartil ( Q2= mediana), 75% serão inferiores
ao terceiro quartil (Q3), e 25% serão superiores ao terceiro quartil.

27
Exemplo: Determine, por inspeção, os quartis dos seguintes conjuntos de dados:
a) 1 2 3 4 b) 2 3 5 8 9 12 13 15

Q1 Q2 Q3
Q1 Q2 Q3

Costuma-se arrendodar quando um quartil não é um número inteiro.

Quartis em dados não agrupados


O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis.

Na realidade serão calculadas “3 medianas” em uma mesma série.

Exemplo 1: Calcule os Quartis da série { 5, 2, 6, 9, 10, 13, 15}

O primeiro passo a ser dado é definir o ROL (ordenação) crescente ou decrescente


dos valores:

{2, 5, 6, 9, 10, 13, 15}

O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md= 9
que será igual a Q2=9.

Temos agora {2,5,6} e {10,13,15} como sendo os dois grupos de valores iguais
proporcionados pela mediana (quartil 2). Para o cálculo do quartil 1 e 3 basta calcular as
medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2).

Logo em {2,5,6} a mediana é = 5 = Q1=5. Ou seja: será o quartil 1.


Em {10,13,15} a mediana é = 13 = Q3=13. Ou seja: será o quartil 3.

Exemplo 2: Calcule os quartis da série: {1,1,2,3,5,5,6,7,9,9,10,13}

A série já está ordenada, então calcularemos o Q2 = Md = (5+6) / 2 = 5,5

28
O quartil 1 será a mediana da série à esquerda de Md: {1,1,2,3,5,5}

Q1 = (2+3)/2 = 2,5

O quartil 3 será a mediana da série à direita de Md: {6,7,9,9,10,13}

Q3 = (9+9)/2 = 9

STEVENSON, Willian, 1981: 19-23

Exercícios:
Calcular os Quartis: Q1, Q2 e Q3 para as séries abaixo:

a) {3, 4, 6, 7, 4, 5, 6 }
b) {12, 14, 16, 14, 15, 18, 17, 13}
c) {3, 8, 9, 4, 6, 7, 2, 9, 10, 12, 11}
d) {103, 98, 99, 104, 86, 87, 102, 89, 110, 112, 91}
e) {8, 4, 9, 4, 6, 9, 2, 9, 10, 12, 11, 12, 16, 7, 17, 11, 15}
f) {31, 45, 33, 56, 29, 45}

COMPARAÇÃO ENTRE MÉDIA E MEDIANA


A escolha da média, ou da mediana, como mediana de tendência central de
um conjunto, depende de diversos fatores. A média é sensível (ou influenciada por)
cada valor do conjunto, inclusive os extremos. Por outro lado, a mediana é
relativamente insensível aos valores extremos.

mediana media

Observe que a média é afetada pelos valores extremos, enquanto a mediana


não é. Assim, os dados sobre renda pessoal, ou valor de casas residenciais têm na
mediana uma medida descritiva mais adequada: isto porque bastam alguns valores
muito grandes para inflacionar a média aritmética.

De modo geral a média possui certas propriedades que a tornam atraente.


Além disso, a ordenação dos dados para determinar a mediana pode ser enfadonha
e o cálculo da mediana não é possível fazer com calculadora.

29
A MODA
A moda é o valor que ocorre com maior freqüência em um conjunto:

Exemplo: Dados nos números: 10, 10, 8, 6, 10: há três dez; portanto, dez é
a moda. A moda funciona como medida descritiva quando se trata de contar dados.

Comparada com a média e a mediana, a moda é a menos útil das medidas


para problemas estatísticos porque não se presta a análise matemática ao contrário
do que ocorre com as outras duas medidas.

A moda indica o valor “típico” em termos da maior ocorrência.

A utilidade da moda se acentua quando um ou dois valores ocorrem com


muito maior freqüência que outros. Inversamente, quando todos ou quase todos os
valores ocorrem aproximadamente com a mesma freqüência, a moda nada
acrescenta em termos de descrição dos dados.

A moda é o valor que ocorre com maior freqüência.

COMPARAÇÃO ENTRE MÉDIA, MEDIANA E MODA


Definição Vantagens Limitações
Média 1. Reflete cada valor. 1. É influenciada por
∑x i 2. Possui valores externos.
x= propriedades
n matemáticas
atraentes.
Mediana Metade dos valores 1. Menos sensível a 1. Difícil de determinar
são maiores, metade valores extremos do para grande
menores. que a média. quantidade de
dados.
Moda Valor mais freqüente. 1. Valor ”típico”: maior 1. Não se presta à
quantidade de análise matemática.
valores encontrados 2. Pode ser moda
neste ponto. para certo conjunto
de dados.

30
EXERCÍCIOS
1) Determine a média e a mediana de cada conjunto:

a) 4, 8, 7, 3, 5, 6→

b) 2, 1, 7, 6 →

c) 0,010; 0,020; 0,030; 0,020; 0,015 →

d) 309; 81; 452; 530; 70; 55; 198; 266 →

2) Inspecionam-se quinze rádios antes da remessa. Os números de defeitos por


unidade são: 1; 0; 3; 4; 2; 1; 0; 3; 1; 2; 0; 1; 1; 0; 1
Qual o valor da média, mediana, moda e o 3º Quartil?

31
MEDIDAS DE DISPERSÃO

São necessários dois tipos de medidas para descrever adequadamente um


conjunto de dados. Além da informação quanto ao “meio” de um conjunto de números, é
conveniente dispormos também de um método que nos permita exprimir a dispersão. As
medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros,
ou separados. Esta situação é ilustrada esquematicamente na figura abaixo:

a)   

pequena dispersão

b)
       
grande dispersão

A dispersão mede quão próximos, uns dos outros, estão os valores de um grupo.

Consideraremos quatro medidas de dispersão:

• o intervalo;
• o desvio médio;
• a variância;
• o desvio padrão.

Todas elas, exceto o (intervalo) têm na média o ponto de referência. Em cada caso,
o valor zero indica ausência de dispersão; a dispersão aumenta à proporção que aumenta o
valor da medida (intervalo, variância, etc.).

32
O INTERVALO
O intervalo de um grupo de números é, de modo geral, a medida mais simples de
calcular e de entender.

Focaliza o maior e o menor valor no conjunto (ou seja, os valores externos).


O intervalo pode se expresso de duas maneiras:
1ª) a diferença entre o maior e o menor valor;
2ª) o maior e menor valor no grupo.

Consideramos os três valores: 1; 10 e 25. A diferença entre o maior valor e o


menor é 25 – 1 = 24. Alternativamente, pode-se dizer que o intervalo de valores vai de 1 a
25. Este último método tende a ser mais informativo. Por exemplo: o mero conhecimento de
que o intervalo de um conjunto de números é 44 não nos diz nada a respeito dos números;
mas dizer que o intervalo vai de 300 a 344 já nos dá uma informação adicional sobre a
grandeza dos números.

O intervalo pode ser expresso pela diferença entre o maior e o menor número
em um grupo, ou pela identificação desses dois números.

Alguns exemplos:

Intervalo

Números Diferença Do menor ao maior


1; 5; 7 e 13 13 – 1 = 12 de 1 a 13
14; 3; 17; 4; 8; 73; 36 e 48 73 – 3 = 70 de 3 a 73
3,2; 4,7; 5,6; 2,1; 1,9; 10,3 10,3 – 1,9 = 8,4 de 1,9 a 10,3

A vantagem de utilizar o intervalo como medida de dispersão reside no fato de o


intervalo ser relativamente fácil de calcular mesmo para um grande conjunto de números.

A maior limitação do intervalo é o fato de ele só levar em conta os dois valores


extremos de um conjunto, nada informando quanto aos outros valores. Por exemplo:

33
1º)          

três grupos
2º)
        diferentes de
números, todos
com o mesmo
3º)   
intervalo

Intervalo

No 1º conjunto, os valores se distribuem uniformemente, e o intervalo é uma boa


medida.

No 2º, os números se apresentam mais densamente agrupados, muito embora o


intervalo ainda proporcione uma medida aproximada de dispersão.
No 3º, o intervalo é facilmente influenciado por alguns valores externos, sendo por
tanto enganoso quanto à indicação da dispersão. Por isso, a utilidade do intervalo é
bastante limitada.
STEVENSON, Willian, 1981: 24-25

34
MEDIDAS DE DISPERSÃO QUE TÊM A MÉDIA COMO
PONTO DE REFERÊNCIA

Em razão de suas propriedades matemáticas, quase sempre se calcula a média de


um conjunto de dados. Por isso, existem várias medidas de dispersão que têm a média
como ponto de referência. Todas elas requerem o cálculo do desvio, ou diferença entre cada

( )
valor e a média, x i − x .

Estudaremos três dessas medidas.

A primeira focaliza o desvio absoluto a contar da média, enquanto que as outras


duas se concentram nos quadrados dos desvios a contar da média. A discussão se
concentrará principalmente em dados amostrais, ao invés de em dados de populações
inteiras, enfatizando assim o fato de que utilizaremos estatísticas amostrais para aproximar
os valores do parâmetros das populações.

1º) Desvio Médio Absoluto (DMA): Mede o desvio médio dos valores em relação
à média do grupo, ignorando o sinal do desvio. Calcula-se subtraindo a média de cada valor
do grupo e desprezando o sinal (+ ou −) do desvio, e tomando a média em seguida. Ao
calcular o desvio médio, é necessário levar em conta o fato de que a soma dos desvios
positivos e negativos, a contar da média, será sempre (por definição) igual a zero. A
conversão das diferenças a valores absolutos (todos os valores são considerados como
desvios positivos) antes de se proceder à soma resolve o problema.

Calcula-se então o desvio médio absoluto pela fórmula seguinte:

DMA =
∑ x i −x onde: n é o número de observações no
conjunto.

35
Exemplo 1: Determine o desvio médio, para o seguinte conjunto de números:
2; 4; 6; 8; 10
Solução: Determinação da média

x=

Em seguida, determinaremos as diferenças entre a média e cada valor:

xi x xi – x xi − x

Σ= Σ=

∑x i −x
=
Desvio Médio:
n

O desvio médio absoluto de um conjunto de números é a média dos


desvios dos valores a contar da média, ignorando-se o sinal de
diferença.

O DMA tem aplicação no controle de inventários.

36
A VARIÂNCIA
Calcula-se a variância de uma amostra quase da mesma forma que o desvio médio,
com duas pequenas exceções:

1º) os desvios são elevados ao quadrado antes da soma;


−1 em lugar de n, porque isso dá melhor estimativa
2º) toma-se a média dividindo-se por n−
da variância populacional.

∑ (x )
2
i −x
Calcula-se a variância para uma amostra pela fórmula: Sx 2 =
n −1

∑ (x ) 2
−x
=
i
Calcula-se a variância para uma população pela fórmula: Sx 2
n

Se um conjunto de números constitui uma população, ou se a finalidade de somar


os dados é apenas descrevê-los, e não fazer inferências sobre uma população, então deve-
se usar n em lugar de (n − 1) no denominador.
Exemplo: Calcule a variância da amostra 2; 7; 6; 9; 11

Solução: a média ( x ) é

xi x (xi – x ) (x i −x )
2

Σ= Σ=

37
∑ (x )
2
−x
= =
i
Sx 2
n −1

EM RESUMO
Os estágios do cálculo da variância são:
1º) Calcular a média;
2º) Subtrair a média a cada valor do conjunto;
3º) Elevar ao quadrado cada desvio;
4º) Somar os quadrados dos desvios;
5º) Dividir a soma por (n− 1) se se trata de dados amostrais, ou simplesmente por n par
somar o conjunto ou se os dados representam todos os valores de uma população.

A variância de uma amostra é a média dos quadrados dos desvios dos valores a
contar da média, calculada usando-se n − 1 em lugar de n.

Uma fórmula alternativa para o cálculo da variância é:

 (∑ x i )2 
∑ xi −  n 
2

 
=
2
Sx
n −1

Esta fórmula é mais fácil de calcular porque não exige o cálculo da média e também
porque não há necessidade de determinar cada um dos desvios.
Usando os dados anteriores podemos observar a variância calculada por esta última fórmula
é idêntica à obtida anteriormente.

38
xi xi2
2
7
6
9
11

∑x i = 35 ∑x 2
i
=

Sx 2 =

DESVIO PADRÃO

O desvio Padrão depende da soma dos quadrados dos desvios dos valores da variável.
Portanto, quanto menor o Desvio Padrão mais os valores da variável se aproximam de sua
média. Dessa maneira:
• Se o desvio de um valor da variável for menor que o desvio padrão da variável,
então esse valor estará mais próximo da média do que um outro valor com desvio
maior.
• Quanto mais os valores da variável se afastar de sua média maior serão os desvios
e, conseqüentemente, maior será o desvio padrão e mais aberta será a distribuição
de freqüência da variável.
• Se duas variáveis tiverem a mesma média e desvios padrões diferentes, a
distribuição da variável com maior desvio padrão será mais aberta que a da variável
com menor desvio padrão.
LAPPONI, Juan Carlos, 2000: 104

O Desvio Padrão é a medida mais usada na comparação de diferenças entre conjuntos de


dados, por ter grande precisão. O Desvio Padrão determina a dispersão dos valores em
relação à média.

39
O desvio padrão é simplesmente a raiz quadrada positiva da variância.
Assim, se a variância é 81, o desvio padrão é 9; se a variância é 10, o desvio padrão
é 10 = 3,16 .

∑ (x )
2
i −x
Fórmula: S= para amostra
n −1

∑ (x − x )
2

Fórmula: S= i
para população
n

 (∑ x i )2 
∑ x −  n 
2
i
 
Fórmula alternativa = S= n −1
(como anteriormente para calculo da variância, a substituição de (n −1) por n produz
as fórmulas do desvio padrão da população).

Exemplo: Calcule o desvio padrão da amostra de peso (massa) de 8 pacotes de erva mate
retirados durante uma inspeção de qualidade: 501g; 500g; 499,5g; 500,5g; 500g.

x=
Solução: a média ( x ) é

40
xi x (xi – x ) (x i −x )
2

Σ= Σ=

∑ (x )
2
i −x
S= =
n −1

O desvio padrão é uma das medidas mais comumente usadas para distribuições e
desempenha papel relevante em toda ESTATÍSTICA. A unidade do desvio padrão é a
mesma da média. Por exemplo, se a média é em reais, o desvio padrão também se
exprime em quadrados de unidades (por exemplo: reais2, m2, cm2, etc.).
STEVENSON, Willian, 1981: 24-30

41
MEDIDAS DE DISPERSÃO RELATIVA
COEFICIENTE DE VARIAÇÃO (CV)
CV: Coeficiente de Variação de Pearson
Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um
desvio padrão de 2 unidades pode ser considerado pequeno para uma série de
valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não
pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados
limita o seu emprego quando desejamos comparar duas ou mais séries de valores,
relativamente à sua dispersão ou variabilidade, quando expressas em unidades
diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou
variabilidade dos dados em termos relativos a seu valor médio, medida essa
denominada de CV: Coeficiente de Variação de Pearson (é a razão entre o desvio
padão e a média referentes a dados de uma mesma série).
A fórmula é:

( o resultado neste caso é expresso em percentual, entretanto pode ser expresso


também através de um fator decimal, desprezando assim o valor 100 da fórmula).

Exemplo:
Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de
indivíduos:

Qual das medidas (Estatura ou Peso) possui maior homogeneidade ?


Resposta: Teremos que calcular o CV da Estatura e o CV do Peso. O resultado
menor será o de maior homogeneidade ( menor dispersão ou variabilidade).

CV estatura = ( 5 / 175 ) x 100 = 2,85 %

CV peso = ( 2 / 68 ) x 100 = 2,94 %.


Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão
que os pesos.

42
A partir do coeficiente de variação pode-se avaliar a homogeneidade do conjunto de
dados e, conseqüentemente, se a média é uma boa medida para representar estes
dados. É utilizado, também, para comparar conjuntos com unidades de medidas
distintas.
Uma desvantagem do coeficiente de variação é que ele deixa de ser útil quando a
média está próxima de zero. Uma média muito próxima de zero pode inflacionar o
CV.
Um coeficiente de variação superior a 50% sugere alta dispersão o que indica
heterogeneidade dos dados. Quanto maior for este valor, menos representativa
será a média. Neste caso, opta-se pela mediana ou moda, não existindo uma regra
prática para a escolha de uma destas medidas. O pesquisador, com sua experiência,
é que deverá decidir por uma ou outra. Por outro lado, quanto mais próximo de zero,
mais homogêneo é o conjunto de dados e mais representativa será sua média.

Exercícios:

43
EXERCÍCIOS COMPLEMENTARES
1) Responda:

a) O desvio padrão pode ser zero? Explique. Pode ser negativo? Explique.

b) O desvio médio absoluto pode ser negativo? Zero? Explique.

2)Calcule a média e o desvio padrão das vendas diárias:


$ 8.100; $ 9.000; $ 4.580; $ 5.600; $ 7.680; $ 4.800; $ 10.640

3)Calcular a média harmônica para os seguintes valores:


a) 3, 5, 7, 3, 5, 4, 8, 9, 3, 2, 7
b) 23, 24, 22, 30, 27, 24, 26, 26

4) Determine a média e a mediana para cada um dos conjuntos de dados:

a) 7; 9; 2; 1; 5; 4,5; 7.5; 6.2

b) 1; 2; 10; 7; 7; 9; 8; 5; 2; 11

c) 30; 2; 79; 50; 38; 17; 9

d) 0,11; 0,032; 0,027; 0,035; 0,042

5) Calcule a média e a variância para o conjunto de dados abaixo, supondo que eles
representem:
a) uma amostra;
b) a população.

83; 92; 100; 57; 85; 88; 84; 82; 94; 93; 91; 95

44
APOSTILA

ESTATÍSTICA
APLICADA

PARTE I I

45
1. DISTRIBUIÇÃO DE FREQÜENCIA
INTRODUÇÃO:
Um dos objetivos da Estatística é obter uma significativa redução na quantidade de dados
com os quais opera-se diretamente (amostragem). Isto pode ser conseguido modificando-se
a forma de apresentação destes dados. Quando se lida com poucos valores numéricos, o
trabalho estatístico fica sensivelmente reduzido. No entanto, normalmente trabalha-se com
grande quantidade de dados. Para tal, utiliza-se a DISTRIBUIÇÃO DE FREQÜENCIA.
Uma distribuição de freqüência é uma tabela na qual os possíveis valores de uma variável
se encontram agrupados, na qual registra-se os valores observados.
Os valores observados podem ser registrados, numa distribuição de freqüência, em classes
ou não.
As classes são pequenos intervalos, tais que, quando reunidos, abrangem todo o conjunto
de dados.

INTERPRETAÇÃO DE INTERVALO DE CLASSE:


Existem várias formas de apresentarmos o intervalo de classes: iguais ou diferentes entre si.
Porém, sempre que possível, devemos optar por intervalos iguais, o que facilitará os
cálculos posteriores. Mas mesmo com intervalos iguais, as distribuições poderão
apresentar-se da seguinte forma:

0  10 Compreende todos os valores entre 0 e 10, excluindo os extremos.


0 10 Compreende todos os valores entre 0 e 10, incluindo os extremos.
0 10 Compreende todos os valores entre 0 e 10, incluindo o 10 e excluindo o 0.
0 10 Compreende todos os valores entre 0 e 10, incluindo o 0 e excluindo o 10.

DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS AGRUPADOS OU


DADOS TABULADOS EM CLASSES
È uma representação tabular de um conjunto de valores em que coloca-se na primeira
coluna, em ordem crescente, os valores ordenados em classes da série e, na segunda
coluna os valores das freqüências absolutas simples correspondentes, ou seja, é o arranjo
em classes dos dados estatísticos.
Embora o processo de agrupamento inutiliza alguns detalhes originais dos dados,
consegue-se vantagens importantes no aspecto geral obtido, torna mais clara e evidente a
relação essencial dos dados.

46
CONSTRUÇÃO
A construção da distribuição de freqüência para dados agrupados ou tabulados em classe
requer o conhecimento de alguns conceitos.

AMPLITUDE TOTAL DO ROL (At) OU OSCILAÇÕES

Considerando-se X a variável em estudo, então Xmax é a variável de maior valos do rol e Xmin
é a variável de menor valor do rol.
Denomina-se amplitude total dos dados (At) a diferença entre o maior e o menor valor do rol,
ou seja, é a diferença entre os valores extremos do rol.
Matematicamente temos:
At = X max - X min

FREQUENCIA TOTAL (ft)

Representa a soma de todos os elementos observados nas freqüências simples, ou


seja, é a quantidade de valores observados. Pode-se representa-la pela expressão
matemática:

n
ft = ∑ fi
i =1
= N

QUANTIDADE DE CLASSES OU NÚMERO DE CLASSES (k)

Não existem regras que permitam determinar o número exato de classes. Contudo o
número de classes a ser utilizado depende muito da experiência do pesquisador e das
questões que ele pretende responder.
Para a elaboração de tabela de Distribuição de Freqüência para dados agrupados ou
tabulados em classes Sturges sugere para calcular a quantidade de classes (número de
classes) a expressão matemática:

K=1 + 3,3 log.N

OBSERVAÇÃO
I. Se o número de classes for muito pequeno, características importantes da
distribuição de freqüência podem ficar ocultas ou serem apresentadas de forma bastante
resumida.

47
II. Por outro lado, quando se utiliza muitas classes (número de classes for grande),
o trabalho (resultado) pode ficar muito extenso, não realçando aspectos relevantes da
distribuição de freqüência.

III. “k” poderá ser um número aproximado, porém inteiro, por isso, o
arredondamento deverá seguir as regras apresentadas no MODULO 01.

LIMITES DE CLASSE

Os números (valores) extremos de uma classe são denominados limites de classe;


o número da esquerda, de menor valor, é o limite inferior (li) da classe e o número da direita,
de maior valor, é o limite superior (Li) da classe.

OBSERVAÇÃO

I. Limites reais ou limites verdadeiros da classe ou as fronteiras de classes ou


limites exatos, são os pontos ao longo da escala de medida que servem para
separar classes adjacentes.
II. Normalmente as classes são trabalhadas com intervalos de classes fechado à
esquerda e aberto a direita ou intervalos semi-abertos à direita ( ).
III. Os limites inferior ou superior, no intervalo de classe depende do número de
dígitos significativos que se está trabalhando.

AMPLITUDE DO INTERVALO DE CLASSE (h)

Na elaboração de uma Tabela de Distribuição de freqüência para dados agrupados


ou tabulados em classe o critério para determinação da Amplitude do Intervalo de classe,
varia de acordo com o número de classes que se deseja, contudo, quanto maior for a
amplitude da classe, menos precisão se obterá dos fenômenos analisados. Assim, para que
todas as classes tenham o mesmo tamanho, elas deverão ter a mesma amplitude (mesmo
intervalo), desta forma a expressão matemática abaixo prevê essa amplitude:

At
h=
K

OBSERVAÇÃO
I. A amplitude do intervalo de classe (h) depende do número de dígitos
significativos que se está trabalhando.
II. Se houver necessidade de arredondamento da amplitude, este deverá ser feito
(sempre) à maior.

A amplitude do intervalo de classe é definida pela diferença entre os


limites superior e inferior dessa classe. É referida também como a amplitude, o
tamanho ou o comprimento da classe e, simbolicamente representada por h.
Matematicamente:

48
h = Li - li

PONTOS MÉDIOS OU CENTRAIS DE UMA CLASSE (Pmi)

È o ponto intermediário intervalo de classe representa o valor típico da classe, que,


muitas vezes, poderá ser usado para aproximar os demais valores da classe.
É comum, numa distribuição de freqüência, colocar os pontos médios das classes
numa coluna, isto é, para cada classe calcula-se o ponto médio dos seus limites.
O ponto médio (Pm i) é calculado pela soma do limite inferior (li ) de uma classe com
a metade da amplitude do intervalo de classe (h), ou ainda, é a média aritmética simples
entre o limite superior (Li ) e o inferior (li) de uma classe. Assim, as seguintes expressões
matemáticas, podem ser usadas para o cálculo do ponto médio de classes:

Li + li
Pmi =
2

FREQUENCIA ABSOLUTA SIMPLES (fi )

É definida como sendo o número de vezes ou de informações em cada classe


contém, ou seja, é a quantidade de valores que pertencem a uma classe.

REGRAS GERAIS PARA ELABORAR UMA DISTRIBUIÇÃO DE


FREQUENCIA PARA DADOS AGRUPADOS OU TABULADOS EM CLASSES

ORGANIZAÇÃO DA TABELA DE DISTRIBUIÇÃO DE FREQUENCIA

1º . Determinar o maior e o menor número dos dados isolados, e então, calcular a


amplitude total do rol (At).
At = Xmax − Xmin

2º. Determinar o número de valores observados = freqüência total (ft = N).

∑ fi = f
i =1
t =N

3º. Determinar o número de classes = quantidade de classes (k).

k= 1 + 3,3 log.N

49
At
4º. Determinar a amplitude (h) h=
k
5º Determinar os intervalos de classe.

6º Determina-se o número de observações que correspondem a cada classe, ou


seja, determinar a freqüência simples (fi ).

7º. Determinar os pontos médios de cada classe.

8º Elaborar a tabela de distribuição de freqüência .

OBSERVAÇÕES

I. Sempre que possível, utilizar, em tabela de freqüências, classes com amplitude


(h) iguais, o que permite uma comparação perfeita das freqüências de classes.
II. O menor valor do rol (Xmin) deverá ser igual (ou menor) que o limite inferior (li) da
1ª classe.
III. O maior valor do rol (Xmax ) deverá ser menor que o limite superior (Li) da última
classe.

EXERCÍCIO RESOLVIDO:

Em 18 Estabelecimentos Comerciais de Joaçaba, verificou-se os valores abaixo


para um determinado produto de consumo, em outubro de 2005. Fazer a distribuição de
freqüência para os dados abaixo (dados fictícios).

Tabela 1. Valores de um produto de consumo, verificando em 18


Estabelecimentos Comerciais, em outubro de 2005.

16,1 21,5 17,3 19,1 21,6 19,7


18,7 17,9 20,9 17,4 15,5 20,7
17,8 19,8 20,4 19,7 19,8 22,1

INFORMAÇÕES PARA RESOLUÇÃO:Para fazer a distribuição de freqüência para


dados agrupados ou tabulados em classes, sugere-se a seqüência de passos apresentados
anteriormente.

1º . Determinar o maior e o menor número dos dados isolados, e então, calcular a


amplitude total do rol (At).
At = Xmax − Xmin

50
2º. Determinar o número de valores observados = freqüência total (ft = N).

∑ fi = f
i =1
t =N

N=

3º. Determinar o número de classes = quantidade de classes (k).

k= 1 + 3,3 log.N

Conforme observação III = k = 5

At
4º. Determinar a amplitude (h) h=
k

5º Determinar os intervalos de classe.

6º Determina-se o número de observações que correspondem a cada classe, ou


seja, determinar a freqüência simples (fi ).

7º. Determinar os pontos médios de cada classe.

8º Elaborar a tabela de distribuição de freqüência .

51
Valores de um produto de consumo, verificado em 18 Estabelecimentos
Comerciais, em outubro de 2001.

Preços (R$) Freqüência (fi) Amplitude (h) Ponto Médio (Pmi)

Total
∑ fi =

HISTOGRAMA

52
2. DISTRIBUIÇÕES CONTÍNUAS E O
MODELO NORMAL1
PEDRO ALBERTO BARBETTA

Neste capítulo, estudaremos o modelo de probabilidades mais conhecido da


Estatística: a chamada distribuição normal de probabilidades. Para podermos
estudar esta distribuição, vamos, inicialmente, estender o conceito de
equiprobabilidade para variáveis aleatórias contínuas.

Dizemos que uma variável aleatória é contínua quando não conseguimos


enumerar seus possíveis resultados, por estes formarem um conjunto infinito, em um
dado intervalo de números reais. Por exemplo, a altura de um indivíduo, tomando ao
acaso, é uma variável aleatória contínua, pois não é possível enumerar todos os
valores possíveis de altura de indivíduos, mas podemos dizer, por exemplo, que o
resultado será um número do intervalo de zero a dois metros e meio, o qual contém
infinitos números.

Chama-se Distribuição Normal a distribuição de probabilidades definida pela


função de densidade de probabilidades:

F(x)=

Porém esta função fica totalmente definida e simplificada pelos parâmetros µ


(média aritmética de uma população) e σ ou “S“ (desvio padrão) com auxilio de
valores padronizados (tabela).

1
O texto que compõe o capítulo 5 foi obtido do livro ESTATÍSTICA APLICADA ÀS CIÊNCIAS
SOCIAIS – oitavo capítulo.

53
Exemplo 1: Selecionar, aleatoriamente, de uma certa universidade, um
estudante do sexo masculino. Seja X o valor de sua altura, em centímetros.

Temos, novamente, uma variável aleatória contínua, mas, desta vez, não é
razoável atribuir a mesma probabilidade para diferentes faixas de altura. Por
exemplo, é intuitivo que a probabilidade do estudante acusar altura no intervalo de
165 a 175 cm é bem maior do que no intervalo de 190 a 200 cm, mesmo que ambos
os intervalos tenham a mesma amplitude.

A Figura 2(a) sugere um modelo mais adequado para a presente situação.


Por este modelo, conhecido como distribuição normal de probabilidades, existe um
valor típico, ou valor médio, que no caso de alturas de homens adultos, deve estar
em torno de 170 cm. Intervalos em torno deste valor médio têm altas probabilidades
de ocorrência, mas as probabilidades diminuem na medida em que nos afastamos
deste valor médio, indiferentemente se do lado esquerdo (para valores menores) ou
do lado direito (para valores maiores). A Figura 2(b) identifica a probabilidade do
evento o estudante sorteado ter mais de 180 cm.

130 140 150 160 170 180 190 200 210 x


altura (em cm)

Fig. 2 Um modelo para a altura de um aluno universitário.

54
2.1. DISTRIBUIÇÕES NORMAIS
A distribuição normal é caracterizada por uma função, cujo gráfico descreve
uma curva em forma de sino. Esta distribuição depende de dois parâmetros, a saber:
µ (média) – este parâmetro especifica a posição central da distribuição de
probabilidades.
σ (desvio padrão) – este parâmetro especifica a variabilidade da distribuição
de probabilidades2.

A Fig. 3 apresenta a forma gráfica de um modelo normal genérico, com


parâmetros µ e σ. A curva é perfeitamente simétrica em torno da média µ e,
independentemente dos valores de µ e σ, a área total entre a curva e o eixo das
abscissas é igual a 1 (um), permitindo identificar probabilidades de eventos como
áreas sob a curva, como já ilustramos na Fig. 2(b).

Fig. 3 Gráfico da distribuição normal com parâmetros µ e σ

A Fig. 4 mostra diferentes modelos normais, em termos dos parâmetros µ e σ.


Estes modelos podem representar, por exemplo, a distribuição de alturas de criança
em diferentes populações.

Fig. 4 Distribuições normais em função dos parâmetros µ e σ.

2
Os parâmetros µ e σ do modelo normal têm analogia com as estatísticas X e S, usadas para medir,
respectivamente, a posição central e dispersão de uma distribuição de freqüências.

55
As duas distribuições da Fig. 4(a) podem representar, por exemplo, (1) alturas
de estudantes da primeira série do primeiro grau e (2) da oitava série. Podemos
admitir que ambas as distribuições apresentam, aproximadamente, a mesma
dispersão (σ1 ≈ σ2), porém, na oitava série os estudantes devem ter, em média,
alturas maiores do que os estudantes da primeira série ( µ1 > µ2) . Por outro lado, as
distribuições da Fig. 4(b) podem representar (3) alturas de estudantes da quarta
série e (4) alturas de estudantes de todas as séries. É razoável supor, nesse caso,
que a média das alturas dos dois grupos de estudantes devem ser
aproximadamente iguais (µ3 ≈ µ4),mas a dispersão deve ser maior no grupo formado
por todas as séries.

VALORES PADRONIZADOS E A DISTRIBUIÇÃO NORMAL PADRÃO


Com o objetivo de facilitar a obtenção de determinadas áreas sob uma curva
normal, podemos fazer uma transformação na variável, levando-a para uma
distribuição normal com média 0 (zero) e desvio padrão 1 (um), também conhecida
com distribuição normal padrão.

Para que um dado valor x, de uma distribuição normal com média µ e desvio
padrão σ, se transforme em um valor z da distribuição normal padrão, basta fazer a
seguinte operação:

x−µ
z=
σ
O valor z é conhecido como valor padronizado. Ele fornece uma medida
relativa do valor x, em termos da distribuição da variável aleatória em estudo, como
ilustramos no seguinte exemplo.

56
Exemplo 2: Suponha que em uma certa universidade, a altura dos
estudantes do sexo masculino tenha distribuição normal com média µ= 170cm e
desvio padrão σ= 10 cm. A Fig. 5 mostra a relação entre a escala dos valores das
alturas de universitários masculinos (x) e seus correspondentes valores
padronizados (z). Por exemplo, para um estudante de altura x= 180cm, temos o
valor padronizado z= (180 – 170)/10 = 1, ou seja, este estudante encontra-se
a 1 (um) desvio padrão acima da altura média dos estudantes do sexo masculino da
universidade.

Fig. 5 Transformação de valores de alturas de universitários (x) em valores padronizados (z).

Seja X a altura, em centímetro, de um estudante do sexo masculino,


selecionado ao acaso, dessa universidade. Considere que temos interesse no
evento X>180. A figura 6 mostra a equivalência da probabilidade deste evento,
P(X>180), com uma certa área na distribuição normal padrão. Para facilitar a
notação, identificaremos por Z uma variável aleatória com distribuição normal
padrão.

x−µ
Z=
σ

180 − 170
Z=
10

Z=1

57
= 15,87%

Tabela IV com z = 1
encontra-se o valor
da área = 0,1587

58
2.2 TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO
Como vimos na seção precedente, as probabilidades de uma variável com
distribuição normal podem ser representadas por áreas sob a curva da distribuição
normal padrão. No apêndice, apresentamos a Tabela IV que relaciona valores
positivos de z com áreas sob a cauda superior da curva. Os valores de z são
apresentados com duas decimais. A primeira decimal fica na coluna da esquerda e a
segunda decimal na linha do topo da tabela. A Fig. 7 mostra como podemos usar a
Tabela IV para encontrar, por exemplo, a área sob a cauda superior da curva, além
de z = 0,21.

segunda decimal de z
z 0,00 0,01 0,02 ... 0,09
0,0
0,1
0,2 0,4168
... (área na cauda superior)

Fig. 7: Ilustração do uso da tabela da distribuição norma padrão (Tabela IV do apêndice) para
encontrar a área na cauda superior relativa ao valor de z= 0,21.

Exemplo 2, continuação – Admitimos que a altura X de um estudante do


sexo masculino, tomado ao acaso de uma universidade, tinha distribuição normal
com média 170 cm e desvio padrão 10 cm. Vimos, também, que a probabilidade
dele acusar altura superior a 180 cm, correspondia à área acima de z= 1 da curva
normal padrão, isto é, P(X > 180) = P(Z > 1). Usando a Tabela IV do apêndice,
podemos encontrar esta área (probabilidade), como ilustra o esquema seguinte.

segunda decimal de z
z 0,00 ... 0,09
...
1,0 0,1587
...

Portanto:
P(X>180)= 0,1587

A Tabela IV considera valores de z entre 0 (zero) e 5 (cinco). Além de z= 5 a


área pode ser considerada nula. Aliás, a partir de 3 (três) a área já é praticamente
nula. Áreas para valores negativos de z podem ser obtidas por simetria,
considerando os correspondentes valores positivos. O exemplo seguinte mostra
como podemos operar com áreas, a fim de obter diversas probabilidades de
interesse.

59
Exemplo 3: Suponha que o desempenho dos alunos das três últimas fases
do Curso de Ciências da Computação da UFSC tenha distribuição normal de média
2,5 e desvio padrão de 0,6. Selecionando aleatoriamente um aluno desta população,
qual a probabilidade dele acusar desempenho entre 2 e 3,5?
Solução. Primeiramente precisamos transformar os valores de desempenho
x, em valores padronizados:
Z1 será para x=2
x−µ
Z1=
σ

2 − 2,5
Z1=
0,6

Z1 = - 0,83

E Z2 será para x=3,5

x−µ
Z2=
σ

3,5 − 2,5
Z2=
0,6

Z2 = 1,67

A figura abaixo mostra essas transformações.

60
Usando a Tabela IV do apêndice, encontramos para z = −0,83 e z = 1,67 as
respectivas áreas nas extremidades da curva: 0,2033 e 0,0475 (lembrando que para
valores negativos de z, como −0,83, procuramos na Tabela IV o seu valor simétrico
positivo, no caso, z = 0,83). É fácil observar, pela figura abaixo, que a probabilidade
desejada corresponde ao complemento da soma destas áreas, ou seja:

P(2 < X < 3,5) = 1 − (0,2033 + 0,0475) = 0,7492.

ou

P(2 < X < 3,5) = 100% − (20,33% + 4,75%) = 74,92%.

61
EXERCÍCIOS

1) Considerando a variável aleatória X do Exemplo 3 que a altura X de um


estudante do sexo masculino, tomado ao acaso de uma universidade, tinha
distribuição normal com média 170 cm e desvio padrão 10 cm., calcule:
a) P(X>190); b) P(150<X<190); c) P(X≤160);
d) a percentagem esperada de estudantes com altura entre 150 e 190 cm.

2) Admitindo que a distribuição do quociente de inteligência (Q.I.), de crianças de


uma certa escola, seja normal com média 100 pontos e desvio padrão 10 pontos,
calcule:
a) a probabilidade de uma criança, tomada ao acaso dessa escola, acusar Q.I.
superior a 120 pontos;
b) a percentagem esperada de crianças com Q.I. na faixa de 90 a 110 pontos.

3) O resultado da média dos alunos de um determinado curso foi µ = 7,5 pontos e a


variância Sx2 = 3. Utilizando-se dos conceitos e aplicação da curva de Gauss
(distribuição normal) determinar:
a) Os alunos que obtiveram nota igual ou superior a 8 ⇒ P(x > 8)
b) Os alunos que obtiveram nota entre 3,5 e 9 ⇒ P(3,5 < x < 9)
c) Os alunos que obtiveram nota inferior a 2,0 ⇒ P( x < 2,0)

4) A idade média de ingresso de 3000 estudantes de uma determinada Universidade


é de 22 anos e o desvio padrão é 5,4 anos. Admitindo-se que as idades estão
distribuídas normalmente, determinar quantos estudantes ingressarão conforme as
seguintes limitações:
a) Entre 18 e 23 anos;
b) Menos que 18 anos;
c) Mais que 26 anos;

5) A nota dos alunos de um determinado curso foram (7; 8; 6; 7,5; 8; 5) notas


estas que representam uma amostra.
Pergunta-se:
a) Qual a probabilidade em percentual de alunos tirarem nota inferior a 5.
b) Qual a probabilidade em percentual de alunos tirarem nota superior a 9.

6) Suponha que em uma certa região, o peso dos homens adultos tenha distribuição
normal com média 70 kg e desvio padrão 16 kg. E o peso das mulheres adultas
tenha distribuição normal com média 60 kg e desvio padrão 12 kg. Ao selecionar

62
uma pessoa ao acaso, o que é mais provável: uma mulher com mais de 75 kg, ou,
um homem com mais de 90 kg?

7) Em uma fábrica de farinha de trigo, o departamento de qualidade retirou por


amostragem 05 pacotes de farinha com a seguinte pesagem: (998g; 1000g; 996g;
1001g; 995g). Qual a probabilidade segundo a distribuição normal de acontecer um
erro de mais que 10g?

63
3. AJUSTAMENTO DE RETA E CORRELAÇÃO3
GILBERTO ANDRADE MATINS

3.1. INTRODUÇÃO
Um dos maiores problemas para o investigador de fenômenos humanos ou
físicos é o estabelecimento de um modelo matemático que descreva e explique o
fenômeno ocorrido na vida real, com boa aproximação. A busca de uma relação
funcional entre as variáveis observadas que descrevem o fato é uma tarefa de
muitos cientistas em qualquer área de estudo. Assim, o pediatra tem interesse em
estabelecer uma relação funcional entre o peso e a altura dos bebês; o economista
busca o estabelecimento de uma função que explique o comportamento das vendas,
em unidades de um produto, em função do preço; o administrador precisa de uma
função que descreva os custos de um produto, quando as quantidades variam; o
engenheiro quer saber a relação funcional entre a resistência do concreto e a razão
água/cimento; o médico tem interesse em relacionar através de uma função o
volume do plasma sangüíneo e a superfície dos corpos dos pacientes; o psicólogo
deseja a função que explique o QI (quociente de inteligência), etc.

Seja Y uma variável que nos interessa estudar e cujo comportamento futuro
desejamos prever. É fácil prever. É fácil identificarmos uma série de variáveis Xi; (X1,
X2, X3,..., Xn) que influenciam o comportamento de Y, a variável dependente do
modelo. A Estatística oferece meios de chegarmos à relação função entre a variável
dependente (Y) e as variáveis explicativas ou independentes (X1, X2, X3,..., Xn)
através da análise de regressão. Quando maior o número de variáveis explicativas,
mais completo será o modelo. Todavia, sua solução será também mais difícil e
complexa. Em razão disso, limitaremos nossa exposição ao caso em que apenas
duas variáveis intervêm no modelo: a variável dependente Y e a variável
independente X. Apresentaremos apenas o estudo da função linear (ajustamento de
uma reta), isto é, estudaremos o modelo:

Y = a + bX onde a e b são os parâmetros da função.

3
O texto que compõe o capítulo 6 foi obtido do livro Princípios de Estatística

64
Uma maneira bastante prática para auxílio na determinação da função entre
as variáveis dependente e independente é a construção do gráfico denominado
“diagrama de dispersão”. Para desenharmos o diagrama de dispersão devemos
coletar uma amostra de valores X e Y : (x1 , y1), (x2 , y2) , ( x3 , y3), . . . , ( xn, yn),
marcando esses pontos em um sistema de coordenadas cartesianas. Assim:
y

yn •
y2 •
y3 •
y1 •

x1 x2 x3 ... xn x

”Diagrama de Dispersão”

Para análise de “nuvem” de pontos assinalados, teremos melhores


condições de especificar a função que relaciona as variáveis. No caso do
ajustamento de uma linha reta, o diagrama de dispersão apresentará uma “nuvem”
de pontos que nos irá sugerir uma relação linear entre X e Y . É também provável
que a nuvem de pontos nos indique outros tipos de funções (exponencial, parábola,
etc.). Tais ajustamentos fogem aos objetivos desse curso.

3.2. AJUSTAMENTO DA RETA


Estabelecido o modelo Y = a + bx, precisamos dos valores de a e b de forma
que a nossa reta passe tão próxima quanto possível dos pontos assinalados no
diagrama de dispersão. Isto é, queremos minimizar a discrepância total entre os
pontos marcados e a reta que iremos determinar. O melhor método para a
determinação dos parâmetros a e b que minimize as discrepância é o Método dos
Mínimos Quadrados. Segundo esse método, poderemos avaliar os parâmetros a e b
pela aplicação das seguintes fórmulas:

n∑ xy − ∑ x • ∑ y
b=
n∑ x 2 − (∑ x )
2

a = y − bx , onde n = tamanho-amostra

x=
∑ x = média dos xi
n

65
y=
∑ y = média dos yi
n

3.3. EXEMPLO DE APLICAÇÃO


Utilizando os dados abaixo:
a) Construa o diagrama de dispersão.
b) Ajuste uma reta aos dados.
c) Trace a reta no diagrama de dispersão.
d) Qual é o custo para 16 unidades do artigo?

Quantidades (x) 10 11 12 13 14 15
Custos (y) 100 112 119 130 139 142

Solução:

a) Diagrama de dispersão

Custos
y

150 -
140 - • •
130 - •
120 - •
110 - •
100 - •

| | | | | | x
10 11 12 13 14 15 quantidades

b) Ajustamento da reta

Neste item precisamos avaliar a e b. Para tanto, é conveniente a construção


da tabela:

66
X Y XY X2
10
11
12
13
14
15
∑ 75

Assim: n=6; ∑ xy = ; ∑x= ; ∑ y= ; ∑x 2


=
n • ∑ xy − ∑ x ∑ y
b= =
n • ∑ x − (∑ x )
2 2

y=
∑y =
n

x=
∑x =
n
a = y − b x , logo a=

Portanto, y = a + bx y=

c) Gráfico da reta obtida

Custo
y

150 - y=
140 -
130 -
120 -
110 -
100 -

| | | | | | x
10 11 12 13 14 15 quantidade

d) Custo para 16 unidades

Como x = quantidade e y = custo, basta calcularmos o valor de y quando

67
x = 16. Assim:
y=
y=
Logo, o custo para 16 unidades será :

e) Custo para 8 unidades

68
EXERCÍCIO
1. Ajustar uma reta aos dados:

X 1 2 3 4 5 6 7 8
Y 3 3 5 6 6 7 8 9

2. Sendo:

Idade da casa (meses) X 12 15 18 24 30 36


Aluguel (R$) Y 170 150 130 140 100 80

a) Construir o diagrama de dispersão


b) Ajustar uma reta aos dados
c) Traçar a reta obtida no diagrama
d) Qual seria o valor do aluguel para 21 meses?

69
APÊNDICE

TABELA IV – Distribuição normal padrão

segunda decimal de z
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2842 0,2843 0,2776
0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,685 0,1660 0,1635 0,1611

1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0722 0,0708 0,0694 0,0681

1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233

2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064

2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
2,9 0,0019 0,0018 0,0017 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014

3,0 0,00135
3,5 0,000233
4,0 0,0000317
4,5 0,00000340
5,0 0,000000287

70
4. APRESENTAÇÃO GRÁFICA DE DADOS
Os dados estatísticos, apresentados em tabelas, também podem ser
expostos em gráficos, desde que não haja necessidade de grande precisão, os
gráficos permitem ao observador uma leitura mais rápida do fenômeno
representado.
Na apresentação gráfica de dados são necessários alguns cuidados:

a)Todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja
necessidade de esclarecimentos adicionais no texto;

b) O título do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE escreve o título
acima do gráfico, porém a maioria dos estatísticos o coloca abaixo.

c) No eixo das abscissas (eixo x), a escala cresce da esquerda para a direita e é escrita
embaixo do eixo, como mostra o esquema:

d) No eixo das ordenadas (eixo y), a escala cresce de baixo para cima e é escrito à
esquerda do eixo. Deve ser feitas setas para indicar a direção dos eixos.

e)As variáveis representadas em cada eixo devem ser claramente identificadas. No eixo das
ordenadas escreve-se o nome da variável na extremidade do eixo, no eixo das abscissas
escreve-se o nome da variável embaixo da escala, como mostra no esquema abaixo:

f) A escala deve iniciar na origem do sistema de eixos cartesianos. Quando os valores


iniciais dos dados são muito altos (como por exemplo, 50, 51, etc), pode ser feita uma
interrupção no eixo, com indicação clara da posição zero. Veja no esquema.

71
g) O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que
a parte do gráfico que se pretende evidenciar:

h) Os gráficos podem exibir, no rodapé, a fonte, isto é, a instituição, o pesquisador, ou o


grupo de pesquisadores que forneceu o gráfico ou os dados que permitam a construção do
gráfico.

i) Para facilitar a leitura, podem ser feitas linhas auxiliares. Nestes casos, o gráfico
é feito dentro de retângulos, como mostra o esquema:

72
4.1 TIPOS DE GRÁFICOS
1- GRÁFICO DE BARRAS – GRÁFICO DE COLUNAS

O Gráfico de barras ou colunas é usado para representar séries cronológicas,


geográficas e categóricas. Para entender como se faz um gráfico de barras, primeiro
observe a série cronológica apresentada na tabela abaixo.

Tabela 01. População presente no Brasil, segundo o ano do censo demográfico

Ano do censo demográfico População


1940 41.236.315
1950 51.944.397
1960 70.191.370
1970 (1) 93.139.037
1980 (1) 119.002.706
2000 169.872.859
FONTE: IBGE (2000)
(1) População residente

Para apresentar os dados da tabela 01 em um gráfico de barras siga os seguintes


passos:
a) trace o sistema de eixos cartesianos; escreva os anos no eixo das abscissas; a
população será representada no eixo das ordenadas.
b) Construa barras retangulares para representar a população em cada ano de censo. As
barras terão base de mesma largura, mas a altura de cada barra será dada pela
população no ano do censo;
c) As barras (colunas) serão separadas pela metade da largura de cada barra
(preferentemente);
d) Coloque o título no gráfico. Observe o gráfico representativo da tabela 01.

Gráfico 01
População presente no Brasil, segundo o ano de censo
demográfico

180000000
160000000
140000000
120000000
População

100000000
80000000
60000000
40000000
20000000
0
1940 1950 1960 1970 (1) 1980 (1) 2000

FONTE: IBGE (2000)


(1) População residente

73
A apresentação gráfica de séries geográficas e cronológicas, através de gráficos de
barras, é feita da mesma forma. Observe os dados da série geográfica apresentados na
tabela 02 as regiões podem ser colocadas no eixo das abscissas; o número de pessoas de
cada região pode ser apresentado no eixo das ordenadas, como mostra o gráfico 02 para
facilitar a leitura foram feitas linhas auxiliares.
Tabela 02. População residente no Brasil, segundo a região,
de acordo com o censo demográfico de 2000

Região População
Norte 12.911.170
Nordeste 47.782.488
Sudeste 72.430.194
Sul 25.110.349
Centro-oeste 11.638.658
FONTE: IBGE (2000)

Gráfico 02
População residente no Brasil, segundo a região, de acorso
com o censo demográfico de 2000

80000000
70000000
60000000
50000000
40000000
30000000
20000000
10000000
0
Norte Nordeste Sudeste Sul Centro-oeste

74
É preciso deixar claro, no entanto, que no caso dos dados da tabela 02 as barras
também podem ser construídas em posição horizontal. Para isso:

a) trace o sistema de eixos cartesianos; apresenta as regiões no eixo das ordenadas e a


população no eixo das abscissas;
b) construa barras iguais e com comprimento dado pelo número de pessoas de cada
região; as barras (colunas) serão separadas pela metade da largura de cada barra
(preferentemente);
c) coloque o título no gráfico. Observe o gráfico representativo da tabela anterior.

Gráfico 03
População residente no Brasil, segundo a região, de acordo com o censo dem ográfico de
2000

Centro-oeste

Sul

Sudeste

Nordeste

Norte

0 10.000.000 20.000.000 30.000.000 40.000.000 50.000.000 60.000.000 70.000.000 80.000.000

É mais comum a representação das barras ou colunas em posição vertical, como


foi feito no gráfico 02 no entanto, as barras em posição horizontal facilitam a identificação da
categoria, principalmente nos casos em que estas categorias têm nomes muito longos. Isto
porque os nomes podem ser escritos em posição horizontal e por extenso, dispensando o
uso de abreviaturas ou legendas.
Os dados de séries cronológicas devem ser apresentados em seqüência. Se,
porém, os dados são de uma série categórica, ou mesmo de uma série geográfica, a
apresentação das barras em ordem crescente (ou decrescente) ajuda na comparação da
importância relativa das categorias. Como mostra o gráfico 04, é mais fácil interpretar o
gráfico da direita (B) do que o gráfico apresentado à esquerda (A).

Gráfico 04. Dados fictícios

Dados fictícios (A)


Dados fictícios (B)

8 8

7 7

6 6

5 5

4 4
3 3
2 2
1
0 1

0
A B C D B A D C

75
Os números e as palavras devem ser escritos fora das barras. Nos casos em que
os nomes são muito extensos recomenda-se usar uma legenda explicativa.

OBSERVAÇÃO

O gráfico de barras, verticais ou horizontais, pode ser tridimensional. Observe o


gráfico 05, referente a tabela 02.

Gráfico 05
População residente no Brasil, segundo a região, de acordo com o censo
dem ográfico de 2000

80.000.000

70.000.000

60.000.000

50.000.000

40.000.000

30.000.000

20.000.000

10.000.000

Norte
Nordeste
Sudeste
Sul
Centro-
oeste

76
GRÁFICO DE LINHAS (LINEARES)

O gráfico de linhas é usado para apresentar séries cronológicas. Observe os dados


da tabela 01. Para fazer o gráfico de linhas para a tabela 01, tomada como exemplo, segue-
se os seguintes dado:

a) trace o sistema de eixos cartesianos; no eixo das abscissas coloque os anos do censo.
No eixo das ordenadas apresente os dados da população;
b) faça corresponder um ponto para cada par de valores da série. Por exemplo, para o par
(1949,41 milhões) faça um ponto;
c) una os pontos por segmentos de reta; coloque o título no gráfico.

Gráfico 06
População presente no Brasil, segundo o censo demográfico

180.000.000
160.000.000
140.000.000
120.000.000
100.000.000
População
80.000.000
60.000.000
40.000.000
20.000.000
0
1940 1950 1960 1970 (1) 1980 (1) 2000

77
GRÁFICO DE SETORES OU GRÁFICO DE TORTAS

O gráfico de setores é usado para comparar proporções. Observe os dados fictícios


apresentados na tabela 03.

Tabela 03. Distribuição de alunos da 1ª série do


Grupo Escolar “Maria Conceição”, segundo a situação em relação as notas

Situação Freqüência Percentual


Promovido 12 50,0
Em recuperação 8 33,3
Retido 4 16,7
Total 24 100,0

A comparação das proporções, no caso deste exemplo e de outros similares, fica


fácil ser for construído um gráfico de setores.
Gráfico 07
Distribuição de alunos da 1ª série do Colégio Dom Pedro,
segundo a situação em relação as notas

promovido
Em recuperação
17% Retido

50%

33%

Gráfico 08
Distribuição de alunos da 1ª série do Colégio Dom Pedro,
segundo a situação em relação as notas

Retido
17%

promovido
Em 50%
recuperação
33%

78
GRÁFICO COMPARTIVO

Muitas vezes são desenhados dois gráficos, lado a lado, para melhor estabelecer a
comparação de um fenômeno. Outras vezes, os dados obtidos em situações distintas são
sobrepostas na mesma figura, para evidenciar a comparação. Os gráficos são desenhados
da meneira comum, mas são colocados juntos para facilitar a comparação.
Observe a série cronológica apresentada na tabela 04, para a apresentação gráfica
desses dados pode ser feito o gráfico de barras (gráfico 09), ou gráfico de linhas (gráfico
10), nestes gráficos se estabelece uma comparação entre população urbana e população
rural.

Tabela 4. População residente no Brasil, urbana e rural,


segundo o ano do censo demográfico

Ano do censo População


Demográfico Urbana Rural
1940 (1) 12 880 182 28 356 133
1950(1) 18 782 891 33 161 506
1960 31 303 034 38 767 423
1970 52 084 984 41 054 053
1980 80 436 409 38 566 297
2000 137 925 238 31 947 618
Fonte: IBGE (2000)
(1) População presente.

Gráfico 09
População residente no Brasil, urbana e rural, segundo o ano do censo dem ográfico
160

140

120

100
Milhões

Urbana
80
Rural
60

40

20

0
1940 (1) 1950(1) 1960 1970 1980 2000

79
Gráfico 09
População residente no Brasil, urbana e rural, segundo o ano do censo dem ográfico
160

140

120
Urbana
100
Milhões

Rural
80

60

40

20

0
1940 (1) 1950(1) 1960 1970 1980 2000

Os gráficos 09 e 10 mostram melhor do que a tabela 5, que as populações urbana e


rural têm, no Brasil, tendências diferentes de crescimento. Enquanto a população das
cidades aumenta rapidamente, a população do campo cresceu cada vez mais lenta até 1970
e diminui na última década.
Além destes gráficos comparativos pode-se ter os gráficos de área (gráfico 11).

Gráfico 11
População residente no Brasil, urbana e rural, segundo o ano do censo dem ográfico
180
160
140
120 Rural
Milhões

100 Urbana

80
60
40
20
0
1940 (1) 1950(1) 1960 1970 1980 2000

80
EXERCÍCIOS
APRESENTAÇÃO GRÁFICA DE DADOS
01. Faça um gráfico de barras para apresentar os valores de densidade demográfica,
segundo a região.

Tabela.P01. Densidade demográfica no Brasil, segundo a região,


de acordo com o censo demográfico de 1980
Região Densidade (hab/km2)
Norte 1,65
Nordeste 22,57
Sudeste 56,31
Sul 33,86
Centro-oeste 4,01
Fonte: IBGE (1980)

02. Faça um gráfico de linha para representar o crescimento em altura de crianças do sexo
masculino.

Tabela.P02. Altura média de crianças do sexo masculino no Rio de Janeiro


em 1975, segundo a idade
Idade (anos) Altura média (cm)
7 119,7
8 124,4
9 129,3
10 134,1
11 139,2
12 143,2
Fonte: IBGE (1977)

03. Desenhe gráficos para representar os valores de temperatura segundo o mês, nas
cidades do Rio de Janeiro e de São Paulo. Note que é preciso fazer dois gráficos, um para
cada cidade. Faça um gráfico comparativo entre as duas cidades.

81
Tabela.P03. Temperatura do ar, segundo o mês, nas cidades de Rio de Janeiro
e São Paulo, em 1983
Idade (anos) Temperatura (ºC)
Rio de Janeiro São Paulo
Janeiro 26,6 22,5
Fevereiro 27,0 23,1
Março 26,0 21,2
Abril 24,4 20,7
Maio 24,0 19,2
Junho 21,5 19,7
Julho 24,6 17,6
Agosto 20,6 17,0
Setembro 20,6 15,9
Outubro 22,6 18,8
Novembro 24,4 21,4
Dezembro 25,2 21,8
Fonte: IBGE (1977)

BIBLIOGRAFIA
MARTINS, Gilberto de Andrade. Princípios de estatística / Gilberto de Andrade
MARTINS, Denis Donaire. São Paulo: Atlas, 1979.
VIEIRA, Sonia e HOFFMANN, Rodolfo. Elementos de Estatística. São Paulo: Atlas, 1990.
LAPPONI, Juan Carlos. Estatística: Usando Excel: – São Paulo: Lapponi Treinamento e
Editora Ltda, 2000.
CRESPO, Antônio Arnot. Estatística Fácil, - 17. ed. – São Paulo: Saraiva, 2002.
STEVENSON, William J. Estatística Aplicada à Administração; tradução Alfredo Alves de
Farias. – São Paulo:Harper & Row do Brasil, 1981.
TIBONI, Conceição Gentil Rebelo. Estatística Básica para o Curso de Turismo – 2. ed – São
Paulo: Atlas, 2003.

BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Florianópolis:


Editora da UFSC, 1994

BONINI, Edmundo Eboli e BONINI, Sergio Eboli. Estatística: Teoria e exercícios. São
Paulo: Loyola, 1990.

GENTIL, Nelson; SANTOS, Carlos A. Marcondes; GRECO, Antônio Carlos;


BELLOTO FILHO, Antônio; GRECO, Sérgio Emílio. Matemática para o 2º Grau.
São Paulo: Ática.

HOFFMANN, Rodolfo. Estatística para economistas. São Paulo: Pioneira, 1980.

82
KARMEL, Peter Henry & Polaser. Estatística geral e aplicada para economistas. São
Paulo: Atlas, 1972.

KAZMIER, Leonard J. Estatística aplicada à economia e administração. São Paulo:


McGraw-Hill do Brasil, 1982. (ColeçãoSchuman).

MATINS, Gilberto de Andrade. Princípios de estatística. São Paulo: Atlas, 1990.

SPIEGEL, Murray Ralph. Estatística: resumo da teoria. São Paulo: Mc Graw-Hill,


1974. (Coleção Schaunn).

TOLEDO, Geraldo Luciano & OVALLE, Ivo. Estatística básica. São Paulo: Atlas.

VIEIRA, Sônia & HOFFMANN, Rodolfo. Elementos de estatística. São Paulo: Atlas,
1986.

83

Você também pode gostar