Você está na página 1de 230

Inder Jeet Taneja

Fernando Guerra

Estatística Aplicada à
Educação Matemática

Florianópolis, 2007
Universidade Federal de Santa Catarina
Consórcio ReDiSul

Campus Universitário – Trindade


Caixa Postal 476
CEP 88040-900 – Florianópolis – SC

Reitor: Lúcio José Botelho


Vice-Reitor: Ariovaldo Bolzan
Secretário de Educação a Distância: Cícero Barbosa
Pró-Reitoria de Ensino de Graduação: Marcos Laffin
Diretora de Ensino: Araci Hack Catapan
Pró-Reitoria de Pesquisa: Thereza Christina M. Nogueira
Pró-Reitoria de Pós-Graduação: Valdir Soldi
Pró-Reitoria de Cultura e Extensão: Eunice Sueli Nodari
Pró-Reitor de Desenvolvimento Humano e Social: Luiz Henrique Vieira Silva
Pró-Reitor de Orçamento, Administração e Finanças: Mário Kobus
Pró-Reitora de Assuntos Estudantis: Corina Martins Espíndola
Centro de Ciências da Educação: Carlos Alberto Marques
Centro de Ciências Físicas e Matemáticas: Méricles Thadeu Moretti
Centro de Filosofia e Ciências Humanas: Maria Juracy Filgueiras Toneli
Centro de Comunicação e Expressão: Viviane Maria Heberle

Cursos de Licenciaturas na Modalidade à Distância


Coordenação Acadêmica Matemática: Neri Terezinha Both Carvalho
Coordenação de Ambientes Virtuais: Nereu Estanislau Burin
Coordenação de Infra-Estrutura e Pólos: Vladimir Arthur Fey

Comissão Editorial
Antônio Carlos Gardel Leitão
Albertina Zatelli
Elisa Zunko Toma
Igor Mozolevski
Luiz Augusto Saeger
Roberto Corrêa da Silva
Ruy Coimbra Charão
Coordenação Pedagógica das Licenciaturas à Distância UFSC/CED/CFM
Coordenação: Roseli Zen Cerny

Núcleo de Formação
Coordenação: Nilza Godoy Gomes

Núcleo de Criação e Desenvolvimento de Material


Responsável: Isabella Benfica Barbosa
Design Gráfico e Editorial: Carlos A. Ramirez Righi, Diogo Henrique Ropelato,
Mariana da Silva.
Adaptação Design Gráfico: Diogo Henrique Ropelato,
Marta Cristina Goulart Braga, Natal Anacleto Chicca Junior.
Design Instrucional: Janice Pereira Lopes
Revisão Ortográfica: Jane Maria Viana Cardoso
Preparação de Gráficos: Pricila Cristina da Silva, Rafael Schmidt Alves
Editoração Eletrônica: Pricila Cristina da Silva, Rafael Schmidt Alves

Núcleo de Pesquisa e Avaliação


Coordenação: Claudia Regina Flores

Copyright © 2007, Universidade Federal de Santa Catarina / Consórcio RediSul


Nenhuma parte deste material poderá ser reproduzida, transmitida e gravada, por qualquer
meio eletrônico, por fotocópia e outros, sem a prévia autorização, por escrito, da Coordenação
Acadêmica do Curso de Licenciatura em Matemática na Modalidade à Distância.

Ficha Catalográfica
T164e
Taneja, Inder Jet
Estatística Aplicada à Educação Matemática / Inder Jet Taneja, Fernando
Guerra. – Florianópolis : UFSC/EAD/CED/CFM, 2007.

234 p.
ISBN 9788599379158
1. Estastística. 2. Educação. I. Guerra, Fernando. II Título.

CDU 519.2

Elaborada pela Bibliotecária Eleonora M. F. Vieira – CRB – 14/786


Sumário

1 Noções Básicas da Estatística ............................................ 11


1.1 Origem da Estatística ................................................................. 13
1.2 Conceitos ..................................................................................... 15
1.3 População ou Universo .............................................................. 15
1.4 Amostra ...................................................................................... 16
1.5 A Estatística na Metodologia Científica ................................. 16
1.6 Tipos de Pesquisas ..................................................................... 17
1.7 Dados Estatísticos....................................................................... 17
1.8 Análise Crítica dos Dados......................................................... 18
1.9 Análise Exploratória de Dados ................................................. 19
1.10 Classificação dos Dados ........................................................... 19
1.11 Tipos de Variáveis ..................................................................... 20
1.12 Mensuração de uma Variável ................................................. 22
1.13 Instrumento de Coleta de Dados............................................ 23
1.14 Plano de Amostragem .............................................................. 27
1.15 Amostra Aleatória Simples ..................................................... 28

2 Organização de Dados, Gráficos e


Distribuição de Freqüência ................................................. 35
2.1 Variáveis ...................................................................................... 37
2.2 Coleta dos Dados ....................................................................... 38
2.3 Gráficos ........................................................................................ 41
2.3.1 Tipos de Gráficos................................................................ 42
2.4 Distribuição de Freqüências ..................................................... 48
2.5 Histograma de Freqüências ...................................................... 57

3 Medidas de Tendência Central ......................................... 67


3.1 Introdução ................................................................................... 69
3.2 Média Aritmética ....................................................................... 70
3.2.1 Média Aritmética Simples ................................................ 70
3.2.2 Média Aritmética Ponderada ........................................... 71
3.2.3 Média Aritmética para Dados Agrupados
em classe (ponderada) .................................................................74
3.3 Outras Médias ............................................................................ 78
3.3.1 Média geométrica .............................................................. 78
3.3.2 Média Harmônica .............................................................. 79
3.3.3 Média Quadrática .............................................................. 80
3.3.4 Desigualdade entre Quatro Médias ................................ 80
3.4 Mediana ...................................................................................... 81
3.4.1 Mediana para Dados Isolados .......................................... 81
3.4.3 Mediana para Dados Agrupados .................................... 83
3.5 Moda ........................................................................................... 89
3.5.1 Caso de Dados Isolados e/ou
Não Agrupados em Classe ........................................................ 89
3.5.2 Cálculo da Moda para Dados
Agrupados em Classes............................................................... 92

4 Medidas de Dispersão e
Utilização das Planilhas ........................................................ 99
4.1 Introdução ..................................................................................101
4.2 Amplitude ................................................................................. 103
4.3 Desvio Médio............................................................................ 105
4.3.1 Desvio Médio Absoluto – Dados Isolados .................... 106
4.3.2 Dados Isolados Ponderados e
Agrupados em Classe ...............................................................107
4.4 Desvio Padrão ...........................................................................111
4.5 Variância ....................................................................................112
4.6 Coeficiente de Variação ............................................................113
4.7 A Estatística no Excel ............................................................... 120
4.7.1 Conhecendo o Excel ......................................................... 120

5 Cálculo de Probabilidade ................................................. 131


5.1 Introdução ................................................................................. 133
5.2 Experimentos Aleatórios ......................................................... 134
5.3 Espaço amostral e Noção de Probabilidade ......................... 134
5.4 Variáveis Aleatórias ................................................................. 138
5.5 Esperança Matemática ou Valor Esperado ............................141
5.5.1 Variância e Desvio Padrão ...............................................143
5.6 Distribuições Discretas............................................................ 144
5.6.2 Distribuição Binomial ............................................................146
5.7 Distribuições Contínuas ...........................................................151
5.7.1 Distribuição Normal .........................................................152
5.8 Distribuição Normal como Aproximação da
Distribuição Binomial ...................................................................162

6 Amostragem ....................................................................... 173


6.1 Introdução ................................................................................. 175
6.1.1 Tipos de amostragem ........................................................176
6.1.2 Principais fases de um
levantamento estatístico .......................................................... 179
6.2 Amostragem Causal Simples.................................................. 180
6.3 Distribuições Amostrais ..........................................................182
6.3.1 Distribuição Amostral da Média:
Com e Sem Reposição .............................................................. 183
6.4 Distribuição Amostral das Proporções ................................ 195

7 Estimação ............................................................................ 203


7.1 Introdução.................................................................................. 205
7.2 Estimativas Pontuais e Intervalares ....................................... 205
7.3 Intervalo de confiança.............................................................. 206
7.4 Estimação de Média de uma População ................................ 207
7.4.1 Desvio Padrão Populacional Conhecido ....................... 209
7.4.2 Erro de Estimação e Tamanho da Amostra ...................215
7.5 Desvio Padrão Populacional Desconhecido ..........................216
7.5.2 Amostragem de Pequenas Populações:
Fator de Correção Finita ...........................................................219
7.6 Estimativa por Intervalo de Confiança para Proporções .... 222
Sites na Internet ........................................................................ 230
Apresentação

Este livro é destinado a quem estuda estatística pela primeira vez. O


objetivo dos autores foi dar as idéias principais da Estatística, e uma
certa habilitação para a parte algébrica. Através de uma linguagem
simples e clara, muitas vezes coloquial são apresentados conceitos com
alguns exercícios resolvidos. Dentre os exercícios apresentados, encon-
tram-se aqueles que se destinam a auxiliar a compreensão do conteúdo
exposto, e aqueles que objetivam conferir ao leitor certa familiaridade
com a disciplina de Estatística.

No capítulo 1, abordaremos as noções básicas de Estatística, bem como


sua origem, conceitos de Estatística, de população e de amostra. Mos-
traremos a Estatística na Metodologia Científica, os tipos de pesquisas,
a coleta de dados estatísticos, a análise exploratória de dados, os tipos
de variáveis e sua mensuração, a coleta de dados, o plano de amostra-
gem e a amostra aleatória simples.

No capítulo 2, faremos uma rápida organização de dados, através de


coleta e apuração, os quais serão apresentados em tabelas, em quadros,
em gráficos (por exemplo, o gráfico de linha) e em diagramas de pon-
tos. Estudaremos a distribuição de freqüência (ou tabela de freqüência)
e construiremos uma tabela de freqüência com intervalos de classe.
Estudaremos também a freqüência simples, a relativa, a acumulada e a
acumulada relativa. Abordaremos a construção do gráfico do histogra-
ma de freqüência e do polígono de freqüência.

Já no capítulo 3, estudaremos várias medidas de posição ou de ten-


dência central e suas utilidades no ensino fundamental. Dentre elas,
destacaremos a média aritmética, a mediana e a moda. Estudaremos
também outras médias, tais como a média geométrica, a média harmô-
nica e a média quadrática.

Apresentaremos, no capítulo 4, as medidas de dispersão ou variabilida-


de, ou seja, o desvio médio, o desvio padrão, a variância e o coeficien-
te de variação que têm sua importância na Estatística. Abordaremos
ainda a utilização da Estatística no Excel para o cálculo de algumas
freqüências (absoluta e relativa acumulada).
Iniciaremos o capítulo 5 dando os conceitos de experimentos aleatórios, es-
paço amostral, noção de probabilidade e de evento. Definiremos variáveis
aleatórias discretas e contínuas, esperança matemática ou valor esperado,
variância e desvio padrão de uma variável aleatória discreta. Abordare-
mos as principais distribuições de probabilidade discreta: a distribuição
de Bernoulli e a Binomial e também a principal distribuição de probabi-
lidade contínua, que é a distribuição normal ou de Gauss Abordaremos a
distribuição normal como aproximação da distribuição Binomial.

O capítulo 6 tratará dos tipos de amostragem e da distribuição amos-


tral da média com e sem reposição. Estudaremos o Teorema do Limite
Central e a distribuição amostral das proporções com e sem reposição.

Finalmente, no capítulo 7, estudaremos a Estimação de Parâmetros: pon-


tual e intervalar e intervalo de confiança. Abordaremos a estimação da
média de uma população e o desvio padrão populacional, erro de esti-
mação e o tamanho da amostra. Apresentaremos a distribuição t de Stu-
dent, a amostragem de pequenas populações: Fator de Correção Finita
(FCF) e a estimativa por intervalo de confiança para proporções.

Os autores
1 Noções Básicas da Estatística
1 Noções Básicas da Estatística

Neste capítulo, o nosso objetivo será o de apresentar a origem e


alguns conceitos de Estatística, tais como população e amostra,
além de mostrar os tipos de pesquisas, os tipos de variáveis, a
análise exploratória de dados, como mensurar uma variável, a
coleta de dados estatísticos e a amostra aleatória simples.

1.1 Origem da Estatística


Desde a Antigüidade, vários povos já registravam o número de
habitantes, de nascimentos, de óbitos, faziam estimativas das ri-
quezas individual e social, distribuíam eqüitativamente terras ao
A palavra estatística
surge da expressão
povo, cobravam impostos e até realizavam inquéritos quantitati-
em Latim statisticum vos por processos que hoje chamaríamos de “estatísticas”.
collegium palestra sobre
os assuntos do Estado, de
onde surgiu a palavra em Na Idade Média, colhiam-se informações com finalidades tribu-
língua italiana statista, tárias e bélicas.
que significa “homem de
estado”, ou político, e a
palavra alemã Statistik, A partir do século XVI surgem as primeiras análises sistemáticas
designando a análise de de fatos sociais, tais como batizados, casamentos, funerais, origi-
dados sobre o Estado.
A palavra adquiriu um
nando as primeiras tábuas e tabelas.
significado de coleta e
classificação de dados, no No século XVIII, o estudo de tais fatos vai ganhando feição ver-
início do século 19.
Fonte: http://pt.wikipedia. dadeiramente científica. Godofredo Achenwall denomina a nova
org/wiki/Estatistica ciência de Estatística, determinando seu objetivo e suas relações
com as ciências.

No Brasil, a Estatística surgiu na segunda metade do século XIX


com um Decreto Imperial, em 14 de janeiro de 1871 quando foi
criada a primeira Diretoria Geral de Estatística (DGE).

Em 1930, houve uma reforma que fundiu a DGE com a Direto-


ria de Estatística Comercial e, com o advento da República, esta
passou a se chamar Departamento Nacional de Estatística, cujos
setores de atividades foram se desenvolvendo até 1934.

13
Pelo Decreto de 6 de julho de 1934, foi criado o Instituto Nacional de
Estatística, órgão que veio centralizar todas as atividades estatísticas do
país e responsável pela publicação do Anuário Estatístico do Brasil.

Para unificar os serviços de estatística oficial, o Instituto Brasileiro


de Geografia e Estatística (IBGE) foi criado pelo Decreto Lei de 16 de
janeiro de 1938. O IBGE é uma entidade de natureza federativa, su-
bordinada diretamente à Presidência da República, e tem por objetivo
promover, fazer executar ou orientar tecnicamente o regime naciona-
lizado, o levantamento sistemático de todas as estatísticas brasileiras e
a coordenação metódica das atividades geográficas do país.

Como disciplina científica, só no século passado foi que a Estatís-


tica se estruturou, mas já era conhecida desde a antiguidade. Há
mais de quatro mil anos, os chineses utilizavam quadros de es-
tatística agrícola. Na Bíblia, há referências de censo dos Hebreus;
no Egito, devido às inundações do Nilo, efetuavam anualmente
trabalhos cadastrais para a repartição de terras férteis; na Grécia,
realizaram-se censos demográficos muitos séculos antes de Cris-
to; em Roma, os censos eram levados a efeito principalmente com
o objetivo de fazer aplicar o regime de imposto.

Na época moderna, as informações estatísticas mais importantes


figuram nos registros de estado civil, mantidos inicialmente pela
Igreja e depois pelo Poder Civil. É o estudo dos jogos de azar, de-
senvolvido ao ponto de formar um ramo distinto das matemáticas
- o cálculo das probabilidades - que vem dar à Ciência Estatística
sua justificação teórica e seus métodos de pesquisa.

A palavra estatística formou-se da mesma raiz da palavra Estado


(organização política), talvez porque, originalmente, as estatísti-
cas eram colhidas para as finalidades relacionadas com o Estado,
com objetivos militares ou mesmo tributários, e para a computa-
ção de nascimentos e de casamentos.

A palavra estatística, quando usada no plural, refere-se a dados


numéricos, mesmo aqueles obtidos por simples contagem (dados
estatísticos).

Quando usada no singular, estatística significa o conjunto de mé-

14
todos que se destinam a possibilitar a tomada de decisões acerta-
das face às incertezas.

1.2 Conceitos
Existe mais de uma centena de conceitos ou definições propostos
por autores, objetivando estabelecer com clareza a filosofia, os
limites e o campo de atuação da Estatística. Alguns são:

• A estatística é a disciplina científica que trata da coleta, des-


crição (organização, sumarização e apresentação) e análise
de dados, bem como na obtenção de conclusões válidas e
na tomada de decisões acertadas, face a insuficiência das
informações disponíveis.
• A Estatística é um conjunto de processos ou técnicas empregadas
na investigação e análise de fenômenos coletivos ou de massa.
• A Estatística é a matemática aplicada aos dados de observação.

D e acordo com os Parâmetros Curriculares


Nacionais (PCN) elaborados e publicados
pela SEF/MEC, as atividades propostas para o
ensino da estatística e de probabilidade da 1a à
8a série do ensino fundamental (7 a 14 anos) es-
tão recomendados no bloco de conteúdo “Tra-
tamentos da Informação” do currículo de Ma-
temática. Nesse bloco, além da probabilidade e
da estatística, inclui-se a combinatória.

Os Parâmetros Curriculares Nacionais (PCN) recomendam o traba-


lho com Estatística com a finalidade de que o estudante construa
procedimentos para coletar, organizar, comunicar e interpretar
dados, utilizando tabelas, gráficos e representações, e que seja
capaz de descrever e interpretar sua realidade, usando conheci-
mentos matemáticos.

1.3 População ou Universo


O termo população ou universo se refere a todas as observações
(todos os indivíduos ou a todos os objetos) que sejam relevantes
a um determinado problema.

15
Uma população pode ser finita ou infinita (em princípio, não se
pode, na realidade, enumerar todas as observações, como por
exemplo, os astros existentes no Universo).

1.4 Amostra
É um conjunto de observações (aleatórias, sem preferência) e
representativas tomadas de uma População. Uma amostra deve
ser probabilística, isto é, cada elemento da população deve ter a
mesma oportunidade ser escolhido. É, portanto, um subconjunto
finito de uma população. Eis alguns exemplos:

a) População: Os trinta sabores de sorvete da Confeitaria


“Bem Gelado”.

Amostra: Cinco sabores testados para saber se a Confeitaria


“Bem Gelado” vende sorvetes de boa qualidade.
Metodologia científica
refere-se à forma como
b) População: Todos os eleitores do Estado de Santa Catarina. funciona o conhecimento
científico. Tem sua
origem no pensamento
Amostra: Três mil eleitores entrevistados em uma pes- de Descartes, que
quisa do IBOPE. foi posteriormente
desenvolvido
empiricamente pelo físico
1.5 A Estatística na Metodologia Científica inglês Isaac Newton.
Descartes propôs chegar
A Estatística pode estar presente nas diversas etapas de uma pesquisa à verdade através da
desde o seu planejamento até a interpretação de seus resultados, po- dúvida sistemática e
da decomposição do
dendo, com isso, influenciar na condução do processo da pesquisa. problema em pequenas
partes, características
que definiram a base da
A coleta de dados é uma fase da pesquisa que precisa ser cuidado-
pesquisa científica.
samente planejada, para que os dados a serem levantados forne- Fonte: http://pt.wikipedia.
org/wiki/Metodologia_
çam informações relevantes para os objetivos da pesquisa.
cientifica.

Em uma pesquisa científica, precisamos coletar dados que nos forne-


çam informações capazes de responder aos nossos questionamentos.

As principais etapas de planejamento da pesquisa estatística são:

• a definição do problema a ser pesquisado;


• os objetivos da pesquisa (geral e específico) devem ser ela-
borados de forma bem clara;

16
• a execução da pesquisa;
• o levantamento de dados necessários;
• a análise dos dados;
• os resultados alcançados;
• a conclusão.

Apesar de a aplicação de técnicas estatísticas ser feita basicamente


na etapa de análise dos dados, a metodologia estatística deve ser
aplicada nas diversas etapas da pesquisa, havendo uma iteração
com a metodologia da área em estudo.

1.6 Tipos de Pesquisas


Depois dos objetivos traçados, precisamos decidir sobre o delinea-
mento da pesquisa. Para isto temos dois tipos de pesquisas que são:

1) Pesquisa de Levantamento
Neste tipo de pesquisa, levantamos diversas características
dos elementos da população, utilizando questionários ou
entrevistas. A observação é feita naturalmente sem a inter-
ferência do pesquisador.

2) Pesquisa Experimental
Este tipo de pesquisa é usado para resolver problemas bem
específicos, geralmente formulados sob a forma de hipóte-
ses de causa e efeito. Por exemplo, a metodologia que certo
aluno utiliza para estudar uma disciplina do seu curso e sua
reprovação nesta mesma disciplina é influenciada por isto.

Um passo importante no delineamento da pesquisa consiste


na decisão de quem se vai pesquisar. E para isto, temos a
população alvo, que são os elementos para os quais deseja-
mos que as conclusões da pesquisa sejam válidas. Definidos
os objetivos e a população a ser estudada, precisamos pen-
sar em como deverá ser a coleta de dados.

1.7 Dados Estatísticos


Após cuidadoso planejamento e devida determinação das carac-
terísticas do fenômeno que se quer pesquisar, damos início à co-
leta dos dados numéricos necessários à sua descrição.

17
A coleta pode ser direta e indireta.

• A coleta direta é feita sobre elementos informativos de re-


gistro obrigatório, como nascimentos, casamentos e óbitos,
elementos pertinentes aos prontuários dos alunos de uma
escola, ou ainda quando coletados pelo próprio pesquisador
através de inquéritos e questionários, como é o caso das no-
tas de verificação e de exames.

A coleta direta de dados pode ser classificada relativamente


ao fator tempo em:

a) contínua (registro) – quando é feita continuamente, tal


como a de nascimentos e óbitos, a freqüência dos alunos
às aulas;

b) periódica – quando é feita em intervalos constantes de


tempo, como os censos (de 10 em 10 anos), as avaliações
mensais dos alunos;

c) ocasional - quando é feita extemporaneamente, a fim de


atender uma conjuntura ou uma emergência, como no caso
de epidemias que assolam ou dizimam rebanhos inteiros.

• A coleta se diz indireta quando é inferida de elementos co-


nhecidos (coleta direta) e/ou do conhecimento de outros fenô-
menos relacionados com o fenômeno estudado. Como exem-
plo, podemos citar a pesquisa sobre a mortalidade infantil,
que é feita através de dados colhidos por uma coleta direta.

1.8 Análise Crítica dos Dados


Obtidos os dados, eles devem ser cuidadosamente analisados, à
procura de possíveis falhas, imperfeições e erros, a fim de não
incorrermos em erros grosseiros ou de certo vulto, que possam
influir sensivelmente nos resultados.

A crítica é externa quando visa às causas dos erros por parte


do informante, por distração ou má interpretação das perguntas
que lhe foram feitas; é interna quando visa a observar os elemen-
tos originais dos dados da coleta.

18
1.9 Análise Exploratória de Dados
Com os dados adequadamente resumidos e apresentados em ta-
belas e gráficos, podemos observar certos aspectos relevantes e
começar a delinear hipóteses a respeito da estrutura do fenômeno
objeto de estudo. Isto se chama Análise Exploratória de Dados (técni-
cas para extrair informações de conjuntos de dados).

Os dados são a matérias prima da Estatística. Cada observação


individual ou item é denominado como unidade elementar ou
simplesmente unidade. Cada unidade elementar pode estar com-
posta por um ou mais itens medidos, propriedades, atributos etc,
denominados como variáveis.

Variável é uma característica, propriedade ou atributo de uma


unidade da população, cujo valor pode variar entre as unidades
dessa população.

São exemplos de unidades elementares:

• As pessoas, quando descrevemos todos ou parte de seus


atributos, por exemplo: nome, idade, CPF, endereço etc.

• As empresas, quando descrevemos todos ou parte de seus


atributos, por exemplo: razão social, CNPJ, número de fun-
cionários, capital social etc.

• As cidades, por exemplo: número de habitantes, número de


alunos matriculados no Ensino Fundamental, número de
partidos políticos, área etc.

1.10 Classificação dos Dados


Os dados são classificados quanto à sua origem, e temos:

• Dados de Levantamento – São obtidos através da simples


observação de como um fenômeno acontece, provenientes
de uma situação onde não existe nenhum controle sobre os
fatores que influenciam os dados. É o que chamamos tam-
bém de dados secundários, por exemplo: o levantamento
dos dados pessoais de professores e funcionários da Escola
Estadual XX, da cidade YY, no Estado de Santa Catarina.

19
• Dados de Experimento – Têm a finalidade de observar as
relações de causa e efeito que existem entre fenômenos pro-
venientes de uma situação onde existe realmente controle
sobre os fatores que influenciam os dados. É o que chama-
mos também de dados primários, por exemplo: o interes-
se de um aluno em participar em programas de capacita-
ção; o nível de satisfação do aluno em relação a seu curso.

1.11 Tipos de Variáveis


Algumas variáveis, por exemplo, sexo, escolaridade etc. apresentam
como possíveis realizações uma qualidade (ou atributo) dos elemen-
tos pesquisados, ao passo que outras como peso e idade apresentam
como possíveis realizações números resultantes de uma contagem
ou mensuração. As variáveis do primeiro tipo são chamadas quali-
tativas e as do segundo tipo são chamadas quantitativas.

Um pesquisador deve aprender a identificar quatro tipos de variáveis:

• Variáveis Quantitativas se referem a quantidade, isto é, são


medidas numa escala numérica. Estas variáveis podem ser
de dois tipos:
i) Variáveis Discretas, que se referem às variáveis que po-
dem assumir valores inteiros, podendo pertencer a uma
contagem 0, 1, 2, 3 ... Por exemplo: o número de alunos ma-
triculados na turma A da disciplina de Estatística, o núme-
ro de peças com defeito num lote de produção, etc.

ii) Variáveis Contínuas são variáveis não discretas, isto é,


são variáveis que podem assumir qualquer valor do con-
junto dos números reais. Por exemplo: o valor das notas
do aluno XX no semestre YY da UFSC, o valor das vendas
diárias de uma empresa, o consumo mensal de energia
elétrica da Escola Estadual Dona Chiquinha, etc.

• Variáveis Qualitativas não são numéricas, pois somente


podem ser classificadas:
i) Variáveis Nominais são variáveis onde não existe nenhum
ordenamento ou hierarquia. Por exemplo: o estado onde nas-
ceram os alunos matriculados na UFSC; a cidade onde nas-
ceram os servidores técnicos administrativos da UFSC, etc.

20
ii) Variáveis Ordinárias são variáveis onde existe um or-
denamento ou uma hierarquia. Por exemplo: hierarquia
numa empresa: presidente, diretor, gerente etc.; resposta a
um questionário de pesquisa onde existe uma escala: bom,
regular e ruim; as posições das 10 melhores instituições de
ensino superior: primeira, segunda etc.

Para melhor entendermos os tipos de variáveis, vejamos um exemplo.

Exemplo 1.1. No quadro abaixo, um pesquisador registrou parte


do cadastro de funcionário da Escola Estadual Resplendor. Pede-se:
identificar as unidades elementares e as variáveis desse cadastro.

Escolari-
Nome Idade Cargo Sexo Peso
dade
João Paulo 36 Supervisor Escolar M 68 kg 1o Grau
Ana Cristina 29 Secretária F 71 kg 2o Grau
Alex Pereira 39 Chefe de expediente M 65 kg 1o Grau
Paulo José 26 Analista de Sistema M 74 kg 3o Grau

Quadro 1.1

Resposta. Como os dados coletados se referem aos funcionários


da Escola Estadual Resplendor, as unidades elementares são os
referidos funcionários da Escola; isto é, cada funcionário regis-
trado no quadro acima é uma unidade elementar. As variáveis
são as propriedades ou atributos dos funcionários que variam
entre si, por exemplo: idade, cargo, etc.

De um modo geral, para cada elemento investigado, tem-se asso-


ciado um resultado (ou mais de um resultado) correspondente à
realização de certa variável (ou variáveis). No exemplo em ques-
tão, considerando-se a variável sexo, para cada funcionário temos
associada a realização masculino(M) ou feminino(F). Observa-
mos que o pesquisador colheu informações sobre seis variáveis:
nome, idade, cargo, sexo, peso e escolaridade.

Quanto aos tipos de variáveis, temos:

• Nome: variável quantitativa contínua;

21
• Idade: variável quantitativa contínua;
• Cargo: variável qualitativa ordinal;
• Sexo: variável qualitativa ordinal;
• Peso: variável quantitativa continua;
• Escolaridade: variável qualitativa ordinal.

Na descrição das variáveis envolvidas numa pesquisa, devemos


incluir a escala (ou unidade) em que serão mensuradas.

1.12 Mensuração de uma Variável


Muitas características podem ser mensuradas de várias formas,
e nem sempre fica evidente qual delas é a mais apropriada. Por
exemplo, vamos procurar levantar o nível de satisfação de um
servidor técnico-administrativo com a política de trabalho na
UFSC fazendo a ele duas perguntas:

• Primeira

Em termos de trabalho que você exerce no seu serviço, você se sente:

( ) muito satisfeito ( ) pouco satisfeito ( ) insatisfeito

• Segunda

Dê uma nota de 0 (zero) a 10 (dez), relativa ao seu grau de satisfa-


ção com o trabalho que você exerce no seu serviço.

Nota: _________.

A primeira pergunta está associada a uma variável qualitativa, pois o


servidor técnico-administrativo deve atribuir uma resposta dentre as
três qualidades apresentadas, e como existe uma ordenação do nível
de satisfação nas três opções, temos uma variável qualitativa ordinal.

Na segunda pergunta, tenta-se mensurar a característica satisfação


quantitativamente, onde o servidor técnico-administrativo vai atri-
buir um valor, que ele julga ser sua satisfação, na escala de 0 a 10.

A decisão de como medir determinada característica depende de


vários aspectos, mas é sempre recomendável verificar se a men-

22
suração proposta leva aos objetivos da pesquisa.

Em muitas situações, não precisamos ir até os elementos da popu-


lação para obter os dados, pois para isto podemos utilizar a coleta
direta ou a coleta indireta. Quando os dados forem levantados
diretamente dos elementos da população sua coleta deve ser feita
de forma organizada, e pra isto construímos um instrumento que
chamamos de questionário.

1.13 Instrumento de Coleta de Dados


Com os objetivos da pesquisa e a população a ser estudada defi-
nidos, apresentamos, a seguir, alguns procedimentos para a cons-
trução de um questionário.

1) Separar as características a serem levantadas.


Por exemplo, o objetivo geral da pesquisa é conhecer melhor
a relação de um aluno da UFSC com o curso em que está
matriculado (digamos Licenciatura em Matemática). Preci-
samos especificar melhor o que queremos conhecer dos alu-
nos, ou seja, os objetivos específicos, tais como:

a) conhecer o tempo médio dos alunos para a conclusão do


curso;

b) verificar a disciplina em que existe um número excessivo


de reprovação em cada semestre;

c) verificar o interesse dos alunos pelo curso, evitando


com isto o abandono;

d) avaliar o grau de satisfação do aluno com o curso;

e) levantar pontos positivos e negativos do curso, segundo


sua visão.

Com isto, temos as seguintes características a serem levanta-


das dentre os alunos do Curso de Licenciatura em Matemá-
tica da UFSC: o tempo de conclusão do curso; a disciplina
que mais reprova por semestre; o grau de satisfação com o
curso; o interesse do aluno pelo curso e pontos positivos e
negativos do curso, segundo a visão do aluno.

23
2) Fazer uma revisão bibliográfica para verificar como men-
surar adequadamente algumas características.
No nosso exemplo, queremos avaliar o grau de satisfação do
aluno com o seu curso. Devemos procurar referências biblio-
gráficas que nos orientem sobre como medir a satisfação.

3) Estabelecer a forma de mensuração das características das


variáveis a serem levantadas.
Para variáveis quantitativas, devem estar bem definidas as
unidades de medida (semestre, metros, kg, etc) que devem
acompanhar as respostas. Para as variáveis qualitativas,
deve haver uma lista completa de alternativas, tais como:
outros, não têm opinião, etc. Por exemplo, o tempo de con-
clusão do curso pode ser observado quantitativamente em
semestres de estudos na UFSC.

4) Elaborar uma ou mais perguntas para cada característica a


ser observada.
A característica grau de satisfação do aluno com o curso
pode ser avaliada sob vários enfoques, como, por exemplo,
satisfação com o corpo docente do semestre, laboratórios de
informática disponíveis, biblioteca setorial disponível, etc.
Estes itens podem ser avaliados isoladamente, num mesmo
tipo de escala.

5) Verificar se a pergunta está suficientemente clara.


As perguntas devem ser formuladas numa linguagem que
não deve deixar dúvidas de interpretação.

O questionário deve ser feito de forma a facilitar a análise dos da-


dos, deve ser completo, no sentido de abranger as características
necessárias para atingir os objetivos da pesquisa e não deve ter
perguntas que fujam destes objetivos.

Apresentaremos a seguir um exemplo hipotético de um questio-


nário que foi aplicado aos alunos de certa instituição de ensino,
fornecendo as seguintes informações

1) Id: Identificação do alunos;

2) Turma: Turma em que o aluno foi alocado (A ou B);

24
3) Sexo: F se feminino, M se masculino;

4) Idade: Idade em anos;

5) Altura: Altura em metros;

6) Peso: Peso em quilogramas;

7) Filhos: Número de filhos;

8) Gosta: Identifica se o aluno gosta ou não de prati-


car atividades físicas;

9) N vez: Número de vezes que pratica atividades físi-


cas, por semana;

10) Est. Civ.: Estado civil;

11) Pratic.: Identifica se o aluno pratica ou não algum


esporte;

12) Qual: Em caso afirmativo, identifica qual o esporte


que o aluno pratica.

Com base nestas informações, apresentamos o questionário apli-


cado aos alunos da sua instituição de ensino:

• Questionário

Este questionário faz parte de um trabalho de pesquisa da disci-


plina de Estatística. Não há necessidade de colocar seu nome, pois
os questionários são anônimos. Agradecemos sua colaboração em
responder correta e francamente os diversos itens. Os resultados
da pesquisa ficarão disponíveis para a comunidade científica.

1) Id:________

2) Turma: ( ) A ( )B

3) Sexo: ( ) Masc. ( ) Fem

4) Idade: _________ anos

5) Altura: _________ m

6) Peso: __________ kg

7) Número de filhos: __________

25
8) Gosta de praticar atividades físicas? ( ) Sim ( ) Não

9) Quantas vezes por semana pratica atividade física? _____

10) Estado civil: ( ) Solteiro ( ) Casado ( ) Divorciado

11) Pratica algum esporte? ( ) Não ( ) Sim

12) Se sim, qual? _______________________________

Depois de os dados terem sido coletados, precisamos organizá-


los, para facilitar a realização da análise. Tomemos o primeiro
questionário respondido.

1) Id: 1_

2) Turma: ( x ) A ( )B

3) Sexo: ( x ) Masc. ( ) Fem

4) Idade: 30,5_ anos

5) Altura: 1,72_ m

6) Peso: 74,6_ kg

7) Número de Filhos: __0___

8) Gosta de praticar atividades físicas? ( x ) Sim ( ) Não

9) Quantas vezes por semana pratica atividade física? __2__

10) Estado Civil: ( ) Solteiro ( x ) Casado ( ) Divor-


ciado

11) Pratica algum esporte? ( ) Não ( x ) Sim

12) Se sim, qual? __Natação_

É comum armazenar os dados num quadro, onde cada coluna se re-


fere a uma variável e cada linha a um respondente. O quadro abaixo
mostra os dados armazenados dos dez primeiros respondentes.

26
1 2 3 4 5 6 7 8 9 10 11 12
Id. Turma Sexo Idade Altura Peso Filhos Gosta N° vez Est civil Pratica Qual
1 A Mas 30,5 1,72 74,6 0 Sim 2 Cas Sim Nat
2 A Fem 35,7 1,62 62,8 0 Não 2 Solt Sim Nat
3 B Mas 23,4 1,68 80,2 1 Sim 1 Divor Sim Fut
4 B Mas 27,2 1,69 64,8 0 Sim 5 Solt Sim Bas
5 A Fem 32,1 1,63 36,9 0 Não Nen Solt Não Nen
6 B Fem 23,6 1,62 65,3 0 Sim 2 Solt Sim Vol
7 A Fem 30,6 1,72 62,7 2 Sim 3 Cas sim Fut
8 B Fem 22,7 1,83 71,7 1 Sim 2 Cas Sim Nat
9 A Mas 25,5 1,83 109,2 1 Sim Nen Solt Não Nen
10 B Fem 21,8 1,52 58,2 1 Sim Nen Dolt Não Nen
Quadro 1.2

Nas pesquisas científicas, quando queremos conhecer algumas


características de certa população, basta observamos apenas uma
amostra de seus elementos e, a partir dos resultados dessa amostra,
obter estimativas para as características populacionais de nosso in-
teresse e isto nós chamamos de levantamento por amostragem.

Geralmente, temos o interesse em descrever certas característi-


cas dos elementos da população (chamados de parâmetros). Por
exemplo, para planejar políticas de recursos humanos na UFSC,
podemos realizar uma pesquisa para avaliar alguns parâmetros
da população dos alunos matriculados na UFSC, no semestre
2005/1, tais como: tempo médio de conclusão de seu curso, por-
centagem de alunos vindos de outros estados da federação, por-
centagem de alunos oriundos do interior do Estado de Santa Ca-
tarina, porcentagem de alunos matriculados nos cursos de EaD
do Centro de Ciências Físicas e Matemáticas.

1.14 Plano de Amostragem


Após termos bem definidos os objetivos da pesquisa fazemos um
plano de amostragem, e para isto precisamos da população a ser
amostrada e dos parâmetros. Num plano de amostragem deve
constar a definição da unidade da amostragem, ou seja, a unidade a
ser selecionada para chegar aos elementos da população, que po-

27
dem ser os próprios elementos da população; a forma de seleção dos
elementos da população feita sob a forma de sorteio (são as amostras
aleatórias) e o tamanho da amostra. Por exemplo, numa população
de alunos matriculados na UFSC, residentes em Florianópolis,
podemos planejar a seleção dos alunos com domicílios residen-
ciais na ilha ou no continente. Chegando ao domicílio (unidade
de amostragem), podemos chegar aos estudantes domiciliados na
ilha (elemento da população).

1.15 Amostra Aleatória Simples


Para a seleção de uma amostra aleatória simples precisamos ter uma
lista completa dos elementos da população (ou de unidades de amos-
tragem apropriadas). Para calcularmos o tamanho de uma amostra
aleatória simples precisamos de alguns conceitos, tais como:

• Parâmetros: são usados para designar alguma característica


dos elementos da população;

• Estatística: característica descritiva dos elementos da amos-


tra. Por exemplo, na população dos servidores técnicos ad-
ministrativos da UFSC, a porcentagem dos servidores que
possuem o nível superior é um parâmetro. Numa amostra
de 300 destes servidores técnicos administrativos, a porcen-
tagem dos que possuem o nível superior, nesta amostra, é
uma estatística e encontramos 70% dos servidores técnicos
administrativos que possuem o nível superior (chamada de
estimativa do referido parâmetro).

• Erro amostral tolerável: é quanto o pesquisador admite er-


rar na avaliação dos parâmetros de interesse. Por exemplo,
na divulgação de pesquisas eleitorais feitas por órgãos es-
pecializados, no relatório apresentado “o erro da presente
pesquisa é de 3%”. Isto significa dizer que, na pesquisa de
intenção de votos que determinado candidato tem é de 30%
de preferência dos eleitores entrevistados, na verdade a pre-
ferência por este candidato é um valor no intervalo de 27%
a 33%, isto é, 30% ± 3%.

De posse destes conceitos, sejam:

• N = tamanho (número de elementos) da população;

28
• n = tamanho (número de elementos) da amostra;
• n0 = uma primeira aproximação para o tamanho da amostra;
• E0 = erro amostral tolerável.

Um primeiro cálculo do tamanho da amostra, n0 , sem conhecer o


tamanho N da população, é dado pela fórmula
1
n0 = 2 .
E0
Conhecendo o tamanho N da população, corrigindo o cálculo an-
terior, temos
N
n= 2 .
E0 × N + 1
Vamos a alguns exemplos de aplicação.

Exemplo 1.3. Planeja-se um levantamento por amostragem para


avaliar diversas características da população N = 600 alunos ma-
triculados na UFSC, no semestre de 2005/1. Estas características
(parâmetros) são do tipo porcentagens: porcentagem dos alunos
matriculados no Curso de Licenciatura em Matemática, porcenta-
gem dos alunos matriculados no Curso de Medicina, porcentagem
dos alunos matriculados no Curso de Medicina com domicílio re-
sidencial em Florianópolis, porcentagem dos alunos matriculados
no Curso de Licenciatura de Matemática oriundos do interior do
Estado de Santa Catarina, etc. Qual deve ser o tamanho mínimo
de uma amostra aleatória simples, tal que o erro amostral não seja
superior a 5% ?

Resolução. Os dados do exemplo são: N = 600 e E0 = 5% = 0, 05 .

Uma primeira aproximação para o tamanho da amostra é


1 1 1
n0 = 2 ⇒ n0 = 2
= = 400 ,
E0 (0, 05) 0, 0025
ou seja, uma amostra de 400 alunos.

Corrigindo, em função do tamanho N da população, temos


N 600 600 600
n= 2 ⇒n= = = = 240 ,
E0 × N + 1 0, 0025 × 600 + 1 1,5 + 1 2,5
ou seja, uma amostra de 240 alunos.

29
Portanto, o tamanho mínimo de uma amostra aleatória simples,
tal que o erro amostral não seja superior a 5% é de 240 alunos.

Exemplo 1.4. Considerando-se os objetivos e os valores do exem-


plo 1.3, qual deveria ser o tamanho da amostra se a pesquisa fosse
ampliada para todos os alunos matriculados na UFSC, no semes-
tre de 2005/1, digamos, N = 23.000 alunos?

Resolução. Uma primeira aproximação para o tamanho da amos-


tra continua sendo n0 = 400 alunos. Fazendo a correção em ter-
mos do novo valor de N = 23.000 , vem
23.000 23.000
n= = = 393,16 ⇒ n = 393 .
0, 0025 × 23.000 + 1 58,5
Portanto, o tamanho da amostra se a pesquisa fosse amplia-
da para todos os alunos matriculados na UFSC, no semestre de
2005/1, N = 23.000 alunos, é de 393 alunos.

No exemplo 1.3, com a correção em temos do tamanho N da po-


pulação, praticamente não foi alterado o cálculo inicial do tama-
nho da amostra ( n0 = 400 e n = 393 ). Geralmente, se a população
for muito grande, o cálculo do tamanho da amostra pode ser feito
pela equação
1
n = n0 = 2 ,
E0
sem considerar o tamanho exato N da população.

Considerando os estudos feitos até o final dessa seção, atenda aos


exercícios propostos:

Exercícios Propostos
1) Numa pesquisa para estudar se o povo brasileiro confia no
atual presidente da república, diante dos fatos de denúncias de
corrupção e as CPIs, qual o tamanho de uma amostra aleatória
simples de pessoas (maiores de 18 anos) que garanta um erro
amostral não superior a 3%?

Resposta: 1.111 pessoas.

30
2) A UFSC com, digamos, 3.500 servidores técnicos administrati-
vos, numa política de recursos humanos, deseja estimar a porcen-
tagem de servidores favoráveis a certo tipo de capacitação para o
seu tipo de trabalho. Qual deve ser o tamanho de uma amostra ale-
atória simples que garanta um erro amostral não superior a 2%?

Resposta: 1.458 servidores.

3) O objetivo geral da pesquisa é conhecer melhor a relação de um


aluno da UFSC com o curso em que está matriculado (digamos Licen-
ciatura em Matemática). Precisamos especificar melhor o que quere-
mos conhecer dos alunos, ou seja, os objetivos específicos, tais como:

a) conhecer o tempo médio dos alunos para a conclusão do


curso;

b) verificar a disciplina em que existe um número excessivo de


reprovação em cada semestre;

c) verificar o interesse dos alunos pelo curso, evitando com


isto o abandono;

d) avaliar o grau de satisfação do aluno com o curso;

e) levantar pontos positivos e negativos do curso, segundo sua


visão.

Defina as variáveis de cada um dos objetivos específicos acima.


Verificar qual delas são qualitativas e quais são quantitativas.

Respostas:

a) Variável quantitativa contínua.

b) Variável qualitativa ordinal.

c) Variável qualitativa ordinal.

d) Variável qualitativa ordinal.

e) Variável qualitativa ordinal.

31
4) Considerando a população dos alunos do quarto semestre (4ª
fase) do Curso de Licenciatura (noturno) em Matemática da UFSC,
semestre 2005/1, completar as definições das seguintes variáveis e
verificar quais são qualitativas e quais são quantitativas.

a) Turma;

b) Sexo;

c) Idade;

d) Altura;

e) Peso;

f) Filhos;

g) Est. Civ..

Resposta:

a) Variável qualitativa ordinal.

b) Variável quantitativa contínua.

c) Variável quantitativa contínua.

d) Variável quantitativa contínua.

e) Variável quantitativa contínua.

f) Variável qualitativa ordinal.

g) Variável qualitativa ordinal.

Resumo
Neste capítulo, você teve a oportunidade de estudar e compre-
ender os conceitos de Estatística, população e amostra, campo de
aplicação e também o conceito de Estatística Descritiva.

Você deve ter compreendido também o significado de dados esta-


tísticos, análise crítica dos dados, análise exploratória de dados e
classificação dos dados, análise dos tipos de pesquisas e tipos de
variáveis, e aprendeu como mensurar uma variável e um instru-
mento de coleta de dados (o questionário). Além disso, estudou e
compreendeu amostra aleatória simples.

32
Resta mencionar que a compreensão, sempre referida, é impor-
tante para que você possa acompanhar o curso. Se você teve al-
guma dúvida, releia todo o capítulo, já que tudo que veremos a
seguir depende dos conceitos abordados neste capítulo. Consulte
o tutor do pólo sempre que achar necessário.

Bibliografia Comentada

BARBETTA, Pedro Alberto. Estatística aplicada às Ciências Sociais,


5 ed., Ed. da UFSC: Florianópolis, 2002.
O livro apresenta uma introdução à estatística, e uma orientação
de como planejar e conduzir uma pesquisa. Todos os capítulos se
iniciam com alguns problemas práticos para motivar a introdução
de técnicas estatísticas.

33
2 Organização de Dados, Gráficos
e Distribuição de Freqüência

35
2 Organização de Dados, Gráficos
e Distribuição de Freqüência

O objetivo deste capítulo é mostrar, após a coleta de dados,


como organizá-los em tabelas e em gráficos. Vamos estu-
dar também a distribuição de freqüência ou tabela de fre-
qüência em intervalos de classe. Além disso, elaboraremos
o histograma e o polígono de freqüência.

Os PCN indicam que a coleta, a organização e a descrição dos


dados são procedimentos utilizados com muita freqüência na
resolução de problemas e estimulam as crianças a fazer per-
guntas, estabelecer relações, construír justificativas e desenvol-
ver o espírito de investigação. Ressaltam a necessidade de cal-
cular medidas estatísticas, sem se preocupar em enfatizar que
o mais importante é saber o que cada medida significa e não
simplesmente efetuar seus cálculos. Os gráficos fornecem uma
visualização mais sugestiva do que as tabelas. Constituem-se
numa forma alternativa de representação de distribuição de
freqüências. Uma distribuição de freqüências pode ser repre-
sentada graficamente por histograma de freqüência, polígono
de freqüência, gráfico de barras, gráfico de setores e diagrama
de pontos, etc. Construímos qualquer um dos gráficos enume-
rados utilizando o primeiro quadrante do sistema de eixos co-
ordenados cartesianos ortogonais.

2.1 Variáveis
Sempre que desejamos simbolizar os elementos de uma popula-
ção, utilizamos as variáveis, representadas por letras (a, b, x, y, ...) ,
que podem assumir o valor de cada elemento desta população.

De uma maneira geral, quando a variável representa dados de


uma enumeração ou contagem, chama-se variável discreta. Quan-
do ela representa dados de uma medição diz-se variável contínua.
Por exemplo:

37
• o número de peças defeituosas produzidas por uma fábrica
poderá ser 0, 1, 2, ... e não 1,6 ou 3,17 . Assim, este número
é representado por uma variável discreta;
• o peso de uma pessoa poderá ser 74,8 kg ou 74,796 kg , con-
forme a precisão da balança utilizada. Este peso é, então,
representado por uma variável contínua.

2.2 Coleta dos Dados


Quando falamos em coleta dos dados devemos separá-los em dois
métodos ou fontes: coleta de dados primários (diretos), quando o
pesquisador coleta os dados na fonte originária, e coleta de dados
secundários (indiretos), no caso contrário.

Explicando melhor: quando o IBGE faz o levantamento (censo) da


população brasileira, normalmente utiliza o processo primário ou
direto. Caso queira, com base nos censos anteriores, projetar esta
mesma população, estará utilizando o método secundário ou indi-
reto (pois os dados já foram obtidos anteriormente).

• Apuração dos dados

Após a coleta dos dados, torna-se necessária a tabulação, ou seja,


sua apuração ou contagem. Para tanto, de posse dos dados (sobre
o mesmo fenômeno), devemos ordená-los mediante critérios de
classificação. Estas classificações podem ser efetuadas mecânica
ou manualmente. Estas operações podem ser ainda:

a) totais ou parciais;

b) simples ou cruzadas.

Depois dos dados estarem tabulados, ou apurados, eles podem


ser apresentados em:

a) tabelas ou quadros;

b) gráficos.

• Análise, Interpretação e Conclusão dos Dados

De todas as fases do método estatístico, esta é a que apresenta


maior importância. Isto por que todo trabalho efetuado até o

38
momento deixará de ter o valor devido, se a conclusão não es-
tiver coerente.

Não existe, portanto, um critério a ser utilizado nesta fase. É ne-


cessário que o analisador tenha muita sensibilidade com os dados
que ora estão sendo manipulados.

Em resumo, podemos entender que as fases do trabalho estatís-


tico necessitam de planejamento, coleta, crítica, apuração, expo-
sição e interpretação.

• Organização de Dados em Tabelas

A tabela é um quadro que resume um conjunto de observações


colocadas em linhas e colunas e distribuídas de modo ordenado.

Um grupo de informações pode ser escrito na forma de uma ta-


bela, para facilitar a compreensão.

O planejamento de uma tabela requer alguma experiência. A


manipulação destas tabelas pelo estatístico faz com que a cada
dia este profissional fique mais familiarizado com elas. É im-
portante ressaltar que os seguintes pontos devem ser observa-
dos na construção das tabelas:

i) A tabela deve ser auto-explicada. Deve incluir seu título e


todas as notas julgadas explicativas.

ii) O título e os cabeçalhos das colunas e linhas devem ser


claros e concisos, sem a possibilidade de interpretação
ambígua.

iii) O título deve explicitar o objetivo, o lugar e o tempo da


classificação.

Um dos objetivos da Estatística é sintetizar os valores que uma


ou mais variáveis podem assumir, para que tenhamos uma visão
global da variação dessas variáveis. E isto é possível pela apre-
sentação desses valores em tabelas e gráficos, que nos fornecerão
informações rápidas e seguras a respeito das variáveis em estudo,
permitindo-nos determinações administrativas e pedagógicas
mais coerentes e científicas.

39
Uma tabela compõe-se de:

• título: O título deve responder as seguintes questões:


a) o que? (referente ao fato);

b) onde? (relativo ao lugar);

c) quando? (correspondente à época).

• cabeçalho: Parte superior da tabela, que especifica a nature-


za do conteúdo das colunas.
• corpo: Conjunto de linhas e colunas que contêm informa-
ções sobre a variável em estudo.
• linhas: Partes do corpo que contêm uma seqüência horizon-
tal de informações.
• colunas: Partes do corpo que contêm uma seqüência verti-
cal de informações.
• coluna indicadora: Parte da tabela que contém as discrimi-
nações correspondentes aos valores distribuídos pelas colu-
nas numéricas.
• casa ou célula: Parte da tabela formada pelo cruzamento de
uma linha com uma coluna.
• Rodapé: Espaço reservado para colocar as observações per-
tinentes, a identificação da fonte dos dados, as notas e as
chamadas.
• notas e chamadas: São esclarecimentos contidos na tabela:
a) nota – conceituação geral;

b) chamada – esclarecimento de minúcias em relação a uma


célula).

Exemplo 2.1 . Feito o levantamento (em termos percentuais) do


reajuste de salários dos professores de ensino fundamental e en-
sino médio da Escola Prof. Fortunato Siqueira, do município XX,
no estado de Santa Catarina, no período de 1996 a 2005, obteve-se
a seguinte tabela:

40
Reajuste de salários dos professores de ensino fundamental e ensino mé-
dio da Escola Prof. Fortunato Siqueira, do município XX, estado de Santa
Catarina, no período de 1996 a 2005
Anos Reajuste Salarial (%)
1996 12,2
1997 11,4
1998 13,0
1999 10,4
2000 2,8
2001 5,9
2002 6,7
2003 10,9
2004 9,3
2005 8,7

Tabela 2.1
Fonte: Dados Hipotéticos

2.3 Gráficos
Os gráficos assumem papel fundamental em qualquer campo da
ciência. Seja na Física, na Química, na Biologia, na Medicina, na
Engenharia, na Estatística e em outras.

O gráfico pode retratar as análises das situações atuais ou de


históricos, e também pode fazer previsões. Sua utilização na
estatística é de suma importância, visto que praticamente todo
relatório analítico vem acompanhado de gráficos ilustrativos.
Isto facilita a interpretação rápida do fenômeno que se analisa.
Mas, para que esta afirmação se torna válida, é necessário se-
guir certas normas para elaboração correta e precisa dos grá-
ficos. Se isto não ocorrer, poder-se-á ter uma visão distorcida,
ou mesmo errônea, do fenômeno estudado. Basicamente, de-
vemos levar em consideração três características para a cons-
trução de um gráfico: simplicidade, clareza e veracidade.

41
2.3.1 Tipos de Gráficos
Existem vários tipos de gráficos que são classificados a seguir:

i) gráfico de linha;

ii) diagrama ou gráfico de barras;

a) barras simples;

b) barras horizontais;

c) barras superpostas;

d) barras complementares;

iii) gráficos em setores (setograma);

iv) gráfico ilustrativo, figuras (pictograma);

v) gráfico polar;

vi) mapas (cartograma);

vii) estereogramas (representação em três dimensões);

viii) diagrama de área (proporcionalidade entre itens diagra-


mas e as áreas de quadrados e círculos).

• Gráfico de linha

Exemplo 2.2. A tabela seguinte mostra a evolução do número


de alunos do ensino médio matriculados na Escola Dona Ben-
ta, do Município YY, estado de Santa Catarina, no período de
1996 a 2005

Evolução do número de alunos do ensino médio matriculados na Escola


Dona Benta, do Município YY, estado de Santa Catarina, no período de
1996 a 2005
Anos Número de alunos matriculados
1996 1.308
1997 1.308
1998 1.433
1999 2.066
2000 2.574
2001 3.222

42
2002 3.222
2003 3.222
2004 3.222
2005 3.222

Tabela 2.2
Fonte: Dados Hipotéticos

Temos o seguinte gráfico de linha da tabela acima:


3.300
3.200
3.100
3.000
2.900
2.800
2.700
2.600
Número de alunos matriculados

2.500
2.400
2.300
2.200
2.100
2.000
1.900
1.800
1.700
1.600
1.500
1.400
1.300
1.200
1.100
1.000 Anos
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Gráfico 2.1
Fonte: Dados Hipotéticos

• Gráfico de barras

No gráfico de barras, cada categoria é representada por uma bar-


ra de comprimento proporcional à sua freqüência, conforme iden-
tificação no eixo horizontal.

Exemplo 2.3. Um pesquisador obteve informações sobre o grau


de instrução de uma amostra de 36 funcionários da Escola Esta-
dual Primavera, em Florianópolis no ano de 2005, conforme qua-
dro a seguir:

43
Número Grau de instrução
1 1o grau
2 1o grau
3 1o grau
4 2o grau
5 1o grau
6 1o grau
7 1o grau
8 1o grau
9 2o grau
10 2o grau
11 2o grau
12 1o grau
13 2o grau
14 1o grau
15 2o grau
16 2o grau
17 2o grau
18 1o grau
19 superior
20 2o grau
21 2o grau
22 2o grau
23 1o grau
24 superior
25 2o grau
26 2o grau
27 1o grau
28 2o grau
29 2o grau
30 2o grau
31 superior
32 2o grau

44
33 superior
34 superior
35 2o grau
36 superior
Quadro 2.1

O gráfico de barras da amostra dos 36 funcionários da Escola Es-


tadual Primavera, conforme quadro acima, segundo o grau de
instrução, é dado abaixo:
Grau de instrução dos funcionários da
Escola Estadual Primavera

Superior
Segundo
Grau
Primeiro
Grau
0 3 6 9 12 15 18 21
Número de funcionários

Gráfico 2.2

• Gráfico de setores

Este gráfico é constituído com base em um círculo, e é empregado


sempre que desejamos ressaltar a participação do dado em relação ao
total. O total é representado pelo círculo, que fica dividido em tantos
setores quantas são as partes. Os setores são tais que suas áreas são
proporcionais aos dados. Cada setor é obtido por meio de uma regra
de três simples e direta, lembrando que o total corresponde a 3600 .

Exemplo 2.4.

Receita do Município XX de 2001 a 2003


Anos Receita (em R$1.000,00)
2001 90
2002 120
2003 150
Total 360

Tabela 2.3
Fonte: Secretaria de Finanças do Município XX

45
Receita do Município XX de 2001 a 2003

2003 2001
33% 34%

2002
33%
Gráfico 2.3

• Diagrama de pontos

Este diagrama é utilizado quando os dados consistem em um peque-


no conjunto de números. Podem ser representados traçando-se uma
reta com uma escala que abranja todas as mensurações observadas e
marcando-se as respectivas freqüências como ponto acima da reta.

Exemplo 2.5. Consideremos os tempos, em segundos, que os alu-


nos da turma A demoram para responder questões de múltipla
escolha de uma avaliação de Estatística: 2, 6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4,
5, 18. Construir o diagrama de pontos correspondente.

Resolução. Marcando numa reta os tempos correspondentes,


temos o seguinte gráfico:

Gráfico 2.4

Note que os valores tendem a se agrupar, em torno de 3, 4, 5


ou 6, com exceção do valor 18, que se afasta grandemente do
conjunto. Casos como este, com valores extremos ou erráticos,
devem ser sempre investigados, com vistas a uma explicação,
e para que se determine se os extremos devem ou não ser ex-
cluídos do conjunto.

Vamos conferir se você está acompanhando tudo até aqui? Para


saber, procure atender aos exercícios propostos abaixo.

46
Exercícios Propostos
1) Consideremos os dados relativos ao aproveitamento dos
alunos na disciplina de Estatística, turma 404 no Curso de Ma-
temática-EaD-UFSC, período 2005.1 apresentados abaixo.

Classificação dos alunos de Estatística, turma 404 em EaD da UFSC


Classificação Fraca Razoável Média Boa Excelente Total
Número de alunos 2 4 20 10 4 40
Porcentagem 5 10 50 25 10 100

Tabela 2.4

Representar esses dados em:

a) um gráfico de barras horizontais,

b) em um gráfico de setores, usando os valores das freqüências


relativas.

Respostas:

a) Gráfico em barras horizontais.


Clasificação dos alunos de Estatística Turma 404

Excelente

Boa
Média
Razoável

Fraca
0 10 20 30 40 50 60
Porcentagem
Gráfico 2.5

b) Gráfico em setores.
Clasificação dos alunos de Estatística Turma 404

Excelente Fraca
10% 5%
Razoável
10%
Boa
25%

Média
50%
Gráfico 2.6

47
2.4 Distribuição de Freqüências
Entre as séries estatísticas, merece referência especial a distribui-
ção de freqüência. Uma distribuição de freqüência é uma tabela,
na qual os possíveis valores de uma variável se encontram agru-
pados em classes, registrando-se o número de valores observados
em cada classe. Os dados organizados em uma distribuição de
freqüência são chamados dados agrupados. Praticamente se resu-
me na maneira de ordenar os dados estatísticos em linha ou co-
lunas, tornando possível sua leitura, tanto no sentido horizontal
quanto vertical. Isto quer dizer que, dada uma grande quantidade
de dados, geralmente não organizados, costumamos distribuí-los
em classes ou categorias, denominando o número de indivíduos
pertencentes a cada uma delas. A este número damos o nome de
freqüência da classe.

• Tabela de Freqüência

Quando se estuda uma variável, o maior interesse do pesquisador


é conhecer a distribuição dessa variável através de suas possíveis
realizações (valores), isto é, organizar os dados de acordo com a
freqüência com que ocorrem.

Estaturas de 40 alunos (em cm) da Escola Estadual “Esperança”, semestre


2005/1

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

Tabela 2.5

Esse tipo de tabela, cujos elementos não foram numericamente


organizados, denominamos tabela primitiva.

A partir dos dados acima - tabela primitiva - é difícil averiguar


em torno de que valor tende a concentrarem-se as estaturas, qual
a menor ou qual a maior estatura, ou, ainda, quantos alunos se
acham abaixo ou acima de uma dada estatura.

48
Assim, conhecidos os valores de uma variável, é difícil formar-
mos uma idéia exata do comportamento do grupo como um todo
a partir dos dados não ordenados.

A maneira mais simples de organizar os dados é através de certa


ordenação (crescente ou decrescente). A tabela obtida após a orde-
nação dos dados se denomina rol.

Estatura de 40 alunos (em cm) da Escola Estadual “Esperança“


150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Tabela 2.6

Agora, podemos saber, com relativa facilidade, qual a menor esta-


tura (150 cm) e qual a maior (173 cm), que a amplitude de variação
foi de 173 − 150 = 23 cm e, ainda, a ordem que um valor particu-
lar da variável ocupa no conjunto. Com um exame mais acurado,
vemos que há uma concentração das estaturas em algum valor
entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo
de 155 cm e acima de 170 cm.

No exemplo que trabalhamos, a variável em questão, estatura,


será observada e estudada muito mais facilmente quando dispu-
sermos os valores ordenados em uma coluna e colocarmos, ao
lado de cada valor, o número de vezes que ele aparece repetido.

O número de alunos, que fica relacionado a um determinado va-


lor da variável, denominamos freqüência. Obtemos, assim, uma
tabela, que recebe o nome de distribuição de freqüência.

Se um dos intervalos for, por exemplo, [154,158 ) ou 154 A 158, ao


A notação A se aplica a invés de dizermos que a estatura de 1 aluno é de 154 cm, de 4 alu-
intervalos semi-fechados à nos, 155 cm, de 3 alunos, de 156 cm, e de 1 aluno, 157 cm, diremos
esquerda (ou semi-aberto à
direita).
que 9 alunos têm estaturas entre 154, inclusive, e 158 cm.

Deste modo, agruparemos os valores da variável em intervalos, sen-


do que, em Estatística, preferimos denominar classes aos intervalos.

49
Chamando de freqüência de uma classe o número de valores
da variável pertencentes à classe, os dados acima podem ser dis-
postos na tabela abaixo, denominada distribuição de freqüência
com intervalos de classe.

Estatura de 40 alunos (em cm) da Escola Estadual “Esperança“, semestre


2005/1
Estaturas (cm) Freqüências
150 A 154 4

154 A 158 9

158 A 162 11

162 A 166 8

166 A 170 5

170 A 174 3
Total 40

Tabela 2.7
Fonte: Dados Hipotéticos

Para construirmos uma tabela de distribuição de freqüência com


intervalos de classe, necessitamos dos seguintes elementos:

• Classe

Classes de freqüência, ou simplesmente classes, são intervalos de


variação da variável. As classes são representadas simbolicamen-
te por i, sendo i = 1,2,3,...,k (onde k é o número total de classes de
distribuição).

Assim, em nosso exemplo, o intervalo 154 A 158 define a segunda


classe (i = 2) e, como a distribuição é formada de seis classes, po-
demos afirmar que k = 6.

Para a determinação do número de classes de uma distribuição


podemos lançar mão da REGRA DE STURGES, que nos dá o nú-
mero de classes em função do número de valores da variável:

i = 1 + 3,3 × log n
onde:

50
i = número de classes;
n = número total de dados.

• Limites de classe

Aos extremos de cada classe denominamos limites de classe. O


menor número é o limite inferior da classe ( li ), e o maior número
é o limite superior da classe ( Li ).

Na segunda classe, por exemplo, temos l2 = 154 e L2 = 158 .

• Amplitude de um intervalo de classe

Amplitude de um intervalo de classe, ou simplesmente intervalo


de classe, é a medida do intervalo que define a classe. Ela é obtida
pela diferença entre os limites superior e inferior dessa classe, e
será indicada por hr . Assim:
hr = Lr − lr .

No nosso exemplo, temos


h2 = L2 − l2 = 158 − 154 = 4 ⇒ h2 = 4 cm.

• Amplitude total da distribuição

Amplitude total da distribuição ( AT ) é a diferença entre o limite


superior da última classe (limite superior máximo) e o limite in-
ferior da primeira classe (limite inferior mínimo):
AT = L(máximo) − l (mínimo) .

No nosso exemplo, temos


AT = 174 − 150 = 24 ⇒ AT = 24 cm.

• Amplitude amostral

A amplitude amostral é a diferença entre o valor máximo e o va-


lor mínimo da amostra.

AT = xmax − xmin .

No nosso exemplo, temos:


AT = 173 − 150 = 23 ⇒ AT = 23 cm.

51
A amplitude total da distribuição jamais coin-
cide com a amplitude amostral.

• Ponto médio de uma classe

O ponto médio de uma classe é o ponto que divide o intervalo de


classe em duas partes iguais, sendo indicado por xi .

Para obtermos o ponto médio de uma classe, basta adicionar ao


limite inferior da classe a metade do intervalo de classe. Assim, o
ponto médio da segunda classe, em nosso exemplo, é:

h2 4
x2 = l2 + ⇒ x2 = 154 + = 156 ⇒ x2 = 156 cm, ou ainda
2 2
154 + 158
x2 = = 156 .
2

• Freqüência simples ou absoluta

A freqüência simples, ou freqüência absoluta, ou simplesmente,


freqüência de uma classe ou de um valor individual, é o número
de observações correspondentes a essa classe ou a esse valor.

A freqüência simples é simbolizada por fi (lemos: f índice i ou


freqüência da classe i ).

Assim, em nosso exemplo, temos


f1 = 4; f 2 = 9; f 3 = 11; f 4 = 8; f 5 = 5 e f 6 = 3 .

A soma de todas as freqüências será representada pelo símbolo


de somatório: k k
∑ fi é evidente que ∑ fi = n .
i =1 i =1

Para a distribuição em estudo, temos ∑f i = 40 .

• Freqüências relativas ( fri )

São os valores das razões entre as freqüências simples e a freqü-


ência total, isto é:
fi
fri = .
∑ fi

52
Logo, a freqüência relativa da terceira classe no nosso exemplo é:
f3 11
fr3 = ⇒ fr3 = = 0, 275 ⇒ fr3 = 0, 275 .
∑f i 40

• Freqüência acumulada ( Fk )

É o total das freqüências de todos os valores inferiores ao limite


superior do intervalo de uma dada classe. Temos
Fk = f 1 + f 2 + ... + f k.

Assim, no nosso exemplo, a freqüência acumulada corresponden-


te à terceira classe é:

F3 = f1 + f 2 + f3 ⇒ F3 = 4 + 9 + 11 = 24 ,

o que significa existirem 24 alunos com estatura inferior a 162 cm


(limite superior do intervalo da terceira classe).

• Freqüência acumulada relativa ( Fri )

É a freqüência acumulada da classe, dividida pela freqüência to-


tal da distribuição:
Fi
Fri = .
∑ fi
Assim, para a te rceira classe, temos

24
Fr3 = = 0,600 .
40

Portanto, veja na tabela abaixo a distribuição de freqüência das es-


taturas dos 40 alunos (em cm) da Escola Estadual “Esperança”, ao
semestre 2005/1.

Classe Estaturas(em cm) f xi fr F Fr Porcentagem


1 150 A 154 4 152 0,1000 4 0,1000 10,00%
2 154 A 158 9 156 0,2250 13 0,3250 32,50%
3 158 A 162 11 160 0,2750 24 0,6000 60,00%
4 162 A 166 8 164 0,2000 32 0,8000 80,00%
5 166 A 170 5 168 0,1250 37 0,9250 92,50%
6 170 A 174 3 172 0,0750 40 1,000 100,00%

∑f = 40

Tabela 2.8
53
O conhecimento dos vários tipos de freqüência nos ajuda a respon-
der muitas questões com relativa facilidade, como as seguintes:

a) Quantos funcionários têm estaturas entre 154 cm, inclusive,


e 158 cm?

Resposta: Esses são os valores da variável que formam a segun-


da classe, logo, 9 funcionários.

b) Qual a porcentagem de funcionários cujas estaturas são in-


feriores a 154 cm?

Resposta: Esses valores são os que formam a primeira classe,


logo, 10%.

c) Quantos funcionários têm estatura abaixo de 162 cm?

Resposta: É evidente que as estaturas consideradas são aquelas


que formam as classes de ordem 1, 2 e 3 , isto é, 4 + 9 + 11 = 24 .

Exemplo 2.6. Considere os dados brutos do quadro a seguir, que re-


presentam o peso (em kilogramas) de 40 crianças, entre 0 e 8 anos, da
Creche Municipal “O Bom Pastor”, no semestre 2004/2.

11,1 12,5 32,4 7,8 21,0 16,4 11,2 22,3


4,4 6,1 27,7 32,8 18,5 16,4 15,1 6,0
10,7 15,8 25,0 18,2 12,2 12,6 4,7 23,5
14,8 22,6 16,0 19,1 7,4 9,2 10,0 26,2
3,5 16,2 14,5 3,2 8,1 12,9 19,1 13,7

Quadro 2.2

Determinar:

1) a construção do rol em ordem crescente;

2) a Amplitude total dos dados;

3) o número de classes;

4) amplitude de classe;

5) os intervalos de variação das classes (sugestão: considere o

54
limite inferior da primeira classe igual a 3);

6) a tabela de freqüência.

Resposta:

1) Rol em ordem crescente:

Peso (em kilogramas) de 40 crianças, entre 0 e 8 anos, da Creche Muni-


cipal “O Bom Pastor”, no semestre 2004/2
3,2 3,5 4,4 4,7 6,0 6,1 7,4 7,8
8,1 9,2 10,0 10,7 11,1 11,2 12,2 12,5
12,6 12,9 13,7 14,5 14,8 15,1 15,8 16,0
16,2 16,4 16,4 18,2 18,5 19,1 19,1 21,0
22,3 22,6 23,5 25,0 26,2 27,5 32,4 32,8

Quadro 2.3

2) Amplitude total dos dados (AT) AT = 32,8 − 3, 2 = 29, 6 .

3) Número de classe (i) i = 1 +(3,3)log(40) = 6, 286 ≈ 6.

AT 29, 6
4) Amplitude da classe (h) h = = = 4,93 ≈ 5 .
i 6

5) e 6)

Peso (em kilogramas) de 40 crianças, entre 0 e 8 anos, da Creche Muni-


cipal “O Bom Pastor, no semestre 2004/2
Classe Peso f fr F Fr
1 3A8 8 0,20 8 0,20
2 8 A 13 10 0,25 18 0,45
3 13 A 18 9 0,23 27 0,68
4 18 A 23 7 0,18 34 0,85
5 23 A 28 4 0,10 38 0,95
6 28 A 33 2 0,05 40 1,00
∑f = 40

Tabela 2.9

55
Exemplo 2.7. Suponhamos que uma empresa deseje analisar a
distribuição dos salários pagos por hora a seus funcionários. O
estatístico da empresa dispõe dos seguintes dados:

13,3 15,2 12,4 15,8 9,6 10,4


13,2 8,8 8,3 8,5 10,2 11,5
12,6 10,7 12,6 9,7 12,1 13,5
10,3 14,3 9,8 12,3 10,4 11,6
12,4 12,9 11,6 10,3 14,2 13,6
Quadro 2.4

Pode-se notar, no quadro citado, que os dados estão desorde-


nados. Portanto, não houve preocupação quanto à sua ordem
(crescente ou decrescente). Nestas condições, esses dados são
denominados, em estatística, dados brutos. Quando estiverem
ordenados (crescente ou decrescente), são denominados rol.

Para ordená-los, é aconselhável a elaboração de tabelas de fre-


qüência. Inicialmente designamos o x para variável em estudo,
no caso, salário/hora.

xmáx = o maior valor da variável = 15,8

xmín = o menor valor da variável = 8,3

xmáx − xmín = 15,8 − 8,3 = 7,5 .

Para facilitar, podemos dividir em 5 classes com intervalos de 1,5.

Com estas informações iniciais, podemos construir a tabela 2.10


da freqüência:

Classe Freqüências
8,3 A 9,8 6
9,8 A 11,3 6
11,3 A 12,8 9
12,8 A 14,3 7
14,3 A 15,8 2
Total 30
Tabela 2.10

56
Pode-se observar que quando os dados não estavam agrupados
no quadro 2.4, não se tinha nenhuma informação sobre a dis-
tribuição de salários. Agora, observada a tabela 2.10, já pode-
mos estabelecer algumas considerações valiosas. Podemos, por
exemplo, concluir que a classe de salários predominante na em-
presa é a terceira: 11,3 12,8.

2.5 Histograma de Freqüências


O gráfico de distribuição de freqüência também é conhecido
como histograma. Ele é formado por um conjunto de retângulos
justapostos, cujas bases se localizam sobre o eixo horizontal, de
tal modo que seus pontos médios coincidam com os pontos mé-
dios dos intervalos de classe.

Exemplo 2.8. Histograma de freqüências dos alunos da Escola


Estadual “Esperança”. (Veja a tabela 2.8)
Histograma de freqüência
12
11
10
9
8
Freqüência

7
6
5
4
3
2
1
0
150 154 158 162 166 170 174
Estatura dos alunos Escola Estadual Esperança (em cm)
Gráfico 2.7

As larguras dos retângulos são iguais às amplitudes dos inter-


valos de classe. As alturas dos retângulos deverão ser proporcio-
nais às freqüências das classes, sendo a amplitude dos intervalos
igual. Isso nos permite tomar as alturas numericamente iguais às
freqüências. Vejamos agora alguns exemplos de histograma de
freqüências.

57
Exemplo 2.9. Histograma de freqüência de uma amostra de 36
funcionários da Escola Estadual Primavera, conforme quadro 2.1,
segundo o grau de instrução.
Histograma de freqüência
20
50,0%
18
Freqüência Observada 16
14
50,0%
12
10
8
16,7%
6
4
2
0
1° grau 2° grau superior
Escolaridade dos Funcionários
Gráfico 2.8

• Polígono de freqüências

O polígono de freqüência é um gráfico em linha, sendo as freqü-


ências marcadas sobre perpendiculares ao eixo horizontal, levan-
tados pelos pontos médios dos intervalos de classe.

Para realmente obtermos um polígono (linha fechada), devemos com-


pletar a figura, ligando os extremos da linha obtida aos pontos médios
da classe anterior à primeira e posterior à última, da distribuição

Exemplo 2.10. Polígono de freqüência dos alunos da Escola Esta-


dual “Esperança”. (Tabela 2.8)
Polígono de Freqüência
12
11
10
9
8
7
6
5
4
3
2
1
0
150 154 158 162 166 170 174

Gráfico 2.9

Exemplo 2.11. Usando os dados da tabela 2.10:

58
Classe Freqüência Ponto Médio

8,3 A 9,8 6 9,05


9,8 A 11,3 6 10,55

11,3 A 12,8 9 12,05

12,8 A 14,3 7 13,55

14,3 A 15,8 2 14,05


Total 30 -

Tabela 2.11
9
8
7
6

Freqüências
5
4
3
2
1
0
8,3 9,8 11,3 12,8 14,3 15,8 Classe
Gráfico 2.10

Classe
8,3 9,8 11,3 12,8 14,3 15,8

Gráfico 2. 11

59
Exemplo 2.12.

Classe Freqüência Ponto Médio

00 A 05 42 2,5
05 A 10 65 7,5

10 A 15 23 12,5

15 A 20 28 17,5

20 A 25 10 22,5

25 A 30 24 27,5

30 A 35 08 32,5
Total 200 -

Tabela 2.12

70
60
50
Freqüências

40
30
20
10

0 5 10 15 20 25 30 35 Classe

Gráfico 2.12

70
60
50
Freqüências

40
30
20
10

Classe
0 5 10 15 20 25 30 35

Gráfico 2.13

60
Exercícios Propostos
1) Dadas as distribuições de freqüência a seguir, determinar
para cada uma:

a) O histograma de freqüência.

b) O polígono de freqüência.

Pesos(em Kg) Freqüência

40 A 44 2
44 A 48 5

48 A 52 9

52 A 56 6

56 A 60 4
∑ = 26
Tabela 2.13

Resposta.

f
10
8
6
4
2

0 40 44 48 52 56 60 Kg

Gráfico 2.14

61
b)

Estaturas(em cm) Freqüência


150 A 156 1
156 A 162 5
162 A 168 8
168 A 174 13
174 A 180 3
∑ = 30
Tabela 2.14

Resposta.

f
11
9
7
5
3
1
0 150 162 174 186 cm

Gráfico 2.15

c)

Salários (em R$) Freqüência

500 A 700 8
700 A 900 20

900 A 1100 7

1100 A 1300 5

1300 A 1500 2

1500 A 1700 1

1700 A 1900 1
∑ = 44
Tabela 2.15

62
Resposta.
f
20

16

12
8

0 500 900 1300 1700 R$

Gráfico 2. 16

2) Feito um levantamento sobre as idades de 25 alunos que cursam


a 5a série da Escola Estadual “Sena Figueiredo”, da cidade X do Esta-
do de Santa Catarina, chegou-se ao seguinte quadro:

Idade Freqüência
10 3
11 11
12 8
13 3
Quadro 2.5

Faça um gráfico por setores que represente esta distribuição.

3) O quadro seguinte mostra as médias, em matemática, dos 50 alu-


nos da 3a série do ensino médio durante um determinado bimestre do
Colégio Pio XII, da cidade Y do Estado de Santa Catarina.

68 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
41 55 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89
Quadro 2.6

63
Determinar:

a) A distribuição de freqüência iniciando por 30 e adotando-se


o intervalo de classe de amplitude igual a 10.

b) As freqüências acumuladas.

c) As freqüências relativas.

d) O histograma e o polígono de freqüência.

4) O gráfico de setores representa as notas obtidas em uma


questão pelos 32.000 candidatos presentes à primeira fase de uma
prova de vestibular. Ele mostra, por exemplo, que 32% desses can-
didatos tiveram nota 2 nessa questão. Quantos candidatos tive-
ram nota 3?

4 (12%)
3 (16%)
0 (10%)

5 (10%)
2 (32%)

1 (20%)

Gráfico 2.17

Resposta. 5.120 candidatos.

5) (PUC) O histograma seguinte apresenta a distribuição de fre-


qüência das faixas salariais numa pequena empresa.
N° de Funcionários
14
12
10
8
6
4
2
0
Salário em Reais
Gráfico 2.18

64
Com os dados disponíveis, pode-se concluir que a média desses
salários é, aproximadamente:

a) R$ 420,00

b) R$ 536,00

c) R$ 562,00

d) R$ 640,00

e) R$ 708,00

Resposta: e).

Resumo
Você viu neste capítulo como identificar os elementos de uma dis-
tribuição de freqüência e os tipos de freqüência.

Você foi capaz de verificar a representação gráfica do histograma


e do polígono de freqüência, viu a construção de gráfico de barra,
de gráfico de setores e de diagrama de pontos.

Bibliografia Comentada

CRESPO, A. Arnot. Estatística Fácil. 7. ed. São Paulo: Saraiva, 1990.


O autor aborda o conteúdo de distribuição de freqüência e de con-
strução de gráficos estatísticos usando uma linguagem bem simples
e clara, tornando sua leitura agradável.

FONSECA, Jairo Simom da; MARTINS, Gilberto de Andrade. Curso


de Estatística. 3. ed. São Paulo: Atlas, 1982.
Da mesma forma que a fonte anterior, apresentam os principais
conceitos sobre levantamento de dados estatísticos por meio de
tabelas e gráficos .

65
3 Medidas de Tendência Central
3 Medidas de Tendência Central

Neste capítulo estudaremos várias medidas de posição ou


de tendência central e suas utilidades em ensino funda-
mental e médio. A maioria dos dados apresentam uma di-
ferente tendência de se agrupar ou concentrar em torno de
um ponto central. Assim sendo, para um conjunto de da-
dos em particular, geralmente se torna possível selecionar
um valor típico ou médio para descrever todo o conjunto.
Tal descritivo típico é uma medida de localização ou ten-
dência central. As mais importantes das medidas estatísti-
cas de localização ou medidas de posições são as chamadas
medidas de posição ou de tendência central, e dentre elas
destacamos: a média aritmética, a mediana e a moda.

3.1 Introdução
Pelo apresentado nos capítulos anteriores, vemos que à Estatística
cabe a análise de fenômenos mensuráveis. Temos, assim, dian-
te de nós, informações numéricas, obtidas nas fases iniciais do
trabalho estatístico (planejamento, coleta, crítica, apuração e ex-
posição), que deverão ser analisadas agora na fase do trabalho
estatístico que chamamos de interpretação.

Cabe-nos, assim, a determinação dos índices estatísticos que atu-


arão como indicadores do comportamento do fenômeno que esta-
mos pesquisando.

O objetivo central deste capítulo é apresentar, de forma simples


e prática, os parâmetros que caracterizam a distribuição de uma
variável. Em vez de seguirmos uma linha geral, por motivo ób-
vio, iniciaremos o nosso estudo discutindo as medidas de ten-
dência central. Denominam-se medidas de posição, ou medidas
de tendência central, os valores típicos, que tendem a se localizar
em pontos centrais num conjunto de dados ordenados, ou que
ocupam uma posição específica dentro de uma distribuição. As

69
principais medidas de tendência central são as seguintes:

a) Médias

i) aritmética (simples e ponderada);

ii) geométrica;

iii) harmônica;

iv) quadrática.

b) Mediana.

c) Moda.

3.2 Média Aritmética


É uma das principais medidas de posição. Seguramente, a mais
usada, sendo que pode ser simples (dados não agrupados em clas-
se) e ponderada (dados agrupadas em classe).

3.2.1 Média Aritmética Simples


Média aritmética simples ou simplesmente média x, de uma série (
ou conjunto de n valores x1 , x2 ,..., xn é, por definição, o quociente
da soma desses valores pelo número deles, ou seja:
n

x + x + ... + xn ∑x i
,
x= 1 2 = i =1
n n
ou simplesmente
∑x
x=
n .

Exemplo 3.1.

i) A média aritmética dos números 4, 9, 12, 3, 6, 10 e 20 será:


4 + 9 + 12 + 3 + 6 + 10 + 20 70
x= = = 10 .
7 7
ii) x = 2, 5, 7, 6
4

∑x i
2 + 5 + 7 + 6 20
x= i =1
= = =5.
4 4 4

70
Exemplo 3.2. Sabendo-se que um funcionário da Escola Estadual
“Esperança” trabalha, durante uma semana, em horas, 10, 14, 13, 15,
16, 18 e 12 horas, temos que a média de trabalho da semana foi de
10 + 14 + 13 + 15 + 16 + 18 + 12
x= = 14 horas .
7

Observação 3.1. Às vezes acontece de a média ser um número


diferente de todos da série de dados que ela representa. Por exem-
plo, quando temos os valores 2, 4, 8 e 9, a média é 5; neste caso,
costumamos dizer que a média não tem existência concreta.

3.2.2 Média Aritmética Ponderada


Média aritmética ponderada é uma forma simplificada de calcu-
lar a média aritmética simples dos dados repetidos.

Se os números x1 , x2 ,..., xn ocorrem em determinadas freqüên-


cias, f1 , f 2 ,..., f n , respectivamente, a média aritmética pondera-
da é defi nida por:
f x + f x + ... + f n xn
x= 1 1 2 2
f1 + f 2 + ... + f n
n n

∑ fi xi ∑f i xi
= i =1
n
= i =1 ,
∑f
n
i
i =1
n
onde n = ∑ fi , é a freqüência total.
i =1

Observação 3.2. As freqüências f1 , f 2 ,..., f n também são chama-


das de pesos, para x1 , x2 ,..., xn , respectivamente.

Exemplo 3.3. Cálculo da média aritmética ponderada dos se-


guintes dados:

Notas em provas (x ) Números de estudantes (f )


20 3
35 6
40 2
60 10

71
65 8
75 16
80 3
100 2
Total 50

Quadro 3.1

3 × 20 + 6 × 35 + 2 × 40 + 10 × 60 + 8 × 65 + 16 × 75 + 3 × 80 + 2 × 100
x=
50
60 + 210 + 80 + 600 + 520 + 1200 + 240 + 200
=
50
3150
= = 60,3
50

Exemplo 3.4. Cálculo da média aritmética ponderada dos se-


guintes dados:

xi fi
2 8
3 2
5 4
8 6
6 5
9 3
Total 28
Quadro 3.2

8 × 2 + 2 × 3 + 4 × 5 + 6 × 8 + 5 × 6 + 3× 9
x=
28
16 + 6 + 20 + 48 + 30 + 27
=
28
147 .
=
28

Exemplo 3.5. O Colégio “Aprender a Lição”, do Sistema de Ensino


Prof. “Sabe Tudo”, possui dois técnicos em informática recebendo
salários mensais de R$ 3.400,00 cada um; quatro professores de fí-

72
sica recebendo mensalmente R$ 4.500,00 cada um; um diretor de
recursos humanos com salário mensal de R$ 7.000,00; e três ou-
tros profissionais recebendo mensalmente R$ 5.500,00 cada um.

A média mensal destes salários é:

3.400 × 2 + 4.500 × 4 + 7.000 × 1 + 5.500 × 3 48.300


x= = = 4.830 .
2 + 4 +1+ 3 10

Portanto, a média de salários do Colégio “Aprender a Lição” é de


R$ 4.830,00.

Observação 3.3. Quando os dados são agrupados em intervalos


de classe, convenciona-se que todos os valores incluídos em um
determinado intervalo de classe coincidem com o seu ponto mé-
dio, e o cálculo da média aritmética é dado pela fórmula acima
onde xi é o ponto médio da classe.

Exemplo 3.6. Consideremos a tabela abaixo referente aos salários


(em R$) do mês de março/2005 de 44 professores da Escola “Bási-
ca Professora Zulmira”:

Classe Salários Freqüência


1 500 A 700 8
2 700 A 900 20
3 900 A 1100 7
4 1100 A 1300 5
5 1300 A 1500 2
6 1500 A 1700 1
7 1700 A 1900 1
Total = 44

Tabela 3.1

Calcular o salário médio mensal pago pela Escola “Básica Profes-


sora Zulmira”.

73
Aplicando a fórmula da média dada acima, temos
600 × 8 + 800 × 20 + 1000 × 7 + 1200 × 5 + 1400 × 2 + 1600 × 1 + 1800 × 1
x=
44

= 909,09 .

Portanto, o salário médio mensal pago pela Escola “Confiança no


Futuro” é de R$ 909,09.

Exemplo 3.7. Calcular a altura média dos quarenta alunos da Es-


cola Estadual “ESPERANÇA”,

Classe Estaturas (em cm) fi xi fi × xi


1 150 A 154 4 152 608
2 154 A 158 9 156 1404
3 158 A 162 11 160 1760
4 162 A 166 8 164 1312
5 166 A 170 5 168 840
6 170 A 174 3 172 516
∑f i = 40 ∑ f ×x
i i = 6440

Tabela 3.2

Resolução: Na última coluna do quadro acima, temos a altura


média
6440
x= = 161, 00 .
40

Portanto, a altura média dos quarenta alunos da Escola Estadual


“Esperança” é 161 cm.

3.2.3 Média Aritmética para Dados Agrupados em classe


(ponderada)
• Processo Longo

É definido como sendo o “quociente entre a soma dos produtos


das freqüências pelos pontos médios de cada classe, e a soma de
todas as freqüências”. Assim,

74
n

∑f i pmi
x= i =1
n ,

i =1
fi

onde pmi = ponto médio de cada classe.

Exemplo 3.8. Calcule a média aritmética da seguinte tabela de


freqüência (isto é, dados agrupados em classes)

Tempo de serviço Número de Ponto Médio


(anos) empregados ( f ) ( pm ) ( f ⋅ pm )
00 05 42 2,5 105
05 10 65 7,5 487,5
10 15 23 12,5 287,5
15 20 28 17,5 490
20 25 10 22,5 225
25 30 24 27,5 660
30 35 08 32,5 260
Total 200 - 2515

Tabela 3.3
7

∑ f .p i mi
x= i =1
7

∑f
i =1
i

105 + 487,5 + 287,5 + 490 + 225 + 660 + 260


=
200

2515
= = 12,575 .
200
• Processo das freqüências relativas

Por definição, n
⎛ ⎞
∑f ⋅p i mi n ⎜ f ⎟ n
x= i =1
= ∑ ⎜ n i ⎟ pmi = ∑ fri ⋅ pmi ,
i =1 ⎜ ⎟
n

∑f ⎜ ∑ fi ⎟
i =1
i
i =1 ⎝ i =1 ⎠
fi
onde fri = n
, i = 1, 2,..., n são freqüências relativas.
∑f i =1
i

75
Exemplo 3.9. Calcule a média aritmética da seguinte tabela de
freqüência, usando processo de freqüências relativas.

Tempo de Número de Ponto Médio Freqüência


serviço (anos) empregados ( f i ) ( )
pmi Relativa ( fri ) pmi ⋅ fri

00 05 42 2,5 0,21 0,525


05 10 65 7,5 0,325 2,4375
10 15 23 12,5 0,115 1,4375
15 20 28 17,5 0,14 2,45
20 25 10 22,5 0,05 1,125
25 30 24 27,5 0,12 3,3
30 35 08 32,5 0,04 1,3
Total 200 - 1,00 12.575

Tabela 3.4

Neste caso, temos


7
x = ∑ fri ⋅ pmi = 12,575 .
i =1

• Processo dos desvios

Podemos, também, para os dados agrupados, calcular a média aritmé-


tica, considerando um ponto médio qualquer - pm e a diferença entre ( )
este e os restantes pm − pm . Chamamos esta diferença de desvio (d ) de
(
pm em relação a pm di = pmi − pm . Isto implica que, pm = di + pm .
i
)
(Levando esta igualdade à fórmula dada no item acima).
n

∑ f .p i mi
x= i =1
n

∑f
i =1
i

∑ f (d )
n

i i + pm
= i =1
n

∑f
i =1
i

n n

∑ f i d i + ∑ f i . pm
= i =1
n
i =1

∑f
i =1
i

76
n n

∑ fi di ∑f i . pm
= i =1
n
+ i =1
n

∑i =1
fi ∑f i =1
i

n n

∑f d i i ∑f i
= i =1
n
+ pm i =1
n , pois pm é constante.
∑f
i =1
i ∑f i =1
i

Isto é, n

∑f d i i
x = pm + i =1
n
.
∑f i =1
i

Observação 3.4. Como pm pode ser uma constante qualquer ar-


bitrária, é usual toma-la como um ponto médio intermediário de
uma classe da distribuição de freqüência, o que simplificará mui-
to a resolução dos exercícios práticos. Então, pm passa a ser um
ponto médio intermediário arbitrado.

Exemplo 3.10.

Freqüência Ponto Médio Desvio Produto


(f ) ( pm ) d = pm − pm f .d
42 2,5 -15 -630
65 7,5 -10 -650
23 12,5 -5 -115
28 17,5 = pm 0 0
10 22,5 5 50
24 27,5 10 240
8 32,5 15 120
200 - - -985
Tabela 3. 5

Resolução. Neste caso, temos


n

∑f d i i
x = pm + i =1
n

∑f i =1
i

77
⎛ −985 ⎞
= 17,5 + ⎜ ⎟
⎝ 200 ⎠
= 17,5 + (−4,925) = 17,5 − 4,925
= 12,575 .

3.3 Outras Médias


3.3.1 Média geométrica
A média geométrica G de um conjunto de n valores (x1 , x2 ,..., xn ) é a
raiz de ordem n ( n -ésimo raiz) do produto desses valores, ou seja:

G = x1 × x2 × ... × xn =
n n
∏x
i =1
i
.

Exemplo 3.11.

i) A média geométrica entre os números 18, 36 e 72 é:

G = 3 18 × 36 × 72 = 3 46.656 = 36 .

ii) A média geométrica entre os números 1, 9 e 81 é:

G = 3 1 × 9 × 81 = 3 729 = 9 .

Observação 3.5. Devemos notar que nos exemplos apresentamos


números que propositadamente nos conduziram à extração de ra-
ízes bem simples. No entanto, em grande parte de exercícios sobre
o cálculo da média geométrica (principalmente se tivermos três ou
mais valores), somos induzidos a utilizar logaritmos. Veja a seguir.
n
Sabemos que G = n
∏x
i =1
i , então podemos escrever
1/ n
⎛ n ⎞
log G = log ⎜ ∏ xi ⎟
⎝ i =1 ⎠
1
= log (x1 . x2 ... xn )
n
1
= (log x1 + log x2 + ... + log xn )
n
1 n
= ∑ log xi
n i =1 .

78
Portanto,
⎛1 n

G = ant. log ⎜
⎝n
∑ log x ⎟⎠ ,
i =1
i

onde a base do logaritmo é preferencialmente decimal.

3.3.2 Média Harmônica


A média harmônica H de uma série de n valores diferentes de
zero, x1 , x2 ,..., xn , é, por definição, o inverso da média aritmética
dos inversos desses valores, ou seja:
1 n
H= = n
1 1 1 1 ,
+ + ... +
x1 x2 xn ∑i =1 xi
n
ou simplesmente
n
H= , x≠0
1 ,

x
ou
1

1
= x.
H n
Observação 3.6. Quando um elemento da série for igual a zero, a
média harmônica será nula, por definição.

Exemplo 3.12.

i) A média harmônica entre 18, 36 e 72 será:

1 1⎡ 1 1 1 ⎤ 1 ⎡ 4 + 2 + 1⎤ 7
= ⎢ + + ⎥= ⎢ ⎥ = .
H 3 ⎣18 36 72 ⎦ 3 ⎣ 72 ⎦ 216

Portanto,
216
H= = 30,86 .
7

ii) A média harmônica entre 5, 2 e 8 será:


1 1 ⎡ 1 1 1 ⎤ 1 ⎡ 8 + 20 + 5 ⎤ 1 33 11 .
= + + = = =
H 3 ⎢⎣ 5 2 8 ⎥⎦ 8 ⎢⎣ 40 ⎥⎦ 3 40 40
Portanto,
40
H= = 3,63 .
11

79
iii) A média harmônica entre 1 e 4 será:
1 1 ⎡ 1 1 ⎤ 1 ⎡1 + 4 ⎤ 1 5 5 .
= + = = =
H 2 ⎢⎣ 4 1 ⎥⎦ 2 ⎢⎣ 4 ⎥⎦ 2 4 8
Portanto,
8
H= = 1,6 .
5
3.3.3 Média Quadrática
A média quadrática Q de uma série de n valores, x1 , x2 ,..., xn , é,
por definição, a raiz quadrada da média aritmética dos quadra-
dos desses valores, ou seja:
n

x12 + x2 2 + ... + xn 2 ∑x i
2

Q= = i =1
,
n n

ou simplesmente
∑ x2
Q= .
n
Exemplo 3.13.

i) A média quadrática dos números 1 e 4 será:

12 + 42 1 + 16 17
Q= = = = 8,5 = 2,9 .
2 2 2
ii) A média quadrática dos números 3, 5 e 6 será:

32 + 52 + 62 9 + 25 + 36 70
Q= = = = 23,33 = 4,8 .
3 3 3
iii) A média quadrática dos números 1, 2 e 3 será:

12 + 22 + 32 1+ 4 + 9 14
Q= = = = 4,66 = 2,16 .
3 3 3

3.3.4 Desigualdade entre Quatro Médias


Existe uma desigualdade relacionando as quatro médias (aritmé-
tica, geométrica, harmônica e quadrática) dada por

xmín ≤ G ≤ H ≤ x ≤ Q ≤ xmáx ,

com a igualdade quando x1 = x2 = x3 = ... = xn , onde

80
xmín = mín {x1 , x2 ,..., xn } e xmáx = máx {x1 , x2 ,..., xn }.

Uso das médias geométricas, harmônicas e quadráticas

i) Como aplicações importantes da média geométrica, pode-


mos citar a estimativa do crescimento demográfico e o cál-
culo do índice do custo de vida.

ii) A média harmônica é particularmente recomendada para


séries constituídas de números recíprocos, como, por exem-
plo, para o cálculo das médias de velocidade (referidas a
uma dada distância), do custo médio de artigos (adquiridos
com uma determinada quantia), etc.

iii) A média quadrática, além de ser usada na Física, será de


A mediana de um grupo grande valia no estudo sobre as medidas de dispersão, mais
de dados ordenados
separa a metade inferior
especificamente no cálculo do desvio padrão, que será apre-
da amostra, população sentado adiante.
ou probabilidade
de distribuição, da 3.4 Mediana
metade superior. Mais
concretamente, 1/2 da
população terá valores A mediana é o valor médio ou a média aritmética de dois valores
inferiores ou iguais centrais de um conjunto de números ordenados (crescente ou de-
à mediana e 1/2 da
crescente). Isto é, mediana M e )de uma série de n termos, x1 , x2 ,..., xn ,
população terá valores
superiores ou iguais à colocados em ordem crescente (ou decrescente) de valor, é o termo da
mediana. Fonte: http:// série ou a média aritmética de dois valores centrais, que é precedido
pt.wikipedia.org/wiki/
Mediana e seguido pelo mesmo número de ocorrências.

3.4.1 Mediana para Dados Isolados


Dado um conjunto qualquer de valores, o primeiro passo é orde-
ná-los. Isto poderá ser feito tanto em ordem crescente quanto de-
crescente. O segundo passo é verificar se o número de elementos
que compõem este conjunto é par ou ímpar.

Quando a série é constituída de um número (n ) ímpar de termos,


a posição (P ) de mediana é dada por

n +1
P= .
2

81
Exemplo 3.14. Cálculo da mediana da série 9, 15, 3, 7, 6, 16, 4, 19 e 1.

Colocando os termos em ordem crescente, temos 1, 3, 4, 6, 7, 9, 15,


16, e 19. Neste caso, n = 9 , então
n +1 9 +1
P= = = 5.
2 2
Isto é, a mediana é o 5° termo da série ordenada.

Portanto,
Me = 7 .

Observação 3.7. Quando a série é constituída de um número (n )


par de termos, ela terá dois valores centrais. Neste caso, a mediana
é a média aritmética dos dois valores centrais cujas posições são:
n n
P' = e P '' = + 1 .
2 2
Exemplo 3.15. Cálculo da mediana da série 3, 7, 4, 7, 12, 15, 10, 18 e 14.

Resolução: Colocando em ordem crescente, temos 3, 4, 7, 10, 12,


14, 15 e 18. Como o número de termos é par, n = 8 , a mediana
será a média aritmética dos dois termos centrais com posições:
n 8 n 8
P' = = = 4 e P '' = + 1 = + 1 = 5 .
2 2 2 2

Tomando então a média aritmética do 4° e do 5° termos da série,


tem-se finalmente a mediana, ou seja, a mediana é

10 + 12 22
Me = = = 11 .
2 2

Observação 3.8. Neste exemplo, a mediana é um valor que não é


termo da série, mas não prejudica a definição introduzida.

Exemplo 3.16. Suponha que o seguinte conjunto de dados repre-


sente os salários (em reais) para uma amostra de sete profissio-
nais na área da educação que recentemente colaram grau em sua
faculdade:

4.600 3.700 6.900 6.300 7.400 4.800 5.300

82
Resolução: A disposição ordenada torna-se:

3.700 4.600 4.800 5.300 6.300 6.900 7.400


Mediana
Exemplo 3.17. Suponha que o seguinte conjunto de dados repre-
sente a idade (em anos) de uma amostra de oito funcionários da
Escola Estadual “Nova Esperança”:

42 34 32 27 39 29 45 30

Resolução: A disposição ordenada torna-se:

27 29 30 32 34 39 42 45

32 + 34
Mediana = = 33 .
2
Exemplo 3.18. Suponha que o seguinte conjunto de dados repre-
sente os salários (em reais) de uma amostra de sete funcionários
da Escola Estadual “Nova Esperança”:

2.100 1.900 3.400 2.800 1.800 2.400 1.900

Resolução: A disposição ordenada torna-se:

1.800 1.900 1.900 2.100 2.400 2.800 3.400


Mediana

3.4.3 Mediana para Dados Agrupados


• Valores isolados ponderados (não agrupados em classes)

Quando estamos trabalhando com dados tabulados, mas não


agrupados em classe, ou seja, quando aparecem repetições de va-
lores, o cálculo da mediana é feito através de um procedimento
análogo, lembrando, contudo, que agora temos freqüências cor-
respondentes a cada variável.

Desta forma, precisamos acumular freqüências, permitindo, com


isto, localizar o elemento que divide esta observação em duas par-
tes iguais. Para tal, é preciso verificar se o número de observações
é ímpar ou par e, para cada caso, aplicar os critérios anteriores.

83
Exemplo 3.19. Cálculo da mediana dos seguintes dados:

x f fa
2 2 2
4 5 7
5 8 15
7 6 21
8 4 25
Total 25 -

Quadro 3.3

Neste caso,
25 + 1
P= = 13 .
2

O elemento mediano ocupa a 13ª posição do conjunto, sendo, por-


tanto, 5, isto é, M e = 5 .

Exemplo 3.20. Cálculo da mediana da seguinte tabela:

x f fa
3 5 5
5 4 9
6 6 15
7 8 23
9 3 26
Total 26 -

Quadro 3.4

Neste caso, temos

26 26
P' = = 13 e P '' = + 1 = 14 .
2 2

A mediana será o valor médio dos valores das 13ª e 14ª posições.
Isto é,

6+6
Me = =6.
2

84
• Valores agrupados em classe

Quando uma série é agrupada em classes de freqüência, a mediana cor-


responde ao termo que divide a série em duas partes iguais, isto é, é o
⎛n⎞
valor que é precedido e seguido por 50% ou ⎜ ⎟ dos termos da série.
⎝2⎠
Em uma distribuição de freqüência, chama-se classe mediana, a
classe que contém a mediana.

A fórmula para o cálculo da mediana é dada por:


n
− fa
M e = Li + 2 ×h ,
f
onde
M e = mediana;
Li = limite inferior da classe que contém a mediana;
n = número de termos da série;
f a == freqüência acumulativa da classe vizinha anterior à classe
mediana;
f = freqüência da classe mediana;
h = amplitude da classe mediana.

Exemplo 3.21. Calcular a mediana dos 40 alunos da Escola Esta-


dual “Esperança”.

i Estaturas(cm) Freqüências Freqüência Acumulada


1 150 A 154 4 4
2 154 A 158 9 13
3 158 A 162 11 24
4 162 A 166 8 32
5 166 A 170 5 37
6 170 A 174 3 40
Total 40

Tabela 3.6

n 40
Resolução. Temos = = 20 , a classe da Mediana é a terceira.
2 2
LiM= 158 ; n = 40; fa = 13 ; h = 4 ; f = 11.

85
Logo,
⎛ 40 ⎞
⎜ − 13 ⎟ × 4
Me = 158 + ⎝ 2 ⎠
11
(20 − 13) × 4
= 158 +
11
= 158 + 2,545 = 160,545

Portanto, a mediana dos 40 alunos da Escola Estadual “Esperan-


ça” é 160,545 cm.

Exemplo 3.22. Cálculo da mediana de distribuição de notas da-


das em classe:

Notas (Classe) Alunos ( f ) ( fa)


0 A 10 3 3
10 A 20 7 10

20 A 30 12 22

30 A 40 34 56

40 A 50 48 104
50 60 90 194

60 A 70 54 248

70 A 80 52 300

80 A 90 15 315

90 A 100 5 320
Total 320

Tabela 3.7

Resolução. Temos os seguintes dados:


n
= 160 , f a = 104 , Li = 50 , f = 90 , h = 10 .
2

Portanto, a classe mediana é 50 A 60.


n
− fa
M e = Li + 2 ×h
f
160 − 104
= 50 + ×10
90

86
560
= 50 + = 50 + 6, 2 = 56, 2 .
90
A mediana igual à nota 56,2 revela que tal resultado coloca
tantos alunos com notas inferiores a 56,2 quanto com notas
superiores a 56,2.

Gráfico da mediana:
fa

320
315
300

248

194

160

104

56

22
10
3
0 10 20 30 40 50 60 70 80 90 100 Classe
Me = 56,2

Gráfico 3.1

Exemplo 3.23. Cálculo da mediana da seguinte distribuição de


freqüência:

Tempo de serviço Freqüência Freqüência acumulada


(anos) (f ) ( fa )
00 05 42 42
05 10 65 107
10 15 23 130
15 20 28 158
20 25 10 168
25 30 24 192
30 35 08 200
Total 200
Tabela 3. 8

87
Resolução. Neste caso, temos
n
= 100 , f a = 42 , Li = 5 , f = 65 e h = 5 .
2

Portanto, a classe mediana é 5 10. Logo,


100 − 42 58 58
Me = 5 + ×5 = 5 + ×5 = 5 + =
65 65 13

= 5 + 4, 45 = 9, 45 .

Gráfico da mediana:
fa

200
192

168
158

130

107
100

42

0
5 10 15 20 25 30 35 Classe

Gráfico 3. 2

Observações. A mediana

i) não depende de todos os valores da série, podendo mesmo


se alterar com a modificação de alguns dados;

ii) não é influenciada pelos valores extremos;

iii) pode ser calculada para distribuição com limites indeter-


minados (indefinidos) na maioria dos casos.

iv)

88
3.5 Moda
A moda é o valor que ocorre com maior freqüência em um dado con-
junto de números. Isto é, moda ou norma (M o ) de uma série de n
valores, x1 , x2 ,..., xn , é o valor que se repete o maior número de vezes.

Observação 3.9. A moda pode não existir e, quando existir, pode


não ser única.

Exemplo 3.24. Suponha que o seguinte conjunto de dados repre-


sente a idade (em anos) de uma amostra de nove funcionários da
Escola Estadual “Nova Esperança”:

42 34 32 27 39 29 34 30 26

Resolução. A moda é 34 anos.

Exemplo 3.25. Suponha que o seguinte conjunto de dados repre-


sente a idade (em anos) de uma amostra de cinco profissionais de
departamento financeiro da empresa “Capital”:

34 32 27 29 45

Resolução. Neste caso não existe moda (amodal).

Exemplo 3.26. Suponha que o seguinte conjunto de dados repre-


sente a idade (em anos) de uma amostra de nove funcionários da
Escola Estadual “Nova Esperança”:

42 37 32 27 39 29 37 42 26

Resolução. Neste caso existem duas modas 37 anos e 42 anos.

3.5.1 Caso de Dados Isolados e/ou Não Agrupados em Classe


• Série amodal

É aquela em que todos os seus valores ocorrem com a mesma


freqüência, ou seja, não existe moda.

89
Série amodal
Gráfico 3.3

Exemplo 3.27. Não existe moda da série 3, 5, 8, 4, 2, 1, 7, 9 e 10, pois to-


dos os números são diferentes entre si (possuem freqüência unitária).
O mesmo ocorre com o conjunto de números 2, 2, 3, 3, 7, 7, 4, 4, 5 e 5,
onde todos os valores têm a mesma freqüência (2).

• Série modal (ou unimodal)

Neste caso, existe única moda.

Série modal

Gráfico 3. 4

Exemplo 3.28. Determinar a moda da série

3, 4, 4, 8, 4, 5, 4, 3, 4, 9, 4, 3 e 6.

Resolução. Uma simples inspeção dos números indica que a moda é 4,


valor que tem freqüência (6) maior que qualquer outro valor da série.

• Série bimodal

Neste caso, existem duas modas.

90
Gráfico 3. 5

Exemplo 3.29. A série 3, 5, 5, 5, 9, 10, 10, 10, 10, e 15 é bimodal, pois


possui duas modas (5 e 10).

• Série multimodal (ou plurimodal)

Neste caso, existem mais que duas modas.

o o o

Gráfico 3. 6

Exemplo 3.30.

x f
3 5
5 8
7 4
8 8
10 7
12 8
15 3
20 1
Total 44
Quadro 3. 5

Neste exemplo temos 3 modas 5, 8 e 12.

91
3.5.2 Cálculo da Moda para Dados Agrupados em Classes

Em uma distribuição de freqüência, denominamos classe modal


a classe que possui a mais alta freqüência ou, conseqüentemente,
a classe que contém a moda.

Moda bruta é, por definição, o ponto médio da classe modal.

Exemplo 3.31. Na distribuição seguinte a classe modal é a quarta


classe (6 A 8), e a moda bruta é 7.

Notas em prova
(classe)
Alunos (f )

0A2 9
2A4 19

4A6 26

6A8 32

8 A 10 14
Total 100
Tabela 3. 9

A seguir, daremos uma fórmula para cálculo de moda dos dados


agrupados em classes.

O cálculo do valor da moda ( M 0 ) de dados apresentados em ta-


belas de distribuição de freqüências é dado pela seguinte fórmula
(fórmula de Czuber):
Δ1
M 0 = L1i + × h,
Δ1 + Δ 2
onde

L1i = limite inferior da classe modal;


h = amplitude da classe;
Δ1 = diferença entre a freqüência da classe modal e a imediata-
mente anterior;
Δ 2 = diferença entre a freqüência da classe modal e a imediata-
mente posterior.

92
Exemplo 3.32. Calcular a moda dos quarenta alunos da Escola
Estadual “Esperança”.

i Estaturas(cm) Freqüências
1 150 A 154 4
2 154 A 158 9
3 158 A 162 11
4 162 A 166 8
5 166 A 170 5
6 170 A 174 3
Total 40

Tabela 3. 10

Resolução: Neste caso, temos que a classe modal é a terceira.

I = 158; h = 4; Δ1 = 11 – 9 = 2; Δ 2 = 11 – 8 = 3.
L
2
M 0 = 158 + ×4
2+3
2
= 158 + × 4 = 158 + 1,6 = 159,60
5

Portanto, a moda dos quarenta alunos da Escola Estadual “Espe-


rança” é 159,60 cm.

Vamos conferir se você está acompanhando tudo até aqui? Para


saber, procure atender aos exercícios propostos a seguir.

Exercícios Propostos
1) Calcular a média aritmética da seguinte distribuição de fre-
qüência:

Classe Freqüência

0A4 2
4A8 6

93
8 A 12 8

12 A 16 3
16 A 20 1

Tabela 3.11

Resposta. Média aritmética = 9.

2) Feito um levantamento sobre os salários (pagos em dólar) de


20 funcionários de uma empresa multinacional, pode-se elaborar
o seguinte quadro de distribuição:

Classes de Salários Freqüência

50 A 100 3
100 A 150 4

150 A 200 10

200 A 250 2
250 A 300 1

Tabela 3. 12

Nessas condições:

a) determine a distribuição de freqüência acumulada;

b) calcule a média dessa distribuição;

c) determine o valor da mediana.

Respostas:

a)

Classes de Salários Freqüência Freq.Acum.

50 A 100 3 3
100 A 150 4 7

94
150 A 200 10 17

200 A 250 2 19
250 A 300 1 20

Tabela 3. 13

b) 160;

c) 165.

3) Dada a distribuição de freqüência abaixo,


Pesos(em kg) Freqüência

145 A 151 10
151 A 157 9

157 A 163 8

163 A 169 6

169 A 175 3

175 A 187 3
181 1
∑ = 40
Tabela 3. 14

determinar:

a) a média;

b) moda;

c) mediana.

Respostas. a) 159,4 kg; b) 150,8 kg; c) 157,8 kg.

4) Uma amostra de 85 valores tem média 82,31. Uma segunda


amostra, de 35 valores, tem média 81,52. Calcular a média combi-
nada dos 120 valores.

95
Resposta. 82,08.

5) No quadro abaixo está a distribuição dos salários mensais (em


reais) de 40 funcionários da Empresa “Sorriso e Sossego”.

Número de
Salários(em R$)
funcionários

800 A 900 4
900 A 1.000 10

1.000 A 1.100 18

1.100 A 1.200 5
1.200 A 1.300 3

Tabela 3. 15

Nessas condições:

a) Elabore um quadro de distribuição de freqüências relativas


e de freqüências relativas acumuladas.

b) Quantos funcionários dessa empresa ganham menos de


R$1.000,00 mensais?

c) Qual o índice em % dos funcionários dessa empresa que


ganham mais de R$1.000,00 mensais?

d) Quantos funcionários dessa empresa ganham entre R$800,00


e R$1.200,00, inclusive?

Respostas. b) 14; c) 65%; d) 37.

6) Determinar a média aritmética dos valores apresentados no


quadro abaixo.

xi Freqüência - Fi
2 5
3 10
4 15

96
5 12
6 5
7 3

Quadro 3. 6

Resposta. Média = 4,22.

7) (FUVEST –SP) (Fundação Universitária para o Vestibular).


Numa classe com vinte alunos, as notas do exame fi nal podiam
variar de 0 a 100, e a nota mínima para aprovação era 70. Rea-
lizado o exame, verificou-se que 8 alunos foram reprovados. A
média aritmética das notas desses 8 alunos foi 65, enquanto a
média dos aprovados foi 77. Após a divulgação dos resultados,
o professor verificou que uma questão havia sido mal formu-
lada e decidiu atribuir 5 pontos a mais para todos os alunos.
Com essa decisão, a média dos aprovados passou a ser 80 e a
dos reprovados, 68,8.

a) Calcule a média aritmética das notas da classe toda antes da


atribuição dos cinco pontos.

b) Com a atribuição dos cinco pontos extras, quantos alunos,


inicialmente reprovados, atingiram nota para aprovação?

Respostas. a) 72,2; b) 3.

8) (FGV) A tabela a seguir apresenta a distribuição de freqüên-


cias dos salários de um grupo de 50 empregados de uma empre-
sa, num certo mês.

Número da classe Salário do mês em reais Número de empregados


1 1.000 A 2.000 20
2 2.000 A 3.000 18
3 3.000 A 4.000 9
4 4.000 A 5.000 3

Tabela 3. 16

97
O salário médio desses empregados nesse mês foi de:

a) R$ 2.637,00

b) R$ 2.420,00

c) R$ 2.520,00

d) R$ 2.400,00

e) R$ 2.500,00

Resposta. d)

9) (UNICAMP – SP) A média aritmética das idades de um gru-


po de 120 pessoas é de 40 anos. Se a média aritmética das idades
das mulheres é de 35 anos e a dos homens é de 50 anos, qual o
número de pessoas de cada sexo?

Resposta. São 80 mulheres e 40 homens.

Resumo
Neste capítulo explicamos várias medidas de tendência central,
que também são conhecidas com medidas de posição. As princi-
pais medidas são: média, mediana e moda. Também explicamos
outras médias, tais como: médias harmônicas, geométricas e qua-
dráticas.

Através dos diversos exemplos, o leitor deve ter observado tam-


bém que o estudo deste capítulo contribuiu para a compreensão
de como se desenvolve toda a Estatística Descritiva.

98
4 Medidas de Dispersão e Utilização
das Planilhas
4 Medidas de Dispersão e
Utilização das Planilhas

As medidas como variância e desvio padrão também têm


sua importância em estatística, por isso, vamos estudá-
las. Estudo de planilha via computador é um dos assuntos
importantes que também serão abordados neste capítulo.

4.1 Introdução

No capítulo anterior, aprendemos a calcular e a entender conve-


nientemente as medidas de posição representativas de uma deter-
minada série, em que destacamos a média, a mediana e a moda.

Muitas vezes apenas os cálculos ou as apresentações de um valor


específico para um conjunto qualquer não são suficientes para ca-
racterizar uma distribuição ou um conjunto de valores. Por exemplo,
consideremos quatro grupos de alunos com as seguintes notas:

• Grupo A : 7, 7, 7, 7 e 7
• Grupo B : 5, 6, 7, 8 e 9
• Grupo C : 4, 5, 7, 9 e 10
• Grupo D : 0, 5, 10, 10 e 10

Para representarmos cada grupo, podemos calcular a sua respectiva


média aritmética. Assim, encontramos que x A = x B = xC = x D = 7 .
Portanto, vemos que, apesar de constituídos de valores diferentes,
os grupos revelam uma mesma média aritmética, 7.

Vamos considerar agora outro exemplo de uma empresa que ope-


ra em três turnos. No final de cada semana, a produção apresen-
tada foi a seguinte:

101
Dia 2ª 3ª 4ª 5ª 6ª
Turno Feira Feira Feira Feira Feira Total Média
I 150 150 150 150 150 750 150
II 70 130 150 180 220 750 150
III 15 67 117 251 300 750 150

Tabela 4.1

Assim, se este departamento enviasse um relatório mostrando


especificamente a produção média diária, dificilmente iríamos
identificar o grau de relacionamento entre as variáveis (produ-
ção). Isto porque todos os turnos estavam mantendo a mesma
produção média semanal de 150 peças.

Nos dois exemplos, vemos que há necessidade de uma medida


estatística complementar para melhor caracterizar cada con-
junto apresentado.
Utilizaremos o termo
dispersão para indicar o
As medidas de dispersão indicam se os valores estão relativa- grau de afastamento de um
conjunto de números em
mente próximos uns dos outros, ou separados. Todas elas têm relação à sua média.
na média o ponto de referência.

As medidas estatísticas responsáveis pela variação ou dispersão


dos valores de uma série ou de um conjunto de dados apresenta-
dos são as medidas de dispersão ou variabilidade, tais como:

i) desvio médio;

ii) desvio padrão;

iii) variância;

iv) coeficiente de variação.

As medidas de dispersão nos oferecem condições para analisar-


mos até que ponto estes valores apresentam oscilações para mais
ou para menos em relação a uma medida de posição fixada.

Em principio, diremos que entre duas ou mais séries, a mais


dispersa (ou menos homogênea) é aquela que tem a maior me-
dida de dispersão.

102
Antes de apresentar as medidas de dispersão, apresentaremos, a
seguir, o conceito de amplitude.

4.2 Amplitude
Amplitude ou intervalo total (I t ) de uma série de n termos,
x1 , x2 , ..., xn , é definida como a diferença entre os valores extre-
mos da série, ou seja:
I t = xmáx − xmín ,
onde:
I t = amplitude ou intervalo total;
xmáx = valor máximo da série, isto é, máx {x1 , x2 , ..., xn };
xmín = valor mínimo da série, isto é, mín {x1 , x2 , ..., xn }.

Exemplo 4.1. Suponha que o seguinte conjunto de dados repre-


sente a idade (em anos) de uma amostra de oito professores da
Escola Estadual “Esperança”:

42 34 32 27 39 29 45 30

Resolução: A disposição ordenada torna-se:

27 29 30 32 34 39 42 45

Amplitude total = 45 – 27 = 18.

A utilização da amplitude total como medida de dispersão é mui-


to limitada, pois, sendo uma medida que depende apenas dos va-
lores externos, é instável, não sendo afetada pela dispersão dos
valores internos.

A amplitude nos dá idéia do campo de variação dos valores da sé-


rie. Apesar de serem de fácil obtenção, não são muito utilizadas,
visto que elas não levam em consideração as flutuações apresen-
tadas em relação aos valores internos da distribuição.

Quando os dados estiverem em uma tabela de freqüência, com


dados agrupados em classe, podemos utilizar dois processos na
obtenção da amplitude.

103
Um deles segue o mesmo raciocínio anterior, sendo que a am-
plitude é obtida pela diferença entre o limite superior da última
classe e o limite inferior da primeira classe, assim,
I t = xmáx − xmín .

O outro processo utiliza a diferença entre o ponto médio da últi-


ma classe e o ponto médio da primeira classe, ou seja: I t = (ponto
médio da última classe) – (ponto médio da primeira classe).

Exemplo 4.2. Vamos considerar a tabela de distribuição de freqü-


ência abaixo:

CLASSE FREQÜÊNCIA PONTO MÉDIO


(f ) ( pm )
0A2 5 1
2A4 3 3

4A6 8 5

6A8 3 7

8 A 10 1 9
Total 20 -

Tabela 4.2

Resolução.

• Primeiro processo:

I t = 10 − 0 = 10

• Segundo processo:

It = 9 − 1 = 8

104
4.3 Desvio Médio

Desvio Médio é a média aritmética dos valores absolutos dos


desvios da distribuição em relação a uma medida de tendência
central: média ou mediana.

Chamamos de desvio (di ) em relação à média a diferença entre cada


elemento de um conjunto de valores e a média aritmética, isto é,
d i = xi − x .

Exemplo 4.3. Sabendo-se que um funcionário da Escola Estadual


“Esperança” trabalha, durante uma semana, 10, 14, 13, 15, 16, 18 e
12 horas, temos que a média de trabalho da semana foi de:
10 + 14 + 13 + 15 + 16 + 18 + 12
x= = 14 horas .
7

Determine o desvio (di ) em relação à média ( x = 14 ).

Resolução. Aplicando a fórmula d i = xi − x , temos

d1 = x1 − x = 10 − 14 = −4;
d 2 = x2 − x = 14 − 14 = 0;
d3 = x3 − x = 13 − 14 = −1;
d 4 = x4 − x = 15 − 14 = 1;
d5 = x5 − x = 16 − 14 = 2;
d 6 = x6 − x = 18 − 14 = 4;
d 7 = x7 − x = 12 − 14 = −2.

Observe que na determinação de cada desvio di estaremos


medindo a dispersão entre cada xi e a média x . Temos que a
soma algébrica dos desvios em relação à média é zero, isto é,
n

∑d
i =1
i = 0.

105
4.3.1 Desvio Médio Absoluto – Dados Isolados

Desvio médio absoluto é uma medida de dispersão, pois as medidas


de dispersão (que têm a média como ponto de referência) indicam se os
valores estão relativamente próximos uns dos outros, ou separados.

Desvio médio (d m ) de uma série de n termos, x1 , x2 ,..., xn ,é a mé-


dia aritmética dos desvios absolutos tomados em relação à sua
média aritmética, ou seja:
N N

∑ di ∑ x −x i
,
dm = i =1
= i =1
n n
ou simplesmente
∑d
dm = ,
n
onde,
d m = desvio médio;
d = desvio, afastamento, resíduo ou discrepância dos termos da
série, calculados em relação à média aritmética (d = x − x )
sem considerar sinal, ou seja, desvio absoluto;
n = número de termos da série.

Observação. 4.1. Definimos desvio médio a partir dos desvios ab-


solutos, pois se assim não fosse, a soma deles seria sempre nula
em virtude da propriedade da média aritmética (a soma dos des-
vios calculados em relação à média aritmética é nula).

Exemplo 4.4. Seja x = {2, 5, 8, 15, 20}.


Resolução. A média do conjunto acima é:

∑ xi 2 + 5 + 8 + 15 + 20
x= = = 10 .
n 5

Logo, o desvio médio absoluto é

∑ xi − x
dm =
n
2 − 10 + 5 − 10 + 8 − 10 + 15 − 10 + 20 − 10
=
5
8 + 5 + 2 + 5 + 10 30
= = = 6.
5 5

106
Exemplo 4.5. Com os dados do exemplo apresentado em 4.3, tem-
se o Desvio Médio Absoluto (DMA)

∑ x −x i
−4 + 0 + −1 + 1 + 2 + 4 + −2 14
DMA = i =1
= = = 2.
7 7 7

4.3.2 Dados Isolados Ponderados e Agrupados em Classe


Quando os dados se apresentarem ordenados em uma tabela de
freqüência, agrupados em classe ou isolados ponderados, utiliza-
mos a seguinte fórmula:
∑d×f
dm =
f ,
onde
d = x − x (no caso de dados repetidos);
d = pm − x (no caso de dados agrupados em classe);
x = média aritmética;
pm = ponto médio;
f = freqüência da classe.

Podemos também calcular desvio médio usando a mediana, em


lugar de média. Basta fazer:

∑d×f
dm = ,
∑f
onde
d = x − M e ou pm − M e ,
M e = mediana;
e demais variáveis como acima.

Exemplo 4.6. Cálculo do desvio médio dos seguintes dados:

a) usando a média:

x f x. f d = x−x d. f
5 4 20 3,2 12,8
6 5 30 2,2 11,0

107
8 12 96 0,2 2,4
10 4 40 1,8 7,2
12 5 60 3,8 19,0
TOTAL 30 246 - 52,4

Tabela 4.3

Resolução:
∑ f i xi 246
x= = = 8, 2 .
∑ fi 30
e
∑ di . fi 52, 4
dm = = = 1,75 .
∑ fi 30

b) usando a mediana:

x f f .x d = x − Me f .d
5 4 20 3 12
6 5 30 2 10
8 12 96 0 0
10 4 40 2 8
12 5 60 4 20
Total 30 246 - 50

Tabela 4.4

Resolução:

n 30 30
P' = = = 15ª e P '' = + 1 = 16ª ,
2 2 2
8+8
Me = =8,
2
e

∑ di . fi 50
dm = = = 1,67 .
∑ fi 30

108
Exemplo 4.7. Considerando o tempo de serviço (em anos) dos 200
servidores públicos da Escola Estadual “Sena Figueiredo”, da ci-
dade XX, do Estado de Santa Catarina até janeiro de 2006, calcu-
lar o desvio médio dos dados a seguir:

a) usando a média:

Tempo de
f Pm d = pm − x d. f
serviço (anos)

0A5 42 2,5 10,075 423,15


5 A 10 65 7,5 5,075 329,875

10 A 15 23 12,5 0,075 1,725

15 A 20 28 17,5 4,925 137,9

20 A 25 10 22,5 9,925 99,25

25 A 30 24 27,5 14,925 358,2


30 A 35 08 32,5 19,925 159,4
Total 200 - - 1.509,5

Tabela 4.5

Resolução.

∑ f i xi
x= = 12,575 .
∑ fi
e

∑ di . fi 1.509,5
dm = = = 7,547 .
∑ fi 200

109
b) usando a mediana: d = pm − M e

Tempo de
f Pm d = pm − M e d. f
serviço (anos)

0A5 42 2,5 10,075 423,15


5 A 10 65 7,5 5,075 329,875

10 A 15 23 12,5 0,075 1,725

15 A 20 28 17,5 4,925 137,9

20 A 25 10 22,5 9,925 99,25

25 A 30 24 27,5 14,925 358,2

30 A 35 08 32,5 19,925 159,4


TOTAL 200 - - 1.509,5

Tabela 4.6

Resolução.

M e = 9, 45

∑ di . fi 1.462,3
dm = = = 7,311 .
∑ fi 200

Observação 4.2.

i) O desvio médio depende de todos os valores da distribui-


ção, fazendo com que seu resultado apresente maior segu-
rança em relação à amplitude total.

ii) Seu cálculo pode ser efetuado a partir da média ou da media-


na, sendo mínimo quando calculado a partir da mediana.

iii) Não levamos em consideração a existência de desvios nega-


tivos, porque eles são medidos em termos absolutos.

110
4.4 Desvio Padrão
O termo desvio padrão
foi introduzido na
estatística por Karl É definido como a raiz quadrada da média aritmética dos quadra-
Pearson. Ele foi o fundador
dos dos desvios em relação à média. É a mais importante medi-
do Departamento de
Estatística Aplicada da de variabilidade, ou seja, o desvio padrão de uma série de n
(Department of Applied termos, x1 , x2 , ..., xn , é a média quadrática dos desvios calculados
Statistics) na University
College London em 1911.
em relação à média aritmética da série, e é dada por

∑(x i − x )2
s= i
,
n
ou
2
⎛ ⎞
⎜ ∑ xi ⎟
∑i xi 2 − ⎝ i n ⎠
s= ,
n
ou
N

∑d i
2

s= i =1
,
n
ou, simplesmente,

∑d2
s= ,
n
onde
s = desvio padrão;
d = desvio em relação à média (d = x − x );
n = número de termos da série.

Tomando os desvios em relação a uma constante intermediária


arbitrária (x0 ) , a fórmula para o cálculo do desvio padrão se tor-
na:

∑d2 ⎛ ∑d ⎞
2

s= −⎜ ⎟ .
n ⎝ n ⎠

Onde
d = x − x0 (desvio em relação a um valor arbitrário).

111
Para facilitar ainda mais os cálculos, podemos usar x0 = 0 , o que re-
sulta em d = x − 0 = x . Então, a fórmula anterior transforma-se em:

∑ x2 ⎛ ∑ x ⎞
2

s= −⎜ ⎟ .
n ⎝ n ⎠
Exemplo 4.8. Cálculo do desvio padrão dos seguintes valores: 2,
5, 5, 6 e 7.

Resolução.

4 + 25 + 25 + 36 + 49 ⎛ 2 + 5 + 5 + 6 + 7 ⎞
2

s= −⎜ ⎟
5 ⎝ 5 ⎠
⎛ 139 ⎞
= ⎜ − 25 ⎟ = 27,8 − 25 = 2,8 = 1,67 .
⎝ 5 ⎠

Exemplo 4.9. Cálculo do desvio padrão dos seguintes valores: 4,


6, 7, 9 e 9.

Resolução.

42 + 62 + 7 2 + 92 + 92 ⎛ 4 + 6 + 7 + 9 + 9 ⎞
2

s= −⎜ ⎟
5 ⎝ 5 ⎠
⎛ 263 ⎞
= ⎜ − 49 ⎟ = 52,6 − 49 = 3,6 = 1,89 .
⎝ 5 ⎠

4.5 Variância
A variância de uma amostra de valores (dados não agrupados),
x1 , x2 ,..., xn , é definida como sendo a média dos quadrados dos A variância de uma
variável aleatória é uma
desvios das medidas em relação à sua média x , evitando, com medida da sua dispersão
n
estatística, indicando
isso, que ∑d
i =1
i = 0 . A variância da amostra é dada por quão longe em geral os
N seus valores se encontram
∑ (x i − x )2 do valor esperado. Fonte:
s2 = i =1
, http://pt.wikipedia.org/
n wiki/Variancia
ou pela fórmula alternativa
2
⎛ ⎞
⎜ ∑ xi ⎟
∑ xi 2 − ⎝ i ⎠ .
n
s2 = i
n

112
Variância de uma série é o quadrado do desvio padrão desta sé-
rie. É representado por s 2 e suas fórmulas de cálculo são as mes-
mas vistas anteriormente para o desvio padrão:
∑d2
s2 = .
n
Alternativamente, se os dados estão apresentados em uma tabela
de distribuição de freqüências, para obter a variância, aplica-se a
seguinte fórmula:
(∑ xi fi ) 2
∑ xi × fi − n
2

s2 = ,
n
onde
xi são os valores dados;
f i são as freqüências, e
n = ∑ fi número total de observações.

4.6 Coeficiente de Variação

Até o momento, estudamos medidas absolutas de dispersão,


cujas unidades de medida, com exceção da variância, são as
mesmas dos termos da série.

O coeficiente de variação é útil para a comparação, em termos


relativos, do grau de concentração em torno da média de
séries distintas. Ele mede percentualmente a relação entre o
desvio padrão e a média aritmética, sendo, pois, uma medida
adimensional. Sua expressão de cálculo é:
s
CV = × 100% ;
x
onde
CV = coeficiente de variação;
s = desvio padrão;
x = média aritmética.

Observação 4.2. O coeficiente de variação é usado principalmente


na comparação das unidades diferentes, como: salário com peso,
kg com cm, etc.

113
Exemplo 4.10. Sejam as distribuições de pesos e estaturas com as
seguintes características:

i) distribuição de peso: x1 = 57,7 kg e s1 = 7,5kg ;

ii) distribuição de estaturas: x2 = 170,0 cm e s2 = 7,1 cm .

Calcule os coeficientes de variação.

Resolução.
S1 7,5
i) CV1 = 100 × = 100 × = 12,99 , isto é, CV1 ≅ 13,0 %
x1 57, 7

S2 7,1
ii) CV2 = 100 × = 100 × = 41,17 , isto é, CV2 ≅ 41, 2 %
x2 170, 0

Vemos, assim, que a distribuição de estaturas é mais homogênea


(menos dispersa) que a distribuição de pesos.

Exemplo 4.11. Considerando os dados do exemplo 4.3, calcular


sua variância, desvio padrão e coeficiente de variação.

Resolução. Inicialmente, vamos calcular a variância:


1
s2 = ⎡⎣(10 − 14) 2 + (14 − 14) 2 + (13 − 14) 2
7
+ (15 − 14) 2 + (16 − 14) 2 + (18 − 14) 2 + (12 − 14) 2 ⎤⎦

16 + 0 + 1 + 1 + 4 + 16 + 4 42
= = =6.
7 7
Vamos mostrar o cálculo da variância pela fórmula alternativa:

xi xi2
10 100
14 196
13 169
15 225
16 256
18 324
12 144
∑xi
i = 98 ∑x i
2
= 1414
i

Tabela 4.7

114
(98) 2
1414 −
s2 = 7 = 1414 − 1372 = 42 = 6 .
7 7 7
Agora, vamos ao cálculo do desvio padrão:

s = 6 = 2,4495 .

Finalmente, temos o cálculo do coeficiente de variação:

2, 4495
CV = × 100 % = 17,5% .
14

Exemplo 4.12. Um fabricante produz certos tipos de materiais es-


colares. Inspecionaram-se dez itens. Os números de defeitos por
unidade são: 1, 0, 3, 4, 2, 1, 0, 3, 1, 2. Calcule a média, a variância, o
desvio padrão e o coeficiente de variação do número de defeitos.

Resolução. Cálculo da média:


1 + 0 + 3 + 4 + 2 + 1 + 0 + 3 + 1 + 2 17
x= = = 1, 7 .
10 10

Cálculo da variância:

1
s2 = ⎡⎣(1 − 1,7) 2 + (0 − 1,7) 2 + (3 − 1,7) 2 + (4 − 1,7) 2 + (2 − 1,7) 2
10
+ (1 − 1,7) 2 + (0 − 1,7) 2 + (3 − 1,7) 2 + (1 − 1,7) 2 + (2 − 1,7) 2 ⎤⎦

0, 49 + 2,89 + 1,69 + 5, 29 + 0,09 + 0, 49 + 2,89 + 1,69 + 0, 49 + 0,09


=
10
16,10
= = 1,61 .
10
Cálculo do desvio padrão:
s = 1, 61 = 1, 2689 .

Cálculo do coeficiente de variação:


1, 2689
CV = × 100 % = 74,64% .
1, 7

115
Exemplo 4.13. Considere as informações, obtidas na secretaria,
relativas ao número de faltas ao trabalho, durante o mês de Maio/
X1, dos quarenta funcionários da Escola Estadual “ESPERANÇA”.
Calcular a variância e o desvio padrão.

Número de faltas Número de funcionários


0 15
1 10
2 5
3 5
4 1
5 1
6 0
7 3

Quadro 4.1

Resolução. Os cálculos intermediários estão apresentados a seguir.

x f x × f x2 x2 × f
0 15 0 0 0
1 10 10 1 10
2 5 10 4 20
3 5 15 9 45
4 1 4 16 16
5 1 5 25 25
6 0 0 36 0
7 3 21 49 147

∑= 40 ∑ = 65 ∑ = 263

Tabela 4.8

• Cálculo da variância:
(65) 2
263 −
s2 = 40 = 263 − 105, 63 = 3,9344 .
40 40

116
• Cálculo do desvio padrão:
s = 3,9344 = 1,9835 .

Vamos conferir se você está acompanhando tudo até aqui? Para


saber, procure atender aos exercícios propostos abaixo.

Exercícios Propostos
1) Calcular a variância e o desvio padrão da seguinte distribui-
ção de freqüência:

Classe Freqüência

0A4 2
4A8 6

8 A 12 8

12 A 16 3
16 A 20 1

Tabela 4.9

Resposta: Variância = 15,8; desvio padrão = 9,37.

2) Feito um levantamento sobre os salários (pagos em dólar) de


20 funcionários de uma empresa multinacional, pode-se elaborar
o seguinte quadro de distribuição:

Classes de Salários Freqüência

50 A 100 3
100 A 150 4

150 A 200 10

200 A 250 2
250 A 300 1

Tabela 4.10

117
Nessas condições:

a) Faça uma representação gráfica da distribuição usando o


histograma de freqüência.

b) Qual o desvio padrão dessa distribuição?

c) Determine a variância e o desvio padrão da distribuição.

d) Determine o coeficiente de variação da distribuição.

Resposta: a) ; b) 39,5; c) 2.525 e 50,24; d) 31,40%.

3) Em um exame de Matemática, o grau médio final de um gru-


po de 150 alunos foi 7,8, e o desvio padrão, 0,80. Em Física, entre-
tanto, o grau médio final foi 7,3, e o desvio padrão, 0,76. Em que
disciplina foi maior a dispersão?

Resposta: Física.

4) Um grupo de 100 estudantes tem uma estatura média de


163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio
padrão desse grupo?

Resposta: 5,41.

5) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e


CV = 2,9%. Determinar a média da distribuição.

Resposta: 51,7.

6) Num teste aplicado a 20 alunos, obteve-se a seguinte distri-


buição de pontos:

118
Pontos No de alunos

35 A 45 1
45 A 55 3

55 A 65 8

65 A 75 3

75 A 85 3
85 A 95 2

Tabela 4.11

Nessas condições:

a) Calcular o desvio médio.

b) Determinar o desvio padrão.

c) Calcular o coeficiente de variação.

Respostas: a) 11; b) 13,23; c) 20%.

7) Determinar a variância, o desvio padrão e o coeficiente de


variação dos valores apresentados no quadro abaixo.

xi Freqüência – fi
2 5
3 10
4 15
5 12
6 5
7 3
Quadro 4.2

Respostas: Variância = 2,99; desvio padrão = 1,73; CV = 41%.

119
8) Determinada editora pesquisou o número de páginas das re-
vistas mais vendidas em uma cidade.

Revistas A B C D E F
Número de páginas 62 90 88 92 110 86

Quadro 4.3

Calcular:

a) O número médio de páginas.

b) O desvio médio.

c) A variância.

d) O desvio padrão.

Respostas: a) 88; b) 9,3; c) 197,3; d) 14.

4.7 A Estatística no Excel

Nesta seção, apresentaremos a utilização da planilha no progra-


ma Excel. Explicaremos alguns conceitos importantes da estatís-
tica através do uso desse programa.

4.7.1 Conhecendo o Excel


O Excel é um programa de planilha de cálculo que foi desenvolvi-
do pela Microsoft para operar em ambiente Windows.

Uma planilha eletrônica tal como o Excel é um conjunto de li-


nhas e colunas em que podemos colocar as informações de for-
ma organizada.

Você poderá fazer no Excel não apenas cálculos (simples ou muito


complexos), mas também construir gráficos, gerenciar banco de
dados, fazer simulações, etc.

A tela do Excel possui uma série de elementos, e é importante

120
conhecermos cada um deles.

Vamos destacar os principais na seguinte figura:

Barra de menus
Barra de ferramentas
Barra de fórmulas

Endereço de
Célula ativa
Célula ativa Barra de rolagem
vertical e horizontal

Identificador
de linha
Identificador
Botões de rolamento
de coluna
de planilhas
Guia de planilhas

Figura 4.1

É importante ler as seguintes observações:

• A barra de menus permite selecionar um comando no Excel para


realizar uma determinada operação.
• A barra de ferramentas permite acionar comandos no Excel ao dar
um clique com o mouse nos botões correspondentes.
• A barra de fórmulas mostra o conteúdo da célula ativa. É por inter-
médio dela que podemos fazer eventuais alterações.
• Célula é a intercessão entre uma coluna e uma linha da planilha.
Podemos referenciar uma célula pelo seu endereço. Por exemplo,
endereço C3 indica a célula que se encontra na coluna C, linha 3.
A célula ativa é a aquela em que está posicionado o cursor. Tudo o
que for digitado será incluído na célula que estiver ativa.
• As barras de rolamento permitem nos movimentarmos pela planilha.
• As guias de planilha permitem tornar ativa a planilha na qual da-
mos um clique.
• Os botões de rolamento de planilhas permitem a rolagem das guias
de planilhas.

121
Uma das primeiras coisas que devemos aprender sobre uma pla-
nilha é como nos movimentarmos. Realmente é uma área de tra-
balho muito grande que o Excel nos oferece. Quando ingressa-
mos no Excel, ele nos fornece uma pasta de trabalho que tem 3
folhas (ou guias), cada uma das quais tem 256 colunas e 16.384
linhas. Em outras palavras, cada guia tem mais de 4 milhões de
células individuais. Como deslocarmos nesta grande área?

Você pode “navegar” pelo Excel com o teclado e com o mouse.

1) Com o teclado

• Para movimentar célula a célula: utilize as setas cursor de


seu teclado.
• Para movimentar tela a tela, para baixo ou para cima: utilize
as teclas PgUp e PgDown de seu teclado.
• Para movimentar tela a tela lateralmente: utilize as teclas
Ctrl + PgUp e Ctrl + PgDown de seu teclado.
• Para posicionarmos no início da planilha: Ctrl + Home.
• Para posicionarmos na ultima célula ocupada da planilha:
Ctrl + End.

2) Com o mouse

Para nos movimentar com o mouse utilizamos as barras de rola-


gem. Cada uma das barras (vertical ou horizontal) possui dois
botões de movimentação, que contêm uma seta em cada uma de
suas extremidades. Ao clicarmos nestas setas, produzimos a mo-
vimentação em função do seu sentido.

Com o mouse também podemos passar de uma planilha para ou-


tra. O método é bastante intuitivo, pois no rodapé da tela estão os
guias da planilha. Para que tornemos uma determinada planilha
ativa, basta dar um simples clique sobre o seu nome.

Figura 4.2

Outra atividade fundamental quando trabalhamos no Excel


é a seleção de células. Isto nos permite trabalhar simultane-

122
amente com todas as células previamente selecionadas, por
exemplo, para mudar o tipo de letra que elas apresentam, ou
para apagar seu conteúdo, etc.

Para a seleção de uma linha, uma coluna ou a planilha inteira,


veja, na figura abaixo, como proceder.

Para selecionar toda uma coluna: posiconar o


ponteiro do mouse sobre o nome da coluna e
clicar com o botão esquerdo.

Para selecionar toda a Para selecionar toda uma linha: posico-


planilha, posicionar o nar o ponteiro do mouse sobre o número
mouse sobre este da linha e clicar com o botão esquerdo.
botão e dar um clique.

Figura 4.3

Para sair do Excel, clique no menu arquivo e depois na opção sair.

Se você não tiver salvado previamente seu trabalho, o Excel per-


guntará se deseja salvar agora. Se der um clique em sim, você
poderá dar um nome à sua pasta, para que ela fique armazenada
em seu disco. Se der um clique em não, todas as alterações que
você tiver feito na sua pasta serão perdidas para sempre. O ato
de dar um clique no botão cancelar cancela o comando sair, e faz
com que você retorne ao programa Excel.

Para a edição de uma planilha no Excel, se quisermos introdu-


zir qualquer dado, primeiramente devemos selecionar uma célu-
la, clicando nela. Depois de escrever o dado pressionamos Enter
para fixá-lo na célula.

123
É importante também saber identificar em que célula está escrito o
dado. Para isto, é suficiente que você selecione uma célula e verifique,
na barra de fórmulas, se o dado está sendo visualizado também ali.

Uma fórmula é a maneira que indicamos para o Excel para executar


uma conta. Quando montamos uma fórmula, devemos começar co-
locando um sinal de igual (=) e em seguida a fórmula propriamente.

Você não precisa escrever os endereços de células que intervêm


na fórmula. É suficiente dar um clique nas células com as quais
deseja trabalhar.

É bom lembrar que existe uma hierarquia entre os operadores


matemáticos. O Excel executa os cálculos na seguinte ordem:

• 1o Exponenciação ( ^ )
• 2o Multiplicação ( * ) e Divisão ( / )
• 3o Adição ( + ) e Subtração ( - )

Para alterarmos esta hierarquia, lançamos mão dos parêntesis, e desta


forma o Excel executa primeiramente o que estiver dentro dos parên-
tesis. Observe o resultado das seguintes expressões matemáticas:

2*3+10 = 16
2*(3+10) = 26.

Uma função é um processo de cálculo padronizado. Para escre-


ver uma função, em primeiro lugar escrevemos o signo igual (=),
depois o nome da função e entre parêntesis os argumentos. O
nome é a denominação pela qual o Excel reconhece o cálculo a ser
executado. Os argumentos são parâmetros auxiliares ou infor-
mações adicionais que passamos à função para que possam ser
feitos os cálculos. Por exemplo, se escrevemos numa célula livre

=media(A1:A5),

onde media é o nome da função e indica que o cálculo a ser exe-


cutado é uma média simples. (A1:A5) é um argumento da função
e indica que esta média deve ser calculada pelos valores contidos
das células A1 até a célula A5. Caso a função seja mais complexa e
exija mais parâmetros, estes devem estar separados por vírgulas.

124
O Excel possui mais de 700 funções predefinidas, separadas em
11 categorias. Você também poderá escrever uma função com o
assistente de função, o qual pode ser acessado clicando no botão
da barra de ferramentas padrão. Quando você ativa o Assistente de
Função, aparecerá a Caixa de Diálogo, mostrada na seguinte figura:

Lista das categorias Lista das funções


Figura 4.4

Vamos a um exemplo de aplicação.

Exemplo 4.14. Vamos considerar o seguinte exemplo do capítulo 2:

Estaturas de 40 alunos (em cm) da Escola Estadual “Esperança”, no


Semestre 2005/1

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

Tabela 4.12

Construir a freqüência simples ou absoluta, a freqüência relativa,


a freqüência acumulada, a freqüência relativa acumulada e a por-
centagem, usando o Excel.

125
Resolução. Comece por digitar na célula A1 o título ESTATURAS
DE ALUNOS. Da célula A2 à célula J5, digite cada um dos valores
apresentados na tabela 4.12, conforme o exemplo abaixo.

Figura 4.5

Na célula A7 digite MÁXIMO, desloque o cursor para a célula C7


e introduza a função MÁXIMO. Para isto, clique em “assistente de
função”, selecione a categoria “estatística” e selecione a função
MÁXIMO(núm 1; núm 2; ...;núm 30) – Dá como resultado o valor
máximo dos valores numéricos núm 1, núm 2; ...;núm 30. Cada
um desses núm pode ser um intervalo de células de uma planilha
contendo valores numéricos. Selecione as células de A2 até J5, ou
seja, = MÁXIMO(A2:J5), que fornece o resultado igual a 173.

Na célula A8, digite MÍNIMO, desloque o cursor para a célula C8


e introduza a função MÍNIMO(núm 1; núm 2; ...;núm 30) – Dá
como resultado o valor mínimo dos valores numéricos núm 1,
núm 2; ...;núm 30. Cada um desses núm pode ser um intervalo
de células de uma planilha contendo valores numéricos. Selecio-
ne as células de A2 até J5, ou seja,

126
= MÍNIMO(A2:J5), que fornece o resultado igual a 150.

Na célula A9, digite AMPLITUDE, desloque o cursor para a célula


C9 e introduza a a função = C7 − C8 , que fornece o resultado
igual a 23.

Na célula A10, digite i = NÚM. DE CLASSES; na célula A11, digite


n; na célula B11, digite 40; e na célula A12, digite h (amplitude
do intervalo de classe). Desloque o cursor até a célula C10 e in-
troduza a Regra de Sturges, i = 1 + 3,33 log n , no nosso exemplo,
digite: = 1 + 3,33*log(B11) , que fornece i = 6,286798 ou i =
6(célula D10). Desloque o cursor até a célula C12 , digite a fun-
ção = C9/C10, cujo resultado é 3,83333, ou h = 4(célula D12).

Na célula A14, digite i; na B14, digite Estaturas; na C14, digite em cm;


na D14, digite Fre. Abs.; na E14, digite Freq. Rel.; na F14, digite Freq.
Acum.; na G14, digite Freq. Rel. Acum.; e na H14, digite Porcent.

Nas células de A15 até A20, digite o número de classes.

Na célula B15, digite 150 (o limite inferior da primeira classe);


na célula C15, digite 154 (o limite superior da primeira classe)
e assim por diante, até a célula B20, onde você deve digitar 170
(o limite inferior da sexta classe), e na célula C20, digite 174 (o
limite superior da sexta classe).

Para calcular a freqüência simples ou absoluta, você utiliza a fun-


ção estatística CONT.SE. Esta função calcula o número de células
que não estejam em branco em um intervalo e que obedeçam a
um determinado critério, ou seja, = CONT.SE(intervalo; critérios).

Para determinar o número de alunos que têm estatura igual ou


superior a 150 cm e menor do que 154 cm:

• Desloque o cursor para a célula D15.

• Introduza a função:

= CONT.SE(A2 : J5 ; “< 154”) – CONT.SE(A2 : J5 ; “<150”)

cujo resultado é 4.

127
Para determinar o número de alunos que têm estatura igual ou
superior a 154 cm e menor do que 158 cm:

• Desloque o cursor para a célula D16.

• Introduza a função:

= CONT.SE(A2 : J5 ; “< 158”) – CONT.SE(A2 : J5 ; “<154”),

cujo resultado é 9, e assim por diante, até a sexta classe.

Para determinar o número de alunos que têm estatura igual ou


superior a 170 cm e menor do que 174 cm:

• Desloque o cursor para a célula D20.

• Introduza a função:

= CONT.SE(A2 : J5 ; “< 174”) – CONT.SE(A2 : J5 ; “<170”)

cujo resultado é 3.

Desloque agora o cursor para a célula D21 e introduza a função


SOMA. Para introduzir a função SOMA, selecione, no assistente
de função, a categoria “matemática e trigonometria” e selecione
a função SOMA (núm 1; núm 2; ...;núm 30) que soma todos os
números em um intervalo de células. Neste exemplo,

= SOMA (D15:D20), cujo resultado é 40.

Para calcular a freqüência relativa da primeira classe, desloque


o cursor para a célula E15 e introduza a função = D15/D21, cujo
resultado é 0,10000. Para calcular a freqüência relativa da se-
gunda classe, desloque o cursor para a célula E16 e introduza a
função = D16/D21, cujo resultado é 0,2250, e assim por diante,
até a sexta classe. Para calcular a freqüência relativa da sexta
classe, desloque o cursor para a célula E20 e introduza a função

= D20/D21, cujo resultado é 0,0750.

Para calcular a freqüência acumulada da primeira classe, des-


loque o cursor para a célula F15 e digite 4. Para calcular a fre-
qüência acumulada da segunda classe, desloque o cursor para a

128
célula F16 e introduza a função = F15 + D16, cujo resultado é 13.
Para calcular a freqüência acumulada da terceira classe, deslo-
que o cursor para a célula F17 e introduza a função

= F16 + D17, cujo resultado é 24, e assim por diante, até a


sexta classe.

Para calcular a freqüência relativa acumulada da primeira classe,


desloque o cursor para a célula G15 e introduza a função = F15/F20,
cujo resultado é 0,1000. Para calcular a freqüência relativa acumu-
lada da segunda classe, desloque o cursor para a célula G16 e intro-
duza a função =F16/F20, e assim por diante, até a sexta classe.

Para determinar a porcentagem da primeira classe, desloque o


cursor para a célula H15, digite = G15 e utilize os botões da bar-
ra de ferramentas FORMATAÇÃO, no caso, o formato percentual
% , cujo resultado é 10,00%. Utilize o mesmo procedimento
para as demais classes.

Exemplo 4.15. Construir a freqüência simples ou absoluta, a


freqüência relativa, a freqüência acumulada, a freqüência relativa
acumulada e a porcentagem, usando o Excel, considerando os
dados brutos do quadro abaixo, que representam o peso (em
kilogramas) de 40 crianças, entre 0 e 8 anos, da Creche Municipal
“O Bom Pastor”, no semestre 2004/2.

11,1 12,5 32,4 7,8 21,0 16,4 11,2 22,3


4,4 6,1 27,7 32,8 18,5 16,4 15,1 6,0
10,7 15,8 25,0 18,2 12,2 12,6 4,7 23,5
14,8 22,6 16,0 19,1 7,4 9,2 10,0 26,2
3,5 16,2 14,5 3,2 8,1 12,9 19,1 13,7

Quadro 4.5

Resolução: Exercício

129
Resumo
Neste capítulo, explicamos as medidas de dispersão, de cálculo
de amplitude total, o desvio médio absoluto, a variância, o desvio
padrão, o coeficiente de variação, etc.

Além disso, fornecemos um pouco de conhecimento do uso de


planilhas no Excel.

Só prossiga após compreender todo o conteúdo deste capítulo.


Consulte o tutor do pólo sempre que achar necessário.

Bibliografias Comentadas

CRESPO, A. Arnot. Estatística Fácil , 7. ed. São Paulo: Saraiva, 1990.


Apresenta o conteúdo de Medidas de Dispersão de uma maneira
bem clara e objetiva, facilitando a compreensão por parte do aluno.
É um livro complementar para o estudo deste capítulo.

Sugerimos para aprender mais sobre o conteúdo abordado neste


capitulo que consulte

FONSECA, Jairo Simom da e MARTINS, Gilberto de Andrade, Curso


de Estatística. 3. ed. São Paulo: Atlas, 1982.
Nele você encontra exercícios de aplicação.
LEVINE, D. M, BERENSON, M. L. e STEPHAN, D. Estatística: Teoria
e Aplicações – Usando Microsoft Excel em Português. Rio de Janeiro:
LTC, 2000.
Aborda conceitos de Estatística utilizando o Excel. Uma das vanta-
gens de utilizar uma aplicação de planilha como o Microsoft Excel é
que ela facilita o uso da análise de simulação, que permite ao aluno
explorar o efeito de modificações de valores dados.

130
5 Cálculo de Probabilidade
5 Cálculo de Probabilidade

A palavra probabilidade
origina-se do Latim
probare (provar ou testar). O nosso objetivo neste capítulo é encontrar explicação no
Informalmente, provável é
fato de que a maioria dos fenômenos de que se trata a Esta-
uma das muitas palavras
utilizadas para eventos tística é de natureza aleatória ou probabilística. Conseqüen-
incertos ou conhecidos. Tal temente, o conhecimento dos aspectos mais fundamentais
como acontece com a teoria
da mecânica, que atribui
do cálculo de probabilidades é uma ferramenta essencial
definições precisas a para o estudo da Inferência Estatística ou Estatística Infe-
termos de uso diário, como rencial, que será abordada no próximo capítulo.
trabalho e força, também
a teoria das probabilidades
tenta quantificar a noção
de provável. Fonte: http://
pt.wikipedia.org/wiki/Pro 5.1 Introdução
babilidade#Probabilidade_
na_matem.C3.A1tica O cálculo das probabilidades pertence ao campo da Matemática
que trata situações sujeitas às leis do acaso.

Historicamente, a teoria da probabilidade começou com o estudo


de jogos de azar, como a roleta e as cartas. O tratamento moderno
da teoria da probabilidade é puramente axiomático. Isto significa
que as probabilidades de nossos eventos podem perfeitamente
ser arbitrárias, a menos que certos axiomas, enunciados abaixo,
sejam satisfeitos.

Toda pessoa que se aventura em um jogo de azar sabe que tem


Blaise Pascal (1623-1662)
chance de perder e de ganhar, embora em geral não saiba de quanto
Blaise Pascal.
Extraordinário filósofo, é essa chance. Mas foi procurando quantificar essas chances que o
físico e matemático matemático francês Pascal deu origem ao estudo de probabilidade.
francês de curta existência.
Juntamente com Pierre de
Fermat, estabeleceu as bases Sempre que estudamos alguns fenômenos de observação, deve-
da teoria das probabilidades mos distinguir o próprio fenômeno e o modelo matemático (de-
e da análise combinatória.
Fonte: http://pt.wikipedia.
terminístico ou probabilístico) que melhor explique.
org/wiki/Blaise_Pascal
Os fenômenos estudados pela estatística são fenômenos cujo re-
sultado, mesmo em condições normais de experimentação, va-
riam de uma observação para outra, dificultando dessa maneira
a previsão de um resultado.

133
Na teoria da probabilidade, definimos um modelo matemático
para tal fenômeno pela associação s de “probabilidades” (ou os
valores limites das freqüências relativas) aos “eventos” relaciona-
dos com um experimento. A validade do nosso modelo matemá-
tico, para um dado experimento, depende de as probabilidades
associadas estarem bem próximas da freqüência relativa.

5.2 Experimentos Aleatórios


São aqueles que, mesmo repetidos várias vezes sob condições se-
melhantes, apresentam resultados imprevisíveis. A cada experi-
mento correspondem, em geral, vários resultados possíveis. Estes
experimentos também são conhecidos como experimentos não-
determinísticos. Por exemplo:

i) Jogue um dado e observe o número mostrado na face de cima.

ii) Jogue uma moeda quatro vezes e observe o número de ca-


ras obtido.

iii) Em uma linha de produção, fabrique peças em série e conte


o número de peças defeituosas produzidas em um período
de 24 horas.

iv) Uma lâmpada é fabricada. Em seguida é ensaiada quanto à


duração da vida, pela colocação em um soquete e anotação
do tempo decorrido (em horas) até queimar.

5.3 Espaço amostral e Noção de Probabilidade


Espaço amostral é o conjunto de todos os possíveis resultados de
um experimento aleatório.

Considerando cada uma dos experimentos acima, o espaço amos-


tral de cada um deles será:

Ω 1: {1,2,3,4,5,6}

Ω 2: {0,1,2,3,4}.

Ω 3: {0,1,2,...,n}, onde n é o número máximo de peças que pode ser


produzido em 24 horas.

134
Ω 4: {t / t ≥ 0}.

• Evento (E)

Chamamos de evento qualquer subconjunto do espaço amostral


Ω de um experimento aleatório. Um evento é sempre definido
por uma sentença.

Se E = Ω , então E é chamado evento certo.

Se E = ∅, então E é chamado evento impossível.

Por exemplo, no lançamento de um dado, onde Ω = {1,2,3,4,5,6},


temos:

a) um número par na face superior. A = {2,4,6}.

b) um número menor ou igual a seis na face superior.


B = {1,2,3,4,5,6} = Ω .

c) um número maior do que seis na face superior.


C = ∅.

Podemos combinar eventos usando as várias operações com


conjuntos:

• o evento A ∪ B ocorre se e somente se ocorre A ou ocorre


B (ou ambos);
• o evento A ∩ B ocorre se e somente se ocorrem A e B ;
• o evento Ac , complemento de A , ocorre se e somente se não
ocorre A .

Dois eventos, A e B , são ditos mutuamente exclusivos se são disjun-


tos, isto é, se A ∩ B = φ . Em outras palavras, A e B são mutua-
mente exclusivos se não ocorrem simultaneamente.

• Axiomas de Probabilidade

Dados Ω um espaço amostral, P( A) probabilidade do evento A


e P( A) uma função definida em Ω que associa a cada evento um
número real, satisfazendo os seguintes axiomas:

135
Axioma 1: Para todo evento A , 0 ≤ P( A) ≤ 1 .

Axioma 2: P(Ω) = 1 .

Axioma 3: Se A e B são eventos mutuamente exclusivos, então


P( A ∪ B) = P( A) + P( B) .

Desses axiomas decorrem as seguintes propriedades:

• Se φ é um conjunto vazio, então P( φ) = 0 .


• Se Ac é o complemento de um evento A , então.
P( Ac ) = 1 − P( A)
• Se A ⊂ B , então P( A) ≤ P( B) .
• Se A e B são dois eventos quaisquer, então
P( A / B) = P( A) − P( A ∩ B) .

Seja Ω um espaço amostral finito: Ω = {a1 , a2 ,..., an } . Considere-


mos o evento formado por um resultado simples A = {ai } . A cada
evento simples {ai } , associemos um número pi , denominado
probabilidade de {ai } , satisfazendo as seguintes condições:

1a condição: pi ≥ 0 para i = 1, 2,..., n .

2a condição: p1 + p2 + ... + pn = 1 .

Definição 5.1. Seja A um experimento aleatório e Ω o seu espaço


amostral. Admitamos que os elementos de Ω tenham a mesma chance
de acontecer, ou seja, Ω é um conjunto equiprovável. A probabilidade de
um evento A , A ⊂ Ω , é o número real P( A) , tal que

número de vezes que o evento A pode ocorrer


P( A) = .
número de vezes que o espaço amostral Ω ocorre

Definição 5.2. Dados dois eventos, A e B , denotaremos P( A / B) a


probabilidade condicionada do evento A , quando B tiver ocorrido, por:
P( A ∩ B )
P( A / B) = , com P( B) > 0 , pois B já ocorreu.
P( B )
Assim,
P( A ∩ B)
P( A / B) = ⇒ P( A ∩ B) = P( B) × P( A / B)
P( B)

136
e
P( A ∩ B)
P( B / A) = ⇒ P( A ∩ B) = P( B) × P( A / B) .
P( A)

Logo, podemos dizer que:

A probabilidade da ocorrência simultânea de dois


eventos, A e B, do mesmo espaço amostral, é
igual ao produto da probabilidade de um deles pela
probabilidade condicional do outro, dado o primeiro.

Observação 5.1. O teorema do produto para quaisquer eventos


A1 , A2 , A3 ,..., An é dado por
P( A1 ∩ A2 ∩ . . . ∩ A n )
= P( A1 ).P( A2 / A1 ).P( A3 / A1 ∩ A2 )...P( An / A1 ∩ A2 ∩ .... An −1 ) .

Definição 5.3. Os eventos A e B são independentes se


P( A ∩ B) = P( A) × P( B) , caso contrário, são dependentes.

Definição 5.4. Dizemos que dois ou mais eventos são mutua-


mente exclusivos quando a realização de um exclui a realização
do(s) outro(s).

Por exemplo, no lançamento de uma moeda, o evento “tirar cara”


e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se
realizar um deles, o outro não se realiza.

Não é difícil de observar que se A e B são eventos mutuamente


exclusivos, então A ∩ B = φ e P( A ∩ B) = 0 .

Se A e B podem ocorrer ao mesmo tempo, a probabilidade de


ocorrer A ou B é dada pela probabilidade de A, mais a probabili-
dade de B, menos a probabilidade de A e B, e escrevemos
P( A ∪ B) = P( A) + P( B) − P( A ∩ B) .

Observação 5.2. O resultado acima é válido para mais de dois


eventos, ou seja, podemos generalizá-lo. Por exemplo, para três
eventos: A, B e C, o resultado fica:

137
P( A ∪ B ∪ C ) = P( A) + P( B ) + P(C )

− P( A ∩ B ) − P( A ∩ C )

− P( B ∩ C ) + P( A ∩ B ∩ C ) .

5.4 Variáveis Aleatórias


Ao descrever um espaço amostral de um experimento, não es-
pecificamos que um resultado individual necessariamente seja
um número. Temos alguns exemplos nos quais o resultado do
experimento não é uma quantidade numérica: ao descrever uma
peça manufaturada, podemos empregar apenas as categorias “de-
feituosa” e “não defeituosa”; ao observar a temperatura durante
o período de 24 horas, podemos apenas registrar a curva traçada
pelo termógrafo. Contudo em muitas situações experimentais, es-
taremos interessados na mensuração de alguma coisa e no seu
registro como um número. Mesmo nos exemplos citados, pode-
remos atribuir um número a cada resultado (não) numérico do
experimento. Por exemplo, poderemos atribuir o valor um às pe-
ças perfeitas e o valor zero às defeituosas. Podemos registrar a
temperatura máxima ou a temperatura mínima do dia.

Os exemplos acima são bastante típicos de uma classe muito geral


de problemas: em muitas situações experimentais, desejamos atri-
buir um número real a todo elemento do espaço amostral. Com
isto em mente, podemos formular a seguinte definição:

Definição 5.5. Sejam E um experimento e Ω o espaço associado ao


experimento. Uma função X, que associe a cada elemento s de Ω um
número real X(s), é denominada variável aleatória.

Exemplo 5.1.

E: lançamento de duas moedas;


X: número de caras obtidas nas duas moedas;
Ω = {(Ca,Co), (Ca,Ca), (Co,Ca), (Co,Co)},

onde Ca é cara e Co é coroa.

X = 0 - corresponde ao evento (Co,Co), com probabilidade 1/4;

138
X = 1 - corresponde ao evento (Ca,Co), (Co,Ca) com probabilidade
1/2;

X = 2 - corresponde ao evento (Ca,Ca) com probabilidade 1/4.

Q uando uma variável tem resultados ou valores


numéricos que tendem a variar de uma obser-
vação para outra em razão de fatores relacionados
com a chance, chama-se variável aleatória.

Definição 5.6. Seja X uma variável aleatória. Se o número de valores


possíveis de X for finito ou infinito numerável, denominaremos X de
variável aleatória discreta, isto é, os valores de X, podem ser contados.
Uma variável aleatória é
considerada discreta se
toma valores que podem ser Vejamos alguns exemplos:
contados.
• Número de reprovados em física em uma amostra contendo
20 alunos, extraídos de uma turma de 60 alunos.
• Número de pais de alunos na fila de um banco comercial
para realizarem o pagamento da mensalidade.
• Número de falhas que um equipamento apresenta ao longo
de certo período.

Definição 5.7. Seja X uma variável aleatória. Suponha que o contrado-


Uma variável aleatória mínio de X seja um intervalo ou uma coleção de intervalos, então diremos
é considerada contínua que X é uma variável aleatória contínua discreta.
quando pode tomar
qualquer valor do
determinado intervalo. Vejamos alguns exemplos:

• A altura de um aluno da turma A da 5a série da Escola XX.


• O tempo requerido para que um aluno possa realizar a ava-
liação da disciplina de estatística na Escola XX.
• O salário mensal de um professor do ensino fundamental
pago pela Escola XY.

Definição 5.8. Seja X uma variável aleatória discreta. A cada possível resulta-
do de xi associaremos um número p( xi ) = P( X = xi ), i = 1, 2,..., denominado
probabilidade de xi tal que p( xi ) ≥ 0 e ∑ p( xi ) = 1, ou p ( x) = P( X = x) .
i ≥1

139
A função p, assim definida, é denominada função de probabilidade da variável
aleatória X. A coleção de pares (xi , p ( xi ) ), i = 1, 2,... é denominada distribui-
ção de probabilidade de X.

P( X = x) pode ser expressa por uma tabela, gráfico ou fórmula.

Vejamos alguns exemplos para P( X = x) .

Exemplo 5.2. Consideramos o seguinte experimento E: lançamen-


to de duas moedas. Seja a variável aleatória X: número de caras
obtidas. Vamos expressar P( X = x) por

1) Tabela:

x 0 1 2
P( X = x) 1/4 1/2 1/4

Tabela 5.1

2) Gráfico:
P(X= x)

1/2

1/4

x
0 1 2
Gráfico 5.1

⎛2⎞
⎜ x⎟
3) Fórmula: P( X = x ) = ⎝ ⎠ , para x = 0,1,2.
4
Exemplo 5.3. Seja o lançamento de um par de dados. O espaço amos-
tral é constituído de 36 pares ordenados de números entre 1 e 6, isto é,
Ω = {(1,1),(1,2),...,(6,6)}, e X associa a cada ponto (a,b) de Ω o maior des-
ses números, isto é, X(a,b) = máx (a,b). Então, X é uma variável aleatória
com o conjunto imagem {1,2,3,4,5,6}. Determinar p( xi ) = P( X = xi ),
i = 1, 2,...,6 , ou seja, a distribuição ou função de probabilidade de X.

140
Resolução: Calculando a distribuição p de X , vem:

Para x1 = 1 temos
1
p ( x1 ) = p (1) = P( X = 1) = P({(1,1)}) = .
36
Para x2 = 2 temos

3
p ( x2 ) = p (2) = P( X = 2) = P({(2,1), (2, 2), (1, 2)}) = .
36
Para x3 = 3 temos
p( x3 ) = p(3) = P( X = 3)
= P({(3,1),(3, 2),(3,3),(2,3),(1,3)})
5
= .
36
Para x4 = 4 temos
p( x4 ) = p(4) = P( X = 4)
= P({(4,1),(4, 2),(4,3),(4, 4),(3, 4),(2, 4),(1, 4)}) .
7
= .
36
Da mesma forma, temos
9
p ( x5 ) = p (5) = P( X = 5) =
36
e
11
p ( x6 ) = p (6) = P( X = 6) = .
36
Esta informação é colocada na forma de uma tabela, como segue:

xi 1 2 3 4 5 6

1 3 5 7 9 11
p ( xi )
36 36 36 36 36 36

Tabela 5.2

5.5 Esperança Matemática ou Valor Esperado


Chama-se esperança matemática de uma variável aleatória discreta
X, a soma de todos os produtos possíveis da variável aleatória
com respectiva probabilidade.

141
E ( X ) = μ X = μ = ∑ xi × p ( xi )
i ,

isto é, E ( X ) é a média ponderada dos possíveis valores de X,


cada um ponderado por sua probabilidade. Discutimos a média
ponderada no capítulo
3. Volte a ele se
Exemplo 5.4. Calcular o valor esperado ou a esperança matemá- sentir necessidade de
tica do exemplo 5.3. esclarecimentos.

Solução: Pela tabela da distribuição de probabilidade encontra-


da, temos

xi 1 2 3 4 5 6

1 3 5 7 9 11
p ( xi )
36 36 36 36 36 36

Tabela5.3

e,
E ( X ) = ∑ xi × p( xi )
i
1 3 5
= 1× + 2 × + 3×
36 36 36
7 9 11
+4 × + 5 × + 6 ×
36 36 36
161
= = 4, 47 .
36
Portanto, o valor esperado ou esperança matemática é 4,47.

Exemplo 5.5. Um fabricante produz peças tal que 5% delas são


defeituosas e 95% são não defeituosas. Se uma peça for defeituo-
sa, o fabricante perde R$ 2,45, enquanto uma peça não defeituosa
lhe dá um lucro de R$ 6,50. Se X for o lucro líquido por peça, en-
tão X será uma variável aleatória, cujo valor esperado é dado por
E ( X ) = −0, 05 × 2, 45 + 0,95 × 6,50 = R$6, 05 .

Se for produzido um grande número de peças, neste caso, quando


o fabricante perder R$ 2,45, cerca de 5% das vezes, e ganhar R$
6,50, cerca de 95% das vezes, ele espera ganhar cerca de R$ 6,05
por peça, em longo prazo.

142
Exemplo 5.6. O almoxarifado da Escola Estadual “Vida Nova” es-
tabeleceu um registro de requisição para certo tipo de material
escolar, conforme quadro abaixo. Determine o número esperado
de requisições por dia.

Número de requisições/dia 0 1 2 3 4 5 6 7 8 9

Probabilidade de ocorrência 0,02 0,07 0,09 0,12 0,20 0,20 0,18 0,10 0,01 0,01

Quadro 5.1

Resposta: 4,36 ~ 5 requisições/dia.

Exemplo 5.7. O número de chamadas telefônicas da Operadora


XX por mesa e suas respectivas probabilidades por um intervalo
de 3 minutos são dados abaixo.

N° de chamadas 0 1 2 3 4 5

Probabilidade 0,60 0,20 0,10 0,4 0,03 0,03

Quadro 5.2

Em média, quantas chamadas podem ser esperadas num interva-


lo de 3 minutos?

Resposta: 1,87 ~ 2 chamadas


Fizemos algumas reflexões
sobre a variância e o
desvio padrão no capítulo
anterior (Cap. 5), se 5.5.1 Variância e Desvio Padrão
sentir necessidade, volte e
retome-as! A variância , Var ( X ) ou σ 2 , de uma variável aleatória discreta
pode ser obtida multiplicando-se cada diferença ao quadrado
( X i − μ) 2 por sua probabilidade correspondente P( X i ) e soman-
do-se, depois, os produtos resultantes. Assim, a variância da vari-
ável aleatória X pode ser expressa da seguinte maneira:
n
VAR( X ) = σ 2 = ∑ ( X i − μ) 2 × P( X i ) ,
i =1

onde
X = variável aleatória discreta de interesse;
X i = i-ésimo resultado de X;
P( X i ) = probabilidade de ocorrência do i-ésimo resultado de X.
μ = média aritmética

143
Sendo assim, o desvio padrão ( σ ) de uma variável aleatória dis-
creta é dado por:
n
σ= ∑(X
i =1
i − μ) 2 × P( X i ) ,

ou seja,
σ = + Var ( X )

Exemplo 5.8. Considere a distribuição de probabilidade dos re-


sultados de um lançamento de um dado

Face do resultado 1 2 3 4 5 6
Probabilidade 1/6 1/6 1/6 1/6 1/6 1/6

Tabela 5.4

Calcular a média, a variância e o desvio padrão.

Resolução:
μ X = μ = ∑ xi × p ( xi )
i

= 1 × 1/ 6 + 2 × 1/ 6 + 3 × 1/ 6
+ 4 × 1/ 6 + 5 × 1/ 6 + 6 × 1/ 6
= 21/ 6 = 3,5 .
σ = (1 − 3,5) × 1/ 6 + (2 − 3,5) 2 × 1/ 6 + (3 − 3,5) 2 × 1/ 6
2 2

+ (4 − 3,5) 2 × 1/ 6 + (5 − 3,5) 2 × 1/ 6 +
+ (6 − 3,5) 2 × 1 / 6 = 2,9166
e
σ = 2,9166 = 1, 71 .

5.6 Distribuições Discretas


Nesta seção, abordaremos algumas distribuições de probabilidades
discretas que, pela sua importância, merecem um estudo especial.
Conforme veremos, tais distribuições partem da pressuposição de
certas hipóteses bem definidas. Como diversas situações reais mui-
tas vezes se aproximam dessas hipóteses, os modelos aqui descri-
tos são úteis no estudo de tais situações, daí a sua importância.

As distribuições de probabilidades discretas envolvem variáveis


aleatórias relativas a dados que podem ser contados, como o nú-

144
mero de ocorrências por amostra ou o número de ocorrências por
unidade num intervalo de tempo ou de área.

As principais distribuições de probabilidade discretas aqui aborda-


das são: A distribuição de Bernoulli e distribuição Binominal.
Jakob Bernoulli é
considerado o pai do
cálculo exponencial. Foi
professor de matemática
5.6.1 Distribuição de Bernoulli
em Basiléia, tendo sido
importantíssima sua Consideremos uma única tentativa de um experimento aleatório.
contribuição à geometria
analítica, à teoria das Podemos ter “sucesso” ou “fracasso” nessa tentativa.
probabilidades e à
variação do cálculo. Seja p a probabilidade de sucesso e q = 1 − p a probabilidade de
fracasso. Seja X a variável aleatória: número de sucessos em uma
única tentativa do experimento. X assume o valor 0, que corresponde
ao fracasso, com probabilidade q = 1 − p , ou o valor 1, que corres-
ponde ao sucesso, com probabilidade p ou

⎧0 fracasso
X =⎨
⎩1 sucesso
com
P( X = 0) = 1 − p e P( X = 1) = p .

Jakob Bernoulli (1654, 1705) Diremos que a variável aleatória assim definida tem distribuição
de Bernoulli e sua função de probabilidade é dada por
P( X = x) = p x × q1− x .

A média e a variância, da distribuição de Bernoulli são facilmente


calculadas como segue:

• Cálculo da média

Temos que

X P( X i ) ( X i − μ) 2 ( X i − μ) 2 × P( X i )
0 1− p (0 − p ) 2 = p 2 (0 − p ) 2 × (1 − p )
1 p (1 − p ) 2 (1 − p ) 2 × p + (1 − p ) 2 × p
Quadro5.3

Logo,
μ = ∑ xi × P( xi ) = 0 × (1 − p ) + 1× p = p
i

145
• Cálculo da variância e desvio padrão

n
Var ( X ) = σ 2 = ∑ ( X i − μ) 2 × P( X i )
i =1

= (0 − p ) 2 × (1 − p ) + (1 − p ) 2 × p
= p 2 × (1 − p ) + (1 − p ) 2 × p
= p × (1 − p ) × [ p + (1 − p )]
= p × (1 − p ) = p × q , onde q= 1-p

Portanto, a média é μ = p , a variância é Var ( X ) = p × q , e o desvio


padrão é σ = pq .

Observação 5.3. A média é μ = p , a variância é Var ( X ) = pq , e o


desvio padrão é σ = pq serão utilizados posteriormente.

Exemplo 5.9. Uma urna tem 30 bolas brancas e 20 verdes. Retira-


se uma bola dessa urna. Seja X o número de bolas verdes, calcular
a média, a variância e P( X = x) .

Resolução:Pelo enunciado, temos


⎧ 30 3
⎪⎪0 ⇒ q = 50 = 5
X =⎨
⎪1 ⇒ p = 20 = 2
⎪⎩ 50 5 .

Portanto,
2
μ = E( X ) = p = ,
5
2 3 6
Var ( X ) = p × q = × = ,
5 5 25
6
σ= = 0, 4899 ,
25
e
x 1− x
⎛ 2⎞ ⎛3⎞
P( X = x) = ⎜ ⎟ × ⎜ ⎟ .
⎝5⎠ ⎝5⎠

5.6.2 Distribuição Binomial


A distribuição binomial é uma distribuição de probabilidade dis-
creta extremamente útil para descrever muitos fenômenos. A dis-

146
tribuição binomial possui quatro propriedades essenciais.

i) Cada observação ou experimento pode ser considerado


como se tivesse sido selecionado a partir de uma população
finita com reposição.

ii) Cada observação ou experimento pode ser classificado em


uma de duas categorias mutuamente excludentes, geral-
mente chamadas de sucesso e fracasso.

iii) A probabilidade de uma observação ser classificada como su-


cesso (p) é constante de observação para observação. Assim
sendo, a probabilidade de uma observação ser classificada
como fracasso (1 − p ) é constante para todas as observações.

iv) O resultado (isto é, sucesso ou fracasso) de qualquer observa-


ção independe do resultado de qualquer outra observação.

A variável aleatória discreta, ou fenômeno de interesse, que segue


a distribuição binomial, é um número de sucessos obtidos em uma
amostra de n observações. Dessa maneira, a distribuição binomial
pode estar presente em inúmeras aplicações, entre elas:

• Em jogos de azar

Qual a probabilidade de que irá aparecer uma carta vermelha,


de um baralho de 52 cartas, 15 vezes em 19 tentativas?

• No controle de qualidade de produtos

Qual a probabilidade de que, numa amostra de 20 pneus do


mesmo tipo, nenhum será defeituoso, se 8% de todos os pneus
produzidos por determinada fábrica são defeituosos?

• Na educação

Qual a probabilidade de que um aluno seja aprovado numa


prova de múltipla escolha com 10 perguntas (cada pergunta
contendo quatro escolhas), se o aluno tenta adivinhar cada
uma das respostas? (Ser aprovado significa acertar 60% dos
itens, ou seja, conseguir acertar 6 entre 10 itens.)

• Nas finanças

Qual a probabilidade de que uma determinada ação irá apre-

147
sentar elevação no seu preço de fechamento numa base diária
nas próximas 10 sessões (consecutivas) de negociação, se as
mudanças no preço de mercado de ações forem aleatórias?

Associando uma variável aleatória X igual ao número de suces-


sos nessas n observações, ou provas, X poderá assumir os valores
0,1, 2,3,..., n .

Vamos determinar a distribuição de probabilidade dessa variá-


vel X, dada através da probabilidade, de um número genérico k
de sucessos.

Suponhamos que ocorram apenas sucessos nas k primeiras pro-


vas ou observações e apenas fracassos nas n − k provas restantes.
Indicando sucesso em cada prova por 1 e fracasso por 0, temos
1,1,1,....1, 0, 0, 0,..., 0
k n−k

Como as provas são independentes, a probabilidade de ocorrên-


cia desse evento é p k × q n − k . Porém, o evento “k sucessos em n
provas” pode acontecer em outras ordens distintas, todas com a
mesma probabilidade e o número de ordens é o número de com-
binações de n elementos k a k. Você recorda o que seria
o binômio de Newton?
Binômio de Newton é
Portanto, a probabilidade de ocorrerem k sucessos em n provas ou
uma fórmula que permite
observações é dada por desenvolver sob a forma
de polinômio qualquer
⎛n⎞ potência de um binômio,
P( X = k ) = ⎜ ⎟ p k q n−k ,
⎝k ⎠ ,

que é chamada de distribuição binomial, onde q = 1 − p e p k q n −k onde n é um inteiro não


é o termo de grau k em p no desenvolvimento do binômio de negativo.
Newton de ( p + q) n . Também

⎛n⎞ n!
⎜ ⎟= .
⎝ k ⎠ ( n − k )! k !

Observação 5.5. A média ou valor esperado da distribuição bino-


mial é μ = n × p e a variância é Var ( X ) = σ 2 = n × p × q .

Vejamos agora alguns exemplos resolvidos.

Exemplo 5.10. Uma avaliação final de matemática tem 50 questões

148
independentes. Cada questão tem 5 alternativas. Apenas uma al-
ternativa é correta. Se um aluno resolve a avaliação a esmo (no
popular chute), qual a probabilidade de tirar nota 5?

Resolução: Seja X o número de acertos, ou seja, X :


0,1,2,...,50.
1 1 4
Logo, a probabilidade de acerto p = e q = 1− = .
5 5 5
Portanto, a probabilidade de acertar 25 questões em 50 será
50 − 25
⎛ 50 ⎞ ⎛ 1 ⎞ ⎛ 4 ⎞
25

P( X = 25) = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 0,000002
⎝ 25 ⎠ ⎝ 5 ⎠ ⎝ 5 ⎠
Exemplo 5.11. Num determinado processo de fabricação, 5% das
peças são consideradas defeituosas. As peças são colocadas em
caixas com 5 unidades cada uma.

a) Qual a probabilidade de haver exatamente quatro peças de-


feituosas numa caixa?

b) Qual a probabilidade de haver duas ou mais peças defeitu-


osas numa caixa?

c) Se a empresa paga multa de R$ 15,00 por caixa em que hou-


ver alguma peça defeituosa, qual o valor esperado da multa
num total de 500 caixas?

Resolução: Seja sucesso em cada prova o aparecimento de uma


peça defeituosa, assim, p = 0, 05 e q = 0,95 . Logo,

⎛ 5⎞
a) P( X = 4) = ⎜ ⎟ (0,05) 4 (0,95)1
⎝4⎠
= 5 × (0,05) 4 × (0,95)1 = 0,00003 .

b) P (duas ou mais peças defeituosas)


= P( X = 2) + P( X = 3) + P( X = 4) + P( X = 5) ,
ou,

P( X ≥ 2) = 1 − [ P( X = 0) + P( X = 1)] ;
⎛ 5⎞
P( X = 0) = ⎜ ⎟ (0,05)0 (0,95)5 = 0,7738;
⎝ 0⎠
⎛ 5⎞
P( X = 1) = ⎜ ⎟ (0,05)1 (0,95) 4 = 0,2036.
⎝1⎠

149
Logo,
P( X ≥ 2) = 1 − [0,7738 + 0,2036] = 0,0226 .

c) A probabilidade de ter que pagar multa por caixa defeituosa é


P (pagar multa) = 1 − P( X = 0) = 1 − 0, 7738 = 0, 2262 .
O número esperado de caixas com uma ou mais peças defei-
tuosas será
E (pagar multa) = 500 × 0, 2262 = 113,10 .

O valor esperado das multas será R$ 15,00 x 113,10 =


R$ 1.696,50.

Exemplo 5.12. A probabilidade de um item produzido por uma


indústria ser defeituoso é 0,03. Um lote de 5.000 itens é enviado
para seu depósito. Calcule a média de um item defeituoso e o
desvio padrão

Resolução. Usando diretamente as fórmulas da média e da va-


riância, temos
μ = n × p = 5.000 × 0, 03 = 150.
e
σ = n × p × q = 5.000 × 0, 03 × 0,97
= 145,5 = 12,06 .

Exemplo 5.13. Suponha que 80% de uma criação de suínos esteja


atacada por leptospirose. Se uma amostra de 1000 suínos foi exa-
minada por um veterinário:

a) qual a média do número de porcos doentes dessa amos-


tra de 1000?

b) qual a variância e qual o desvio padrão?

Resolução. Aqui n = 1000; p = 0,8 e q = 0,2.


Logo,
a) μ = 1000 × 0,8 = 800 suínos.

b) σ 2 = 1000 × 0,8 × 0, 2 = 160 suínos e σ = 160 = 12, 649 suínos.

Exemplo 5.14. Num rebanho bovino, 30% dos animais estão ata-
cados de febre aftosa. Retirando-se ao acaso uma amostra de 10
animais, qual a probabilidade de se encontrar 6 animais doentes?

150
Resolução: Seja X a variável aleatória associada ao número de
animais com febre aftosa, logo X : 0,1, 2,...,10 .
n = 10 ; p = 0,3; q = 0,7 e k = 6.

⎛ 10 ⎞
P( X = 6) = ⎜ ⎟ × (0,3)6 × (0,7) 4
⎝6⎠
= 210 × 0,00073 × 0, 2401 = 0,037 = 3,7% .

Exemplo 5.15. Numa criação de coelhos, 40% são machos. Qual a


probabilidade de que nasçam pelo menos 2 coelhos machos, num
dia em que nasceram 19 coelhos?

Resolução. Seja X a variável aleatória associada ao número de


coelhos macho, logo
X : 0,1, 2,...,19 , p = 0,4 e q = 0,6.

A probabilidade desejada, P( X ≥ 2) , é dada por


P( X ≥ 2) = 1 − P( X < 2) = 1 − [ P( X = 0) + P( X = 1)] .
⎧⎛ 19 ⎞ ⎛ 19 ⎞ ⎫
= 1 − ⎨⎜ ⎟ × (0, 4)0 × (0,6)19 + ⎜ ⎟ × (0, 4)1 × (0,6)18 ⎬ .
⎩⎝ 0 ⎠ ⎝1⎠ ⎭
= 1 − {0,0001 + 0,008} = 1 − 0,00833 = 0,9919 .

Portanto,
P( X ≥ 2) = 99,19%.

5.7 Distribuições Contínuas


Até aqui temos lidado com algumas distribuições discretas de
probabilidade, as quais tratam de situações em que o espaço
amostral contém um número finito ou infinito, porém contável,
de pontos. Quando uma variável aleatória apresenta um grande
número de resultados possíveis, não podemos usar distribuições
discretas como a binomial para obter probabilidades. Se o espaço
amostral contém um número infinito não-contável de pontos, isto
porque uma variável contínua inclui, em seus resultados, valores
tanto inteiros como não-inteiros, não pode ser adequadamente
descrita por uma distribuição discreta, e por causa disso temos
que trabalhar com distribuições contínuas. O estudo completo
destas distribuições exige a aplicação dos métodos do cálculo di-
ferencial e integral, que não são utilizados aqui.

151
Consideremos uma variável aleatória que pode tomar todos os
valores de um dado intervalo. Pertencem a este tipo as mensura-
ções de altura, temperatura, precipitação pluviométrica, tempo de
espera numa fila, etc. Tais mensurações na prática são registradas
com aproximação de inteiro, décimo ou centésimo. Conforme o
caso, a natureza da variável aleatória é essencialmente contínua.

Algumas distribuições de variáveis aleatórias contínuas são im-


portantes. Faremos o estudo da distribuição normal por ser a
mais importante.

5.7.1 Distribuição Normal


É uma das mais importantes distribuições de probabilidades, sen-
do aplicada em inúmeros fenômenos e constantemente utilizada
para o desenvolvimento teórico da inferência estatística. Sem dúvi-
da já conhecida de muitos leitores como a “curva em forma de sino”, Johann Carl Friedrich Gauss
tem sua origem associada aos erros de mensuração. Sabemos que, (1777-1855)
ao se efetuarem repetidas mensurações de determinada grandeza Johann Carl Friedrich
com um aparelho equilibrado, não se chega ao mesmo resultado Gauss foi um famoso
matemático, astrônomo
todas às vezes; obtém-se, ao contrário, um conjunto de valores que e físico alemão. Era
oscilam, de modo aproximadamente simétrico, em torno do verda- conhecido como o príncipe
deiro valor. dos matemáticos. Muitos
consideram Gauss o
maior gênio da história
Inicialmente se supunha que todos os fenômenos da vida real de- da Matemática. Pierre
Simon Laplace (1749-
vessem ajustar-se a uma curva em forma de sino em caso contrá-
1827) foi um matemático,
rio, suspeitava-se de alguma anormalidade no processo de coleta astrônomo e físico francês.
de dados. Daí a designação de curva normal. Foi chamado o Newton da
França, sendo considerado
o fundador da moderna
Muitas das variáveis analisadas na pesquisa sócio econômica cor- teoria das probabilidade.
respondem ou se aproximam da distribuição normal. A distribuição Fontes:http://pt.wikipedia.
org/wiki/Carl_Friedrich_
normal é também conhecida como distribuição de Gauss, Laplace ou Gauss;http://pt.wikipedia.
Laplace-Gauss. A equação da curva normal foi primeiro deduzida org/wiki/Laplace
por Abraham de Moivre por volta de 1730. Posteriormente, Pierre S.
de Laplace e Karl F. Gauss desenvolveram estudos sobre a curva.

Uma variável aleatória contínua X tem Distribuição Normal ca-


racterizada por uma função f ( x) , cujo gráfico descreve uma curva
em forma de sino. Esta distribuição depende de dois parâmetros:

152
• μ (média): este parâmetro especifica a posição central da
distribuição de probabilidades.

• σ (desvio padrão): este parâmetro especifica a variabilidade


da distribuição de probabilidades. Logo, temos o seguinte
gráfico de f ( x) .

f (x)

m
Gráfico 5.2

Costuma-se representar essa variável aleatória por X : (μ, σ 2 ) .

A curva é perfeitamente simétrica em torno da média μ e, inde-


pendentemente dos valores de μ e σ , a área total entre a curva e
o eixo das abscissas é igual a 1, permitindo identificar probabili-
dades de eventos com áreas sob a curva.

Como a curva é simétrica em torno da média ( μ ), a probabilidade


de ocorrer valor maior do que a média é igual à probabilidade de
ocorrer valor menor do que a média, isto é, ambas as probabilida-
des são iguais a 0,5.

Escrevemos:

P( X > μ) = P( X < μ) = 0,5 .

A probabilidade de uma variável aleatória com distribuição normal


tomar um valor entre dois pontos quaisquer, por exemplo, entre os
pontos a e b , é igual à área sob a curva normal compreendida
entre aqueles dois pontos. Suponha, então, que: X : (μ, σ 2 ), e quei-
ramos determinar a probabilidade de X estar entre a e b. Para isso
devemos realizar o seguinte cálculo.
( x − μ )2
b 1 −
P ( a < X < b) = ∫ e 2σ2
dx .
a
σ 2π

153
No cálculo da probabilidade de uma variável aleatória normal-
mente distribuída, surgem dois problemas:

• Para integrar f ( x) é necessário o seu desenvolvimento


usando procedimentos de cálculo diferencial e integral.

• É necessária a elaboração de uma tabela de probabilidades,


pois f ( x) depende de dois parâmetros, seria muito trabalho
para tabelar essas probabilidades considerando as várias
combinações de μ e σ 2 .

Vimos, portanto, que temos dois problemas. O primeiro deles é o


fato de existirem infinitas distribuições normais e o segundo é a
dificuldade para calcular probabilidades na distribuição normal.
Para resolver esses dois problemas, foi realizada uma transfor-
mação na variável aleatória X , originando uma nova variável,
denominada variável aleatória normal padronizada e representada
pela letra Z , cuja distribuição denomina-se distribuição normal
padrão, a qual passaremos a estudar.

Foi desenvolvida uma alternativa, para solucionar os proble-


mas levantados, que é o de trabalhar com valores padroniza-
dos, isto é, a média é tomada como origem, referência do novo
sistema (a nova média tem valor zero), e o desvio padrão como
medida de afastamento a contar da média, ou seja, é a nova
unidade de medida. Esta nova escala é chamada de escala Z .

A variável reduzida Z é dada por

X−μ
Z= ,
σ
onde

Z = é o número de desvios padrões a contar da média;


X = é a variável na unidade original;
μ = é a média da população;
σ = é o desvio padrão da população.

Exemplo 5.16. Consideremos uma distribuição normal com mé-


dia μ =100 e desvio padrão σ = 10. Para X = 100, tem-se

100 − 100
Z= =0.
10
154
Para X = 130, tem-se:

130 − 100
Z= = 3,
10
e assim por diante.

Definição 5.5. Se N ( μ , σ 2), então a variável aleatória Z definida por

X−μ
Z= ,
σ
tem uma distribuição N(0,1), isto é, tem distribuição normal com média

μ = 0 e variância σ 2 = 1 , e a função f ( z ) é dada por:

1 − 12 z 2
f ( z) = e , com −∞ ≤ z ≤ +∞ .

Logo, Z tem distribuição normal de média zero e va-
riância 1. O aspecto gráfico de uma distribuição nor-
mal reduzida ou padronizada é o da figura a seguir.

(m-2s) (m-s) m (m+s) (m+2s)


-2 -1 0 1 2
Figura 5.1

Para uma perfeita compreensão da distribuição normal, ob-


servemos a figura 5.1 acima e procuremos visualizar as se-
guintes propriedades:

• A variável aleatória Z pode assumir todo e qualquer valor real.


• A representação gráfica da distribuição normal é uma curva
em forma de sino, simétrica em torno da média ( μ ).
• A área total limitada pela curva e pelo eixo das abscissas é
igual a 1; já que essa área corresponde à probabilidade de a
variável aleatória Z assumir qualquer valor real.
• A curva normal é assintótica em relação ao eixo das abscis-

155
sas, isto é, aproxima-se indefinidamente do eixo das abscis-
sas sem, contudo, alcançá-lo.

As probabilidades, isto é, as áreas sob esta curva, associadas à


distribuição normal reduzida ou padronizada são encontradas em ta-
belas, não havendo necessidade de serem calculadas.

A tabela de distribuição normal reduzida nos dá a probabilidade


de Z tomar qualquer valor entre a média zero e um dado valor z ,
(veja figura abaixo), isto é:
P(0 < Z < z )

Área tabelada = área desejada

0 z
(Média)
Figura 5.2

A tabela da distribuição normal reduzida (tabela 5.5) é a área sob


a curva (a probabilidade de um valor cair naquele intervalo) entre
a média e valores escolhidos de z . A porção sombreada da figura
acima corresponde à área sob a curva que pode ser lida direta-
mente, dada no final deste capítulo.

A tabela vem dada em termos de valores de z com duas casas


decimais decompostos em duas partes: os valores da parte inteira
e da primeira decimal integram a coluna à esquerda, enquanto que
a segunda decimal aparece na linha horizontal do topo.

Vejamos agora um exemplo para determinarmos a área entre a


média e z para ilustrar o uso da tabela.

Exemplo 5.17. Determinar a área entre a média e z = 1, 25 .

Resolução. Devemos inicialmente localizar 1,2 na coluna à esquer-


da e, em seguida, 0,05 na linha horizontal do topo. A área será
então dada pelo número formado pela interseção da linha z = 1, 2

156
e da coluna 0,05. O valor 0,3944 é a porcentagem da área sob a
curva normal entre a média 0 e z = 1, 25 . Veja a figura abaixo:

1,2,5

00 01 02 03 04 05 06 ...

...
1,0
1,1
1,2 0,3944

...
Figura 5.3

Naturalmente, tal porcentagem (0,3944 = 39, 44%) nada mais é


do que a probabilidade de uma variável aleatória normal tomar um
valor z entre a média e um ponto situado a 1,25 desvios padrões
acima da média.

Eis mais alguns exemplos no quadro abaixo, que usam direta-


mente a tabela da distribuição normal reduzida ou padronizada.

Valor de z Área entre a média e z


0,67 0,2486
-0,67 0,2486(a curva é simétrica em torno da média)
1,84 0,4671
-1,84 0,4671(a curva é simétrica em torno da média)
2,05 0,4798
2,11 0,4826
3,06 0,4985

Quadro 5.4
A tabela normal reduzida pode também ser usada para deter-
minar a área sob a curva além de um dado valor de z . O detalhe
aqui é que a área de uma das metades é 50%, logo a área além
de z é 50% menos o valor tabelado. Por exemplo, a área além
de z = +1 será 0,5 − 0,3413 = 0,1587 , pois a área entre a média e
z = +1 é 0,3413.

157
Área desejada = 50% - área tabelada

Área
na
tabela
0 z
50%
Figura 5.4

Eis alguns exemplos no quadro abaixo, que usam a tabela da


distribuição normal reduzida ou padronizada e o conceito ilus-
trado na figura acima.

z P(0 < Z < z ) P( Z > z ) = 0,5 − P(0 < Z < z )


1,73 0,4582 0,5 − 0, 4582 = 0, 0418
0,5 + P(0 < z < −1,73)
-1,73 0,4882
= 0,5 + 04582 = 0,9582
2,33 0,4901 0,5 − 0, 4901 = 0, 0099
1,96 0,4750 0,5 − 0, 4750 = 0, 0250
0,5 + P(0 < z < −1,84)
-1,84 0,4671
= 0,5 + 0, 4671 = 0,9671

Quadro 5.5

Temos, então, que se X é uma variável aleatória com distribuição


normal de média μ e desvio padrão σ , isto é, N (μ, σ 2 ) , pode-
mos escrever:
X−μ
P( x1 < X < x2 ) = P( z1 < Z < z2 ) , com Z = .
σ
Para melhor compreensão, veremos alguns exemplos resolvidos com
o auxílio da tabela da distribuição normal reduzida ou padronizada.
(Tabela 5.5 final deste capítulo)

Exemplo 5.18. Seja: N (100, 25) . Calcular

a) P(100 ≤ X ≤ 106) ;

b) P(89 ≤ X ≤ 107) ;

c) P(112 ≤ X ≤ 116)

158
X − 100
Resolução. Como μ = 100 e σ = 5 logo Z = .
5
Assim, para responder a letra a), temos
P(100 ≤ X ≤ 106)
100 − 100 X − 100 106 − 100
= P( ≤ ≤ )
5 5 5
= P(0 ≤ Z ≤ 1, 2) = 0,384930 = 38, 4930% .

Portanto, a P(100 ≤ X ≤ 106) = 38, 4930% .

Para responder a letra b), temos


P(89 ≤ X ≤ 107)
89 − 100 X − 100 107 − 100
= P( ≤ ≤ )
5 5 5
= P( −2, 2 ≤ Z ≤ 1, 4)

= P( −2, 2 ≤ Z ≤ 0) + P(0 ≤ Z ≤ 1, 4)

= 0, 486097 + 0, 419243 = 0,90534 = 90,534% .

Portanto, P(89 ≤ X ≤ 107) = 90,534% .

Finalmente, para responder a letra c), temos


P(112 ≤ X ≤ 116)
112 − 100 X − 100 116 − 100
= P( ≤ ≤ )
5 5 5
= P(2, 4 ≤ Z ≤ 3, 2)
= P(0 ≤ Z ≤ 3, 2) − P(0 ≤ Z ≤ 2, 4)
= 0,499313 - 0,491803 = 0,007510=0,7510% .

Portanto, P(112 ≤ X ≤ 116) = 0, 7510% .

Exemplo 5.19. O peso de uma caixa de frango embalado que a


cantina da Escola Estadual “João XXIII” compra de seu fornece-
dor para fazer a merenda escolar é uma variável aleatória que
tem distribuição normal com média de 65 kg e desvio padrão de
4 kg. Um caminhão é carregado com 120 caixas de frango. Qual a
probabilidade de a carga do caminhão pesar:

a) Entre 7.893 kg e 7.910 kg?

b) Mais de 7.722 kg?

159
Observação. Considerar o peso da carga com distribuição normal.

Resolução. Sejam X i : peso de uma caixa de frango embala-

do onde X i : N ( μ, σ 2 ) ou X i : N (65,16) para i = 1, 2,...,120 e


X é a variável aleatória do peso da carga do caminhão. Então,
120
X = ∑ Xi .
i =1

Assim, 120
E ( X ) = μ = ∑ 65 = 120 × 65 = 7.800
i =1
e
Var ( X ) = σ 2

120 120
= ∑ VAR( X i ) = ∑16 = 120 × 16 = 1.920,
i =1 i =1

ou
σ = 1920 = 43,82 .
Logo,
N (7800,1920) ,

μ = 7800 ,

σ = 43,82
e
X − 7.800
Z= .
43,82

Para respondermos a letra a), temos


P(7893 < X < 7910)
7893 − 7800 X − 7800 7910 − 7800
= P( < < )
43,82 43,82 43,82
= P(2,12 ≤ Z ≤ 2,51)

= P(0 < Z < 2,51) − P(0 < Z < 2,12)

= 0, 493963 − 0, 482997 = 0, 010966 = 1, 0966% .

Portanto, a probabilidade de a carga do caminhão pesar entre


7.893 kg e 7.910 kg é de 1,0966%.

Para respondermos a letra b), temos

160
P( X > 7722)
X − 7800 7722 − 7800
= P( > )
43,82 43,82
= P( Z ≥ −1, 78) = P(−1, 78 ≤ Z ≤ 0) + 0,5
= 0,5 + 0, 462462 = 0,962462 = 96, 2462% .

Portanto, a probabilidade de a carga do caminhão pesar mais de


7.722 kg é de 96,2462%.

Exemplo 5.20. Seja X a variável aleatória que representa os diâ-


metros dos parafusos utilizados pela Escola Estadual “Sena Fi-
gueiredo” para a manutenção das carteiras e mesas. Suponhamos
que essa variável tenha distribuição normal com média μ = 2 cm
e desvio padrão σ = 0,04 cm. Calcular a probabilidade de um pa-
rafuso ter um diâmetro com valor entre 2 e 2,05 cm.

Resolução. Queremos calcular P(2 < X < 2, 05) . Como μ = 2 e


σ = 2, 05 , temos

2 − 2 X − 2 2, 05 − 2
P(2 < X < 2, 05) = P( < < )
0, 04 0, 04 0, 04
= P(0 < Z < 1, 25) = 0,3944 = 39,44%.

Portanto, a probabilidade de um parafuso ter um diâmetro com


valor entre 2 e 2,05 cm é de 39,44%.

Exemplo 5.21. A duração de certo tipo de brinquedo na creche


“Dona Marrequinha” tem média de 850 dias e desvio padrão de
45 dias. Calcular a probabilidade de esse brinquedo durar:

a) menos que 750 dias;

b) mais que 800 dias.

Resolução.

a) Seja X a variável aleatória de dias de duração do brinquedo

na creche “Dona Marrequinha”.Assim μ = 850 e σ = 45 .

161
Temos
X − 850 750 − 850
P( X < 750) = P( < )
45 45
= P( Z < −2, 222)

= 0,5 + P(0 < Z < 2, 222)

= 0,5 + 0, 4868 = 0,9868 = 98,68% .

Portanto, a probabilidade de esse brinquedo durar menos que


750 dias é de 96,68%.

X − 850 800 − 850


b) P( X > 800) = P( > )
45 45
= P( Z > −1,111)

= 0,5 + P(0 < Z < 1,1111)

= 0,5 + 0,3665 = 0,8665 = 86, 65% .

Portanto, a probabilidade de esse brinquedo durar mais que


800 dias é de 86,65%.

5.8 Distribuição Normal como Aproximação da


Distribuição Binomial
Muitas situações reais podem ser convenientemente descritas
pelo modelo binomial. Acontece que quando o número de repe-
tições do experimento ( n ) for muito grande, para se calcular as
probabilidades binomiais são necessários cálculos extensos. Para
n suficientemente grande e p não próximo de zero e de um, já se
obtém boas aproximações da normal à binomial. Se n aumenta,
a necessidade de se ter p próximo de 0,5 diminui. Para verificar
se a aproximação é boa, uma sugestão é verificar se n × p ≥ 5 e
n × (1 − p ) ≥ 5 , desde que n > 20 e p ≅ 0,50 .

Uma dificuldade verificada neste tipo de aproximação é que o


modelo normal é para variável aleatória contínua (raciocinar em
termos de intervalo), enquanto o modelo binomial é para variável
aleatória discreta.

162
P ara melhorar a aproximação, é necessário
um pequeno ajuste (correção de continui-
dade), que consiste em subtrair e/ou somar 0,5
aos valores da variável aleatória discreta.

Mostraremos este procedimento através de exemplos.

Exemplo 5.22. Consideremos Y uma variável aleatória binomial de


parâmetros n = 10 e p = 0,5 , e queremos calcular P(8 ≤ Y ≤ 10) .

Resolução. Chamando de X a variável com distribuição normal,


tem-se:
P(8 ≤ Y ≤ 10) = P(7,5 ≤ X ≤ 10,5)

7,5 − μ X − μ 10,5 − μ
= P( ≤ ≤ ),
σ σ σ
onde
μ = n × p = 10 × 0, 5 = 5
e
σ = 10 × 0,5 × 0,5 = 1,58113 .
Assim,
7,5 − 5 10,5 − 5
P( ≤Z≤ )
1,58113 1,58113
= P(1,5811 ≤ Z ≤ 3, 4785)
= 0, 49975 − 0, 44295 = 0,0568 = 5,68% .
Portanto, a P(8 ≤ Y ≤ 10) é de 5,68%.

Resolvendo o exemplo 5.22 pela distribuição binomial, vem:

P(8 ≤ Y ≤ 10) = 0, 044 + 0, 010 + 0, 001 = 0, 055 = 5,5% .


Verifique você mesmo este
resultado!!
Observamos que os dois resultados são bem próximos, mesmo
com n pequeno, porém, p = 0,5 .

Exemplo 5.23. Os frangos da produção da granja “Frangolândia”,


responsável pelo fornecimento para a cantina da Escola Estadual
“Bento Ribeiro” para merenda escolar de seus alunos, são classi-
ficados em grande ou pequeno, conforme seu peso. Verificou-se
que 45% dos frangos são considerados grandes. Supondo que os
frangos são colocados em caixas de 60, aleatoriamente, calcular:

163
a) Em que porcentagem de caixas teremos pelo menos 50% de
frangos grandes? (50% é igual a 30 frangos).

b) Em que porcentagem de caixas terá exatamente 50% de fran-


gos grandes?

Resolução. Aqui, p = 45% = 0, 45 ; n = 60 , pois são colocados


nas caixas 60 frangos; μ = 0, 45 × 60 = 27 e
σ = 60 × 0, 45 × 0,55 = 3,85356 frangos.

a) Usando aproximação normal à binomial, a probabilidade de


uma caixa conter 30 ou mais frangos será:
P(Y ≥ 30) = P( X ≥ 29,5)
29,5 − 27
= P( Z ≥ ) = P( Z ≥ 0,65)
3,85356
= 0,5 − P(0 ≤ Z ≤ 0,65)
= 0,5 − 0, 24215 = 0, 25785 = 25, 785% .

Portanto, a porcentagem de caixas ou a probabilidade em que


teremos pelo menos 50% dos frangos grandes é de 25,785%.

b) A probabilidade de encontrarmos exatamente 30 frangos é:


P(Y = 30) = P(29,5 ≤ X ≤ 30,5)
29,5 − 27 30,5 − 27
= P( ≤Z≤ )
3,85356 3,85356
= P(0,65 ≤ Z ≤ 0,91)

= 0,31859 − 0,024215 = 0,0764 = 7,64% .

Portanto, a probabilidade de encontrarmos exatamente 30 frangos


é de 7,64%.

Exemplo 5.24. Um dado não viciado é lançado 180 vezes. Deter-


minar a probabilidade de o número 4 aparecer:

a) entre 29 e 32 vezes, inclusive;

b) entre 31 e 35 vezes, inclusive.

Resolução. Seja Y a variável aleatória que representa o número


de vezes em que ocorre o número 4.

1 5
Aqui, n = 180 ; p = ; q= .
6 6
164
Assim,
1
μ = 180 × = 30 ⇒ μ = 30
6
e
1 5
σ = 180 × × = 25 = 5 ⇒ σ = 5 .
6 6
Na letra a), calculando P(29 ≤ Y ≤ 32) , temos

P(29 ≤ Y ≤ 32) = P(28,5 ≤ X ≤ 32,5)


28,5 − 30 X − 30 32,5 − 30
= P( ≤ ≤ )
5 5 5
= P( −0,3 ≤ Z ≤ 0,5)
= P( −0,3 ≤ Z ≤ 0) + P(0 ≤ Z ≤ 0,5)
= 0,1179 + 0,1915 = 0,3094 = 30,94% .

Portanto, a probabilidade de o número 4 aparecer entre 29 e 32


vezes, inclusive, é de 30,94%.

Na letra b), calculando P(31 ≤ Y ≤ 35) , temos

P(31 ≤ Y ≤ 35) = P(30,5 ≤ X ≤ 35,5)


30,5 − 30 X − 30 35,5 − 30
= P( ≤ ≤ )
5 5 5
= P(0,1 ≤ Z ≤ 1,1)
= P(0 ≤ Z ≤ 1,1) − P(0 ≤ Z ≤ 0,1)
= 0,3643 − 0, 0398 = 0,3245 = 32, 45% .

Portanto, a probabilidade de o número 4 aparecer entre 31 e 35


vezes, inclusive, é de 32,45%.

Exemplo 5.25. Entre 10.000 dígitos aleatórios, determinar a pro-


babilidade de o dígito 2 ocorrer pelo menos 950 vezes.

Resolução. Seja X a variável aleatória que representa o número de


vezes em que o dígito 2 ocorre. Vamos calcular P( X ≤ 950) .
1 9
Neste exemplo, n = 10000 ; p = ; q = .
10 10
Assim,
1
μ = 10000 × = 1000 ⇒ μ = 1000
10
e

165
1 9
σ = 10000 × × = 900 = 30
10 10
⇒ σ = 30 .

Logo,

X − 1000 950 − 1000


P( X ≤ 950) = P( ≤ )
30 30
= P( Z ≤ −1, 67)

= P( Z ≤ 0) − P( −1,67 ≤ Z ≤ 0)

= 0,5000 − 0, 4525 = 0,0475 = 4,75% .

Portanto, a probabilidade de o dígito 2 ocorrer pelo menos 950


vezes é de 4,75%.

Exercícios Propostos
1) Lançam-se dois dados conjuntamente. Determinar a probabi-
lidade da soma ser igual ou maior do que 10.

1
Resposta: .
6

2) Um casal planeja ter três filhos. Qual a probabilidade de nas-


cerem:

a) Três homens?

b) Dois homens e uma mulher?


1 3
Resposta: a) ; b) .
8 8

3) Uma loja dispõe de 12 geladeiras do mesmo tipo, das quais 4


apresentam defeitos.

a) Se um cliente vai comprar uma geladeira, qual a probabili-


dade de levar uma defeituosa?

166
b) Se um cliente vai comprar duas geladeiras, qual a probabili-

dade de levar duas defeituosas?

1 1
Resposta: a) ; b) .
3 11

4) Um diretor da “Escola Estadual Primavera” julga que tem


0,40 de probabilidade de ganhar R$ 25.000,00 e 0,60 de probabi-
lidade de perder R$ 15.000,00 num investimento. Calcule o seu
ganho esperado.

Resposta: R$ 1.000,00

5) O diretor da “Escola Estadual D. Pedro I” necessita reformar


algumas salas de aula e contratou um empreiteiro que fez seguin-
tes estimativas para a execução da obra:

Prazo de execução Probabilidade


10 dias 0,30
15 dias 0,20
22 dias 0,50

Calcule o prazo esperado para a execução da obra, de acordo com


essas estimativas.

Resposta: 17 dias.

6) Um número inteiro é escolhido aleatoriamente dentre os nú-


meros 1, 2, 3, ..., 50. Qual a probabilidade de o número:

a) ser divisível por 5;

b) terminar em 3,

c) ser primo;

d) ser divisível por 6 ou por 8.

Resposta. a) 1/5; b) 1/10; c) 3/10; d) 0,24.

167
7) Se P( A) = 12 ; P( B) = 13 e P( A ∩ B) = 14 , calcular:
− − − −
a) P( A ∪ B) ; b) P( A∪ B) e c) P( A∩ B) .

Resposta. a) 7/12; b) 3/4 e c) 5/12.

8) Um grupo de 10 pessoas apresenta, de acordo com o sexo e a


filiação partidária, a seguinte composição:

Partido AA Partido BB
Homens 21 39
Mulheres 14 26

Calcular:
a) a probabilidade de um escolhido ser homem;

b) a probabilidade de um escolhido ser mulher do Partido BB;

c) a porcentagem dos partidários do Partido BB;

d) a porcentagem dos homens filiados ao Partido AA;

e) se o sorteado for do Partido AA, a probabilidade de ser mu-


lher;

f) se o sorteado for homem, a probabilidade de ser do Partido BB.

Resposta. a) 60%; b) 26%; c)65%; d) 21%; e) 40% e f) 65%.

9) Os pesos de 60 estudantes da Escola Estadual “Dona Chiqui-


nha” são normalmente distribuídos com média 65,3 kg e desvio pa-
drão 5,5 kg. Determinar a probabilidade de estudantes que pesam:

a) entre 60 e 70 kg;

b) mais que 63,2 kg;

c) menos que 68 kg.

Resposta. a)0,6338; b)0,648; c)0,6879.

10) Dois times de futebol, A e B, jogam ente si 6 vezes. Determi-


nar a probabilidade do time A ganhar 4 jogos.

Resposta. 20/243.

168
P ara saber mais sobre distribuição normal e
a normal como aproximação da binominal,
consulte SOARES, J.F; FARIAS, A.A. E CESAR,
C.C. Introdução à Estatística, LTC, Rio de Janei-
ro, 1991.

Resumo
Neste capítulo, você teve a oportunidade de estudar e compreen-
der os conceitos de experimento, espaço amostral, evento, axiomas
da probabilidade, probabilidades finitas dos espaços amostrais
finitos, cálculo de probabilidade condicional e ainda percebeu a
independência estatística com eventos mutuamente exclusivos.

Você pôde compreender também como calcular o valor esperado,


a variância e o desvio padrão de uma variável aleatória, entendeu
a análise dos modelos clássicos de distribuição de probabilidade,
principalmente a distribuição discreta binomial, a distribuição
normal e a distribuição normal como aproximação da binomial.

Resta mencionar que a compreensão sempre referida é importante


para que você possa acompanhar o curso. Só prossiga após fazer
todos os exercícios propostos, já que tudo que veremos a seguir
depende de alguns conceitos abordados neste capítulo. Consulte
o tutor do pólo sempre que achar necessário.

Apêndice
Área na Cauda Direita sob a Distribuição Normal Padronizada

Cada valor da tabela indica a proporção da área total sob a curva


normal contida no segmento delimitado por uma perpendicular
levantada na média e uma perpendicular levantada à distância
de z desvios padrões unitários.

169
Média z

Ilustrando: 43,57% da área sob uma curva normal estão entre a orde-
nada máxima e um ponto 1,52 desvios padrões adiante.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549
0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

170
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4986 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,5000
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

Tabela 5.5

171
6 Amostragem
6 Amostragem

Neste capítulo, apresentaremos o conceito de amostragem.


Estudaremos a amostragem casual simples e também ana-
lisaremos o conceito de distribuições amostrais das médias
com e sem reposição. Também explicaremos distribuição
amostral das proporções. Todos esses assuntos serão abor-
dados com exemplos numéricos.

6.1 Introdução
A seguir, apresentamos alguns conceitos básicos de amostragem.
Explicamos também sua utilização conforme a cada situação.

• Amostragem – é a parte de Estatística que se preocupa com


os modos e as maneiras de relacionar amostras que sejam
representativas das populações e que proporcionem estima-
tivas, as mais precisas possíveis, para a obtenção dos objeti-
vos desejados.

• População – é um conjunto de elementos possuindo pelo


menos uma característica comum. Na prática, considera-se
população como sendo um conjunto de números que repre-
sentam esta característica de interesse. Às vezes, a população
também é chamada de universo. As populações podem ser:

i) Finitas – quando possuem um número finito de elemen-


tos. Por exemplo: os alunos da uma turma; os alunos da
UFSC; resultados possíveis do lançamento de uma mo-
eda ou dados; produção mensal de uma máquina.

ii) Infinitas – quando uma população é suficientemente


grande para que sua distribuição de probabilidade se
mantenha inalterada durante a retirada de uma amos-
tra. Por exemplo: resultado dos lançamentos de uma
moeda ou de dados; produção passada e futura de
uma máquina.

175
• Amostra – é uma parte (subconjunto) necessariamente fini-
ta da população, retirada segundo uma regra conveniente.
Quanto maior a amostra, mais precisos e mais cofiáveis são
os resultados.
• Censo – ao medir ou observar todos os elementos de uma
população realizamos um censo. Um censo é um processo
de obter informação
• Censo x Amostragem – há várias situações de aplicação sobre a totalidade dos
de censo ou amostragem. Abaixo, descrevemos algumas membros de uma dada
população (não tem de
situações de quando utilizamos censo e quando utiliza-
ser, necessariamente,
mos amostragem: uma população humana).
Os chineses e romanos
i) Censo – é utilizado quando: elaboraram os primeiros
censos conhecidos; a
a) a população é bastante pequena; finalidade deste trabalho
na época era militar e
b) o tamanho da amostra for grande em relação à popu- fiscal; em Roma, era o
lação; censor que mantinha o
moral público e levava
ao governo central as
c) for necessária a precisão completa;
informações sobre o estado
geral da população. Fonte:
d) já se dispõe da informação completa.
http://pt.wikipedia.org/
wiki/Censo
ii) Amostragem – é utilizada quando:

a) a população é infinita;

b) uma amostra for mais atualizada do que o censo (in-


formações urgentes – epidemias);

c) houver testes de caráter destrutivo (lâmpadas, muni-


ções, vidraçarias);

d) o custo do censo é mais elevado;

e) a precisão sofrer quando a população for muito grande;

f) O tipo de informação pode depender da utilização de


uma amostra ou de um censo (premência de tempo, res-
trições orçamentárias, exame de laboratório de análise
clínica).

6.1.1 Tipos de amostragem


Existem dois tipos de amostragem: probabilística e não pro-
babilística.

• Amostragem probabilística – a amostragem será probabi-

176
lística se todos os elementos da população tiverem probabili-
dade conhecida, e diferente de zero, de pertencer à amostra.
Isto implica num sorteio com regras bem determinadas, cuja
realização só será possível se a população for finita e total-
mente acessível.

A utilização de uma amostragem probabilística é o melhor que


se deve fazer para garantir a representatividade de amostra ao se
fazer inferências estatísticas. Números de amostras possíveis de
construir:

Sem reposição: C Nn ;

Com reposição: N n .

As seguintes técnicas de amostragem probabilística são as seguintes:

a) Amostragem simples ao acaso (aleatória, randômica, casu-


al, simples, elementar) – é equivalente a um sorteio lotérico.
Pode ser usada a tabela de números aleatórios (TNA):

• a TNA contém os dez algarismos 0, 1,..., 9. Estes números po-


dem ser lidos isoladamente ou em grupos, em qualquer ordem,
por coluna, por linhas, diagonalmente, de cima para baixo;
• uma característica TNA é que todos os algarismos têm a
mesma probabilidade de ocorrer;
• outra característica é que as combinações de algarismos
têm a mesma probabilidade que outras combinações.

Procedimento: seja a escolha aleatória de 15 clientes entre 830.

• atribuímos números de 001 a 830 (o 1o ao último);

• necessitamos de três algarismos.

b) Amostragem sistemática – caso os elementos se apresentem


ordenados, e as retiradas dos elementos da amostra forem
feitas periodicamente.

Procedimento: seja a escolha aleatória de 15 clientes entre


830:

830
• tamanho dos grupos = 55,3... , isto é 56;
15

177
• pela TNA, procuramos o 1o elemento entre 01 e 56;

• vamos supor que ocorra o elemento 12;

• os demais serão obtidos pela fórmula: 12 + 56 × n com


n = 1, 2,.., 14 ;

• 12, 68, ... , 740, 796.

c) Amostragem estratificada – muitas vezes, a população se di-


vide em sub populações ou estratos, sendo razoável supor
que, de estrato para estrato, a variável de interesse apresente
um comportamento substancialmente diverso, tendo, entre-
tanto, comportamento razoavelmente homogêneo dentro
de cada estrato. Por exemplo,

• usinas de açúcar no estado de São Paulo (três grupos –


pequenos, médios e grandes);
• estudantes, conforme suas especializações ou faixas etárias.

A amostragem estratificada pode ser:

• Uniforme – mesmo número de elementos por estrato


proporcional ao número de elementos de estrato.
• Ótima – número de elementos de cada estrato propor-
cional ao número de elementos de estrato e usando-se o
desvio padrão (variação menor – menos elementos).

d) Amostragem por conglomerados – pressupõe a disposição


dos itens de uma população em grupos heterogêneos repre-
sentativos da população global. Por exemplo, no estudo da
população de uma favela:

• é impossível relacionar todos os habitantes, porém é pos-


sível relacionar os barracos;
• efetuar a escolha casual simples de barracos e estudar os
indivíduos que moram nos barracos sorteados.

e) Amostragem em estágios múltiplos – a amostra é retirada


em diversas etapas sucessivas. Dependendo dos resultados
observados, etapas suplementares podem ser dispensadas.
Por exemplo, na pesquisa para uma fábrica de detergentes
em Santa Catarina

1o estágio: sortear os municípios de Santa Catarina;

178
2o estágio: sortear quarteirões dos municípios;
3o estágio: sortear residências dos quarteirões sorteados.

• Amostragem não probabilística – é aquela em que há uma


escolha deliberada dos elementos da amostra. As amostras
intencionais como também são usadas em certos tipos de
pesquisa de mercado, porém as inferências feitas nestas
condições não permitem analisar a probabilidade de erro.
As situações onde utilizamos amostragem não probabilísti-
ca são as seguintes:

a) Inacessibilidade a toda a população – busca-se a amos-


tra na parte da população que é acessível. Por exemplo,

• minério – colhe-se na camada próxima à superfície;


• peixes – somente os que foram apanhados.

b) A população é formada por material contínuo – impos-


sível a amostragem probabilística, por exemplo, quando
trabalhamos com gases ou líquidos, etc.

c) Amostragens intencionais – o amostrador escolhe deli-


beradamente certos elementos para pertencer à amostra
por julgar tais elementos bem representativos da popula-
ção. Por exemplo,

• pesquisa de mercado para carros superluxo – selecio-


nar pessoas de alto poder aquisitivo.
• congressos estudantis – participação de elementos
que coordenam os diretórios.

6.1.2 Principais fases de um levantamento estatístico


a) Objetivos do levantamento – conseguir definições claras e
diretrizes para sua perfeita execução.

b) População – deve ser bem definida.

c) Dados a serem coletados – somente levantar dados essenciais.

d) Grau de precisão desejado – dimensionar a amostra no


grau de precisão desejado.

e) Métodos de medida – estruturar toda a metodologia da co-


leta de dados.

179
f) Unidade de amostra – definir a unidade amostra – indivi-
duo, casa, família etc.

g) Escolha do tipo de amostra – de acordo com o tipo de levanta-


mento, levando em conta a exeqüibilidade e os custos operacio-
nais.

h) Pré-amostragem – testar em pequena escala para verificar a


necessidade ou não de alternações.

i) Organização do trabalho – traçar uma sistemática de trabalho


ou uma rotina de operações para toda equipe de trabalho.

j) Sintetização e analise de dados – compilação e conferência


de dados, gráficos, tabelas e testes estatísticas.

k) Sugestões – informações utilizáveis em futuros levantamentos.

Este trabalho somente vai se concentrar no caso mais simples de


amostragem probabilística: amostragem casual simples.

6.2 Amostragem Causal Simples


A maneira mais fácil de selecionarmos uma amostra é aquela em
que atribuímos a cada elemento da população a mesma probabili-
dade de seleção, e o elemento sorteado é reposto na população antes
do próximo sorteio. Podemos obter uma amostra nessas condições,
escrevendo cada elemento da população num cartão, misturando-
se numa e sorteando tantos cartões quantos desejarmos nas amos-
tras. Esse procedimento torna-se invariável quando a população
é muito grande. Nesse caso, usa-se um processo alternativo, em
que os elementos são numerados e em seguida sorteados através
de uma tabela de números aleatórios. A seguir damos algumas de-
finições de amostra casual simples de tamanho n .

Definição 6.1. Uma amostra casual simples de tamanho n de uma vari-


ável aleatória X com uma dada distribuição é o conjunto de n variáveis
aleatórias independentes, X 1 , X 2 ,..., X n , cada uma com a mesma distri-
buição de X . Ou seja, a amostra será a n -upla ordenada ( X 1 , X 2 ,...,X n )
em que X i indica a observação do i -ésimo elemento sorteado.

A média da amostra é dada por


1
X = ( X 1 + X 2 + ... + X n ) .
n

180
Podemos observar que X é também uma variável aleatória. Qual-
quer outra característica da amostra também será uma função do
vetor aleatório ( X 1 , X 2 ,...,X n ) .

Definição 6.2. Uma estatística é uma característica da amostra,


ou seja, uma estatística T é uma função de X 1 , X 2 ,..., X n , isto é,
T = f ( X 1 , X 2 ,..., X n ).

As estatísticas mais comuns são:

1 n
X= ∑ Xi
n i =1
→ média de amostra

1 n
(
∑ Xi − X )
2
s2 = → variância da amostra
n − 1 i =1
X mín = mín {X 1 , X 2 ,..., X n } → menor valor da amostra

X máx = máx {X 1 , X 2 ,..., X n } → maior valor da amostra

w = X máx − X mín → amplitude total da amostra

X (i ) → ésima maior observação da amostra


1 n
(
∑ Xi − X )
2
σˆ 2 = → variância da população
n i =1

Assim, se estamos colhendo amostras de uma população identifi-


cada pela variável aleatória (v.a.) (definida na seção 5.4) X de então,
a média E ( X ) e a variância var ( X ) são da população, ou seja,

Var ( X ) = σ 2 e E ( X ) = μ .

Normalmente, são utilizadas as seguintes notações:

Estatística amostral População


Média X μ
Variância s2 σ2
Número de Elementos n N
Proporção p p

Quadro 6.1

181
Como já vimos antes amostra é uma parte (subconjunto)necessar
iamente finita da população, retirada segundo uma regra conve-
niente. Veja o gráfico a seguir:

Inferência Estatística
A A A
U U
X , S2,n,p^ m,s,N,p
Funções Distribuições
População Amostras das F. Amostrais
Amostrais

Gráfico 6.1

Observação 6.1. Quanto maior a amostra mais precisa e mais


confiável devem ser os resultados.

6.3 Distribuições Amostrais


A teoria da amostragem é um estudo das relações existentes en-
tre uma população e as amostras dela extraídas.

Através das estatísticas amostrais – grandezas corresponden-


tes às amostras (média aritmética, desvio padrão, variância
etc.)- procura-se avaliar as grandezas desconhecidas das popu-
lações parâmetros populacionais (parâmetros).

Ao retirar uma amostra aleatória de uma população, portanto, esta-


remos considerando cada valor da amostra como um valor de uma
variável aleatória cuja distribuição de probabilidade é a mesma da
população no instante da retirada desse elemento para amostra.

U ma distribuição amostral é uma distribuição


de probabilidades que indica até que ponto
uma estatística amostral tende a variar devido à
variações casuais na amostragem aleatória.

182
6.3.1 Distribuição Amostral da Média: Com e Sem Reposição
Se extrairmos um objeto de uma urna, poderemos repô-lo ou não
na urna antes da extração seguinte. No primeiro caso, determina
do objeto pode aparecer mais de uma vez, enquanto, no segundo
caso, o objeto só pode aparecer uma vez, No primeiro caso, temos
a amostragem com reposição, no segundo, amostragem sem reposição.

Vamos estudar agora a distribuição amostral da estatística X , a mé-


dia da amostra. Consideremos uma população identificada pela variá-
vel X , cujos parâmetros médios populacionais μ = E ( X ) e variância
populacional σ 2 = Var ( X ) são supostamente conhecidos. Vamos re-
tirar todas as possíveis amostras causais simples de tamanho n dessa
população, para cada uma calcular a média X . Em seguida, construí-
mos a distribuição amostral e estudamos suas propriedades.

A seguir apresentaremos um exemplo de cálculo de média, vari-


ância etc. da amostra e da população é:

Exemplo 6.1. Seja uma população limitada a 3 valores, ou seja,


X = {2, 4,6}. Então, a média da população.
2+4+6
μ= =4
3 .
O desvio padrão da população é:
1
σ=
n
∑ ( xi − X )
(4 − 2) 2 + (4 − 4) 2 + (6 − 4) 2
=
3
8
= = 1,633 .
3
Consideremos as amostras aleatórias de 2 elementos com reposição.

Conjunto das amostras:

{(2, 2 ), (2, 4 ), (2,6 ), (4, 2 ), (4, 4 ), (4,6 ), (6, 2 ), (6, 4 ), (6,6 )}.
Conjunto das médias das amostras:

{2, 3, 4, 3, 4, 5, 4, 5, 6}.

183
Este conjunto é uma população.

Média do conjunto das médias:


2+3+ 4+3+ 4+5+ 4+ 5+ 6
μX = =4
9
Desvio padrão do conjunto das médias:

4
σX = = 1,1547
3
Pelo exemplo observamos que
4 8 8 1 .
σX = = = ×
3 3× 2 3 2

Observação 6.2. Do exemplo acima podemos observar que

i) É possível demonstrar que de uma população de tamanho N


da qual são retiradas todas as amostras possíveis de tamanho
n , obtemos população infinita ou amostragem com reposição.

σ X = μ , isto é, a média das médias de todas as amostras pos-


ii)
síveis do mesmo tamanho retirados de uma mesma popula-
ção de valores X é igual a média desta população.

σ
iii) σ X = , isto é, o desvio padrão das médias dessas amostras é
n
igual ao desvio padrão da população dividida pela raiz quadra-
da do tamanho da amostra.

Mais precisamente, temos o seguinte teorema:

Teorema 6.1. Seja X uma v.a. com média μ e variância σ 2 , e seja


( X 1, X 2 ,...,X n ) uma amostra casual simples (amostragem com re-
posição) com

X 1 + X 2 + ... + X n
X= .
n
Então, temos

μX = E X = μ( ) (1)

184
( ) (
σ 2 X = var X = E X − μ2 = ) σ2
n
. (2)

Teorema a seguir é conhecido como Teorema do Limite Central , em


O Teorema do Limite que a distribuição amostral de X aproxima-se cada vez mais de uma
Central estabelece
condições segundo distribuição normal quando o tamanho da amostra aumenta indepen-
as quais a soma de dente de distribuição da população original.
variáveis aleatórias é
aproximadamente normal. Teorema 6.2. Para amostras casuais simples ( X 1 , X 2 ,...,X n ) reti-
Fonte: http://pt.wikipedia.
org/wiki/Teorema_do_
radas de uma população com média μ e a variância σ 2 , a dis-
Limite_Central
tribuição amostral da média X =
( X 1, X 2 ,...,X n )
aproxima-se de
n
σ2
uma distribuição normal com média μ e variância , quando
n
n tende ao infinito.

Observação 6.3. Se a população tem tamanho N , se a amostragem


é sem reposição, e se o tamanho da amostra é n ≤ N , então (2) é
substituída por

σ2 ⎛ N − n ⎞
σ2X = ⎜ ⎟, (3)
n ⎝ N −1 ⎠
ao passo que μ X é dado ainda por (1), ou seja, μ X = μ . Note que
(3) se reduz a (2) quando N → ∞ .

Assim, podemos dizer que

À medida em que se aumenta o tamanho da


amostra, a distribuição da amostragem da mé-
dia se aproxima da forma da distribuição normal,
qualquer que seja a forma da população.

Na prática, a distribuição de amostragem da média pode ser con-


siderada como aproximadamente normal sempre que o tamanho
da amostra for n ≥ 30 .

Exemplo 6.2. Uma população consiste dos números 1, 3, 6, 7, 8.


Consideremos todas as amostras possíveis de tamanho 2 que po-
dem ser extraídas, com reposição dessa população. Determine:

a) a média da população;

185
b) o desvio padrão da população;

c) a média da distribuição amostral de médias;

d) o desvio padrão da distribuição amostral de médias, isto é,


o erro padrão das médias;

e) a média de distribuição amostral de médias sem reposição;

f) a variância da distribuição amostral de médias.

Resolução:

a) A média da população é
1+ 3 + 6 + 7 + 8
μ= =5.
5

b) O desvio padrão da população é

(1 − 5) + (3 − 5) + (6 − 5) + (7 − 5) + (8 − 5)
2 2 2 2 2

σ2 =
5
16 + 4 + 1 + 4 + 9 34
= = = 6,8 .
5 5
c) Média da distribuição amostral de médias:

temos 52 = 25 amostras de tamanhos 2 com reposição. Essas


amostras são:

(1,1) (1,3) (1,6 ) (1,7 ) (1,8)

(3,1) (3,3) (3,6 ) (3,7 ) (3,8)

(6,1) (6,3) (6,6 ) (6,7 ) (6,8)

(7,1) (7,3) (7,6 ) (7,7 ) (7,8)

(8,1) (8,3) (8,6 ) (8,7 ) (8,8).

As correspondentes médias amostrais são:

1 2 3,5 4 4,5

2 3 4,5 5 5,5

186
3,5 4,5 6 6,5 7

4 5 6,5 7 7,5

4,5 5,5 7 7,5 8.

A média da distribuição amostral das médias é

soma de todas as médias dadas na tabela


μX =
25
125
= = 5,0
25
d) Obtém-se a variância da distribuição amostral da média sub-
traindo-se a média 5,0 de cada número dado na tabela, ele-
vando-se o resultado ao quadrado, somando-se todos os valo-
res assim obtidos, e dividindo os por 25. O resultado final é:
(1 − 5) + (2 − 5) + ... + (7,5 − 5 ) + (8 − 5 )
2 2 2 2

σ2X =
25
85
= = 3, 4 .
25
Isto mostra que, para população finita envolvendo amostragem
σ2
com reposição ou populações infinitas, σ 2 X = , pois o mem-
n
6,8
bro direto é = 3, 4 , o que está de acordo com o valor obtido
2
acima.

5! 5.4
e) Há C5,2 = = = 10 amostras de tamanho dois, sem re-
2! 3! 1.2
posição, que podem ser extraídas da população. Isto significa
que podemos extrair um número e em seguida outro número
diferente do 1°, a saber,

(1,3) (1,6 ) (1,7 ) (1,8) (3,6 )

(3,7 ) (3,8) (6,7 ) (6,8) (7,8)

187
Aqui a escolha (1,3) , por exemplo, é considerada idêntica à es-
colha (3,1) . As médias amostrais correspondentes são

2 3,5 4 4,5 4,5


5 5,5 6,5 7 7,5 ,

e a média da distribuição amostral das médias é


2 + 3,5 + 4 + 4,5 + 4,5 + 5 + 5,5 + 6,5 + 7 + 7,5
μX =
10
50
= = 5,0 .
10

Isto mostra que μ X = μ .

f) A variância da distribuição amostral de médias é

σ2X =
1
10
{
(2 − 5) + (3,5 − 5) + (4 − 5) + (4,5 − 5) + (4,5 − 5) ,
2 2 2 2 2

+ (5 − 5 ) + (5,5 − 5 ) + (6,5 − 5 ) + (7 − 5 ) + (7,5 − 5 )


2 2 2 2 2
}
=
1 2
10
{
3 + (1,5 ) + 12 + (0,5 ) + (0,5 ) + (0,5 ) + (1,5 ) + 22 + (2,5 )
2 2 2 2 2 2
}
=
1 2
10
{
3 + (2,5 ) + 22 + 2 × (1,5 ) + 12 + 3 × (0,5 )
2 2 2
}
1
= {9 + 6, 25 + 4 + 4,5 + 1 + 0,75}
10
1
= × 25,5 = 2,55
10
⇒ σ X = 1,5968 .

Isto mostra que

σ2 ⎛ N − n ⎞
σ2X = ⎜ ⎟ (N = 5 e n = 2)
n ⎝ N −1 ⎠

⇒ σ X = 1,5968 ,

o que é o mesmo valor calculado acima.

188
• Fator de Correção Finita (FCF)

O fator de correção finita é usado quando o tamanho da amos-


tra é superior a 5% do tamanho da população, principalmente no
caso de amostragem sem reposição. Esse fator é dado por

N −n
n > 5% ⇒ FCF = ,
N −1
σx = μ .
e
σ N −n
σx = ⋅ .
n N −1
Observação 6.4. Quanto à normalidade da distribuição da população:

a) se for normal, então a distribuição amostral de X será nor-


mal para qualquer tamanho da amostra.

b) se não for normal, então,

• para amostras suficientemente grandes (população infi-


nita, amostragem com reposição) a distribuição de X será
aproximadamente normal.
• para amostras sem reposição de população finita com
n > 30 , a distribuição de X é aceita como normal.

c) para a determinação da probabilidade e caso a distribuição de


X seja normal, aplicamos a transformação de padronização:

X −μ X −μ
z= ou z = ,
σx σ/ n
onde:
X – elemento da distribuição X;
μ – média da população;
σ – desvio padrão da população;
n – tamanho da amostra.

Exemplo 6.3. Suponhamos que as alturas de 2500 estudantes do


sexo masculino em uma universidade tenha média 175 cm e des-
vio padrão 9 cm. Extraindo-se 70 amostras de 36 estudantes de
cada uma, quais seriam a média e o desvio padrão da distribui-
ção amostral de médias no caso de:

189
a) amostragem com reposição;

b) amostragem sem reposição;

c) abaixo de 170 cm.

d) quantos amostras podem esperar que a média esteja entre


172 cm e 179 cm;

Resolução:

a) e b) Pela fórmula, temos em total de amostras com reposição


(2500 ) e C2500,36 sem reposição. Logicamente, ambas são bem
36

maiores que 70. Então, neste caso não obtemos uma distribuição
amostral verdadeira, mas uma distribuição amostral experimental.
Como o número de amostras é muito grande, deve haver aproxi-
mação satisfatória entre as duas distribuições amostrais. Logo,
a média e o desvio padrão esperados devem estar próximos dos
valores correspondentes de distribuição teórica. Então, temos

μ X = μ = 175 cm,

σ 9 9
σX = = = = 1,5 .
n 36 6

Agora, utilizando o fator de correção finita, temos


σ N − n 9 2500 − 36 3 49, 6386
σX = = = = × = 1, 489 cm.
n N − 1 6 2500 − 1 2 49,9984

O que é quase igual a 1,5, portanto, para fins práticos, podemos con-
siderar como o mesmo valor obtido por amostragem com reposição.
Assim, podemos concluir que a distribuição experimental das
médias tem distribuição aproximadamente normal com média
175 cm e desvio padrão 1,5 cm.

c) A média amostral X , em unidades padronizadas, é aqui dada


por

X − μX X − 175
z= = ;
σX 1,5

172 em unidades padronizadas é

=
(172 − 175) = −2,0 ;
1,5

190
179 em unidades padronizadas é

=
(179 − 175) = 2,67 .
1,5
Proporção da amostra com médias 172 e 179

= (área sob a curva normal entre z = −2 e z = 2,67 )

= área entre ( z = −2 e z = 0 ) + área entre ( z = 0 e z = 2,67 ).

=0,4772 + 0,4962 = 0,9734.

Número esperado da amostra:

= 70 (0,9734) = 68,13 ou 68.

-2 2,67

Figura 6.1

d) 173 em unidades padronizadas é

=
(173 − 175) = −1,34 .
1,5
Porções de amostras com média inferior a 173 cm

= (área sob a curva normal à esquerda de z = −1,34 )

= (área à esquerda de z = 0 ) – (área entre z = −1,34 e z = 0 ).

= 0,5 - 0,4099 = 0,0901

-1,34
Figura 6.2

191
Então o número esperado de amostras é

70 × (0,0910 ) = 6,307 ,

ou seja, aproximadamente 6.

Exemplo 6.4. Seiscentos alunos têm peso médio de 70 kg e desvio


padrão de 5,0 Kg. Determine a probabilidade de 50 pessoas extra-
ídas aleatoriamente desse grupo terem:

a) um peso médio entre 68 e 69 kg;

b) de mais que 72 kg.

Resolução: Para distribuição amostral de médias:


μx = μ = 70kg
e

σ N −n 5 600 − 50
σX = =
n N −1 50 600 − 1
= 0,707 × 0,958 = 0,68 .

a)O peso médio estará entre 68 e 69 Kg. Se o peso médio da


amostra de 100 alunos estiver entre 68 e 69 Kg,

68 em unidades padronizadas é

68 − 70
= = −2,98 ;
0,67
69 em unidades padronizadas é

69 − 70
= = −1, 49 .
0,67
Probabilidade desejada

= (área entre z = −2,98 e z = −1, 49 )


= (área entre z = −2,98 e z = 0 ) – (área entre z = −1, 49 e z = 0 )
= 0, 4986 − 0, 4319 = 0,0667 =6,67%

192
-2,98 -1,49

Figura 6.3

b) O peso total excederá 72Kg se o peso médio dos 100 alunos


da amostra exceder os 75Kg.

Em unidades padronizadas, 75 é

=
(72 − 70 ) = 2,98 .
0,67
Probabilidade desejada

= (área entre z = 2,98 )

= (área à direita de z = 2,98 )

= (área à direita de z = 0 ) – (área entre z = 0 e z = 2,98 )

= 0,5 − 0, 4986 = 0,0014 =0,14%,

o que é praticamente zero.

Exemplo 6.5. Um fabricante de baterias alega que seu artigo de


primeira categoria tem uma vida esperada (média) de 50 meses.
Sabe-se que o desvio-padrão correspondente é de 4 meses. Que
percentagem de amostras de 36 observações acusará vida média,
no intervalo de 1 mês, em torno de 50 meses, admitindo ser de 50
meses a verdadeira vida média das baterias?

Resolução.

1) Dados: μ = 50 meses, σ = 4 meses, n = 36 .

193
2) P(49 ≤ X ≤ 51) = ?

3) Cálculos: P(49 ≤ X ≤ 51) = P( z1 ≤ z ≤ z2 )

49 − 50 51 − 50
z1 = = −1,5 , z2 = = 1,5 .
4 / 36 4 / 36

Logo,
P(49 ≤ X ≤ 51) = P( −1,5 ≤ z ≤ 1,5)

= 0, 4332 + 0, 43320

= 0,8664 = 86,64% .

Exemplo 6.6. Uma máquina para recobrir cerejas de chocolates é


regulada para produzir um revestimento de 3mm de espessura.
O processo tem distribuição normal com desvio padrão de 1mm.
Se o processo funciona conforme e esperado (i.e., média de 3mm
e desvio padrão de 1mm), qual seria a probabilidade de extrair
uma amostra de 25 de um lote de 169 cerejas e encontrar uma
média amostral superior a 3,4mm?

Resolução. Temos os seguintes dados:

1) μ = 3 mm, σ = 1 mm, n = 25 , N = 169 .

2) P( X > 3, 4) = ?

3) Cálculos: P( X > 3, 4) = P( z > z1 )


n 25
= = 0,15 > 5% - FCF,
N 169

1 169 − 25 3, 4 − 3
σx = ⋅ = 0,185 , z1 = = 2,16 .
25 169 − 1 0,185
Logo,
P( X > 3, 4) = P( z > 2,16)
= 0,5 − 0, 4846 = 0,0154 = 1,54% .

Exemplo 6.7. Certos amortecedores fabricados por uma empresa


têm uma vida média de 800 dias e desvio padrão de 60 dias. Deter-
minar a probabilidade de amostras aleatórias de 16 amortecedores,
retirados do grupo terem a vida média entre 770 e 830 dias.

194
Resolução. Temos seguintes dados:

1) μ = 800 dias, σ = 60 dias, n = 16 .

2) P(770 ≤ X ≤ 830) = ?

3) Cálculos: P(770 ≤ X ≤ 830) = P( z1 ≤ z ≤ z2 )

770 − 800 830 − 800


z1 = = −2 , z 2 = = 2.
60 / 16 60 / 16
Logo,
P(770 ≤ X ≤ 830) = P( −2 ≤ z ≤ 2)
= 0, 4772 + 0, 4772 = 0,9544 = 95, 44% .

6.4 Distribuição Amostral das Proporções


Uma distribuição de proporções amostrais indica quão provável é
determinado conjunto de proporções amostrais, dados o tama-
nho da amostra e a proporção populacional. Quando o tamanho
da amostra é 20 ou menos, as probabilidades dos diversos re-
sultados possíveis podem ser lidas diretamente numa tabela de
probabilidades binomiais, simplesmente convertendo o número
de sucessos em percentagens. Por exemplo, 4 ocorrências em 10
observações correspondem a 40% e 10 ocorrências em 20 observa-
ções correspondem a 50%. Para maiores amostras, a aproximação
normal da binomial dá resultados bastante satisfatórios.

Admitamos que uma população é infinita e que a probabilida-


de da ocorrência de um evento (seu sucesso) é p , enquanto sua
não-ocorrência é q = 1 − p . De uma população de tamanho N são
retiradas todas as amostras possíveis de tamanho n e é determi-
nada a proporção de sucessos. Então:

• População Infinita ou Amostragem com Reposição

pq
μp = p e σp = .
n
• Amostragem sem Reposição de População Finita

pq N −n
μ p = p e caso n > 5% σ p = × .
n N −1

195
• Fator de Correção de Continuidade (FCC) - Considerando
que a proporção é uma variável discreta e que a população
é distribuída binomialmente ( p e q ), o que não impede de
n > 30 ser aceita como aproximadamente normal. É neces-
1
sário, então, que se acrescente ou se subtraia , confor-
2× n
me a situação exigir. A transformação para o uso da Curva
Normal Padronizada será efetuada pela fórmula:
p′ − p ± FCC
z= ,
σ
onde

p′ é a proporção da amostra;
p é a proporção da população;
σ é o desvio padrão da população;
1
FCC = → Fator de Correção de Continuidade.
2× n
Exemplo 6.8. Determine a probabilidade de que em 80 jogadas de
uma moeda apareçam:

a) entre 45% e 55% de cara.

b) 3 ou mais caras.
5
Resolução: Consideremos 80 jogadas como uma amostra das
infinitas jogadas possíveis da moeda. Em tal população, a pro-
1
babilidade de “cara” é p = , e a probabilidade de coroa é
2
1
9 = 1− p = .
2
a)Queremos a probabilidade de o número de caras em 80 joga-
das estar entre 36 (45% de 80) e 44 (55% de 80). Temos
1
μ = número de caras = np = 80 × = 40 ,
2
1 1
σ = n p q = 80 × × = 20 = 4, 47 ,
2 2
1 1 1
FCC = = = = 0, 00625
2n 2 × 80 160
e

196
1 1
×
pq 2 2 = 0, 0559 .
σp = =
n 80
Em unidades padronizadas, 45% com FCC é

0, 45 − 0,00625 − 0,50
= = −1,00 ;
0,0559
e 55% em unidades padronizadas com FCC é

0,55 + 0,00625 − 0,50


= = 1,00 .
0,0559
Logo,

a probabilidade desejada é

= (área sob a curva normal entre z = −1,00 e z = 1,00 )

= 2 (área entre z = 0 e z = 1,00 )

= 2 (0,3413) = 0,6826 = 68,26%.

Portanto,

P(0, 45 < p < 0,55) = 68,34% .


3
b) Agora, = 0,60 = 60% .
5
Em unidades padronizadas 60%, com FCC é
0,60 + 0,00625 − 0,50
= = 1,90
0,0559

Logo,
a probabilidade procurada é
= (área sob a curva normal à direita de z = 1,90 )
= (área à direita de z = 0 ) – (área entre z = 0 e z = 1,90)
= 0,5 – 0,4712 = 0,0288 = 2,88%.
Portanto,
P( p ≥ 0,6) = 2,88% .

Exemplo 6.9. Um varejista compra copos diretamente da fá-


brica em grandes lotes. Os copos vêm embrulhados individu-
almente. Periodicamente, o varejista inspeciona os lotes para
determinar a proporção dos copos quebrados ou lascados. Se

197
um grande lote contém 10% de copos quebrados ou lascados,
qual a probabilidade de o varejista obter uma de 100 copos
com 17% ou mais defeituosos?

Resolução. Temos os seguintes dados:

1) p = 0,10 , n = 100 ;

2) P( p > 0,17) = ? ;

3) Cálculos: P( p > 0,17) = P( z > z1 ) ;

μ p = p = 0,1 , q = 1 − p = 0,9 ,

1
FCC = = 0, 005 ,
2 × 100

0,1 × 0,9
σp = = 0,03
100

0,17 − 0,10 − 0,005


z1 = = 2,167 = 2,17% ,
0,03
Logo,
P( p > 0,17) = P( z > 2,17)

= 0,5 − 0, 4850 = 0,0150 = 1,5%

Exemplo 6.10. Um processo de encher garrafas de cola dá, em


média, 10% de garrafas mal cheias. Extraída uma amostra de 225
garrafas de uma seqüência de produção de 625, qual a probabili-
dade de que a proporção amostral de garrafas cheias esteja entre
9% e 11%?

Resolução. Temos seguintes dados:

1) p = 0,10 , n = 100 , N = 625 .

2) P( p > 0,17) = ?

3) Cálculos: P(0,9 ≤ p ≤ 0,11) = P( z1 ≤ z ≤ z2 ) ,

198
μ p = p = 0,1 , q = 1 − p = 0,9 ,

1
FCC = = 0, 00222 ,
2 × 225

n 225
= > 5% → FCC ,
N 625

0,1 × 0,9 625 − 225


σr = ⋅ = 0,0160128 ,
225 625 − 1

0,09 − 0,10 − 0,0022


z1 = = −0,7632761 = −0,76
0,0160128
e
0,11 − 0,10 − 0,0022
z2 = = 0,7632761 = 0,76 ,
0,0160128
Logo,
P(0,09 ≤ p ≤ 0,11) = P( −0,76 ≤ z ≤ 0,76)

= 2 × 0, 2764 = 0,5528 = 55, 28% .

Exercícios Propostos
1)Um fabricante de baterias alega que seu artigo de primeira ca-
tegoria tem uma vida esperada (média) de 50 meses. Sabe-se que
o desvio padrão correspondente é de 4 meses.

a) Que percentagem de amostras de 36 observações acusará


vida média, no intervalo de 1 mês, em torno de 50 meses,
admitindo ser de 50 meses a verdadeira vida média das ba-
terias?

b) Qual será a resposta para uma amostra de 64 observações?

c) Qual seria a probabilidade de obter uma média amostral infe-


rior a 49,8 meses com uma amostra de 100 observações?

Respostas: a) 86,64% ; b) 95,44%; c) 30,85%.

2)Uma máquina para recobrir cerejas de chocolate é regulada


para produzir um revestimento de 3 mm de espessura. O pro-

199
cesso tem distribuição normal com desvio padrão de 1 mm. Se
o processo funciona conforme o esperado (i.e, média de 3mm de
desvio padrão de 1mm), qual seria a probabilidade de extrair uma
amostra de 25 de um lote de 169 cerejas e encontrar uma média
amostral superior a 3,4mm?

Resposta: 1,54.

3)Uma população consiste de cinco números: 2, 3, 6, 8 e 11. Con-


siderem-se todas as amostras de 2 elementos que dela podem ser
retiradas com reposição. Determinar:

a) A média da população.

b) O desvio padrão da população.

c) A média da distribuição amostral das médias.

d) O desvio padrão da distribuição amostral das médias.

Respostas: a) μ = 6 ; b) σ = 3, 29 ; c) μ = 6 ; d) σ = 2,32 .

4) Resolver o problema anterior para o caso de amostragem


sem reposição.

Respostas: a) μ = 6 ; b) σ = 3, 29 ; c) μ = 6 ; d) σ = 2,01 .

5) Admite-se que as alturas de 3000 estudantes do sexo mascu-


lino de uma universidade são normalmente distribuídas com mé-
dia 172,72 cm, e o desvio padrão esperado da distribuição amos-
tral das médias resultantes se a amostragem for finita:

a) com reposição.

b) sem reposição.

Respostas: a) 172,72 e 1,52; b) 172,72 e 1,52.

6) Em quantas amostras do problema anterior pode-se esperar


que a média se encontre:

a) entre 169,67cm e 173,48cm?

b) abaixo de 169,65cm?

200
Respostas: a) 54 ; b) 2.

7) Certos amortecedores fabricados por uma empresa têm uma


vida média de 800 dias e desvio padrão de 60 dias. Determinar
a probabilidade de uma amostra aleatória de 16 amortecedores,
retirados do grupo, ter a vida média:

a) superior a 820 dias;

b) menor que 785 dias;

c) entre 790 e 810 dias;

Respostas: a) 9,18%; b) 15,37%; c) 49,72%.

Resumo
Neste capítulo, apresentamos o conceito de amostragem. Estuda-
mos a amostragem casual simples, e analisamos o conceito de dis-
tribuições amostrais das médias com e sem reposição. Também
explicamos distribuição amostral das proporções. Todos esses
assuntos foram abordados com exemplos numéricos e, ao final
propusemos uma lista de exercícios.

201
7 Estimação
7 Estimação

Neste capítulo, apresentaremos os assuntos relacionados


estimação e explicaremos o que é intervalo de confiança.
Abordaremos intervalo de confiança para média de uma
população. Também explicaremos como calcular o erro da
estimação e o tamanho da amostra. Também explicaremos
o desvio padrão populacional desconhecido utilizando a
destituição t de student.

7.1 Introdução
Estimação é o processo que consiste em utilizar dados amostrais
para estimar os valores de parâmetros populacionais desconhe-
cidos. Essencialmente, qualquer característica de uma população
pode ser estimada a partir de uma amostra aleatória. Por exemplo:
Lojas – devem prever a procura dos diversos artigos, tais como:
avaliação de estoques, estimação de custos de projetos, avaliação
de novas fontes de energia, predições sobre realizações de empre-
endimentos, estimativas de tempo médio etc.

7.2 Estimativas Pontuais e Intervalares


Neste caso, há dois tipos de situações:

• Estimativa Pontual – é a estimativa única de um parâmetro


populacional.
• Estimativa Intervalar – dá um intervalo de valores possí-
veis, no qual se admite estar o parâmetro populacional.

205
Veja quadro abaixo, que dá exemplos de estimativas pontuais e
intervalares:

Parâmetro
Pontual Intervalar
populacional

1. O brasileiro conso-
1. O consumo médio de carne
me em média 15kg de
no país está entre 12 e 18
carne/ano.
Média kg/ano.
2. Um Palio de 8 ci-
2. Um Palio de 8 cilindros faz
lindros faz 10 km/l de
entre 8 e 12 km/l de gasolina.
gasolina.

1. 20% da população 1. Entre 18% e 22% da popu-


se opõe a um aumento lação há oposição a um au-
do limite de velocidade. mento do limite de velocidade.
Proporção
2. A proporção de 2. A proporção de estudantes
estudantes fumantes é fumantes está entre 38% e
de 40% 42%.

Quadro 7.1

Podemos também considerar outros parâmetros, tais como: a va-


riância, o desvio padrão etc.

7.3 Intervalo de confiança


Suponha que estejamos interessados num parâmetro populacio-
nal verdadeiro (mas desconhecido) θ . Podemos estimar o parâ-
metro θ usando informação de nossa amostra. Chamamos o úni-
co número que representa o valor mais plausível do parâmetro
(baseado nos dados amostrais) de uma estimativa pontual de θ .
Contudo, sabemos que o valor estimado, na maior parte das vezes,
não será exatamente igual ao valor verdadeiro. Então, também se-
ria interessante encontrar um intervalo de confiança que forneça
um intervalo de valores plausíveis para o parâmetro, com base
nos dados amostrais. Um intervalo de confiança dá um intervalo
de valores centrado na estatística amostral, no qual julgamos, com
um risco conhecido de erro, estar o parâmetro da população.

Tecnicamente, 95% de todos os intervalos de confiança que cons-


truirmos conterá o verdadeiro valor do parâmetro (dado que todas
as suposições envolvidas estejam corretas). Então, se obtivermos

206
um intervalo de confiança para o parâmetro θ para cada uma
dentre 100 amostras aleatórias da população, somente 5, em mé-
dia, destes intervalos de confiança não conterão θ . Por exemplo,
95% de confiança ⇒ risco de 5%.

Confiança = 1 – P(risco) = 1 − α , então

α = 5% ⇒ z = 1,96 . (Usando tabela de distribuição normal padro-


nizada.)

Analogamente,

98% de confiança ⇒ risco de 2%,

i.e., α = 2% ⇒ z = 2,33 .

Como não sabemos ao certo, admitimos o pior e construímos um


intervalo de valores verdadeiros possíveis.

Intervalo de confiança: X ± z σ X

Figura 7.1

7.4 Estimação de Média de uma População


A proximidade que a determinada média amostral pode estar da
média da distribuição amostral, em unidades efetivas, depende
da variabilidade na distribuição amostral (desvio padrão). Gran-
des amostras implicam em médias amostrais mais perto da ver-
dadeira média. Uma razão para a distribuição normal ser consi-
derada tão importante é porque qualquer que seja a distribuição
da variável de interesse para grande amostras, a distribuição das
médias amostrais será aproximadamente normalmente distri-
buída, e tenderá a uma distribuição normal à medida que o ta-
manho de amostra crescer. Então, podemos ter uma variável ori-
ginal com uma distribuição muito diferente da normal (pode até
mesmo ser discreta), mas se tomarmos várias amostras grandes
desta distribuição e então fizermos um histograma das médias

207
amostrais, a forma se parecerá com uma curva normal.

A distribuição da média amostral X é aproximadamente normal


com média μ e desvio padrão σ / n . Aqui, μ e σ são a média e
o desvio padrão populacionais das medidas individuais X , e n
é o tamanho amostral. Denota-se

X ∼ N ( μ, σ 2 / n)

A seguir, consideremos alguns exemplos de uso da tabela de dis-


tribuição normal padronizada.

Quando n > 30 , já entendemos que estamos trabalhando com


grandes amostras. Se a estatística S é a média amostral X , então
os limites de confianças de 95% e 99% para estimação de média μ
da população são dados por X ± 1,96 σ X e X ± 2,58 σ X , respecti-
vamente. Mas geralmente, os limites de confianças são dados por
X ± zc σ X , onde zc , que depende da particular nível de confiança
desejado, pode ser lido no seguinte quadro.

Nível de
99,73% 99% 98% 96% 95,45% 95% 90% 80% 68,27% 50%
Confiança

zc 3,00 2,58 2,33 2,05 2,00 1,96 1,643 1,28 1,00 0,6745

Quadro 7.2

Esses valores são obtidos a partir da tabela de áreas sob a curva


normal (veja tabela 5.5, capítulo 5).

Utilizando os valores de σ X obtidos no capítulo anterior, vemos


que os limites de confiança para a média da população, no caso
de amostragem de uma população infinita ou amostragem com
reposição de uma população finita, são dadas por

σ
X ± zc , (1)
n
e no caso de amostragem sem reposição de uma população finita
de tamanho N , são dadas por

σ N −n
X ± zc . (2)
n N −1

208
Em geral, não se conhece o desvio padrão σ da população, de
modo que se passam a obter os limites de confiança acima. Va-
mos analisar a seguir dois casos:

i) desvio padrão populacional conhecido;

ii) desvio padrão populacional desconhecido.

7.4.1 Desvio Padrão Populacional Conhecido


Estimativa Pontual de μ : x .

Estimativa Intervalar de μ : x ± z σ x .

Por exemplo, se consideremos n = 36 , σ = 3 e x = 24, 2 , então te-


mos os seguintes cálculos, conforme a confiança desejada:

Confiança z Cálculo Solução Intervalo


desejada
3 23,375 a
90% 1,65 24, 2 ± 1, 65 × 24, 2 ± 0,825
36 25,025
3 23,220 a
95% 1,96 24, 2 ± 1,96 × 24, 2 ± 0,980
36 25,180
3 23,910 a
99% 2,58 24, 2 ± 2,58 × 24, 2 ± 1, 290
36 25,490

Quadro 7.3

P ara amostras de 30 ou menos observações


é importante saber que a população sub-
metida à amostragem tem distribuição normal.
De outra forma estas técnicas não podem ser
utilizadas.

209
Exemplo 7.1. Suponha que as alturas de 100 estudantes do sexo
masculino da UFSC constituam uma amostra aleatória das altu-
ras dos 2000 estudantes de sexo masculino. A amostra é dada (em
cm) na seguinte tabela.

(X − X ) ( )
2 2
Intervalo Média Freqüência f ⋅x f ⋅x⋅ X − X

160 A 164 162 15 2430 56,55 848,26


164 A 168 166 23 3818 12,39 284,98

168 A 172 170 30 5100 0,23 6,91

172 A 176 174 23 4002 20,07 461,62

176 A 180 178 9 1602 71,91 647,19


Total 100 16952 2248,96

Quadro 7.4

Determine:

a) a média (estimativa eficiente),

b) a variância,

c) o intervalo de confiança de 95%,

d) um intervalo de confiança de 99% para estimar a altura média.

Resolução.

a) Média
∑ f x ∑ f x 16952
X= = = = 169,52 cm .
∑f n 100
b) Variância

( )
2
∑f x X −X 2248,96
s= = = 22, 49 = 4,7423 cm.
n 100
σ
c) Os limites de confiança na base de 95% são X ± 1,96 .
n
Usando X = 169,52 e s = 4,7423 como estimativa de σ , os li-
mites de confiança são
4,7423
169,52 ± 1,96 = 169,52 ± 0,92
100
⇒ 168,59 a 170, 44 .

210
Assim, o intervalo de confiança de 95% para média μ da popu-
lação de 168,59 a 170,44 cm é de 95% ou 0,95, ou seja,

P (168,59 < μ < 170, 44 ) = 0,95 .

Isto equivale a dizer que temos 95% de confiança em que a ver-


dadeira média da população esteja entre 168,59 e 170,44 cm.

σ
d)Os limites de confiança na base de 99% são X ± 2,58 .
n
Para o nosso caso,
σ 4, 7423
X ± 2,58 = 169,52 ± 2,58
n 100
= 169,52 ± 1, 22

⇒ 168,06 e 170,74 .

Assim, o intervalo de confiança de 99% para a média da popu-


lação é de 168,06 a 170,74 cm, que se pode denotar por
168, 06 < μ < 170, 74 .

A o obter os intervalos de confiança acima,


admitimos que a população fosse infinita
ou tão grande que se pudessem considerar as
condições idênticas às de amostragem com re-
posição. Para populações finitas sujeitas a amos-
tragem sem reposição, deveríamos utilizar

em lugar de .

Sempre podemos considerar o fator

N −n 2000 − 100
= = 0,9749 ,
N −1 2000 − 1
o que é bem próximo de 1. Logo, podemos omiti-lo. Se levarmos
em conta os limites de confiança, serão:

c) 169,52 ± 0,90

d) 169,52 ± 1,22

Exemplo 7.2 A medida dos diâmetros de uma amostra aleató-


ria de 160 mancais fabricados por determinada máquina durante

211
uma semana acusa média de 2,15 cm e desvio padrão de 0,17 cm.
Determine o intervalo de confiança de:

a) 95%

b) 99%

c) 98%

d) 90%

e) 99,73%

para o diâmetro médio de todos os mancais.

Resolução:

a) Os limites de confiança de 95% são


σ S
X ± 1,96 = X ± 1,96
n n
0,17
= 2,15 ± 1,96
160
0,17
= 2,15 ± 1,96
12,65
= 2,15 ± 0,026

⇒ 2,124 a 2,176 cm.

b)Os limites de confiança de 99% são


σ S
X ± 2,58 = X ± 2,58
n n
0,17
= 2,15 ± 2,58
12,65
= 2,15 ± 2,58 ⋅ 0,01086

= 2,15 ± 0,028

⇒ 2,122 a 2,178 cm.

c) Seja zc tal que a área sob a curva normal à direita de z = zc


é de 1%. Então, por simetria, a área à esquerda de z = − zc é
também 1%, de modo que a área sombreada é 98% da área
total. Como a área total sob a curva é 1, a área de z = 0 a
z = zc é 0,49 logo zc = 2,33 .

212
-zc zc

Figura 7.2

Assim, os limites de confiança de 98% são


σ 0,17
X ± 2,33 = 2,15 ± 2,58
n 160
0,17
= 2,15 ± 2,33
12,65
= 2,15 ± 2,33 ⋅ 0,01086
= 2,15 ± 0,025
⇒ 2,125 a 2,175 cm.

d)Queremos zc tal que a área de z = 0 a z = c . Seja 0,45, então


zc = 1,645 .

Assim, os limites de confiança de 90% são


σ 0,17
X ± 1, 65 = 2,15 ± 1, 645
n 160
= 2,15 ± 1,645 ⋅ 0,01086

= 2,15 ± 0,018

⇒ 2,132 a 2,168 cm.

e) Os limites de confiança de 99,73% são


σ 0,17
X ±3 = 2,15 ± 3
n 160
= 2,15 ± 0,032

⇒ 2,118 a 2,182 cm.

213
Exemplo 7.3. De um total de 250 notas em matemática, uma amos-
tra aleatória de 50 notas acusa média 7,0 e desvio padrão de 0,10.

a) Quais os limites de confiança de 95% para estimar a média


das 250 notas?

b) Com que grau de confiança poderíamos afirmar que a mé-


dia das 250 notas é 7,0 ± 0,01 ?

Resolução:

a) Como o tamanho da população não é muito grande compa-


rando com o da amostra, devemos fazer um ajuste. Então, os
limites de confianças de 95% são

σ N −n
X ± 1,96 σ X = X ± 1,96
n N −1

0,1 250 − 50
= 7,0 ± 1,96
50 250 − 1
0,1
= 7,0 ± 1,96 0,896
7,14
= 7,0 ± 1,96 ⋅ 0,0125

= 7,0 ± 0,025

⇒ o intervalo de confiança será de 6,975 a 7,025.

b) Os limites de confiança podem ser representados por


σ N −n
X ± zc σ X = X ± zc
n N −1
0,1 250 − 50
= 7,0 ± zc
50 250 − 1
= 7,0 ± zc 0,0125 .

Como este valor deve ser igual a 7,0 ± 0,03 , temos


0,03
0,0125 zc = 0,03 ⇒ zc = = 2, 4 .
0,0125
A área sob a curva normal de z = 0 a z = 2, 4 é 0,4918.

Logo, o grau de confiança procurado é 2 × 0, 4918 = 0,9836 ,


ou seja, 98,36%.

214
7.4.2 Erro de Estimação e Tamanho da Amostra
O erro num intervalo de estimação diz respeito ao desvio (diferença)
entre a média amostral e a verdadeira média da população. Como o
intervalo de confiança tem centro na média amostral, o erro máxi-
mo provável é igual à metade da amplitude do intervalo.

σ σ
x ± z⋅ ⇒ e = z⋅ .
n n
Se quisermos saber qual é o tamanho da amostra, então calcula-
mos a seguir: 2
σ ⎛ σ ⎞ e
e = z⋅ ⇒ e = ⎜z⋅ ⎟ , onde = erro tolerável.
n ⎝ n⎠
Exemplo 7.4. Qual o tamanho da amostra necessária para se esti-
mar a média da população infinita cujo desvio padrão é igual a 4,
com 98% de confiança e precisão de 0,5?

Resolução: IC = 98% ⇒ z = 2,33 ,


2
⎛ 2,33 × 4 ⎞
n=⎜ ⎟ = 347, 4496 ⇒ n = 348 .
⎝ 0,5 ⎠

Exemplo 7.5. Ao medir um tempo de reação, um psicólogo esti-


ma o desvio padrão em 0,06 segundos. Qual o tamanho de uma
amostra de medidas que ele deve tomar a fim de que possa ter (a)
95% e (b) 99% de confiança em que o erro de sua estimativa do
tempo médio de reação não supera 0,02 segundos?

Resolução.
σ
a) Os limites de confiança de 95% são X ± 1,96 , com o
n
σ
erro da estimativa sendo 1,96 . Tomando σ = S = 0, 06 se-
n
gundos, vemos que este erro será igual a 0,02 segundos se
(1,96 )(0,06 ) = 0,02, isto é,
n 1,96 × 0,06
n= = 5,88
0,02
⇒ n = 34,57 .

Podemos assim ter 95% de confiança em que o erro de estimati-


va será inferior a 0,02 se n for igual ou maior do que 35.

215
σ
b) Os limites de confiança de 99% são X ± 2,58 . Então,
n
(2,58)(0,06 ) = 0,02 , isto é,
n
2,58 × 0,06
n= = 7,74
0,02
⇒ n = 59,90 .

Assim, podemos ter 99% de confiança em que o erro da estimati-


va será inferior a 0,02 se n for igual ou maior do que 60.

7.5 Desvio Padrão Populacional Desconhecido


Quando o desvio padrão é desconhecido, como é geralmente o
caso, usa-se o desvio padrão da amostra S . Sabemos que, caso
o tamanho da amostra seja superior a 30, a distribuição das mé-
dias é aproximadamente normal. Todavia, para amostras de 30
ou menos observações, a aproximação normal não é adequada.
Devemos usar, então, a distribuição t de Student.

7.5.1 Distribuição t de Student

A forma da distribuição t é bastante parecida com a normal. A


principal diferença entre as duas distribuições é que a distribui-
ção t tem maior área nas caudas.

NORMAL

Figura 7.3

A distribuição t não é uma distribuição padronizada tal como a


distribuição normal. Para cada amostra, existe uma distribuição
t ligeiramente diferente. A distribuição normal é essencialmente
independente do tamanho da amostra, o que não ocorre com a
distribuição t.

216
Para grandes amostras ( n > 30 ), é razoável usar valores z para
aproximar valores t, muito embora a distribuição t seja sempre
teoricamente correta quando não se conhece o desvio padrão da
população independentemente do tamanho da amostra.

Para usar a tabela t, devemos conhecer duas coisas:

• o nível de confiança desejado;


• o número de graus de liberdade (GL).

O número de graus de liberdade está relacionado com a maneira


como se calcula o desvio padrão da amostra:

(∑ x )
2

∑x 2

n .
s=
n −1
s - desvio padrão amostral
n − 1 - graus de liberdade.

95%

47,59% 47,59%
O z = 1,96

Figura 7.4

t
95%
2,5% 2,5%

Figura 7.5

217
Observações 7.2.

1) Se n > 30 ⇒ t ≈ z

2) A distribuição t supõe que a população submetida à amos-


tragem seja normal, principalmente para n ≤ 30 .

Exemplo 7.6. Completar a tabela:


Coluna
Inter. Conf. n GL Fórmula Valor t
Conf.
95% 8 0,975 7 t0,976;7 2,36
95% 13
95% 23
95% 28
90% 18
99% 29
50% 7
90% 37
98% 5
40% 10

Tabela 7.5

s
Estimação por intervalo de μ : x ± t × .
n
Agora veremos o que você compreendeu! Complete a tabela do
exemplo seguinte, com base no que foi apresentado.

Exemplo 7.7. Sejam x = 20,0 ; s = 1,5 ; n = 25 . Completar:

Conf. Desej. t Fórmula Cálculo Solução

P (19,487 ≤ μ ≤ 20,513)
90% 1,71 1,5
20 − 1,71 × 20 ± 0,513
25
= 0,90
95%

99%

Tabela 7.6

218
7.5.2 Amostragem de Pequenas Populações: Fator de
Correção Finita
Quando a população é finita e a amostra constitui mais de 5% da
população, devemos aplicar o fator de Correção Finita (FCF), dado
N −n
por . Veja na tabela como utilizar este FCF.
n −1
Desvio padrão Intervalo de Cofiança Erro

σx N −n σx N −n
σ x conhecido x ± z⋅ ⋅ z⋅ ⋅
n N −1 n N −1

s N −n s N −n
σ x desconhecido x ±t⋅ ⋅ t⋅ ⋅
n N −1 n N −1

Tabela 7.7

Exemplo 7.8. Determine um intervalo de confiança para estas


duas situações:

a) x = 20 , σ x = 2,5 , n = 120 , N = 1200 ;

b) x = 20 , sx = 2,5 , n = 20 , N = 240 .
Resolução.
n 120
a) Como = = 10% , devemos utilizar o fator de correção
N 1200
finita. A fórmula para o intervalo de confiança é

σx N −n 2,5 1200 − 120


x ± z⋅ ⋅ = 20 ± 1,96
n N −1 120 1200 − 1
= 20 ± (1,96)(0, 2283)(0,9132)
= 20 ± 0, 408 .

n 20
b)Como = = 0,0833 = 8,33% , σ x é desconhecido e
N 240
n ≤ 30 , devemos utilizar a distribuição de t , e a fórmula para

o intervalo de confiança é
s N −n 2,5 240 − 20
x ±t⋅ ⋅ = 20 ± 2,131
n N −1 20 240 − 1
= 20 ± (2,131)(0,559)(0,959)
= 20 ± 1,142 .

219
• Fórmula Modificada para Determinação do Tamanho da
Amostra

No caso de determinação do tamanho da amostra, devemos apli-


car também FCF da seguinte maneira:

z 2 σ 2x N
σ x conhecido: n= 2 2 .
z σ x + e 2 ( N − 1)

t 2s2 N
σ x desconhecido: n= .
t 2 s 2 + e 2 ( N − 1)
Observação 7.1. A não utilização destas fórmulas pode resultar
numa amostra que exceda o tamanho da população.

Exemplo 7.9. Os coeficientes de confiança de 95%, (duas caudas)


para a distribuição normal, são dadas por ±1,96 . Quais são os
coeficientes correspondentes para a distribuição t se:

a) v = 9 ?

b) v = 20 ?

c) v = 30 ?

d) v = 60 ?

Resolução: Para os coeficientes de confiança de 95%, (duas


caudas) a área sombreada total na figura abaixo deve ser 0,05.

Figura 7.6

Assim, a área sombreada à direita é 0,025 e o valor crítico cor-


respondente é t0,975 . Então, os coeficientes de confiança procu-
rados são ± t0,975 . Para os valores dados de v , são:

a) ±2, 26 b) ±2,09 c) ±2,04 d) ±2,00 .

220
Exemplo 7.10. Uma amostra de 10 medidas do diâmetro de uma esfera
acusa média X = 11,0 cm e desvio padrão S = 0,15 cm. Determine os
limites de confiança (a) de 95% e (b) de 99% para o diâmetro efetivo.

Resolução:
a) Os limites de confiança de 95% são dados por
( )
X ± t0,975 S | n − 1 .

Como v = n − 1 = 10 − 1 = 9 , obtemos t0,975 = 2, 26 (conforme


exemplo a)).

Fazendo X = 11,0 e S = 0,15 , obtemos os limites de 95% pro-


curados:
0,15
11,0 ± 2, 26 = 11,0 ± 0,113 cm
10 − 1
⇒ 4,3348 e 4, 4252 .

Podemos, assim, ter 95% de confiança em que a verdadeira


média esteja compreendida entre 11,0 − 0,113 = 10,887 cm e
11,0 + 0,113 = 11,113 cm.

b) Para v = 9 , t0,975 = 3, 25 . Então, os limites de confiança de 99%


são
⎛ S ⎞ ⎛ 0,15 ⎞
X ± t0,995 ⎜ ⎟ = 11,0 ± 3, 25 ⎜ ⎟
⎝ n −1 ⎠ ⎝ 10 − 1 ⎠
= 11,0 ± 0,163 pols.

e o intervalo de 99% de confiança vai de 10,837 cm a 11,163cm.

Exemplo 7.11.

a) Resolver o exemplo anterior supondo válidos os métodos de


teoria das grandes amostras.

b) Compare os resultados dos dois métodos.

Resolução.
a) Utilizando a teoria das grandes amostras, os limites de con-
fiança de 95% são
σ 0,15
X ± 1,96 = 11, 0 ± 1,96
n 10
= 11,0 ± 0,093 ,

221
onde tomamos o desvio padrão amostral de 0,15 como estimati-
va de σ . Analogamente, os limites de confiança de 99% são
0,15
11,0 ± 2,58 = 11,0 ± 0,122
10
⇒ 10,878 e 11,122 .

b) Em cada caso, os intervalos obtidos pelos métodos das pe-


quenas amostras são mais amplos do que os obtidos pela teo-
ria das grandes amostras, o que já era de esperar, uma vez que
há menos precisão quando lidamos com pequenas amostras.

7.6 Estimativa por Intervalo de Confiança para


Proporções
Seja estatística S a proporção de “sucesso” em uma amostra de
tamanho n ≥ 30 extraída de uma população binomial em que p é
a proporção de sucessos (isto é, a probabilidade de sucesso). Então,
os limites de confiança para p são dados por P ± zc σ p , onde P
denota a proporção de sucessos na amostra de tamanho n . Usan-
do os valores de σ p obtidos no Capítulo anterior, vemos que os li-
mites de confiança para a proporção da população são dados por

pq p (1 − p )
P ± zc = P ± zc ,
n n
no caso de amostragem de uma população infinita, ou amostra-
gem com reposição de uma população finita. Analogamente, os
limites de confiança são

pq N −n
P ± zc
n N −1
se a amostragem é sem reposição, de uma população finita de
tamanho N . Nota-se que tais resultados se obtêm de (1) e (2 )
substituindo X por P e σ por pq .

Em resumo, temos:

• Proporção ⇒ percentagem

Ocorre sob forma de perguntas sobre percentagem, sobre propor-


ções, sobre probabilidade de pessoas num grupo, etc.

222
x
• p= , onde
n
x – no de elementos da proporção;
n – tamanho da amostra.

• Estimação pontual de p : x ;
n
⎛ x ⎞ ⎡ ⎛ x ⎞⎤
⎜ ⎟ ⎢1 − ⎜ ⎟ ⎥
• Estimação intervalar de p : x ± z ⋅ ⎝ n ⎠ ⎣ ⎝ n ⎠ ⎦ ;
n n

n
• População Finita: > 5% ⇒ F.C.F.;
N
⎛ x ⎞ ⎡ ⎛ x ⎞⎤
⎜ n ⎟ ⎢1 − ⎜ n ⎟ ⎥
⎝ ⎠ ⎣ ⎝ ⎠⎦
• Erro de Estimação: e = z ⋅ ;
n

⎛ x ⎞ ⎡ ⎛ x ⎞⎤
⎜ n ⎟ ⎢1 − ⎜ n ⎟ ⎥
⎝ ⎠ ⎣ ⎝ ⎠⎦
• Tamanho da Amostra: n = z 2 ⋅ .
e2

Exemplo 7.12. Qual o tamanho da amostra necessária para obter


um intervalo de 95% de confiança para a proporção populacional,
se o erro tolerável é de 0,08?

x
Resolução. Dados: IC = 95% ⇒ z = 1,96 , e = 0,08 , p = = 0,5 .
n
Cálculos:
⎧ 0,5(1,0 − 0,5) ⎫
n = (1,96) 2 ⎨ 2 ⎬ = 150,0625 ⇒ n = 151 .
⎩ (0,08) ⎭
Exemplo 7.13. Uma amostra aleatória de 100 eleitores de certo dis-
trito eleitoral dá 55% como favoráveis a determinado candidato.
Determine os limites de confianças para a proporção global de
eleitores favoráveis ao candidato

a) na base de 95%;

b) na base de 99%;

c) na base de 99,73%.

223
Resolução:

a) Os limites de confiança para a população são

p (1 − p )
P ± 1,96 σ p = P ± 1,96
n

= 0,55 ± 1,96
(0,55)(0, 45)
100
= 0,55 ± 0,10
⇒ 0, 45 a 0,65 ,

onde tomamos a proporção amostral 0,55 como estimativa de p .

c) Os limites de confiança de 99% para p são

0,55 ± 2,58
(0,55)(0, 45) = 0,55 ± 0,15
100
⇒ 0, 40 a 0,70 .

Exemplo 7.14. Em 40 jogadas de uma moeda, apareceram 24 “ca-


ras”. Determine os limites de confiança

a) de 95%

b) de 99,73%

para a proporção de “caras” em uma seqüência ilimitada de jogadas.

Resolução:

24
a) Para 95%, zc = 1,96 . Levando os valores P = = 0,6 e
40
n = 40 na fórmula

P (− p )
p = P ± zc
n
= 0,6 ± 1,96
(0,6 )(0, 4 )
40
= 0,6 ± 0,15 ,

tem-se o intervalo de 0,37 a 0,83.

224
Exercícios Propostos
1)Considerando-se que uma amostra de 100 elementos extraída
de uma população aproximadamente normal, cujo desvio padrão
é igual a 2,0, forneceu uma média = 35,6 , construir um intervalo
de 95% de confiança para a média população.

Resposta: 35,208; 35,992.

2)Feito um ensaio de corrosão com 64 peças de um lote de produ-


ção, verificou-se que o tempo que a peça suportou nesse teste apre-
sentou uma média X = 200 horas. Calcular um intervalo de 95% de
confiança para a verdadeira média, sabendo-se que o=16 horas.

Resposta: 196,08; 203,92.

3)Suponha que o desvio padrão da vida útil de uma determi-


nada marca de tubo de imagem de TV seja conhecido e igual a =
500, mas que a média da vida útil é desconhecida. Supõe-se que
a vida útil dos tubos de imagem tenha uma distribuição aproxi-
madamente normal. Para uma amostra de n = 15, a média da vida
útil é X = 8900 horas de operação. Construir intervalo de confian-
ça de 90% para estimar a média populacional.

Resposta: 8687; 9113.

4)Uma amostra aleatória de uma população normal com vari-


ância populacional igual a 1,96 forneceu: 25,2, 26, 26,4 27,1, 28,2,
28,4. Obtenha estimativas por ponto e por intervalo da verdadeira
média, com confiança de 95% e 90%.

Resposta: 25,76; 28 e 25,94; 27,82.

5)Sabe-se que os comprimentos das barras produzidas por uma


siderúrgica têm uma distribuição normal de variância 1,69 m.
Numa amostra de 5 barras encontraram-se: 20,1, 21, 21,4, 22,1, 23,3
m. Determinar o erro máximo provável para a média, com:

225
a) = 0,10,

b) = 0,06.

Resposta: a) 0,96; b)1,09.

6)A distribuição dos números de parafusos produzidos por cer-


ta máquina é normal, com desvio padrão igual a 0,17 mm. Uma
amostra de seis parafusos retirada ao acaso da produção apre-
sentou os seguintes diâmetros (em mm): 25, 4 25,2 25,6 25,3 25
25,4. Calcular o erro máximo provável para intervalos de 90%,
95% e 98,74% para o diâmetro médio da produção da máquina.

Resposta: 0,11, 0,14 e 0,17.

7)Um comprador potencial deseja estimar o valor médio das


compras por cliente em uma loja de brinquedos em um aeropor-
to. Com base em dados de outros aeroportos similares, o desvio
padrão de tais valores de vendas é estimado em cerca de o = $
0,88. Qual o tamanho mínimo que deveria ter uma amostra alea-
tória se ele deseja estimar a média das vendas dentro de $ 0,15 e
com uma confiança de 99%?

Resposta: 69.

8)Dados X = 500 , s = 16 e n = 25 , determinar o intervalo de


confiança de 98% para a média populacional.

Resposta: 492,03; 507,97.

9)Uma amostra é composta pelos seguintes elementos: 7, 7, 8, 9,


9, 9, 10, 11, 11, 11, 12, 13, 13, 14, 15, 15. Pede-se construir o intervalo
de confiança para:

a) a média real, com confiança de 98%.

b) a proporção real de valores inferiores a 9, com significância


de 20%.

Resposta: a) 9,17; 12,59; b) 6,25%; 31,25%.

226
10)Determinar um intervalo de 95% de confiança para estas
duas situações:

a) X = 15,0 , s = 2,0 , n = 16 , N = 200 .


b) X = 15,0 , s = 2,0 , n = 100 , N = 1000 .

Resposta: a) 13,98; 16,02; b) 14,63; 15,37.

11)Determinar um intervalo de 98% de confiança para a verda-


deira proporção populacional, se X = 15 e n = 200 .

Resposta:0,18; 0,32.

227
Resumo
Este capítulo está dedicado para assuntos relacionados com esti-
mação. Explicamos o que é intervalo de confiança e abordamos
esse assunto para média de uma população. Também explicamos
como calcular o erro da estimação e o tamanho da amostra. No
caso de desvio padrão populacional desconhecido, explicamos
como utilizar a destituição t de studant.

228
Referências

BARBETTA, Pedro Alberto. Estatística aplicada às Ciências Sociais, 5.


ed., Florianópolis: UFSC 2002.

BRASIL, SECRETARIA DE EDUCAÇÃO FUNDAMENTAL.


Parâmetros Curriculares Nacionais: Matemática (1o e 2o ciclos do Ensino
Fundamental). Brasília: SEF/MEC, 1997.

BRASIL, SECRETARIA DE EDUCAÇÃO FUNDAMENTAL.


Parâmetros Curriculares Nacionais: Matemática (3o e 4o ciclos do
Ensino Fundamental). Brasília: SEF/MEC, 1998.

BUSSAB, Wilton de O; MORETTIN, Pedro. A. Estatística Básica. 5. ed.


São Paulo: Saraiva, 2004.

CRESPO, A. Arnot. Estatística Fácil . 7. ed. São Paulo: Saraiva, 1990.

FONSECA, Jairo Simom da e MARTINS, Gilberto de Andrade. Curso


de Estatística. 3. ed. São Paulo: Atlas, 1982.

KAZMIER, L.J.; Estatística Aplicada a Economia e Administração,


McGraw-Hill, 1982.

LEVINE, D. M, BERENSON, M. L. STEPHAN, D. Estatística: Teoria e


Aplicações – Usando Microsoft Excel em Português. Rio de Janeiro:
LTC, 2000.

MORETTIN, P.A.; BUSSAB W.O. , Estatística Básica. Atual Editora, 1984.


Vol. 3

PEREIRA, Alexandre. SPSS Guia Prático de Utilização Análise de


Dados para Ciências Sociais e Psicologia. Lisboa: Edições Sílabo, 1999.

LOPES, Celi Aparecida Espasandin. A Probabilidade e a Estatística no


Ensino Fundamental: uma análise curricular. Campinas: Faculdade
de Educação da UNICAMP, 1998. 125p. (Dissertação, Mestrado em
Educação).

SAMUEL, B. GREEN, Neil J. SALKIND, Theresa M. Akey - Using SPSS


for Windows - Analyzing and Understanding Data, Prentice Hall

SOARES, J.F; FARIAS, A.A. E CESAR, C.C. Introdução à Estatística. Rio


de Janeiro: LTC, 1991.

229
SPIEGEL, M.R. Probabilidade e Estatística. São Paulo: McGraw
Hill,1997

STEVENSON, W.J. Estatística Aplicada a Administração. São Paulo :


Harbra, 1981.

VINACUA, B. Visauta – Análisis estadístico con SPSS para WINDOWS,


McGraw-Hill/Interamericana de Espana, 1997

Sites na Internet
http://www.estatisticaaplicada.oi.com.br/aulas.html

http://www.dmat.ubi.pt/~jgama/Ficheiros/Apontamentos.pdf

http://www.vademecum.com.br/iatros/estdiscritiva.htm

http://alea-estp.ine.pt/ingles/html/glossar/html/glossar.html#h
(Glossário)

http://www.socio-estatistica.com.br/Edestatistica/glossario.htm

http://www.ibge.gov.br/

http://www.ibope.com.br

http://www.dme.im.ufrj.br/divulgacao.ppt#22

Você também pode gostar