Full Text

capa_curvas.
pdf 1 19/07/12 10:57
CM
MY
CY
CMY
K
Universidade do Sul de Santa Catarina
Probabilidade e Estatística
Disciplina na modalidade a distância
Palhoça
UnisulVirtual
2011
probabilidade_e_estatistica_1582.indb 1 19/07/12 11:11

Créditos
Universidade do Sul de Santa Catarina | Campus UnisulVirtual | Educação Superior a Distância
Avenida dos Lagos, 41 – Cidade Universitária Pedra Branca | Palhoça – SC | 88137-900 | Fone/fax: (48) 3279-1242 e 3279-1271 | E-mail: cursovirtual@unisul.br | Site: www.unisul.br/unisulvirtual
Reitor Coordenadores Graduação Marilene de Fátima Capeleto Patrícia de Souza Amorim Karine Augusta Zanoni
Ailton Nazareno Soares Aloísio José Rodrigues Patricia A. Pereira de Carvalho Poliana Simao Marcia Luz de Oliveira
Ana Luísa Mülbert Paulo Lisboa Cordeiro Schenon Souza Preto Mayara Pereira Rosa
Vice-Reitor Ana Paula R.Pacheco Paulo Mauricio Silveira Bubalo Luciana Tomadão Borguetti
Sebastião Salésio Heerdt Artur Beck Neto Rosângela Mara Siegel Gerência de Desenho e
Bernardino José da Silva Simone Torres de Oliveira Desenvolvimento de Materiais Assuntos Jurídicos
Chefe de Gabinete da Reitoria Charles Odair Cesconetto da Silva Vanessa Pereira Santos Metzker Didáticos Bruno Lucion Roso
Willian Corrêa Máximo Dilsa Mondardo Vanilda Liordina Heerdt Márcia Loch (Gerente) Sheila Cristina Martins
Diva Marília Flemming Marketing Estratégico
Pró-Reitor de Ensino e Horácio Dutra Mello Gestão Documental Desenho Educacional
Lamuniê Souza (Coord.) Cristina Klipp de Oliveira (Coord. Grad./DAD) Rafael Bavaresco Bongiolo
Pró-Reitor de Pesquisa, Itamar Pedro Bevilaqua
Pós-Graduação e Inovação Jairo Afonso Henkes Clair Maria Cardoso Roseli A. Rocha Moterle (Coord. Pós/Ext.) Portal e Comunicação
Daniel Lucas de Medeiros Aline Cassol Daga Catia Melissa Silveira Rodrigues
Mauri Luiz Heerdt Janaína Baeta Neves
Aline Pimentel
Jorge Alexandre Nogared Cardoso Jaliza Thizon de Bona Andreia Drewes
Pró-Reitora de Administração José Carlos da Silva Junior Guilherme Henrique Koerich Carmelita Schulze Luiz Felipe Buchmann Figueiredo
Acadêmica José Gabriel da Silva Josiane Leal Daniela Siqueira de Menezes Rafael Pessi
Marília Locks Fernandes Delma Cristiane Morari
Miriam de Fátima Bora Rosa José Humberto Dias de Toledo
Eliete de Oliveira Costa
Joseane Borges de Miranda Gerência de Produção
Pró-Reitor de Desenvolvimento Luiz G. Buchmann Figueiredo Gerência Administrativa e Eloísa Machado Seemann Arthur Emmanuel F. Silveira (Gerente)
e Inovação Institucional Marciel Evangelista Catâneo Financeira Flavia Lumi Matuzawa Francini Ferreira Dias
Renato André Luz (Gerente) Geovania Japiassu Martins
Valter Alves Schmitz Neto Maria Cristina Schweitzer Veit
Ana Luise Wehrle Isabel Zoldan da Veiga Rambo Design Visual
Maria da Graça Poyer
Diretora do Campus Mauro Faccioni Filho Anderson Zandré Prudêncio João Marcos de Souza Alves Pedro Paulo Alves Teixeira (Coord.)
Universitário de Tubarão Moacir Fogaça Daniel Contessa Lisboa Leandro Romanó Bamberg Alberto Regis Elias
Milene Pacheco Kindermann Nélio Herzmann Naiara Jeremias da Rocha Lygia Pereira Alex Sandro Xavier
Onei Tadeu Dutra Rafael Bourdot Back Lis Airê Fogolari Anne Cristyne Pereira
Diretor do Campus Universitário Patrícia Fontanella Thais Helena Bonetti Luiz Henrique Milani Queriquelli Cristiano Neri Gonçalves Ribeiro
da Grande Florianópolis Roberto Iunskovski Valmir Venício Inácio Marcelo Tavares de Souza Campos Daiana Ferreira Cassanego
Hércules Nunes de Araújo Rose Clér Estivalete Beche Mariana Aparecida dos Santos Davi Pieper
Gerência de Ensino, Pesquisa e Marina Melhado Gomes da Silva Diogo Rafael da Silva
Secretária-Geral de Ensino Vice-Coordenadores Graduação Extensão Marina Cabeda Egger Moellwald Edison Rodrigo Valim
Adriana Santos Rammê Janaína Baeta Neves (Gerente) Mirian Elizabet Hahmeyer Collares Elpo Fernanda Fernandes
Solange Antunes de Souza Aracelli Araldi Pâmella Rocha Flores da Silva
Bernardino José da Silva Frederico Trilha
Diretora do Campus Catia Melissa Silveira Rodrigues Rafael da Cunha Lara Jordana Paula Schulka
Elaboração de Projeto Roberta de Fátima Martins Marcelo Neri da Silva
Universitário UnisulVirtual Horácio Dutra Mello Carolina Hoeller da Silva Boing
Jucimara Roesler Jardel Mendes Vieira Roseli Aparecida Rocha Moterle Nelson Rosa
Vanderlei Brasil Sabrina Bleicher Noemia Souza Mesquita
Joel Irineu Lohn Francielle Arruda Rampelotte
Equipe UnisulVirtual José Carlos Noronha de Oliveira Verônica Ribas Cúrcio Oberdan Porto Leal Piantino
José Gabriel da Silva Reconhecimento de Curso
José Humberto Dias de Toledo Acessibilidade Multimídia
Diretor Adjunto Maria de Fátima Martins Vanessa de Andrade Manoel (Coord.) Sérgio Giron (Coord.)
Moacir Heerdt Luciana Manfroi
Rogério Santos da Costa Extensão Letícia Regiane Da Silva Tobal Dandara Lemos Reynaldo
Secretaria Executiva e Cerimonial Rosa Beatriz Madruga Pinheiro Maria Cristina Veit (Coord.) Mariella Gloria Rodrigues Cleber Magri
Jackson Schuelter Wiggers (Coord.) Sergio Sell Vanesa Montagna Fernando Gustav Soares Lima
Marcelo Fraiberg Machado Pesquisa Josué Lange
Tatiana Lee Marques Daniela E. M. Will (Coord. PUIP, PUIC, PIBIC) Avaliação da aprendizagem
Tenille Catarina Valnei Carlos Denardin Claudia Gabriela Dreher Conferência (e-OLA)
Mauro Faccioni Filho (Coord. Nuvem)
Assessoria de Assuntos Sâmia Mônica Fortunato (Adjunta) Jaqueline Cardozo Polla Carla Fabiana Feltrin Raimundo (Coord.)
Internacionais Pós-Graduação Nágila Cristina Hinckel Bruno Augusto Zunino
Coordenadores Pós-Graduação Anelise Leal Vieira Cubas (Coord.) Sabrina Paula Soares Scaranto
Murilo Matos Mendonça Aloísio José Rodrigues Gabriel Barbosa
Anelise Leal Vieira Cubas Thayanny Aparecida B. da Conceição
Assessoria de Relação com Poder Biblioteca Produção Industrial
Público e Forças Armadas Bernardino José da Silva Salete Cecília e Souza (Coord.) Gerência de Logística Marcelo Bittencourt (Coord.)
Adenir Siqueira Viana Carmen Maria Cipriani Pandini Paula Sanhudo da Silva Jeferson Cassiano A. da Costa (Gerente)
Walter Félix Cardoso Junior Daniela Ernani Monteiro Will Marília Ignacio de Espíndola Gerência Serviço de Atenção
Giovani de Paula Renan Felipe Cascaes Logísitca de Materiais Integral ao Acadêmico
Assessoria DAD - Disciplinas a Karla Leonora Dayse Nunes Carlos Eduardo D. da Silva (Coord.) Maria Isabel Aragon (Gerente)
Distância Letícia Cristina Bizarro Barbosa Gestão Docente e Discente Abraao do Nascimento Germano Ana Paula Batista Detóni
Patrícia da Silva Meneghel (Coord.) Luiz Otávio Botelho Lento Enzo de Oliveira Moreira (Coord.) Bruna Maciel André Luiz Portes
Carlos Alberto Areias Roberto Iunskovski Fernando Sardão da Silva Carolina Dias Damasceno
Cláudia Berh V. da Silva Rodrigo Nunes Lunardelli Capacitação e Assessoria ao Fylippy Margino dos Santos Cleide Inácio Goulart Seeman
Conceição Aparecida Kindermann Rogério Santos da Costa Docente Guilherme Lentz Denise Fernandes
Luiz Fernando Meneghel Thiago Coelho Soares Alessandra de Oliveira (Assessoria) Marlon Eliseu Pereira Francielle Fernandes
Renata Souza de A. Subtil Vera Rejane Niedersberg Schuhmacher Adriana Silveira Pablo Varela da Silveira Holdrin Milet Brandão
Alexandre Wagner da Rocha Rubens Amorim
Assessoria de Inovação e Jenniffer Camargo
Gerência Administração Elaine Cristiane Surian (Capacitação) Yslann David Melo Cordeiro Jessica da Silva Bruchado
Qualidade de EAD Acadêmica Elizete De Marco
Denia Falcão de Bittencourt (Coord.) Jonatas Collaço de Souza
Angelita Marçal Flores (Gerente) Fabiana Pereira Avaliações Presenciais
Andrea Ouriques Balbinot Juliana Cardoso da Silva
Fernanda Farias Iris de Souza Barros Graciele M. Lindenmayr (Coord.)
Carmen Maria Cipriani Pandini Juliana Elen Tizian
Juliana Cardoso Esmeraldino Ana Paula de Andrade
Secretaria de Ensino a Distância Kamilla Rosa
Maria Lina Moratelli Prado Angelica Cristina Gollo
Assessoria de Tecnologia Samara Josten Flores (Secretária de Ensino) Simone Zigunovas
Mariana Souza
Osmar de Oliveira Braz Júnior (Coord.) Cristilaine Medeiros Marilene Fátima Capeleto
Giane dos Passos (Secretária Acadêmica) Daiana Cristina Bortolotti
Felipe Fernandes Adenir Soares Júnior Tutoria e Suporte Maurício dos Santos Augusto
Felipe Jacson de Freitas Delano Pinheiro Gomes Maycon de Sousa Candido
Alessandro Alves da Silva Anderson da Silveira (Núcleo Comunicação) Edson Martins Rosa Junior
Jefferson Amorin Oliveira Andréa Luci Mandira Claudia N. Nascimento (Núcleo Norte- Monique Napoli Ribeiro
Phelipe Luiz Winter da Silva Fernando Steimbach Priscilla Geovana Pagani
Cristina Mara Schauffert Nordeste)
Fernando Oliveira Santos
Priscila da Silva Djeime Sammer Bortolotti Maria Eugênia F. Celeghin (Núcleo Pólos) Sabrina Mari Kawano Gonçalves
Rodrigo Battistotti Pimpão Lisdeise Nunes Felipe Scheila Cristina Martins
Douglas Silveira Andreza Talles Cascais Marcelo Ramos
Tamara Bruna Ferreira da Silva Evilym Melo Livramento Daniela Cassol Peres Taize Muller
Marcio Ventura Tatiane Crestani Trentin
Fabiano Silva Michels Débora Cristina Silveira Osni Jose Seidler Junior
Coordenação Cursos Fabricio Botelho Espíndola Ednéia Araujo Alberto (Núcleo Sudeste) Thais Bortolotti
Coordenadores de UNA Felipe Wronski Henrique Francine Cardoso da Silva
Diva Marília Flemming Gisele Terezinha Cardoso Ferreira Janaina Conceição (Núcleo Sul) Gerência de Marketing
Marciel Evangelista Catâneo Indyanara Ramos Joice de Castro Peres Eliza B. Dallanhol Locks (Gerente)
Roberto Iunskovski Janaina Conceição Karla F. Wisniewski Desengrini
Jorge Luiz Vilhar Malaquias Kelin Buss Relacionamento com o Mercado
Auxiliares de Coordenação Juliana Broering Martins Liana Ferreira Alvaro José Souto
Ana Denise Goularte de Souza Luana Borges da Silva Luiz Antônio Pires
Camile Martinelli Silveira Luana Tarsila Hellmann Maria Aparecida Teixeira Relacionamento com Polos
Fabiana Lange Patricio Luíza Koing Zumblick Mayara de Oliveira Bastos Presenciais
Tânia Regina Goularte Waltemann Maria José Rossetti Michael Mattar Alex Fabiano Wehrle (Coord.)
Jeferson Pandolfo

Luiz Arthur Dornelles Júnior
Livro didático
Revisão e atualização de conteúdo

Gabriel Oscar Cremona Parma
Design instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher
2ª edição
Palhoça
UnisulVirtual
2011

Copyright © UnisulVirtual 2011
Nenhuma parte desta publicação pode ser reproduzida por qualquer meio sem a prévia autorização desta instituição.
Edição – Livro Didático

Professor Conteudista
Revisão e atualização de conteúdo

Gabriel Oscar Cremona Parma (2ª edição)
Designer Instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher (2ª edição)
Projeto Gráfico e Capa

Equipe UnisulVirtual
Diagramação
Fernanda Fernandes
Revisão
Contextuar
ISBN
978-85-7817-336-4
519.5
D75 Dornelles Júnior, Luiz Arthur
Probabilidade e estatística : livro didático / Luiz Arthur Dornelles
Júnior; revisão e atualização de conteúdo Gabriel Oscar Cremona Parma ;
design instrucional Karla Leonora Dahse Nunes, Sabrina Bleicher. – 2. ed. –
Palhoça: UnisulVirtual, 2011.
336 p. : il. ; 28 cm.
Inclui bibliografia.
ISBN 978-85-7817-336-4
1. Estatística. 2. Probabilidades. I. Parma, Gabriel Oscar Cremona. II.

Nunes, Karla Leonora Dahse. III. Bleicher, Sabrina. IV. Título.
Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul

Sumário
Apresentação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Palavras do professor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
Plano de estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
UNIDADE 1 - Introdução à Estatística. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

UNIDADE 2 - Distribuição de frequências e representação gráfica. . . . . . . 43
UNIDADE 3 - Medidas de posição e dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . 81
UNIDADE 4 - Cálculo e distribuição de probabilidades. . . . . . . . . . . . . . . . . 147
UNIDADE 5 - Amostragem e cálculo de estimativa. . . . . . . . . . . . . . . . . . . . . 205
UNIDADE 6 - Regressão linear e gráficos de controle. . . . . . . . . . . . . . . . . . . 253
Para concluir o estudo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285

Referências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Sobre os professores conteudistas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
Respostas e comentários das atividades de autoavaliação. . . . . . . . . . . . . . 291
Anexos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
Biblioteca Virtual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335

Apresentação
Este livro didático corresponde à disciplina Probabilidade e

Estatística.
O material foi elaborado visando a uma aprendizagem autônoma

e aborda conteúdos especialmente selecionados e relacionados
à sua área de formação. Ao adotar uma linguagem didática
e dialógica, objetivamos facilitar seu estudo a distância,
proporcionando condições favoráveis às múltiplas interações e a
um aprendizado contextualizado e eficaz.
Lembre-se que sua caminhada, nesta disciplina, será

acompanhada e monitorada constantemente pelo Sistema
Tutorial da UnisulVirtual, por isso a “distância” fica
caracterizada somente na modalidade de ensino que você optou
para sua formação, pois na relação de aprendizagem professores
e instituição estarão sempre conectados com você.
Então, sempre que sentir necessidade entre em contato; você tem

à disposição diversas ferramentas e canais de acesso tais como:
telefone, e-mail e o Espaço Unisul Virtual de Aprendizagem,
que é o canal mais recomendado, pois tudo o que for enviado e
recebido fica registrado para seu maior controle e comodidade.
Nossa equipe técnica e pedagógica terá o maior prazer em lhe
atender, pois sua aprendizagem é o nosso principal objetivo.
Bom estudo e sucesso!
Equipe UnisulVirtual.

Palavras do professor
Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística.
Dentro desta disciplina você irá estudar o que os profissionais

e cientistas chamam de probabilidade e estatística.
Tendo como base a matemática, esta disciplina trata da

aplicação no cotidiano, em pesquisas e avaliações. Trata
também de técnicas eficientes para organizar e analisar dados
e tomar decisões.
Não é objetivo desta disciplina formar estatísticos e, sim,

profissionais com conhecimento técnico para realizar análises
e interpretação de dados, além de ter condições de argumentar,
dar suporte e trocar ideias com outros profissionais.
Desta forma, o esperado é que ao final da disciplina você tenha

em suas mãos uma verdadeira “caixa com várias ferramentas”
para apoiar suas decisões.
Sinta-se, agora, convidado a estudar para obter todas as

“ferramentas” que lhe serão apresentadas nesta disciplina, e
cuide para ordenar as ferramentas na “caixa”, de modo a poder
fazer uso delas quando for necessário.
Bons estudos!
Professor Luiz Arthur Dornelles Júnior

Plano de estudo
O plano de estudos visa a orientá-lo no desenvolvimento da

disciplina. Ele possui elementos que o ajudarão a conhecer o
contexto da disciplina e a organizar o seu tempo de estudos.
O processo de ensino e aprendizagem na UnisulVirtual leva

em conta instrumentos que se articulam e se complementam,
portanto, a construção de competências se dá sobre a
articulação de metodologias e por meio das diversas formas de
ação/mediação.
São elementos desse processo:
o livro didático;
o Espaço UnisulVirtual de Aprendizagem (EVA);
as atividades de avaliação (a distância, presenciais e de

autoavaliação);
o Sistema Tutorial.
Ementa
Conceitos gerais de população, amostra, parâmetro, estatística,
tipos de dados, níveis de mensuração, planejamento de
experimentos. Histogramas. Medidas de locação e de
variabilidade. Boxplot. Ramo e folhas. Probabilidade e
distribuições de probabilidade. Principais distribuições
discretas. Principais distribuições contínuas. Estatísticas e
distribuições amostrais. Estimação pontual de parâmetros de
processos. Inferência estatística para uma amostra. Inferência
estatística para duas amostras. Análise de variância com um
único fator. Correlação e regressão linear. Gráficos de controle.

Objetivos
Geral
Adquirir competências para pesquisar; coletar dados, organizar
e analisá-los; e delinear conclusões, testando-as na solução de
problemas, sob o ponto de vista da estatística e da probabilidade.
Específicos
Compreender os conceitos, procedimentos e estratégias
para uma pesquisa.
Identificar ferramentas que apoiem decisões nas áreas de

conhecimento inerentes a sua profissão.
Analisar e resolver situações que envolvam coleção de

dados agrupados ou não.
Analisar e resolver situações que envolvam uma ou mais

variáveis de estudo.
Identificar ferramentas para o cálculo de estimavas para

uma ou mais variáveis.
Correlacionar duas variáveis.
Carga Horária
A carga horária total da disciplina é 60 horas-aula.
12

Conteúdo programático/objetivos
Veja, a seguir, as unidades que compõem o livro didático desta
disciplina e os seus respectivos objetivos. Estes se referem aos
resultados que você deverá alcançar ao final de uma etapa de
estudo. Os objetivos de cada unidade definem o conjunto de
conhecimentos que você deverá possuir para o desenvolvimento
de habilidades e competências necessárias à sua formação.
Unidades de estudo: 6
Unidade 1 – Introdução à Estatística

É muito importante, antes de começar a ter contato com as técnicas
estatísticas, conhecer bem os conceitos e definições de alguns termos
que serão usados dentro desta disciplina. Por isso, nesta unidade você
conhecerá alguns conceitos introdutórios da Estatística.
Unidade 2 – Distribuição de frequências e representação gráfica

De posse dos dados de forma desorganizada, um primeiro
passo seria organizá-los em tabelas para que possibilitem a
primeira análise e uma série de interpretações. Nesta unidade,
você poderá aprender como se organizam dados brutos e como
pode ser analisada a distribuição de frequências. Após aprender
como organizar os dados, você aprenderá como representá-los
graficamente. Este assunto é importante porque o seu dia a
dia está impregnado de informações representadas por gráficos
e, nesta unidade, você poderá conhecer os tipos de gráficos e
algumas dicas de como interpretá-los.
13

Unidade 3 – Medidas de posição e dispersão

Você conhecerá, nesta unidade, como calcular algumas medidas,
começando por média, mediana e moda, sendo que a medida
mais importante dentro da Estatística é a média. Verá também
outra medida importante, a de dispersão. Muitas vezes as
medidas de posição por si só não bastam para analisar uma série
de dados, então, se faz necessário trabalhar com medidas de
dispersão. Dentre as medidas de dispersão, a mais importante
delas que é o desvio padrão.
Unidade 4 – Cálculo e distribuição de probabilidades

Esta unidade é um marco que divide a Estatística em duas partes:
a estatística descritiva e estatística indutiva. Dar-se-á início ao
estudo sobre probabilidade, estimativas e cálculo do erro de
estimativa. O estudo de probabilidade é a base fundamental para
concretizar o conhecimento sobre estimativas. Além disso, você
conhecerá que o estudo de probabilidades pode ser dividido em
duas partes: probabilidade de variáveis discretas e probabilidade
de variáveis contínuas.
Unidade 5 – Amostragem e cálculo de estimativa

Tendo como base o estudo do cálculo de probabilidades, você
poderá aprender, nesta unidade, como calcular o tamanho de
uma amostra necessário para se obter um determinado erro
de estimativa, bem como, descobrir maneiras de selecionar os
elementos de uma amostra de forma que eles sejam realmente
representativos da população objeto de pesquisa.
Unidade 6 – Regressão linear e gráficos de controle

Nesta unidade, você irá estudar como analisar e comparar duas
variáveis correlacionando-as; assim como também aprenderá a
construir e trabalhar com gráfico de controle para verificar os
erros em processos de controle de qualidade, dentre outros fins.
14

Agenda de atividades/Cronograma
Verifique com atenção o EVA, organize-se para acessar

periodicamente a sala da disciplina. O sucesso nos seus
estudos depende da priorização do tempo para a leitura,
da realização de análises e sínteses do conteúdo e da
interação com os seus colegas e professor.
Não perca os prazos das atividades. Registre no espaço

a seguir as datas com base no cronograma da disciplina
disponibilizado no EVA.
Use o quadro para agendar e programar as atividades

relativas ao desenvolvimento da disciplina.
Atividades obrigatórias
Demais atividades (registro pessoal)
15

1
UNIDADE 1
Introdução à Estatística
Objetivos de aprendizagem
Identificar o processo estatístico de pesquisa.
Diferenciar censo e estimação.
Entender a importância de usar amostra estatística.
Identificar variáveis.
Identificar dados absolutos e dados relativos.
Classificar séries estatísticas.
Seções de estudo
Seção 1 Conceitos básicos da Estatística
Seção 2 Variáveis
Seção 3 Dados
Seção 4 Séries

Para início de estudo

A cada dia, nossa sociedade se torna mais complexa. Convivemos
com os indicadores econômicos, com a inflação, com a reforma
da previdência, com o controle de qualidade, enfim, nos
deparamos com situações e informações sempre mais complexas.
No que se refere à gestão das organizações, a situação não é

diferente. Para se administrar uma empresa, seja pública ou
privada, necessitamos de ferramentas para poder acompanhar a
evolução da sociedade e, assim, analisar situações e informações
bem como dar suporte às nossas decisões.
Por isso, dizemos que a Estatística é um conjunto de ferramentas

as quais, quando bem empregadas, podem ser de grande utilidade
para a gestão de empresas. Hoje em dia, sem a Estatística, não
seríamos capazes de avaliar a variação de preços, da inflação, de
consumo, nem fazer controle de qualidade, pesquisa eleitoral etc.
Nesta unidade, você irá conhecer alguns conceitos importantes

para a Estatística. Assim, conforme a metáfora utilizada, você
estará apropriando-se de mais algumas “ferramentas para colocar
na sua caixa”.
Seção 1 – Conceitos básicos da Estatística

Para conhecer Estatística, é importante que você compreenda,
antes, o significado da palavra e o seu conceito. A palavra
estatística origina-se do latim, e o seu radical status, significa
estado. Sendo assim, a palavra estatística significa “o estudo
do estado”. Para entender o conceito de “estudo do estado”,
acompanhe as seguintes definições sobre Estatística:
A Estatística é uma coleção de métodos para planejar

experimentos, obter dados e organizá-los e, deles, extrair
conclusões. (TRIOLA, 1999, p. 2).
18

A Estatística está interessada nos métodos científicos

para a coleta, organização, resumo, apresentação e análise
de dados, bem como na obtenção de conclusões válidas
e na tomada de decisões razoáveis, baseadas em tais
análises. (SPIEGEL, 1994, p. 1).
Estatística é um conjunto de métodos e processos

quantitativos que serve para estudar e medir os
fenômenos coletivos. (SILVA, 1999, p. 11).
Você percebeu que as definições se assemelham e se completam?

Então, observe, a seguir, a definição de Estatística adotada neste
estudo que agora se inicia.
A Estatística corresponde a um conjunto de métodos

científicos para a coleta, organização, apresentação
e análise de dados, bem como, para a conclusão e
tomada de decisões baseadas em tais análises.
Em termos gerais, convém destacar que a Estatística está dividida

em duas partes:
Estatística indutiva: aplicada quando é impossível

realizar levantamentos com a totalidade dos objetos
de uma pesquisa seja por tempo, ou por economia
etc., somente uma parcela destes elementos é utilizada
para realizar as observações. Partindo, neste caso, de
uma parcela destes elementos, a Estatística indutiva
tira conclusões e realiza previsões sobre elementos
em questão (método que se fundamenta na teoria da
probabilidade associado a uma margem de incerteza).
Estatística descritiva: aplicada quando você se depara

com uma quantidade muito grande de dados, e é difícil
tirar conclusões sobre o fenômeno que descrevem. A
Estatística descritiva é usada para reduzir as informações
até o ponto em que se possa interpretar tal fenômeno. O
objetivo da Estatística descritiva é observar fenômenos
de mesma natureza, coletar, organizar, classificar,
apresentar, interpretar e analisar dados referentes ao
fenômeno através de gráficos e tabelas, além de calcular
medidas que permitam descrever o fenômeno.
Unidade 1 19

Para obtenção de resultados confiáveis, que reflitam a realidade

dos fatos, é necessário realizar uma pesquisa cuidadosamente
planejada com métodos adequados.
O método é um conjunto de meios dispostos

convenientemente para se chegar a um fim que
se demarcou. O método estatístico, diante da
impossibilidade de manter as causas constantes,
admite as causas presentes, variando-as, registrando
essas variações e procurando determinar, no resultado
final, que influências cabem a cada uma delas.
Alguns passos precisam ser seguidos para que seja aplicado o

método estatístico e, assim, realizada uma boa pesquisa. Para
você entender quais são estes passos, acompanhe a seguir as
principais fases.
a) Definição do problema: a primeira fase do trabalho

estatístico consiste em uma definição ou formulação
correta do problema a ser estudado. Nesta fase, você
precisa definir:
O que será pesquisado? Definir o tema e os objetivos

de pesquisa;
Em que setor geográfico? O público-alvo a ser

planejado;
Como será a amostra? Incluir o cálculo da amostra e

as técnicas de coletas de dados.
b) Planejamento: consiste em determinar o procedimento

necessário para levantar informações sobre o assunto
objeto do estudo. Você deverá definir como serão
coletados os dados de pesquisa, já que isto pode ser feito
de várias formas.
Observação direta: caracteriza-se, quando o

pesquisador somente faz observações para coletar os
dados necessários para a pesquisa.
20

Entrevista oral: caracteriza-se por estabelecer

perguntas orais a um indivíduo ou grupo de
indivíduos. As entrevistas podem ser classificadas
em estruturadas e não estruturadas; entrevistas
estruturadas são aquelas em que o pesquisador
estabelece um roteiro prévio de perguntas. Nas
entrevistas não estruturadas, o pesquisador, por meio
de uma conversa amigável, busca levantar dados
que possam ser utilizados em análise qualitativa,
selecionando-se os aspectos mais relevantes do
problema de pesquisa. (RAUEN, 2006).
Entrevista escrita ou questionário: questionário

é uma lista de indagações escritas, as quais devem
ser respondidas pelo informante por escrito. Sua
vantagem é a possibilidade de se indagarem muitas
pessoas ao mesmo tempo. Para entrevistar uma sala
de universitários, basta distribuir as folhas, para que
todos respondam simultaneamente (entrevista de
grupo). (RAUEN, 2006). O questionário é uma forma
muito utilizada na coleta de dados, mas exige ser:
completo (responder tudo), concreto (perguntas claras
e objetivas), secreto (sem identificação) e discreto
(perguntas bem formuladas).
É preciso planejar o trabalho a ser realizado, tendo em

vista o objetivo que se pretende atingir.
c) Coleta de dados: compreende a coleta das informações

propriamente ditas. Formalmente, a coleta de dados
refere-se à obtenção, à reunião e ao registro sistemático
de dados com um objetivo determinado.
d) Apuração dos dados: consiste em reunir os dados através

de sua contagem e agrupamento.
e) Apresentação dos dados: os dados estatísticos podem ser

mais facilmente compreendidos quando apresentados por
meio de uma representação gráfica, o que permite uma
visualização instantânea de todos os dados.
Unidade 1 21

f) Análise e interpretação de dados: nesta etapa, o

interesse maior reside em tirar conclusões que auxiliam
o pesquisador a atingir seu objetivo, ou seja, encontrar a
resposta para a sua pergunta.
Todas estas fases são realizadas quando se cumpre um processo

de pesquisa. Veja a representação no esquema a seguir:
Produção
População de dados
Amostra
Estatística
Descritiva
Estudo da amostra
Características tabelas
populacionais gráficos
medidas
Estatística
Indutiva
Características
amostrais
Figura 1.1 – O processo da pesquisa estatística

Fonte: Adaptado de Ação Local de Estatística Aplicada - ALEA (1999-2010).
População e amostra
Quando você prepara um alimento, pode provar (observar)
uma pequena porção. Neste procedimento, você está fazendo o
processo de amostragem, ou seja, extraindo do todo (população)
uma parte (amostra), com o propósito de inferir (avaliar) a
qualidade de todo o alimento. A partir do exemplo, podemos
distinguir dois importantes conceitos da Estatística descritiva:
população e amostra.
População é o conjunto total de elementos com,

pelo menos, uma característica em comum, cujo
comportamento interessa estudar.
22

A definição dos elementos que serão estudados está ligada

diretamente às características levantadas no objetivo da pesquisa,
ou seja, é este objetivo que auxiliará na definição desta população.
Estes elementos podem ser:
animados: pessoas, animais etc.;
inanimados: notas fiscais, produtos industrializados etc.
Em relação ao número de elementos, a população pode ser:
finita: quando tem um número limitado de elementos

(número de funcionários de um determinado banco etc.);
infinita: quando tem um número ilimitado de elementos

(exemplo: número possível de análises químicos que
podem ser feitos em um rio poluído etc.).
A representação do tamanho da população é dada por

N = número de elementos da população.
São exemplos de definição de população:
Ao estudar a idade e sexo de funcionários da empresa A:

para definir a população, devemos considerar todos os
funcionários da empresa.
Ao estudar a qualidade de peças de uma linha de

produção da empresa A: para definir a população,
devemos considerar todas as peças produzidas pela
empresa.
Amostra é o conjunto de elementos ou observações,

recolhidos a partir de um subconjunto da população,
que se estuda com o objetivo de tirar conclusões para a
população de onde foi recolhida.
A amostra precisa ser representativa, ou seja, possuir as mesmas

características da população.
A representação do tamanho da amostra é dada por n = número

de elementos da amostra.
Unidade 1 23

Processos estatísticos de abordagem

Ao estudar um fenômeno coletivo, ou seja, um fenômeno que se
refere a uma determinada população, compreendendo um grande
número de elementos, coisas e indivíduos, podemos optar entre
os seguintes processos estatísticos:
Censo: é uma coleção de dados relativos a todos os

elementos de uma população; uma avaliação direta de
O censo era considerado uma
pesquisa desatualizada pela demora
um parâmetro que utiliza todos os componentes da
da publicação dos dados, mas a população. No Brasil, por exemplo, o censo é feito de dez
tecnologia veio para diminuir em em dez anos, momento em que são pesquisados todos os
muito esse tempo de publicação. No domicílios brasileiros.
ano de 2010, constatamos que os
dados foram publicados com mais Principais propriedades do censo:
rapidez que nas décadas anteriores.
Acesse o site do Instituto Brasileiro »» admite erro processual zero e tem confiabilidade 100%;
de Geografia e Estatística (IBGE) e
consulte informações da sua cidade »» é caro e lento;
e do seu estado.
»» quase sempre desatualizado;
»» nem sempre é viável.
Parâmetro: usado para designar alguma característica

descritiva dos elementos da população (percentagem,
média etc.).
Estimação: é uma avaliação indireta de um parâmetro

com base em um estimador, através do cálculo de
probabilidades. Nesse caso, utiliza-se uma amostra.
Principais propriedades da estimação:
»» admite erro processual positivo e tem confiabilidade

menor que 100%;
»» é barata e rápida;
»» é atualizada;
»» é sempre viável.
24

Estimativa: é o valor assumido por certa estatística

(exemplo: 60% é o valor de estimativa do referido
parâmetro).
Amostragem
Como já foi exposto nesta unidade, as pesquisas são realizadas
por meio de estudo dos elementos que compõem uma amostra
extraída da população que se pretende analisar. O conceito de
população é intuitivo. Trata-se do conjunto de indivíduos ou
objetos que apresentam, em comum, determinadas características
definidas para o estudo. Amostra é um subconjunto da
população. O estudo de todos os elementos da população
possibilita conhecimento preciso das variáveis que estão sendo
pesquisadas; todavia nem sempre é possível obter as informações
de todos os elementos da população.
Limitações de tempo, custo e as vantagens do uso das

técnicas estatísticas justificam o uso de planos amostrais. A
representatividade da amostra dependerá do seu tamanho (quanto
maior, melhor). O investigador procurará acercar-se de cuidados,
visando à obtenção de uma amostra significativa, ou seja, que
de fato represente toda a população da melhor maneira possível.
(FONSECA, 1996).
Observe, a seguir, mais alguns conceitos do processo estatístico,

relacionados à amostragem:
Estatística: característica descritiva dos elementos da

amostra (percentagem, média etc.).
Erro amostral: é a máxima diferença que o investigador/

pesquisador admite entre a média da população e a
média da amostra. Em pesquisa, admite-se o uso do
erro amostral entre 2% a 7%. Observe, por exemplo, as
pesquisas eleitorais, a grande maioria destas pesquisas
é efetuada com erro amostral de 2%. Isto significa que
pode variar de −2% a +2%. Quando se diz que dois
candidatos estão com empate técnico, isso quer dizer que,
somando ou diminuindo 2%, estão empatados.
Unidade 1 25

O candidato A está com 48% da preferência dos votos,

e o candidato B está com 52% da preferência dos votos.
O candidato A tem 48%; diminuindo os 2% = 46; com
48% mais 2% = 50%. Já, o candidato B tem 52% menos
2% = 50%; com 52% + 2% = 54%. Logo, os candidatos
estão empatados tecnicamente, com 50% cada.
Nível de confiança: é expressa em percentual e representa

quantas vezes o percentual real da população encontra-se
dentro do intervalo de confiança. O nível de confiança de
95% significa que você tem 95% de certeza. A maioria dos
pesquisadores usa o nível de confiança de 95%.
Como podemos ver, o uso da amostragem é vantajoso por trazer:
economia: é mais econômico o levantamento de somente

uma parte da população, muitas vezes pelo custo do
próprio levantamento e também por não ser mais possível
recuperar elementos da população;
tempo: em pouco tempo, pode-se pesquisar uma

amostra, ao contrário de uma população;
confiabilidade: quando se pesquisa um número menor

de elementos, pode-se dar mais atenção, evitando erros
nas respostas.
– Até aqui, vimos alguns conceitos básicos de estatística. Mas, entre

os conceitos fundamentais da Estatística, é importante distinguir
variáveis estatísticas de dados estatísticos. Estes assuntos serão
tratados na próxima seção. Vamos adiante... Bons Estudos!
26

Seção 2 – Variáveis
Variáveis são conjuntos de características que podem ser
observadas e/ou medidas em cada elemento da população ou
amostra, sob as mesmas condições.
Ao analisar uma determinada experiência, um fato ou um

elemento, você pode verificar que todos eles assumem diferentes
características ou valores.
Ao analisar um determinado setor de uma empresa,

você pode verificar, entre seus funcionários, algumas
características como sexo, idade, salário, assiduidade etc.
Estas características variam de elemento para elemento, por isto

são chamadas de variáveis.
As variáveis são classificadas em dois tipos:
Qualitativas: representam a informação que identifica

alguma qualidade, categoria ou característica,
não suscetível de medida (não numérica), mas de
classificação, assumindo várias modalidades.
Estado civil: casado, solteiro, viúvo, divorciado.

Sexo: masculino e feminino.
Escolaridade: 1º grau, 2º grau, 3º grau.
As variáveis qualitativas estão divididas em:
Nominais: são dados caracterizados por rótulos ou

categorias. Por exemplo, sexo, estado civil, cor dos olhos etc.;
Ordinais: são dados caracterizados por uma ordem,

mas não podem ser diferenciados por valor numérico.
Por exemplo: nível de escolaridade (1º, 2º e 3º graus),
intensidade da luz (muito forte, forte, média, suave,
muito suave).
Unidade 1 27

Quantitativas: representam a informação resultante

de características suscetíveis de serem medidas,
apresentam-se com diferentes intensidades.
Idade: 19 anos, 20 anos, 35 anos.

Número de nascidos vivos: 10, 15, 22, 12, 14.
Peso: 55 kg, 66 kg, 71 kg.
As variáveis quantitativas estão divididas em:
Variáveis discretas: se ela pode assumir um conjunto

constante discreto, ou seja, enumerável, finito de valores.
Geralmente são expressas por valores inteiros não
negativos. Por exemplo: número de pessoas do setor,
quantidade de notas fiscais (observação: não se pode
considerar meia nota fiscal ou meia pessoa).
Variáveis contínuas: são as variáveis em que não

conseguimos enumerar seus possíveis resultados, por estes
formarem um conjunto infinito de valores, num intervalo
de números reais. Por exemplo: peso, altura, temperatura.
Diferença entre as variáveis discreta e contínua

Você, à noite, ao ir deitar, tem 1,65m e desperta
pela manhã com 1,70m. Você cresce 5cm de forma
instantânea? Não, você cresce aos poucos e, entre
1,65 e 1,70, você tem infinitas alturas. Para a variável
discreta, observamos que não é possível aumentar o
número de pessoas de 22 para 22,57. Não podemos
aumentar em 0,57 pessoa. Só podemos aumentar em
uma unidade.
28

Seção 3 – Dados
Dados estatísticos são medidas da presença de um determinado
conjunto de valores de uma variável numa população ou amostra.
Os tipos de dados estatísticos são:
dados primários: quando são observados e/ou

levantados pelo próprio pesquisador ou organização que
os tenha recolhido;
dados secundários: quando são observados e/ou

levantados por outra organização ou pesquisador.
Além desta classificação, os dados também pode ser absolutos

e relativos. Nesta seção, vamos aprender a transformar dados
absolutos em dados relativos, mas, antes disso, vamos conhecer
suas definições.
Dados absolutos são dados estatísticos resultantes da

coleta direta da fonte, sem outra manipulação a não ser
a contagem ou medida. A leitura dos dados absolutos é
sempre enfadonha e inexpressiva. Embora esses dados
traduzam um resultado exato e fiel, não têm a virtude de
ressaltar de imediato as suas conclusões numéricas.
Daí o uso imprescindível que faz a Estatística dos dados

relativos. O número de vezes que um valor da variável de
uma pesquisa é citado representa a frequência absoluta
daquele valor.
Dados relativos são o resultado de comparações por

quociente (razões) que se estabelecem entre dados
absolutos e têm por finalidade realçar ou facilitar as
comparações entre quantidades. Traduzem-se os dados
relativos, em geral, por meio de:
percentagens;
coeficientes;
taxas;
índices.
Unidade 1 29

A frequência relativa é o quociente entre a frequência absoluta de

uma variável e o total de citações de todas as variáveis da pesquisa.
Percentagens e proporções
Permitem padronizar distribuições de frequência quanto ao
tamanho, ou seja, comparam grupos de diferentes frequências totais.
Na proporção (P), compara-se o número de sujeitos de uma dada

categoria (F) com o número total de sujeitos (N).
Num grupo de 20 alunos, 10 gostam de futebol. Assim,

a proporção será dada por:
Logo, a proporção é de 0,50, ou seja, de cada dois

indivíduos um gosta de futebol.
Em percentagem, entretanto, podemos multiplicar esta

proporção por 100, obtendo, assim, a porcentagem ou
percentagem.
Então, de acordo com o exemplo dado, temos:
(Porcentagem)
Portanto, de cada 100 alunos, 50 gostam de futebol.
No próximo exemplo, consideremos a tabela a seguir:
30

Tabela 1.1 – Área territorial brasileira por região – 2010
Região Área territorial em km2

Centro-Oeste 1.606.371
Nordeste 1.554.257
Norte 3.853.327
Sudeste 924.511
Sul 576.409
Total 8.514.875
Fonte: IBGE (2010).
Nesse caso, vamos identificar qual percentual do território

nacional cada região ocupa em relação ao total. Para isso,
precisamos dividir a área territorial de cada região pela área total
e multiplicar por 100.
Calculemos as percentagens de cada região:
Centro-Oeste = 1.606.371 ÷ 8.514.875 = 0,1886 × 100 = 18,87%
Nordeste = 1.554.257 ÷ 8.514.875 = 0,1825 × 100 = 18,25%
Norte = 3.853.327 ÷ 8.514.875 = 0,4525 × 100 = 45,25%
Sudeste = 924.511 ÷ 8514.875 = 0,1086 × 100 = 10,86%
Sul = 576.409 ÷ 8.514.409 = 0,06769 × 100 = 6,77%
Agora, vamos acrescentar na tabela uma coluna com os

percentuais.
Unidade 1 31

Tabela 1.2 – Área territorial brasileira por região – 2010
Região Área territorial em km2 Percentual (%)

Centro-Oeste 1.606.371 18,87
Nordeste 1.554.257 18,25
Norte 3.853.327 45,25
Sudeste 924.511 10,86
Sul 576.409 6,77
Total 8.514.875 100,0
Fonte: IBGE (2010).
Observe que, no resultado do cálculo do percentual,

foram aplicadas regras de arredondamento.
Considerando que cada região representa uma
proporção do todo, o total precisa fechar com 100%.
Nesse exemplo, os dados referentes à área territorial são dados

secundários e absolutos. Secundários porque não foram pesquisados
por nós, e sim pelo IBGE; e absolutos porque estão na tabela como
foram coletados. Já no percentual, os dados são relativos porque
sofreram transformações: são dados de comparações.
Coeficientes e taxas
São razões que comparam o número de ocorrências de certo evento
com ele mesmo, acrescido das não ocorrências (mas que poderiam
ter ocorrido); e a razão entre variáveis da mesma espécie.
Coeficientes
São razões entre o número de ocorrências e o número total (que

é o número de ocorrências e não ocorrências). Os coeficientes são
multiplicados por 100, para transformá-los em taxa.
32

Número de nascimentos
Coeficiente de natalidade =
População total
Número de óbitos
Coeficiente de mortalidade infantil =
Número de nascimento total
Taxas
São os coeficientes multiplicados por 100 ou 1.000. As taxas de

mortalidade infantil e de natalidade são multiplicadas por 1.000,
por serem números muito pequenos.
A taxa nacional de mortalidade infantil do Brasil,

segundo o IBGE – dados de 2007 –, é de 19,3 por mil
nascimentos.
Índices
São métodos que comparam duas grandezas distintas, ou seja,

uma não inclui a outra.
População
Densidade demográfica =
Superfície
Número de alunos
Densidade aluno/professor =
Número de professores
Número de alunos
Densidade aluno/ sala de aula =
Número de sala de aula
Unidade 1 33

Índices econômicos
Valor total da produção

Produção per capita =
População
Consumo de bem
Consumo per capita =
População
Renda
Renda per capita =
População
– Você pôde conhecer, nas duas últimas seções, as definições e diferen‑

ças das variáveis e dos dados estatísticos. Na próxima seção, serão
apresentadas séries estatísticas... Bons estudos!
Seção 4 – Séries
Série estatística define-se como toda e qualquer coleção de
dados estatísticos referidos a uma mesma ordem de classificação.
Quantitativa em seu sentido mais amplo, o termo série refere-se a
uma sucessão de números referidos a qualquer variável.
Os resultados estatísticos são apresentados em quadros ou

tabelas para maior clareza, objetividade e melhor visão do
conjunto, oferecendo, assim, vantagens para uma análise
Tabela é a organização racional
e prática de apresentação dos
matemática das mesmas.
dados estatísticos e a sintetização
dos dados no mínimo espaço para
colocar o máximo de informações. A série estatística pode ser definida, portanto, como
qualquer tabela que apresente a distribuição de um
conjunto de dados estatísticos.
34

Tipos de séries
Para diferenciar uma série estatística de outra, há que levar em
conta três caracteres presentes na tabela que se apresenta:
época: fator temporal ou cronológico a que se refere o

fenômeno analisado;
local: fator geográfico onde o fenômeno acontece;
fenômeno: espécie ou fato ou fator específico que é

descrito.
Conforme a variação dos elementos da série, é possível classificá-

las em temporal, geográfica específica e conjugada.
a) Série temporal: identifica-se por descrever a variável

no decorrer de um determinado período de tempo. Esta
série também é chamada de histórica ou evolutiva.
Observe a tabela que registra os nascidos vivos
registrados segundo o ano do registro no Brasil.
Tabela 1.3 – Nascidos vivos registrados segundo o ano do registro no Brasil
Anos Nº de nascidos
1984 2.559.038
1985 2.619.604
1986 2.779.253
Fonte: IBGE (2010).
b) Série geográfica: identifica-se por descrever a variável

considerando o fator geográfico. Também é chamada de
espacial, territorial ou de localização. Observe a tabela
que registra as mulheres de dez anos ou mais de idade,
total, que tiveram filhos nascidos vivos – Censo de 2000
– segundo as Mesorregiões:
Unidade 1 35

Tabela 1.4 – Mulheres de dez anos ou mais de idade, total, tiveram filhos nascidos vivos –
Censo de 2000 - segundo as Mesorregiões
Mulheres de dez anos ou mais de idade que

Mesorregiões tiveram filhos nascidos vivos
Grande Florianópolis 211.763
Norte Catarinense 267.448
Oeste Catarinense 297.814
Serrana 106.025
Sul Catarinense 224.287
Vale do Itajaí 319.195
Fonte: IBGE (2010).
c) Série específica: o caráter variável é apenas o fato

ou espécie. Também é chamada de série categórica.
Observe a tabela que registra as pessoas de dez anos ou
mais de idade que viviam em companhia de cônjuge
ou companheiro(a), por natureza da união, segundo as
Mesorregiões – Santa Catarina – Censo de 2000.
Tabela 1.5 – Pessoas de dez anos ou mais de idade que viviam em companhia de cônjuge
ou companheiro(a), por natureza da união, segundo as Mesorregiões – Santa Catarina –
Censo de 2000
Número de pessoas de dez anos ou mais de

Natureza da união idade
Casamento civil e religioso 1.666.621
Só casamento civil 189.741
Só casamento religioso 85.543
União consensual 521.001
Fonte: IBGE (2010).
d) Séries conjugadas: também chamadas de tabelas de

dupla entrada. São apropriadas à apresentação de duas ou
mais séries de maneira conjugada, havendo duas ordens
de classificação: uma horizontal e outra vertical. Observe
a tabela a seguir, que registra a quantidade de mortes por
acidente de trânsito em São Paulo, nos anos de 1997 e 1998.
36

Tabela 1.6 – Quantidade de mortes por acidente de trânsito em São Paulo, nos anos de
1997 e 1998 (dados fictícios)
Idade 1997 1998

Até 10 anos 69 45
De 10 a 19 anos 212 165
De 20 a 49 anos 868 628
De 50 anos e mais 382 287
Idade Ignorada 51 40
Fonte: Elaboração do autor (2006).
As séries conjugadas ainda podem ser geográfico-

temporal e geográfico-específica.
Síntese
Nesta unidade, você estudou conceitos básicos e introdutórios da

Estatística. Também conheceu quais são as etapas do processo de
uma pesquisa para que se possa alcançar um resultado fiel, que
traduza a realidade.
Você pôde estudar alguns conceitos importantes como

população e amostra, variáveis, dados e séries. Todos estes novos
conhecimentos serão muito importantes para você dar sequência
ao estudo da Estatística.
Unidade 1 37

Atividades de autoavaliação
Ao final de cada unidade, você realizará atividades de autoavaliação. O

gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.
1) Analise os conceitos de censo e estimação e descreva a principal

diferença entre os termos.
2) Ao escolher os elementos de uma amostra, o que você deve considerar

para que ela seja representativa? Por quê?
38

3) Como você pôde acompanhar, existem dois tipos de variáveis: a

qualitativa, que está dividida em nominal e ordinária, e a quantitativa,
que está dividida em contínua e discreta. Identifique, no seu dia a dia,
pelo menos um exemplo de cada uma destas variáveis e as escreva no
quadro a seguir:
Variável Exemplo
Qualitativa nominal
Qualitativa ordinal
Quantitativa discreta
Quantitativa contínua
4) Ao planejar uma pesquisa sobre uma determinada síndrome, um

pesquisador tem a intenção de usar um questionário para a coleta de
dados e, também, planeja fazer levantamento de dados no Ministério
da Saúde, para que possa realizar comparativos. Como consequência
disto, ele terá que trabalhar com dois tipos de dados: os resultantes
dos questionários e os resultantes do levantamento no Ministério.
Classifique os dois tipos de dados.
a) Os dados coletados por meio de questionário são: ________________
b) Os dados coletados no Ministério:_____________________________
Unidade 1 39

5) Classifique cada uma das variáveis a seguir em qualitativa nominal ou

ordinal e em quantitativa discreta ou contínua:
Descrição da variável Classificação
Saldo em conta corrente em R$
Idade do cliente
Sexo do cliente
Classe econômica
Estado civil
Número de defeitos do produto
Consumo de energia em kWh
Grau de instrução
Número de filhos
Hierarquia de uma empresa
Número de filhos de uma família
Diâmetro da peça produzida
Comprimento da peça
Tempo de espera em caixa eletrônico

em minutos
Nome de país exportador de petróleo
Grau de satisfação no atendimento

numa loja comercial
Número de ações negociadas na
bolsa de valores
Número de alunos de uma
universidade
Altura dos funcionários de uma
empresa
40

6) Observe as duas tabelas a seguir e classifique as séries estatísticas de

cada uma delas.
Tabela A – Pessoas de dez anos ou mais de idade, por estado civil e condição de
convivência – Santa Catarina – Censo de 2000
Desquitado(a)
Estado civil Casado(a) ou separado(a) Divorciado(a) Viúvo(a) Solteiro(a)
judicialmente
Mesorregiões
Grande Florianópolis 267.867 18.697 16.779 28.224 333.974
Norte Catarinense 380.222 21.098 13.630 38.037 379.194
Oeste Catarinense 439.967 16.130 9.174 38.856 399.587
Serrana 142.373 6.738 4.814 15.834 150.964
Sul Catarinense 314.348 14.021 12.068 32.261 302.894
Vale do Itajaí 443.839 25.825 20.433 46.595 439.800
Fonte: IBGE (2010).
Tabela B – Metabolismo basal (cal/dia) em adolescentes (dados fictícios)

Metabolismo basal (cal/dia) Número de adolescentes
910 |-- 989 3
989 |-- 1068 5
1068 |-- 1147 9
1147 |-- 1226 5
1226 |-- 1305 8
1305 |-- 1384 3
1384 |-- 1463 2
41

Saiba mais
Se você desejar, aprofunde os conteúdos estudados nesta unidade

ao consultar as seguintes referências:
CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo:

Saraiva, 2009.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade.

Curso de estatística. 6. ed. São Paulo: Atlas, 1996.
RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era,

2006.
SILVA, Ermes Medeiros da. Estatística para os cursos de

economia, administração e ciências contábeis. 3. ed. São Paulo:
Atlas, 1996. v. 1.
TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de

Janeiro: LTC, 1999.
42

2
UNIDADE 2
Distribuição de frequências e
representação gráfica
Organizar dados brutos de acordo com os tipos de
variáveis.
Compreender, organizar e analisar a distribuição de

frequência.
Montar tabelas de distribuição de frequência para

variáveis qualitativas e quantitativas.
Analisar e interpretar gráficos.
Seções de estudo
Seção 1 Representação numérica
Seção 2 Tipos de frequência
Seção 3 Representação gráfica


Nesta unidade, você vai trabalhar com a organização dos dados
estatísticos propriamente ditos.
De posse dos dados de forma desorganizada, um primeiro passo

seria organizá-los em tabelas para que possibilite uma primeira
análise, além de servir para uma série de interpretações. Você
poderá aprender como se organizam dados brutos e como pode
ser analisada a distribuição de frequências.
Você também terá a oportunidade de adquirir mais uma

importante ferramenta para utilizar na análise e interpretação de
dados: a representação gráfica. Você irá conhecer alguns tipos de
representação gráfica mais utilizados e suas características.
Poderá constatar que os dados representados por meio de

gráficos, muitas vezes, facilitam a leitura e a compreensão de
algum fenômeno ou acontecimento.
Seção 1 – Representação numérica

Para iniciar o estudo desta unidade, antes de qualquer coisa, você
precisa saber o que são dados brutos e dados agrupados.
Dados brutos
Dados brutos são sequências de valores numéricos

ou não, os quais não sofreram qualquer tratamento
estatístico, nem foram organizados, obtidos
diretamente da observação de um fenômeno.
44

Mais precisamente, dados brutos são os dados apresentados

da forma como foram coletados na pesquisa ou levantamento,
desorganizados, sem ordenação.
Acompanhe os exemplos de levantamento de dados de acordo

com o tipo de variável: qualitativa, quantitativa discreta ou
quantitativa contínua.
Para uma variável qualitativa

Em um levantamento realizado com 56 clientes de um banco,
foram obtidos os seguintes dados sobre o tipo de investimento em
que mais confiavam, conforme legenda:
I M R P I I P R
P R I P P I R I
P P P M I P P P
M P I I I M P R
M R R P M M P R
I R M P P I R P
M P I P P M P I
Quadro 2.1 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
Legenda do quadro:
I – Investimentos imobiliários
M – Investimento em mercado de ações
P – Investimento em poupança
R – Investimento em fundos de renda fixa
Repare que, neste caso, foram pesquisados 56 clientes e foram

anotadas as respostas na ordem das entrevistas.
Para uma variável quantitativa discreta

O controle de qualidade de uma fábrica de rolamentos vem
analisando os lotes para detectar defeitos nas peças fabricadas.
Cada lote contém 56 peças. A seguir, está relacionado o número
de defeitos por peça, conforme estas são produzidas neste lote:
Unidade 2 45

1 1 4 1 0 0 1 6
5 0 0 0 0 0 0 0
0 1 0 0 1 0 3 2
4 2 0 0 2 0 1 0
0 0 3 3 0 0 4 0
0 1 0 2 0 0 1 0
3 0 0 0 3 0 0 0
Quadro 2.2 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
Repare que foram analisadas 56 peças e foram anotados os

números de defeitos por peça, na ordem em que estas foram
produzidas.
Para uma variável quantitativa contínua

Os valores anotados a seguir representam o volume de vendas
mensal de 56 representantes de uma empresa que fabrica
remédios. Os valores estão em milhares de reais:
23,25 27,43 17,76 33,33 33,05 16,08 34,49 23,74

32,63 20,58 18,50 16,69 16,43 20,08 19,00 16,13
21,36 26,60 22,49 22,77 23,05 33,55 22,73 24,89
24,11 34,83 21,73 31,53 35,13 34,36 20,80 16,84
29,55 34,76 31,72 24,89 21,65 22,65 30,43 30,93
17,25 17,05 19,67 22,79 25,30 23,08 25,77 35,03
16,59 15,90 20,30 33,86 17,76 30,93 20,81 29,05
Quadro 2.3 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma

empresa que fabrica remédios
Dados agrupados
Dados agrupados são sequências de valores numéricos, ou não, os
quais se encontram já organizados, ou por semelhança (qualitativas),
ou por ordenação numérica (quantitativas), em tabelas.
46

Tabelas para variável qualitativa

Para montar uma tabela com variável qualitativa, acompanhe o
exemplo, a seguir, de um levantamento de dados acerca do tipo
de investimento em que os clientes de um banco mais confiavam.
Veja passo a passo
1º passo: para começar, você deve organizar os dados por

semelhança.
I I I I I I I I
I I I I I I M M
M M M M M M M M
P P P P P P P P
P P P P P P P P
P P P P P P R R
R R R R R R R R
Quadro 2.4 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
Legenda do quadro:
I – Investimentos imobiliários
M – Investimento em mercado de ações
P – Investimento em poupança
R – Investimento em fundos de renda fixa
Repare que os dados estão organizados por tipo de investimento.
2º passo: agora você vai escrever, em uma coluna, cada uma das
opções verificadas. Contar o número de vezes em que cada tipo
aparece e marcar com traços, ao lado, para representar as aparições.
Em seguida, conte o número de traços para obter o número de vezes
que cada opção aparece. Observe, a seguir, a contagem dos dados.
I = 14
M = 10
P = 22
R = 10
Unidade 2 47

3º passo: após a contagem e organização dos dados, agora é só

montar a tabela, sem esquecer nenhum de seus componentes.
Acompanhe:
Tabela 2.1 – Tipos de investimento
Tipo de investimento Número de clientes
Imobiliário 14
Mercado de ações 10
Poupança 22
Fundos de renda fixa 10
Total 56
Essas tabelas são denominadas de distribuição de

frequências.
Tabelas para variável quantitativa discreta

Nesta seção, vamos verificar como montar uma tabela com
variável quantitativa discreta. Para saber como são montados
estes tipos de tabela, acompanhe os passos apresentados a seguir.
Observe que a opção de montar uma tabela sem

intervalos se deve ao fato de esta série ter um número
de elementos distintos pequeno.
48

Veja passo a passo
1º passo: para começar organize os dados em ordem crescente.
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 1 1 1 1 1 1 1
1 1 2 2 2 2 3 3
3 3 3 4 4 4 5 6
Quadro 2.5 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
Repare que foram organizados conforme uma ordem numérica

crescente (de 0 a 6).
A organização de dados na
2º passo: escreva, em uma coluna, cada um dos valores observados. forma de lista em ordem –
Conte o número de vezes em que cada tipo aparece e marque com crescente ou decrescente
traços, ao lado, para representar as aparições. Após, conte o número –, é chamada de Rol.
de traços para obter o número de vezes em que cada valor aparece.
Observe, a seguir, a contagem dos dados.
0 33
1 9
2 4
3 5
4 3
5 1
6 1
Unidade 2 49

3º passo: agora é só montar a tabela, sem esquecer nenhum de seus

componentes.
Tabela 2.2 – Número de defeitos por peças analisadas do lote
Nesta tabela, utilizamos algumas expressões estatísticas para

representação dos elementos:
os valores que a variável pode assumir é representado por xi;
o número de observações de cada linha chama-se de

frequência simples, denotada por f i; e
o número total de observações chama-se de frequência

total e pode ser denotada por N (tamanho da população),
n (tamanho da amostra) ou .
50

Tabelas para variável quantitativa contínua

A opção de montar uma tabela com intervalos é preferível porque
esta série possui um grande número de elementos distintos
ou, ainda, quando os valores apresentam uma natureza de
continuidade. Vamos acompanhar um exemplo para montagem
das tabelas para variável quantitativa contínua.
Para a variável
quantitativa contínua,
Os valores anotados a seguir representam o volume utilizam-se intervalos na
de vendas mensal de 56 representantes de uma tabela para representar
empresa que fabrica remédios. Os valores estão em a série de dados. Estes
milhares de reais. intervalos denominam-se
intervalos de classes.
Veja passo a passo
1º passo: para começar, você deve organizar os dados em ordem

crescente (Rol).
15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05

17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
Quadro 2.6 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma
empresa que fabrica remédios
Unidade 2 51

2º passo: você deve calcular o número e o tamanho dos intervalos.
O número de intervalos (k) é obtido a partir dos seguintes

critérios:
critério da raiz ;
fórmula de Sturges k = 1 + 3,3.log n;
Sendo n = tamanho da amostra (poderá ser usado N, quando for

com a população).
Observe que:
1. Ainda que existam dois critérios, em geral, o critério
utilizado é o da raiz: .
2. O número do intervalo (k), em alguns casos, pode ser
predefinido.
3. As tabelas devem ter, no mínimo, 5 e, no máximo,
20 intervalos de classes, para que não haja nem perda,
nem excesso de informação.
Para este estudo, sendo n o número de elementos da amostra,

n = 56, e , então , logo k = 7 e o número de
intervalos utilizados será igual a 7.
Agora, vamos analisar as amplitudes e os limites de classe para

determinar o tamanho dos intervalos.
a) Amplitude total da distribuição (AT): é a diferença entre o

maior valor e o menor valor observado.
AT = L(máx) – l(mín)
L(máx) = Limite máximo (maior valor)
l(min) = Limite mínimo (menor valor)
52

No exemplo que você está estudando:

AT = 35,13 − 15,90 AT = 19,23 19,50
Nesta etapa, é conveniente que o resultado seja

arredondado para cima, a fim de que não haja perda de
informação.
b) Amplitude de um intervalo de classe (h): também chamada

de tamanho do intervalo de classe, é obtida da seguinte forma:
No exemplo:
Antes de partir para a construção da tabela, é conveniente testar

se os cálculos estão corretos. Para que isso aconteça, verifique se:
h.K > AT
Aplique sobre o exemplo dado:
2,80 . 7 = 19,60 > 19,23
Ou seja, ao somar 19,60 ao menor valor observado resulta 35,50,

que é maior que o valor da maior observação, 35,13.
15,90 + 19,60 = 35,50 > 35,13
Caso não seja satisfeita esta condição, será necessário fazer um

ajuste, aumentando o tamanho do intervalo. Então, resumindo,
segundo o exemplo dado, a tabela terá:
Unidade 2 53

sete intervalos;
cada um com o tamanho de 2,80.
c) limites de classes: são os extremos de cada classe. O limite

inferior da classe (Li) é o menor número do intervalo. O limite
superior (Ls) é o maior número do intervalo.
3º passo: escreva os intervalos da tabela.
Comece pela primeira classe, escreva o menor valor observado. 15,90
A este valor, some o h (2,8) e encontre o limite superior deste intervalo: 15,90 |--- 18,70
15,9 + 2,8 = 18,7. Você deve escrever na tabela:
Na segunda classe, repita o último valor da classe anterior (18,7), some

o h (2,8) e encontre o limite superior deste intervalo: 18,7 + 2,8 = 21,5. 18,70 |--- 21,50
Você pode escrever na tabela:
Na terceira classe, repita o último valor da classe anterior (21,5), some

o h (2,8) e encontre o limite superior deste intervalo: 21,5 + 2,8 = 24,3. 21,50 |--- 24,30
Você pode escrever na tabela:
24,30 |--- 27,10

Usando este procedimento para as outras classes, você terá os 27,10 |--- 29,90
seguintes intervalos a seguir, até a sétima classe:
29,90 |--- 32,70
Observe que os intervalos são escritos dessa forma:

15,90 |--- 18,70. O que significa?
A representação indica um intervalo fechado à esquerda e aberto

à direita Þ [15,90; 18,70), ou seja, os valores deste intervalo
chegam perto de 18,70, mas o valor 18,70 está no próximo
intervalo: 18,70 |--- 21,50; o valor 21,50 não está neste intervalo,
e sim no intervalo: 21,50 |---24,30. E assim por diante.
54

4º passo: agora é a vez de partir para a construção da tabela, sem

se esquecer de seus componentes. Primeiro monte a tabela e
escreva os intervalos.
Tabela 2.3 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
Classe Volume de vendas (em mil reais)

1 15,90 |--- 18,70
2 18,70 |--- 21,50
3 21,50 |--- 24,30
4 24,30 |--- 27,10
5 27,10 |--- 29,90
6 29,90 |--- 32,70
7 32,70 |--- 35,50
5º passo: agora é só contar e marcar o número de valores em cada

intervalo. É aconselhável marcar os limites dos intervalos no Rol e usar
os traços para indicar a contagem ou marcar como no quadro a seguir:
15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05

17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
Quadro 2.7 – Volume de vendas mensais

Unidade 2 55

Classe Volume de vendas Contagem Nº de

(em mil reais) representantes (fi)
1 15,9 18,7 12
2 18,7 21,5 8
3 21,5 24,3 12
4 24,3 27,1 5
5 27,1 29,9 3
6 29,9 32,7 6
7 32,7 35,5 10
Total ( ) 56
E, no final, a tabela fica como está apresentado a seguir:
Até aqui, você estudou dois tipos de frequência: a simples e a total, e

pôde aprender que: o número de observações de cada linha chama‑se
frequência simples, f i; e o número total de observações chama-se
frequência total, . Na seção a seguir, você irá aprender que,
além destas duas, existem outros tipos de frequência.
56

Seção 2 – Tipos de frequência

A Estatística tem como uma de suas finalidades facilitar a análise
e a leitura dos dados, e, justamente, para isso, um dos métodos
utilizados é trabalhar com tipos de frequência. Estes tipos de
frequência lhe serão apresentados a seguir.
Frequência acumulada
Na tabela, na coluna da frequência acumulada, você deverá
escrever o valor acumulado das frequências, ou seja, para
começar, repita a frequência simples da primeira linha e,
nas linhas seguintes, some a frequência simples à frequência
acumulada anterior.
Este processo deverá chegar até a frequência total
fa = fa(ant) + f i
Sendo:
fa: frequência acumulada;
fa(ant): frequência crescente da classe anterior;
f i: frequência simples da classe;
Unidade 2 57

Acompanhe com atenção a tabela:
Tabela 2.6 – Volume de vendas
Para que serve a frequência acumulada?
Imagine que você está apresentando um relatório de vendas da

empresa para a diretoria.
Então, um dos diretores lhe pergunta: “Quantos representantes

tiveram vendas menores que 29,9 mil reais?” Você não necessitará
fazer contas, é só observar a quinta classe, na coluna da
frequência acumulada na tabela e dizer: “40 representantes!”
E se perguntarem: “Quantos representantes venderam abaixo de

24,3 mil reais?” Você vai encontrar a resposta na terceira classe na
coluna com a frequência acumulada: “32 representantes”.
Observe que o volume de vendas questionado é sempre do limite

superior de cada intervalo para baixo.
58

Frequência relativa (fr)

É o quociente entre a frequência (f i) da classe e o número total de
observações.
Sendo:
fr: frequência relativa da classe;
f i: frequência simples da classe;
n: número total de observações (pode-se usar n ou ).
Neste caso, deve-se calcular a frequência com quatro

casas decimais visando ao próximo passo.
Unidade 2 59

Lembre-se: use sempre quatro casas decimais para

arredondar a frequência relativa.
Frequência percentual (fp)

É a frequência relativa multiplicada por 100. É dada em
porcentagem (%).
fp = fr . 100
Sendo:
fp: frequência percentual;
fr: frequência relativa.
60

Observe que, ao usar quatro casas decimais para a frequência

relativa, o percentual ficou com duas casas decimais.
Para que serve a frequência percentual?
Mais uma vez você está apresentando um relatório de vendas da

empresa para a diretoria.
E vem aquela pergunta: “O que representa, do total, os

representantes que venderam de 32,70 a 35,50 mil reais?” Você
poderia responder diretamente, sem cálculos: “17,86%.”
E, se perguntarem: “Quantos representantes venderam de 24,3 a

27,1 mil reais ou mais?” Você responderá: “8,93%.”
Observe que, neste exemplo, o volume de vendas questionado é

sempre um intervalo. Antes de acompanhar os outros tipos de
frequência, entenda o que é ponto médio de uma classe.
Ponto médio de uma classe são os valores da variável

que se encontram exatamente na metade do intervalo
de cada classe.
Para calcular o ponto médio, usa-se a média aritmética simples

dos limites de cada intervalo:
Sendo:
PM: ponto médio;
Ls: limite superior do intervalo;
Li: limite inferior de cada intervalo.
Unidade 2 61

A tabela a seguir indica o cálculo do ponto médio para o exemplo

que estamos estudando.
Lembre-se deste conceito: o ponto médio será usado

para outros cálculos que você irá realizar mais adiante.
Seção 3 – Representação gráfica

O gráfico constitui outra maneira de se apresentarem os dados
estatísticos. Eles têm a finalidade de mostrar com clareza,
veracidade e rapidez os dados que estão sendo estudados. Além
disso, os gráficos propiciam uma noção muito boa de como
algum fenômeno se comporta.
Por meio de formas geométricas, os gráficos mostram, por área

ou volume, as diferenças entre as opções de cada variável.
62

Tome cuidado ao interpretar um gráfico. Assim

como os gráficos podem dar informações rápidas e
precisas, sua manipulação pode distorcer a realidade,
provocando tendenciosidade nas informações.
Observe os gráficos a seguir:
Gráfico 2.1 – Censo demográfico Brasil 1890 – 2000

Fonte: IBGE (2010).
Gráfico 2.2 – Censo demográfico Brasil 1890 – 2000

Fonte: IBGE (2010).
Unidade 2 63

Observe que, no Gráfico 2.1, a impressão é que a população

aumenta abruptamente, enquanto que, no Gráfico 2.2, a
impressão é que a população aumenta lentamente. E a única
diferença entre os dois gráficos é a largura que se usou para cada
um deles. Em alguns casos, isso pode ser muito prejudicial.
Os gráficos comunicam as mesmas ideias das tabelas, porém

produzem uma impressão e compreensão mais rápida, mais viva,
pois eliminam detalhes desnecessários, visualizando somente as
características mais importantes dos dados.
O gráfico estatístico é uma forma de apresentação dos

dados estatísticos, cujo objetivo é o de produzir, no
investigador ou no público em geral, uma impressão
mais rápida e viva do fenômeno em estudo, já que os
gráficos falam mais rápido à compreensão que as séries.
A representação gráfica de um fenômeno deve obedecer a certos

requisitos fundamentais para ser realmente útil:
a) simplicidade: o gráfico deve ser destituído de detalhes

de importância secundária, assim como de traços
desnecessários que possam levar o observador a uma
análise morosa ou com erros;
b) clareza: o gráfico deve possibilitar uma correta

interpretação dos valores representativos do fenômeno
em estudo;
c) veracidade: o gráfico deve expressar a verdade sobre o

fenômeno em estudo.
Para a construção de gráficos, você deverá observar alguns itens

que se fazem necessários neles:
todo gráfico deve ter título e fonte (no rodapé), para que
o leitor não tenha a necessidade de voltar ao texto para
saber do que se trata;
a escala do eixo horizontal deve ser escrita abaixo desse

eixo e deverá crescer da esquerda para a direita;
64

a escala do eixo vertical deve ser escrita à esquerda do

eixo e crescer de baixo para cima;
cada eixo deve ser identificado com o que está sendo

medido ou representado;
não é necessário colocar linhas de grade (que saem das

marcas das escalas horizontais e verticais). Estas são
opcionais.
Acompanhe, a seguir, um gráfico com todos os detalhes citados.
Gráfico 2.3 – Censo demográfico – Brasil – 1890 – 2000

Fonte: Adaptado de IBGE (2010).
Antigamente, os gráficos eram feitos a mão, com a ajuda de

régua, compasso, transferidor, esquadros e canetas ou giz
coloridos. Hoje, podemos contar com softwares específicos que
auxiliam e facilitam na construção de gráficos e, muitas vezes,
propiciam mais precisão e clareza. Além dos softwares específicos
de Estatística, temos os programas aplicativos de escritório, que
incluem as chamadas planilhas eletrônicas.
Uma planilha eletrônica utiliza tabelas para a realização de

cálculos e permite, também, a criação de vários tipos de gráficos,
o que facilita a representação e análise de dados estatísticos.
Os principais tipos de gráficos são os diagramas, os cartogramas

e os pictogramas.
Unidade 2 65

Na sequência deste estudo, você conhecerá alguns tipos de gráficos

relevantes para a apresentação dos dados estatísticos. Vamos identificar
cada tipo de gráfico, suas características e formas de análise, quando
for o caso. Dentre os gráficos classificados como diagramas, os mais
amplamente utilizados (e destacados a seguir) são os gráficos de
colunas e de barras. Os outros tipos de gráficos classificados como os
cartogramas e os pictogramas serão apresentados ao final desta seção.
Diagramas
Os diagramas são gráficos geométricos de, no máximo, duas
dimensões; para sua construção, em geral, fazemos uso do
sistema cartesiano (eixo X e Y). Os principais diagramas são os
gráficos de linhas, colunas, barras, setores ou pizza e o gráfico
polar. Veja cada um desses tipos.
Gráfico de colunas
É usado para apresentar séries temporais, geográficas e
específicas. Formado por retângulos dispostos verticalmente, de
mesma largura (arbitrária), com altura proporcional às grandezas
(variáveis) do fenômeno a ser representado.
Todos os retângulos têm base comum no eixo de x e, no eixo de

y, os valores das variáveis estudadas. Observe os exemplos na
tabela 2.10 e nos gráficos 2.4 e 2.5.
Tabela 2.10 – Mortalidade Infantil, na região Sul e Sudeste, 2004
Estado Por mil nascimentos

SC 17,2
RG 14,3
PR 20,0
SP 16,5
RJ 20,9
ES 20,1
MG 21,8
Fonte: Portal Brasil (2004).
66

Gráfico 2.4 – Mortalidade Infantil, na região Sul e Sudeste, 2004

Gráfico 2.5 – Porcentagem de mulheres, com filhos antes dos 20 anos, 2000
Fonte: Population Reference Bureau (2000).
Unidade 2 67

Gráfico de barras
Segue as mesmas normas do gráfico de coluna, porém os
retângulos ocupam posição horizontal e, por isso, terão
base comum no eixo y. É também mais indicado para séries
geográficas e específicas.
Gráfico de linhas
É comum, para quem trabalha na área de administração e
negócios, observar o comportamento de uma variável ao longo do
tempo. Por exemplo, um executivo que acompanha a cotação diária
das ações da sua empresa, um gerente que acompanha o volume
semanal de vendas de sua loja ou um engenheiro de produção que
acompanha características de qualidade do produto que fabrica.
Gráfico de setores ou de pizza

É usado para mostrar a importância relativa das proporções e é
construído a partir das coordenadas polares:
comparar a parte com o todo;
é formado por um círculo, do qual cada parte representa

um percentual da variável.
Neste caso, utilizamos o mesmo exemplo do gráfico de barras, de

modo que você possa analisar as proporções no gráfico de setores.
Gráficos em colunas ou em barras múltiplas

Este tipo de gráfico é geralmente empregado quando queremos
representar, simultaneamente, dois ou mais fenômenos estudados
com o propósito de comparação.
68

Tabela 2.11 – Balança Comercial brasileira (Valores em US$ Milhões), 2005 a 2009
Ano Exportação Importação

2005 118.309 73.545
2006 137.807 91.350
2007 160.649 120.610
2008 197.953 173.148
2009 152.252 127.637
Fonte: Base de dados do Portal Brasil (2010).
Gráfico 2.6 – Balança comercial brasileira (Valores em US$ milhões), 2005 a 2009
Análise dos dados: observando o gráfico, podemos

concluir que o saldo da balança comercial brasileira
é positivo, pois as colunas em cinza claro, que
representam as exportações em todos os anos, são
maiores que as colunas de cor cinza escuro que
representam as importações.
O ano que representou um maior volume de exportação e

também de importação foi o de 2008. O menor volume de
importação foi no ano de 2005.
Unidade 2 69

Gráfico Polar
É o gráfico mais indicado quando temos necessidade de
representar variações cíclicas, ou seja, que se repetem em períodos
predeterminados.
O gráfico polar é mais utilizado em estudos climáticos (para

séries temporais).
Cartograma
O cartograma é a representação sobre um mapa. Este gráfico é
empregado quando o objetivo é o de figurar os dados estatísticos
diretamente relacionados com áreas geográficas ou políticas.
Pictogramas
Pictogramas são construídos a partir de figuras ou conjunto de
figuras representativas da intensidade ou das modalidades do
fenômeno.
São mais utilizados em jornais, revistas, cartazes e propagandas,

ou seja, quando se deseja dar um efeito mais atrativo ou chamar a
atenção, sem nenhum rigor científico.
Representação gráfica de uma distribuição

Alguns gráficos em Estatística são usados para interpretações
de informações, análises de dados e, também, para a dedução
geométrica de fórmulas de algumas medidas importantes.
Para as distribuições de frequências simples, são utilizados o

histograma e o polígono de frequências. E, para as frequências
acumuladas, é utilizado o polígono de frequências acumuladas.
70

Histograma
Este gráfico é muito semelhante ao de colunas, ou seja, é formado
por um conjunto de retângulos justapostos, de maneira que a
altura de cada retângulo seja proporcional à frequência simples da
classe por ele representada.
É construído no sistema de eixos cartesianos. No eixo horizontal,

são marcados os valores ou intervalos das classes assumidos pela
variável. No eixo vertical, são marcadas as frequências simples,
que servirão para marcar a altura dos retângulos, indicando,
assim, o número de observações (ocorrências) de cada valor ou
classe da variável.
Como a altura de cada retângulo é proporcional à frequência

simples, a área de cada retângulo também o é. Considerando
isso, a soma das áreas dos retângulos também é proporcional à
frequência total.
Como construir um histograma?
Siga os seguintes passos:
desenhe os eixos vertical e horizontal;
faça as escalas em cada um dos eixos – no horizontal, os

intervalos de classe; e, no vertical, a frequência;
desenhe os retângulos que representam cada intervalo

com a mesma largura de cada intervalo e com a altura
proporcional às frequências dos intervalos;
não se esqueça de escrever o título e a fonte.
Unidade 2 71

Observe o exemplo na tabela 2.12 e no gráfico 2.7.
Tabela 2.12 – Quantidade de óxido de enxofre
Quantidade de óxido de enxofre Nº de meses (fi)
6,2 |--- 9,9 6
9,9 |--- 13,6 10
13,6 |--- 17,3 11
17,3 |--- 21,0 20
21,0 |--- 24,7 13
24,7 |--- 28,4 7
28,4 |--- 32,1 3
Total 70
Gráfico 2.7 – Emissão de óxido de enxofre nos últimos 70 meses (em toneladas)
Há uma analogia dos histogramas com os gráficos de barras.

Mas, nos gráficos de barras, não há necessidade de se usar escala
horizontal contínua, além de não ser necessária a rigidez de
construção que têm os histogramas.
72

Polígono de frequências
Unindo por linhas retas os pontos médios das bases superiores
dos retângulos do histograma, obtém-se outra representação dos
dados, denominada polígono de frequências.
Você pode observar que a área do histograma é igual à área

abaixo do polígono de frequências, ou seja, os retângulos
que ficam fora são compensados pelos triângulos que estão
adicionados por dentro.
Gráfico 2.8 – Emissão de óxido de enxofre – em toneladas

Unidade 2 73

Síntese
Nesta unidade, você estudou como organizar e agrupar dados,

como construir tabelas com todos seus elementos e, também,
como acrescentar informações às tabelas que auxiliem sua
leitura. Aprendeu a montar tabelas com dados quantitativos, e
sempre que precisar trabalhar com esses dados, você vai recorrer
às tabelas de frequências. Este conhecimento será bastante útil
quando for preciso apresentar algum relatório, e as pessoas para
quem o apresenta levantarem alguns questionamentos.
Ter conhecimento de como interpretar uma tabela permite que

você tenha acesso rápido às respostas com a devida precisão.
Nessa unidade, você estudou, também, como os gráficos

facilitam a nossa vida. Com eles, temos acesso rápido e claro às
informações, sem necessidade de grandes cálculos.
Mas um alerta importante que não pode ser esquecido é que

apenas a qualidade e a clareza do gráfico dão condição para um
bom trabalho, afastando toda possibilidade de tendenciosidade.
Nesta unidade, você pôde estudar diferentes tipos de diagramas

e conhecer o que são os pictogramas e os gráficos representativos
de distribuição de frequências. Com tudo isso, agora você já tem
condições de realizar algumas análises rápidas de diversos tipos
de gráficos.
74


1) Um relatório recente distinguiu em seis tipos os principais motivos de

tensão (estresse). A pesquisa realizada para provar isso resultou nos
dados a seguir (dados fictícios):
MP MC DO DG MF
DM MF MP DG MC
MC MF MF MC MC
MF MC MP DO MP
MP MP DM MP DO
MP DM DG DM MC
MF MF MF MF MF
DO MP DG MP DG
MF MC MF MP DO
DO DO DM MF MC
MF DM MC MC DG
DO MF DG MF MC
Legenda: tipos de fobias
MF: Morte de um filho;
MC: Morte do cônjuge;
MP: Morte dos pais ou irmãos;
DO: Divórcio;
DG: Doença grave;
DM: Demissão.
Monte a tabela não esquecendo de todos seus componentes.
Unidade 2 75

2) Uma empresa procurou estudar a ocorrência de acidentes com seus

empregados, tendo, para isso, realizado levantamento abrangendo um
período de 36 meses. No levantamento, foi observado o número de
operários acidentados para cada mês. Os dados correspondentes são:
4 8 6 6 4 5
6 5 8 5 6 5
8 5 7 6 8 7
3 3 4 4 3 3
5 5 4 6 5 5
7 7 6 8 8 7
Levando em consideração os dados apresentados, monte a tabela

com as variáveis quantitativa discreta. Procure incluir todos os seus
componentes.
3) Os dados a seguir representam a renda de uma amostra de famílias de

um bairro de classe baixa de Florianópolis, em reais (dados fictícios).
Construa a tabela de distribuição de frequências sem esquecer de
nenhum de seus elementos. Usar k = 6 (número de intervalos).
Sugestão: ao calcular o h (tamanho de cada intervalo), arredonde para
um número inteiro. Exemplo: 3,84 4
115 121 117 124 122 116
123 118 123 119 123 126
128 122 112 125 124 126
125 121 129 127 128 129
113 115 116 124 119 118
126 129 116 127 123 121
76

4) Os dados abaixo representam a renda de uma amostra de famílias de

um bairro de classe baixa de Florianópolis, em reais (dados fictícios).
Renda de famílias de um bairro da classe baixa de Florianópolis
Renda (R$) Nº de famílias fiacd fiacid fr fp (%) PM

“abaixo de” “acima de”
112 |--- 115 2
115 |--- 118 6
118 |--- 121 4
121 |--- 124 9
124 |--- 127 8
127 |--- 130 7
Total (Σfi) 36
FONTE: Elaboração do autor (2006).
Complete a tabela com as frequências acumuladas direta e indireta, a

frequência relativa, percentual e o ponto médio. Depois responda as
perguntas:
a) Quantas famílias apresentam renda menor que 124?

______ (use a coluna da fiacd “abaixo de”)
b) Quantas famílias apresentam renda menor que 127?
c) Quantas famílias apresentam renda maior ou igual a 124?
______ (use a coluna da fiacd “acima de”)
d) Quantas famílias apresentam renda maior ou igual a 127? ______
(use a coluna da fiacd “acima de”)
e) Qual foi o percentual de famílias com renda de 118 a 121 pontos?
______ (use a coluna da fp)
f) Qual foi o percentual de famílias com renda de 121 a 124 pontos?
Unidade 2 77

5) Uma empresa procurou estudar a ocorrência de acidentes com seus

empregados, tendo, para isso, a CIPA realizado um levantamento
abrangendo um período de 36 meses, em que foi observado o número de
operários acidentados para cada mês. A tabela abaixo resume estes dados:
Número de operários acidentados para cada mês
Número de Número de fiacd fiaci fr fp (%)

acidentados meses “abaixo de” “acima de”
3 4
4 5
5 9
6 7
7 5
8 6
Total (Σfi) 36
Complete a tabela com as frequências acumulada direta e indireta, a

frequência relativa e a percentual. Depois responda as perguntas:
a) Em quantos meses a empresa teve um número de funcionários

acidentados menor que 6?
(observação: menor que 6 = 5, 4 e 3)
b) Em quantos meses a empresa teve um número de funcionários

acidentados menor ou igual a 6?
(observação: menor ou igual a 6 = 6, 5, 4 e 3)
c) Em quantos meses a empresa teve um número de funcionários

acidentados maior que 5?
______ (use a coluna da fiaci “acima de”)
(observação: maior que 5 = 6, 7 e 8)
d) Em quantos meses a empresa teve um número de funcionários

acidentados maior ou igual a 5?
______ (use a coluna da fiaci “acima de”)
(observação: maior ou igual a 5 = 5, 6, 7 e 8)
e) Qual foi o percentual de meses em que a empresa verificou 5

funcionários acidentados?
f) Qual foi o percentual de meses em que a empresa verificou 7
funcionários acidentados?
78

6) Procure, em jornais, revistas, cartazes, internet etc., três tipos de gráficos

diferentes, semelhantes aos que você estudou até agora, e os analise.
Não esqueça de procurar gráficos cujo tema seja relacionado ao seu
curso. Faça uma descrição sucinta de cada um deles e trace comentários
sobre tendências, maior proporção, maior alta, maior baixa etc.
7) A seguir, você tem uma distribuição de frequências e um sistema de

eixos. Construa o histograma e o polígono de frequências para essa
distribuição usando o sistema de eixos (não esqueça de todos os
componentes de um gráfico, inclusive as escalas dos eixos, título e
fonte): tempo de sono, em minutos, induzido em ratos por injeção de
um certo químico, na dosagem de 40 mg por quilo.
Tempo de sono (em min.) Número de ratos

7 |--- 12 2
12 |--- 17 6
17 |--- 22 17
22 |--- 27 9
27|--- 32 5
32 |--- 37 2
Unidade 2 79

Saiba mais
Você quer aprofundar seus estudos sobre o conteúdo desta

unidade? A sugestão é que você pesquise em:
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.

ed. São Paulo: Harbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo:

Saraiva, 2009.
FLEMMING, Diva Marília. Representações gráficas. São

José: Saint Germain, 2003.
LEVIN, Jack. Estatística aplicada às ciências humanas. São

Paulo: Habra, 1987.
NEUFELD, John L. Estatística aplicada à administração

usando excel. São Paulo: Prentice Hall, 2003.
SILVA, Ermes Medeiros da. Estatística para os cursos de

economia, administração e ciências contábeis. 3. ed. São Paulo:
Atlas, 1999. v. 1.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro.

Estatística básica. 2. ed. São Paulo: Atlas, 1985.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro:

LTC, 1999.
VIEIRA, Sonia. Princípios de estatística. São Paulo: Pioneira,

2003.
80

3
UNIDADE 3
Medidas de posição e dispersão
Conhecer os tipos de medidas de posição.
Calcular e interpretar a média, a moda e a mediana

para dados brutos e agrupados.
Compreender e calcular separatrizes.
Compreender os tipos de medidas de dispersão.
Calcular e interpretar variância e desvio padrão para

dados brutos e agrupados.
Seções de estudo
Seção 1 Medidas de posição
Seção 2 Gráficos box-plot e ramo e folhas
Seção 3 Medidas de dispersão
Seção 4 Coeficiente de variação


Nessa unidade, você vai obter mais uma ferramenta para
auxiliá-lo a compreender e utilizar a Estatística no seu dia a dia
profissional. O objetivo aqui é estudar medidas importantes e
bastante utilizadas nos métodos estatísticos.
O cálculo de medidas como a média, a moda e a mediana, e os

conceitos apresentados nesta unidade, são de grande valia no
seu cotidiano profissional, pois lhe fornecerão dados que serão
pertinentes para o entendimento de algum fato ou acontecimento.
Chamamos essas medidas de medidas de posição.
Mas conhecer as interpretações destas medidas não basta por si só.

Através delas, podemos chegar a algumas conclusões, mas não são
suficientes para que possamos avaliar o comportamento dos dados.
Por isso, nesta unidade, você vai estudar, também, medidas que
irão auxiliá-lo na avaliação do comportamento das séries de
dados com relação a sua média. Chamamos essas medidas de
medidas de dispersão.
Está preparado(a)? Então inicie agora a leitura da seção a seguir!
Seção 1 – Medidas de posição

Muitas vezes você irá se deparar com uma massa de dados grande
o bastante para que a leitura e a análise se tornem muito difíceis.
E como fazer para tirar informações relevantes e resumir os
dados de forma eficaz nesses casos? Usando medidas estatísticas!
Nesta unidade, vamos ver algumas delas.
As medidas de posição, assim chamadas pela posição que

elas ocupam na série estatística, quando bem utilizadas e
interpretadas, podem ser úteis, não só por elas mesmas, mas
também, auxiliando o cálculo de outras medidas.
82

Além de tudo, ela facilita o estudo de grandes volumes de dados,

pois as medidas de posição podem resumir as informações, dando
a você uma noção do comportamento do todo. As medidas de
posição estão divididas da seguinte maneira:
a) medidas de tendência central: são valores da variável

que tendem a estar no centro da série, por isso o nome.
Refere-se ao valor da variável que está, senão no centro,
perto dele. Está dividia em três tipos: média, mediana e
moda.
b) separatrizes: são valores da variável que dividem a

série ordenada de dados em partes que contém a mesma
quantidade de observações.
Medidas de Tendência Central – Média

A média é uma das medidas mais importantes dentro da
Estatística. Ela é o ponto de equilíbrio de uma série de dados.
Veja a figura a seguir, extraída do livro Introdução à Estatística,
de Mário F. Triola (1999).
Figura 3.1 – A média como ponto de equilíbrio

Fonte: Triola (1999, p. 32).
Vários tipos de médias podem ser calculados para uma massa

de dados. A mais importante é a média aritmética, que você irá
estudar nessa seção.
Unidade 3 83

A média aritmética é a soma de todos os elementos de uma série

de dados, dividida pelo número de elementos que compõe essa
série. Veja a seguir como representá-la.
Notação:
= média dos dados de uma amostra.
μ = média dos dados de uma população (em que μ = 12° letra do

alfabeto grego, “μ” lê-se como “mi”).
A média aritmética para dados brutos

Agora, você vai calcular a média para dados que não foram
organizados em tabelas, ou seja, estão conforme foram coletados,
brutos.
A soma de todos os valores, dividida pelo número de valores.
Em que:
n = número de valores da série (ou tamanho da amostra).
x i = valores da série.
Veja a seguir um exemplo bem detalhado para compreender

como realizar os cálculos.
Um exemplo bem típico é calcular a média das notas das provas.

Digamos que as notas de uma disciplina cursada por você sejam:
7; 7,8; 6 e 8, então a média será:
84

A média aritmética para dados agrupados

Agora, você vai calcular a média para dados que foram
organizados em tabelas, ou seja, após a coleta, eles foram
organizados em categorias e escritos em uma tabela.
Dados agrupados sem intervalos (variável discreta)
Para os dados agrupados (em tabela), sem intervalos, utiliza-se a

fórmula descrita a seguir, em que cada frequência simples pode
ser considerada como peso. Por isso que se chama, também, de
média aritmética ponderada (pesos).
A soma de todos os valores multiplicados por sua frequência

simples, dividida pela soma das frequências (frequência total).
Em que:
n = número de valores da série (ou tamanho da amostra)
x i = valores da série
f i = frequência simples de cada xi
Veja a seguir um exemplo. Calcule a média dos dados

representados na tabela a seguir:
Tabela 3.1 – Número de filhos por famílias de um bairro de Florianópolis
No de filhos No de famílias xi.fi

(xi) (fi)
0 14 0 0×14 = 0
1 16 16
2 11 22 1×16 = 16
3 9 27
2×11 = 22
4 4 16
5 1 5 3×9 = 27
6 1 6
Total (Σfi) 56 92 Σxi.fi = 92
Somar as frequências simples

Unidade 3 85

Veja a seguir como calcular passo a passo
Passo 1: some a coluna das frequências simples (fi) para obter Σfi
(frequência total).
= 56
Passo 2: multiplique cada xi por sua correspondente fi na coluna xi.fi.
Passo 3: some os valores calculados no passo 2 e escreva a soma no

final da coluna. Esse resultado é o Σxi.fi.
xi.f i = 92
Passo 4: divida o resultado do passo 3 (Σxi.fi) pelo resultado do

passo 1 (Σfi).
Como interpretar estes dados? O valor médio da série é 1,64,

ou seja, a média de filhos por família é de 1,64 filhos. Analisando
dessa maneira, pode parecer um absurdo, mas você pode concluir
que a média de filhos por família é de 1 a 2 filhos.
Dados agrupados com intervalos (variável contínua)
Para os dados agrupados em tabela, com intervalos, você deve

utilizar a fórmula descrita a seguir, semelhante àquela utilizada
para dados sem intervalos, entretanto, por estarmos usando
intervalos, usamos os pontos médios e não x i.
A soma de todos os pontos médios multiplicados por sua

frequência simples, dividida pela soma das frequências
86

Em que:
n = número de valores da série (ou tamanho da amostra)
PM = ponto médio do intervalo
f i = frequência simples de cada intervalo
Quando trabalhamos com dados agrupados em intervalos,

passamos a trabalhar com a perda dos valores individuais, ou
seja, sabemos a frequência de cada intervalo, mas não sabemos
exatamente quais são os valores contidos nele (intervalo). Por
esse motivo, o cálculo da média, nesse caso, é feito com o uso do
ponto médio. A média, sendo assim, é um valor aproximado.
Veja o exemplo a seguir para compreender.
Veja a seguir como calcular passo a passo
Passo 1: some a coluna das frequências simples (fi) para obter Σfi
= 56
Passo 2: calcule o ponto médio de cada intervalo. Você lembra?
Passo 3: multiplique cada PM por sua correspondente fi e escrever na

coluna PM.fi.
Unidade 3 87

Passo 4: some os valores calculados no passo 3 e escreva a soma no

final da coluna; esse resultado é o ΣPM.fi.
ΣPMi.f i = 1386
Passo 5: divida o resultado do passo 4 (ΣPM.fi) pelo resultado do

passo 1 (Σfi).
Como interpretar o resultado? A quantidade média de óxido de

enxofre emitida, em 56 meses, foi de 24,75 toneladas.
Calcule a média dos dados representados como na tabela a seguir:
Tabela 3.2 – Quantidade emitida de óxido de enxofre (SO), em toneladas, pelas fábricas
do distrito industrial de Florianópolis
(15,9 + 18,7)
⁄2 = 17,3
Qtde. de SO Nº de meses PM PM.fi
(em ton.) (fi)
15,9 |--- 18,7 12 17,3 207,6 17,3×12 = 207,6
18,7 |--- 21,5 8 20,1 160,8
21,5 |--- 24,3 12 22,9 274,8 20,1×8 = 160,8
24,3 |--- 27,1 5 25,7 128,5 22,9×12 = 274,8
27,1 |--- 29,9 3 28,5 85,5
29,9 |--- 32,7 6 31,3 187,8 25,7×5 = 128,5
32,7 |--- 35,5 10 34,1 341
Total (Σfi) 56 1386 Σxi.fi = 92
Somar as
Fonte: Elaboração do autor (2006). frequências simples
88

Medidas de Tendência Central – Mediana

A mediana é um valor que divide a série de dados em duas partes
iguais, ou seja, é o valor observado que está no meio da série.
Notação:
Me = Mediana (também é usado md).
Mediana para dados brutos

Agora, você vai calcular a mediana para dados que não foram
organizados em tabelas, ou seja, estão conforme foram coletados,
brutos. Após a ordenação crescente dos dados, determinamos o
número de elementos (n) do mesmo.
Separamos em dois casos:
a) quando o n (tamanho da amostra) é ímpar: o cálculo da

posição da mediana deve ser conforme segue:
b) quando o n (tamanho da amostra) é par: o cálculo da

posição da mediana deve ser realizado com a seguinte
fórmula:
Unidade 3 89

Veja passo a passo como calcular a mediana para dados brutos quando
o (n) é ímpar
Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20, 31.
Passo 1: ordene os valores de forma crescente → 5, 9, 15, 19, 20, 24,

27, 30, 31.
Passo 2: o número de elementos é 9 (n = 9, ímpar).
Passo 3: calcule a posição da mediana.
Passo 4: a mediana é o 5º elemento.
Me = 20
1º 2º 3º 4º 5º 6º 7º 8º 9º
5 9 15 19 20 24 27 30 31
Como interpretar estes dados? 50% dos valores da série são

menores ou iguais a 20, e 50% dos valores da série são maiores ou
iguais a 20.
90

Veja passo a passo como calcular a mediana para dados brutos quando
o (n) é par
Para você encontrar a mediana, é preciso calcular o ponto médio
dos dois valores que ocupam as posições calculadas.
Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20.
Passo 1: ordene de forma crescente 5, 9, 15, 19, 20, 24, 27, 30.
Passo 2: o número de elementos é 8 (n = 8, par).
Passo 3: calcule a posição de Pos1 e Pos2.
Passo 4: a mediana está entre o 4º e o 5º elemento.
1º 2º 3º 4º 5º 6º 7º 8º
5 9 15 19 19,5 20 24 27 30
Como interpretar estes dados? 50% dos valores da série

são menores que 19,5, e 50% dos valores da série são valores
maiores que 19,5.
Você viu como se encontra a mediana para dados brutos?

Assim como você estudou na média, aqui, também para efeito
de cálculo, você usará diferente tratamento quando se tratar
de dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua).
Unidade 3 91

Medidas de posição usando o Excel

Mais uma vez, você poderá se deparar com um volume grande
de dados. O Microsoft Office Excel é muito útil para este tipo
de situação. Siga o pequeno roteiro para calcular as medidas de
tendência central no Excel:
Passo 1: Abrir o arquivo que está na midiateca de nome dados.xls,

usando o Excel;
Passo 2: Clique com o botão esquerdo do mouse no menu

“Ferramentas” e, se o item “Análise de dados” não estiver ativo no
menu, clique em “Suplementos”, conforme a imagem a seguir; caso
contrário, passe para o passo 4.
Figura 3.2 – Interface do programa Microsoft Office Excel 2003

Fonte: Adaptado pelo autor (2006).
Passo 3: Caso tenha clicado em “Suplementos”, a seguinte janela

abrirá, na qual você deverá marcar as opções “Ferramentas de
análise” e “Ferramentas de análise – VBA”, em seguida, clique em OK.
92


Passo 4: Voltando ao menu “Ferramentas”, clique no item “Análise de

dados”, como mostra a Figura a seguir.

Unidade 3 93

Passo 5: Após o clique, irá abrir a seguinte janela, na qual você irá
selecionar o item “Estatística Descritiva” e clicar em OK.

Passo 6: Na janela que se abre (mostrada adiante), você deve indicar

os dados a serem analisados, ou seja, no quadro ao lado do item
“Intervalo de entrada” devem aparecer as células que contêm os
dados. Selecione a coluna A (basta clicar com o mouse e arrastar, com
o botão pressionado, até o último quadrinho – célula) e tecle “Enter”.
Marque a opção “Resumo estatístico” e, após este procedimento,
você deve clicar em OK.

94

Passo 7: Uma nova planilha é criada com as informações, conforme a

seguinte figura.

Medidas de Tendência Central – Moda

A moda é um valor que mais se repete em uma série de dados, ou
seja, de maior frequência.
Notação:
Mo = Moda.
Unidade 3 95

Moda para dados brutos

Agora, você vai encontrar a moda para dados que não foram
organizados em tabelas, ou seja, que estão conforme foram
coletados, brutos. A moda será o valor que mais se repete no
conjunto de dados.
Veja os exemplos:
Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.
O elemento que mais se repete é o 22, então, Mo = 22. Observe

que o número 20 se repete, mas não mais que o 22. Para esse
caso, no qual a Mo = 22, afirma-se que a série é unimodal.
Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
Os elementos que mais se repetem são o 20 e o 22, então,

Mo1 = 20 e Mo2 = 22. Para esse caso, no qual temos duas modas
na série, afirma-se que a série é bimodal. Acima de duas modas,
é mais comum chamarmos a série de polimodal.
Exemplo 3: X: 20, 20, 22, 22, 25, 25, 28, 28.
Na série anterior, não temos um elemento que mais se repete,

pois todos têm a mesma frequência. Nesse caso, afirma-se que a
série é amodal.
Você viu como se encontra a moda para dados brutos. Assim

como você estudou na média, aqui, também para efeito de
cálculo, você usará diferente tratamento quando se tratar de
dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua). Mas, para a
finalidade deste estudo, não será incluído.
Entre média, mediana ou moda: qual utilizar?
96

Não há uma resposta simples e objetiva para determinar a medida

que seja mais representativa. A seguir, você encontra um resumo
das vantagens e desvantagens de cada medida de tendência central:
Afetada
Existência Leva em pelos Vantagens e
Medida Definição Frequência conta todos valores desvantagens
os valores? extremos?
Usada em toda
Soma de todos os Estatística;
valores divididos funciona bem
Média Mais usada. Existe sempre. Sim. Sim.
pelo número de com muitos
valores. métodos
estatísticos.
Costuma ser
uma boa
Mediana Valor que divide a Usada Existe sempre. Não. Não. escolha se há
série na metade. comumente. alguns valores
extremos.
Pode não
Valor que mais existir ou, Apropriada para
Usada às
Moda se repete (maior ainda, pode Não. Não. dados ao nível
vezes.
frequência). haver mais de nominal.
uma.
Quadro 3.1 – Resumo das vantagens e desvantagens de cada medida de tendência central
Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer
outros aspectos relativos ao conjunto de valores, além de um valor
central ou valor típico. Algumas informações relevantes podem
ser obtidas através do conjunto de medidas: média, extremos,
quartís, decís, percentís etc. Veja, a seguir, mais detalhes e
exemplos de como calcular as separatrizes.
a) Quartís: divide uma série ordenada em quatro partes

iguais, ou seja, em partes de 25% cada.
Representação: Q1, Q2 e Q3.

Denominação: 1º quartil, 2º quartil e 3º quartil.
Unidade 3 97

b) Decís: divide uma série ordenada em 10 partes iguais, ou

seja, em partes de 10% cada.
Representação: D1, D2, .... e D9.

Denominação: 1º decil, 2º decil, ... e 9º decil.
c) Percentil: divide uma série ordenada em 100 partes

iguais, ou seja, em partes de 1% cada.
Representação: P1, P2, .... e P99.

Denominação: 1º percentil, 2º percentil, ... e 99º percentil.
Note que a mediana também é uma separatriz. Você saberia dizer

com quais separatrizes podemos comparar? Veja:
Q2 = D5 = P50 = Me
Todas essas medidas dividem a série de dados pela metade.
»» 50% dos valores são maiores que Q2 = D5 = P50 =

Me; e
»» 50% dos valores são menores que Q2 = D5 = P50 =

Me.
Separatrizes para dados brutos

O procedimento é bastante semelhante ao da mediana. Preste
atenção nas explicações a seguir: após a ordenação crescente dos
dados (rol), determinamos o seu número de elementos (n).
Veja o exemplo passo a passo

Calcular Q1 para a série de dados X: 22, 15, 20, 22, 28, 20, 20,
22, 25, 26, 16.
Passo 1: ordene de forma crescente (rol) 15, 16, 20, 20, 20, 22, 22,
22, 25, 26, 28.
98

Passo 2: o número de elementos é 11 (n = 11, número ímpar). Aqui,

você deve adotar procedimento semelhante ao da mediana e deve
usar a mesma fórmula para calcular a posição. Lembre-se: a posição!
Assim, você irá encontrar a mediana, ou seja, o segundo quartil (Q2).
Passo 3: Pos = 6, ou seja, Q2 ocupa a 6ª posição.
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
Observe que o Q2 = 22.
Interpretação para Q2 = 22: 50% dos valores da série são

menores ou iguais que 22, e 50% dos valores da série são maiores
ou iguais que 22. Antes do Q2, está formado um novo conjunto
de dados, mostrado a seguir:
1º 2º 3º 4º 5º
15 16 20 20 20
Neste caso, a mediana (desta nova série de dados) será o primeiro

quartil. É só repetir o mesmo processo feito nos passos 2 e 3.
Passo 4: o número de elementos é 5 (n = 5, ímpar).
Unidade 3 99

1º 2º 3º 4º 5º
15 16 20 20 20
Observe que o elemento que ocupa a terceira posição é o 20,

então, Q1 = 20.
Como interpretar estes dados? 25% dos dados observados são

menores ou iguais a 20. 75% dos valores observados são maiores
ou iguais a 20.
Observe que pode ser usado, também, para calcular a posição

do primeiro quartil e do terceiro, respectivamente, as seguintes
fórmulas:
Para o primeiro quartil
Para o terceiro quartil
Veja passo a passo como você pode calcular o terceiro quartil
Passo 1: o número de elementos é 11 (n = 11).
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
100

Observe que o elemento que ocupa a nona posição é o 25,

então, Q3 = 25.
Percentis
Observação: para calcular a posição dos percentis use a seguinte
fórmula:
Para o primeiro quartil
PPi = posição da separatriz.
N ou n = tamanho da população (ou amostra).
i = número da separatriz (ex.: P60 = i = 60).
Continuando com o mesmo exemplo, calcule o sexagésimo percentil.
Passo 1: o número de elementos é 11 (n = 11) e o i = 60.
Passo 2: PP60 = 7,2, ou seja, P60está entre a 7ª e a 8ª posições.
1º 2º 3º 4º 5º 6º 7º PP60 8º 9º 10º 11º

15 16 20 20 20 22 22 P60 22 25 26 28
Unidade 3 101

Passo 3: o Para calcular o sexagésimo percentil, você deve encontrar

o valor que fica entre os valores que ocupam a 7ª e a 8ª posições.
Valor que ocupa a 7ª posição = 22.
Então, P60 = 22.

ou iguais a 22.
Decís
Se você notar, poderá comparar os decís com alguns percentis, ou seja:
Decís 1º 2º 3º 4º 5º 6º 7º 8º 9º
Percentis 10º 20º 30º 40º 50º 60º 70º 80º 90º
Isso mesmo, por exemplo, o D1 = P10, o D2 = P20, D3 = P30 e,

assim, sucessivamente. Note, também, que as interpretações são
as mesmas:
para o primeiro decil: 10% dos valores observados são

menores e 90% dos valores observados são maiores;
para o segundo decil: 20% dos valores observados são

menores e 80% dos valores observados são maiores;
para o terceiro decil: 30% dos valores observados são

menores e 70% dos valores observados são maiores etc.
Continuando com o mesmo exemplo, calcule o terceiro decil.

Note que ele é igual ao trigésimo percentil (D3 = P30)! Será a
mesma coisa que calcular P30.
102

Veja passo a passo
Passo 1: o número de elementos é 11 (n = 11) e o i = 30.
Passo 2: PD3 = PP30 = 3,6, ou seja, D3 está entre a 3ª e a 4ª posições.
1º 2º 3º PD3 4º 5º 6º 7º 8º 9º 10º 11º

15 16 20 D3 20 20 22 22 22 25 26 28
Passo 3: para calcular o terceiro decil, você deve encontrar o valor

que fica entre os valores que ocupam a 3ª e a 4ª posições.
Então, D3 = 20.

ou iguais a 20.
Assim como você estudou na média, aqui, também para efeito

de cálculo, você usará diferente tratamento quando se tratar
de dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua). Mas para a
finalidade deste estudo não será incluído.
Unidade 3 103

Seção 2 – Gráficos box-plot e ramo e folhas

O gráfico box plot (gráfico de caixa) é uma ferramenta
exploratória de análise de dados, cujo principal propósito é dar ao
usuário um método eficiente de examinar um conjunto de dados,
para se ter uma primeira idéia da distribuição desses dados.
Por sua vez, podemos usar os gráficos ramo e folhas para

representar as distribuições de frequências e também para
pequenos conjuntos dados além de possibilitar a visualização
completa das observações.
Construção de um gráfico ramo e folhas

Na construção, cada observação é dividida em duas partes, o
ramo e as suas folhas, do mesmo jeito que ocorre numa árvore.
Logo que finalizamos a sua construção, se observarmos os dados

coletados gerados em um ângulo de noventa graus, veremos um
diagrama bem semelhante a um histograma, só que feito com
valores em vez de retângulos.
Esta representação possui duas vantagens em relação ao

histograma:
seus valores são os valores reais;
é simples de construir
104

Vejamos um exemplo para aclarar essa visualização!
Exemplo de gráfico ramo e folhas

Imaginemos que desejamos visualizar a distribuição dos valores
de tempo de antiguidade – em meses – dos funcionários de uma
determinada empresa. Coletados esses dados, os 20 valores de
tempo de antiguidade (em meses) já ordenados são:
8, 9, 11, 17, 17, 19, 20, 44, 45, 53, 57, 57, 57, 58, 70, 81, 82, 83,
100, 104.
Podemos, para construir nosso gráfico, organizar os dados,

separando-os pelas dezenas: uma em cada linha do gráfico, da
seguinte forma:
8, 9
11, 17, 17, 19
20
44, 45
53, 57, 57, 57, 58
70
81, 82, 83
100, 104
E, assim obtemos uma primeira aproximação do gráfico. Porém,

como muitos valores, em cada linha, tem as dezenas em comum,
podemos colocar as dezenas em evidência, separando-as das
unidades por um traço:
0 89
1 1779
2 0
3 -
4 45
RAMO 5 37778 FOLHAS
6 -
7 0 Legenda:
8 123 5 | 3 = 53 meses
9 - 10| 4 = 104 meses
10 4
Figura 3.8 – Construção de um diagrama de ramo e folhas
Unidade 3 105

Ao dispor os dados dessa maneira, estamos construindo um

diagrama de ramo e folhas. O lado esquerdo, com as dezenas,
é chamado de ramo, no qual estão dependuradas as unidades,
chamadas folhas, à direita da linha vertical.
Para sabermos o que está sendo representado,

um ramo de folhas deve ter sempre uma legenda,
indicando o que significam o ramo e as folhas. Assim,
se o tempo de empresa dos funcionários estivesse
medido em dias, por exemplo, usando esse mesmo
ramo de folhas, poderíamos estabelecer que o ramo
representaria as centenas e as folhas, as dezenas. Assim,
0|8 seria igual a 80 dias e 10|4 seria igual a 104 dias.
Como podemos agora interpretar este gráfico? Analisando

o ramo e folhas para o tempo de empresa dos funcionários,
percebemos a existência de três grupos:
o grupo com os recém-contratados (até 20 meses);
o grupo com os que já tem algum tempo de empresa (de

44 a 58 meses);
o grupo com os mais velhos (mais de 70 meses) com

destaque, aqui, para dois funcionários que já estão na
empresa à mais de oito anos!
O que mais podemos fazer com este mesmo gráfico do exemplo?

O ramo e folhas também pode ser usado para comparar duas
distribuições de valores. Assim, aproveitando o mesmo ramo
do diagrama do tempo de empresa, podemos fazer o diagrama
das mulheres que trabalham nesta empresa, utilizando o lado
esquerdo. Logo após serem coletados os dados, resultou o
seguinte gráfico:
106

998 0 89
99876610001 1 1779
3111 2 0
5444322 3 -
55 4 45
8651 5 37778
8 6 -
0 7 0
31 8 123
- 9 -
- 10 04
5 11 -
- 12 -
- 13 - Legenda:
- 14 - 5 | 5 | = 55 meses para homem
7 15 - | 5 | 3 = 53 meses para mulher
Figura 3.9 – Gráfico ramo e folhas

Podemos observar que as folhas das mulheres são dependuradas

de modo espelhado, assim como explica a legenda, que agora
deve ser dupla!
Observando a tabela, notamos que as mulheres têm menos tempo de

empresa do que os homens, embora possuam dois funcionários com
mais tempo na empresa. Também podemos observar rapidamente
que a empresa tem mais empregados homens que mulheres.
Construção de um gráfico box-plot

O box-plot é especialmente útil quando trabalhamos com
conjuntos limitados de dados para os quais outras ferramentas,
como histogramas que requerem dados com mais de 30 pontos,
não permitem auxiliar o estudo pois a quantidade de dados pode
ser insuficiente para se obter uma conclusão.
Através da disposição dos valores em ordem crescente, tem-se

uma ideia clara sobre a localização e a dispersão dos dados. Para a
construção do gráfico box–plot, precisamos calcular:
Unidade 3 107

limite inferior;
limite superior;
primeiro quartil;
terceiro quartil;
mediana.
Estas cinco medidas são denominadas de estatística de ordem.
Vejamos as partes componentes de um box-plot:
Figura 3.10 – Componentes de um box-plot

As informações dadas pelo resumo destes cinco números são

apresentadas na forma de um gráfico de caixa que agrega uma
série de informações sobre a distribuição, como:
posição;
dispersão;
assimetria;
caudas;
dados discrepantes (outliers).
108

Figura 3.11 – Componentes de um box-plot: nomes usuais

Assim, a posição central dos valores é dada pela mediana e a

dispersão, pela amplitude interquartílica; as posições relativas da
mediana e dos quartis e o formato dos bigodes dão uma noção da
simetria e do tamanho das caudas da distribuição.
Algumas propriedades dos box-plot para a sua interpretação

Quando a distribuição dos dados é simétrica, a linha da
mediana estará localizada no centro do retângulo e as duas
linhas que partem das extremidades do retângulo terão quase os
mesmos comprimentos.
Quando a distribuição dos dados é assimétrica à direita, a linha

da mediana estará mais próxima de Q1 do que de Q3; e, por sua
vez, quando a distribuição é assimétrica à esquerda, a linha da
mediana estará mais próxima de Q3 do que de Q1.
Assim, podemos observar os seguintes exemplos de assimetrias

negativas, positivas e dados simétricos, respectivamente, de
esquerda à direita:
Unidade 3 109

Figura 3.12 – Assimetrias

O box plot também pode ser desenhado na posição vertical ou

na horizontal. Pode ser utilizado na comparação de dois ou mais
conjuntos de dados e na comparação com outras ferramentas, por
exemplo, junto com os histogramas.
Dicas para a construção do box-plot

colete os n dados referentes à variável de interesse;
disponha os dados em ordem crescente. Calcule a

mediana, Q1 e Q3;
identifique o valor (min) e o valor (max) da amostra.
trace um eixo e o marque com uma escala adequada e de

fácil leitura;
sobre o eixo, desenhe um retângulo da seguinte forma:
»» posicione a extremidade inferior do retângulo em Q1;
»» posicione a extremidade superior do retângulo em Q3

e, no interior do retângulo, trace a mediana;
»» feche o retângulo para obter o box;
110

desenhe uma linha a partir da extremidade inferior

do retângulo com distância de até 1,5x(Q3-Q1) para
construir o bigode inferior;
desenhe uma linha a partir da extremidade superior

do retângulo com uma distância de 1,5x(Q3-Q1) para
construir o bigode superior;
desenhe asteriscos para marcar as observações localizadas

a uma distância de 1,5x(Q3-Q1) a 3x(Q3-Q1) de cada
extremidade do retângulo, que são os possíveis outliers.
desenhe círculos para marcar as observações localizadas a

uma distância superior a 3x(Q3-Q1) de cada extremidade
do retângulo, que são os prováveis outliers.
registre as informações importantes que devam constar

no gráfico, como título, período, coleta de dados,
tamanho da amostra, identificação dos eixos.
Os valores que estiverem acima do limite superior (haste

superior) ou abaixo do limite inferior (haste inferior) do box-plot
serão considerados outliers.
Estes valores são considerados discrepantes, ou seja, não fazem

parte do comportamento esperado do grupo em estudo.
Unidade 3 111

Assim o box-plot resulta:
Figura 3.13 – Box-plot

Complicado? Sim, um pouco, mas com a ajuda de um “truque” no

Excel, podemos fazer, ao menos, um esquema de box-plot,ainda
que o melhor seja sempre trabalhar com algum programa de
estatística que esteja preparado para desenhar este tipo de gráfico.
Dentre os programas grátis de estatísticas que podem

ser achados na internet, uns dos mais completos
é o PAST (http://folk.uio.no/ohammer/past/) da
Universidade de Oslo (Noruega).
Na internet, podem ser achados vários tutoriais explicando como

fazer um box-plot completo no Excel, é só procurar com um site
de buscas como o Google ou outro semelhante que você esteja
acostumado a utilizar no seu dia a dia.
112

Exemplo de como construir um box-plot no Excel.

Em uma nova planilha, digite os seguintes dados, que são
os valores necessários para construir o box-plot e que foram
calculados a partir de três conjuntos de dados de um certo
levantamento de campo:
Figura 3.14 – Box-plot em Excel

a) selecionar as células A2:D7;
b) em seguida, ir ao menu Inserir e clicar em gráfico;
c) Na guia tipos padrão, clique em ações, depois em tipo

de gráfico e, em seguida, clique no quarto gráfico de
subtipo:

Unidade 3 113

d) clique em Avançar;
e) na guia Intervalo de dados, clique em linhas, depois em

sequências em e, em seguida, clique em Avançar;
f) na guia Legenda, clique para desmarcar a caixa de

seleção Mostrar legenda;
g) na guia Eixos, clique para desmarcar a caixa de seleção

eixo (Y) em eixo secundário e, em seguida, clique em
Concluir;
h) clique uma vez em qualquer uma das colunas coloridas

para selecionar a série. Não clique em uma das colunas
em branco;
i) no menu Gráfico, clique em Tipo de gráfico;
j) em Tipo de gráfico, clique em Linha e, em seguida,

clique em OK.

k) uma linha que conecta as três colunas em branco

aparecerá no gráfico;
l) clique uma vez na linha e, em seguida, clique com o

botão direito do mouse em formatar serie de dados para
indicar nenhuma linha e marcador;
114

m) pronto, o esquema do box-plot já está construído.

Somente agora você deve botar as informações
importantes do gráfico.

Seção 3 – Medidas de dispersão

Para compreender melhor o que são as medidas de dispersão,
acompanhe o exemplo. A realização de testes em três grupos de
pessoas resultou nos escores descritos a seguir.
Tabela 3.3 – Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos
Grupos Escores (em pontos) obtidos por pessoa (10 pessoas) Total
Grupo 1: 6 6 6 6 6 6 6 6 6 6 60
Grupo 2: 1 8 9 2 6 10 5 8 7 4 60
Grupo 3: 5 6 7 7 6 5 6 7 5 6 60
Unidade 3 115

Se você calcular a média dos escores para cada grupo, obterá os

seguintes resultados:
Para o grupo 1:
, ou seja, 6 pontos é o escore médio;
Para o grupo 2:
Para o grupo 3:
Observe que os escores médios dos três grupos são iguais. E

agora? Como diferenciar um grupo do outro? Olhando somente
para os dados você pode tirar algumas conclusões: no grupo 1,
as pessoas têm o mesmo escore; no grupo 2, os escores são
diversificados; e, no grupo 3, existe uma pequena diversificação,
ou seja, os escores estão bem próximos da média.
Pode-se afirmar, quanto à dispersão das séries anteriores, que:
grupo 1: não é uma série em que os dados apresentam

dispersão com relação à média, ou seja, os dados estão
totalmente concentrados na média;
grupo 2: é uma série de dados em que os valores

observados estão bastante dispersos, ou seja, apresenta
muitos valores distantes da média. Podemos dizer que é
uma série dispersa;
grupo 3: há uma pequena diferença de alguns dados

com relação à média, ou seja, apresenta uma pequena
dispersão com relação à média: os dados estão
concentrados em torno da média.
Em resumo, nos grupos 1 e 3, a média pode servir como uma

medida representativa, mas, no grupo 2, a média não resulta
representativa.
116

Para identificar esses tipos de situações é que usamos

as medidas de dispersão. Essas medidas são a maneira
mais adequada para quantificar a dispersão dos dados
e avaliar a representatividade da média.
As principais medidas, denominadas de dispersão absolutas são:

amplitude total, desvio médio simples, variância e desvio padrão.
O desvio médio simples, não menos importante, não será visto

neste estudo, pois, para o objetivo que se pretende alcançar, a
variância e o desvio padrão são mais adequados.
Cálculos da variância e do desvio padrão

Para começar a trabalhar com dispersão, é necessário que você
conheça as definições e as formas de representação da variância e
do desvio padrão.
A variância é a média dos quadrados dos desvios

de cada valor da série com relação à média. Ficou
complicado? Não se preocupe, a seguir você vai
aprender como calcular!
O desvio padrão é a raiz quadrada da variância, pois

assim fica mais fácil analisar e comparar com a média;
se usássemos a variância, as unidades seriam ao
quadrado, enquanto que o desvio padrão apresentaria
a mesma unidade de medida que a média.
Veja a seguir como representá-las.
População Amostra
σ2 (x) → variância S2(x) → variância
σ (x) → desvio padrão s(x) →desvio padrão

σ = 18ª letra do alfabeto grego, chama-se sigma.
Quadro 3.2 – Representação do desvio padrão

Unidade 3 117

A variância e o desvio padrão para dados brutos

Neste item, você vai aprender como calcular a variância e o
desvio padrão para dados brutos. Preste atenção! A fórmula para
população e para amostra são diferentes.
O quadro a seguir apresenta as fórmulas utilizadas para calcular a

variância e o desvio padrão.
Medidas População Amostra
Variância
Desvio padrão
σ = 18ª letra do alfabeto grego, chama-se sigma.
Quadro 3.3 – Fórmulas para o cálculo de medidas de dispersão com dados brutos
Observação: A diferença mais importante entre as

duas fórmulas da variância são os denominadores. Para
a população, usamos n e, para a amostra, usamos n – 1.
Como, ao trabalharmos com uma amostra para estimar
valores de uma população, a variabilidade dos dados é
maior, então, dessa maneira, é mais indicado usarmos
n – 1 para que não subestimemos a dispersão. O n – 1 é
usado, nesse caso, como uma correção para a variância
da amostra. Para amostras com mais de 30 elementos,
essa correção torna-se irrelevante.
Para você entender melhor, imagine que a média de depósitos

diários de uma agência bancária seja de 120.000 reais e a
variância, de 25.000 reais ao quadrado. Seria difícil comparar
reais com reais ao quadrado. Para tanto, ao se fazer uso do desvio
padrão, o qual corresponde à raiz quadrada de 25.000 reais ao
quadrado, teríamos 5.000 reais. E esta é a mesma unidade de
medida da média.
Daremos continuidade ao exemplo, para calcular a variância e o

desvio padrão.
118

Veja passo a passo

Exemplo: Uma vez dadas as notas: 6; 7; 7,8; e 8.
Passo 1: calcular a média: observe que, na média para a população,

usa-se a letra grega .
Passo 2: – agora, calcular os desvios (xi − ).
(x1 − ) = (6 – 7,20) = −1,20
(x2 − ) = (7 – 7,20) = −0,20
(x3 − ) = (7,8 – 7,20) = 0,60
(x4 − ) = (8 – 7,20) = 0,80
Passo 3: elevar ao quadrado cada desvio (xi − )2.
(x1 − )2 = (1,20)2 = 1,4400
(x2 − )2 = (−0,20)2 = 0,0400
(x3 − )2 = (0,60)2 = 0,3600
(x4 − )2 = (0,80)2 = 0,6400
Unidade 3 119

Passo 4: calcular a média dos quadrados dos desvios, ou seja, a

variância. Aqui, você vai calcular para a população e para a amostra.
Caso sejam dados de uma população:
Então: σ2(x) = 0,62
Caso sejam dados de uma amostra:
Então: s2(x) = 0,83
Passo 5: calcular o desvio padrão, calculando a raiz da variância.
Interpretação dos dados – Para dados de uma

população, a variabilidade das notas é de 0,79 pontos.
Para dados de uma amostra, a variabilidade das notas é
de 0,91 pontos.
120

A variância e o desvio padrão para dados agrupados sem intervalos

(variável discreta)
Agora, você vai calcular a variância e o desvio padrão para dados
que foram organizados em tabelas, ou seja, após a coleta, eles
foram organizados em categorias e organizados em tabelas onde
os dados estão agrupados sem intervalos.
Observe as fórmulas que são utilizadas para calcular este tipo de

dados, a variância e o desvio padrão.
Variância
Desvio padrão
Quadro 3.4 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados sem intervalos
Acompanhe o exemplo a seguir para compreender como realizar

o cálculo dos dados agrupados sem intervalos.
Exemplo: A tabela apresenta dados referentes à remuneração de

funcionários de uma empresa. Foram levantados o número de
funcionários e sua faixa salarial, em número de salários-mínimos.
Unidade 3 121

Tabela 3.4 – Remuneração de funcionários
(−2,33) 2 =5,4289 5,4289.29 = 157,4381

1 − 3,33 = −2,33
Nº de
Nº de salários -
funcionários x i . (fi) (x i − x ) (x − x )
2 2
(x − x ) . (fi)
mínimos (x i )
(fi)
1 29 29 -2,33 5,4 1 157,4381
2 28 56 -1,33 1,7 7 49,5292
3 20 60 0,33 0,1 1 2,1780
4 18 72 0,67 0,4 5 8,0820
5 16 80 1,67 2,7 8 44,4560
6 15 90 2,67 7,1 3 106,9335
7 9 63 3,67 13,4 7 121,1607
Σ 135 450 489,7757
2
Σ fi Σ x i .f i Σ ( x i − x ) .f i
Quando realizar o passo a passo desses cálculos,

sugerimos que crie mais quatro colunas à direita para
auxiliar em seus cálculos.
Agora, acompanhe o cálculo passo a passo
Passo 1: inicie por somar a coluna das frequências simples (fi) para
obter Σfi (frequência total); Σfi = 135.
Passo 2: calcule a média: multiplique cada xi por sua correspondente

fi e escreva na coluna xi.fi, some os valores calculados e escreva no
final da coluna esse resultado, que é:
Σxi.fi; Σxi.fi = 450
122

Passo 3: divida o resultado do passo 2 (Σ xi.fi ) pelo resultado do

passo 1 (Σ fi).
Para facilitar os cálculos, arredondamos a média em duas casas

decimais.
Passo 4: calcule a quarta coluna, (xi − ), subtraindo o xi de cada linha

pela média:
1 − 3,33 = −2,33
2 − 3,33 = −1,33
3 − 3,33 = −0,33
4 − 3,33 = 0,67
5 − 3,33 = 1,67
6 − 3,33 = 2,67
7 − 3,33 = 3,67
Passo 5: calcule a quinta coluna, elevando os valores da quarta

coluna ao quadrado (xi − )2.
(−2,33)2 = 5,4289
(−1,33)2 = 1,7689
(−0,33)2 = 0,1089
(0,67)2 = 0,4489
(1,67)2 = 2,7785
(2,67)2 = 7,1289
(3,67)2 = 13,4689
Neste passo, usa-se quatro casas decimais, deixando para

arredondar para duas casas somente o resultado.
Unidade 3 123

Passo 6: calcule a sexta coluna, multiplicando os valores da quinta

pela frequência simples de cada linha, (xi − )2.fi:
5,4289 . 29 = 157,4381
1,7689 . 28 = 49,5292
0,1089 . 20 = 2,1780
0,4489 . 18 = 8,0802
2,7785 . 16 = 44,4560
7,1289 . 15 = 106,9335
13,4689 . 9 = 121,1607
Passo 7: some os valores obtidos na sexta coluna, Σ(xi − )2.fi.
(Σ(xi − )2.f i = 489,7757
Passo 8: calcule a variância.
Na variância, serão usadas quatro casas decimais, pois ainda será

necessário extrair a raiz quadrada para chegar ao desvio padrão.
124

Passo 9: calcule o desvio padrão.

população, a variabilidade do número de salários
é de 1,90 salários. Para dados de uma amostra, a
variabilidade do número de salários é de 1,91 salários.
Dados agrupados com intervalos (variável contínua)

Nesse item, você poderá ver como se calcula a variância e o desvio
padrão para dados agrupados com intervalos (variável contínua).
Observe as fórmulas que são utilizadas para calcular este tipo de

dados. Use para:
Variância
Desvio padrão
Quadro 3.5 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados com intervalos
Para o caso de dados agrupados com intervalos, usa-se

o ponto médio – PM – de cada intervalo, pois não se
tem um valor específico para usar. O ponto médio
serve como uma boa aproximação.
Unidade 3 125

Agora, vamos analisar um exemplo para realizar os cálculos de

medidas de dispersão com dados agrupados com intervalos.
55,5025.12 = 666,0300
17,3 − 24,75 = −7,45
(−7,45) 2 = 55,5025
Nº de
Nº de vendas
representantes PM PM. fi PM i − x (PM i − x )
2 2
(PM i − x ) . fi
(em mil reais)
(fi )
15,9 | -- 18,7 12 17,3 207,6 −7,45 55,5025 666,0300
18,7 | -- 21,5 8 20,1 160,8 −4,65 21,6225 172,9800
21,5 | -- 24,3 12 22,9 274,8 −1,85 3,4225 41,0700
24,3 | -- 27,1 5 25,7 128,5 0,95 0,9025 4,5125
27,1 | -- 29,9 3 28, 5 85,5 3,75 14,0625 42,1875
29,9 | -- 32,7 6 31,3 187,8 6,55 42,9025 257,4150
32,7 | -- 35,5 10 34,1 341,0 9,35 87,4225 874,2250
Total ( Σ fi ) 56 1.386 2.058,4200
Σ fi Σ PM i . fi 2
Σ ( PM i − x ) .f i
Ao realizar o passo a passo, crie uma nova tabela com

mais cinco colunas à direita para auxiliar em seus cálculos.
Acompanhe os cálculos passo a passo
Passo 1: primeiro some a coluna das frequências simples (fi) para

obter Σ fi (frequência total); Σ fi = 56.
Passo 2: calcule a média; nesse caso, calcule o ponto médio de cada

intervalo, multiplique cada PM por sua correspondente fi e escreva
na coluna PM.fi; some os valores calculados nessa coluna e escreva
o total. Esse resultado é o Σ PM.fi: PMi.fi = 1.386. Agora, divida esse
resultado (Σ PM.f) pelo resultado do passo 1 (Σ fi). Assim, obtemos:
126

Passo 3: calcule a quinta coluna, subtraindo o PMi de cada linha pela

média PMi − .
17,3 − 24,75 = −7,45

20,1 − 24,75 = −4,65
22,9 − 24,75 = −1,85
25,7 − 24,75 = 0,95
28,5 − 24,75 = 3,75
31,3 − 24,75 = 6,55
34,1 − 24,75 = 9,35
Passo 4: calcule a sexta coluna, elevando os valores da quinta ao

quadrado, (PMi − )2.
(−7,45)2 = 55,5025
(−4,65)2 = 21,6225
(−1,85)2 = 3,4225
(0,95)2 = 0,9025
(3,75)2 = 14,0625
(6,55)2 = 42,9025
(9,35)2 = 87,4225
Passo 5: calcule a sétima coluna, multiplicando os valores da sexta

pela frequência simples de cada linha, (PMi − )2.fi.
55,5025 . 12 = 666,0300
21,6225 . 8 = 172,9800
3,4225 . 12 = 41,0700
0,9025 . 5 = 4,5125
14,0625 . 3 = 42,1875
42,9025 . 6 = 257,4150
87,4225 . 10 = 874,2250
Passo 6: some os valores obtidos na sexta coluna, Σ (PMi − )2.fi.
Σ (PMi − )2.f i: = 2.058,4200.
Unidade 3 127

Passo 7: calcule a variância.
Passo 8: calcule o desvio padrão.

população, a variabilidade do volume de vendas
é de 6,06 mil reais. Para dados de uma amostra, a
variabilidade do volume de vendas é de 6,12 mil reais.
Interpretação do desvio padrão

O desvio padrão é uma importante medida de dispersão. É com
ele que você irá quantificar a dispersão dos dados de uma série
com relação à sua média. Preste atenção:
128

quanto maior o valor do desvio padrão, mais dispersos

estão os valores. Pode-se dizer, também, que mais
distantes estão da média;
quanto menor o valor do desvio padrão, menos dispersos

estão os valores. Pode-se dizer, também, que mais
próximos estão da média.
Veja a figura a seguir para compreender melhor o que foi

colocado.
Figura 3.18 – Quanto mais distantes da média, mais dispersos os dados estão
Fonte: Triola (1999, p. 42).
Outra utilização do desvio padrão

Muitas séries, quando representadas por seu polígono de
frequências, com certo ajuste nas curvas, apresentam um formato
semelhante a um sino, uma curva simétrica (observando que a
média, a moda e a mediana estão posicionadas ao centro), como
mostra o gráfico a seguir.
Gráfico 3.1 – Gráfico da curva normal

Unidade 3 129

Para séries de dados que apresentam esse tipo de representação,

pode-se trabalhar com a área abaixo do polígono. A área abaixo é
proporcional à frequência total. Essa curva é chamada de Curva
Normal ou Curvas de Gauss, e suas principais características são:
a curva se caracteriza por ter a forma de um sino;
a curva normal é simétrica com relação à média;
a área limitada pela curva e pelo eixo das abscissas é 1

ou 100%;
a curva é assintótica, isto é, aproxima-se indefinidamente

do eixo das abscissas sem tocá-lo;
a curva normal é unimodal, isto é, possui um só pico ou

ponto de frequência máxima, ponto este que coincide
com a moda, a média e a mediana.
Como relacionar a curva com o desvio padrão? Veja a curva a seguir:
Gráfico 3.2 – Gráfico da curva normal

130

Exemplo: Numa série em que μ = 80 e o σ(x)=3, pode-se

interpretar estes valores da seguinte forma:
os valores da série estão concentrados em torno da

média, que é de 80 unidades;
o intervalo [μ − σ(x); μ + σ(x)] contém aproximadamente

68,26% dos elementos da série, ou seja, o intervalo [77;83];
o intervalo [μ − 2σ(x); μ + 2σ(x)] contém

aproximadamente 95,44% dos elementos da série, ou
seja, o intervalo [74;86];
o intervalo [μ − 3σ(x); μ + 3σ(x)] contém

aproximadamente 99,74% dos elementos da série, ou seja,
o intervalo [71;89];
Seção 4 – Coeficiente de variação
Séries de dados com médias iguais

Acompanhe o exemplo: considere dois grupos de pessoas, nos
quais foram feitos levantamentos de suas rendas. Os resultados
deste levantamento foram os seguintes:
Tabela 3.6 – Resultado do levantamento de renda
Grupo 1 Grupo 2
Média: Média:
μ = 122 pontos μ = 122 pontos
Desvio padrão: Desvio padrão:
σ(x) = 4,5 pontos σ(x) = 7,5 pontos
Unidade 3 131

Compare a dispersão das duas séries:
note que as médias são iguais;
o desvio padrão do grupo 1 é 4,5, e o do grupo 2 é 7,5;

portanto, o grupo que apresenta maior dispersão quanto
ao nível de renda é o grupo 2;
conclusão: os níveis de renda do grupo 2 são mais

dispersos com relação ao grupo 1 (valores mais distantes
da média); ou: os integrantes do grupo 1 tem renda mais
semelhantes entre eles que os integrantes do grupos 2.
Para comparar duas séries de dados usando medidas

de dispersão absolutas (variância e desvio padrão) é
necessário que as médias sejam iguais, caso contrário,
usamos uma medida de dispersão relativa que veremos
nesta seção.
Séries de dados com médias diferentes

Como você pôde observar no item anterior, para comparar duas
séries de dados quanto a suas dispersões, pode-se usar valores
absolutos dos desvios padrão, mas somente quando as médias
são iguais.
E quando as médias são diferentes?
Nesse caso, utiliza-se o Coeficiente de Variação (CV), que é

uma medida de dispersão relativa. Veja a seguir.
132

Medida de dispersão relativa – o Coeficiente de Variação

O coeficiente de variação é a relação do desvio com a média. Veja
a fórmula a seguir:
Tabela 3.7 – Fórmula do coeficiente de variação
Para a população Para a amostra
A série que apresentar maior coeficiente de variação

será realmente a série de maior dispersão dos dados. O
resultado é expresso em percentual (%), ou seja, quanto
o desvio padrão representa da média.
Acompanhe o exemplo a seguir para compreender como realizar

o cálculo.
Exemplo: Considere dois grupos de pessoas, nos quais foram

feitos levantamentos de suas rendas. Os resultados deste
levantamento foram os seguintes:
Tabela 3.8 – Resultado do levantamento
Grupo 1 Grupo 2
Desvio padrão: Desvio padrão:
σ(x) = 9,8 reais σ(x) = 7,5 reais
Média: Média:
μ = 145 reais μ = 95 reais
note que as médias são diferentes;
o desvio padrão do grupo 1 é 9,8; e o do grupo 2 é 7,5;

portanto, o grupo que apresenta maior dispersão absoluta
quanto ao nível de renda é o grupo 1;
Unidade 3 133

como as médias são diferentes, devemos calcular o

coeficiente de variação, pois, simplesmente pela dispersão
absoluta, não podemos afirmar nada (se fossem iguais,
bastaria a dispersão absoluta).
»» Para o grupo 1:
»» Para o grupo 2:
O grupo que apresenta maior coeficiente de variação é o grupo 2.

Ou seja, os níveis de renda observados no grupo 2 são mais
dispersos com relação ao grupo 1 (valores mais distantes da média).
Quais outras conclusões você poderia tirar com relação

aos dois grupos?
Comparando os dois, você poderia dizer que, no grupo 1, as

pessoas têm a renda mais próxima da média do grupo que no
Grupo 2, que, por sua vez, as pessoas apresentam níveis de renda
mais diferenciado da média do grupo, comparando os dois grupos.
Para comparar a dispersão dos dados de duas séries de

médias diferentes, usamos o coeficiente de variação.
Ele compara o desvio padrão com a média (proporção)
entre o desvio padrão e a média da série, sendo, assim,
considerado uma forma mais eficaz de comparação e,
portanto, prevalecendo sobre a absoluta.
134

Síntese
Nessa unidade, você pôde estudar e compreender “ferramentas”

que irão auxiliá-lo na prática de sua profissão.
Você pôde conhecer os tipos de medidas de posição e calcular

e interpretar a média, a moda e a mediana e pôde, também,
compreender e calcular separatrizes. Estudou como se calculam
as diversas medidas estatísticas, tanto para dados brutos ou
agrupados, com e sem intervalos.
Também foram vistos os gráficos box-plot e ramo e folhas como

ferramentas exploratórias de análise de dados que são capazes de
examinar um conjunto de dados para se ter uma primeira ideia da
distribuição deles.
Nessa unidade, você estudou, ainda, uma medida muito

importante em Estatística: a medida de dispersão. Sem estudar
estas medidas, muitas vezes fica difícil de definir se a média
seria ou não representativa de uma série de dados. Além disso,
você conheceu o método utilizado para comparar dados com
médias diferentes, largamente utilizado em estudos de dados e
tratamentos estatísticos.
Unidade 3 135


1) Uma empresa procurou estudar a ocorrência de uso de drogas lícitas –

bebidas alcoólicas – por seus empregados, tendo, para isso, realizado
um levantamento sobre o número de dias por semana que cada um
dos empregados costuma beber. Calcule e interprete a média. Os
dados correspondentes são:
Consumo de bebidas alcoólicas por semana pelos funcionários

Nº de dias (xi) Nº de func. (fi) xi.fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (Σfi) 64
136

2) Os dados seguintes representam a renda de uma amostra de famílias

de um bairro de classe baixa de Florianópolis, em reais (dados fictícios).
Calcule e interprete a média.
Renda de famílias de um bairro de classe baixa de Florianópolis

Renda (R$) No de famílias (fi) PM PM.fi
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total (Σfi) 36
Unidade 3 137

3) Nos itens a seguir, estão dois conjuntos de dados. Calcule a mediana

para cada um deles e interprete seus resultados.
a) Conjunto 1
15 19 13 21 16 17 15 12 13
Sugestão: use a tabela a seguir para organizar e posicionar os dados.
b) Conjunto 2
17 18 14 14 15 15 16 16
Sugestão: use a tabela abaixo para organizar e posicionar os dados.
138

4) Nas opções a seguir, estão três conjuntos de dados. Encontre a moda

para cada um deles e interprete seus resultados.
a) Conjunto 01
7 6 5 8 2 1 3 2 1
1 7 6 8 5 1 2 2 7
b) Conjunto 02
5 6 8 2 3 5 3 3
2 6 5 8 3 2 5 6
c) Conjunto 03
5 6 3 7 5 3 2 1
1 6 7 2 8 4 8 4
Unidade 3 139

5) Em um grupo de pacientes acometidos de fobias, foi levantado o

tempo em tratamento em anos, conforme tabela abaixo. Calcule o Q3, o
D9 e o P35 e interprete seus resultados.
Tempo em tratamento de fobias em anos:
4 6 8 2 5 9 4 3 8 9 5 4
Use a tabela abaixo para organizar e posicionar os dados.
6) Os dados a seguir representam o tempo em minutos usados por um

grupo de seis pessoas na realização de um teste. Calcule a variância e o
desvio padrão, considerando como uma população.
Tempo (em min.): 25, 22, 36, 20, 29, 38;
140

7) Os escores obtidos por cinco pessoas em um teste estão relacionados

a seguir. Calcule a variância e o desvio padrão, considerando como
uma amostra.
Tempo: 15, 10, 9, 23, 31.
8) Uma empresa procurou estudar a ocorrência de uso de drogas

lícitas – bebidas alcoólicas – por seus empregados, tendo, para isso,
tem-se realizado um levantamento sobre o número de dias por
semana que cada um dos empregados costuma beber. Calcule a
variância e o desvio padrão, considerando que os dados são de uma
amostra (sugere-se utilizar colunas para facilitar o cálculo). Os dados
correspondentes são:

Nº de dias (xi) Nº de func. (fi) xi.fi (xi – ) (xi – )2 (xi – )2. fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (Σfi) 64
Unidade 3 141

9) Na tabela a seguir, estão relacionados dados relativos à idade de um

grupo de 63 estudantes matriculados numa disciplina da Unisul Virtual.
Calcule a variância e o desvio padrão, considerando que são dados da
população (sugere-se utilizar colunas para facilitar o cálculo).
Idade dos estudantes da disciplina de Métodos Estatísticos a distância
Idade (xi) Nº de estud. (fi) xi.fi (xi – ) (xi – )2 (xi – )2. fi

17 5
18 20
19 22
20 10
21 6
Total (Σfi) 63
142

10) Os dados abaixo representam a renda de uma amostra de famílias de

um bairro de classe baixa de Florianópolis, em reais. (dados fictícios).
Calcule a variância e o desvio padrão, considerando como sendo dados
de uma amostra:

Nº de famílias
Renda (R$) PMi PMi.fi (PMi – ) (PMi – )2 (PMi – )2. fi
(fi)
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total (Σfi)
11) Analise cada caso, comparando quanto à dispersão dos dados e

responda às perguntas:
a) Qual das séries apresenta maior dispersão absoluta (comparar os
desvios padrão)?
b) Qual das séries apresenta maior dispersão relativa (comparar os
coeficientes de variação)?
c) Conclua qual das séries realmente apresenta maior dispersão (não
esqueça que o coeficiente de variação é mais eficaz para determinar a
dispersão de uma série).
Unidade 3 143

11.1)
Série A Série B
μ = 57; σ(x) = 5,6 μ = 96; σ(x) = 8,2
11.2)
Série A Série B
μ = 64; σ(x) = 12 μ = 96; σ(x) = 18
11.3)
Série A Série B
μ = 195; σ(x) = 12 μ = 125; σ(x) = 12
11.4)
Série A Série B
μ = 869; σ(x) = 201 μ = 625; σ(x) = 198
144

12) Durante o processo de fabricação de parafusos, fez-se uma

amostragem aleatória e, de cada elemento obtido, calculou-se a
diferença entre o peso (em miligramas) que o parafuso devia ter
segundo o projeto e o real peso logo de fabricado, obtendo os
seguintes dados.
Diferença de pesos em miligramas:
40,208
42,303
43,262
48,914
49,46
52,681
52,764
52,87
57,784
61,411
68,02
71,615
72,471
74,176
75,973
78,769
81,412
81,736
82,756
106,354
Para analisar o comportamento das discrepâncias dos pesos, trace

o gráfico box-plot do conjunto de dados amostrais da fábrica de
parafusos.
Unidade 3 145

Saiba mais

BARBETTA, Pedro Alberto. Estatística aplicada às ciências

sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva,

2001.
LEVIN, Jack. Estatística aplicada às Ciências Humanas. São

Paulo: Habra, 1987.
SILVA, Ermes Medeiros da. Estatística. v. 1. São Paulo: Atlas,

1996.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:

LTC, 1999.
146

4
UNIDADE 4
Cálculo e distribuição de
probabilidades
Calcular e interpretar probabilidades.
Compreender variável aleatória e distribuição de

probabilidades.
Compreender o que é variável aleatória discreta e

contínua.
Compreender distribuição discreta e contínua de

probabilidades.
Calcular probabilidade usando distribuição contínua de

probabilidades.
Seções de estudo
Seção 1 Principais conceitos
Seção 2 Cálculo de probabilidade
Seção 3 Noções sobre variável aleatória e distribuição de

probabilidades
Seção 4 Os tipos de distribuições de probabilidades
Seção 5 Cálculo de probabilidade usando a distribuição


Nesta unidade, você iniciará o estudo da Estatística Indutiva, que
tem como base o estudo de Probabilidades.
Talvez você deva estar se perguntando: Probabilidade? O

que é? Tenho certeza que muitas vezes você já pensou em
“possibilidades” de algo acontecer. Será que vai chover? Será
que serei escolhido para participar de um grupo? Será que vou
encontrar meu amigo hoje? Etc.
Muitas vezes, não podemos prever acontecimentos como esses,

ou seja, podem acontecer ou não. Você até poderia associar isso
tudo à sorte ou ao azar, enfim, ao acaso. E é aqui que o estudo
de probabilidade entra. Tentar formular e calcular modelos
matemáticos que definam essas situações e possibilite a você tomar
suas decisões e, assim, conduzir sua vida, suas experiências e seus
caminhos; este é um dos principais objetivos desta unidade.
Nessa unidade, você também conhecerá como é possível

expressar em números algumas situações com a finalidade de
possibilitar um melhor tratamento matemático a elas. Serão
apresentados os tipos de distribuições de probabilidades e como
se calcula probabilidade usando a distribuição discreta e a
distribuição contínua de probabilidades.
Você está convidado a conhecer um pouco desse assunto! Vamos lá?!
Bons Estudos!
148

Seção 1 – Principais conceitos

Você conhecerá, nesta seção, o que são fenômenos, o que é
um espaço amostral e o que são eventos. Estes são alguns dos
conceitos mais importantes que são utilizados na Probabilidade.
O objetivo é que você compreenda como aplicar estes
conhecimentos no seu dia a dia!
Fenômenos (ou experimentos)

Você pode entender por fenômeno qualquer acontecimento, seja
ele natural ou não.Eles podem ser classificados em dois tipos:
determinísticos ou aleatórios.
Fenômenos determinísticos: são fenômenos em que as

condições iniciais determinam um único resultado.
Fenômenos aleatórios: são fenômenos em que as

condições iniciais não determinam a possibilidade da
existência de um resultado em particular.
Em resumo, quando você pode determinar o resultado de um

fenômeno, você irá chamá-lo de determinístico, mas quando os
resultados do fenômeno não podem ser determinados, você irá
chamá-lo de aleatório, pois pode apresentar qualquer resultado
dentro de um grupo de esperados (mais de um).
Veja, a seguir, exemplos de cada um deles.
Unidade 4 149

Para ilustrar, considere dois dados diferentes, o dado 1

tem as faces com o mesmo número de pontos em cada
face, e o dado 2 é um dado normal, tem as faces com
números de pontos diferentes.
 Dado 1: tem as faces com o mesmo número de
pontos;
 Dado 2: é um dado normal, tem as faces com
números de pontos diferentes e não é viciado (observe
que um dado viciado é aquele que, ao ser jogado,
sempre sai o mesmo número).
Fenômeno determinístico – se você jogar o dado

1 várias vezes, sob as mesmas condições, sempre
irá apresentar o mesmo número de pontos na face
voltada para cima. Nesse caso, você pode dizer que
é um fenômeno determinístico, pois não existe outra
possibilidade de resultado e é possível prever qual será.
Fenômeno aleatório – se você jogar o dado 2 várias

vezes, sob as mesmas condições, poderá apresentar
resultados diferentes a cada lançamento. Nesse caso,
você pode dizer que é um fenômeno aleatório, pois
existem várias possibilidades de resultado e não é
possível prever qual será.
A partir do exposto, conclui-se que o estudo de probabilidade

é baseado nos fenômenos aleatórios. Você pode dizer que o
estudo de probabilidades está intimamente ligado ao acaso.
Espaço amostral
Observe que quando se trabalha com experimentos que admitem
mais de um resultado, torna-se interessante definir o conjunto
de todos esses resultados; nesse caso, você pode chamar esse
conjunto de espaço amostral.
O símbolo para representar o
conjunto do espaço amostral é S
(letra maiúscula).
Espaço amostral é o conjunto de todos os possíveis
resultados de um experimento (fenômeno) aleatório.
150

Veja, a seguir, exemplos sobre o espaço amostral.
Ao verificar os exemplos, lembre-se de que o número

de elementos do conjunto do espaço amostral é
representado por n(S):
n(S) = número de elementos de S.
Exemplo 1: você pode usar o dado 2, citado no exemplo

anterior, e estudar todas as possibilidades. Pode-se construir o
seguinte conjunto:
S = {1, 2, 3, 4, 5, 6}: observe que são todas as possibilidades de

pontos de um dado normal.
Exemplo 2: um médico trabalha com um grupo de pessoas

com problemas de alcoolismo. O grupo é composto por cinco
pessoas. Duas delas apresentam cirrose e três não apresentam
cirrose (veja legenda).
Cn – Pessoa número ‘n’ com cirrose

Pn – Pessoa número ‘n’ sem cirrose
Ex.: C1 – pessoa número 1 com cirrose;

P1 – pessoa número 1 sem cirrose.
Pode-se construir o seguinte conjunto:
S = {C1, C2, P1, P2, P3}: observe que são todas as possibilidades
entre as pessoas do grupo.
Exemplo 3: um psicólogo trabalha com um grupo de pessoas

e estuda os distúrbios do sono. O grupo é composto por
sete pessoas. Cinco delas apresentam distúrbios e duas não
apresentam distúrbios (veja legenda).
Dn – Pessoa número ‘n’ com distúrbio

Pn – Pessoa número ‘n’ sem distúrbio
Ex.: D1 – pessoa número 1 com distúrbio;

P1 – pessoa número 1 sem distúrbio.
Unidade 4 151

S = {D1, D2, D3, D4, D5, P1, P2}: observe que são todas as
possibilidades entre as pessoas do grupo.
Exemplo 4: um grupo de pessoas que apresentam diferenças na

cor do cabelo (veja legenda).
Pn – Pessoa número ‘n’ com cabelos pretos

Ln – Pessoa número ‘n’ com cabelos louros
Cn – Pessoa número ‘n’ com cabelos castanhos
Rn – Pessoa número ‘n’ com cabelos ruivos
Ex.: P1 – pessoa número 1 com cabelos pretos;

L1 – pessoa número 1 com cabelos louros.
Sabendo que, nesse grupo, você tem três pessoas com cabelos
pretos, duas com cabelos louros, três com cabelos castanhos
e uma com cabelos ruivos, como fica o conjunto do espaço
amostral? Pense e anote a seguir como você acha que fica o
conjunto do espaço amostral do exemplo:
S = {______________________________________}
Agora, compare se o seu conjunto do espaço amostral está igual

ao seguinte conjunto do espaço amostral:
S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que são todas
as possibilidades entre as pessoas do grupo.
Qual é o número de elementos dos espaços amostrais citados nos

exemplos dados? Veja:
No exemplo 1: n(S) = 6;
No exemplo 4: n(S) = 9.
152

Eventos
Quando você tiver que estudar algum experimento aleatório,
deverá identificar as diferentes variações de resultados possíveis
dentro do espaço amostral. Você pode chamar de evento
cada uma dessas variações, ou seja, cada uma dessas partes
(subconjuntos) do espaço amostral é um evento.
O símbolo para representar
Um evento é qualquer subconjunto do espaço amostral
o subconjunto de um
determinado pelo experimento (fenômeno) aleatório em estudo. evento é A (letra
maiúscula).
Ao verificar os exemplos, lembre-se de que o número

de elementos de evento é representado por n(A):
n(A) = número de elementos de A.
Usando os exemplos citados anteriormente, você pode observar:
Exemplo 1: você pode usar o dado 2, citado no exemplo anterior,

e estudar todas as possibilidades.
Pode-se construir o seguinte evento:
A: sair um número par na face superior.
A = {2, 4, 6}: observe que são todas as possibilidades de pontos

pares de dado normal.
Exemplo 2: um médico trabalha com um grupo de pessoas

com problemas de alcoolismo. O grupo é composto por cinco
pessoas. Duas delas apresentam cirrose e três não apresentam
cirrose (veja legenda).
Cn – Pessoa número ‘n’ com cirrose

Pn – Pessoa número ‘n’ sem cirrose
Ex.: C1 – pessoa número 1 com cirrose;

P1 – pessoa número 1 sem cirrose.
Unidade 4 153

B: ser uma pessoa sem cirrose.

B = {P1, P2, P3}: observe que são todas as possibilidades de
pessoas sem cirrose.
Exemplo 3: um professor trabalha com um grupo de pessoas

e estuda os distúrbios do humor. O grupo é composto por
sete pessoas. Cinco delas apresentam distúrbios e duas não
apresentam distúrbios (veja legenda).
Dn – Pessoa número ‘n’ com distúrbio

Pn – Pessoa número ‘n’ sem distúrbio
Ex.: D1 – pessoa número 1 com distúrbio;

P1 – pessoa número 1 sem distúrbio.
C: ser uma pessoa com distúrbio.

C = {D1, D2, D3, D4, D5}: observe que são todas as
possibilidades de pessoas com distúrbio.
Exemplo 4: um grupo de pessoas que apresentam diferenças na

cor do cabelo (veja legenda).
Pn – Pessoa número ‘n’ com cabelos pretos

Ln – Pessoa número ‘n’ com cabelos louros
Cn – Pessoa número ‘n’ com cabelos castanhos
Rn – Pessoa número ‘n’ com cabelos ruivos
Ex.: P1 – pessoa número 1 com cabelos pretos;

L1 – pessoa número 1 com cabelos louros.
Sabendo que nesse grupo você tem três pessoas com cabelos
pretos, duas com cabelos louros, três com cabelos castanhos e
uma com cabelos ruivos, como fica o subconjunto do evento
pessoas com cabelos ruivos?
154

D: ser uma pessoa com cabelos ruivos.

D = {R1}: observe que é a única possibilidade com cabelos ruivos.
Qual é o número de elementos dos eventos citados nos exemplos

anteriores?
No exemplo 1: n(A) = 3;
No exemplo 2: n(B) = 3;
No exemplo 3: n(C) = 5;
No exemplo 4: n(D) = 1.
Tipos de eventos
Existem três tipos de eventos, que são:
Evento simples: formado por apenas um elemento do

espaço amostral.
Exemplo: D: ser uma pessoa com cabelos ruivos. (Veja o

exemplo 4)
D = {R1} ⇒ n(D) = 1.
Evento composto: formado por dois ou mais elementos

do espaço amostral.
Exemplo: B: ser uma pessoa sem cirrose. (Veja o exemplo

2)
B = {P1, P2, P3} ⇒ n(B) = 3
Evento impossível: não ocorre, seja qual for a realização

do experimento aleatório.
Exemplo: F: ser uma pessoa com cabelos verdes naturais.

(Veja o exemplo 4)
F = { } ⇒ n(F) = 0
Unidade 4 155

Evento certo: é quando o evento é o próprio espaço

amostral.
Exemplo: E: ser uma pessoa com alcoolismo. (Veja o

exemplo 2)
E={C1, C2, P1, P2, P3} ⇒ n (E)= 5 = n(S)
Operações com eventos

As operações com eventos são muito semelhantes às operações
com conjuntos, até porque os eventos nada mais são que
conjuntos. Veja, a seguir, mais detalhes sobre este assunto.
União de eventos
Se existem os eventos A e B de um espaço amostral S, a união
desses eventos existe se pode ocorrer A ou B.
A B
Figura 4.1 – Representação em diagrama da união entre eventos

A união de A e B pode ser representada por: A soma B ou A∪B.

A união corresponde a toda a área colorida.
Interseção de eventos
Se existem os eventos A e B de um espaço amostral S,
a interseção desses eventos existe se pode ocorrer A e B,
simultaneamente.
156

Figura 4.2 – Representação em diagrama da intersecção entre eventos

A interseção de A e B pode ser representada por: A vezes B ou

A∩B. A interseção corresponde a toda a área colorida.
Complemento de um evento
É um evento formado por todos os elementos pertencentes a S,
mas que não pertencem a A.
S
A
A’
Figura 4.3 – Representação em diagrama do complementar de um evento

Complementar de A – pode ser representado por: , A’ ou CA. O

complementar de A corresponde a toda a área colorida.
Unidade 4 157

Subtração de eventos
Você pode dizer que A menos B é se, e somente se, ocorre A e
não ocorre B.
A B
Figura 4.4 – Representação em diagrama da subtração de eventos

A subtração de eventos pode ser representada por A − B, que

corresponde a toda a área colorida.
Eventos excludentes
Dois ou mais eventos são ditos excludentes (mutuamente
exclusivos) se a realização de um dos eventos excluir a realização
do outro ou de outros eventos.
S
A
B
C
Figura 4.5 – Representação em diagrama da subtração de eventos

Se, quando A ocorrer, exclui ocorrerem os outros, isso quer

dizer que não há interseção entre eles! A e B são mutuamente
exclusivos e B e C não são mutuamente exclusivos.
Agora que você já estudou os conceitos mais importantes que são

utilizados na probabilidade, é hora de conhecer como é feito o
cálculo de probabilidade. Acompanhe na seção a seguir!
158

Seção 2 – Cálculo de probabilidade

Nesta seção, vamos estudar os conceitos de probabilidade e a
forma de fazer seus cálculos! Acompanhe as duas definições
mais importantes dentro do estudo de probabilidades. São elas: a
definição clássica de probabilidade e a frequência relativa.
Veja, então, separadamente, cada uma dessas definições.
Probabilidade clássica
Antes de conhecer como se calcular a probabilidade clássica,
saiba como ela é possível.
A probabilidade de ocorrer um determinado resultado

na realização de um experimento é igual ao quociente
entre o número de casos favoráveis ao sucesso (número
de elementos do evento A) e o número de casos
possíveis (número de elementos do espaço amostral S).
Observe a fórmula a seguir:
Probabilidade de um evento A ocorrer:
= P = sucesso
Observação: A probabilidade de não ocorrência pode ser

representada por:
= q = fracasso
Observe que, se você quiser o resultado em porcentagem, deve

multiplicá-lo por 100 ao final.
Unidade 4 159

Veja, a seguir, alguns exemplos do cálculo de probabilidade clássica.
Exemplo 1: em um levantamento feito com oito moradores de um

condomínio, verificou-se que dois são casados, dois são solteiros, três
são divorciados e um é viúvo. Qual a probabilidade de, ao escolher
um morador ao acaso, ele ser casado? E qual a probabilidade de, ao
escolher um morador ao acaso, ele ser divorciado?
Compreenda passo a passo

Legenda:
Estado civil: Passo 1: identificar os elementos do espaço amostral e do evento
C – Casado (dois moradores ) C1, C2 solicitado.
S – Solteiro (dois moradores) S1, S2
D – Divorciado (três moradores) D1,
D2, D3 S: moradores do condomínio S = {C1, C2, S1, S2, D1, D2,
V – Viúvo (um morador) V1
D3, V1}
A: moradores casados A = {E1, E2}
B: moradores divorciados B = {F1, F2, F3}
Passo 2: identificar o número de elementos de cada conjunto.
n(S) = 8;
n(A) = 2;
n(B) = 3.
Passo 3: usar a fórmula da probabilidade.
Observação: Após efetuar a divisão é só multiplicar por 100 para

obter a probabilidade na forma percentual.
P(A) = 0,25 ou 25%

Para o evento A:
Para o evento B: P(A) = 0,375 ou 37,5%
160

Passo 4: interpretar os dados.
Como interpretar estes dados? A probabilidade de um morador

casado ser escolhido é de 25%, e a probabilidade de um morador
divorciado ser escolhido é de 37,5%.
Exemplo 2: em um levantamento realizado com um grupo de 90

chefes de famílias com diferentes vínculos de trabalho, obteve-se
os seguintes resultados (dados fictícios):
Pesquisa dos motivos de estresse

Tipos de vínculo Nº de pessoas
Evento A M Funcionário público municipal 29 n(A)
E Funcionário público estadual 24
F Funcionário público federal 20 n(C)
Evento C C Comerciário 17
T Temporário 17 n(B)
Evento B I Comércio informal 11 Tamanho do espaço
Total 118 amostral: n(S)
Espaço
amostral
Figura 4.6 – Resultado do levantamento

Se você escolher ao acaso uma pessoa do grupo pesquisado, qual

a probabilidade de ela ter vínculo do tipo:
a) funcionário público municipal?
b) comerciário?
c) comércio informal?
Unidade 4 161

Passo 1: identificar os elementos do espaço amostral e do evento

solicitado.
S: todas as pessoas pesquisadas;

A: pessoa com vínculo do tipo funcionário público municipal;
B: pessoa com vínculo do tipo comerciário;
C: pessoa com vínculo do tipo comercio informal.
n(S) = 118
n(A) = 29
n(B) = 11
n(C) = 17
Obs: Após efetuar a divisão, é só multiplicar o resultado por 100

para obter a probabilidade na forma percentual.
Para o evento A
P(A) = 0,2458 ou 24,58%
Para o evento B
P(B) = 0,0932 ou 9,32%
Para o evento C
P(C) = 0,1441 ou 14,41%
No exemplo anterior, você calculou a probabilidade para

três eventos. A seguir, você montará uma tabela com as
probabilidades para todos os eventos calculados. Siga os passos:
162


solicitado.
S: todas as pessoas pesquisadas (no caso, pessoas acometidas de

estresse);
D: pessoa com vínculo do tipo funcionário público estadual;
E: pessoa com vínculo do tipo funcionário público federal;
F: pessoa com vínculo do tipo temporário.
n(S) = 118
n(D) = 24
n(E) = 20
n(F) = 17

Para o evento D
P(D) = 0,2034 ou 20,34%
Para o evento E
P(E) = 0,1695 ou 16,95%
Para o evento F
P(F) = 0,1441 ou 14,41%
Unidade 4 163

Passo 4: montar a tabela com as probabilidades correspondentes a

cada evento.
Tabela 4.1 – Levantamento com 90 chefes de famílias sobre os diferentes vínculos de

trabalho
Tipos de vínculo Nº de pessoas Probabilidade
M Funcionário público municipal 29 0,2458
E Funcionário público estadual 24 0,2034
F Funcionário público federal 20 0,1695
C Comerciário 17 0,1441
T Temporário 17 0,1441
I Comércio informal 11 0,0932
Total 118 1*
* Repare que a soma é 1 ou 100%
Agora que você já compreendeu o conceito clássico de

probabilidade e como realizar os cálculos, é hora de compreender
o que é frequência relativa e como realizar os cálculos.
Frequência Relativa
A frequência relativa de um evento A é calculada dividindo o
número de vezes que ocorre o evento A pelo total de observação
do experimento. É chamada, também, de probabilidade
avaliada ou probabilidade estimada.
Veja a fórmula abaixo:
Frequência relativa de um evento A:
número de vezes que ocorreu A

frA =
número total de observações
164

Na verdade, a frequência relativa é calculada quando você se deparar

com situações em que o cálculo da probabilidade de um evento não
é possível. Nesse caso, só é possível o cálculo de uma aproximação,
a qual, por sua vez, consiste em analisar o experimento e, com os
resultados obtidos, calcular a frequência relativa.
É importante que você saiba que essa aproximação

para o cálculo de probabilidade só será considerável
caso haja um número bastante grande de tentativas
de execução do experimento. Como fazer isso? Veja os
exemplos a seguir.
Exemplos do cálculo da frequência relativa

Em um teste feito em laboratório com cobaias, foi analisada uma
delas e, após inúmeras vezes, sob efeito de estímulos (comida,
reação a dor etc.), ela executou um comando, que era empurrar
uma pequena alavanca. Foi observado que, após 3500 estímulos,
a cobaia executou o comando 875 vezes. Qual é a frequência
relativa para o evento A: a cobaia executar o comando?
Acompanhe passo a passo
Passo 1: identificar o numerador e o denominador da fórmula.
Número total de observações: 3500

Número de vezes que ocorre A: 875
Unidade 4 165

Passo 2: usar a fórmula da frequência relativa.

número de vezes que ocorreu A

frA =
Passo 3: interpretar os dados.
A frequência relativa para a cobaia executar a tarefa é de 25%; ou,

ainda, a probabilidade estimada da cobaia executar a tarefa é de 25%.
Algumas considerações
Consideremos S um espaço amostral, e A, B, C são eventos
contidos em S, então:
a) para cada evento A → 0 ≤ P(A) ≤ 1 (a probabilidade de A

vai de 0 a 1 ou de 0% a 100%);
b) P(S) = 1 ↔
c) sejam A, B e C todos os eventos possíveis do espaço

amostral, então: P(A) + P(B) + P(C) = 1 ou 100%;
d) quando A e B são mutuamente exclusivos:

P(A∪B) = P(A) + P(B);
e) quando A e B não são mutuamente exclusivos:

P(A∪B) = P(A) + P(B) – P(A∩B);
f) se A, B, C, ... são uma sequência de eventos mutuamente

exclusivos, então:
P(A∪B∪C∪...) = P(A) + P(B) + P(C) + ...
166

Seção 3 – Noções sobre variável aleatória e

distribuição de probabilidades
A variável aleatória é uma ferramenta na análise estatística que
possibilita a atribuição de números para resultados de experimentos,
adequando, assim, o problema para um melhor tratamento
matemático. Dentro da Estatística, ela é considerada uma função
que associa números aos eventos de um espaço amostral. Você
poderá entender melhor se começar analisando um exemplo.
Exemplos de variável aleatória e distribuição de probabilidades

Exemplo 1: se o experimento consistir em dois lançamentos de
uma moeda, e a variável aleatória (v.a.), definida como o nº de caras
obtidas em dois lançamentos de uma moeda, então você terá:
v.a. ⇒ X = nº de caras obtidas em dois lançamentos de uma moeda
X definirá uma variável aleatória que poderá assumir os valores

descritos na tabela a seguir (K = cara e C = coroa).
Tabela 4.2 – Organização dos resultados e valores
Resultados Resultados Resultados possíveis nos dois

2º lançamento lançamentos Valor VA
1º lançamento
K K KK 2
K C KC 1
C K CK 1
C C CC 0
Você pode observar que existe apenas uma possibilidade para

cada situação e o total de possibilidades é 4; então o cálculo da
probabilidade se dá da seguinte forma:
Unidade 4 167

Escrevendo na tabela, atribuindo a probabilidade de cada linha

você terá:
Tabela 4.3 – Distribuição de probabilidade
Resultados possíveis Valor VA Probabilidade

nos dois lançamentos
KK 2 1/4
KC 1 1/4 Duas
CK 1 1/4 possibilidades de
sair uma cara
CC 0 1/4
Esta tabela caracteriza a distribuição de

probabilidade, que é a probabilidade de ocorrência
de cada um dos valores da variável aleatória.
Note que o valor 1 se repete, não é? Então, você pode agrupar

e montar uma nova tabela sem as repetições. É claro que se
agrupam os valores repetidos. Você deve somar as probabilidades,
não se esqueça disso. Observe:
Tabela 4.4 – Agrupamento de resultados

Nº de caras (Valor v.a.) Probabilidade
2 1/4
1 1/2
0 1/4 Ao agrupar os resultados
da variável aleatória (uma
Fonte: Elaboração do autor (2006). cara – 1), você deve somar
as probabilidades:
168

Seção 4 – Os tipos de distribuições de probabilidades

O estudo de probabilidades é uma ferramenta de apoio à decisão.
É com base em seu estudo que você terá oportunidade de suporte
para analisar os experimentos, organizar suas possibilidades e, então,
partir para a ação, adotando o resultado que julgar mais eficaz.
A variável aleatória e a distribuição de probabilidades são muito

utilizadas nesse sentido. Você pode ver que, a cada valor da
variável, corresponde uma probabilidade de ocorrência. Como a
variável aleatória possibilita a atribuição de valores aos eventos,
você pode encontrar dois tipos de situação.
Variáveis aleatórias discretas: ela pode assumir um conjunto

constante discreto, ou seja, enumerável, finito de valores.
Número de caras resultante de lançamentos de uma

moeda, quantidade de caminhões de determinado
modelo, número de defeitos por peça, entre outros,
são exemplos deste tipo de variáveis.
Variáveis aleatórias contínuas: é a variável em que não

conseguimos enumerar seus possíveis resultados, por estes
formarem um conjunto infinito de valores num intervalo de
números reais.
São exemplos desse tipo de variáveis: peso, altura,

temperatura, tempo de transporte, custo de uma
operação etc.
Baseado nesses dois conceitos, você pode atribuir a cada um dos

tipos de variáveis aleatórias uma distribuição de probabilidades de
acordo com o tipo de variável, veja a figura a seguir:
Unidade 4 169

Variável aleatória Distribuição discreta

discreta de probabilidade
Variável aleatória Distribuição contínua

contínua de probabilidade
Figura 4.7 – Tipos de distribuição de probabilidade
Como você pôde observar, cada tipo de variável gera um tipo

de distribuição de probabilidade. Em resumo, os tipos de
distribuição de probabilidades são:
Distribuição discreta de probabilidades; e
Distribuição contínua de probabilidades.
Como elas são diferentes, os métodos de cálculos das

probabilidades também são.
Você vai estudar, na próxima seção, os modelos mais importantes

e mais aplicados dentro da área de seu curso, que são a
distribuição binomial, para a variável discreta, e a distribuição
normal, para a contínua.
Para o bom andamento de seu
estudo, é importante que você
entenda bem a diferença entre
as duas variáveis, a discreta e a
contínua!
170

Seção 5 – Cálculo de probabilidade usando a

distribuição
Uma distribuição discreta de probabilidade de uma variável
aleatória atribui probabilidades aos distintos valores
dessa variável. Observe que essa distribuição não atribui
probabilidade para intervalos, e sim para cada valor ou para um
conjunto de valores da variável.
Uma das principais distribuições discretas é a binomial. Veja, a

seguir, como se calcula probabilidade usando esse método.
Como se calcula a distribuição binomial?
A distribuição binomial é o método utilizado para cálculo de

probabilidades de experimentos que se repetem algumas vezes e
seguem algumas características.
A distribuição binomial é aplicável se:
1. o experimento que você está observando for repetido n

vezes independentes;
2. cada tentativa (repetição) admitir somente dois

resultados:
sucesso: denotado por S;
fracasso: denotado por F.
A probabilidade de sucesso é denotada por p ⇒ P(S) = p, e a

probabilidade de fracasso é denotada por q ⇒ P(F) = q.
Importante: A soma da probabilidade de sucesso e fracasso é

igual a 100%, ou seja, é igual a 1 ⇒ p + q = 1.
A soma é utilizada se você estiver interessado em estudar o número

de sucessos e fracassos sem importar a ordem em que acontecem.
Unidade 4 171

Diante do exposto, é importante salientar que:
a distribuição binomial só é aplicável caso ocorram os

três casos citados anteriormente;
os termos sucesso e fracasso são usados se o resultado

esperado ocorre ou não, ou seja, depende do objetivo de
seu estudo.
Veja o exemplo a seguir para compreender como realizar os

cálculos:
Em um exame, você deseja saber a probabilidade de erro de uma

determinada questão. Essa questão apresenta cinco alternativas
(a, b, c, d, e) e somente uma está correta.
Qual é a probabilidade de sucesso?
Nesse caso, o objetivo é estudar a probabilidade de erro, então, o

sucesso se refere ao erro. Para calcular a probabilidade de sucesso,
você deve calcular a probabilidade de erro da questão.
Veja como se calcula passo a passo

solicitado.
A: errar a questão
S: todas as opções (a, b, c, d, e)
Passo 2: identificar o número de elementos do evento e do espaço

amostral.
n(A) = 4 (se somente uma está correta, sobram quatro incorretas)

n(S) = 5
172

→ a probabilidade de sucesso é,
então, p = 0,8.
Qual é a probabilidade de fracasso?
Acompanhe passo a passo

solicitado.
B: acertar a questão

amostral.
n(B) = 1 (se somente uma está correta)

n(S) = 5
– a probabilidade de sucesso é, então,
q = 0,2
Observe:
p + q = 0,8 + 0,2 = 1 ou 100%
- Espero que a diferença tenha sido percebida. Lembre-se de que o suces‑

so não está ligado a acontecimentos bons e, sim, se ocorrer o resulta‑
do que é objetivo de seu estudo.
Unidade 4 173

Analise o seguinte exemplo: estudar a probabilidade de errar,

como no exemplo anterior. Ainda citando o exemplo anterior:
nesse problema, você estudou a probabilidade de errar somente
uma questão do exame, e para estudar as possibilidades de erro
ou acerto de questões de um exame inteiro? É aí que entra a
distribuição binomial.
Você sabe qual o método de cálculo?
No exemplo anterior, você calculou a probabilidade de sucesso

(errar) para somente uma tentativa (questão). Agora, você
vai calcular, para n tentativas, a probabilidade de k sucessos.
Acompanhe:
Seja X o número de sucessos em n tentativas do experimento.
Então, a fórmula para determinar a probabilidade de um dado

número k de sucessos é dada por:
P(X = K) = Cn,k . pk . qn-k
Sendo:
Cn,k = combinação de n elementos organizados em grupos de k

elementos;
n = tentativas do experimento;
k = número de sucessos desejados;
p = probabilidade de sucesso (ocorrência do evento);
q = probabilidade de fracasso (não ocorrência do evento).
Notação: n!
n! = n.(n − 1).(n − 2). ... .2.1
k! = k.(k − 1).(k − 2). ... .2.1
Veja, a seguir, exemplos do cálculo de probabilidade usando a

distribuição binomial.
174

Exemplo 1: uma prova com quatro questões, cada uma apresenta

cinco alternativas (a, b, c, d, e) e somente uma está correta. Qual
a probabilidade de errar duas questões?
Nesse caso, o objetivo é
Passo 1: calcular a probabilidade de errar (no caso, sucesso) para estudar a probabilidade
cada questão. de erro, então, o sucesso
se refere ao erro. Veja,
a seguir como se calcula
A: errar a questão passo a passo.
n(A) = 4 (se somente uma está correta, sobram quatro incorretas)
n(S) = 5
– a probabilidade de sucesso é,
então, p = 0,8.
Passo 2: calcular a probabilidade de acertar (no caso, fracasso) para

cada questão.
Você pode calcular de dois modos:
1. Primeiro modo de cálculo:
B: acertar a questão
n(B) = 1 (se somente uma está correta)
n(S) = 5
– a probabilidade de fracasso, então
q = 0,2
2. Segundo modo de cálculo:
p + q = 1 ⇒ 0,8 + q = 1 ⇒ q = 1 – 0,8 ⇒ q = 0,2
Unidade 4 175

Passo 3: identificar cada um dos componentes da fórmula.
n = 4 (total de repetições – são quatro questões com as mesmas

características)
k = 2 (número de sucessos – errar duas questões)
p = 0,8 (probabilidade de sucesso, calculado anteriormente)
q = 0,2 (probabilidade de fracasso, calculado anteriormente)
Passo 4: calcular a probabilidade usando a fórmula apresentada.
P(X = K) = Cn,k . pk . qn-k ⇒
Passo 5: como interpretar estes dados?
A probabilidade de uma pessoa acertar duas questões de um teste

de quatro questões é de 15,36%. Note que não é 50%, pois você
deve levar em consideração que cada questão tem sua probabilidade
e, também, você pôde agrupar as questões de várias maneiras (errar
a 1ª e a 3ª, ou a 2ª e a 4ª, ou a 1ª e a 4ª, e assim por diante).
Representação gráfica de uma distribuição binomial

Como se trata de uma distribuição, você pode construir um
gráfico que represente as probabilidades do problema do exemplo
usado. Claro que, para tanto, você deverá calcular a probabilidade
para cada possibilidade, ou seja, para k = 0, 1, 2, 3 e 4. Não se
assuste, pois, a seguir, você poderá acompanhar as probabilidades
calculadas na tabela e o gráfico desta distribuição.
176

Tabela 4.5 – Probabilidade de errar as questões do teste
Número de erros P(X)

0 0,0016
1 0,0256
2 0,1536
3 0,4096
4 0,4096
Total 1
Note que para cada uma

das possibilidades é
construída uma coluna.
Gráfico 4.1 – Probabilidade de errar as questões no teste

Tudo o que você acabou de estudar, neste tópico, é o método

de cálculo de probabilidade usando a distribuição binomial. A
intenção, com esse estudo, é que você tenha uma noção desse
processo, porém sem maiores aprofundamentos.
Unidade 4 177

Cálculo de probabilidade usando distribuição contínua de

probabilidade
Uma distribuição contínua de probabilidade de uma variável
aleatória atribui probabilidades a intervalos de valores dessa
variável. Note que essa distribuição atribui probabilidade para
intervalos, e não para um valor dessa variável.
Uma das principais distribuições contínuas é a normal.

No decorrer desse tópico, você vai estudar um pouco dessa
distribuição, além de aprender a calcular probabilidade usando
esse método.
A distribuição normal
Como você estudou anteriormente, quando se utiliza uma
variável aleatória contínua, pode-se atribuir probabilidade a
essa variável. Conforme a seção anterior, os processos definidos
a partir de contagens conduzem aos modelos que envolvem
variáveis aleatórias discretas, enquanto que os processos definidos
a partir de medidas conduzem aos modelos que envolvem
variáveis aleatórias contínuas.
Contagens Variável aleatória

discreta
Variável aleatória
Medidas
contínua
Figura 4.8 – Tipos de distribuições de probabilidade
Podemos citar, como exemplos de variáveis contínuas, a altura

das pessoas, temperatura corporal, peso, escores obtidos em testes
psicológicos etc.
Antes de começar o estudo do cálculo de probabilidade usando a

distribuição normal, vamos relembrar alguns conceitos.
Considere a distribuição de frequências e seu histograma a

seguir:
178

Tabela 4.6 – Tempo, em minutos, para as entregas urbanas da empresa X
Tempo (em minutos) Nº de entregas (fi)

15,9 |--- 18,7 2
18,7 |--- 21,5 6
21,5 |--- 24,3 10
24,3 |--- 27,1 14
27,1 |--- 29,9 10
29,9 |--- 32,7 6
32,7 |--- 35,5 2
Total (∑fi) 50
Histograma
Gráfico 4.2 – Tempo, em minutos, para as entregas urbanas da empresa X

Unidade 4 179

Observe que o gráfico é construído no sistema de eixos

cartesianos, não é mesmo? No eixo horizontal, são marcados
os valores ou intervalos das classes assumidos pela variável. No
eixo vertical, marcamos as frequências simples, que servirão para
marcar a altura dos retângulos, indicando, assim, o número de
observações (ocorrências) de cada valor ou classe da variável.
Como a altura de cada retângulo é proporcional à

frequência simples, a área de cada retângulo também
Mantenha essa informação à mão, é. Considerando isso, a soma das áreas dos retângulos
pois, você irá usá-la novamente! também é proporcional à frequência total.
Continuando com a recordação, veja, agora, o polígono de

frequências. Para construir um polígono de frequência de dados,
é só unir, por linhas, os pontos médios das bases superiores dos
retângulos do histograma.
Acompanhe o exemplo a seguir.
Tempo, em minutos, para as entregas urbanas da empresa X
16
14 Polígono de Estes triângulos

Frequência compensam os
12
que ficam fora
No de entregas
10 do polígono.
8
0
,7
,5
,3
,1
,9
,7
,5
18
21
24
27
29
32
35
|—
|—
|—
|—
|—
|—
|—
,9
,7
,5
,3
,1
,9
,7
15
18
21
24
27
29
32
Tempo em minutos
Gráfico 4.3 – Tempo, em minutos, para as entregas urbanas da empresa X

180

Você pôde observar que a área do histograma é igual à área

abaixo do polígono de frequências, ou seja, os triângulos que
ficam fora são compensados por aqueles que estão adicionados
por dentro.
O gráfico expressa os tempos que a empresa levou

para realizar 100% das entregas de um determinado
período.
Você observou que o polígono de frequências tem um formato

especial? Sim, ele tem o formato de um sino. Essa curva é chamada
de curva normal ou curva de Gauss-Laplace e tem algumas
características bem especiais. Conheça-a no tópico a seguir.
Características da curva normal

Analisando o polígono de frequências da grande maioria
das séries, você pode observar, com certo ajuste, que elas se
aproximam de uma distribuição normal, ou seja, apresentam um
gráfico semelhante conforme pode ser observado a seguir:
X=Me=Mo x
Gráfico 4.4 – Curva de Gauss-Laplace
Fonte: Adaptado de Silva (1997, p. 70).
Unidade 4 181

Principais características da curva normal

Dentre as principais, podemos citar algumas tais como:
a) a curva se caracteriza por ter a forma de um sino;
b) a curva tem 2 pontos de inflexão (lugar onde a curva se

modifica);
c) a curva normal é simétrica com relação à média (é igual

tanto à esquerda, quanto à direita da média);
d) a área limitada pela curva e pelo eixo das abscissas é 1 ou

100% (sendo assim, por ser simétrica, tem 50% da área à
esquerda e 50% da área à direita da média);
e) a curva é assintótica, isto é, se aproxima indefinidamente

do eixo das abscissas sem tocá-lo;
f) a curva normal é unimodal, isto é, possui um só pico ou

ponto de frequência máxima, ponto este onde coincidem
a moda, a média e a mediana;
g) a função que define a curva é:
A distribuição normal de probabilidade usa como base

a curva normal.
Sabendo que a área abaixo do polígono (curva) representa

proporcionalmente a frequência total da série, e com o uso da
média e do desvio padrão tem-se condições de realizar estudo de
concentração dos dados em torno da média.
Com relação à área abaixo da curva, analise o gráfico a seguir:
34,13%
13,59% 0,5 ou 50%

2,15%
X
Gráfico 4.5 – Distribuição normal, com percentuais em referência ao desvio padrão

Fonte: Adaptado de Triola (1999, p. 43).
182

Veja, a seguir, alguns exemplos para compreender como realizar

os cálculos do desvio padrão.
Em um teste, a média dos escores de um grupo de pessoas foi de

= 80, e o desvio padrão foi de σ(x) = 3. Pode-se interpretar esses
valores da seguinte forma:
Os valores da série estão concentrados em torno da média:
o intervalo ( − σ (x); + σ (x)) contém aproximadamente

68,26% dos elementos da série, ou seja, o intervalo
(77; 83) → (80 − 3 = 77 e 80 + 3 = 83);
o intervalo ( − 2 σ (x); + 2 σ (x)) contém

aproximadamente 95,44% dos elementos da série, ou
seja, o intervalo(74; 86) → (80 − 6 = 74 e 80 + 6 = 86);
o intervalo ( − 3 σ (x); + 3 σ (x)) contém

aproximadamente 99,74% dos elementos da série, ou seja,
o intervalo (71; 89) → (80 − 9 = 71 e 80 + 9 = 89).
Veja, no gráfico a seguir, a ilustração desse exemplo:
99,74%
95,44%
68,26%
34,13% 34,13%
13,59% 13,59%
2,15% 2,15%
71 74 77 =80 83 86 89
Gráfico 4.6 – Distribuição normal, com percentuais em referência ao desvio padrão

Fonte: Adaptado de Triola (1999, p. 43).
Unidade 4 183

Como ler os gráficos? Aí vão algumas sugestões:
 O percentual de entregas com tempo entre 77 e

83 minutos é de 68,26% (ou, ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 77 e
83 minutos é de 68,26%).
86 minutos é de 95,44% (ou ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 74 e 86
minutos é de 95,44%).
89 minutos é de 99,74% (ou ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 71 e 89
minutos é de 99,74%).
Como você pôde observar, os percentuais estão ligados à média

e ao desvio padrão e, por sua vez, determinam os intervalos a
serem estudados. Esses percentuais são obtidos calculando a área
entre a curva e o eixo X, entre os extremos do intervalo que você
está estudando. Exemplo: (77; 83).
Baseado nesse estudo é que você poderá calcular a probabilidade

de algum evento que resulte em um intervalo. Veja como fazer
esses cálculos no próximo tópico.
Descrição do método de cálculo

A probabilidade em uma distribuição contínua de probabilidade
(probabilidade de ocorrência de um intervalo) é obtida calculando
a área entre a curva e o eixo X, como você já viu em estudos
anteriores. Essa área é calculada com o uso de uma ferramenta
matemática chamada de integral definida da função, ou seja,
dada a função a seguir, a área entre a curva e o eixo X, no
intervalo (a; b), é calculada da seguinte forma:
184

f
P(a<x<b)
a b x
Gráfico 4.7 – Distribuição normal, com intervalo definido
- A determinação desta área usando-se o cálculo de integral é bastan‑

te complicada e não será usado em seu estudo. Para superar essa
dificuldade, utiliza-se outra distribuição, chamada de Distribui‑
ção Normal Padronizada (ou Reduzida). O artifício consiste em
transformar a variável X, com média e desvio padrão σ, em
uma variável Z , com média 0 e desvio padrão 1, para que você
possa fazer utilização da tabela de Z (variável padronizada) com
os valores das áreas já calculados.
Mas como podemos padronizar?
Esta padronização é adotada para tornar o cálculo de probabilidade

da ocorrência de intervalo mais fácil e mais simples. Qualquer
distribuição X com as características citadas anteriormente pode ser
transformada na distribuição normal padronizada (ou reduzida) Z,
para que seja possível o cálculo de áreas.
A transformação da variável aleatória X na variável padronizada

se dá mediante o uso da fórmula a seguir:
Unidade 4 185

Cálculo da variável padronizada:
Em que:
X1 = valor da v.a. (limite do intervalo)
= média
σ = desvio padrão
Acompanhe os exemplos a seguir para compreender como

realizar o cálculo.
Exemplo 1: a área a ser calculada está no intervalo que vai da

média até x1. Nesse caso, só é necessário o cálculo de um limite
do intervalo.
P( <x<x1)
x1 x
P(0<z<z1)
0 z1 z
Gráfico 4.8 e 4.9 – Padronização de uma distribuição normal
Nesse caso, a probabilidade de ocorrer o intervalo da média ate o

x1 é igual à probabilidade de ocorrer o intervalo de
0 à z1 ⇒ P( < x < x1) = P(0 < z < z1)
Exemplo 2: A área a ser calculada está no intervalo que vai de

x1 até x 2. Nesse caso, é necessário o cálculo de dois limites do
intervalo (z1 e z2).
186

Cálculo da variável padronizada:
Onde:
X1 e X 2 = valores da v.a. (limites do intervalo)
= média
σ = desvio padrão
P(x1<x<x2)
x1 x2 x
P(z1<Z<z2)
z1 0 z2 z
Fonte: Adaptado de Silva (1997, p.71).
Nesse caso, a probabilidade de ocorrer o intervalo entre x1 e x 2 é

igual à probabilidade de ocorrer o intervalo entre
z1 e z2 ⇒ P(x1 < x < x 2) = P(z1 < z < z2).
Até aqui, você conheceu como padronizar os valores da variável

aleatória X. Agora, você irá aprender como usar a tabela de áreas
da distribuição padronizada.
Com o valor de Z calculado,
basta encontrar o valor na
tabela (ver tabela no final
As áreas dadas na tabela são sempre de 0 a Z. desse livro didático).
Unidade 4 187

Veja, a seguir, um gráfico com representação da área dada pela

tabela.
Área
0 z
Gráfico 4.12 – Distribuição normal padronizada
Fonte: Triola (1999).
Observe que, conhecendo a área especificada na tabela, qualquer

tipo de área poderá ser calculada usando a simetria da curva.
Observe os exemplos a seguir com atenção.
Exemplo 1: Em um levantamento executado por uma empresa de

entregas, resultou que o tempo médio para a realização das entregas
era de 21 minutos e o desvio padrão foi de 7 minutos. Ao escolher,
ao acaso, uma das entregas realizadas, qual a probabilidade de o
tempo para realizá-la estar entre 21 e 28 minutos?
Calculando passo a passo
Passo 1: identificar todos os elementos que compõem o problema.
média: = 21;
desvio padrão: σ(x) = 7;
os limites do intervalo: como um dos limites é a própria

média, você só terá que calcular um Z. O outro limite é
28 ⇒ X = 28.
188

Passo 2: calcular a variável padronizada Z.
⇒Z=1
Passo 3: identificar, no gráfico, qual é a área que você deve encontrar.
Veja que a área está entre

Área zero e 1.
µ=21 x=28
Área
0 z=1
Passo 4: procurar, na tabela, o Z = 1,00 e encontrar sua área

correspondente.
Primeiro, você deve procurar o valor 1,0 na primeira

coluna.
Depois, procurar, na primeira linha, o valor 0,00 (é como

se separasse o número 1,00 em dois, uma parte seria 1,0
e a outra seria o 0,00).
No cruzamento da coluna em que está o 0,00 e da linha

em que está o 1,0, você encontrará um número (no caso é
0,3413).
Esse número é a área entre Z e 0.
Unidade 4 189

Z 0,00 0,01 0,02

0,0 0,0000 0,0040 0,0080
0,l 0,0398 0,0438 0,0478
0,2 0,0793 0,0832 0,0871
0,3 0,1179 0,1217 0,1255
0,4 0,1554 0,1591 0,1628
0,5 0,1915 0,1950 0,1985
0,6 0,2257 0,2291 0,2324
0,7 0,2580 0,2611 0,2642
0,8 0,2881 0,2910 0,2939
0,9 0,3159 0,3186 0,3212
1,0 0,3413 0,3438 0,3461
1,1 0,3643 0,3665 0,3686
1,2 0,3849 0,3869 0,3888
1,3 0,4032 0,4049 0,4066
Passo 5: responder e interpretar.
P(21 < x < 28) = 0,3413 ou 34,13%
A probabilidade do tempo para realizar uma entrega estar entre

21 e 28 minutos é de 34,13%.
Exemplo 2: Em média, a vida útil de um modelo de máquina de

empacotar é de 24 anos, com um desvio padrão de 6 anos. Levando
em consideração que a vida útil deste tipo de máquina se distribui
normalmente, qual a probabilidade de uma máquina, adquirida
recentemente pela empresa, durar entre 17,52 e 29,7 anos?
190

A média: = 24;
desvio padrão: σ(x) = 6;
os limites do intervalo: como os limites são diferentes

da média, você deve calcular Z para os dois valores
(x1 = 17,52 e x 2 = 29,7).
Passo 2: calcular as variáveis padronizadas Z1 e Z2.
Passo 3: identificar, no gráfico, qual é a área que você deseja

encontrar.
Área
x2=17,52 µ=24 x1=29,7
Área
z=-1,08 0 z=0,95

Fonte: Adaptado de Silva (1997, p.71).
Veja que a área está entre –1,08 e 0,95.
Unidade 4 191

Não se preocupe com o sinal negativo de Z1. Esse

sinal só serve para indicar que a área está à esquerda
da média (zero), por isso, o negativo. Como a curva
é simétrica, a área tanto à esquerda como à direita
é calculada da mesma maneira, e o uso da tabela
também é o mesmo.
Passo 4: procurar, na tabela, o Z1 = −1,08 e Z2 = 0,95 e encontrar suas

áreas correspondentes.
Como usar a tabela?
É possível procurando o Z1. Veja de que forma:
primeiro, procurar o valor 1,0 na primeira coluna;
depois, procurar, na primeira linha, o valor 0,08 (é como

se separasse o número 1,08 em dois: uma parte seria 1,0,
e a outra seria o 0,08);
no cruzamento da coluna na qual está o 0,08 e da linha

na qual está o 1,0, você encontrará um número (no caso é
0,3599). Esse número é a área entre Z1 e 0.
Tabela 4.7 – Tabela de valores normais Z
Cruzando a
linha com a
Procurar 1,0 coluna.
Procurar 0,08 Z 0,00 0,01 ... 0,07 0,08

0,0 0,0000 0,0040 ... 0,0279 0,0319
0,l 0,0398 0,0438 ... 0,0675 0,0714
0,2 0,0793 0,0832 ... 0,10 64 0,1103
... ... ... ... ... ...
0,8 0,2881 0,2910 ... 0,3078 0,3106
0,9 0,3159 0,3186 ... 0,3340 0,3365
Cruzando a 1,0 0,3413 0,3438 ... 0,3577 0,3599
linha com a
coluna. 1,1 0,3643 0,3665 ... 0,3790 0,3810
1,2 0,3849 0,3869 ... 0,3980 0,3997
192

Agora, falta procurar o Z2. Como fazer:
primeiro, você deve procurar o valor 0,9 na primeira

coluna;

se separasse o número 0,95 em dois: uma parte seria 0,9,
e a outra seria o 0,05);

Tabela 4.8 – Tabela de valores normais Z

Z 0,00 ... 0,04 0,05
0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749
Passo 5: responder e interpretar.
Como você tem duas áreas, o próximo passo é somar, veja o

gráfico a seguir:
Gráfico 4.17 – Soma das áreas determinadas pela padronização

Unidade 4 193

P(17,52 < x < 29,7) = 0,3599 + 0,3289 = 0,6888 ou 68,88%.
A probabilidade de uma máquina, adquirida recentemente pela

empresa, durar entre 17,52 e 29,7 anos é de 68,88%.
Exemplo 3: Em média, a vida útil de um modelo de máquina

de empacotar é de 24 anos, com um desvio padrão de 6 anos.
Levando em consideração que a vida útil deste tipo de máquina
se distribui normalmente, qual a probabilidade de uma máquina,
adquirida recentemente pela empresa, durar mais que 29,7 anos?
Calculando passo a passo, temos
a média: = 24;
o desvio padrão: σ(x) = 6;
os limites do intervalo: o intervalo é limitado abaixo por

x = 29,7 e não tem limite acima. Você deve calcular Z
somente para esse valor de x.
Passo 2: calcular a variável padronizada Z.
194

Passo 3: identificar, no gráfico, qual é a área que você deseja

encontrar.
Área
µ=24 x1=29,7
Área
0 z=0,95

Veja que a área está de 0,95 para cima.
Passo 4: Procurar, na tabela, o Z = 0,95 e encontrar sua área

correspondente.
Como usar a tabela?
Primeiro, você deve procurar o valor 0,9 na primeira

coluna;

se separasse o número 0,95 em dois, uma parte seria 0,9 e
a outra seria o 0,05);

Unidade 4 195

Cruzando a
linha com a
Procurar 0,9 coluna.
Procurar 0,05 Z 0,00 ... 0,04 0,05

0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0 ,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
Cruzando a 0,9 0,3159 ... 0,3264 0,3289
linha com a
coluna. 1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749
Passo 5: interpretar e responder.
Como a área dada pela tabela é sempre entre zero e Z,

como calcular a área de Z para cima?
Você lembra que a curva normal é simétrica e que, de cada lado,

tem 50% da área total? Pois é! Se a metade tem 50% ou 0,5 e
você diminuir dessa área a área encontrada, restará a que você
quer encontrar. Veja o gráfico a seguir:
0,3289
0,5-0,3289
0 z=0,95
Gráfico 4.20 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
A área cinza escuro é calculada diminuindo 0,3289 (área entre

zero e Z – encontrada na tabela) de 0,5.
P(x > 29,7) = 0,5 – 0,3289 = 0,1711 ou 17,11%
196

Então, a probabilidade de uma máquina, adquirida recentemente

pela empresa, durar mais que 29,7 anos é de 17,11%.
Além dos casos que você estudou nos exemplos, ainda há outros.
Um deles pode ser ilustrado a seguir:
0,3413 0,5
ou
34,13% ou
50%
X
Gráfico 4.21 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Caso o limite inferior do intervalo esteja à esquerda da média,

o processo é o mesmo, calcular o Z, encontrar a área na tabela
e, no final, calcular a área final. No caso anterior, note que você
terá que juntar as duas áreas, a cinza claro com a cinza escuro.
Lembre-se de que a área, na metade da curva, é de 0,5 ou 50%.
Somando as duas: 0,5 + 0,3413 = 0,8413 ou 84,13%.
Unidade 4 197

Síntese
Nessa unidade, você começou a conhecer a maneira como

lidar com o acaso. O cálculo de probabilidade nada mais é que
uma tentativa de entender e organizar o acaso. Você aprendeu
como calcular a probabilidade de um evento e, além disso,
compreendeu como calcular a frequência relativa.
Teve uma noção sobre o que é uma variável aleatória e sua

distribuição de probabilidades. Essas são ferramentas muito
importantes dentro das análises estatísticas que você terá que
fazer ao longo de seu curso e de sua profissão.
Você estudou, também nesta unidade, dois tipos de distribuições

de probabilidade. Conheceu as diferenças entre variável aleatória
discreta e contínua, bem como entre suas distribuições de
probabilidade. Aprendeu, também, a calcular probabilidade com
essas distribuições. Não foi tão difícil, não é?
Os conteúdos estudados nessa unidade, além de serem utilizados

em situações práticas dentro de seu curso, bem como no
desenvolvimento de sua vida profissional, são, também, base para
o estudo de amostragem, um assunto importante quando se trata
de probabilidade.
198


1) Em estudo realizado sobre os padrões de indecisão, depressão e

ansiedade em adolescentes, revelou-se que a relação com os pais era
fator influenciador dessas reações. Nessa pesquisa, foi pesquisado um
total de 1500 adolescentes, e em 675 casos, os jovens sofriam com o
autoritarismo dos pais. Qual a probabilidade de ser escolhido ao acaso,
um jovem que sofra com o autoritarismo dos pais?
Unidade 4 199

2) Segundo o IBGE, na Grande Florianópolis, as pessoas de dez anos ou

mais de idade, por estado civil foram agrupados na tabela abaixo:
Desquitado(a)
Casado(a) ou separado(a) Divorciado(a) Viúvo(a) Solteiro(a) Total
judicialmente
267.867 18.697 16.779 28.224 333.974 665.541
Se uma pessoa da Grande Florianópolis for escolhida ao acaso, qual é a

probabilidade de ela ser:
a) casada?
b) solteira?
c) divorciada?
200

3) Em testes feitos em laboratório com cobaias, foram analisadas duas

delas e, após inúmeras tentativas, a cobaia 1 sofria estímulos com
reação a dor enquanto a cobaia 2 sofria estímulos com alimentação. A
pesquisa visava à execução de uma tarefa que era a de empurrar uma
pequena alavanca, considerada uma reação positiva. Os resultados
foram apresentados na seguinte tabela:
Número total de Número de reações

Cobaia Estímulo tentativas positivas
Cobaia 1 Efeitos de dor 4500 1215
Cobaia 2 Alimentação 3500 1050
a) Qual a frequência relativa (ou probabilidade estimada) para o número

de reações positivas para cada cobaia?
b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?
Unidade 4 201

4) O teste chamado Tarefa de Memória Seletiva (TMS) testa alguns

aspectos da memória verbal. Baseia-se em ouvir, lembrar e aprender
doze palavras apresentadas à pessoa que está sendo testada.
Diversos aspectos da memória verbal, tais como lembrança total,
armazenamento na memória de longa duração etc., são combinados
para produzir um escore global. Sabendo que, para um grupo
determinado de pessoas, a média dos escores foi de 126 pontos e que o
desvio padrão foi de 10 pontos, determine o que é pedido a seguir.
a) Calcule Z (variável padronizada) para x = 116, para x = 136, para x = 131
e para x = 141 pontos.
b) Qual a probabilidade de escolher uma pessoa com escore maior que
136 pontos?
c) Qual a probabilidade de escolher uma pessoa com escore entre 126 e
131 pontos?
d) Qual a probabilidade de escolher uma pessoa com escore entre 116 e
141 pontos?
202

Saiba mais


MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo:

Makron Books, 1999.
SILVA, Ermes Medeiros da. et al. Estatística para os cursos de

Economia, Administração e Ciências Contábeis. São Paulo:
Ed. Atlas, 1997. v. 1.

LTC, 1999.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro:

LTC, 2004.
Unidade 4 203

5
UNIDADE 5
Amostragem e cálculo de
estimativa
Conhecer as vantagens e a importância da
amostragem.
Calcular tamanho de amostra.
Conhecer as informações que a amostragem propicia.
Aplicar as técnicas de amostragem para a proporção e

para a média.
Calcular as estimativas populacionais para a proporção
e para a média.
Compreender e calcular a análise de variância.
Seções de estudo
Seção 1 Introdução
Seção 2 Conceitos importantes
Seção 3 Estimativas para a proporção populacional
Seção 4 Estimativas para média populacional
Seção 5 Análise de variância – ANOVA


Nesta unidade, você conhecerá com mais detalhes o que é
amostra e poderá aumentar seus conhecimentos sobre como
escolher, calcular e para que usar amostras em pesquisas e
levantamentos de dados. Você terá a oportunidade de verificar
como é importante o estudo da amostragem, uma vez que é uma
das ferramentas essenciais que pode apoiar suas decisões.
Nesta unidade, você também conhecerá como proceder para

calcular o erro padrão de uma estimativa.
Você já deve ter visto, nos jornais ou na televisão, quando

anunciam resultados de uma pesquisa eleitoral, informarem que
os resultados têm uma margem de erro. Isto ocorre devido ao fato
do uso da amostragem, ou seja, quando uma pesquisa se baseia
apenas em uma parcela da população.
Como não é possível executar a pesquisa com a totalidade dessa

população, os resultados não são exatos, necessitando, assim, do
cálculo da margem de erro. Nesta unidade, você vai entender
como se procede para encontrar esse erro.
Nesta unidade, serão usados alguns termos que são fundamentais

no entendimento dos cálculos e da interpretação. Sendo assim,
antes de saber como se calcula o erro de uma estimativa, é muito
importante que você aprenda alguns conceitos importantes.
Por isso, como forma a facilitar a compreensão desta unidade,
as primeiras seções tratam de conceitos introdutórios e básicos.
Começaremos por eles, lembrando que são fundamentais para a
compreensão dos demais assuntos.
Finalmente, enfrentaremos outro desafio: definir se as médias de

várias populações são mesmo semelhantes ou se existem diferenças
que superam os próprios problemas do processo de amostragem,
analisando, para isso, as variâncias obtidas nos processos.
Vamos começar então? Bons estudos!
206

Seção 1 – Introdução
A amostragem está intimamente ligada aos estudos de Estatística
descritiva e probabilidades. Além de estarem ligados, são
dependentes uns dos outros. Veja a figura a seguir:
Amostragem
Estatística descritiva Probabilidade
Figura 5.1 – Relações dos estudos estatísticos

Como é feita essa relação entre os três? Com o estudo desta

unidade, você vai poder compreender melhor. Conheça, a seguir,
alguns conceitos importantes para o estudo da amostragem.
População
População é o conjunto total de elementos com, pelo menos, uma
característica em comum, cujo comportamento interessa estudar.
Notação:
N = número de elementos da população (tamanho da população)
Censo: é uma coleção de dados relativos a todos os

elementos de uma população.
Parâmetro: é utilizado para designar alguma

característica descritiva dos elementos da população
(percentagem, média etc.).
Unidade 5 207

Amostra
Amostra é o conjunto de elementos ou observações, recolhidos
a partir de um subconjunto da população, que se estuda com o
objetivo de tirar conclusões para a população de onde foi recolhida.
Notação:
n = número de elementos da amostra (tamanho da amostra)
Mas qual tamanho de amostra usar?
Essa sempre é a dúvida de muitos pesquisadores. O tamanho da

amostra muitas vezes depende da experiência e do conhecimento
do pesquisador. Experiência em saber qual o tamanho que
realmente representará, com fidelidade, a população e o
conhecimento do pesquisador sobre o tema e sobre a população
alvo do estudo. Dessa forma, você verá duas formas de calcular o
tamanho da amostra, que são as seguintes:
quando não se têm informações sobre a população: se

o pesquisador não tem acesso às medidas, como desvio
padrão, percentuais etc.
quando têm informações sobre a população: se o

pesquisador tem acesso às medidas, como desvio padrão,
percentuais etc.
Quando não se têm informações sobre a população

Nesse caso, é necessária a especificação do erro amostral
pretendido pelo pesquisador. Sugeridas por Barbetta (2002), as
formas de cálculo do tamanho da amostra, quando você não tem
acesso a informações da população, são as que seguem:
208

a) Quando não se conhece o tamanho da população
Tamanho da amostra:
Em que:
n0 = primeira aproximação para o tamanho da amostra;
E = erro amostral tolerável.

(usar o erro na forma unitária, ex.: 2%, usar 0,02)
b) Quando se conhece o tamanho da população
Tamanho da amostra:
Em que:
n0 = primeira aproximação para o tamanho da amostra;
N = tamanho da população;
n = tamanho da amostra.
Veja, a seguir, um exemplo de como realizar os cálculos.
Um pesquisador deseja realizar estudo para com estudantes do

Ensino Fundamental da rede municipal de escolas da cidade de
Florianópolis. Nessa pesquisa, ele irá tolerar um erro amostral
de 4% e gostaria de saber qual seria o tamanho da amostra
necessária para realizar sua pesquisa, nos seguintes casos:
a) O pesquisador não conhece o número total de estudantes do

Ensino Fundamental da cidade
Passo 1: identificar os elementos da fórmula.
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100).
Unidade 5 209

Passo 2: usar a fórmula.
→ n0 = 625 estudantes.
Um tamanho aproximado para a amostra seria de 625 estudantes

do Ensino Fundamental.
b) O número total de estudantes do Ensino Fundamental da

cidade é de 27.000 alunos.
Passo 1: identificar os elementos da fórmula.
E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100);
N = tamanho da população = 27000.
Passo 2: usar a fórmula.
→ n0 = 625 estudantes.
Um tamanho aproximado para a amostra seria de 625 estudantes

do Ensino Fundamental. Observe que o pesquisador teve acesso
à informação de que a população seria de 27.000 estudantes,
então você deve passar para o passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a

seguinte fórmula.
Arredondando, seriam 611 estudantes.
210

Quando se têm informações sobre a população

Nesse caso, além da margem de erro tolerável, seriam necessárias
informações como desvio padrão, percentual dos indivíduos que
apresentam as características estudadas etc. Essas informações
poderiam ser obtidas de pesquisas anteriores ou, até mesmo, de
uma pré-pesquisa. Nesse último, seria preciso uma amostragem
prévia para realizar os levantamentos necessários. Embora não
seja de nosso interesse aprofundar o estudo sobre este assunto, a
seguir estão as fórmulas para calcular o tamanho da amostra para
os dois casos existentes, para estimar a proporção (percentual) e a
média populacional.
Para a estimativa da média Para a estimativa da proporção

populacional populacional (percentual)
Para amostragem com reposição Para amostragem com reposição
(população infinita) (população infinita)
Para amostragem sem reposição Para amostragem sem reposição

(população finita) (população finita)
Onde: Onde:
n = tamanho da amostra; n = tamanho da amostra;
N = tamanho da população; N = tamanho da população;
e = erro amostral; e = erro amostral;
σ = desvio padrão; p = percentual de elementos
Z = limite do intervalo (dist. Normal). com a característica estudada;
q = percentual de elementos
sem a característica estudada;
Z = limite do intervalo (dist. Normal).
Quadro 5.1 – Tamanho da amostra, proporção (percentual) e média populacional

Embora não seja a intenção de aprofundar esse tipo de cálculo,

faça a atividade de autoavaliação referente ao assunto e constate
se compreendeu a maneira de realizar os cálculos.
Unidade 5 211

Representatividade da amostra na população

Quando você está cozinhando, após temperar a comida, costuma
mexer com uma colher, não é? Por que você mexe? Para que o
tempero fique bem misturado com a comida. Correto? Qual é o
passo seguinte? Provar! Claro, você pega apenas uma pitada da
comida para saber como está o gosto. Para tanto, não é necessário
comer tudo!
Em resumo, o processo de amostragem é bem semelhante. Para

que a prova de comida seja representativa, você teve, antes, que
mexer bem, tornando, assim, uma mistura homogênea. Se for bem
misturada, qualquer amostra que você colha, em qualquer lugar da
panela, dará uma boa noção de como o todo (a comida) está.
Em pesquisas, o processo é bem semelhante!
Você lembra da pesquisa de intenções de voto? Em época de

campanha eleitoral, quando um instituto de pesquisa faz uma
pesquisa, ele tem que selecionar eleitores que representem as mais
diversas camadas sociais, regiões, raças etc., tornando, assim, a
amostra representativa da população.
Seção 2 – Conceitos importantes

Você saberia dizer se os dados levantados com base em alguns
poucos elementos podem trazer informações precisas acerca de
uma população inteira?
De certa forma, sim! Você não terá informações exatas da

população usando uma amostra, mas sim uma aproximação
bastante precisa. É importante salientar que, por não haver
pesquisado a totalidade dos elementos, você é levado a concluir
que os dados nunca representarão um reflexo exato da população.
212

Exemplos bem conhecidos são as pesquisas eleitorais divulgadas

pelos meios de comunicação. Veja:
Gráfico 5.1 – Exemplo dos dados de uma pesquisa eleitoral

Como era a notícia que deu origem a esta tabela?
“A pesquisa de outubro apresentou os seguintes resultados: o

candidato A tem 39% das intenções de voto, o candidato B tem 26%
das intenções de voto, o candidato C tem 9% das intenções de votos
e o candidato D tem 7% das intenções de votos. O erro é de 2%.”
De fato, existe uma margem de erro. Esse erro, relatado na

notícia, gera um intervalo, ou seja, as intenções de votos para
o candidato A podem variar de 37% a 41%. Por se tratar de
uma pesquisa feita por amostragem, você não pode dizer que o
candidato terá realmente 39% das intenções de votos.
Quais são as informações que a amostragem pode

fornecer?
Unidade 5 213

Como você já viu em estatísticas, esses intervalos são divididos

em dois tipos, de acordo da variável estudada. Vale relembrar:
Figura 5.2 – Variável aleatória discreta e intervalo de produção; variável aleatória continua e
intervalo da média
Intervalos de proporção: como visto no exemplo

anterior, correspondem aos percentuais das intenções de
votos. Exemplos: proporção de famílias, percentual de
pacientes, proporção de cobaias etc.;
Intervalos da média: são intervalos baseados em

medidas. São sempre calculados pela média dessas
medidas. Exemplo: escore médio, peso médio, altura
média etc.
Outra informação importante para a definição do erro é o

conhecimento do que, em Estatística, é chamado de nível de
confiança.
Nível de confiança
O nível de confiança é a probabilidade de o intervalo conter o
parâmetro estimado, ou seja, pode-se entender que o valor ou
percentual da população que você está tentando estimar tem
a probabilidade de estar em um intervalo que seria o definido
pelo erro.
214

Intervalo de confiança
Intervalo de confiança é aquele que contém o parâmetro estudado
com determinada probabilidade (nível de confiança), ou seja,
citando o exemplo da pesquisa eleitoral, é o intervalo calculado
com o erro. Veja os valores no exemplo citado nesta seção: “... as
intenções de votos para o candidato A podem variar de 37% a
41%”. Esse é o intervalo de confiança.
Curva normal
Você poderia se perguntar, a partir do que foi apresentado, qual
relação se pode estabelecer entre o nível de confiança e intervalo
de confiança. Como o nível de confiança é a probabilidade de
a estimativa estar correta e essa probabilidade determina um
intervalo (o intervalo de confiança), é possível usar a curva
normal para identificar a ambos. Veja a figura a seguir:
Figura 5.3 – Curva normal

Fonte: Elaborado pelo autor (2006).
Note que o nível de confiança é um percentual definido pelo

intervalo de –z a z. Como a curva é simétrica, metade da área vai
de –z a zero, e a outra metade vai de zero a z, ou seja, ambas são
iguais. Isso é muito importante na definição do valor de z. Para
descobri-lo, você deve calcular a metade do nível de confiança e
usar a tabela da distribuição normal padronizada.
Unidade 5 215

Exemplo 1: Nível de confiança: NC = 95%. Encontrar o valor de

z na tabela.
Passo 1: dividir o NC por dois. Antes disso, não se esqueça de usar o

valor do nível de confiança na forma decimal, ou seja, dividido por 100.
Passo 2: procurar esse valor na tabela e encontrar o z

correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:
Tabela 5.1 – Tabela de valores normais
216

Localizada a área, é só seguir a coluna onde está o valor até a

primeira linha, encontrando o número 0,06. Na horizontal,
basta traçar a linha até a primeira coluna, encontrando o valor
correspondente a 1,9. Juntando, ou somando os dois valores, você
encontra o valor 1,96 para z, ou seja, z = 1,96.
Exemplo 2: Nível de Confiança: NC = 90%. Encontrar o valor

de z na tabela.
Passo 1: dividir o NC por dois. Para tanto, sempre usar o valor do

nível de confiança na forma decimal, ou seja, dividido por 100.


Unidade 5 217

Encontrando a área, é só seguir a coluna na qual está o valor até

a primeira linha. Note que o valor se situa entre 0,4495 e 0,4505
e, sendo assim, você deve usar o valor compreendido entre 0,04 e
0,05 como se fosse um ponto médio, ou seja, 0,045. Seguindo a
linha até a primeira coluna, você encontra o valor 1,6. Efetuando-
se a soma, chega-se ao valor 1,645 para z, ou seja, z = 1,645.
O nível de confiança é muito importante!
Para calcular o erro, é necessário conhecer ou estabelecer

previamente o nível de confiança. Não existe uma regra específica
para a determinação do nível de confiança. Ele é determinado
pelo pesquisador com base em sua experiência e, em geral, os
mais usados são 90% e 95%.
Na seção seguinte, você aprenderá a usar o nível de confiança

e saber como se calcula o erro da estimativa e o intervalo
correspondente.
Seção 3 – Estimativas para a proporção populacional

Antes de começar a calcular o erro da estimativa, conheça
algumas notações:
= proporção da mostra (percentual) – probabilidade de

sucesso;
p = proporção da população – probabilidade de sucesso;

fracasso;
q = proporção da população – probabilidade de fracasso.
Para diferenciar um percentual da amostra do percentual da

população, tanto de sucesso quanto de fracasso, deve usar o
acento circunflexo (“chapéu”) para a amostra.
218

Veja os exemplos a seguir.
Exemplo 1: Em uma determinada população, foi retirada uma

amostra antes da eleição e verificou-se que 30% dos eleitores
votariam no candidato Théo. Após a realização da eleição,
verificou-se que o total de votantes (da população) para esse
candidato foi de 33%. Indicar os percentuais de sucesso e fracasso
tanto para a população quanto para a amostra de votantes e não
votantes em relação ao candidato em questão.
População Amostra
Percentual de votantes em Théo = 33%; Percentual de votantes em Théo = 30%;

p = 33% (percentual de sucesso da população); = 30% (percentual de sucesso da amostra);
Percentual de eleitores que não votam em Percentual de eleitores que não votam em
Théo: calcule o percentual de fracasso sempre Théo: calcule o percentual de fracasso sempre
na forma decimal, ou seja, dividindo o na forma decimal, ou seja, dividindo o
percentual por 100. percentual por 100.
q = 1 – p = 1 – 0,33 = 0,67
No final, multiplique por 100 para encontrar No final, multiplique por 100 para
novamente o percentual: encontrar novamente o percentual:
q = 0,67. 100 = 67% (percentual de (percentual de fracasso
fracasso da população). da amostra).
Quadro 5.2 – População e amostra

Observação: note que a diferença, além dos valores, está em

identificar o percentual da amostra com o acento circunflexo
(“chapéu”).
A seguir, veja um exemplo mais elaborado.
Exemplo 2: Em uma determinada população, foi retirada uma

amostra de 200 votantes antes da eleição e verificou-se que 60
eleitores votariam no candidato Théo. Após a realização da
eleição, verificou-se que o total de votantes (da população) era de
3000 eleitores e que 990 votaram no referido candidato. Indicar
os percentuais de sucesso e fracasso tanto para a população
quanto para a amostra de votantes e não votantes em relação ao
candidato mencionado.
Unidade 5 219

População Amostra
Passo 1: identificar os valores. Passo 1: identificar os valores.
N = 3000 (tamanho da população); N = 200 (tamanho da população);

X = 990 (número de votantes no X = 60 (número de votantes no candidato).
candidato).
Passo 2: cálculo do percentual de votantes
Passo 2: cálculo do percentual de votantes no candidato.
no candidato.
Percentual de votantes em Théo = 30%

Percentual de votantes em Théo = 33%; (percentual de Sucesso da
p = 33% amostra)
(percentual de sucesso da população).
Percentual de eleitores que não votam Percentual de eleitores que não votam
em Théo: calcule o percentual de fracasso em Théo: calcule o percentual de fracasso
sempre na forma decimal, ou seja, sempre na forma decimal, ou seja,
dividindo o percentual por 100. dividindo o percentual por 100.
p = 0,33
q = 1 – p = 1 – 0,33 = 0,67
No final, multiplique por 100 para No final, multiplique por 100 para
encontrar novamente o percentual: encontrar novamente o percentual:
q = 0,67. 100 = 67%
(percentual de fracasso da população). (percentual de fracasso da amostra).
Quadro 5.3 – População e amostra

E para calcular o erro e o intervalo de uma estimativa?
Para fazer uma estimativa, após ter os resultados e calculados

os percentuais, você deve calcular o erro da estimativa e o seu
intervalo (intervalo de confiança). Veja a seguir a fórmula para o
cálculo do erro:
220

Em que:
e = erro da estimativa;
z = limite do intervalo definido pelo nível de confiança;
= proporção da mostra (percentual) – probabilidade de sucesso

(ex.: percentual de votantes em relação a um determinado
candidato);
= proporção da mostra (percentual) – probabilidade de fracasso (ex.:

percentual dos eleitores que não votam em determinado candidato);
O intervalo é calculado subtraindo-se o erro do percentual e,

em seguida, somando-se o erro a esse percentual. Veja abaixo a
notação usada:
Em que:
P = probabilidade de o valor estimado estar no intervalo

calculado;

sucesso (ex.: percentual da amostra de votantes em relação a um
determinado candidato);
p = proporção da população (percentual) que se quer estimar

– probabilidade de sucesso (ex.: percentual da população de
votantes em relação a um determinado candidato);
NC = nível de confiança.
Unidade 5 221

Exemplo 1: Uma pesquisa recente, efetuada com uma amostra

de 300 eleitores de uma pequena cidade, indicou que 35% deles
votariam no candidato Arthur. Faça uma estimativa para a
totalidade dos eleitores (população) dessa cidade que votarão no
referido candidato. Use um nível de confiança de 95%.
Passo 1: calcular e procurar o z na tabela (ver exemplo 1, ao final da

seção 1). Dividir o NC por dois. Para tanto, não se esqueça de usar o
Passo 2: procurar na tabela esse valor e encontrar o z

222

Localizada a área, é só seguir a coluna na qual está o valor até a

primeira linha, chegando-se ao número 0,06 e, na horizontal, seguir
a linha até a primeira coluna, encontrando o valor 1,9. Efetuada a
soma, você encontra o valor 1,96 para z, ou seja, z = 1,96.
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e

aplicá-la ao caso em análise.
Em que:
z = 1,96 (calculado e encontrado no passo 2);
= 35% ou (percentual da amostra de eleitores que

votam no candidato);
(percentual da amostra dos eleitores que não

n = 300 (tamanho da amostra).
Cálculo do erro
= 1,96.
Ao final de seu cálculo, deve-se multiplicar o resultado por 100,

para que ele fique em porcentagem. Esse é um erro comum dos
meios de comunicação (TV, rádio, jornais, etc.), ao informarem
os resultados de uma pesquisa citam “... com um erro de 5,4% a
mais ou a menos.”
Unidade 5 223

Passo 4: calcular o intervalo da estimativa. Neste passo, o cálculo

pode ser efetuado na forma percentual ou decimal. Interpretando
os resultados obtidos, tem-se que as intenções de votos para o
candidato referido devem ficar entre 29,603% e 40,397%. Segundo as
notações da Estatística, esse intervalo se escreve da seguinte forma:
ou 29,603%
ou 40,397%
Interpretando os resultados obtidos, tem-se que as intenções de votos

para o candidato referido devem ficar entre 29,603% e 40,397%.
Segundo as notações da Estatística, esse intervalo se escreve da

seguinte forma:
P(0,29603 < p < 0,40397) = 0,95 ou
P(29,603% < p < 40,397%) = 95%
Que leitura você pode fazer? O intervalo da

estimativa para a totalidade dos eleitores que votariam
no candidato mencionado está compreendido
entre 29,603% e 40,397%, com base em um nível de
confiança de 95%.
Exemplo 2: Um levantamento de alunos aprovados e reprovados

feito com base no sistema municipal de educação de um município,
referente ao Ensino Fundamental, usando uma amostra de
2500 alunos, indicou que 1500 alunos dentre eles haviam sido
reprovados. Com um nível de confiança de 90%, faça uma
estimativa para a população de alunos que foram reprovados no
Ensino Fundamental do sistema municipal de educação.
224

Passo 1: como não foi indicado o percentual de alunos da amostra

que foram reprovados, você deve, em primeiro lugar, calcular esse
percentual (como foi feito no exemplo 2 no início da seção).
n = 2500 (tamanho da amostra);
X = 1500 (número de alunos reprovados).
Cálculo do percentual:
Você pode manter o resultado na forma decimal, pois o cálculo

do erro também é feito assim.
Passo 2: calcular e procurar o z na tabela (ver exemplo 2, ao final da

seção 1). Dividir o NC por dois. Para tanto, não se esqueça de usar o
Passo 3: procurar na tabela esse valor e encontrar o z

Unidade 5 225

Localizada a área, é só seguir a coluna na qual está o valor até

a primeira linha. Note que o valor se encontra entre 0,4495 e
0,4505 e, sendo assim,.você deve usar o valor compreendido
entre 0,04 e 0,05 como se fosse um ponto médio, ou seja, 0,045.
Seguindo a linha até a primeira coluna, você encontra o valor
correspondente a 1,6. Juntando, ou somando os dois valores, você
chega ao valor 1,645 para z, ou seja, z = 1,645.

aplicá-la ao caso em exame.
Em que:
e = o que se quer calcular (erro da estimativa);
= 60% ou (percentual da amostra de alunos

reprovados)
226

(percentual da amostra de alunos que não foram

reprovados)
Cálculo do erro
= 1,645 .
e = 1,645 . 0,009797959 ou 1,16%
Ao final, não se esqueça de multiplicar o resultado por 100

para transformá-lo novamente em porcentagem. Esse é um erro
comum dos meios de comunicação (TV, rádio, jornais etc.), ao
informarem os resultados de uma pesquisa citam: “... com um
erro de 1,16% a mais ou a menos”.
Passo 5: calcular o intervalo da estimativa.
Neste passo, o cálculo pode ser feito na forma percentual ou

decimal.
ou 58,38%
ou 61,61%
Interpretando os resultados obtidos, tem-se que de 58,38% a

61,61% da totalidade dos alunos cursando o Ensino Fundamental
na rede municipal foram reprovados.
Segundo as notações de Estatística, esse intervalo se escreve da

seguinte forma:
P(0,29603 < p < 0,40397) = 0,90 ou
P(29,603 < p < 40,397) = 90%
Unidade 5 227


estimativa para a totalidade dos eleitores que votariam
no candidato está compreendido entre 29,603% e
40,397%, com base em um nível de confiança de 90%.
Nesta seção, você aprendeu como calcular o erro referente à

estimativa do percentual de uma população. Na próxima, você
verá como calcular o erro de uma estimativa para a média de
uma população.
Seção 4 – Estimativas para média populacional

Ao realizar uma pesquisa por amostragem, além de calcular
percentuais, você pode obter algumas médias, como por exemplo,
a média das alturas, das idades, dos pesos etc. O processo é
semelhante, ou seja, calcula-se o erro e o intervalo. O que muda é a
forma de cálculo do erro. Isso vale para as séries de dados amostrais
que podem ser aproximados por uma distribuição normal.
E para calcular o erro e o intervalo de uma estimativa

da média populacional?
Para calcular o erro de uma estimativa da média populacional,

você vai precisar da média de uma amostra e do desvio padrão.
Este pode ser obtido com base na própria população, se for
possível, ou na amostra. O desvio padrão da amostra pode ser
usado como uma aproximação.
228

Veja, a seguir, a fórmula para o cálculo do erro:
Em que:
z = limite do intervalo definido pelo nível de confiança;
S(x) = desvio padrão da amostra (ou da população, se possível);
O intervalo é calculado subtraindo-se o erro da média da amostra e

somando-se o erro à referida média. Veja, abaixo, a notação usada:
Em que:
P = probabilidade de o valor estimado estar no intervalo

calculado;
x = média da amostra;
μ = média da população (o que você vai estimar);
NC = nível de confiança.
Veja os exemplos a seguir
Exemplo 1: Em sondagem realizada com base nos alunos do

curso de Matemática das quintas séries de uma determinada
escola, o resultado geral apresentou uma média de 6,7, com um
desvio padrão de 1,2. Com esse tipo de informação, pode-se
realizar uma série de análises. A partir desses dados, calcule uma
estimativa (erro e intervalo), considerando essa série com uma
distribuição normal para a média populacional a um nível de
confiança de 95% e que a amostra foi de 35 alunos.
Unidade 5 229

Passo 1: calcular e procurar z na tabela (veja exemplo1, seção 1).

Dividir o NC por dois. Usar o valor do nível de confiança na forma
decimal, ou seja, dividido por 100.


primeira linha, encontrando o número 0,06. Na horizontal, basta
traçar a linha até a primeira coluna, chegando ao número 1,9.
Somando os dois, você encontra o valor correspondente a 1,96
para z, ou seja, z = 1,96.
230


aplicá-la ao caso em questão.
Em que:
z = 1,96 (ver passo 2);
S(x) = 1,2 (desvio padrão da amostra)
Cálculo do erro:
= 1,96.
Não é necessário multiplicar por 100, pois este resultado não

indica um percentual, mas sim pontos (a nota)!
Passo 4: calcular o intervalo da estimativa.
Neste passo, como na estimativa para o percentual, você deve

subtrair e somar o erro à média:
Interpretando os resultados obtidos, tem-se que a média das

notas da totalidade dos alunos está compreendida entre 6,3 e 7,1
pontos, aproximadamente.
Unidade 5 231


seguinte forma:
P(6,7 – 0,3976 < μ < 6,7 + 0,3976) = 0,95
P(6,3024 < μ < 7,0976) = 0,95
Que leitura você pode fazer? O intervalo da estimativa

para a média das notas da totalidade dos alunos está
compreendido entre 6,3 e 7,1 pontos, aproximadamente,
com um índice de confiança de 95%.
Exemplo 2: Em uma pesquisa realizada com diversas turmas

de uma escola, os alunos levaram 39 minutos, em média, para
terminar uma avaliação de matemática. O tamanho da amostra
era de 100 estudantes. O desvio padrão dessa amostra foi de 18
minutos. Com base em um nível de confiança de 90%, qual seria a
estimativa para a média populacional da escola e sua interpretação?
Calculando
Passo 1: calcular e procurar o z na tabela (ver exemplo 2, no final da

seção 1). Dividir o NC por dois. Para tanto, usar o valor do nível de
confiança na forma decimal, ou seja, dividido por 100.

232


primeira linha. Note que o valor se encontra entre 0,4495 e 0,4505
e, sendo assim, deve-se usar o valor compreendido entre 0,04 e
0,05 como se fosse um ponto médio, ou seja, 0,045. Traçando a
linha até a primeira coluna, chega-se ao número 1,6. Somando os
dois, você encontra o valor 1,645 para z, ou seja, z = 1,645.
Unidade 5 233


aplicá-la ao caso em questão.
Em que:
z =1,645 (ver passo 2);
S(x) = 18 (desvio padrão da amostra);
Cálculo do erro:
= 1,645.
Não é necessário multiplicar por 100, pois este resultado não

indica um percentual, mas sim minutos!
Passo 4: calcular o intervalo da estimativa. Neste passo, como na

estimativa para o percentual, você deve subtrair e somar o erro à média.
Interpretando os resultados obtidos, tem-se que o tempo médio

para a realização da avaliação está compreendido entre 36,04 e
41,96 minutos, aproximadamente.

seguinte forma:
P(39 – 2,961 < μ < 39 + 2,961) = 0,90
P(36,039 < μ < 41,961) = 0,90
234


estimativa para a média do tempo de execução da
avaliação está compreendido entre 36,04 e 41,96
minutos, com um índice de confiança de 90%
Seção 5 – Análise de variância – ANOVA
Como comparar as características de várias amostras

Logo após calcular a estimativa de uma média populacional,
podemos ter outro desafio: definir se as médias de várias
populações são mesmo semelhantes ou existem diferenças que
superam os próprios problemas do processo de amostragem.
Isso porque, muitas vezes, amostras de diferentes populações

são selecionadas com a finalidade de se avaliarem possíveis
diferenças entre as distribuições populacionais de alguma
característica de interesse.
Podemos citar alguns exemplos destas situações:
 Seleção de lotes de parafusos fabricados em

diferentes empresas com diferentes equipamentos,
para avaliar se a distribuição (populacional) do
valor médio do diâmetro da cabeça dos parafusos
produzidos varia com a marca do equipamento usado
na fabricação.
 Para curar certa doença, existem quatro tratamentos

possíveis: A, B, C e D. Pretende-se saber se existem
diferenças significativas nos tratamentos no que diz
respeito ao tempo necessário para eliminar a doença.
 Análise de amostras de água de diversos pontos da

cidade para verificar se existe variação na distribuição
de alguma característica (nível de ácidos, por exemplo)
associada à qualidade da água entre bairros.
Unidade 5 235

Em muitos casos, uma análise descritiva dos dados indica

que modelos gaussianos ou normais são compatíveis com suas
distribuições. Em outras palavras, sob o ponto de vista estatístico,
podemos considerar as k amostras disponíveis como provenientes
de populações normais com médias μ1, μ2, ..., μk.
Se não existirem razões contrárias, podemos também supor

que as amostras são independentes. Adicionalmente, a análise
descritiva muitas vezes sugere que as k populações têm a mesma
variância σ2 (desconhecida).
O problema proposto pode então ser encarado como um teste da

hipótese de que as médias são iguais: H: μ1 = μ2 = ... =μk. E, nestas
situações, a técnica para resolver problemas desse tipo (e muitos
outros semelhantes) é chamada de análise de variância de um fator.
Definição do problema a ser resolvido

Considerando que existem k populações de interesse, nas quais se
estuda uma característica comum X1, X2, ..., Xk, são as variáveis
aleatórias que representam tais característica nas populações 1, 2, ...,
k, respectivamente. Assim, a hipótese a testar é: μ1 = μ2 = ... = μk?
Neste problema, as k populações podem ser vistas como k níveis

de um mesmo fator. E, assim, a questão é saber se o fator exerce
alguma influência na variação da característica em estudo (a
média, neste caso).
Caso o problema apresente somente um fator,

estaremos trabalhando com análise de variância de um
fator, conhecido como ANOVA de um único fator. Claro
que também existe ANOVA de múltiplos fatores, mas
este tema não será abordado neste estudo.
236

Analisando o problema com um exemplo

Exemplo: o Sr. Fernando Fernandes é dono de uma Indústria
Metal-Mecânica e pretende comprar três fábricas de parafusos
para suprimentos da sua própria indústria. Para isso, precisa
analisar o volume de fabricação das fábricas a comprar, já que ele
precisa que as três tenham produções semelhantes de parafusos
para prover regularmente à sua industria.
Para isso, o Sr. Fernando Fernandes seleciona aleatoriamente

cinco semanas do semestre, nas quais observa o volume de
fabricação semanal para cada fábrica (ou seja, as três amostras
são independentes).
Os dados amostrais estão registrados na seguinte tabela:
Tabela 5.7 – Dados amostrais
Semanas Fábrica 1 Fábrica 2 Fábrica 3

Semana 1 47 55 54
Semana 2 53 54 50
Semana 3 49 58 51
Semana 4 50 61 51
Semana 5 46 52 49
(médias amostrais) = 49 = 56 = 51 = 52
Representamos por Xi o volume de fabricação semanal na Fábrica

i (i = 1, 2, 3) e por µi o valor médio de Xi.
Neste exemplo, existe apenas um fator de interesse, o fator “fábrica”

que apresenta três níveis ou grupos: fábrica 1, fábrica 2 e fábrica 3.
Assim, cada nível do fator define uma população de média μi.
Unidade 5 237

Assim, o que o Sr. Fernando Fernandes pretende saber é se as

médias dos três níveis, ou populações, são iguais, isto é, pretende-
se saber se a hipótese é certa ou não:
H: µ1 = µ2 = µ3
(Hipótese de igualdade na fabricação média das três fábricas)
Então a questão a responder é:
Serão as médias amostrais =49, = 56, = 51,

diferentes porque há diferenças entre as médias
populacionais: µ1 = µ2 = µ3? Ou serão essas diferenças
atribuídas a flutuações amostrais?
Podemos, então, formular as seguintes hipóteses:
H: µ1 = µ2 = µ3
Ou, em outras palavras, a hipótese está afirmando que não há

diferença entre o volume médio de fabricação das três fábricas.
Lembre-se: como toda hipótese, as pesquisas (testes

em nosso caso) poderão confirmá-la ou negá-la!
Pressupostos para resolver a questão

A aplicação da análise de variância pressupõe a verificação das
seguintes condições:
as amostras devem ser aleatórias e independentes;
as amostras devem ser extraídas de populações normais;
as populações devem ter variâncias iguais.
Assim, temos duas situações possíveis demonstradas a seguir.
238

A hipótese H é verdadeira
As diferenças observadas entre as médias amostrais são devidas a
flutuações amostrais. Ou seja, neste caso, teremos que µ1 = µ2 =
µ3: todas as amostras provêm de populações com médias iguais.
Como se supôs que todas as populações são normais e têm

variâncias iguais, isto é o mesmo que extrair todas as amostras de
uma única população (de uma única fábrica).
Gráfico 5.2 – Distribuição populacional quando µ1 = µ2 = µ3 = µ

A hipótese H é falsa
As diferenças observadas entre as médias amostrais são
demasiado grandes para serem devidas unicamente a flutuações
amostrais.
Aqui, as médias das populações não são iguais, ou seja pelo

menos duas fábricas têm volumes de produção média diferentes.
As amostras recolhidas provêm de populações diferentes.
Gráfico 5.3 – Distribuição populacional quando µ1 ≠ µ2 ≠ µ3

Unidade 5 239

Teste ANOVA
Para testar a hipótese, devemos trabalhar com o valor da
Estatística de teste F, que é outro valor que surge de outra
distribuição de probabilidade, que a semelhança da distribuição
normal tem uma tabela para calcular seu valor, no qual devemos
entrar com os graus de liberdades (número de dados da amostra
diminuído um) para obter o valor correspondendo a um certo
nível de confiança (por exemplo, NC = 95%, ou seja, um nível de
significância de 5%: α = 5%).
Então, a estatística de teste mede a razão entre a variação entre

grupos e a variação dentro dos grupos:
F= Variação entre grupos

Variação dentro dos grupos
A hipótese H é, pois, rejeitada para valores grandes da estatística F.
A tabela ANOVA tem a seguinte estrutura:
Tabela 5.8 – Tabela ANOVA
Por exemplo, para n = 3 (três grupos) e m = 5 (cinco amostras por

grupo) resultam em:
240

GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 = K);
GLm = 15 – 3 = 12 (graus de liberdade do denominador,

15 = 3 x 5 = N).
Ao final da seção, você pode achar a tabela completa para

determinar o PC (ponto crítico) ou estatística F para um nível de
confiança de 95%.
Assim, na tabela, procura-se na primeira coluna (GL do

denominador) a linha do 12 e, na primeira fila, a linha do 2 (GL
do numerador), resulta num valor do estatístico F: F = 3,89, este
valor definido pela tabela é conhecido como Ponto Crítico ou PC.
Devemos aclarar que existem diversas tabelas de F, cada uma

delas calculadas para um grau de significância diferente, a tabela
de nosso trabalho é a tabela para um grau de significância de 5%.
Agora, temos que calcular o valor de F para nosso experimento, e

se o valor do F calculado resulta maior que o valor de F tabelado
(PC), a hipótese deverá ser rejeitada.
Dessa forma, para calcular nosso valor de F amostral, devemos

utilizar uma tabela de layout já tradicional para organizar
nossos cálculos.
A tabela, chamada de Tabela ANOVA, tem a seguinte estrutura

tradicional:
Unidade 5 241

Nessa tabela, temos:
SST = é a soma de quadrados total e mede a variação total nos

dados;
SSA = é a soma de quadrados entre os níveis (grupos) do fator

e mede a variação entre grupos (populações); é designada por
variação explicada, pois ela é explicada pelo fato de as amostras
poderem provir de populações diferentes;
SSE = é a soma de quadrados dentro dos níveis (grupos) do fator

e mede a variação dentro dos grupos (populações); é, por vezes,
designada por variação não explicada ou residual, pois é atribuída
a flutuações dentro da mesma população, portanto não pode ser
explicada pelas possíveis diferenças entre os grupos (populações).
Também temos que:
MSA = que é a soma média de quadrados entre grupos;
MSE = que é a soma média de quadrados dentro dos grupos ou

residual.
Pode-se provar que:

SST = SSA + SSE;
e, também, que:
(K − 1) + (N – K) = N – 1
Isso permite verificar os cálculos da tabela ANOVA.
Assim, sob o pressuposto da hipótese ser verdadeira, tem-se:
242

A hipótese deve ser rejeitada se o valor observado de F se situar à

direita do ponto crítico; isto é, rejeita-se H se Fobs ≥ PC, em que o
ponto crítico PC é dado por:
Então, para nosso exemplo da compra das fábricas por parte do Sr.
Fernando Fernandes, vamos ver o que podemos concluir ao nível de
significância de 0.05, ou seja, a um nível de confiança NC = 95%.
Cálculo de SSE:
Cálculo de SSA:
SSA = 5(49 – 52)2 + 5(56 – 52)2 + 5(51 – 52)2 = 130
Assim, a tabela ANOVA resulta, numericamente para o exemplo,

nos seguintes valores:
E, se a hipótese H é verdadeira, resultará:
Unidade 5 243

Da tabela F, a gente já calculou o valor F para os graus de

liberdade 2 e 12 e 95% de confiança:
F1–a,2,12 = 3.89
E, segundo a tabela ANOVA, o valor observado da estatística F é:
E, como resultando que 8,3 > 3,89, então a hipótese (H: µ1 =

µ2 = µ3) é rejeitada ao nível de significância de 0,05 ou nível de
confiança de 95%; isto é, existem diferenças significativas entre
as médias amostrais das vendas, e há, portanto, evidência de que
existem pelo menos duas lojas com volumes médios de produção
diferentes entre elas.
Em outras palavras, o fator fábrica exerce uma influência

significativa sobre o volume médio da produção de parafusos:
tem, ao menos, uma fábrica que está produzindo bem menos ou
bem mais que as outras, desequilibrado o suprimento constante
de parafusos que a indústria de Fernando Fernandez precisa.
244

Síntese
O processo de amostragem é muito importante e eficaz no dia

a dia de qualquer profissional. Diariamente, você esbarra com
situações semelhantes às que foram analisadas nesta unidade,
tanto nos meios de comunicação, como rádio, TV, jornais etc.,
mas também em escolas, empresas e outras instituições.
Nesta unidade, você pôde ver as facilidades e a importância do uso

de amostragem. Hoje, os processos de amostragem e as estimativas
estão muito precisos, a ponto de ser mais confiável usar a amostra
que realizar uma pesquisa com a totalidade da população.
Você teve, também, algumas noções de como funciona todo esse

processo, mas fique à vontade para aprofundar esse tema tão
importante e fundamental na realização de uma pesquisa. Muitas
vezes, você terá que usar ferramentas como as que vimos aqui,
tanto na sua vida acadêmica quanto na profissional.
Entender que as pesquisas feitas com base em uma amostra não

culminam em resultados exatos, e poder definir a margem de erro
ocasionada por essa amostragem, é um passo muito importante
na formação profissional e acadêmica, além de possibilitar uma
leitura mais realista da realidade.
Unidade 5 245


1) Estão listadas, a seguir, uma série de estudos e a margem de erro que

o pesquisador irá adotar como tolerável, bem como o tamanho da
população alvo desse estudo. Calcule o tamanho da amostra necessária
para realizar as pesquisas considerando que o pesquisador não tem
acesso ao tamanho da população e que o pesquisador tem acesso ao
tamanho da população (calcular para os dois casos).
Tipos de estudos, margem de erro e tamanho da população e da amostra
Tamanho Tamanho
Erro
Tema do estudo da da amostra
tolerável população (preencher)
a) Estudo socioeconômico com 0,03 5600

estudantes da Unisul
b) Estudo com famílias do bairro Rio 0,04 9400

Vermelho, em Florianópolis
c) Estudo com adolescentes com Teste 0,05 400

de Sondagem Intelectual (TSI)
d) Estudo da fecundidade na cidade de 0,06 125.000

Florianópolis
e) Estudo com usuários de drogas 0,09 250

adolescentes de uma escola
f ) Estudo sobre analfabetismo no bairro 0,09 2.500

Rio Tavares, em Florianópolis
g) Estudo de Índice de Massa Corporal 0,05 4.000

dos estudantes da Unisul
h) Pesquisa de intenções de voto no 0,02 80.000.000*

Brasil
246

2) Leia a notícia da IstoÉ On-Line (2004):
Florianópolis / SC – Caça ao tucano

Sem contar com o apoio do governador, da prefeita Ângela Amin
(PP) e de caciques da política catarinense, Dário Berger, candidato
da coligação PSDB-PMN, é a grande surpresa até o momento nas
eleições em Florianópolis. Concorrendo pela primeira vez a um
cargo público de expressão, Berger vem liderando com folga a
corrida eleitoral em Floripa. Pela pesquisa ISTOÉ/Databrain – feita
entre os dias 26 e 27 de julho, com 700 entrevistados, margem
de erro de 2,74 pontos porcentuais e coeficiente de confiança de
90% – Berger apresenta tranquilos 26,4% das intenções de voto. O
levantamento foi registrado no TRE-SC com o número 559/2004.
(Dados adaptados de ISTOÈ ONLINE, 2004).
Com os dados dessa matéria, mostre os cálculos que foram feitos para
se chegar ao erro de 2,74 pontos percentuais, e encontre o intervalo da
estimativa.
Unidade 5 247

3) A formação dos professores de Matemática da rede pública é

importante para o ensino e para o aprendizado e é cada vez mais
valorizado pelas instituições de ensino. Uma amostragem feita com
300 professores indicou que apenas 240 professores do Ensino
Fundamental da rede pública têm graduação completa em Matemática.
Faça uma estimativa para o percentual da população de professores
que têm graduação completa usando um nível de confiança de 95%
(de início, não se esqueça de calcular o percentual de professores com
graduação completa, assim como o intervalo da estimativa).
248

4) Uma amostragem com 250 alunos foi feita em escolas, e, entre outras
perguntas, questionou-se sobre o peso dos alunos da quinta-série. O
peso médio dos alunos entrevistados foi de 29,3 Kg e apresentou um
desvio padrão de 3,4 Kg. Usando um nível de confiança de 95%, calcule
uma estimativa para a totalidade (população) de alunos da quinta-série
(não esqueça de calcular o erro e o intervalo correspondentes).
Unidade 5 249

5) O governo federal instituiu o programa Bolsa Escola, no qual as famílias

de baixa renda recebem ajuda financeira por cada filho que frequenta a
escola. Essa ajuda financeira, segundo setor responsável, é em média de
R$ 150,00 por família e apresenta um desvio padrão de R$ 31,50. Esses
dados foram obtidos por uma amostragem realizada com 1000 famílias.
Faça uma estimativa (erro e intervalo) para o valor médio recebido pela
população das famílias com base em um nível de confiança de 98%
(não se esqueça de calcular z, dividindo 98 por 100 e, após, dividindo o
resultado obtido por 2. Procure o resultado na tabela).
6) O diretor de marketing de uma indústria pretende comprar uma nova

máquina para fabricar parafusos. Você foi designado para estudar
três marcas de maquinarias semelhantes, cada uma delas combina,
de modo diferente, fatores como o preço do produto, volume de
fabricação, condições de consumo de energia etc.
Qualquer um destes equipamentos pode ser utilizada na sua indústria,
não havendo qualquer tipo de influência no rendimento pela presença
dos outros equipamentos da indústria.
Para saber se há diferença entre o volume de produção das
três máquinas visando à sua eficácia, cada uma delas é testada,
aleatoriamente, funcionando em algumas das lojas dos fabricantes
durante um período de duração limitada. Note que as lojas de venda
são selecionadas de modo que as três amostras sejam aleatórias e
independentes entre si.
250

A quantidade de peças produzidas durante este período constam na

tabela seguinte:
Maquina 1 Máquina 2 Máquina 3
8 10 7
6 8 5
5 12 8
6 7 6
7 9 7
10 5
11
Soma 32 67 38
Seja Xi a variável aleatória que representa o volume de produção de cada

máquina i (i = 1,2,3), também admitamos que X1, X2 e X3 têm distribuição
normal com iguais variâncias e fixemos o nível de confiança do teste em
95%, ou seja, trabalhemos com um nível de significância de 5%.
A hipótese a testar é: H: µ1 = µ2 = µ3, ou seja: aceita-se que não há
diferença entre os níveis de produção relativamente ao volume médio
de peças que podem fabricar.
No caso que a hipótese H seja rejeitada, estaremos demostrando que pelo
menos duas máquinas produzem um volume médio de peças diferente.
Assim, para resolver este problema, calcule o ponto crítico pelo médio
do estatístico F da tabela da distribuição para um nível de significância
de 5%. Verifique se aceita ou rejeita a hipótese de trabalho e crie a
tabela ANOVA.
Unidade 5 251

Saiba mais
Se quiser aprofundar os estudos relativos ao assunto tratado nessa

unidade, pesquise em:


Makron Books, 1999.

LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de

Janeiro: Campus, 2000.

6
UNIDADE 6
Regressão linear e gráficos de

controle
Compreender e calcular a correlação entre duas
variáveis.
Analisar a força de correlação entre duas variáveis.
Ajustar linearmente as duas variáveis.
Calcular previsões usando análise de regressão.
Seções de estudo
Seção 1 Correlação linear simples
Seção 2 Análise de regressão linear
Seção 3 Gráficos de controle


Pense na seguinte situação: será que existe alguma relação entre
peso e altura? E entre nota escolar e idade? Sabemos como
funcionam algumas destas relações por simples experiência de
vida. Como, por exemplo, você pode dizer que quanto mais alta
é a pessoa, mais pesada ela é. Claro que existem as exceções, mas
geralmente, baixinhos são gordinhos, e altos, magrinhos.
Nesta unidade, você irá estudar como se pode analisar e

comparar duas variáveis. Além disso, você irá aprender a fazer
previsões utilizando esse método.
Bons estudos!
Seção 1 – Correlação linear simples

Os métodos que você estudou até o momento são eficazes para
analisar e interpretar somente uma variável de cada vez. Se eles
servem para a análise de uma variável, como analisar e comparar
duas variáveis simultaneamente? Para compreender como solucionar
tal situação, você irá conhecer a correlação linear simples.
A correlação é uma ferramenta destinada ao estudo

da relação entre duas variáveis quantitativas, além de
fornecer a intensidade dessa relação.
Para você estudar como usar a correlação linear simples, é

importante que você conheça o que é diagrama de dispersão e o
coeficiente de correlação linear de Pearson. Conheça melhor estes
assuntos a seguir.
254

Diagrama de dispersão
O diagrama de dispersão ajuda a definir a correlação entre duas
variáveis quantitativas de modo gráfico. Em outras palavras,
a relação entre duas variáveis, X e Y, pode ser vista em um
diagrama, no qual são marcados os pontos correspondentes aos
pares ordenados gerados pela relação X → Y, e (x,y) são esses pares
ordenados. Dessa forma se constrói um diagrama de dispersão.
Quanto mais esses pontos estão próximos à reta imaginária gerada

pela nuvem de pontos, mais forte será a correlação. Observe o
gráfico a seguir e acompanhe os exemplos apresentados.
No Gráfico 6.1, os pares ordenados são gerados da relação entre a

altura das pessoas em centímetros e o peso em quilos.
Gráfico 6.1 – Diagrama de dispersão

Coeficiente de correlação linear de Pearson

O coeficiente de correlação permite que você analise a força ou a
existência da correlação entre duas variáveis. Considerando que
n é o número de observações (tamanho da amostra), o coeficiente
será dado pela seguinte fórmula:
n. ∑ x. y − [(∑ x )(
. ∑ y )]
rxy =
[n ∑ x 2
][
− (∑ x ) . n ∑ y 2 − (∑ y )
2 2
]
Unidade 6 255

Em que:
r = resultado do coeficiente de correlação linear de Pearson;
n = número de observações;
x = valores assumidos pela variável X;
y = valores assumidos pela variável Y.
Obs.: O coeficiente de Pearson pode variar de −1 a +1 → [−1,+1].
Quanto ao resultado de r, você deve considerar cinco situações,

descritas no quadro a seguir.
Valor de r Correlação entre as variáveis
r próximo de 0 Correlação linear pouco significativa
r=0 Não há correlação linear entre as variáveis
r próximo de –1 Há correlação linear negativa (significativa)
r = –1 Há correlação linear negativa perfeita
r próximo de +1 Há correlação linear positiva (significativa)
r = +1 Há correlação linear positiva perfeita
Quadro 6.1 – Resultados possíveis do valor de x

Tipos de correlações
Então, segundo os resultados de r, as correlações podem assumir
diferentes tipos, os quais você pode acompanhar detalhadamente
a seguir:
a) Correlação linear positiva
Neste caso, o coeficiente de Pearson estará entre 0 e 1 →

intervalo (0,1).
256

Gráfico 6.2 – Correlação linear positiva: altura x peso

x cresce, y cresce: no exemplo, se a altura cresce, o peso

cresce;
x decresce, y decresce: no exemplo, se a altura decresce, o

peso decresce.
b) Correlação linear perfeita positiva
Neste caso, o coeficiente de Pearson r será +1: os pontos estão

perfeitamente alinhados.
Gráfico 6.3 – Correlação linear perfeita positiva: altura x peso

x cresce, y cresce: no exemplo, se altura cresce, o peso

cresce;
x decresce, y decresce: no exemplo: se a altura decresce, o

peso decresce.
Unidade 6 257

c) Correlação linear negativa
Neste caso, o coeficiente de Pearson estará entre 0 e −1:

intervalo [−1,0].
Gráfico 6.4 – Correlação linear negativa: idade x nota

x cresce, y decresce: no exemplo, se a idade cresce, a nota

decresce;
x decresce, y cresce: no exemplo, se a idade decresce, a

nota cresce.
d) Correlação linear perfeita negativa
Neste caso, o coeficiente de Pearson r será −1: os pontos estão

perfeitamente alinhados.
Gráfico 6.5 – Correlação linear perfeita negativa: idade x nota

258

x cresce, y decresce: no exemplo, se a idade cresce, a nota

decresce;
x decresce, y cresce: no exemplo, se a idade decresce, a

nota cresce.
e) Correlação linear nula ou ausência de correlação
A seguir, veja exemplo de quando não há correlação entre as

variáveis X e Y (coeficiente de Pearson r = 0).
Gráfico 6.6 – correlação linear nula ou ausência de correlação: altura x nota

Como calcular o coeficiente de correlação?

Para obter esta resposta, acompanhe com atenção o exemplo.
Exemplo: Calcule o coeficiente de correlação de Pearson e

construa o diagrama de dispersão para uma turma de alunos,
correlacionando altura e peso, descritas a seguir:
Unidade 6 259

Tabela 6.1 – Tabela de altura e peso dos alunos de uma série
Passo 1: acrescente, na tabela, mais três colunas para auxiliar nos

cálculos. Some os elementos da coluna x (altura) e escreva o total na
última linha, obtendo, assim, o Σx. Some os elementos da coluna y (peso)
e escreva o total na última linha, obtendo, assim, o Σy (veja tabela).
Passo 2: calcule os elementos da terceira coluna (x.y), multiplicando

cada um dos elementos da coluna x (altura) por cada um dos
elementos da coluna y (peso).
160.61 = 9760
155.56 = 8680
152.55 = 8360
E, assim, até o último aluno (aluno de número 10: veja os

resultados na tabela). Em seguida, some todos eles e escreva o
total na última linha, obtendo, assim, o Σx y.
260

Passo 3: calcule os elementos da quarta coluna (x2), elevando ao

quadrado, cada um dos elementos da coluna x (altura).
(160)2 = 25600
(155)2 = 24025
(152)2 = 23104
E, assim, até o último aluno (veja os resultados na tabela). Em

seguida, some todos eles e escreva o total na última linha, para
obter, assim, o Σx2.
Passo 4: calcule os elementos da quinta coluna (y2), elevando ao

quadrado, cada um dos elementos da coluna y (peso em Kg).
(61)2 = 3721
(56)2 = 3136
(55)2 = 3025
E, assim, até o último aluno (veja os resultados na tabela). Em

seguida, some todos eles e escreva o total na última linha, para
obter, assim, o Σy2.
Passo 5: calcule o coeficiente de correlação utilizando a fórmula vista

anteriormente.
Agora, que tal identificar os elementos da fórmula?

n = número de observações (10 alunos) → n = 10.
Unidade 6 261

Os elementos a seguir foram calculados nos passos anteriores:
Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
Σy2 = 50323
Observação: É importante lembrar que:
Σx.y ≠ Σx . Σy
Σx2 ≠ Σy2
Se você escrever na fórmula, terá:
Passo 6: agora, construa o diagrama de dispersão; para construir o

diagrama; você deve marcar os pontos de cada par ordenado usando
os valores da coluna das alturas como x e da coluna dos pesos como
y, formando (x, y); veja o gráfico a seguir:
262

Gráfico 6.7 – Gráfico altura x peso

Como interpretar? O coeficiente de correlação resultou em

um número positivo e próximo de 1 (r = 0,98), sendo assim,
a correlação entre a altura dos alunos e o peso é positiva
(significativa), ou seja, quanto maior a altura do aluno, maior
será seu peso, e quanto menor for sua altura menor será seu peso.
Uma vez que você acompanhou e entendeu bem o exemplo de
como aplicar o coeficiente de correlação de Pearson, siga para o
estudo da próxima seção.
Seção 2 – Análise de regressão linear

Para fazer a análise da regressão, nos casos em que é possível
estabelecer uma correlação entre duas variáveis, você terá de usar essa
relação para prever valores para uma delas (sempre a variável que for
adotada como Y), mas isso só será possível quando for conhecido o
valor da outra variável, no caso, a variável X. E essa previsão só tem
significado caso a força da correlação seja significativa ou perfeita
(quando r está próximo ou igual a +1 ou −1). Essa força se dá pela
proximidade dos pontos do diagrama de dispersão à reta imaginária.
A reta imaginária obtida pela aproximação dos pontos

do diagrama de dispersão é chamada de reta de
regressão!
Unidade 6 263

Para encontrar uma equação que lhe auxilie a prever valores

de Y, usa-se o Método dos Mínimos Quadrados, o qual você
conhecerá a seguir.
A escolha da variável que será o Y está relacionada à

variável que o pesquisador deseja estimar. No exemplo
anterior, se a intenção é a de estimar o peso dos alunos,
então, o Y deve ser a variável peso. Caso a necessidade
fosse a de estimar a altura dos alunos, a variável Y
passaria a ser a altura.
Método dos mínimos quadrados

Pode-se representar a reta imaginária pela equação:
Reta de regressão: = b + a.X
Sendo:
Em que:
= valor predito de y (a ser estimado);
x = valor da variável x para determinado elemento da amostra;
y = valor da variável y para determinado elemento da amostra;
n = nº total de observações (tamanho da amostra);
b = a intersecção do eixo y (ou coeficiente linear da reta);
a = coeficiente de inclinação da reta (ou coeficiente angular da reta).
264

Ao predizer um valor de y com base em determinado

valor de x, quanto mais significativa a correlação linear,
mais precisa se torna a previsão.
 Interpolação: estimativas com valores entre os da série;
 Extrapolação: estimativas com valores fora dos da série;
 Resíduo: é a diferença entre um valor amostral
observado y, e o valor predito com base na equação de
regressão.
A tabela a seguir (a mesma do exemplo anterior) descreve as

alturas e pesos dos alunos de uma turma. Você deverá:
a) construir a equação de uma reta de regressão para prever

o peso dos alunos;
b) prever o peso ( ) de um aluno com 175 cm (x) de altura.
Tabela 6.2 – Altura e peso dos alunos de uma série

Para o item a):
Considerando que a tabela é a mesma do exemplo da seção 1

(cálculo do coeficiente de correlação), não será necessário calcular
as colunas nem os totais (veja a tabela).
Unidade 6 265

Equação da reta de regressão → = b + a.X
Passo 1: você pode começar calculando a inclinação da reta (a).
Inclinação da reta (a) →
Agora, identifique os elementos da fórmula:

Os elementos a seguir foram calculados nos passos anteriores
Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
Passo 2: calcule a intersecção com o eixo y (b).
Intersecção do eixo y (b) →

Os elementos a seguir foram calculados nos passos anteriores.
266

Σx = 1723
Σy = 703
a = 0,72117
b = –53,95769
Passo 3: construa a equação da reta de regressão.
Após calcular a e b, tem-se:
a = 0,72117
b = − 53,95769
= b + a.X
= 0,72117x – 53,95769
Para o item b):
Fazer a previsão para um aluno que mede 175 cm. Você deve usar
175 como X = 175. Substituir o valor de X na equação de regressão.
= 0,72117 . 175 – 53,95769 = 126,20475 – 53,95769
= 72,24706
Como interpretar? A previsão para o peso deste aluno que mede

175 cm é de 72,25 Kg.
Unidade 6 267

Seção 3 – Gráficos de controle

Antes de iniciar, vamos a uma questão: você saberia explicar o
porquê do controle nos processos?
Quando fabricado um produto, bem ou serviço, as características

deste produto irão apresentar certa variabilidade, devido à variação
sofrida pelos fatores que compõem o próprio processo produtivo;
por exemplo, diferença entre máquinas, mudanças nas condições
ambientais, variação do material utilizado na fabricação, diferença
entre fornecedores, e outras tantas causas possíveis.
Apesar do esforço direcionado para controlar todas esta

variabilidade, ela irá sempre existir no produto acabado.
Portanto, é importante controlar esta variabilidade para que
possam ser fabricados produtos dentro dos padrões de qualidade
próprios da empresa.
Também é importante verificar a estabilidade

do processo de produção, já que de processos
instáveis irão resultar produtos defeituosos ou
perdas na produção ou, ainda, baixa na qualidade e,
consequentemente, perda da confiança do cliente.
A partir do exposto, é possível compreender melhor a necessidade

dos gráficos de controle. O que nos leva a outra questão: o que
são os gráficos de controle?
Os gráficos de controle são um método para analisar

e ajustar as variações de um processo em função do
tempo. Descrevem o processo considerando duas
caraterísticas básicas: centralização, definida pela
média aritmética, e dispersão, verificada pelo desvio
padrão ou pela amplitude.
Assim, temos dois grandes grupos de gráfico de controle: os

gráficos para variáveis e os gráficos para atributos. As variáveis
são os dados que podem ser medidos ou que sofrem variações
contínuas (por exemplo, resistência à compressão, dureza,
diâmetros etc.), e os atributos são dados que somente podem ser
268

contados ou classificados (por exemplo, passa/não passa, claro/

escuro, quente/frio etc.), em outras palavras, são aqueles que
representam variáveis contínuas ou discretas, respectivamente.
Tipos de gráficos de controle

O gráfico para atributos mais usado é o gráfico NP, que
monitora a variação do número de itens defeituosos em amostras
de tamanho constante.
O gráfico de variável mais conhecido é o gráfico X-r, que monitora

a variação da média e amplitude dos dados ao longo do tempo.
E quais são os principais objetivos destes gráficos?
Monitorar os dados temporais para uma característica

particular de qualidade, como exemplo: a cor de um
produto, o peso ou a temperatura;
detectar mudanças no processo ao longo do mesmo;
responder a perguntas do tipo:
»» são os lotes de matéria-prima ou a variação de turno

que causam a variação do processo?
»» são causas especiais do processo ou causas naturais que

ocasionam a variação no processo?
»» a variação entre os diferentes lotes de produção é

maior que o esperado?
Acompanhe alguns exemplos de aplicação dos gráficos de

controles a seguir.
Unidade 6 269

Exemplo 1:
Proposta: verificar se o processo de fabricação está sob

controle estatístico, ou seja, somente causas comuns de variação
influenciam processos.
Problema: a fábrica Peças & Peças deseja realizar um controle de

qualidade do processo de fabricação de parafusos.
Dados coletados: em todas as horas, são retiradas cinco peças

da linha de produção, que são medidas, e os valores, registrados.
Definimos, neste caso, que o tamanho do subgrupo é igual a
cinco, destes, 25 subgrupos foram obtidos.
Exemplo 2:
Proposta: verificar se a proporção de pedidos não aceitos está sob

controle.
Problema: o Banco de Minas deseja saber o número de pedidos

não aceitos para a abertura de contas em uma rede bancária.
Coleta de dados: Foi coletada uma amostra de 20 pedidos.
Exemplo 3:
Proposta: verificar o número de erros nas fichas de

cadastramento de uma empresa.
Problema: foi observado um grande número de erros no

preenchimento dos cadastros dos vendedores de uma empresa.
Deseja-se analisar o número de erros por cadastro (não
conformidades).
Coleta de dados: analisa-se uma amostra de 22 conjuntos,

contendo 15 fichas de cadastro cada.
270

Construção de gráficos de controle com ajuda de planilhas de

cálculo: gráfico NP
A fábrica de Parafusos Fernando Fernandes, no final de cada dia de
trabalho, inspeciona uma amostra de cem peças para obter o número
de defeitos e conhecer o grau de qualidade da sua produção.
Pode-se perceber que essa característica de qualidade varia ao

longo do tempo; e, assim, para facilitar esse estudo, devemos usar
uma ferramenta que possibilite a visualização do número de peças
dentro dos padrões predeterminados pela fábrica e aquelas que
estão fora desses padrões, como são os gráficos de controle.
Os gráficos de controle típicos exibem três linhas paralelas

ao eixo X: a linha central, que representa o valor médio do
característico de qualidade exigido pela fábrica; a linha superior,
que representa o limite superior de controle (LSC); e a linha
inferior, representando o limite inferior de controle (LIC).
Assim, uma vez apresentado o gráfico, os pontos da amostragem

devem permanecer dentro do intervalo determinado por LSC e
LIC. Cada ponto representa uma amostra do processo.
Para visualizar a evolução do característico de qualidade ao longo

do tempo, é usual unir os pontos com retas.
Assim, os gráficos de controle apresentam o desempenho do

processo no tempo e podem indicar que o processo está sob
controle estatístico quando:
todos os pontos do gráfico estão dentro dos limites de

controle;
a disposição dos pontos dentro dos limites é aleatória;
No caso que todos os pontos amostrais estejam sem distribuição

aleatória, pode acontecer de estar trabalhando com dados visados.
Unidade 6 271

Construção do gráfico de controle NP

Logo após de uma semana de amostragem, os resultado são os
seguintes:
Tabela 6.3 – Resultado da amostragem

Amostra número 1 2 3 4 5 6
Tamanho amostra n 100 100 100 100 100 100
Número de peças defeituosas d 5 2 7 3 6 2
Proporção de peças defeituosas p 0,05 0,02 0,07 0,03 0,06 0,03
Para o cálculo da média das proporções, devemos utilizar a

seguinte fórmula:
P = (1 / m) Spi
Em que:
P = média das proporções;
m = número de amostras (no exemplo, m = 6);
Spi = somatória das proporções.
Assim sendo:
P = 1/6 * (B4 + C4 + D4 + E4 + F4 + G4) = 0,04167
Para calcular o número médio, usamos a fórmula:
NP = P x n
Em que:
NP = número médio;
n = tamanho da amostra (no exemplo, n = 100).
272

Para o exemplo:
NP = 0,04167 x 100 = 4,167
Para calcular o LSC, usamos a fórmula:
Em que:
LSC = limite superior de controle;
NP = número médio;
P = médias das proporções.
Para o exemplo dado:
LSC = 10,1615
Para o cálculo do LIC, usamos a fórmula:
Em que LIC é o limite inferior de controle, e, usando os dados

do exemplo, resulta em:
LIC = −1,8281.
Porém, pelo fato de que a fábrica está testando o número de peças

defeituosas, resulta que o LIC (o mínimo de peças defeituosas
produzidas) não pode ser um número negativo.
No exemplo, devemos assumir como LIC o menor valor possível,

ou seja, zero peças defeituosas.
Unidade 6 273

Temos, então, todos os parâmetros necessários à construção do

gráfico NP:
LIC = 0
LSC = 10,1615
NP = 4,167
Agora, vamos construir o gráfico, com a ajuda de uma tabela em

Excel, que possuirá quatro colunas:
Número de peças defeituosas;
Limite superior de controle (LSC);
Limite inferior de controle (LIC);
Número médio (NP).
Tabela 6.4 – Peças com defeito
Note que os valores de LSC, LIC e NP são iguais para cada

amostra. Com a tabela pronta, efetua-se o procedimento usual para
a construção de um gráfico de linhas com os pontos plotados.
Este procedimento será mostrado a seguir:
Marcar o intervalo A1:D7 e, a partir do menu Inserir /

Gráfico, inserir um gráfico de linhas com marcas para
os pontos.
274

Figura 6.1 – Criação de gráfico de controle em Excel

E, assim, veremos uma janela semelhante à seguinte:

Nesta caixa, podemos visualizar como ficará o gráfico.
Clique em continuar; na próxima caixa, mostrada na Figura

3.3, definiremos os detalhes do gráfico NP, tais como título do
gráfico, legendas e títulos dos eixos X e Y.
Feito isso, finalizaremos o procedimento clicando em finalizar.
Unidade 6 275


Resultando, finalmente, no gráfico de controle NP.
Gráfico 6.8 – Gráfico de controle

Analisando o gráfico, observamos que todos os pontos amostrais

estão distribuídos aleatoriamente ao redor da média, sem
apresentar valores fora dos limites máximos e mínimos e sem
apresentar dados visados; através dessa análise, podemos concluir
que o processo de fabricação está sob controle estatístico e não
apresenta falhas de produção que precisem parar a produção para,
por exemplo, calibrar alguma parte de equipamento.
Dito com outras palavras, conclui-se que o número de peças não

conformes está sob controle estatístico, já que nenhum ponto
ultrapassa os limites de controle.
276

Construção de gráficos de controle com ajuda de planilhas de

cálculo: gráfico X-r
Uma empresa que produz, ensaca e comercializa arroz deve verificar
a qualidade de seu produto em relação ao peso de cada pacote.
Para isso, faz-se necessário um gráfico de controle para variáveis;

neste caso, a variável é o peso dos pacotes.
Por tal motivo, foi feita uma amostragem aleatória de quatro

pacotes em cada uma das seis amostras. Para cada uma das seis
amostras, calculou-se a média aritmética e a amplitude dos pesos
(valor máximo – valor mínimo).
Na construção do gráfico X-r, são necessários os seguintes

valores:
média das médias das amostras (X);
média das amplitudes das amostras (K);
tamanho das amostras (n).
Com estas duas médias, X e K, e com n, pode-se calcular os

limites de controle (LIC e LSC).
Então, temos que:
Faz-se amostragem dos pesos nas m amostras com n pacotes e

registram-se estes pesos:
número de amostras m = 6;
número de pacotes por amostra n = 4.
Com os dados coletados, podemos construir a tabela seguinte e

calcular a média e amplitude dos pesos de cada amostra.
Unidade 6 277

Tabela 6.5 – Amostras
Agora, devemos calcular os valores necessários para a construção

do gráfico de controle X-r para cada uma das amostras e, no caso
da amostra 1, resulta:
Cálculo da média
X = Σn amostra 1 / n
Em que:
X = média aritmética;
Σn amostra 1 = soma dos pesos da amostra 1;
X = 250 / 4 = 62,5
Cálculo da amplitude dos pesos
r = valor máximo − valor mínimo
Em que:
r = amplitude
r = 70 – 55 = 15
278

Calculamos, assim, a média e a amplitude de todas as amostras,

construindo a seguinte tabela:
Continuando, para calcular os limites de controle inferior

e superior, calculamos a média das médias e a média das
amplitudes para cada amostra:
Média das médias
Média das médias (X) = Soma das médias / m
X = 367,50 / 6 = 61,25
Médias das amplitudes
Médias das amplitudes (K) = Soma das amplitudes / m
K = 95 / 6 = 15,83
E, finalmente, construímos uma tabela semelhante à

seguinte:
Unidade 6 279

Todos os valores necessários para calcularmos LIC e LSC estão

disponíveis:
média das médias: X = 61,25;
média das amplitudes: K = 15,83;
tamanho da amostra: n = 4.
Para calcularmos LIC e LSC:
LIC = X − A2 x K
LSC = X + A2 x K
Observação: o valor de A2 é obtido na tabela no final desta seção.
Para nosso caso, resulta em:
LIC = 61,25 − (0,729 x 15,83) = 49,71
LSC = 61,25 + (0,729 x 15,83) = 72,79
Podemos, para construir o gráfico de controle, construir uma

tabela semelhante à seguinte:
280

Tabela 6.8 – Média das amostras
Média das LIC LSC Média das

amostras médias
62,50 49,71 72,79 61,25
60,00 49,71 72,79 61,25
67,50 49,71 72,79 61,25
55,00 49,71 72,79 61,25
60,00 49,71 72,79 61,25
62,50 49,71 72,79 61,25
E, seguindo os mesmos passos do exemplo anterior para

construir o gráfico, resulta no nosso gráfico de controle X-r:
Gráfico 6.9 – Gráfico de Controle

Unidade 6 281

Síntese
O processo de amostragem é muito importante e eficaz no dia

a dia de qualquer profissional. Diariamente, você esbarra com
situações semelhantes às que foram analisadas nesta unidade,
tanto nos meios de comunicação, como rádio, TV, jornais etc.,
mas também em escolas, empresas e outras instituições.
É preciso entender que as pesquisas feitas com base em uma

amostra não culminam com resultados exatos, e poder definir
a margem de erro ocasionada por essa amostragem é um passo
muito importante na formação profissional e acadêmica, além de
possibilitar uma leitura mais realista da realidade.
282

1) Uma turma da oitava série realizou avaliação em duas disciplinas,

Matemática e Biologia; as notas obtidas estão na tabela abaixo. Usando
estes dados, calcule o que se pede:
Aluno Nota Matemática Nota Biologia X.Y X2 Y2
1 9,5 3,4 32,3 90,3 11,6

2 9,0 5,4 48,6 81,0 29,2
3 8,5 6,0 51,0 72,3 36,0
4 8,0 6,0 48,0 64,0 36,0
5 8,0 5,0 40,0 64,0 25,0
6 7,5 7,0 52,5 56,3 49,0
7 7,5 9,0 67,5 56,3 81,0
8 6,0 7,5 45,0 36,0 56,3
9 5,0 8,0 40,0 25,0 64,0
10 4,0 8,0 32,0 16,0 64,0
Totais 73,0 65,3 456,9 561,0 452,0
a) Calcule o coeficiente de correlação entre as duas variáveis, identifique o

tipo de correlação e interprete o resultado.
b) Construa uma equação para a relação indicada (a equação da reta de
regressão) para possibilitar o cálculo de estimativas para a nota de
Biologia (Y), segundo a nota de Matemática (X).
c) Estime a nota de Biologia considerando que um aluno tenha tirado nota
6,5 (X) em Matemática. Substitua na equação da reta construída no
item “b”.
Unidade 6 283

Saiba mais
Se quiser aprofundar os estudos relativos ao assunto tratado nessa

unidade, pesquise em:


Makron Books, 1999.

LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de

Janeiro: Campus, 2000.
284

Para concluir o estudo
Muitas vezes nos deparamos com situações em que

temos que lidar com muitos dados e não sabemos como
vamos lidar com eles. Esta disciplina é uma tentativa de
proporcionar ferramentas para os profissionais que lidam
com esse tipo de situação.
Desde a apresentação de relatórios e trabalhos científicos

a pesquisas, controle, testes, projeções e previsões, a
Estatística está sempre presente. Afinal, no dia a dia,
lidamos com uma grande quantidade de informações
e pergunto: De que vale ter tanta informação se não
sabemos o que fazer com elas? Espera-se que todo o
conhecimento que você adquiriu nesta disciplina seja
suporte para as suas análises, opiniões e decisões.
Muito sucesso profissional!
Prof. Luiz Arthur Dornelles Júnior

Referências
ACÇÃO LOCAL DE ESTATÍSTICA APLICADA – ALEA. 1999-2010.

Disponível em: <http://alea-estp.ine.pt>. Acesso em: 15 ago. 2010.
ARANGO, Héctor Gustavo. Bioestatística teórica e
computacional. Rio de Janeiro: Guanabara, 2001.
ASSOCIAÇÃO NACIONAL DE ENTIDADES PROMOTORAS DE
EMPREENDIMENTOS INOVADORES - Anprotec. 2008. Disponível
em: <http://www.anprotec.org.br>. Acesso em: 15 ago. 2010.
BANCO CENTRAL DO BRASIL. 2010. Disponível em: <http://www.
bcb.gov.br/>. Acesso em: 15 ago. 2010.
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.
ed. São Paulo: Harbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva,
2001.
DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS
SOCIOECONÔMICOS – DIEESE. 2010. Disponível em: <http://www.
dieese.org.br/>. Acesso em: 3 ago. 2010.
FLEMMING, Diva Marília. Representações gráficas. São José:
Saint Germain, 2003.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso
de estatística. 6. ed. São Paulo: Atlas, 1996.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE.
2010. Disponível em: <http://www.ibge.gov.br/>. Acesso em: 3
set. 2010.
ISTOÈ ONLINE. Florianópolis / SC – Caça ao tucano. 2004.
Disponível em: <http://www.terra.com.br/istoe/especiais/
eleicoes_2004/1_rodada/florianopolis.htm. Acesso em: 10 ago
2006.
LEVIN, Jack. Estatística aplicada às ciências humanas. São
Paulo: Habra, 1987.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: Makron
Books, 1999

NEUFELD, John L. Estatística aplicada à administração usando excel.

São Paulo: Prentice Hall, 2003.
POPULATION REFERENCE BUREAU. La juventud del mundo 2000.
Washington DC: Population Reference Bureau, 2000. Disponível em:
<http://www.prb.org/SpanishContent.aspx>. Acesso em: 3 março 2011.
PORTAL BRASIL. 2010. Disponível em: <http://www.portalbrasil.net/>.
Acesso em: 3 set. 2010.
RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era, 2006.
SILVA, Ermes Medeiros da. Estatística para os cursos de Economia,
Administração e Ciências Contábeis. São Paulo: Atlas, 1999.
______. Estatística. São Paulo: Atlas, 1996. v.1.
SINDICATO DA HABITAÇÃO – SECOVI/RS. 2010. Disponível em: <http://
www.secovi-rs.com.br/index.asp>. Acesso em: 10 ago. 2010.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1994.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed.
São Paulo: Atlas, 1985.
TRIBUNAL SUPERIOR ELEITORAL. 2010. Disponível em: <http://www.tse.
gov.br>. Acesso em: 20 set. 2010.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de Janeiro: Campus,
2000.
______. Princípios de Estatística. São Paulo: Pioneira, 2003.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro: LTC, 2004.
288

Sobre os professores conteudistas
Graduado em Matemática pela Fundação Universidade

do Rio Grande (FURG). É professor da Universidade
do Sul de Santa Catarina (UNISUL) desde 2000,
onde leciona as disciplinas de Estatística, Métodos
Quantitativos e Programação Linear. Atualmente, está
cursando Especialização em Educação Matemática na
Unisul Virtual.
Gabriel Cremona Parma (2ª edição)
Doutor em Engenharia Civil, na área de Gestão

Territorial pela Universidade Federal de Santa Catarina
(UFSC). Mestre em Engenharia Civil, na área Cadastro
Técnico Multifinalitário pela Universidade Federal de
Santa Catarina (UFSC). Cartógrafo: UNL, Argentina.
Consultor especializado em Geoprocessamento e
Controle de Qualidade de Dados Geoespaciais. Atua
como professor e pesquisador na Universidade do Sul de
Santa Catarina (UNISUL) nos cursos de Engenharia
e Arquitetura e Urbanismo, assim como em projetos
de pesquisa e extensão. Ex-professor na Universidade
Nacional do Litoral (UNL), na Argentina.

Respostas e comentários das
atividades de autoavaliação
Unidade 1
1) O censo é uma coleção de dados de uma população,
enquanto que a estimação usa dados de uma amostra para
avaliar um parâmetro (característica descritiva dos elementos
da população).
2) Deve-se escolher elementos com as mesmas características

da população, ou seja, elementos que realmente
representem a população. Aqui, você pode citar exemplos
(escolher clientes de níveis sociais diferentes para estudar
grau de satisfação, escolher amostras de diversos locais
de um lago para análise etc.). Isso é necessário para que
você possa realmente refletir a realidade, sem distorcer ou
conduzir os resultados.
3. Nessa questão, você deve citar exemplos do seu dia a dia, por
exemplo:
Variável Exemplos
Qualitativa nominal Nacionalidade
Qualitativa ordinal Atendimento (ótimo, muito bom, ... , muito ruim.)
Quantitativa discreta Número de filhos
Quantitativa contínua Escore de teste psicológico

4) A classificação que você pode fazer é:

os dados coletados por meio de questionário: primários;
os dados coletados na Federação: secundários.
5) Observe, no quadro a seguir, a resposta para esta questão.
DESCRIÇÃO DA VARIÁVEL CLASSIFICAÇÃO

Saldo em conta corrente em R$ Quantitativa contínua
Idade do cliente Quantitativa contínua
Sexo do cliente Qualitativa nominal
Classe econômica Qualitativa ordinal
Estado civil Qualitativa nominal
Número de defeitos do produto Quantitativa discreta
Consumo de energia em kWh Quantitativa contínua
Grau de instrução Qualitativa ordinal
Número de filhos Quantitativa discreta
Hierarquia de uma empresa Qualitativa nominal
Número de filhos de uma família Qualitativa nominal
Diâmetro da peça produzida Quantitativa discreta
Comprimento da peça Quantitativa contínua
Tempo de espera em caixa eletrônico em minutos Qualitativa nominal
Nome de país exportador de petróleo Quantitativa contínua
Grau de satisfação no atendimento numa loja comercial Qualitativa nominal
Número de ações negociadas na bolsa de valores Quantitativa contínua
Número de alunos de uma universidade Quantitativa contínua
Altura dos funcionários de uma empresa Qualitativa nominal
6) A classificação que você pode fazer é:

A) série específico-geográfica;
B) série específica.
292

Unidade 2
1) Montagem da tabela:
Principais motivos de tensão (estresse) Nº de clientes

Morte de um filho 16
Morte do cônjuge 12
Morte dos pais ou irmãos 11
Divórcio 8
Doença grave 7
Demissão 6
Acidentes de trabalho nos últimos 36 meses

Nº de acidentes Número de meses
3 4
4 5
5 9
6 7
7 5
8 6
Renda das famílias de um bairro de classe baixa de Florianópolis
Renda família (R$) Nº de pacientes

112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
293

4) Completando a tabela:
Renda de famílias de um bairro da classe baixa de Florianópolis
Renda Nº de fiacd fiaci fr fp(%) PM

(R$) famílias “abaixo de” “acima de”
112 |--- 115 2 2 36 0,0556 5,56 113,5
115 |--- 118 6 8 34 0,1667 16,7 116,5
118 |--- 121 4 12 28 0,1111 11,1 119,5
121 |--- 124 9 21 24 0,25 25 122,5
124 |--- 127 8 29 15 0,2222 22,2 125,5
127 |--- 130 7 36 7 0,1944 19,4 128,5
Total (Σfi) 36 1,0 100,0
Respondendo as perguntas:
a) 21 famílias;
b) 29 famílias;
c) 15 famílias;
d) 7 famílias;
e) 11,1% das famílias;
f) 25% das famílias.
5) Completando a tabela:
Número de operários acidentados para cada mês
Número de Nº de fiacd fiaci fr fp (%)

acidentados meses “abaixo de” “acima de”
3 4 4 36 0,1111 11,1
4 5 9 32 0,1389 13,9
5 9 18 27 0,2500 25
6 7 25 18 0,1944 19,4
7 5 30 11 0,1389 13,9
8 6 36 6 0,1667 16,7
Total (Σfi) 36 1,0 100,0
294

a) 18 meses;
b) 25 meses;
c) 18 meses;
d) 27 meses;
e) 25% dos meses;
f) 13,89% dos meses.
6) Essa atividade vai depender muito do gráfico escolhido e de sua análise.

Não esqueça de usar as dicas para analisar um gráfico:
identificar as variáveis expressas pelo gráfico;
identificar os intervalos em que as variáveis atuam;
identificar onde a variável que está sendo estudada apresenta
máximo e mínimo;
identificar se a tendência é de crescimento ou de decrescimento. Em
alguns casos, pode ser bastante difícil realizar essa identificação;
analisar o comportamento de uma maneira geral, identificando as
alterações mais expressivas;
outras análises também são possíveis, isso só depende do
observador e, muitas vezes, da variável que estamos estudando.
7) O histograma e o polígono de frequências deverão ser semelhantes ao

seguir:
295

Unidade 3
1) Em primeiro lugar, construa a tabela:
Número de dias (xi) Número de funcionários (fi) xi.fi

0 10 0
1 16 16
2 14 28
3 8 24
4 5 20
5 4 20
6 4 24
7 3 21
Total (Σfi) 64 153
Em segundo lugar, calcule a média, dividindo a soma da coluna xi.fi,

pela soma da coluna fi. O resultado é a média:
Interpretação: o número médio de dias de consumo de álcool pelos

funcionários é de 2,39 dias.
2) Usando um processo semelhante ao anterior, em primeiro lugar, você

deve calcular o ponto médio. Em seguida, multiplicar o ponto médio
pela fi de cada linha e escrever o resultado na coluna PM.fi. Some esses
números no final da coluna, conforme a tabela.
Renda (R$) Número de famílias PM PM.fi

112 |---- 115 2 113,5 227
115 |---- 118 6 116,5 699
118 |---- 121 4 119,5 478
121 |---- 124 9 122,5 1102,5
124 |---- 127 8 125,5 1004
127 |---- 130 7 128,5 899,5
Total (Σfi) 36 4410
296

Em segundo lugar, divida o resultado da soma (ΣPM.fi) pelo soma dos

números da coluna fi:
Interpretação: o nível da renda familiar é de 122,5 reais
3)
a) Conjunto 1
Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posições:
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
Segundo passo: calcular a posição, levando em consideração que a

série tem 9 elementos, sendo, assim, ímpar:
Terceiro passo: encontrar, na tabela p, o elemento que ocupa a 5ª

posição:
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
Me = 15 – o tempo de internação mediano é de 15 dias.

Interpretação: 50% dos valores observados são menores ou iguais a
15, e 50% dos valores observados são maiores ou iguais a 15.
b) Conjunto 2
Primeiro passo: escrever, na tabela, os dados organizados em ordem
14 14 15 15 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Segundo passo: calcular a posição, levando em consideração que a

série tem 8 elementos, sendo, assim, par:
297

A mediana ocupa uma posição entre a 4ª e a 5ª posições.

Terceiro passo: encontrar na tabela os elementos que ocupam as
posições 4ª e 5ª:
14 14 15 15 Me 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Elemento da 4ª posição = 15;

Elemento da 5ª posição = 16.
Quarto passo: calcular a media:
Me = 15,5.
Interpretação: 50% dos valores observados são menores ou iguais a
15,5 e 50% dos valores observados são maiores ou iguais a 15,5.
4)
a) Conjunto 1
Organizando os dados:
1 1 1 1 2 2 2 2 3
5 5 6 6 7 7 7 8 8
A série tem duas modas: Mo1 = 1 e Mo2 = 2.

Interpretação moda 1: O valor mais frequente é 1.
b) Conjunto 2
2 2 2 3 3 3 3 5
5 5 5 6 6 6 8 8
A série tem duas modas: Mo1 = 3 e Mo2 = 5.

298

c) Conjunto 3
1 1 2 2 3 3 4 4
5 5 6 6 7 7 8 8
A série não tem moda, pois não tem nenhum dado que se repita mais
que os outros
Interpretação moda: é uma série amodal, ou seja, não tem valor(es)
mais frequente.
5) Primeiro passo: escrever, na tabela, os dados organizados em ordem

2 3 4 4 4 5 5 6 8 8 9 9
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª
Para o terceiro quartil

Segundo passo: calcular a posição. Considerando N = 12:
Ou seja, Q3 está entre a 9ª e a 10ª posições.

Terceiro passo: calcular o terceiro quartil.
Valor que ocupa a 9ª posição = 8;
Então, calcule da seguinte forma:
Interpretação:
75% dos dados observados são menores ou iguais a 8, e 25% dos dados
observados são maiores ou iguais a 8.
Para o nono decil (note que D9 = P90)
Quarto passo: calcular a posição. Considerando N = 12:
Ou seja, D9 está entre a 11ª e a 12ª posições.
299

Quinto passo: calcular o nono decil.

Interpretação:
Para o trigésimo quinto percentil
Sexto passo: calcular a posição. Considerando N = 12:
Ou seja, P35 está entre a 4ª e a 5ª posições.

Sétimo passo: calcular o trigésimo quinto percentil.
Interpretação:
6) Nessa questão, você pode seguir os seguintes passos:

Passo 1: calcular a média:
Obs.: não esqueça que, na média, usamos a letra grega μ para a

população.
300

Passo 2: calcular os desvios (xi – ):

(x1 – ) = (25 − 28,33)= −3,33
(x2 – ) = (22 − 28,33) = −6,33
(x 3 – ) = (36 − 28,33) = 7,67
(x4 – ) = (20 − 28,33) = −8,33
(x5 – ) = (29 − 28,33) = 0,67
(x 6 – ) = (38 − 28,33) = 9,67
Passo 3: elevar ao quadrado cada desvio (xi – )2:
(x1 – )2 = (−3,33) 2 = 11,0889
(x2 – )2 = (−6,33) 2 = 40,0689
(x3 – )2 = (7,67) 2 = 58,8289
(x4 – )2 = (−8,33) 2 = 69,3889
(x5 – )2 = (0,67) 2 = 0,4489
(x 6 – )2 = (9,67) 2 = 93,5089
Somando todos os resultados, temos 273,3334.
Passo 4: calcular a média dos quadrados dos desvios. Aqui, você vai
calcular para a população (variância):
Variância:
Então σ2(x) = 45,5556

Passo 5: calcular o desvio padrão calculando a raiz da variância:
Desvio padrão:
Interpretação: a variabilidade de tempo de execução do teste é de

6,7495 minutos.
301

7) O modo de calcular é o mesmo da questão anterior, só muda no final,

ao calcular a variância, usamos a fórmula para amostra.
Passo 1: calcular a média:
Obs.: não esqueça que, na média, usamos a xˉ para a amostra.

Passo 2: calcular os desvios (xi – ):
(x1 – ) = (15 – 17,6) = –2,6
(x2 – ) = (10 – 17,6) = –7,6
(x3 – ) = (9 – 17,6) = –8,6
(x4 – ) = (23 – 17,6) = 5,4
(x5 – ) = (31 – 17,6) = 13,4
Passo 3: elevar ao quadrado cada desvio (xi – )2:
(x1 – )2 = (–2,6)2 = 6,76
(x2 – )2 = (–7,6)2 = 57,76
(x3 – )2 = (–8,6) 2 = 73,96
(x4 – )2 = (5,4) 2 = 29,16
(x5 – )2 = (13,4) 2 = 179,56
Somando todos os resultados, temos 347,2.
Passo 4: calcular a média dos quadrados dos desvios. Aqui, você vai
calcular para a amostra (variância):
Variância:
Então, s2 (x) = 86,8.

Passo 5: calcular o desvio padrão calculando a raiz da variância:
Desvio padrão:
Interpretação: a variabilidade dos escores é de 9,32 pontos.
302

8) O primeiro passo é calcular a média:
1–2,39 = –1,39 (–2,39)2 = 5,71
0–2,39 = –2,39 (–1,39)2 = 1,93
No de dias No de func.
xi.fi (xi – x̄) (xi – x̄)2 (xi – x̄)2. fi
(xi) (fi)
0 10 0 –2,39 5,71 57,1 5,71×10 = 57,1
1 16 16 –1,39 1,93 30,88
2 14 28 –0,39 0,15 2,1 1,93×16 = 30,88
3 8 24 0,61 0,37 2,96
4 5 20 1,61 2,59 12,95
5 4 20 2,61 6,81 27,24
6 4 24 3,61 13,03 52,12
7 3 21 4,61 21,25 63,75
Σ 64 153 249,1 Σ(xi – x̄)2. fi
Σfi Σxi.fi
Vamos calcular passo a passo

Passo 1: devemos somar a coluna das frequências simples (fi) para
obter Σfi (frequência total):
Σfi = 64
Passo 2: calcular a média: multiplicar cada xi por sua correspondente fi
e escrever na coluna xi.fi; somar os valores calculados e escrever no final
da coluna esse resultado, que é o Σxi.fi:
Σxi.fi = 153
Passo 3: dividir o resultado do passo 2 (Σxi.f i) pelo resultado do
passo 1 (Σf i):
Passo 4: calcular a quarta coluna, (xi – ) subtraindo o xi de cada linha

pela média:
0 – 2,39 = –2,39
1 – 2,39 = –1,39
2 – 2,39 = –0,39
3 – 2,39 = 0,61
4 – 2,39 = 1,61
5 – 2,39 = 2,61
6 – 2,39 = 3,61
7 – 2,39 = 4,61
303

Passo 5: calcular a quinta coluna elevando os valores da quarta ao

quadrado, (xi – )2:
(–2,39)2 = 5,71
(–1,39) 2 = 1,93
(–0,39) 2 = 0,15
(0,61) 2 = 0,37
(1,61) 2 = 2,59
(2,61) 2 = 6,81
(3,61) 2 = 13,03
(4,61) 2 = 21,25
Passo 6: calcular a sexta coluna multiplicando os valores da quinta pela
frequência simples de cada linha, (xi – )2.fi:
5,71×10 = 57,1
1,93×16 = 30,88
0,15×14 = 2,1
0,37×8 = 2,96
2,59×5 = 12,95
6,81×4 = 27,24
13,03×4 = 52,12
21,25×3 = 63,75
Passo 7: somar os valores obtidos na sexta coluna, Σ(xi – )2.fi:
Σ(xi – )2.fi = 249,1
Passo 8: calcular a variância para a amostra:
Passo 9: calcular o desvio padrão:
304

9) Mais uma vez, vamos calcular passo a passo. Comparando com a anterior,
a diferença está em que aquela era para amostra, enquanto que essa é
para a população. Sugestão: use as colunas para facilitar os cálculos.
18 – 18,873 = –0,873
(–1,873)2 = 3,508
17 – 18,873 = –1,873
(–0,873)2 = 0,762
Idade dos estudantes da disciplina de métodos estatísticos
Idade (xi) N de
o
est. xi.fi (xi – μ) (xi – μ)2 (xi – μ)2. fi
(fi)
17 5 85 -1,873 3,508 17,54 3,508×5 = 17,54
18 20 360 -0,873 0,762 15,24
19 22 418 0,127 0,016 0,352 0,762×20 = 15,24
20 10 200 1,127 1,27 12,7
21 6 126 2,127 4,524 27,144
(Σfi) 63 1189 72,976 Σ(xi – x̄)2. fi
Σfi Σxi.fi
Passo 1: devemos somar a coluna das frequências simples (fi) para

obter Σfi (frequência total):
Σfi = 63
Passo 2: calcular a média: multiplicar cada xi por sua correspondente fi
e escrever na coluna xi.fi; somar os valores calculados e escrever no final
da coluna esse resultado, que é o Σxi.fi:
Σxi.fi = 1189
Passo 3: dividir o resultado do passo 2 (Σxi.f i) pelo resultado do
passo 1 (Σf i):
Passo 4: calcular a quarta coluna, (xi – μ) subtraindo o xi de cada linha

pela média:
17 – 18,873 = –1,873
18 – 18,873 = –0,873
19 – 18,873 = 0,127
20 – 18,873 = 1,127
21 – 18,873 = 2,127
305

Passo 5: calcular a quinta coluna, elevando os valores da quarta ao

quadrado, (xi - μ)2:
(–1,873)2 = 3,508
(–0,873)2 = 0,762
(0,127) 2 = 0,016
(1,127) 2 = 1,27
(2,127) 2 = 4,524
Passo 6: calcular a sexta coluna, multiplicando os valores da quinta
pela freqüência simples de cada linha, (xi – μ)2.fi:
3,508×17 = 17,54
0,762×18 = 15,24
0,016×19 = 0,352
1,27×20 = 12,7
4,524×21 = 27,144
Passo 7: somar os valores obtidos na sexta coluna, Σ(xi – μ)2.fi:
Σ(xi – μ)2.fi = 72,976
Passo 8: calcular a variância para a amostra:
306

10) Quando você tiver que calcular o desvio padrão para uma tabela com
intervalos, usamos o mesmo processo, apenas substituindo o xi pelo
ponto médio:
116,5 – 122,5 = –9
(–9)2 = 81
113,5 – 122,5 = –6
(–6)2 = 36
Renda de família de um bairro de classe baixa de Florianópolis
No de
Renda (R$) famílias PMi PMi.fi (PMi – x̄) (PMi – x̄)2 (PMi – x̄)2. fi
(fi)
112 |---- 115 2 113,5 227 -9 81 162 81×2 = 162
115 |---- 118 6 116,5 699 -6 36 216
118 |---- 121 4 119,5 478 -3 9 36 36×6 = 216
121 |---- 124 9 122,5 1102,5 0 0 0
124 |---- 127 8 125,5 1004 3 9 72
127 |---- 130 7 128,5 899,5 6 36 252
Total (Σfi) 36 4410 738 Σ(PMi – x̄)2. fi
Σfi ΣPMi.fi
Vamos calcular passo a passo

Passo 1: somar a coluna das frequências simples (fi) para obter Σfi
(frequência total):
Σfi = 36
Passo 2: cálculo da média: calcular o ponto médio de cada intervalo
e multiplicar cada PM por sua correspondente fi e escrever na coluna
PM.fi, somar os valores calculados nessa coluna e escrever o total. Esse
resultado é o ΣPM.fi:
ΣPM.fi = 4410
Passo 3: dividir o resultado (ΣPM.fi) pelo resultado do Passo 1 (Σfi):
Passo 4: calcular a quinta coluna, (PMi – ¯ ) subtraindo o PMi de cada

linha pela média:
113,5 – 122,5 = –9
116,5 – 122,5 = –6
119,5 – 122,5 = –3
122,5 – 122,5 = 0
125,5 – 122,5 = 3
128,5 – 122,5 = 6
307

Passo 5: calcular a sexta coluna, elevando os valores da quinta ao

quadrado, (PMi – )2:
(–9)2 = 81
(–6)2 = 36
(–3)2 = 9
(0)2 = 0
(3)2 = 9
(6)2 = 36
Passo 6: calcular a sétima coluna, multiplicando os valores da sexta
pela frequência simples de cada linha, (PMi – )2.fi:
81×2 = 162
36×6 = 216
9×4 = 36
0×9 = 0
9×8 = 72
36×7 = 252
Passo 7: somar os valores obtidos na sexta coluna, Σ(PMi – )2.fi:
Σ(PMi – )2.fi = 738
Passo 8: calcular a variância:
11)
11.1)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
308

b) Você tem que calcular o coeficiente de variação.

Para a série A:
Para a série B:
A série com maior dispersão relativa é a série A (maior coeficiente de

variação).
c) Concluindo, a série mais dispersa é a série A.
11.2)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
Para a série A:
Para a série B:
As duas séries apresentam o mesmo valor para os coeficientes de

variação.
c) Concluindo, as duas séries apresentam a mesma dispersão.
11.3)
a) Em termos absolutos, as duas séries apresentam a mesma dispersão
(desvios iguais).
Para a série A:
309

Para a série B:
A série com maior dispersão relativa é a série B (maior coeficiente de

variação).
c) Concluindo, a série mais dispersa é a série B.
11.4)
a) A mais dispersa em termos absolutos é a série A (maior desvio padrão).
Para a série A:
Para a série B:
A série com maior dispersão relativa é a série B (maior coeficiente de

variação).
c) Concluindo, a série mais dispersa é a série B.
310

12) Passo 1: abra uma nova planilha Excel e, na célula A1, escreva: gráfico
box-plot, digite todos os números dos dados na coluna A de uma nova
planilha do Excel, a partir da fila 2 e, no intervalo C3:C8, escreva os
textos indicados na figura seguinte:
Passo 2: agora, vamos calcular a mediana, quartis, máximos e mínimos

usando as fórmulas do Excel. Para isso, digite as seguintes fórmulas:
Em D4: =MED(A2:A21) para calcular a mediana do intervalo de dados
A2:A21.
Em D5: =QUARTIL(A2:A21;1) para calcular o 1° quartil dos dados.
Em D6: =MÍNIMO(A2:A21) para calcular o mínimo valor do conjunto
de dados;
Em D7: =MÁXIMO(A2:A21) para calcular o máximo dos dados.
Em D8: =QUARTIL(A2:A21;3) para calcular o 3° quartil da
amostragem.
311

O resultado será:
Passo 3: crie o gráfico, acompanhando o exemplo desenvolvido na

teoria desta seção, até obter o gráfico box-plot dos dados, semelhante
ao seguinte:
312

Unidade 4
1)
Passo 1: para começar, você deve identificar o evento e o espaço
amostral:
A: jovens sofriam com o autoritarismo dos pais
S: adolescentes
amostral:
n(A) = 675
n(S) = 1500
Passo 3: calcular usando a fórmula:
0,45 ou 45%
2)
Passo 1: Para começar, você deve identificar os eventos e o espaço
amostral:
A: casado(a)
B: solteiro(a)
C: divorciado(a)
S: total pesquisado
Passo 2: identificar o número de elementos dos eventos e do espaço
amostral:
n(A) = 267.867
n(B) = 333.974
n(C) = 16.779
n(S) = 665.541
Passo 3: calcular usando a fórmula:
0,4025 ou 40,25%
313

0,5018 ou 50,18%
0,0252 ou 2,52%
3)
a) Qual a frequência relativa para o número de reações positivas para cada
cobaia?
Passo 1: identificar o numerador e o denominador da fórmula, para
cada experimento.
Cobaia 1:
Número de reações positivas = 1215;
número total de tentativas = 4500.
Cobaia 2:
Número de reações positivas = 1050;
número total de tentativas = 3500.
Passo 2: usar a fórmula da freqüência relativa.
FrA = número de vezes que ocorreu A

1215
FrA = 0,27 ou 27%
4500
FrB = número de vezes que ocorreu B

FrB = 1050 0,3 ou 30%

3500
b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?
O estímulo por alimentação, pois a cobaia 2, em termos relativos,
apresentou melhor resposta. Embora o número de reações da cobaia
1 tenha sido maior comparando com o total (frequência relativa), a
reação é menor.
314

4)
a) Calcule Z (variável padronizada) para x = 116, x = 136, para x = 131 e
para x = 141 pontos;
Passo 1: identificar todos os elementos que compõe o problema:
a média: μ = 126;
o desvio padrão: σ(x) = 10;
os limites do intervalo: X = 116; X = 136; X = 131; X = 141.
Passo 2: calcular a variável padronizada Z:
Para X = 116:
Z = −1
Para X = 136:
Z=1
Para X = 131:
Z = 0,5
Para X = 141:
Z = 1,5
315

b) Qual a probabilidade de escolher uma pessoa com escore maior que

136 pontos?
Passo 1: identificar, no gráfico, o intervalo e a área que você deve
calcular (usar o z calculado no item anterior, para x = 136, o z = 1):
Passo 2: procurar na tabela a área correspondente a z = 1 (não esqueça,

a área dada na tabela é sempre entre 0 e z):
Z = 1 → Área = 0,3413
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,3413), mas o intervalo solicitado é de
136 para cima. Nesse caso, você deve subtrair de 0,5 (total de área de
um lado da curva) o valor encontrado (0,3413), então:
P(x > 136) = 0,5 – 0,3413 = 0,1587 ou 15,87%
c) Qual a probabilidade de escolher uma pessoa com escore entre 126 e

131 pontos? Note que 126 é a média. Esse fica mais fácil.
Passo 1: identificar, no gráfico, o intervalo e a área que você deve
calcular (usar o z calculado no item anterior, para x = 131, o z = 0,5):
316

Passo 2: procurar na tabela a área correspondente à z = 0,5 (não

esqueça, a área dada na tabela é sempre entre 0 e z)
Z = 0,5 → Área = 0,1915
A área dada na tabela é de 0 a Z (0,1915), e o intervalo solicitado é entre
0 e Z, então, você já tem o resultado:
P(126 < x < 131) = 0,1915 ou 19,15%
d) Qual a probabilidade de escolher uma pessoa com escore entre 116 e

141 pontos?
Passo 1: identificar no gráfico o intervalo e a área que você deve
calcular (usar os valores de z calculados no item anterior, para x=116, o
z=-1 e para x=141, o z=1,5):
Passo 2: procurar, na tabela, a área correspondente à z1 = –1 e z2 = 1,5

(não esqueça, a área dada na tabela é sempre entre 0 e z):
Z1 = –1 → Área = 0,3413 (não esqueça que a curva é simétrica, e o sinal
só indica de que lado está a área).
Z2 = 1,5 → Área = 0, 4332
A área solicitada é a soma das duas áreas, a correspondente à Z1 (0,3413)
e a correspondente à Z2 (0,4332), então:
P(116 < x < 141) = 0,3413 + 0,4332 = 0,7745 ou 77,45%
317

Unidade 5
1)
a) Estudo socioeconômico com estudantes da Unisul.
Passo 1: identificar os elementos da fórmula:
E = erro amostral tolerável = 0,03;
Passo 2: usar a fórmula:
n0 = 1111,11 → arredondando, temos 1111 pessoas.

Um tamanho aproximado para a amostra seria de 1111 pessoas. Observe
que o pesquisador teve acesso à informação de que a população seria de
5600 pessoas, então você deve passar para o passo seguinte:
seguinte fórmula:
Arredondando, seriam 927 pessoas.
b) Estudo com famílias do bairro Rio Vermelho, em Florianópolis.

n0 = 625 crianças.
Um tamanho aproximado para a amostra seria de 625 crianças. Observe
que o pesquisador teve acesso à informação de que a população seria
de 9400 crianças, então você deve passar para o passo seguinte:
318


seguinte fórmula:
Arredondando, seriam 586 crianças.
c) Estudo com adolescentes com Teste de Sondagem Intelectual (TSI).

n0 = 400 adolescentes.
Um tamanho aproximado para a amostra seria de 400 adolescentes.
Observe que o pesquisador teve acesso à informação de que a
população seria de 400 adolescentes, então você deve passar para o
passo seguinte:
seguinte fórmula:
Seriam 200 adolescentes.

Você pode resolver os outros itens da mesma maneira que os três já
calculados, o processo é o mesmo. As respostas estão abaixo:
d) Estudo da fecundidade na cidade de Florianópolis.

n0 = 278.
n = 277.
e) Estudo com usuários de drogas adolescentes de uma escola.

n0 = 123.
n = 83.
f) Estudo sobre analfabetismo no bairro do Rio Tavares, em Florianópolis.

n0 = 123.
319

n = 118.
g) Estudo do índice de massa corporal dos estudantes da Unisul.

n0 = 400.
n = 364.
h) Pesquisa de intenções de voto no Brasil.

n0 = 2500.
n = 2500.
2)
Passo 1: Como já foi indicado o percentual de eleitores que votam no
candidato, só falta calcular o percentual dos eleitores que não votam no
candidato ( ).
Você pode deixar na forma decimal, pois, para calcular o erro, é usado
desta forma.
Passo 2: Calcular e procurar o z na tabela (o z é igual ao encontrado no
exemplo 2, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:
Passo 3: procurar este valor na tabela e encontrar o z correspondente.

Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a figura a seguir:
320

Encontrando a área, é só seguir a coluna na qual o valor se encontra até

a primeira linha. Note que o valor se encontra entre 0,4495 e 0,4505 e,
sendo assim, na primeira linha, você deve usar o valor entre 0,04 e 0,05
como se fosse um ponto médio ficando, assim, 0,045. Seguindo a linha
até a primeira coluna, você encontra o valor 1,6. Juntando ou somando
os dois, você encontra o valor 1,645 para z, ou seja, z = 1,645.
calcular o
Em que:
= 26,4% ou (percentual da amostra de eleitores que
321

(percentual da amostra dos eleitores que não

Cálculo do erro:
= 1,645.
Passo 5: calcular o intervalo da estimativa:

Neste passo, o cálculo pode ser na forma percentual ou decimal.
P(0,2366 < p < 0,2914) = 0,90 ou

P(23,66 < p < 29,14) = 90%
3)
Passo 1: como não foi indicado o percentual de professores da amostra
que tem graduação completa, você deve, em primeiro lugar, calcular
este percentual:
n = 300 (tamanho da amostra);
X = 240 (número de professores com graduação);
Cálculo do percentual:
= 1 – 0,8 = 0,2
Você pode deixar na forma decimal, pois, para calcular o erro, é usado
desta forma.
Passo 2: calcular e procurar o z na tabela.
322


região central da tabela. Veja a figura abaixo:
Encontrando a área, é só seguir a coluna na qual o valor se encontra

até a primeira linha; encontrando o número 0,06 é só seguir a linha até
a primeira coluna, encontrando o valor 1,9. Juntando ou somando os
dois, você encontra o valor 1,96 para z, ou seja, z = 1,96.
calcular o mesmo:
Em que:
= 80% ou (percentual da amostra de eleitores que votam
no candidato);
= 1 – 0,8 = 0,2 (percentual da amostra dos eleitores que não votam no
candidato);
323

Cálculo do erro:
= 1,96.
P(0,7547 < p < 0,8452) = 0,95 ou

P(75,47 < p < 84,52) = 95%
4)
Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no

região central da tabela. Veja a figura a seguir:
324


a primeira linha; encontrando o número 0,06, deve-se seguir a linha até
a primeira coluna e encontrar o valor 1,9. Juntando ou somando os dois,
você encontra o valor 1,96 para z, ou seja, z=1,96.
calculá-lo:
Em que:
e = o que você quer calcular (erro da estimativa);
S(x) = 3,4 (desvio padrão da amostra);
Cálculo do erro:
Observação importante: não é necessário multiplicar por 100, pois

este resultado não indica percentual, neste caso, ele indica quilos!
325

5) Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no


região central da tabela. Veja a seguinte figura:

a primeira linha; encontrando o número 0,06, deve-se seguir a linha até
a primeira coluna, encontrando o valor 1,9. Juntando ou somando os
dois, você encontra o valor 1,96 para z, ou seja, z=2,33.
calculá-lo:
Em que:
e = o que você quer calcular (erro da estimativa);
326

S(x) = 31,4 (desvio padrão da amostra);

Cálculo do erro:
Observação importante: não é necessário multiplicar por 100, pois

este resultado não indica percentual, neste caso indica reais!
P(147,6791 < μ < 152,3209) = 0,98
6)
Passo 1:
Cálculo dos graus de liberdade para definição do ponto crítico (PC):
GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 máquinas = K);
GLm = 18 – 3 = 15 (graus de liberdade do denominador, 18 = 5 peças na
máquina 1 + 7 peças da máquina 2 + 6 peças da máquina 3 = N).
Agora, procurando na tabela de F para 5% de nível de significância,
entrando na coluna da esquerda com GLm = 15 e na fila superior com
GLn=4, resulta: F (5%,2,15) = 3,68 = PC
327

E, para as amostras recolhidas, tem-se que:
E o valor observado de F resulta em:
Então, ao nível de significância de 0.05 (95% de nível de confiança),

rejeita-se a hipótese H de igualdade de médias de produção, pois o valor
observado da estatística de teste F é maior que o ponto crítico PC =
10,9174.
328

Há, portanto, evidência estatística de que as três máquinas não são

iguais relativamente ao volume médio de produção.
Em outras palavras: a marca da máquina influencia significativamente a
quantidade de peças fabricada por ela.
A tabela ANOVA resulta nos seguintes valores:
Unidade 6
1)
a) Passo 1: como as colunas já estão calculadas, você pode começar
identificando os elementos da fórmula:
n =10 (número de alunos);

∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
∑y2 = 456,9;
329

Passo 2: calcule o coeficiente de correlação utilizando a fórmula vista

no passo anterior:
rxy = –0,73842
Passo 3: analisando o resultado, você pode classificar e interpretar
contextualizando-o na situação descrita.
Classificação: a correlação entre as notas de Matemática e Biologia
pode ser classificada como negativa forte.
Como interpretar?
O coeficiente de correlação resultou em um número negativo e
próximo de 1 (r = –0,73842), sendo assim, a correlação entre as notas de
Matemática e Biologia é negativa (significativa), ou seja, quanto maior a
nota em Matemática, menor será a nota em Biologia, e quanto menor a
nota em Matemática, maior será a nota em Biologia.
b) Passo 1: para a equação da reta, conforme mostrada abaixo, você pode

começar calculando a inclinação da reta (a):
Equação da reta de regressão → = b+a.X
Inclinação da reta (a):

n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
330

a = –0,70427
Passo 2: calcule a intersecção com o eixo y (b):
Intersecção do eixo y (b)
Identifique os elementos da fórmula:

n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
a = –0,70427.
b = –11,671171.
Passo 3: construa a equação da reta de regressão:
Após calcular a e b, tem-se:
a = –0,70427
b = –11,671171
= b + a.X
= 11,671171 – 0,70427.X
331

c) Para calcular a estimativa, você necessita de um valor para X que é dado

no item c), ou seja, X = 6,5. Para estimar a nota de Biologia, você precisa
de uma nota de Matemática. Observe o seguinte procedimento:
X = 6,5
= 11,671171 − 0,70427.X
= 11,671171 − 0,70427.(6,5)
= 11,671171 − 4,577755
= 7,09
Interpretação: se um aluno tirar 6,5 em Matemática, possivelmente ele
tirará em torno de 7,09 na nota de Biologia.
332

Anexos

Biblioteca Virtual
Veja a seguir os serviços oferecidos pela Biblioteca Virtual aos

alunos a distância:
Pesquisa a publicações on-line

<www.unisul.br/textocompleto>
Acesso a bases de dados assinadas
<www.unisul.br/bdassinadas>
Acesso a bases de dados gratuitas selecionadas
<www.unisul.br/bdgratuitas >
Acesso a jornais e revistas on-line
<www.unisul.br/periodicos>
Empréstimo de livros
<www.unisul.br/emprestimos>
Escaneamento de parte de obra*
Acesse a página da Biblioteca Virtual da Unisul, disponível no EVA,

e explore seus recursos digitais.
Qualquer dúvida escreva para: bv@unisul.br
* Se você optar por escaneamento de parte do livro, será lhe enviado o

sumário da obra para que você possa escolher quais capítulos deseja solicitar
a reprodução. Lembrando que para não ferir a Lei dos direitos autorais (Lei
9610/98) pode-se reproduzir até 10% do total de páginas do livro.

capa_curvas.pdf 1 19/07/12 10:57
CM
MY
CY
CMY

Full Text

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Full Text

Enviado por

Direitos autorais:

Formatos disponíveis

capa_curvas.

pdf 1 19/07/12 10:57

probabilidade_e_estatistica_1582.indb 1 19/07/12 11:11

probabilidade_e_estatistica_1582.indb 2 19/07/12 11:11

Revisão e atualização de conteúdo

probabilidade_e_estatistica_1582.indb 3 19/07/12 11:11

Edição – Livro Didático

Revisão e atualização de conteúdo

Projeto Gráfico e Capa

1. Estatística. 2. Probabilidades. I. Parma, Gabriel Oscar Cremona. II.

Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul

probabilidade_e_estatistica_1582.indb 4 19/07/12 11:11

UNIDADE 1 - Introdução à Estatística. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Para concluir o estudo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285

probabilidade_e_estatistica_1582.indb 5 19/07/12 11:11

Este livro didático corresponde à disciplina Probabilidade e

O material foi elaborado visando a uma aprendizagem autônoma

Lembre-se que sua caminhada, nesta disciplina, será

Então, sempre que sentir necessidade entre em contato; você tem

Bom estudo e sucesso!

probabilidade_e_estatistica_1582.indb 7 19/07/12 11:11

Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística.

Dentro desta disciplina você irá estudar o que os profissionais

Tendo como base a matemática, esta disciplina trata da

Não é objetivo desta disciplina formar estatísticos e, sim,

Desta forma, o esperado é que ao final da disciplina você tenha

Sinta-se, agora, convidado a estudar para obter todas as

Professor Luiz Arthur Dornelles Júnior

probabilidade_e_estatistica_1582.indb 9 19/07/12 11:11

O plano de estudos visa a orientá-lo no desenvolvimento da

O processo de ensino e aprendizagem na UnisulVirtual leva

São elementos desse processo:

 o Espaço UnisulVirtual de Aprendizagem (EVA);

 as atividades de avaliação (a distância, presenciais e de

probabilidade_e_estatistica_1582.indb 11 19/07/12 11:11

 Identificar ferramentas que apoiem decisões nas áreas de

 Analisar e resolver situações que envolvam coleção de

 Analisar e resolver situações que envolvam uma ou mais

 Identificar ferramentas para o cálculo de estimavas para

 Correlacionar duas variáveis.

probabilidade_e_estatistica_1582.indb 12 19/07/12 11:11

Unidade 1 – Introdução à Estatística

Unidade 2 – Distribuição de frequências e representação gráfica

probabilidade_e_estatistica_1582.indb 13 19/07/12 11:11

Unidade 3 – Medidas de posição e dispersão

Unidade 4 – Cálculo e distribuição de probabilidades

Unidade 5 – Amostragem e cálculo de estimativa

Unidade 6 – Regressão linear e gráficos de controle

probabilidade_e_estatistica_1582.indb 14 19/07/12 11:11

 Verifique com atenção o EVA, organize-se para acessar

 Não perca os prazos das atividades. Registre no espaço

 Use o quadro para agendar e programar as atividades

Demais atividades (registro pessoal)

probabilidade_e_estatistica_1582.indb 15 19/07/12 11:11

 Diferenciar censo e estimação.

 Entender a importância de usar amostra estatística.

 Identificar dados absolutos e dados relativos.

 Classificar séries estatísticas.

probabilidade_e_estatistica_1582.indb 17 19/07/12 11:11

Para início de estudo

No que se refere à gestão das organizações, a situação não é

Por isso, dizemos que a Estatística é um conjunto de ferramentas

Nesta unidade, você irá conhecer alguns conceitos importantes

Seção 1 – Conceitos básicos da Estatística

o Espaço UnisulVirtual de Aprendizagem (EVA);

as atividades de avaliação (a distância, presenciais e de

Identificar ferramentas que apoiem decisões nas áreas de

Analisar e resolver situações que envolvam coleção de

Analisar e resolver situações que envolvam uma ou mais

Identificar ferramentas para o cálculo de estimavas para

Correlacionar duas variáveis.

Verifique com atenção o EVA, organize-se para acessar

Não perca os prazos das atividades. Registre no espaço

Use o quadro para agendar e programar as atividades

Diferenciar censo e estimação.

Entender a importância de usar amostra estatística.

Identificar dados absolutos e dados relativos.

Classificar séries estatísticas.

Estatística indutiva: aplicada quando é impossível

Estatística descritiva: aplicada quando você se depara

O que será pesquisado? Definir o tema e os objetivos

Em que setor geográfico? O público-alvo a ser

Como será a amostra? Incluir o cálculo da amostra e

Observação direta: caracteriza-se, quando o

Entrevista oral: caracteriza-se por estabelecer

Entrevista escrita ou questionário: questionário

animados: pessoas, animais etc.;

inanimados: notas fiscais, produtos industrializados etc.

finita: quando tem um número limitado de elementos

infinita: quando tem um número ilimitado de elementos

Ao estudar a idade e sexo de funcionários da empresa A:

Ao estudar a qualidade de peças de uma linha de

Censo: é uma coleção de dados relativos a todos os

Parâmetro: usado para designar alguma característica

Estimação: é uma avaliação indireta de um parâmetro

Estimativa: é o valor assumido por certa estatística

Estatística: característica descritiva dos elementos da

Erro amostral: é a máxima diferença que o investigador/

Nível de confiança: é expressa em percentual e representa

economia: é mais econômico o levantamento de somente

tempo: em pouco tempo, pode-se pesquisar uma

confiabilidade: quando se pesquisa um número menor