Você está na página 1de 338

capa_curvas.

pdf 1 19/07/12 10:57

CM

MY

CY

CMY

K
Universidade do Sul de Santa Catarina

Probabilidade e Estatística
Disciplina na modalidade a distância

Palhoça
UnisulVirtual
2011

probabilidade_e_estatistica_1582.indb 1 19/07/12 11:11


Créditos
Universidade do Sul de Santa Catarina | Campus UnisulVirtual | Educação Superior a Distância
Avenida dos Lagos, 41 – Cidade Universitária Pedra Branca | Palhoça – SC | 88137-900 | Fone/fax: (48) 3279-1242 e 3279-1271 | E-mail: cursovirtual@unisul.br | Site: www.unisul.br/unisulvirtual
Reitor Coordenadores Graduação Marilene de Fátima Capeleto Patrícia de Souza Amorim Karine Augusta Zanoni
Ailton Nazareno Soares Aloísio José Rodrigues Patricia A. Pereira de Carvalho Poliana Simao Marcia Luz de Oliveira
Ana Luísa Mülbert Paulo Lisboa Cordeiro Schenon Souza Preto Mayara Pereira Rosa
Vice-Reitor Ana Paula R.Pacheco Paulo Mauricio Silveira Bubalo Luciana Tomadão Borguetti
Sebastião Salésio Heerdt Artur Beck Neto Rosângela Mara Siegel Gerência de Desenho e
Bernardino José da Silva Simone Torres de Oliveira Desenvolvimento de Materiais Assuntos Jurídicos
Chefe de Gabinete da Reitoria Charles Odair Cesconetto da Silva Vanessa Pereira Santos Metzker Didáticos Bruno Lucion Roso
Willian Corrêa Máximo Dilsa Mondardo Vanilda Liordina Heerdt Márcia Loch (Gerente) Sheila Cristina Martins
Diva Marília Flemming Marketing Estratégico
Pró-Reitor de Ensino e Horácio Dutra Mello Gestão Documental Desenho Educacional
Lamuniê Souza (Coord.) Cristina Klipp de Oliveira (Coord. Grad./DAD) Rafael Bavaresco Bongiolo
Pró-Reitor de Pesquisa, Itamar Pedro Bevilaqua
Pós-Graduação e Inovação Jairo Afonso Henkes Clair Maria Cardoso Roseli A. Rocha Moterle (Coord. Pós/Ext.) Portal e Comunicação
Daniel Lucas de Medeiros Aline Cassol Daga Catia Melissa Silveira Rodrigues
Mauri Luiz Heerdt Janaína Baeta Neves
Aline Pimentel
Jorge Alexandre Nogared Cardoso Jaliza Thizon de Bona Andreia Drewes
Pró-Reitora de Administração José Carlos da Silva Junior Guilherme Henrique Koerich Carmelita Schulze Luiz Felipe Buchmann Figueiredo
Acadêmica José Gabriel da Silva Josiane Leal Daniela Siqueira de Menezes Rafael Pessi
Marília Locks Fernandes Delma Cristiane Morari
Miriam de Fátima Bora Rosa José Humberto Dias de Toledo
Eliete de Oliveira Costa
Joseane Borges de Miranda Gerência de Produção
Pró-Reitor de Desenvolvimento Luiz G. Buchmann Figueiredo Gerência Administrativa e Eloísa Machado Seemann Arthur Emmanuel F. Silveira (Gerente)
e Inovação Institucional Marciel Evangelista Catâneo Financeira Flavia Lumi Matuzawa Francini Ferreira Dias
Renato André Luz (Gerente) Geovania Japiassu Martins
Valter Alves Schmitz Neto Maria Cristina Schweitzer Veit
Ana Luise Wehrle Isabel Zoldan da Veiga Rambo Design Visual
Maria da Graça Poyer
Diretora do Campus Mauro Faccioni Filho Anderson Zandré Prudêncio João Marcos de Souza Alves Pedro Paulo Alves Teixeira (Coord.)
Universitário de Tubarão Moacir Fogaça Daniel Contessa Lisboa Leandro Romanó Bamberg Alberto Regis Elias
Milene Pacheco Kindermann Nélio Herzmann Naiara Jeremias da Rocha Lygia Pereira Alex Sandro Xavier
Onei Tadeu Dutra Rafael Bourdot Back Lis Airê Fogolari Anne Cristyne Pereira
Diretor do Campus Universitário Patrícia Fontanella Thais Helena Bonetti Luiz Henrique Milani Queriquelli Cristiano Neri Gonçalves Ribeiro
da Grande Florianópolis Roberto Iunskovski Valmir Venício Inácio Marcelo Tavares de Souza Campos Daiana Ferreira Cassanego
Hércules Nunes de Araújo Rose Clér Estivalete Beche Mariana Aparecida dos Santos Davi Pieper
Gerência de Ensino, Pesquisa e Marina Melhado Gomes da Silva Diogo Rafael da Silva
Secretária-Geral de Ensino Vice-Coordenadores Graduação Extensão Marina Cabeda Egger Moellwald Edison Rodrigo Valim
Adriana Santos Rammê Janaína Baeta Neves (Gerente) Mirian Elizabet Hahmeyer Collares Elpo Fernanda Fernandes
Solange Antunes de Souza Aracelli Araldi Pâmella Rocha Flores da Silva
Bernardino José da Silva Frederico Trilha
Diretora do Campus Catia Melissa Silveira Rodrigues Rafael da Cunha Lara Jordana Paula Schulka
Elaboração de Projeto Roberta de Fátima Martins Marcelo Neri da Silva
Universitário UnisulVirtual Horácio Dutra Mello Carolina Hoeller da Silva Boing
Jucimara Roesler Jardel Mendes Vieira Roseli Aparecida Rocha Moterle Nelson Rosa
Vanderlei Brasil Sabrina Bleicher Noemia Souza Mesquita
Joel Irineu Lohn Francielle Arruda Rampelotte
Equipe UnisulVirtual José Carlos Noronha de Oliveira Verônica Ribas Cúrcio Oberdan Porto Leal Piantino
José Gabriel da Silva Reconhecimento de Curso
José Humberto Dias de Toledo Acessibilidade Multimídia
Diretor Adjunto Maria de Fátima Martins Vanessa de Andrade Manoel (Coord.) Sérgio Giron (Coord.)
Moacir Heerdt Luciana Manfroi
Rogério Santos da Costa Extensão Letícia Regiane Da Silva Tobal Dandara Lemos Reynaldo
Secretaria Executiva e Cerimonial Rosa Beatriz Madruga Pinheiro Maria Cristina Veit (Coord.) Mariella Gloria Rodrigues Cleber Magri
Jackson Schuelter Wiggers (Coord.) Sergio Sell Vanesa Montagna Fernando Gustav Soares Lima
Marcelo Fraiberg Machado Pesquisa Josué Lange
Tatiana Lee Marques Daniela E. M. Will (Coord. PUIP, PUIC, PIBIC) Avaliação da aprendizagem
Tenille Catarina Valnei Carlos Denardin Claudia Gabriela Dreher Conferência (e-OLA)
Mauro Faccioni Filho (Coord. Nuvem)
Assessoria de Assuntos Sâmia Mônica Fortunato (Adjunta) Jaqueline Cardozo Polla Carla Fabiana Feltrin Raimundo (Coord.)
Internacionais Pós-Graduação Nágila Cristina Hinckel Bruno Augusto Zunino
Coordenadores Pós-Graduação Anelise Leal Vieira Cubas (Coord.) Sabrina Paula Soares Scaranto
Murilo Matos Mendonça Aloísio José Rodrigues Gabriel Barbosa
Anelise Leal Vieira Cubas Thayanny Aparecida B. da Conceição
Assessoria de Relação com Poder Biblioteca Produção Industrial
Público e Forças Armadas Bernardino José da Silva Salete Cecília e Souza (Coord.) Gerência de Logística Marcelo Bittencourt (Coord.)
Adenir Siqueira Viana Carmen Maria Cipriani Pandini Paula Sanhudo da Silva Jeferson Cassiano A. da Costa (Gerente)
Walter Félix Cardoso Junior Daniela Ernani Monteiro Will Marília Ignacio de Espíndola Gerência Serviço de Atenção
Giovani de Paula Renan Felipe Cascaes Logísitca de Materiais Integral ao Acadêmico
Assessoria DAD - Disciplinas a Karla Leonora Dayse Nunes Carlos Eduardo D. da Silva (Coord.) Maria Isabel Aragon (Gerente)
Distância Letícia Cristina Bizarro Barbosa Gestão Docente e Discente Abraao do Nascimento Germano Ana Paula Batista Detóni
Patrícia da Silva Meneghel (Coord.) Luiz Otávio Botelho Lento Enzo de Oliveira Moreira (Coord.) Bruna Maciel André Luiz Portes
Carlos Alberto Areias Roberto Iunskovski Fernando Sardão da Silva Carolina Dias Damasceno
Cláudia Berh V. da Silva Rodrigo Nunes Lunardelli Capacitação e Assessoria ao Fylippy Margino dos Santos Cleide Inácio Goulart Seeman
Conceição Aparecida Kindermann Rogério Santos da Costa Docente Guilherme Lentz Denise Fernandes
Luiz Fernando Meneghel Thiago Coelho Soares Alessandra de Oliveira (Assessoria) Marlon Eliseu Pereira Francielle Fernandes
Renata Souza de A. Subtil Vera Rejane Niedersberg Schuhmacher Adriana Silveira Pablo Varela da Silveira Holdrin Milet Brandão
Alexandre Wagner da Rocha Rubens Amorim
Assessoria de Inovação e Jenniffer Camargo
Gerência Administração Elaine Cristiane Surian (Capacitação) Yslann David Melo Cordeiro Jessica da Silva Bruchado
Qualidade de EAD Acadêmica Elizete De Marco
Denia Falcão de Bittencourt (Coord.) Jonatas Collaço de Souza
Angelita Marçal Flores (Gerente) Fabiana Pereira Avaliações Presenciais
Andrea Ouriques Balbinot Juliana Cardoso da Silva
Fernanda Farias Iris de Souza Barros Graciele M. Lindenmayr (Coord.)
Carmen Maria Cipriani Pandini Juliana Elen Tizian
Juliana Cardoso Esmeraldino Ana Paula de Andrade
Secretaria de Ensino a Distância Kamilla Rosa
Maria Lina Moratelli Prado Angelica Cristina Gollo
Assessoria de Tecnologia Samara Josten Flores (Secretária de Ensino) Simone Zigunovas
Mariana Souza
Osmar de Oliveira Braz Júnior (Coord.) Cristilaine Medeiros Marilene Fátima Capeleto
Giane dos Passos (Secretária Acadêmica) Daiana Cristina Bortolotti
Felipe Fernandes Adenir Soares Júnior Tutoria e Suporte Maurício dos Santos Augusto
Felipe Jacson de Freitas Delano Pinheiro Gomes Maycon de Sousa Candido
Alessandro Alves da Silva Anderson da Silveira (Núcleo Comunicação) Edson Martins Rosa Junior
Jefferson Amorin Oliveira Andréa Luci Mandira Claudia N. Nascimento (Núcleo Norte- Monique Napoli Ribeiro
Phelipe Luiz Winter da Silva Fernando Steimbach Priscilla Geovana Pagani
Cristina Mara Schauffert Nordeste)
Fernando Oliveira Santos
Priscila da Silva Djeime Sammer Bortolotti Maria Eugênia F. Celeghin (Núcleo Pólos) Sabrina Mari Kawano Gonçalves
Rodrigo Battistotti Pimpão Lisdeise Nunes Felipe Scheila Cristina Martins
Douglas Silveira Andreza Talles Cascais Marcelo Ramos
Tamara Bruna Ferreira da Silva Evilym Melo Livramento Daniela Cassol Peres Taize Muller
Marcio Ventura Tatiane Crestani Trentin
Fabiano Silva Michels Débora Cristina Silveira Osni Jose Seidler Junior
Coordenação Cursos Fabricio Botelho Espíndola Ednéia Araujo Alberto (Núcleo Sudeste) Thais Bortolotti
Coordenadores de UNA Felipe Wronski Henrique Francine Cardoso da Silva
Diva Marília Flemming Gisele Terezinha Cardoso Ferreira Janaina Conceição (Núcleo Sul) Gerência de Marketing
Marciel Evangelista Catâneo Indyanara Ramos Joice de Castro Peres Eliza B. Dallanhol Locks (Gerente)
Roberto Iunskovski Janaina Conceição Karla F. Wisniewski Desengrini
Jorge Luiz Vilhar Malaquias Kelin Buss Relacionamento com o Mercado
Auxiliares de Coordenação Juliana Broering Martins Liana Ferreira Alvaro José Souto
Ana Denise Goularte de Souza Luana Borges da Silva Luiz Antônio Pires
Camile Martinelli Silveira Luana Tarsila Hellmann Maria Aparecida Teixeira Relacionamento com Polos
Fabiana Lange Patricio Luíza Koing Zumblick Mayara de Oliveira Bastos Presenciais
Tânia Regina Goularte Waltemann Maria José Rossetti Michael Mattar Alex Fabiano Wehrle (Coord.)
Jeferson Pandolfo

probabilidade_e_estatistica_1582.indb 2 19/07/12 11:11


Luiz Arthur Dornelles Júnior

Probabilidade e Estatística
Livro didático

Revisão e atualização de conteúdo


Gabriel Oscar Cremona Parma

Design instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher

2ª edição

Palhoça
UnisulVirtual
2011

probabilidade_e_estatistica_1582.indb 3 19/07/12 11:11


Copyright © UnisulVirtual 2011
Nenhuma parte desta publicação pode ser reproduzida por qualquer meio sem a prévia autorização desta instituição.

Edição – Livro Didático


Professor Conteudista
Luiz Arthur Dornelles Júnior

Revisão e atualização de conteúdo


Gabriel Oscar Cremona Parma (2ª edição)

Designer Instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher (2ª edição)

Projeto Gráfico e Capa


Equipe UnisulVirtual

Diagramação
Fernanda Fernandes

Revisão
Contextuar

ISBN
978-85-7817-336-4

519.5
D75 Dornelles Júnior, Luiz Arthur
Probabilidade e estatística : livro didático / Luiz Arthur Dornelles
Júnior; revisão e atualização de conteúdo Gabriel Oscar Cremona Parma ;
design instrucional Karla Leonora Dahse Nunes, Sabrina Bleicher. – 2. ed. –
Palhoça: UnisulVirtual, 2011.
336 p. : il. ; 28 cm.

Inclui bibliografia.
ISBN 978-85-7817-336-4

1. Estatística. 2. Probabilidades. I. Parma, Gabriel Oscar Cremona. II.


Nunes, Karla Leonora Dahse. III. Bleicher, Sabrina. IV. Título.

Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul

probabilidade_e_estatistica_1582.indb 4 19/07/12 11:11


Sumário

Apresentação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Palavras do professor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
Plano de estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

UNIDADE 1 - Introdução à Estatística. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17


UNIDADE 2 - Distribuição de frequências e representação gráfica. . . . . . . 43
UNIDADE 3 - Medidas de posição e dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . 81
UNIDADE 4 - Cálculo e distribuição de probabilidades. . . . . . . . . . . . . . . . . 147
UNIDADE 5 - Amostragem e cálculo de estimativa. . . . . . . . . . . . . . . . . . . . . 205
UNIDADE 6 - Regressão linear e gráficos de controle. . . . . . . . . . . . . . . . . . . 253

Para concluir o estudo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285


Referências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Sobre os professores conteudistas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
Respostas e comentários das atividades de autoavaliação. . . . . . . . . . . . . . 291
Anexos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
Biblioteca Virtual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335

probabilidade_e_estatistica_1582.indb 5 19/07/12 11:11


probabilidade_e_estatistica_1582.indb 6 19/07/12 11:11
Apresentação

Este livro didático corresponde à disciplina Probabilidade e


Estatística.

O material foi elaborado visando a uma aprendizagem autônoma


e aborda conteúdos especialmente selecionados e relacionados
à sua área de formação. Ao adotar uma linguagem didática
e dialógica, objetivamos facilitar seu estudo a distância,
proporcionando condições favoráveis às múltiplas interações e a
um aprendizado contextualizado e eficaz.

Lembre-se que sua caminhada, nesta disciplina, será


acompanhada e monitorada constantemente pelo Sistema
Tutorial da UnisulVirtual, por isso a “distância” fica
caracterizada somente na modalidade de ensino que você optou
para sua formação, pois na relação de aprendizagem professores
e instituição estarão sempre conectados com você.

Então, sempre que sentir necessidade entre em contato; você tem


à disposição diversas ferramentas e canais de acesso tais como:
telefone, e-mail e o Espaço Unisul Virtual de Aprendizagem,
que é o canal mais recomendado, pois tudo o que for enviado e
recebido fica registrado para seu maior controle e comodidade.
Nossa equipe técnica e pedagógica terá o maior prazer em lhe
atender, pois sua aprendizagem é o nosso principal objetivo.

Bom estudo e sucesso!

Equipe UnisulVirtual.

probabilidade_e_estatistica_1582.indb 7 19/07/12 11:11


probabilidade_e_estatistica_1582.indb 8 19/07/12 11:11
Palavras do professor

Olá! Bem-vindo(a) à disciplina Probabilidade e Estatística.

Dentro desta disciplina você irá estudar o que os profissionais


e cientistas chamam de probabilidade e estatística.

Tendo como base a matemática, esta disciplina trata da


aplicação no cotidiano, em pesquisas e avaliações. Trata
também de técnicas eficientes para organizar e analisar dados
e tomar decisões.

Não é objetivo desta disciplina formar estatísticos e, sim,


profissionais com conhecimento técnico para realizar análises
e interpretação de dados, além de ter condições de argumentar,
dar suporte e trocar ideias com outros profissionais.

Desta forma, o esperado é que ao final da disciplina você tenha


em suas mãos uma verdadeira “caixa com várias ferramentas”
para apoiar suas decisões.

Sinta-se, agora, convidado a estudar para obter todas as


“ferramentas” que lhe serão apresentadas nesta disciplina, e
cuide para ordenar as ferramentas na “caixa”, de modo a poder
fazer uso delas quando for necessário.

Bons estudos!

Professor Luiz Arthur Dornelles Júnior

probabilidade_e_estatistica_1582.indb 9 19/07/12 11:11


probabilidade_e_estatistica_1582.indb 10 19/07/12 11:11
Plano de estudo

O plano de estudos visa a orientá-lo no desenvolvimento da


disciplina. Ele possui elementos que o ajudarão a conhecer o
contexto da disciplina e a organizar o seu tempo de estudos.

O processo de ensino e aprendizagem na UnisulVirtual leva


em conta instrumentos que se articulam e se complementam,
portanto, a construção de competências se dá sobre a
articulação de metodologias e por meio das diversas formas de
ação/mediação.

São elementos desse processo:

„„ o livro didático;

„„ o Espaço UnisulVirtual de Aprendizagem (EVA);

„„ as atividades de avaliação (a distância, presenciais e de


autoavaliação);

„„ o Sistema Tutorial.

Ementa
Conceitos gerais de população, amostra, parâmetro, estatística,
tipos de dados, níveis de mensuração, planejamento de
experimentos. Histogramas. Medidas de locação e de
variabilidade. Boxplot. Ramo e folhas. Probabilidade e
distribuições de probabilidade. Principais distribuições
discretas. Principais distribuições contínuas. Estatísticas e
distribuições amostrais. Estimação pontual de parâmetros de
processos. Inferência estatística para uma amostra. Inferência
estatística para duas amostras. Análise de variância com um
único fator. Correlação e regressão linear. Gráficos de controle.

probabilidade_e_estatistica_1582.indb 11 19/07/12 11:11


Universidade do Sul de Santa Catarina

Objetivos

Geral
Adquirir competências para pesquisar; coletar dados, organizar
e analisá-los; e delinear conclusões, testando-as na solução de
problemas, sob o ponto de vista da estatística e da probabilidade.

Específicos
„„ Compreender os conceitos, procedimentos e estratégias
para uma pesquisa.

„„ Identificar ferramentas que apoiem decisões nas áreas de


conhecimento inerentes a sua profissão.

„„ Analisar e resolver situações que envolvam coleção de


dados agrupados ou não.

„„ Analisar e resolver situações que envolvam uma ou mais


variáveis de estudo.

„„ Identificar ferramentas para o cálculo de estimavas para


uma ou mais variáveis.

„„ Correlacionar duas variáveis.

Carga Horária
A carga horária total da disciplina é 60 horas-aula.

12

probabilidade_e_estatistica_1582.indb 12 19/07/12 11:11


Probabilidade e Estatística

Conteúdo programático/objetivos
Veja, a seguir, as unidades que compõem o livro didático desta
disciplina e os seus respectivos objetivos. Estes se referem aos
resultados que você deverá alcançar ao final de uma etapa de
estudo. Os objetivos de cada unidade definem o conjunto de
conhecimentos que você deverá possuir para o desenvolvimento
de habilidades e competências necessárias à sua formação.

Unidades de estudo: 6

Unidade 1 – Introdução à Estatística


É muito importante, antes de começar a ter contato com as técnicas
estatísticas, conhecer bem os conceitos e definições de alguns termos
que serão usados dentro desta disciplina. Por isso, nesta unidade você
conhecerá alguns conceitos introdutórios da Estatística.

Unidade 2 – Distribuição de frequências e representação gráfica


De posse dos dados de forma desorganizada, um primeiro
passo seria organizá-los em tabelas para que possibilitem a
primeira análise e uma série de interpretações. Nesta unidade,
você poderá aprender como se organizam dados brutos e como
pode ser analisada a distribuição de frequências. Após aprender
como organizar os dados, você aprenderá como representá-los
graficamente. Este assunto é importante porque o seu dia a
dia está impregnado de informações representadas por gráficos
e, nesta unidade, você poderá conhecer os tipos de gráficos e
algumas dicas de como interpretá-los.

13

probabilidade_e_estatistica_1582.indb 13 19/07/12 11:11


Universidade do Sul de Santa Catarina

Unidade 3 – Medidas de posição e dispersão


Você conhecerá, nesta unidade, como calcular algumas medidas,
começando por média, mediana e moda, sendo que a medida
mais importante dentro da Estatística é a média. Verá também
outra medida importante, a de dispersão. Muitas vezes as
medidas de posição por si só não bastam para analisar uma série
de dados, então, se faz necessário trabalhar com medidas de
dispersão. Dentre as medidas de dispersão, a mais importante
delas que é o desvio padrão.

Unidade 4 – Cálculo e distribuição de probabilidades


Esta unidade é um marco que divide a Estatística em duas partes:
a estatística descritiva e estatística indutiva. Dar-se-á início ao
estudo sobre probabilidade, estimativas e cálculo do erro de
estimativa. O estudo de probabilidade é a base fundamental para
concretizar o conhecimento sobre estimativas. Além disso, você
conhecerá que o estudo de probabilidades pode ser dividido em
duas partes: probabilidade de variáveis discretas e probabilidade
de variáveis contínuas.

Unidade 5 – Amostragem e cálculo de estimativa


Tendo como base o estudo do cálculo de probabilidades, você
poderá aprender, nesta unidade, como calcular o tamanho de
uma amostra necessário para se obter um determinado erro
de estimativa, bem como, descobrir maneiras de selecionar os
elementos de uma amostra de forma que eles sejam realmente
representativos da população objeto de pesquisa.

Unidade 6 – Regressão linear e gráficos de controle


Nesta unidade, você irá estudar como analisar e comparar duas
variáveis correlacionando-as; assim como também aprenderá a
construir e trabalhar com gráfico de controle para verificar os
erros em processos de controle de qualidade, dentre outros fins.

14

probabilidade_e_estatistica_1582.indb 14 19/07/12 11:11


Probabilidade e Estatística

Agenda de atividades/Cronograma

„„ Verifique com atenção o EVA, organize-se para acessar


periodicamente a sala da disciplina. O sucesso nos seus
estudos depende da priorização do tempo para a leitura,
da realização de análises e sínteses do conteúdo e da
interação com os seus colegas e professor.

„„ Não perca os prazos das atividades. Registre no espaço


a seguir as datas com base no cronograma da disciplina
disponibilizado no EVA.

„„ Use o quadro para agendar e programar as atividades


relativas ao desenvolvimento da disciplina.

Atividades obrigatórias

Demais atividades (registro pessoal)

15

probabilidade_e_estatistica_1582.indb 15 19/07/12 11:11


probabilidade_e_estatistica_1582.indb 16 19/07/12 11:11
1
UNIDADE 1

Introdução à Estatística

Objetivos de aprendizagem
„„ Identificar o processo estatístico de pesquisa.

„„ Diferenciar censo e estimação.

„„ Entender a importância de usar amostra estatística.

„„ Identificar variáveis.

„„ Identificar dados absolutos e dados relativos.

„„ Classificar séries estatísticas.

Seções de estudo
Seção 1 Conceitos básicos da Estatística

Seção 2 Variáveis

Seção 3 Dados

Seção 4 Séries

probabilidade_e_estatistica_1582.indb 17 19/07/12 11:11


Universidade do Sul de Santa Catarina

Para início de estudo


A cada dia, nossa sociedade se torna mais complexa. Convivemos
com os indicadores econômicos, com a inflação, com a reforma
da previdência, com o controle de qualidade, enfim, nos
deparamos com situações e informações sempre mais complexas.

No que se refere à gestão das organizações, a situação não é


diferente. Para se administrar uma empresa, seja pública ou
privada, necessitamos de ferramentas para poder acompanhar a
evolução da sociedade e, assim, analisar situações e informações
bem como dar suporte às nossas decisões.

Por isso, dizemos que a Estatística é um conjunto de ferramentas


as quais, quando bem empregadas, podem ser de grande utilidade
para a gestão de empresas. Hoje em dia, sem a Estatística, não
seríamos capazes de avaliar a variação de preços, da inflação, de
consumo, nem fazer controle de qualidade, pesquisa eleitoral etc.

Nesta unidade, você irá conhecer alguns conceitos importantes


para a Estatística. Assim, conforme a metáfora utilizada, você
estará apropriando-se de mais algumas “ferramentas para colocar
na sua caixa”.

Seção 1 – Conceitos básicos da Estatística


Para conhecer Estatística, é importante que você compreenda,
antes, o significado da palavra e o seu conceito. A palavra
estatística origina-se do latim, e o seu radical status, significa
estado. Sendo assim, a palavra estatística significa “o estudo
do estado”. Para entender o conceito de “estudo do estado”,
acompanhe as seguintes definições sobre Estatística:

A Estatística é uma coleção de métodos para planejar


experimentos, obter dados e organizá-los e, deles, extrair
conclusões. (TRIOLA, 1999, p. 2).

18

probabilidade_e_estatistica_1582.indb 18 19/07/12 11:11


Probabilidade e Estatística

A Estatística está interessada nos métodos científicos


para a coleta, organização, resumo, apresentação e análise
de dados, bem como na obtenção de conclusões válidas
e na tomada de decisões razoáveis, baseadas em tais
análises. (SPIEGEL, 1994, p. 1).

Estatística é um conjunto de métodos e processos


quantitativos que serve para estudar e medir os
fenômenos coletivos. (SILVA, 1999, p. 11).

Você percebeu que as definições se assemelham e se completam?


Então, observe, a seguir, a definição de Estatística adotada neste
estudo que agora se inicia.

A Estatística corresponde a um conjunto de métodos


científicos para a coleta, organização, apresentação
e análise de dados, bem como, para a conclusão e
tomada de decisões baseadas em tais análises.

Em termos gerais, convém destacar que a Estatística está dividida


em duas partes:

„„ Estatística indutiva: aplicada quando é impossível


realizar levantamentos com a totalidade dos objetos
de uma pesquisa seja por tempo, ou por economia
etc., somente uma parcela destes elementos é utilizada
para realizar as observações. Partindo, neste caso, de
uma parcela destes elementos, a Estatística indutiva
tira conclusões e realiza previsões sobre elementos
em questão (método que se fundamenta na teoria da
probabilidade associado a uma margem de incerteza).

„„ Estatística descritiva: aplicada quando você se depara


com uma quantidade muito grande de dados, e é difícil
tirar conclusões sobre o fenômeno que descrevem. A
Estatística descritiva é usada para reduzir as informações
até o ponto em que se possa interpretar tal fenômeno. O
objetivo da Estatística descritiva é observar fenômenos
de mesma natureza, coletar, organizar, classificar,
apresentar, interpretar e analisar dados referentes ao
fenômeno através de gráficos e tabelas, além de calcular
medidas que permitam descrever o fenômeno.

Unidade 1 19

probabilidade_e_estatistica_1582.indb 19 19/07/12 11:11


Universidade do Sul de Santa Catarina

Para obtenção de resultados confiáveis, que reflitam a realidade


dos fatos, é necessário realizar uma pesquisa cuidadosamente
planejada com métodos adequados.

O método é um conjunto de meios dispostos


convenientemente para se chegar a um fim que
se demarcou. O método estatístico, diante da
impossibilidade de manter as causas constantes,
admite as causas presentes, variando-as, registrando
essas variações e procurando determinar, no resultado
final, que influências cabem a cada uma delas.

Alguns passos precisam ser seguidos para que seja aplicado o


método estatístico e, assim, realizada uma boa pesquisa. Para
você entender quais são estes passos, acompanhe a seguir as
principais fases.

a) Definição do problema: a primeira fase do trabalho


estatístico consiste em uma definição ou formulação
correta do problema a ser estudado. Nesta fase, você
precisa definir:

„„ O que será pesquisado? Definir o tema e os objetivos


de pesquisa;

„„ Em que setor geográfico? O público-alvo a ser


planejado;

„„ Como será a amostra? Incluir o cálculo da amostra e


as técnicas de coletas de dados.

b) Planejamento: consiste em determinar o procedimento


necessário para levantar informações sobre o assunto
objeto do estudo. Você deverá definir como serão
coletados os dados de pesquisa, já que isto pode ser feito
de várias formas.

„„ Observação direta: caracteriza-se, quando o


pesquisador somente faz observações para coletar os
dados necessários para a pesquisa.

20

probabilidade_e_estatistica_1582.indb 20 19/07/12 11:11


Probabilidade e Estatística

„„ Entrevista oral: caracteriza-se por estabelecer


perguntas orais a um indivíduo ou grupo de
indivíduos. As entrevistas podem ser classificadas
em estruturadas e não estruturadas; entrevistas
estruturadas são aquelas em que o pesquisador
estabelece um roteiro prévio de perguntas. Nas
entrevistas não estruturadas, o pesquisador, por meio
de uma conversa amigável, busca levantar dados
que possam ser utilizados em análise qualitativa,
selecionando-se os aspectos mais relevantes do
problema de pesquisa. (RAUEN, 2006).

„„ Entrevista escrita ou questionário: questionário


é uma lista de indagações escritas, as quais devem
ser respondidas pelo informante por escrito. Sua
vantagem é a possibilidade de se indagarem muitas
pessoas ao mesmo tempo. Para entrevistar uma sala
de universitários, basta distribuir as folhas, para que
todos respondam simultaneamente (entrevista de
grupo). (RAUEN, 2006). O questionário é uma forma
muito utilizada na coleta de dados, mas exige ser:
completo (responder tudo), concreto (perguntas claras
e objetivas), secreto (sem identificação) e discreto
(perguntas bem formuladas).

É preciso planejar o trabalho a ser realizado, tendo em


vista o objetivo que se pretende atingir.

c) Coleta de dados: compreende a coleta das informações


propriamente ditas. Formalmente, a coleta de dados
refere-se à obtenção, à reunião e ao registro sistemático
de dados com um objetivo determinado.

d) Apuração dos dados: consiste em reunir os dados através


de sua contagem e agrupamento.

e) Apresentação dos dados: os dados estatísticos podem ser


mais facilmente compreendidos quando apresentados por
meio de uma representação gráfica, o que permite uma
visualização instantânea de todos os dados.

Unidade 1 21

probabilidade_e_estatistica_1582.indb 21 19/07/12 11:11


Universidade do Sul de Santa Catarina

f) Análise e interpretação de dados: nesta etapa, o


interesse maior reside em tirar conclusões que auxiliam
o pesquisador a atingir seu objetivo, ou seja, encontrar a
resposta para a sua pergunta.

Todas estas fases são realizadas quando se cumpre um processo


de pesquisa. Veja a representação no esquema a seguir:

Produção
População de dados
Amostra

Estatística
Descritiva

Estudo da amostra
Características  tabelas
populacionais  gráficos
 medidas
Estatística
Indutiva

Características
amostrais

Figura 1.1 – O processo da pesquisa estatística


Fonte: Adaptado de Ação Local de Estatística Aplicada - ALEA (1999-2010).

População e amostra
Quando você prepara um alimento, pode provar (observar)
uma pequena porção. Neste procedimento, você está fazendo o
processo de amostragem, ou seja, extraindo do todo (população)
uma parte (amostra), com o propósito de inferir (avaliar) a
qualidade de todo o alimento. A partir do exemplo, podemos
distinguir dois importantes conceitos da Estatística descritiva:
população e amostra.

População é o conjunto total de elementos com,


pelo menos, uma característica em comum, cujo
comportamento interessa estudar.

22

probabilidade_e_estatistica_1582.indb 22 19/07/12 11:11


Probabilidade e Estatística

A definição dos elementos que serão estudados está ligada


diretamente às características levantadas no objetivo da pesquisa,
ou seja, é este objetivo que auxiliará na definição desta população.
Estes elementos podem ser:

„„ animados: pessoas, animais etc.;

„„ inanimados: notas fiscais, produtos industrializados etc.

Em relação ao número de elementos, a população pode ser:

„„ finita: quando tem um número limitado de elementos


(número de funcionários de um determinado banco etc.);

„„ infinita: quando tem um número ilimitado de elementos


(exemplo: número possível de análises químicos que
podem ser feitos em um rio poluído etc.).

A representação do tamanho da população é dada por


N = número de elementos da população.

São exemplos de definição de população:

„„ Ao estudar a idade e sexo de funcionários da empresa A:


para definir a população, devemos considerar todos os
funcionários da empresa.

„„ Ao estudar a qualidade de peças de uma linha de


produção da empresa A: para definir a população,
devemos considerar todas as peças produzidas pela
empresa.

Amostra é o conjunto de elementos ou observações,


recolhidos a partir de um subconjunto da população,
que se estuda com o objetivo de tirar conclusões para a
população de onde foi recolhida.

A amostra precisa ser representativa, ou seja, possuir as mesmas


características da população.

A representação do tamanho da amostra é dada por n = número


de elementos da amostra.

Unidade 1 23

probabilidade_e_estatistica_1582.indb 23 19/07/12 11:11


Universidade do Sul de Santa Catarina

Processos estatísticos de abordagem


Ao estudar um fenômeno coletivo, ou seja, um fenômeno que se
refere a uma determinada população, compreendendo um grande
número de elementos, coisas e indivíduos, podemos optar entre
os seguintes processos estatísticos:

„„ Censo: é uma coleção de dados relativos a todos os


elementos de uma população; uma avaliação direta de
O censo era considerado uma
pesquisa desatualizada pela demora
um parâmetro que utiliza todos os componentes da
da publicação dos dados, mas a população. No Brasil, por exemplo, o censo é feito de dez
tecnologia veio para diminuir em em dez anos, momento em que são pesquisados todos os
muito esse tempo de publicação. No domicílios brasileiros.
ano de 2010, constatamos que os
dados foram publicados com mais Principais propriedades do censo:
rapidez que nas décadas anteriores.
Acesse o site do Instituto Brasileiro »» admite erro processual zero e tem confiabilidade 100%;
de Geografia e Estatística (IBGE) e
consulte informações da sua cidade »» é caro e lento;
e do seu estado.

»» quase sempre desatualizado;

»» nem sempre é viável.

„„ Parâmetro: usado para designar alguma característica


descritiva dos elementos da população (percentagem,
média etc.).

„„ Estimação: é uma avaliação indireta de um parâmetro


com base em um estimador, através do cálculo de
probabilidades. Nesse caso, utiliza-se uma amostra.

Principais propriedades da estimação:

»» admite erro processual positivo e tem confiabilidade


menor que 100%;

»» é barata e rápida;

»» é atualizada;

»» é sempre viável.

24

probabilidade_e_estatistica_1582.indb 24 19/07/12 11:11


Probabilidade e Estatística

„„ Estimativa: é o valor assumido por certa estatística


(exemplo: 60% é o valor de estimativa do referido
parâmetro).

Amostragem
Como já foi exposto nesta unidade, as pesquisas são realizadas
por meio de estudo dos elementos que compõem uma amostra
extraída da população que se pretende analisar. O conceito de
população é intuitivo. Trata-se do conjunto de indivíduos ou
objetos que apresentam, em comum, determinadas características
definidas para o estudo. Amostra é um subconjunto da
população. O estudo de todos os elementos da população
possibilita conhecimento preciso das variáveis que estão sendo
pesquisadas; todavia nem sempre é possível obter as informações
de todos os elementos da população.

Limitações de tempo, custo e as vantagens do uso das


técnicas estatísticas justificam o uso de planos amostrais. A
representatividade da amostra dependerá do seu tamanho (quanto
maior, melhor). O investigador procurará acercar-se de cuidados,
visando à obtenção de uma amostra significativa, ou seja, que
de fato represente toda a população da melhor maneira possível.
(FONSECA, 1996).

Observe, a seguir, mais alguns conceitos do processo estatístico,


relacionados à amostragem:

„„ Estatística: característica descritiva dos elementos da


amostra (percentagem, média etc.).

„„ Erro amostral: é a máxima diferença que o investigador/


pesquisador admite entre a média da população e a
média da amostra. Em pesquisa, admite-se o uso do
erro amostral entre 2% a 7%. Observe, por exemplo, as
pesquisas eleitorais, a grande maioria destas pesquisas
é efetuada com erro amostral de 2%. Isto significa que
pode variar de −2% a +2%. Quando se diz que dois
candidatos estão com empate técnico, isso quer dizer que,
somando ou diminuindo 2%, estão empatados.

Unidade 1 25

probabilidade_e_estatistica_1582.indb 25 19/07/12 11:11


Universidade do Sul de Santa Catarina

O candidato A está com 48% da preferência dos votos,


e o candidato B está com 52% da preferência dos votos.
O candidato A tem 48%; diminuindo os 2% = 46; com
48% mais 2% = 50%. Já, o candidato B tem 52% menos
2% = 50%; com 52% + 2% = 54%. Logo, os candidatos
estão empatados tecnicamente, com 50% cada.

„„ Nível de confiança: é expressa em percentual e representa


quantas vezes o percentual real da população encontra-se
dentro do intervalo de confiança. O nível de confiança de
95% significa que você tem 95% de certeza. A maioria dos
pesquisadores usa o nível de confiança de 95%.

Como podemos ver, o uso da amostragem é vantajoso por trazer:

„„ economia: é mais econômico o levantamento de somente


uma parte da população, muitas vezes pelo custo do
próprio levantamento e também por não ser mais possível
recuperar elementos da população;

„„ tempo: em pouco tempo, pode-se pesquisar uma


amostra, ao contrário de uma população;

„„ confiabilidade: quando se pesquisa um número menor


de elementos, pode-se dar mais atenção, evitando erros
nas respostas.

– Até aqui, vimos alguns conceitos básicos de estatística. Mas, entre


os conceitos fundamentais da Estatística, é importante distinguir
variáveis estatísticas de dados estatísticos. Estes assuntos serão
tratados na próxima seção. Vamos adiante... Bons Estudos!

26

probabilidade_e_estatistica_1582.indb 26 19/07/12 11:11


Probabilidade e Estatística

Seção 2 – Variáveis
Variáveis são conjuntos de características que podem ser
observadas e/ou medidas em cada elemento da população ou
amostra, sob as mesmas condições.

Ao analisar uma determinada experiência, um fato ou um


elemento, você pode verificar que todos eles assumem diferentes
características ou valores.

Ao analisar um determinado setor de uma empresa,


você pode verificar, entre seus funcionários, algumas
características como sexo, idade, salário, assiduidade etc.

Estas características variam de elemento para elemento, por isto


são chamadas de variáveis.

As variáveis são classificadas em dois tipos:

„„ Qualitativas: representam a informação que identifica


alguma qualidade, categoria ou característica,
não suscetível de medida (não numérica), mas de
classificação, assumindo várias modalidades.

Estado civil: casado, solteiro, viúvo, divorciado.


Sexo: masculino e feminino.
Escolaridade: 1º grau, 2º grau, 3º grau.

As variáveis qualitativas estão divididas em:

„„ Nominais: são dados caracterizados por rótulos ou


categorias. Por exemplo, sexo, estado civil, cor dos olhos etc.;

„„ Ordinais: são dados caracterizados por uma ordem,


mas não podem ser diferenciados por valor numérico.
Por exemplo: nível de escolaridade (1º, 2º e 3º graus),
intensidade da luz (muito forte, forte, média, suave,
muito suave).

Unidade 1 27

probabilidade_e_estatistica_1582.indb 27 19/07/12 11:11


Universidade do Sul de Santa Catarina

„„ Quantitativas: representam a informação resultante


de características suscetíveis de serem medidas,
apresentam-se com diferentes intensidades.

Idade: 19 anos, 20 anos, 35 anos.


Número de nascidos vivos: 10, 15, 22, 12, 14.
Peso: 55 kg, 66 kg, 71 kg.

As variáveis quantitativas estão divididas em:

„„ Variáveis discretas: se ela pode assumir um conjunto


constante discreto, ou seja, enumerável, finito de valores.
Geralmente são expressas por valores inteiros não
negativos. Por exemplo: número de pessoas do setor,
quantidade de notas fiscais (observação: não se pode
considerar meia nota fiscal ou meia pessoa).

„„ Variáveis contínuas: são as variáveis em que não


conseguimos enumerar seus possíveis resultados, por estes
formarem um conjunto infinito de valores, num intervalo
de números reais. Por exemplo: peso, altura, temperatura.

Diferença entre as variáveis discreta e contínua


Você, à noite, ao ir deitar, tem 1,65m e desperta
pela manhã com 1,70m. Você cresce 5cm de forma
instantânea? Não, você cresce aos poucos e, entre
1,65 e 1,70, você tem infinitas alturas. Para a variável
discreta, observamos que não é possível aumentar o
número de pessoas de 22 para 22,57. Não podemos
aumentar em 0,57 pessoa. Só podemos aumentar em
uma unidade.

28

probabilidade_e_estatistica_1582.indb 28 19/07/12 11:11


Probabilidade e Estatística

Seção 3 – Dados
Dados estatísticos são medidas da presença de um determinado
conjunto de valores de uma variável numa população ou amostra.
Os tipos de dados estatísticos são:

„„ dados primários: quando são observados e/ou


levantados pelo próprio pesquisador ou organização que
os tenha recolhido;

„„ dados secundários: quando são observados e/ou


levantados por outra organização ou pesquisador.

Além desta classificação, os dados também pode ser absolutos


e relativos. Nesta seção, vamos aprender a transformar dados
absolutos em dados relativos, mas, antes disso, vamos conhecer
suas definições.

„„ Dados absolutos são dados estatísticos resultantes da


coleta direta da fonte, sem outra manipulação a não ser
a contagem ou medida. A leitura dos dados absolutos é
sempre enfadonha e inexpressiva. Embora esses dados
traduzam um resultado exato e fiel, não têm a virtude de
ressaltar de imediato as suas conclusões numéricas.

Daí o uso imprescindível que faz a Estatística dos dados


relativos. O número de vezes que um valor da variável de
uma pesquisa é citado representa a frequência absoluta
daquele valor.

„„ Dados relativos são o resultado de comparações por


quociente (razões) que se estabelecem entre dados
absolutos e têm por finalidade realçar ou facilitar as
comparações entre quantidades. Traduzem-se os dados
relativos, em geral, por meio de:

„„ percentagens;

„„ coeficientes;

„„ taxas;

„„ índices.

Unidade 1 29

probabilidade_e_estatistica_1582.indb 29 19/07/12 11:11


Universidade do Sul de Santa Catarina

A frequência relativa é o quociente entre a frequência absoluta de


uma variável e o total de citações de todas as variáveis da pesquisa.

Percentagens e proporções
Permitem padronizar distribuições de frequência quanto ao
tamanho, ou seja, comparam grupos de diferentes frequências totais.

Na proporção (P), compara-se o número de sujeitos de uma dada


categoria (F) com o número total de sujeitos (N).

Num grupo de 20 alunos, 10 gostam de futebol. Assim,


a proporção será dada por:

Logo, a proporção é de 0,50, ou seja, de cada dois


indivíduos um gosta de futebol.

Em percentagem, entretanto, podemos multiplicar esta


proporção por 100, obtendo, assim, a porcentagem ou
percentagem.

Então, de acordo com o exemplo dado, temos:

(Porcentagem)

Portanto, de cada 100 alunos, 50 gostam de futebol.

No próximo exemplo, consideremos a tabela a seguir:

30

probabilidade_e_estatistica_1582.indb 30 19/07/12 11:11


Probabilidade e Estatística

Tabela 1.1 – Área territorial brasileira por região – 2010

Região Área territorial em km2


Centro-Oeste 1.606.371
Nordeste 1.554.257
Norte 3.853.327
Sudeste 924.511
Sul 576.409
Total 8.514.875

Fonte: IBGE (2010).

Nesse caso, vamos identificar qual percentual do território


nacional cada região ocupa em relação ao total. Para isso,
precisamos dividir a área territorial de cada região pela área total
e multiplicar por 100.

Calculemos as percentagens de cada região:

Centro-Oeste = 1.606.371 ÷ 8.514.875 = 0,1886 × 100 = 18,87%

Nordeste = 1.554.257 ÷ 8.514.875 = 0,1825 × 100 = 18,25%

Norte = 3.853.327 ÷ 8.514.875 = 0,4525 × 100 = 45,25%

Sudeste = 924.511 ÷ 8514.875 = 0,1086 × 100 = 10,86%

Sul = 576.409 ÷ 8.514.409 = 0,06769 × 100 = 6,77%

Agora, vamos acrescentar na tabela uma coluna com os


percentuais.

Unidade 1 31

probabilidade_e_estatistica_1582.indb 31 19/07/12 11:11


Universidade do Sul de Santa Catarina

Tabela 1.2 – Área territorial brasileira por região – 2010

Região Área territorial em km2 Percentual (%)


Centro-Oeste 1.606.371 18,87
Nordeste 1.554.257 18,25
Norte 3.853.327 45,25
Sudeste 924.511 10,86
Sul 576.409 6,77
Total 8.514.875 100,0

Fonte: IBGE (2010).

Observe que, no resultado do cálculo do percentual,


foram aplicadas regras de arredondamento.
Considerando que cada região representa uma
proporção do todo, o total precisa fechar com 100%.

Nesse exemplo, os dados referentes à área territorial são dados


secundários e absolutos. Secundários porque não foram pesquisados
por nós, e sim pelo IBGE; e absolutos porque estão na tabela como
foram coletados. Já no percentual, os dados são relativos porque
sofreram transformações: são dados de comparações.

Coeficientes e taxas
São razões que comparam o número de ocorrências de certo evento
com ele mesmo, acrescido das não ocorrências (mas que poderiam
ter ocorrido); e a razão entre variáveis da mesma espécie.

Coeficientes

São razões entre o número de ocorrências e o número total (que


é o número de ocorrências e não ocorrências). Os coeficientes são
multiplicados por 100, para transformá-los em taxa.

32

probabilidade_e_estatistica_1582.indb 32 19/07/12 11:11


Probabilidade e Estatística

Número de nascimentos
Coeficiente de natalidade =
População total

Número de óbitos
Coeficiente de mortalidade infantil =
Número de nascimento total

Taxas

São os coeficientes multiplicados por 100 ou 1.000. As taxas de


mortalidade infantil e de natalidade são multiplicadas por 1.000,
por serem números muito pequenos.

A taxa nacional de mortalidade infantil do Brasil,


segundo o IBGE – dados de 2007 –, é de 19,3 por mil
nascimentos.

Índices

São métodos que comparam duas grandezas distintas, ou seja,


uma não inclui a outra.

População
Densidade demográfica =
Superfície

Número de alunos
Densidade aluno/professor =
Número de professores

Número de alunos
Densidade aluno/ sala de aula =
Número de sala de aula

Unidade 1 33

probabilidade_e_estatistica_1582.indb 33 19/07/12 11:11


Universidade do Sul de Santa Catarina

Índices econômicos

Valor total da produção


Produção per capita =
População

Consumo de bem
Consumo per capita =
População

Renda
Renda per capita =
População

– Você pôde conhecer, nas duas últimas seções, as definições e diferen‑


ças das variáveis e dos dados estatísticos. Na próxima seção, serão
apresentadas séries estatísticas... Bons estudos!

Seção 4 – Séries
Série estatística define-se como toda e qualquer coleção de
dados estatísticos referidos a uma mesma ordem de classificação.
Quantitativa em seu sentido mais amplo, o termo série refere-se a
uma sucessão de números referidos a qualquer variável.

Os resultados estatísticos são apresentados em quadros ou


tabelas para maior clareza, objetividade e melhor visão do
conjunto, oferecendo, assim, vantagens para uma análise
Tabela é a organização racional
e prática de apresentação dos
matemática das mesmas.
dados estatísticos e a sintetização
dos dados no mínimo espaço para
colocar o máximo de informações. A série estatística pode ser definida, portanto, como
qualquer tabela que apresente a distribuição de um
conjunto de dados estatísticos.

34

probabilidade_e_estatistica_1582.indb 34 19/07/12 11:11


Probabilidade e Estatística

Tipos de séries
Para diferenciar uma série estatística de outra, há que levar em
conta três caracteres presentes na tabela que se apresenta:

„„ época: fator temporal ou cronológico a que se refere o


fenômeno analisado;

„„ local: fator geográfico onde o fenômeno acontece;

„„ fenômeno: espécie ou fato ou fator específico que é


descrito.

Conforme a variação dos elementos da série, é possível classificá-


las em temporal, geográfica específica e conjugada.

a) Série temporal: identifica-se por descrever a variável


no decorrer de um determinado período de tempo. Esta
série também é chamada de histórica ou evolutiva.
Observe a tabela que registra os nascidos vivos
registrados segundo o ano do registro no Brasil.

Tabela 1.3 – Nascidos vivos registrados segundo o ano do registro no Brasil

Anos Nº de nascidos
1984 2.559.038
1985 2.619.604
1986 2.779.253

Fonte: IBGE (2010).

b) Série geográfica: identifica-se por descrever a variável


considerando o fator geográfico. Também é chamada de
espacial, territorial ou de localização. Observe a tabela
que registra as mulheres de dez anos ou mais de idade,
total, que tiveram filhos nascidos vivos – Censo de 2000
– segundo as Mesorregiões:

Unidade 1 35

probabilidade_e_estatistica_1582.indb 35 19/07/12 11:11


Universidade do Sul de Santa Catarina

Tabela 1.4 – Mulheres de dez anos ou mais de idade, total, tiveram filhos nascidos vivos –
Censo de 2000 - segundo as Mesorregiões

Mulheres de dez anos ou mais de idade que


Mesorregiões tiveram filhos nascidos vivos
Grande Florianópolis 211.763
Norte Catarinense 267.448
Oeste Catarinense 297.814
Serrana 106.025
Sul Catarinense 224.287
Vale do Itajaí 319.195

Fonte: IBGE (2010).

c) Série específica: o caráter variável é apenas o fato


ou espécie. Também é chamada de série categórica.
Observe a tabela que registra as pessoas de dez anos ou
mais de idade que viviam em companhia de cônjuge
ou companheiro(a), por natureza da união, segundo as
Mesorregiões – Santa Catarina – Censo de 2000.

Tabela 1.5 – Pessoas de dez anos ou mais de idade que viviam em companhia de cônjuge
ou companheiro(a), por natureza da união, segundo as Mesorregiões – Santa Catarina –
Censo de 2000

Número de pessoas de dez anos ou mais de


Natureza da união idade
Casamento civil e religioso 1.666.621
Só casamento civil 189.741
Só casamento religioso 85.543
União consensual 521.001

Fonte: IBGE (2010).

d) Séries conjugadas: também chamadas de tabelas de


dupla entrada. São apropriadas à apresentação de duas ou
mais séries de maneira conjugada, havendo duas ordens
de classificação: uma horizontal e outra vertical. Observe
a tabela a seguir, que registra a quantidade de mortes por
acidente de trânsito em São Paulo, nos anos de 1997 e 1998.

36

probabilidade_e_estatistica_1582.indb 36 19/07/12 11:11


Probabilidade e Estatística

Tabela 1.6 – Quantidade de mortes por acidente de trânsito em São Paulo, nos anos de
1997 e 1998 (dados fictícios)

Idade 1997 1998


Até 10 anos 69 45
De 10 a 19 anos 212 165
De 20 a 49 anos 868 628
De 50 anos e mais 382 287
Idade Ignorada 51 40

Fonte: Elaboração do autor (2006).

As séries conjugadas ainda podem ser geográfico-


temporal e geográfico-específica.

Síntese

Nesta unidade, você estudou conceitos básicos e introdutórios da


Estatística. Também conheceu quais são as etapas do processo de
uma pesquisa para que se possa alcançar um resultado fiel, que
traduza a realidade.

Você pôde estudar alguns conceitos importantes como


população e amostra, variáveis, dados e séries. Todos estes novos
conhecimentos serão muito importantes para você dar sequência
ao estudo da Estatística.

Unidade 1 37

probabilidade_e_estatistica_1582.indb 37 19/07/12 11:11


Universidade do Sul de Santa Catarina

Atividades de autoavaliação

Ao final de cada unidade, você realizará atividades de autoavaliação. O


gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.

1) Analise os conceitos de censo e estimação e descreva a principal


diferença entre os termos.

2) Ao escolher os elementos de uma amostra, o que você deve considerar


para que ela seja representativa? Por quê?

38

probabilidade_e_estatistica_1582.indb 38 19/07/12 11:11


Probabilidade e Estatística

3) Como você pôde acompanhar, existem dois tipos de variáveis: a


qualitativa, que está dividida em nominal e ordinária, e a quantitativa,
que está dividida em contínua e discreta. Identifique, no seu dia a dia,
pelo menos um exemplo de cada uma destas variáveis e as escreva no
quadro a seguir:

Variável Exemplo
Qualitativa nominal
Qualitativa ordinal
Quantitativa discreta
Quantitativa contínua

4) Ao planejar uma pesquisa sobre uma determinada síndrome, um


pesquisador tem a intenção de usar um questionário para a coleta de
dados e, também, planeja fazer levantamento de dados no Ministério
da Saúde, para que possa realizar comparativos. Como consequência
disto, ele terá que trabalhar com dois tipos de dados: os resultantes
dos questionários e os resultantes do levantamento no Ministério.
Classifique os dois tipos de dados.
a) Os dados coletados por meio de questionário são: ________________
b) Os dados coletados no Ministério:_____________________________

Unidade 1 39

probabilidade_e_estatistica_1582.indb 39 19/07/12 11:11


Universidade do Sul de Santa Catarina

5) Classifique cada uma das variáveis a seguir em qualitativa nominal ou


ordinal e em quantitativa discreta ou contínua:

Descrição da variável Classificação

Saldo em conta corrente em R$

Idade do cliente

Sexo do cliente

Classe econômica

Estado civil

Número de defeitos do produto

Consumo de energia em kWh

Grau de instrução

Número de filhos

Hierarquia de uma empresa

Número de filhos de uma família

Diâmetro da peça produzida

Comprimento da peça

Tempo de espera em caixa eletrônico


em minutos

Nome de país exportador de petróleo

Grau de satisfação no atendimento


numa loja comercial
Número de ações negociadas na
bolsa de valores
Número de alunos de uma
universidade
Altura dos funcionários de uma
empresa

40

probabilidade_e_estatistica_1582.indb 40 19/07/12 11:11


Probabilidade e Estatística

6) Observe as duas tabelas a seguir e classifique as séries estatísticas de


cada uma delas.

Tabela A – Pessoas de dez anos ou mais de idade, por estado civil e condição de
convivência – Santa Catarina – Censo de 2000

Desquitado(a)
Estado civil Casado(a) ou separado(a) Divorciado(a) Viúvo(a) Solteiro(a)
judicialmente
Mesorregiões
Grande Florianópolis 267.867 18.697 16.779 28.224 333.974
Norte Catarinense 380.222 21.098 13.630 38.037 379.194
Oeste Catarinense 439.967 16.130 9.174 38.856 399.587
Serrana 142.373 6.738 4.814 15.834 150.964
Sul Catarinense 314.348 14.021 12.068 32.261 302.894
Vale do Itajaí 443.839 25.825 20.433 46.595 439.800

Fonte: IBGE (2010).

Tabela B – Metabolismo basal (cal/dia) em adolescentes (dados fictícios)


Metabolismo basal (cal/dia) Número de adolescentes
910 |-- 989 3
989 |-- 1068 5
1068 |-- 1147 9
1147 |-- 1226 5
1226 |-- 1305 8
1305 |-- 1384 3
1384 |-- 1463 2

Fonte: Elaboração do autor (2006).

41

probabilidade_e_estatistica_1582.indb 41 19/07/12 11:11


Universidade do Sul de Santa Catarina

Saiba mais

Se você desejar, aprofunde os conteúdos estudados nesta unidade


ao consultar as seguintes referências:

CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo:


Saraiva, 2009.

FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade.


Curso de estatística. 6. ed. São Paulo: Atlas, 1996.

RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era,


2006.

SILVA, Ermes Medeiros da. Estatística para os cursos de


economia, administração e ciências contábeis. 3. ed. São Paulo:
Atlas, 1996. v. 1.

TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de


Janeiro: LTC, 1999.

42

probabilidade_e_estatistica_1582.indb 42 19/07/12 11:11


2
UNIDADE 2

Distribuição de frequências e
representação gráfica

Objetivos de aprendizagem
„„ Organizar dados brutos de acordo com os tipos de
variáveis.

„„ Compreender, organizar e analisar a distribuição de


frequência.

„„ Montar tabelas de distribuição de frequência para


variáveis qualitativas e quantitativas.

„„ Analisar e interpretar gráficos.

Seções de estudo
Seção 1 Representação numérica

Seção 2 Tipos de frequência

Seção 3 Representação gráfica

probabilidade_e_estatistica_1582.indb 43 19/07/12 11:11


Universidade do Sul de Santa Catarina

Para início de estudo


Nesta unidade, você vai trabalhar com a organização dos dados
estatísticos propriamente ditos.

De posse dos dados de forma desorganizada, um primeiro passo


seria organizá-los em tabelas para que possibilite uma primeira
análise, além de servir para uma série de interpretações. Você
poderá aprender como se organizam dados brutos e como pode
ser analisada a distribuição de frequências.

Você também terá a oportunidade de adquirir mais uma


importante ferramenta para utilizar na análise e interpretação de
dados: a representação gráfica. Você irá conhecer alguns tipos de
representação gráfica mais utilizados e suas características.

Poderá constatar que os dados representados por meio de


gráficos, muitas vezes, facilitam a leitura e a compreensão de
algum fenômeno ou acontecimento.

Seção 1 – Representação numérica


Para iniciar o estudo desta unidade, antes de qualquer coisa, você
precisa saber o que são dados brutos e dados agrupados.

Dados brutos

Dados brutos são sequências de valores numéricos


ou não, os quais não sofreram qualquer tratamento
estatístico, nem foram organizados, obtidos
diretamente da observação de um fenômeno.

44

probabilidade_e_estatistica_1582.indb 44 19/07/12 11:11


Probabilidade e Estatística

Mais precisamente, dados brutos são os dados apresentados


da forma como foram coletados na pesquisa ou levantamento,
desorganizados, sem ordenação.

Acompanhe os exemplos de levantamento de dados de acordo


com o tipo de variável: qualitativa, quantitativa discreta ou
quantitativa contínua.

Para uma variável qualitativa


Em um levantamento realizado com 56 clientes de um banco,
foram obtidos os seguintes dados sobre o tipo de investimento em
que mais confiavam, conforme legenda:

I M R P I I P R
P R I P P I R I
P P P M I P P P
M P I I I M P R
M R R P M M P R
I R M P P I R P
M P I P P M P I

Quadro 2.1 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
Fonte: Elaboração do autor (2006).
Legenda do quadro:
I – Investimentos imobiliários
M – Investimento em mercado de ações
P – Investimento em poupança
R – Investimento em fundos de renda fixa

Repare que, neste caso, foram pesquisados 56 clientes e foram


anotadas as respostas na ordem das entrevistas.

Para uma variável quantitativa discreta


O controle de qualidade de uma fábrica de rolamentos vem
analisando os lotes para detectar defeitos nas peças fabricadas.
Cada lote contém 56 peças. A seguir, está relacionado o número
de defeitos por peça, conforme estas são produzidas neste lote:

Unidade 2 45

probabilidade_e_estatistica_1582.indb 45 19/07/12 11:11


Universidade do Sul de Santa Catarina

1 1 4 1 0 0 1 6
5 0 0 0 0 0 0 0
0 1 0 0 1 0 3 2
4 2 0 0 2 0 1 0
0 0 3 3 0 0 4 0
0 1 0 2 0 0 1 0
3 0 0 0 3 0 0 0

Quadro 2.2 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
Fonte: Elaboração do autor (2006).

Repare que foram analisadas 56 peças e foram anotados os


números de defeitos por peça, na ordem em que estas foram
produzidas.

Para uma variável quantitativa contínua


Os valores anotados a seguir representam o volume de vendas
mensal de 56 representantes de uma empresa que fabrica
remédios. Os valores estão em milhares de reais:

23,25 27,43 17,76 33,33 33,05 16,08 34,49 23,74


32,63 20,58 18,50 16,69 16,43 20,08 19,00 16,13
21,36 26,60 22,49 22,77 23,05 33,55 22,73 24,89
24,11 34,83 21,73 31,53 35,13 34,36 20,80 16,84
29,55 34,76 31,72 24,89 21,65 22,65 30,43 30,93
17,25 17,05 19,67 22,79 25,30 23,08 25,77 35,03
16,59 15,90 20,30 33,86 17,76 30,93 20,81 29,05

Quadro 2.3 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma


empresa que fabrica remédios
Fonte: Elaboração do autor (2006).

Dados agrupados
Dados agrupados são sequências de valores numéricos, ou não, os
quais se encontram já organizados, ou por semelhança (qualitativas),
ou por ordenação numérica (quantitativas), em tabelas.

46

probabilidade_e_estatistica_1582.indb 46 19/07/12 11:11


Probabilidade e Estatística

Tabelas para variável qualitativa


Para montar uma tabela com variável qualitativa, acompanhe o
exemplo, a seguir, de um levantamento de dados acerca do tipo
de investimento em que os clientes de um banco mais confiavam.

Veja passo a passo

1º passo: para começar, você deve organizar os dados por


semelhança.

I I I I I I I I
I I I I I I M M
M M M M M M M M
P P P P P P P P
P P P P P P P P
P P P P P P R R
R R R R R R R R
Quadro 2.4 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
Fonte: Elaboração do autor (2006).

Legenda do quadro:
I – Investimentos imobiliários
M – Investimento em mercado de ações
P – Investimento em poupança
R – Investimento em fundos de renda fixa

Repare que os dados estão organizados por tipo de investimento.

2º passo: agora você vai escrever, em uma coluna, cada uma das
opções verificadas. Contar o número de vezes em que cada tipo
aparece e marcar com traços, ao lado, para representar as aparições.
Em seguida, conte o número de traços para obter o número de vezes
que cada opção aparece. Observe, a seguir, a contagem dos dados.

I = 14

M = 10

P = 22

R = 10

Unidade 2 47

probabilidade_e_estatistica_1582.indb 47 19/07/12 11:11


Universidade do Sul de Santa Catarina

3º passo: após a contagem e organização dos dados, agora é só


montar a tabela, sem esquecer nenhum de seus componentes.
Acompanhe:

Tabela 2.1 – Tipos de investimento

Tipo de investimento Número de clientes

Imobiliário 14
Mercado de ações 10
Poupança 22
Fundos de renda fixa 10
Total 56

Fonte: Elaboração do autor (2006).

Essas tabelas são denominadas de distribuição de


frequências.

Tabelas para variável quantitativa discreta


Nesta seção, vamos verificar como montar uma tabela com
variável quantitativa discreta. Para saber como são montados
estes tipos de tabela, acompanhe os passos apresentados a seguir.

Observe que a opção de montar uma tabela sem


intervalos se deve ao fato de esta série ter um número
de elementos distintos pequeno.

48

probabilidade_e_estatistica_1582.indb 48 19/07/12 11:11


Probabilidade e Estatística

Veja passo a passo

1º passo: para começar organize os dados em ordem crescente.

0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 1 1 1 1 1 1 1
1 1 2 2 2 2 3 3
3 3 3 4 4 4 5 6

Quadro 2.5 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
Fonte: Elaboração do autor (2006).

Repare que foram organizados conforme uma ordem numérica


crescente (de 0 a 6).
A organização de dados na
2º passo: escreva, em uma coluna, cada um dos valores observados. forma de lista em ordem –
Conte o número de vezes em que cada tipo aparece e marque com crescente ou decrescente
traços, ao lado, para representar as aparições. Após, conte o número –, é chamada de Rol.
de traços para obter o número de vezes em que cada valor aparece.
Observe, a seguir, a contagem dos dados.

0 33

1 9

2 4

3 5

4 3

5 1

6 1

Unidade 2 49

probabilidade_e_estatistica_1582.indb 49 19/07/12 11:11


Universidade do Sul de Santa Catarina

3º passo: agora é só montar a tabela, sem esquecer nenhum de seus


componentes.

Tabela 2.2 – Número de defeitos por peças analisadas do lote

Fonte: Elaboração do autor (2006).

Nesta tabela, utilizamos algumas expressões estatísticas para


representação dos elementos:

„„ os valores que a variável pode assumir é representado por xi;

„„ o número de observações de cada linha chama-se de


frequência simples, denotada por f i; e

„„ o número total de observações chama-se de frequência


total e pode ser denotada por N (tamanho da população),
n (tamanho da amostra) ou .

50

probabilidade_e_estatistica_1582.indb 50 19/07/12 11:11


Probabilidade e Estatística

Tabelas para variável quantitativa contínua


A opção de montar uma tabela com intervalos é preferível porque
esta série possui um grande número de elementos distintos
ou, ainda, quando os valores apresentam uma natureza de
continuidade. Vamos acompanhar um exemplo para montagem
das tabelas para variável quantitativa contínua.
Para a variável
quantitativa contínua,
Os valores anotados a seguir representam o volume utilizam-se intervalos na
de vendas mensal de 56 representantes de uma tabela para representar
empresa que fabrica remédios. Os valores estão em a série de dados. Estes
milhares de reais. intervalos denominam-se
intervalos de classes.

Veja passo a passo

1º passo: para começar, você deve organizar os dados em ordem


crescente (Rol).

15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05


17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13
Quadro 2.6 – Levantamento sobre o volume de vendas mensal de 56 representantes de uma
empresa que fabrica remédios
Fonte: Elaboração do autor (2006).

Unidade 2 51

probabilidade_e_estatistica_1582.indb 51 19/07/12 11:11


Universidade do Sul de Santa Catarina

2º passo: você deve calcular o número e o tamanho dos intervalos.

O número de intervalos (k) é obtido a partir dos seguintes


critérios:

„„ critério da raiz ;

„„ fórmula de Sturges k = 1 + 3,3.log n;

Sendo n = tamanho da amostra (poderá ser usado N, quando for


com a população).

Observe que:
1. Ainda que existam dois critérios, em geral, o critério
utilizado é o da raiz: .
2. O número do intervalo (k), em alguns casos, pode ser
predefinido.
3. As tabelas devem ter, no mínimo, 5 e, no máximo,
20 intervalos de classes, para que não haja nem perda,
nem excesso de informação.

Para este estudo, sendo n o número de elementos da amostra,


n = 56, e , então , logo k = 7 e o número de
intervalos utilizados será igual a 7.

Agora, vamos analisar as amplitudes e os limites de classe para


determinar o tamanho dos intervalos.

a) Amplitude total da distribuição (AT): é a diferença entre o


maior valor e o menor valor observado.

AT = L(máx) – l(mín)

L(máx) = Limite máximo (maior valor)

l(min) = Limite mínimo (menor valor)

52

probabilidade_e_estatistica_1582.indb 52 19/07/12 11:11


Probabilidade e Estatística

No exemplo que você está estudando:


AT = 35,13 − 15,90 AT = 19,23 19,50

Nesta etapa, é conveniente que o resultado seja


arredondado para cima, a fim de que não haja perda de
informação.

b) Amplitude de um intervalo de classe (h): também chamada


de tamanho do intervalo de classe, é obtida da seguinte forma:

No exemplo:

Antes de partir para a construção da tabela, é conveniente testar


se os cálculos estão corretos. Para que isso aconteça, verifique se:

h.K > AT

Aplique sobre o exemplo dado:

2,80 . 7 = 19,60 > 19,23

Ou seja, ao somar 19,60 ao menor valor observado resulta 35,50,


que é maior que o valor da maior observação, 35,13.

15,90 + 19,60 = 35,50 > 35,13

Caso não seja satisfeita esta condição, será necessário fazer um


ajuste, aumentando o tamanho do intervalo. Então, resumindo,
segundo o exemplo dado, a tabela terá:

Unidade 2 53

probabilidade_e_estatistica_1582.indb 53 19/07/12 11:11


Universidade do Sul de Santa Catarina

„„ sete intervalos;

„„ cada um com o tamanho de 2,80.

c) limites de classes: são os extremos de cada classe. O limite


inferior da classe (Li) é o menor número do intervalo. O limite
superior (Ls) é o maior número do intervalo.

3º passo: escreva os intervalos da tabela.

Comece pela primeira classe, escreva o menor valor observado. 15,90

A este valor, some o h (2,8) e encontre o limite superior deste intervalo: 15,90 |--- 18,70
15,9 + 2,8 = 18,7. Você deve escrever na tabela:

Na segunda classe, repita o último valor da classe anterior (18,7), some


o h (2,8) e encontre o limite superior deste intervalo: 18,7 + 2,8 = 21,5. 18,70 |--- 21,50
Você pode escrever na tabela:

Na terceira classe, repita o último valor da classe anterior (21,5), some


o h (2,8) e encontre o limite superior deste intervalo: 21,5 + 2,8 = 24,3. 21,50 |--- 24,30
Você pode escrever na tabela:

24,30 |--- 27,10


Usando este procedimento para as outras classes, você terá os 27,10 |--- 29,90
seguintes intervalos a seguir, até a sétima classe:
29,90 |--- 32,70

Observe que os intervalos são escritos dessa forma:


15,90 |--- 18,70. O que significa?

A representação indica um intervalo fechado à esquerda e aberto


à direita Þ [15,90; 18,70), ou seja, os valores deste intervalo
chegam perto de 18,70, mas o valor 18,70 está no próximo
intervalo: 18,70 |--- 21,50; o valor 21,50 não está neste intervalo,
e sim no intervalo: 21,50 |---24,30. E assim por diante.

54

probabilidade_e_estatistica_1582.indb 54 19/07/12 11:11


Probabilidade e Estatística

4º passo: agora é a vez de partir para a construção da tabela, sem


se esquecer de seus componentes. Primeiro monte a tabela e
escreva os intervalos.

Tabela 2.3 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010

Classe Volume de vendas (em mil reais)


1 15,90 |--- 18,70
2 18,70 |--- 21,50
3 21,50 |--- 24,30
4 24,30 |--- 27,10
5 27,10 |--- 29,90
6 29,90 |--- 32,70
7 32,70 |--- 35,50

Fonte: Elaboração do autor (2006).

5º passo: agora é só contar e marcar o número de valores em cada


intervalo. É aconselhável marcar os limites dos intervalos no Rol e usar
os traços para indicar a contagem ou marcar como no quadro a seguir:

15,90 16,08 16,13 16,43 16,59 16,69 16,84 17,05


17,25 17,76 17,76 18,50 19,00 19,67 20,08 20,30
20,58 20,80 20,81 21,36 21,65 21,73 22,49 22,65
22,73 22,77 22,79 23,05 23,08 23,25 23,74 24,11
24,89 24,89 25,30 25,77 26,60 27,43 29,05 29,55
30,43 30,93 30,93 31,53 31,72 32,63 33,05 33,33
33,55 33,86 34,36 34,49 34,76 34,83 35,03 35,13

Quadro 2.7 – Volume de vendas mensais


Fonte: Elaboração do autor (2006).

Unidade 2 55

probabilidade_e_estatistica_1582.indb 55 19/07/12 11:11


Universidade do Sul de Santa Catarina

Tabela 2.4 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010

Classe Volume de vendas Contagem Nº de


(em mil reais) representantes (fi)

1 15,9 18,7 12

2 18,7 21,5 8

3 21,5 24,3 12

4 24,3 27,1 5

5 27,1 29,9 3

6 29,9 32,7 6

7 32,7 35,5 10

Total ( ) 56

Fonte: Elaboração do autor (2006).

E, no final, a tabela fica como está apresentado a seguir:

Tabela 2.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010

Fonte: Elaboração do autor (2006).

Até aqui, você estudou dois tipos de frequência: a simples e a total, e


pôde aprender que: o número de observações de cada linha chama‑se
frequência simples, f i; e o número total de observações chama-se
frequência total, . Na seção a seguir, você irá aprender que,
além destas duas, existem outros tipos de frequência.

56

probabilidade_e_estatistica_1582.indb 56 19/07/12 11:11


Probabilidade e Estatística

Seção 2 – Tipos de frequência


A Estatística tem como uma de suas finalidades facilitar a análise
e a leitura dos dados, e, justamente, para isso, um dos métodos
utilizados é trabalhar com tipos de frequência. Estes tipos de
frequência lhe serão apresentados a seguir.

Frequência acumulada
Na tabela, na coluna da frequência acumulada, você deverá
escrever o valor acumulado das frequências, ou seja, para
começar, repita a frequência simples da primeira linha e,
nas linhas seguintes, some a frequência simples à frequência
acumulada anterior.

Este processo deverá chegar até a frequência total

fa = fa(ant) + f i

Sendo:

fa: frequência acumulada;

fa(ant): frequência crescente da classe anterior;

f i: frequência simples da classe;

Unidade 2 57

probabilidade_e_estatistica_1582.indb 57 19/07/12 11:11


Universidade do Sul de Santa Catarina

Acompanhe com atenção a tabela:

Tabela 2.6 – Volume de vendas

Fonte: Elaboração do autor (2006).

Para que serve a frequência acumulada?

Imagine que você está apresentando um relatório de vendas da


empresa para a diretoria.

Então, um dos diretores lhe pergunta: “Quantos representantes


tiveram vendas menores que 29,9 mil reais?” Você não necessitará
fazer contas, é só observar a quinta classe, na coluna da
frequência acumulada na tabela e dizer: “40 representantes!”

E se perguntarem: “Quantos representantes venderam abaixo de


24,3 mil reais?” Você vai encontrar a resposta na terceira classe na
coluna com a frequência acumulada: “32 representantes”.

Observe que o volume de vendas questionado é sempre do limite


superior de cada intervalo para baixo.

58

probabilidade_e_estatistica_1582.indb 58 19/07/12 11:11


Probabilidade e Estatística

Frequência relativa (fr)


É o quociente entre a frequência (f i) da classe e o número total de
observações.

Sendo:

fr: frequência relativa da classe;

f i: frequência simples da classe;

n: número total de observações (pode-se usar n ou ).

Neste caso, deve-se calcular a frequência com quatro


casas decimais visando ao próximo passo.

Tabela 2.7 – Volume de vendas

Fonte: Elaboração do autor (2006).

Unidade 2 59

probabilidade_e_estatistica_1582.indb 59 19/07/12 11:11


Universidade do Sul de Santa Catarina

Lembre-se: use sempre quatro casas decimais para


arredondar a frequência relativa.

Frequência percentual (fp)


É a frequência relativa multiplicada por 100. É dada em
porcentagem (%).

fp = fr . 100

Sendo:

fp: frequência percentual;

fr: frequência relativa.

Tabela 2.8 – Volume de vendas

Fonte: Elaboração do autor (2006).

60

probabilidade_e_estatistica_1582.indb 60 19/07/12 11:11


Probabilidade e Estatística

Observe que, ao usar quatro casas decimais para a frequência


relativa, o percentual ficou com duas casas decimais.

Para que serve a frequência percentual?

Mais uma vez você está apresentando um relatório de vendas da


empresa para a diretoria.

E vem aquela pergunta: “O que representa, do total, os


representantes que venderam de 32,70 a 35,50 mil reais?” Você
poderia responder diretamente, sem cálculos: “17,86%.”

E, se perguntarem: “Quantos representantes venderam de 24,3 a


27,1 mil reais ou mais?” Você responderá: “8,93%.”

Observe que, neste exemplo, o volume de vendas questionado é


sempre um intervalo. Antes de acompanhar os outros tipos de
frequência, entenda o que é ponto médio de uma classe.

Ponto médio de uma classe são os valores da variável


que se encontram exatamente na metade do intervalo
de cada classe.

Para calcular o ponto médio, usa-se a média aritmética simples


dos limites de cada intervalo:

Sendo:

PM: ponto médio;

Ls: limite superior do intervalo;

Li: limite inferior de cada intervalo.

Unidade 2 61

probabilidade_e_estatistica_1582.indb 61 19/07/12 11:11


Universidade do Sul de Santa Catarina

A tabela a seguir indica o cálculo do ponto médio para o exemplo


que estamos estudando.

Tabela 2.9 – Volume de vendas

Fonte: Elaboração do autor (2006).

Lembre-se deste conceito: o ponto médio será usado


para outros cálculos que você irá realizar mais adiante.

Seção 3 – Representação gráfica


O gráfico constitui outra maneira de se apresentarem os dados
estatísticos. Eles têm a finalidade de mostrar com clareza,
veracidade e rapidez os dados que estão sendo estudados. Além
disso, os gráficos propiciam uma noção muito boa de como
algum fenômeno se comporta.

Por meio de formas geométricas, os gráficos mostram, por área


ou volume, as diferenças entre as opções de cada variável.

62

probabilidade_e_estatistica_1582.indb 62 19/07/12 11:11


Probabilidade e Estatística

Tome cuidado ao interpretar um gráfico. Assim


como os gráficos podem dar informações rápidas e
precisas, sua manipulação pode distorcer a realidade,
provocando tendenciosidade nas informações.

Observe os gráficos a seguir:

Gráfico 2.1 – Censo demográfico Brasil 1890 – 2000


Fonte: IBGE (2010).

Gráfico 2.2 – Censo demográfico Brasil 1890 – 2000


Fonte: IBGE (2010).

Unidade 2 63

probabilidade_e_estatistica_1582.indb 63 19/07/12 11:11


Universidade do Sul de Santa Catarina

Observe que, no Gráfico 2.1, a impressão é que a população


aumenta abruptamente, enquanto que, no Gráfico 2.2, a
impressão é que a população aumenta lentamente. E a única
diferença entre os dois gráficos é a largura que se usou para cada
um deles. Em alguns casos, isso pode ser muito prejudicial.

Os gráficos comunicam as mesmas ideias das tabelas, porém


produzem uma impressão e compreensão mais rápida, mais viva,
pois eliminam detalhes desnecessários, visualizando somente as
características mais importantes dos dados.

O gráfico estatístico é uma forma de apresentação dos


dados estatísticos, cujo objetivo é o de produzir, no
investigador ou no público em geral, uma impressão
mais rápida e viva do fenômeno em estudo, já que os
gráficos falam mais rápido à compreensão que as séries.

A representação gráfica de um fenômeno deve obedecer a certos


requisitos fundamentais para ser realmente útil:

a) simplicidade: o gráfico deve ser destituído de detalhes


de importância secundária, assim como de traços
desnecessários que possam levar o observador a uma
análise morosa ou com erros;

b) clareza: o gráfico deve possibilitar uma correta


interpretação dos valores representativos do fenômeno
em estudo;

c) veracidade: o gráfico deve expressar a verdade sobre o


fenômeno em estudo.

Para a construção de gráficos, você deverá observar alguns itens


que se fazem necessários neles:

„„ todo gráfico deve ter título e fonte (no rodapé), para que
o leitor não tenha a necessidade de voltar ao texto para
saber do que se trata;

„„ a escala do eixo horizontal deve ser escrita abaixo desse


eixo e deverá crescer da esquerda para a direita;

64

probabilidade_e_estatistica_1582.indb 64 19/07/12 11:11


Probabilidade e Estatística

„„ a escala do eixo vertical deve ser escrita à esquerda do


eixo e crescer de baixo para cima;

„„ cada eixo deve ser identificado com o que está sendo


medido ou representado;

„„ não é necessário colocar linhas de grade (que saem das


marcas das escalas horizontais e verticais). Estas são
opcionais.

Acompanhe, a seguir, um gráfico com todos os detalhes citados.

Gráfico 2.3 – Censo demográfico – Brasil – 1890 – 2000


Fonte: Adaptado de IBGE (2010).

Antigamente, os gráficos eram feitos a mão, com a ajuda de


régua, compasso, transferidor, esquadros e canetas ou giz
coloridos. Hoje, podemos contar com softwares específicos que
auxiliam e facilitam na construção de gráficos e, muitas vezes,
propiciam mais precisão e clareza. Além dos softwares específicos
de Estatística, temos os programas aplicativos de escritório, que
incluem as chamadas planilhas eletrônicas.

Uma planilha eletrônica utiliza tabelas para a realização de


cálculos e permite, também, a criação de vários tipos de gráficos,
o que facilita a representação e análise de dados estatísticos.

Os principais tipos de gráficos são os diagramas, os cartogramas


e os pictogramas.

Unidade 2 65

probabilidade_e_estatistica_1582.indb 65 19/07/12 11:11


Universidade do Sul de Santa Catarina

Na sequência deste estudo, você conhecerá alguns tipos de gráficos


relevantes para a apresentação dos dados estatísticos. Vamos identificar
cada tipo de gráfico, suas características e formas de análise, quando
for o caso. Dentre os gráficos classificados como diagramas, os mais
amplamente utilizados (e destacados a seguir) são os gráficos de
colunas e de barras. Os outros tipos de gráficos classificados como os
cartogramas e os pictogramas serão apresentados ao final desta seção.

Diagramas
Os diagramas são gráficos geométricos de, no máximo, duas
dimensões; para sua construção, em geral, fazemos uso do
sistema cartesiano (eixo X e Y). Os principais diagramas são os
gráficos de linhas, colunas, barras, setores ou pizza e o gráfico
polar. Veja cada um desses tipos.

Gráfico de colunas
É usado para apresentar séries temporais, geográficas e
específicas. Formado por retângulos dispostos verticalmente, de
mesma largura (arbitrária), com altura proporcional às grandezas
(variáveis) do fenômeno a ser representado.

Todos os retângulos têm base comum no eixo de x e, no eixo de


y, os valores das variáveis estudadas. Observe os exemplos na
tabela 2.10 e nos gráficos 2.4 e 2.5.

Tabela 2.10 – Mortalidade Infantil, na região Sul e Sudeste, 2004

Estado Por mil nascimentos


SC 17,2
RG 14,3
PR 20,0
SP 16,5
RJ 20,9
ES 20,1
MG 21,8

Fonte: Portal Brasil (2004).

66

probabilidade_e_estatistica_1582.indb 66 19/07/12 11:11


Probabilidade e Estatística

Gráfico 2.4 – Mortalidade Infantil, na região Sul e Sudeste, 2004


Fonte: Portal Brasil (2004).

Gráfico 2.5 – Porcentagem de mulheres, com filhos antes dos 20 anos, 2000
Fonte: Population Reference Bureau (2000).

Unidade 2 67

probabilidade_e_estatistica_1582.indb 67 19/07/12 11:11


Universidade do Sul de Santa Catarina

Gráfico de barras
Segue as mesmas normas do gráfico de coluna, porém os
retângulos ocupam posição horizontal e, por isso, terão
base comum no eixo y. É também mais indicado para séries
geográficas e específicas.

Gráfico de linhas
É comum, para quem trabalha na área de administração e
negócios, observar o comportamento de uma variável ao longo do
tempo. Por exemplo, um executivo que acompanha a cotação diária
das ações da sua empresa, um gerente que acompanha o volume
semanal de vendas de sua loja ou um engenheiro de produção que
acompanha características de qualidade do produto que fabrica.

Gráfico de setores ou de pizza


É usado para mostrar a importância relativa das proporções e é
construído a partir das coordenadas polares:

„„ comparar a parte com o todo;

„„ é formado por um círculo, do qual cada parte representa


um percentual da variável.

Neste caso, utilizamos o mesmo exemplo do gráfico de barras, de


modo que você possa analisar as proporções no gráfico de setores.

Gráficos em colunas ou em barras múltiplas


Este tipo de gráfico é geralmente empregado quando queremos
representar, simultaneamente, dois ou mais fenômenos estudados
com o propósito de comparação.

68

probabilidade_e_estatistica_1582.indb 68 19/07/12 11:11


Probabilidade e Estatística

Tabela 2.11 – Balança Comercial brasileira (Valores em US$ Milhões), 2005 a 2009

Ano Exportação Importação


2005 118.309 73.545
2006 137.807 91.350
2007 160.649 120.610
2008 197.953 173.148
2009 152.252 127.637

Fonte: Base de dados do Portal Brasil (2010).

Gráfico 2.6 – Balança comercial brasileira (Valores em US$ milhões), 2005 a 2009
Fonte: Portal Brasil (2010).

Análise dos dados: observando o gráfico, podemos


concluir que o saldo da balança comercial brasileira
é positivo, pois as colunas em cinza claro, que
representam as exportações em todos os anos, são
maiores que as colunas de cor cinza escuro que
representam as importações.

O ano que representou um maior volume de exportação e


também de importação foi o de 2008. O menor volume de
importação foi no ano de 2005.

Unidade 2 69

probabilidade_e_estatistica_1582.indb 69 19/07/12 11:11


Universidade do Sul de Santa Catarina

Gráfico Polar
É o gráfico mais indicado quando temos necessidade de
representar variações cíclicas, ou seja, que se repetem em períodos
predeterminados.

O gráfico polar é mais utilizado em estudos climáticos (para


séries temporais).

Cartograma
O cartograma é a representação sobre um mapa. Este gráfico é
empregado quando o objetivo é o de figurar os dados estatísticos
diretamente relacionados com áreas geográficas ou políticas.

Pictogramas
Pictogramas são construídos a partir de figuras ou conjunto de
figuras representativas da intensidade ou das modalidades do
fenômeno.

São mais utilizados em jornais, revistas, cartazes e propagandas,


ou seja, quando se deseja dar um efeito mais atrativo ou chamar a
atenção, sem nenhum rigor científico.

Representação gráfica de uma distribuição


Alguns gráficos em Estatística são usados para interpretações
de informações, análises de dados e, também, para a dedução
geométrica de fórmulas de algumas medidas importantes.

Para as distribuições de frequências simples, são utilizados o


histograma e o polígono de frequências. E, para as frequências
acumuladas, é utilizado o polígono de frequências acumuladas.

70

probabilidade_e_estatistica_1582.indb 70 19/07/12 11:11


Probabilidade e Estatística

Histograma
Este gráfico é muito semelhante ao de colunas, ou seja, é formado
por um conjunto de retângulos justapostos, de maneira que a
altura de cada retângulo seja proporcional à frequência simples da
classe por ele representada.

É construído no sistema de eixos cartesianos. No eixo horizontal,


são marcados os valores ou intervalos das classes assumidos pela
variável. No eixo vertical, são marcadas as frequências simples,
que servirão para marcar a altura dos retângulos, indicando,
assim, o número de observações (ocorrências) de cada valor ou
classe da variável.

Como a altura de cada retângulo é proporcional à frequência


simples, a área de cada retângulo também o é. Considerando
isso, a soma das áreas dos retângulos também é proporcional à
frequência total.

Como construir um histograma?

Siga os seguintes passos:

„„ desenhe os eixos vertical e horizontal;

„„ faça as escalas em cada um dos eixos – no horizontal, os


intervalos de classe; e, no vertical, a frequência;

„„ desenhe os retângulos que representam cada intervalo


com a mesma largura de cada intervalo e com a altura
proporcional às frequências dos intervalos;

„„ não se esqueça de escrever o título e a fonte.

Unidade 2 71

probabilidade_e_estatistica_1582.indb 71 19/07/12 11:11


Universidade do Sul de Santa Catarina

Observe o exemplo na tabela 2.12 e no gráfico 2.7.

Tabela 2.12 – Quantidade de óxido de enxofre

Quantidade de óxido de enxofre Nº de meses (fi)

6,2 |--- 9,9 6

9,9 |--- 13,6 10

13,6 |--- 17,3 11

17,3 |--- 21,0 20

21,0 |--- 24,7 13

24,7 |--- 28,4 7

28,4 |--- 32,1 3

Total 70

Fonte: Elaboração do autor (2006).

Gráfico 2.7 – Emissão de óxido de enxofre nos últimos 70 meses (em toneladas)
Fonte: Elaboração do autor (2006).

Há uma analogia dos histogramas com os gráficos de barras.


Mas, nos gráficos de barras, não há necessidade de se usar escala
horizontal contínua, além de não ser necessária a rigidez de
construção que têm os histogramas.

72

probabilidade_e_estatistica_1582.indb 72 19/07/12 11:11


Probabilidade e Estatística

Polígono de frequências
Unindo por linhas retas os pontos médios das bases superiores
dos retângulos do histograma, obtém-se outra representação dos
dados, denominada polígono de frequências.

Você pode observar que a área do histograma é igual à área


abaixo do polígono de frequências, ou seja, os retângulos
que ficam fora são compensados pelos triângulos que estão
adicionados por dentro.

Gráfico 2.8 – Emissão de óxido de enxofre – em toneladas


Fonte: Elaboração do autor (2006).

Unidade 2 73

probabilidade_e_estatistica_1582.indb 73 19/07/12 11:11


Universidade do Sul de Santa Catarina

Síntese

Nesta unidade, você estudou como organizar e agrupar dados,


como construir tabelas com todos seus elementos e, também,
como acrescentar informações às tabelas que auxiliem sua
leitura. Aprendeu a montar tabelas com dados quantitativos, e
sempre que precisar trabalhar com esses dados, você vai recorrer
às tabelas de frequências. Este conhecimento será bastante útil
quando for preciso apresentar algum relatório, e as pessoas para
quem o apresenta levantarem alguns questionamentos.

Ter conhecimento de como interpretar uma tabela permite que


você tenha acesso rápido às respostas com a devida precisão.

Nessa unidade, você estudou, também, como os gráficos


facilitam a nossa vida. Com eles, temos acesso rápido e claro às
informações, sem necessidade de grandes cálculos.

Mas um alerta importante que não pode ser esquecido é que


apenas a qualidade e a clareza do gráfico dão condição para um
bom trabalho, afastando toda possibilidade de tendenciosidade.

Nesta unidade, você pôde estudar diferentes tipos de diagramas


e conhecer o que são os pictogramas e os gráficos representativos
de distribuição de frequências. Com tudo isso, agora você já tem
condições de realizar algumas análises rápidas de diversos tipos
de gráficos.

74

probabilidade_e_estatistica_1582.indb 74 19/07/12 11:11


Probabilidade e Estatística

Atividades de autoavaliação

Ao final de cada unidade, você realizará atividades de autoavaliação. O


gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.

1) Um relatório recente distinguiu em seis tipos os principais motivos de


tensão (estresse). A pesquisa realizada para provar isso resultou nos
dados a seguir (dados fictícios):
MP MC DO DG MF
DM MF MP DG MC
MC MF MF MC MC
MF MC MP DO MP
MP MP DM MP DO
MP DM DG DM MC
MF MF MF MF MF
DO MP DG MP DG
MF MC MF MP DO
DO DO DM MF MC
MF DM MC MC DG
DO MF DG MF MC
Legenda: tipos de fobias
MF: Morte de um filho;
MC: Morte do cônjuge;
MP: Morte dos pais ou irmãos;
DO: Divórcio;
DG: Doença grave;
DM: Demissão.
Monte a tabela não esquecendo de todos seus componentes.

Unidade 2 75

probabilidade_e_estatistica_1582.indb 75 19/07/12 11:11


Universidade do Sul de Santa Catarina

2) Uma empresa procurou estudar a ocorrência de acidentes com seus


empregados, tendo, para isso, realizado levantamento abrangendo um
período de 36 meses. No levantamento, foi observado o número de
operários acidentados para cada mês. Os dados correspondentes são:

4 8 6 6 4 5
6 5 8 5 6 5
8 5 7 6 8 7
3 3 4 4 3 3
5 5 4 6 5 5
7 7 6 8 8 7

Levando em consideração os dados apresentados, monte a tabela


com as variáveis quantitativa discreta. Procure incluir todos os seus
componentes.

3) Os dados a seguir representam a renda de uma amostra de famílias de


um bairro de classe baixa de Florianópolis, em reais (dados fictícios).
Construa a tabela de distribuição de frequências sem esquecer de
nenhum de seus elementos. Usar k = 6 (número de intervalos).
Sugestão: ao calcular o h (tamanho de cada intervalo), arredonde para
um número inteiro. Exemplo: 3,84 4
115 121 117 124 122 116
123 118 123 119 123 126
128 122 112 125 124 126
125 121 129 127 128 129
113 115 116 124 119 118
126 129 116 127 123 121

76

probabilidade_e_estatistica_1582.indb 76 19/07/12 11:11


Probabilidade e Estatística

4) Os dados abaixo representam a renda de uma amostra de famílias de


um bairro de classe baixa de Florianópolis, em reais (dados fictícios).

Renda de famílias de um bairro da classe baixa de Florianópolis

Renda (R$) Nº de famílias f­iacd fiacid fr fp (%) PM


“abaixo de” “acima de”
112 |--- 115 2
115 |--- 118 6
118 |--- 121 4
121 |--- 124 9
124 |--- 127 8
127 |--- 130 7
Total (Σfi) 36

FONTE: Elaboração do autor (2006).

Complete a tabela com as frequências acumuladas direta e indireta, a


frequência relativa, percentual e o ponto médio. Depois responda as
perguntas:

a) Quantas famílias apresentam renda menor que 124?


______ (use a coluna da fiacd “abaixo de”)
b) Quantas famílias apresentam renda menor que 127?
______ (use a coluna da fiacd “abaixo de”)
c) Quantas famílias apresentam renda maior ou igual a 124?
______ (use a coluna da fiacd “acima de”)
d) Quantas famílias apresentam renda maior ou igual a 127? ______
(use a coluna da fiacd “acima de”)
e) Qual foi o percentual de famílias com renda de 118 a 121 pontos?
______ (use a coluna da fp)
f) Qual foi o percentual de famílias com renda de 121 a 124 pontos?
______ (use a coluna da fp)

Unidade 2 77

probabilidade_e_estatistica_1582.indb 77 19/07/12 11:11


Universidade do Sul de Santa Catarina

5) Uma empresa procurou estudar a ocorrência de acidentes com seus


empregados, tendo, para isso, a CIPA realizado um levantamento
abrangendo um período de 36 meses, em que foi observado o número de
operários acidentados para cada mês. A tabela abaixo resume estes dados:

Número de operários acidentados para cada mês

Número de Número de fiacd fiaci fr fp (%)


acidentados meses “abaixo de” “acima de”
3 4
4 5
5 9
6 7
7 5
8 6
Total (Σfi) 36

Fonte: Elaboração do autor (2006).

Complete a tabela com as frequências acumulada direta e indireta, a


frequência relativa e a percentual. Depois responda as perguntas:

a) Em quantos meses a empresa teve um número de funcionários


acidentados menor que 6?
______ (use a coluna da fiacd “abaixo de”)
(observação: menor que 6 = 5, 4 e 3)

b) Em quantos meses a empresa teve um número de funcionários


acidentados menor ou igual a 6?
______ (use a coluna da fiacd “abaixo de”)
(observação: menor ou igual a 6 = 6, 5, 4 e 3)

c) Em quantos meses a empresa teve um número de funcionários


acidentados maior que 5?
______ (use a coluna da fiaci “acima de”)
(observação: maior que 5 = 6, 7 e 8)

d) Em quantos meses a empresa teve um número de funcionários


acidentados maior ou igual a 5?
______ (use a coluna da fiaci “acima de”)
(observação: maior ou igual a 5 = 5, 6, 7 e 8)

e) Qual foi o percentual de meses em que a empresa verificou 5


funcionários acidentados?
______ (use a coluna da fp)
f) Qual foi o percentual de meses em que a empresa verificou 7
funcionários acidentados?
______ (use a coluna da fp)

78

probabilidade_e_estatistica_1582.indb 78 19/07/12 11:11


Probabilidade e Estatística

6) Procure, em jornais, revistas, cartazes, internet etc., três tipos de gráficos


diferentes, semelhantes aos que você estudou até agora, e os analise.
Não esqueça de procurar gráficos cujo tema seja relacionado ao seu
curso. Faça uma descrição sucinta de cada um deles e trace comentários
sobre tendências, maior proporção, maior alta, maior baixa etc.

7) A seguir, você tem uma distribuição de frequências e um sistema de


eixos. Construa o histograma e o polígono de frequências para essa
distribuição usando o sistema de eixos (não esqueça de todos os
componentes de um gráfico, inclusive as escalas dos eixos, título e
fonte): tempo de sono, em minutos, induzido em ratos por injeção de
um certo químico, na dosagem de 40 mg por quilo.

Tempo de sono (em min.) Número de ratos


7 |--- 12 2
12 |--- 17 6
17 |--- 22 17
22 |--- 27 9
27|--- 32 5
32 |--- 37 2

Unidade 2 79

probabilidade_e_estatistica_1582.indb 79 19/07/12 11:11


Universidade do Sul de Santa Catarina

Saiba mais

Você quer aprofundar seus estudos sobre o conteúdo desta


unidade? A sugestão é que você pesquise em:

COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.


ed. São Paulo: Harbra, 1998.

CRESPO, Antônio Arnot. Estatística fácil. 19. ed. São Paulo:


Saraiva, 2009.

FLEMMING, Diva Marília. Representações gráficas. São


José: Saint Germain, 2003.

LEVIN, Jack. Estatística aplicada às ciências humanas. São


Paulo: Habra, 1987.

NEUFELD, John L. Estatística aplicada à administração


usando excel. São Paulo: Prentice Hall, 2003.

SILVA, Ermes Medeiros da. Estatística para os cursos de


economia, administração e ciências contábeis. 3. ed. São Paulo:
Atlas, 1999. v. 1.

TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro.


Estatística básica. 2. ed. São Paulo: Atlas, 1985.

TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro:


LTC, 1999.

VIEIRA, Sonia. Princípios de estatística. São Paulo: Pioneira,


2003.

80

probabilidade_e_estatistica_1582.indb 80 19/07/12 11:11


3
UNIDADE 3

Medidas de posição e dispersão

Objetivos de aprendizagem
„„ Conhecer os tipos de medidas de posição.

„„ Calcular e interpretar a média, a moda e a mediana


para dados brutos e agrupados.
„„ Compreender e calcular separatrizes.

„„ Compreender os tipos de medidas de dispersão.

„„ Calcular e interpretar variância e desvio padrão para


dados brutos e agrupados.

Seções de estudo
Seção 1 Medidas de posição

Seção 2 Gráficos box-plot e ramo e folhas

Seção 3 Medidas de dispersão

Seção 4 Coeficiente de variação

probabilidade_e_estatistica_1582.indb 81 19/07/12 11:11


Universidade do Sul de Santa Catarina

Para início de estudo


Nessa unidade, você vai obter mais uma ferramenta para
auxiliá-lo a compreender e utilizar a Estatística no seu dia a dia
profissional. O objetivo aqui é estudar medidas importantes e
bastante utilizadas nos métodos estatísticos.

O cálculo de medidas como a média, a moda e a mediana, e os


conceitos apresentados nesta unidade, são de grande valia no
seu cotidiano profissional, pois lhe fornecerão dados que serão
pertinentes para o entendimento de algum fato ou acontecimento.
Chamamos essas medidas de medidas de posição.

Mas conhecer as interpretações destas medidas não basta por si só.


Através delas, podemos chegar a algumas conclusões, mas não são
suficientes para que possamos avaliar o comportamento dos dados.

Por isso, nesta unidade, você vai estudar, também, medidas que
irão auxiliá-lo na avaliação do comportamento das séries de
dados com relação a sua média. Chamamos essas medidas de
medidas de dispersão.

Está preparado(a)? Então inicie agora a leitura da seção a seguir!

Seção 1 – Medidas de posição


Muitas vezes você irá se deparar com uma massa de dados grande
o bastante para que a leitura e a análise se tornem muito difíceis.
E como fazer para tirar informações relevantes e resumir os
dados de forma eficaz nesses casos? Usando medidas estatísticas!
Nesta unidade, vamos ver algumas delas.

As medidas de posição, assim chamadas pela posição que


elas ocupam na série estatística, quando bem utilizadas e
interpretadas, podem ser úteis, não só por elas mesmas, mas
também, auxiliando o cálculo de outras medidas.

82

probabilidade_e_estatistica_1582.indb 82 19/07/12 11:11


Probabilidade e Estatística

Além de tudo, ela facilita o estudo de grandes volumes de dados,


pois as medidas de posição podem resumir as informações, dando
a você uma noção do comportamento do todo. As medidas de
posição estão divididas da seguinte maneira:

a) medidas de tendência central: são valores da variável


que tendem a estar no centro da série, por isso o nome.
Refere-se ao valor da variável que está, senão no centro,
perto dele. Está dividia em três tipos: média, mediana e
moda.

b) separatrizes: são valores da variável que dividem a


série ordenada de dados em partes que contém a mesma
quantidade de observações.

Medidas de Tendência Central – Média


A média é uma das medidas mais importantes dentro da
Estatística. Ela é o ponto de equilíbrio de uma série de dados.
Veja a figura a seguir, extraída do livro Introdução à Estatística,
de Mário F. Triola (1999).

Figura 3.1 – A média como ponto de equilíbrio


Fonte: Triola (1999, p. 32).

Vários tipos de médias podem ser calculados para uma massa


de dados. A mais importante é a média aritmética, que você irá
estudar nessa seção.

Unidade 3 83

probabilidade_e_estatistica_1582.indb 83 19/07/12 11:11


Universidade do Sul de Santa Catarina

A média aritmética é a soma de todos os elementos de uma série


de dados, dividida pelo número de elementos que compõe essa
série. Veja a seguir como representá-la.

Notação:

= média dos dados de uma amostra.

μ = média dos dados de uma população (em que μ = 12° letra do


alfabeto grego, “μ” lê-se como “mi”).

A média aritmética para dados brutos


Agora, você vai calcular a média para dados que não foram
organizados em tabelas, ou seja, estão conforme foram coletados,
brutos.

A soma de todos os valores, dividida pelo número de valores.

Em que:
n = número de valores da série (ou tamanho da amostra).
x i = valores da série.

Veja a seguir um exemplo bem detalhado para compreender


como realizar os cálculos.

Um exemplo bem típico é calcular a média das notas das provas.


Digamos que as notas de uma disciplina cursada por você sejam:
7; 7,8; 6 e 8, então a média será:

84

probabilidade_e_estatistica_1582.indb 84 19/07/12 11:11


Probabilidade e Estatística

A média aritmética para dados agrupados


Agora, você vai calcular a média para dados que foram
organizados em tabelas, ou seja, após a coleta, eles foram
organizados em categorias e escritos em uma tabela.

Dados agrupados sem intervalos (variável discreta)

Para os dados agrupados (em tabela), sem intervalos, utiliza-se a


fórmula descrita a seguir, em que cada frequência simples pode
ser considerada como peso. Por isso que se chama, também, de
média aritmética ponderada (pesos).

A soma de todos os valores multiplicados por sua frequência


simples, dividida pela soma das frequências (frequência total).

Em que:
n = número de valores da série (ou tamanho da amostra)
x i = valores da série
f i = frequência simples de cada xi

Veja a seguir um exemplo. Calcule a média dos dados


representados na tabela a seguir:

Tabela 3.1 – Número de filhos por famílias de um bairro de Florianópolis

No de filhos No de famílias xi.fi


(xi) (fi)
0 14 0 0×14 = 0
1 16 16
2 11 22 1×16 = 16
3 9 27
2×11 = 22
4 4 16
5 1 5 3×9 = 27
6 1 6
Total (Σfi) 56 92 Σxi.fi = 92

Somar as frequências simples


Fonte: Elaboração do autor (2006).

Unidade 3 85

probabilidade_e_estatistica_1582.indb 85 19/07/12 11:11


Universidade do Sul de Santa Catarina

Veja a seguir como calcular passo a passo

Passo 1: some a coluna das frequências simples (fi) para obter Σfi
(frequência total).

= 56

Passo 2: multiplique cada xi por sua correspondente fi na coluna xi.fi.

Passo 3: some os valores calculados no passo 2 e escreva a soma no


final da coluna. Esse resultado é o Σxi.fi.

xi.f i = 92

Passo 4: divida o resultado do passo 3 (Σxi.fi) pelo resultado do


passo 1 (Σfi).

Como interpretar estes dados? O valor médio da série é 1,64,


ou seja, a média de filhos por família é de 1,64 filhos. Analisando
dessa maneira, pode parecer um absurdo, mas você pode concluir
que a média de filhos por família é de 1 a 2 filhos.

Dados agrupados com intervalos (variável contínua)

Para os dados agrupados em tabela, com intervalos, você deve


utilizar a fórmula descrita a seguir, semelhante àquela utilizada
para dados sem intervalos, entretanto, por estarmos usando
intervalos, usamos os pontos médios e não x i.

A soma de todos os pontos médios multiplicados por sua


frequência simples, dividida pela soma das frequências
(frequência total).

86

probabilidade_e_estatistica_1582.indb 86 19/07/12 11:11


Probabilidade e Estatística

Em que:
n = número de valores da série (ou tamanho da amostra)
PM = ponto médio do intervalo
f i = frequência simples de cada intervalo

Quando trabalhamos com dados agrupados em intervalos,


passamos a trabalhar com a perda dos valores individuais, ou
seja, sabemos a frequência de cada intervalo, mas não sabemos
exatamente quais são os valores contidos nele (intervalo). Por
esse motivo, o cálculo da média, nesse caso, é feito com o uso do
ponto médio. A média, sendo assim, é um valor aproximado.

Veja o exemplo a seguir para compreender.

Veja a seguir como calcular passo a passo

Passo 1: some a coluna das frequências simples (fi) para obter Σfi
(frequência total).

= 56

Passo 2: calcule o ponto médio de cada intervalo. Você lembra?

Passo 3: multiplique cada PM por sua correspondente fi e escrever na


coluna PM.fi.

Unidade 3 87

probabilidade_e_estatistica_1582.indb 87 19/07/12 11:11


Universidade do Sul de Santa Catarina

Passo 4: some os valores calculados no passo 3 e escreva a soma no


final da coluna; esse resultado é o ΣPM.fi.

ΣPMi.f i = 1386

Passo 5: divida o resultado do passo 4 (ΣPM.fi) pelo resultado do


passo 1 (Σfi).

Como interpretar o resultado? A quantidade média de óxido de


enxofre emitida, em 56 meses, foi de 24,75 toneladas.

Calcule a média dos dados representados como na tabela a seguir:

Tabela 3.2 – Quantidade emitida de óxido de enxofre (SO), em toneladas, pelas fábricas
do distrito industrial de Florianópolis
(15,9 + 18,7)
⁄2 = 17,3
Qtde. de SO Nº de meses PM PM.fi
(em ton.) (fi)
15,9 |--- 18,7 12 17,3 207,6 17,3×12 = 207,6
18,7 |--- 21,5 8 20,1 160,8
21,5 |--- 24,3 12 22,9 274,8 20,1×8 = 160,8
24,3 |--- 27,1 5 25,7 128,5 22,9×12 = 274,8
27,1 |--- 29,9 3 28,5 85,5
29,9 |--- 32,7 6 31,3 187,8 25,7×5 = 128,5
32,7 |--- 35,5 10 34,1 341
Total (Σfi) 56 1386 Σxi.fi = 92

Somar as
Fonte: Elaboração do autor (2006). frequências simples

88

probabilidade_e_estatistica_1582.indb 88 19/07/12 11:11


Probabilidade e Estatística

Medidas de Tendência Central – Mediana


A mediana é um valor que divide a série de dados em duas partes
iguais, ou seja, é o valor observado que está no meio da série.

Notação:

Me = Mediana (também é usado md).

Mediana para dados brutos


Agora, você vai calcular a mediana para dados que não foram
organizados em tabelas, ou seja, estão conforme foram coletados,
brutos. Após a ordenação crescente dos dados, determinamos o
número de elementos (n) do mesmo.

Separamos em dois casos:

a) quando o n (tamanho da amostra) é ímpar: o cálculo da


posição da mediana deve ser conforme segue:

b) quando o n (tamanho da amostra) é par: o cálculo da


posição da mediana deve ser realizado com a seguinte
fórmula:

Unidade 3 89

probabilidade_e_estatistica_1582.indb 89 19/07/12 11:11


Universidade do Sul de Santa Catarina

Veja passo a passo como calcular a mediana para dados brutos quando
o (n) é ímpar
Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20, 31.

Passo 1: ordene os valores de forma crescente → 5, 9, 15, 19, 20, 24,


27, 30, 31.

Passo 2: o número de elementos é 9 (n = 9, ímpar).

Passo 3: calcule a posição da mediana.

Passo 4: a mediana é o 5º elemento.

Me = 20

1º 2º 3º 4º 5º 6º 7º 8º 9º
5 9 15 19 20 24 27 30 31

Como interpretar estes dados? 50% dos valores da série são


menores ou iguais a 20, e 50% dos valores da série são maiores ou
iguais a 20.

90

probabilidade_e_estatistica_1582.indb 90 19/07/12 11:11


Probabilidade e Estatística

Veja passo a passo como calcular a mediana para dados brutos quando
o (n) é par
Para você encontrar a mediana, é preciso calcular o ponto médio
dos dois valores que ocupam as posições calculadas.

Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20.

Passo 1: ordene de forma crescente 5, 9, 15, 19, 20, 24, 27, 30.

Passo 2: o número de elementos é 8 (n = 8, par).

Passo 3: calcule a posição de Pos1 e Pos2.

Passo 4: a mediana está entre o 4º e o 5º elemento.

1º 2º 3º 4º 5º 6º 7º 8º
5 9 15 19 19,5 20 24 27 30

Como interpretar estes dados? 50% dos valores da série


são menores que 19,5, e 50% dos valores da série são valores
maiores que 19,5.

Você viu como se encontra a mediana para dados brutos?


Assim como você estudou na média, aqui, também para efeito
de cálculo, você usará diferente tratamento quando se tratar
de dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua).

Unidade 3 91

probabilidade_e_estatistica_1582.indb 91 19/07/12 11:11


Universidade do Sul de Santa Catarina

Medidas de posição usando o Excel


Mais uma vez, você poderá se deparar com um volume grande
de dados. O Microsoft Office Excel é muito útil para este tipo
de situação. Siga o pequeno roteiro para calcular as medidas de
tendência central no Excel:

Passo 1: Abrir o arquivo que está na midiateca de nome dados.xls,


usando o Excel;

Passo 2: Clique com o botão esquerdo do mouse no menu


“Ferramentas” e, se o item “Análise de dados” não estiver ativo no
menu, clique em “Suplementos”, conforme a imagem a seguir; caso
contrário, passe para o passo 4.

Figura 3.2 – Interface do programa Microsoft Office Excel 2003


Fonte: Adaptado pelo autor (2006).

Passo 3: Caso tenha clicado em “Suplementos”, a seguinte janela


abrirá, na qual você deverá marcar as opções “Ferramentas de
análise” e “Ferramentas de análise – VBA”, em seguida, clique em OK.

92

probabilidade_e_estatistica_1582.indb 92 19/07/12 11:11


Probabilidade e Estatística

Figura 3.3 – Interface do programa Microsoft Office Excel 2003


Fonte: Adaptado pelo autor (2006).

Passo 4: Voltando ao menu “Ferramentas”, clique no item “Análise de


dados”, como mostra a Figura a seguir.

Figura 3.4 – Interface do programa Microsoft Office Excel 2003


Fonte: Adaptado pelo autor (2006).

Unidade 3 93

probabilidade_e_estatistica_1582.indb 93 19/07/12 11:11


Universidade do Sul de Santa Catarina

Passo 5: Após o clique, irá abrir a seguinte janela, na qual você irá
selecionar o item “Estatística Descritiva” e clicar em OK.

Figura 3.5 – Interface do programa Microsoft Office Excel 2003


Fonte: Adaptado pelo autor (2006).

Passo 6: Na janela que se abre (mostrada adiante), você deve indicar


os dados a serem analisados, ou seja, no quadro ao lado do item
“Intervalo de entrada” devem aparecer as células que contêm os
dados. Selecione a coluna A (basta clicar com o mouse e arrastar, com
o botão pressionado, até o último quadrinho – célula) e tecle “Enter”.
Marque a opção “Resumo estatístico” e, após este procedimento,
você deve clicar em OK.

Figura 3.6 – Interface do programa Microsoft Office Excel 2003


Fonte: Adaptado pelo autor (2006).
94

probabilidade_e_estatistica_1582.indb 94 19/07/12 11:11


Probabilidade e Estatística

Passo 7: Uma nova planilha é criada com as informações, conforme a


seguinte figura.

Figura 3.7 – Interface do programa Microsoft Office Excel 2003


Fonte: Adaptado pelo autor (2006).

Medidas de Tendência Central – Moda


A moda é um valor que mais se repete em uma série de dados, ou
seja, de maior frequência.

Notação:

Mo = Moda.

Unidade 3 95

probabilidade_e_estatistica_1582.indb 95 19/07/12 11:11


Universidade do Sul de Santa Catarina

Moda para dados brutos


Agora, você vai encontrar a moda para dados que não foram
organizados em tabelas, ou seja, que estão conforme foram
coletados, brutos. A moda será o valor que mais se repete no
conjunto de dados.

Veja os exemplos:

Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.

O elemento que mais se repete é o 22, então, Mo = 22. Observe


que o número 20 se repete, mas não mais que o 22. Para esse
caso, no qual a Mo = 22, afirma-se que a série é unimodal.

Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.

Os elementos que mais se repetem são o 20 e o 22, então,


Mo1 = 20 e Mo2 = 22. Para esse caso, no qual temos duas modas
na série, afirma-se que a série é bimodal. Acima de duas modas,
é mais comum chamarmos a série de polimodal.

Exemplo 3: X: 20, 20, 22, 22, 25, 25, 28, 28.

Na série anterior, não temos um elemento que mais se repete,


pois todos têm a mesma frequência. Nesse caso, afirma-se que a
série é amodal.

Você viu como se encontra a moda para dados brutos. Assim


como você estudou na média, aqui, também para efeito de
cálculo, você usará diferente tratamento quando se tratar de
dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua). Mas, para a
finalidade deste estudo, não será incluído.

Entre média, mediana ou moda: qual utilizar?

96

probabilidade_e_estatistica_1582.indb 96 19/07/12 11:11


Probabilidade e Estatística

Não há uma resposta simples e objetiva para determinar a medida


que seja mais representativa. A seguir, você encontra um resumo
das vantagens e desvantagens de cada medida de tendência central:

Afetada
Existência Leva em pelos Vantagens e
Medida Definição Frequência conta todos valores desvantagens
os valores? extremos?
Usada em toda
Soma de todos os Estatística;
valores divididos funciona bem
Média Mais usada. Existe sempre. Sim. Sim.
pelo número de com muitos
valores. métodos
estatísticos.
Costuma ser
uma boa
Mediana Valor que divide a Usada Existe sempre. Não. Não. escolha se há
série na metade. comumente. alguns valores
extremos.
Pode não
Valor que mais existir ou, Apropriada para
Usada às
Moda se repete (maior ainda, pode Não. Não. dados ao nível
vezes.
frequência). haver mais de nominal.
uma.

Quadro 3.1 – Resumo das vantagens e desvantagens de cada medida de tendência central
Fonte: Elaboração do autor (2006).

Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer
outros aspectos relativos ao conjunto de valores, além de um valor
central ou valor típico. Algumas informações relevantes podem
ser obtidas através do conjunto de medidas: média, extremos,
quartís, decís, percentís etc. Veja, a seguir, mais detalhes e
exemplos de como calcular as separatrizes.

a) Quartís: divide uma série ordenada em quatro partes


iguais, ou seja, em partes de 25% cada.

Representação: Q1, Q2 e Q3.


Denominação: 1º quartil, 2º quartil e 3º quartil.

Unidade 3 97

probabilidade_e_estatistica_1582.indb 97 19/07/12 11:11


Universidade do Sul de Santa Catarina

b) Decís: divide uma série ordenada em 10 partes iguais, ou


seja, em partes de 10% cada.

Representação: D1, D2, .... e D9.


Denominação: 1º decil, 2º decil, ... e 9º decil.

c) Percentil: divide uma série ordenada em 100 partes


iguais, ou seja, em partes de 1% cada.

Representação: P1, P2, .... e P99.


Denominação: 1º percentil, 2º percentil, ... e 99º percentil.

Note que a mediana também é uma separatriz. Você saberia dizer


com quais separatrizes podemos comparar? Veja:

Q2 = D5 = P50 = Me

Todas essas medidas dividem a série de dados pela metade.

»» 50% dos valores são maiores que Q2 = D5 = P50 =


Me; e

»» 50% dos valores são menores que Q2 = D5 = P50 =


Me.

Separatrizes para dados brutos


O procedimento é bastante semelhante ao da mediana. Preste
atenção nas explicações a seguir: após a ordenação crescente dos
dados (rol), determinamos o seu número de elementos (n).

Veja o exemplo passo a passo


Calcular Q1 para a série de dados X: 22, 15, 20, 22, 28, 20, 20,
22, 25, 26, 16.

Passo 1: ordene de forma crescente (rol) 15, 16, 20, 20, 20, 22, 22,
22, 25, 26, 28.

98

probabilidade_e_estatistica_1582.indb 98 19/07/12 11:11


Probabilidade e Estatística

Passo 2: o número de elementos é 11 (n = 11, número ímpar). Aqui,


você deve adotar procedimento semelhante ao da mediana e deve
usar a mesma fórmula para calcular a posição. Lembre-se: a posição!
Assim, você irá encontrar a mediana, ou seja, o segundo quartil (Q2).

Passo 3: Pos = 6, ou seja, Q2 ocupa a 6ª posição.

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28

Observe que o Q2 = 22.

Interpretação para Q2 = 22: 50% dos valores da série são


menores ou iguais que 22, e 50% dos valores da série são maiores
ou iguais que 22. Antes do Q2, está formado um novo conjunto
de dados, mostrado a seguir:

1º 2º 3º 4º 5º
15 16 20 20 20

Neste caso, a mediana (desta nova série de dados) será o primeiro


quartil. É só repetir o mesmo processo feito nos passos 2 e 3.

Passo 4: o número de elementos é 5 (n = 5, ímpar).

Unidade 3 99

probabilidade_e_estatistica_1582.indb 99 19/07/12 11:11


Universidade do Sul de Santa Catarina

Passo 5: Pos = 3, ou seja, Q1 ocupa a 3ª posição.

1º 2º 3º 4º 5º
15 16 20 20 20

Observe que o elemento que ocupa a terceira posição é o 20,


então, Q1 = 20.

Como interpretar estes dados? 25% dos dados observados são


menores ou iguais a 20. 75% dos valores observados são maiores
ou iguais a 20.

Observe que pode ser usado, também, para calcular a posição


do primeiro quartil e do terceiro, respectivamente, as seguintes
fórmulas:

Para o primeiro quartil

Para o terceiro quartil

Veja passo a passo como você pode calcular o terceiro quartil

Passo 1: o número de elementos é 11 (n = 11).

Passo 2: Pos = 9, ou seja, Q3 ocupa a 9ª posição.

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28

100

probabilidade_e_estatistica_1582.indb 100 19/07/12 11:11


Probabilidade e Estatística

Observe que o elemento que ocupa a nona posição é o 25,


então, Q3 = 25.

Percentis
Observação: para calcular a posição dos percentis use a seguinte
fórmula:

Para o primeiro quartil

PPi = posição da separatriz.

N ou n = tamanho da população (ou amostra).

i = número da separatriz (ex.: P60 = i = 60).

Continuando com o mesmo exemplo, calcule o sexagésimo percentil.

Passo 1: o número de elementos é 11 (n = 11) e o i = 60.

Passo 2: PP60 = 7,2, ou seja, P60está entre a 7ª e a 8ª posições.

1º 2º 3º 4º 5º 6º 7º PP60 8º 9º 10º 11º


15 16 20 20 20 22 22 P60 22 25 26 28

Unidade 3 101

probabilidade_e_estatistica_1582.indb 101 19/07/12 11:11


Universidade do Sul de Santa Catarina

Passo 3: o Para calcular o sexagésimo percentil, você deve encontrar


o valor que fica entre os valores que ocupam a 7ª e a 8ª posições.

ƒƒ Valor que ocupa a 7ª posição = 22.

ƒƒ Valor que ocupa a 8ª posição = 22.

Então, P60 = 22.

Como interpretar estes dados? 60% dos dados observados são


menores ou iguais a 22. 40% dos valores observados são maiores
ou iguais a 22.

Decís
Se você notar, poderá comparar os decís com alguns percentis, ou seja:

Decís 1º 2º 3º 4º 5º 6º 7º 8º 9º
Percentis 10º 20º 30º 40º 50º 60º 70º 80º 90º

Isso mesmo, por exemplo, o D1 = P10, o D2 = P20, D3 = P30 e,


assim, sucessivamente. Note, também, que as interpretações são
as mesmas:

ƒƒ para o primeiro decil: 10% dos valores observados são


menores e 90% dos valores observados são maiores;

ƒƒ para o segundo decil: 20% dos valores observados são


menores e 80% dos valores observados são maiores;

ƒƒ para o terceiro decil: 30% dos valores observados são


menores e 70% dos valores observados são maiores etc.

Continuando com o mesmo exemplo, calcule o terceiro decil.


Note que ele é igual ao trigésimo percentil (D3 = P30)! Será a
mesma coisa que calcular P30.

102

probabilidade_e_estatistica_1582.indb 102 19/07/12 11:11


Probabilidade e Estatística

Veja passo a passo

Passo 1: o número de elementos é 11 (n = 11) e o i = 30.

Passo 2: PD3 = PP30 = 3,6, ou seja, D3 está entre a 3ª e a 4ª posições.

1º 2º 3º PD3 4º 5º 6º 7º 8º 9º 10º 11º


15 16 20 D3 20 20 22 22 22 25 26 28

Passo 3: para calcular o terceiro decil, você deve encontrar o valor


que fica entre os valores que ocupam a 3ª e a 4ª posições.

ƒƒ Valor que ocupa a 3ª posição = 20.

ƒƒ Valor que ocupa a 4ª posição = 20.

Então, D3 = 20.

Como interpretar estes dados? 30% dos dados observados são


menores ou iguais a 20. 70% dos valores observados são maiores
ou iguais a 20.

Assim como você estudou na média, aqui, também para efeito


de cálculo, você usará diferente tratamento quando se tratar
de dados agrupados com intervalos (variável discreta) e dados
agrupados sem intervalos (variável contínua). Mas para a
finalidade deste estudo não será incluído.

Unidade 3 103

probabilidade_e_estatistica_1582.indb 103 19/07/12 11:11


Universidade do Sul de Santa Catarina

Seção 2 – Gráficos box-plot e ramo e folhas


O gráfico box plot (gráfico de caixa) é uma ferramenta
exploratória de análise de dados, cujo principal propósito é dar ao
usuário um método eficiente de examinar um conjunto de dados,
para se ter uma primeira idéia da distribuição desses dados.

Por sua vez, podemos usar os gráficos ramo e folhas para


representar as distribuições de frequências e também para
pequenos conjuntos dados além de possibilitar a visualização
completa das observações.

Construção de um gráfico ramo e folhas


Na construção, cada observação é dividida em duas partes, o
ramo e as suas folhas, do mesmo jeito que ocorre numa árvore.

Logo que finalizamos a sua construção, se observarmos os dados


coletados gerados em um ângulo de noventa graus, veremos um
diagrama bem semelhante a um histograma, só que feito com
valores em vez de retângulos.

Esta representação possui duas vantagens em relação ao


histograma:

ƒƒ seus valores são os valores reais;

ƒƒ é simples de construir

104

probabilidade_e_estatistica_1582.indb 104 19/07/12 11:11


Probabilidade e Estatística

Vejamos um exemplo para aclarar essa visualização!

Exemplo de gráfico ramo e folhas


Imaginemos que desejamos visualizar a distribuição dos valores
de tempo de antiguidade – em meses – dos funcionários de uma
determinada empresa. Coletados esses dados, os 20 valores de
tempo de antiguidade (em meses) já ordenados são:

8, 9, 11, 17, 17, 19, 20, 44, 45, 53, 57, 57, 57, 58, 70, 81, 82, 83,
100, 104.

Podemos, para construir nosso gráfico, organizar os dados,


separando-os pelas dezenas: uma em cada linha do gráfico, da
seguinte forma:

8, 9
11, 17, 17, 19
20
44, 45
53, 57, 57, 57, 58
70
81, 82, 83
100, 104

E, assim obtemos uma primeira aproximação do gráfico. Porém,


como muitos valores, em cada linha, tem as dezenas em comum,
podemos colocar as dezenas em evidência, separando-as das
unidades por um traço:

0 89
1 1779
2 0
3 -
4 45
RAMO 5 37778 FOLHAS
6 -
7 0 Legenda:
8 123 5 | 3 = 53 meses
9 - 10| 4 = 104 meses
10 4
Figura 3.8 – Construção de um diagrama de ramo e folhas
Fonte: Elaboração do autor (2011).

Unidade 3 105

probabilidade_e_estatistica_1582.indb 105 19/07/12 11:11


Universidade do Sul de Santa Catarina

Ao dispor os dados dessa maneira, estamos construindo um


diagrama de ramo e folhas. O lado esquerdo, com as dezenas,
é chamado de ramo, no qual estão dependuradas as unidades,
chamadas folhas, à direita da linha vertical.

Para sabermos o que está sendo representado,


um ramo de folhas deve ter sempre uma legenda,
indicando o que significam o ramo e as folhas. Assim,
se o tempo de empresa dos funcionários estivesse
medido em dias, por exemplo, usando esse mesmo
ramo de folhas, poderíamos estabelecer que o ramo
representaria as centenas e as folhas, as dezenas. Assim,
0|8 seria igual a 80 dias e 10|4 seria igual a 104 dias.

Como podemos agora interpretar este gráfico? Analisando


o ramo e folhas para o tempo de empresa dos funcionários,
percebemos a existência de três grupos:

ƒƒ o grupo com os recém-contratados (até 20 meses);

ƒƒ o grupo com os que já tem algum tempo de empresa (de


44 a 58 meses);

ƒƒ o grupo com os mais velhos (mais de 70 meses) com


destaque, aqui, para dois funcionários que já estão na
empresa à mais de oito anos!

O que mais podemos fazer com este mesmo gráfico do exemplo?


O ramo e folhas também pode ser usado para comparar duas
distribuições de valores. Assim, aproveitando o mesmo ramo
do diagrama do tempo de empresa, podemos fazer o diagrama
das mulheres que trabalham nesta empresa, utilizando o lado
esquerdo. Logo após serem coletados os dados, resultou o
seguinte gráfico:

106

probabilidade_e_estatistica_1582.indb 106 19/07/12 11:11


Probabilidade e Estatística

998 0 89
99876610001 1 1779
3111 2 0
5444322 3 -
55 4 45
8651 5 37778
8 6 -
0 7 0
31 8 123
- 9 -
- 10 04
5 11 -
- 12 -
- 13 - Legenda:
- 14 - 5 | 5 | = 55 meses para homem
7 15 - | 5 | 3 = 53 meses para mulher

Figura 3.9 – Gráfico ramo e folhas


Fonte: Elaboração do autor (2011).

Podemos observar que as folhas das mulheres são dependuradas


de modo espelhado, assim como explica a legenda, que agora
deve ser dupla!

Observando a tabela, notamos que as mulheres têm menos tempo de


empresa do que os homens, embora possuam dois funcionários com
mais tempo na empresa. Também podemos observar rapidamente
que a empresa tem mais empregados homens que mulheres.

Construção de um gráfico box-plot


O box-plot é especialmente útil quando trabalhamos com
conjuntos limitados de dados para os quais outras ferramentas,
como histogramas que requerem dados com mais de 30 pontos,
não permitem auxiliar o estudo pois a quantidade de dados pode
ser insuficiente para se obter uma conclusão.

Através da disposição dos valores em ordem crescente, tem-se


uma ideia clara sobre a localização e a dispersão dos dados. Para a
construção do gráfico box–plot, precisamos calcular:

Unidade 3 107

probabilidade_e_estatistica_1582.indb 107 19/07/12 11:11


Universidade do Sul de Santa Catarina

ƒƒ limite inferior;

ƒƒ limite superior;

ƒƒ primeiro quartil;

ƒƒ terceiro quartil;

ƒƒ mediana.

Estas cinco medidas são denominadas de estatística de ordem.

Vejamos as partes componentes de um box-plot:

Figura 3.10 – Componentes de um box-plot


Fonte: Elaboração do autor (2011).

As informações dadas pelo resumo destes cinco números são


apresentadas na forma de um gráfico de caixa que agrega uma
série de informações sobre a distribuição, como:

ƒƒ posição;

ƒƒ dispersão;

ƒƒ assimetria;

ƒƒ caudas;

ƒƒ dados discrepantes (outliers).

108

probabilidade_e_estatistica_1582.indb 108 19/07/12 11:11


Probabilidade e Estatística

Figura 3.11 – Componentes de um box-plot: nomes usuais


Fonte: Elaboração do autor (2011).

Assim, a posição central dos valores é dada pela mediana e a


dispersão, pela amplitude interquartílica; as posições relativas da
mediana e dos quartis e o formato dos bigodes dão uma noção da
simetria e do tamanho das caudas da distribuição.

Algumas propriedades dos box-plot para a sua interpretação


Quando a distribuição dos dados é simétrica, a linha da
mediana estará localizada no centro do retângulo e as duas
linhas que partem das extremidades do retângulo terão quase os
mesmos comprimentos.

Quando a distribuição dos dados é assimétrica à direita, a linha


da mediana estará mais próxima de Q1 do que de Q3; e, por sua
vez, quando a distribuição é assimétrica à esquerda, a linha da
mediana estará mais próxima de Q3 do que de Q1.

Assim, podemos observar os seguintes exemplos de assimetrias


negativas, positivas e dados simétricos, respectivamente, de
esquerda à direita:

Unidade 3 109

probabilidade_e_estatistica_1582.indb 109 19/07/12 11:11


Universidade do Sul de Santa Catarina

Figura 3.12 – Assimetrias


Fonte: Elaboração do autor (2011).

O box plot também pode ser desenhado na posição vertical ou


na horizontal. Pode ser utilizado na comparação de dois ou mais
conjuntos de dados e na comparação com outras ferramentas, por
exemplo, junto com os histogramas.

Dicas para a construção do box-plot


ƒƒ colete os n dados referentes à variável de interesse;

ƒƒ disponha os dados em ordem crescente. Calcule a


mediana, Q1 e Q3;

ƒƒ identifique o valor (min) e o valor (max) da amostra.

ƒƒ trace um eixo e o marque com uma escala adequada e de


fácil leitura;

ƒƒ sobre o eixo, desenhe um retângulo da seguinte forma:

»» posicione a extremidade inferior do retângulo em Q1;

»» posicione a extremidade superior do retângulo em Q3


e, no interior do retângulo, trace a mediana;

»» feche o retângulo para obter o box;

110

probabilidade_e_estatistica_1582.indb 110 19/07/12 11:11


Probabilidade e Estatística

ƒƒ desenhe uma linha a partir da extremidade inferior


do retângulo com distância de até 1,5x(Q3-Q1) para
construir o bigode inferior;

ƒƒ desenhe uma linha a partir da extremidade superior


do retângulo com uma distância de 1,5x(Q3-Q1) para
construir o bigode superior;

ƒƒ desenhe asteriscos para marcar as observações localizadas


a uma distância de 1,5x(Q3-Q1) a 3x(Q3-Q1) de cada
extremidade do retângulo, que são os possíveis outliers.

ƒƒ desenhe círculos para marcar as observações localizadas a


uma distância superior a 3x(Q3-Q1) de cada extremidade
do retângulo, que são os prováveis outliers.

ƒƒ registre as informações importantes que devam constar


no gráfico, como título, período, coleta de dados,
tamanho da amostra, identificação dos eixos.

Os valores que estiverem acima do limite superior (haste


superior) ou abaixo do limite inferior (haste inferior) do box-plot
serão considerados outliers.

Estes valores são considerados discrepantes, ou seja, não fazem


parte do comportamento esperado do grupo em estudo.

Unidade 3 111

probabilidade_e_estatistica_1582.indb 111 19/07/12 11:11


Universidade do Sul de Santa Catarina

Assim o box-plot resulta:

Figura 3.13 – Box-plot


Fonte: Elaboração do autor (2011).

Complicado? Sim, um pouco, mas com a ajuda de um “truque” no


Excel, podemos fazer, ao menos, um esquema de box-plot,ainda
que o melhor seja sempre trabalhar com algum programa de
estatística que esteja preparado para desenhar este tipo de gráfico.

Dentre os programas grátis de estatísticas que podem


ser achados na internet, uns dos mais completos
é o PAST (http://folk.uio.no/ohammer/past/) da
Universidade de Oslo (Noruega).

Na internet, podem ser achados vários tutoriais explicando como


fazer um box-plot completo no Excel, é só procurar com um site
de buscas como o Google ou outro semelhante que você esteja
acostumado a utilizar no seu dia a dia.

112

probabilidade_e_estatistica_1582.indb 112 19/07/12 11:11


Probabilidade e Estatística

Exemplo de como construir um box-plot no Excel.


Em uma nova planilha, digite os seguintes dados, que são
os valores necessários para construir o box-plot e que foram
calculados a partir de três conjuntos de dados de um certo
levantamento de campo:

Figura 3.14 – Box-plot em Excel


Fonte: Elaboração do autor (2011).

a) selecionar as células A2:D7;

b) em seguida, ir ao menu Inserir e clicar em gráfico;

c) Na guia tipos padrão, clique em ações, depois em tipo


de gráfico e, em seguida, clique no quarto gráfico de
subtipo:

Figura 3.15 – Box-plot em Excel


Fonte: Elaboração do autor (2011).

Unidade 3 113

probabilidade_e_estatistica_1582.indb 113 19/07/12 11:11


Universidade do Sul de Santa Catarina

d) clique em Avançar;

e) na guia Intervalo de dados, clique em linhas, depois em


sequências em e, em seguida, clique em Avançar;

f) na guia Legenda, clique para desmarcar a caixa de


seleção Mostrar legenda;

g) na guia Eixos, clique para desmarcar a caixa de seleção


eixo (Y) em eixo secundário e, em seguida, clique em
Concluir;

h) clique uma vez em qualquer uma das colunas coloridas


para selecionar a série. Não clique em uma das colunas
em branco;

i) no menu Gráfico, clique em Tipo de gráfico;

j) em Tipo de gráfico, clique em Linha e, em seguida,


clique em OK.

Figura 3.16 – Box-plot em Excel


Fonte: Elaboração do autor (2011).

k) uma linha que conecta as três colunas em branco


aparecerá no gráfico;

l) clique uma vez na linha e, em seguida, clique com o


botão direito do mouse em formatar serie de dados para
indicar nenhuma linha e marcador;

114

probabilidade_e_estatistica_1582.indb 114 19/07/12 11:11


Probabilidade e Estatística

m) pronto, o esquema do box-plot já está construído.


Somente agora você deve botar as informações
importantes do gráfico.

Figura 3.17 – Box-plot em Excel


Fonte: Elaboração do autor (2011).

Seção 3 – Medidas de dispersão


Para compreender melhor o que são as medidas de dispersão,
acompanhe o exemplo. A realização de testes em três grupos de
pessoas resultou nos escores descritos a seguir.

Tabela 3.3 – Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos

Grupos Escores (em pontos) obtidos por pessoa (10 pessoas) Total
Grupo 1: 6 6 6 6 6 6 6 6 6 6 60
Grupo 2: 1 8 9 2 6 10 5 8 7 4 60
Grupo 3: 5 6 7 7 6 5 6 7 5 6 60

Fonte: Elaboração do autor (2006).

Unidade 3 115

probabilidade_e_estatistica_1582.indb 115 19/07/12 11:11


Universidade do Sul de Santa Catarina

Se você calcular a média dos escores para cada grupo, obterá os


seguintes resultados:

Para o grupo 1:

, ou seja, 6 pontos é o escore médio;

Para o grupo 2:

, ou seja, 6 pontos é o escore médio;

Para o grupo 3:

, ou seja, 6 pontos é o escore médio;

Observe que os escores médios dos três grupos são iguais. E


agora? Como diferenciar um grupo do outro? Olhando somente
para os dados você pode tirar algumas conclusões: no grupo 1,
as pessoas têm o mesmo escore; no grupo 2, os escores são
diversificados; e, no grupo 3, existe uma pequena diversificação,
ou seja, os escores estão bem próximos da média.

Pode-se afirmar, quanto à dispersão das séries anteriores, que:

ƒƒ grupo 1: não é uma série em que os dados apresentam


dispersão com relação à média, ou seja, os dados estão
totalmente concentrados na média;

ƒƒ grupo 2: é uma série de dados em que os valores


observados estão bastante dispersos, ou seja, apresenta
muitos valores distantes da média. Podemos dizer que é
uma série dispersa;

ƒƒ grupo 3: há uma pequena diferença de alguns dados


com relação à média, ou seja, apresenta uma pequena
dispersão com relação à média: os dados estão
concentrados em torno da média.

Em resumo, nos grupos 1 e 3, a média pode servir como uma


medida representativa, mas, no grupo 2, a média não resulta
representativa.

116

probabilidade_e_estatistica_1582.indb 116 19/07/12 11:11


Probabilidade e Estatística

Para identificar esses tipos de situações é que usamos


as medidas de dispersão. Essas medidas são a maneira
mais adequada para quantificar a dispersão dos dados
e avaliar a representatividade da média.

As principais medidas, denominadas de dispersão absolutas são:


amplitude total, desvio médio simples, variância e desvio padrão.

O desvio médio simples, não menos importante, não será visto


neste estudo, pois, para o objetivo que se pretende alcançar, a
variância e o desvio padrão são mais adequados.

Cálculos da variância e do desvio padrão


Para começar a trabalhar com dispersão, é necessário que você
conheça as definições e as formas de representação da variância e
do desvio padrão.

A variância é a média dos quadrados dos desvios


de cada valor da série com relação à média. Ficou
complicado? Não se preocupe, a seguir você vai
aprender como calcular!

O desvio padrão é a raiz quadrada da variância, pois


assim fica mais fácil analisar e comparar com a média;
se usássemos a variância, as unidades seriam ao
quadrado, enquanto que o desvio padrão apresentaria
a mesma unidade de medida que a média.

Veja a seguir como representá-las.

População Amostra
σ2 (x) → variância S2(x) → variância

σ (x) → desvio padrão s(x) →desvio padrão


σ = 18ª letra do alfabeto grego, chama-se sigma.

Quadro 3.2 – Representação do desvio padrão


Fonte: Elaboração do autor (2006).

Unidade 3 117

probabilidade_e_estatistica_1582.indb 117 19/07/12 11:11


Universidade do Sul de Santa Catarina

A variância e o desvio padrão para dados brutos


Neste item, você vai aprender como calcular a variância e o
desvio padrão para dados brutos. Preste atenção! A fórmula para
população e para amostra são diferentes.

O quadro a seguir apresenta as fórmulas utilizadas para calcular a


variância e o desvio padrão.

Medidas População Amostra

Variância

Desvio padrão
σ = 18ª letra do alfabeto grego, chama-se sigma.

Quadro 3.3 – Fórmulas para o cálculo de medidas de dispersão com dados brutos
Fonte: Elaboração do autor (2006).

Observação: A diferença mais importante entre as


duas fórmulas da variância são os denominadores. Para
a população, usamos n e, para a amostra, usamos n – 1.
Como, ao trabalharmos com uma amostra para estimar
valores de uma população, a variabilidade dos dados é
maior, então, dessa maneira, é mais indicado usarmos
n – 1 para que não subestimemos a dispersão. O n – 1 é
usado, nesse caso, como uma correção para a variância
da amostra. Para amostras com mais de 30 elementos,
essa correção torna-se irrelevante.

Para você entender melhor, imagine que a média de depósitos


diários de uma agência bancária seja de 120.000 reais e a
variância, de 25.000 reais ao quadrado. Seria difícil comparar
reais com reais ao quadrado. Para tanto, ao se fazer uso do desvio
padrão, o qual corresponde à raiz quadrada de 25.000 reais ao
quadrado, teríamos 5.000 reais. E esta é a mesma unidade de
medida da média.

Daremos continuidade ao exemplo, para calcular a variância e o


desvio padrão.

118

probabilidade_e_estatistica_1582.indb 118 19/07/12 11:11


Probabilidade e Estatística

Veja passo a passo


Exemplo: Uma vez dadas as notas: 6; 7; 7,8; e 8.

Passo 1: calcular a média: observe que, na média para a população,


usa-se a letra grega .

Passo 2: – agora, calcular os desvios (xi − ).

(x1 − ) = (6 – 7,20) = −1,20

(x2 − ) = (7 – 7,20) = −0,20

(x3 − ) = (7,8 – 7,20) = 0,60

(x4 − ) = (8 – 7,20) = 0,80

Passo 3: elevar ao quadrado cada desvio (xi − )2.

(x1 − )2 = (1,20)2 = 1,4400

(x2 − )2 = (−0,20)2 = 0,0400

(x3 − )2 = (0,60)2 = 0,3600

(x4 − )2 = (0,80)2 = 0,6400

Unidade 3 119

probabilidade_e_estatistica_1582.indb 119 19/07/12 11:11


Universidade do Sul de Santa Catarina

Passo 4: calcular a média dos quadrados dos desvios, ou seja, a


variância. Aqui, você vai calcular para a população e para a amostra.

ƒƒ Caso sejam dados de uma população:

Então: σ2(x) = 0,62

ƒƒ Caso sejam dados de uma amostra:

Então: s2(x) = 0,83

Passo 5: calcular o desvio padrão, calculando a raiz da variância.

ƒƒ Caso sejam dados de uma população:

ƒƒ Caso sejam dados de uma amostra:

Interpretação dos dados – Para dados de uma


população, a variabilidade das notas é de 0,79 pontos.
Para dados de uma amostra, a variabilidade das notas é
de 0,91 pontos.

120

probabilidade_e_estatistica_1582.indb 120 19/07/12 11:11


Probabilidade e Estatística

A variância e o desvio padrão para dados agrupados sem intervalos


(variável discreta)
Agora, você vai calcular a variância e o desvio padrão para dados
que foram organizados em tabelas, ou seja, após a coleta, eles
foram organizados em categorias e organizados em tabelas onde
os dados estão agrupados sem intervalos.

Observe as fórmulas que são utilizadas para calcular este tipo de


dados, a variância e o desvio padrão.

Medidas População Amostra

Variância

Desvio padrão

Quadro 3.4 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados sem intervalos
Fonte: Elaboração do autor (2006).

Acompanhe o exemplo a seguir para compreender como realizar


o cálculo dos dados agrupados sem intervalos.

Exemplo: A tabela apresenta dados referentes à remuneração de


funcionários de uma empresa. Foram levantados o número de
funcionários e sua faixa salarial, em número de salários-mínimos.

Unidade 3 121

probabilidade_e_estatistica_1582.indb 121 19/07/12 11:12


Universidade do Sul de Santa Catarina

Tabela 3.4 – Remuneração de funcionários

(−2,33) 2 =5,4289 5,4289.29 = 157,4381


1 − 3,33 = −2,33

Nº de
Nº de salários -
funcionários x i . (fi) (x i − x ) (x − x )
2 2
(x − x ) . (fi)
mínimos (x i )
(fi)
1 29 29 -2,33 5,4 1 157,4381

2 28 56 -1,33 1,7 7 49,5292

3 20 60 0,33 0,1 1 2,1780

4 18 72 0,67 0,4 5 8,0820

5 16 80 1,67 2,7 8 44,4560

6 15 90 2,67 7,1 3 106,9335

7 9 63 3,67 13,4 7 121,1607

Σ 135 450 489,7757

2
Σ fi Σ x i .f i Σ ( x i − x ) .f i
Fonte: Elaboração do autor (2006).

Quando realizar o passo a passo desses cálculos,


sugerimos que crie mais quatro colunas à direita para
auxiliar em seus cálculos.

Agora, acompanhe o cálculo passo a passo

Passo 1: inicie por somar a coluna das frequências simples (fi) para
obter Σfi (frequência total); Σfi = 135.

Passo 2: calcule a média: multiplique cada xi por sua correspondente


fi e escreva na coluna xi.fi, some os valores calculados e escreva no
final da coluna esse resultado, que é:
Σxi.fi; Σxi.fi = 450

122

probabilidade_e_estatistica_1582.indb 122 19/07/12 11:12


Probabilidade e Estatística

Passo 3: divida o resultado do passo 2 (Σ xi.fi ) pelo resultado do


passo 1 (Σ fi).

Para facilitar os cálculos, arredondamos a média em duas casas


decimais.

Passo 4: calcule a quarta coluna, (xi − ), subtraindo o xi de cada linha


pela média:

1 − 3,33 = −2,33
2 − 3,33 = −1,33
3 − 3,33 = −0,33
4 − 3,33 = 0,67
5 − 3,33 = 1,67
6 − 3,33 = 2,67
7 − 3,33 = 3,67

Passo 5: calcule a quinta coluna, elevando os valores da quarta


coluna ao quadrado (xi − )2.

(−2,33)2 = 5,4289
(−1,33)2 = 1,7689
(−0,33)2 = 0,1089
(0,67)2 = 0,4489
(1,67)2 = 2,7785
(2,67)2 = 7,1289
(3,67)2 = 13,4689

Neste passo, usa-se quatro casas decimais, deixando para


arredondar para duas casas somente o resultado.

Unidade 3 123

probabilidade_e_estatistica_1582.indb 123 19/07/12 11:12


Universidade do Sul de Santa Catarina

Passo 6: calcule a sexta coluna, multiplicando os valores da quinta


pela frequência simples de cada linha, (xi − )2.fi:

5,4289 . 29 = 157,4381
1,7689 . 28 = 49,5292
0,1089 . 20 = 2,1780
0,4489 . 18 = 8,0802
2,7785 . 16 = 44,4560
7,1289 . 15 = 106,9335
13,4689 . 9 = 121,1607

Passo 7: some os valores obtidos na sexta coluna, Σ(xi − )2.fi.

(Σ(xi − )2.f i = 489,7757

Passo 8: calcule a variância.

ƒƒ Caso sejam dados de uma população:

Na variância, serão usadas quatro casas decimais, pois ainda será


necessário extrair a raiz quadrada para chegar ao desvio padrão.

ƒƒ Caso sejam dados de uma amostra:

124

probabilidade_e_estatistica_1582.indb 124 19/07/12 11:12


Probabilidade e Estatística

Passo 9: calcule o desvio padrão.

ƒƒ Caso sejam dados de uma população:

ƒƒ Caso sejam dados de uma amostra:

Interpretação dos dados – Para dados de uma


população, a variabilidade do número de salários
é de 1,90 salários. Para dados de uma amostra, a
variabilidade do número de salários é de 1,91 salários.

Dados agrupados com intervalos (variável contínua)


Nesse item, você poderá ver como se calcula a variância e o desvio
padrão para dados agrupados com intervalos (variável contínua).

Observe as fórmulas que são utilizadas para calcular este tipo de


dados. Use para:

Medidas População Amostra

Variância

Desvio padrão

Quadro 3.5 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados com intervalos
Fonte: Elaboração do autor (2006).

Para o caso de dados agrupados com intervalos, usa-se


o ponto médio – PM – de cada intervalo, pois não se
tem um valor específico para usar. O ponto médio
serve como uma boa aproximação.

Unidade 3 125

probabilidade_e_estatistica_1582.indb 125 19/07/12 11:12


Universidade do Sul de Santa Catarina

Agora, vamos analisar um exemplo para realizar os cálculos de


medidas de dispersão com dados agrupados com intervalos.

Tabela 3.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
55,5025.12 = 666,0300
17,3 − 24,75 = −7,45
(−7,45) 2 = 55,5025

Nº de
Nº de vendas
representantes PM PM. fi PM i − x (PM i − x )
2 2
(PM i − x ) . fi
(em mil reais)
(fi )
15,9 | -- 18,7 12 17,3 207,6 −7,45 55,5025 666,0300

18,7 | -- 21,5 8 20,1 160,8 −4,65 21,6225 172,9800

21,5 | -- 24,3 12 22,9 274,8 −1,85 3,4225 41,0700

24,3 | -- 27,1 5 25,7 128,5 0,95 0,9025 4,5125

27,1 | -- 29,9 3 28, 5 85,5 3,75 14,0625 42,1875

29,9 | -- 32,7 6 31,3 187,8 6,55 42,9025 257,4150

32,7 | -- 35,5 10 34,1 341,0 9,35 87,4225 874,2250

Total ( Σ fi ) 56 1.386 2.058,4200

Σ fi Σ PM i . fi 2
Σ ( PM i − x ) .f i

Fonte: Elaboração do autor (2006).

Ao realizar o passo a passo, crie uma nova tabela com


mais cinco colunas à direita para auxiliar em seus cálculos.

Acompanhe os cálculos passo a passo

Passo 1: primeiro some a coluna das frequências simples (fi) para


obter Σ fi (frequência total); Σ fi = 56.

Passo 2: calcule a média; nesse caso, calcule o ponto médio de cada


intervalo, multiplique cada PM por sua correspondente fi e escreva
na coluna PM.fi; some os valores calculados nessa coluna e escreva
o total. Esse resultado é o Σ PM.fi: PMi.fi = 1.386. Agora, divida esse
resultado (Σ PM.f) pelo resultado do passo 1 (Σ fi). Assim, obtemos:

126

probabilidade_e_estatistica_1582.indb 126 19/07/12 11:12


Probabilidade e Estatística

Passo 3: calcule a quinta coluna, subtraindo o PMi de cada linha pela


média PMi − .

17,3 − 24,75 = −7,45


20,1 − 24,75 = −4,65
22,9 − 24,75 = −1,85
25,7 − 24,75 = 0,95
28,5 − 24,75 = 3,75
31,3 − 24,75 = 6,55
34,1 − 24,75 = 9,35

Passo 4: calcule a sexta coluna, elevando os valores da quinta ao


quadrado, (PMi − )2.

(−7,45)2 = 55,5025
(−4,65)2 = 21,6225
(−1,85)2 = 3,4225
(0,95)2 = 0,9025
(3,75)2 = 14,0625
(6,55)2 = 42,9025
(9,35)2 = 87,4225

Passo 5: calcule a sétima coluna, multiplicando os valores da sexta


pela frequência simples de cada linha, (PMi − )2.fi.

55,5025 . 12 = 666,0300
21,6225 . 8 = 172,9800
3,4225 . 12 = 41,0700
0,9025 . 5 = 4,5125
14,0625 . 3 = 42,1875
42,9025 . 6 = 257,4150
87,4225 . 10 = 874,2250

Passo 6: some os valores obtidos na sexta coluna, Σ (PMi − )2.fi.

Σ (PMi − )2.f i: = 2.058,4200.

Unidade 3 127

probabilidade_e_estatistica_1582.indb 127 19/07/12 11:12


Universidade do Sul de Santa Catarina

Passo 7: calcule a variância.

ƒƒ Caso sejam dados de uma população:

ƒƒ Caso sejam dados de uma amostra:

Passo 8: calcule o desvio padrão.

ƒƒ Caso sejam dados de uma população:

ƒƒ Caso sejam dados de uma amostra:

Interpretação dos dados – Para dados de uma


população, a variabilidade do volume de vendas
é de 6,06 mil reais. Para dados de uma amostra, a
variabilidade do volume de vendas é de 6,12 mil reais.

Interpretação do desvio padrão


O desvio padrão é uma importante medida de dispersão. É com
ele que você irá quantificar a dispersão dos dados de uma série
com relação à sua média. Preste atenção:

128

probabilidade_e_estatistica_1582.indb 128 19/07/12 11:12


Probabilidade e Estatística

ƒƒ quanto maior o valor do desvio padrão, mais dispersos


estão os valores. Pode-se dizer, também, que mais
distantes estão da média;

ƒƒ quanto menor o valor do desvio padrão, menos dispersos


estão os valores. Pode-se dizer, também, que mais
próximos estão da média.

Veja a figura a seguir para compreender melhor o que foi


colocado.

Figura 3.18 – Quanto mais distantes da média, mais dispersos os dados estão
Fonte: Triola (1999, p. 42).

Outra utilização do desvio padrão


Muitas séries, quando representadas por seu polígono de
frequências, com certo ajuste nas curvas, apresentam um formato
semelhante a um sino, uma curva simétrica (observando que a
média, a moda e a mediana estão posicionadas ao centro), como
mostra o gráfico a seguir.

Gráfico 3.1 – Gráfico da curva normal


Fonte: Elaboração do autor (2006).

Unidade 3 129

probabilidade_e_estatistica_1582.indb 129 19/07/12 11:12


Universidade do Sul de Santa Catarina

Para séries de dados que apresentam esse tipo de representação,


pode-se trabalhar com a área abaixo do polígono. A área abaixo é
proporcional à frequência total. Essa curva é chamada de Curva
Normal ou Curvas de Gauss, e suas principais características são:

ƒƒ a curva se caracteriza por ter a forma de um sino;

ƒƒ a curva normal é simétrica com relação à média;

ƒƒ a área limitada pela curva e pelo eixo das abscissas é 1


ou 100%;

ƒƒ a curva é assintótica, isto é, aproxima-se indefinidamente


do eixo das abscissas sem tocá-lo;

ƒƒ a curva normal é unimodal, isto é, possui um só pico ou


ponto de frequência máxima, ponto este que coincide
com a moda, a média e a mediana.

Como relacionar a curva com o desvio padrão? Veja a curva a seguir:

Gráfico 3.2 – Gráfico da curva normal


Fonte: Elaboração do autor (2006).

130

probabilidade_e_estatistica_1582.indb 130 19/07/12 11:12


Probabilidade e Estatística

Exemplo: Numa série em que μ = 80 e o σ(x)=3, pode-se


interpretar estes valores da seguinte forma:

ƒƒ os valores da série estão concentrados em torno da


média, que é de 80 unidades;

ƒƒ o intervalo [μ − σ(x); μ + σ(x)] contém aproximadamente


68,26% dos elementos da série, ou seja, o intervalo [77;83];

ƒƒ o intervalo [μ − 2σ(x); μ + 2σ(x)] contém


aproximadamente 95,44% dos elementos da série, ou
seja, o intervalo [74;86];

ƒƒ o intervalo [μ − 3σ(x); μ + 3σ(x)] contém


aproximadamente 99,74% dos elementos da série, ou seja,
o intervalo [71;89];

Seção 4 – Coeficiente de variação

Séries de dados com médias iguais


Acompanhe o exemplo: considere dois grupos de pessoas, nos
quais foram feitos levantamentos de suas rendas. Os resultados
deste levantamento foram os seguintes:

Tabela 3.6 – Resultado do levantamento de renda

Grupo 1 Grupo 2
Média: Média:
μ = 122 pontos μ = 122 pontos
Desvio padrão: Desvio padrão:
σ(x) = 4,5 pontos σ(x) = 7,5 pontos
Fonte: Elaboração do autor (2006).

Unidade 3 131

probabilidade_e_estatistica_1582.indb 131 19/07/12 11:12


Universidade do Sul de Santa Catarina

Compare a dispersão das duas séries:

ƒƒ note que as médias são iguais;

ƒƒ o desvio padrão do grupo 1 é 4,5, e o do grupo 2 é 7,5;


portanto, o grupo que apresenta maior dispersão quanto
ao nível de renda é o grupo 2;

ƒƒ conclusão: os níveis de renda do grupo 2 são mais


dispersos com relação ao grupo 1 (valores mais distantes
da média); ou: os integrantes do grupo 1 tem renda mais
semelhantes entre eles que os integrantes do grupos 2.

Para comparar duas séries de dados usando medidas


de dispersão absolutas (variância e desvio padrão) é
necessário que as médias sejam iguais, caso contrário,
usamos uma medida de dispersão relativa que veremos
nesta seção.

Séries de dados com médias diferentes


Como você pôde observar no item anterior, para comparar duas
séries de dados quanto a suas dispersões, pode-se usar valores
absolutos dos desvios padrão, mas somente quando as médias
são iguais.

E quando as médias são diferentes?

Nesse caso, utiliza-se o Coeficiente de Variação (CV), que é


uma medida de dispersão relativa. Veja a seguir.

132

probabilidade_e_estatistica_1582.indb 132 19/07/12 11:12


Probabilidade e Estatística

Medida de dispersão relativa – o Coeficiente de Variação


O coeficiente de variação é a relação do desvio com a média. Veja
a fórmula a seguir:

Tabela 3.7 – Fórmula do coeficiente de variação

Para a população Para a amostra

Fonte: Elaboração do autor (2006).

A série que apresentar maior coeficiente de variação


será realmente a série de maior dispersão dos dados. O
resultado é expresso em percentual (%), ou seja, quanto
o desvio padrão representa da média.

Acompanhe o exemplo a seguir para compreender como realizar


o cálculo.

Exemplo: Considere dois grupos de pessoas, nos quais foram


feitos levantamentos de suas rendas. Os resultados deste
levantamento foram os seguintes:
Tabela 3.8 – Resultado do levantamento
Grupo 1 Grupo 2
Desvio padrão: Desvio padrão:
σ(x) = 9,8 reais σ(x) = 7,5 reais
Média: Média:
μ = 145 reais μ = 95 reais
Fonte: Elaboração do autor (2006).

ƒƒ note que as médias são diferentes;

ƒƒ o desvio padrão do grupo 1 é 9,8; e o do grupo 2 é 7,5;


portanto, o grupo que apresenta maior dispersão absoluta
quanto ao nível de renda é o grupo 1;

Unidade 3 133

probabilidade_e_estatistica_1582.indb 133 19/07/12 11:12


Universidade do Sul de Santa Catarina

ƒƒ como as médias são diferentes, devemos calcular o


coeficiente de variação, pois, simplesmente pela dispersão
absoluta, não podemos afirmar nada (se fossem iguais,
bastaria a dispersão absoluta).

»» Para o grupo 1:

»» Para o grupo 2:

O grupo que apresenta maior coeficiente de variação é o grupo 2.


Ou seja, os níveis de renda observados no grupo 2 são mais
dispersos com relação ao grupo 1 (valores mais distantes da média).

Quais outras conclusões você poderia tirar com relação


aos dois grupos?

Comparando os dois, você poderia dizer que, no grupo 1, as


pessoas têm a renda mais próxima da média do grupo que no
Grupo 2, que, por sua vez, as pessoas apresentam níveis de renda
mais diferenciado da média do grupo, comparando os dois grupos.

Para comparar a dispersão dos dados de duas séries de


médias diferentes, usamos o coeficiente de variação.
Ele compara o desvio padrão com a média (proporção)
entre o desvio padrão e a média da série, sendo, assim,
considerado uma forma mais eficaz de comparação e,
portanto, prevalecendo sobre a absoluta.

134

probabilidade_e_estatistica_1582.indb 134 19/07/12 11:12


Probabilidade e Estatística

Síntese

Nessa unidade, você pôde estudar e compreender “ferramentas”


que irão auxiliá-lo na prática de sua profissão.

Você pôde conhecer os tipos de medidas de posição e calcular


e interpretar a média, a moda e a mediana e pôde, também,
compreender e calcular separatrizes. Estudou como se calculam
as diversas medidas estatísticas, tanto para dados brutos ou
agrupados, com e sem intervalos.

Também foram vistos os gráficos box-plot e ramo e folhas como


ferramentas exploratórias de análise de dados que são capazes de
examinar um conjunto de dados para se ter uma primeira ideia da
distribuição deles.

Nessa unidade, você estudou, ainda, uma medida muito


importante em Estatística: a medida de dispersão. Sem estudar
estas medidas, muitas vezes fica difícil de definir se a média
seria ou não representativa de uma série de dados. Além disso,
você conheceu o método utilizado para comparar dados com
médias diferentes, largamente utilizado em estudos de dados e
tratamentos estatísticos.

Unidade 3 135

probabilidade_e_estatistica_1582.indb 135 19/07/12 11:12


Universidade do Sul de Santa Catarina

Atividades de autoavaliação

Ao final de cada unidade, você realizará atividades de autoavaliação. O


gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.

1) Uma empresa procurou estudar a ocorrência de uso de drogas lícitas –


bebidas alcoólicas – por seus empregados, tendo, para isso, realizado
um levantamento sobre o número de dias por semana que cada um
dos empregados costuma beber. Calcule e interprete a média. Os
dados correspondentes são:

Consumo de bebidas alcoólicas por semana pelos funcionários


Nº de dias (xi) Nº de func. (fi) xi.fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (Σfi) 64

Fonte: Elaboração do autor (2006).

136

probabilidade_e_estatistica_1582.indb 136 19/07/12 11:12


Probabilidade e Estatística

2) Os dados seguintes representam a renda de uma amostra de famílias


de um bairro de classe baixa de Florianópolis, em reais (dados fictícios).
Calcule e interprete a média.

Renda de famílias de um bairro de classe baixa de Florianópolis


Renda (R$) No de famílias (fi) PM PM.fi
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total (Σfi) 36
Fonte: Elaboração do autor (2006).

Unidade 3 137

probabilidade_e_estatistica_1582.indb 137 19/07/12 11:12


Universidade do Sul de Santa Catarina

3) Nos itens a seguir, estão dois conjuntos de dados. Calcule a mediana


para cada um deles e interprete seus resultados.
a) Conjunto 1

15 19 13 21 16 17 15 12 13

Sugestão: use a tabela a seguir para organizar e posicionar os dados.

b) Conjunto 2

17 18 14 14 15 15 16 16

Sugestão: use a tabela abaixo para organizar e posicionar os dados.

138

probabilidade_e_estatistica_1582.indb 138 19/07/12 11:12


Probabilidade e Estatística

4) Nas opções a seguir, estão três conjuntos de dados. Encontre a moda


para cada um deles e interprete seus resultados.
a) Conjunto 01

7 6 5 8 2 1 3 2 1
1 7 6 8 5 1 2 2 7

b) Conjunto 02

5 6 8 2 3 5 3 3
2 6 5 8 3 2 5 6

c) Conjunto 03

5 6 3 7 5 3 2 1
1 6 7 2 8 4 8 4

Unidade 3 139

probabilidade_e_estatistica_1582.indb 139 19/07/12 11:12


Universidade do Sul de Santa Catarina

5) Em um grupo de pacientes acometidos de fobias, foi levantado o


tempo em tratamento em anos, conforme tabela abaixo. Calcule o Q3, o
D9 e o P35 e interprete seus resultados.
Tempo em tratamento de fobias em anos:

4 6 8 2 5 9 4 3 8 9 5 4

Use a tabela abaixo para organizar e posicionar os dados.

6) Os dados a seguir representam o tempo em minutos usados por um


grupo de seis pessoas na realização de um teste. Calcule a variância e o
desvio padrão, considerando como uma população.
Tempo (em min.): 25, 22, 36, 20, 29, 38;

140

probabilidade_e_estatistica_1582.indb 140 19/07/12 11:12


Probabilidade e Estatística

7) Os escores obtidos por cinco pessoas em um teste estão relacionados


a seguir. Calcule a variância e o desvio padrão, considerando como
uma amostra.
Tempo: 15, 10, 9, 23, 31.

8) Uma empresa procurou estudar a ocorrência de uso de drogas


lícitas – bebidas alcoólicas – por seus empregados, tendo, para isso,
tem-se realizado um levantamento sobre o número de dias por
semana que cada um dos empregados costuma beber. Calcule a
variância e o desvio padrão, considerando que os dados são de uma
amostra (sugere-se utilizar colunas para facilitar o cálculo). Os dados
correspondentes são:

Consumo de bebidas alcoólicas por semana pelos funcionários


Nº de dias (xi) Nº de func. (fi) xi.fi (xi – ) (xi – )2 (xi – )2. fi
0 10
1 16
2 14
3 8
4 5
5 4
6 4
7 3
Total (Σfi) 64
Fonte: Elaboração do autor (2006).

Unidade 3 141

probabilidade_e_estatistica_1582.indb 141 19/07/12 11:12


Universidade do Sul de Santa Catarina

9) Na tabela a seguir, estão relacionados dados relativos à idade de um


grupo de 63 estudantes matriculados numa disciplina da Unisul Virtual.
Calcule a variância e o desvio padrão, considerando que são dados da
população (sugere-se utilizar colunas para facilitar o cálculo).

Idade dos estudantes da disciplina de Métodos Estatísticos a distância

Idade (xi) Nº de estud. (fi) xi.fi (xi – ) (xi – )2 (xi – )2. fi


17 5
18 20
19 22
20 10
21 6
Total (Σfi) 63

Fonte: Elaboração do autor (2006).

142

probabilidade_e_estatistica_1582.indb 142 19/07/12 11:12


Probabilidade e Estatística

10) Os dados abaixo representam a renda de uma amostra de famílias de


um bairro de classe baixa de Florianópolis, em reais. (dados fictícios).
Calcule a variância e o desvio padrão, considerando como sendo dados
de uma amostra:

Renda de famílias de um bairro de classe baixa de Florianópolis


Nº de famílias
Renda (R$) PMi PMi.fi (PMi – ) (PMi – )2 (PMi – )2. fi
(fi)
112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7
Total (Σfi)

Fonte: Elaboração do autor (2006).

11) Analise cada caso, comparando quanto à dispersão dos dados e


responda às perguntas:
a) Qual das séries apresenta maior dispersão absoluta (comparar os
desvios padrão)?
b) Qual das séries apresenta maior dispersão relativa (comparar os
coeficientes de variação)?
c) Conclua qual das séries realmente apresenta maior dispersão (não
esqueça que o coeficiente de variação é mais eficaz para determinar a
dispersão de uma série).

Unidade 3 143

probabilidade_e_estatistica_1582.indb 143 19/07/12 11:12


Universidade do Sul de Santa Catarina

11.1)
Série A Série B
μ = 57; σ(x) = 5,6 μ = 96; σ(x) = 8,2

11.2)

Série A Série B
μ = 64; σ(x) = 12 μ = 96; σ(x) = 18

11.3)

Série A Série B
μ = 195; σ(x) = 12 μ = 125; σ(x) = 12

11.4)

Série A Série B
μ = 869; σ(x) = 201 μ = 625; σ(x) = 198

144

probabilidade_e_estatistica_1582.indb 144 19/07/12 11:12


Probabilidade e Estatística

12) Durante o processo de fabricação de parafusos, fez-se uma


amostragem aleatória e, de cada elemento obtido, calculou-se a
diferença entre o peso (em miligramas) que o parafuso devia ter
segundo o projeto e o real peso logo de fabricado, obtendo os
seguintes dados.
Diferença de pesos em miligramas:

40,208
42,303
43,262
48,914
49,46
52,681
52,764
52,87
57,784
61,411
68,02
71,615
72,471
74,176
75,973
78,769
81,412
81,736
82,756
106,354

Para analisar o comportamento das discrepâncias dos pesos, trace


o gráfico box-plot do conjunto de dados amostrais da fábrica de
parafusos.

Unidade 3 145

probabilidade_e_estatistica_1582.indb 145 19/07/12 11:12


Universidade do Sul de Santa Catarina

Saiba mais

Se você desejar, aprofunde os conteúdos estudados nesta unidade


ao consultar as seguintes referências:

BARBETTA, Pedro Alberto. Estatística aplicada às ciências


sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.

CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva,


2001.

LEVIN, Jack. Estatística aplicada às Ciências Humanas. São


Paulo: Habra, 1987.

SILVA, Ermes Medeiros da. Estatística. v. 1. São Paulo: Atlas,


1996.

TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:


LTC, 1999.

146

probabilidade_e_estatistica_1582.indb 146 19/07/12 11:12


4
UNIDADE 4

Cálculo e distribuição de
probabilidades

Objetivos de aprendizagem
„„ Calcular e interpretar probabilidades.

„„ Compreender variável aleatória e distribuição de


probabilidades.

„„ Compreender o que é variável aleatória discreta e


contínua.

„„ Compreender distribuição discreta e contínua de


probabilidades.

„„ Calcular probabilidade usando distribuição contínua de


probabilidades.

Seções de estudo
Seção 1 Principais conceitos

Seção 2 Cálculo de probabilidade

Seção 3 Noções sobre variável aleatória e distribuição de


probabilidades
Seção 4 Os tipos de distribuições de probabilidades

Seção 5 Cálculo de probabilidade usando a distribuição

probabilidade_e_estatistica_1582.indb 147 19/07/12 11:12


Universidade do Sul de Santa Catarina

Para início de estudo


Nesta unidade, você iniciará o estudo da Estatística Indutiva, que
tem como base o estudo de Probabilidades.

Talvez você deva estar se perguntando: Probabilidade? O


que é? Tenho certeza que muitas vezes você já pensou em
“possibilidades” de algo acontecer. Será que vai chover? Será
que serei escolhido para participar de um grupo? Será que vou
encontrar meu amigo hoje? Etc.

Muitas vezes, não podemos prever acontecimentos como esses,


ou seja, podem acontecer ou não. Você até poderia associar isso
tudo à sorte ou ao azar, enfim, ao acaso. E é aqui que o estudo
de probabilidade entra. Tentar formular e calcular modelos
matemáticos que definam essas situações e possibilite a você tomar
suas decisões e, assim, conduzir sua vida, suas experiências e seus
caminhos; este é um dos principais objetivos desta unidade.

Nessa unidade, você também conhecerá como é possível


expressar em números algumas situações com a finalidade de
possibilitar um melhor tratamento matemático a elas. Serão
apresentados os tipos de distribuições de probabilidades e como
se calcula probabilidade usando a distribuição discreta e a
distribuição contínua de probabilidades.

Você está convidado a conhecer um pouco desse assunto! Vamos lá?!

Bons Estudos!

148

probabilidade_e_estatistica_1582.indb 148 19/07/12 11:12


Probabilidade e Estatística

Seção 1 – Principais conceitos


Você conhecerá, nesta seção, o que são fenômenos, o que é
um espaço amostral e o que são eventos. Estes são alguns dos
conceitos mais importantes que são utilizados na Probabilidade.
O objetivo é que você compreenda como aplicar estes
conhecimentos no seu dia a dia!

Fenômenos (ou experimentos)


Você pode entender por fenômeno qualquer acontecimento, seja
ele natural ou não.Eles podem ser classificados em dois tipos:
determinísticos ou aleatórios.

„„ Fenômenos determinísticos: são fenômenos em que as


condições iniciais determinam um único resultado.

„„ Fenômenos aleatórios: são fenômenos em que as


condições iniciais não determinam a possibilidade da
existência de um resultado em particular.

Em resumo, quando você pode determinar o resultado de um


fenômeno, você irá chamá-lo de determinístico, mas quando os
resultados do fenômeno não podem ser determinados, você irá
chamá-lo de aleatório, pois pode apresentar qualquer resultado
dentro de um grupo de esperados (mais de um).

Veja, a seguir, exemplos de cada um deles.

Unidade 4 149

probabilidade_e_estatistica_1582.indb 149 19/07/12 11:12


Universidade do Sul de Santa Catarina

Para ilustrar, considere dois dados diferentes, o dado 1


tem as faces com o mesmo número de pontos em cada
face, e o dado 2 é um dado normal, tem as faces com
números de pontos diferentes.
 Dado 1: tem as faces com o mesmo número de
pontos;
 Dado 2: é um dado normal, tem as faces com
números de pontos diferentes e não é viciado (observe
que um dado viciado é aquele que, ao ser jogado,
sempre sai o mesmo número).

Fenômeno determinístico – se você jogar o dado


1 várias vezes, sob as mesmas condições, sempre
irá apresentar o mesmo número de pontos na face
voltada para cima. Nesse caso, você pode dizer que
é um fenômeno determinístico, pois não existe outra
possibilidade de resultado e é possível prever qual será.

Fenômeno aleatório – se você jogar o dado 2 várias


vezes, sob as mesmas condições, poderá apresentar
resultados diferentes a cada lançamento. Nesse caso,
você pode dizer que é um fenômeno aleatório, pois
existem várias possibilidades de resultado e não é
possível prever qual será.

A partir do exposto, conclui-se que o estudo de probabilidade


é baseado nos fenômenos aleatórios. Você pode dizer que o
estudo de probabilidades está intimamente ligado ao acaso.

Espaço amostral
Observe que quando se trabalha com experimentos que admitem
mais de um resultado, torna-se interessante definir o conjunto
de todos esses resultados; nesse caso, você pode chamar esse
conjunto de espaço amostral.
O símbolo para representar o
conjunto do espaço amostral é S
(letra maiúscula).
Espaço amostral é o conjunto de todos os possíveis
resultados de um experimento (fenômeno) aleatório.

150

probabilidade_e_estatistica_1582.indb 150 19/07/12 11:12


Probabilidade e Estatística

Veja, a seguir, exemplos sobre o espaço amostral.

Ao verificar os exemplos, lembre-se de que o número


de elementos do conjunto do espaço amostral é
representado por n(S):
n(S) = número de elementos de S.

Exemplo 1: você pode usar o dado 2, citado no exemplo


anterior, e estudar todas as possibilidades. Pode-se construir o
seguinte conjunto:

S = {1, 2, 3, 4, 5, 6}: observe que são todas as possibilidades de


pontos de um dado normal.

Exemplo 2: um médico trabalha com um grupo de pessoas


com problemas de alcoolismo. O grupo é composto por cinco
pessoas. Duas delas apresentam cirrose e três não apresentam
cirrose (veja legenda).

Cn – Pessoa número ‘n’ com cirrose


Pn – Pessoa número ‘n’ sem cirrose

Ex.: C1 – pessoa número 1 com cirrose;


P1 – pessoa número 1 sem cirrose.

Pode-se construir o seguinte conjunto:

S = {C1, C2, P1, P2, P3}: observe que são todas as possibilidades
entre as pessoas do grupo.

Exemplo 3: um psicólogo trabalha com um grupo de pessoas


e estuda os distúrbios do sono. O grupo é composto por
sete pessoas. Cinco delas apresentam distúrbios e duas não
apresentam distúrbios (veja legenda).

Dn – Pessoa número ‘n’ com distúrbio


Pn – Pessoa número ‘n’ sem distúrbio

Ex.: D1 – pessoa número 1 com distúrbio;


P1 – pessoa número 1 sem distúrbio.

Unidade 4 151

probabilidade_e_estatistica_1582.indb 151 19/07/12 11:12


Universidade do Sul de Santa Catarina

Pode-se construir o seguinte conjunto:

S = {D1, D2, D3, D4, D5, P1, P2}: observe que são todas as
possibilidades entre as pessoas do grupo.

Exemplo 4: um grupo de pessoas que apresentam diferenças na


cor do cabelo (veja legenda).

Pn – Pessoa número ‘n’ com cabelos pretos


Ln – Pessoa número ‘n’ com cabelos louros
Cn – Pessoa número ‘n’ com cabelos castanhos
Rn – Pessoa número ‘n’ com cabelos ruivos

Ex.: P1 – pessoa número 1 com cabelos pretos;


L1 – pessoa número 1 com cabelos louros.

Sabendo que, nesse grupo, você tem três pessoas com cabelos
pretos, duas com cabelos louros, três com cabelos castanhos
e uma com cabelos ruivos, como fica o conjunto do espaço
amostral? Pense e anote a seguir como você acha que fica o
conjunto do espaço amostral do exemplo:

S = {______________________________________}

Agora, compare se o seu conjunto do espaço amostral está igual


ao seguinte conjunto do espaço amostral:

S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que são todas
as possibilidades entre as pessoas do grupo.

Qual é o número de elementos dos espaços amostrais citados nos


exemplos dados? Veja:

No exemplo 1: n(S) = 6;
No exemplo 2: n(S) = 5;
No exemplo 3: n(S) = 7;
No exemplo 4: n(S) = 9.

152

probabilidade_e_estatistica_1582.indb 152 19/07/12 11:12


Probabilidade e Estatística

Eventos
Quando você tiver que estudar algum experimento aleatório,
deverá identificar as diferentes variações de resultados possíveis
dentro do espaço amostral. Você pode chamar de evento
cada uma dessas variações, ou seja, cada uma dessas partes
(subconjuntos) do espaço amostral é um evento.
O símbolo para representar
Um evento é qualquer subconjunto do espaço amostral
o subconjunto de um
determinado pelo experimento (fenômeno) aleatório em estudo. evento é A (letra
maiúscula).

Ao verificar os exemplos, lembre-se de que o número


de elementos de evento é representado por n(A):
n(A) = número de elementos de A.

Usando os exemplos citados anteriormente, você pode observar:

Exemplo 1: você pode usar o dado 2, citado no exemplo anterior,


e estudar todas as possibilidades.

Pode-se construir o seguinte evento:

A: sair um número par na face superior.

A = {2, 4, 6}: observe que são todas as possibilidades de pontos


pares de dado normal.

Exemplo 2: um médico trabalha com um grupo de pessoas


com problemas de alcoolismo. O grupo é composto por cinco
pessoas. Duas delas apresentam cirrose e três não apresentam
cirrose (veja legenda).

Cn – Pessoa número ‘n’ com cirrose


Pn – Pessoa número ‘n’ sem cirrose

Ex.: C1 – pessoa número 1 com cirrose;


P1 – pessoa número 1 sem cirrose.

Unidade 4 153

probabilidade_e_estatistica_1582.indb 153 19/07/12 11:12


Universidade do Sul de Santa Catarina

Pode-se construir o seguinte conjunto:

B: ser uma pessoa sem cirrose.


B = {P1, P2, P3}: observe que são todas as possibilidades de
pessoas sem cirrose.

Exemplo 3: um professor trabalha com um grupo de pessoas


e estuda os distúrbios do humor. O grupo é composto por
sete pessoas. Cinco delas apresentam distúrbios e duas não
apresentam distúrbios (veja legenda).

Dn – Pessoa número ‘n’ com distúrbio


Pn – Pessoa número ‘n’ sem distúrbio

Ex.: D1 – pessoa número 1 com distúrbio;


P1 – pessoa número 1 sem distúrbio.

Pode-se construir o seguinte evento:

C: ser uma pessoa com distúrbio.


C = {D1, D2, D3, D4, D5}: observe que são todas as
possibilidades de pessoas com distúrbio.

Exemplo 4: um grupo de pessoas que apresentam diferenças na


cor do cabelo (veja legenda).

Pn – Pessoa número ‘n’ com cabelos pretos


Ln – Pessoa número ‘n’ com cabelos louros
Cn – Pessoa número ‘n’ com cabelos castanhos
Rn – Pessoa número ‘n’ com cabelos ruivos

Ex.: P1 – pessoa número 1 com cabelos pretos;


L1 – pessoa número 1 com cabelos louros.

Sabendo que nesse grupo você tem três pessoas com cabelos
pretos, duas com cabelos louros, três com cabelos castanhos e
uma com cabelos ruivos, como fica o subconjunto do evento
pessoas com cabelos ruivos?

154

probabilidade_e_estatistica_1582.indb 154 19/07/12 11:12


Probabilidade e Estatística

Pode-se construir o seguinte evento:

D: ser uma pessoa com cabelos ruivos.


D = {R1}: observe que é a única possibilidade com cabelos ruivos.

Qual é o número de elementos dos eventos citados nos exemplos


anteriores?

No exemplo 1: n(A) = 3;
No exemplo 2: n(B) = 3;
No exemplo 3: n(C) = 5;
No exemplo 4: n(D) = 1.

Tipos de eventos
Existem três tipos de eventos, que são:

„„ Evento simples: formado por apenas um elemento do


espaço amostral.

Exemplo: D: ser uma pessoa com cabelos ruivos. (Veja o


exemplo 4)

D = {R1} ⇒ n(D) = 1.

„„ Evento composto: formado por dois ou mais elementos


do espaço amostral.

Exemplo: B: ser uma pessoa sem cirrose. (Veja o exemplo


2)

B = {P1, P2, P3} ⇒ n(B) = 3

„„ Evento impossível: não ocorre, seja qual for a realização


do experimento aleatório.

Exemplo: F: ser uma pessoa com cabelos verdes naturais.


(Veja o exemplo 4)

F = { } ⇒ n(F) = 0

Unidade 4 155

probabilidade_e_estatistica_1582.indb 155 19/07/12 11:12


Universidade do Sul de Santa Catarina

„„ Evento certo: é quando o evento é o próprio espaço


amostral.

Exemplo: E: ser uma pessoa com alcoolismo. (Veja o


exemplo 2)

E={C1, C2, P1, P2, P3} ⇒ n (E)= 5 = n(S)

Operações com eventos


As operações com eventos são muito semelhantes às operações
com conjuntos, até porque os eventos nada mais são que
conjuntos. Veja, a seguir, mais detalhes sobre este assunto.

União de eventos
Se existem os eventos A e B de um espaço amostral S, a união
desses eventos existe se pode ocorrer A ou B.

A B

Figura 4.1 – Representação em diagrama da união entre eventos


Fonte: Elaboração do autor (2006).

A união de A e B pode ser representada por: A soma B ou A∪B.


A união corresponde a toda a área colorida.

Interseção de eventos
Se existem os eventos A e B de um espaço amostral S,
a interseção desses eventos existe se pode ocorrer A e B,
simultaneamente.

156

probabilidade_e_estatistica_1582.indb 156 19/07/12 11:12


Probabilidade e Estatística

Figura 4.2 – Representação em diagrama da intersecção entre eventos


Fonte: Elaboração do autor (2006).

A interseção de A e B pode ser representada por: A vezes B ou


A∩B. A interseção corresponde a toda a área colorida.

Complemento de um evento
É um evento formado por todos os elementos pertencentes a S,
mas que não pertencem a A.

S
A
A’

Figura 4.3 – Representação em diagrama do complementar de um evento


Fonte: Elaboração do autor (2006).

Complementar de A – pode ser representado por: , A’ ou CA. O


complementar de A corresponde a toda a área colorida.

Unidade 4 157

probabilidade_e_estatistica_1582.indb 157 19/07/12 11:12


Universidade do Sul de Santa Catarina

Subtração de eventos
Você pode dizer que A menos B é se, e somente se, ocorre A e
não ocorre B.

A B

Figura 4.4 – Representação em diagrama da subtração de eventos


Fonte: Elaboração do autor (2006).

A subtração de eventos pode ser representada por A − B, que


corresponde a toda a área colorida.

Eventos excludentes
Dois ou mais eventos são ditos excludentes (mutuamente
exclusivos) se a realização de um dos eventos excluir a realização
do outro ou de outros eventos.

S
A

B
C

Figura 4.5 – Representação em diagrama da subtração de eventos


Fonte: Elaboração do autor (2006).

Se, quando A ocorrer, exclui ocorrerem os outros, isso quer


dizer que não há interseção entre eles! A e B são mutuamente
exclusivos e B e C não são mutuamente exclusivos.

Agora que você já estudou os conceitos mais importantes que são


utilizados na probabilidade, é hora de conhecer como é feito o
cálculo de probabilidade. Acompanhe na seção a seguir!
158

probabilidade_e_estatistica_1582.indb 158 19/07/12 11:12


Probabilidade e Estatística

Seção 2 – Cálculo de probabilidade


Nesta seção, vamos estudar os conceitos de probabilidade e a
forma de fazer seus cálculos! Acompanhe as duas definições
mais importantes dentro do estudo de probabilidades. São elas: a
definição clássica de probabilidade e a frequência relativa.

Veja, então, separadamente, cada uma dessas definições.

Probabilidade clássica
Antes de conhecer como se calcular a probabilidade clássica,
saiba como ela é possível.

A probabilidade de ocorrer um determinado resultado


na realização de um experimento é igual ao quociente
entre o número de casos favoráveis ao sucesso (número
de elementos do evento A) e o número de casos
possíveis (número de elementos do espaço amostral S).

Observe a fórmula a seguir:

Probabilidade de um evento A ocorrer:

= P = sucesso

Observação: A probabilidade de não ocorrência pode ser


representada por:

= q = fracasso

Observe que, se você quiser o resultado em porcentagem, deve


multiplicá-lo por 100 ao final.

Unidade 4 159

probabilidade_e_estatistica_1582.indb 159 19/07/12 11:12


Universidade do Sul de Santa Catarina

Veja, a seguir, alguns exemplos do cálculo de probabilidade clássica.

Exemplo 1: em um levantamento feito com oito moradores de um


condomínio, verificou-se que dois são casados, dois são solteiros, três
são divorciados e um é viúvo. Qual a probabilidade de, ao escolher
um morador ao acaso, ele ser casado? E qual a probabilidade de, ao
escolher um morador ao acaso, ele ser divorciado?

Compreenda passo a passo


Legenda:
Estado civil: Passo 1: identificar os elementos do espaço amostral e do evento
C – Casado (dois moradores ) C1, C2 solicitado.
S – Solteiro (dois moradores) S1, S2
D – Divorciado (três moradores) D1,
D2, D3 S: moradores do condomínio S = {C1, C2, S1, S2, D1, D2,
V – Viúvo (um morador) V1
D3, V1}

A: moradores casados A = {E1, E2}

B: moradores divorciados B = {F1, F2, F3}

Passo 2: identificar o número de elementos de cada conjunto.

n(S) = 8;
n(A) = 2;
n(B) = 3.

Passo 3: usar a fórmula da probabilidade.

Observação: Após efetuar a divisão é só multiplicar por 100 para


obter a probabilidade na forma percentual.

P(A) = 0,25 ou 25%


Para o evento A:

Para o evento B: P(A) = 0,375 ou 37,5%

160

probabilidade_e_estatistica_1582.indb 160 19/07/12 11:12


Probabilidade e Estatística

Passo 4: interpretar os dados.

Como interpretar estes dados? A probabilidade de um morador


casado ser escolhido é de 25%, e a probabilidade de um morador
divorciado ser escolhido é de 37,5%.

Exemplo 2: em um levantamento realizado com um grupo de 90


chefes de famílias com diferentes vínculos de trabalho, obteve-se
os seguintes resultados (dados fictícios):

Pesquisa dos motivos de estresse


Tipos de vínculo Nº de pessoas
Evento A M Funcionário público municipal 29 n(A)
E Funcionário público estadual 24
F Funcionário público federal 20 n(C)
Evento C C Comerciário 17
T Temporário 17 n(B)
Evento B I Comércio informal 11 Tamanho do espaço
Total 118 amostral: n(S)
Espaço
amostral

Figura 4.6 – Resultado do levantamento


Fonte: Elaboração do autor (2006).

Se você escolher ao acaso uma pessoa do grupo pesquisado, qual


a probabilidade de ela ter vínculo do tipo:

a) funcionário público municipal?

b) comerciário?

c) comércio informal?

Unidade 4 161

probabilidade_e_estatistica_1582.indb 161 19/07/12 11:12


Universidade do Sul de Santa Catarina

Compreenda passo a passo

Passo 1: identificar os elementos do espaço amostral e do evento


solicitado.

S: todas as pessoas pesquisadas;


A: pessoa com vínculo do tipo funcionário público municipal;
B: pessoa com vínculo do tipo comerciário;
C: pessoa com vínculo do tipo comercio informal.

Passo 2: identificar o número de elementos de cada conjunto.

n(S) = 118
n(A) = 29
n(B) = 11
n(C) = 17

Passo 3: usar a fórmula da probabilidade.

Obs: Após efetuar a divisão, é só multiplicar o resultado por 100


para obter a probabilidade na forma percentual.

Para o evento A

P(A) = 0,2458 ou 24,58%

Para o evento B

P(B) = 0,0932 ou 9,32%

Para o evento C

P(C) = 0,1441 ou 14,41%

No exemplo anterior, você calculou a probabilidade para


três eventos. A seguir, você montará uma tabela com as
probabilidades para todos os eventos calculados. Siga os passos:

162

probabilidade_e_estatistica_1582.indb 162 19/07/12 11:12


Probabilidade e Estatística

Compreenda passo a passo

Passo 1: identificar os elementos do espaço amostral e do evento


solicitado.

S: todas as pessoas pesquisadas (no caso, pessoas acometidas de


estresse);
D: pessoa com vínculo do tipo funcionário público estadual;
E: pessoa com vínculo do tipo funcionário público federal;
F: pessoa com vínculo do tipo temporário.

Passo 2: identificar o número de elementos de cada conjunto.

n(S) = 118
n(D) = 24
n(E) = 20
n(F) = 17

Passo 3: usar a fórmula da probabilidade.

Obs: Após efetuar a divisão, é só multiplicar o resultado por 100


para obter a probabilidade na forma percentual.

Para o evento D

P(D) = 0,2034 ou 20,34%

Para o evento E

P(E) = 0,1695 ou 16,95%

Para o evento F

P(F) = 0,1441 ou 14,41%

Unidade 4 163

probabilidade_e_estatistica_1582.indb 163 19/07/12 11:12


Universidade do Sul de Santa Catarina

Passo 4: montar a tabela com as probabilidades correspondentes a


cada evento.

Tabela 4.1 – Levantamento com 90 chefes de famílias sobre os diferentes vínculos de


trabalho
Tipos de vínculo Nº de pessoas Probabilidade
M Funcionário público municipal 29 0,2458
E Funcionário público estadual 24 0,2034
F Funcionário público federal 20 0,1695
C Comerciário 17 0,1441
T Temporário 17 0,1441
I Comércio informal 11 0,0932
Total 118 1*
* Repare que a soma é 1 ou 100%
Fonte: Elaboração do autor (2006).

Agora que você já compreendeu o conceito clássico de


probabilidade e como realizar os cálculos, é hora de compreender
o que é frequência relativa e como realizar os cálculos.

Frequência Relativa
A frequência relativa de um evento A é calculada dividindo o
número de vezes que ocorre o evento A pelo total de observação
do experimento. É chamada, também, de probabilidade
avaliada ou probabilidade estimada.

Veja a fórmula abaixo:

Frequência relativa de um evento A:

número de vezes que ocorreu A


frA =
número total de observações

164

probabilidade_e_estatistica_1582.indb 164 19/07/12 11:12


Probabilidade e Estatística

Na verdade, a frequência relativa é calculada quando você se deparar


com situações em que o cálculo da probabilidade de um evento não
é possível. Nesse caso, só é possível o cálculo de uma aproximação,
a qual, por sua vez, consiste em analisar o experimento e, com os
resultados obtidos, calcular a frequência relativa.

É importante que você saiba que essa aproximação


para o cálculo de probabilidade só será considerável
caso haja um número bastante grande de tentativas
de execução do experimento. Como fazer isso? Veja os
exemplos a seguir.

Exemplos do cálculo da frequência relativa


Em um teste feito em laboratório com cobaias, foi analisada uma
delas e, após inúmeras vezes, sob efeito de estímulos (comida,
reação a dor etc.), ela executou um comando, que era empurrar
uma pequena alavanca. Foi observado que, após 3500 estímulos,
a cobaia executou o comando 875 vezes. Qual é a frequência
relativa para o evento A: a cobaia executar o comando?

Acompanhe passo a passo

Passo 1: identificar o numerador e o denominador da fórmula.

Número total de observações: 3500


Número de vezes que ocorre A: 875

Unidade 4 165

probabilidade_e_estatistica_1582.indb 165 19/07/12 11:12


Universidade do Sul de Santa Catarina

Passo 2: usar a fórmula da frequência relativa.

Obs: Após efetuar a divisão, é só multiplicar o resultado por 100


para obter a probabilidade na forma percentual.

número de vezes que ocorreu A


frA =
número total de observações

Passo 3: interpretar os dados.

A frequência relativa para a cobaia executar a tarefa é de 25%; ou,


ainda, a probabilidade estimada da cobaia executar a tarefa é de 25%.

Algumas considerações
Consideremos S um espaço amostral, e A, B, C são eventos
contidos em S, então:

a) para cada evento A → 0 ≤ P(A) ≤ 1 (a probabilidade de A


vai de 0 a 1 ou de 0% a 100%);

b) P(S) = 1 ↔

c) sejam A, B e C todos os eventos possíveis do espaço


amostral, então: P(A) + P(B) + P(C) = 1 ou 100%;

d) quando A e B são mutuamente exclusivos:


P(A∪B) = P(A) + P(B);

e) quando A e B não são mutuamente exclusivos:


P(A∪B) = P(A) + P(B) – P(A∩B);

f) se A, B, C, ... são uma sequência de eventos mutuamente


exclusivos, então:
P(A∪B∪C∪...) = P(A) + P(B) + P(C) + ...

166

probabilidade_e_estatistica_1582.indb 166 19/07/12 11:12


Probabilidade e Estatística

Seção 3 – Noções sobre variável aleatória e


distribuição de probabilidades
A variável aleatória é uma ferramenta na análise estatística que
possibilita a atribuição de números para resultados de experimentos,
adequando, assim, o problema para um melhor tratamento
matemático. Dentro da Estatística, ela é considerada uma função
que associa números aos eventos de um espaço amostral. Você
poderá entender melhor se começar analisando um exemplo.

Exemplos de variável aleatória e distribuição de probabilidades


Exemplo 1: se o experimento consistir em dois lançamentos de
uma moeda, e a variável aleatória (v.a.), definida como o nº de caras
obtidas em dois lançamentos de uma moeda, então você terá:

v.a. ⇒ X = nº de caras obtidas em dois lançamentos de uma moeda

X definirá uma variável aleatória que poderá assumir os valores


descritos na tabela a seguir (K = cara e C = coroa).

Tabela 4.2 – Organização dos resultados e valores

Resultados Resultados Resultados possíveis nos dois


2º lançamento lançamentos Valor VA
1º lançamento
K K KK 2
K C KC 1
C K CK 1
C C CC 0

Fonte: Elaboração do autor (2006).

Você pode observar que existe apenas uma possibilidade para


cada situação e o total de possibilidades é 4; então o cálculo da
probabilidade se dá da seguinte forma:

Unidade 4 167

probabilidade_e_estatistica_1582.indb 167 19/07/12 11:12


Universidade do Sul de Santa Catarina

Escrevendo na tabela, atribuindo a probabilidade de cada linha


você terá:

Tabela 4.3 – Distribuição de probabilidade

Resultados possíveis Valor VA Probabilidade


nos dois lançamentos
KK 2 1/4
KC 1 1/4 Duas
CK 1 1/4 possibilidades de
sair uma cara
CC 0 1/4

Fonte: Elaboração do autor (2006).

Esta tabela caracteriza a distribuição de


probabilidade, que é a probabilidade de ocorrência
de cada um dos valores da variável aleatória.

Note que o valor 1 se repete, não é? Então, você pode agrupar


e montar uma nova tabela sem as repetições. É claro que se
agrupam os valores repetidos. Você deve somar as probabilidades,
não se esqueça disso. Observe:

Tabela 4.4 – Agrupamento de resultados


Nº de caras (Valor v.a.) Probabilidade
2 1/4
1 1/2
0 1/4 Ao agrupar os resultados
da variável aleatória (uma
Fonte: Elaboração do autor (2006). cara – 1), você deve somar
as probabilidades:

168

probabilidade_e_estatistica_1582.indb 168 19/07/12 11:12


Probabilidade e Estatística

Seção 4 – Os tipos de distribuições de probabilidades


O estudo de probabilidades é uma ferramenta de apoio à decisão.
É com base em seu estudo que você terá oportunidade de suporte
para analisar os experimentos, organizar suas possibilidades e, então,
partir para a ação, adotando o resultado que julgar mais eficaz.

A variável aleatória e a distribuição de probabilidades são muito


utilizadas nesse sentido. Você pode ver que, a cada valor da
variável, corresponde uma probabilidade de ocorrência. Como a
variável aleatória possibilita a atribuição de valores aos eventos,
você pode encontrar dois tipos de situação.

Variáveis aleatórias discretas: ela pode assumir um conjunto


constante discreto, ou seja, enumerável, finito de valores.

Número de caras resultante de lançamentos de uma


moeda, quantidade de caminhões de determinado
modelo, número de defeitos por peça, entre outros,
são exemplos deste tipo de variáveis.

Variáveis aleatórias contínuas: é a variável em que não


conseguimos enumerar seus possíveis resultados, por estes
formarem um conjunto infinito de valores num intervalo de
números reais.

São exemplos desse tipo de variáveis: peso, altura,


temperatura, tempo de transporte, custo de uma
operação etc.

Baseado nesses dois conceitos, você pode atribuir a cada um dos


tipos de variáveis aleatórias uma distribuição de probabilidades de
acordo com o tipo de variável, veja a figura a seguir:

Unidade 4 169

probabilidade_e_estatistica_1582.indb 169 19/07/12 11:12


Universidade do Sul de Santa Catarina

Variável aleatória Distribuição discreta


discreta de probabilidade

Variável aleatória Distribuição contínua


contínua de probabilidade
Figura 4.7 – Tipos de distribuição de probabilidade
Fonte: Elaboração do autor (2006).

Como você pôde observar, cada tipo de variável gera um tipo


de distribuição de probabilidade. Em resumo, os tipos de
distribuição de probabilidades são:

„„ Distribuição discreta de probabilidades; e

„„ Distribuição contínua de probabilidades.

Como elas são diferentes, os métodos de cálculos das


probabilidades também são.

Você vai estudar, na próxima seção, os modelos mais importantes


e mais aplicados dentro da área de seu curso, que são a
distribuição binomial, para a variável discreta, e a distribuição
normal, para a contínua.
Para o bom andamento de seu
estudo, é importante que você
entenda bem a diferença entre
as duas variáveis, a discreta e a
contínua!

170

probabilidade_e_estatistica_1582.indb 170 19/07/12 11:12


Probabilidade e Estatística

Seção 5 – Cálculo de probabilidade usando a


distribuição
Uma distribuição discreta de probabilidade de uma variável
aleatória atribui probabilidades aos distintos valores
dessa variável. Observe que essa distribuição não atribui
probabilidade para intervalos, e sim para cada valor ou para um
conjunto de valores da variável.

Uma das principais distribuições discretas é a binomial. Veja, a


seguir, como se calcula probabilidade usando esse método.

Como se calcula a distribuição binomial?

A distribuição binomial é o método utilizado para cálculo de


probabilidades de experimentos que se repetem algumas vezes e
seguem algumas características.

A distribuição binomial é aplicável se:

1. o experimento que você está observando for repetido n


vezes independentes;

2. cada tentativa (repetição) admitir somente dois


resultados:

„„ sucesso: denotado por S;

„„ fracasso: denotado por F.

A probabilidade de sucesso é denotada por p ⇒ P(S) = p, e a


probabilidade de fracasso é denotada por q ⇒ P(F) = q.

Importante: A soma da probabilidade de sucesso e fracasso é


igual a 100%, ou seja, é igual a 1 ⇒ p + q = 1.

A soma é utilizada se você estiver interessado em estudar o número


de sucessos e fracassos sem importar a ordem em que acontecem.

Unidade 4 171

probabilidade_e_estatistica_1582.indb 171 19/07/12 11:12


Universidade do Sul de Santa Catarina

Diante do exposto, é importante salientar que:

„„ a distribuição binomial só é aplicável caso ocorram os


três casos citados anteriormente;

„„ os termos sucesso e fracasso são usados se o resultado


esperado ocorre ou não, ou seja, depende do objetivo de
seu estudo.

Veja o exemplo a seguir para compreender como realizar os


cálculos:

Em um exame, você deseja saber a probabilidade de erro de uma


determinada questão. Essa questão apresenta cinco alternativas
(a, b, c, d, e) e somente uma está correta.

Qual é a probabilidade de sucesso?

Nesse caso, o objetivo é estudar a probabilidade de erro, então, o


sucesso se refere ao erro. Para calcular a probabilidade de sucesso,
você deve calcular a probabilidade de erro da questão.

Veja como se calcula passo a passo

Passo 1: identificar os elementos do espaço amostral e do evento


solicitado.

A: errar a questão
S: todas as opções (a, b, c, d, e)

Passo 2: identificar o número de elementos do evento e do espaço


amostral.

n(A) = 4 (se somente uma está correta, sobram quatro incorretas)


n(S) = 5

172

probabilidade_e_estatistica_1582.indb 172 19/07/12 11:12


Probabilidade e Estatística

Passo 3: usar a fórmula da probabilidade.

→ a probabilidade de sucesso é,

então, p = 0,8.

Qual é a probabilidade de fracasso?

Acompanhe passo a passo

Passo 1: identificar os elementos do espaço amostral e do evento


solicitado.

B: acertar a questão
S: todas as opções (a, b, c, d, e)

Passo 2: identificar o número de elementos do evento e do espaço


amostral.

n(B) = 1 (se somente uma está correta)


n(S) = 5

Passo 3: usar a fórmula da probabilidade.

– a probabilidade de sucesso é, então,

q = 0,2

Observe:
p + q = 0,8 + 0,2 = 1 ou 100%

- Espero que a diferença tenha sido percebida. Lembre-se de que o suces‑


so não está ligado a acontecimentos bons e, sim, se ocorrer o resulta‑
do que é objetivo de seu estudo.

Unidade 4 173

probabilidade_e_estatistica_1582.indb 173 19/07/12 11:12


Universidade do Sul de Santa Catarina

Analise o seguinte exemplo: estudar a probabilidade de errar,


como no exemplo anterior. Ainda citando o exemplo anterior:
nesse problema, você estudou a probabilidade de errar somente
uma questão do exame, e para estudar as possibilidades de erro
ou acerto de questões de um exame inteiro? É aí que entra a
distribuição binomial.

Você sabe qual o método de cálculo?

No exemplo anterior, você calculou a probabilidade de sucesso


(errar) para somente uma tentativa (questão). Agora, você
vai calcular, para n tentativas, a probabilidade de k sucessos.
Acompanhe:

Seja X o número de sucessos em n tentativas do experimento.

Então, a fórmula para determinar a probabilidade de um dado


número k de sucessos é dada por:

P(X = K) = Cn,k . pk . qn-k

Sendo:

Cn,k = combinação de n elementos organizados em grupos de k


elementos;
n = tentativas do experimento;
k = número de sucessos desejados;
p = probabilidade de sucesso (ocorrência do evento);
q = probabilidade de fracasso (não ocorrência do evento).

Notação: n!

n! = n.(n − 1).(n − 2). ... .2.1

k! = k.(k − 1).(k − 2). ... .2.1

Veja, a seguir, exemplos do cálculo de probabilidade usando a


distribuição binomial.

174

probabilidade_e_estatistica_1582.indb 174 19/07/12 11:12


Probabilidade e Estatística

Exemplo 1: uma prova com quatro questões, cada uma apresenta


cinco alternativas (a, b, c, d, e) e somente uma está correta. Qual
a probabilidade de errar duas questões?
Nesse caso, o objetivo é
Passo 1: calcular a probabilidade de errar (no caso, sucesso) para estudar a probabilidade
cada questão. de erro, então, o sucesso
se refere ao erro. Veja,
a seguir como se calcula
A: errar a questão passo a passo.
S: todas as opções (a, b, c, d, e)
n(A) = 4 (se somente uma está correta, sobram quatro incorretas)
n(S) = 5

– a probabilidade de sucesso é,
então, p = 0,8.

Passo 2: calcular a probabilidade de acertar (no caso, fracasso) para


cada questão.

Você pode calcular de dois modos:

1. Primeiro modo de cálculo:

B: acertar a questão
S: todas as opções (a, b, c, d, e)
n(B) = 1 (se somente uma está correta)
n(S) = 5
– a probabilidade de fracasso, então

q = 0,2

2. Segundo modo de cálculo:

p + q = 1 ⇒ 0,8 + q = 1 ⇒ q = 1 – 0,8 ⇒ q = 0,2

Unidade 4 175

probabilidade_e_estatistica_1582.indb 175 19/07/12 11:12


Universidade do Sul de Santa Catarina

Passo 3: identificar cada um dos componentes da fórmula.

n = 4 (total de repetições – são quatro questões com as mesmas


características)
k = 2 (número de sucessos – errar duas questões)
p = 0,8 (probabilidade de sucesso, calculado anteriormente)
q = 0,2 (probabilidade de fracasso, calculado anteriormente)

Passo 4: calcular a probabilidade usando a fórmula apresentada.

P(X = K) = Cn,k . pk . qn-k ⇒

Passo 5: como interpretar estes dados?

A probabilidade de uma pessoa acertar duas questões de um teste


de quatro questões é de 15,36%. Note que não é 50%, pois você
deve levar em consideração que cada questão tem sua probabilidade
e, também, você pôde agrupar as questões de várias maneiras (errar
a 1ª e a 3ª, ou a 2ª e a 4ª, ou a 1ª e a 4ª, e assim por diante).

Representação gráfica de uma distribuição binomial


Como se trata de uma distribuição, você pode construir um
gráfico que represente as probabilidades do problema do exemplo
usado. Claro que, para tanto, você deverá calcular a probabilidade
para cada possibilidade, ou seja, para k = 0, 1, 2, 3 e 4. Não se
assuste, pois, a seguir, você poderá acompanhar as probabilidades
calculadas na tabela e o gráfico desta distribuição.

176

probabilidade_e_estatistica_1582.indb 176 19/07/12 11:12


Probabilidade e Estatística

Tabela 4.5 – Probabilidade de errar as questões do teste

Número de erros P(X)


0 0,0016
1 0,0256
2 0,1536
3 0,4096
4 0,4096

Total 1

Fonte: Elaboração do autor (2006).

Note que para cada uma


das possibilidades é
construída uma coluna.

Gráfico 4.1 – Probabilidade de errar as questões no teste


Fonte: Elaboração do autor (2006).

Tudo o que você acabou de estudar, neste tópico, é o método


de cálculo de probabilidade usando a distribuição binomial. A
intenção, com esse estudo, é que você tenha uma noção desse
processo, porém sem maiores aprofundamentos.

Unidade 4 177

probabilidade_e_estatistica_1582.indb 177 19/07/12 11:12


Universidade do Sul de Santa Catarina

Cálculo de probabilidade usando distribuição contínua de


probabilidade
Uma distribuição contínua de probabilidade de uma variável
aleatória atribui probabilidades a intervalos de valores dessa
variável. Note que essa distribuição atribui probabilidade para
intervalos, e não para um valor dessa variável.

Uma das principais distribuições contínuas é a normal.


No decorrer desse tópico, você vai estudar um pouco dessa
distribuição, além de aprender a calcular probabilidade usando
esse método.

A distribuição normal
Como você estudou anteriormente, quando se utiliza uma
variável aleatória contínua, pode-se atribuir probabilidade a
essa variável. Conforme a seção anterior, os processos definidos
a partir de contagens conduzem aos modelos que envolvem
variáveis aleatórias discretas, enquanto que os processos definidos
a partir de medidas conduzem aos modelos que envolvem
variáveis aleatórias contínuas.

Contagens Variável aleatória


discreta

Variável aleatória
Medidas
contínua
Figura 4.8 – Tipos de distribuições de probabilidade
Fonte: Elaboração do autor (2006).

Podemos citar, como exemplos de variáveis contínuas, a altura


das pessoas, temperatura corporal, peso, escores obtidos em testes
psicológicos etc.

Antes de começar o estudo do cálculo de probabilidade usando a


distribuição normal, vamos relembrar alguns conceitos.

Considere a distribuição de frequências e seu histograma a


seguir:

178

probabilidade_e_estatistica_1582.indb 178 19/07/12 11:12


Probabilidade e Estatística

Tabela 4.6 – Tempo, em minutos, para as entregas urbanas da empresa X

Tempo (em minutos) Nº de entregas (fi)


15,9 |--- 18,7 2
18,7 |--- 21,5 6
21,5 |--- 24,3 10
24,3 |--- 27,1 14
27,1 |--- 29,9 10
29,9 |--- 32,7 6
32,7 |--- 35,5 2
Total (∑fi) 50

Fonte: Elaboração do autor (2006).

Histograma

Gráfico 4.2 – Tempo, em minutos, para as entregas urbanas da empresa X


Fonte: Elaboração do autor (2006).

Unidade 4 179

probabilidade_e_estatistica_1582.indb 179 19/07/12 11:12


Universidade do Sul de Santa Catarina

Observe que o gráfico é construído no sistema de eixos


cartesianos, não é mesmo? No eixo horizontal, são marcados
os valores ou intervalos das classes assumidos pela variável. No
eixo vertical, marcamos as frequências simples, que servirão para
marcar a altura dos retângulos, indicando, assim, o número de
observações (ocorrências) de cada valor ou classe da variável.

Como a altura de cada retângulo é proporcional à


frequência simples, a área de cada retângulo também
Mantenha essa informação à mão, é. Considerando isso, a soma das áreas dos retângulos
pois, você irá usá-la novamente! também é proporcional à frequência total.

Continuando com a recordação, veja, agora, o polígono de


frequências. Para construir um polígono de frequência de dados,
é só unir, por linhas, os pontos médios das bases superiores dos
retângulos do histograma.

Acompanhe o exemplo a seguir.

Tempo, em minutos, para as entregas urbanas da empresa X

16

14 Polígono de Estes triângulos


Frequência compensam os
12
que ficam fora
No de entregas

10 do polígono.
8

0
,7

,5

,3

,1

,9

,7

,5
18

21

24

27

29

32

35
|—

|—

|—

|—

|—

|—

|—
,9

,7

,5

,3

,1

,9

,7
15

18

21

24

27

29

32

Tempo em minutos

Gráfico 4.3 – Tempo, em minutos, para as entregas urbanas da empresa X


Fonte: Elaboração do autor (2006).

180

probabilidade_e_estatistica_1582.indb 180 19/07/12 11:12


Probabilidade e Estatística

Você pôde observar que a área do histograma é igual à área


abaixo do polígono de frequências, ou seja, os triângulos que
ficam fora são compensados por aqueles que estão adicionados
por dentro.

O gráfico expressa os tempos que a empresa levou


para realizar 100% das entregas de um determinado
período.

Você observou que o polígono de frequências tem um formato


especial? Sim, ele tem o formato de um sino. Essa curva é chamada
de curva normal ou curva de Gauss-Laplace e tem algumas
características bem especiais. Conheça-a no tópico a seguir.

Características da curva normal


Analisando o polígono de frequências da grande maioria
das séries, você pode observar, com certo ajuste, que elas se
aproximam de uma distribuição normal, ou seja, apresentam um
gráfico semelhante conforme pode ser observado a seguir:

X=Me=Mo x
Gráfico 4.4 – Curva de Gauss-Laplace
Fonte: Adaptado de Silva (1997, p. 70).

Unidade 4 181

probabilidade_e_estatistica_1582.indb 181 19/07/12 11:12


Universidade do Sul de Santa Catarina

Principais características da curva normal


Dentre as principais, podemos citar algumas tais como:

a) a curva se caracteriza por ter a forma de um sino;

b) a curva tem 2 pontos de inflexão (lugar onde a curva se


modifica);

c) a curva normal é simétrica com relação à média (é igual


tanto à esquerda, quanto à direita da média);

d) a área limitada pela curva e pelo eixo das abscissas é 1 ou


100% (sendo assim, por ser simétrica, tem 50% da área à
esquerda e 50% da área à direita da média);

e) a curva é assintótica, isto é, se aproxima indefinidamente


do eixo das abscissas sem tocá-lo;

f) a curva normal é unimodal, isto é, possui um só pico ou


ponto de frequência máxima, ponto este onde coincidem
a moda, a média e a mediana;

g) a função que define a curva é:

A distribuição normal de probabilidade usa como base


a curva normal.

Sabendo que a área abaixo do polígono (curva) representa


proporcionalmente a frequência total da série, e com o uso da
média e do desvio padrão tem-se condições de realizar estudo de
concentração dos dados em torno da média.

Com relação à área abaixo da curva, analise o gráfico a seguir:

34,13%

13,59% 0,5 ou 50%


2,15%
X

Gráfico 4.5 – Distribuição normal, com percentuais em referência ao desvio padrão


Fonte: Adaptado de Triola (1999, p. 43).

182

probabilidade_e_estatistica_1582.indb 182 19/07/12 11:12


Probabilidade e Estatística

Veja, a seguir, alguns exemplos para compreender como realizar


os cálculos do desvio padrão.

Em um teste, a média dos escores de um grupo de pessoas foi de


= 80, e o desvio padrão foi de σ(x) = 3. Pode-se interpretar esses
valores da seguinte forma:

Os valores da série estão concentrados em torno da média:

„„ o intervalo ( − σ (x); + σ (x)) contém aproximadamente


68,26% dos elementos da série, ou seja, o intervalo
(77; 83) → (80 − 3 = 77 e 80 + 3 = 83);

„„ o intervalo ( − 2 σ (x); + 2 σ (x)) contém


aproximadamente 95,44% dos elementos da série, ou
seja, o intervalo(74; 86) → (80 − 6 = 74 e 80 + 6 = 86);

„„ o intervalo ( − 3 σ (x); + 3 σ (x)) contém


aproximadamente 99,74% dos elementos da série, ou seja,
o intervalo (71; 89) → (80 − 9 = 71 e 80 + 9 = 89).

Veja, no gráfico a seguir, a ilustração desse exemplo:

99,74%
95,44%
68,26%

34,13% 34,13%

13,59% 13,59%
2,15% 2,15%

71 74 77 =80 83 86 89

Gráfico 4.6 – Distribuição normal, com percentuais em referência ao desvio padrão


Fonte: Adaptado de Triola (1999, p. 43).

Unidade 4 183

probabilidade_e_estatistica_1582.indb 183 19/07/12 11:12


Universidade do Sul de Santa Catarina

Como ler os gráficos? Aí vão algumas sugestões:

 O percentual de entregas com tempo entre 77 e


83 minutos é de 68,26% (ou, ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 77 e
83 minutos é de 68,26%).
 O percentual de entregas com tempo entre 74 e
86 minutos é de 95,44% (ou ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 74 e 86
minutos é de 95,44%).
 O percentual de entregas com tempo entre 71 e
89 minutos é de 99,74% (ou ainda, a probabilidade de
escolher uma entrega que tenha sido feita entre 71 e 89
minutos é de 99,74%).

Como você pôde observar, os percentuais estão ligados à média


e ao desvio padrão e, por sua vez, determinam os intervalos a
serem estudados. Esses percentuais são obtidos calculando a área
entre a curva e o eixo X, entre os extremos do intervalo que você
está estudando. Exemplo: (77; 83).

Baseado nesse estudo é que você poderá calcular a probabilidade


de algum evento que resulte em um intervalo. Veja como fazer
esses cálculos no próximo tópico.

Descrição do método de cálculo


A probabilidade em uma distribuição contínua de probabilidade
(probabilidade de ocorrência de um intervalo) é obtida calculando
a área entre a curva e o eixo X, como você já viu em estudos
anteriores. Essa área é calculada com o uso de uma ferramenta
matemática chamada de integral definida da função, ou seja,
dada a função a seguir, a área entre a curva e o eixo X, no
intervalo (a; b), é calculada da seguinte forma:

184

probabilidade_e_estatistica_1582.indb 184 19/07/12 11:12


Probabilidade e Estatística

f
P(a<x<b)

a b x
Gráfico 4.7 – Distribuição normal, com intervalo definido
Fonte: Adaptado de Silva (1997, p. 71).

- A determinação desta área usando-se o cálculo de integral é bastan‑


te complicada e não será usado em seu estudo. Para superar essa
dificuldade, utiliza-se outra distribuição, chamada de Distribui‑
ção Normal Padronizada (ou Reduzida). O artifício consiste em
transformar a variável X, com média e desvio padrão σ, em
uma variável Z , com média 0 e desvio padrão 1, para que você
possa fazer utilização da tabela de Z (variável padronizada) com
os valores das áreas já calculados.

Mas como podemos padronizar?

Esta padronização é adotada para tornar o cálculo de probabilidade


da ocorrência de intervalo mais fácil e mais simples. Qualquer
distribuição X com as características citadas anteriormente pode ser
transformada na distribuição normal padronizada (ou reduzida) Z,
para que seja possível o cálculo de áreas.

A transformação da variável aleatória X na variável padronizada


se dá mediante o uso da fórmula a seguir:

Unidade 4 185

probabilidade_e_estatistica_1582.indb 185 19/07/12 11:12


Universidade do Sul de Santa Catarina

Cálculo da variável padronizada:

Em que:

X1 = valor da v.a. (limite do intervalo)

= média

σ = desvio padrão

Acompanhe os exemplos a seguir para compreender como


realizar o cálculo.

Exemplo 1: a área a ser calculada está no intervalo que vai da


média até x1. Nesse caso, só é necessário o cálculo de um limite
do intervalo.

P( <x<x1)

x1 x

P(0<z<z1)

0 z1 z
Gráfico 4.8 e 4.9 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p. 71).

Nesse caso, a probabilidade de ocorrer o intervalo da média ate o


x1 é igual à probabilidade de ocorrer o intervalo de
0 à z1 ⇒ P( < x < x1) = P(0 < z < z1)

Exemplo 2: A área a ser calculada está no intervalo que vai de


x1 até x 2. Nesse caso, é necessário o cálculo de dois limites do
intervalo (z1 e z2).

186

probabilidade_e_estatistica_1582.indb 186 19/07/12 11:12


Probabilidade e Estatística

Cálculo da variável padronizada:

Onde:

X1 e X 2 = valores da v.a. (limites do intervalo)

= média

σ = desvio padrão

P(x1<x<x2)

x1 x2 x
P(z1<Z<z2)

z1 0 z2 z
Gráfico 4.10 e 4.11 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p.71).

Nesse caso, a probabilidade de ocorrer o intervalo entre x1 e x 2 é


igual à probabilidade de ocorrer o intervalo entre
z1 e z2 ⇒ P(x1 < x < x 2) = P(z1 < z < z2).

Até aqui, você conheceu como padronizar os valores da variável


aleatória X. Agora, você irá aprender como usar a tabela de áreas
da distribuição padronizada.
Com o valor de Z calculado,
basta encontrar o valor na
tabela (ver tabela no final
As áreas dadas na tabela são sempre de 0 a Z. desse livro didático).

Unidade 4 187

probabilidade_e_estatistica_1582.indb 187 19/07/12 11:12


Universidade do Sul de Santa Catarina

Veja, a seguir, um gráfico com representação da área dada pela


tabela.

Área
0 z
Gráfico 4.12 – Distribuição normal padronizada
Fonte: Triola (1999).

Observe que, conhecendo a área especificada na tabela, qualquer


tipo de área poderá ser calculada usando a simetria da curva.

Observe os exemplos a seguir com atenção.

Exemplo 1: Em um levantamento executado por uma empresa de


entregas, resultou que o tempo médio para a realização das entregas
era de 21 minutos e o desvio padrão foi de 7 minutos. Ao escolher,
ao acaso, uma das entregas realizadas, qual a probabilidade de o
tempo para realizá-la estar entre 21 e 28 minutos?

Calculando passo a passo

Passo 1: identificar todos os elementos que compõem o problema.

„„ média: = 21;

„„ desvio padrão: σ(x) = 7;

„„ os limites do intervalo: como um dos limites é a própria


média, você só terá que calcular um Z. O outro limite é
28 ⇒ X = 28.

188

probabilidade_e_estatistica_1582.indb 188 19/07/12 11:12


Probabilidade e Estatística

Passo 2: calcular a variável padronizada Z.

⇒Z=1

Passo 3: identificar, no gráfico, qual é a área que você deve encontrar.

Veja que a área está entre


Área zero e 1.

µ=21 x=28

Área
0 z=1
Gráfico 4.13 e 4.14 – Padronização de uma distribuição normal
Fonte: Elaboração do autor (2006).

Passo 4: procurar, na tabela, o Z = 1,00 e encontrar sua área


correspondente.

„„ Primeiro, você deve procurar o valor 1,0 na primeira


coluna.

„„ Depois, procurar, na primeira linha, o valor 0,00 (é como


se separasse o número 1,00 em dois, uma parte seria 1,0
e a outra seria o 0,00).

„„ No cruzamento da coluna em que está o 0,00 e da linha


em que está o 1,0, você encontrará um número (no caso é
0,3413).

„„ Esse número é a área entre Z e 0.

Unidade 4 189

probabilidade_e_estatistica_1582.indb 189 19/07/12 11:12


Universidade do Sul de Santa Catarina

Z 0,00 0,01 0,02


0,0 0,0000 0,0040 0,0080
0,l 0,0398 0,0438 0,0478
0,2 0,0793 0,0832 0,0871
0,3 0,1179 0,1217 0,1255
0,4 0,1554 0,1591 0,1628
0,5 0,1915 0,1950 0,1985
0,6 0,2257 0,2291 0,2324
0,7 0,2580 0,2611 0,2642
0,8 0,2881 0,2910 0,2939
0,9 0,3159 0,3186 0,3212
1,0 0,3413 0,3438 0,3461
1,1 0,3643 0,3665 0,3686
1,2 0,3849 0,3869 0,3888
1,3 0,4032 0,4049 0,4066

Passo 5: responder e interpretar.

P(21 < x < 28) = 0,3413 ou 34,13%

A probabilidade do tempo para realizar uma entrega estar entre


21 e 28 minutos é de 34,13%.

Exemplo 2: Em média, a vida útil de um modelo de máquina de


empacotar é de 24 anos, com um desvio padrão de 6 anos. Levando
em consideração que a vida útil deste tipo de máquina se distribui
normalmente, qual a probabilidade de uma máquina, adquirida
recentemente pela empresa, durar entre 17,52 e 29,7 anos?

190

probabilidade_e_estatistica_1582.indb 190 19/07/12 11:12


Probabilidade e Estatística

Calculando passo a passo

Passo 1: identificar todos os elementos que compõem o problema.

„„ A média: = 24;

„„ desvio padrão: σ(x) = 6;

„„ os limites do intervalo: como os limites são diferentes


da média, você deve calcular Z para os dois valores
(x1 = 17,52 e x 2 = 29,7).

Passo 2: calcular as variáveis padronizadas Z1 e Z2.

Passo 3: identificar, no gráfico, qual é a área que você deseja


encontrar.

Área
x2=17,52 µ=24 x1=29,7

Área
z=-1,08 0 z=0,95

Gráfico 4.15 e 4.16 – Padronização de uma distribuição normal


Fonte: Adaptado de Silva (1997, p.71).

Veja que a área está entre –1,08 e 0,95.

Unidade 4 191

probabilidade_e_estatistica_1582.indb 191 19/07/12 11:12


Universidade do Sul de Santa Catarina

Não se preocupe com o sinal negativo de Z1. Esse


sinal só serve para indicar que a área está à esquerda
da média (zero), por isso, o negativo. Como a curva
é simétrica, a área tanto à esquerda como à direita
é calculada da mesma maneira, e o uso da tabela
também é o mesmo.

Passo 4: procurar, na tabela, o Z1 = −1,08 e Z2 = 0,95 e encontrar suas


áreas correspondentes.

Como usar a tabela?

É possível procurando o Z1. Veja de que forma:

„„ primeiro, procurar o valor 1,0 na primeira coluna;

„„ depois, procurar, na primeira linha, o valor 0,08 (é como


se separasse o número 1,08 em dois: uma parte seria 1,0,
e a outra seria o 0,08);

„„ no cruzamento da coluna na qual está o 0,08 e da linha


na qual está o 1,0, você encontrará um número (no caso é
0,3599). Esse número é a área entre Z1 e 0.

Tabela 4.7 – Tabela de valores normais Z

Cruzando a
linha com a
Procurar 1,0 coluna.

Procurar 0,08 Z 0,00 0,01 ... 0,07 0,08


0,0 0,0000 0,0040 ... 0,0279 0,0319
0,l 0,0398 0,0438 ... 0,0675 0,0714
0,2 0,0793 0,0832 ... 0,10 64 0,1103
... ... ... ... ... ...
0,8 0,2881 0,2910 ... 0,3078 0,3106
0,9 0,3159 0,3186 ... 0,3340 0,3365
Cruzando a 1,0 0,3413 0,3438 ... 0,3577 0,3599
linha com a
coluna. 1,1 0,3643 0,3665 ... 0,3790 0,3810
1,2 0,3849 0,3869 ... 0,3980 0,3997
Fonte: Elaboração do autor (2006).
192

probabilidade_e_estatistica_1582.indb 192 19/07/12 11:12


Probabilidade e Estatística

Agora, falta procurar o Z2. Como fazer:

„„ primeiro, você deve procurar o valor 0,9 na primeira


coluna;

„„ depois, procurar, na primeira linha, o valor 0,05 (é como


se separasse o número 0,95 em dois: uma parte seria 0,9,
e a outra seria o 0,05);

„„ no cruzamento da coluna na qual está o 0,05 e da linha


na qual está o 0,9, você encontrará um número (no caso é
0,3289). Esse número é a área entre Z2 e 0.

Tabela 4.8 – Tabela de valores normais Z


Z 0,00 ... 0,04 0,05
0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
0,9 0,3159 ... 0,3264 0,3289
1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749

Fonte: Elaboração do autor (2006).

Passo 5: responder e interpretar.

Como você tem duas áreas, o próximo passo é somar, veja o


gráfico a seguir:

Gráfico 4.17 – Soma das áreas determinadas pela padronização


Fonte: Elaboração do autor (2006).

Unidade 4 193

probabilidade_e_estatistica_1582.indb 193 19/07/12 11:12


Universidade do Sul de Santa Catarina

P(17,52 < x < 29,7) = 0,3599 + 0,3289 = 0,6888 ou 68,88%.

A probabilidade de uma máquina, adquirida recentemente pela


empresa, durar entre 17,52 e 29,7 anos é de 68,88%.

Exemplo 3: Em média, a vida útil de um modelo de máquina


de empacotar é de 24 anos, com um desvio padrão de 6 anos.
Levando em consideração que a vida útil deste tipo de máquina
se distribui normalmente, qual a probabilidade de uma máquina,
adquirida recentemente pela empresa, durar mais que 29,7 anos?

Calculando passo a passo, temos

Passo 1: identificar todos os elementos que compõem o problema.

„„ a média: = 24;

„„ o desvio padrão: σ(x) = 6;

„„ os limites do intervalo: o intervalo é limitado abaixo por


x = 29,7 e não tem limite acima. Você deve calcular Z
somente para esse valor de x.

Passo 2: calcular a variável padronizada Z.

194

probabilidade_e_estatistica_1582.indb 194 19/07/12 11:12


Probabilidade e Estatística

Passo 3: identificar, no gráfico, qual é a área que você deseja


encontrar.

Área
µ=24 x1=29,7

Área
0 z=0,95

Gráfico 4.18 e 4.19 – Padronização de uma distribuição normal


Fonte: Elaboração do autor (2006).

Veja que a área está de 0,95 para cima.

Passo 4: Procurar, na tabela, o Z = 0,95 e encontrar sua área


correspondente.

Como usar a tabela?

„„ Primeiro, você deve procurar o valor 0,9 na primeira


coluna;

„„ depois, procurar, na primeira linha, o valor 0,05 (é como


se separasse o número 0,95 em dois, uma parte seria 0,9 e
a outra seria o 0,05);

„„ no cruzamento da coluna na qual está o 0,05 e da linha


na qual está o 0,9, você encontrará um número (no caso é
0,3289). Esse número é a área entre Z2 e 0.

Unidade 4 195

probabilidade_e_estatistica_1582.indb 195 19/07/12 11:12


Universidade do Sul de Santa Catarina

Cruzando a
linha com a
Procurar 0,9 coluna.

Procurar 0,05 Z 0,00 ... 0,04 0,05


0,0 0,0000 ... 0,0160 0,0199
0,l 0,0398 ... 0,0557 0 ,0596
... ... ... ... ...
0,7 0,2580 ... 0,2704 0,2734
0,8 0,2881 ... 0,2995 0,3023
Cruzando a 0,9 0,3159 ... 0,3264 0,3289
linha com a
coluna. 1,0 0,3413 ... 0,3508 0,3531
1,1 0,3643 ... 0,3729 0,3749

Passo 5: interpretar e responder.

Como a área dada pela tabela é sempre entre zero e Z,


como calcular a área de Z para cima?

Você lembra que a curva normal é simétrica e que, de cada lado,


tem 50% da área total? Pois é! Se a metade tem 50% ou 0,5 e
você diminuir dessa área a área encontrada, restará a que você
quer encontrar. Veja o gráfico a seguir:

0,3289

0,5-0,3289
0 z=0,95
Gráfico 4.20 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Fonte: Elaboração do autor (2006).

A área cinza escuro é calculada diminuindo 0,3289 (área entre


zero e Z – encontrada na tabela) de 0,5.

P(x > 29,7) = 0,5 – 0,3289 = 0,1711 ou 17,11%

196

probabilidade_e_estatistica_1582.indb 196 19/07/12 11:12


Probabilidade e Estatística

Então, a probabilidade de uma máquina, adquirida recentemente


pela empresa, durar mais que 29,7 anos é de 17,11%.

Além dos casos que você estudou nos exemplos, ainda há outros.
Um deles pode ser ilustrado a seguir:

0,3413 0,5
ou
34,13% ou
50%
X
Gráfico 4.21 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Fonte: Elaboração do autor (2006).

Caso o limite inferior do intervalo esteja à esquerda da média,


o processo é o mesmo, calcular o Z, encontrar a área na tabela
e, no final, calcular a área final. No caso anterior, note que você
terá que juntar as duas áreas, a cinza claro com a cinza escuro.
Lembre-se de que a área, na metade da curva, é de 0,5 ou 50%.
Somando as duas: 0,5 + 0,3413 = 0,8413 ou 84,13%.

Unidade 4 197

probabilidade_e_estatistica_1582.indb 197 19/07/12 11:12


Universidade do Sul de Santa Catarina

Síntese

Nessa unidade, você começou a conhecer a maneira como


lidar com o acaso. O cálculo de probabilidade nada mais é que
uma tentativa de entender e organizar o acaso. Você aprendeu
como calcular a probabilidade de um evento e, além disso,
compreendeu como calcular a frequência relativa.

Teve uma noção sobre o que é uma variável aleatória e sua


distribuição de probabilidades. Essas são ferramentas muito
importantes dentro das análises estatísticas que você terá que
fazer ao longo de seu curso e de sua profissão.

Você estudou, também nesta unidade, dois tipos de distribuições


de probabilidade. Conheceu as diferenças entre variável aleatória
discreta e contínua, bem como entre suas distribuições de
probabilidade. Aprendeu, também, a calcular probabilidade com
essas distribuições. Não foi tão difícil, não é?

Os conteúdos estudados nessa unidade, além de serem utilizados


em situações práticas dentro de seu curso, bem como no
desenvolvimento de sua vida profissional, são, também, base para
o estudo de amostragem, um assunto importante quando se trata
de probabilidade.

198

probabilidade_e_estatistica_1582.indb 198 19/07/12 11:12


Probabilidade e Estatística

Atividades de autoavaliação

Ao final de cada unidade, você realizará atividades de autoavaliação. O


gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.

1) Em estudo realizado sobre os padrões de indecisão, depressão e


ansiedade em adolescentes, revelou-se que a relação com os pais era
fator influenciador dessas reações. Nessa pesquisa, foi pesquisado um
total de 1500 adolescentes, e em 675 casos, os jovens sofriam com o
autoritarismo dos pais. Qual a probabilidade de ser escolhido ao acaso,
um jovem que sofra com o autoritarismo dos pais?

Unidade 4 199

probabilidade_e_estatistica_1582.indb 199 19/07/12 11:12


Universidade do Sul de Santa Catarina

2) Segundo o IBGE, na Grande Florianópolis, as pessoas de dez anos ou


mais de idade, por estado civil foram agrupados na tabela abaixo:

Desquitado(a)
Casado(a) ou separado(a) Divorciado(a) Viúvo(a) Solteiro(a) Total
judicialmente
267.867 18.697 16.779 28.224 333.974 665.541

Se uma pessoa da Grande Florianópolis for escolhida ao acaso, qual é a


probabilidade de ela ser:

a) casada?
b) solteira?
c) divorciada?

200

probabilidade_e_estatistica_1582.indb 200 19/07/12 11:12


Probabilidade e Estatística

3) Em testes feitos em laboratório com cobaias, foram analisadas duas


delas e, após inúmeras tentativas, a cobaia 1 sofria estímulos com
reação a dor enquanto a cobaia 2 sofria estímulos com alimentação. A
pesquisa visava à execução de uma tarefa que era a de empurrar uma
pequena alavanca, considerada uma reação positiva. Os resultados
foram apresentados na seguinte tabela:

Número total de Número de reações


Cobaia Estímulo tentativas positivas
Cobaia 1 Efeitos de dor 4500 1215
Cobaia 2 Alimentação 3500 1050

a) Qual a frequência relativa (ou probabilidade estimada) para o número


de reações positivas para cada cobaia?
b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?

Unidade 4 201

probabilidade_e_estatistica_1582.indb 201 19/07/12 11:12


Universidade do Sul de Santa Catarina

4) O teste chamado Tarefa de Memória Seletiva (TMS) testa alguns


aspectos da memória verbal. Baseia-se em ouvir, lembrar e aprender
doze palavras apresentadas à pessoa que está sendo testada.
Diversos aspectos da memória verbal, tais como lembrança total,
armazenamento na memória de longa duração etc., são combinados
para produzir um escore global. Sabendo que, para um grupo
determinado de pessoas, a média dos escores foi de 126 pontos e que o
desvio padrão foi de 10 pontos, determine o que é pedido a seguir.
a) Calcule Z (variável padronizada) para x = 116, para x = 136, para x = 131
e para x = 141 pontos.
b) Qual a probabilidade de escolher uma pessoa com escore maior que
136 pontos?
c) Qual a probabilidade de escolher uma pessoa com escore entre 126 e
131 pontos?
d) Qual a probabilidade de escolher uma pessoa com escore entre 116 e
141 pontos?

202

probabilidade_e_estatistica_1582.indb 202 19/07/12 11:12


Probabilidade e Estatística

Saiba mais

Se você desejar, aprofunde os conteúdos estudados nesta unidade


ao consultar as seguintes referências:

BARBETTA, Pedro Alberto. Estatística aplicada às ciências


sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.

MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo:


Makron Books, 1999.

SILVA, Ermes Medeiros da. et al. Estatística para os cursos de


Economia, Administração e Ciências Contábeis. São Paulo:
Ed. Atlas, 1997. v. 1.

TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:


LTC, 1999.

WILD, Christopher J. Encontros com o acaso. Rio de Janeiro:


LTC, 2004.

Unidade 4 203

probabilidade_e_estatistica_1582.indb 203 19/07/12 11:12


probabilidade_e_estatistica_1582.indb 204 19/07/12 11:12
5
UNIDADE 5

Amostragem e cálculo de
estimativa

Objetivos de aprendizagem
„„ Conhecer as vantagens e a importância da
amostragem.
„„ Calcular tamanho de amostra.

„„ Conhecer as informações que a amostragem propicia.

„„ Aplicar as técnicas de amostragem para a proporção e


para a média.
„„ Calcular as estimativas populacionais para a proporção
e para a média.
„„ Compreender e calcular a análise de variância.

Seções de estudo
Seção 1 Introdução

Seção 2 Conceitos importantes

Seção 3 Estimativas para a proporção populacional

Seção 4 Estimativas para média populacional

Seção 5 Análise de variância – ANOVA

probabilidade_e_estatistica_1582.indb 205 19/07/12 11:12


Universidade do Sul de Santa Catarina

Para início de estudo


Nesta unidade, você conhecerá com mais detalhes o que é
amostra e poderá aumentar seus conhecimentos sobre como
escolher, calcular e para que usar amostras em pesquisas e
levantamentos de dados. Você terá a oportunidade de verificar
como é importante o estudo da amostragem, uma vez que é uma
das ferramentas essenciais que pode apoiar suas decisões.

Nesta unidade, você também conhecerá como proceder para


calcular o erro padrão de uma estimativa.

Você já deve ter visto, nos jornais ou na televisão, quando


anunciam resultados de uma pesquisa eleitoral, informarem que
os resultados têm uma margem de erro. Isto ocorre devido ao fato
do uso da amostragem, ou seja, quando uma pesquisa se baseia
apenas em uma parcela da população.

Como não é possível executar a pesquisa com a totalidade dessa


população, os resultados não são exatos, necessitando, assim, do
cálculo da margem de erro. Nesta unidade, você vai entender
como se procede para encontrar esse erro.

Nesta unidade, serão usados alguns termos que são fundamentais


no entendimento dos cálculos e da interpretação. Sendo assim,
antes de saber como se calcula o erro de uma estimativa, é muito
importante que você aprenda alguns conceitos importantes.
Por isso, como forma a facilitar a compreensão desta unidade,
as primeiras seções tratam de conceitos introdutórios e básicos.
Começaremos por eles, lembrando que são fundamentais para a
compreensão dos demais assuntos.

Finalmente, enfrentaremos outro desafio: definir se as médias de


várias populações são mesmo semelhantes ou se existem diferenças
que superam os próprios problemas do processo de amostragem,
analisando, para isso, as variâncias obtidas nos processos.

Vamos começar então? Bons estudos!

206

probabilidade_e_estatistica_1582.indb 206 19/07/12 11:12


Probabilidade e Estatística

Seção 1 – Introdução
A amostragem está intimamente ligada aos estudos de Estatística
descritiva e probabilidades. Além de estarem ligados, são
dependentes uns dos outros. Veja a figura a seguir:

Amostragem

Estatística descritiva Probabilidade

Figura 5.1 – Relações dos estudos estatísticos


Fonte: Elaboração do autor (2006).

Como é feita essa relação entre os três? Com o estudo desta


unidade, você vai poder compreender melhor. Conheça, a seguir,
alguns conceitos importantes para o estudo da amostragem.

População
População é o conjunto total de elementos com, pelo menos, uma
característica em comum, cujo comportamento interessa estudar.

Notação:

N = número de elementos da população (tamanho da população)

„„ Censo: é uma coleção de dados relativos a todos os


elementos de uma população.

„„ Parâmetro: é utilizado para designar alguma


característica descritiva dos elementos da população
(percentagem, média etc.).

Unidade 5 207

probabilidade_e_estatistica_1582.indb 207 19/07/12 11:12


Universidade do Sul de Santa Catarina

Amostra
Amostra é o conjunto de elementos ou observações, recolhidos
a partir de um subconjunto da população, que se estuda com o
objetivo de tirar conclusões para a população de onde foi recolhida.

Notação:

n = número de elementos da amostra (tamanho da amostra)

Mas qual tamanho de amostra usar?

Essa sempre é a dúvida de muitos pesquisadores. O tamanho da


amostra muitas vezes depende da experiência e do conhecimento
do pesquisador. Experiência em saber qual o tamanho que
realmente representará, com fidelidade, a população e o
conhecimento do pesquisador sobre o tema e sobre a população
alvo do estudo. Dessa forma, você verá duas formas de calcular o
tamanho da amostra, que são as seguintes:

„„ quando não se têm informações sobre a população: se


o pesquisador não tem acesso às medidas, como desvio
padrão, percentuais etc.

„„ quando têm informações sobre a população: se o


pesquisador tem acesso às medidas, como desvio padrão,
percentuais etc.

Quando não se têm informações sobre a população


Nesse caso, é necessária a especificação do erro amostral
pretendido pelo pesquisador. Sugeridas por Barbetta (2002), as
formas de cálculo do tamanho da amostra, quando você não tem
acesso a informações da população, são as que seguem:

208

probabilidade_e_estatistica_1582.indb 208 19/07/12 11:12


Probabilidade e Estatística

a) Quando não se conhece o tamanho da população

Tamanho da amostra:

Em que:

n0 = primeira aproximação para o tamanho da amostra;

E = erro amostral tolerável.


(usar o erro na forma unitária, ex.: 2%, usar 0,02)

b) Quando se conhece o tamanho da população

Tamanho da amostra:

Em que:

n0 = primeira aproximação para o tamanho da amostra;

N = tamanho da população;

n = tamanho da amostra.

Veja, a seguir, um exemplo de como realizar os cálculos.

Um pesquisador deseja realizar estudo para com estudantes do


Ensino Fundamental da rede municipal de escolas da cidade de
Florianópolis. Nessa pesquisa, ele irá tolerar um erro amostral
de 4% e gostaria de saber qual seria o tamanho da amostra
necessária para realizar sua pesquisa, nos seguintes casos:

a) O pesquisador não conhece o número total de estudantes do


Ensino Fundamental da cidade

Calculando passo a passo

Passo 1: identificar os elementos da fórmula.

n0 = tamanho aproximado da amostra;

E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100).

Unidade 5 209

probabilidade_e_estatistica_1582.indb 209 19/07/12 11:12


Universidade do Sul de Santa Catarina

Passo 2: usar a fórmula.

→ n0 = 625 estudantes.

Um tamanho aproximado para a amostra seria de 625 estudantes


do Ensino Fundamental.

b) O número total de estudantes do Ensino Fundamental da


cidade é de 27.000 alunos.

Calculando passo a passo

Passo 1: identificar os elementos da fórmula.

n0 = tamanho aproximado da amostra;

E = erro amostral tolerável = 4% ou 0,04 (é só dividir por 100);

N = tamanho da população = 27000.

Passo 2: usar a fórmula.

→ n0 = 625 estudantes.

Um tamanho aproximado para a amostra seria de 625 estudantes


do Ensino Fundamental. Observe que o pesquisador teve acesso
à informação de que a população seria de 27.000 estudantes,
então você deve passar para o passo seguinte:

Passo 3: calcular o tamanho da amostra usando a população com a


seguinte fórmula.

Arredondando, seriam 611 estudantes.

210

probabilidade_e_estatistica_1582.indb 210 19/07/12 11:12


Probabilidade e Estatística

Quando se têm informações sobre a população


Nesse caso, além da margem de erro tolerável, seriam necessárias
informações como desvio padrão, percentual dos indivíduos que
apresentam as características estudadas etc. Essas informações
poderiam ser obtidas de pesquisas anteriores ou, até mesmo, de
uma pré-pesquisa. Nesse último, seria preciso uma amostragem
prévia para realizar os levantamentos necessários. Embora não
seja de nosso interesse aprofundar o estudo sobre este assunto, a
seguir estão as fórmulas para calcular o tamanho da amostra para
os dois casos existentes, para estimar a proporção (percentual) e a
média populacional.

Para a estimativa da média Para a estimativa da proporção


populacional populacional (percentual)
Para amostragem com reposição Para amostragem com reposição
(população infinita) (população infinita)

Para amostragem sem reposição Para amostragem sem reposição


(população finita) (população finita)

Onde: Onde:
n = tamanho da amostra; n = tamanho da amostra;
N = tamanho da população; N = tamanho da população;
e = erro amostral; e = erro amostral;
σ = desvio padrão; p = percentual de elementos
Z = limite do intervalo (dist. Normal). com a característica estudada;
q = percentual de elementos
sem a característica estudada;
Z = limite do intervalo (dist. Normal).

Quadro 5.1 – Tamanho da amostra, proporção (percentual) e média populacional


Fonte: Elaboração do autor (2006).

Embora não seja a intenção de aprofundar esse tipo de cálculo,


faça a atividade de autoavaliação referente ao assunto e constate
se compreendeu a maneira de realizar os cálculos.

Unidade 5 211

probabilidade_e_estatistica_1582.indb 211 19/07/12 11:12


Universidade do Sul de Santa Catarina

Representatividade da amostra na população


Quando você está cozinhando, após temperar a comida, costuma
mexer com uma colher, não é? Por que você mexe? Para que o
tempero fique bem misturado com a comida. Correto? Qual é o
passo seguinte? Provar! Claro, você pega apenas uma pitada da
comida para saber como está o gosto. Para tanto, não é necessário
comer tudo!

Em resumo, o processo de amostragem é bem semelhante. Para


que a prova de comida seja representativa, você teve, antes, que
mexer bem, tornando, assim, uma mistura homogênea. Se for bem
misturada, qualquer amostra que você colha, em qualquer lugar da
panela, dará uma boa noção de como o todo (a comida) está.

Em pesquisas, o processo é bem semelhante!

Você lembra da pesquisa de intenções de voto? Em época de


campanha eleitoral, quando um instituto de pesquisa faz uma
pesquisa, ele tem que selecionar eleitores que representem as mais
diversas camadas sociais, regiões, raças etc., tornando, assim, a
amostra representativa da população.

Seção 2 – Conceitos importantes


Você saberia dizer se os dados levantados com base em alguns
poucos elementos podem trazer informações precisas acerca de
uma população inteira?

De certa forma, sim! Você não terá informações exatas da


população usando uma amostra, mas sim uma aproximação
bastante precisa. É importante salientar que, por não haver
pesquisado a totalidade dos elementos, você é levado a concluir
que os dados nunca representarão um reflexo exato da população.

212

probabilidade_e_estatistica_1582.indb 212 19/07/12 11:12


Probabilidade e Estatística

Exemplos bem conhecidos são as pesquisas eleitorais divulgadas


pelos meios de comunicação. Veja:

Gráfico 5.1 – Exemplo dos dados de uma pesquisa eleitoral


Fonte: Elaboração do autor (2006).

Como era a notícia que deu origem a esta tabela?

“A pesquisa de outubro apresentou os seguintes resultados: o


candidato A tem 39% das intenções de voto, o candidato B tem 26%
das intenções de voto, o candidato C tem 9% das intenções de votos
e o candidato D tem 7% das intenções de votos. O erro é de 2%.”

De fato, existe uma margem de erro. Esse erro, relatado na


notícia, gera um intervalo, ou seja, as intenções de votos para
o candidato A podem variar de 37% a 41%. Por se tratar de
uma pesquisa feita por amostragem, você não pode dizer que o
candidato terá realmente 39% das intenções de votos.

Quais são as informações que a amostragem pode


fornecer?

Unidade 5 213

probabilidade_e_estatistica_1582.indb 213 19/07/12 11:12


Universidade do Sul de Santa Catarina

Como você já viu em estatísticas, esses intervalos são divididos


em dois tipos, de acordo da variável estudada. Vale relembrar:

Figura 5.2 – Variável aleatória discreta e intervalo de produção; variável aleatória continua e
intervalo da média
Fonte: Elaboração do autor (2006).

„„ Intervalos de proporção: como visto no exemplo


anterior, correspondem aos percentuais das intenções de
votos. Exemplos: proporção de famílias, percentual de
pacientes, proporção de cobaias etc.;

„„ Intervalos da média: são intervalos baseados em


medidas. São sempre calculados pela média dessas
medidas. Exemplo: escore médio, peso médio, altura
média etc.

Outra informação importante para a definição do erro é o


conhecimento do que, em Estatística, é chamado de nível de
confiança.

Nível de confiança
O nível de confiança é a probabilidade de o intervalo conter o
parâmetro estimado, ou seja, pode-se entender que o valor ou
percentual da população que você está tentando estimar tem
a probabilidade de estar em um intervalo que seria o definido
pelo erro.

214

probabilidade_e_estatistica_1582.indb 214 19/07/12 11:12


Probabilidade e Estatística

Intervalo de confiança
Intervalo de confiança é aquele que contém o parâmetro estudado
com determinada probabilidade (nível de confiança), ou seja,
citando o exemplo da pesquisa eleitoral, é o intervalo calculado
com o erro. Veja os valores no exemplo citado nesta seção: “... as
intenções de votos para o candidato A podem variar de 37% a
41%”. Esse é o intervalo de confiança.

Curva normal
Você poderia se perguntar, a partir do que foi apresentado, qual
relação se pode estabelecer entre o nível de confiança e intervalo
de confiança. Como o nível de confiança é a probabilidade de
a estimativa estar correta e essa probabilidade determina um
intervalo (o intervalo de confiança), é possível usar a curva
normal para identificar a ambos. Veja a figura a seguir:

Figura 5.3 – Curva normal


Fonte: Elaborado pelo autor (2006).

Note que o nível de confiança é um percentual definido pelo


intervalo de –z a z. Como a curva é simétrica, metade da área vai
de –z a zero, e a outra metade vai de zero a z, ou seja, ambas são
iguais. Isso é muito importante na definição do valor de z. Para
descobri-lo, você deve calcular a metade do nível de confiança e
usar a tabela da distribuição normal padronizada.

Unidade 5 215

probabilidade_e_estatistica_1582.indb 215 19/07/12 11:12


Universidade do Sul de Santa Catarina

Exemplo 1: Nível de confiança: NC = 95%. Encontrar o valor de


z na tabela.

Calculando passo a passo

Passo 1: dividir o NC por dois. Antes disso, não se esqueça de usar o


valor do nível de confiança na forma decimal, ou seja, dividido por 100.

Passo 2: procurar esse valor na tabela e encontrar o z


correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:

Tabela 5.1 – Tabela de valores normais

Fonte: Elaboração do autor (2006).

216

probabilidade_e_estatistica_1582.indb 216 19/07/12 11:12


Probabilidade e Estatística

Localizada a área, é só seguir a coluna onde está o valor até a


primeira linha, encontrando o número 0,06. Na horizontal,
basta traçar a linha até a primeira coluna, encontrando o valor
correspondente a 1,9. Juntando, ou somando os dois valores, você
encontra o valor 1,96 para z, ou seja, z = 1,96.

Exemplo 2: Nível de Confiança: NC = 90%. Encontrar o valor


de z na tabela.

Calculando passo a passo

Passo 1: dividir o NC por dois. Para tanto, sempre usar o valor do


nível de confiança na forma decimal, ou seja, dividido por 100.

Passo 2: procurar esse valor na tabela e encontrar o z


correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:

Tabela 5.2 – Tabela de valores normais

Fonte: Elaboração do autor (2006).


Unidade 5 217

probabilidade_e_estatistica_1582.indb 217 19/07/12 11:12


Universidade do Sul de Santa Catarina

Encontrando a área, é só seguir a coluna na qual está o valor até


a primeira linha. Note que o valor se situa entre 0,4495 e 0,4505
e, sendo assim, você deve usar o valor compreendido entre 0,04 e
0,05 como se fosse um ponto médio, ou seja, 0,045. Seguindo a
linha até a primeira coluna, você encontra o valor 1,6. Efetuando-
se a soma, chega-se ao valor 1,645 para z, ou seja, z = 1,645.

O nível de confiança é muito importante!

Para calcular o erro, é necessário conhecer ou estabelecer


previamente o nível de confiança. Não existe uma regra específica
para a determinação do nível de confiança. Ele é determinado
pelo pesquisador com base em sua experiência e, em geral, os
mais usados são 90% e 95%.

Na seção seguinte, você aprenderá a usar o nível de confiança


e saber como se calcula o erro da estimativa e o intervalo
correspondente.

Seção 3 – Estimativas para a proporção populacional


Antes de começar a calcular o erro da estimativa, conheça
algumas notações:

„„ = proporção da mostra (percentual) – probabilidade de


sucesso;

„„ p = proporção da população – probabilidade de sucesso;

„„ = proporção da mostra (percentual) – probabilidade de


fracasso;

„„ q = proporção da população – probabilidade de fracasso.

Para diferenciar um percentual da amostra do percentual da


população, tanto de sucesso quanto de fracasso, deve usar o
acento circunflexo (“chapéu”) para a amostra.

218

probabilidade_e_estatistica_1582.indb 218 19/07/12 11:12


Probabilidade e Estatística

Veja os exemplos a seguir.

Exemplo 1: Em uma determinada população, foi retirada uma


amostra antes da eleição e verificou-se que 30% dos eleitores
votariam no candidato Théo. Após a realização da eleição,
verificou-se que o total de votantes (da população) para esse
candidato foi de 33%. Indicar os percentuais de sucesso e fracasso
tanto para a população quanto para a amostra de votantes e não
votantes em relação ao candidato em questão.

População Amostra

Percentual de votantes em Théo = 33%; Percentual de votantes em Théo = 30%;


p = 33% (percentual de sucesso da população); = 30% (percentual de sucesso da amostra);

Percentual de eleitores que não votam em Percentual de eleitores que não votam em
Théo: calcule o percentual de fracasso sempre Théo: calcule o percentual de fracasso sempre
na forma decimal, ou seja, dividindo o na forma decimal, ou seja, dividindo o
percentual por 100. percentual por 100.

q = 1 – p = 1 – 0,33 = 0,67

No final, multiplique por 100 para encontrar No final, multiplique por 100 para
novamente o percentual: encontrar novamente o percentual:
q = 0,67. 100 = 67% (percentual de (percentual de fracasso
fracasso da população). da amostra).

Quadro 5.2 – População e amostra


Fonte: Elaboração do autor (2006).

Observação: note que a diferença, além dos valores, está em


identificar o percentual da amostra com o acento circunflexo
(“chapéu”).

A seguir, veja um exemplo mais elaborado.

Exemplo 2: Em uma determinada população, foi retirada uma


amostra de 200 votantes antes da eleição e verificou-se que 60
eleitores votariam no candidato Théo. Após a realização da
eleição, verificou-se que o total de votantes (da população) era de
3000 eleitores e que 990 votaram no referido candidato. Indicar
os percentuais de sucesso e fracasso tanto para a população
quanto para a amostra de votantes e não votantes em relação ao
candidato mencionado.

Unidade 5 219

probabilidade_e_estatistica_1582.indb 219 19/07/12 11:12


Universidade do Sul de Santa Catarina

População Amostra

Passo 1: identificar os valores. Passo 1: identificar os valores.

N = 3000 (tamanho da população); N = 200 (tamanho da população);


X = 990 (número de votantes no X = 60 (número de votantes no candidato).
candidato).
Passo 2: cálculo do percentual de votantes
Passo 2: cálculo do percentual de votantes no candidato.
no candidato.

Percentual de votantes em Théo = 30%


Percentual de votantes em Théo = 33%; (percentual de Sucesso da
p = 33% amostra)
(percentual de sucesso da população).

Percentual de eleitores que não votam Percentual de eleitores que não votam
em Théo: calcule o percentual de fracasso em Théo: calcule o percentual de fracasso
sempre na forma decimal, ou seja, sempre na forma decimal, ou seja,
dividindo o percentual por 100. dividindo o percentual por 100.
p = 0,33
q = 1 – p = 1 – 0,33 = 0,67

No final, multiplique por 100 para No final, multiplique por 100 para
encontrar novamente o percentual: encontrar novamente o percentual:
q = 0,67. 100 = 67%
(percentual de fracasso da população). (percentual de fracasso da amostra).

Quadro 5.3 – População e amostra


Fonte: Elaboração do autor (2006).

E para calcular o erro e o intervalo de uma estimativa?

Para fazer uma estimativa, após ter os resultados e calculados


os percentuais, você deve calcular o erro da estimativa e o seu
intervalo (intervalo de confiança). Veja a seguir a fórmula para o
cálculo do erro:

220

probabilidade_e_estatistica_1582.indb 220 19/07/12 11:12


Probabilidade e Estatística

Em que:

e = erro da estimativa;

z = limite do intervalo definido pelo nível de confiança;

= proporção da mostra (percentual) – probabilidade de sucesso


(ex.: percentual de votantes em relação a um determinado
candidato);

= proporção da mostra (percentual) – probabilidade de fracasso (ex.:


percentual dos eleitores que não votam em determinado candidato);

n = tamanho da amostra.

O intervalo é calculado subtraindo-se o erro do percentual e,


em seguida, somando-se o erro a esse percentual. Veja abaixo a
notação usada:

Em que:

P = probabilidade de o valor estimado estar no intervalo


calculado;

= proporção da mostra (percentual) – probabilidade de


sucesso (ex.: percentual da amostra de votantes em relação a um
determinado candidato);

p = proporção da população (percentual) que se quer estimar


– probabilidade de sucesso (ex.: percentual da população de
votantes em relação a um determinado candidato);

NC = nível de confiança.

Unidade 5 221

probabilidade_e_estatistica_1582.indb 221 19/07/12 11:12


Universidade do Sul de Santa Catarina

Veja os exemplos a seguir.

Exemplo 1: Uma pesquisa recente, efetuada com uma amostra


de 300 eleitores de uma pequena cidade, indicou que 35% deles
votariam no candidato Arthur. Faça uma estimativa para a
totalidade dos eleitores (população) dessa cidade que votarão no
referido candidato. Use um nível de confiança de 95%.

Calculando passo a passo

Passo 1: calcular e procurar o z na tabela (ver exemplo 1, ao final da


seção 1). Dividir o NC por dois. Para tanto, não se esqueça de usar o
valor do nível de confiança na forma decimal, ou seja, dividido por 100.

Passo 2: procurar na tabela esse valor e encontrar o z


correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:

Tabela 5.3 – Tabela de valores normais

Fonte: Elaboração do autor (2006).

222

probabilidade_e_estatistica_1582.indb 222 19/07/12 11:12


Probabilidade e Estatística

Localizada a área, é só seguir a coluna na qual está o valor até a


primeira linha, chegando-se ao número 0,06 e, na horizontal, seguir
a linha até a primeira coluna, encontrando o valor 1,9. Efetuada a
soma, você encontra o valor 1,96 para z, ou seja, z = 1,96.

Passo 3: discriminar cada elemento da fórmula de cálculo do erro e


aplicá-la ao caso em análise.

Em que:

e = erro da estimativa;

z = 1,96 (calculado e encontrado no passo 2);

= 35% ou (percentual da amostra de eleitores que


votam no candidato);

(percentual da amostra dos eleitores que não


votam no candidato);

n = 300 (tamanho da amostra).

Cálculo do erro

= 1,96.

Ao final de seu cálculo, deve-se multiplicar o resultado por 100,


para que ele fique em porcentagem. Esse é um erro comum dos
meios de comunicação (TV, rádio, jornais, etc.), ao informarem
os resultados de uma pesquisa citam “... com um erro de 5,4% a
mais ou a menos.”

Unidade 5 223

probabilidade_e_estatistica_1582.indb 223 19/07/12 11:12


Universidade do Sul de Santa Catarina

Passo 4: calcular o intervalo da estimativa. Neste passo, o cálculo


pode ser efetuado na forma percentual ou decimal. Interpretando
os resultados obtidos, tem-se que as intenções de votos para o
candidato referido devem ficar entre 29,603% e 40,397%. Segundo as
notações da Estatística, esse intervalo se escreve da seguinte forma:

ou 29,603%

ou 40,397%

Interpretando os resultados obtidos, tem-se que as intenções de votos


para o candidato referido devem ficar entre 29,603% e 40,397%.

Segundo as notações da Estatística, esse intervalo se escreve da


seguinte forma:

P(0,29603 < p < 0,40397) = 0,95 ou

P(29,603% < p < 40,397%) = 95%

Que leitura você pode fazer? O intervalo da


estimativa para a totalidade dos eleitores que votariam
no candidato mencionado está compreendido
entre 29,603% e 40,397%, com base em um nível de
confiança de 95%.

Veja os exemplos a seguir.

Exemplo 2: Um levantamento de alunos aprovados e reprovados


feito com base no sistema municipal de educação de um município,
referente ao Ensino Fundamental, usando uma amostra de
2500 alunos, indicou que 1500 alunos dentre eles haviam sido
reprovados. Com um nível de confiança de 90%, faça uma
estimativa para a população de alunos que foram reprovados no
Ensino Fundamental do sistema municipal de educação.

224

probabilidade_e_estatistica_1582.indb 224 19/07/12 11:12


Probabilidade e Estatística

Calculando passo a passo

Passo 1: como não foi indicado o percentual de alunos da amostra


que foram reprovados, você deve, em primeiro lugar, calcular esse
percentual (como foi feito no exemplo 2 no início da seção).

n = 2500 (tamanho da amostra);

X = 1500 (número de alunos reprovados).

Cálculo do percentual:

Você pode manter o resultado na forma decimal, pois o cálculo


do erro também é feito assim.

Passo 2: calcular e procurar o z na tabela (ver exemplo 2, ao final da


seção 1). Dividir o NC por dois. Para tanto, não se esqueça de usar o
valor do nível de confiança na forma decimal, ou seja, dividido por 100.

Passo 3: procurar na tabela esse valor e encontrar o z


correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:

Unidade 5 225

probabilidade_e_estatistica_1582.indb 225 19/07/12 11:12


Universidade do Sul de Santa Catarina

Tabela 5.4 – Tabela de valores normais

Fonte: Elaboração do autor (2006).

Localizada a área, é só seguir a coluna na qual está o valor até


a primeira linha. Note que o valor se encontra entre 0,4495 e
0,4505 e, sendo assim,.você deve usar o valor compreendido
entre 0,04 e 0,05 como se fosse um ponto médio, ou seja, 0,045.
Seguindo a linha até a primeira coluna, você encontra o valor
correspondente a 1,6. Juntando, ou somando os dois valores, você
chega ao valor 1,645 para z, ou seja, z = 1,645.

Passo 4: discriminar cada elemento da fórmula de cálculo do erro e


aplicá-la ao caso em exame.

Em que:

e = o que se quer calcular (erro da estimativa);

z = 1,645 (calculado e encontrado no passo 2);

= 60% ou (percentual da amostra de alunos


reprovados)

226

probabilidade_e_estatistica_1582.indb 226 19/07/12 11:12


Probabilidade e Estatística

(percentual da amostra de alunos que não foram


reprovados)

n = 2500 (tamanho da amostra).

Cálculo do erro

= 1,645 .

e = 1,645 . 0,009797959 ou 1,16%

Ao final, não se esqueça de multiplicar o resultado por 100


para transformá-lo novamente em porcentagem. Esse é um erro
comum dos meios de comunicação (TV, rádio, jornais etc.), ao
informarem os resultados de uma pesquisa citam: “... com um
erro de 1,16% a mais ou a menos”.

Passo 5: calcular o intervalo da estimativa.

Neste passo, o cálculo pode ser feito na forma percentual ou


decimal.

ou 58,38%

ou 61,61%

Interpretando os resultados obtidos, tem-se que de 58,38% a


61,61% da totalidade dos alunos cursando o Ensino Fundamental
na rede municipal foram reprovados.

Segundo as notações de Estatística, esse intervalo se escreve da


seguinte forma:

P(0,29603 < p < 0,40397) = 0,90 ou

P(29,603 < p < 40,397) = 90%

Unidade 5 227

probabilidade_e_estatistica_1582.indb 227 19/07/12 11:12


Universidade do Sul de Santa Catarina

Que leitura você pode fazer? O intervalo da


estimativa para a totalidade dos eleitores que votariam
no candidato está compreendido entre 29,603% e
40,397%, com base em um nível de confiança de 90%.

Nesta seção, você aprendeu como calcular o erro referente à


estimativa do percentual de uma população. Na próxima, você
verá como calcular o erro de uma estimativa para a média de
uma população.

Seção 4 – Estimativas para média populacional


Ao realizar uma pesquisa por amostragem, além de calcular
percentuais, você pode obter algumas médias, como por exemplo,
a média das alturas, das idades, dos pesos etc. O processo é
semelhante, ou seja, calcula-se o erro e o intervalo. O que muda é a
forma de cálculo do erro. Isso vale para as séries de dados amostrais
que podem ser aproximados por uma distribuição normal.

E para calcular o erro e o intervalo de uma estimativa


da média populacional?

Para calcular o erro de uma estimativa da média populacional,


você vai precisar da média de uma amostra e do desvio padrão.
Este pode ser obtido com base na própria população, se for
possível, ou na amostra. O desvio padrão da amostra pode ser
usado como uma aproximação.

228

probabilidade_e_estatistica_1582.indb 228 19/07/12 11:12


Probabilidade e Estatística

Veja, a seguir, a fórmula para o cálculo do erro:

Em que:

e = erro da estimativa;

z = limite do intervalo definido pelo nível de confiança;

S(x) = desvio padrão da amostra (ou da população, se possível);

n = tamanho da amostra.

O intervalo é calculado subtraindo-se o erro da média da amostra e


somando-se o erro à referida média. Veja, abaixo, a notação usada:

Em que:

P = probabilidade de o valor estimado estar no intervalo


calculado;

x = média da amostra;

μ = média da população (o que você vai estimar);

NC = nível de confiança.

Veja os exemplos a seguir

Exemplo 1: Em sondagem realizada com base nos alunos do


curso de Matemática das quintas séries de uma determinada
escola, o resultado geral apresentou uma média de 6,7, com um
desvio padrão de 1,2. Com esse tipo de informação, pode-se
realizar uma série de análises. A partir desses dados, calcule uma
estimativa (erro e intervalo), considerando essa série com uma
distribuição normal para a média populacional a um nível de
confiança de 95% e que a amostra foi de 35 alunos.

Unidade 5 229

probabilidade_e_estatistica_1582.indb 229 19/07/12 11:12


Universidade do Sul de Santa Catarina

Calculando passo a passo

Passo 1: calcular e procurar z na tabela (veja exemplo1, seção 1).


Dividir o NC por dois. Usar o valor do nível de confiança na forma
decimal, ou seja, dividido por 100.

Passo 2: procurar esse valor na tabela e encontrar o z


correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:

Tabela 5.5 – Tabela de valores normais

Fonte: Elaboração do autor (2006).

Localizada a área, é só seguir a coluna na qual está o valor até a


primeira linha, encontrando o número 0,06. Na horizontal, basta
traçar a linha até a primeira coluna, chegando ao número 1,9.
Somando os dois, você encontra o valor correspondente a 1,96
para z, ou seja, z = 1,96.
230

probabilidade_e_estatistica_1582.indb 230 19/07/12 11:12


Probabilidade e Estatística

Passo 3: discriminar cada elemento da fórmula de cálculo do erro e


aplicá-la ao caso em questão.

Em que:

e = o que se quer calcular (erro da estimativa);

z = 1,96 (ver passo 2);

S(x) = 1,2 (desvio padrão da amostra)

n = 35 (tamanho da amostra).

Cálculo do erro:

= 1,96.

Não é necessário multiplicar por 100, pois este resultado não


indica um percentual, mas sim pontos (a nota)!

Passo 4: calcular o intervalo da estimativa.

Neste passo, como na estimativa para o percentual, você deve


subtrair e somar o erro à média:

Interpretando os resultados obtidos, tem-se que a média das


notas da totalidade dos alunos está compreendida entre 6,3 e 7,1
pontos, aproximadamente.

Unidade 5 231

probabilidade_e_estatistica_1582.indb 231 19/07/12 11:12


Universidade do Sul de Santa Catarina

Segundo as notações de Estatística, esse intervalo se escreve da


seguinte forma:

P(6,7 – 0,3976 < μ < 6,7 + 0,3976) = 0,95

P(6,3024 < μ < 7,0976) = 0,95

Que leitura você pode fazer? O intervalo da estimativa


para a média das notas da totalidade dos alunos está
compreendido entre 6,3 e 7,1 pontos, aproximadamente,
com um índice de confiança de 95%.

Exemplo 2: Em uma pesquisa realizada com diversas turmas


de uma escola, os alunos levaram 39 minutos, em média, para
terminar uma avaliação de matemática. O tamanho da amostra
era de 100 estudantes. O desvio padrão dessa amostra foi de 18
minutos. Com base em um nível de confiança de 90%, qual seria a
estimativa para a média populacional da escola e sua interpretação?

Calculando

Passo 1: calcular e procurar o z na tabela (ver exemplo 2, no final da


seção 1). Dividir o NC por dois. Para tanto, usar o valor do nível de
confiança na forma decimal, ou seja, dividido por 100.

Passo 2: procurar esse valor na tabela e encontrar o z


correspondente. O valor é referente à área entre zero e z, localizado
na região central da tabela. Veja a seguir:

232

probabilidade_e_estatistica_1582.indb 232 19/07/12 11:12


Probabilidade e Estatística

Tabela 5.6 – Tabela de valores normais

Fonte: Elaboração do autor (2006).

Localizada a área, é só seguir a coluna na qual está o valor até a


primeira linha. Note que o valor se encontra entre 0,4495 e 0,4505
e, sendo assim, deve-se usar o valor compreendido entre 0,04 e
0,05 como se fosse um ponto médio, ou seja, 0,045. Traçando a
linha até a primeira coluna, chega-se ao número 1,6. Somando os
dois, você encontra o valor 1,645 para z, ou seja, z = 1,645.

Unidade 5 233

probabilidade_e_estatistica_1582.indb 233 19/07/12 11:12


Universidade do Sul de Santa Catarina

Passo 3: discriminar cada elemento da fórmula de cálculo do erro e


aplicá-la ao caso em questão.

Em que:

e = o que se quer calcular (erro da estimativa);

z =1,645 (ver passo 2);

S(x) = 18 (desvio padrão da amostra);

n = 100 (tamanho da amostra).

Cálculo do erro:

= 1,645.

Não é necessário multiplicar por 100, pois este resultado não


indica um percentual, mas sim minutos!

Passo 4: calcular o intervalo da estimativa. Neste passo, como na


estimativa para o percentual, você deve subtrair e somar o erro à média.

Interpretando os resultados obtidos, tem-se que o tempo médio


para a realização da avaliação está compreendido entre 36,04 e
41,96 minutos, aproximadamente.

Segundo as notações de Estatística, esse intervalo se escreve da


seguinte forma:

P(39 – 2,961 < μ < 39 + 2,961) = 0,90

P(36,039 < μ < 41,961) = 0,90

234

probabilidade_e_estatistica_1582.indb 234 19/07/12 11:12


Probabilidade e Estatística

Que leitura você pode fazer? O intervalo da


estimativa para a média do tempo de execução da
avaliação está compreendido entre 36,04 e 41,96
minutos, com um índice de confiança de 90%

Seção 5 – Análise de variância – ANOVA

Como comparar as características de várias amostras


Logo após calcular a estimativa de uma média populacional,
podemos ter outro desafio: definir se as médias de várias
populações são mesmo semelhantes ou existem diferenças que
superam os próprios problemas do processo de amostragem.

Isso porque, muitas vezes, amostras de diferentes populações


são selecionadas com a finalidade de se avaliarem possíveis
diferenças entre as distribuições populacionais de alguma
característica de interesse.

Podemos citar alguns exemplos destas situações:

 Seleção de lotes de parafusos fabricados em


diferentes empresas com diferentes equipamentos,
para avaliar se a distribuição (populacional) do
valor médio do diâmetro da cabeça dos parafusos
produzidos varia com a marca do equipamento usado
na fabricação.

 Para curar certa doença, existem quatro tratamentos


possíveis: A, B, C e D. Pretende-se saber se existem
diferenças significativas nos tratamentos no que diz
respeito ao tempo necessário para eliminar a doença.

 Análise de amostras de água de diversos pontos da


cidade para verificar se existe variação na distribuição
de alguma característica (nível de ácidos, por exemplo)
associada à qualidade da água entre bairros.

Unidade 5 235

probabilidade_e_estatistica_1582.indb 235 19/07/12 11:12


Universidade do Sul de Santa Catarina

Em muitos casos, uma análise descritiva dos dados indica


que modelos gaussianos ou normais são compatíveis com suas
distribuições. Em outras palavras, sob o ponto de vista estatístico,
podemos considerar as k amostras disponíveis como provenientes
de populações normais com médias μ1, μ2, ..., μk.

Se não existirem razões contrárias, podemos também supor


que as amostras são independentes. Adicionalmente, a análise
descritiva muitas vezes sugere que as k populações têm a mesma
variância σ2 (desconhecida).

O problema proposto pode então ser encarado como um teste da


hipótese de que as médias são iguais: H: μ1 = μ2 = ... =μk. E, nestas
situações, a técnica para resolver problemas desse tipo (e muitos
outros semelhantes) é chamada de análise de variância de um fator.

Definição do problema a ser resolvido


Considerando que existem k populações de interesse, nas quais se
estuda uma característica comum X1, X2, ..., Xk, são as variáveis
aleatórias que representam tais característica nas populações 1, 2, ...,
k, respectivamente. Assim, a hipótese a testar é: μ1 = μ2 = ... = μk?

Neste problema, as k populações podem ser vistas como k níveis


de um mesmo fator. E, assim, a questão é saber se o fator exerce
alguma influência na variação da característica em estudo (a
média, neste caso).

Caso o problema apresente somente um fator,


estaremos trabalhando com análise de variância de um
fator, conhecido como ANOVA de um único fator. Claro
que também existe ANOVA de múltiplos fatores, mas
este tema não será abordado neste estudo.

236

probabilidade_e_estatistica_1582.indb 236 19/07/12 11:12


Probabilidade e Estatística

Analisando o problema com um exemplo


Exemplo: o Sr. Fernando Fernandes é dono de uma Indústria
Metal-Mecânica e pretende comprar três fábricas de parafusos
para suprimentos da sua própria indústria. Para isso, precisa
analisar o volume de fabricação das fábricas a comprar, já que ele
precisa que as três tenham produções semelhantes de parafusos
para prover regularmente à sua industria.

Para isso, o Sr. Fernando Fernandes seleciona aleatoriamente


cinco semanas do semestre, nas quais observa o volume de
fabricação semanal para cada fábrica (ou seja, as três amostras
são independentes).

Os dados amostrais estão registrados na seguinte tabela:

Tabela 5.7 – Dados amostrais

Semanas Fábrica 1 Fábrica 2 Fábrica 3


Semana 1 47 55 54
Semana 2 53 54 50
Semana 3 49 58 51
Semana 4 50 61 51
Semana 5 46 52 49

(médias amostrais) = 49 = 56 = 51 = 52

Fonte: Elaboração do autor (2011).

Representamos por Xi o volume de fabricação semanal na Fábrica


i (i = 1, 2, 3) e por µi o valor médio de Xi.

Neste exemplo, existe apenas um fator de interesse, o fator “fábrica”


que apresenta três níveis ou grupos: fábrica 1, fábrica 2 e fábrica 3.
Assim, cada nível do fator define uma população de média μi.

Unidade 5 237

probabilidade_e_estatistica_1582.indb 237 19/07/12 11:12


Universidade do Sul de Santa Catarina

Assim, o que o Sr. Fernando Fernandes pretende saber é se as


médias dos três níveis, ou populações, são iguais, isto é, pretende-
se saber se a hipótese é certa ou não:

H: µ1 = µ2 = µ3

(Hipótese de igualdade na fabricação média das três fábricas)

Então a questão a responder é:

Serão as médias amostrais =49, = 56, = 51,


diferentes porque há diferenças entre as médias
populacionais: µ1 = µ2 = µ3? Ou serão essas diferenças
atribuídas a flutuações amostrais?

Podemos, então, formular as seguintes hipóteses:

H: µ1 = µ2 = µ3

Ou, em outras palavras, a hipótese está afirmando que não há


diferença entre o volume médio de fabricação das três fábricas.

Lembre-se: como toda hipótese, as pesquisas (testes


em nosso caso) poderão confirmá-la ou negá-la!

Pressupostos para resolver a questão


A aplicação da análise de variância pressupõe a verificação das
seguintes condições:

„„ as amostras devem ser aleatórias e independentes;

„„ as amostras devem ser extraídas de populações normais;

„„ as populações devem ter variâncias iguais.

Assim, temos duas situações possíveis demonstradas a seguir.

238

probabilidade_e_estatistica_1582.indb 238 19/07/12 11:12


Probabilidade e Estatística

A hipótese H é verdadeira
As diferenças observadas entre as médias amostrais são devidas a
flutuações amostrais. Ou seja, neste caso, teremos que µ1 = µ2 =
µ3: todas as amostras provêm de populações com médias iguais.

Como se supôs que todas as populações são normais e têm


variâncias iguais, isto é o mesmo que extrair todas as amostras de
uma única população (de uma única fábrica).

Gráfico 5.2 – Distribuição populacional quando µ1 = µ2 = µ3 = µ


Fonte: Elaboração do autor (2011).

A hipótese H é falsa
As diferenças observadas entre as médias amostrais são
demasiado grandes para serem devidas unicamente a flutuações
amostrais.

Aqui, as médias das populações não são iguais, ou seja pelo


menos duas fábricas têm volumes de produção média diferentes.
As amostras recolhidas provêm de populações diferentes.

Gráfico 5.3 – Distribuição populacional quando µ1 ≠ µ2 ≠ µ3


Fonte: Elaboração do autor (2011).

Unidade 5 239

probabilidade_e_estatistica_1582.indb 239 19/07/12 11:12


Universidade do Sul de Santa Catarina

Teste ANOVA
Para testar a hipótese, devemos trabalhar com o valor da
Estatística de teste F, que é outro valor que surge de outra
distribuição de probabilidade, que a semelhança da distribuição
normal tem uma tabela para calcular seu valor, no qual devemos
entrar com os graus de liberdades (número de dados da amostra
diminuído um) para obter o valor correspondendo a um certo
nível de confiança (por exemplo, NC = 95%, ou seja, um nível de
significância de 5%: α = 5%).

Então, a estatística de teste mede a razão entre a variação entre


grupos e a variação dentro dos grupos:

F= Variação entre grupos


Variação dentro dos grupos

A hipótese H é, pois, rejeitada para valores grandes da estatística F.

A tabela ANOVA tem a seguinte estrutura:

Tabela 5.8 – Tabela ANOVA

Fonte: Elaboração do autor (2011).

Por exemplo, para n = 3 (três grupos) e m = 5 (cinco amostras por


grupo) resultam em:

240

probabilidade_e_estatistica_1582.indb 240 19/07/12 11:12


Probabilidade e Estatística

„„ GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 = K);

„„ GLm = 15 – 3 = 12 (graus de liberdade do denominador,


15 = 3 x 5 = N).

Ao final da seção, você pode achar a tabela completa para


determinar o PC (ponto crítico) ou estatística F para um nível de
confiança de 95%.

Assim, na tabela, procura-se na primeira coluna (GL do


denominador) a linha do 12 e, na primeira fila, a linha do 2 (GL
do numerador), resulta num valor do estatístico F: F = 3,89, este
valor definido pela tabela é conhecido como Ponto Crítico ou PC.

Devemos aclarar que existem diversas tabelas de F, cada uma


delas calculadas para um grau de significância diferente, a tabela
de nosso trabalho é a tabela para um grau de significância de 5%.

Agora, temos que calcular o valor de F para nosso experimento, e


se o valor do F calculado resulta maior que o valor de F tabelado
(PC), a hipótese deverá ser rejeitada.

Dessa forma, para calcular nosso valor de F amostral, devemos


utilizar uma tabela de layout já tradicional para organizar
nossos cálculos.

A tabela, chamada de Tabela ANOVA, tem a seguinte estrutura


tradicional:

Tabela 5.9 – Tabela ANOVA

Fonte: Elaboração do autor (2011).

Unidade 5 241

probabilidade_e_estatistica_1582.indb 241 19/07/12 11:12


Universidade do Sul de Santa Catarina

Nessa tabela, temos:

SST = é a soma de quadrados total e mede a variação total nos


dados;

SSA = é a soma de quadrados entre os níveis (grupos) do fator


e mede a variação entre grupos (populações); é designada por
variação explicada, pois ela é explicada pelo fato de as amostras
poderem provir de populações diferentes;

SSE = é a soma de quadrados dentro dos níveis (grupos) do fator


e mede a variação dentro dos grupos (populações); é, por vezes,
designada por variação não explicada ou residual, pois é atribuída
a flutuações dentro da mesma população, portanto não pode ser
explicada pelas possíveis diferenças entre os grupos (populações).

Também temos que:

MSA = que é a soma média de quadrados entre grupos;

MSE = que é a soma média de quadrados dentro dos grupos ou


residual.

Pode-se provar que:


SST = SSA + SSE;
e, também, que:
(K − 1) + (N – K) = N – 1
Isso permite verificar os cálculos da tabela ANOVA.

Assim, sob o pressuposto da hipótese ser verdadeira, tem-se:

242

probabilidade_e_estatistica_1582.indb 242 19/07/12 11:12


Probabilidade e Estatística

A hipótese deve ser rejeitada se o valor observado de F se situar à


direita do ponto crítico; isto é, rejeita-se H se Fobs ≥ PC, em que o
ponto crítico PC é dado por:

Então, para nosso exemplo da compra das fábricas por parte do Sr.
Fernando Fernandes, vamos ver o que podemos concluir ao nível de
significância de 0.05, ou seja, a um nível de confiança NC = 95%.

Cálculo de SSE:

Cálculo de SSA:

SSA = 5(49 – 52)2 + 5(56 – 52)2 + 5(51 – 52)2 = 130

Assim, a tabela ANOVA resulta, numericamente para o exemplo,


nos seguintes valores:

Tabela 5.10 – Tabela ANOVA

Fonte: Elaboração do autor (2011).

E, se a hipótese H é verdadeira, resultará:

Unidade 5 243

probabilidade_e_estatistica_1582.indb 243 19/07/12 11:12


Universidade do Sul de Santa Catarina

Da tabela F, a gente já calculou o valor F para os graus de


liberdade 2 e 12 e 95% de confiança:

F1–a,2,12 = 3.89

E, segundo a tabela ANOVA, o valor observado da estatística F é:

E, como resultando que 8,3 > 3,89, então a hipótese (H: µ1 =


µ2 = µ3) é rejeitada ao nível de significância de 0,05 ou nível de
confiança de 95%; isto é, existem diferenças significativas entre
as médias amostrais das vendas, e há, portanto, evidência de que
existem pelo menos duas lojas com volumes médios de produção
diferentes entre elas.

Em outras palavras, o fator fábrica exerce uma influência


significativa sobre o volume médio da produção de parafusos:
tem, ao menos, uma fábrica que está produzindo bem menos ou
bem mais que as outras, desequilibrado o suprimento constante
de parafusos que a indústria de Fernando Fernandez precisa.

244

probabilidade_e_estatistica_1582.indb 244 19/07/12 11:12


Probabilidade e Estatística

Síntese

O processo de amostragem é muito importante e eficaz no dia


a dia de qualquer profissional. Diariamente, você esbarra com
situações semelhantes às que foram analisadas nesta unidade,
tanto nos meios de comunicação, como rádio, TV, jornais etc.,
mas também em escolas, empresas e outras instituições.

Nesta unidade, você pôde ver as facilidades e a importância do uso


de amostragem. Hoje, os processos de amostragem e as estimativas
estão muito precisos, a ponto de ser mais confiável usar a amostra
que realizar uma pesquisa com a totalidade da população.

Você teve, também, algumas noções de como funciona todo esse


processo, mas fique à vontade para aprofundar esse tema tão
importante e fundamental na realização de uma pesquisa. Muitas
vezes, você terá que usar ferramentas como as que vimos aqui,
tanto na sua vida acadêmica quanto na profissional.

Entender que as pesquisas feitas com base em uma amostra não


culminam em resultados exatos, e poder definir a margem de erro
ocasionada por essa amostragem, é um passo muito importante
na formação profissional e acadêmica, além de possibilitar uma
leitura mais realista da realidade.

Unidade 5 245

probabilidade_e_estatistica_1582.indb 245 19/07/12 11:12


Universidade do Sul de Santa Catarina

Atividades de autoavaliação

Ao final de cada unidade, você realizará atividades de autoavaliação. O


gabarito está disponível no final do livro didático, mas se esforce para
resolver as atividades sem a ajuda do gabarito, pois, assim, você estará
promovendo (e estimulando) a sua aprendizagem.

1) Estão listadas, a seguir, uma série de estudos e a margem de erro que


o pesquisador irá adotar como tolerável, bem como o tamanho da
população alvo desse estudo. Calcule o tamanho da amostra necessária
para realizar as pesquisas considerando que o pesquisador não tem
acesso ao tamanho da população e que o pesquisador tem acesso ao
tamanho da população (calcular para os dois casos).

Tipos de estudos, margem de erro e tamanho da população e da amostra

Tamanho Tamanho
Erro
Tema do estudo da da amostra
tolerável população (preencher)

a) Estudo socioeconômico com 0,03 5600


estudantes da Unisul

b) Estudo com famílias do bairro Rio 0,04 9400


Vermelho, em Florianópolis

c) Estudo com adolescentes com Teste 0,05 400


de Sondagem Intelectual (TSI)

d) Estudo da fecundidade na cidade de 0,06 125.000


Florianópolis

e) Estudo com usuários de drogas 0,09 250


adolescentes de uma escola

f ) Estudo sobre analfabetismo no bairro 0,09 2.500


Rio Tavares, em Florianópolis

g) Estudo de Índice de Massa Corporal 0,05 4.000


dos estudantes da Unisul

h) Pesquisa de intenções de voto no 0,02 80.000.000*


Brasil

Fonte: Elaboração do autor (2006).

246

probabilidade_e_estatistica_1582.indb 246 19/07/12 11:12


Probabilidade e Estatística

2) Leia a notícia da IstoÉ On-Line (2004):

Florianópolis / SC – Caça ao tucano


Sem contar com o apoio do governador, da prefeita Ângela Amin
(PP) e de caciques da política catarinense, Dário Berger, candidato
da coligação PSDB-PMN, é a grande surpresa até o momento nas
eleições em Florianópolis. Concorrendo pela primeira vez a um
cargo público de expressão, Berger vem liderando com folga a
corrida eleitoral em Floripa. Pela pesquisa ISTOÉ/Databrain – feita
entre os dias 26 e 27 de julho, com 700 entrevistados, margem
de erro de 2,74 pontos porcentuais e coeficiente de confiança de
90% – Berger apresenta tranquilos 26,4% das intenções de voto. O
levantamento foi registrado no TRE-SC com o número 559/2004.
(Dados adaptados de ISTOÈ ONLINE, 2004).

Com os dados dessa matéria, mostre os cálculos que foram feitos para
se chegar ao erro de 2,74 pontos percentuais, e encontre o intervalo da
estimativa.

Unidade 5 247

probabilidade_e_estatistica_1582.indb 247 19/07/12 11:12


Universidade do Sul de Santa Catarina

3) A formação dos professores de Matemática da rede pública é


importante para o ensino e para o aprendizado e é cada vez mais
valorizado pelas instituições de ensino. Uma amostragem feita com
300 professores indicou que apenas 240 professores do Ensino
Fundamental da rede pública têm graduação completa em Matemática.
Faça uma estimativa para o percentual da população de professores
que têm graduação completa usando um nível de confiança de 95%
(de início, não se esqueça de calcular o percentual de professores com
graduação completa, assim como o intervalo da estimativa).

248

probabilidade_e_estatistica_1582.indb 248 19/07/12 11:12


Probabilidade e Estatística

4) Uma amostragem com 250 alunos foi feita em escolas, e, entre outras
perguntas, questionou-se sobre o peso dos alunos da quinta-série. O
peso médio dos alunos entrevistados foi de 29,3 Kg e apresentou um
desvio padrão de 3,4 Kg. Usando um nível de confiança de 95%, calcule
uma estimativa para a totalidade (população) de alunos da quinta-série
(não esqueça de calcular o erro e o intervalo correspondentes).

Unidade 5 249

probabilidade_e_estatistica_1582.indb 249 19/07/12 11:12


Universidade do Sul de Santa Catarina

5) O governo federal instituiu o programa Bolsa Escola, no qual as famílias


de baixa renda recebem ajuda financeira por cada filho que frequenta a
escola. Essa ajuda financeira, segundo setor responsável, é em média de
R$ 150,00 por família e apresenta um desvio padrão de R$ 31,50. Esses
dados foram obtidos por uma amostragem realizada com 1000 famílias.
Faça uma estimativa (erro e intervalo) para o valor médio recebido pela
população das famílias com base em um nível de confiança de 98%
(não se esqueça de calcular z, dividindo 98 por 100 e, após, dividindo o
resultado obtido por 2. Procure o resultado na tabela).

6) O diretor de marketing de uma indústria pretende comprar uma nova


máquina para fabricar parafusos. Você foi designado para estudar
três marcas de maquinarias semelhantes, cada uma delas combina,
de modo diferente, fatores como o preço do produto, volume de
fabricação, condições de consumo de energia etc.
Qualquer um destes equipamentos pode ser utilizada na sua indústria,
não havendo qualquer tipo de influência no rendimento pela presença
dos outros equipamentos da indústria.
Para saber se há diferença entre o volume de produção das
três máquinas visando à sua eficácia, cada uma delas é testada,
aleatoriamente, funcionando em algumas das lojas dos fabricantes
durante um período de duração limitada. Note que as lojas de venda
são selecionadas de modo que as três amostras sejam aleatórias e
independentes entre si.

250

probabilidade_e_estatistica_1582.indb 250 19/07/12 11:12


Probabilidade e Estatística

A quantidade de peças produzidas durante este período constam na


tabela seguinte:

Maquina 1 Máquina 2 Máquina 3

8 10 7

6 8 5

5 12 8

6 7 6

7 9 7

10 5

11

Soma 32 67 38

Seja Xi a variável aleatória que representa o volume de produção de cada


máquina i (i = 1,2,3), também admitamos que X1, X2 e X3 têm distribuição
normal com iguais variâncias e fixemos o nível de confiança do teste em
95%, ou seja, trabalhemos com um nível de significância de 5%.
A hipótese a testar é: H: µ1 = µ2 = µ3, ou seja: aceita-se que não há
diferença entre os níveis de produção relativamente ao volume médio
de peças que podem fabricar.
No caso que a hipótese H seja rejeitada, estaremos demostrando que pelo
menos duas máquinas produzem um volume médio de peças diferente.
Assim, para resolver este problema, calcule o ponto crítico pelo médio
do estatístico F da tabela da distribuição para um nível de significância
de 5%. Verifique se aceita ou rejeita a hipótese de trabalho e crie a
tabela ANOVA.

Unidade 5 251

probabilidade_e_estatistica_1582.indb 251 19/07/12 11:12


Saiba mais

Se quiser aprofundar os estudos relativos ao assunto tratado nessa


unidade, pesquise em:

BARBETTA, Pedro Alberto. Estatística aplicada às ciências


sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.

MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo:


Makron Books, 1999.

TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:


LTC, 1999.

VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de


Janeiro: Campus, 2000.

probabilidade_e_estatistica_1582.indb 252 19/07/12 11:12


6
UNIDADE 6

Regressão linear e gráficos de


controle

Objetivos de aprendizagem
„„ Compreender e calcular a correlação entre duas
variáveis.
„„ Analisar a força de correlação entre duas variáveis.

„„ Ajustar linearmente as duas variáveis.

„„ Calcular previsões usando análise de regressão.

Seções de estudo
Seção 1 Correlação linear simples

Seção 2 Análise de regressão linear

Seção 3 Gráficos de controle

probabilidade_e_estatistica_1582.indb 253 19/07/12 11:12


Universidade do Sul de Santa Catarina

Para início de estudo


Pense na seguinte situação: será que existe alguma relação entre
peso e altura? E entre nota escolar e idade? Sabemos como
funcionam algumas destas relações por simples experiência de
vida. Como, por exemplo, você pode dizer que quanto mais alta
é a pessoa, mais pesada ela é. Claro que existem as exceções, mas
geralmente, baixinhos são gordinhos, e altos, magrinhos.

Nesta unidade, você irá estudar como se pode analisar e


comparar duas variáveis. Além disso, você irá aprender a fazer
previsões utilizando esse método.

Bons estudos!

Seção 1 – Correlação linear simples


Os métodos que você estudou até o momento são eficazes para
analisar e interpretar somente uma variável de cada vez. Se eles
servem para a análise de uma variável, como analisar e comparar
duas variáveis simultaneamente? Para compreender como solucionar
tal situação, você irá conhecer a correlação linear simples.

A correlação é uma ferramenta destinada ao estudo


da relação entre duas variáveis quantitativas, além de
fornecer a intensidade dessa relação.

Para você estudar como usar a correlação linear simples, é


importante que você conheça o que é diagrama de dispersão e o
coeficiente de correlação linear de Pearson. Conheça melhor estes
assuntos a seguir.

254

probabilidade_e_estatistica_1582.indb 254 19/07/12 11:12


Probabilidade e Estatística

Diagrama de dispersão
O diagrama de dispersão ajuda a definir a correlação entre duas
variáveis quantitativas de modo gráfico. Em outras palavras,
a relação entre duas variáveis, X e Y, pode ser vista em um
diagrama, no qual são marcados os pontos correspondentes aos
pares ordenados gerados pela relação X → Y, e (x,y) são esses pares
ordenados. Dessa forma se constrói um diagrama de dispersão.

Quanto mais esses pontos estão próximos à reta imaginária gerada


pela nuvem de pontos, mais forte será a correlação. Observe o
gráfico a seguir e acompanhe os exemplos apresentados.

No Gráfico 6.1, os pares ordenados são gerados da relação entre a


altura das pessoas em centímetros e o peso em quilos.

Gráfico 6.1 – Diagrama de dispersão


Fonte: Elaboração do autor (2006).

Coeficiente de correlação linear de Pearson


O coeficiente de correlação permite que você analise a força ou a
existência da correlação entre duas variáveis. Considerando que
n é o número de observações (tamanho da amostra), o coeficiente
será dado pela seguinte fórmula:

n. ∑ x. y − [(∑ x )(
. ∑ y )]
rxy =
[n ∑ x 2
][
− (∑ x ) . n ∑ y 2 − (∑ y )
2 2
]

Unidade 6 255

probabilidade_e_estatistica_1582.indb 255 19/07/12 11:12


Universidade do Sul de Santa Catarina

Em que:

r = resultado do coeficiente de correlação linear de Pearson;

n = número de observações;

x = valores assumidos pela variável X;

y = valores assumidos pela variável Y.

Obs.: O coeficiente de Pearson pode variar de −1 a +1 → [−1,+1].

Quanto ao resultado de r, você deve considerar cinco situações,


descritas no quadro a seguir.

Valor de r Correlação entre as variáveis

r próximo de 0 Correlação linear pouco significativa

r=0 Não há correlação linear entre as variáveis

r próximo de –1 Há correlação linear negativa (significativa)

r = –1 Há correlação linear negativa perfeita

r próximo de +1 Há correlação linear positiva (significativa)

r = +1 Há correlação linear positiva perfeita

Quadro 6.1 – Resultados possíveis do valor de x


Fonte: Elaboração do autor (2006).

Tipos de correlações
Então, segundo os resultados de r, as correlações podem assumir
diferentes tipos, os quais você pode acompanhar detalhadamente
a seguir:

a) Correlação linear positiva

Neste caso, o coeficiente de Pearson estará entre 0 e 1 →


intervalo (0,1).

256

probabilidade_e_estatistica_1582.indb 256 19/07/12 11:12


Probabilidade e Estatística

Gráfico 6.2 – Correlação linear positiva: altura x peso


Fonte: Elaboração do autor (2006).

„„ x cresce, y cresce: no exemplo, se a altura cresce, o peso


cresce;

„„ x decresce, y decresce: no exemplo, se a altura decresce, o


peso decresce.

b) Correlação linear perfeita positiva

Neste caso, o coeficiente de Pearson r será +1: os pontos estão


perfeitamente alinhados.

Gráfico 6.3 – Correlação linear perfeita positiva: altura x peso


Fonte: Elaboração do autor (2006).

„„ x cresce, y cresce: no exemplo, se altura cresce, o peso


cresce;

„„ x decresce, y decresce: no exemplo: se a altura decresce, o


peso decresce.

Unidade 6 257

probabilidade_e_estatistica_1582.indb 257 19/07/12 11:12


Universidade do Sul de Santa Catarina

c) Correlação linear negativa

Neste caso, o coeficiente de Pearson estará entre 0 e −1:


intervalo [−1,0].

Gráfico 6.4 – Correlação linear negativa: idade x nota


Fonte: Elaboração do autor (2006).

„„ x cresce, y decresce: no exemplo, se a idade cresce, a nota


decresce;

„„ x decresce, y cresce: no exemplo, se a idade decresce, a


nota cresce.

d) Correlação linear perfeita negativa

Neste caso, o coeficiente de Pearson r será −1: os pontos estão


perfeitamente alinhados.

Gráfico 6.5 – Correlação linear perfeita negativa: idade x nota


Fonte: Elaboração do autor (2006).

258

probabilidade_e_estatistica_1582.indb 258 19/07/12 11:12


Probabilidade e Estatística

„„ x cresce, y decresce: no exemplo, se a idade cresce, a nota


decresce;

„„ x decresce, y cresce: no exemplo, se a idade decresce, a


nota cresce.

e) Correlação linear nula ou ausência de correlação

A seguir, veja exemplo de quando não há correlação entre as


variáveis X e Y (coeficiente de Pearson r = 0).

Gráfico 6.6 – correlação linear nula ou ausência de correlação: altura x nota


Fonte: Elaboração do autor (2006).

Como calcular o coeficiente de correlação?


Para obter esta resposta, acompanhe com atenção o exemplo.

Exemplo: Calcule o coeficiente de correlação de Pearson e


construa o diagrama de dispersão para uma turma de alunos,
correlacionando altura e peso, descritas a seguir:

Unidade 6 259

probabilidade_e_estatistica_1582.indb 259 19/07/12 11:12


Universidade do Sul de Santa Catarina

Tabela 6.1 – Tabela de altura e peso dos alunos de uma série

Fonte: Elaboração do autor (2006).

Calculando passo a passo

Passo 1: acrescente, na tabela, mais três colunas para auxiliar nos


cálculos. Some os elementos da coluna x (altura) e escreva o total na
última linha, obtendo, assim, o Σx. Some os elementos da coluna y (peso)
e escreva o total na última linha, obtendo, assim, o Σy (veja tabela).

Passo 2: calcule os elementos da terceira coluna (x.y), multiplicando


cada um dos elementos da coluna x (altura) por cada um dos
elementos da coluna y (peso).

160.61 = 9760
155.56 = 8680
152.55 = 8360

E, assim, até o último aluno (aluno de número 10: veja os


resultados na tabela). Em seguida, some todos eles e escreva o
total na última linha, obtendo, assim, o Σx y.

260

probabilidade_e_estatistica_1582.indb 260 19/07/12 11:12


Probabilidade e Estatística

Passo 3: calcule os elementos da quarta coluna (x2), elevando ao


quadrado, cada um dos elementos da coluna x (altura).

(160)2 = 25600
(155)2 = 24025
(152)2 = 23104

E, assim, até o último aluno (veja os resultados na tabela). Em


seguida, some todos eles e escreva o total na última linha, para
obter, assim, o Σx2.

Passo 4: calcule os elementos da quinta coluna (y2), elevando ao


quadrado, cada um dos elementos da coluna y (peso em Kg).

(61)2 = 3721
(56)2 = 3136
(55)2 = 3025

E, assim, até o último aluno (veja os resultados na tabela). Em


seguida, some todos eles e escreva o total na última linha, para
obter, assim, o Σy2.

Passo 5: calcule o coeficiente de correlação utilizando a fórmula vista


anteriormente.

Agora, que tal identificar os elementos da fórmula?


n = número de observações (10 alunos) → n = 10.

Unidade 6 261

probabilidade_e_estatistica_1582.indb 261 19/07/12 11:12


Universidade do Sul de Santa Catarina

Os elementos a seguir foram calculados nos passos anteriores:

Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
Σy2 = 50323

Observação: É importante lembrar que:

Σx.y ≠ Σx . Σy

Σx2 ≠ Σy2

Se você escrever na fórmula, terá:

Passo 6: agora, construa o diagrama de dispersão; para construir o


diagrama; você deve marcar os pontos de cada par ordenado usando
os valores da coluna das alturas como x e da coluna dos pesos como
y, formando (x, y); veja o gráfico a seguir:

262

probabilidade_e_estatistica_1582.indb 262 19/07/12 11:13


Probabilidade e Estatística

Gráfico 6.7 – Gráfico altura x peso


Fonte: Elaboração do autor (2006).

Como interpretar? O coeficiente de correlação resultou em


um número positivo e próximo de 1 (r = 0,98), sendo assim,
a correlação entre a altura dos alunos e o peso é positiva
(significativa), ou seja, quanto maior a altura do aluno, maior
será seu peso, e quanto menor for sua altura menor será seu peso.
Uma vez que você acompanhou e entendeu bem o exemplo de
como aplicar o coeficiente de correlação de Pearson, siga para o
estudo da próxima seção.

Seção 2 – Análise de regressão linear


Para fazer a análise da regressão, nos casos em que é possível
estabelecer uma correlação entre duas variáveis, você terá de usar essa
relação para prever valores para uma delas (sempre a variável que for
adotada como Y), mas isso só será possível quando for conhecido o
valor da outra variável, no caso, a variável X. E essa previsão só tem
significado caso a força da correlação seja significativa ou perfeita
(quando r está próximo ou igual a +1 ou −1). Essa força se dá pela
proximidade dos pontos do diagrama de dispersão à reta imaginária.

A reta imaginária obtida pela aproximação dos pontos


do diagrama de dispersão é chamada de reta de
regressão!

Unidade 6 263

probabilidade_e_estatistica_1582.indb 263 19/07/12 11:13


Universidade do Sul de Santa Catarina

Para encontrar uma equação que lhe auxilie a prever valores


de Y, usa-se o Método dos Mínimos Quadrados, o qual você
conhecerá a seguir.

A escolha da variável que será o Y está relacionada à


variável que o pesquisador deseja estimar. No exemplo
anterior, se a intenção é a de estimar o peso dos alunos,
então, o Y deve ser a variável peso. Caso a necessidade
fosse a de estimar a altura dos alunos, a variável Y
passaria a ser a altura.

Método dos mínimos quadrados


Pode-se representar a reta imaginária pela equação:

Reta de regressão: = b + a.X

Sendo:

Em que:

= valor predito de y (a ser estimado);

x = valor da variável x para determinado elemento da amostra;

y = valor da variável y para determinado elemento da amostra;

n = nº total de observações (tamanho da amostra);

b = a intersecção do eixo y (ou coeficiente linear da reta);

a = coeficiente de inclinação da reta (ou coeficiente angular da reta).

264

probabilidade_e_estatistica_1582.indb 264 19/07/12 11:13


Probabilidade e Estatística

Ao predizer um valor de y com base em determinado


valor de x, quanto mais significativa a correlação linear,
mais precisa se torna a previsão.
 Interpolação: estimativas com valores entre os da série;
 Extrapolação: estimativas com valores fora dos da série;
 Resíduo: é a diferença entre um valor amostral
observado y, e o valor predito com base na equação de
regressão.

A tabela a seguir (a mesma do exemplo anterior) descreve as


alturas e pesos dos alunos de uma turma. Você deverá:

a) construir a equação de uma reta de regressão para prever


o peso dos alunos;

b) prever o peso ( ) de um aluno com 175 cm (x) de altura.

Tabela 6.2 – Altura e peso dos alunos de uma série

Fonte: Elaboração do autor (2006).

Calculando passo a passo


„„ Para o item a):

Considerando que a tabela é a mesma do exemplo da seção 1


(cálculo do coeficiente de correlação), não será necessário calcular
as colunas nem os totais (veja a tabela).

Unidade 6 265

probabilidade_e_estatistica_1582.indb 265 19/07/12 11:13


Universidade do Sul de Santa Catarina

Equação da reta de regressão → = b + a.X

Passo 1: você pode começar calculando a inclinação da reta (a).

Inclinação da reta (a) →

Agora, identifique os elementos da fórmula:


n = número de observações (10 alunos) → n = 10.

Os elementos a seguir foram calculados nos passos anteriores

Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537

Se você escrever na fórmula, terá:

Passo 2: calcule a intersecção com o eixo y (b).

Intersecção do eixo y (b) →

Agora, identifique os elementos da fórmula:


n = número de observações (10 alunos) → n = 10.

Os elementos a seguir foram calculados nos passos anteriores.

266

probabilidade_e_estatistica_1582.indb 266 19/07/12 11:13


Probabilidade e Estatística

Σx = 1723
Σy = 703
a = 0,72117

b = –53,95769

Passo 3: construa a equação da reta de regressão.

Após calcular a e b, tem-se:

a = 0,72117

b = − 53,95769

= b + a.X

= 0,72117x – 53,95769

„„ Para o item b):

Fazer a previsão para um aluno que mede 175 cm. Você deve usar
175 como X = 175. Substituir o valor de X na equação de regressão.

= 0,72117 . 175 – 53,95769 = 126,20475 – 53,95769

= 72,24706

Como interpretar? A previsão para o peso deste aluno que mede


175 cm é de 72,25 Kg.

Unidade 6 267

probabilidade_e_estatistica_1582.indb 267 19/07/12 11:13


Universidade do Sul de Santa Catarina

Seção 3 – Gráficos de controle


Antes de iniciar, vamos a uma questão: você saberia explicar o
porquê do controle nos processos?

Quando fabricado um produto, bem ou serviço, as características


deste produto irão apresentar certa variabilidade, devido à variação
sofrida pelos fatores que compõem o próprio processo produtivo;
por exemplo, diferença entre máquinas, mudanças nas condições
ambientais, variação do material utilizado na fabricação, diferença
entre fornecedores, e outras tantas causas possíveis.

Apesar do esforço direcionado para controlar todas esta


variabilidade, ela irá sempre existir no produto acabado.
Portanto, é importante controlar esta variabilidade para que
possam ser fabricados produtos dentro dos padrões de qualidade
próprios da empresa.

Também é importante verificar a estabilidade


do processo de produção, já que de processos
instáveis irão resultar produtos defeituosos ou
perdas na produção ou, ainda, baixa na qualidade e,
consequentemente, perda da confiança do cliente.

A partir do exposto, é possível compreender melhor a necessidade


dos gráficos de controle. O que nos leva a outra questão: o que
são os gráficos de controle?

Os gráficos de controle são um método para analisar


e ajustar as variações de um processo em função do
tempo. Descrevem o processo considerando duas
caraterísticas básicas: centralização, definida pela
média aritmética, e dispersão, verificada pelo desvio
padrão ou pela amplitude.

Assim, temos dois grandes grupos de gráfico de controle: os


gráficos para variáveis e os gráficos para atributos. As variáveis
são os dados que podem ser medidos ou que sofrem variações
contínuas (por exemplo, resistência à compressão, dureza,
diâmetros etc.), e os atributos são dados que somente podem ser

268

probabilidade_e_estatistica_1582.indb 268 19/07/12 11:13


Probabilidade e Estatística

contados ou classificados (por exemplo, passa/não passa, claro/


escuro, quente/frio etc.), em outras palavras, são aqueles que
representam variáveis contínuas ou discretas, respectivamente.

Tipos de gráficos de controle


O gráfico para atributos mais usado é o gráfico NP, que
monitora a variação do número de itens defeituosos em amostras
de tamanho constante.

O gráfico de variável mais conhecido é o gráfico X-r, que monitora


a variação da média e amplitude dos dados ao longo do tempo.

E quais são os principais objetivos destes gráficos?

„„ Monitorar os dados temporais para uma característica


particular de qualidade, como exemplo: a cor de um
produto, o peso ou a temperatura;

„„ detectar mudanças no processo ao longo do mesmo;

„„ responder a perguntas do tipo:

»» são os lotes de matéria-prima ou a variação de turno


que causam a variação do processo?

»» são causas especiais do processo ou causas naturais que


ocasionam a variação no processo?

»» a variação entre os diferentes lotes de produção é


maior que o esperado?

Acompanhe alguns exemplos de aplicação dos gráficos de


controles a seguir.

Unidade 6 269

probabilidade_e_estatistica_1582.indb 269 19/07/12 11:13


Universidade do Sul de Santa Catarina

Exemplo 1:

Proposta: verificar se o processo de fabricação está sob


controle estatístico, ou seja, somente causas comuns de variação
influenciam processos.

Problema: a fábrica Peças & Peças deseja realizar um controle de


qualidade do processo de fabricação de parafusos.

Dados coletados: em todas as horas, são retiradas cinco peças


da linha de produção, que são medidas, e os valores, registrados.
Definimos, neste caso, que o tamanho do subgrupo é igual a
cinco, destes, 25 subgrupos foram obtidos.

Exemplo 2:

Proposta: verificar se a proporção de pedidos não aceitos está sob


controle.

Problema: o Banco de Minas deseja saber o número de pedidos


não aceitos para a abertura de contas em uma rede bancária.

Coleta de dados: Foi coletada uma amostra de 20 pedidos.

Exemplo 3:

Proposta: verificar o número de erros nas fichas de


cadastramento de uma empresa.

Problema: foi observado um grande número de erros no


preenchimento dos cadastros dos vendedores de uma empresa.
Deseja-se analisar o número de erros por cadastro (não
conformidades).

Coleta de dados: analisa-se uma amostra de 22 conjuntos,


contendo 15 fichas de cadastro cada.

270

probabilidade_e_estatistica_1582.indb 270 19/07/12 11:13


Probabilidade e Estatística

Construção de gráficos de controle com ajuda de planilhas de


cálculo: gráfico NP
A fábrica de Parafusos Fernando Fernandes, no final de cada dia de
trabalho, inspeciona uma amostra de cem peças para obter o número
de defeitos e conhecer o grau de qualidade da sua produção.

Pode-se perceber que essa característica de qualidade varia ao


longo do tempo; e, assim, para facilitar esse estudo, devemos usar
uma ferramenta que possibilite a visualização do número de peças
dentro dos padrões predeterminados pela fábrica e aquelas que
estão fora desses padrões, como são os gráficos de controle.

Os gráficos de controle típicos exibem três linhas paralelas


ao eixo X: a linha central, que representa o valor médio do
característico de qualidade exigido pela fábrica; a linha superior,
que representa o limite superior de controle (LSC); e a linha
inferior, representando o limite inferior de controle (LIC).

Assim, uma vez apresentado o gráfico, os pontos da amostragem


devem permanecer dentro do intervalo determinado por LSC e
LIC. Cada ponto representa uma amostra do processo.

Para visualizar a evolução do característico de qualidade ao longo


do tempo, é usual unir os pontos com retas.

Assim, os gráficos de controle apresentam o desempenho do


processo no tempo e podem indicar que o processo está sob
controle estatístico quando:

„„ todos os pontos do gráfico estão dentro dos limites de


controle;

„„ a disposição dos pontos dentro dos limites é aleatória;

No caso que todos os pontos amostrais estejam sem distribuição


aleatória, pode acontecer de estar trabalhando com dados visados.

Unidade 6 271

probabilidade_e_estatistica_1582.indb 271 19/07/12 11:13


Universidade do Sul de Santa Catarina

Construção do gráfico de controle NP


Logo após de uma semana de amostragem, os resultado são os
seguintes:

Tabela 6.3 – Resultado da amostragem


Amostra número 1 2 3 4 5 6
Tamanho amostra n 100 100 100 100 100 100
Número de peças defeituosas d 5 2 7 3 6 2
Proporção de peças defeituosas p 0,05 0,02 0,07 0,03 0,06 0,03

Fonte: Elaboração do autor (2011).

Para o cálculo da média das proporções, devemos utilizar a


seguinte fórmula:

P = (1 / m) Spi

Em que:

P = média das proporções;

m = número de amostras (no exemplo, m = 6);

Spi = somatória das proporções.

Assim sendo:

P = 1/6 * (B4 + C4 + D4 + E4 + F4 + G4) = 0,04167

Para calcular o número médio, usamos a fórmula:

NP = P x n

Em que:

NP = número médio;

n = tamanho da amostra (no exemplo, n = 100).

272

probabilidade_e_estatistica_1582.indb 272 19/07/12 11:13


Probabilidade e Estatística

Para o exemplo:

NP = 0,04167 x 100 = 4,167

Para calcular o LSC, usamos a fórmula:

Em que:

LSC = limite superior de controle;

NP = número médio;

P = médias das proporções.

Para o exemplo dado:

LSC = 10,1615

Para o cálculo do LIC, usamos a fórmula:

Em que LIC é o limite inferior de controle, e, usando os dados


do exemplo, resulta em:

LIC = −1,8281.

Porém, pelo fato de que a fábrica está testando o número de peças


defeituosas, resulta que o LIC (o mínimo de peças defeituosas
produzidas) não pode ser um número negativo.

No exemplo, devemos assumir como LIC o menor valor possível,


ou seja, zero peças defeituosas.

Unidade 6 273

probabilidade_e_estatistica_1582.indb 273 19/07/12 11:13


Universidade do Sul de Santa Catarina

Temos, então, todos os parâmetros necessários à construção do


gráfico NP:

LIC = 0

LSC = 10,1615

NP = 4,167

Agora, vamos construir o gráfico, com a ajuda de uma tabela em


Excel, que possuirá quatro colunas:

„„ Número de peças defeituosas;

„„ Limite superior de controle (LSC);

„„ Limite inferior de controle (LIC);

„„ Número médio (NP).

Tabela 6.4 – Peças com defeito

Fonte: Elaboração do autor (2011).

Note que os valores de LSC, LIC e NP são iguais para cada


amostra. Com a tabela pronta, efetua-se o procedimento usual para
a construção de um gráfico de linhas com os pontos plotados.

Este procedimento será mostrado a seguir:

Marcar o intervalo A1:D7 e, a partir do menu Inserir /


Gráfico, inserir um gráfico de linhas com marcas para
os pontos.

274

probabilidade_e_estatistica_1582.indb 274 19/07/12 11:13


Probabilidade e Estatística

Figura 6.1 – Criação de gráfico de controle em Excel


Fonte: Elaboração do autor (2011).

E, assim, veremos uma janela semelhante à seguinte:

Figura 6.2 – Criação de gráfico de controle em Excel


Fonte: Elaboração do autor (2011).

Nesta caixa, podemos visualizar como ficará o gráfico.

Clique em continuar; na próxima caixa, mostrada na Figura


3.3, definiremos os detalhes do gráfico NP, tais como título do
gráfico, legendas e títulos dos eixos X e Y.

Feito isso, finalizaremos o procedimento clicando em finalizar.

Unidade 6 275

probabilidade_e_estatistica_1582.indb 275 19/07/12 11:13


Universidade do Sul de Santa Catarina

Figura 6.3 – Criação de gráfico de controle em Excel


Fonte: Elaboração do autor (2011).

Resultando, finalmente, no gráfico de controle NP.

Gráfico 6.8 – Gráfico de controle


Fonte: Elaboração do autor (2011).

Analisando o gráfico, observamos que todos os pontos amostrais


estão distribuídos aleatoriamente ao redor da média, sem
apresentar valores fora dos limites máximos e mínimos e sem
apresentar dados visados; através dessa análise, podemos concluir
que o processo de fabricação está sob controle estatístico e não
apresenta falhas de produção que precisem parar a produção para,
por exemplo, calibrar alguma parte de equipamento.

Dito com outras palavras, conclui-se que o número de peças não


conformes está sob controle estatístico, já que nenhum ponto
ultrapassa os limites de controle.

276

probabilidade_e_estatistica_1582.indb 276 19/07/12 11:13


Probabilidade e Estatística

Construção de gráficos de controle com ajuda de planilhas de


cálculo: gráfico X-r
Uma empresa que produz, ensaca e comercializa arroz deve verificar
a qualidade de seu produto em relação ao peso de cada pacote.

Para isso, faz-se necessário um gráfico de controle para variáveis;


neste caso, a variável é o peso dos pacotes.

Por tal motivo, foi feita uma amostragem aleatória de quatro


pacotes em cada uma das seis amostras. Para cada uma das seis
amostras, calculou-se a média aritmética e a amplitude dos pesos
(valor máximo – valor mínimo).

Na construção do gráfico X-r, são necessários os seguintes


valores:

„„ média das médias das amostras (X);

„„ média das amplitudes das amostras (K);

„„ tamanho das amostras (n).

Com estas duas médias, X e K, e com n, pode-se calcular os


limites de controle (LIC e LSC).

Então, temos que:

Faz-se amostragem dos pesos nas m amostras com n pacotes e


registram-se estes pesos:

„„ número de amostras m = 6;

„„ número de pacotes por amostra n = 4.

Com os dados coletados, podemos construir a tabela seguinte e


calcular a média e amplitude dos pesos de cada amostra.

Unidade 6 277

probabilidade_e_estatistica_1582.indb 277 19/07/12 11:13


Universidade do Sul de Santa Catarina

Tabela 6.5 – Amostras

Fonte: Elaboração do autor (2011).

Agora, devemos calcular os valores necessários para a construção


do gráfico de controle X-r para cada uma das amostras e, no caso
da amostra 1, resulta:

„„ Cálculo da média

X = Σn amostra 1 / n

Em que:

X = média aritmética;

Σn amostra 1 = soma dos pesos da amostra 1;

n = tamanho da amostra.

X = 250 / 4 = 62,5

„„ Cálculo da amplitude dos pesos

r = valor máximo − valor mínimo

Em que:

r = amplitude

r = 70 – 55 = 15

278

probabilidade_e_estatistica_1582.indb 278 19/07/12 11:13


Probabilidade e Estatística

Calculamos, assim, a média e a amplitude de todas as amostras,


construindo a seguinte tabela:

Tabela 6.6 – Peças com defeito

Fonte: Elaboração do autor (2011).

Continuando, para calcular os limites de controle inferior


e superior, calculamos a média das médias e a média das
amplitudes para cada amostra:

„„ Média das médias

Média das médias (X) = Soma das médias / m

X = 367,50 / 6 = 61,25

„„ Médias das amplitudes

Médias das amplitudes (K) = Soma das amplitudes / m

K = 95 / 6 = 15,83

E, finalmente, construímos uma tabela semelhante à


seguinte:

Unidade 6 279

probabilidade_e_estatistica_1582.indb 279 19/07/12 11:13


Universidade do Sul de Santa Catarina

Tabela 6.7 – Peças com defeito

Fonte: Elaboração do autor (2011).

Todos os valores necessários para calcularmos LIC e LSC estão


disponíveis:

„„ média das médias: X = 61,25;

„„ média das amplitudes: K = 15,83;

„„ tamanho da amostra: n = 4.

Para calcularmos LIC e LSC:

LIC = X − A2 x K

LSC = X + A2 x K

Observação: o valor de A2 é obtido na tabela no final desta seção.

Para nosso caso, resulta em:

LIC = 61,25 − (0,729 x 15,83) = 49,71

LSC = 61,25 + (0,729 x 15,83) = 72,79

Podemos, para construir o gráfico de controle, construir uma


tabela semelhante à seguinte:

280

probabilidade_e_estatistica_1582.indb 280 19/07/12 11:13


Probabilidade e Estatística

Tabela 6.8 – Média das amostras

Média das LIC LSC Média das


amostras médias
62,50 49,71 72,79 61,25
60,00 49,71 72,79 61,25
67,50 49,71 72,79 61,25
55,00 49,71 72,79 61,25
60,00 49,71 72,79 61,25
62,50 49,71 72,79 61,25
Fonte: Elaboração do autor (2011).

E, seguindo os mesmos passos do exemplo anterior para


construir o gráfico, resulta no nosso gráfico de controle X-r:

Gráfico 6.9 – Gráfico de Controle


Fonte: Elaboração do autor (2011).

Unidade 6 281

probabilidade_e_estatistica_1582.indb 281 19/07/12 11:13


Universidade do Sul de Santa Catarina

Síntese

O processo de amostragem é muito importante e eficaz no dia


a dia de qualquer profissional. Diariamente, você esbarra com
situações semelhantes às que foram analisadas nesta unidade,
tanto nos meios de comunicação, como rádio, TV, jornais etc.,
mas também em escolas, empresas e outras instituições.

É preciso entender que as pesquisas feitas com base em uma


amostra não culminam com resultados exatos, e poder definir
a margem de erro ocasionada por essa amostragem é um passo
muito importante na formação profissional e acadêmica, além de
possibilitar uma leitura mais realista da realidade.

282

probabilidade_e_estatistica_1582.indb 282 19/07/12 11:13


Probabilidade e Estatística

Atividades de autoavaliação

1) Uma turma da oitava série realizou avaliação em duas disciplinas,


Matemática e Biologia; as notas obtidas estão na tabela abaixo. Usando
estes dados, calcule o que se pede:

Aluno Nota Matemática Nota Biologia X.Y X2 Y2

1 9,5 3,4 32,3 90,3 11,6


2 9,0 5,4 48,6 81,0 29,2
3 8,5 6,0 51,0 72,3 36,0
4 8,0 6,0 48,0 64,0 36,0
5 8,0 5,0 40,0 64,0 25,0
6 7,5 7,0 52,5 56,3 49,0
7 7,5 9,0 67,5 56,3 81,0
8 6,0 7,5 45,0 36,0 56,3
9 5,0 8,0 40,0 25,0 64,0
10 4,0 8,0 32,0 16,0 64,0
Totais 73,0 65,3 456,9 561,0 452,0

a) Calcule o coeficiente de correlação entre as duas variáveis, identifique o


tipo de correlação e interprete o resultado.
b) Construa uma equação para a relação indicada (a equação da reta de
regressão) para possibilitar o cálculo de estimativas para a nota de
Biologia (Y), segundo a nota de Matemática (X).
c) Estime a nota de Biologia considerando que um aluno tenha tirado nota
6,5 (X) em Matemática. Substitua na equação da reta construída no
item “b”.

Unidade 6 283

probabilidade_e_estatistica_1582.indb 283 19/07/12 11:13


Universidade do Sul de Santa Catarina

Saiba mais

Se quiser aprofundar os estudos relativos ao assunto tratado nessa


unidade, pesquise em:

BARBETTA, Pedro Alberto. Estatística aplicada às ciências


sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.

MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo:


Makron Books, 1999.

TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro:


LTC, 1999.

VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de


Janeiro: Campus, 2000.

284

probabilidade_e_estatistica_1582.indb 284 19/07/12 11:13


Para concluir o estudo

Muitas vezes nos deparamos com situações em que


temos que lidar com muitos dados e não sabemos como
vamos lidar com eles. Esta disciplina é uma tentativa de
proporcionar ferramentas para os profissionais que lidam
com esse tipo de situação.

Desde a apresentação de relatórios e trabalhos científicos


a pesquisas, controle, testes, projeções e previsões, a
Estatística está sempre presente. Afinal, no dia a dia,
lidamos com uma grande quantidade de informações
e pergunto: De que vale ter tanta informação se não
sabemos o que fazer com elas? Espera-se que todo o
conhecimento que você adquiriu nesta disciplina seja
suporte para as suas análises, opiniões e decisões.

Muito sucesso profissional!

Prof. Luiz Arthur Dornelles Júnior

probabilidade_e_estatistica_1582.indb 285 19/07/12 11:13


probabilidade_e_estatistica_1582.indb 286 19/07/12 11:13
Referências

ACÇÃO LOCAL DE ESTATÍSTICA APLICADA – ALEA. 1999-2010.


Disponível em: <http://alea-estp.ine.pt>. Acesso em: 15 ago. 2010.
ARANGO, Héctor Gustavo. Bioestatística teórica e
computacional. Rio de Janeiro: Guanabara, 2001.
ASSOCIAÇÃO NACIONAL DE ENTIDADES PROMOTORAS DE
EMPREENDIMENTOS INOVADORES - Anprotec. 2008. Disponível
em: <http://www.anprotec.org.br>. Acesso em: 15 ago. 2010.
BANCO CENTRAL DO BRASIL. 2010. Disponível em: <http://www.
bcb.gov.br/>. Acesso em: 15 ago. 2010.
BARBETTA, Pedro Alberto. Estatística aplicada às ciências
sociais. 5. ed. rev. Florianópolis: Ed. UFSC, 2002.
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.
ed. São Paulo: Harbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva,
2001.
DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS
SOCIOECONÔMICOS – DIEESE. 2010. Disponível em: <http://www.
dieese.org.br/>. Acesso em: 3 ago. 2010.
FLEMMING, Diva Marília. Representações gráficas. São José:
Saint Germain, 2003.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso
de estatística. 6. ed. São Paulo: Atlas, 1996.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE.
2010. Disponível em: <http://www.ibge.gov.br/>. Acesso em: 3
set. 2010.
ISTOÈ ONLINE. Florianópolis / SC – Caça ao tucano. 2004.
Disponível em: <http://www.terra.com.br/istoe/especiais/
eleicoes_2004/1_rodada/florianopolis.htm. Acesso em: 10 ago
2006.
LEVIN, Jack. Estatística aplicada às ciências humanas. São
Paulo: Habra, 1987.
MORETTIN, Luiz Gonzaga. Estatística básica. São Paulo: Makron
Books, 1999

probabilidade_e_estatistica_1582.indb 287 19/07/12 11:13


Universidade do Sul de Santa Catarina

NEUFELD, John L. Estatística aplicada à administração usando excel.


São Paulo: Prentice Hall, 2003.
POPULATION REFERENCE BUREAU. La juventud del mundo 2000.
Washington DC: Population Reference Bureau, 2000. Disponível em:
<http://www.prb.org/SpanishContent.aspx>. Acesso em: 3 março 2011.
PORTAL BRASIL. 2010. Disponível em: <http://www.portalbrasil.net/>.
Acesso em: 3 set. 2010.
RAUEN, Fábio. Roteiro de pesquisa. Rio de Sul: Nova Era, 2006.
SILVA, Ermes Medeiros da. Estatística para os cursos de Economia,
Administração e Ciências Contábeis. São Paulo: Atlas, 1999.
______. Estatística. São Paulo: Atlas, 1996. v.1.
SINDICATO DA HABITAÇÃO – SECOVI/RS. 2010. Disponível em: <http://
www.secovi-rs.com.br/index.asp>. Acesso em: 10 ago. 2010.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1994.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed.
São Paulo: Atlas, 1985.
TRIBUNAL SUPERIOR ELEITORAL. 2010. Disponível em: <http://www.tse.
gov.br>. Acesso em: 20 set. 2010.
TRIOLA, Mario F. Introdução à Estatística. Rio de Janeiro: LTC, 1999.
VIEIRA, Sônia. Introdução à bioestatística. 6. ed. Rio de Janeiro: Campus,
2000.
______. Princípios de Estatística. São Paulo: Pioneira, 2003.
WILD, Christopher J. Encontros com o acaso. Rio de Janeiro: LTC, 2004.

288

probabilidade_e_estatistica_1582.indb 288 19/07/12 11:13


Sobre os professores conteudistas

Luiz Arthur Dornelles Júnior

Graduado em Matemática pela Fundação Universidade


do Rio Grande (FURG). É professor da Universidade
do Sul de Santa Catarina (UNISUL) desde 2000,
onde leciona as disciplinas de Estatística, Métodos
Quantitativos e Programação Linear. Atualmente, está
cursando Especialização em Educação Matemática na
Unisul Virtual.

Gabriel Cremona Parma (2ª edição)

Doutor em Engenharia Civil, na área de Gestão


Territorial pela Universidade Federal de Santa Catarina
(UFSC). Mestre em Engenharia Civil, na área Cadastro
Técnico Multifinalitário pela Universidade Federal de
Santa Catarina (UFSC). Cartógrafo: UNL, Argentina.
Consultor especializado em Geoprocessamento e
Controle de Qualidade de Dados Geoespaciais. Atua
como professor e pesquisador na Universidade do Sul de
Santa Catarina (UNISUL) nos cursos de Engenharia
e Arquitetura e Urbanismo, assim como em projetos
de pesquisa e extensão. Ex-professor na Universidade
Nacional do Litoral (UNL), na Argentina.

probabilidade_e_estatistica_1582.indb 289 19/07/12 11:13


probabilidade_e_estatistica_1582.indb 290 19/07/12 11:13
Respostas e comentários das
atividades de autoavaliação

Unidade 1
1) O censo é uma coleção de dados de uma população,
enquanto que a estimação usa dados de uma amostra para
avaliar um parâmetro (característica descritiva dos elementos
da população).

2) Deve-se escolher elementos com as mesmas características


da população, ou seja, elementos que realmente
representem a população. Aqui, você pode citar exemplos
(escolher clientes de níveis sociais diferentes para estudar
grau de satisfação, escolher amostras de diversos locais
de um lago para análise etc.). Isso é necessário para que
você possa realmente refletir a realidade, sem distorcer ou
conduzir os resultados.

3. Nessa questão, você deve citar exemplos do seu dia a dia, por
exemplo:

Variável Exemplos
Qualitativa nominal Nacionalidade
Qualitativa ordinal Atendimento (ótimo, muito bom, ... , muito ruim.)
Quantitativa discreta Número de filhos
Quantitativa contínua Escore de teste psicológico

probabilidade_e_estatistica_1582.indb 291 19/07/12 11:13


Universidade do Sul de Santa Catarina

4) A classificação que você pode fazer é:


„„ os dados coletados por meio de questionário: primários;
„„ os dados coletados na Federação: secundários.

5) Observe, no quadro a seguir, a resposta para esta questão.

DESCRIÇÃO DA VARIÁVEL CLASSIFICAÇÃO


Saldo em conta corrente em R$ Quantitativa contínua
Idade do cliente Quantitativa contínua
Sexo do cliente Qualitativa nominal
Classe econômica Qualitativa ordinal
Estado civil Qualitativa nominal
Número de defeitos do produto Quantitativa discreta
Consumo de energia em kWh Quantitativa contínua
Grau de instrução Qualitativa ordinal
Número de filhos Quantitativa discreta
Hierarquia de uma empresa Qualitativa nominal
Número de filhos de uma família Qualitativa nominal
Diâmetro da peça produzida Quantitativa discreta
Comprimento da peça Quantitativa contínua
Tempo de espera em caixa eletrônico em minutos Qualitativa nominal
Nome de país exportador de petróleo Quantitativa contínua
Grau de satisfação no atendimento numa loja comercial Qualitativa nominal
Número de ações negociadas na bolsa de valores Quantitativa contínua
Número de alunos de uma universidade Quantitativa contínua
Altura dos funcionários de uma empresa Qualitativa nominal

6) A classificação que você pode fazer é:


A) série específico-geográfica;
B) série específica.

292

probabilidade_e_estatistica_1582.indb 292 19/07/12 11:13


Probabilidade e Estatística

Unidade 2
1) Montagem da tabela:

Principais motivos de tensão (estresse) Nº de clientes


Morte de um filho 16
Morte do cônjuge 12
Morte dos pais ou irmãos 11
Divórcio 8
Doença grave 7
Demissão 6

2) Montagem da tabela:

Acidentes de trabalho nos últimos 36 meses


Nº de acidentes Número de meses
3 4
4 5
5 9
6 7
7 5
8 6

3) Montagem da tabela:

Renda das famílias de um bairro de classe baixa de Florianópolis

Renda família (R$) Nº de pacientes


112 |---- 115 2
115 |---- 118 6
118 |---- 121 4
121 |---- 124 9
124 |---- 127 8
127 |---- 130 7

293

probabilidade_e_estatistica_1582.indb 293 19/07/12 11:13


Universidade do Sul de Santa Catarina

4) Completando a tabela:

Renda de famílias de um bairro da classe baixa de Florianópolis

Renda Nº de fiacd fiaci fr fp(%) PM


(R$) famílias “abaixo de” “acima de”
112 |--- 115 2 2 36 0,0556 5,56 113,5
115 |--- 118 6 8 34 0,1667 16,7 116,5
118 |--- 121 4 12 28 0,1111 11,1 119,5
121 |--- 124 9 21 24 0,25 25 122,5
124 |--- 127 8 29 15 0,2222 22,2 125,5
127 |--- 130 7 36 7 0,1944 19,4 128,5
Total (Σfi) 36 1,0 100,0

Respondendo as perguntas:

a) 21 famílias;
b) 29 famílias;
c) 15 famílias;
d) 7 famílias;
e) 11,1% das famílias;
f) 25% das famílias.

5) Completando a tabela:

Número de operários acidentados para cada mês

Número de Nº de fiacd fiaci fr fp (%)


acidentados meses “abaixo de” “acima de”
3 4 4 36 0,1111 11,1
4 5 9 32 0,1389 13,9
5 9 18 27 0,2500 25
6 7 25 18 0,1944 19,4
7 5 30 11 0,1389 13,9
8 6 36 6 0,1667 16,7
Total (Σfi) 36 1,0 100,0

294

probabilidade_e_estatistica_1582.indb 294 19/07/12 11:13


Probabilidade e Estatística

a) 18 meses;
b) 25 meses;
c) 18 meses;
d) 27 meses;
e) 25% dos meses;
f) 13,89% dos meses.

6) Essa atividade vai depender muito do gráfico escolhido e de sua análise.


Não esqueça de usar as dicas para analisar um gráfico:
„„ identificar as variáveis expressas pelo gráfico;
„„ identificar os intervalos em que as variáveis atuam;
„„ identificar onde a variável que está sendo estudada apresenta
máximo e mínimo;
„„ identificar se a tendência é de crescimento ou de decrescimento. Em
alguns casos, pode ser bastante difícil realizar essa identificação;
„„ analisar o comportamento de uma maneira geral, identificando as
alterações mais expressivas;
„„ outras análises também são possíveis, isso só depende do
observador e, muitas vezes, da variável que estamos estudando.

7) O histograma e o polígono de frequências deverão ser semelhantes ao


seguir:

295

probabilidade_e_estatistica_1582.indb 295 19/07/12 11:13


Universidade do Sul de Santa Catarina

Unidade 3
1) Em primeiro lugar, construa a tabela:

Consumo de bebidas alcoólicas por semana pelos funcionários

Número de dias (xi) Número de funcionários (fi) xi.fi


0 10 0
1 16 16
2 14 28
3 8 24
4 5 20
5 4 20
6 4 24
7 3 21
Total (Σfi) 64 153

Em segundo lugar, calcule a média, dividindo a soma da coluna xi.fi,


pela soma da coluna fi. O resultado é a média:

Interpretação: o número médio de dias de consumo de álcool pelos


funcionários é de 2,39 dias.

2) Usando um processo semelhante ao anterior, em primeiro lugar, você


deve calcular o ponto médio. Em seguida, multiplicar o ponto médio
pela fi de cada linha e escrever o resultado na coluna PM.fi. Some esses
números no final da coluna, conforme a tabela.

Renda de famílias de um bairro de classe baixa de Florianópolis

Renda (R$) Número de famílias PM PM.fi


112 |---- 115 2 113,5 227
115 |---- 118 6 116,5 699
118 |---- 121 4 119,5 478
121 |---- 124 9 122,5 1102,5
124 |---- 127 8 125,5 1004
127 |---- 130 7 128,5 899,5
Total (Σfi) 36 4410
296

probabilidade_e_estatistica_1582.indb 296 19/07/12 11:13


Probabilidade e Estatística

Em segundo lugar, divida o resultado da soma (ΣPM.fi) pelo soma dos


números da coluna fi:

Interpretação: o nível da renda familiar é de 122,5 reais

3)
a) Conjunto 1
Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posições:

12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª

Segundo passo: calcular a posição, levando em consideração que a


série tem 9 elementos, sendo, assim, ímpar:

Terceiro passo: encontrar, na tabela p, o elemento que ocupa a 5ª


posição:

12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª

Me = 15 – o tempo de internação mediano é de 15 dias.


Interpretação: 50% dos valores observados são menores ou iguais a
15, e 50% dos valores observados são maiores ou iguais a 15.

b) Conjunto 2
Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posições:

14 14 15 15 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª

Segundo passo: calcular a posição, levando em consideração que a


série tem 8 elementos, sendo, assim, par:

297

probabilidade_e_estatistica_1582.indb 297 19/07/12 11:13


Universidade do Sul de Santa Catarina

A mediana ocupa uma posição entre a 4ª e a 5ª posições.


Terceiro passo: encontrar na tabela os elementos que ocupam as
posições 4ª e 5ª:

14 14 15 15 Me 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª

Elemento da 4ª posição = 15;


Elemento da 5ª posição = 16.
Quarto passo: calcular a media:
Me = 15,5.
Interpretação: 50% dos valores observados são menores ou iguais a
15,5 e 50% dos valores observados são maiores ou iguais a 15,5.

4)
a) Conjunto 1
„„ Organizando os dados:

1 1 1 1 2 2 2 2 3
5 5 6 6 7 7 7 8 8

A série tem duas modas: Mo1 = 1 e Mo2 = 2.


Interpretação moda 1: O valor mais frequente é 1.
Interpretação moda 2: O valor mais frequente é 2.

b) Conjunto 2
„„ Organizando os dados:

2 2 2 3 3 3 3 5
5 5 5 6 6 6 8 8

A série tem duas modas: Mo1 = 3 e Mo2 = 5.


Interpretação moda 1: O valor mais frequente é 3.
Interpretação moda 2: O valor mais frequente é 5.

298

probabilidade_e_estatistica_1582.indb 298 19/07/12 11:13


Probabilidade e Estatística

c) Conjunto 3
„„ Organizando os dados:

1 1 2 2 3 3 4 4
5 5 6 6 7 7 8 8

A série não tem moda, pois não tem nenhum dado que se repita mais
que os outros
Interpretação moda: é uma série amodal, ou seja, não tem valor(es)
mais frequente.

5) Primeiro passo: escrever, na tabela, os dados organizados em ordem


crescente (Rol) e, na linha de baixo, as posições:

2 3 4 4 4 5 5 6 8 8 9 9
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª

„„ Para o terceiro quartil


Segundo passo: calcular a posição. Considerando N = 12:

Ou seja, Q3 está entre a 9ª e a 10ª posições.


Terceiro passo: calcular o terceiro quartil.
Valor que ocupa a 9ª posição = 8;
Valor que ocupa a 10ª posição = 8.
Então, calcule da seguinte forma:

Interpretação:
75% dos dados observados são menores ou iguais a 8, e 25% dos dados
observados são maiores ou iguais a 8.
„„ Para o nono decil (note que D9 = P90)
Quarto passo: calcular a posição. Considerando N = 12:

Ou seja, D9 está entre a 11ª e a 12ª posições.

299

probabilidade_e_estatistica_1582.indb 299 19/07/12 11:13


Universidade do Sul de Santa Catarina

Quinto passo: calcular o nono decil.


Valor que ocupa a 11ª posição = 9;
Valor que ocupa a 12ª posição = 9.
Então, calcule da seguinte forma:

Interpretação:
90% dos dados observados são menores ou iguais a 9, e 10% dos dados
observados são maiores ou iguais a 9.
„„ Para o trigésimo quinto percentil
Sexto passo: calcular a posição. Considerando N = 12:

Ou seja, P35 está entre a 4ª e a 5ª posições.


Sétimo passo: calcular o trigésimo quinto percentil.
Valor que ocupa a 4ª posição = 4;
Valor que ocupa a 5ª posição = 4.
Então, calcule da seguinte forma:

Interpretação:
35% dos dados observados são menores ou iguais a 4, e 65% dos dados
observados são maiores ou iguais a 4.

6) Nessa questão, você pode seguir os seguintes passos:


Passo 1: calcular a média:

Obs.: não esqueça que, na média, usamos a letra grega μ para a


população.

300

probabilidade_e_estatistica_1582.indb 300 19/07/12 11:13


Probabilidade e Estatística

Passo 2: calcular os desvios (xi – ):


(x1 – ) = (25 − 28,33)= −3,33
(x2 – ) = (22 − 28,33) = −6,33
(x 3 – ) = (36 − 28,33) = 7,67
(x4 – ) = (20 − 28,33) = −8,33
(x5 – ) = (29 − 28,33) = 0,67
(x 6 – ) = (38 − 28,33) = 9,67
Passo 3: elevar ao quadrado cada desvio (xi – )2:
(x1 – )2 = (−3,33) 2 = 11,0889
(x2 – )2 = (−6,33) 2 = 40,0689
(x3 – )2 = (7,67) 2 = 58,8289
(x4 – )2 = (−8,33) 2 = 69,3889
(x5 – )2 = (0,67) 2 = 0,4489
(x 6 – )2 = (9,67) 2 = 93,5089
Somando todos os resultados, temos 273,3334.
Passo 4: calcular a média dos quadrados dos desvios. Aqui, você vai
calcular para a população (variância):
Variância:

Então σ2(x) = 45,5556


Passo 5: calcular o desvio padrão calculando a raiz da variância:
Desvio padrão:

Interpretação: a variabilidade de tempo de execução do teste é de


6,7495 minutos.

301

probabilidade_e_estatistica_1582.indb 301 19/07/12 11:13


Universidade do Sul de Santa Catarina

7) O modo de calcular é o mesmo da questão anterior, só muda no final,


ao calcular a variância, usamos a fórmula para amostra.
Passo 1: calcular a média:

Obs.: não esqueça que, na média, usamos a xˉ para a amostra.


Passo 2: calcular os desvios (xi – ):
(x1 – ) = (15 – 17,6) = –2,6
(x2 – ) = (10 – 17,6) = –7,6
(x3 – ) = (9 – 17,6) = –8,6
(x4 – ) = (23 – 17,6) = 5,4
(x5 – ) = (31 – 17,6) = 13,4
Passo 3: elevar ao quadrado cada desvio (xi – )2:
(x1 – )2 = (–2,6)2 = 6,76
(x2 – )2 = (–7,6)2 = 57,76
(x3 – )2 = (–8,6) 2 = 73,96
(x4 – )2 = (5,4) 2 = 29,16
(x5 – )2 = (13,4) 2 = 179,56
Somando todos os resultados, temos 347,2.
Passo 4: calcular a média dos quadrados dos desvios. Aqui, você vai
calcular para a amostra (variância):
Variância:

Então, s2 (x) = 86,8.


Passo 5: calcular o desvio padrão calculando a raiz da variância:
Desvio padrão:

Interpretação: a variabilidade dos escores é de 9,32 pontos.

302

probabilidade_e_estatistica_1582.indb 302 19/07/12 11:13


Probabilidade e Estatística

8) O primeiro passo é calcular a média:

1–2,39 = –1,39 (–2,39)2 = 5,71

0–2,39 = –2,39 (–1,39)2 = 1,93

No de dias No de func.
xi.fi (xi – x̄) (xi – x̄)2 (xi – x̄)2. fi
(xi) (fi)
0 10 0 –2,39 5,71 57,1 5,71×10 = 57,1
1 16 16 –1,39 1,93 30,88
2 14 28 –0,39 0,15 2,1 1,93×16 = 30,88
3 8 24 0,61 0,37 2,96
4 5 20 1,61 2,59 12,95
5 4 20 2,61 6,81 27,24
6 4 24 3,61 13,03 52,12
7 3 21 4,61 21,25 63,75
Σ 64 153 249,1 Σ(xi – x̄)2. fi

Σfi Σxi.fi

Vamos calcular passo a passo


Passo 1: devemos somar a coluna das frequências simples (fi) para
obter Σfi (frequência total):
Σfi = 64
Passo 2: calcular a média: multiplicar cada xi por sua correspondente fi
e escrever na coluna xi.fi; somar os valores calculados e escrever no final
da coluna esse resultado, que é o Σxi.fi:
Σxi.fi = 153
Passo 3: dividir o resultado do passo 2 (Σxi.f i) pelo resultado do
passo 1 (Σf i):

Passo 4: calcular a quarta coluna, (xi – ) subtraindo o xi de cada linha


pela média:
0 – 2,39 = –2,39
1 – 2,39 = –1,39
2 – 2,39 = –0,39
3 – 2,39 = 0,61
4 – 2,39 = 1,61
5 – 2,39 = 2,61
6 – 2,39 = 3,61
7 – 2,39 = 4,61
303

probabilidade_e_estatistica_1582.indb 303 19/07/12 11:13


Universidade do Sul de Santa Catarina

Passo 5: calcular a quinta coluna elevando os valores da quarta ao


quadrado, (xi – )2:
(–2,39)2 = 5,71
(–1,39) 2 = 1,93
(–0,39) 2 = 0,15
(0,61) 2 = 0,37
(1,61) 2 = 2,59
(2,61) 2 = 6,81
(3,61) 2 = 13,03
(4,61) 2 = 21,25
Passo 6: calcular a sexta coluna multiplicando os valores da quinta pela
frequência simples de cada linha, (xi – )2.fi:
5,71×10 = 57,1
1,93×16 = 30,88
0,15×14 = 2,1
0,37×8 = 2,96
2,59×5 = 12,95
6,81×4 = 27,24
13,03×4 = 52,12
21,25×3 = 63,75
Passo 7: somar os valores obtidos na sexta coluna, Σ(xi – )2.fi:
Σ(xi – )2.fi = 249,1
Passo 8: calcular a variância para a amostra:

Passo 9: calcular o desvio padrão:

304

probabilidade_e_estatistica_1582.indb 304 19/07/12 11:13


Probabilidade e Estatística

9) Mais uma vez, vamos calcular passo a passo. Comparando com a anterior,
a diferença está em que aquela era para amostra, enquanto que essa é
para a população. Sugestão: use as colunas para facilitar os cálculos.

18 – 18,873 = –0,873
(–1,873)2 = 3,508
17 – 18,873 = –1,873
(–0,873)2 = 0,762
Idade dos estudantes da disciplina de métodos estatísticos

Idade (xi) N de
o
est. xi.fi (xi – μ) (xi – μ)2 (xi – μ)2. fi
(fi)
17 5 85 -1,873 3,508 17,54 3,508×5 = 17,54
18 20 360 -0,873 0,762 15,24
19 22 418 0,127 0,016 0,352 0,762×20 = 15,24
20 10 200 1,127 1,27 12,7
21 6 126 2,127 4,524 27,144
(Σfi) 63 1189 72,976 Σ(xi – x̄)2. fi

Σfi Σxi.fi

Passo 1: devemos somar a coluna das frequências simples (fi) para


obter Σfi (frequência total):
Σfi = 63
Passo 2: calcular a média: multiplicar cada xi por sua correspondente fi
e escrever na coluna xi.fi; somar os valores calculados e escrever no final
da coluna esse resultado, que é o Σxi.fi:
Σxi.fi = 1189
Passo 3: dividir o resultado do passo 2 (Σxi.f i) pelo resultado do
passo 1 (Σf i):

Passo 4: calcular a quarta coluna, (xi – μ) subtraindo o xi de cada linha


pela média:
17 – 18,873 = –1,873
18 – 18,873 = –0,873
19 – 18,873 = 0,127
20 – 18,873 = 1,127
21 – 18,873 = 2,127

305

probabilidade_e_estatistica_1582.indb 305 19/07/12 11:13


Universidade do Sul de Santa Catarina

Passo 5: calcular a quinta coluna, elevando os valores da quarta ao


quadrado, (xi - μ)2:
(–1,873)2 = 3,508
(–0,873)2 = 0,762
(0,127) 2 = 0,016
(1,127) 2 = 1,27
(2,127) 2 = 4,524
Passo 6: calcular a sexta coluna, multiplicando os valores da quinta
pela freqüência simples de cada linha, (xi – μ)2.fi:
3,508×17 = 17,54
0,762×18 = 15,24
0,016×19 = 0,352
1,27×20 = 12,7
4,524×21 = 27,144
Passo 7: somar os valores obtidos na sexta coluna, Σ(xi – μ)2.fi:
Σ(xi – μ)2.fi = 72,976
Passo 8: calcular a variância para a amostra:

Passo 9: calcular o desvio padrão:

306

probabilidade_e_estatistica_1582.indb 306 19/07/12 11:13


Probabilidade e Estatística

10) Quando você tiver que calcular o desvio padrão para uma tabela com
intervalos, usamos o mesmo processo, apenas substituindo o xi pelo
ponto médio:

116,5 – 122,5 = –9
(–9)2 = 81
113,5 – 122,5 = –6
(–6)2 = 36
Renda de família de um bairro de classe baixa de Florianópolis

No de
Renda (R$) famílias PMi PMi.fi (PMi – x̄) (PMi – x̄)2 (PMi – x̄)2. fi
(fi)
112 |---- 115 2 113,5 227 -9 81 162 81×2 = 162
115 |---- 118 6 116,5 699 -6 36 216
118 |---- 121 4 119,5 478 -3 9 36 36×6 = 216
121 |---- 124 9 122,5 1102,5 0 0 0
124 |---- 127 8 125,5 1004 3 9 72
127 |---- 130 7 128,5 899,5 6 36 252
Total (Σfi) 36 4410 738 Σ(PMi – x̄)2. fi

Σfi ΣPMi.fi

Vamos calcular passo a passo


Passo 1: somar a coluna das frequências simples (fi) para obter Σfi
(frequência total):
Σfi = 36
Passo 2: cálculo da média: calcular o ponto médio de cada intervalo
e multiplicar cada PM por sua correspondente fi e escrever na coluna
PM.fi, somar os valores calculados nessa coluna e escrever o total. Esse
resultado é o ΣPM.fi:
ΣPM.fi = 4410
Passo 3: dividir o resultado (ΣPM.fi) pelo resultado do Passo 1 (Σfi):

Passo 4: calcular a quinta coluna, (PMi – ¯ ) subtraindo o PMi de cada


linha pela média:
113,5 – 122,5 = –9
116,5 – 122,5 = –6
119,5 – 122,5 = –3
122,5 – 122,5 = 0
125,5 – 122,5 = 3
128,5 – 122,5 = 6

307

probabilidade_e_estatistica_1582.indb 307 19/07/12 11:13


Universidade do Sul de Santa Catarina

Passo 5: calcular a sexta coluna, elevando os valores da quinta ao


quadrado, (PMi – )2:
(–9)2 = 81
(–6)2 = 36
(–3)2 = 9
(0)2 = 0
(3)2 = 9
(6)2 = 36
Passo 6: calcular a sétima coluna, multiplicando os valores da sexta
pela frequência simples de cada linha, (PMi – )2.fi:
81×2 = 162
36×6 = 216
9×4 = 36
0×9 = 0
9×8 = 72
36×7 = 252
Passo 7: somar os valores obtidos na sexta coluna, Σ(PMi – )2.fi:
Σ(PMi – )2.fi = 738
Passo 8: calcular a variância:

Passo 9: calcular o desvio padrão:

11)
11.1)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).

308

probabilidade_e_estatistica_1582.indb 308 19/07/12 11:13


Probabilidade e Estatística

b) Você tem que calcular o coeficiente de variação.


„„ Para a série A:

„„ Para a série B:

A série com maior dispersão relativa é a série A (maior coeficiente de


variação).

c) Concluindo, a série mais dispersa é a série A.

11.2)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
„„ Para a série A:

„„ Para a série B:

As duas séries apresentam o mesmo valor para os coeficientes de


variação.

c) Concluindo, as duas séries apresentam a mesma dispersão.

11.3)
a) Em termos absolutos, as duas séries apresentam a mesma dispersão
(desvios iguais).
b) Você tem que calcular o coeficiente de variação.
„„ Para a série A:

309

probabilidade_e_estatistica_1582.indb 309 19/07/12 11:13


Universidade do Sul de Santa Catarina

„„ Para a série B:

A série com maior dispersão relativa é a série B (maior coeficiente de


variação).

c) Concluindo, a série mais dispersa é a série B.

11.4)
a) A mais dispersa em termos absolutos é a série A (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
„„ Para a série A:

„„ Para a série B:

A série com maior dispersão relativa é a série B (maior coeficiente de


variação).

c) Concluindo, a série mais dispersa é a série B.

310

probabilidade_e_estatistica_1582.indb 310 19/07/12 11:13


Probabilidade e Estatística

12) Passo 1: abra uma nova planilha Excel e, na célula A1, escreva: gráfico
box-plot, digite todos os números dos dados na coluna A de uma nova
planilha do Excel, a partir da fila 2 e, no intervalo C3:C8, escreva os
textos indicados na figura seguinte:

Passo 2: agora, vamos calcular a mediana, quartis, máximos e mínimos


usando as fórmulas do Excel. Para isso, digite as seguintes fórmulas:
„„ Em D4: =MED(A2:A21) para calcular a mediana do intervalo de dados
A2:A21.
„„ Em D5: =QUARTIL(A2:A21;1) para calcular o 1° quartil dos dados.
„„ Em D6: =MÍNIMO(A2:A21) para calcular o mínimo valor do conjunto
de dados;
„„ Em D7: =MÁXIMO(A2:A21) para calcular o máximo dos dados.
„„ Em D8: =QUARTIL(A2:A21;3) para calcular o 3° quartil da
amostragem.

311

probabilidade_e_estatistica_1582.indb 311 19/07/12 11:13


Universidade do Sul de Santa Catarina

O resultado será:

Passo 3: crie o gráfico, acompanhando o exemplo desenvolvido na


teoria desta seção, até obter o gráfico box-plot dos dados, semelhante
ao seguinte:

312

probabilidade_e_estatistica_1582.indb 312 19/07/12 11:13


Probabilidade e Estatística

Unidade 4
1)
Passo 1: para começar, você deve identificar o evento e o espaço
amostral:
A: jovens sofriam com o autoritarismo dos pais
S: adolescentes
Passo 2: identificar o número de elementos do evento e do espaço
amostral:
n(A) = 675
n(S) = 1500
Passo 3: calcular usando a fórmula:

0,45 ou 45%

2)
Passo 1: Para começar, você deve identificar os eventos e o espaço
amostral:
A: casado(a)
B: solteiro(a)
C: divorciado(a)
S: total pesquisado
Passo 2: identificar o número de elementos dos eventos e do espaço
amostral:
n(A) = 267.867
n(B) = 333.974
n(C) = 16.779
n(S) = 665.541
Passo 3: calcular usando a fórmula:

0,4025 ou 40,25%

313

probabilidade_e_estatistica_1582.indb 313 19/07/12 11:13


Universidade do Sul de Santa Catarina

0,5018 ou 50,18%

0,0252 ou 2,52%

3)
a) Qual a frequência relativa para o número de reações positivas para cada
cobaia?
Passo 1: identificar o numerador e o denominador da fórmula, para
cada experimento.
„„ Cobaia 1:
Número de reações positivas = 1215;
número total de tentativas = 4500.
„„ Cobaia 2:
Número de reações positivas = 1050;
número total de tentativas = 3500.
Passo 2: usar a fórmula da freqüência relativa.

FrA = número de vezes que ocorreu A


número total de observações

1215
FrA = 0,27 ou 27%
4500

FrB = número de vezes que ocorreu B


número total de observações

FrB = 1050 0,3 ou 30%


3500

b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?
O estímulo por alimentação, pois a cobaia 2, em termos relativos,
apresentou melhor resposta. Embora o número de reações da cobaia
1 tenha sido maior comparando com o total (frequência relativa), a
reação é menor.

314

probabilidade_e_estatistica_1582.indb 314 19/07/12 11:13


Probabilidade e Estatística

4)
a) Calcule Z (variável padronizada) para x = 116, x = 136, para x = 131 e
para x = 141 pontos;
Passo 1: identificar todos os elementos que compõe o problema:
a média: μ = 126;
o desvio padrão: σ(x) = 10;
os limites do intervalo: X = 116; X = 136; X = 131; X = 141.
Passo 2: calcular a variável padronizada Z:
„„ Para X = 116:

Z = −1
„„ Para X = 136:

Z=1
„„ Para X = 131:

Z = 0,5
„„ Para X = 141:

Z = 1,5

315

probabilidade_e_estatistica_1582.indb 315 19/07/12 11:13


Universidade do Sul de Santa Catarina

b) Qual a probabilidade de escolher uma pessoa com escore maior que


136 pontos?
Passo 1: identificar, no gráfico, o intervalo e a área que você deve
calcular (usar o z calculado no item anterior, para x = 136, o z = 1):

Passo 2: procurar na tabela a área correspondente a z = 1 (não esqueça,


a área dada na tabela é sempre entre 0 e z):

Z = 1 → Área = 0,3413
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,3413), mas o intervalo solicitado é de
136 para cima. Nesse caso, você deve subtrair de 0,5 (total de área de
um lado da curva) o valor encontrado (0,3413), então:
P(x > 136) = 0,5 – 0,3413 = 0,1587 ou 15,87%

c) Qual a probabilidade de escolher uma pessoa com escore entre 126 e


131 pontos? Note que 126 é a média. Esse fica mais fácil.
Passo 1: identificar, no gráfico, o intervalo e a área que você deve
calcular (usar o z calculado no item anterior, para x = 131, o z = 0,5):

316

probabilidade_e_estatistica_1582.indb 316 19/07/12 11:13


Probabilidade e Estatística

Passo 2: procurar na tabela a área correspondente à z = 0,5 (não


esqueça, a área dada na tabela é sempre entre 0 e z)
Z = 0,5 → Área = 0,1915
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,1915), e o intervalo solicitado é entre
0 e Z, então, você já tem o resultado:
P(126 < x < 131) = 0,1915 ou 19,15%

d) Qual a probabilidade de escolher uma pessoa com escore entre 116 e


141 pontos?
Passo 1: identificar no gráfico o intervalo e a área que você deve
calcular (usar os valores de z calculados no item anterior, para x=116, o
z=-1 e para x=141, o z=1,5):

Passo 2: procurar, na tabela, a área correspondente à z1 = –1 e z2 = 1,5


(não esqueça, a área dada na tabela é sempre entre 0 e z):
Z1 = –1 → Área = 0,3413 (não esqueça que a curva é simétrica, e o sinal
só indica de que lado está a área).
Z2 = 1,5 → Área = 0, 4332
Passo 3: calcular a probabilidade.
A área solicitada é a soma das duas áreas, a correspondente à Z1 (0,3413)
e a correspondente à Z2 (0,4332), então:
P(116 < x < 141) = 0,3413 + 0,4332 = 0,7745 ou 77,45%

317

probabilidade_e_estatistica_1582.indb 317 19/07/12 11:13


Universidade do Sul de Santa Catarina

Unidade 5
1)
a) Estudo socioeconômico com estudantes da Unisul.
Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,03;
N = tamanho da população = 5600.
Passo 2: usar a fórmula:

n0 = 1111,11 → arredondando, temos 1111 pessoas.


Um tamanho aproximado para a amostra seria de 1111 pessoas. Observe
que o pesquisador teve acesso à informação de que a população seria de
5600 pessoas, então você deve passar para o passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a
seguinte fórmula:

Arredondando, seriam 927 pessoas.

b) Estudo com famílias do bairro Rio Vermelho, em Florianópolis.


Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,04;
N = tamanho da população = 9400.
Passo 2: usar a fórmula:

n0 = 625 crianças.
Um tamanho aproximado para a amostra seria de 625 crianças. Observe
que o pesquisador teve acesso à informação de que a população seria
de 9400 crianças, então você deve passar para o passo seguinte:

318

probabilidade_e_estatistica_1582.indb 318 19/07/12 11:13


Probabilidade e Estatística

Passo 3: calcular o tamanho da amostra usando a população com a


seguinte fórmula:

Arredondando, seriam 586 crianças.

c) Estudo com adolescentes com Teste de Sondagem Intelectual (TSI).


Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,05;
N = tamanho da população = 400.
Passo 2: usar a fórmula:

n0 = 400 adolescentes.
Um tamanho aproximado para a amostra seria de 400 adolescentes.
Observe que o pesquisador teve acesso à informação de que a
população seria de 400 adolescentes, então você deve passar para o
passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a
seguinte fórmula:

Seriam 200 adolescentes.


Você pode resolver os outros itens da mesma maneira que os três já
calculados, o processo é o mesmo. As respostas estão abaixo:

d) Estudo da fecundidade na cidade de Florianópolis.


n0 = 278.
n = 277.

e) Estudo com usuários de drogas adolescentes de uma escola.


n0 = 123.
n = 83.

f) Estudo sobre analfabetismo no bairro do Rio Tavares, em Florianópolis.


n0 = 123.

319

probabilidade_e_estatistica_1582.indb 319 19/07/12 11:13


Universidade do Sul de Santa Catarina

n = 118.

g) Estudo do índice de massa corporal dos estudantes da Unisul.


n0 = 400.
n = 364.

h) Pesquisa de intenções de voto no Brasil.


n0 = 2500.
n = 2500.

2)
Passo 1: Como já foi indicado o percentual de eleitores que votam no
candidato, só falta calcular o percentual dos eleitores que não votam no
candidato ( ).

Você pode deixar na forma decimal, pois, para calcular o erro, é usado
desta forma.
Passo 2: Calcular e procurar o z na tabela (o z é igual ao encontrado no
exemplo 2, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:

Passo 3: procurar este valor na tabela e encontrar o z correspondente.


Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a figura a seguir:

320

probabilidade_e_estatistica_1582.indb 320 19/07/12 11:13


Probabilidade e Estatística

Encontrando a área, é só seguir a coluna na qual o valor se encontra até


a primeira linha. Note que o valor se encontra entre 0,4495 e 0,4505 e,
sendo assim, na primeira linha, você deve usar o valor entre 0,04 e 0,05
como se fosse um ponto médio ficando, assim, 0,045. Seguindo a linha
até a primeira coluna, você encontra o valor 1,6. Juntando ou somando
os dois, você encontra o valor 1,645 para z, ou seja, z = 1,645.
Passo 4: discriminar cada elemento da fórmula de cálculo do erro e
calcular o

Em que:
e = erro da estimativa;
z = 1,645 (calculado e encontrado no passo 2);

= 26,4% ou (percentual da amostra de eleitores que

votam no candidato);

321

probabilidade_e_estatistica_1582.indb 321 19/07/12 11:13


Universidade do Sul de Santa Catarina

(percentual da amostra dos eleitores que não


votam no candidato);
n = 700 (tamanho da amostra).
Cálculo do erro:
= 1,645.

Passo 5: calcular o intervalo da estimativa:


Neste passo, o cálculo pode ser na forma percentual ou decimal.

P(0,2366 < p < 0,2914) = 0,90 ou


P(23,66 < p < 29,14) = 90%

3)
Passo 1: como não foi indicado o percentual de professores da amostra
que tem graduação completa, você deve, em primeiro lugar, calcular
este percentual:
n = 300 (tamanho da amostra);
X = 240 (número de professores com graduação);
Cálculo do percentual:

= 1 – 0,8 = 0,2
Você pode deixar na forma decimal, pois, para calcular o erro, é usado
desta forma.
Passo 2: calcular e procurar o z na tabela.
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:

322

probabilidade_e_estatistica_1582.indb 322 19/07/12 11:13


Probabilidade e Estatística

Passo 3: procurar este valor na tabela e encontrar o z correspondente.


Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a figura abaixo:

Encontrando a área, é só seguir a coluna na qual o valor se encontra


até a primeira linha; encontrando o número 0,06 é só seguir a linha até
a primeira coluna, encontrando o valor 1,9. Juntando ou somando os
dois, você encontra o valor 1,96 para z, ou seja, z = 1,96.
Passo 4: discriminar cada elemento da fórmula de cálculo do erro e
calcular o mesmo:

Em que:
e = erro da estimativa;
z = 1,96 (calculado e encontrado no passo 2);

= 80% ou (percentual da amostra de eleitores que votam

no candidato);
= 1 – 0,8 = 0,2 (percentual da amostra dos eleitores que não votam no
candidato);
n = 300 (tamanho da amostra).

323

probabilidade_e_estatistica_1582.indb 323 19/07/12 11:13


Universidade do Sul de Santa Catarina

Cálculo do erro:
= 1,96.

Passo 5: calcular o intervalo da estimativa:

P(0,7547 < p < 0,8452) = 0,95 ou


P(75,47 < p < 84,52) = 95%

4)
Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no
exemplo 1, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:

Passo 2: procurar este valor na tabela e encontrar o z correspondente.


Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a figura a seguir:

324

probabilidade_e_estatistica_1582.indb 324 19/07/12 11:13


Probabilidade e Estatística

Encontrando a área, é só seguir a coluna na qual o valor se encontra até


a primeira linha; encontrando o número 0,06, deve-se seguir a linha até
a primeira coluna e encontrar o valor 1,9. Juntando ou somando os dois,
você encontra o valor 1,96 para z, ou seja, z=1,96.
Passo 5: discriminar cada elemento da fórmula de cálculo do erro e
calculá-lo:

Em que:
e = o que você quer calcular (erro da estimativa);
z = 1,96 (calculado e encontrado no passo 2);
S(x) = 3,4 (desvio padrão da amostra);
n = 250 (tamanho da amostra).
Cálculo do erro:

Observação importante: não é necessário multiplicar por 100, pois


este resultado não indica percentual, neste caso, ele indica quilos!
Passo 4: calcular o intervalo da estimativa:

325

probabilidade_e_estatistica_1582.indb 325 19/07/12 11:13


Universidade do Sul de Santa Catarina

5) Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no


exemplo 1, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:

Passo 2: procurar este valor na tabela e encontrar o z correspondente.


Este valor é referente à área entre zero e z, então ele está localizado na
região central da tabela. Veja a seguinte figura:

Encontrando a área, é só seguir a coluna na qual o valor se encontra até


a primeira linha; encontrando o número 0,06, deve-se seguir a linha até
a primeira coluna, encontrando o valor 1,9. Juntando ou somando os
dois, você encontra o valor 1,96 para z, ou seja, z=2,33.
Passo 3: discriminar cada elemento da fórmula de cálculo do erro e
calculá-lo:

Em que:
e = o que você quer calcular (erro da estimativa);
z = 2,33 (calculado e encontrado no passo 2);

326

probabilidade_e_estatistica_1582.indb 326 19/07/12 11:13


Probabilidade e Estatística

S(x) = 31,4 (desvio padrão da amostra);


n = 1000 (tamanho da amostra).

Cálculo do erro:

Observação importante: não é necessário multiplicar por 100, pois


este resultado não indica percentual, neste caso indica reais!
Passo 4: calcular o intervalo da estimativa:

P(147,6791 < μ < 152,3209) = 0,98

6)
Passo 1:
Cálculo dos graus de liberdade para definição do ponto crítico (PC):
GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 máquinas = K);
GLm = 18 – 3 = 15 (graus de liberdade do denominador, 18 = 5 peças na
máquina 1 + 7 peças da máquina 2 + 6 peças da máquina 3 = N).
Agora, procurando na tabela de F para 5% de nível de significância,
entrando na coluna da esquerda com GLm = 15 e na fila superior com
GLn=4, resulta: F (5%,2,15) = 3,68 = PC

327

probabilidade_e_estatistica_1582.indb 327 19/07/12 11:13


Universidade do Sul de Santa Catarina

E, para as amostras recolhidas, tem-se que:

E o valor observado de F resulta em:

Então, ao nível de significância de 0.05 (95% de nível de confiança),


rejeita-se a hipótese H de igualdade de médias de produção, pois o valor
observado da estatística de teste F é maior que o ponto crítico PC =
10,9174.

328

probabilidade_e_estatistica_1582.indb 328 19/07/12 11:13


Probabilidade e Estatística

Há, portanto, evidência estatística de que as três máquinas não são


iguais relativamente ao volume médio de produção.
Em outras palavras: a marca da máquina influencia significativamente a
quantidade de peças fabricada por ela.
A tabela ANOVA resulta nos seguintes valores:

Unidade 6
1)
a) Passo 1: como as colunas já estão calculadas, você pode começar
identificando os elementos da fórmula:

n =10 (número de alunos);


∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
∑y2 = 456,9;

329

probabilidade_e_estatistica_1582.indb 329 19/07/12 11:13


Universidade do Sul de Santa Catarina

Passo 2: calcule o coeficiente de correlação utilizando a fórmula vista


no passo anterior:

rxy = –0,73842
Passo 3: analisando o resultado, você pode classificar e interpretar
contextualizando-o na situação descrita.
Classificação: a correlação entre as notas de Matemática e Biologia
pode ser classificada como negativa forte.
Como interpretar?
O coeficiente de correlação resultou em um número negativo e
próximo de 1 (r = –0,73842), sendo assim, a correlação entre as notas de
Matemática e Biologia é negativa (significativa), ou seja, quanto maior a
nota em Matemática, menor será a nota em Biologia, e quanto menor a
nota em Matemática, maior será a nota em Biologia.

b) Passo 1: para a equação da reta, conforme mostrada abaixo, você pode


começar calculando a inclinação da reta (a):
Equação da reta de regressão → = b+a.X
Inclinação da reta (a):

Agora, identifique os elementos da fórmula:


n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
∑x.y = 456,9;
∑x2 = 561;
330

probabilidade_e_estatistica_1582.indb 330 19/07/12 11:13


Probabilidade e Estatística

Se você escrever na fórmula, terá:

a = –0,70427
Passo 2: calcule a intersecção com o eixo y (b):
Intersecção do eixo y (b)

Identifique os elementos da fórmula:


n = 10 (número de alunos);
∑x = 73;
∑y = 65,3;
a = –0,70427.

b = –11,671171.
Passo 3: construa a equação da reta de regressão:
Após calcular a e b, tem-se:
a = –0,70427
b = –11,671171
= b + a.X
= 11,671171 – 0,70427.X

331

probabilidade_e_estatistica_1582.indb 331 19/07/12 11:13


Universidade do Sul de Santa Catarina

c) Para calcular a estimativa, você necessita de um valor para X que é dado


no item c), ou seja, X = 6,5. Para estimar a nota de Biologia, você precisa
de uma nota de Matemática. Observe o seguinte procedimento:
X = 6,5
= 11,671171 − 0,70427.X
= 11,671171 − 0,70427.(6,5)
= 11,671171 − 4,577755
= 7,09
Interpretação: se um aluno tirar 6,5 em Matemática, possivelmente ele
tirará em torno de 7,09 na nota de Biologia.

332

probabilidade_e_estatistica_1582.indb 332 19/07/12 11:13


Anexos

probabilidade_e_estatistica_1582.indb 333 19/07/12 11:13


probabilidade_e_estatistica_1582.indb 334 19/07/12 11:13
Biblioteca Virtual

Veja a seguir os serviços oferecidos pela Biblioteca Virtual aos


alunos a distância:

„„ Pesquisa a publicações on-line


<www.unisul.br/textocompleto>
„„ Acesso a bases de dados assinadas
<www.unisul.br/bdassinadas>
„„ Acesso a bases de dados gratuitas selecionadas
<www.unisul.br/bdgratuitas >
„„ Acesso a jornais e revistas on-line
<www.unisul.br/periodicos>
„„ Empréstimo de livros
<www.unisul.br/emprestimos>
„„ Escaneamento de parte de obra*

Acesse a página da Biblioteca Virtual da Unisul, disponível no EVA,


e explore seus recursos digitais.
Qualquer dúvida escreva para: bv@unisul.br

* Se você optar por escaneamento de parte do livro, será lhe enviado o


sumário da obra para que você possa escolher quais capítulos deseja solicitar
a reprodução. Lembrando que para não ferir a Lei dos direitos autorais (Lei
9610/98) pode-se reproduzir até 10% do total de páginas do livro.

probabilidade_e_estatistica_1582.indb 335 19/07/12 11:13


probabilidade_e_estatistica_1582.indb 336 19/07/12 11:13
capa_curvas.pdf 1 19/07/12 10:57

CM

MY

CY

CMY

Você também pode gostar