Você está na página 1de 157

ESTATÍSTICA BÁSICA

Professor: Narcelio de Araújo Pereira
narcelioap@yahoo.com.br

2014

SUMÁRIO

INTRODUÇÃO ............................................................................................ 03

UNIDADE 1: A NATUREZA DA ESTATÍSTICA ................................... 05

UNIDADE 2: POPULAÇÃO E AMOSTRA ............................................. 12

UNIDADE 3: SÉRIES ESTATÍSTICAS.................................................... 20

UNIDADE 4: GRÁFICOS ........................................................................... 32

UNIDADE 5: DISTRIBUIÇÃO DE FREQUENCIA ................................ 45

UNIDADE 6: MEDIDAS DE POSIÇÃO ................................................... 64

UNIDADE 7: MEDIDAS DE DISPERSÃO OU VARIABILIDADE....... 92

UNIDADE 8: PROBABILIDADE ............................................................ 105

UNIDADE 9: DISTRIBUIÇÃO BINOMIAL E NORMAL ................... 116

UNIDADE 10: CORRELAÇÃO E REGRESSÃO .................................. 139

REFERENCIAS ......................................................................................... 154

ANEXOS ..................................................................................................... 155

2

INTRODUÇÃO

Na antiguidade os povos já registravam o número de habitantes, nascimentos,
óbitos. Faziam "estatísticas". Na idade média as informações eram tabuladas
com finalidades tributárias e bélicas.
No século XVI surgem as primeiras análises sistemáticas, as primeiras tabelas
e os números relativos.
No século XVIII a estatística com feição científica é batizada por
GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as
primeiras representações gráficas e os cálculos de probabilidades. A estatística
deixa de ser uma simples tabulação de dados numéricos para se tornar "O
estudo de como se chegar a conclusão sobre uma população, partindo da
observação de partes dessa população (amostra)".
Ao longo do século XX, os métodos estatísticos foram desenvolvidos como
uma mistura de ciência, tecnologia e lógica para a solução e investigação de
problemas em várias áreas do conhecimento humano (Stigler, 1986). Ela foi
reconhecida como um campo da ciência neste período, mas sua história tem
início bem anterior a 1900.

A estatística moderna é uma tecnologia quantitativa para a ciência
experimental e observacional que permite avaliar e estudar as incertezas e os
seus efeitos no planejamento e interpretação de experiências e de observações
de fenômenos da natureza e da sociedade.

A estatística não é uma caixa-preta, nem bola de cristal, nem mágica.
Tampouco é um conjunto de técnicas úteis para algumas áreas isoladas ou
restritas da ciência. Por exemplo, ao contrário do que alguns imaginam, a
estatística não é um ramo da matemática onde se investigam os processos de
obtenção, organização e análise de dados sobre uma determinada população.
A estatística também não se limita a um conjunto de elementos numéricos
relativos a um fato social, nem a números, tabelas e gráficos usados para o
resumo, à organização e apresentação dos dados de uma pesquisa, embora este
seja um aspecto da estatística que pode ser facilmente percebido no cotidiano
(basta abrir os jornais e revistas para ver o "bombardeio" de estatísticas). Ela é
uma ciência multidisciplinar: um mesmo programa de computador que
permite a análise estatística de dados de um físico poderia também ser usado
por um economista, agrônomo, químico, geólogo, matemático, biólogo,
sociólogo, psicólogo e cientista político. Mesmo que as interpretações dessas
análises sejam diferentes por causa das diferenças entre as áreas do

3

a estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo. Finalmente.conhecimento. em questões judiciais. previsões e em muitas outras áreas. o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema. Segundo Rao (1999). a tomada de decisões sob condições de incerteza. a estatística tem sido utilizada na pesquisa científica. para a otimização de recursos econômicos. para o aumento da qualidade e produtividade. sob o menor risco possível. os conceitos empregados. na otimização em análise de decisões. 4 . as limitações das técnicas e as consequências dessas interpretações são essencialmente as mesmas.

casamentos. partindo da observação de partes dessa população (amostra). surgiram as representações gráficas e o cálculo das probabilidades.A NATUREZA DA ESTATÍSTICA PANORAMA HISTÓRICO Todas as ciências têm suas raízes na história do homem. quer teórica quer prática. de óbitos. ramo da matemática aplicada. Desde a antiguidade. Os que assim pensam ignoram os objetivos. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais. Atualmente. determinando o seu objetivo com as ciências. o campo e o rigor do método estatístico. geralmente com finalidades tributárias ou bélicas. A estatística. com seus processos e técnicas. têm contribuído para a organização dos negócios e recursos do mundo moderno. No século XVIII o estudo de tais fatos foi adquirindo. empírico. vários povos já registravam o número de habitantes. faziam estimativas das riquezas individual e social. com caráter prático. ou a conhecem muito superficialmente. originou-se do convívio social. os estudos estatísticos têm avançado rapidamente e. de nascimentos. teve origem semelhante. ignoram a Estatística. das trocas. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística. que é considerada “a ciência que une à clareza do raciocínio a síntese da linguagem”. 5 . distribuíram equitativamente terras ao povo. o público leigo (leitor de jornais e revistas) posiciona-se em dois extremos divergentes e igualmente errôneos quanto a validade das conclusões estatísticas: ou crê em sua infalibilidade ou afirma que elas nada provam. hoje. chamaríamos de "estatísticas". A Matemática. Na idade média colhiam-se informações. da contagem. As tabelas tornam-se mais completas. originando as primeiras tábuas e tabelas e os primeiros números relativos.I . cobravam impostos e realizavam inquéritos quantitativos por processos que. e a estatística deixa de ser uma simples catalogação de dados numéricos para se tornar o estudo de como se chegar a conclusão sobre uma população. Na era da energia nuclear. feição verdadeiramente científica. utilitário. funerais. como batizados. aos poucos.

no momento da pesquisa. por necessidades práticas. caso existam. o gosto dos consumidores deveria permanecer constante. seria necessário que não houvesse alteração nos outros fatores.MÉTODO ESTATÍSTICO O Método Científico Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e. Para aplicarmos o método experimental. Contudo. Se bem que muito desse conhecimento possa ter sido observado inicialmente por acaso. Podemos então dizer que:  Método: é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. O Método Estatístico Muitas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais). teríamos de fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço. vamos destacar o Método experimental e o Método estatístico. ou seja. outros. O Método Experimental . e variar esta causa de modo que o pesquisador possa descobrir seus efeitos. menos uma. Química. Mas isso tudo é impossível. naquele momento. a verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos. etc. Assim. Como exemplo. sem aplicação de um método.  Método experimental: consiste em manter constantes todas as causas (fatores). uma uniformidade dos salários. seria necessária a fixação do nível geral dos preços das outras necessidades etc. 6 .É o método preferido pela física. nos interessa. já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que. é um meio mais eficaz para atingir determinada meta. podemos citar a determinação das causas que definem o preço de uma mercadoria. Atualmente. deveria existir. Dos métodos científicos. quase todo acréscimo de conhecimento resulta da observação e do estudo.

a formulação de soluções apropriadas e um planejamento objetivo de ação. organização. pelo menos. Podemos dizer. quando se referem ao termo estatística. as pessoas. desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais. produtividade).Nesses casos. uma característica comum (por exemplo: os alunos do sexo masculino de uma comunidade). registrando essas variações e procurando determinar. então.  Método estatístico: diante da impossibilidade de manter as causas constantes.  A Estatística Indutiva ou Inferencial se encarrega de fazer a análise e interpretação dos dados. que influências cabem a cada uma delas. o conhecimento de seus problemas (condições de funcionamento. o fazem no sentido da organização e descrição dos dados (estatística do Ministério da educação. obtemos os chamados dados referentes a esses elementos. A ESTATÍSTICA Exprimindo por meio de números as observações que se fazem de elementos com. 7 . de uma escola). admitem todas essas causas presentes variando-as.). análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. que: A Estatística é uma parte da matemática aplicada que fornece métodos para a coleta. Assim. embora mais difícil e menos preciso.  A Estatística Descritiva se encarrega de fazer a coleta. a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por exemplo. no resultado final. denominado método estatístico. lançamos mão de outro método. Em geral. que permitam conclusões que transcendam os dados obtidos inicialmente. descrição. organização e descrição dos dados. estatísticas dos acidentes de tráfego etc.

8 .Fases do Método estatístico: Podemos distinguir no método estatístico as seguintes fases: 1 – Coleta de Dados Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno coletivamente típico que se quer pesquisar. Como por exemplo. como os censos (de 10 em 10 anos) e as avaliações periódicas.  Periódica: quando feita em intervalos constantes de tempo. 1. A coleta de dados pode ser direta ou indireta. quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários.2 – Indireta: Quando é inferida de elementos conhecidos (coleta direta) e/ou conhecimento de outros fenômenos relacionados com o fenômeno estudado. como no caso de epidemias que assolam ou dizimam rebanhos inteiros. a fim de atender a uma conjuntura ou a uma emergência. ainda. importação e exportação de mercadorias). do censo demográfico. censo industrial. etc.1 – Direta: Quando ela é feita sobre elementos informativos de registro obrigatório (nascimentos. podemos citar a pesquisa sobre mortalidade infantil. damos início à coleta dos dados numéricos necessários à sua descrição. como é o caso das notas de verificação e de exames.  Ocasional: quando feita extemporaneamente. tal como a de nascimentos. que é feita através de dados colhidos por uma coleta direta. óbitos e a frequência dos alunos às aulas. 1. recenseamento demográfico. casamentos e óbitos. elementos pertinentes aos prontuários dos alunos de uma escola ou. A coleta direta de dados pode ser classificada relativamente ao fator tempo em:  Contínua (registro): quando feita continuamente.

que possam influir sensivelmente nos resultados. os dados devem ser apresentados sob forma de tabelas (unidade 3) e gráficos (unidade 4). A crítica dos dados se divide em: externa e interna  Crítica externa – quando visa às causas dos erros por parte do informante. Assim. eles devem ser cuidadosamente criticados. 3 – Apuração dos Dados Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. 9 . É a condensação e tabulação de dados.2 – Crítica dos Dados Obtidos os dados. eletromecânica ou eletrônica. e tiramos desses resultados conclusões e previsões.  Crítica interna – quando visa observar os elementos originais dos dados da coleta. Resumo dos dados através de sua contagem e agrupamento. através dos métodos da Estatística Indutiva ou Inferencial. por distração ou má interpretação das perguntas que lhe foram feitas. fazemos uma análise dos resultados obtidos. o objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). pois tornam mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas de posição (unidade 6) e medidas de dispersão (unidade 7). 5 – Análise dos Resultados Como já dissemos. a fim de não incorrermos em erros grosseiros ou de certo vulto. realizadas as etapas anteriores (estatística descritiva). 4 – Exposição ou Apresentação dos Dados Por mais diversa que seja a finalidade que se tenha em vista. Pode ser manual. à procura de possíveis falhas e imperfeições. que tem por base a indução ou inferência.

se planejou. de qualquer tipo. O homem de hoje. ainda. ainda. que pode ser resumido. O esquema do planejamento é o plano. na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas. frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística. médio ou longo prazo. da energia e do material e. A estatística ajudará em tal trabalho. documentado para evitar esquecimentos. como também na seleção e organização da estratégia a ser adotada no empreendimento e. em suas múltiplas atividades. dirigir e controlar a empresa. em tabelas e gráficos. 10 . e o conhecimento e o uso da estatística facilitarão seu tríplice trabalho de organizar. humanos e financeiros disponíveis. exige de seu administrador a importante tarefa de tomar decisões. A direção de uma empresa. incluindo as estatais e governamentais. seus objetivos com maior possibilidade de serem alcançados a curto. os recursos naturais. e só estudando-os evitaremos o erro das generalizações apressadas a respeito de tabelas e gráficos apresentados em jornais. e estabelecer suas metas. de coleta de dados e de recenseamento de opiniões. Tudo isso que se pensou. podemos conhecer a realidade geográfica e social. a fim de garantir o bom uso do tempo. que facilitarão a compreensão visual dos cálculos matemático-estatísticos que lhes deram origens. para controle eficiente do trabalho. a empresa é uma das vigas-mestras da economia dos povos. com auxílio da estatística. Por meio de sondagem. as expectativas da comunidade sobre a empresa. lança mão de processos e técnicas estatísticas. precisa ficar registrado.A ESTATÍSTICA NAS EMPRESAS No mundo atual. revistas e televisão.

Para você. Complete: O método experimental é o mais usado por ciências como: _______________. O que é apurar dados? 8. e) Estudar fenômenos numéricos. Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz necessária. O método estatístico tem como um de seus fins: a) Estudar os fenômenos estatísticos. Para que serve a crítica dos dados? 7. As ciências humanas e sociais. d) Determinar qualidades abstratas de grupos de indivíduos.EXERCÍCIOS 1. As conclusões. 11. 2. 11 . b) Estudar qualidades concretas dos indivíduos que formam grupos. O que é Estatística? 4. 5. o que é coletar dados? 6. as inferências pertencem a que parte da Estatística? 10. c) Determinar qualidades abstratas dos indivíduos que formam grupos. Cite as fases do método estatístico. Como podem ser apresentados ou expostos os dados? 9. lançam mão de que método? 3. para obter os dados que buscam.

idade.2. parda) etc. 58..78 ou 4. Resulta normalmente de contagens.}.para o fenômeno “estatura” temos uma situação diferente.3.. Assim..54 kg. teoricamente. 12 .5 kg. ..: número de alunos de uma escola que pode assumir qualquer um dos valores do conjunto N = {1. ou seja. e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números reais.: salários dos operários. como 72.para o fenômeno “número de filhos” há um número de resultados possíveis expressos através dos números naturais: 0.325 etc. mas nunca valores como 2.. preta. pois um aluno tanto pode pesar 72 kg.: sexo (masculino ou feminino)..  Variável: é. 2.5 ou 3.  Contínua: resulta normalmente de uma mensuração. amarela. vermelha. Ex. . como 72.n. ex.. etc. altura. qualquer valor entre dois limites. Uma variável pode ser: qualitativa ou quantitativa  Qualitativa: quando seus valores são expressos por atributos.  Quantitativa: quando seus valores são expressos em números.. podem assumir. convencionalmente.II – POPULAÇÃO E AMOSTRA 1 – VARIÁVEL A cada fenômeno corresponde um número de resultados possíveis. ex. 3.. por exemplo: .1. .... Ex. pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. o conjunto de resultados possíveis de um fenômeno.para um fenômeno “sexo” são dois os resultados possíveis: masculino e feminino. Divide-se em discreta e contínua:  Discreta ou descontínua: seus valores são expressos geralmente através de números inteiros não negativos. cor da pele (branca.: peso dos alunos de uma escola. dependendo da precisão da medida.

possibilitam descreve-las sob os mais diversos aspectos. em geral. como a média. sejam 2. Designamos as variáveis por letras latinas. Classifique as variáveis em qualitativas e quantitativas (contínuas ou discretas): a) Cor dos cabelos b) Número de filhos c) Número de peças produzidas por hora d) Diâmetro de uma peça e) Número de volumes de uma biblioteca f) produção de algodão em um ano 2 – POPULAÇÃO E AMOSTRA Dois conceitos devem estar bem claros: o de população e o de amostra. y. 3. a variáveis discretas. temos: x ϵ {2. Por exemplo. e que.. as medições dão origem a variáveis contínuas e as contagens ou enumerações. etc. em última análise. 13 . o desvio-padrão. 3. Fazendo uso da letra x para indicar a variável relativa ao fenômeno considerado. as últimas: x. Classifique as variáveis em qualitativas e quantitativas (contínuas ou discretas): a) Cor dos olhos – Qualitativa b) Índice de liquidez nas indústrias Cearenses – Quantitativa contínua c) Produção de café no Brasil – Quantitativa contínua d) Número de defeitos em aparelhos de TV – Quantitativa discreta e) Comprimento dos pregos produzidos por uma empresa – Quantitativa contínua f) O ponto obtido em cada jogada de um dado – quantitativa discreta Resolva: 1. 8} Exercício resolvido: 1.De modo geral. z. 5. pois é deles que são extraídos os dados que dão origem às diversas relações estatísticas. 5 e 8 todos os resultados possíveis de um dado fenômeno.

tanto quanto possível.1 – Amostragem casual ou aleatória simples Esta técnica de amostragem é equivalente a um sorteio lotérico: Na prática. e isto é muito importante. a seguir. o que garante à amostra o caráter de representatividade. A população estatística também é conhecida como universo estatístico. ser parecida com ela (quantitativa e quantitativamente). cada elemento da população passa a ter a mesma chance de ser escolhido. a seguir. Censo: exame de todos os elementos da população. Daremos. K números dessa sequência. pois. pelo menos. devendo obedecer a dois princípios básicos:  Deve ser suficientemente grande. Amostras: são subconjuntos finitos representativos de uma dada população. conjunto de entes portadores de. como vimos. Dessa forma. por meio de um dispositivo aleatório qualquer. três das principais técnicas de amostragem. Exemplo: pessoas que possuem automóvel da marca Fiat. uma característica comum. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola: 14 .  Seus constituintes devem ter sido selecionados ao acaso. 3 – AMOSTRAGEM  Conceito: é uma técnica especial para recolher amostras que garante. a amostragem casual ou aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando-se. os quais corresponderão aos elementos pertencentes à amostra. o acaso na escolha. A amostra deve ser representativa da população da qual foi extraída. Exemplo: pessoas que possuem automóvel.População: coleção completa de todos os elementos que são objeto de um estudo. 3. nossas conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras dessa população.

3. esse tipo de sorteio torna-se muito trabalhoso.  Colocamos os noventa números. sorteamos um algarismo qualquer da mesma. dentro de uma caixa. um comportamento homogêneo.  Numeramos os alunos de 01 a 90 (população).2 – Amostragem proporcional estratificada Muitas vezes a população se divide em subpopulações – estratos Como é provável. verticalmente (de cima para baixo ou vice versa). construída de modo que os dez algarismos (de 0 a 9) são distribuídos ao acaso nas linhas e colunas (ver anexo). considerando a 18ª linha. o numeral 92 será desprezado. 9 números que representarão a amostra. A leitura da tabela pode ser feita horizontalmente (da direita para esquerda ou vice versa). tomamos os números de dois algarismos (tantos algarismos quantos formam o maior número da população). de estrato em estrato. como será também abandonado um numeral que já tenha aparecido. convém que o sorteio dos elementos da amostra leve em consideração tais estratos. para o nosso exemplo. três ou mais algarismos. Os números assim obtidos irão indicar os elementos da amostra. em pedaços iguais de um mesmo papel. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos. Assim. obteremos uma amostra das estaturas dos noventa alunos. Para obtermos os elementos da amostra usando a tabela. pois não consta da população. A opção. um comportamento heterogêneo e. Quando o número de elementos da amostra é grande. conforme nossa necessidade. porém. que a variável em estudo apresente. dentro de cada estrato. A fim de facilitá-lo. 10% desta população. diagonalmente (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. deve ser feita antes de iniciado o processo. 15 . a partir do qual iremos considerar números de dois. foi elaborada uma tabela – Tabela de Números Aleatórios -. então: 61 02 01 81 73 60 66 58 53 Medindo as alturas dos alunos correspondentes aos números sorteados. Neste caso. Temos. um a um. obtendo: 61 02 01 81 73 92 60 66 73 58 53 34 Evidentemente.

temos 54 meninos e 36 meninas. 28 22 53 18 03 – para os meninos. de 10 % do exemplo anterior. sendo que de 01 a 54 correspondem meninos e de 55 a 90. Sugestão: Use a tabela de Tabela de Números Aleatórios (25ª linha. Pesquise o peso de seus colegas de classe (incluindo o seu) e retire uma amostra de 30% da população.4 MASCULINO 54 5 100 10 x 36 = 3.6 FEMININO 36 4 100 10 x 90 = 9 TOTAL 90 9 100 b) Numeramos os alunos de 01 a 90. supondo que dos 90 alunos. obtém elementos da amostra proporcional ao número de elementos desses estratos. Tomando na Tabela de Números Aleatórios a primeira e a segunda colunas da esquerda. da esquerda para a direita). além de considerar a existência de estratos. que. Pesquise a estatura de seus colegas de classe (incluindo o seu) e retire uma amostra de 15% da população. 16 . São. Exemplo: Vamos obter uma amostra proporcional estratificada.É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada. Resolva: 1. (sexo masculino e sexo feminino). portanto dois estratos. de cima para baixo. 2. Temos: a) SEXO POPULAÇÃO 10 % AMOSTRA 10 x 54 = 5. Sugestão: Use a tabela de Tabela de Números Aleatórios (5ª e 6ª colunas. 57 90 80 56 – para as meninas. obtemos os seguintes números: 57 28 92 90 80 22 56 79 53 18 53 03 27 05 40 Temos então. meninas. de baixo para cima).

56 (31+25). 32 na 2ª. no caso de uma linha de produção.  Assim. 17 . vamos supor a casa de número 6.3 – Amostragem sistemática Quando os elementos da população já se acham ordenados. 3. etc. Neste caso. Neste caso. a cada dez itens produzidos. etc. podemos usar o seguinte procedimento:  Como 500/20 = 25.  Os demais elementos da amostra seriam considerados de 25 em 25. podemos. Obtenha uma amostra de 40 alunos e preencha o quadro a seguir. São exemplos os prontuários médicos de um hospital. Assim. Nestes casos. estaríamos fixando o tamanho da amostra em 10% da população. 32 na 6ª. sendo 35 na 1ª série. 31 na 7ª e 27 na 8ª. 30 na 3ª. escolhemos por sorteio casual um número de 01 a 25. retirar um para pertencer a uma amostra da produção diária. não há necessidade de construir o sistema de referência.3 – Em uma escola existem 250 alunos. das quais desejamos obter uma amostra formada por 20 casas para uma pesquisa de opinião. A esse tipo de amostragem denominamos sistemática. 81 (56+25). 35 na 5ª. a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. as demais casas da amostra seriam as casas de números 31 (6+25). Exemplo: Supomos uma rua com 500 casas. os números de uma rua.  Este número indicará a primeira casa da amostra. uma linha de produção. 28 na 4ª.

Na ordenação geral. sistemática ou estratificada. 6 – Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada por 2432 elementos. 725º. 9ª e 10ª colunas. 5 – O diretor de uma escola. Obtenha uma amostra de doze alunos. c) O sorteio de um livro dentre os 40 alunos de Estatística de uma turma do IFCE. Transporte (348). resolveu fazer um levantamento.EXERCÍCIOS 1 – Uma escola abriga 124 alunos. 18 . Obtenha. Obtenha uma amostra representativa correspondendo a 15% da população. 2 – Em uma escola há oitenta alunos. Deseja-se extrair uma amostra entre os colaboradores para verificar o grau de satisfação em relação à qualidade da refeição servida no refeitório. Produção (1401) e Outros (751). 3 – Identifique o tipo de amostragem utilizada em cada situação: simples ao acaso. da Tabela de Números Aleatórios (de cima para baixo). por amostragem. 80 são negras e 40 são morenas. entrevistando uma a cada 10 pessoas da fila. sabendo-se que o elemento de ordem 1420 a ela pertence? 1648º. os elementos componentes da amostra. qual dos elementos abaixo seria escolhido para pertencer à amostra. 1120º. 120 são brancas. na qual estão matriculados 280 meninos e 320 meninas.414 colaboradores repartidos nos seguintes departamentos: Administração (914). a partir da 1ª linha. b) Um administrador hospitalar faz uma pesquisa com as pessoas que estão na fila de espera para serem atendidas pelo sistema SUS. em 10% dessa clientela. Sugestão: Use a Tabela de Números Aleatórios (escolha a linha e a coluna). a) Dentre 240 pessoas escaladas para um sorteio de júri. 2025º. Retire uma amostra de: a) 10% colaboradores? b) 854 colaboradores desta empresa. 4 – Uma empresa tem 3. para esse diretor. desejoso de conhecer as condições de vida extraescolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias. Sugestão: Use a 8ª. 290º.

N 3  60 e N 4  480 . Qual o número de elementos da amostra de cada estrato? 8 – Uma cidade X apresenta o seguinte quadro relativo às suas escolas de ensino fundamental: Nº DE ESTUDANTES ESCOLAS MASCULINO FEMININO A 80 95 B 102 120 C 110 92 D 134 228 E 150 130 F 300 290 Total 876 955 Obtenha uma amostra proporcional estratificada de 120 estudantes. Ao se realizar uma amostragem estratificada proporcional. 19 . com tamanhos N1  90 .7 – Uma população se encontra dividida em quatro estratos. N 2  120 . doze elementos da amostra foram retirados do primeiro estrato.

localizado no topo da tabela. 6. de dados que se inscrevem nos seus cruzamentos com as colunas. para que tenhamos uma visão global da variação dessa ou dessas variáveis. colocadas. que são a fonte. de preferência. 3. permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. para inserção de notas de natureza informativa. pois irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo. 5. uma tabela deve apresentar o seguinte esquema de representação: 1. as notas e as chamadas. cabeçalho. Título: designação do fato observado. Deste modo. Há ainda que se considerar os elementos complementares. linhas. Depois dos dados organizados.  TABELA: é um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. no sentido horizontal. Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas. 20 . destinado a um só número (nunca deve ficar em branco). Uma tabela compõe-se de: corpo. Linhas: retas imaginárias que facilitam a leitura. Casa ou célula: cruzamento de uma coluna com uma linha. coluna indicadora. em seguida ao fecho da tabela.III . faz-se necessário que essas informações sejam apresentadas em formato de tabelas. 4. local e época.SÉRIES ESTATÍSTICAS TABELAS Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir. Corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo. casa ou célula e título. 2. Rodapé: espaço reservado. no seu rodapé. Coluna indicadora: parte da tabela que especifica o conteúdo das linhas.

0. nas casas ou células da tabela devemos colocar:  Um traço horizontal (-) quando o valor é zero.). Chamadas: informações de natureza específica sobre determinada parte da tabela. destinada a conceituar ou esclarecer dados.Fonte: entidade responsável pelo levantamento dos dados ou pela elaboração da tabela.) quando não temos a informação.: Os lados direito e esquerdo de uma tabela oficial devem ser abertos. como quanto ao resultado do inquérito.. Obs.... não só quanto à natureza das coisas. destinada a conceituar ou esclarecer o conteúdo das tabelas. De acordo com as normas da Fundação IBGE.0. 21 .  Três pontos (. .00.  Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Notas: são informações de natureza geral.. precisamos acrescentar à parte decimal um número correspondente de zeros (0. 0.. Se os valores são expressos em numerais decimais.000. ou indicar a metodologia adotada.  Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor.

67 2006 2. Daí. marcha ou evolutiva.: Levantamento Epidemiológico no Estado do Rio de Janeiro – 2010 Especificação Nº de Casos Nº de óbitos Sarampo (1) 115 15 Varíola . - Meningite 35 5 Total 150 30 Fonte: Departamento Nacional de Endemias Rurais Nota: As atividades da campanha de vacinação abrangeram as áreas de maior incidência. cronológica. podemos inferir que numa série estatística observamos a existência de três elementos ou fatores: o tempo.56 2004 2. Esta série também é chamada de histórica. do local ou da espécie.Ex.64 22 .64 2005 2. O local e a espécie (fenômeno) são elementos fixos.20 2008 3. Podem ser do tipo temporal. geográfica ou específica.  Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou descontínua.. o espaço e a espécie. a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. Frango – Preços Médios em São Paulo – 2003 a 2008 ANOS PREÇO (R$) 2003 2.53 2007 3. Dividem-se em séries homógradas e conjugadas.. SÉRIES ESTATÍSTICAS Denominamos séries estatísticas toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época. 10 Cólera . (1) inclusive a área urbana.

Também é chamada de série categórica.729.925 884.630 Suínos 35. territorial ou de localização.467 7.379.357 778. A época e o fato (espécie) são elementos fixos.746.634 Sul 1. Também é chamada de espacial. 23 .658 403.541.b) Série Geográfica: Apresenta como elemento variável o fator geográfico.9 Inglaterra Menos de 4 Fonte: Revista Veja.5 Alemanha 7.  Séries conjugadas: Também chamadas de tabelas de dupla entrada.401.287.231. Terminais Telefônicos em Serviço 1991 .156.608.870 Aves 821. c) Série Específica: O caráter variável é apenas o fato ou espécie.1994 PAÍSES Nº DE ANOS Itália 7.93 FILIAIS 1991 1992 1993 Norte 342. O exemplo abaixo é de uma série geográfico-temporal.234.2006 ESPÉCIES QUANTIDADE Bovinos 205.822 Fonte: Ministério das Comunicações.501 6.232 Centro-Oeste 713.449 Fonte: IBGE.486.494 Nordeste 1.173.824 Ovinos 16.938 375.649 Sudeste 6.315 1.101 1.813 1.989 1.886. Duração Média dos Estudos Superiores .0 Holanda 5. havendo duas ordens de classificação: uma horizontal e outra vertical.170 Caprinos 10.0 França 7. São apropriadas à apresentação de duas ou mais séries de maneira conjugada. Rebanhos Brasileiros .497.244 Bubalinos 1.019.

Resolva: 1 – Classifique as séries 24 .

10.518. Confeccione a série correspondente e classifique-a.946. c) Represente esta série através de gráfico de barras.) FIAT 17 VW 23 GM 12 TOTAL 52 a) Classifique a série.024 t. no valor de US$ 1.889 t.034.843.000. oriundas da Arábia Saudita. dos Estados Unidos.547. em 1993. do Japão. b) Represente esta série através de gráfico de colunas. sabendo que os dados acima foram fornecidos pelo Ministério da Fazenda.2 – Procure exemplos de séries estatísticas em jornais e revistas e copie-os.000. 4 – Considere a série abaixo: Vendas no Ano de 2008 (em mil unidades) FILIAIS JAN FEV MAR SÃO PAULO 10 15 7 FORTALEZA 8 5 4 RIO DE JANEIRO 12 13 10 TOTAL 30 33 21 a) Classifique a série. e 561.469. b) Represente esta série através de gráfico de setores.Considere a série abaixo: Vendas de Automóveis no 1º bimestre de 2009 em São Paulo VENDAS MARCA (mil und.000. no valor de US$ 6. no valor de US$ 1. 3 . 25 .839. classificando essas séries.804 t. o seguinte movimento de importação de mercadorias: 14. 5 – Verificou-se.

6- Complete-a com uma coluna de percentagens com uma casa decimal e faça a compensação. coeficientes e taxas. Traduzem-se os dados relativos. DADOS ABSOLUTOS E DADOS RELATIVOS  Dados absolutos: são dados resultantes da coleta direta da fonte. embora esses dados traduzam um resultado exato e fiel. A leitura dos dados absolutos é sempre enfadonha e inexpressiva. Daí o uso imprescindível que faz a Estatística dos dados relativos. por meio de percentagens. índices. se necessário. em geral. 26 . sem outra manipulação senão a contagem ou medida.  Dados relativos: são os resultados de comparações por quocientes (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. não têm a virtude de ressaltar de imediato as suas conclusões numéricas.

Os valores dessa nova coluna nos dizem que.1 21201 Com esses dados. DE ALUNOS % Fundamental 19286 91. DE ALUNOS Fundamental 19286 Ensino médio 1681 Superior 234 TOTAL 21201 Dados fictícios. podemos formar uma nova coluna na série em estudo: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 2011 GRAU Nº. 8 aproximadamente estão no ensino médio e 1 aproximadamente está matriculado no ensino superior.96 = 91.92 = 7.1 – Percentagens Considere a série: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 2011 GRAU Nº.9 21201 Superior – 234 x 100 = 1.0 Ensino médio 1681 7. de cada 100 alunos da cidade A. 27 . 91 estão no ensino fundamental. Calculemos as percentagens dos alunos da cada grau: Fundamental – 19286 x 100 = 90.1 TOTAL 21201 100 Dados fictícios.0 21201 Ensino médio – 1681 x 100 = 7.9 Superior 234 1. O emprego da porcentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo.10 = 1.

e quando tomamos 1 por base. são arredondados até a terceira casa decimal.8 B 222 C 202 D 362 E 280 F 540 TOTAL 1781 1.000 100.0 2 – Índices Os índices são razões entre duas grandezas tais que uma não inclui a outra.NOTAS:  Do mesmo modo que tomamos 100 para base de comparação. supondo o total igual a 1. entre os quais destacamos o número 1. Resolva: 1 . É claro que. os dados relativos das parcelas serão todos menores que 1.Complete a tabela abaixo DADOS RELATIVOS ESCOLAS Nº. também podemos tomar outro número qualquer. São exemplos de índices: Índice cefálico = diâmetro transversal do crânio x 100 diâmetro longitudinal do crânio Quociente intelectual = idade mental x 100 idade cronológica 28 . DE ALUNOS POR 1 POR 100 A 175 0. quando usamos 100 para base.098 9. os dados são arredondados até a primeira casa decimal.  Em geral.

São exemplos de coeficientes: Coeficiente de natalidade = número de nascimentos população total Coeficiente de mortalidade = número de óbitos__ população total Coeficiente educacionais: Coeficiente de evasão escolar = nº. Densidade demográfica = população total Superfície (área) Índice econômicos: Produção per capta = valor total da produção população Consumo per capta = consumo do bem população Renda per capta = renda____ população Receita per capta = receita__ população 3 – Coeficientes Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e número de não-ocorrências). de alunos recuperados_ nº. inicial de matrículas Coeficiente de aproveitamento escolar = nº. de alunos evadidos__ nº. final de matrículas Coeficiente de recuperação escolar = nº. de alunos aprovados nº. de alunos em recuperação 29 .

determinando as percentagens com uma casa decimal e fazendo a compensação. e 683.) para tornar o resultado mais inteligível.8% 733.127 – 412.457) x 100 = 5.4 – Taxas As taxas são os coeficientes multiplicados por uma potência de 10 (10.986 matriculados na 1ª série. 436.816 no fim do ano.816) x 100 = 6. 30 . respectivamente.986 – 683. % 1º 546 2º 328 3º 280 4º 120 TOTAL 1274 Complete-a. se necessário.127 O Estado que apresentou maior evasão escolar foi A. 100. O Estado B apresentou. 1000 etc.457 matriculados. no início do ano de 2012.4% 436. Qual o Estado que apresentou maior evasão escolar? A: TEE = (733.127 e 412. São exemplos de taxas: Taxa de natalidade = Coeficiente de natalidade X 1000 Taxa de mortalidade = Coeficiente de mortalidade X 1000 Taxa de evasão escolar = Coeficiente de evasão escolar X 100 Exercício Resolvido: 1 – O estado A apresentou 733. EXERCÍCIOS 1 – Considere a série estatística: SÉRIES ALUNOS MATRIC.986 B: TEE = (436.

a taxa de mortalidade. b. c.  Óbitos: 99.2 – Uma escola apresentava.281.036. Calcule a taxa de evasão da escola 3 – Considerando que Minas Gerais. apresentou (dados fornecidos pelo IBGE):  População: 15.  Superfície: 586. Calcule: a.957. a taxa de natalidade. 31 . Calcule a taxa de evasão por série b.624 Km2. no final do ano.  Nascimentos: 292. em 1992. o seguinte quadro: MATRICULAS SÉRIES MARÇO NOVEMBRO 1º 480 475 2º 458 456 3º 436 430 4º 420 420 TOTAL 1794 1781 a.6 mil habitantes. o índice da densidade demográfica.

A representação gráfica deve obedecer a certos requisitos fundamentais como:  Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária.GRÁFICOS ESTATÍSTICOS 1. mas nunca substituir as tabelas estatísticas. É uma forma de apresentação dos dados estatísticos. Uso indevido de Gráficos: Podem trazer uma ideia falsa dos dados que estão sendo analisados.IV . chegando mesmo a confundir o leitor. Deve proporcionar que o observador analise rapidamente o fenômeno apresentado. Para tornarmos possível uma representação gráfica. Trata-se. de um problema de construção de escalas. Devem corresponder.  Clareza – deve proporcionar que o observador tenha uma correta leitura dos valores representativos do fenômeno. por meio de figuras geométricas. assim como traços desnecessários que possam levar o observador a uma análise morosa ou com erros. no investigador ou no público em geral. já que os gráficos falam mais à compreensão que as séries. na realidade.Conceito: O gráfico é um método de representação de dados estatísticos em forma visual. 32 . uma impressão mais rápida e viva do fenômeno em estudo. estabelecemos uma correspondência entre os termos da série e determinada figura geométrica. de tal modo que cada elemento da série seja representado por uma figura proporcional.  Veracidade – deve expressar a verdade sobre o fenômeno em estudo. cujo objetivo é o de produzir.

eixo das ordenadas (ou eixo dos y). que é o gráfico em linha ou em curva correspondente a série do exemplo. Para exemplificar considere a série: Determinamos. todos os pontos da série. em barras verticais (colunas). fazemos uso do sistema cartesiano. em barras horizontais. por segmentos de reta.Diagramas: São gráficos geométricos dispostos.Classificação dos gráficos: Os principais gráficos são os Diagramas. dois a dois. 2. ligamos todos esses pontos. graficamente. e em setores. as retas são os eixos coordenados e o ponto de intersecção. em geral. o que irá nos dar uma poligonal.2 .1 . Eles podem ser em linhas. O eixo horizontal é denominado eixo das abscissas (ou eixo dos x) e o vertical. Estereogramas. São os mais usados na representação de séries estatísticas. no máximo. a origem. em duas dimensões. usando as coordenadas. Como sabemos. para sua construção. nesse sistema fazemos uso de duas retas perpendiculares.  Gráficos em linhas ou lineares O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. 33 . Pictogramas e Cartogramas.

a variação de dois fenômenos.São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. 34 . As linhas são mais eficientes do que as colunas. Quando em barras. quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos. os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. a parte interna da figura formada pelos gráficos desses fenômenos é denominada de área de excesso. em um mesmo sistema de coordenadas. dispostos verticalmente (em colunas) ou horizontalmente (em barras). os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados.  Gráficos em colunas ou barras É a representação de uma série por meio de retângulos. Quando em colunas.

Exemplo: Gráfico em colunas

35

Exemplo: Gráfico em barras

NOTAS:
 Quando as legendas não são breves usa-se de preferência os gráficos em
barras horizontais;
 A ordem a ser observada é a cronológica, se a série for histórica, e a
decrescente, se for geográfica ou categórica;
 A distância entre as colunas (ou barras), por questões estéticas, não
deverá ser menor que a metade nem maior que os dois terços da largura
(ou da altura) dos retângulos.

36

 Gráficos em barras ou colunas múltiplas

Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo
fato de apresentar cada barra ou coluna segmentada em partes componentes.
Servem para representar comparativamente dois ou mais atributos.

 Gráficos em setores
Este gráfico é construído com base em um círculo, e é empregado sempre que
desejamos ressaltar a participação do dado no total.
O total é representado pelo círculo, que fica dividido em tantos setores quantas
são as partes.
Os setores são tais que suas áreas são respectivamente proporcionais aos
dados da série. Obtemos cada setor por meio de uma regra de três simples e
direta, lembrando que o total da série corresponde a 360º.

37

: As séries temporais geralmente não são representadas por este tipo de gráfico. Obs. 38 .O gráfico em setores só deve ser empregado quando há. no máximo. sete dados.

3 . Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. Os símbolos devem ser auto-explicativos.Pictogramas: São construídos a partir de figuras representativas da intensidade do fenômeno. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno. Veja o exemplo abaixo: 39 .Estereogramas: São gráficos geométricos dispostos em três dimensões. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo. pois sua forma é atraente e sugestiva. 2.2. São usados nas representações gráficas das tabelas de dupla entrada.2 . pois representam volume. e não de detalhes minuciosos.

em número proporcional aos dados. em geral. b.4 . representar dados relativos (densidade) . de hachuras ou cores.Cartogramas: São ilustrações relativas a cartas geográficas (mapas).2. em geral. Distinguimos duas aplicações: a. dos pontos. lançamos mão. representar os dados absolutos (população) – neste caso. 40 . lançamos mão. O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.neste caso.

41 .

EXERCÍCIOS 1 – Represente a série abaixo usando o gráfico em linha: COMÉRCIO EXTERIOR BRASIL – 1984 -93 QUANTIDADE (1000t) ANOS EXPORTAÇÃO IMPORTAÇÃO 84 141.059 93 182.295 68.410.832 60.974 63.095 57.4 92 36. b) PRODUÇÃO BRASILEIRA DE PETRÓLEO 1991 -93 ANOS QUANT. 2 – Represente as tabelas usando o gráfico em colunas: a) ENTREGA DE GASOLINA PARA CONSUMO BRASIL 1988 -91 ANOS VOLUME (1000m3) 88 9.121. Comércio e Turismo.278 92 167.666 58. Indústria.180.870 86 133.164.5 93 37.3 Fonte: Petrobrás.1 90 10.561 77.4 Fonte: IBGE.813 Fonte: Min.975 88 169.345.723.737 53.351 48.597 87 142.378 61.267.095 89 177. (1000m3) 91 36.184 91 165.033 57.293 90 168.988 85 146.7 89 9.3 91 12. 42 .

25 Nordeste 18.804 Sudeste 984.387 Comerciais pesados 66. 4 – Represente as tabelas usando o gráfico de setores: a) ÁREA TERRESTRE BRASIL – 1992 REGIÕES RELATIVA (%) Norte 45.3 – Represente as tabelas usando o gráfico em barras: a) PRODUÇÃO DE OVOS NO BRASIL .297 Nordeste 414.771 Fonte: ANFAVEA.174 Rio de Janeiro 5.85 Sul 6.28 Sudeste 10. b) PRODUÇÃO BRASILEIRA DE FERRO-GUSA -1993 ESTADO PRODUÇÃO (1000t) Minas Gerais 12.278 Comerciais leves 224.100.76 Centro-Oeste 18.1992 QUANT. b) PRODUÇÃO DE VEÍCULOS DE AUTOPROPUSÃO BRASIL 1993 TIPOS QUANTIDADE Automóveis 1.008 São Paulo 2.345 Fonte: IBGE. REGIÕES (1000dúzias) Norte 57.912 Fonte: Instituo Brasileiro de Siderurgia.86 Fonte: IBGE.978 Centro-Oeste 126. 43 .888 Espírito Santo 3.659 Sul 615.

44 .9 14.7 22.5 13.4 91 70.3 16.5 – Represente as tabelas usando o gráfico em colunas múltiplas: PROPORÇÃO DOS DOMICÍLIOS POR CONDIÇÃO DE OCUPAÇÃO BRASIL 1990 -91 NATUREZA ANOS PRÓPRIOS (%) ALUGADOS (%) CEDIDOS (%) 90 62.2 Fonte: IBGE.

Em razão disso.V . Mesmo uma informação tão simples como a de saber o valor máximo e mínimo requer certo exame dos dados da tabela. em ordem crescente ou decrescente. conhecidos os valores de uma variável. denominamos de tabela primitiva. salários recebidos pelos operários de uma fábrica. em particular. ROL: é a tabela ou relação obtida após a ordenação dos dados. é difícil formarmos uma ideia exata do comportamento do grupo como um todo. a forma pela qual podemos descrever os dados estatísticos resultantes de variáveis quantitativas. a partir de dados não ordenados. Assim. Tabela primitiva ou dados brutos é uma tabela ou relação de elementos que não foram numericamente organizados. onde os elementos não foram numericamente organizados. pouca informação se consegue obter inspecionando os dados anotados. resultando a seguinte tabela de valores: ESTATURAS DE 40 ALUNOS DO IFCE 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 A esse tipo de tabela. Para o exemplo acima temos: ESTATURAS DE 40 ALUNOS DO IFCE 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173 45 . que compõem uma amostra dos alunos do IFCE.DISTRIBUIÇÃO DE FREQUENCIA Vamos considerar. etc. como é o caso de notas obtidas pelos alunos de uma classe. ou seja. estaturas de um conjunto de pessoas. 1 – Tabela Primitiva e Rol Considere a estatura de quarenta alunos. neste capítulo.

ao lado de cada valor. a ordem que um valor particular ocupa no grupo. Distribuição de frequência sem intervalos de classe: é a simples condensação dos dados conforme as repetições de seus valores. mais ainda.os valores extremos são percebidos de imediato. a variável em questão. Agora. No exemplo que trabalhamos. Frequência: é a quantidade que fica relacionada a um determinado valor da variável. estatura. qual a menor estatura (150 cm) e qual a maior (173 cm). que há poucos valores abaixo de 155 cm e acima de 170 cm. com relativa facilidade. que a amplitude de variação foi de 173 – 150 = 23 cm. ainda assim persiste o problema de a análise ter que se basear nas 40 observações.é possível observar a tendência de concentração dos valores. o número de vezes que aparece repetido. ainda. vemos que há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e. Veja para o nosso exemplo: 46 .Essa classificação dos dados proporciona algumas vantagens concretas com relação à sua forma original: .é possível visualizar de forma ampla as variações de consumo. Com um exame mais acurado. . podemos saber. . O problema se agravará quando o número de dados for muito grande. Logo podemos definir o termo frequência. será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos. 2 – Distribuição de Frequência É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). Apesar de o rol propiciar ao analista mais informações e com menor esforço de concentração do que os dados brutos. e.

sendo que. se um dos intervalos for. Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. e de um aluno. preferimos chamar de intervalos de classes. em vez de dizermos que a estatura de um aluno é de 154 cm. 47 . 155 cm. Deste modo. VARIÁVEL FREQUENCIA 150 1 151 1 152 1 153 1 154 1 155 4 156 3 157 1 158 2 160 5 161 4 162 2 163 2 164 3 165 1 166 1 167 1 168 2 169 1 170 1 172 1 173 1 TOTAL 40 Para um ROL de tamanho razoável esta distribuição de frequência é inconveniente. em Estatística. 156 cm. de três alunos. 157 cm. Assim. estaremos agrupando os valores da variável em intervalos. por exemplo. já que exige muito espaço.158. 154 |---. de quatro alunos. inclusive. diremos que nove alunos têm estaturas entre 154 cm. e 158 cm.

166 8 166 |---. cada dado é separado em duas partes: Ramo: é a parte da esquerda e Folhas: é a parte da direita. na tabela de distribuição de frequência sem classes. Veja exemplo: Vamos considerar o número de alunos presentes em 20 palestras. que quatro alunos têm 161 cm de altura e que não existe nenhum aluno com 171 cm de altura. No diagrama de ramos e folhas. são comumente denominados dados agrupados. podemos dividir cada dado em algarismo da dezena e da unidade. Foram vistas as seguintes formas de apresentação dos dados:  ROL (dados isolados). 68 82 75 43 59 80 69 60 73 54 51 93 70 32 63 61 76 87 65 71 Como todos os dados possuem dois algarismos. sabemos. Mas há ainda outra técnica alternativa de apresentação e organização de dados: o Diagrama de Ramos e Folhas. Nota: Quando os dados estão organizados em uma distribuição de frequência. que onze alunos têm estatura compreendida entre 158 e 162 cm. Assim.  Agrupamentos em classes. o algarismo da dezena será o 48 . Em seguida as folhas são colocadas em seus respectivos ramos. mas perdemos em pormenores. ESTATURAS DE 40 ALUNOS DO IFCE CLASSES FREQUENCIAS 150 |---. facilmente.154 4 154 |---. No entanto.162 11 162 |---. A obtenção do diagrama é rápida e fácil. ganhamos em simplicidade. Já na distribuição de frequência com classes não podemos ver se algum aluno tem a estatura de 159 cm. podemos verificar.174 3 Total 40 Ao agruparmos os valores da variável em classes.170 5 170 |---. Portanto.  Agrupamento simples (sem classes). com segurança.158 9 158 |---.

ou seja. k. i = 2. simplesmente.. e traçamos uma linha vertical. 3. No exemplo. a distribuição é formada por seis classes. ou seja. Em (a) colocamos apenas os ramos distintos. d) da construção do diagrama de ramos e folhas. como representado abaixo nas etapas (a. 49 .158 define a 2ª classe. b. classes são os intervalos de variação da variável.ramo e a unidade será a folha. em ordem crescente. finalmente em (d) apresentamos o resultado final do diagrama com todos os dados.1 – Classe Classe de frequência ou.. em (b) colocamos a primeira folha (8) do dado 68. verticalmente um abaixo do outro. 3 3 3 3 2 4 4 4 4 3 5 5 5 5 9 4 1 6 6 8 6 8 6 8 9 0 3 1 5 7 7 7 7 5 3 0 6 1 8 8 8 2 8 2 0 7 9 9 9 9 3 (a) (b) (c) (d) Observe que o número de folhas deve ser igual ao número de dados. sendo i = 1. c. 2. em (c) colocamos a folha correspondente ao dado 82 e. As classes são representadas simbolicamente por i. 3. (onde K é o número total de classes da distribuição).. . Vamos usar o dado 68 como exemplo: 6 8 ramo folha Colocamos todos os ramos distintos em uma coluna. 3 – Elementos de uma Distribuição de Frequência com Intervalos de Classe: Os valores exemplificados a seguir são referentes a Distribuição de frequências com das estaturas de 40 alunos do IFCE. então temos k = 6 e o intervalo de classe 154 |---.

Assim.162.154 = 4 .166[. O menor número é o limite inferior da classe (li) e o maior número. empregando. Na terceira classe. Assim: hi = Li . l3 = 158 e L3 = 162.3 – Amplitude do intervalo de classe Amplitude do intervalo de classe ou..150 = 4 h2 = 158 . para isso.. h6 = 174 . o indivíduo com uma estatura de 158 cm está incluso na terceira classe (i = 3) e não na segunda. como mostrado a seguir: h1 = 154 .. simplesmente. de acordo com a Resolução 886/66 do IBGE.166. por exemplo..3. O quarto intervalo 162 |---. o símbolo |---. intervalo de classe é a medida do intervalo que define a classe.li Na distribuição de frequência com classes o hi será igual em todas as classes.. pode ser também ser representado desta maneira: [162. Ela é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi. temos: 158 |---. 3. Nota: Os intervalos de classe devem ser escritos. por exemplo.(inclusão de li e exclusão de Li). em termos de desta quantidade até menos aquela.2 – Limites de classe Limites de classe são os extremos de cada classe.170 = 4 50 .. limite superior da classe (Li).

o ponto que divide o intervalo de classe em duas partes iguais.3.Xmin Em nosso exemplo AA = 173 . AT = Lmax . calculamos a semi-soma dos limites da classe (média aritmética): x i = l i + Li 2 No intervalo da 2ª classe 154 |---.5 – Amplitude amostral Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra (obtidos através do ROL). 3.lmin. temos AT = 174 – 150 = 24 cm Nota: É evidente que.158 o ponto médio x2 é calculado: x2 = (l2 + L2)/2 = (154 + 158)/2 = 156 cm 51 .: AT sempre será maior que AA.4 – Amplitude total da distribuição Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo).150 = 23 cm. No exemplo. se as classes possuem o mesmo intervalo. Obs.6 – Ponto médio da classe Ponto médio da classe (xi) é. AA = Xmax . verificamos a relação: AT = k Temos: 24 = 6 hi 4 3. Para obtermos o ponto médio de uma classe. como o próprio nome indica.

8.158 9 158 |---. f2 = 9. 5. temos: ESTATURAS DE 40 ALUNOS DO IFCE ESTATURA (cm) FREQUÊNCIA 150 |---. Atividade 1: As notas obtidas por 50 alunos de uma classe foram: 1. 4. 3. 5. 8.170 5 170 |---. 4.Obs. 6. 3. 6. A soma das frequências é sempre igual ao total de elementos da amostra. 7. 3. 9. 5.166 8 166 |---. 3.8 5 8 |---. 2. 5.2 2 2 |---. 3. 5. 6.4 3 4 |---. f3 = 11. 0. 5. 4. 6. A frequência simples é simbolizada por fi (lemos f índice i ou frequência da classe i). 4. 7. 3. considerando o exemplo abaixo.6 4 6 |---. 7. 8. 6. 6. 6. 2. 2. 3. 7.: O ponto médio da classe é o valor que a representa para efeito de cálculos de medidas de posição e dispersão ou variabilidade.10 Total 50 52 .7 – Frequência simples ou absoluta Frequência simples ou frequência absoluta ou simplesmente. 7. 2. 4. 2. a) Complete a distribuição de frequência abaixo: i Notas xi fi 1 0 |---.174 3 TOTAL 40 f1 = 4. 6. 7. 4. f5 = 5 e f6 = 3. frequência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. 5. 8. f4 = 8. Assim.154 4 154 |---. 8. 9. 8.162 11 162 |---. 9. 7.

. 6. h3 = .. Qual a amplitude do segundo intervalo de classe? 7... Σ fi = n Frequências relativas (fri) ou fi (%) são os valores das razões entre as frequências absolutas de cada classe e a frequência total da distribuição. n = . A soma das frequências simples é igual ao número total de dados da distribuição..... para o exemplo da página 36 a frequência da terceira classe é: fr3 = f3/n .. 3.275 ou 27. 2. Qual o limite superior da classe de ordem 2? 6.... A soma das frequências relativas é igual a 1 ou 100 %.... 4... Qual a frequência da terceira classe? c) Complete: 1..... 5. Qual o limite inferior da quarta classe? 5.. 4 – Tipos de Frequências Frequência simples ou absolutas (fi) são os valores que realmente representam o número de dados de cada classe.. Qual o número de classes da distribuição? 4. L3 = ... 53 .. f5 = ... Qual a amplitude amostral? 2.........b) Agora.. Qual a amplitude da distribuição? 3.. fr3 = 11/40 = 0.. l1 = .. x2 = .5% Nota: O propósito das frequências relativas é o de permitir a análise ou facilitar as comparações. Logo.. responda: 1.

. + fK Assim. Frequência acumulada relativa (Fri) ou Fi (%) de uma classe é a frequência acumulada da classe.58 56 9 58 |---.62 60 11 62 |---.0% Atividade 2: Complete o quadro com as frequências que se pede. no exemplo.600 ou 60.. fri (%) = frequência percentual e Fri (%) = frequência percentual acumulada. CLASSE xi fi Fi fi (%) Fi (%) 50 |---. 100 -- Sendo xi = ponto médio de classe.. temos: Fr3 = F3 / Σ fi = 24/40 = 0.54 52 4 54 |---. 40 -. para a terceira classe..66 64 8 66 |---. Fi = frequência Acumulada. 54 ..70 68 5 70 |---. fi = frequência simples. Fri = Fi / Σ fi Assim. dividida pela frequência total da distribuição. no exemplo. a frequência acumulada correspondente à terceira classe é: F3 = f1 + f2 + f3 = 4 + 9 + 11 = 24 O que significa existirem 24 alunos com estatura inferior a 162 cm (limite superior do intervalo da terceira classe).Frequência acumulada de uma classe (Fi) é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe: Fk = f1 + f2 + f3 + .74 72 3 Total -.

5 - Método Prático para Construção de uma Distribuição de Frequências com
Classes:
1º - Organize os dados brutos em um ROL.
2º - Calcule a amplitude amostral AA. Para o exemplo da página 45, temos:
AA = 173 - 150 = 23
3º - Calcule o número de classes através da:
a) Regra de Sturges: i = 1 + 3,3.log n
n i = nº de classes
3 ---- 5 3
6 ---- 11 4
12 ---- 22 5
23 ---- 46 6
47 ---- 90 7
91 ---- 181 8
182---- 362 9
b) Raiz quadrada de n. (usa-se somente a parte inteira do número quando a
raiz não for exata).
Obs.: Qualquer regra para determinação do nº de classes da tabela não nos
leva a uma decisão final; esta vai depender na realidade de um julgamento
pessoal, que deve estar ligado à natureza dos dados.
No nosso exemplo: n = 40 dados, então, a regra de Sturges sugere a adoção
de 6 classes e pela regra da raiz quadrada também o uso de 6 classes.
Dependendo do n, o número de classes pode ser diferente quando usamos os
dois métodos. Por exemplo, para n igual a 100 teremos 8 classes pela regra de
Sturges e 10 classes para a regra da raiz de n.
4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe
h > AA / i.
No nosso exemplo: AA / i = 23/6 = 3,83. Obs.: Como h > AA / i é um valor
ligeiramente superior para haver folga na última classe. Utilizaremos então
h = 4.

55

5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes
com frequência = 0 (zero).
No nosso exemplo: o menor nº da amostra = 150 + h = 154, logo a primeira
classe será representada por 150 |---- 154. As classes seguintes respeitarão o
mesmo procedimento.
O primeiro elemento da classe seguinte sempre será formado pelo último
elemento da classe anterior.
Resolva:
1. Complete a distribuição abaixo, determinando as frequências simples:

xi fi Fi
2 2
3 9
4 21
5 29
6 34
Total 34 --

EXERCÍCIOS
1 - Suponha que o ponto médio das classes de uma distribuição de frequência
de umidade relativa em um posto seja: 28%, 37%, 46%, 55%, 64%, 73% e
82%.
a) Encontre a amplitude da classe;
b) Os limites de cada classe.

2 - Imagine que em uma região durante um dia de inverno foram medidas 150
temperaturas mínimas (em oC) em pontos próximos. Suponha que estas
temperaturas variaram entre 5,18 ºC a 7,44 ºC. Determine um conjunto de
intervalos de classe que seja razoável para esse conjunto de dados.

3 – Conhecidas as notas de 50 alunos, obtenha uma distribuição de frequência
tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe.
84 - 68 - 33 - 52 - 47 - 73 - 68 - 61 - 73 - 77 - 74 - 71 - 81 - 91 - 65 - 55 - 57 -
35 - 85 - 88 - 59 - 80 - 41 - 50 - 53 - 65 - 76 - 85 - 73 - 60 - 67 - 41 - 78 - 56 -
94 - 35 - 45 - 55 - 64 - 74 - 65 - 94 - 66 - 48 - 39 - 69 - 89 - 98 - 42 - 54.

56

4 – Os resultados do lançamento de um dado 50 vezes foram os seguintes:
6, 5, 2, 6, 4, 3, 6, 2, 6, 5, 1, 6, 3, 3, 5, 1, 3, 6, 3, 4, 5, 4, 3, 1, 3, 5, 4, 4, 2, 6, 2,
2, 5, 2, 5, 1, 3, 6, 5, 1, 5, 6, 2, 4, 6, 1, 5, 2, 4, 3.
Forme uma distribuição de frequência sem intervalos de classes.

5 – Considere os dados da quantidade de gordura no leite (em %), n = 49
3,66 - 3,66 - 3,72 - 3,74 - 3,74 - 3,77 - 3,81 - 3,88 - 3,89 - 3,91 - 3,96 - 3,96 -
3,97 - 3,97 - 4,00 - 4,00 - 4,02 - 4,03 - 4,05 - 4,06 - 4,08 - 4,10 - 4,10 - 4,15 -
4,16 - 4,20 - 4,20 - 4,23 4,24 - 4,25 - 4,27 - 4,28 - 4,29 - 4,32 - 4,32 - 4,33 -
4,38 - 4,38 - 4,38 - 4,40 - 4,41 - 4,42 - 4,49 - 4,60 - 4,67 - 4,70 - 4,71 - 4,81 -
4,82.
Use os dados da amostra para fazer uma Distribuição de frequências com
classes, calculando as frequências simples e acumuladas, absolutas e relativas.

6 - Na Tabela, identifique a amplitude dos intervalos de classe e os pontos
médios de cada classe.
Classes Frequência (fi)
[0 – 6[ 39
[6 – 12[ 41
[12 – 18[ 38
[18 – 24[ 40
[24 – 30[ 42
Total 200
Construa a tabela de frequências relativas, percentual e acumulada.

7 - A tabela abaixo apresenta a distribuição de frequência dos salários mensais
em reais, de 65 empregados da companhia P & R.

Nº. de
Salários (R$)
Empregados
5.000 |--- 6.000 8
6.000 |--- 7.000 10
7.000 |--- 8.000 16
8.000 |--- 9.000 14
9.000 |--- 10.000 10
10.000 |--- 11.000 5
11.000 |--- 12.000 2
Total 65

57

00 por mês. d) O número de motoristas que sofreram no mínimo três e no máximo cinco acidentes.000. 9 – A tabela abaixo apresenta a distribuição de frequência das áreas de 400 lotes: ÁREAS (m2) 300 |-. c) O ponto médio da 3ª classe.400 |-. c) o limite inferior da oitava classe.000. 58 . determine: a) a amplitude total.00 e pelo menos R$ 6.600 |-.900 |-. b) O limite superior da 4ª classe. f) a frequência da quarta classe. e) a amplitude do intervalo da segunda classe.1000 |-. e) A frequência da 3ª classe. f) A frequência relativa da 3ª classe. i) A percentagem de empregados que ganham menos de R$ 10. g) O intervalo de classe que tem a maior frequência. b) O número de motoristas que sofreram pelo menos quatro acidentes. h) A percentagem de empregados que ganham menos de R$ 8. d) o ponto médio da sétima classe. b) o limite superior da quinta classe.Determinar: a) O limite inferior da 6ª classe. d) A amplitude do 5º intervalo de classe. c) O número de motoristas que sofreram menos de três acidentes.800 |-.1100 |-.1200 Nº DE LOTES 14 46 58 76 68 62 48 22 6 Com referência a esta tabela.000. e) A percentagem dos motoristas que sofreram no máximo dois acidentes. 8.700 |-.A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Nº ACIDENTES 0 1 2 3 4 5 6 7 Nº MOTORISTAS 20 10 16 9 6 5 3 1 Determine: a) O número de motoristas que não sofreram nenhum acidente.00 por mês.500 |-.

Representação Gráfica de uma Distribuição Uma distribuição de frequência pode ser representada graficamente pelo Histograma. o) Até que classe estão incluídos 60% dos lotes. n) a classe do 72º lote. sendo a amplitude dos intervalos igual. Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. cujas bases se localizam sobre o eixo horizontal. g) a frequência relativa da sexta classe. as frequências. i) o número de lotes cuja área não atinge 700 m2. Isso nos permite tomar as alturas numericamente iguais às frequências.Histograma O Histograma é formado por um conjunto de retângulos justapostos. h) a frequência acumulada da quinta classe. l) a percentagem dos lotes cuja área seja maior ou igual a 900 m2. Para o exemplo a seguir. j) o número de lotes cuja área atinge e ultrapassa 800 m2. As alturas dos retângulos devem ser proporcionais às frequências das classes. No caso de usarmos as frequências relativas. k) a percentagem dos lotes cuja área não atinge 600 m2. As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. temos o seguinte histograma: 59 . A área de um histograma é proporcional à soma das frequências simples ou absolutas. 6. pelo Polígono de frequência e pelo Polígono de frequência acumulada (alguns autores denominam de ogiva de Galton). no mínimo. obtemos um gráfico de área unitária. m) a percentagem dos lotes cuja área é de 500 m2. de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. mas inferior a 1000 m2. Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical (eixo das ordenadas).1 . 6 .

devemos completar a figura. Para realmente obtermos um polígono (linha fechada). sendo as frequências marcadas sobre perpendiculares ao eixo horizontal.166 8 166 |---.2 – Polígono de Frequência O Polígono de frequência é um gráfico em linha. levantadas pelos pontos médios dos intervalos de classe. Para o exemplo anterior temos o seguinte Polígono de frequência: 60 . ESTATURAS DE 40 ALUNOS NA ESCOLA A ESTATURA (cm) FREQUÊNCIA 150 |---.174 3 TOTAL 40 6. da distribuição.162 11 162 |---. ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última.158 9 158 |---.170 5 170 |---.154 4 154 |---.

levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe.3 – Polígono de Frequência Acumulada O Polígono de frequência acumulada é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal.6. Para o exemplo em estudo temos o seguinte Polígono de frequência acumulada: Uma distribuição de frequência sem intervalos de classe é representada graficamente por um diagrama onde cada valor da variável é representado por 61 .

Fi = frequência Acumulada. 40 -.48 5 3 48 |--. fi (%) = frequência percentual. polígono de frequência e polígono de frequência acumulada.66 64 8 66 |--. a) PESOS i fi (Kg) 1 40 |--.58 56 9 58 |--. Atividade 3: Complete o quadro com as frequências que se pede e com base nele construa o histograma.70 68 5 70 |--. CLASSE xi fi Fi fi (%) Fi (%) 50 |--.54 52 4 54 |--.44 2 2 44 |--. o Polígono de frequência simples e o Polígono de frequência acumulada. Fi (%) = frequência percentual acumulada.um segmento de reta variável e de comprimento proporcional à respectiva frequência.56 6 5 56 |--. confeccione.62 60 11 62 |--.52 9 4 52 |--.74 72 3 Total -. 100 -- Sendo xi = ponto médio de classe.60 4 Total 26 62 . para cada uma o Histograma. fi = frequência simples. EXERCÍCIOS 1 – Considerando as distribuições de frequência seguintes.

que corresponde às notas relativas à aplicação de um teste de inteligência a um grupo de alunos. responda: (a) Qual o intervalo de classe que tem maior frequência? (b) Qual a amplitude total da distribuição? (c) Qual o número total de alunos? (d) Qual a frequência do intervalo de classe 110 |---120? (e) Quais são os intervalos de classes tais que a frequência de um é o dobro da frequência do outro? (f) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110? (g) Qual o percentual de alunos que estão no intervalo 100 |---130? (h) Quantos alunos receberam nota não-inferior a 100? 63 .1300 5 5 1300 |--.b) SALÁRIOS i fi (R$) 1 500 |--.1900 1 Total 44 2 – Examinando o histograma abaixo.1500 2 6 1500 |--.700 8 2 700 |--.900 20 3 900 |--.1100 7 4 1100 |--.1700 1 7 1700 |--.

cúbica e biquadrática. d.VI .MEDIDAS DE POSIÇÃO 1 – Introdução O estudo que fizemos sobre distribuições de frequência. a moda. medidas de assimetria. podemos localizar a maior concentração de valores de uma dada distribuição. os quartis e os percentis. que recebem tal denominação pelo fato de os dados observados tenderem. 64 . Dentre os elementos típicos. necessitamos introduzir conceitos que se expressam através de números. b. Dessa forma. Dentre as medidas de tendência central. no meio ou no final. que englobam: a própria mediana. destacamos: a. em geral. que nos permitam traduzir essas tendências. se ela se localiza no início. de modo geral. os grupos dos valores que uma variável pode assumir. as medidas de posição . isto é. medidas de variabilidade ou dispersão. neste capítulo. c. a média aritmética. c. se há uma distribuição por igual. medidas de posição. medidas de curtose. Outras promédias menos usadas são as médias: geométrica. Porém.estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência. quadrática. permite-nos descrever. a mediana. b. para ressaltar as tendências características de cada distribuição. os decis. a se agruparem em torno dos valores centrais. destacamos. ou ainda. harmônica. isoladamente. ou em confronto com outras. Esses conceitos são denominados elementos típicos da distribuição e são as: a. As medidas de posições mais importantes são as medidas de tendência central ou promédias. As outras medidas de posição são as separatrizes. até agora.

Exemplo: Sabendo-se que a venda diária de arroz tipo A. 2. em nossos estudos iremos nos limitar a mais importante: a média aritmética. podemos definir vários tipos de médias.= 14 Kg Às vezes. para venda média diária na semana de: . 14. 15. 6 e 8. Porém. a média pode ser um número diferente de todos os da série de dados que ela representa. embora não esteja representado nos dados originais.= (10+14+13+15+16+18+12) / 7 = 14 kg Logo: . costumamos dizer que a média não tem existência concreta. para os quais a média é 5.1 – Dados não . foi de 10. 16. Esse será o número representativo dessa série de valores. Neste caso.agrupados Quando desejamos conhecer a média dos dados não-agrupados em tabelas de frequências.2 – Desvio em relação à média Denominamos Desvio em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética. 13. temos. Média Aritmética é o quociente entre a soma dos valores da variável pelo número deles. durante uma semana. 2. temos:.2 – Média Aritmética ( ) Em um conjunto de dados. Designando o desvio por di.di = Xi - 65 . 4. determinamos a média aritmética simples. onde xi são os valores da variável e n o número de valores. 18 e 12 kg. É o que acontece quando temos os valores 2.

14 = -2.3 -. d7 = 12 .. a média do conjunto fica multiplicada (ou dividida) por essa constante.14 = -1. Ou seja: No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0 2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável. Se no exemplo anterior. d3 = 13 .No exemplo anterior temos sete desvios:.14 = 4.. d6 = 18 . 2. Y = . d4 = 15 .+ 2 = 14 +2 = 16 kg 3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c).14 = -4.14 = 1.14 = 0. somarmos a constante 2 a cada um dos valores da variável temos: Y = (12+16+15+17+18+20+14) / 7 = 112/7 = 16 kg Ou seja. d2 = 14 . d5 = 16 . 66 . d1 = 10 .14 = 2. a média do conjunto fica aumentada (ou diminuída) dessa constante.Propriedades da média 1ª propriedade: A soma algébrica dos desvios em relação à média é nula.

Se no exemplo anterior multiplicarmos a constante 3 a cada um dos valores da variável temos: Y = (30+42+39+45+48+54+36) / 7 = 294/7 = 42 kg Ou seja. Calcularemos a quantidade média de meninos por família: Nº de meninos Frequência (fi) 0 2 1 6 2 10 3 12 4 4 Total 34 Neste caso.4 – Dados Agrupados  A média aritmética sem intervalos de classe Consideremos a distribuição relativa a 34 famílias de quatro filhos. dada pela fórmula: O modo mais prático de obtenção da média ponderada é abrir. na tabela. uma coluna correspondente aos produtos xifi: 67 . 2. tomando para variável o número de filhos do sexo masculino. como as frequências são números indicadores da intensidade de cada valor da variável. elas funcionam como fatores de ponderação. o que nos leva a calcular a média aritmética ponderada. Y = x 3 = 14 x 3 = 42 kg.

e determinamos a média aritmética ponderada por meio da fórmula: Onde xi é o ponto médio da classe. xi fi x i . Resolva: 1 – Calcule a média aritmética da distribuição: xi 1 2 3 4 5 6 fi 2 4 6 8 3 1  A média aritmética com intervalos de classe Neste caso. a tendência geral de uma leve superioridade numérica em relação ao número de meninos. como interpretar o resultado obtido.3 Portanto a média é de 2. Σ xifi = 78 e Σf i = 34 Logo Σ xifi / Σf i = 78 / 34 = 2. 2 meninos e 3 décimos de menino? O valor médio de 2.3 meninos sugere. fi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 Σ 34 78 Temos. porém. sendo. convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio. 68 . neste caso. que o maior número de famílias tem 2 meninos e 2 meninas.Sendo x uma variável discreta.3 meninos por família Nota: .

54 4 2 54 |---. abrir uma coluna para os pontos médios (xi) e outra para os produtos xifi: i Estaturas (cm) fi xi xi. Logo Σ xifi / Σf i = 2440 / 40 = 61 Portanto. em cm.440 Temos.62 11 60 660 4 62 |---. de 40 bebês.70 5 68 340 6 70 |---. Σ xifi = 2440 e Σf i = 40. a estatura média dos bebês é de 61 cm.Exemplo: Considere a distribuição de frequência relativo a estaturas.54 4 52 208 2 54 |---.58 9 3 58 |---. inicialmente.74 3 72 216 Σ 40 2.5 – Emprego da média A média é utilizada quando: a. 69 .fi 1 50 |---. i Estaturas (cm) fi 1 50 |---.66 8 5 66 |---. desejamos obter a medida de posição que possui a maior estabilidade. 2.58 9 56 504 3 58 |---.66 8 64 512 5 66 |---. Calcular a estatura média dos bebês conforme a tabela abaixo. b.62 11 4 62 |---. houver necessidade de um tratamento algébrico ulterior. vamos.74 3 Σ 40 Pela mesma razão do caso anterior.70 5 6 70 |---.

Resolva:
1 – Calcule a media da distribuição de frequência:
CUSTO (R$) 450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150

fi 8 10 11 16 13 5 1

3 – Moda

Denominamos Moda o valor que ocorre com maior frequência em uma série
de valores.

Mo é o símbolo da moda.
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais
comum, isto é, o salário recebido pelo maior número de empregados dessa
fábrica.
3.1 – Dados não - agrupados
Quando lidamos com dados não-agrupados, a moda é facilmente reconhecida:
basta, de acordo com definição, procurar o valor que mais se repete.
Exemplo: Na série de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.
Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor
apareça mais vezes que outros.
Exemplo: {3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.
Em outros casos, pode haver dois ou mais valores de concentração. Dizemos,
então, que a série tem dois ou mais valores modais.
Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.
A série é bimodal.
3.2 – Dados agrupados
 Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda:
basta fixar o valor da variável de maior frequência.

70

Exemplo: Qual a temperatura mais comum medida no mês abaixo:
Temperaturas (º C) Frequência
0 3
1 9
2 12
3 6
Resp.: 2º C é a temperatura modal, pois é a de maior frequência (12 vezes).
 Com intervalos de classe
A classe que apresenta a maior frequência é denominada classe modal. Pela
definição, podemos afirmar que a moda, neste caso, é o valor dominante que
está compreendido entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto
médio da classe modal. Damos a esse valor a denominação de moda bruta.

Onde: l* = limite inferior da classe modal;
L*= limite superior da classe modal.
Exemplo: Calcule a estatura modal conforme a tabela abaixo.
Classes (cm) Frequência
54 |---- 58 9
58 |---- 62 11
62 |---- 66 8
66 |---- 70 5
Resposta: A classe modal é 58 |---- 62, pois é a de maior frequência.
l* = 58 e L* = 62
Mo = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o
valor real da moda).

71

Há, para o cálculo da moda, outros métodos mais elaborados, como, por
exemplo, o que faz uso da fórmula de Czuber:

Na qual:
l* é o limite inferior da classe modal;
h* é a amplitude da classe modal;
D1 = f* - f (ant.);
D2 = f* - f (post.);
Sendo:
f* a frequência simples da classe modal;
f (ant.) a frequência simples da classe anterior à classe modal;
f (post.) a frequência simples da classe posterior à classe modal.

Exemplo: Considere a distribuição a seguir
Classes fi
150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
Total 40
Temos:
D1 = 11 – 9 = 2 e D2 = 11 – 8 = 3;
Mo = 158 + 2 x 4 = 159,6 cm
2+3

72

15. 10} De acordo com a definição de mediana. desejamos obter uma medida rápida e aproximada de posição. 6. 5. quando a medida de posição deva ser o valor mais típico da distribuição. dispostos segundo uma ordem (crescente ou decrescente). Símbolo da mediana: Md 4. 13. por exemplo: {5. 9. 9.850 16 850 |---.550 8 550 |---. 15} 73 . 13. o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2.650 10 650 |---. b.1050 5 1050 |---. é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.1150 1 Total 64 4 – Mediana A Mediana de um conjunto de valores.1 – Dados não-agrupados Dada uma série de valores como.3 – Emprego da moda A moda é utilizada quando: a. 10.3. 6.950 13 950 |---. Resolva: 1 – Calcule a moda da distribuição de frequência: Classes fi 450 |---. 2.750 11 750 |---.

3. 1. qualquer dos números compreendidos entre os dois valores centrais da série. 0. 0. 0. Md = 2.Em seguida. 6} n = 10. 3.5. logo a fórmula ficará: [(10/2) + (10/2 + 1)] / 2 [(5 + 6)] / 2. a série dada tiver um número par de termos. 4. A mediana no exemplo será a média aritmética do 5º e 6º termos da série. 0. porém. 2. Neste caso o valor que divide a série acima em duas partes iguais é o 9. 2. A mediana será o 5º elemento = 2 b) Se a série dada tiver número par de termos: O valor mediano será dado pela fórmula: . Convencionou-se utilizar o ponto médio. 1. 2. 3. 4.Método prático para o cálculo da Mediana a) Se a série dada tiver número ímpar de termos: O valor mediano será o termo de ordem dado pela fórmula: (n+1)/2 Exemplo: Calcule a mediana da série {1. 4. 1. 6} 1º . 2.: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor correspondente. 3. 5. 5. será na realidade (5º termo + 6º termo) / 2 Temos: 5º termo = 2 e 6º termo = 3 A mediana será = (2 + 3) / 2. logo a Md = 9. 2. Se. ou seja. logo (n + 1)/2 é dado por (9 + 1) / 2 = 5. 3. 5} n = 9. tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda.ordenar a série {0. 1. o 5º elemento da série ordenada será a mediana.ordenar a série {0. 1. 1. 0. 3. 0. [( n/2 ) +( n/2+ 1 )] / 2 Obs. a mediana será. 2. 74 . 4. por definição. ou seja. Exemplo: Calcule a mediana da série {1.  . 5} 1º .

e muito. 4. o mesmo valor.  Sem intervalos de classe Neste caso. haverá coincidência da mediana com um dos elementos da série. ao passo que a mediana permanece a mesma. 7. A mediana será aquele valor da variável que corresponde a tal frequência acumulada.  Quando o número de elementos da série estatística for par. 15}.Quando o somatório das frequências for ímpar o valor mediano será o termo de ordem dado pela fórmula: 75 . . Essa é uma das diferenças marcantes entre mediana e média (que se deixa influenciar. a média do segundo conjunto de valores é maior do que a do primeiro.  A mediana depende da posição e não dos valores dos elementos na série ordenada. por influência dos valores extremos. A mediana será sempre a média aritmética dos 2 elementos centrais da série. é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. 13. a média e a moda não têm. pelos valores extremos). Vejamos: Em {5. haverá ou não coincidência da mediana com um dos elementos da série. Ainda aqui. temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos. 10.2 – Dados agrupados Se os dados se agrupam em uma distribuição de frequência.  Em uma série a mediana. a média = 10 e a mediana = 10 Em {5. a média = 20 e a mediana = 10 Isto é. necessariamente. implicando. 10. 13.Notas:  Quando o número de elementos da série estatística for ímpar. 65}. porém. 7. a determinação prévia das frequências acumuladas. o cálculo da mediana se processa de modo muito semelhante àquele dos dados não- agrupados.

5. igual a 3. o valor da mediana para esta distribuição será igual a 15. ou seja.Exemplo – considere a distribuição abaixo: Variável (xi) fi Fi 0 2 2 1 6 8 2 9 17 3 13 30 4 5 35 Total 35 -- Como o somatório das frequências Σfi = 35.5 Logo. 76 .Calcule Mediana da tabela abaixo: xi fi Fi 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 Total 8 -- Aplicando fórmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15. Pela distribuição temos a mediana igual ao valor da variável correspondente ao 18º termo. .Quando o somatório das frequências for par o valor mediano será o termo de ordem dado pela fórmula: Exemplo . a fórmula para calcular a mediana será: (35+1) / 2 = 18º termo.

temos inicialmente que determinar a classe na qual se acha a mediana – classe mediana. Devemos seguir os seguintes passos: Exemplo: Considere a distribuição a seguir Classes fi Fi 50 |---.Resolva: 1 – Calcule a mediana da distribuição: xi 2 4 6 8 10 fi 3 7 12 8 4  Com intervalos de classe Neste caso.70 5 37 70 |---.62 11 24 62 |---. o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana.54 4 4 54 |---.66 8 32 66 |---.58 9 13 58 |---. Para tanto.74 3 40 Total 40 -- 77 .

.3 .Emprego da Mediana A mediana é usada quando: a. NOTA: No caso de existir uma frequência acumulada exatamente igual a Σfi/2.... ou seja...40 7 20 5 40 |---. 78 . b.Md = L* = 30 4. a variável em estudo é salário.13 Logo. pois não temos os 40 valores da distribuição.. F(ant) = 13... há valores extremos que afetam de maneira acentuada a média aritmética. 58 |---.10 1 1 2 10 |---. obtemos: Md = 58 + [(20 ..50 4 24 6 50 |---...13) x 4] / 11 = 58 + (28/11) = 58 + 2.54 Obs..: Este valor (Md = 60. a mediana será o limite superior da classe correspondente.20 Logo....a classe mediana será a terceira classe...62 e com base nesta classe temos ainda: l* = 58....54) é estimado. f* = 11.30 9 13 4 30 |---.. Temos: = 40 / 2 =.20 3 4 3 20 |---....... desejamos obter o ponto que divide a distribuição em duas partes iguais. c.60 2 26 Total 26 -- Temos: = 26 / 2 =... h* = 4 Substituindo esses valores na fórmula acima.54 = 60... Exemplo: Considere a distribuição a seguir i Classes fi Fi 1 0 |---.

no caso da curva assimétrica positiva.1050 |-.950 |-.850 |-. em uma distribuição em forma de sino.650 |-. as três medidas coincidem.Resolva: 1 – Calcule a mediana da distribuição de frequência: CUSTO (R$) 450 |-.750 |-. 79 . temos: Media = Mediana = Moda. Moda e Mediana Quando uma distribuição é simétrica.1150 fi 8 10 11 16 13 5 1 5 – Posição Relativa da Média. Assim. Moda < Mediana < Media.550 |-. a assimetria torna-as diferentes e essa diferença é tanto maior quanto maior é a assimetria. Porém. no caso da curva assimétrica negativa. no caso da curva simétrica. Media < Mediana < Moda.

para determinar os quartis usamos a mesma técnica do cálculo da mediana. ela apresenta uma característica. já que se baseiam em posição na série. c. três quartis: a. valor que coincide com a mediana (Q2 = Md). Quando os dados são agrupados. O segundo quartil (Q2) – evidentemente. O terceiro quartil (Q3) – valor situado de tal modo na série que as três quartas partes (75%) dos termos são menores que ele e uma quarta parte restante (25%) é maior. por: 80 . a mediana caracteriza uma série de valores devido à sua posição central. consideradas individualmente. Há. No entanto. tão importante quanto a primeira: ela separa a série em dois grupos que apresentam o mesmo número de valores. não são medidas de tendência central.6 – As Separatrizes Como vimos. O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. há outras que.1 – Os quartis Denominamos quartis os valores de uma série que a divide em quatro partes iguais. juntamente com a mediana. na fórmula da mediana. bastando substituir. b. Essas medidas – os quartis. conhecidas pelo nome genérico de separatrizes. Assim. portanto. 6. mas estão ligadas à mediana relativamente à sua segunda característica. os percentis e os decis – são. além das medidas de posição que estudamos.

158 9 13 (Q1) 158 |---.154 4 4 154 |---.174 3 40 Total 40 -- 81 . Assim temos: Exemplo: Classes fi Fi 150 |---.166 8 32 (Q3) 166 |---.170 5 37 170 |---.162 11 24 162 |---.Sendo K o número de ordem do quartil.

Resolva: 1. Complete os esquemas para o cálculo do primeiro e do terceiro quartis da distribuição de frequência: 82 .

.....6. a fórmula será substituída por: 10 Sendo K o número de ordem do decil.. D9 É evidente que: D5= Q2 = Md O cálculo de um decil segue a mesma técnica do cálculo da mediana..2 – Os Decis Denominamos decis os nove valores que separam uma série em 10 partes iguais... D2. Indicamos: D1.. Assim temos: 10 D1 10 D3 83 . . D3... porém.

166 8 32 (D7) 166 |---. P3. P99 É evidente que: P50= D5= Q2 = Md. P25= Q1..162 11 24 162 |---... Indicamos: P1...Exemplo: Calcule o sétimo decil Classes fi Fi 150 |---. porém. a fórmula será substituída por: 84 .3 – Os Percentis Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais.154 4 4 154 |---.170 5 37 170 |---......174 3 40 Total 40 -- Sétimo Decil: 7 x ∑ fi/10 = 7 x 40/10 = 28 (28º termo) D7 = 162 + (28 -24).. .. P75= Q3 O cálculo de um percentil segue a mesma técnica do cálculo da mediana. P2.158 9 13 158 |---.4 8 D7 = 162 + 2 = 164 6.

162 11 24 162 |---. Assim para o 27º percentil.170 5 37 170 |---.166 8 32 166 |---.Sendo K o número de ordem do percentil.158 9 13 158 |---.174 3 40 Total 40 -- 85 . temos para o oitavo percentil: Classes fi Fi 150 |---.154 4 4 (P8) 154 |---. temos: Exemplo: Considerando a distribuição de frequência.

Resolva: 1. Complete o esquema para o cálculo do vigésimo percentil da distribuição: 86 .

A média salarial dos empregados deste supermercado. 16.5 6 – Sabe-se que a média aritmética de 5 números inteiros distintos. O maior valor que um desses números pode assumir é: a) 16 b) 20 c) 50 d) 70 e) 100 87 . 3. estritamente positivos. 15. 26. 10} é igual a: ( ) 15 ( ) 12 ( ) 15. 8. 8. 16} é igual a: ( ) 15 ( ) 12 ( ) 16 ( ) 14 ( ) 15. sua mediana ficará multiplicada por 2.A moda da série {21. 25. 15.A mediana da série {21. 2 . 13. ( ) Dividindo-se todos os números de uma série com cinco elementos por 2.4 e) 3. 3. quando ela estiver disposta em ordem decrescente. ( ) A mediana de uma série disposta em ordem crescente é o termo que a divide em três partes iguais.3 d) 3. A media salarial das mulheres é de 3 salários mínimos e dos homens é de 5 salários mínimos. ( ) Multiplicando-se todos os elementos de uma série por 5. em salários mínimos. 12. 13. quando ela estiver disposta em ordem crescente. 3. 12. marque V ou F nas sentenças abaixo. 12. 13. ( ) A mediana de uma série de 33 elementos é o valor do 17º termo desta série. 27. sendo 150 mulheres e 50 homens. 10. 30.2 c) 3. moda e mediana. 8. 17. ( ) A moda é o valor da variável que possui maior frequência. 12. é 16.1 b) 3. 26.5 4 . 16. 27.A média da série {21. sua média permanece inalterada. 15.EXERCÍCIOS 1 – Com relação às propriedades da média aritmética. 12. 26. 10} é igual a: ( ) 15 ( ) 12 ( ) 15.5 ( ) 14 ( ) NRA 3 . 17. 17. é: a) 3. ( ) A mediana de uma série de 46 elementos é a média dos valores do 23º e do 24º termos desta série.5 ( ) 14 ( ) NRA 5 – Um supermercado tem 200 empegados.

48 b) 26. Qual das alternativas representa melhor a média aritmética das idades dos alunos: a) 16 anos e 10 meses b) 17 anos e 1 mês c) 17 anos e 5 meses d) 17 anos e 4 meses e) 18 anos e 2 meses 9 .06 k 06 |.92 8 – A distribuição de idades dos alunos de uma sala é dada pelo gráfico abaixo. a moda e a mediana possuam valores iguais.04 d) 26.38 c) 28.62 e) 26.Considere a distribuição de frequências: Classes Frequências 02 |. de valores 25.7 – A média aritmética dos elementos de um conjunto de 28 números é 27.10 3k-12 10 |. a média aritmética dos elementos do novo conjunto é: a) 25.08 1001 08 |.04 3 04 |. Se retirarmos desse conjunto três números.12 3 Total Determine o valor de k para que a média. 88 . 28 e 30.

52 8 52 |---. b) Projetar o número total de parafusos com defeitos em um dia de trabalho. calcule a média.Considere a tabela de distribuição de frequência a seguir.44 9 44 |---. 89 .48 4 48 |---.0 d) 14.5 e) 13.56 5 56 |---. o controle de qualidade verificou o número seguinte de parafusos com defeitos em cada lote: Amostra 1 2 3 4 5 6 7 8 Defeitos 300 550 480 980 1050 350 450 870 Pede-se: a) Calcular a média diária de parafusos com defeitos. DE (fi) CHEQUES 36 |---.6 A moda e a mediana valem? 12 – A produção diária de parafusos da Indústria Asterx Ltda.40 6 40 |---.2 b) 14.000 unidades.2 c) 14. a moda e a mediana das encomendas devolvidas em 35 correios de Fortaleza no mês de abril de 2005: Nº.10 . Ao escolher uma amostra de oito lotes.60 3 Total 35 11 – Seja a tabela a seguir: FREQUENCIAS IDADE ACUMULADAS 11 10 12 15 13 25 14 40 15 50 A média aritmética vale: a) 13. cada um contendo 100. é de 20 lotes.

o 23º e o 90º percentis da distribuição do item “b” do exercício treze. 90 .Calcule o 1º. 16 .Calcule a média. 15 . moda e a mediana das distribuições de frequência abaixo: 14 .Calcule o quarto e o nono decil de cada uma das distribuições de frequência do exercício treze. o 10º. o 15º.13 .Calcule o primeiro e o terceiro quartis de cada uma das distribuições de frequência do exercício treze.

c) O salário mediano. d) Q3. revelou os salários apresentados na tabela seguinte.. 91 . P73. D8.Uma pesquisa contemplando uma amostra de 54 estagiários da Empresa “Produtos Bons” Ltda. Faça a distribuição de frequência com classes e baseado nela calcule: 497 497 499 500 498 502 501 504 537 505 506 508 508 507 503 508 508 520 510 511 511 511 517 519 511 512 534 512 513 513 513 521 527 514 516 526 518 520 520 523 531 530 524 524 535 525 526 528 529 501 528 530 532 536 a) O salário médio.17 . b) O salário modal.

é necessário ter-se uma ideia retrospectiva de como se apresentavam esses mesmos dados nas tabelas. média da variável y = 70. em poucos valores representativos – média aritmética. y e z: X: 70. então. 70. 70. é mais homogêneo que o conjunto Z. 71. por sua vez. 69. podemos dizer que o conjunto X apresenta 92 . 120. No entanto. destacar o grau de homogeneidade que existe entre os valores que compõem o conjunto. Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. por si mesma. 70. O conjunto Y. 72 Z: 5. 15. Vemos. 70 Y: 68. Tais valores podem servir de comparação para dar a posição de qualquer elemento do conjunto. mesmo aqueles já convenientemente simplificados.VII – MEDIDAS DE DISPERSÃO OU VARIABILIDADE 1 – Dispersão ou variabilidade Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado. moda e mediana. Assim. não é o bastante dar uma das medidas de posição para caracterizar perfeitamente um conjunto de valores. por meio de procedimentos matemáticos. Vemos então que os três conjuntos apresentam a mesma média aritmética: 70. obtemos: média da variável x = 70. Consideremos os seguintes conjuntos de valores das variáveis x. 50. pois há menor diversificação entre cada um de seus valores e a média representativa. que a média – ainda que considerada como um número que tem a faculdade de representar uma série de valores – não pode. 160 Calculando a média aritmética de cada um desses conjuntos. média da variável z = 70. já que todos os valores são iguais à média. 70. é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z. Entretanto. quando se trata de interpretar dados estatísticos.

48. Quando dizemos que a amplitude total dos valores é 30. a Estatística recorre às medidas de dispersão ou de variabilidade.X (min) 93 .2. 2 – Amplitude Total 2. estamos afirmando alguma coisa do grau de sua concentração. quanto maior a amplitude total. temos: ATX = 70 – 70 = 0.X (min) Exemplo: para os valores: 40. estudaremos a amplitude total. maior a dispersão ou variabilidade dos valores da variável.1 – Sem intervalos de classe Neste caso. Dessas medidas.2 – Dados agrupados 2. Y e Z) mencionados no início deste capítulo. o Desvio-padrão. a Variância e o Coeficiente de variação. (dispersão nula) ATY = 72 – 68 = 4 ATZ = 160 – 5 = 155 2.dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z. É evidente que. 62 e 70 Temos: AT = 70 – 40 = 30. logo AT = 30. 54. 52. para qualificar os valores de uma dada variável. ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição. Portanto. 45.1 – Dados não-agrupados A Amplitude total é a diferença entre o maior e o menor valor observado: AT = X (max) . ainda temos: AT = X (max) . Relativamente aos três conjuntos de valores (X.

o que quase sempre invalida a idoneidade do resultado.162 11 162 |---.154 4 154 |---.2. 2.174 3 Total 40 Temos: AT = 174 – 150 = 24. A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série.l (min) Exemplo: Considerando a distribuição de frequência abaixo: Classes fi 150 |---. descuidando do conjunto de valores intermediários. 94 .158 9 158 |---.Exemplo: Considerando a tabela abaixo: Xi fi 0 2 1 6 2 12 3 7 4 3 Total 30 Temos: AT = 4 – 0 = 4. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. logo AT = 4.166 8 166 |---. a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe: AT = L (max) .170 5 170 |---. logo: AT = 24 cm.2 – Com intervalos de classe Neste caso.

Assim. o que faz delas índices de variabilidade bastante estáveis e.1 – Introdução: A variância e o desvio-padrão levam em consideração a totalidade dos valores da variável em estudo. representando a variância por s2. denominada desvio-padrão. Quando se tratar de uma amostra devemos usar no denominador n – 1. Sendo a variância calculada a partir dos quadrados dos desvios. sob o ponto de vista prático é inconveniente. Por isso mesmo. por isso mesmo. porém é extremamente importante na inferência estatística e em combinações de amostras.3 – Variância e Desvio-padrão 3. 95 . ela é um número em unidade quadrada em relação à variável em questão. imaginou-se uma nova medida que tem utilidade e interpretações práticas. os mais geralmente empregados. definida como a raiz quadrada da variância e representada por S. o que. temos: Quando se tratar de uma amostra devemos usar no denominador n – 1. A variância baseia-se nos desvios em torno da média aritmética. A variância é uma medida que tem pouca utilidade como estatística descritiva. porém determinando média aritmética dos quadrados dos desvios.

Essas propriedades nos permitem introduzir. no cálculo do desvio padrão simplificações úteis. que resultam imediatamente da definição. o desvio padrão fica multiplicado (ou dividido) por essa constante. isto é. c  O desvio padrão é sempre não negativo e será tanto maior. o desvio padrão não se altera. O uso de uma ou de outra dependerá da finalidade que se tenha em vista.2 – Propriedades do desvio-padrão O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for o seu valor. os dados são todos iguais. yi = xi .  Se s = 0. consideremos os seguintes casos: 96 . yi = xi ± c → sy = sx  Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero). Algumas propriedades do desvio padrão.NOTA:  Tanto o desvio-padrão como a variância são usados como medidas de dispersão ou variabilidade. são:  Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável. maior será a dispersão dos dados. Outra fórmula bastante utilizada para calcular o desvio-padrão de uma população é: 3. então não existe variabilidade. Para o cálculo do desvio-padrão. quanto mais variabilidade houver entre os dados. c → sy = sx .

mas. 3. visamos tirar inferências válidas para a respectiva população.: Podemos também calcular utilizando a outra fórmula possível. -. 5} xi 10 5 5 25 6 5 1 1 1 5 -4 16 3 5 -2 4 5 5 0 0 -. Quando nosso interesse não se restringe à descrição dos dados. Exemplo: Calcular o desvio padrão da população representada por: População = {10. a raiz quadrada de 9. convém efetuar uma modificação.3 – Dados não-agrupados Devemos empregar uma das duas fórmulas mostradas para cálculo do desvio- padrão.2. 3 e 5 representassem uma amostra o desvio padrão amostral seria a raiz quadrada de 46 / (5 -1) = 3.03 Obs. Logo.2 é o desvio padrão. S = 3. 6.3. A fórmula ficará então: Exemplo: Se os dados 10.39 97 . partindo da amostra. 1. 1. 6. ∑ = 46 Usando a fórmula: Sabemos que n = 5 e que ∑ / n = 46 / 5 = 9. que consiste em usar o divisor (n – 1) em lugar de n.

4 – Dados agrupados Quando os dados estão agrupados (temos a presença de frequências) a fórmula do cálculo do desvio padrão para uma população ficará: Quando se trata de uma amostra devemos usar a seguinte fórmula: Podemos também calcular o desvio-padrão populacional pela seguinte fórmula: Exemplo: Calcule o desvio padrão populacional da tabela abaixo: xi fi x i .82 1 6 6 2.1 -1. 16. 3. Somatório 32. 10.81 5.41 8.1 -2. dados os valores da variável: 8. fi . 11. 18. 3 – Comprove a segunda propriedade do desvio padrão multiplicando por 2 cada valor da variável do exercício 1.9 0.1 -0.Calcule o desvio padrão.12 3 7 21 2.1 0.01 0.1 1. fi 0 2 0 2. 2 .83 Total 30 63 -.Resolva: 1 .1 1.26 2 12 24 2.1 0. 15.70 98 .1 4.9 3.61 10.67 4 3 12 2.Comprove a primeira propriedade do desvio padrão somando 5 a cada valor da variável do exercício 1.21 7.

062)2 = 1.96 95. desvio-padrão é um modo de representar a dispersão dos dados ao redor da média. Se considerarmos os dados como sendo de uma amostra o desvio padrão seria: A raiz quadrada de 32. A raiz quadrada de 1.09 b) Para a amostra: S2 = (1.09. ou seja. eles se distribuirão simetricamente ao redor da média.09 é o desvio padrão. % da população incluída Grosseiramente padrão 1 68.7 / 30 = 1.062.044. Se os dados obedecerem a uma distribuição normal.044)2 = 1.13 3. No exemplo anterior a variância é igual a: a) Para a população S2 = (1.Sabemos que ∑ fi = 30 e ∑ .: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizada é a mesma do exemplo anterior.0 2 95. O quadro a seguir mostra os dados contidos entre desvio-padrão para ambos os lados da média. f i / n = 32.5 – Entendendo o significado do desvio-padrão: Em termos simples. Média + ou – ( ) desvio.5 95 % da população 2. todos estarão compreendidos por uma curva em forma de sino.7 100 % da população 99 . s = 1. Obs.3 2/3 da população 1.0 3 99.7 / (30 -1) = 1.58 99.

1 .Aproximadamente 95% dos dados estão no intervalo 100 .Aproximadamente 68% dos dados estão no intervalo 2 .

podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio.4 – Coeficiente de Variação O desvio padrão por si só não nos diz muita coisa. os pesos apresentam maior grau de dispersão que as estaturas. no entanto. o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores. medida essa denominada coeficiente de variação (CV): Exemplo: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos: Variável S Estatura 175 cm 5. Assim. o mesmo não pode ser dito. um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200. relativamente à sua dispersão ou variabilidade. nesse grupo de indivíduos. se a média for igual a 20. Para contornar essas dificuldades e limitações.85% CVP = (2/68) x 100 = 2.0 cm Peso 68 Kg 2.94% Logo.0 Kg Temos: CVE = (5/175) x 100 = 2. 101 . Além disso. quando expressas em unidades diferentes.

devemos proceder da mesma maneira. ( ) A média permanece a mesma e seu desvio-padrão fica multiplicado por 3. 2 – Considere o conjunto de A = {3. ( ) Quando multiplicarmos uma constante a um conjunto de dados. todos os valores do conjunto de dados são iguais. 50} B = {100. Sobre o conjunto B = {9. 500} Que relação existe entre os desvios padrões dos dois conjuntos de números? 4 . 24} podemos afirmar que: ( ) Sua média e seu desvio-padrão não se alteram.Considere os seguintes conjuntos de números: A = {10. ( ) Tanto a média como o desvio-padrão ficam multiplicados por 3. 3 . 18. 60} Que relação existe entre os desvios padrões dos dois conjuntos de números? 102 .padrão representa o grau de variabilidade de um conjunto de dados. 30.08. ( ) Quando somamos uma constante K a um conjunto de dados. assim como sua média. coloque V ou F nas sentenças abaixo: ( ) O desvio – padrão pode assumir qualquer valor numérico. ( ) Nada podemos afirmar em relação a média e seu desvio-padrão. ( ) Quando o valor do desvio-padrão é zero. 40. 240. 50. 250. 20.5 e desvio-padrão igual a 2. 300. não há variação entre eles. 400. ( ) O desvio . 6. 230. 200. ( ) Seu desvio-padrão é o mesmo e a média fica multiplicada por 3.Dados os conjuntos de números: A = {220. ou seja. podemos afirmar que seu desvio-padrão fica multiplicado por essa constante. podemos afirmar que seu desvio-padrão e sua média permanecem inalterados. 8}. 5. ( ) Para calcularmos o desvio-padrão e a variância para uma população e para uma amostra. 260} B = {20. 15. que tem média igual a 5.EXERCÍCIOS 1 – Com relação às propriedades do desvio-padrão. 30. quanto maior o valor do desvio-padrão mais compactos são seus dados. 40.

22. 2. 230. 6} calcule seu desvio-padrão e a variância. 0. 1.3. PESO (kg) fi 41 3 43 1 50 2 54 1 57 1 60 2 TOTAL 10 103 . 3. 21.Dados os conjuntos de números: A = {-2. 5. 7. b) ao desvio padrão de A.8.9. o desvio- padrão e a variância. 235.2 d) -10. 14. 22. 2 } B = {220. de acordo com as propriedades do desvio padrão. 15. 6 – Calcule a amplitude total dos conjuntos de dados: a) 1. 16. Calcule seu desvio-padrão e sua variância.5. e esse resultado somado a 230. 19. que o desvio padrão de B é igual: a) ao desvio padrão de A.5. 240} Podemos afirmar. 3. multiplicado pela constante 5. 7. -1. 9 . 13. 225. multiplicado pela constante 5. 8} calcule sua média. 20 c) 17. 9. 5. 13. 8 – Considere a amostra B = {2. -6. 3. 9 b) 20. 14. 6. 10 7 – Considere a população A = {1.Considere a distribuição de frequência transcrita a seguir como de uma população. 9. c) ao desvio padrão de A.4. 15. 7. d) ao desvio padrão de A mais a constante 230.

faça a distribuição de frequência por classes e calcule o desvio-padrão e a variância.64. Acrescentando-se ao grupo n objetos de massa igual a 4 kg cada. Determinar a média da distribuição. 41. 41.5 e CV = 2. 42. obtivemos media igual a 162.01 cm. 65. 54. 51. 67. 44. 61). 42. 60. 68.8 cm. 70. com um coeficiente de variação de 3. calcule o valor de n. 62. 12 . 52. Nessas condições.9%. 43.10 . 58.2 cm e desvio padrão de 8.Um grupo de cem estudantes tem uma estatura média de 163.Considere a seguinte amostra. com um desvio padrão de 2. 50. 60. 46. 51. 43.O gráfico a seguir indica a massa de uma população de objetos. A = (45. 46. 58. 57. mas o desvio padrão se reduz à metade do que era. O peso médio desses indivíduos é 52 kg. 104 . Esses indivíduos apresentam maior variabilidade em estatura ou peso? 13 .3 kg. 42. Qual o desvio padrão desse grupo? 14 – Uma distribuição apresenta as seguintes estatísticas: s = 1.3%. 50. 11 . sabe-se que a media não se altera.Medidas as estaturas de 1017 indivíduos. 55.

como os relativos a experimento aleatório. O conhecimento dos aspectos fundamentais do cálculo da probabilidade é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial. 2 . Baseado neste exemplo. enunciamos a definição de experimentos aleatórios: São fenômenos que. as situações marcadas pela possibilidade de ocorrência de mais de um resultado possível costumam ser analisadas em estatística com o auxílio das probabilidades. O resultado que vemos e registramos é chamado de observação. E2: Joga-se uma moeda três vezes e observa-se o número de caras obtido. ou medição.PROBABILIDADE 1 . é necessário definir alguns conceitos e terminologias usuais. Como exemplos de experimentos aleatórios.VIII . entretanto a maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. presumiremos que a população é conhecida e calcularemos as chances de obter várias amostras desta população. podem ser citados: E1: Joga-se um dado e observa-se o número mostrado na face de cima. Para estudar probabilidades. O resultado final depende do acaso. e o processo de realizar uma observação é chamado de experimento. fabricam-se peças em série e conta-se o número de peças defeituosas produzidas em um período de 24 horas. apresentam resultados imprevisíveis.Introdução Neste capítulo. 105 . E3: Em uma linha de produção. O cálculo das probabilidades pertence ao campo da Matemática. espaço amostral e eventos. Sendo assim. A probabilidade estuda o risco e o acaso em eventos futuros. mostraremos que a probabilidade é o reverso da estatística: na probabilidade usaremos a informação da população para inferir a natureza provável da amostra. mesmo repetidos várias vezes sob condições semelhantes. Assim.Experimento Aleatório Suponha que uma moeda foi jogada uma vez e “deu cara”. determinando se é provável ou não o seu acontecimento.

No entanto.. por espaço amostral..Eventos Quando o espaço amostral for finito ou infinito numerável.. respectivamente.. embora um e somente um resultado possa ser obtido por vez.. o espaço amostral para cada um deles pode ser descrito. 3} S3: {0. 3. N} Cada elemento do espaço amostral que corresponde a um resultado recebe o nome de ponto amostral. Logo. . 4 . representado por S. . Considerando os quatros experimentos aleatórios citados no item anterior.. os resultados individuais parecerão ocorrer de forma acidental. 3. 6} S2: {0. 4. Porém. 3 . c) Quando o experimento for executado repetidamente. uma configuração definida ou uma regularidade surgirá. 5. 2. 2. entende-se: Ao conjunto de resultados possíveis de um experimento aleatório damos o nome de espaço amostral ou conjunto universo. 1. 2. quando o experimento for repetido um grande número de vezes. 1. se o espaço amostral for infinito não numerável.É importante destacar que os experimentos mencionados possuem algumas características em comum: a) Cada experimento poderá ser repetido indefinidamente sob condições essencialmente inalteradas. 106 . por: S1: {1. Logo. b) Muito embora não seja possível afirmar que resultado particular ocorrerá. todo subconjunto poderá ser considerado um evento.. No primeiro exemplo: o número 1 pertence ao espaço amostral {1}. pode-se descrever o conjunto de todos os possíveis resultados do experimento.. podemos definir evento como: Qualquer subconjunto do espaço amostral S de um experimento aleatório. surgirá uma dificuldade teórica na identificação e apresentação de eventos.Espaço Amostral Um conjunto de resultados totais pode ser obtido ao ser realizada uma experiência aleatória..

 Se A = Ø. 6}. um número par ocorre.No lançamento de uma moeda qual a probabilidade de obter “cara” em um evento A? S = {ca. vamos admitir que todos os elementos de S tenham a mesma chance de acontecer. A é chamado de evento elementar. A é chamado de evento impossível. ou seja. como os eventos abaixo: A1: {2. qualquer que seja A.Em relação aos quatro experimentos aleatórios apresentados inicialmente. Aplicar probabilidade significa usá-la em situações em que não se pode prever um resultado futuro. 4. Nos itens anteriores aprendemos as definições e exemplos de experimento aleatório. Os resultados são incertos. A2: {2}. regidos pelo acaso. espaço amostral e eventos. sendo S o seu espaço amostral.  Se A está contido em S e A é um conjunto unitário. Em particular:  Se A = S. então A é um evento de S. isto é.5 = 50% 107 . co} = 2 A = {ca} = 1 P (A) = 1/2 = 0. isto é. podem ser citados. isto é. No item a seguir. que S é um conjunto equiprovável. 5 . Observe os exemplos a seguir: 1.Probabilidade Dado um experimento aleatório. duas caras ocorrem. se A está contido em S. A é chamado de evento certo. usaremos estas definições para enunciar o conceito de probabilidade. Se considerarmos S como espaço amostral e A como evento. A3: {0}. todas as peças são perfeitas. respectivamente.

: a probabilidade de todo evento certo é igual a 1 ou 100%.0 = 100% Obs.Calcular a probabilidade de um piloto vencer uma dada corrida.3.2 .4.2.67%.No lançamento de um dado qual a probabilidade de obter um “número par” em um evento A? S = {1.: Em uma distribuição de probabilidades o somatório das probabilidades atribuídas a cada evento elementar é igual a 1.No lançamento de um dado qual a probabilidade de obter um “número maior que 6” em um evento A? S = {1.2.6} = 6 A = {2.4.5.4. são de "3 para 2".Eventos Complementares Sabemos que um evento pode ocorrer ou não.5.6} = 3 P (A) = 3/6 = 0. a probabilidade de não tirar é q = 1 . Logo.2. Exemplos: 1 – Qual a probabilidade de não tirar o nº 4 no lançamento de um dado? Solução: sabemos que a probabilidade de tirar o nº 4 no lançamento aleatório de um dado é p = 1/6 ou 16. 4 .6} = 6 A={ }=0 P (A) = 0/6 = 0 = 0% Obs.3.33%.: a probabilidade de todo evento impossível é igual a 0 ou 0% 6 .6} = 6 P (A) = 6/6 = 1.3.5 = 50% 3 . onde as suas "chances"... 108 .1/6 = 5/6 ou 83.p ou q = 1 .2.5.6} = 6 A = {1.4. Calcule também a probabilidade dele perder. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso). segundo os especialistas.4. logo temos: p1 + p2 + p3 + . + pn = 1. para um mesmo evento existe sempre a relação: p+q=1 Obs.No lançamento de um dado qual a probabilidade de obter um “número menor ou igual a 6” em um evento A? S = {1.3. 2 .5.

Fique atento aos exemplos de eventos independentes abaixo: 109 . quando lançamos dois dados. o resultado obtido em um deles independe do resultado obtido no outro.Eventos Independentes Dizemos que dois eventos são independentes quando a realização ou a não- realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. se p1 é a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento. Se dois eventos são independentes.33%. e são representadas pelo símbolo de intersecção “∩”.1/6 = 5/6 ou 83.Solução: O termo "3 para 2" significa: de cada 5 corridas ele ganha 3 e perde 2. que se aplica nas operações multiplicativas de probabilidades. Por exemplo. 7 . Assim. e que a probabilidade de um evento acontecer somado à probabilidade deste mesmo evento não acontecer (complementar) é sempre igual a 1 ou 100%. logo q = 1 .Qual a probabilidade de tirar um número maior ou igual a dois no lançamento de um dado? Solução: sabemos que neste evento só excluímos a possibilidade do resultado do lançamento ser o nº 1 e a probabilidade de tirá-lo no lançamento de um dado é p = 1/6. 3 . a probabilidade de que tais eventos se realizem simultaneamente é dada por: p = p1 x p2 Esta regra também é conhecida como Teorema do produto. a probabilidade do resultado obtido neste lançamento ser maior ou igual a 2 é q = 1 – p. a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos. Aprendemos a distinguir eventos complementares. Operações multiplicativas geralmente envolvem a conjunção “e”. Logo. Então p = 3/5 ou 60% (ganhar) e q = 2/5 ou 40% (perder). A seguir vamos definir eventos independentes e calcular a probabilidade deles acontecerem.

110 .1 – Ao lançarmos dois dados. ao se realizar um deles. Operações aditivas geralmente envolvem a expressão “ou” e são representadas pelo símbolo de união “U”. o outro não se realiza. supondo a reposição da primeira bola extraída antes da extração da segunda bola? Solução: A probabilidade de obtermos uma bola de cor vermelha na primeira extração é: p1 = 6/10 A probabilidade de obtermos uma bola de cor branca na segunda extração é: p2 = 4/10 Logo. que se aplica nas operações aditivas de probabilidades.Eventos Mutuamente Exclusivos Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um dos eventos exclui a realização do(s) outro(s). a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: p = p1 + p2 Esta regra também é conhecida como Teorema da soma. a probabilidade da extração das duas bolas: p = 6/10 x 4/10 = 24/100 = 0. o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos.24 ou 24% Aprendemos o que são eventos independentes e como calcular a probabilidade desses eventos acontecerem. a probabilidade de obtermos. Se dois eventos são mutuamente exclusivos. qual a probabilidade de obtermos o número 1 no primeiro e o número 5 no segundo dado? Solução: A probabilidade de obtermos 1 no primeiro dado é: p1 = 1/6 A probabilidade de obtermos 5 no segundo dado é: p2 = 1/6 Logo. quando lançamos uma moeda. Assim.78% 2 – Qual a probabilidade da extração de uma bola vermelha e uma bola branca (nesta ordem) de uma urna com 6 bolas vermelhas e 4 bolas brancas. simultaneamente. já que. 1 no primeiro e 5 no segundo é: p = 1/6 x 1/6 = 1/36 ou 2. 8 . A seguir vamos definir eventos mutuamente exclusivos e calcular a probabilidade deles acontecerem.

os eventos são mutuamente excludentes. Como não é possível que uma carta seja das duas cores ao mesmo tempo.33% 2 – Ao lançarmos uma moeda. Como não é possível que uma face seja cara e coroa ao mesmo tempo. Como cinco é um número ímpar. a probabilidade de obtermos o número 3 ou o número 5 é: p = 1/6 + 1/6 = 2/6 = 1/3 ou 33. os eventos são mutuamente excludentes. 4 bolas brancas e 5 pretas? Solução: A probabilidade de obtermos uma bola vermelha é: p1 = 6/15 111 . d) Extrair face par e extrair o número cinco do lance de um dado. os eventos são mutuamente excludentes. Fique atento ao cálculo da probabilidade de eventos mutuamente excludentes: 1 – Ao lançarmos um dado. b) Extrair uma carta vermelha e extrair uma carta preta de um baralho. qual a probabilidade de obtermos cara ou coroa? Solução: A probabilidade de obtermos cara é: p1 = 1/2 A probabilidade de obtermos coroa é: p2 = 1/2 Logo. em que os eventos são classificados como mutuamente exclusivos ou excludentes. Como paus é um naipe preto. a probabilidade de obtermos cara ou coroa é: p = 1/2 + 1/2 = 2/2 = 1 ou 100% (evento certo) 3 – Qual a probabilidade da extração de uma bola vermelha ou branca de uma urna que contém 6 bolas vermelhas. c) Extrair cara e extrair coroa do lance de uma moeda. os eventos são mutuamente excludentes. qual a probabilidade de obtermos o número 3 ou o número 5? Solução: A probabilidade de obtermos o número 3 é: p1 = 1/6 A probabilidade de obtermos o número 5 é: p2 = 1/6 Logo. a) Extrair uma carta vermelha e extrair uma carta de paus de um baralho.Veja os exemplos apresentados a seguir.

4 são defeituosas.67%. a probabilidade da extração de uma bola vermelha ou branca é: p = 4/15 + 6/15 = 10/15 ou 66. A probabilidade dessa peça não ser defeituosa Resposta: Temos p = 1 .11%. 5 – De dois baralhos de 52 cartas retiram-se. 2 verdes. logo: p = 4/52 = 1/13 ou 7.92%. 3 – Em um lote de 12 peças. logo: p1 = 4/52 = 1/13 e p2 = 1/52. uma urna B contém: 5 bolas brancas. uma carta do primeiro baralho e uma carta do segundo. uma urna C contém: 2 bolas brancas. Como o número de elementos de S é 36. (3. temos: p = 4/36 = 1/9 ou 11.69%. simultaneamente.2) e (4. A probabilidade dessa peça ser defeituosa Resposta: Temos p = 4/12 = 1/3 ou 33. Qual a 112 . 2 – Qual a probabilidade de sair um rei quando retirarmos uma carta de um baralho de 52 cartas? Resposta: Como há quatro reis no baralho. 3 pretas e 4 verdes. logo: p = 1/52 ou 1.3). 2 pretas. 4 – No lançamento de dois dados. vem: p = 1/13 x 1/52 = 1/676 ou 0. Como esses dois acontecimentos são independentes e simultâneos. Resposta: O evento é formado pelos elementos (1. 4 pretas.33%. calcule: a.A probabilidade de obtermos uma bola branca é: p2 = 4/15 Logo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus? Resposta: Como há quatro reis no baralho.1/3 = 2/3 ou 66. b. Uma bola é retirada de cada urna.67% Exercícios Resolvidos 1 – Qual a probabilidade de sair o ás de ouros quando retirarmos uma carta de um baralho de 52 cartas? Resposta: Como só há um ás de ouros. calcule a probabilidade de se obter soma igual a 5. o número de elementos do evento é 1. o número de elementos do evento é 4. (2. o número de elementos do evento é 4.1). 1 verde.15%.4). Sendo retirada uma peça ao acaso. 6 – Uma urna A contém: 3 bolas brancas.

já que a carta retirada não foi reposta. vem: p = 1/13 + 1/13 + 1/13 = 3/13 ou 23. Após a retirada da primeira carta. p = 1/6 + 1/6 = 1/3 ou 33. segunda e terceira urnas serem.probabilidade de as bolas retiradas da primeira. temos: p = 1/169 + 1/169= 2/169 ou 1.04%. pO = 1/4. restam 51 cartas no baralho. vem: p = 1/4 + 1/4 = 1/2 ou 50%. 8 – Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52 cartas? Resposta: Temos pR = 4/52 = 1/13. de acordo com o problema: p1 = 1/13 x 1/13= 1/169. pD = 1/13 pV = 1/13. branca. qual a probabilidade de se obter um número não-inferior a 5? Resposta: A probabilidade de se ter um número não-inferior a 5 é a probabilidade de se obter 5 ou 6. 11 – São dados dois baralhos de 52 cartas. uma carta do primeiro baralho e uma carta do segundo. Tiramos. respectivamente. p2 = 2/8= 1/4 e p3 = 4/9. Como esses três acontecimentos são independentes e simultâneos. Como esses dois eventos são mutuamente exclusivos. a probabilidade de a segunda carta ser o rei de paus é p2 = 1/51.70%. duas cartas sem reposição.33%. preta e verde? Resposta: Temos: p1 = 3/9 = 1/3. Qual a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus? Resposta: A probabilidade de sair o ás de paus na primeira carta é p 1 = 1/52. 7 – De um baralho de 52 cartas retiram-se. 9 – Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um baralho de 52 cartas? Resposta: Temos pC = 13/52 = 1/4. Assim. não necessariamente nesta ordem? Resposta: A probabilidade de tirarmos uma dama do primeiro baralho é p = 4/52 = 1/13 e um rei do segundo é p = 4/52 = 1/13. 10 – No lançamento de um dado. Como esses eventos são mutuamente exclusivos.18%.08%. Qual é a probabilidade de tirarmos uma dama e um rei. Como esses eventos são mutuamente exclusivos. Assim. A probabilidade de tirarmos um rei do primeiro baralho e uma dama do segundo é: p2 = 1/13 x 1/13= 1/169. ao mesmo tempo. ao acaso. temos: p = 1/52 x 1/51= 1/2652 ou 0. Como esses dois eventos são independentes. 113 . vem: p = 1/3 x 1/4 x 4/9 = 1/27 ou 3.

Em relação ao espaço amostral. 6}. 3. calcule: (a) a probabilidade de ocorrer face cinco. 16 verdes e 8 rosas. (e) pelo menos uma cara.5). Determine a probabilidade de a soma ser 10 ou maior que 10. 114 . Calcule a probabilidade de obtermos: (a) três caras. a probabilidade é (5. 3 – Determine o espaço amostral do evento extração de uma carta de um baralho honesto. quatro são defeituosas. (c) extrair um valete de paus. 11 ou 12. (d) nenhuma cara. (b) Obter um número menor ou igual a 6. Para que a soma seja 10. Como esses três eventos são mutuamente exclusivos. temos: p = 3/36 + 2/36 + 1/36 = 6/36 = 1/6 ou 16. (c) Obter o número 4. (b) a probabilidade de não ocorrer face três. logo: p = 2/36. EXERCÍCIOS 1. 5 – Uma bola é retirada ao acaso de uma urna que contém 12 bolas pretas. 2.5) e (6. (c) uma cara somente. logo: p = 3/36. Calcule a probabilidade de: (a) extrair uma carta de copas. 7 – Uma moeda é lançada três vezes.67%. Para que a soma seja 12.6). (c) ser rosa. Resposta: A soma deverá ser então 10. 2 – Construa o espaço amostral do evento “lance de um dado honesto”.12 – Dois dados são lançados conjuntamente. (d) Obter um número maior que 6. calcule: (a) a probabilidade de ser homem. (b) a probabilidade de ambas não serem defeituosas. logo: p = 1/36. a probabilidade é (6. Para que a soma seja 11. a probabilidade é (4. 5. (f) no máximo uma cara. Sendo retiradas aleatoriamente duas peças. 6 – Em um lote de 12 peças. Calcule a probabilidade de: (a) não ser verde. 4 – Um grupo de 20 pessoas é formado por 12 homens e 8 mulheres. Formule os eventos definidos pelas sentenças: (a) Obter um número par. (b) duas caras e uma coroa. 4. (b) não ser preta.4). (b) a probabilidade de ser mulher.6).No lançamento de um dado temos S = {1. calcule: (a) a probabilidade de ambas serem defeituosas. Em relação ao sorteio de um elemento deste grupo. (b) extrair um rei.6) e (6. (5. (c) a probabilidade de ao menos uma ser defeituosa.

em uma extração ao acaso: (a) obtermos a bola de número 27. (b) um 5 aparece pelo menos em um dos dados.8 – Uma urna contém 50 bolas idênticas. (b) pelo menos uma seja perfeita. (d) obtermos uma bola de número menor ou igual a 20. 10 – Um lote é formado por dez peças boas. Encontre a probabilidade de que a soma seja 10 ou maior que 10 se: (a) um 5 aparece no primeiro dado. Calcule a probabilidade de que: (a) ela não tenha defeitos graves. (d) nenhuma seja perfeita. Sendo as bolas numeradas de 1 a 50. 9 – Um par de dados é atirado. (b) obtermos uma bola de número par. (c) nenhuma tenha defeitos graves. 11 – Considere o mesmo lote do problema anterior. quatro com defeitos e duas com defeitos graves. determine a probabilidade de. Uma peça é escolhida ao acaso. Retiram-se duas peças ao acaso. (c) ela se boa ou tenha defeitos graves. (c) obtermos uma bola de número maior que 20. (b) ela não tenha defeitos. Calcule a probabilidade de que: (a) ambas sejam perfeitas. 115 .

1 . Ca) 2 (Ca. (Ca. definida uma função chamada variável aleatória. Fica. a cada ponto amostral podemos associar um número para X. então. indicada por uma letra maiúscula. (Co. Co). de acordo com a tabela abaixo: PONTO X AMOSTRAL (Ca. (Co. se o espaço amostral relativo ao “lançamento de duas moedas” é S = {(Ca. Ca). Assim. aos quais um experimento aleatório estudado possa ser adaptado.IX – DISTRIBUIÇÕES BINOMIAL E NORMAL Neste capítulo apresentaremos dois modelos teóricos de distribuição de probabilidade. sendo seus valores indicados por letras minúsculas. Co)} e se X representa “o número de caras” que aparecem. o que permitirá a solução de grande número de problemas práticos. Co) 1 (Co.Variável Aleatória Suponhamos um espaço amostral S e que cada ponto amostral seja atribuído um número. Ca). Co) 0 2 – Distribuição de Probabilidade Consideremos a distribuição de frequências relativa ao número de acidentes diários em um estacionamento: Nº DE FREQUENCIAS ACIDENTES 0 22 1 5 2 2 3 1 TOTAL 30 116 . Ca) 1 (Co.

..73 1 0.. p2. voltando a tabela inicial.ocorrer um acidente é: p = 5/30 = 0.73 ou 73% .. a probabilidade de: ..00 Essa tabela é denominada distribuição de probabilidade.03 ou 3% Podemos. Seja X uma variável aleatória que pode assumir os valores x 1. xn e seus correspondentes p1. x2. p3. Assim. xn. x3. escrever: Nº DE PROBABILIDADES ACIDENTES 0 0. . Temos: 117 ..não ocorrer acidente é: p = 22/30 = 0. x2. Assim..07 ou 7% .ocorrerem três acidentes é: p = 1/30 = 0.. pn definem uma distribuição de probabilidade.07 3 0. temos: ∑ pi = 1 Os valores x1.17 2 0. ..17 ou 17% .03 TOTAL 1....Em um dia.ocorrerem dois acidentes é: p = 2/30 = 0. então. x3... A cada valor xi correspondem a probabilidade pi de ocorrência de tais pontos no espaço amostral.. .

. n) formam o domínio da função e os valores de pi (i = 1.. Esta correspondência define uma função. estabelecemos uma correspondência unívoca entre os valores da variável aleatória X e os valores da variável P. 2.. .. n).Logo.. é denominada função probabilidade e representada por: f(x) = P(X = xi) A função P(X = xi) determina a distribuição de probabilidade de variável aleatória X. 3. 3. . ao lançarmos um dado. definida por “pontos de um dado”. Assim.. 2. 3. 6... pode tomar os valores 1... o seu conjunto imagem. a variável aleatória X.. os valores xi (i = 1.. Como a cada um destes valores está associada uma e uma só probabilidade de realização e ∑ P(xi) = 1.. Essa função.. assim definida. 2.. da qual resulta a seguinte distribuição de probabilidade: X P(X) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 ∑ 1 118 . fica definida uma função de probabilidade.. . podemos escrever: Nº DE CARAS (X) P(X) 0 1/4 1 2/4 2 1/4 ∑ 1 Ao definir a distribuição de probabilidade..

Por coletivamente exaustivas entende-se que a união de ambos os eventos resulta no espaço amostral. neste item. Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n tentativas. As provas repetidas devem ser independentes. e por meio da extração de cartas vermelhas e pretas de um baralho. a probabilidade de não-realização desse mesmo evento (insucesso) é 1 – p = q. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso. Exemplos de eventos binomiais podem ser fornecidos por meio de números pares e ímpares no lançamento de um dado honesto. Vamos. c. O experimento “obtenção de caras em cinco lançamentos sucessivos e independentes de uma moeda” satisfaz essas condições. mutuamente excludentes e coletivamente exaustivos. Mutuamente excludentes significa que uma categoria implica a possibilidade da não-ocorrência simultânea da outra categoria. Situações de sucesso correspondem àquilo que se deseja estudar. em análises estatísticas. um número finito de vezes (n). isto é. àquilo que não se deseja estudar. Geralmente. os exemplos mais comuns de eventos binomiais são aqueles que estabelecem situações de sucesso e fracasso. se a probabilidade de realização de um evento (sucesso) é p. considerar experimentos que satisfaçam as seguintes condições: a. Situações de fracasso correspondem ao complemento. Sabemos que. 119 . d. o resultado de uma não deve afetar os resultados das sucessivas. O experimento deve ser repetido. nas mesmas condições. Ou seja. b.3 – Distribuição Binomial Eventos binomiais são marcados pela existência de duas categorias. a probabilidade p do sucesso e a probabilidade q (q = 1 – p) do insucesso manter-se-ão constantes. quando da realização de um experimento qualquer em uma única tentativa. No decorrer do experimento.

Exercícios Resolvidos 1 – Uma moeda é lançada 5 vezes seguidas e independentes. A probabilidade de que um evento se realize k vezes nas provas é dada pela função: Na qual: P (X = k) é a probabilidade de que o evento se realize k vezes em n provas. Essa função. q é a probabilidade de que o evento não se realize no decurso dessa – insucesso. p é a probabilidade de que o evento se realize em uma só prova – sucesso. denominada lei binomial. define a distribuição binomial. que realizemos a mesma prova n vezes sucessivas e independentes.Suponhamos. Calcule a probabilidade de serem obtidas 3 caras nessas 5 provas. 120 . agora.

P(x = 3) = C4.50)3(0.25 ou 25% (c) Pelo menos uma vez implica na aceitação do número de caras igual a 1. ou x = 4. P(x ≥ 1) = P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4) = 1 .50. ou x = 3. x = 1. ou q = 1 – p = 1 – 0. sabe-se que n é igual a 4 (número de lances da moeda).3(0.75% 121 . ou x = 2.9375 ou 93.1(0. (c) pelo menos uma vez.50)4-0 = 1 .C4. A variável x varia para cada situação: (a) Para calcular a probabilidade de ocorrer apenas uma cara. Neste caso. 2.P(x = 0) P(x ≥ 1) = 1 . pelo menos uma vez implica na aceitação de qualquer resultado menos o resultado x = 0. de forma mais fácil. P(x = 1) = C4. Ou. Deseja-se calcular a probabilidade de sair cara: (a) uma vez.0. que apresenta a mesma probabilidade de cara ou coroa. jogam entre si 6 vezes.2 – Dois times de futebol. ou na probabilidade de x = 1.0(0. A e B. x = 3. Encontre a probabilidade de o time A ganhar 4 jogos.50)4-3 = 0. A probabilidade de sair coroa também é igual a meio. a probabilidade de sair cara é igual a meio. 3 ou 4. (b) três vezes.50)0(0.50.50)4-1 = 0.50 = 0. é jogada quatro vezes. 3 – Uma moeda honesta.25 ou 25% (b) Para calcular a probabilidade de ocorrerem três caras.0625 = 0. ou p = 0.50)1(0.

Escolhemos ao acaso seis duplicatas para uma auditoria. P(x = 1) = C6. P(x = 0) = C6. temos x = 6. Ganhar pelo menos um jogo.70)0(0. Solução: para resolver este problema podemos considerar como evento sucesso i) duplicata paga em dia. Encontre a probabilidade de o time A: a. 40% são machos.30)6-0 = 0. temos x = 1.07% (b) Para calcular a probabilidade de apenas uma duplicata ser paga em dia.0007 ou 0. temos x = 0. Ganhar dois ou três jogos.1(0.01 ou 1% (c) Para calcular a probabilidade de todas as duplicatas serem pagas em dia.30)6-6 = 0. Qual a probabilidade de que nasçam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos? 5 – Dois times de futebol. (b) Apenas uma ser paga em dia. 122 . A e B.8% EXERCÍCIOS 1 – Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda. Deseja-se calcular a probabilidade de: (a) todas serem pagas em atraso. determine a probabilidade de se obter um múltiplo de 3 duas vezes. 2. 4 – Numa criação de coelhos. Considerando a primeira opção temos: (a) Para calcular a probabilidade de todas serem pagas em atraso.Uma moeda é lançada 20 vezes.30)6-1 = 0.70)6(0. P(x = 6) = C6. Qual a probabilidade de saírem 8 caras? 3 – Jogando-se um dado três vezes.118 ou 11.4 – A probabilidade de uma duplicata ser paga em dia é de 70%. jogam entre si 6 vezes. (c) todas serem pagas em dia. ou nenhuma ser paga em dia.0(0. b.6(0. ii) duplicata paga em atraso.70)1(0.

Seja X o número de sucessos. Qual a probabilidade de que: a. 10 sejam brancas? 10 – A probabilidade de um arqueiro acertar o alvo com uma única flecha é 0. Retiram-se 25 bolas com reposição. Qual a probabilidade de serem defeituosos dois deles? 8 – Uma prova tipo teste tem 50 questões independentes. Pelo menos 3 vezes? c. Exatamente 5 vezes? b. Qual a probabilidade de acertar: a. Qual a probabilidade de que: a. que apresenta 10% de peças defeituosas.20. Se um aluno resolve a prova respondendo a esmo as questões. No máximo 2 sejam brancas? b. 12 – Uma urna tem 10 bolas brancas e 40 pretas. Nenhuma vez? d. calcular P (1< x ≤ 4).05. Apenas uma das alternativas é a correta. 2 sejam pretas? b. Exatamente 4 acertem o alvo? b. qual a probabilidade de tirar nota 5? 9 – Uma urna tem 20 bolas pretas e 30 brancas. 3 sejam brancas? 123 . O atirador atira 20 vezes no alvo. Se ele atirar 5 vezes.6 – A probabilidade de um atirador acertar o alvo em um único tiro é 2/3. No máximo 4 vezes? 14 – Uma urna contém 8 bolas brancas e 12 pretas. Retiram-se 10 bolas com reposição. Pelo menos 3 acertem o alvo? 11 – Considere 10 tentativas independentes de um experimento. qual a probabilidade de acertar exatamente 2 tiros? 7 – Seis parafusos são escolhidos ao acaso da produção de certa máquina. Lança 30 flechas no alvo. Cada tentativa admite sucesso com probabilidade 0. Pelo menos 3 sejam pretas? c. Cada questão tem 5 alternativas. Qual a probabilidade de que: a. Qual a probabilidade de que em 30 bolas retiradas com reposição ocorram no máximo 2 brancas? 13 – A probabilidade de um atirador acertar no alvo num único tiro é 1/4.

Se 16 alunos são selecionados ao acaso. se forem assados inadequadamente. quantas se esperaria que tivessem: a) Nenhuma menina. qual é a probabilidade de que pelo menos uma não seja alfabetizada? 20 – Uma pesquisa. Qual é a probabilidade do consumidor ter mais de 6 frangos contaminados? 17 – Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica tem alergia aos poluentes lançados ao ar. 21 – As pacientes diagnosticadas com certa doença têm 80% de chance de serem curadas. ocorram 3 defeituosas? 16 – Estima-se que cerca de 30% dos frangos congelados contenham suficiente número de bactérias salmonelas causadoras de doenças. é de 0. calcule a probabilidade de: a) Oito ficarem completamente curadas.1. constatou que a probabilidade de nascimento de meninos é de 58%. Nestas 420 famílias com cinco crianças cada uma. b) Três meninos. respectivamente. 124 . c) Não mais do que duas permanecerem com a doença. Admitindo que este percentual de alérgicos é real (correto). num dia. Para um grupo de doze pacientes nessas condições. Se 12 pessoas da população A e 10 da população B forem selecionadas ao acaso. 90% e 80% dos indivíduos das populações A e B sejam alfabetizados. 18 . com 420 casais que possuem cinco filhos. b) Entre três (inclusive) e cinco (inclusive) não serem curadas. Um consumidor compra 12 frangos congelados. qual é a probabilidade de que: (a) Pelo menos 12 tenham feito cursinho? (b) No máximo 13 tenham feito cursinho? (c) Exatamente 12 tenham feito cursinho? 19 . c) Quatro meninos.15 – A probabilidade de uma máquina produzir uma peça defeituosa.Três em cada quatro alunos de uma universidade fizeram cursinho antes de prestar vestibular. calcule a probabilidade de que pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso. Qual a probabilidade de que em 20 peças produzidas pela máquina num dia.Admita que.

em função do recebimento de cheques sem fundos. (b) acertar pelo menos um jogo. a probabilidade de um homem. determinado time pode ganhar ou empatar ou perder. Calcule a probabilidade de um jogador que nada sabe sobre os times: (a) acertar todos os jogos. b) Pelo menos 3.22 – Um vendedor de seguros vende apólices a 5 homens. Use o maior número de casas decimais nas respostas. 23 – Uma recente pesquisa detectou que 90% dos fumantes de uma região afirmaram desejar parar com seu vício. Determinar a probabilidade de estarem ainda vivos daqui a 30 anos: a) Todos os cinco homens. d) Pelo menos 1. (c) acertar pelo menos doze jogos. serem pagas? (c) pelo menos três vendas serem pagas normalmente? (d) todas as vendas não serem pagas? 25 – Existem treze jogos na Loteria Esportiva. dessa idade particular. apenas. qual a probabilidade de: (a) todas serem pagas normalmente? (b) uma ou duas vendas. todos da mesma idade e de boa saúde. c) Apenas 2. Em uma amostra formada por dez pessoas: a) Qual a probabilidade de a maioria querer parar de fumar? b) Qual a probabilidade de todos quererem parar de fumar? 24 – Uma empresa comercial calcula que 5% de suas vendas não são recebidas. De acordo com as tabelas atuariais. estar vivo daqui a 30 anos é de 2/3. Ao se analisar uma amostra formada por oito vendas. 125 . Em cada um dos jogos.

Laplace e Gauss. onde a apresentação da distribuição de frequências f(x) de uma variável qualitativa x costuma apresentar-se em forma de sino e simétrica em relação à média. registra-se alta concentração de frequências ou probabilidade maior de ocorrência. Alguns estudos revelam que medições repetidas de uma mesma grandeza. Das observações surgiu o nome curva “normal” dos erros.4 – Distribuição Normal Entre as distribuições teóricas de variável aleatória contínua. O estudo da distribuição normal recebeu contribuições de matemáticos importantes. Porém. a apresentação das frequências dos inúmeros números coletados sempre resultava em uma curiosa curva em forma de sino. Quanto mais longe da média e dos valores centrais. O aspecto gráfico da distribuição normal é o da figura abaixo: Os conceitos associados à distribuição Normal são simples. como De Moivre. como o diâmetro de uma esfera ou o peso de determinado objeto. Muitas das variáveis analisadas na pesquisa socioeconômica correspondem à distribuição normal ou dela se aproximam. Em torno da média. menores as frequências e as probabilidades. as frequências são reduzidas. nunca forneciam os mesmos valores. Consiste em uma distribuição contínua de probabilidades. valor central. A probabilidade de encontrarmos valores mais distantes da média diminui. À medida que nos afastamos da média. uma das mais empregadas é a distribuição normal. 126 .

a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média. 127 . aproxima-se indefinidamente do eixo das abscissas sem. 6ª) Como a curva é simétrica em torno de . Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. pode ser também representada desta maneira: X: N ( . Queremos conhecer a probabilidade de um parafuso tirado ao acaso ter um diâmetro com valor entre 2 e 2. proveniente da variância. 2ª) A representação gráfica da distribuição normal é uma curva em forma de sino. 3ª) A distribuição é simétrica em torno da média ( ) 4ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1 ou à percentagem de 100%. por meio de um exemplo concreto. S2). que recebe o nome de curva normal ou de Gauss ou de Moivre. Escrevemos: P(X > ) = P(X < ) = 0. Quando temos em mãos uma variável aleatória com distribuição normal. alcançá-lo. ambas as probabilidades são iguais a 0. contudo. isto é.5 ou 50%.5 ou 50%.05 cm.Para uma perfeita compreensão da distribuição normal. nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. 5ª) A curva normal é assintótica em relação ao eixo das abscissas. X segue uma distribuição Normal de media e variância S2. Então. A distribuição Normal de variável aleatória X depende dos parâmetros da media e do desvio padrão. ou seja. Vejamos como proceder. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão s = 0. observe a figura e procure visualizar as seguintes propriedades: 1ª) A variável aleatória X pode assumir todo e qualquer valor real. isto é. já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.04 cm.

então. Basta aceitar. Entretanto. indicada por: P(2< X < 2.É fácil notar que essa probabilidade. com 128 . não havendo necessidade de serem calculadas. se X é uma variável aleatória com distribuição normal de média e desvio padrão s. Em anexo. que nos dá a probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z. tem distribuição normal de média 0 e desvio padrão 1. As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas. podemos contornar facilmente esse problema.05) corresponde à área hachurada na figura: O cálculo direto dessa probabilidade exige um conhecimento de Matemática mais avançado do que aquele que dispomos no curso de ensino médio. que se X é uma variável aleatória com distribuição normal de média e desvio padrão s. isto é: P(0 < Z < z) Temos. é apresentada uma tabela de distribuição normal reduzida. sem demonstração. e então a variável z dada por: tem distribuição normal reduzida. isto é. que. podemos escrever: P( < X < x) = P(0 < Z < z).

3944. Temos então: Z = 2. Queremos calcular P(2< X < 2.25.05) = P(0 < Z < 1.05) = P(0 < Z < 1. o valor 5 (2ª casa decimal).25) = 0. na primeira linha. agora. em primeiro lugar. Em seguida.25.Voltemos.05 – 2 / 0.05). precisamos. Para obter essa probabilidade.25) Procuremos. Escrevemos. 129 . calcular o valor de z que corresponde a variável x = 2. ao nosso problema.05 é 0.3944 Assim. pois = 2.2 (número inteiro + 1ª casa decimal). então.05. na tabela Z em anexo. Observe a forma de entrada na tabela: Na primeira coluna encontramos o valor 1. que corresponde ao último algarismo do número 1. encontramos.25 donde: P(2 < X < 2. então: P(2 < X < 2.25) = 0. o valor de z = 1.44%.3944. a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro entre a média = 2 e o valor x = 2.04 = 1. o que nos permite escrever: P(0 < Z < 1.3944 ou 39. Na intersecção da linha e coluna correspondentes encontramos o valor 0. já que para x = 2 → z = 0.

3944ou 39.25 < Z < 0) A probabilidade procurada corresponde à parte hachurada da figura: Sabemos que: P(0 < Z < 1.5 < Z < 1.25) = 0.6221ou 62. Exercícios Resolvidos 1 – Com base na tabela Z determine as probabilidades: a.5 < Z < 0) + P(0 < Z < 1.5 < Z < 1. P(-1.1915 e P(0 < Z < 1.5) = 0.48) = 0.5 < Z < 0) = P(0 < Z < 0. P(-0.48) A probabilidade procurada corresponde à parte hachurada da figura: Temos que: P(-0.5 < Z < 1.3944 Pela simetria da curva. temos: P(-1.4306 Obtemos: P(-0.48) Como: P(-0.44%.1915 + 0.25 < Z < 0) = P(0 < Z < 1.4306 = 0. b.25) = 0.48) = P(-0.21% 130 .48)= 0.

c.8) Como: P(0 < Z < 1.6) = 0. P(Z > 0.2881 = 0. P(0.0.2881 Obtemos: P(0.2258 Obtemos: P(Z > 0.6) Como: P(Z > 0)= 0.3907 .5 .P(0 < Z < 0.23)= 0.1026 ou 10.23) A probabilidade procurada corresponde à parte hachurada da figura: Temos que: P(0.23) .23) = P(0 < Z < 1.8)= 0.P(0 < Z < 0.8 < Z < 1.8 < Z < 1.2258 = 0.2742 ou 27.42% 131 .6)= 0.3907 e P(0 < Z < 0.23) = 0.6) A probabilidade procurada corresponde à parte hachurada da figura: Temos que: P(Z > 0.6) = P(Z > 0) .26% d.0.8 < Z < 1.5 e P(0 < Z < 0.

00 e R$ 520.1915 = 0. 2 – Os salários semanais dos operários industriais são distribuídos normalmente.5 + 0. Calcule a probabilidade de um operário escolhido ao acaso ter um salário semanal situado entre R$ 490.2902 É. ou seja. Assim. Z1 = 490 – 500 = .00 e R$ 520.25 < Z < 0.25 e Z2 = 520 – 500 = 0.00. 29. Obtemos: P(Z < 0.92) = P(Z < 0) + P(0 < Z < 0.00. e.92)= 0.02%.12%. Devemos inicialmente. com desvio padrão de R$ 40.0987 + 0. determinar os valores Z1 e Z2 da variável de distribuição normal reduzida.5 40 40 Como: P(490 < X < 520) = P(.5)= 0. em torno da média de R$ 500.5 e P(0 < Z < 0.0.5) = P(.25 < Z < 0) + P( 0 < Z < 0.00 é de 29.3212.92) A probabilidade procurada corresponde à parte hachurada da figura: Temos que: P(Z < 0. de se esperar que.02% dos operários tenham salários entre R$ 490. 132 .00.00 e R$ 520.0.92) Como: P(Z < 0)= 0. em média. a probabilidade de um operário escolhido ao acaso ter salário entre R$ 490. P(Z < 0. pois.92) = 0.0.8212 ou 82.3212 = 0.00.

30 ou Z > 1. P(Z < . P (Z < -2.48 < Z < 2.56 < Z < 2. P (1. P(Z > 1. P (Z < 1. P (112 ≤ X ≤ 116) d. baseado na tabela Z calcule: a. P(Z < 0.29) 3 – seja X: N (100.EXERCÍCIOS 1 – Sendo Z uma variável com distribuição normal reduzida. P (89 ≤ X ≤ 107) c.66) h. Maior que 100 e. P(0.08) g. P(-0.44) b.66) h.72 < Z < 1.08) g. P (100 ≤ X ≤ 106) b.89) e. P (X ≥ 108) e. P(0 < Z < 1. Até qual nota apresenta 83. P (Z > 1.37) e.0.1. P(. P(Z > .34) b.2. Determine a probabilidade de um indivíduo submetido a esse teste e escolhido ao acaso ter nota: a.4) f.85) c.40% de probabilidade de acontecer 133 .05) d. Calcular a.85 < Z < 0) c.0. Maior que 80 c. P (Z > 0. Entre 85 e 115 d. P (X ≤ 90) 4 – Um teste padronizado de escolaridade tem distribuição normal com média aritmética de 100 e desvio padrão de 10.1. P (Z < .03) f.37 < Z < 3.60) 2 – Use a tabela Z para encontrar as seguintes probabilidades: a.25). P (-0.24) d. P (Z < . Maior que 120 b.

5 – No exercício anterior. sendo que a duração tem aproximadamente distribuição Normal. tal que: a. Determine o número de estudantes que pesam: a. com media 1. no qual 15036 alunos estejam abaixo dela? 7 – Os pesos de 600 estudantes são normalmente distribuídos com média aritmética de 65. determinar Xα.52 m? b) Qual o intervalo simétrico em torno da media. Sabendo que a duração é normalmente distribuída.16). O fabricante oferece uma garantia de 312 dias. Menos de 750 dias 9 – Sendo X: N (50.000 baterias.2 kg c.3 kg e desvio padrão de 5.5 kg.64 m e desvio padrão 0. P (X ≥ Xα) = 0.05 b. Quantas baterias ele deverá trocar mensalmente pelo uso da garantia? 134 . que conterá 78% das alturas dos alunos? c) Qual a altura esperada.16 m. Pede-se: a) Qual o número esperado de alunos com altura superior a 1. qual a nota que apresenta 93. troca as baterias que apresentarem falhas nesse período.000 dias b. P (X ≤ Xα) = 0. isto é. Entre 60 e 70 kg b.70% de probabilidade de um aluno tirar acima dela? 6 – As alturas de 20000 alunos de um colégio têm distribuição aproximadamente normal. Menos que 68 kg 8 – A duração de um componente eletrônico tem média de 850 dias e desvio padrão de 40 dias. Entre 700 e 1. Mais de 800 dias c. Mais que 63. por experiência passada. que as baterias de sua fabricação têm vida média de 600 dias e desvio padrão de 100 dias. A fábrica produz mensalmente 10. calcule a probabilidade de um componente escolhido ao acaso durar: a.99 10 – Um fabricante de baterias sabe.

Menos de R$ 6. escolhido ao acaso.00? b. De mais de 50? 13 – Os salários dos diretores das empresas de São Paulo distribuem-se normalmente com média de R$ 8.00 e R$ 9.000. tenha um motor que dure: a. Entre 140. qual deve ser esta garantia para que a porcentagem de motores substituídos seja inferior a 0. dos fabricados por essa firma.00.000 km e desvio padrão de 5. uma seja rejeitada? b. Entre 1. Menos de 170.90 m? 135 .000 km? b.72 m e desvio padrão de 5 cm. Nas condições do item a. Encontre a porcentagem de pessoas que se espera possuir uma pontuação de QI: a. Se a fábrica substitui o motor que apresenta duração inferior à garantia.57 e 1. qual a probabilidade de que em 20 latas observadas. Entre R$ 8.00? 14 – A quantidade de óleo contida em cada lata fabricada por uma indústria tem peso distribuído normalmente. Qual a percentagem de diretores que recebem: a. Acima de 1.380. Uma lata é rejeitada no comércio se tiver peso menor que 976 g. Qual a porcentagem dos alunos com altura: a. De menos de 70? b. isto é.000 km? c. Observou-se que ela se distribui normalmente com média de 1. 3 sejam rejeitadas? 15 – Foi feito um estudo sobre a altura dos alunos da IFCE.225).11 – Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média de 150.000 e 165. Entre 80 e 120? c. Qual a probabilidade de que um carro.2%? 12 – As pontuações de QI seguem uma distribuição normal com uma pontuação média de 100 e desvio padrão de 15. Qual a probabilidade de que em 10 latas observadas.00 e desvio padrão de R$ 500. a. com média de 990 g e desvio padrão igual a 10 g.87 m? b.920.470.000 km. X ~ N (100.

Sofreram aumentos superiores a 75%? b. Menos de 500 horas? b. de produtos industrializados.5 minutos? (c) E entre 7 e 10 minutos? (d) 75% das chamadas telefônicas requerem pelo menos quanto tempo de atendimento? 20 . Admita que o volume siga uma distribuição normal. Entre 3600 e 4250 cartas? b.16 – Um estudo das modificações dos preços. 4 tenham volume de líquido superior a 1002 cm3? 136 . Menos de 3400 cartas? 18 – Numa fábrica foram instaladas 1000 lâmpadas novas. Determinar a quantidade de lâmpadas que durarão: a. a) Qual é a porcentagem de garrafas em que o volume de líquido é menor que 990 cm3? b) Qual é a porcentagem de garrafas em que o volume de líquido não se desvia da média em mais do que dois desvios padrões? c) Se 10 garrafas são selecionadas ao acaso. Mais de 700 horas? c. Entre 516 e 684 horas? 19 – Suponha que o tempo necessário para atendimento de clientes em uma central de atendimento telefônico siga uma distribuição normal de média de 8 minutos e desvio padrão de 2 minutos. mostrou que há distribuição normal com média de 50% e desvio padrão de 10%. Sofreram aumentos entre 30% e 80%? 17 – O volume de correspondência recebido por uma firma quinzenalmente tem distribuição normal com média de 4000 cartas e desvio padrão de 200 cartas. Qual a porcentagem dos artigos que: a. Mais de 4636 cartas? c. com distribuição normal. Qual a percentagem de quinzenas em que a firma recebe: a.Uma enchedora automática de refrigerantes está regulada para que o volume médio de líquido em cada garrafa seja de 1000 cm3 e desvio padrão de 10 cm3. (a) Qual é a probabilidade de que um atendimento dure menos de 5 minutos? (b) E mais do que 9. qual é a probabilidade de que. no máximo. no atacado. Sabe-se que a duração média das lâmpadas é de 800 horas e desvio padrão de 100 horas.

21 – Suponha que as notas em certa disciplina estão normalmente distribuídas com média 5. Quantas máquinas ele espera trocar mensalmente pelo uso da garantia dada? 23 – Um fabricante de produtos alimentícios vende um de seus produtos em latas de 900 g de conteúdo líquido. com distribuição normal e desvio padrão de 10 g. determine o percentual de estudantes reprovados. O IPM (Instituto de Pesos e Medidas) exige que no máximo 5% das latas contenham menos do que o peso líquido nominal. Para passar no teste. c) explique por que a probabilidade de um estudante dessa população obter nota acima de 9. Suponha que o tempo para completar o teste seja distribuído normalmente com média de 80 minutos e desvio padrão de 30 minutos. O IPM examina. quão rápido deve ser o candidato para que obtenha essa posição? 137 . por longa experiência. então. b) se a nota mínima para obter aprovação e 3. Produz mensalmente 2000 máquinas.0 e desvio padrão 1. as latas são remetidas ao comércio.0.8 é praticamente zero. poderá satisfazer esta exigência do IPM? b) Qual deverá ser a regulagem da máquina para que a exigência do IPM seja satisfeita? c) Feita esta nova regulagem (item b). uma amostra de 20 latas em um supermercado. O fabricante oferece uma garantia de 1 ano (365 dias) para o produto. Qual a probabilidade de encontrar pelo menos três com o peso inferior ao especificado na embalagem? 24 – Um teste de aptidão feito por pilotos de elite em treinamento inicial requer que uma série de operações seja realizada em uma rápida sucessão.0.5: a) determine o percentual de estudantes com nota superior a 8. Responda: a) Se a máquina for regulada para 910 g. Para embalar o produto. Pede-se: a) Se 200 candidatos fazem o teste. que a duração tem duração de suas máquinas tem distribuição normal com média de 1000 dias e desvio padrão de 200 dias. 22 – Um fabricante de máquinas de lavar sabe. adquiriu uma máquina que permite obter o peso desejado. o candidato deve completá-lo em menos de 70 minutos. quantos são esperados passar no teste? b) Se os 5% melhores candidatos serão alocados para aeronaves maiores.

Um matadouro comprará 5000 porcos e pretende classificá-los de acordo com o peso. o professor verificou que o tempo dedicado aos estudos de revisão dos seus alunos seguia uma distribuição aproximadamente normal. com média de 60 kg e desvio padrão de 8 kg.25 – A distribuição dos pesos de porcos numa suinocultura pode muito bem ser representada por uma distribuição normal.3 7. de media 12 horas e desvio padrão de 1. os 22% seguintes como grandes e os 10% mais pesados como extras.2 em matemática e superior a 9. Sabendo que as notas seguem uma distribuição normal. com media e variância apresentados na tabela seguinte.5% dos alunos? b) Determinar a faixa em torno do valor médio que contenha 90% dos valores do tempo dedicados aos estudos. Quais os limites de peso para cada classificação? 26 – Um pesquisador verificou que em uma cidade do interior de São Paulo o peso dos homens tem distribuição aproximadamente normal com média de 85 kg e desvio padrão de 20 kg. os 50% seguintes como médios.1 3. sendo ela sorteada de um grupo em que o número de mulheres é o triplo do de homens? 27 – Antes de uma importante prova de Estatística. Pede- se: (a) sorteando-se um homem.5 hora.72 kg e desvio padrão de 32. calcule quantos alunos de um grupo de 950 devem ser aprovados neste processo seletivo. qual a probabilidade de ela ter peso acima de 65 kg? (c) qual é a probabilidade de uma pessoa ter peso acima de 65 kg. qual a probabilidade de ele ter peso acima de 75 kg? (b) sorteando-se uma mulher. do seguinte modo: 18% dos mais leves como pequenos. PROVA MEDIA VARIANCIA PORTUGUES 7.29 MATEMÁTICA 6. enquanto o das mulheres também apresenta-se normalmente distribuído. Pede-se: a) Determinar o tempo de estudo que é superado por 98.5 em português. 28 – Para ser aprovado em um exame de seletivo um candidato deve obter nota superior a 8.24 138 .46 kg. com média de 128.

consideramos observações de duas ou mais variáveis. então. o perímetro e o lado de um quadrado estão relacionados. 139 . Assim. é necessário o conhecimento de novas medidas. Porém. em media.X – CORRELAÇÃO E REGRESSÃO 1 . aprendemos a calcular medidas de tendência central e variabilidade. Uma vez caracterizada a relação. Para isso. onde 2p é o perímetro e l é o lado do quadrado. é possível determinar exatamente o valor de 2p. Nesse caso. nossa preocupação era descrever a distribuição de valores de uma variável. Sendo a relação entre as variáveis de natureza quantitativa. uso do cigarro e incidência de câncer. agora. A relação que os liga é perfeitamente definida e pode ser expressa por meio de uma sentença matemática: 2p = 4l. ela é bem menos precisa. porém. Consideremos. 2 – Correlação 2. É evidente que essa relação não é do mesmo tipo da anterior. Com esse objetivo. quanto maior a estatura.Introdução Nos capítulos anteriores. a correlação é o instrumento adequado para descobrir e medir essa relação. procuramos descrevê-la através de uma função matemática. Atribuindo-se. a relação que existe entre o peso e a estatura de um grupo de pessoas. pode acontecer que a estaturas diferentes correspondam pesos iguais ou que a estaturas iguais correspondam pesos diferentes. quando consideramos variáveis como peso e altura de um grupo de pessoas. vocabulário e compreensão da leitura. as medidas estudadas não são suficientes. dominância e submissão.1 – Relação funcional e relação estatística Como sabemos. maior o peso. Quando. Assim. A regressão é o instrumento adequado para a determinação dos parâmetros dessa função. surge um novo problema: as relações que podem existir entre as variáveis estudadas. um valor qualquer a l. procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação.

obtemos uma nuvem de pontos que denominamos diagrama de dispersão.0 2.0 7. da correlação existente: 140 .As relações do tipo perímetro-lado são conhecidas como relações funcionais e as do tipo peso-estatura.0 6. dizemos que existe correlação entre elas.0 9.0 8.2 – Diagrama de dispersão Consideremos uma amostra aleatória.0 24 7.0 8.0 10. os pares ordenados (xi. em um sistema coordenado cartesiano ortogonal.0 Representando.Notas de Matemática e Estatística da Faculdade A Notas Nºs Matemática (xi) Estatística (yi) 01 5.0 6.0 44 6.0 08 8.0 92 2. formada por dez dos 98 alunos de uma classe da faculdade A e pelas notas obtidas por eles em Matemática e Estatística: Tabela 1.yi).0 59 9.0 38 10. 2.0 4.0 58 7. Quando duas variáveis estão ligadas por uma relação estatística.0 5. como relações estatísticas. porém útil.0 80 8.0 72 3. Esse diagrama nos fornece uma ideia grosseira.

as relações funcionais são chamadas relações perfeitas. Podemos imaginar que. por isso. Assim. então. não oferecendo uma “imagem” definida. denominada correlação linear. vistos em conjunto. que a correlação de forma elíptica tem como “imagem” uma reta. Como a correlação em estudo tem como “imagem” uma reta ascendente. ela é chamada correlação linear positiva. 141 . quanto mais fina for a elipse.3 – Correlação linear Os pontos obtidos. formam uma elipse em diagonal.  Não-linear se os pontos têm como “imagem” uma curva. Por esse motivo. É possível verificar que a cada correlação está associada como “imagem” uma relação funcional. Dizemos. mais ela se aproximará de uma reta. Se os pontos apresentam-se dispersos. concluímos que não há relação alguma entre as variáveis em estudo. sendo.  Linear negativa se os pontos do diagrama têm como “imagem” uma reta descendente.2. uma correlação é:  Linear positiva se os pontos do diagrama têm como “imagem” uma reta ascendente.

o valor de r pertence ao intervalo [-1. 142 . Faremos uso do coeficiente de correlação de Pearson.+1].4 – Coeficiente de correlação linear O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Os valores limites do coeficiente r são -1 e +1. ainda. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e. isto é.Temos. que é dado por: onde n é o número de observações. então: 2. o sentido dessa correlação (positivo ou negativo).

 Se a correlação é perfeita e negativa.Assim:  Se a correlação entre duas variáveis é perfeita e positiva. Se 0 < | r | < 0. temos a tabela a seguir: 143 .6. O modo mais prático para obtermos r é abrir. provavelmente trata-se de correlação curvilínea. há uma correlação perfeita e positiva entre as variáveis. há uma correlação perfeita e negativa entre as variáveis. então. então r = 0. Logicamente:  Se r = +1. ou não há correlação entre as variáveis. na tabela.  Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas.  Se r = 0. calcular o coeficiente de correlação relativo à Tabela 1. Uma maneira prática de verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se a elipse apresenta saliências ou reentrâncias muito acentuadas. Vamos.  Se r = -1. praticamente. NOTAS:  Para que uma relação possa ser descrita por meio do coeficiente de correlação de Pearson é imprescindível que ela se aproxime de uma função linear.6 ≤ | r | ≤ 1 (forte correlação entre as variáveis). então r = -1. Se 0. ou a relação que porventura exista não é linear. nada podemos concluir sobre a relação entre as variáveis em estudo. xi2 e yi2. colunas correspondentes aos valores de xiyi. então r = +1.  Se não há correlação entre as variáveis. a correlação é muita fraca e.3. é necessário que: 0. Assim. há uma correlação relativamente fraca entre as variáveis.3 ≤ | r | < 0.

0 12 9 16 8.0 100 100 100 6.0 56 49 64 10.0 4 4 4 Σ = 65 Σ = 65 Σ = 473 Σ = 481 Σ = 475 Logo: Daí: r = 0. 144 .0 30 25 36 8.0 49 49 49 9.0 72 81 64 3.0 6.0 8. Resultado que indica uma correlação linear positiva altamente significativa entre as duas variáveis.0 7.0 2.0 5.0 30 36 25 7.0 4.0 6.0 72 64 81 7.0 48 64 36 2. xi2 e yi2 (n = 10) Matemática Estatística xiyi x i2 y i2 (xi) (yi) 5.0 9.0 8.91. Tabela 2 – Cálculo dos valores de xiyi.0 10.

Resolva: 1. Complete o esquema de cálculo do coeficiente de correlação para os valores das variáveis xi e yi: 145 .

a relação entre as duas variáveis. fazemos uma análise de regressão.1 – Ajustamento da reta Sempre que desejamos estudar determinada variável em função de outra. por exemplo. temos: Tabela 3 – Valores das variáveis xi e yi. vamos obter uma função definida por: Y = aX + b onde a e b são os parâmetros. Podemos dizer que a análise de regressão tem por objetivo descrever.3 – Regressão 3. supondo X a variável independente e Y a dependente. Assim. Sejam duas variáveis X e Y. entre as quais exista uma correlação acentuada. partindo de n observações das mesmas. xi 5 8 7 10 6 7 9 3 8 2 yi 6 9 8 10 5 7 8 4 6 2 cujo diagrama de dispersão é dado por: 146 . A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. através de um modelo matemático. como. Daí. as que formam a tabela 2. ou seja. vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis. embora não perfeita.

na realidade. o resultado. escrevemos: 147 . que se trata de uma correlação retilínea. pela forma do diagrama. Sendo assim. NOTA:  Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros. é uma estimativa da verdadeira equação de regressão. de modo a permitir o ajustamento de uma reta. calcular os valores dos parâmetros a e b com a ajuda das fórmulas: onde.Podemos concluir. então. imagem da função definida por: Y = aX + b Vamos.

Formemos. (xi) (yi) xiyi x i2 5.0 30 25 8. então.0 72 81 3. assim: a = 10x473 – 65x65 = 4730 – 4225 = 505 = 0.0 7.0 49 49 9.0 30 36 7.0 10.0 8.8632 10x481 – (65)2 4810 – 4225 585 148 .0 4 4 Σ = 65 Σ = 65 Σ = 473 Σ = 481 Temos.0 9. a tabela de valores: Tabela 4 – Cálculo dos valores de xiyi e xi2 (n = 10).0 5.0 100 100 6.0 12 9 8.0 56 49 10.0 72 64 7.0 6.0 6.0 2.0 48 64 2.0 4.0 8.

Repetindo o procedimento. dizemos que foi feita uma interpolação. Entretanto.0. temos: Como a nota 4.0 na equação: O mesmo acontece com a nota 1. temos: 3. 149 . podemos estimar a nota correspondente em Estatística fazendo X = 4. e como a nota 1.10].2 – Interpolação e extrapolação Voltando à tabela 1. vemos que 4. dizemos que foi uma extrapolação.0 pertence ao intervalo [2.Assim. NOTA:  Uma norma fundamental no uso das equações de regressão é a de nunca extrapolar.0 não pertence ao intervalo [2.0 não figura entre as notas de Matemática. exceto quando considerações teóricas ou experimentais demonstrem a possibilidade de extrapolação.10].

Resolva: 1. Complete o esquema para o ajustamento de uma reta aos dados: xi 2 4 6 8 10 12 14 yi 30 25 22 18 15 11 10 150 .

c) Escreva. Com o peso real e a media dos pesos aparentes. X e Y. por exemplo: xi’ = xi . dados pelo grupo. as conclusões a que chegou sobre a relação entre as variáveis. Sugestão: para simplificar os cálculos.EXERCÍCIOS 1 – Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. se existe correlação retilínea. use para o tempo uma variável auxiliar. obtidos por um grupo de alunos da escola A: xi 11 14 19 19 22 28 30 31 34 37 yi 13 14 18 15 22 17 24 22 24 25 a) Verifique. c) A produção estimada para o ano de 1989. 151 .1984 b) A reta ajustada. b) Em caso afirmativo. 3 – A tabela abaixo apresenta a produção de uma indústria: ANOS 1980 1981 1982 1983 1984 1985 1986 1987 1988 QUANTIDADES (t) 34 36 36 38 41 42 43 44 46 Calcule: a) O coeficiente de correlação. pelo diagrama. em poucas linhas. 2 – Considere os resultados de dois testes. obteve-se a tabela: PESO REAL 18 30 42 62 73 97 120 PESO APARENTE 10 23 33 60 91 98 159 Calcule o índice de correlação. calcule o coeficiente de correlação.

4 – A tabela abaixo apresenta valores que mostram como o comprimento de
uma barra de aço varia conforme a temperatura:

TEMPERATURA (ºC) 10 15 20 25 30
COMPRIMENTO (mm) 1003 1005 1010 1011 1014

Determine:
a) O coeficiente de correlação;
b) A reta ajustada a essa correlação;
c) O valor estimado do comprimento da barra para a temperatura de 18ºC;
d) O valor estimado do comprimento da barra para a temperatura de 35ºC;

5 – A variação do valor da Unidade de Preços ao Consumidor - UPC,
relativamente a alguns meses de 2009, deu origem à tabela:

MESES mai jun jul ago Set out nov
VALORES (R$) 10,32 10,32 11,34 11,34 11,34 12,22 12,22
Calcule:
a) O grau de correlação de correlação;
b) Estabeleça a equação de regressão de Y sobre X;
c) Estime o valor da UPC para o mês de dezembro.
Sugestão: substitua os meses, respectivamente, por 1, 2, 3, ....., 7.

6 – A partir da tabela:

xi 1 2 3 4 5 6
yi 70 50 40 30 20 10
a) Calcule o coeficiente de correlação;
b) Determine a reta ajustada;
c) Estime o valor de Y para X = 0.

152

7 – Certa empresa, estudando a variação da demanda de seu produto em
relação à variação de preço de venda, obteve a tabela:

PREÇO (xi) 38 42 50 56 59 63 70 80 95 110
DEMANDA (yi) 350 325 297 270 256 246 238 223 215 208
a) Determine o coeficiente de correlação;
b) Estabeleça a equação da reta ajustada;
c) Estime o valor de Y para X = 60 e X = 120.

8 – Pretendendo-se estudar a relação entre as variáveis “consumo de energia
elétrica” (xi) e “volume de produção nas empresas industriais” (yi), fez-se uma
amostragem que inclui vinte empresas, computando-se os seguintes valores:

Σxi =11,34; Σyi = 20,72; Σ xi2 = 12,16; Σ yi2 =84,96; Σxiyi = 22,13

Determine:
a) O cálculo do coeficiente de correlação;
b) A equação de regressão de Y para X;
c) A equação de regressão de X para Y.

153

REFERENCIAS

Bruni, Adriano Leal. Estatística aplicada à gestão empresarial. 1.ed. São
Paulo: Editora Atlas, 2007.

Crespo, Antonio Arnot. Estatística fácil. 17.ed. São Paulo: Saraiva, 2002.

Hoffmann, Ronaldo; Ovalle, Vieira Sonia. Elementos de estatística. 4.ed.
São Paulo: Editora Atlas, 2003.

Morettin, Pedro A. Estatística básica. 5.ed. São Paulo: Saraiva, 2002.

Pinheiro, João Ismael D. Estatística básica: a arte de trabalhar com dados.
Rio de Janeiro: Elsevier, 2009.

Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonçalves; Valter; Murolo,
Afrânio Carlos. Estatística: Para os cursos de economia, Administração e
Ciências Contábeis - 1. 3.ed. São Paulo: Editora Atlas, 1999.

Toledo, Geraldo Luciano; Ovalle, Ivo Izidoro. Estatística básica. 2.ed. São
Paulo: Editora Atlas, 1985.

154

ANEXOS:  Tabela de Números Aleatórios. 155 .  Tabela de Distribuição Normal.

TABELA DE NÚMEROS ALEATÓRIOS C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C27 C28 C29 L1 4 1 6 1 6 1 0 2 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4 L2 3 0 7 2 6 3 9 5 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2 L3 2 2 5 3 7 5 0 1 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0 L4 1 9 8 4 7 7 8 6 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4 L5 0 3 4 5 8 9 0 2 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0 L6 0 8 9 6 8 1 7 2 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1 L7 8 3 3 7 9 0 6 3 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2 L8 8 8 0 8 9 2 3 6 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3 L9 5 4 1 9 0 0 2 0 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6 L10 6 7 2 0 0 3 1 1 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0 L11 4 4 0 5 1 9 1 9 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9 L12 3 5 1 4 3 3 0 3 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3 L13 2 6 9 3 5 8 2 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2 L14 0 1 2 2 7 4 0 7 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3 L15 9 0 8 1 9 8 3 8 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5 L16 7 2 2 0 2 5 0 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0 L17 8 9 3 9 4 7 4 1 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9 L18 6 3 0 8 6 6 0 1 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8 L19 5 8 1 7 8 7 5 9 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5 L20 3 4 0 6 0 1 9 8 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4 L21 8 7 2 1 1 3 5 2 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1 L22 1 4 9 1 3 2 8 6 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2 L23 2 7 3 2 5 4 6 5 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3 L24 4 3 8 2 7 3 7 8 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4 L25 5 0 3 3 9 5 7 0 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5 L26 2 5 7 3 0 4 2 2 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8 L27 1 1 4 4 2 6 3 2 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0 L28 0 2 7 4 3 6 4 3 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8 L29 9 1 5 5 6 8 5 6 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1 156 .

157 .