Você está na página 1de 128

ESTATSTICA

Professor: Narcelio de Arajo Pereira narcelio@stellamaris.edu.br

2013

SUMRIO
INTRODUO ............................................................................................ 03 UNIDADE 1: A NATUREZA DA ESTATSTICA ................................... 05 UNIDADE 2: GENERALIDADES E CONCEITOS BSICOS .............. 10 UNIDADE 3: SRIES ESTATSTICAS.................................................... 15 UNIDADE 4: GRFICOS ........................................................................... 24 UNIDADE 5: DISTRIBUIO DE FREQUENCIA ................................ 34 UNIDADE 6: MEDIDAS DE POSIO ................................................... 48 UNIDADE 7: MEDIDAS DE DISPERSO OU VARIABILIDADE ....... 71 UNIDADE 8: PROBABILIDADE .............................................................. 81 UNIDADE 9: DISTRIBUIO BINOMIAL E NORMAL ..................... 91 REFERENCIAS ......................................................................................... 106 ANEXOS ..................................................................................................... 107 EXERCCIOS DE FIXAO .................................................................. 110

INTRODUO Na antiguidade os povos j registravam o nmero de habitantes, nascimentos, bitos. Faziam "estatsticas". Na idade mdia as informaes eram tabuladas com finalidades tributrias e blicas. No sculo XVI surgem as primeiras anlises sistemticas, as primeiras tabelas e os nmeros relativos. No sculo XVIII a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as primeiras representaes grficas e os clculos de probabilidades. A estatstica deixa de ser uma simples tabulao de dados numricos para se tornar "O estudo de como se chegar a concluso sobre uma populao, partindo da observao de partes dessa populao (amostra)". Ao longo do sculo XX, os mtodos estatsticos foram desenvolvidos como uma mistura de cincia, tecnologia e lgica para a soluo e investigao de problemas em vrias reas do conhecimento humano (Stigler, 1986). Ela foi reconhecida como um campo da cincia neste perodo, mas sua histria tem incio bem anterior a 1900. A estatstica moderna uma tecnologia quantitativa para a cincia experimental e observacional que permite avaliar e estudar as incertezas e os seus efeitos no planejamento e interpretao de experincias e de observaes de fenmenos da natureza e da sociedade. A estatstica no uma caixa-preta, nem bola de cristal, nem mgica. Tampouco um conjunto de tcnicas teis para algumas reas isoladas ou restritas da cincia. Por exemplo, ao contrrio do que alguns imaginam, a estatstica no um ramo da matemtica onde se investigam os processos de obteno, organizao e anlise de dados sobre uma determinada populao. A estatstica tambm no se limita a um conjunto de elementos numricos relativos a um fato social, nem a nmeros, tabelas e grficos usados para o resumo, organizao e apresentao dos dados de uma pesquisa, embora este seja um aspecto da estatstica que pode ser facilmente percebido no cotidiano (basta abrir os jornais e revistas para ver o "bombardeio" de estatsticas). Ela uma cincia multidisciplinar: um mesmo programa de computador que permite a anlise estatstica de dados de um fsico poderia tambm ser usado por um economista, agrnomo, qumico, gelogo, matemtico, bilogo, socilogo, psiclogo e cientista poltico. Mesmo que as interpretaes dessas anlises sejam diferentes por causa das diferenas entre as reas do
3

conhecimento, os conceitos empregados, as limitaes das tcnicas e as consequncias dessas interpretaes so essencialmente as mesmas. Segundo Rao (1999), a estatstica uma cincia que estuda e pesquisa sobre: o levantamento de dados com a mxima quantidade de informao possvel para um dado custo; o processamento de dados para a quantificao da quantidade de incerteza existente na resposta para um determinado problema; a tomada de decises sob condies de incerteza, sob o menor risco possvel. Finalmente, a estatstica tem sido utilizada na pesquisa cientfica, para a otimizao de recursos econmicos, para o aumento da qualidade e produtividade, na otimizao em anlise de decises, em questes judiciais, previses e em muitas outras reas.

I - A NATUREZA DA ESTATSTICA MTODO ESTATSTICO O Mtodo Cientfico Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e, outros, por necessidades prticas, sem aplicao de um mtodo. Atualmente, quase todo acrscimo de conhecimento resulta da observao e do estudo. Se bem que muito desse conhecimento possa ter sido observado inicialmente por acaso, a verdade que desenvolvemos processos cientficos para seu estudo e para adquirirmos tais conhecimentos. Podemos ento dizer que: Mtodo: um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja, ou seja, um meio mais eficaz para atingir determinada meta. Dos mtodos cientficos, vamos destacar o Mtodo experimental e o Mtodo estatstico. O Mtodo Experimental - o mtodo preferido pela fsica, Qumica, etc. Mtodo experimental: consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. O Mtodo Estatstico Muitas vezes temos necessidade de descobrir fatos em um campo em que o mtodo experimental no se aplica (nas cincias sociais), j que os vrios fatores que afetam o fenmeno em estudo no podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos preciso, denominado mtodo estatstico. Mtodo estatstico: diante da impossibilidade de manter as causas constantes, admitem todas essas causas presentes variando-as, registrando essas variaes e procurando determinar, no resultado final, que influncias cabem a cada uma delas.
5

A ESTATSTICA Exprimindo por meio de nmeros as observaes que se fazem de elementos com, pelo menos, uma caracterstica comum (por exemplo: os alunos do sexo masculino de uma comunidade), obtemos os chamados dados referentes a esses elementos. Podemos dizer, ento, que: A Estatstica uma parte da matemtica aplicada que fornece mtodos para a coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A Estatstica Descritiva se encarrega de fazer a coleta, organizao e descrio dos dados. A Estatstica Indutiva ou Inferencial se encarrega de fazer a anlise e interpretao dos dados. O aspecto essencial da Estatstica o de proporcionar mtodos infernciais, que permitam concluses que transcendam os dados obtidos inicialmente. Fases do Mtodo estatstico: Podemos distinguir no mtodo estatstico as seguintes fases: 1 Definio do Problema Saber exatamente aquilo que se pretende pesquisar o mesmo que definir corretamente o problema. 2 Planejamento Como levantar informaes? Que dados devero ser obtidos? Qual levantamento a ser utilizado? Censitrio? Por amostragem? E o cronograma de atividades? Os custos envolvidos? etc.

3 Coleta de Dados Aps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos incio coleta dos dados numricos necessrios sua descrio. Fase operacional. o registro sistemtico de dados, com um objetivo determinado. A coleta de dados pode ser direta ou indireta. 3.1 Direta: Quando ela feita sobre elementos informativos de registro obrigatrio (nascimentos, casamentos, bitos, importao, exportao, etc.), elementos pertinentes aos pronturios dos alunos de uma escola ou, ainda, quando os dados so coletados pelo prprio pesquisador atravs de inquritos e questionrios, como o caso das notas de verificao e de exames, do censo demogrfico, etc. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: Contnua (registro): quando feita continuamente, tal como a de nascimentos, bitos e a frequncia dos alunos s aulas; Peridica: quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliaes peridicas; recenseamento demogrfico, censo industrial; Ocasional: quando feita esporadicamente, a fim de atender a uma conjuntura ou a uma emergncia, como no caso de epidemias. 3.2 Indireta: Quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento de outros fenmenos relacionados com o fenmeno estudado. Ex.: pesquisa sobre mortalidade infantil, que feita atravs de dados colhidos por uma coleta direta.

4 Crtica dos Dados Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis falhas e imperfeies, a fim de no incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados. A crtica dos dados se divide em: externa e interna Crtica externa quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe foram feitas. Crtica interna quando visa observar os elementos originais dos dados da coleta. 5 Apurao dos Dados Nada mais do que a soma e o processamento dos dados obtidos e a disposio mediante critrios de classificao. Resumo dos dados atravs de sua contagem e agrupamento. a condensao e tabulao de dados. Pode ser manual, eletromecnica ou eletrnica. 6 Exposio ou Apresentao dos Dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma de tabelas (unidade 3) e grficos (unidade 4), pois tornam mais fcil o exame daquilo que est sendo objeto de tratamento estatstico e ulterior obteno de medidas de posio (unidade 6) e medidas de disperso (unidade 7). 7 Anlise dos Dados Como j dissemos, o objetivo ltimo da estatstica tirar concluses sobre o todo (populao) a partir de informaes fornecidas por parte representativa do todo (amostra). Assim, realizadas as etapas anteriores (estatstica descritiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Indutiva ou Inferencial, que tem por base a induo ou inferncia, e tiramos desses resultados concluses e previses.

A ESTATSTICA NAS EMPRESAS No mundo atual, a empresa uma das vigas-mestras da economia dos povos. A direo de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decises, e o conhecimento e o uso da estatstica facilitaro seu trplice trabalho de organizar, dirigir e controlar a empresa. Por meio de sondagem, de coleta de dados e de recenseamento de opinies, podemos conhecer a realidade geogrfica e social, os recursos naturais, humanos e financeiros disponveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcanados a curto, mdio ou longo prazo. A estatstica ajudar em tal trabalho, como tambm na seleo e organizao da estratgia a ser adotada no empreendimento e, ainda, na escolha das tcnicas de verificao e avaliao da quantidade e da qualidade do produto e mesmo dos possveis lucros e/ou perdas. Tudo isso que se pensou, se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para controle eficiente do trabalho. O esquema do planejamento o plano, que pode ser resumido, com auxlio da estatstica, em tabelas e grficos, que facilitaro a compreenso visual dos clculos matemtico-estatsticos que lhes deram origens.

II - GENERALIDADES E CONCEITOS BSICOS 1 VARIVEL A cada fenmeno corresponde um nmero de resultados possveis. Assim, por exemplo: - para um fenmeno sexo so dois os resultados possveis: masculino e feminino; - para o fenmeno nmero de filhos h um nmero de resultados possveis expressos atravs dos nmeros naturais: 0,1,2,3,....,n; - para o fenmeno estatura temos uma situao diferente, pois os resultados podem tomar um nmero infinito de valores numricos dentro de um determinado intervalo. Varivel: , convencionalmente, o conjunto de resultados possveis de um fenmeno. Uma varivel pode ser: qualitativa ou quantitativa Qualitativa: quando seus valores so expressos por atributos; ex: sexo, cor da pele, etc; Quantitativa: quando seus valores so expressos em nmeros; ex: salrios, idade, altura, etc. Divide-se em discreta e contnua: Discreta ou descontnua: seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente de contagens. Ex.: nmeros de alunos presentes s aulas: ontem = 20, hoje = 23; N de alunos presentes s aulas de introduo estatstica no 1 semestre de 1997: mar = 18, abr = 30, mai = 35, jun = 36. Contnua: resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R dos nmeros reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites.

10

Exerccio resolvido: Classifique as variveis em qualitativas e quantitativas (contnuas ou discretas): a) Cor dos olhos Qualitativa b) ndice de liquidez nas indstrias Cearenses Quantitativa contnua c) Produo de caf no Brasil Quantitativa contnua d) Nmero de defeitos em aparelhos de TV Quantitativa discreta e) Comprimento dos pregos produzidos por uma empresa Quantitativa contnua f) O ponto obtido em cada jogada de um dado quantitativa discreta 2 POPULAO E AMOSTRA Dois conceitos devem estar bem claros: o de populao e o de amostra, pois deles que so extrados os dados que do origem s diversas relaes estatsticas, como a mdia, o desvio-padro, etc., e que, em ltima anlise, possibilitam descreve-las sob os mais diversos aspectos. Populao: coleo completa de todos os elementos que so objeto de um estudo; conjunto de entes portadores de, pelo menos, uma caracterstica comum. A populao estatstica tambm conhecida como universo estatstico. Exemplo: pessoas que possuem automvel. Amostras: so subconjuntos finitos representativos de uma dada populao. Exemplo: pessoas que possuem automvel da marca Fiat. Censo: exame de todos os elementos da populao. A amostra deve ser representativa da populao da qual foi extrada, ser parecida com ela (quantitativa e quantitativamente), devendo obedecer a dois princpios bsicos: Deve ser suficientemente grande; Seus constituintes devem ter sido selecionados ao acaso. Nem sempre possvel estudar exaustivamente todos os elementos da populao!

11

- Pode a populao ter dimenso infinita Exemplo: Populao constituda pelas presses atmosfricas, nos diferentes pontos de uma cidade. - Pode o estudo da populao levar destruio da mesma Exemplo: Populao dos fsforos de uma caixa. - Pode o estudo da populao ser muito dispendioso Exemplo: Sondagens exaustivas de todos os eleitores, sobre determinado candidato. Quando no possvel estudar, exaustivamente, todos os elementos da populao, estudam-se s alguns elementos, a que damos o nome de Amostra. importante a fase de escolha da amostra? Sim, pois a amostra deve ser to representativa quanto possvel da Populao que se pretende estudar, uma vez que vai ser a partir do estudo da amostra, que vamos tirar concluses para a Populao. Quando a amostra no representa corretamente a populao diz-se destorcida e a sua utilizao pode dar origem a interpretaes erradas, como nos seguintes exemplos: - Utilizar uma amostra constituda por 10 flamenguistas, para prever o vencedor do prximo Flamengo X Vasco. - Utilizar uma amostra constituda pelos leitores habituais de determinada revista especializada, para tirar concluses sobre a populao geral. 3 AMOSTRAGEM Conceito: uma tcnica especial para recolher amostras que garante, tanto quanto possvel, o acaso na escolha. Dessa forma, cada elemento da populao passa a ter a mesma chance de ser escolhido, o que garante amostra o carter de representatividade, e isto muito importante, pois, como vimos, nossas concluses relativas populao vo estar baseadas nos resultados obtidos nas amostras dessa populao.

12

Daremos, a seguir, trs das principais tcnicas de amostragem. 3.1 Amostragem casual ou aleatria simples Esta tcnica de amostragem equivalente a um sorteio lotrico: Na prtica esta amostragem pode ser realizada da seguinte maneira: Enumera-se a populao de 1 a n; Sorteia-se K nmeros dessa sequncia, que representaro a amostra. Exemplo: Vamos obter uma amostra de 10% para a uma pesquisa de peso de uma populao de 80 (oitenta) alunos de uma escola: Numeramos os alunos de 01 a 80 (populao); Colocamos os oitenta nmeros, em pedaos iguais de um mesmo papel, dentro de uma caixa. Agitamos e realizamos o sorteio de 8 alunos, que representa uma amostra de 10% desta populao. Quando o nmero de elementos da amostra grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilit-lo, foi elaborada uma tabela Tabela de Nmeros Aleatrios -, construda de modo que os dez algarismos (de 0 a 9) so distribudos ao acaso nas linhas e colunas (ver anexo). 3.2 Amostragem proporcional estratificada Muitas vezes a populao se divide em subpopulaes estratos Como provvel, que a varivel em estudo apresente, de estrato em estrato, um comportamento heterogneo e, dentro de cada estrato, um comportamento homogneo, convm que o sorteio dos elementos da amostra leve em considerao tais estratos. exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, alm de considerar a existncia de estratos, obtm elementos da amostra proporcional ao nmero de elementos desses estratos. Exemplo: Vamos obter uma amostra proporcional estratificada, de 10 % do exemplo anterior, supondo que dos 80 alunos, temos 44 meninos e 36 meninas.
13

So, portanto dois estratos, (sexo masculino e sexo feminino). Temos: SEXO MASCULINO FEMININO TOTAL POPULAO 44 36 80 10 % 10 x 44 = 4,4 100 10 x 36 = 3,6 100 10 x 80 = 8 100 AMOSTRA 4 4 8

3.3 Amostragem sistemtica Quando os elementos da populao j se acham ordenados, no h necessidade de construir o sistema de referncia. So exemplos os pronturios mdicos de um hospital, os nmeros de uma rua, uma linha de produo, etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemtica. Assim, no caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produo diria. Neste caso, estaramos fixando o tamanho da amostra em 10% da populao. Exemplo: Supomos uma rua com 500 casas, das quais desejamos obter uma amostra formada por 20 casas para uma pesquisa de opinio. Neste caso, podemos usar o seguinte procedimento: Como 500/20 = 25, escolhemos por sorteio casual um nmero de 01 a 25; Este nmero indicar a primeira casa da amostra, vamos supor a casa de nmero 6; Os demais elementos da amostra seriam considerados de 25 em 25; Assim, as demais casas da amostra seriam as casas de nmeros 31 (6+25), 56 (31+25), 81 (56+25), etc.

14

III - SRIES ESTATSTICAS TABELAS Um dos objetivos da estatstica sintetizar os valores que uma ou mais variveis podem assumir, para que tenhamos uma viso global da variao dessa ou dessas variveis. Depois dos dados organizados, faz-se necessrio que essas informaes sejam apresentadas em formato de tabelas, pois iro nos fornecer rpidas e seguras informaes a respeito das variveis em estudo, permitindo-nos determinaes administrativas e pedaggicas mais coerentes e cientficas. TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemtica. Uma tabela compe-se de: corpo, cabealho, coluna indicadora, linhas, casa ou clula e ttulo. Deste modo, uma tabela deve apresentar o seguinte esquema de representao: 1. Corpo: conjunto de linhas e colunas que contm informaes sobre a varivel em estudo; 2. Cabealho: parte superior da tabela que especifica o contedo das colunas; 3. Coluna indicadora: parte da tabela que especifica o contedo das linhas; 4. Linhas: retas imaginrias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; 5. Casa ou clula: cruzamento de uma coluna com uma linha, destinado a um s nmero (nunca deve ficar em branco); 6. Ttulo: designao do fato observado, local e poca. H ainda que se considerar os elementos complementares, que so a fonte, as notas e as chamadas, colocadas, de preferncia, no seu rodap. Rodap: espao reservado, em seguida ao fecho da tabela, para insero de notas de natureza informativa;

15

Fonte: entidade responsvel pelo levantamento dos dados ou pela elaborao da tabela; Notas: so informaes de natureza geral, destinada a conceituar ou esclarecer o contedo das tabelas, ou indicar a metodologia adotada; Chamadas: informaes de natureza especfica sobre determinada parte da tabela, destinada a conceituar ou esclarecer dados.

De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar:

Um trao horizontal (-) quando o valor nulo; Trs pontos (...) quando no temos a informao; Zero (0) quando o valor muito pequeno para ser expresso pela unidade utilizada. Se os valores so expressos em numerais decimais, precisamos acrescentar parte decimal um nmero correspondente de zeros (0,0; 0,00; 0,000; .....); Um ponto de interrogao (?) quando temos dvida quanto exatido de determinado valor; A letra x quando o dado for omitido, a fim de evitar individualizao das informaes.

Obs.: Os lados direito e esquerdo de uma tabela oficial devem ser abertos.
16

Ex.: Levantamento Epidemiolgico no Estado do Rio de Janeiro 2010 Especificao Sarampo Varola Clera Meningite Total (1) N de Casos 115 ... 35 150 N de bitos 15 10 5 30

Fonte: Departamento Nacional de Endemias Rurais Nota: As atividades da campanha de vacinao abrangeram as reas de maior incidncia. (1) inclusive a rea urbana.

SRIES ESTATSTICAS: Denominamos sries estatsticas toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, do local ou da espcie. Dividem-se em sries homgradas e conjugadas. Sries Homgradas: so aquelas em que a varivel descrita apresenta variao discreta ou descontnua. Podem ser do tipo temporal, geogrfica ou especfica. a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O local e a espcie (fenmeno) so elementos fixos. Esta srie tambm chamada de histrica, cronolgica, marcha ou evolutiva. ABC VECULOS LTDA. Vendas no 1 bimestre de 2010 PERODO JAN FEV TOTAL UNIDADES VENDIDAS (mil) 20 10 30

17

b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao. ABC VECULOS LTDA. Vendas no 1 bimestre de 2010 FILIAIS SO PAULO RIO DE JANEIRO TOTAL UNIDADES VENDIDAS (mil) 13 17 30

c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada de srie categrica. ABC VECULOS LTDA. Vendas no 1 bimestre de 2010 MARCA FIAT GM TOTAL UNIDADES VENDIDAS (mil) 18 12 30

Sries conjugadas: Tambm chamadas de tabelas de dupla entrada. So apropriadas apresentao de duas ou mais sries de maneira conjugada, havendo duas ordens de classificao: uma horizontal e outra vertical. O exemplo abaixo de uma srie geogrfica-temporal. ABC VECULOS LTDA. Vendas no 1 bimestre de 2010 (em mil unidades) FILIAIS SO PAULO RIO DE JANEIRO TOTAL JANEIRO 10 12 22 FEVEREIRO 3 5 8
18

DADOS ABSOLUTOS E DADOS RELATIVOS Dados absolutos: so dados resultantes da coleta direta da fonte, sem outra manipulao seno a contagem ou medida. A leitura dos dados absolutos sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e fiel, no tm a virtude de ressaltar de imediato as suas concluses numricas. Da o uso imprescindvel que faz a Estatstica dos dados relativos. Dados relativos: so os resultados de comparaes por quocientes (razes) que se estabelecem entre dados absolutos e tm por finalidade realar ou facilitar as comparaes entre quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens, ndices, coeficientes e taxas. 1 Percentagens Considere a srie: MATRCULAS NAS ESCOLAS DA CIDADE A 2011 GRAU Fundamental Ensino mdio Superior TOTAL
Dados fictcios.

N. DE ALUNOS 19286 1681 234 21201

Calculemos as percentagens dos alunos da cada grau: Fundamental 19286 x 100 = 90,96 = 91,0 21201 Ensino mdio 1681 x 100 = 7,92 = 7,9 21201 Superior 234 x 100 = 1,10 = 1,1 21201

19

Com esses dados, podemos formar uma nova coluna na srie em estudo: MATRCULAS NAS ESCOLAS DA CIDADE A 2011 GRAU Fundamental Ensino mdio Superior TOTAL
Dados fictcios.

N. DE ALUNOS 19286 1681 234 21201

% 91,0 7,9 1,1 100

Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A, 91 esto no ensino fundamental, 8 aproximadamente esto no ensino mdio e 1 aproximadamente est matriculado no ensino superior. O emprego da porcentagem de grande valia quando nosso intuito destacar a participao da parte no todo. NOTAS: Do mesmo modo que tomamos 100 para base de comparao, tambm podemos tomar outro nmero qualquer, entre os quais destacamos o nmero 1. claro que, supondo o total igual a 1, os dados relativos das parcelas sero todos menores que 1. Em geral, quando usamos 100 para base, os dados so arredondados at a primeira casa decimal; e quando tomamos 1 por base, so arredondados at a terceira casa decimal. Exerccio: Complete a tabela abaixo DADOS RELATIVOS ESCOLAS A B C D E F TOTAL N. DE ALUNOS POR 1 175 222 202 362 280 540 1781 0,098 POR 100 9,8

1,000

100,0
20

2 ndices Os ndices so razes entre duas grandezas tais que uma no inclui a outra. So exemplos de ndices: ndice ceflico = dimetro transversal do crnio x 100 dimetro longitudinal do crnio

Quociente intelectual =

idade mental idade cronolgica

x 100

Densidade demogrfica = populao total Superfcie (rea) ndice econmicos : Produo per capta = valor total da produo populao Consumo per capta = consumo do bem populao Renda per capta = renda____ populao receita__ populao

Receita per capta =

21

3 Coeficientes Os coeficientes so razes entre o nmero de ocorrncias e o nmero total (nmero de ocorrncias e nmero de no-ocorrncias). So exemplos de coeficientes: Coeficiente de natalidade = nmero de nascimentos populao total Coeficiente de mortalidade = nmero de bitos__ populao total Coeficiente educacionais: Coeficiente de evaso escolar = n. de alunos evadidos__ n. inicial de matrculas

Coeficiente de aproveitamento escolar = n. de alunos aprovados n. final de matrculas Coeficiente de recuperao escolar = n. de alunos recuperados_ n. de alunos em recuperao 4 Taxas As taxas so os coeficientes multiplicados por uma potncia de 10 (10, 100, 1000 etc.) para tornar o resultado mais inteligvel. So exemplos de taxas: Taxa de natalidade = Coeficiente de natalidade X 1000 Taxa de mortalidade = Coeficiente de mortalidade X 1000 Taxa de evaso escolar = Coeficiente de evaso escolar X 100

22

Exerccios: 1 Considere a srie estatstica: SRIES 1 2 3 4 TOTAL ALUNOS MATRIC. 546 328 280 120 1274 %

Complete-a, determinando as percentagens com uma casa decimal e fazendo a compensao, se necessrio. 2 Uma escola apresentava, no final do ano, o seguinte quadro: MATRICULAS SRIES MARO 1 2 3 4 TOTAL a. Calcule a taxa de evaso por srie b. Calcule a taxa de evaso da escola 3 Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE): Populao: 15.957,6 mil habitantes; Superfcie: 586.624 Km2; Nascimentos: 292036; bitos: 99281. Calcule: a. o ndice da densidade demogrfica; b. a taxa de natalidade; c. a taxa de mortalidade. 480 458 436 420 1794 NOVEMBRO 475 456 430 420 1781

23

IV - GRFICOS ESTATSTICOS 1- Conceito: O grfico um mtodo de representao de dados estatsticos em forma visual, por meio de figuras geomtricas. Devem corresponder, mas nunca substituir as tabelas estatsticas. uma forma de apresentao dos dados estatsticos, cujo objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais rpida e viva do fenmeno em estudo, j que os grficos falam mais compreenso que as sries. Para tornarmos possvel uma representao grfica, estabelecemos uma correspondncia entre os termos da srie e determinada figura geomtrica, de tal modo que cada elemento da srie seja representado por uma figura proporcional. A representao grfica deve obedecer a certos requisitos fundamentais como: Simplicidade deve proporcionar que o observador analise rapidamente o fenmeno apresentado; Clareza deve proporcionar que o observador tenha uma correta leitura dos valores representativos do fenmeno; Veracidade deve expressar a verdade sobre o fenmeno estatstico representado. 2 - Caractersticas: Grficos de informao: So grficos destinados principalmente ao pblico em geral, objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos, dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que as informaes desejadas estejam presentes. Grficos de anlise: So grficos que se prestam melhor ao trabalho estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os grficos de anlise frequentemente vm

24

acompanhados de uma tabela estatstica. Inclui-se, muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais revelados pelo grfico. Uso indevido de Grficos: Podem trazer uma ideia falsa dos dados que esto sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construo de escalas. 3 - Classificao dos grficos: Os principais grficos so os Diagramas, Estereogramas, Pictogramas e Cartogramas. 3.1 - Diagramas: So grficos geomtricos dispostos, no mximo, em duas dimenses. So os mais usados na representao de sries estatsticas. Eles podem ser em linhas, em barras horizontais, em barras verticais (colunas), e em setores. Grficos em linhas ou lineares O grfico em linha constitui uma aplicao do processo de representao das funes num sistema de coordenadas cartesianas. Como sabemos, nesse sistema fazemos uso de duas retas perpendiculares; as retas so os eixos coordenados e o ponto de interseco, a origem. O eixo horizontal denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo das ordenadas (ou eixo dos y). Para exemplificar considere a srie:

25

Determinamos, graficamente, todos os pontos da srie, usando as coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o que ir nos dar uma poligonal, que o grfico em linha ou em curva correspondente a srie do exemplo.

So frequentemente usados para representao de sries cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um mesmo grfico. Quando representamos, em um mesmo sistema de coordenadas, a variao de dois fenmenos, a parte interna da figura formada pelos grficos desses fenmenos denominada de rea de excesso.

26

Grficos em colunas ou barras a representao de uma srie por meio de retngulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados. Quando em barras, os retngulos tm a mesma altura e os comprimentos so proporcionais aos respectivos dados. Exemplo: Grfico em colunas

27

Exemplo: Grfico em barras

NOTAS: Quando as legendas no so breves usa-se de preferncia os grficos em barras horizontais; A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica; A distncia entre as colunas (ou barras), por questes estticas, no dever ser menor que a metade nem maior que os dois teros da largura (ou da altura) dos retngulos.

28

Grficos em barras ou colunas mltiplas Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos.

Grficos em setores Este grfico construdo com base em um crculo, e empregado sempre que desejamos ressaltar a participao do dado no total. O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais que suas reas so respectivamente proporcionais aos dados da srie. Obtemos cada setor por meio de uma regra de trs simples e direta, lembrando que o total da srie corresponde a 360.

29

O grfico em setores s deve ser empregado quando h, no mximo, sete dados. Obs.: As sries temporais geralmente no so representadas por este tipo de grfico.

30

3.2 - Estereogramas: So grficos geomtricos dispostos em trs dimenses, pois representam volume. So usados nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso que oferecem. 3.3 - Pictogramas: So construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo abaixo:

31

3.4 - Cartogramas: So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas. Distinguimos duas aplicaes: a. representar os dados absolutos (populao) neste caso, lanamos mo, em geral, dos pontos, em nmero proporcional aos dados. b. representar dados relativos (densidade) - neste caso, lanamos mo, em geral, de hachuras ou cores.

32

33

V - DISTRIBUIO DE FREQUENCIA 1 Tabela Primitiva e Rol Considere os dados a seguir relativos a uma determinada varivel e obtidos de uma pesquisa com vinte e duas pessoas: 45, 41, 42, 41, 42, 55, 43, 54, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51. Esse tipo de tabela chamada de tabela primitiva, ou seja: Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram numericamente organizados. Assim, conhecidos os valores de uma varivel, difcil formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados no ordenados. Em razo disso, pouca informao se consegue obter inspecionando os dados anotados. Mesmo uma informao to simples como a de saber o valor mximo e mnimo requer certo exame dos dados da tabela. ROL: a tabela ou relao obtida aps a ordenao dos dados, em ordem crescente ou decrescente. Para o exemplo acima temos: Rol: 41, 41, 41, 42, 42, 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 54, 55, 57, 58, 58, 60, 60. Essa classificao dos dados proporciona algumas vantagens concretas com relao sua forma original: - possvel visualizar de forma ampla as variaes de consumo; - os valores extremos so percebidos de imediato; - possvel observar a tendncia de concentrao dos valores. Apesar de o rol propiciar ao analista mais informaes e com menor esforo de concentrao do que os dados brutos, ainda assim persiste o problema de a anlise ter que se basear nas 22 observaes. O problema se agravar quando o nmero de dados for muito grande.

34

2 Distribuio de Frequncia um tipo de tabela que condensa uma coleo de dados conforme as frequncias (repeties de seus valores). A forma pela qual podemos descrever os dados estatsticos resultantes de variveis quantitativas, como o caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de pessoas, salrios recebidos pelos operrios de uma fbrica, etc. Frequncia: a quantidade que fica relacionada a um determinado valor da varivel. Distribuio de frequncia sem intervalos de classe: a simples condensao dos dados conforme as repeties de seus valores. Veja exemplo abaixo:
VARIVEL FREQUENCIA

41 42 43 44 45 46 50 51 52 54 55 57 58 60
TOTAL

3 2 1 1 1 2 2 1 1 2 1 1 2 2 22

Para um ROL de tamanho razovel esta distribuio de frequncia inconveniente, j que exige muito espao.

Distribuio de frequncia com intervalos de classe: Quando o tamanho da amostra elevado mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.

35

Agrupando em 4 classes, temos:


CLASSES FREQUENCIAS

41 |---- 46 46 |---- 51 51 |---- 56 56 |---- 61 Total Agrupando em 5 classes, temos:


CLASSES

8 4 5 5 22

FREQUENCIAS

41 |---- 45 45 |---- 49 49 |---- 53 53 |---- 57 57 |---- 61 Total

7 3 4 3 5 22

Obs.: A definio do nmero de classes a ser adotado ser visto no item 5. Foram vistas as seguintes formas de apresentao dos dados: ROL (dados isolados); Agrupamento simples (sem classes); Agrupamentos em classes. Mas h ainda outra tcnica alternativa de apresentao e organizao de dados: o Diagrama de Ramos e Folhas. A obteno do diagrama rpida e fcil. No diagrama de ramos e folhas, cada dado separado em duas partes: Ramo: a parte da esquerda e Folhas: a parte da direita. Em seguida as folhas so colocadas em seus respectivos ramos. Veja exemplo: Vamos considerar o nmero de alunos presentes em 20 palestras. 68 51 82 93 75 70 43 32 59 63 80 61 69 76 60 87 73 65 54 71

36

Como todos os dados possuem dois algarismos, podemos dividir cada dado em algarismo da dezena e da unidade. Portanto, o algarismo da dezena ser o ramo e a unidade ser a folha. Vamos usar o dado 68 como exemplo:
6 ramo 8 folha

Colocamos todos os ramos distintos em uma coluna, ou seja, verticalmente um abaixo do outro, em ordem crescente, e traamos uma linha vertical, como representado abaixo nas etapas (a, b, c, d) da construo do diagrama de ramos e folhas. Em (a) colocamos apenas os ramos distintos; em (b) colocamos a primeira folha (8) do dado 68; em (c) colocamos a folha correspondente ao dado 82 e, finalmente em (d) apresentamos o resultado final do diagrama com todos os dados. 3 4 5 6 7 8 9 (a) 3 4 5 6 8 7 8 9 (b) 3 4 5 6 8 7 8 2 9 (c) 3 4 5 6 7 8 9 (d) 2 3 9 8 5 2 3

4 9 3 0

1 0 0 7

3 6

1 1

Observe que o nmero de folhas deve ser igual ao nmero de dados. 3 Elementos de uma Distribuio de Frequncia com Intervalos de Classe: Os valores exemplificados a seguir so referentes a Distribuio de frequncias com 5 classes da pgina anterior. 3.1 Classe Classe de frequncia ou, simplesmente, classes so os intervalos de variao da varivel. As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k. (onde K o nmero total de classes da distribuio).

37

Na tabela do exemplo anterior, a distribuio formada por cinco classes, ento temos k = 5 e o intervalo de classe 49 |---- 53 representa a 3 classe, ou seja, i = 3. 3.2 Limites de classe Limites de classe so os extremos de cada classe.

O menor nmero o limite inferior da classe (li) e o maior nmero, limite superior da classe (Li). Na classe 49 |---- 53, temos:,l3 = 49 e L3 = 53. O smbolo |---- representa um intervalo fechado esquerda e aberto direita. O dado 53 do ROL no pertence a classe 3 e sim a classe 4, que representada por 53 |---- 57. Outra representao que pode ser utilizada para representar este intervalo : [53,57[. 3.3 Amplitude do intervalo de classe Amplitude do intervalo de classe ou, simplesmente, intervalo de classe a medida do intervalo que define a classe. Ela obtida atravs da diferena entre o limite superior e inferior da classe e simbolizada por: hi = Li - li Na tabela do exemplo anterior hi = 53 - 49 = 4. Obs.: Na distribuio de frequncia com classes o hi ser igual em todas as classes, como mostrado a seguir: hi = 57 - 53 = 4 hi = 49 - 45 = 4

38

3.4 Amplitude total da distribuio Amplitude total da distribuio (AT) a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. AT = Lmax - lmin. Na tabela anterior AT = 61 - 41= 20 Nota: evidente que, se as classes possuem o mesmo intervalo, verificamos a relao: AT = k hi 3.5 Amplitude amostral Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo da amostra (obtidos atravs do ROL). AA = Xmax - Xmin Em nosso exemplo AA = 60 - 41 = 19. Obs.: AT sempre ser maior que AA. 3.6 Ponto mdio da classe Ponto mdio da classe (xi) , como o prprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto mdio de uma classe, calculamos a semi-soma dos limites da classe (mdia aritmtica): xi = li + Li 2 No intervalo da 3 classe 49 |---- 53 o ponto mdio x3 calculado: x3 = (l3 + L3)/2 = (53 + 49)/2 = 51

39

Obs.: O ponto mdio da classe o valor que a representa para efeito de clculos de medidas de posio e disperso ou variabilidade. 3.7 Frequncia simples ou absoluta Frequncia simples ou frequncia absoluta ou simplesmente, frequncia de uma classe ou de um valor individual o nmero de observaes correspondentes a essa classe ou a esse valor. A frequncia simples simbolizada por fi (lemos f ndice i ou frequncia da classe i). Assim, considerando o exemplo abaixo, temos: ESTATURAS DE 40 ALUNOS NA ESCOLA A ESTATURA (cm) 150 |---- 154 154 |---- 158 158 |---- 162 162 |---- 166 166 |---- 170 170 |---- 174 TOTAL f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3. A soma das frequncias sempre igual ao total da amostra. Exerccio 1: As notas obtidas por 50 alunos de uma classe foram: 1; 2; 3; 4; 5; 0; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9. a) Complete a distribuio de frequncia abaixo: i 1 2 3 4 5 Notas 0 |---- 2 2 |---- 4 4 |---- 6 6 |---- 8 8 |---- 10 Total xi fi FREQUNCIA 4 9 11 8 5 3 40

50
40

b) Agora, responda: 1. Qual a amplitude amostral? 2. Qual a amplitude da distribuio? 3. Qual o nmero de classes da distribuio? 4. Qual o limite inferior da quarta classe? 5. Qual o limite superior da classe de ordem 2? 6. Qual a amplitude do segundo intervalo de classe? 7. Qual a frequncia da terceira classe? c) Complete: 1. h3 = ....... 2. n = ........ 3. l1 = ........ 4. L3 = ........ 5. x2 = ........ 6. f5 = ........ 4 Tipos de Frequncias Frequncia simples ou absolutas (fi) so os valores que realmente representam o nmero de dados de cada classe. A soma das frequncias simples igual ao nmero total de dados da distribuio.

fi = n
Frequncias relativas (fri) ou fi (%) so os valores das razes entre as frequncias absolutas de cada classe e a frequncia total da distribuio. A soma das frequncias relativas igual a 1 ou 100 %. Logo, para o exemplo da pgina 36 a frequncia da terceira classe : fr3 = f3/n ; fr3 = 11/40 = 0,275 ou 27,5% O propsito das frequncias relativas o de permitir a anlise ou facilitar as comparaes.

41

Frequncia acumulada de uma classe (F i) o total das frequncias de todos os valores inferiores ao limite superior do intervalo de uma determinada classe: Fk = f1 + f2 + f3 + ...... + fK Assim, no exemplo, a frequncia acumulada correspondente terceira classe : F3 = f1 + f2 + f3 = 4 + 9 + 11 = 24 O que significa existirem 24 alunos com estatura inferior a 162 cm (limite superior do intervalo da terceira classe). Frequncia acumulada relativa (Fri) ou Fi (%) de uma classe a frequncia acumulada da classe, dividida pela frequncia total da distribuio. Fri = Fi / fi Assim, no exemplo, para a terceira classe, temos: Fr3 = F3 / fi = 24/40 = 0,600 ou 60,0% Exerccio 2: Complete o quadro com as frequncias que se pede. CLASSE 50 |---- 54 54 |---- 58 58 |---- 62 62 |---- 66 66 |---- 70 70 |---- 74 Total xi 52 56 60 64 68 72 -fi 4 9 11 8 5 3 40 Fi fi (%) Fi (%)

--

100

--

Sendo xi = ponto mdio de classe; fi = frequncia simples; Fi = frequncia Acumulada; fri (%) = frequncia percentual e Fri (%) = frequncia percentual acumulada.

42

5 - Mtodo Prtico para Construo de uma Distribuio de Frequncias com Classes: 1 - Organize os dados brutos em um ROL. 2 - Calcule a amplitude amostral AA. Para o exemplo da pgina 34, temos: AA = 60 - 41 = 19 3 - Calcule o nmero de classes atravs da: a) Regra de Sturges: i = 1 + 3,3.log n n i = n de classes 3 ---- 5 3 6 ---- 11 4 12 ---- 22 5 23 ---- 46 6 47 ---- 90 7 91 ---- 181 8 182---- 362 9 b) Raiz quadrada de n. (usa-se somente a parte inteira do nmero quando a raiz no for exata). Obs.: Qualquer regra para determinao do n de classes da tabela no nos leva a uma deciso final; esta vai depender na realidade de um julgamento pessoal, que deve estar ligado natureza dos dados. No nosso exemplo: n = 22 dados, ento, a regra sugere a adoo de 5 classes pela regra de Sturges e de 4 classes pela regra da raiz quadrada, ficando a critrio de quem vai fazer a distribuio de frequncia. 4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe h > AA / i. No nosso exemplo: AA / i = 19/4 = 4,75. Obs.: Como h > AA / i um valor ligeiramente superior para haver folga na ltima classe. Utilizaremos ento h = 5. 5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes com frequncia = 0 (zero).

43

No nosso exemplo: o menor n da amostra = 41 + h = 46, logo a primeira classe ser representada por 41 |---- 46. As classes seguintes respeitaro o mesmo procedimento. O primeiro elemento da classe seguinte sempre ser formado pelo ltimo elemento da classe anterior. 6 - Representao Grfica de uma Distribuio Uma distribuio de frequncia pode ser representada graficamente pelo Histograma, pelo Polgono de frequncia e pelo Polgono de frequncia acumulada (alguns autores denominam de ogiva de Galton). Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as frequncias. 6.1 - Histograma O Histograma formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios dos intervalos de classe. A rea de um histograma proporcional soma das frequncias simples ou absolutas. Para o exemplo a seguir, temos o seguinte histograma: ESTATURAS DE 40 ALUNOS NA ESCOLA A ESTATURA (cm) 150 |---- 154 154 |---- 158 158 |---- 162 162 |---- 166 166 |---- 170 170 |---- 174 TOTAL FREQUNCIA 4 9 11 8 5 3 40

44

6.2 Polgono de Frequncia O Polgono de frequncia um grfico em linha, sendo as frequncias marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de classe.

Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos mdios da classe anterior a primeira e da posterior ltima, da distribuio. Para o exemplo anterior temos o seguinte Polgono de frequncia:

45

6.3 Polgono de Frequncia Acumulada O Polgono de frequncia acumulada traado marcando-se as frequncias acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Para o exemplo em estudo temos o seguinte Polgono de frequncia acumulada:

Uma distribuio de frequncia sem intervalos de classe representada graficamente por um diagrama onde cada valor da varivel representado por um segmento de reta varivel e de comprimento proporcional respectiva frequncia.

46

Exerccio 3: Complete o quadro com as frequncias que se pede e com base nele construa o histograma, polgono de frequncia e polgono de frequncia acumulada. CLASSE 50 |----- 54 54 |----- 58 58 |----- 62 62 |----- 66 66 |----- 70 70 |----- 74 Total xi 52 56 60 64 68 72 -fi 4 9 11 8 5 3 40 Fi fi (%) Fi (%)

--

100

--

Sendo xi = ponto mdio de classe; fi = frequncia simples; Fi = frequncia Acumulada; fi (%) = frequncia percentual; Fi (%) = frequncia percentual acumulada.

47

VI - MEDIDAS DE POSIO 1 Introduo O estudo que fizemos sobre distribuies de frequncia, at agora, permite-nos descrever, de modo geral, os grupos dos valores que uma varivel pode assumir. Dessa forma, podemos localizar a maior concentrao de valores de uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final, ou ainda, se h uma distribuio por igual. Porm, para ressaltar as tendncias caractersticas de cada distribuio, isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se expressam atravs de nmeros, que nos permitam traduzir essas tendncias. Esses conceitos so denominados elementos tpicos da distribuio e so as: a. medidas de posio; b. medidas de variabilidade ou disperso; c. medidas de assimetria; d. medidas de curtose. Dentre os elementos tpicos, destacamos, neste captulo, as medidas de posio - estatsticas que representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixo horizontal do grfico da curva de frequncia. As medidas de posies mais importantes so as medidas de tendncia central ou promdias, que recebem tal denominao pelo fato de os dados observados tenderem, em geral, a se agruparem em torno dos valores centrais. Dentre as medidas de tendncia central, destacamos: a. a mdia aritmtica; b. a moda; c. a mediana. Outras promdias menos usadas so as mdias: geomtrica, harmnica, quadrtica, cbica e biquadrtica.

48

As outras medidas de posio so as separatrizes, que englobam: a prpria mediana, os decis, os quartis e os percentis. 2 Mdia Aritmtica ( )

Em um conjunto de dados, podemos definir vrios tipos de mdias. Porm, em nossos estudos iremos nos limitar a mais importante: a mdia aritmtica. Mdia Aritmtica o quociente entre a soma dos valores da varivel pelo nmero deles.

onde xi so os valores da varivel e n o nmero de valores. 2.1 Dados no - agrupados Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de frequncias, determinamos a mdia aritmtica simples. Exemplo: Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kg, temos, para venda mdia diria na semana de: .= (10+14+13+15+16+18+12) / 7 = 14 kg Logo: .= 14 Kg

s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados que ela representa. o que acontece quando temos os valores 2, 4, 6 e 8, para os quais a mdia 5. Esse ser o nmero representativo dessa srie de valores, embora no esteja representado nos dados originais. Neste caso, costumamos dizer que a mdia no tem existncia concreta. 2.2 Desvio em relao mdia Denominamos Desvio em relao mdia a diferena entre cada elemento de um conjunto de valores e a mdia aritmtica.

49

Designando o desvio por di, temos:.di = Xi No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4; d2 = 14 - 14 = 0; d3 = 13 - 14 = - 1; d4 = 15 - 14 = 1; d5 = 16 - 14 = 2; d6 = 18 - 14 = 4; d7 = 12 - 14 = - 2. 2.3 .Propriedades da mdia 1 propriedade: A soma algbrica dos desvios em relao mdia nula. Ou seja:

No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0 2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma varivel, a mdia do conjunto fica aumentada (ou diminuda) dessa constante.

Se no exemplo anterior, somarmos a constante 2 a cada um dos valores da varivel temos: Y = (12+16+15+17+18+20+14) / 7 = 16 kg Ou seja, Y = .+ 2 = 14 +2 = 16 kg

50

3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada (ou dividida) por essa constante.

Se no exemplo anterior multiplicarmos a constante 3 a cada um dos valores da varivel temos: Y = (30+42+39+45+48+54+36) / 7 = 42 kg Ou seja, Y = x 3 = 14 x 3 = 42 kg

2.4 Dados Agrupados A mdia aritmtica sem intervalos de classe Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o nmero de filhos do sexo masculino. Calcularemos a quantidade mdia de meninos por famlia: N de meninos 0 1 2 3 4 Total Frequncia (fi) 2 6 10 12 4 34

Neste caso, como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada, dada pela frmula:

51

O modo mais prtico de obteno da mdia ponderada abrir, na tabela, uma coluna correspondente aos produtos xifi: xi 0 1 2 3 4 Temos, xifi = 78 e f i = 34 Logo xifi / f i = 78 / 34 = 2,3 Portanto a mdia de 2,3 meninos por famlia Nota: - Sendo x uma varivel discreta, como interpretar o resultado obtido, 2 meninos e 3 dcimos de menino? O valor mdio de 2,3 meninos sugere, neste caso, que o maior nmero de famlias tem 2 meninos e 2 meninas, sendo, porm, a tendncia geral de uma leve superioridade numrica em relao ao nmero de meninos. fi 2 6 10 12 4 34 xi . fi 0 6 20 36 16 78

A mdia aritmtica com intervalos de classe Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio da frmula:

Onde xi o ponto mdio da classe.

52

Exemplo: Considere a distribuio de frequncia abaixo, relativa s estaturas em cm de bebs. Calcular a estatura mdia de bebs conforme a tabela abaixo.

i 1 2 3 4 5 6

Estaturas (cm) 50 |---- 54 54 |---- 58 58 |---- 62 62 |---- 66 66 |---- 70 70 |---- 74

fi 4 9 11 8 5 3 40

Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos mdios (xi) e outra para os produtos xifi: i 1 2 3 4 5 6 Estaturas (cm) 50 |---- 54 54 |---- 58 58 |---- 62 62 |---- 66 66 |---- 70 70 |---- 74 fi 4 9 11 8 5 3 40 xi 52 56 60 64 68 72 xi.fi 208 504 660 512 340 216 2.440

Temos, xifi = 2440 e f i = 40; Logo xifi / f i = 2440 / 40 = 61 Portanto, a estatura mdia dos bebs de 61 cm.

2.5 Emprego da mdia A mdia utilizada quando: a. desejamos obter a medida de posio que possui a maior estabilidade; b. houver necessidade de um tratamento algbrico ulterior.

53

3 Moda Denominamos Moda o valor que ocorre com maior frequncia em uma srie de valores. Mo o smbolo da moda. Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o salrio recebido pelo maior nmero de empregados dessa fbrica. 3.1 Dados no - agrupados Quando lidamos com dados no-agrupados, a moda facilmente reconhecida: basta, de acordo com definio, procurar o valor que mais se repete. Exemplo: Na srie de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10. H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros. Exemplo: {3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal. Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a srie tem dois ou mais valores modais. Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie bimodal. 3.2 Dados agrupados Sem intervalos de classe Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o valor da varivel de maior frequncia. Exemplo: Qual a temperatura mais comum medida no ms abaixo: Temperaturas ( C) 0 1 2 3 Frequncia 3 9 12 6

Resp: 2 C a temperatura modal, pois a de maior frequncia (12 vezes).


54

Com intervalos de classe A classe que apresenta a maior frequncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta.

Onde: l* = limite inferior da classe modal; L*= limite superior da classe modal. Exemplo: Calcule a estatura modal conforme a tabela abaixo. Classes (cm) 54 |---- 58 58 |---- 62 62 |---- 66 66 |---- 70 Frequncia 9 11 8 5

Resposta: A classe modal 58 |------ 62, pois a de maior frequncia. l* = 58 e L* = 62 Mo = (58+62) / 2 = 60 cm (este valor estimado, pois no conhecemos o valor real da moda). H, para o clculo da moda, outros mtodos mais elaborados, como, por exemplo, o que faz uso da frmula de Czuber:

55

Na qual: l* o limite inferior da classe modal; h* a amplitude da classe modal; D1 = f* - f (ant.); D2 = f* - f (post.); Sendo: f* a frequncia simples da classe modal; f (ant.) a frequncia simples da classe anterior classe modal; f (post.) a frequncia simples da classe posterior classe modal. Exemplo: Considere a distribuio a seguir Classes 150 |---- 154 154 |---- 158 158 |---- 162 162 |---- 166 166 |---- 170 170 |---- 174 Total Temos: D1 = 11 9 = 2 e D2 = 11 8 = 3; Mo = 158 + 2 2+3 3.3 Emprego da moda A moda utilizada quando: a. desejamos obter uma medida rpida e aproximada de posio; b. quando a medida de posio deva ser o valor mais tpico da distribuio. x 4 = 159,6 cm fi 4 9 11 8 5 3 40

56

4 Mediana A Mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos. Smbolo da mediana: Md 4.1 Dados no-agrupados Dada uma srie de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10} De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15} Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de elementos direita e esquerda. Neste caso o valor que divide a srie acima em duas partes iguais o 9, logo a Md = 9. Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por definio, qualquer dos nmeros compreendidos entre os dois valores centrais da srie. Convencionou-se utilizar o ponto mdio. .Mtodo prtico para o clculo da Mediana a) Se a srie dada tiver nmero mpar de termos: O valor mediano ser o termo de ordem dado pela frmula: (n+1)/2

Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 2, 5} 1 - ordenar a srie {0, 0, 1, 1, 2, 2, 3, 4, 5} n = 9, logo (n + 1)/2 dado por (9 + 1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser a mediana. A mediana ser o 5 elemento = 2

57

b) Se a srie dada tiver nmero par de termos: O valor mediano ser dado pela frmula: . [( n/2 ) +( n/2+ 1 )] / 2
Obs.: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor correspondente.

Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 3, 5, 6} 1 - ordenar a srie {0, 0, 1, 1, 2, 3, 3, 4, 5, 6} n = 10, logo a frmula ficar: [(10/2) + (10/2 + 1)] / 2 [(5 + 6)] / 2, ser na realidade (5 termo + 6 termo) / 2 Temos: 5 termo = 2 e 6 termo = 3 A mediana ser = (2 + 3) / 2, ou seja, Md = 2,5. A mediana no exemplo ser a mdia aritmtica do 5 e 6 termos da srie. Notas:

Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie. Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. A mediana depende da posio e no dos valores dos elementos na srie ordenada. Essa uma da diferenas marcantes entre mediana e mdia (que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Em {5, 7, 10, 13, 15}; a mdia = 10 e a mediana = 10 Em {5, 7, 10, 13, 65}; a mdia = 20 e a mediana = 10

Isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma.

58

4.2 Dados agrupados Se os dados se agrupam em uma distribuio de frequncia, o clculo da mediana se processa de modo muito semelhante quele dos dados noagrupados, implicando, porm, a determinao prvia das frequncias acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuio em dois grupos que contenham o mesmo nmero de elementos. Sem intervalos de classe Neste caso, o bastante identificar a frequncia acumulada imediatamente superior metade da soma das frequncias. A mediana ser aquele valor da varivel que corresponde a tal frequncia acumulada. - Quando o somatrio das frequncias for mpar o valor mediano ser o termo de ordem dado pela frmula:

Exemplo considere a distribuio abaixo: Varivel (xi) 0 1 2 3 4 Total fi 2 6 9 13 5 35 Fi 2 8 17 30 35 --

Como o somatrio das frequncias fi = 35, a frmula para calcular a mediana ser: (35+1) / 2 = 18 termo Pela distribuio temos a mediana igual ao valor da varivel correspondente ao 18 termo, ou seja, igual a 3. - Quando o somatrio das frequncias for par o valor mediano ser o termo de ordem dado pela frmula:

59

Exemplo - Calcule Mediana da tabela abaixo: Varivel xi 12 14 15 16 17 20 Total Aplicando frmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5 Logo, o valor da mediana para esta distribuio ser igual a 15,5. fi 1 2 1 2 1 1 8 Fi 1 3 4 6 7 8 --

Com intervalos de classe Neste caso, o problema consiste em determinar o ponto do intervalo em que est compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana classe mediana. Devemos seguir os seguintes passos:

60

Exemplo: Considere a distribuio a seguir Classes 50 |---- 54 54 |---- 58 58 |---- 62 62 |---- 66 66 |---- 70 70 |---- 74 Total Temos: fi 4 9 11 8 5 3 40 Fi 4 13 24 32 37 40 --

= 40 / 2 =.20

Logo,.a classe mediana ser a terceira classe, ou seja, 58 |---- 62 e com base nesta classe temos ainda: l* = 58........... F(ant) = 13........... f* = 11........... h* = 4 Substituindo esses valores na frmula acima, obtemos: Md = 58 + [(20 - 13) x 4] / 11 = 58 + (28/11) = 58 + 2,54 = 60,54 Obs.: Este valor (Md = 60,54) estimado, pois no temos os 40 valores da distribuio.
NOTA: No caso de existir uma frequncia acumulada exatamente igual a fi/2, a mediana ser o limite superior da classe correspondente .

Exemplo: Considere a distribuio a seguir i 1 2 3 4 5 6 Classes 0 |---- 10 10 |---- 20 20 |---- 30 30 |---- 40 40 |---- 50 50 |---- 60 Total Temos: fi 1 3 9 7 4 2 26 Fi 1 4 13 20 24 26 --

= 26 / 2 =.13

Logo,.Md = L* = 30

61

4.3 - Emprego da Mediana A mediana usada quando: a. desejamos obter o ponto que divide a distribuio em duas partes iguais; b. h valores extremos que afetam de maneira acentuada a mdia aritmtica; c. a varivel em estudo salrio. 5 Posio Relativa da Mdia, Moda e Mediana Quando uma distribuio simtrica, as trs medidas coincidem. Porm, a assimetria torna-as diferentes e essa diferena tanto maior quanto maior a assimetria. Assim, em uma distribuio em forma de sino, temos: Media = Mediana = Moda, no caso da curva simtrica; Moda < Mediana < Media, no caso da curva assimtrica positiva; Media < Mediana < Moda, no caso da curva assimtrica negativa;

62

6 As Separatrizes Como vimos, a mediana caracteriza uma srie de valores devido sua posio central. No entanto, ela apresenta uma caracterstica, to importante quanto a primeira: ela separa a srie em dois grupos que apresentam o mesmo nmero de valores. Assim, alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua segunda caracterstica, j que se baseiam em posio na srie. Essas medidas os quartis, os percentis e os decis so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes. 6.1 Os quartis Denominamos quartis os valores de uma srie que a divide em quatro partes iguais. H, portanto, trs quartis: a. O primeiro quartil (Q1) valor situado de tal modo na srie que uma quarta parte (25%) dos dados menor que ele e as trs quartas partes restantes (75%) so maiores. b. O segundo quartil (Q2) evidentemente, valor que coincide com a mediana (Q2 = Md). c. O terceiro quartil (Q3) valor situado de tal modo na srie que as trs quartas partes (75%) dos termos so menores que ele e uma quarta parte restante (25%) maior. Quando os dados so agrupados, para determinar os quartis usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana, por:

63

Sendo K o nmero de ordem do quartil. Assim temos:

Exemplo: Classes 150 |---- 154 154 |---- 158 158 |---- 162 162 |---- 166 166 |---- 170 170 |---- 174 Total fi 4 9 11 8 5 3 40 Fi 4 13 24 32 37 40 --

(Q1) (Q3)

64

Exerccio: 1. Complete os esquemas para o clculo do primeiro e do terceiro quartis da distribuio de frequncia:

65

6.2 Os Decis Denominamos decis os nove valores que separam uma srie em 10 partes iguais. Indicamos: D1, D2, D3, ............, D9 evidente que: D5= Q2 = Md

O clculo de um decil segue a mesma tcnica do clculo da mediana, porm, a frmula ser substituda por:

10

Sendo K o nmero de ordem do decil. Assim temos:

D1

10

D3

10

66

Exemplo: Calcule o stimo decil Classes 150 |---- 154 154 |---- 158 158 |---- 162 162 |---- 166 166 |---- 170 170 |---- 174 Total Stimo Decil: 7 x fi/10 = 7 x 40/10 = 28 (28 termo) D7 = 162 + (28 -24).4 8 D7 = 162 + 2 = 164 6.3 Os Percentis Denominamos percentis os noventa e nove valores que separam uma srie em 100 partes iguais. Indicamos: P1, P2, P3, ............, P99 evidente que: P50= D5= Q2 = Md, P25= Q1, P75= Q3 O clculo de um percentil segue a mesma tcnica do clculo da mediana, porm, a frmula ser substituda por: fi 4 9 11 8 5 3 40 Fi 4 13 24 32 37 40 --

(D7)

67

Sendo K o nmero de ordem do percentil. Assim para o 27 percentil, temos:

Exemplo: Considerando a distribuio de frequncia, temos para o oitavo percentil: Classes 150 |---- 154 154 |---- 158 158 |---- 162 162 |---- 166 166 |---- 170 170 |---- 174 Total fi 4 9 11 8 5 3 40 Fi 4 13 24 32 37 40 --

(P8)

68

Exerccio: 1. Complete o esquema para o clculo do vigsimo percentil da distribuio:

69

2. Calcule a mdia aritmtica das distribuies de frequncia abaixo:

3. Calcule a mediana de cada uma das distribuies de frequncia do exerccio anterior. 4. Calcule a moda de cada uma das distribuies de frequncia do exerccio dois. 5. Calcule o primeiro e o terceiro quartis de cada uma das distribuies de frequncia do exerccio dois. 5. Calcule o quarto e o nono decil de cada uma das distribuies de frequncia do exerccio dois. 6. Calcule o 1, o 10, o 15, o 23 e o 90 percentis da distribuio b) do exerccio dois.

70

VII MEDIDAS DE DISPERSO OU VARIABILIDADE 1 Disperso ou variabilidade Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por meio de procedimentos matemticos, em poucos valores representativos mdia aritmtica, moda e mediana. Tais valores podem servir de comparao para dar a posio de qualquer elemento do conjunto. No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j convenientemente simplificados, necessrio ter-se uma ideia retrospectiva de como se apresentavam esses mesmos dados nas tabelas. Assim, no o bastante dar uma das medidas de posio para caracterizar perfeitamente um conjunto de valores. Vemos, ento, que a mdia ainda que considerada como um nmero que tem a faculdade de representar uma srie de valores no pode, por si mesma, destacar o grau de homogeneidade que existe entre os valores que compem o conjunto. Consideremos os seguintes conjuntos de valores das variveis x, y e z: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5, 15, 50, 120, 160 Calculando a mdia aritmtica de cada um desses conjuntos, obtemos: mdia da varivel x = 70; mdia da varivel y = 70; mdia da varivel z = 70; Vemos ento que os trs conjuntos apresentam a mesma mdia aritmtica: 70. Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa. Chamando de disperso ou variabilidade a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central tomado como ponto de comparao, podemos dizer que o conjunto X apresenta
71

disperso ou variabilidade nula e que o conjunto Y apresenta uma disperso ou variabilidade menor que o conjunto Z. Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor disperso ou variabilidade entre esses valores e a sua medida de posio, a Estatstica recorre s medidas de disperso ou de variabilidade. Dessas medidas, estudaremos a amplitude total, o Desvio-padro, a Varincia e o Coeficiente de variao. 2 Amplitude Total 2.1 Dados no-agrupados A Amplitude total a diferena entre o maior e o menor valor observado: AT = X (max) - X (min) Exemplo: para os valores: 40, 45, 48, 52, 54, 62 e 70 Temos: AT = 70 40 = 30, logo AT = 30. Quando dizemos que a amplitude total dos valores 30, estamos afirmando alguma coisa do grau de sua concentrao. evidente que, quanto maior a amplitude total, maior a disperso ou variabilidade dos valores da varivel. Relativamente aos trs conjuntos de valores (X, Y e Z) mencionados no incio deste captulo, temos: ATX = 70 70 = 0, (disperso nula) ATY = 72 68 = 4 ATZ = 160 5 = 155 2.2 Dados agrupados 2.2.1 Sem intervalos de classe Neste caso, ainda temos: AT = X (max) - X (min)

72

Exemplo: Considerando a tabela abaixo: Xi 0 1 2 3 4 Total Temos: AT = 4 0 = 4, logo AT = 4. 2.2.2 Com intervalos de classe Neste caso, a amplitude total a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe: AT = L (max) - l (min) Exemplo: Considerando a distribuio de frequncia abaixo: Classes 150 |---- 154 154 |---- 158 158 |---- 162 162 |---- 166 166 |---- 170 170 |---- 174 Total Temos: AT = 174 150 = 24, logo: AT = 24 cm. A amplitude total tem o inconveniente de s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios, o que quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao aproximada da disperso ou variabilidade. fi 4 9 11 8 5 3 40 fi 2 6 12 7 3 30

73

3 Varincia e Desvio-padro 3.1 Introduo: A varincia e o desvio-padro levam em considerao a totalidade dos valores da varivel em estudo, o que faz delas ndices de variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados. A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. A varincia baseia-se nos desvios em torno da mdia aritmtica, porm determinando mdia aritmtica dos quadrados dos desvios. Assim, representando a varincia por s2, temos:

Quando se tratar de uma amostra devemos usar no denominador n 1. Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretaes prticas, denominada desvio-padro, definida como a raiz quadrada da varincia e representada por S.

Quando se tratar de uma amostra devemos usar no denominador n 1.

74

NOTA: Tanto o desvio-padro como a varincia so usados como medidas de disperso ou variabilidade. O uso de uma ou de outra depender da finalidade que se tenha em vista. Outra frmula bastante utilizada para calcular o desvio-padro de uma populao :

3.2 Propriedades do desvio-padro O desvio padro uma medida que s pode assumir valores no negativos e quanto maior for o seu valor, maior ser a disperso dos dados. Algumas propriedades do desvio padro, que resultam imediatamente da definio, so: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera. yi = xi c sy = sx Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padro fica multiplicado (ou dividido) por essa constante. yi = xi . c sy = sx . c O desvio padro sempre no negativo e ser tanto maior, quanto mais variabilidade houver entre os dados. Se s = 0, ento no existe variabilidade, isto , os dados so todos iguais. Essas propriedades nos permitem introduzir, no clculo do desvio padro simplificaes teis. Para o clculo do desvio-padro, consideremos os seguintes casos:

75

3.3 Dados no-agrupados Devemos empregar uma das duas frmulas mostradas para clculo do desviopadro. Exemplo: Calcular o desvio padro da populao representada por: Populao = {10, 6, 1, 3, 5} xi 10 6 1 3 5 5 5 5 5 5 -Usando a frmula: 5 1 -4 -2 0 -25 1 16 4 0
= 46

Sabemos que n = 5 e que

/ n = 46 / 5 = 9,2.

Logo, a raiz quadrada de 9,2 o desvio padro, S = 3,03 Obs.: Podemos tambm calcular utilizando a outra frmula possvel. Quando nosso interesse no se restringe descrio dos dados, mas, partindo da amostra, visamos tirar inferncias vlidas para a respectiva populao, convm efetuar uma modificao, que consiste em usar o divisor ( n 1) em lugar de n. A frmula ficar ento:

Exemplo: Se os dados 10, 6, 1, 3 e 5 representassem uma amostra o desvio padro amostral seria a raiz quadrada de 46 / (5 -1) = 3,39

76

3.4 Dados agrupados Quando os dados esto agrupados (temos a presena de frequncias) a frmula do clculo do desvio padro para uma populao ficar:

Quando se trata de uma amostra devemos usar a seguinte frmula:

Podemos tambm calcular o desvio-padro populacional pela seguinte frmula:

Exemplo: Calcule o desvio padro populacional da tabela abaixo: xi 0 1 2 3 4 Total fi 2 6 12 7 3 30 xi . fi 0 6 24 21 12 63 . fi 2,1 2,1 2,1 2,1 2,1 --2,1 -1,1 -0,1 0,9 1,9 4,41 1,21 0,01 0,81 3,61 8,82 7,26 0,12 5,67 10,83 32,70

Somatrio . f i / n = 32,7 / 30 = 1,09.

Sabemos que fi = 30 e

A raiz quadrada de 1,09 o desvio padro, ou seja, s = 1,044.

77

Se considerarmos os dados como sendo de uma amostra o desvio padro seria: A raiz quadrada de 32,7 / (30 -1) = 1,062. Obs.: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior. No exemplo anterior a varincia igual a: a) Para a populao S2 = (1,044)2 = 1,09 b) Para a amostra: S2 = (1,062)2 = 1,13 3.5 Entendendo o significado do desvio-padro: Em termos simples, desvio-padro um modo de representar a disperso dos dados ao redor da mdia. Se os dados obedecerem a uma distribuio normal, todos estaro compreendidos por uma curva em forma de sino; eles se distribuiro simetricamente ao redor da mdia. O quadro a seguir mostra os dados contidos entre desvio-padro para ambos os lados da mdia. Mdia + ou ( ) desviopadro 1 1,96 2 2,58 3 % da populao includa 68,3 95,0 95,5 99,0 99,7 100 % da populao 95 % da populao Grosseiramente 2/3 da populao

78

1 - Aproximadamente 68% dos dados esto no intervalo

2 - Aproximadamente 95% dos dados esto no intervalo

79

4 Coeficiente de Variao

O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro de duas unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada coeficiente de variao (CV):

Exemplo: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivduos: Varivel Estatura Peso Temos: CVE = (5/175) x 100 = 2,85% CVP = (2/68) x 100 = 2,94% Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso que as estaturas. 175 cm 68 Kg S 5,0 cm 2,0 Kg

80

VIII - PROBABILIDADE 1 - Introduo Neste captulo, presumiremos que a populao conhecida e calcularemos as chances de obter vrias amostras desta populao. Assim, mostraremos que a probabilidade o reverso da estatstica: na probabilidade usaremos a informao da populao para inferir a natureza provvel da amostra. Sendo assim, as situaes marcadas pela possibilidade de ocorrncia de mais de um resultado possvel costumam ser analisadas em estatstica com o auxlio das probabilidades. A probabilidade estuda o risco e o acaso em eventos futuros, determinando se provvel ou no o seu acontecimento. O clculo das probabilidades pertence ao campo da Matemtica, entretanto a maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou probabilstica. O conhecimento dos aspectos fundamentais do clculo da probabilidade uma necessidade essencial para o estudo da Estatstica Indutiva ou Inferencial. Para estudar probabilidades, necessrio definir alguns conceitos e terminologias usuais, como os relativos a experimento aleatrio, espao amostral e eventos. 2 - Experimento Aleatrio Suponha que uma moeda foi jogada uma vez e deu cara. O resultado que vemos e registramos chamado de observao, ou medio, e o processo de realizar uma observao chamado de experimento. Baseado neste exemplo, enunciamos a definio de experimentos aleatrios: So fenmenos que, mesmo repetidos vrias vezes sob condies semelhantes, apresentam resultados imprevisveis. O resultado final depende do acaso. Como exemplos de experimentos aleatrios, podem ser citados: E1: Joga-se um dado e observa-se o nmero mostrado na face de cima. E2: Joga-se uma moeda trs vezes e observa-se o nmero de caras obtido. E3: Em uma linha de produo, fabricam-se peas em srie e conta-se o nmero de peas defeituosas produzidas em um perodo de 24 horas.

81

importante destacar que os experimentos mencionados possuem algumas caractersticas em comum: a) Cada experimento poder ser repetido indefinidamente sob condies essencialmente inalteradas; b) Muito embora no seja possvel afirmar que resultado particular ocorrer, pode-se descrever o conjunto de todos os possveis resultados do experimento; c) Quando o experimento for executado repetidamente, os resultados individuais parecero ocorrer de forma acidental. Porm, quando o experimento for repetido um grande nmero de vezes, uma configurao definida ou uma regularidade surgir. 3 - Espao Amostral Um conjunto de resultados totais pode ser obtido ao ser realizada uma experincia aleatria, embora um e somente um resultado possa ser obtido por vez. Logo, por espao amostral, entende-se: Ao conjunto de resultados possveis de um experimento aleatrio damos o nome de espao amostral ou conjunto universo, representado por S. . Considerando os quatros experimentos aleatrios citados no item anterior, o espao amostral para cada um deles pode ser descrito, respectivamente, por: S1: {1; 2; 3; 4; 5; 6} S2: {0; 1; 2; 3} S3: {0; 1; 2; 3; .........; N}

Cada elemento do espao amostral que corresponde a um resultado recebe o nome de ponto amostral. No primeiro exemplo: o nmero 1 pertence ao espao amostral {1}. 4 - Eventos Quando o espao amostral for finito ou infinito numervel, todo subconjunto poder ser considerado um evento. No entanto, se o espao amostral for infinito no numervel, surgir uma dificuldade terica na identificao e apresentao de eventos. Logo, podemos definir evento como:

82

Qualquer subconjunto do espao amostral S de um experimento aleatrio. Em relao aos quatro experimentos aleatrios apresentados inicialmente, podem ser citados, respectivamente, como os eventos abaixo: A1: {2; 4; 6}; isto , um nmero par ocorre. A2: {2}; isto , duas caras ocorrem. A3: {0}; isto , todas as peas so perfeitas.

Se considerarmos S como espao amostral e A como evento, qualquer que seja A, se A est contido em S, ento A um evento de S. Em particular: Se A = S, A chamado de evento certo. Se A est contido em S e A um conjunto unitrio, A chamado de evento elementar. Se A = , A chamado de evento impossvel. Nos itens anteriores aprendemos as definies e exemplos de experimento aleatrio, espao amostral e eventos. No item a seguir, usaremos estas definies para enunciar o conceito de probabilidade. 5 - Probabilidade Dado um experimento aleatrio, sendo S o seu espao amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S um conjunto equiprovvel.

Aplicar probabilidade significa us-la em situaes em que no se pode prever um resultado futuro. Os resultados so incertos, regidos pelo acaso. Observe os exemplos a seguir:
83

1- No lanamento de uma moeda qual a probabilidade de obter cara em um evento A? S = {ca, co} = 2 A = {ca} = 1 P (A) = 1/2 = 0,5 = 50%

2 - No lanamento de um dado qual a probabilidade de obter um nmero par em um evento A? S = {1,2,3,4,5,6} = 6 A = {2,4,6} = 3 P (A) = 3/6 = 0,5 = 50%

3 - No lanamento de um dado qual a probabilidade de obter um nmero menor ou igual a 6 em um evento A? S = {1,2,3,4,5,6} = 6 A = {1,2,3,4,5,6} = 6 P (A) = 6/6 = 1,0 = 100%

Obs.: a probabilidade de todo evento certo igual a 1 ou 100%. 4 - No lanamento de um dado qual a probabilidade de obter um nmero maior que 6 em um evento A? S = {1,2,3,4,5,6} = 6 A={ }=0 P (A) = 0/6 = 0 = 0%

Obs.: a probabilidade de todo evento impossvel igual a 0 ou 0% 6 - Eventos Complementares Sabemos que um evento pode ocorrer ou no. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele no ocorra (insucesso), para um mesmo evento existe sempre a relao: p+q=1 Obs.: Em uma distribuio de probabilidades o somatrio das probabilidades atribudas a cada evento elementar igual a 1, logo temos: p1 + p2 + p3 + ... + pn = 1. Exemplos: 1 Qual a probabilidade de no tirar o n 4 no lanamento de um dado? Soluo: sabemos que a probabilidade de tirar o n 4 no lanamento aleatrio de um dado p = 1/6 ou 16,67%. Logo, a probabilidade de no tirar q = 1 - p ou q = 1 - 1/6 = 5/6 ou 83,33%.
84

2 - Calcular a probabilidade de um piloto vencer uma dada corrida, onde as suas "chances", segundo os especialistas, so de "3 para 2". Calcule tambm a probabilidade dele perder. Soluo: O termo "3 para 2" significa: de cada 5 corridas ele ganha 3 e perde 2. Ento p = 3/5 ou 60% (ganhar) e q = 2/5 ou 40% (perder). 3 - Qual a probabilidade de tirar um nmero maior ou igual a dois no lanamento de um dado? Soluo: sabemos que neste evento s exclumos a possibilidade do resultado do lanamento ser o n 1 e a probabilidade de tir-lo no lanamento de um dado p = 1/6. Logo, a probabilidade do resultado obtido neste lanamento ser maior ou igual a 2 q = 1 p, logo q = 1 - 1/6 = 5/6 ou 83,33%. Aprendemos a distinguir eventos complementares, e que a probabilidade de um evento acontecer somado probabilidade deste mesmo evento no acontecer (complementar) sempre igual a 1 ou 100%. A seguir vamos definir eventos independentes e calcular a probabilidade deles acontecerem. 7 - Eventos Independentes Dizemos que dois eventos so independentes quando a realizao ou a norealizao de um dos eventos no afeta a probabilidade da realizao do outro e vice-versa. Por exemplo, quando lanamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Se dois eventos so independentes, a probabilidade de que eles se realizem simultaneamente igual ao produto das probabilidades de realizao dos dois eventos. Assim, se p1 a probabilidade de realizao do primeiro evento e p2 a probabilidade de realizao do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente dada por: p = p1 x p2 Esta regra tambm conhecida como Teorema do produto, que se aplica nas operaes multiplicativas de probabilidades. Operaes multiplicativas geralmente envolvem a conjuno e, e so representadas pelo smbolo de interseco .

85

Fique atento aos exemplos de eventos independentes abaixo: 1 Ao lanarmos dois dados, qual a probabilidade de obtermos o nmero 1 no primeiro e o nmero 5 no segundo dado? Soluo: A probabilidade de obtermos 1 no primeiro dado : p1 = 1/6 A probabilidade de obtermos 5 no segundo dado : p2 = 1/6 Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo : p = 1/6 x 1/6 = 1/36 ou 2,78% 2 Qual a probabilidade da extrao de uma bola vermelha e uma bola branca (nesta ordem) de uma urna com 6 bolas vermelhas e 4 bolas brancas, supondo a reposio da primeira bola extrada antes da extrao da segunda bola? Soluo: A probabilidade de obtermos uma bola de cor vermelha na primeira extrao : p1 = 6/10 A probabilidade de obtermos uma bola de cor branca na segunda extrao : p2 = 4/10 Logo, a probabilidade da extrao das duas bolas: p = 6/10 x 4/10 = 24/100 = 0,24 ou 24% Aprendemos o que so eventos independentes e como calcular a probabilidade desses eventos acontecerem. A seguir vamos definir eventos mutuamente exclusivos e calcular a probabilidade deles acontecerem. 8 - Eventos Mutuamente Exclusivos Dizemos que dois ou mais eventos so mutuamente exclusivos quando a realizao de um dos eventos exclui a realizao do(s) outro(s). Assim, quando lanamos uma moeda, o evento tirar cara e o evento tirar coroa so mutuamente exclusivos, j que, ao se realiz ar um deles, o outro no se realiza. Se dois eventos so mutuamente exclusivos, a probabilidade de que um ou outro se realize igual soma das probabilidades de que cada um deles se realize: p = p1 + p2
86

Esta regra tambm conhecida como Teorema da soma, que se aplica nas operaes aditivas de probabilidades. Operaes aditivas geralmente envolvem a expresso ou e so representadas pelo smbolo de unio U. Veja os exemplos apresentados a seguir, em que os eventos so classificados como mutuamente exclusivos ou excludentes. a) Extrair uma carta vermelha e extrair uma carta de paus de um baralho. Como paus um naipe preto, os eventos so mutuamente excludentes; b) Extrair uma carta vermelha e extrair uma carta preta de um baralho. Como no possvel que uma carta seja das duas cores ao mesmo tempo, os eventos so mutuamente excludentes; c) Extrair cara e extrair coroa do lance de uma moeda. Como no possvel que uma face seja cara e coroa ao mesmo tempo, os eventos so mutuamente excludentes; d) Extrair face par e extrair o nmero cinco do lance de um dado. Como cinco um nmero mpar, os eventos so mutuamente excludentes. Fique atento ao clculo da probabilidade de eventos mutuamente excludentes: 1 Ao lanarmos um dado, qual a probabilidade de obtermos o nmero 3 ou o nmero 5? Soluo: A probabilidade de obtermos o nmero 3 : p1 = 1/6 A probabilidade de obtermos o nmero 5 : p2 = 1/6 Logo, a probabilidade de obtermos o nmero 3 ou o nmero 5 : p = 1/6 + 1/6 = 2/6 = 1/3 ou 33,33% 2 Ao lanarmos uma moeda, qual a probabilidade de obtermos cara ou coroa? Soluo: A probabilidade de obtermos cara : p1 = 1/2 A probabilidade de obtermos coroa : p2 = 1/2 Logo, a probabilidade de obtermos cara ou coroa : p = 1/2 + 1/2 = 2/2 = 1 ou 100% (evento certo)
87

3 Qual a probabilidade da extrao de uma bola vermelha ou branca de uma urna que contm 6 bolas vermelhas, 4 bolas brancas e 5 pretas? Soluo: A probabilidade de obtermos uma bola vermelha : p1 = 6/15 A probabilidade de obtermos uma bola branca : p2 = 4/15 Logo, a probabilidade da extrao de uma bola vermelha ou branca : p = 4/15 + 6/15 = 10/15 ou 66,67% Exerccios Resolvidos 1 Qual a probabilidade de sair o s de ouros quando retirarmos uma carta de um baralho de 52 cartas? Resposta: Como s h um s de ouros, o nmero de elementos do evento 1; logo: p = 1/52 ou 1,92%. 2 Qual a probabilidade de sair um rei quando retirarmos uma carta de um baralho de 52 cartas? Resposta: Como h quatro reis no baralho, o nmero de elementos do evento 4; logo: p = 4/52 = 1/13 ou 7,69%. 3 Em um lote de 12 peas, 4 so defeituosas. Sendo retirada uma pea ao acaso, calcule: a. A probabilidade dessa pea ser defeituosa Resposta: Temos p = 4/12 = 1/3 ou 33,33%. b. A probabilidade dessa pea no ser defeituosa Resposta: Temos p = 1 - 1/3 = 2/3 ou 66,67%. 4 No lanamento de dois dados, calcule a probabilidade de se obter soma igual a 5. Resposta: O evento formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como o nmero de elementos de S 36, temos: p = 4/36 = 1/9 ou 11,11%. 5 De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus? Resposta: Como h quatro reis no baralho, o nmero de elementos do evento 4; logo: p1 = 4/52 = 1/13 e p2 = 1/52. Como esses dois acontecimentos so independentes e simultneos, vem: p = 1/13 x 1/52 = 1/676 ou 0,15%.

88

6 Uma urna A contm: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contm: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contm: 2 bolas brancas, 3 pretas e 4 verdes. Uma bola retirada de cada urna. Qual a probabilidade de as bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde? Resposta: Temos: p1 = 3/9 = 1/3; p2 = 2/8= 1/4 e p3 = 4/9. Como esses trs acontecimentos so independentes e simultneos, vem: p = 1/3 x 1/4 x 4/9 = 1/27 ou 3,70%. 7 De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposio. Qual a probabilidade de a primeira carta ser o s de paus e a segunda ser o rei de paus? Resposta: A probabilidade de sair o s de paus na primeira carta p 1 = 1/52. Aps a retirada da primeira carta, restam 51 cartas no baralho, j que a carta retirada no foi reposta. Assim, a probabilidade de a segunda carta ser o rei de paus p2 = 1/51. Como esses dois eventos so independentes, temos: p = 1/52 x 1/51= 1/2652 ou 0,04%. 8 Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52 cartas? Resposta: Temos pR = 4/52 = 1/13, pD = 1/13 pV = 1/13. Como esses eventos so mutuamente exclusivos, vem: p = 1/13 + 1/13 + 1/13 = 3/13 ou 23,08%. 9 Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um baralho de 52 cartas? Resposta: Temos pC = 13/52 = 1/4, pO = 1/4. Como esses eventos so mutuamente exclusivos, vem: p = 1/4 + 1/4 = 1/2 ou 50%. 10 No lanamento de um dado, qual a probabilidade de se obter um nmero no-inferior a 5? Resposta: A probabilidade de se ter um nmero no-inferior a 5 a probabilidade de se obter 5 ou 6. Assim, p = 1/6 + 1/6 = 1/3 ou 33,33%. 11 So dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma dama e um rei, no necessariamente nesta ordem? Resposta: A probabilidade de tirarmos uma dama do primeiro baralho p = 4/52 = 1/13 e um rei do segundo p = 4/52 = 1/13, de acordo com o problema: p1 = 1/13 x 1/13= 1/169.

89

A probabilidade de tirarmos um rei do primeiro baralho e uma dama do segundo : p2 = 1/13 x 1/13= 1/169. Como esses dois eventos so mutuamente exclusivos, temos: p = 1/169 + 1/169= 2/169 ou 1,18%. 12 Dois dados so lanados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10. Resposta: A soma dever ser ento 10, 11 ou 12. Para que a soma seja 10, a probabilidade (4,6); (5,5) e (6,4), logo: p = 3/36. Para que a soma seja 11, a probabilidade (5,6) e (6,5), logo: p = 2/36. Para que a soma seja 12, a probabilidade (6,6), logo: p = 1/36. Como esses trs eventos so mutuamente exclusivos, temos: p = 3/36 + 2/36 + 1/36 = 6/36 = 1/6 ou 16,67%.

90

IX DISTRIBUIES BINOMIAL E NORMAL Neste captulo apresentaremos dois modelos tericos de distribuio de probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo de grande nmero de problemas prticos. 1 - Varivel Aleatria Suponhamos um espao amostral S e que cada ponto amostral seja atribudo um nmero. Fica, ento, definida uma funo chamada varivel aleatria, indicada por uma letra maiscula, sendo seus valores indicados por letras minsculas. Assim, se o espao amostral relativo ao lanamento de duas moedas S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)} e se X representa o nmero de caras que aparecem, a cada ponto amostral podemos associar um nmero para X, de acordo com a tabela abaixo: PONTO AMOSTRAL (Ca, Ca) (Ca, Co) (Co, Ca) (Co, Co) 2 Distribuio de Probabilidade Consideremos a distribuio de frequncias relativa ao nmero de acidentes dirios em um estacionamento: N DE ACIDENTES 0 1 2 3 TOTAL FREQUENCIAS 22 5 2 1 30 X 2 1 1 0

91

Em um dia, a probabilidade de: - no ocorrer acidente : p = 22/30 = 0,73 ou 73% - ocorrer um acidente : p = 5/30 = 0,17 ou 17% - ocorrerem dois acidentes : p = 2/30 = 0,07 ou 7% - ocorrerem trs acidentes : p = 1/30 = 0,03 ou 3% Podemos, ento, escrever: N DE ACIDENTES 0 1 2 3 TOTAL PROBABILIDADES 0,73 0,17 0,07 0,03 1,00

Essa tabela denominada distribuio de probabilidade. Seja X uma varivel aleatria que pode assumir os valores x1, x2, x3, ....., xn. A cada valor xi correspondem a probabilidade pi de ocorrncia de tais pontos no espao amostral. Assim, temos:
pi = 1

Os valores x1, x2, x3, ....., xn e seus correspondentes p1, p2, p3, ....., pn definem uma distribuio de probabilidade. Assim, voltando a tabela inicial. Temos:

92

Logo, podemos escrever: N DE CARAS (X) 0 1 2

P(X) 1/4 2/4 1/4 1

Ao definir a distribuio de probabilidade, estabelecemos uma correspondncia unvoca entre os valores da varivel aleatria X e os valores da varivel P. Esta correspondncia define uma funo; os valores xi (i = 1, 2, 3, ...., n) formam o domnio da funo e os valores de pi (i = 1, 2, 3, ...., n), o seu conjunto imagem. Essa funo, assim definida, denominada funo probabilidade e representada por:
f(x) = P(X = xi)

A funo P(X = xi) determina a distribuio de probabilidade de varivel aleatria X. Assim, ao lanarmos um dado, a varive l aleatria X, definida por pontos de um dado, pode tomar os valores 1, 2, 3, ........., 6. Como a cada um destes valores est associada uma e uma s probabilidade de realizao e P(xi) = 1, fica definida uma funo de probabilidade, da qual resulta a seguinte distribuio de probabilidade:

X 1 2 3 4 5 6

P(X) 1/6 1/6 1/6 1/6 1/6 1/6 1

93

3 Distribuio Binomial Eventos binomiais so marcados pela existncia de duas categorias, mutuamente excludentes e coletivamente exaustivos. Mutuamente excludentes significa que uma categoria implica a possibilidade da no-ocorrncia simultnea da outra categoria. Por coletivamente exaustivas entende-se que a unio de ambos os eventos resulta no espao amostral. Exemplos de eventos binomiais podem ser fornecidos por meio de nmeros pares e mpares no lanamento de um dado honesto, e por meio da extrao de cartas vermelhas e pretas de um baralho. Geralmente, em anlises estatsticas, os exemplos mais comuns de eventos binomiais so aqueles que estabelecem situaes de sucesso e fracasso. Situaes de sucesso correspondem quilo que se deseja estudar. Situaes de fracasso correspondem ao complemento. Ou seja, quilo que no se deseja estudar. Vamos, neste item, considerar experimentos que satisfaam as seguintes condies: a. O experimento deve ser repetido, nas mesmas condies, um nmero finito de vezes (n). b. As provas repetidas devem ser independentes, isto , o resultado de uma no deve afetar os resultados das sucessivas. c. Em cada prova deve aparecer um dos dois possveis resultados: sucesso e insucesso. d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q = 1 p) do insucesso manter-se-o constantes. Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n tentativas. O experimento obteno de caras em cinco lanamentos sucessivos e independentes de uma moeda satisfaz essas condies. Sabemos que, quando da realizao de um experimento qualquer em uma nica tentativa, se a probabilidade de realizao de um evento (sucesso) p, a probabilidade de no-realizao desse mesmo evento (insucesso) 1 p = q.

94

Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e independentes. A probabilidade de que um evento se realize k vezes nas provas dada pela funo:

Na qual: P (X = k) a probabilidade de que o evento se realize k vezes em n provas; p a probabilidade de que o evento se realize em uma s prova sucesso; q a probabilidade de que o evento no se realize no decurso dessa insucesso;

Essa funo, denominada lei binomial, define a distribuio binomial. Exerccios Resolvidos 1 Uma moeda lanada 5 vezes seguidas e independentes. Calcule a probabilidade de serem obtidas 3 caras nessas 5 provas.

95

2 Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A ganhar 4 jogos.

3 Uma moeda honesta, que apresenta a mesma probabilidade de cara ou coroa, jogada quatro vezes. Deseja-se calcular a probabilidade de sair cara: (a) uma vez; (b) trs vezes, (c) pelo menos uma vez. Neste caso, sabe-se que n igual a 4 (nmero de lances da moeda); a probabilidade de sair cara igual a meio, ou p = 0,50. A probabilidade de sair coroa tambm igual a meio, ou q = 1 p = 1 0,50 = 0,50. A varivel x varia para cada situao: (a) Para calcular a probabilidade de ocorrer apenas uma cara, x = 1. P(x = 1) = C4,1(0,50)1(0,50)4-1 = 0,25 ou 25% (b) Para calcular a probabilidade de ocorrerem trs caras, x = 3. P(x = 3) = C4,3(0,50)3(0,50)4-3 = 0,25 ou 25% (c) Pelo menos uma vez implica na aceitao do nmero de caras igual a 1, 2, 3 ou 4, ou na probabilidade de x = 1, ou x = 2, ou x = 3, ou x = 4. Ou, de forma mais fcil, pelo menos uma vez implica na aceitao de qualquer resultado menos o resultado x = 0. P(x 1) = P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4) = 1 - P(x = 0) P(x 1) = 1 - C4,0(0,50)0(0,50)4-0 = 1 - 0,0625 = 0,9375 ou 93,75%
96

4 A probabilidade de uma duplicata ser paga em dia de 70%. Escolhemos ao acaso seis duplicatas para uma auditoria. Deseja-se calcular a probabilidade de: (a) todas serem pagas em atraso; (b) Apenas uma ser paga em dia; (c) todas serem pagas em dia. Soluo: para resolver este problema podemos considerar como evento sucesso i) duplicata paga em dia; ii) duplicata paga em atraso. Considerando a primeira opo temos: (a) Para calcular a probabilidade de todas serem pagas em atraso, ou nenhuma ser paga em dia, temos x = 0. P(x = 0) = C6,0(0,70)0(0,30)6-0 = 0,0007 ou 0,07% (b) Para calcular a probabilidade de apenas uma duplicata ser paga em dia, temos x = 1. P(x = 1) = C6,1(0,70)1(0,30)6-1 = 0,01 ou 1% (c) Para calcular a probabilidade de todas as duplicatas serem pagas em dia, temos x = 6. P(x = 6) = C6,6(0,70)6(0,30)6-6 = 0,118 ou 11,8% Exerccios propostos 1 Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda. 2 Jogando-se um dado trs vezes, determine a probabilidade de se obter um mltiplo de 3 duas vezes. 3 Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A: a. Ganhar dois ou trs jogos; b. Ganhar pelo menos um jogo. 4 A probabilidade de um atirador acertar o alvo em um nico tiro 2/3. Se ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros? 5 Seis parafusos so escolhidos ao acaso da produo de certa mquina, que apresenta 10% de peas defeituosas. Qual a probabilidade de serem defeituosos dois deles?
97

4 Distribuio Normal Entre as distribuies tericas de varivel aleatria contnua, uma das mais empregadas a distribuio normal. Consiste em uma distribuio contnua de probabilidades, onde a apresentao da distribuio de frequncias f(x) de uma varivel qualitativa x costuma apresentar-se em forma de sino e simtrica em relao mdia. O estudo da distribuio normal recebeu contribuies de matemticos importantes, como De Moivre, Laplace e Gauss. Alguns estudos revelam que medies repetidas de uma mesma grandeza, como o dimetro de uma esfera ou o peso de determinado objeto, nunca forneciam os mesmos valores. Porm, a apresentao das frequncias dos inmeros nmeros coletados sempre resultava em uma curiosa curva em forma de sino. Das observaes surgiu o nome curva normal dos erros. Muitas das variveis analisadas na pesquisa socioeconmica correspondem distribuio normal ou dela se aproximam. O aspecto grfico da distribuio normal o da figura abaixo:

Os conceitos associados distribuio Normal so simples. Em torno da mdia, valor central, registra-se alta concentrao de frequncias ou probabilidade maior de ocorrncia. medida que nos afastamos da mdia, as frequncias so reduzidas. A probabilidade de encontrarmos valores mais distantes da mdia diminui. Quanto mais longe da mdia e dos valores centrais, menores as frequncias e as probabilidades.

98

Para uma perfeita compreenso da distribuio normal, observe a figura e procure visualizar as seguintes propriedades:

1) A varivel aleatria X pode assumir todo e qualquer valor real. 2) A representao grfica da distribuio normal uma curva em forma de sino, que recebe o nome de curva normal ou de Gauss ou de Moivre. 3) A distribuio simtrica em torno da mdia ( ) 4) A rea total limitada pela curva e pelo eixo das abscissas igual a 1 ou percentagem de 100%, j que essa rea corresponde probabilidade de a varivel aleatria X assumir qualquer valor real. 5) A curva normal assinttica em relao ao eixo das abscissas, isto , aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcan-lo. 6) Como a curva simtrica em torno de , a probabilidade de ocorrer valor maior do que a mdia igual probabilidade de ocorrer valor menor do que a mdia, isto , ambas as probabilidades so iguais a 0,5 ou 50%. Escrevemos: P(X > ) = P(X < ) = 0,5 ou 50%.

Quando temos em mos uma varivel aleatria com distribuio normal, nosso principal interesse obter a probabilidade de essa varivel aleatria assumir um valor em um determinado intervalo. Vejamos como proceder, por meio de um exemplo concreto. A distribuio Normal de varivel aleatria X depende dos parmetros da media e do desvio padro, proveniente da varincia. Ento, pode ser tambm representada desta maneira: X: N ( , S2), ou seja, X segue uma distribuio Normal de media e varincia S2.

Exemplo: Seja X a varivel aleatria que representa os dimetros dos parafusos produzidos por certa mquina. Vamos supor que essa varivel tenha distribuio normal com mdia = 2 cm e desvio padro s = 0,04 cm.

Queremos conhecer a probabilidade de um parafuso tirado ao acaso ter um dimetro com valor entre 2 e 2,05 cm.

99

fcil notar que essa probabilidade, indicada por: P(2< X < 2,05) corresponde rea com hachura na figura:

O clculo direto dessa probabilidade exige um conhecimento de Matemtica mais avanado do que aquele que dispomos no curso de ensino mdio. Entretanto, podemos contornar facilmente esse problema. Basta aceitar, sem demonstrao, que, se X uma varivel aleatria com distribuio normal de mdia e desvio padro s, e ento a varivel z dada por:

tem distribuio normal reduzida, isto , tem distribuio normal de mdia 0 e desvio padro 1. As probabilidades associadas distribuio normal padronizada so encontradas em tabelas, no havendo necessidade de serem calculadas. Em anexo, apresentada uma tabela de distribuio normal reduzida, que nos d a probabilidade de Z tomar qualquer valor entre a mdia 0 e um dado valor z, isto : P(0 < Z < z) Temos, ento, que se X uma varivel aleatria com distribuio normal de mdia e desvio padro s, podemos escrever: P( < X < x) = P(0 < Z < z), com

100

Voltemos, ento, ao nosso problema. Queremos calcular P(2< X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a varivel x = 2,05, j que para x = 2 z = 0, pois = 2. Temos ento: Z = 2,05 2 / 0,04 = 1,25 donde: P(2 < X < 2,05) = P(0 < Z < 1,25) Procuremos, agora, na tabela Z em anexo, o valor de z = 1,25. Observe a forma de entrada na tabela: Na primeira coluna encontramos o valor 1,2 (nmero inteiro + 1 casa decimal). Em seguida, encontramos, na primeira linha, o valor 5 (2 casa decimal), que corresponde ao ltimo algarismo do nmero 1,25. Na interseco da linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever: P(0 < Z < 1,25) = 0,3944 Assim, a probabilidade de um parafuso fabricado por essa mquina apresentar um dimetro entre a mdia Escrevemos, ento: P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%. = 2 e o valor x = 2,05 0,3944.

101

Exerccios Resolvidos 1 Com base na tabela Z determine as probabilidades: a. P(-1,25 < Z < 0) A probabilidade procurada corresponde parte com hachura da figura:

Sabemos que: P(0 < Z < 1,25) = 0,3944 Pela simetria da curva, temos: P(-1,25 < Z < 0) = P(0 < Z < 1,25) = 0,3944ou 39,44%. b. P(-0,5 < Z < 1,48) A probabilidade procurada corresponde parte com hachura da figura:

Temos que: P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48) Como: P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915 e P(0 < Z < 1,48)= 0,4306 Obtemos: P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221ou 62,21%

102

c. P(0,8 < Z < 1,23) A probabilidade procurada corresponde parte com hachura da figura:

Temos que: P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8) Como: P(0 < Z < 1,23)= 0,3907 e P(0 < Z < 0,8)= 0,2881 Obtemos: P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026 ou 10,26% d. P(Z > 0,6) A probabilidade procurada corresponde parte com hachura da figura:

Temos que: P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6) Como: P(Z > 0)= 0,5 e P(0 < Z < 0,6)= 0,2258 Obtemos: P(Z > 0,6) = 0,5 - 0,2258 = 0,2742 ou 27,42%

103

e. P(Z < 0,92) A probabilidade procurada corresponde parte com hachura da figura:

Temos que: P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92) Como: P(Z < 0)= 0,5 e P(0 < Z < 0,92)= 0,3212, Obtemos: P(Z < 0,92) = 0,5 + 0,3212 = 0,8212 ou 82,12%. 2 Os salrios semanais dos operrios industriais so distribudos normalmente, em torno da mdia de R$ 500,00, com desvio padro de R$ 40,00. Calcule a probabilidade de um operrio escolhido ao acaso ter um salrio semanal situado entre R$ 490,00 e R$ 520,00. Devemos inicialmente, determinar os valores Z1 e Z2 da varivel de distribuio normal reduzida. Assim, Z1 = 490 500 = - 0,25 e Z2 = 520 500 = 0,5 40 40 Como: P(490 < X < 520) = P(- 0,25 < Z < 0,5) = P(- 0,25 < Z < 0) + P( 0 < Z < 0,5)= 0,0987 + 0,1915 = 0,2902 , pois, de se esperar que, em mdia, 29,02% dos operrios tenham salrios entre R$ 490,00 e R$ 520,00, ou seja, a probabilidade de um operrio escolhido ao acaso ter salrio entre R$ 490,00 e R$ 520,00 de 29,02%.
104

Exerccios Propostos 1 Sendo Z uma varivel com distribuio normal reduzida, baseado na tabela Z calcule: a. b. c. d. e. f. g. h. P(0 < Z < 1,44) P(-0,85 < Z < 0) P(- 1,48 < Z < 2,05) P(0,72 < Z < 1,89) P(Z > - 2,03) P(Z > 1,08) P(Z < - 0,66) P(Z < 0,60)

2 Um teste padronizado de escolaridade tem distribuio normal com mdia aritmtica de 100 e desvio padro de 10. Determine a probabilidade de um indivduo submetido a esse teste e escolhido ao acaso ter nota: a. b. c. d. e. Maior que 120 Maior que 80 Entre 85 e 115 Maior que 100 At qual nota apresenta 83,40% de probabilidade de acontecer

3 No exerccio anterior, qual a nota que apresenta 93,70% de probabilidade de um aluno tirar acima dela? 4 Os pesos de 600 estudantes so normalmente distribudos com mdia aritmtica de 65,3 kg e desvio padro de 5,5 kg. Determine o nmero de estudantes que pesam: a. Entre 60 e 70 kg b. Mais que 63,2 kg c. Menos que 68 kg 5 A durao de um certo componente eletrnico tem mdia de 850 dias e desvio padro de 40 dias. Sabendo que a durao normalmente distribuda, calcule a probabilidade de um componente escolhido ao acaso durar: a. Entre 700 e 1.000 dias b. Mais de 800 dias c. Menos de 750 dias
105

REFERENCIAS
Bruni, Adriano Leal. Estatstica aplicada gesto empresarial. 1.ed. So Paulo: Editora Atlas, 2007. Crespo, Antonio Arnot. Estatstica fcil. 17.ed. So Paulo: Saraiva, 2002. Hoffmann, Ronaldo; Ovalle, Vieira Sonia. Elementos de estatstica. 4.ed. So Paulo: Editora Atlas, 2003. Morettin, Pedro A. Estatstica bsica. 5.ed. So Paulo: Saraiva, 2002. Pinheiro, Joo Ismael D. Estatstica bsica: a arte de trabalhar com dados. Rio de Janeiro: Elsevier, 2009. Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonalves; Valter; Murolo, Afrnio Carlos. Estatstica: Para os cursos de economia, Administrao e Cincias Contbeis - 1. 3.ed. So Paulo: Editora Atlas, 1999. Toledo, Geraldo Luciano; Ovalle, Ivo Izidoro. Estatstica bsica. 2.ed. So Paulo: Editora Atlas, 1985.

106

ANEXOS:
Tabela de Nmeros Aleatrios; Tabela de Distribuio Normal.

107

TABELA DE NMEROS ALEATRIOS


C1 4 3 2 1 0 0 8 8 5 6 4 3 2 0 9 7 8 6 5 3 8 1 2 4 5 2 1 0 9 C2 1 0 2 9 3 8 3 8 4 7 4 5 6 1 0 2 9 3 8 4 7 4 7 3 0 5 1 2 1 C3 6 7 5 8 4 9 3 0 1 2 0 1 9 2 8 2 3 0 1 0 2 9 3 8 3 7 4 7 5 C4 1 2 3 4 5 6 7 8 9 0 5 4 3 2 1 0 9 8 7 6 1 1 2 2 3 3 4 4 5 C5 6 6 7 7 8 8 9 9 0 0 1 3 5 7 9 2 4 6 8 0 1 3 5 7 9 0 2 3 6 C6 1 3 5 7 9 1 0 2 0 3 9 3 8 4 8 5 7 6 7 1 3 2 4 3 5 4 6 6 8 C7 0 9 0 8 0 7 6 3 2 1 1 0 2 0 3 0 4 0 5 9 5 8 6 7 7 2 3 4 5 C8 2 5 1 6 2 2 3 6 0 1 9 3 3 7 8 5 1 1 9 8 2 6 5 8 0 2 2 3 6 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C27 C28 C29 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1

L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 L12 L13 L14 L15 L16 L17 L18 L19 L20 L21 L22 L23 L24 L25 L26 L27 L28 L29

108

109

EXERCCIOS DE FIXAO

110

POPULAO E AMOSTRA 1 Uma populao se encontra dividida em quatro estratos, com tamanhos N1 90 , N 2 120 , N 3 60 e N 4 480 . Ao se realizar uma amostragem estratificada proporcional, doze elementos da amostra foram retirados do primeiro estrato. Qual o nmero de elementos da amostra de cada estrato? 2 Identifique o tipo de amostragem utilizada em cada situao: simples ao acaso, sistemtica ou estratificada. a) Dentre 240 pessoas escaladas para um sorteio de jri, 120 so brancas, 80 so negras e 40 so morenas. b) Um administrador hospitalar faz uma pesquisa com as pessoas que esto na fila de espera para serem atendidas pelo sistema SUS, entrevistando uma a cada 10 pessoas da fila. c) O sorteio de um livro dentre os 40 alunos de Estatstica de uma turma da Faculdade Stella Maris. 3 Em uma escola existem 250 alunos, sendo 35 na 1 srie, 32 na 2, 30 na 3, 28 na 4, 35 na 5, 32 na 6, 31 na 7 e 27 na 8. Obtenha uma amostra de 40 alunos e preencha o quadro a seguir.

4 Uma empresa tem 3.414 empregados repartidos nos seguintes departamentos: Administrao (914), Transporte (348), Produo (1401) e Outros (751). Deseja-se extrair uma amostra entre os empregados para verificar o grau de satisfao em relao qualidade da refeio servida no refeitrio. Retire uma amostra de: a) 10% dos empregados? b) 854 empregados desta empresa
111

SRIES ESTATSTICAS E GRFICOS 1 Classifique as sries

112

3 Considere a srie abaixo: Vendas de Automveis no 1 bimestre de 2009 em So Paulo MARCA FIAT VW GM TOTAL a) Classifique a srie; b) Represente esta srie atravs de grfico de setores. 4 Considere a srie abaixo: Vendas no Ano de 2008 (em mil unidades) FILIAIS SO PAULO FORTALEZA RIO DE JANEIRO TOTAL a) Classifique a srie; b) Represente esta srie atravs de grfico de colunas; c) Represente esta srie atravs de grfico de barras; JAN 10 8 12 30 FEV 15 5 13 33 MAR 7 4 10 21 VENDAS (mil und.) 17 23 12 52

113

Complete-a com uma coluna de percentagens com uma casa decimal e faa a compensao, se necessrio. 6

114

DISTRIBUIO DE FREQUENCIA E GRFICOS 1 - Suponha que o ponto mdio das classes de uma distribuio de frequncia de umidade relativa em um posto seja: 28%, 37%, 46%, 55%, 64%, 73% e 82%. a) Encontre a amplitude da classe; b) Os limites de cada classe. 2 - Imagine que em uma regio durante um dia de inverno foram medidas 150 temperaturas mnimas (em oC) em pontos prximos. Suponha que estas temperaturas variaram entre 5,18 C a 7,44 C. Determine um conjunto de intervalos de classe que seja razovel para esse conjunto de dados. 3 Considere os dados de dimetros de laranjas (em mm), N = 66 40 - 42 - 45 - 45 - 48 - 49 - 50 - 50 - 50 - 51 - 51 - 52 - 55 - 55 - 57 - 58 - 59 59 - 60 - 60 - 60 - 61 - 62 - 62 - 64 - 64 - 64 - 64 - 64 - 65 - 65 - 66 - 67 - 68 68 - 68 - 69 - 71 - 71 - 72 - 72 - 73 - 75 - 75 - 78 - 78 - 79 - 80 - 80 - 81 - 83 85 - 87 - 88 - 89 - 91 - 92 - 93 - 96 - 96 - 98 - 100 -101- 101 - 101 -102 Construa a Tabela de Distribuio de Frequncias com classes para a amostra, usando: a) intervalos de classes adequados para se obter 8 classes; b) Com os dados obtidos calcule as frequncias relativas para cada classe. 4 Considere os dados da quantidade de gordura no leite (em %), n = 49 3,66 - 3,66 - 3,72 - 3,74 - 3,74 - 3,77 - 3,81 - 3,88 - 3,89 - 3,91 - 3,96 - 3,96 3,97 - 3,97 4,00 - 4,00 - 4,02 - 4,03 - 4,05 - 4,06 - 4,08 - 4,10 - 4,10 - 4,15 4,16 - 4,20 - 4,20 - 4,23 4,24 - 4,25 - 4,27 - 4,28 - 4,29 - 4,32 - 4,32 - 4,33 4,38 - 4,38 - 4,38 - 4,40 - 4,41 - 4,42 4,49 - 4,60 - 4,67 - 4,70 - 4,71 - 4,81 4,82 Use os dados da amostra classificada em 7 classes e construa o grfico em colunas e o polgono de frequncias.

115

5 - Na Tabela, identifique a amplitude dos intervalos de classe e os pontos mdios de cada classe. Classes [0 6[ [6 12[ [12 18[ [18 24[ [24 30[ Total Frequncia (fi) 39 41 38 40 42 200

Construa a tabela de frequncias relativas, percentual e acumulada. 6 - A tabela abaixo apresenta a distribuio de frequncia dos salrios mensais em reais, de 65 empregados da companhia P & R. Salrios (R$) 5.000 |--- 6.000 6.000 |--- 7.000 7.000 |--- 8.000 8.000 |--- 9.000 9.000 |--- 10.000 10.000 |--- 11.000 11.000 |--- 12.000 Total N. de Empregados 8 10 16 14 10 5 2 65

Determinar: a) O limite inferior da 6 classe; b) O limite superior da 4 classe; c) O ponto mdio da 3 classe; d) A amplitude do 5 intervalo de classe; e) A frequncia da 3 classe; f) A frequncia relativa da 3 classe; g) O intervalo de classe que tem a maior frequncia; h) A percentagem de empregados que ganham menos de R$ 8.000,00 por ms; i) A percentagem de empregados que ganham menos de R$ 10.000,00 e pelo menos R$ 6.000,00 por ms; j) Fazer um histograma; k) Fazer um polgono de frequncia; l) Q1; Q3; D4; D7; P30; P75.
116

MEDIDAS DE POSIO 1 Com relao s propriedades da mdia aritmtica, moda e mediana, marque V ou F nas sentenas abaixo. ( ) Multiplicando-se todos os elementos de uma srie por 5, sua mdia permanece inalterada. ( ) A mediana de uma srie disposta em ordem crescente o termo que a divide em trs partes iguais. ( ) A moda o valor da varivel que possui maior frequncia. ( ) A mediana de uma srie de 46 elementos a mdia dos valores do 23 e do 24 termos desta srie, quando ela estiver disposta em ordem crescente. ( ) A mediana de uma srie de 33 elementos o valor do 17 termo desta srie, quando ela estiver disposta em ordem decrescente. ( ) Dividindo-se todos os nmeros de uma srie com cinco elementos por 2, sua mediana ficar multiplicada por 2. 2 Com relao s propriedades da mdia aritmtica, moda e mediana, marque V ou F nas sentenas abaixo. ( ) Multiplicando-se todos os elementos de uma srie por 3, sua mdia ficar multiplicada por 3. ( ) A mediana de uma srie disposta em ordem crescente o termo que a divide em quatro partes. ( ) A moda o valor da varivel que possui menor frequncia. ( ) A mediana de uma srie de 36 elementos a mdia dos valores do 17 e do 18 termo desta srie, quando ela estiver disposta em ordem crescente. ( ) A mediana de uma srie de 13 elementos o valor do 7 termo desta srie, quando ela estiver disposta em ordem decrescente. ( ) Dividindo-se todos os elementos de uma srie de 3, sua mdia ficar multiplicada por 5. 3 - A mdia da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a: ( ) 15 ( ) 12 ( ) 15,5 ( ) 14 ( ) Nenhuma das anteriores

4 - A mediana da srie {21, 13, 8, 15, 30, 12, 17, 3, 26, 10, 25, 16} igual a: ( ) 15 ( ) 12 ( ) 16 ( ) 14 ( ) Igual a 15,5

5 - A moda da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a: ( ) 15 ( ) 12 ( ) 15,5 ( ) 14 ( ) Nenhuma das anteriores

117

6 - A mdia da srie {21, 13, 8, 15, 30, 12, 17, 3, 26, 10, 25, 16} igual a: ( ) 15 ( ) 12 ( ) 16 ( ) 14 ( ) 15,5 ( ) Nenhuma das anteriores

7 - A moda da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 12} igual a: ( ) 15 ( ) 12 ( ) 15,5 ( ) 14 ( ) Nenhuma das anteriores

8 - Considere a tabela de distribuio de frequncia a seguir, calcule a mdia, a moda e a mediana das encomendas devolvidas em 35 correios de Fortaleza no ms de abril de 2012: N. DE CHEQUES (un) 36 |---- 40 40 |---- 44 44 |---- 48 48 |---- 52 52 |---- 56 56 |---- 60 Total FREQ. SIMPLES (fi) 6 9 4 8 5 3 35

9 - A tabela apresenta os pesos em quilogramas, de 20 alunos de uma sala. Faa a distribuio de frequncia e baseado nela responda as questes abaixo: 45 43 75 58 Determinar: a) O peso mdio dos alunos; b) A classe modal e a moda do peso dos alunos; c) A classe mediana e a mediana do peso dos alunos. 48 66 46 57 72 71 60 58 41 50 54 60 62 66 78 80

118

10 - Considere a seguinte distribuio de frequncia sem intervalos de classes, calcule a mdia, a moda e a mediana do peso das 10 pessoas entrevistadas: PESO (kg) 41 43 50 54 57 60 Total FREQ. SIMPLES (fi) 3 1 2 1 1 2 10

DESVIO PADRO E VARINCIA 1 Com relao s propriedades do desvio-padro, coloque V ou F nas sentenas abaixo: ( ) O desvio padro pode assumir qualquer valor numrico. ( ) O desvio - padro representa o grau de variabilidade de um conjunto de dados, ou seja, quanto maior o valor do desvio-padro mais compactos so seus dados. ( ) Quando o valor do desvio-padro zero, todos os valores do conjunto de dados so iguais, no h variao entre eles. ( ) Quando multiplicarmos uma constante a um conjunto de dados, podemos afirmar que seu desvio-padro fica multiplicado por essa constante, assim como sua mdia. ( ) Quando somamos uma constante K a um conjunto de dados, podemos afirmar que seu desvio-padro e sua mdia permanecem inalterados. ( ) Para calcularmos o desvio-padro e a varincia para uma populao e para uma amostra, devemos proceder da mesma maneira. 2 Considere o conjunto de A = {3, 5, 6, 8}, que tem mdia igual a 5,5 e desvio-padro igual a 2,08. Sobre o conjunto B = {9, 15, 18, 24} podemos afirmar que: ( ( ( ( ( ) Sua mdia e seu desvio-padro no se alteram. ) A mdia permanece a mesma e seu desvio-padro fica multiplicado por 3. ) Seu desvio-padro o mesmo e a mdia fica multiplicada por 3. ) Tanto a mdia como o desvio-padro ficam multiplicados por 3. ) Nada podemos afirmar em relao a mdia e seu desvio-padro.
119

3 - Considere os seguintes conjuntos de nmeros: A = {10, 20, 30, 40, 50} B = {100, 200, 300, 400, 500}

Que relao existe entre os desvios padres dos dois conjuntos de nmeros? 4 - Dados os conjuntos de nmeros: A = {220, 230, 240, 250, 260} B = {20, 30, 40, 50, 60}

Que relao existe entre os desvios padres dos dois conjuntos de nmeros? 5- Dados os conjuntos de nmeros: A = {-2, -1, 0, 1, 2 } B = {220, 225, 230, 235, 240}

Podemos afirmar, de acordo com as propriedades do desvio padro, que o desvio padro de B igual: a) ao desvio padro de A; b) ao desvio padro de A, multiplicado pela constante 5; c) ao desvio padro de A, multiplicado pela constante 5, e esse resultado somado a 230; d) ao desvio padro de A mais a constante 230. 6 Considere a populao A = {1, 3, 7, 9, 6} calcule seu desvio-padro e a varincia. 7 Considere a amostra B = {2, 5, 6, 13, 7, 8} calcule sua mdia, o desviopadro e a varincia. 8 Compare as medidas de posio e disperso das amostras A e B e chegue concluso de qual das duas pode ser considerada a amostra mais consistente. A = {0, 2, 8, 10} e B = {3, 4, 6, 7}.

120

9 - Considere a distribuio de frequncia transcrita a seguir como de uma populao. Calcule seu desvio-padro e sua varincia. PESO (kg) FREQ. SIMPLES 41 3 43 1 50 2 54 1 57 1 60 2 TOTAL 10 10 Considere a seguinte amostra, faa a distribuio de frequncia por classes e calcule o desvio-padro e a varincia. A = (45, 43, 41, 42, 68, 42, 43, 42, 44, 41, 50, 46, 50, 46, 51, 60, 62, 54, 55, 52,64, 58, 57, 58, 67, 60, 51, 70, 65, 61).

PROBABILIDADE 1- No lanamento de um dado temos S = {1, 2, 3, 4, 5, 6}. Formule os eventos definidos pelas sentenas: (a) Obter um nmero par; (b) Obter um nmero menor ou igual a 6; (c) Obter o nmero 4; (d) Obter um nmero maior que 6. 2 Construa o espao amostral do evento lance de um dado honesto. Em relao ao espao amostral, calcule: (a) a probabilidade de ocorrer face cinco; (b) a probabilidade de no ocorrer face trs. 3 Determine o espao amostral do evento extrao de uma carta de um baralho honesto. Calcule a probabilidade de: (a) extrair uma carta de copas; (b) extrair um rei; (c) extrair um valete de paus. 4 - Um dado foi fabricado de tal forma que num lanamento a probabilidade de ocorrer um nmero par o dobro da probabilidade de ocorrer nmero mpar na face superior, sendo que os trs nmeros pares ocorrem com igual probabilidade, bem como os trs nmeros mpares. Determine a probabilidade de ocorrncia de cada evento elementar.

121

5 Um dado e uma moeda so lanados. Pede-se: (a) construir o espao amostral; (b) enumerar os eventos: (i) sair cara e par; (ii) sair coroa e mpar; (iii) sair mltiplo de trs; (c) calcular as probabilidades da letra b. 6 - Seja S = {a, b, c, d}, com a seguinte distribuio de probabilidades: P(a) = 1/8; P(b) = 1/8; P(c) = 1/4 e P(d) = x. Calcule o valor de x. 7- As chances de um time de futebol T ganhar o campeonato que est disputando so de "5 para 2". Determinar a probabilidade de T ganhar e a probabilidade de T perder. 8 Um grupo de 20 pessoas formado por 12 homens e 8 mulheres. Em relao ao sorteio de um elemento deste grupo, calcule: (a) a probabilidade de ser homem; (b) a probabilidade de ser mulher. 9 Uma bola retirada ao acaso de uma urna que contm 12 bolas pretas, 16 verdes e 8 rosas. Calcule a probabilidade de: (a) no ser verde; (b) no ser preta; (c) ser rosa. 10- Trs cavalos C1, C2 e C3 disputam um preo, onde s se premiar o vencedor. Um conhecedor desses cavalos afirma que as "chances" de C1 vencer so o dobro das de C2, e que C2 tem o triplo das "chances" de C3. Calcule as probabilidades de cada cavalo vencer o preo. DISTRIBUIO BINOMIAL 1- Uma moeda lanada 20 vezes. Qual a probabilidade de sarem 8 caras? 2 Numa criao de coelhos, 40% so machos. Qual a probabilidade de que nasam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos? 3 Uma prova tipo teste tem 50 questes independentes. Cada questo tem 5 alternativas. Apenas uma das alternativas a correta. Se um aluno resolve a prova respondendo a esmo as questes, qual a probabilidade de tirar nota 5? 4 Uma urna tem 20 bolas pretas e 30 brancas. Retiram-se 25 bolas com reposio. Qual a probabilidade de que: a. 2 sejam pretas? b. Pelo menos 3 sejam pretas? c. 10 sejam brancas?

122

5 A probabilidade de um arqueiro acertar o alvo com uma nica flecha 0,20. Lana 30 flechas no alvo. Qual a probabilidade de que: a. Exatamente 4 acertem o alvo? b. Pelo menos 3 acertem o alvo? 6 Considere 10 tentativas independentes de um experimento. Cada tentativa admite sucesso com probabilidade 0,05. Seja X o nmero de sucessos, calcular P (1< x 4). 7 Uma urna tem 10 bolas brancas e 40 pretas. Qual a probabilidade de que em 30 bolas retiradas com reposio ocorram no mximo 2 brancas? 8 A probabilidade de um atirador acertar no alvo num nico tiro 1/4. O atirador atira 20 vezes no alvo. Qual a probabilidade de acertar: a. Exatamente 5 vezes? b. Pelo menos 3 vezes? c. Nenhuma vez? d. No mximo 4 vezes? 9 Uma urna contm 8 bolas brancas e 12 pretas. Retiram-se 10 bolas com reposio. Qual a probabilidade de que: a. No mximo 2 sejam brancas? b. 3 sejam brancas? 10 A probabilidade de uma mquina produzir uma pea defeituosa, num dia, de 0,1. Qual a probabilidade de que em 20 peas produzidas pela mquina num dia, ocorram 3 defeituosas? 11 Uma pesquisa, com 420 casais que possuem cinco filhos, constatou que a probabilidade de nascimento de meninos de 58%. Nestas 420 famlias com cinco crianas cada uma, quantas se esperaria que tivessem: a) Nenhuma menina; b) Trs meninos; c) Quatro meninos.

123

12 As pacientes diagnosticadas com certa doena tm 80% de chance de serem curadas. Para um grupo de doze pacientes nessas condies, calcule a probabilidade de: a) Oito ficarem completamente curadas; b) Entre trs (inclusive) e cinco (inclusive) no serem curadas; c) No mais do que duas permanecerem com a doena. 13 Uma empresa comercial calcula que 5% de suas vendas no so recebidas, em funo do recebimento de cheques sem fundos. Ao se analisar uma amostra formada por oito vendas, qual a probabilidade de: (a) todas serem pagas normalmente? (b) uma ou duas vendas, apenas, serem pagas? (c) pelo menos trs vendas serem pagas normalmente? (d) todas as vendas no serem pagas? 14 Existem treze jogos na Loteria Esportiva. Em cada um dos jogos, determinado time pode ganhar ou empatar ou perder. Calcule a probabilidade de um jogador que nada sabe sobre os times: (a) acertar todos os jogos; (b) acertar pelo menos um jogo; (c) acertar pelo menos doze jogos. Use o maior nmero de casas decimais nas respostas. DISTRIBUIO NORMAL 1 Use a tabela Z para encontrar as seguintes probabilidades: a. b. c. d. e. f. g. h. P (Z > 0,34) P (Z < 1,85) P (Z < - 1,24) P (1,56 < Z < 2,37) P (-0,37 < Z < 3,4) P (Z > 1,08) P (Z < - 0,66) P (Z < -2,30 ou Z > 1,29)

2 seja X: N (100,25). Calcular a. b. c. d. e. P (100 X 106) P (89 X 107) P (112 X 116) P (X 108) P (X 90)

124

3 Sendo X: N (50,16), determinar X, tal que: a. P (X X) = 0,05 b. P (X X) = 0,99 4 Um fabricante de baterias sabe, por experincia passada, que as baterias de sua fabricao tm vida mdia de 600 dias e desvio padro de 100 dias, sendo que a durao tem aproximadamente distribuio Normal. O fabricante oferece uma garantia de 312 dias, isto , troca as baterias que apresentarem falhas nesse perodo. A fbrica produz mensalmente 10.000 baterias. Quantas baterias ele dever trocar mensalmente pelo uso da garantia? 5 Uma fbrica de carros sabe que os motores de sua fabricao tm durao normal com mdia de 150.000 km e desvio padro de 5.000 km. Qual a probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa firma, tenha um motor que dure: a. Menos de 170.000 km? b. Entre 140.000 e 165.000 km? c. Se a fbrica substitui o motor que apresenta durao inferior garantia, qual deve ser esta garantia para que a porcentagem de motores substitudos seja inferior a 0,2%? 6 As pontuaes de QI seguem uma distribuio normal com uma pontuao mdia de 100 e desvio padro de 15, isto , X ~ N (100,225). Encontre a porcentagem de pessoas que se espera possuir uma pontuao de QI: a. De menos de 70? b. Entre 80 e 120? c. De mais de 50? 7 Os salrios dos diretores das empresas de So Paulo distribuem-se normalmente com mdia de R$ 8.000,00 e desvio padro de R$ 500,00. Qual a percentagem de diretores que recebem: a. Menos de R$ 6.470,00? b. Entre R$ 8.920,00 e R$ 9.380,00?

125

8 A quantidade de leo contida em cada lata fabricada por uma indstria tem peso distribudo normalmente, com mdia de 990 g e desvio padro de 10 g. Uma lata rejeitada no comrcio se tiver peso menor que 976 g. a. Qual a probabilidade de que em 10 latas observadas, uma seja rejeitada? b. Nas condies do item a, qual a probabilidade de que em 20 latas observadas, 3 sejam rejeitadas? 9 Foi feito um estudo sobre a altura dos alunos da Faculdade Stella Maris. Observou-se que ela se distribui normalmente com mdia de 1,72 m e desvio padro de 5 cm. Qual a porcentagem dos alunos com altura: a. Entre 1,57 e 1,87 m? b. Acima de 1,90 m? 10 Um estudo das modificaes dos preos, no atacado, de produtos industrializados, mostrou que h distribuio normal com mdia de 50% e desvio padro de 10%. Qual a porcentagem dos artigos que: a. Sofreram aumentos superiores a 75%? b. Sofreram aumentos entre 30% e 80%? 11 O volume de correspondncia recebido por uma firma quinzenalmente tem distribuio normal com mdia de 4000 cartas e desvio padro de 200 cartas. Qual a percentagem de quinzenas em que a firma recebe: a. Entre 3600 e 4250 cartas? b. Mais de 4636 cartas? c. Menos de 3400 cartas? 12 Numa fbrica foram instaladas 1000 lmpadas novas. Sabe-se que a durao mdia das lmpadas de 800 horas e desvio padro de 100 horas, com distribuio normal. Determinar a quantidade de lmpadas que duraro: a. Menos de 500 horas? b. Mais de 700 horas? c. Entre 516 e 684 horas?

126

13 Um fabricante de mquinas de lavar sabe, por longa experincia, que a durao tem durao de suas mquinas tem distribuio normal com mdia de 1000 dias e desvio padro de 200 dias. O fabricante oferece uma garantia de 1 ano (365 dias) para o produto. Produz mensalmente 2000 mquinas. Quantas mquinas ele espera trocar mensalmente pelo uso da garantia dada? 14 Um fabricante de produtos alimentcios vende um de seus produtos em latas de 900 g de contedo lquido. Para embalar o produto, adquiriu uma mquina que permite obter o peso desejado, com distribuio normal e desvio padro de 10 g. O IPM (Instituto de Pesos e Medidas) exige que no mximo 5% das latas contenham menos do que o peso lquido nominal. Responda: a) Se a mquina for regulada para 910 g, poder satisfazer esta exigncia do IPM? b) Qual dever ser a regulagem da mquina para que a exigncia do IPM seja satisfeita? c) Feita esta nova regulagem (item b), as latas so remetidas ao comrcio. O IPM examina, ento, uma amostra de 20 latas em um supermercado. Qual a probabilidade de encontrar pelo menos trs com o peso inferior ao especificado na embalagem? 15 Um teste de aptido feito por pilotos de elite em treinamento inicial requer que uma srie de operaes seja realizada em uma rpida sucesso. Suponha que o tempo para completar o teste seja distribudo normalmente com mdia de 80 minutos e desvio padro de 30 minutos. Para passar no teste, o candidato deve complet-lo em menos de 70 minutos. Pede-se: a) Se 200 candidatos fazem o teste, quantos so esperados passar no teste? b) Se os 5% melhores candidatos sero alocados para aeronaves maiores, quo rpido deve ser o candidato para que obtenha essa posio? 16 A distribuio dos pesos de porcos numa suinocultura pode muito bem ser representada por uma distribuio normal, com mdia de 128,72 kg e desvio padro de 32,46 kg. Um matadouro comprar 5000 porcos e pretende classific-los de acordo com o peso, do seguinte modo: 18% dos mais leves como pequenos, os 50% seguintes como mdios, os 22% seguintes como grandes e os 10% mais pesados como extras. Quais os limites de peso para cada classificao?

127

17 Um pesquisador verificou que em uma cidade do interior de So Paulo o peso dos homens tem distribuio aproximadamente normal com mdia de 85 kg e desvio padro de 20 kg, enquanto o das mulheres tambm apresenta-se normalmente distribudo, com mdia de 60 kg e desvio padro de 8 kg. Pedese: (a) sorteando-se um homem, qual a probabilidade de ele ter peso acima de 75 kg? (b) sorteando-se uma mulher, qual a probabilidade de ela ter peso acima de 65 kg? (c) qual a probabilidade de uma pessoa ter peso acima de 65 kg, sendo ela sorteada de um grupo em que o nmero de mulheres o triplo do de homens? 18 Para ser aprovado em um exame de seletivo um candidato deve obter nota superior a 8,2 em matemtica e superior a 9,5 em portugus. Sabendo que as notas seguem uma distribuio normal, com media e varincia apresentados na tabela seguinte, calcule quantos alunos de um grupo de 950 devem ser aprovados neste processo seletivo. PROVA PORTUGUES MATEMTICA MEDIA 7,3 6,1 VARIANCIA 7,29 3,24

128