Você está na página 1de 69

APOSTILA DE ESTATSTICA

PROF. VITOR JOAO DAMATO

SUMRIO 1- Definies Bsicas 1.1 Estatstica: 1.2 Populao, Amostra e Censo: 1.3 Estatstica Descritiva e Estatstica Indutiva 1.4 Tipos de Variveis 2. A Metodologia da Pesquisa Estatstica 2.1. Introduo 2.2. Metodologia da Pesquisa 2.3. Apurao dos Dados e Apresentao dos Resultados. 2.4. Anlise, Interpretao dos Resultados. 2.5. Concluso ou Comentrios Finais 2.6 Bibliografia 3. Tcnicas Amostrais 3.1 Amostras Probabilsticas 3.2 Amostragem Aleatria Estratificada 3.3 Amostras No-Probabilsticas 3.4 Dimensionamento da Amostra 4 . ndices, Coeficientes E Taxas 5 Representaes Grficas 5.1 Histogramas 5.2 Grfico De Barras Simples 5.3 Grfico De Setores 5.4 Grfico De Linha 5.5 Grfico De Colunas Ou Barras Mltiplas 5.6 Grfico De Linhas Mltiplas 6. Distribuio De Frequencias - Estatstica Descritiva 7. Medidas de Posio ou Medidas de Tendncia Central 7.1 Mdia 7.2 Moda 7.3 Mediana 8. Medidas de Disperso 8.1 Desvio Mdio 8.2 Varincia 8.3 Desvio Padro 8.4 Amplitude Total, 9. Distribuio de Freqncia Varivel Contnua 10. Medidas de Tendncia Central para Varivel Contnua 10.1 Mdia de uma Distribuio de Freqncia, Pg. 3 Pg. 3 Pg. 3 Pg. 4 Pg. 5 Pg. 7 Pg. 7 Pg. 8 Pag13 Pg. 13 Pg. 14 Pg. 14 Pg. 15 Pg. 15 Pg. 17 Pg. 19 Pg. 20 Pg. 22 Pg. 23 Pg. 23 Pg. 25 Pg. 26 Pg. 27 Pg. 28 Pg. 29 Pg. 30 Pg. 36 Pg. 36 Pg. 38 Pg. 39 Pg. 42 Pg. 42 Pg. 43 Pg. 44 Pg. 45 Pg. 47

Pg. 49
2

10.2 Moda de Uma Distribuio de Freqncia, 10.3 Mediana de uma Distribuio de Freqncia, Md 10.4 Separatrizes: Quarts, Decs E Percents 11. Medidas de Disperso para Variveis Contnuas 11.1 Clculo do Dms Para Varivel Contnua. 11.2 Varincia 11.3 Desvio Padro 12. Probabilidades 12.1 - Noes de Probabilidade, Tipos de eventos, Aplicaes 12.2 - Teorema do Produto 12.3 - Teorema da Soma 12.4 - Eventos com e sem reposio 12.5 Unio interseco de 2 e 3 conjuntos . Aplicaes

Pg. 50 Pg. 51 Pg. 53

Pg. 54 Pg. 55 Pg. 55

Pg. 56 Pg. 58 Pg. 59 Pg. 60 Pg. 61

DISCIPLINA: ESTATSTICA 1- DEFINIES BSICAS


Para podermos estudar a Estatstica de fundamental importncia conhecer algumas definies, bem como, a aplicao de termos tcnicos ou nomenclatura especfica. Seguem abaixo as definies bsicas

1.1 Estatstica:
Na Idade Mdia colhiam-se informaes, em geral com objetivos tributrios ou blicos. A partir do sculo XVI comearam a surgir s primeiras anlises de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tbuas e tabelas e os primeiros nmeros relativos. No sculo XVIII o estudo destes fatos foi adquirindo feio verdadeiramente cientfica. O alemo Godofredo Achenwall batizou a nova cincia (ou mtodo) como Estatstica, determinando o seu objetivo e suas relaes com as cincias. Vrios autores tm procurado conceituar a Estatstica, existem muitos livros contendo conceitos dos mais simples at os mais complexos, citando dois destes conceitos: Estatstica uma coleo de mtodo para planejar experimentos, obter dados e organiz-los, resumi-los, analis-los, interpret-los e deles extrair concluses (Triola, 1999, p. 2). Estatstica uma parte da Matemtica Aplicada que fornece mtodos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. (Arnot, 1997, p.13). Atualmente, os estudos estatsticos tm avanado rapidamente e, com seus processos e tcnicas, tm contribudo para a organizao dos negcios e recursos do mundo moderno. Assim, podemos dizer que a Estatstica est interessada nos mtodos cientficos para coleta, organizao, resumo, apresentao e anlise de dados, bem como na obteno de concluses vlidas para a tomada de decises baseadas em tais anlises.

1.2. Populao, Amostra e Censo:


Quando formos estudar um fenmeno poderemos coletar dados de vrias formas. Ressaltamos que todo objeto de estudo denomina-se fenmeno (o significado da palavra fenmeno em estatstica no o de algo incomum ou raro como normalmente utilizado, mas sim, para definir o que esta sendo estudado).
4

Ao coletar os dados referentes s caractersticas de um grupo de objetos ou indivduos, como altura e peso de funcionrios ou nmeros de peas defeituosas produzidos em uma empresa, muitas vezes impossvel ou impraticvel observar todo o grupo, especialmente se for muito grande. Em vez de examinar todo o grupo, denominado Populao ou universo, examina-se uma pequena parte chamada Amostra. Uma Amostra , portanto, um subconjunto finito de uma populao que mantm suas caractersticas (totais ou parciais). Cada subconjunto da populao denominado de Amostra. Exemplo Fenmeno coletivo: Eleio para governador do Estado de SP. Populao: Conjunto de todos os eleitores do estado. Parmetro: Proporo de votos destinados pela populao ao candidato A Amostra: Grupo de 1580 eleitores escolhidos no Estado Estimador: Proporo de votos destinados ao candidato A na amostra

Censo: Quando ao efetuarmos o estudo de determinado fenmeno todos os


elementos da populao participam na coleta de dados. Vantagens: Admite erro zero; Confiabilidade 100% Desvantagens: caro; lento; quase sempre desatualizado; Nem sempre vivel.

Estimao por amostragem:


uma avaliao indireta de um parmetro, com base em um estimador, utilizando-se de uma amostra. Vantagens: bem mais barata; rpida; atualizada; Sempre vivel. Desvantagens: Admite erro processual positivo; Tem confiabilidade menor que 100% As tabelas tornaram-se mais completas, surgiram s representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser catalogao de dados numricos coletivos para se tornar o estudo de como chegar a concluses sobre o todo (populao), partindo da observao de partes desse todo (amostra).

1.3. Estatstica Descritiva e Estatstica Indutiva


Estatstica Descritiva ou Dedutiva aquela que tem por objeto descrever e analisar determinado grupo, sem pretender tirar concluses de carter mais genrico, no estende seus resultados a outros grupos externos daquele que foram coletados os dados. Estatstica Indutiva ou Inferncia Estatstica: baseado em resultados obtidos da anlise de determinado grupo / amostra, pode inferir, estender as leis do comportamento da populao da qual a amostra foi retirada. necessrio garantir que a amostra deve ser representativa da populao (universo).

O objetivo da Estatstica Indutiva de obter concluses sobre populaes baseado nos resultados observados em amostras. A palavra indutiva um processo de raciocnio em que, partindo do conhecimento de uma parte, procura-se tirar concluses sobre a realidade do todo. Ao induzir, portanto, estamos sempre sujeitos a erros. Com responsabilidade e bom senso, devemos aguar nossa capacidade de reconhecer dados estatsticos distorcidos. Na Estatstica indutiva, podemos determinar o erro de nossas indues, e qual a probabilidade de se confiar nas concluses obtidas. Esse fato fundamental para uma induo ser considerada estatstica, dizendo tambm qual preciso de resultados e qual probabilidade; e a forma como a induo realizada depender de cada problema.

1.4 Tipos de Variveis


Na execuo de anlise de dados, vrias caractersticas de interesse so analisadas tais como estado civil, sexo, escolaridade, vendas, participao de mercado, nmero de filhos, salrios, idade, produo de um bem; reajustes mensais, etc. A essas caractersticas chamamos de VARIVEIS. Podemos atribuir uma letra, como A, B, C etc. para representar uma varivel, por ex.

Varivel Estado civil Escolaridade Regio de residncia

Representao A B C

Varivel Salrio Idade Peso

Representao D E F .

Observando estes dados termos seis variveis.


Variveis Qualitativas: quando apresentam como possveis realizaes uma qualidade ou atributo. Ex.: sexo (masculino, feminino), estado civil (solteiro, casado, vivo, divorciado), escolaridade (1o grau, 2ograu, superior). Dentre as variveis qualitativas, ainda podemos fazer uma distino entre dois tipos: Varivel qualitativa nominal, para a qual no existe nenhuma ordenao nas possveis realizaes so elas : sexo:( masculino,feminino:no existe nenhuma ordenao), regio de residncia ( cidade, bairro , etc.) Varivel qualitativa ordinal, para a qual existe uma ordem nos seus resultados. Escolaridade uma varivel ordinal (fundamental 1 grau, 2ograu, superior ou 3 grau). Variveis Quantitativas: quando apresentam como possveis realizaes nmeros resultantes de uma contagem ou mensurao Ex. estatura, peso, salrio, n. de filhos.

Varivel quantitativa contnua: Quando os valores dos dados ordenados podem assumir qualquer valor num determinado intervalo. Corresponde a organizao dos dados em uma srie estatstica, os possveis resultados so provenientes de uma medio, para os quais qualquer valor dentro de um intervalo contnuo possvel, normalmente nmeros inteiros e/ou nmeros decimais: Ex.: peso, idade, nota de alunos, lucro , etc.) Varivel quantitativa discreta: Quando existe uma distancia entre os valores dos dados ordenados. Corresponde a organizao dos dados em uma srie estatstica, os possveis valores so provenientes de uma contagem, so somente valores fixos, normalmente nmeros inteiros: nmero de filhos, nmero de empregados, notas de R$50 circulando no pas, nmero de alunos aprovados de numa disciplina, etc. Resumidamente podemos esquematizar:

Nominal Qualitativa Varivel Ordinal Contnua Quantitativa Discreta

Notas: 1) Em algumas situaes podemos atribuir valores numricos a varias qualidades ou atributos (ou, ainda, classes) de uma varivel qualitativa e depois proceder anlise como se esta fosse quantitativa, desde que seja passvel de interpretao. 2) As variveis discretas quando agrupadas em classes de freqncias, tornam-se variveis contnuas. Toda pesquisa estatstica deve seguir uma cronologia, esta ordem chamada de Metodologia da Pesquisa Estatstica assunto do prximo captulo.

2. A METODOLOGIA DA PESQUISA ESTATSTICA


Quando se pretende empreender um estudo estatstico completo, existem fases do trabalho que devem ser desenvolvidas para chegarmos aos resultados finais do estudo. Essas etapas so chamadas fases do trabalho estatstico e so de mbito da Estatstica Descritiva. Para elaborar e desenvolver um projeto de pesquisa e/ou dissertao de mestrado e/ou tese de doutorado. Estas fases de uma pesquisa estatstica denominam-se de Metodologia da Pesquisa. Resumidamente temos os seguintes estgios ou captulos: 1- Introduo Objetivos Justificativa

2- Planejamento ou Metodologia de Coleta de dados 3- Contagem, apurao e Representao dos dados. 4- Anlise e Interpretao dos resultados 5- Concluso ou comentrios finais 6- Bibliografia (quando em trabalhos acadmicos) 2.1- Introduo
Parte de um aspecto geral, descrevendo o universo do tema at chegarmos ao ponto particular objeto da pesquisa. Esta parte extremamente importante e consiste em definir com exatido o(s) objetivo(s): OBJETIVO: O QUE ser pesquisado. Tudo deve ser convenientemente definido antes de iniciar a coleta de dados da pesquisa. Normalmente expressamos o objetivo como uma pergunta denominado de problema de pesquisa, por exemplo: Objetivo: Verificar qual o perfil dos alunos do curso? Neste caso poderemos coletar dados para esclarecer os seguintes campos: - dados pessoais: grau de instruo, religio, nacionalidade, salrio, peso, altura, idade, etc. - dados sobre vizinhana: circunstncias em que vivem os indivduos pesquisados, relaes familiares, habitat, etc. - dados comportamentais: como se comportam os elementos de uma populao, segundo determinadas circunstncias. Ex.: comportamento dos alunos de uma classe quando mudam frequentemente de sala ou de professores. - nveis de informao: opinies, expectativas dos membros de uma populao, ou seja, suas aspiraes em relao a determinado assunto.

Justificativa: o PORQU da pesquisa


Descreve qual a importncia da pesquisa. importante definir o porque de estudarmos determinado evento, quais so os itens importantes conhecermos para desvendar incgnitas e colaborar para a tomada de deciso.

2.2. Metodologia da pesquisa: o COMO ser efetuada a Coletas de dados:


Com os objetivos claramente definidos, deve ser estabelecida a estratgia que possibilitar a obteno dos resultados, que dever seguir o seguinte lema: Mximo de Informes com o Mnimo de Custo e Tempo. Aqui, a preocupao com a forma pela qual os dados sero coletados, se atravs da observao direta, de entrevista ou de autoentrevista, em que reas sero realizados as pesquisas, quando e quantos dados sero coletados, qual a preciso exigida, qual tipo de amostragem, qual amplitude (tamanho), qual tempo disponvel e qual custo previsto e tambm qual o embasamento terico utilizado. Algumas formas de se coletarem os dados esto descritas abaixo: A entrevista o mtodo mais eficiente, porm caro. Isto porque entrevista pessoal feita com cada um dos componentes, da amostra ou da populao, a fim de termos absoluta certeza da opinio do indivduo acerca de determinado fato. A observao direta consiste em fazer uma observao do fato atravs de uma pessoa ou com auxlio de cmara de TV /vdeo Ex.: ao mudar a embalagem de um produto, o marketing da empresa quer conhecer a reao dos consumidores devido a modificao. A auto-entrevista permite que se faa pesquisa com um grande nmero de elementos, a um custo relativamente baixo, principalmente quando sua distribuio feita pelo correio ou pela mala-direta ou e-mail. Neste caso, o nmero de questionrios a serem enviados deve ser bem maior do que o necessrio, uma vez que, muitos no os devolvem (mdia de 15% de retorno). Questionrio: na entrevista e na auto-entrevista, o acessrio principal o questionrio, parte muito importante da pesquisa, pois se for mal formulado, todo o tempo e custo da pesquisa resultaro em dados inaproveitados. Em alguns casos, durante a entrevista, utiliza-se apenas um roteiro de entrevista, que tambm dever ser feito obedecendo mesmos critrios de um questionrio. Realmente uma tarefa difcil fazer um bom questionrio. Por isso, deve-se contar com a colaborao de pessoas que ajudem na sua confeco: socilogos, psiclogos, economistas, administradores, professores etc. Um bom questionrio deve ser: completo, concreto, secreto e discreto.
9

- Completo no sentido de conter todas as informaes que pretendemos obter; - Concreto no sentido das perguntas serem formuladas de forma clara e objetiva; - Secreto no sentido de no conter a identificao, para no tolher a liberdade do entrevistado; - Discreto no sentido de no conter perguntas que possam ferir a suscetibilidade do pesquisado. Tendo em mente estas condies, podemos pensar na estrutura do questionrio e nos tipos de questes que dever conter: ser uma questo aberta ou fechada, ser uma questo por que, ou uma questo intensidade? PERGUNTAS FECHADAS

Nas perguntas fechadas so fornecidas as possveis respostas ao entrevistado, sendo que apenas uma alternativa de resposta possvel. Exemplo: Em que bairro o Sr.(a) mora? ( ) Higienpolis ( ) Sumar Exemplo: ( ) Pacaembu ( ) Mooca PERGUNTAS ABERTAS Qual a sua opinio sobre o bairro onde mora? PERGUNTA SEMI-ABERTA ( ) Pinheiros ( ) ________

Nesse tipo de pergunta o entrevistado responde livremente o que pensa sobre o assunto.

A pergunta semi-aberta a juno de uma pergunta fechada a uma aberta em que, num primeiro momento, o entrevistado responde a uma das opes de alternativas e depois justifica ou explica a sua resposta. Exemplo: Em que bairro o sr.(a) mora? ( ) Higienpolis ( ) Sumar ( ) Pacaembu ( ) Mooca ( ) Pinheiros ( ) ________

Por qu? __________________________________________________________ Exemplo: O Sr.(a) mora em casa prpria? ( ) Sim ( ) No PERGUNTA DICOTMICA

a pergunta que tem como respostas Sim e No.

10

Exemplo:

PERGUNTAS ENCADEADAS

A segunda pergunta depende da resposta da primeira. O Senhor (a) mora em casa prpria financiada? ( ) Sim ( ) BNH ( ) Banco particular Exemplo: Bairro Higienpolis Perdizes Mooca Pinheiros Bela Vista Tatuap Exemplo: Caso o Sr.(a) fosse mudar de casa, qual bairro escolheria em 1, 2 e 3 lugares? ( ) Higienpolis ( ) Perdizes ( ) Mooca ( ) Pinheiros ESCALA ORDINAL DE PREFERNCIA ( ) Bela Vista ( ) Tatuap MOROU Mora Pretende Morar ( ) No ( ) CEF ( ) Construtora ( ) Outros Caso a resposta seja afirmativa. Qual a entidade financiadora? ( ) Banco estatal PERGUNTA COM MATRIZ DE RESPOSTA

Nesse caso, monta-se um quadro para facilitar a resposta do entrevistado.

PERGUNTAS COM ORDEM DE PREFERNCIA

dada ao entrevistado a possibilidade de escolha do 1, 2 e 3 lugares:

Exemplo: Por favor, indique a sua preferncia por companhias areas, numerando de 1 a 5 , sendo 1 para a de maior preferncia e 5 para a de menor preferncia. (mostrar carto). 1 .____________ 2 .____________ 3 .____________ 4 .____________ 5 .____________ Modelo do carto

ESCALA ORDINAL DE RANKING

11

Exemplo: Por favor, coloquem em ordem de preferncia as empresas listadas no carto (entregar carto C para o entrevistado), de acordo com as caractersticas que esto sendo avaliadas sendo 1 para a melhor empresa no atributo e at 4 para a pior empresa. Vamos comear com superior tecnologia. Que empresa voc colocaria em 1, em 2, em 3, em 4? Empresa A Empresa B Empresa C Empresa D tecnologia __________ __________ __________ __________ Cumpre prazos _______________ _______________ _______________ _______________ ps-venda __________ __________ __________ __________

ESCALA DE LEMBRANA DE MARCA

Exemplo: Quando eu menciono indstria farmacutica, qual nome lhe vem primeiro cabea?
Lembra outras?

______________ primeira empresa mencionada.


_______________ segunda empresa mencionada _______________ terceira empresa mencionada

J ouviu falar da Empresa XW? ( ) sim ( ) no ESCALA DE DIFERENCIAL SEMNTICO (OSGOOD)

Exemplo: Com relao ao Iogurte marca P com polpa de frutas, qual a sua opinio sobre os seguintes atributos? Puro Saboroso Natural Alta qualidade Embalagem higinica 7654321 7654321 7654321 7654321 7654321 Impuro Sem sabor Artificial Baixa Qualidade Embalagem no-higinica

ESCALA DE LIKERT

O respondente indica o grau de concordncia ou discordncia de acordo com as variveis e atitudes relacionadas ao objeto:

Os tnis importados so melhores que os nacionais XZ uma marca nacional As melhores marcas de tnis patrocinam times de futebol XZ um tnis para pessoas jovens e ativas CT= concordo totalmente DP= discordo parcialmente CP= concordo parcialmente que est: ( ) ( ) ( ) totalmente satisfeito parcialmente satisfeito parcialmente insatisfeito DT= discordo totalmente

CT 5 5 5 5

CP 4 4 4 4

NA 3 3 3 3

DP 2 2 2 2

DT 1 1 1 1

NA= no concordo nem discordo

ESCALA ITEMIZADA

Exemplo: Com relao ao grau de satisfao com seu atual plano de sade, voc afirmaria

12

( ) produto? ( ) ( ) ( ) ( ) ( )

totalmente insatisfeito ESCALA DE INTENO DE COMPRA

Exemplo: Qual a chance de voc adquirir a marca Y na prxima compra desse tipo de certamente comprarei possivelmente comprarei no sei se comprarei possivelmente no comprarei certamente no comprarei

Alguns cuidados ao elaborar um questionrio: Instrues e definies completas. Tanto entrevistador como entrevistado no devem ter qualquer dvida a respeito das informaes desejadas e dos termos ou unidades que devem ser usados na pesquisa. Portanto, antes de sair a campo, o entrevistador deve conhecer os detalhes e o objetivo da pesquisa. Evitar perguntas constrangedoras, pois podem ferir a suscetibilidade das pessoas entrevistadas, podendo dar informaes que no correspondem veracidade dos fatos. Perguntas de dados pessoais, como renda, costumes, vcios, opes sexuais, etc. devem ser feitas com muito tato; as respostas podem ser obtidas de forma indireta. A clareza essencial. As perguntas devem ser expressas de maneiras simples

clara e direta, pois uma pergunta mal formulada pode conduzir a resultados inteis. Perguntas objetivas e facilitando a contagem ao planejar as questes, devemos formul-las para que o entrevistado entenda realmente aquilo que desejamos que ele responda, evitando termos tcnicos ou siglas que no so do conhecimento geral. Planejamento da ordem das perguntas e do tamanho do questionrio. A

colocao das perguntas no questionrio no deve ser feita de qualquer maneira, mas sim, deve obedecer a uma ordenao, ou seja, das perguntas mais simples e genricas at as perguntas mais pessoais, seguindo uma seqncia lgica e aumentando paulatinamente o seu grau de profundidade, devese ter em mente no fazer um questionrio muito longo, alm de cansativo, as ltimas perguntas podero ser respondidas sem as devidas reflexes.
Nota: Uma vez elaborado o questionrio e antes de ser utilizado na pesquisa, devemos fazer o que se denomina pr-teste ou pesquisa-piloto com pessoas que entendam do assunto a ser pesquisado, que emitiro sua opinio e crticas em relao ao perfeito entendimento das perguntas, 13

isto corresponde validao do questionrio. Feito isso, o questionrio estar validado para ser distribudo para os entrevistados.

2.3. Apurao dos Dados e Apresentao dos resultados.


A coleta dos dados pode ser realizada de duas maneiras: direta ou indiretamente. A coleta direta quando obtida diretamente da fonte. H trs tipos de coleta direta. A coleta dos dados indireta quando inferida a partir dos elementos conseguidos pela coleta direta, ou atravs do conhecimento de outros fenmenos que, de algum modo, estejam relacionados com o fenmeno em questo. a) direta b) indireta Apurao dos Dados A apurao ou sumarizao consiste em resumir os dados coletados atravs de sua contagem e agrupamento, ou seja, um trabalho de condensao e de tabulao dos dados, que chegam de forma desorganizada, tornando impossvel tarefa de apreender todo o seu significado pela simples leitura. contnua, ocasional, peridica

Exposio ou apresentao dos dados


H duas formas de apresentao dos dados apurados: em tabelas e ou grficos.

2.4. Anlise, interpretao dos resultados.


A anlise dos resultados consiste em comentar exclusivamente os resultados numricos obtidos descrevendo e interpretando os tpicos relevantes e est ligada essencialmente ao clculo de medidas, cuja finalidade principal descrever o fenmeno. O significado exato de cada um dos valores obtidos do clculo das vrias medidas estatsticas disponveis deve ser bem interpretado. Alguns autores consideram que estas anlises devem estar no mesmo captulo da apresentao dos resultados, logo aps cada grfico e/ou tabela. Voc deve decidir qual a sua opinio e fazer sua opo.

2.5. Concluso ou comentrios finais


O interesse maior reside em tirar concluses que auxiliem o pesquisador a resolver o problema de pesquisa, ou seja, verificar se os Objetivos da pesquisa foram alcanados.
14

Deve embasar-se exclusivamente a dados apresentados no corpo/contedo do trabalho, sem chismos do tipo O grupo achou que... ou tambm, emitir opinies, dedues e concluses sobre dados que no aparecem no trabalho e no foram pesquisados. Finalizando, estabelecer se a pesquisa foi elaborada com estatstica inferencial, ou seja, tirar concluses sobre o todo (populao), a partir de informaes fornecidas pelos dados coletados nas amostras, ou estatstica descritiva, os resultados so vlidos exclusivamente para descrever a populao (ou amostra) de onde coletamos os dados. Alm de efetuar a anlise dos resultados obtidos, tirando concluses e previses para aes futuras podem-se propor novas pesquisas para aprofundar o assunto pesquisado em alguns pontos que no foram objeto no estudo desenvolvido.

2.6. Bibliografia
Elencar todos os meios consultados para a elaborao da pesquisa, livros, apostilas, artigos e revistas acadmicas ou de circulao, jornais e consultas eletrnicas (sites, e-mail) A forma de descrever os meios consultados deve obedecer a Norma Brasileira da ABNT ( Associao Brasileira de Normas Tcnicas ) e , s devero constar da bibliografia os elementos realmente utilizados e que existam comprovao no corpo do trabalho.

3. TCNICAS AMOSTRAIS
Na teoria da amostragem, so consideradas duas dimenses: Tcnicas amostrais (Mtodos de amostragem). Dimensionamento da amostra.

15

As tcnicas amostrais se subdividem em dois grupos: Probabilsticas e Noprobabilsticas 3.1 AMOSTRAS PROBABILSTICAS Para se obter uma amostra probabilstica, utilizam-se os conceitos da estatstica, pois, nesse tipo de amostra, todos os elementos da populao tm igual probabilidade, e diferente de zero, de serem selecionados para compor a amostra. Existem seis procedimentos bsicos para a obteno de amostras Probabilsticas: simples, estratificada, sistemtica, por grupos, conglomerado e amostragem em mltiplas etapas. Vamos detalhar os dois tipos mais utilizados A Amostra Aleatria Simples e Estratificada. AMOSTRAGEM ALEATRIA SIMPLES

Este mtodo permite que todos os elementos da populao tm igual probabilidade de compor a amostra, e a seleo de um particular indivduo ou objeto, no afeta a probabilidade de qualquer outro ser escolhido.Uma amostra em que a probabilidade de escolher qualquer dos N elementos em uma nica prova igual a 1/N uma amostra aleatria. Significa que os elementos tm a mesma chance de serem includos na amostra. - Se a populao infinita, como por exemplo, chamadas telefnicas, produo futura de certa mquina, etc; podemos consider-los um processo probabilstico, compondo as amostras aleatrias na ordem que ocorrem. - Se a populao finita, tal como os livros da biblioteca a escolha aleatria envolve a compilao de uma lista de todos os elementos da populao, e a realizao de sorteios equivalente a um sorteio lotrico, para escolher os itens que iro compor a amostra. Na prtica, a amostragem pode ser realizada numerando-se a populao de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, k nmeros dessa seqncia, os quais sero os elementos da amostra. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola. 1 numeramos os alunos de 01 a 90. 2 escrevemos os nmeros de 01 a 90, em cartes, colocando-os dentro de uma caixa e sorteamos nove nmeros que formaro a amostra. No caso, 10% da populao. Quando o nmero de elementos da amostra grande, o sorteio torna-se trabalhoso. Para facilit-lo, existe a Tabela dos nmeros aleatrios, construda de modo que os dez algarismos (0 a 9) so distribudos ao acaso nas linhas e colunas. Para obter os elementos da amostra usando a tabela, sorteiam-se um algarismo da mesma, a partir do qual iremos considerar nmeros de dois, trs ou mais algarismos, conforme nossa necessidade. Os nmeros obtidos indicaro os elementos da amostra.

16

A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou viceversa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opo deve ser feita antes de iniciar o processo TABELA DE NMEROS ALEATRIOS
57720039848441796771402113975649865408932968745483 28805351590993988758702771771706320278621674696517 9259185287304886974835251888740362983858658642410 3 9038129174301975890750641559718813749530527830117 5 8091169467586082066690475618464511123532455041134 3 2201703132969192754016542972749900959761009824300 7 5624100430204629905353110584412164791976295162606 6 7944926202968664300094566930205987873544225097781 9 5399664508897850775337257741276238022357620141603 5 1892873588550521365139285014668579301979726664314 5 5308589663056125702250412896626643630663013279852 2 0358802928768951182488894647485919298703103399671 2 2707818865694998002804705130014718973321858245432 4 0521085901062224989181175544661607730766101231785 8 4036132784308233363969420558646112338927895266719 3 5460252885882000105961053661337201011901611051209 1 7151634076711173735237316045889273437128049809024 8 6102018173926066735853344268263834032744960446659 3 8255931346309526550696176591723979961249528063269 9 17

8998541421741357681986286089473315262877453848080 8 0099848414679513775890145079427363310660434012550 4 6241507820480588435298031993920304972584959503633 1 9427906924680992118607638319329951155571092702670 0

Assim, para o exemplo, considerando a 18 linha, tomamos os nmeros de dois algarismos (tantos algarismos quantos formam o maior nmero da populao), obtendo: 61 02 01 81 73 92 60 66 73 58 53 34 Evidentemente, o nmero 92 ser desprezado, pois no consta da populao, como tambm, ser abandonado um nmero que j tenha aparecido. Temos ento: 61 02 01 81 73 60 66 58 53 Medindo as alturas dos alunos correspondentes aos nmeros sorteados, obteremos uma amostra das estaturas dos noventa alunos. 3.2 AMOSTRAGEM ALEATRIA ESTRATIFICADA Este mtodo muito similar ao da amostragem aleatria simples, mas utilizado quando se pensa que a populao possui grupos distintos que podem possuir diferentes vises sobre os assuntos de interesse. Por exemplo: Os proprietrios de carros e ciclistas/pedestre teriam vises diferentes sobre o lanamento de medidas de controle de carros no centro de uma cidade. Para superar o perigo de uma amostra acidentalmente no ser representativa, a amostra pode ser estratificada de acordo com esses grupos, para que possua aproximadamente as mesmas propores da populao. Se existir 80% de proprietrios de carros e 20% de ciclistas/pedestres na populao, ento a razo 4: 1 deve ser refletida na amostra. Para cada grupo, os membros so selecionados aleatoriamente (como na amostragem aleatria simples). O processo de escolha (sorteio) deve ser para 4 proprietrios de carro e 01 ciclistas/pedestres. Exemplo 1: Supondo, no exemplo anterior, que dos noventa alunos, 54 sejam homens e 36 sejam mulheres, vamos obter a amostra proporcional estratificada. So, portanto dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10 elementos da populao.

sexo alunos Masc.

total da populao 54

% 60%

amostra n = 10 6
18

Fem. TOTAL

36 90

40% 100%

4 10

Determinamos uma amostra com 10 alunos CADA PARCELA x 100% NMERO TOTAL % Masc = 54 x 100% = 60% e a amostra ser 60% de 10 alunos = 6 90 % Fem = 36 x 100% = 40% e a amostra ser 40% de 10 alunas = 4 90 Utilizando a tabela de nmeros aleatrios: Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem os homens e de 55 a 90, mulheres. Tomando na Tabela de nmeros aleatrios a 1 e 2 coluna da esquerda, de cima para baixo, obtemos os seguintes nmeros: 57 28 92 90 80 22 56 79 53 18 53 03 27 05 40 Ento temos: 28 22 53 18 03 para os homens; 57 90 80 56 para as mulheres. Exemplo 2. Em uma indstria existem 250 funcionrios, sendo 35 trabalham no Setor A, 32 no Setor B, 30 no Setor C, 28 no Setor D, 35 no Setor E, 32 no Setor F, 31 no Setor G e 27 no Setor H. Obtenha uma amostra de 40 funcionrios utilizando a amostragem proporcional. Soluo: Como neste caso foi dado o nmero de elementos da amostra, devemos ento calcular o nmero de elementos de cada estrato proporcionalmente ao nmero de elementos da amostra, usando Regra de trs. A 40 35 250 A= % =

35 . 40 = 5,6 250
14% x 40 = 5,6 = 6 Total 250 Proporo % 14,0% 12,8% 12,0% 11,2% 14,0% 12,8% 12,4% 10,8% 100,0% Amostra N= 40 6 5 5 4 6 5 5 4 40
19

usando % = cada parcela ( setor) x 100% = 35 x 100% = 14%

Setores A B C D E F G H

Populao 35 32 30 28 35 32 31 27 250

Esse um mtodo comparativamente no tendencioso, gera uma amostra representativa, entretanto a estratificao adicionar custos ao processo de pesquisa e tambm necessrio ter acesso populao. Outros tipos de amostragem so descritos abaixo AMOSTRAGEM POR GRUPOS

Freqentemente utilizado quando os itens da populao de interesse so amplamente diversificados e desejvel que os elementos da amostra sejam agrupados de alguma forma (talvez geograficamente ou no decorrer de um curto perodo de tempo). Exemplo: se um varejista quisesse entrevistar uma amostra de lojistas, faria sentido selecionar aleatoriamente duas ou trs reas de vendas primeiro. Cada lojista dentro dessas reas poderia, ento, ser entrevistado: isso evitaria a seleo de um nmero de lojistas isolados espalhados por todo o pas. Mtodo utilizado quando os dados esto muito espalhados geograficamente e em que a populao no definida exatamente (infinita).

AMOSTRA PROBABILSTICA POR CONGLOMERADO


A tcnica probabilstica por conglomerado exige a utilizao de mapas detalhados de regies, estados, municpios e cidades, pois, para a seleo da amostra, h subdiviso da rea a ser pesquisada por bairros, quarteires e domiclios, que sero sorteados para composio dos elementos da amostra, e a pesquisa ser realizada de forma sistemtica para que no haja interferncia nas informaes. Por exemplo, se desejamos fazer uma pesquisa no bairro da Mooca, dividimos o bairro por quarteires, identificamos a populao do quarteiro e ento estabelecemos o intervalo por meio da frmula de tcnica probabilstica sistemtica.

3.3 AMOSTRAS NO-PROBABILSTICAS


As amostras no-probabilsticas so selecionadas por critrios subjetivos do pesquisador, de acordo com sua experincia e com objetivos do estudo. As amostras noprobabilsticas no so obtidas utilizando-se conceitos estatsticos e podem ser subdivididas em no-probabilsticas por convenincia, por julgamento e por cota. AMOSTRA NO-PROBABILSTICA POR CONVENINCIA Os elementos da amostra so selecionados de acordo com a convenincia do pesquisador. So as pessoas que esto ao alcance do pesquisador e dispostas a responder a um questionrio. Por exemplo: podem-se abordar alunos de uma determinada faculdade para obter as informaes para uma pesquisa. Essa tcnica no-conclusiva e a amostragem menos confivel, apesar de mais barata e simples. importante ressaltar que as amostras obtidas
20

pelas tcnicas no-probabilsticas no permitem a inferncia sobre o universo, pois, nesses casos, desconhecido o erro cometido na escolha dos elementos que faro a amostra. A amostragem por cotas muito utilizada quando a entrevista o principal mtodo de coleta de dados. A meta similar meta da amostragem estratificada, na qual desejvel que se garanta que a composio da amostra corresponda populao. O entrevistador recebe o perfil amostral predeterminado, em que corresponda s propores da populao. Ele seleciona pessoas dentre as que esto passando para preencher o nmero exigido em cada categoria. Por exemplo: Com base na tabela 2, um entrevistador de uma pesquisa de opinio poltica solicitado a entrevistar 40 pessoas no total: duas dessas pessoas sero mulheres profissionais (classe A/B com idades entre 45 e 64, etc). Isso ter sido escolhido para que a proporo na amostra (2/40 = 5%) seja similar da populao original. Tabela 2 Cota de entrevistas para uma pesquisa de opinio poltica Classe social Idade/sexo 18 - 29 30 - 44 45 64 65 ou mais A/B M 0 1 2 1 F 0 1 2 1 M 3 2 3 2 C F 1 1 1 1 D/E M 2 4 2 3 F 2 3 2 0

Esse mtodo tende a fornecer boas taxas de resposta, porque o entrevistador alcana o conjunto de cotas, os que no respondem so ignorados e outras pessoas so escolhidas para substitu-las. 3.4 DIMENSIONAMENTO DA AMOSTRA O clculo para o tamanho da amostra uma etapa que exige mxima ateno, pois fundamental determinar com preciso quais as caractersticas da populao em estudo da qual ser extrada a amostra que estar apta a responder pesquisa, atendendo os objetivos da pesquisa. Na verdade, para o dimensionamento de uma amostra probabilstica existe um conjunto de conceitos e relaes conhecidos genericamente como Teoria da Amostragem. No nosso propsito aqui tecer consideraes sobre este assunto, pois se trata de um captulo da Estatstica que no totalmente o foco deste curso e o que nos afastaria muito de uma apresentao geral. Acreditamos ser o suficiente dizer que dependendo do tipo de amostra probabilstica utilizada existem clculos e consideraes especficos para determinarmos o tamanho da amostra.
21

Qualquer que seja o caso, entretanto, o problema da amostragem aleatria simples , como sabemos , o de inicialmente retirar de uma populao de N elementos, um conjunto amostral de n elementos sendo que n < N. - Determinar qual o grau de certeza nos resultados da pesquisa, tambm conhecido como nvel de confiana. No caso das pesquisas que trabalham com percentagens os valores mais comuns adotados para o erro de amostragem

(epslon) so de 1%, 2% , 3%

, 4% ,5% e 10%. Quanto maior o grau de confiana que se deseja sobre os resultados e, menor o erro de amostragem, tanto maior ser a mostra requerida. A frmula para o tamanho da amostra n da Teoria da Amostragem :

n = 2.500 ( z / )
Onde expresso em percentagem e z = X da distribuio Normal reduzida Exemplo de aplicao: Desejamos efetuar uma amostra de eleitores de forma a estimar o vencedor da prxima eleio de governador. O nvel de confiana solicitado de 95% e o erro de amostragem no dever ultrapassar de 5%. A soluo ser: Para nvel de confiana de 95% encontraremos z = 1,96 na tabela da Distribuio Normal de probabilidades e = 5% ento temos : n = 2.500. (1,96 / 5) = 384,16 O resultado, arredondado para cima ser de n= 385 eleitores, com 95% de confiana e erro de 5% para mais ou menos. Interpretando o resultado: Supondo que no resultado da pesquisa efetuada com os 385 eleitores, o candidato A obteve 38% de inteno de votos, com a margem de erro = 5% , podemos afirmar que se a eleio fosse hoje ele obteria 38% dos votos com margem de 5% para mais ou para menos , ou seja : entre 33% a 43% dos votos . Com a frmula apresentada, podemos elaborar uma tabela com os tamanhos de amostra necessria em funo do nvel de confiana e margem de erro requerida.

Tabela - Tamanho de amostras n % Tamanho da amostra com grau de confiana


Erro de amostragem

95% 9.604 2.401 1.068 601

97% 11.733 2.944 1.309 736

99% 16.577 4.145 1.842 1.037


22

+- 1 +- 2 +- 3 +- 4

+- 5 +- 6 +- 7 +- 8 +- 9 + - 10

385 267 196 151 119 97

471 328 241 184 146 118

664 461 339 260 205 166

4 . NDICES, COEFICIENTES E TAXAS


ndice: a comparao entre duas grandezas independentes. Ex. QI =

idade mental idade cronolgica Populao total Superfcie total

Densidade Demogrfica =

Coeficiente: a comparao entre duas grandezas em que uma est contida na outra. Ex.: Coef. Mortalidade =

N . de bitos Populao total N . de aprovados N . de alunos

Coef. Aproveitamento Escolar =

Taxas: o mesmo que o coeficiente, apenas multiplicado por 10 n para tornar mais inteligvel o fator. Taxa percentual = coeficiente . 10 n , para n = 2 . Taxa milesimal = coeficiente . 10 n , para n = 3.

Ex. Quantidade de analfabetos na cidade X: 80.080 habitantes . Populao dessa cidade: 520.000 habitantes.

Coeficiente de analfabetismo =

80 .080 = 0,154 520 .000

Explicaes: o coeficiente de analfabetismo 0,154, significa que em cada um habitante, 0,154 analfabeto. Se multiplicarmos o coeficiente (0,154) por 10 2 , teremos 15,4 o que significa que h 15,4 analfabeto em cada 100 habitante. Porm, se multiplicarmos o
23

coeficiente de analfabetismo (0,154) por 103, teremos a taxa de analfabetismo de interpretao muito mais clara, ou seja, em cada 1000 habitantes, 154 so analfabetos. Ou ainda: Taxa de analfabetismo = 0,154 x 1000 = 154 , o que significa que temos 154 analfabetos em cada 1000 habitantes.

5 REPRESENTAES GRFICAS
A apresentao grfica um complemento importante da apresentao tabular, ou seja, uma das maneiras mais concisas de interpretar os dados estatsticos de uma tabela atravs da interpretao grfica. A principal vantagem de um grfico sobre a tabela prende se ao fato de que ele permite conseguir uma visualizao imediata da distribuio dos valores observados. Os grficos propiciam uma idia preliminar mais satisfatria da concentrao e disperso de valores, uma vez que atravs deles os dados estatsticos se apresentam em termos de grandezas visualmente interpretveis. Por outro lado, os fatos essenciais e as relaes que poderiam ser difceis de reconhecer em massas de dados estatsticos podem ser observados mais claramente atravs dos grficos. DIFERENTES TIPOS DE GRFICOS DE SRIES ESTATSTICAS A distribuio de freqncias, tanto de variveis discretas como de variveis contnuas, pode ser interpretada mais facilmente quando os valores dessas variveis so apresentados em forma de grficos. A Estatstica utiliza vrios tipos de grficos: de setores, de barras, de colunas, de linhas, histogramas e polgonos de freqncia. 5.1 HISTOGRAMAS

Representao grfica da distribuio de freqncia para varivel discreta


So grficos em colunas que so construdos em eixos cartesianos. No eixo

horizontal (abscissas) so colocados os valores da varivel e no eixo vertical (ordenadas) esto os respectivos valores de suas freqncias. Exemplo: Ocupao = Profisso Artesanato Trabalho no qualificado Gerencial Freqncia 52 65 29
24

Servios burocrticos

34

Fonte: Livro: Hanan, H.S. & Batalha, B.H.L. Amaznia contradies no paraso ecolgico. Cultura ed. Associados. 5a ed. 1999.

Ento o histograma assume a forma:


G rficod eh isto g ra m ao ud e co lu n as sim p le sd eu m a D istrib u ioO cu p acio n al

7 0 Frequncia 6 0 5 0 4 0 3 0 2 0 1 0 0 A rte sa n a to
5 2

6 5

2 9

3 4

T ra b .N o Q u al.

G e re n cia l

S e rvio s B u r.

Representao grfica da distribuio de freqncia de uma varivel contnua um conjunto de retngulos (colunas) justapostos, representados em um sistema de

coordenadas cartesianas cujas bases so os intervalos de classes e cujas as alturas so valores proporcionais s freqncias simples correspondentes (fi ).

Exemplo: Notas de 24 alunos de Marketing na prova de Estatstica


CLASSES Notas 0 2 4 6 8 I---I---I---I---I--- 2 4 6 8 10 fi 3 6 8 5 2 24

25

Notar que o zero correspondente ao valor da varivel x i est deslocado direita do eixo vertical, propositadamente, criando uma classe fictcia, para se desenhar o que se chama polgono de freqncias. Tambm, uma classe fictcia fica marcada direita do limite superior da ltima classe ( ver figura seguinte) .

Polgono de freqncias Unindo com segmentos de reta os pontos mdios dos lados
superiores de cada coluna de um histograma, obtemos uma linha poligonal. Essa nova figura chamada de polgono de freqncias. fi
A unio dos pontos mdios de todas as classes por uma linha, incluindo as duas classes fictcias, forma o que se chama polgono de freqncias. Observe que a rea sob o polgono de freqncias igual a rea do histograma.

8 6 4 2 0 2 4 6 8 10 xi

5.2 GRFICO DE BARRAS SIMPLES So grficos em colunas que so construdos em eixos cartesianos. No eixo horizontal (abscissas) so colocados os valores de suas freqncias e no eixo vertical (ordenadas) esto os respectivos valores da varivel. Exemplo: Produo Nacional de madeira por regio
Regio Sudeste Norte Centro-Oeste Sul % 4 20 7 69

26

5.3 GRFICO DE SETORES Sua construo feita com base em um crculo que dividido em setores com reas proporcionais s freqncias das diversas categorias. usado para comparar freqncias relativas. Lembrar que a freqncia relativa de uma varivel xi a razo entre a freqncia fi e o nmero total de elementos, multiplicada por 100 (%). Exemplo: Distribuio dos alunos do Curso de Gesto Ambiental, segundo a situao em relao s notas. Para determinarmos o ngulo correspondente a cada setor, utilizando uma regra de trs: Situao Promovido Em recuperao Retido Total Freqncia fi 12 8 4 24 fi % 50,00 33,30 16,70 100,00 Graus 1800 1200 600 3600

24 alunos total

3600 x

12 promovidos
X= 24

12 . 360 = 1800 ou seja , equivalem a metade do setor (crculo)

Analogamente determinamos os ngulos dos outros setores.

Distribuio de alunos do Curso de Ge sto Ambie ntal se gundo a re lao de notas


retido 17% Promovido 50%

Em recuperao 33%

27

5.4 GRFICO DE LINHA Constitui uma aplicao do processo de representao das funes num sistema de coordenadas cartesianas. Este tipo de grfico se utiliza da linha poligonal para representar a srie estatstica. Exemplo: Produo Brasileira de leo de dend 1997 2002. Produo 1000 t 1997 39,3 1998 39,1 1999 53,9 2000 65,1 2001 69,1 2002 59,5 Vamos tomar os anos como abscissas e as quantidades como ordenadas. Determinados graficamente, todos os pontos da srie, usando as coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o que ir nos dar uma poligonal, que o grfico em linha correspondente srie em estudo. Anos

28

5.5 GRFICO DE COLUNAS OU BARRAS MLTIPLAS


aquele em que os retngulos so dispostos um sobre o outro, procurando evidenciar suas diferenas, facilitando a comparao entre eles. Exemplo: Quantidade de lixo gerado nos bairros da Cidade de So Paulo (em toneladas/ano). Anos 94 95 96 97
Fonte: Hipotticos

Bairro A 8.000 12.000 9.000 11.000

Bairro B 6.000 11.000 10.000 9.500

Quantidade de lixo gerado nos bairros da Cidade de Sao Paulo


14000
Quantidade (1000 t)
12000 11000 10000 9500 9000 8000 11000

12000

10000

8000

6000

6000

4000

2000

94

95

96

97

Anos

29

5.6 GRFICO DE LINHAS MLTIPLAS


Este grfico permite representar e comparar duas sries simultaneamente ao longo do tempo. Exemplo: Quantidade de lixo gerado nos bairros da Cidade de Rio de Janeiro. Anos 84 85 Bairro A 8.000 12.000 Bairro B 6.000 11.000

30

86 87
Fonte: Hipotticos

9.000 11.000

10.000 9.500

A elaborao de grficos torna-se muito simples utilizando o Excel, do MS Office. Basta clicarcom o mouse no cone inserir grfico na barra de ferramentas e seguir as instrues que aparecero na tela ( desde a escolha do tipo de grfico, dados de origem, ttulo, escala , etc. at finalizar) aps quatro cliques no avanar, na seqncia apresentada pelo programa, seu grfico estar pronto. Caso o tipo de grfico no agrade suas pretenses, voc poder mudar o tipo de grfico. Tente, selecionando os dados em uma planilha do Excel.

6 . DISTRIBUIO DE FREQUENCIAS - ESTATSTICA DESCRITIVA ORGANIZAO E DESCRIO DOS DADOS COLETADOS EM CAMPO. Denominamos srie estatstica toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, do local ou da espcie.

31

Podemos inferir que numa srie estatstica observamos a existncia de trs elementos: tempo, espao e espcie. Conforme as variaes de um dos elementos podemos classific-las em: a) b) c) d) e) Sries Cronolgicas, Histricas, Temporais ou Marcha. Sries Geogrficas, Espaciais, Territoriais ou de Localizao. Sries Especficas ou Categricas. Sries Conjugadas ou Mistas. Distribuies de Freqncias:

As distribuies de freqncias so sries hetergradas. Neste caso todos os elementos poca, local e fenmeno so fixos. Temos dois tipos: 1 Distribuio de Freqncia Sem Intervalo de Classe - para variveis discretas

____________________________ X x1
x2 x3 . .
i

fi f1
f2 f3 . . Nota: N = N. de observaes f i = freqncia absoluta x i = (varivel alvo do estudo)

____________________________

. x
i

. f f
i

____________________________
i

= N

_____________________________
Usamos a distribuio de freqncia no agrupada, ou seja trabalharemos com cada varivel individualmente, sem intervalo de classe, pois trata-se de varivel discreta com variao relativamente pequena, cada valor tomado individualmente denominaremos de xi

2 Distribuio de freqncia para Dados Agrupados em Classes - variveis contnuas Ex.: Estaturas de 40 alunos no Uni A - 2007 Estaturas (cm) Li Ls Freqncias fi
32

150 I--154 I--158 I--162 I--166 I--170 I--

154 158 162 166 170 174

4 9 11 8 5 3 40

Este tipo de distribuio usado quando trabalhamos com uma amostragem relativamente grande e, as variveis sero contnuas, ou seja, agruparemos os dados em classes com determinado intervalo de valores contidos em cada uma delas, facilitando a anlise de dados, elaborao de grficos e concluses. Na anlise estatstica, a coleta de dados a primeira etapa de todo o processo com que se deve trabalhar se o objetivo analisar dados, obter resultados e testar hipteses acerca da natureza da realidade. Procura transformar seus dados brutos num conjunto de mensuraes, organizadas e dotadas de sentido, que possam ser usadas para testar suas primeiras hipteses iniciais (dados ordenados ou ROL). Que que se faz para transformar essa massa de dados brutos num conjunto/ resumo fcil de entender? O primeiro passo ser orden-los, normalmente em ordem crescente, e contar qual a freqncia que cada varivel aparece, assim, estamos verificando como as frequencias dos dados coletados esto distribudas. Em determinado intervalo, estamos construindo uma DISTRIBUIO DE FREQNCIA sob a forma de tabela. Para elaborao da Tabela de Distribuio de Freqncia deve-se primeiramente identificar o tipo de varivel:

A) DISTRIBUIO DE FREQUNCIA VARIVEL DISCRETA (dados nominais, ordinais ) Chamamos:

Freqncia Absoluta (ou freqncia simples) fi,refere-se ao nmero de vezes que cada varivel (Xi ) aparece no conjunto de dados.

33

Freqncia Relativa Absoluta (ou proporo) frel i , a freqncia fi , nmero de vezes que cada varivel xi aparece, sobre ao nmero total de dados coletados N. Ou seja: freqncia relativa = frel i = fi N Total de observaes: N = f ou = fi
.

fi

= Nmero de dados coletados, a soma das

freqncias absolutas.

freq. relativa percentual Sendo que: f %i =.=

:f %i a freqncia absoluta fi divida pelo total de ou = f i . 100 % fi

observaes e multiplicada por 100. f i . 100 % N


Freqncia acumulada

fac, a soma das freqncias simples (absolutas fi)

acumuladamente iniciando da 1 at a ltima linha da tabela. Representa o nmero total de elementos do incio at uma linha qualquer da tabela

Freqncia Acumulada Percentual fac % a soma das freqncias percentuais fi %) acumuladamente iniciando da 1 at a ltima linha da tabela percentual total dos elementos do incio at uma linha qualquer da tabela
Freqncia acumulada inversa

Representa o

f ac, a soma das freqncias simples

(absolutas fi) acumuladamente iniciando da ltima at a1 linha da tabela.( de baixo para cima) . Representa o nmero total de elementos de uma linha qualquer at o final da tabela

Freqncia Acumulada Percentual inversa para cima) .

f ac % a soma das freqncias

percentuais ( fi %) acumuladamente iniciando da ltima at a1 linha da tabela.( de baixo Representa o percentual total dos elementos de uma linha qualquer at o final da tabela. Exemplo: Tabela1. 1 Dados brutos com Informaes sobre estado civil, grau de instruo, nmero de filhos, salrio (expresso como frao do salrio mnimo), idade (medida em anos e meses) e procedncia de 36 funcionrios de um Departamento da Empresa BOMP.
N. 1 2 3 Estado Civil Solteiro Casado Casado Educao 1 Grau 1 Grau 1 Grau n. de filhos 1 2 Salrio (Sal. min) 4,00 4,56 5,25 Idade anos 20 31 28 meses 03 10 05 Regio de Procedncia Interior Capital Capital 34

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Solteiro Solteiro Casado Solteiro Solteiro Casado Solteiro Casado Solteiro Solteiro Casado Casado Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Casado Casado Solteiro Casado Casado Casado Solteiro Casado Casado Solteiro Casado Casado

2 Grau 1 Grau 1 Grau 1 Grau 1 Grau 2 Grau 2 Grau 2 Grau 1 Grau 2 Grau 1 Grau 2 Grau 2 Grau 2 Grau 1 Grau Superior 2 Grau 2 Grau 2 Grau 1 Grau Superior 2 Grau 2 Grau 1 Grau 2 Grau 2 Grau 2 Grau Superior 2 Grau Superior Superior 2 Grau Superior

0 1 2 3 0 1 2 0 2 2 0 2 2 0 5 2 1 3 2 3

5,73 6,26 6,66 6,86 7,39 7,59 7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30

36 42 34 28 41 40 36 31 25 44 40 33 26 40 34 34 44 30 34 25 41 32 27 42 32 37 38 26 39 33 48 37 30

10 07 00 00 04 10 06 06 11 05 02 05 08 07 07 08 04 09 02 00 01 05 00 07 08 06 10 05 04 07 07 11 02

Outro Outro Interior Interior Capital Capital Outro Interior Capital Outro Outro Interior Outro Capital Outro Interior Interior Outro Capital Outro Outro Interior Outro Outro Interior Interior Capital Outro Interior Capital Capital Capital Interior

1. Usando os dados da Tabela 1.1 construa a distribuio de freqncias do grau de

instruo - determine o ROL, ordenando e contando os dados coletados (ordem crescente) Resoluo: NATUREZA DA VARIVEL QUALITATIVA ORDIINAL: GRAU DE INSTRUO A distribuio de freqncia fica: instruo 10 grau 20 grau 30 grau Total fi 12 18 6 36 f rel i 0,3333 0,5000 0,1667 1,0000 f% 33,33 50,00 16,67 100,00

fac
12 30 36

fac %
33,33 83,33 100,00

f ac
36 24 6

f ac %
100,00 66,67 16,67

Fonte: Tabela 1.1

Estes valores podem ser interpretados da seguinte forma: 33,33% dos empregados possuem 1o grau; 50,00% dos empregados possuem 2o grau;
35

16,67% dos empregados possuem 3o grau.


83,33% dos empregados possuem at 2o grau.

NATUREZA DA VARIVEL QUANTITATIVA DISCRETA: IDADES


idades xi 20 25 26 27 28 30 31 32 33 34 36 37 38 39 40 41 43 44 48

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

fi 1 2 2 1 2 2 2 2 2 4 2 2 1 1 3 2 2 2 1 36

fi rel 0,0278 0,0556 0,0556 0,0278 0,0556 0,0556 0,0556 0,0556 0,0556 0,1111 0,0556 0,0556 0,0278 0,0278 0,0833 0,0556 0,0556 0,0556 0,0278 1,0000

f rel % 2,78% 5,56% 5,56% 2,78% 5,56% 5,56% 5,56% 5,56% 5,56% 11,11% 5,56% 5,56% 2,78% 2,78% 8,33% 5,56% 5,56% 5,56% 2,78% 100,0%

fac 1 3 5 6 8 10 12 14 16 20 22 24 25 26 29 31 33 35 36

fac% 2,78% 8,33% 13,89% 16,67% 22,22% 27,78% 33,33% 38,89% 44,44% 55,56% 61,11% 66,67% 69,44% 72,22% 80,56% 86,11% 91,67% 97,22% 100,00%

f 'ac 36 35 33 31 30 28 26 24 22 20 16 14 12 11 10 7 5 3 1

f 'ac% 100,00% 97,22% 91,67% 86,11% 83,33% 77,78% 72,22% 66,67% 61,11% 55,56% 44,44% 38,89% 33,33% 30,56% 27,78% 19,44% 13,89% 8,33% 2,78%

i = ndice, indica a linha ou o nmero da varivel

xi = cada uma das variveis alvo do estudo no caso, idades dos funcionrios

Estes valores podem ser interpretados da seguinte forma: Quantos funcionrios e qual o respectivo percentual tem idade menor ou igual a 32 anos ? So 14 funcionrios, representando 38,89% , tem no mximo idade igual a 32 anos. Ou seja de 20 a 32 anos . Basta seguir na linha de xi = 32 anos at as colunas de fac e fac % e efetuar a leitura. Quantos funcionrios e qual o respectivo percentual tem idade maior ou igual a 36 anos ? So 16 funcionrios, representando 44,44%, tem no mnimo idade igual a 36anos. Ou seja de 36 a 48 anos. Basta seguir na linha de x i = 36 anos at as colunas de f ac e f ac% e efetuar a leitura. Quantos funcionrios e qual o percentual respectivo tem idade igual a 34 anos ? So 4 funcionrios que representam 11,11% , tem 34 anos de idade. Basta seguir a linha x i = 34 anos e efetuar a leitura nas colunas f i e fi %

36

Quantos funcionrios e qual o percentual respectivo tem idade entre 30 anos a 40anos inclusive ? Que 19 funcionrios, que representam 52,78% , tem idade entre 30 anos a 40 anos (inclusive 30 e 40 anos). Deve-se subtrair os valores encontrados nas colunas de fac da linha xi =40 ( fac = 29) e xi =30 ( fac = 10) , ento 30 29 = 19 funcionrios Analogamente Fac% de xi =40 ser 80,56% e fac % de xi = 30 ser 27,78% ento : 80,56 27,78 = 52,78%

7. MEDIDAS DE POSIO OU MEDIDAS DE TENDNCIA CENTRAL Para interpretar os dados corretamente, em geral preciso primeiro organizar e sumarizar os nmeros, ou seja, um conjunto de nmeros pode reduzir-se a uma ou a algumas medidas numricas que resume todo o conjunto. Aqui, estamos interessados em calcular alguns valores de uma srie, que representam bem e resumidamente, todos os dados dessa srie. So posies no eixo horizontal de um grfico, em torno das quais se concentram a maioria dos valores da varivel xi. Usualmente empregamos as seguintes Medidas de posio ou de tendncia central : A mdia (aritmtica simples e ponderada), a moda e a mediana. Possuem essa denominao por possurem a tendncia de estar no centro de um conjunto de valores. Podemos determinar seus valores para variveis discretas e para variveis contnuas. MEDIDAS DE TENDENCIA CENTRAL PARA VARIVEIS DISCRETAS 8.1 . MDIA

37

um valor representativo de todo um conjunto de valores, normalmente utilizada como um parmetro comparativo entre grupos distintos, por exemplo, uma classe obteve mdias 6,0 de estatstica comparando com outra classe que obteve mdia 5,4. Qual a melhor turma? No exemplo diramos que a melhor sala seria a 1 turma que obteve mdia 6,0, embora alguns alunos desta classe certamente sejam piores que outros da sala com mdia menor e vice-versa. Na mdia geral a 1 turma melhor. A.1 Mdia Aritmtica Para calcularmos x , a mdia aritmtica determinamos a

soma das observaes dividida pelo nmero delas.Assim a mdia de 3, 4, 7, 8 e 8 :

x
Ou seja:

3 + 4 + 7 + 8 + 8 30 = =6 5 5

x
i =1

Onde: x i = x1 + x2 + x3 + ....+ xn;


i =1

n = no de elementos na amostra; O clculo de x mesmo para dados amostrais como para populao.

A.2

Mdia Aritmtica Ponderada

x,

consideremos por ex.: a situao em

que o professor informe que os pesos da notas bimestres so: 1 obimestre: peso 2; 2obimestre: peso 2; 3obimestre: peso 3; 4obimestre: peso 3. O aluno obteve as seguintes notas em Matemtica: 6,0; 8,0; 9,0 e 5,0, respectivamente. O clculo da mdia ponderada deve levar em conta os pesos desiguais dos bimestres. A frmula para o clculo :
n

Mdia ponderada =

f x
i =1 n i

f
i =1

onde

fi

= peso de observao de ordem i.

Portanto:

70 2.6 + 2.8 + 3.9 + 3.5 = = 7,0 2+ 2+3+3 10

A.3 Determinao da Mdia de uma distribuio de freqncia,

Se os dados esto apresentados na forma de uma varivel discreta, utilizaremos a mdia aritmtica ponderada, considerando as freqncias simples fi como sendo as ponderaes dos elementos xi correspondentes. 1. forma da distribuio: mais adequada para distribuio unimodais simtricas; 2. objetivo: uma medida de tendncia central exata, pode frequentemente ser usada em operaes estatsticas mais avanadas,
38

Pode-se usar a frmula da mdia ponderada para determinar a mdia de uma distribuio de freqncia. Os pesos so substitudos pelas freqncias (fi) das classes e a frmula fica:

f ix
n

f ix fi

Onde: fi a freqncia da i-sima classe n o nmero de observaes (= f i ) Exemplo: Determinar a mdia dos seguintes dados: No acidentes xi 0 5 10 15 20 25 30 Freqncia fi 2 4 5 10 2 1 1 25 fi.xi 0 20 50 150 40 25 30 315

Soluo:

f i xi

315 = 12,6 25

8.2 MODA = Mo o valor (observao) que ocorre com maior freqncia num conjunto. Sejam os dados os nmeros 10, 10, 8, 6, 10, h trs 10s. O valor mais freqente, a moda, 10. 1. forma da distribuio: mais apropriada para distribuio Bimodais; 2. objetivo: permite obter uma medida de tendncia central rpida, simples, embora grosseira. Exemplo: Nmero de pessoas da famlia numa amostra de 26 respondentes de renda baixa ( Distribuio Bimodal) Tamanho de famlia 1 2 3 4 5 6 7 8 9 10

fi
1 2 6 2 1 2 3 6 2 1 26 Temos uma com apenas algumas pessoas (MO = 3) e outra com um nmero bastante grande de pessoas(MO = 8)

~ x =6
Temos: x = 5,58

39

B. 2. Determinao da Moda de uma distribuio de freqncia, Mo.


o valor mais freqente da distribuio. Para distribuies discretas, a identificao da Moda facilitada pela simples observao do elemento que apresenta maior freqncia. Assim:

Xi fi

243 7

245 17

248 23

251 20

307 8

A moda 248, ou seja, Mo = 248. Esse no aparece mais vezes nesta distribuio.

8.3 MEDIANA (Md ) Colocados os dados brutos em ordem crescente ou decrescente (ROL), a mediana o elemento que ocupa a posio central, ou seja, o valor da varivel que divide um conjunto em duas partes iguais, quer dizer que os valores dos dados coletados sero 50% igual ou abaixo do valor da Mediana e 50% igual ou acima do valor da Mediana. 1. forma da distribuio: mais adequada para distribuio assimtricas; 2. objetivo: uma medida de tendncia central confivel, pode, s vezes ser usada em operaes estatsticas mais avanadas ou quebrar uma distribuio em duas categorias distintas (por exemplo poluentes x no poluentes). Para pequenas amostras Assim, se tivermos 05 observaes de uma varivel, por exemplo, nmero de exerccios efetuados por 5 alunos de estatstica e obtivermos : 8, 7, 4, 8 e 3, Ordenando os dados teremos : 3, 4 , 7, 8, 8 . O valor da Md = 7 corresponde 3a posio (observao) valor central, significa que 50% dos alunos efetuaram 7 exerccios ou menos e 50% resolveram 7 exerccios ou mais. O processo para determinar a mediana o seguinte: a) Ordenar os valores (Rol); b) Verificar se h um nmero mpar ou par de observaes;
c) Para um nmero mpar de observaes, a mediana o valor do meio. Para

um nmero par de observaes, a mediana a mdia das duas observaes do meio.


40

Se n mpar O Rol admite um termo central que ocupa a posio

n+1 ; 2

No de elementos da amostra = n = 5 (mpar) Md =

n+1 6 = 2 2

= 3a posio

Se n par - usar como Md a mdia aritmtica das duas observaes centrais.

Assim, 3, 4, 7, 8, 8 e 9, Md = Exemplos: Par 2, 3, 4, 5

7+8 = 7,5 2
Md mpar 1, 2, 3, 3, 3, 4, 7 Md 3

(3+4)/2 = 3,5

Determinao da Mediana de uma distribuio de freqncia, Md


Se os dados esto apresentados na forma de varivel discreta, eles j esto naturalmente ordenados. Assim, basta verificar se o nmero de elementos mpar ou par.

n (nmero de elementos da amostra) = mpar a mediana ser o elemento central,

ordem =

n+1 ; 2 n 2
e

n = par a mediana ser a mdia entre os elementos centrais ordem =

n + 1. 2

Exemplo: medidas de tendncia central numa distribuio de salrios anuais Salrio anual (R$) 17.000,00 17.000,00 17.000,00 85.000,00 170.000,00 425.000,00 1.700.000,00

MO = 17.000,00 Md = 51.000,00

= R$ 306.000,00

No exemplo acima, se trabalhssemos de relaes pblicas de uma empresa e desejssemos angariar-lhe uma imagem pblica favorvel, calcularamos, talvez, a mdia a fim de demonstrar que o empregado tpico ganha R$306.000,00 por ano, e relativamente
41

bem pago, que o valor da Mdia sofre influncia de valores extremos, puxando para mais ou para menos seu valor. Por outro lado, se ns fssemos representantes sindicais e estivssemos procurando melhorar os nveis salariais, iramos provavelmente empregar a moda para demonstrar que o salrio mdio apenas 17.000,00, o que representa uma quantia bastante reduzida. Se fossemos pesquisadores sociais desejosos de dar uma informao acurada do salrio mdio dos empregados dessa empresa, empregaramos, a mediana (R$ 51.000,00), uma vez que esta medida cai entre outras duas, oferece portanto um quadro mais equilibrado da estrutura salarial.

Exemplo 02: Dada a distribuio: xi 1 2 3 4 fi 1 3 5 2 11 Facumulada=Fac 1 4 9 (60 elem.) 11

n = 11 mpar, Md =

n+1 2

11 + 1 = 60 elemento. Abre-se a coluna de Fac e atravs 2

dessas freqncias acumuladas encontra-se o valor (xi) correspondente mediana. Neste exemplo Md = 3 ( ser o xi correspondente classe que contiver a ordem calculada). Exemplo 02: Dada a distribuio: xi 82 85 87 89 90 fi 5 10 15 8 4 42 Facumulada 5 15 30 (210 e 220) 38 42

n= 42 par, Md ser a mdia entre os elementos de ordem =

n 2

n 2

+1

42 2

= 210 e

42 + 1 = 220. Observando os elementos 21 e 22 na Fac correspondem a 87. 2

Logo:

87 + 87 = 87 ( a mediana). 2
42

8. MEDIDAS DE DISPERSO - Para Variveis Discretas Considere as trs sries de dados coletados seguintes: X : 10, 10, 10, 10, 10, 10, 10, 10, 10, 10 Y : 7, 8, 9, 9, 10, 10, 11, 11, 12, 13 Z : 3, 4, 5, 6, 10, 10, 14, 15, 16, 17 As trs sries tm uma caracterstica comum, que o valor da mdia. Essa mdia 10 para as trs sries. Entretanto elas diferem entre si com relao ao agrupamento dos dados em torno dessa mdia. Na srie X todos os dados so iguais a 10 e portanto a mdia representa muito bem essa srie. Na seqncia Y v-se que vrios dados diferem da mdia, mas esto prximos dela, ou seja, apresentam grande concentrao em torno de 10. A mdia representa razoavelmente bem a srie. Na seqncia seguinte, Z , existem vrios valores muito afastados do valor 10 e portanto a mdia no representa muito bem a srie. Em resumo, em X todos os dados esto totalmente concentrados na mdia 10 e, portanto no h disperso de dados. Em Y existe forte concentrao de dados sobre a mdia e fraca disperso. Em Z h fraca concentrao de valores sobre a mdia e grande disperso de dados. , portanto importante construir medidas que avaliem a representatividade da mdia, estas medidas so denominadas medidas de Disperso , e como o nome j define , medem o grau de disperso dos dados em relao a um determinado valor, normalmente em relao Mdia. As medidas de disperso mais utilizadas e conhecidas so: A Amplitude total, O Desvio Mdio, A Varincia e o desvio Padro:

43

8.1 Desvio mdio simples ( dm ).

a mdia aritmtica dos desvios de cada

elemento da srie em relao mdia dessa srie. O desvio de um elemento para a mdia o valor absoluto (mdulo) da diferena entre ambos. Clculo do dm para variveis discretas. Na srie Y do exemplo anterior, Y : 7, 8, 9, 9, 10, 10, 11, 11, 12, 13 Esse clculo pode ser melhor visualizado usando uma tabela de distribuio de freqncias e aplicando a frmula para o clculo do dm.

dm =

di . f i fi

I di I = xi x cada varivel menos a mdia usaremos o valor absoluto (em mdulo)

Notar que sempre preciso calcular a mdia da srie para se ter o dm Lembrar que a mdia dada por:

x=

xi f i fi

para esta diferena ou seja sempre positivo A tabela abaixo representa a srie Y:

xi 7 8 9 10 11 12 13

fi 1 1 2 2 2 1 1 10

xi . f i
7 8 18 20 22 12 13 100

di = xi - x 3 2 1 0 1 2 3

I dII . f i 3 2 2 0 2 2 3 14 100 x= = 10 10

f i = 10

x i f i = 100

d i f i = 14 dm = 14 = 1,4 . 10

Substituindo os valores na frmula tem-se que

A interpretao desse resultado que, em mdia, cada elemento da srie est distante 1,4 unidade da mdia 10.

8.2 Varincia O clculo do desvio mdio simples implica no clculo do mdulo dos desvios dos dados em relao media. Esse mdulo sempre um nmero positivo, que associado a uma distncia. Uma outra forma de se ter valores positivos para os desvios considerar o quadrado de

( xi x ) , ou seja, ( xi x ) 2 . Substituindo na frmula do dm o mdulo


44

xi x por essa expresso obtm-se uma nova medida de disperso chamada varincia.
Assim, para uma populao de n elementos, a varincia dada por V( x ) .

( di )2 fi V ( x) = ( x) = n
2

8.3 Desvio Padro. Define-se o desvio padro como sendo a raiz quadrada positiva de V(x). O desvio padro representado simbolicamente pela letra grega sigma minsculo

( x) =

V ( x)

Obs: Quando os elementos da srie representam uma populao, a varincia ser simbolizada por 2 ( x ) e o desvio padro por ( x ) . Se os elementos representam uma amostra, a varincia ser denotado por s 2 ( x ) e o desvio padro por s ( x ) . Os valores de
2 2 ( x ) e s ( x ) diferem numericamente, j que a varincia amostral tem como denominador

o valor n 1 e no n, sendo portanto ligeiramente maior que a varincia populacional. Dessa forma, temos:

Desvio padro populacional:

( x) =

(di ) 2 f i n
(d i ) 2 f i n 1

Desvio padro amostral:

s ( x) =

As frmulas acima so usadas para o clculo de desvio padro de variveis discretas. No caso de variveis contnuas substitui-se o valor da varivel xi pelo valor mdio da classe

x i , como veremos no captulo mais a frente.

Clculo da varincia e do desvio padro. Varivel discreta Como exemplo, ser calculada a varincia e o desvio padro de uma populao

representada pela distribuio de freqncias da srie Y


45

xi 7 8 9 10 11 12 13

fi 1 1 2 2 2 1 1 10

xi f i 7 8 18 20 22 12 13 100

di = xi - x 3 2 1 0 1 2 3

I dII . f i 3 2 2 0 2 2 3 14

di 9 4 1 0 1 4 9

fi . di 9 4 2 0 2 4 9 30

Acrescenta-se a coluna que o produto x i f i para se calcular a mdia. A soma dos elementos da segunda coluna d o nmero total de elementos na srie n = f i

n = f i = 10

x i f i = 100

x=

xi f i = 10 n

2 Desenha-se outra coluna dos valores ( d i ) f i .

A soma dos elementos dessa coluna dividida por n populao. Portanto, V (x) =

d o valor da varincia da

2 ( x) =

30 =3 10

O desvio padro

( x) = 3 = 1,7

Se a srie representa uma amostra de uma populao, ento o denominador ser igual a 9 e os valores da varincia e do desvio padro sero 3,3 e 1,8 respectivamente. A seguir, sero apresentadas algumas consideraes sobre as Medidas de disperso (disperso de nmeros). O conceito de desvio padro o que mostra a maneira como os dados agrupam se em torno do centro da distribuio.

8.4 A amplitude total At = Vm vm,


46

Foi definida como um indicador de variabilidade rpido e grosseiro, facilmente calculada a partir da diferena entre o maior e o menor dado da distribuio. No exemplo Y temos At = 13 7 = 6 O desvio mdio no muito usado em pesquisa, uma vez que ele no se presta a muitas anlises estatsticas avanadas. Por outro lado, o clculo do desvio padro implica a utilizao de um procedimento aceitvel do ponto de vista matemtico, com vistas de contornar o problema dos sinais de + , -. O desvio padro uma medida de variabilidade confivel, de nvel intervalar, que pode ser utilizada em operaes estatsticas avanadas, descritivas ou inferenciais.

47

9. DISTRIBUIO DE FREQUNCIAVARIVEL CONTNUA (dados agrupados) Um dos objetivos de construir a distribuio de freqncia resumir o conjunto de dados. No caso de variveis contnuas no podemos construir a distribuio de freqncias listando um a um os resultados, pois no havendo observaes iguais no h reduo na tabela. Desta forma interessante agrupar os resultados em classes. Para agrupar os dados de uma varivel em classes devemos ter alguns cuidados: 1. Adotar classes de mesma amplitude, sempre que possvel; Amplitude total de uma seqncia, At, a diferena entre o maior e o menor elemento de uma seqncia. Representa o comprimento total da seqncia:

At = X max X min
2. Determinar o nmero de classes K Se adequarmos muitas classes no reduziremos os dados e, poucas classes poderemos perder as informaes. Sugere-se o uso de entre 5 a 15 classes com a mesma amplitude. Sendo K=

(usual)

ou

K = 1 + 3,3 log n

n = nmero de dados coletados K = o nmero de grupos, classes que iremos formar ( ou seja o nmero de linhas que teremos na tabela) , normalmente arredondaremos o resultado para o nmero inteiro maior , por exemplo K =

24 =4,89 ento, teremos

K = 5 classes ( 5 linhas na tabela) 3. Amplitude ou intervalo total de classe, h, o tamanho de cada classe, ou seja, de quanto em quanto iremos agrupar os dados coletados Ou h=

At

, onde K = nmero de classes.

a diferena entre o limite superior e o limite inferior de cada classe: h = L s Li Por exemplo: 2 4, Li (limite inferior) = 2 e Ls (limite superior) = 4

Exemplo: Usando os dados da Tabela 1.1 construa a distribuio de freqncias da varivel: salrios Resoluo: Natureza da varivel qualitativa contnua: Salrios

48

Da Tabela 1.1, (pg.32) computando as freqncias absolutas de cada classe, construmos a varivel contnua os salrios vo de 4 at 23,30. A seqncia que devemos obedecer : 1 Ordenar os dados coletados (ordem crescente) e contar quantas vezes cada varivel aparece
Salrio (Sal. min) 4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,44 7,59 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30 fi 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 - A t = amplitude total = 23,30 4,0 = 19,30

2 - Nmero de classes = K = n = 36 = 6 ; Logo n de classes, ou grupos quem iremos formar ser 5, 6 ou 7


o

3 - h = Amplitude de classes

h=

At

19 ,30 = 3,26 = 4 6

Agruparemos os valores dos salrios de 4 em 4 Cada grupo ter um limite inferior Li e um limite Superior Ls Quando h = par usaremos intervalo aberto a direita, e Ls = Li + h - 1 A 1 classe ser de 4 salrios a 8 4 I----- 8 com 10 elementos

A 2 classe ser de 4 salrios a 8 8 I----- 12 note que o valor de 12 salrios no entrar por ser intervalo aberto (no inclui o Ls)

O valor 12 entrar na classe seguinte de 12 I---- 16

A tabela de distribuio ficar ento, ver pagina seguinte

Salrios Li Ls fi
10 12 8 5 1 36 4,00 8,00 8,00 12,00 12,00 16,00 16,00 20,00 20,00 24,00 Xi ou pm 4+8/2=6 10 14 18 22 fi . xi 60 120 112 90 22 404 f% 27,78 33,33 22,22 13,89 2,78 100,00

f ac
10 22 30 35 36

fac.% 27,78 61,11 83,33 97,22 100,00

49

Estes valores podem ser interpretados da seguinte forma: 35 empregados recebem salrios menores que 20; que corresponde a 97,22% dos empregados recebem salrios menores que 20, assim por diante. Ex. Sendo xi ou pm = ponto mdio de cada classe = Li + Ls 2 10. MEDIDAS DE TENDENCIA CENTRAL PARA VARIVEL CONTNUA 10.1 Determinao da Mdia de uma distribuio de freqncia,

Se os dados esto apresentados na forma de uma varivel contnua, utilizaremos a mdia aritmtica ponderada, considerando as freqncias simples das classes como sendo as ponderaes dos pontos mdios destas classes. A frmula a mesma da dist. com

variveis discretas

x =

f ix
n

f ix fi

No exemplo acima temos que a mdia de salrios ser :

f ix
n

404 = 11,22 O Salrio mdio dos funcionrios de 11,22 SM . 36

Exemplo: Determinar a mdia dos seguintes dados: no acidentes Li 0 10 20 30 40 Ls 10 20 30 40 50 Freqncia fi 2 1 5 8 4 20 Ponto mdio xi 5 15 25 35 45 fi.xi 10 15 125 280 180 610

Os pontos mdios das classes x

se determinam tomando-se a mdia do limite 2

inferior de cada classe e do limite superior x i = Li + Ls

Soluo:

f ix
n

610 = 30,5 20

10. 2 Determinao da Moda de uma distribuio de freqncia, Mo Para determinar a moda de uma varivel contnua, podemos optar por vrios processos ( Moda de Pearson, moda de King, moda de Czuber). Daremos destaque para a moda de Czuber.

50

MODA DE CZUBER : CZUBER levou em considerao, em sua frmula a freqncia simples da classe anterior, a freqncia simples da classe posterior, alm da freqncia simples da classe modal. Mo = Li Mo +

(f

max

max

(f

f
ant

ant

)
f
post

) .h

Onde: todos os valores dependem da posio da maior freqncia f Max = freqncia simples da classe modal = freqncia mxima; Li Mo = limite inferior da classe modal; f ant = freqncia simples da classe anterior classe modal; f post = freqncia simples da classe posterior classe modal; h = amplitude do intervalo de classe. Exemplo: Calcule a moda de Czuber para a distribuio: Li 0 10 20 30 Ls 10 20 30 40 fi 1 3 6 2

Soluo: A classe modal a terceira classe, a Mo vale: Mo = 20 +

63 .10 = 24,29 (valor mais freqente nesta distribuio). 2(6) (3 + 2)

Graficamente: preciso construir o histograma da distribuio, identificar a classe modal (aquela com maior altura) e fazer a construo abaixo:

7 6 5 4

f 6

0 a 10 10 a 20 20 a 30 30 a 40

3 3 2 2 1 1 0 1 classes

10. 3 Determinao da Mediana de uma distribuio de freqncia, Md Procedimento:


51

1. Calcula-se P =

n , como a varivel contnua, no se preocupe se n par ou mpar; 2


fac (valor igual ou imediatamente superior a P) identifica-se a

2. Localizar P na coluna

classe que contm a mediana (classe da ~ x ); 3. Utiliza-se a frmula:

Md = LMd +
Onde:

h .(P f acant)

dP

L Md = limite inferior da classe onde esta P (mediana); P = elemento mediano ; P = n / 2 ou P = fi / 2 fac ant = soma das freqncias anteriores classe onde esta P; h = amplitude da classe Md; f dP = freqncia simples (fi) da classe onde esta P

Exemplo: Classes 35 45 45 55 65 75 85 55 65 75 85 95 fi 5 12 18 14 6 3 58 Fac 5 17 35(classe Md) 49 55 58

10 passo: Calcula-se P =

n . 2

Como n = 58, temos

58 2

= 290;

2o passo: Identifica-se P na classe Md na coluna fac. Neste caso, a classe Md a 3a; 3o passo: Aplica-se a frmula

Md = LMd +
Neste caso: LMd = limite inferior da classe Md = 55 n = nmero de elementos = 58

h .(P f acant)

dP

fac ant = soma das freqncias anteriores classe Md = 17 h = amplitude da classe Md = 10 fdP = freqncia da classe Md = 18 Md = 55 +
10.4

58 17 ).10 2 = 61,57

18

Separatrizes: mediana, quarts, decs e Percents


52

As separatrizes so valores que ocupam determinados lugares de uma srie ordenada (rol). A mediana (Md) uma separatriz que divide a distribuio (srie ordenada) em duas partes iguais, como j vimos anteriormente. Os quarts, decs e Percents so separatrizes como a mediana. Os quarts dividem a distribuio em quatro partes iguais, os decs em dez partes e os Percents em cem partes iguais. Assim para dividir uma srie ordenada de valores em quatro partes iguais, precisamos de trs separatrizes (quarts); para dividi-la em dez, iremos recorrer a nove separatrizes (decs); em cem, recorremos a noventa e nove separatrizes (Percents).Para calcul-los usamos a mesma frmula da mediana, havendo diferena apenas nos divisores para a determinao das posies em que se encontra o elemento desejado. Quarts: Qi (i = 1, 2, 3)

Eqi = Q2 = 50% ;

i.N 4 Q3 = 75%

Q1 = 25%;
Decs: Di

(i = 1,2,3, ... , 9) ;

Edi = D3 = 30% ; . . . .
;

i. N 10
;

D1 = 10% ;
Percents: Pi

D2 = 20% ;

D9 = 90%

(i = 1,2,3, ... , 99)

E pi =
;

i. N 100 P99 = 99%

P 1 = 1% ;

P2 = 2% ; P3 = 3% ; . . .

Nota: N o nmero de elementos da distribuio = fi 11. MEDIDAS DE DISPERSO PARA VARIVEIS CONTNUAS 11.1 Clculo do DMS para varivel contnua.

Neste caso usa-se a mesma frmula da varivel discreta, substituindo o valor x i pelo ponto mdio da classe DMS = xi - x fi fi xi Acrescentam-se mais quatro colunas a essa tabela. A primeira o valor mdio de cada classe x i a segunda o produto x i f i , a terceira o desvio do valor mdio de cada classe em relao mdia da srie e a quarta coluna o produto x i x f i .

Exemplo: Calcule o DMS da distribuio de freqncias abaixo: Classes INT.CLASSE

fi
53

1 2 3 4

3 5 7 9

5 7 9 11

4 8 6 4

Class e 1 2 3 4 f i = 22

CLASSE

fi

xi

xi fi

di= x i x

xi x fi

3 5 7 9

5 7 9 11

4 8 6 4

4 6 8 10 x = 6,9

16 48 48 40

2,9 0,9 1,1 3,1

11,6 7,2 6,6 12,4

x i f i = 152

x i x f i = 37,8
i n

Ento o DMS ser:

DM =

i =1

/ d

/ fi =
i

/ d

/ fi

N =

i =1

37 ,8 1,7 . 22

Interpretao do resultado: Em mdia, cada elemento est afastado 1,7 unidades da mdia 6,9. 11.2 Varincia

Neste caso os valores contidos em certa classe i no so conhecidos. Calculam-se ento os valores mdios das classes, denotados por x i . A varincia calculada pela frmula:

(d i ) 2 f i V (x) = ( x) = fi
2

11.3- Desvio Padro O desvio padro populacional , portanto:

S ou =

d . f
2 i i

fi

Se a varivel representa uma amostra, a varincia ser denotada por

s 2 ( x) ,

que

calculada pela frmula:

s 2 ( x) =

( d i ) f i n 1
54

O desvio padro amostral dado por:

s ( x) =

(d i ) f i n 1

Exemplo: Calcule a varincia e o desvio padro para a distribuio de uma amostra dos valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos Consumo Por Nota US$ 1 2 3 4 5 0 50 100 150 200 50 100 150 200 250 10 28 12 2 1

Classe

N0 de notas

6 250 300 1 Acrescentam-se as colunas que mostram os valores mdios das classes ( x i ) e o produto desses valores pelas respectivas freqncias. Isso til para se calcular o valor mdio da distribuio x

( )
N 0 de notas fi 10 28 12 2 1 1 54

Class e 1 2 3 4 5 6

Consumo Por Nota US$ 0 50 100 150 200 250 50 100 150 200 250 300

xi
25 75 125 175 225 275

xi fi
250 2.100 1.500 350 225 275 4.700

A mdia :

x=

x i f i 4.700 = =87 n 54

Finalmente acrescenta-se a coluna com os valores de di . fi = ( x i x ) 2 f i .


Consumo Por Nota US$

Classe

de x i 25 75

xi fi 250 2.100

( xi x )2 fi

1 2

0 50

50 100

notas 10 28

38.440 4.032
55

3 4 5 6

100 150 200 250

150 200 250 300

12 2 1 1 54

125 175 225 275

1.500 350 225 275 4.700

17.328 15.488 19.044 35.344 129.676

Varincia = s 2 ( x ) =

129 .676 = 2.446 ,72 54


2.446 ,72 = 49 ,46

Desvio padro = s ( x ) =

A unidade da varincia, neste exemplo, ( US$ ) 2 e a unidade do desvio padro US$. Comentrios sobre a varincia e o desvio padro. A unidade em que a varincia expressa o quadrado da unidade de medida de uma srie. Isso leva concluso que a varincia no admite interpretao. Por exemplo, se os dados so expressos em unidade de rea , metro quadrado , por exemplo, a varincia seria expressa em metro elevado quarta potncia, o que no tem significado. Entretanto, o desvio padro tem a mesma unidade de medida dos dados, j que a raiz quadrada da varincia. O desvio padro admite, portanto uma interpretao, como ser visto nos exerccios. Em distribuies de freqncias em que os dados so simtricos em relao mdia, como na figura abaixo, o intervalo em torno dessa mdia, desde x at contm aproximadamente 68 % dos valores da srie. Os intervalos x +

[ x 2 ,

x + 2

[ x 3 ,

x + 3

contm
2,2 2,0 1,8 1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 0,0 -2

aproximadamente 95% e 99% dos valores da srie,

respectivamente.

x-
-1

x
1

x+

Se, por exemplo, temos uma srie de dados que apresenta mdia x = 50 e desvio padro ( x ) = 3 , sendo esses dados distribudos simetricamente em relao mdia, interpretamos esses valores como: 1) Os valores da srie esto concentrados em torno de 50;
56

2) 3) 4)

O intervalo O intervalo O intervalo

[ 47 ,

53

contm aproximadamente 68 % dos valores da srie; contm aproximadamente 95 % dos valores da srie; contm aproximadamente 99 % dos valores da srie.

[ 44 , [ 41,

56

] 59 ]

As medidas de desvio padro so medidas absolutas da disperso dos dados de uma srie. Assim, se uma srie X tem mdia 100m, com desvio padro 5, e outra srie Y tem mdia 50 com desvio padro 4, conclui-se que a srie X tem uma disperso absoluta maior. Entretanto pode-se definir uma medida, chamada coeficiente de variao, que d a disperso relativa da srie. Esse coeficiente, denotado por CV(x), dado por:

CV ( x) =

( x) x

O coeficiente de variao um nmero puro, ou seja, no tem unidade de medida. Pode, portanto, ser expresso em porcentagem. Nos exemplos acima calcula-se que para a srie X CV(x) = 5% e para a srie Y CV(y) = 8%. Nota-se, portanto, que a srie X tem uma disperso relativa menor.

12.PROBABILIDADES 12.1 - Noes de Probabilidade Experimento aleatrio, Eventos, Definio de probabilidade, Tipos de eventos, Aplicaes INTRODUO Consciente ou inconscientemente, a probabilidade usada por qualquer indivduo que toma decises em situaes de incerteza. Conhecendo ou no regras de clculo, muitas pessoas interessam-se por eventos ligados s probabilidades. So vrias situaes em que desejvel se ter uma medida (avaliao numrica) de quo provvel a ocorrncia de determinado evento futuro. Por exemplo: lanamento de um produto, bons lucros em uma operao mercantil, meu time vai ganhar o prximo jogo, etc. Por definio probabilidade pode ser calculada como: P(A) = N. de casos favorveis de ocorrer o evento A N. de Casos possveis no total

57

Como nas distribuies de freqncias, vamos tratar sobre as distribuies de probabilidades de populaes. Pode-se dizer que uma distribuio de freqncia de uma amostra uma estimativa das distribuies de probabilidades da populao.
As anlises das distribuies de probabilidades possibilitam a construo de modelos que nos auxiliam no entendimento de fenmenos do mundo real. VARIVEIS ALEATRIAS (V.A.) Uma varivel aleatria, X = v.a., fornece um meio para descrever por valores numricos os resultados experimentais. Definio: Uma varivel aleatria uma descrio numrica do resultado de um experimento Classificao: varivel aleatria discreta e varivel aleatria contnua. Definies: Uma v.a. considerada discreta se toma valores que podem ser contados, ou seja, pode assumir um nmero de valores de X for finito como uma seqncia infinita numervel (0, 1, 2, 3, ). Uma v.a. considerada contnua se pode assumir qualquer valor numrico em um intervalo ou uma coleo de intervalos.

Tabela 1 - Exemplos de variveis aleatrias discretas


Experimento Contatar cinco clientes Inspecionar embarque de 50 rdios Operar um restaurante por um dia Vender um automvel Varivel aleatria (X) N de clientes que fecham pedido Nmero de rdios defeituosos Nmero de clientes Sexo do cliente Possveis valores para X 0, 1, 2, 3, 4, 5 0, 1, 2,........48, 49, 50. 0, 1, 2, 3, ......... 1 masculino. 2 feminino.

Tabela 2 - Exemplos de variveis aleatrias Contnuas


Experimento Operar um banco Encher um copo de refrigerante Elaborar projeto de construo Testar novo processo qumico Varivel aleatria (X) Tempo de chegada dos clientes Nmero de ml % concludo aps 6 meses Temperatura tima de reao (min 65 oC, max. 100 oC) obs.: a varivel aleatria (x) ser utilizada para estabelecer modelos tericos de probabilidade com a finalidade de descrever populaes Possveis valores para X X 0 ( em minutos) 0 X 343 mL (max.=343 mL) 0 X 100 65 X 100

P(A) = N. de casos favorveis de ocorrer o evento A N. de Casos possveis no total Exemplo . Qual a probabilidade de jogando-se um dado : a) sair o lado n 2 N total de resultados ( 1,2,3,4,5,6) = 6 n de casos favorveis = ( s n 2) = 1
58

P( x=2) = 1 / 6 b) de sair um n par ? Ns pares = 2,4,6, = 3 casos favorveis ento P (x=par) = 3 / 6 c) de sair um mltiplo de 3 ( mltiplos de 3 so 3,6) Ns mltiplos de 3 = 3,6 = 2 casos favorveis ento : P (x=mltiplo de 3 ) = 2 / 6 d) de sair mltiplo de 3 e n par ( mltiplos de3 so 3,6 Ns pares= 2,4,6) Ns pares = 3,6, = 2 casos favorveis ento :

12.2 Teorema do Produto


Probabilidade de ocorrer A e B simultaneamente simbolizado por P(A B) = A interseco com B e ser = Prob A x Prob de B. O E em probabilidade significa produto eventos simultneos, devem ocorrer os dois ao mesmo tempo P ( par e mltiplo de 3 ) = P(par) x P(mltiplo de 3 ) = 3 / 6 X 2/6 = 6/36 = 1/6 P( A

B) = 1 / 6

Por lgica temos que o nico caso favorvel de ser par e mltiplo de 3 simultaneamente 6 P(x par e x mltiplo de 3) = 1/6

12.3 Teorema da Soma


e) de sair mltiplo de 3 ou n. par ( mltiplos de 3 so 3,6; Ns pares = 2,4,6). Neste caso pode ocorrer um evento ou outro simbolizado por P(AUB) - probabilidade de ocorrer A unio com B = P(A) + P(B) P( A

B )
B )

Probabilidade de ocorrer ou A ou B = Prob A + Prob de B - P( A

P (x=mltiplo de 3 ou par) = p( x3) + p(par) p( x 3 e par ) = 3 / 6 + 2/6 1/6 = 5/6 A subtrao da interseco necessria pois, estaramos contando com o nmero 6 duas vezes, 1 como n par e outra como mltiplo de 3, o que no realidade pois no dado, s temos 1 vez o nmero 6

Exerccios de aplicao 1- Numa classe com 64 alunos, 16 so mulheres. Qual a probabilidade de sorteando simultaneamente 2 alunos sejam : a ) 2 HOMENS Soluo: Temos no Total n=64 alunos sendo mulheres = 16 portanto, homens = 64-16 = 48 homens
59

b ) 2 MULHERES

c ) 2 HOMENS OU 2 MULHERES

a) P(homem) = 48 / 64 (sorteando um s) como so dois simultaneamente, teremos que retirar um homem E outro homem. O E em probabilidade significa produto eventos simultneos devem ocorrer os dois ao mesmo tempo. Desta forma teremos que a probabilidade de sair um homem e a seguir outro homem ser : p(H1) x P(H2) = 48/64 x 48/64 = simplificando por 16 fica : 3 / 4 x 3 / 4 = 9 / 16 b) P(mulheres) Analogamente a probabilidade de sair mulher e a seguir outra mulher ser: p(M1) x P(M2) = 16/64 x 16/64 = simplificando por 16 fica: 1 / 4 x 1 / 4 = 1 / 16
d) P (2homens ou 2 mulheres) o OU em probabilidades significa soma , como no caso

no temos a interseco P( A

B )

=0

P(AUB) - probabilidade de ocorrer A unio com B = P(A) + P(B) ento p(2H U 2M) = 9/16 + 1/16 = 10/16 = 5/8

12.4 Eventos com e sem reposio Quando tivermos eventos com reposio dos elementos, significa que o N total deles permanecer sempre o mesmo , como no exemplo a seguir : Uma urna tem 2 letras O , 2 C , 2 A , 1 D e 3 letras X .Qual a prob. de retirando-se uma a uma formar na seqncia a palavra COCADA a ) Com Reposio ; ; ; ; ; ; ; Temos o total 10 letras, (ser constante) pois, a cada retirada, a letra ser reposta na urna 1 C 1 O 2 C 1 A 1 D 2 A

2/10 x 2/10 x 2/10 x 2/10 x 1/10 x 2/10 = 2x2x2x2x1x2 /10x10x10x10x10x10 = 32 / 1.000.000 para compararmos com o prximo resultado simplificando por 32 temos : 1 / 31.250 b) Sem Reposio Temos no total 10 letras, que no ser constante, pois, a cada retirada, o nmero total de letras que permanecero na urna ser alterado (diminuindo de1) bem como as letras, veja no exemplo: 1 C 1 O 2 C 1 A 1 D 2 A
60

2/10 x 2/9 x 1/8 x 2/7 x 2/6 x 1/5 = 2 x 2 x 1x 2 x 2 x 1/10 x 9 x 8 x 7 x 6 = 16 / 151.200 j saiu um C j saiu um A Simplificando por 16 teremos: 1 / 9450 Compare os resultados e qual sua concluso. Faa os exerccios abaixo 1 - Uma urna tem 2 letras B , 2 N , 3 A , 1D . Qual a prob. de retirando-se uma a uma formar BANANA ? a ) Com Reposio a palavra SURURU ? a ) Com Reposio b ) Sem Reposio Extra: Agora que voc j conhece a probabilidade, determine qual sua chance de ganhar na Megasena jogando 6 dezenas (lembre-se que so sorteadas 6 dezenas SEM REPOSIO, num total de 60 dezenas) 12.5 UNIO INTERSECO DE 2 E 3 CONJUNTOS . APLICAES Relembrando P(A ) = n de casos favorveis N DE CASOS TOTAL e a probabilidade desfavorvel ser = q probabilidade de no ocorrer o evento p+q=1 ou em percentual p + q = 100% A probabilidade de sair o n 4 no lanamento de um dado ser p = 1 / 6 = 0,1667 ou ainda 16,67% Portanto a probabilidade de no sair o 4 ser : q = 1 1 / 6 = 5 / 6 = 0,8333 ou ainda 83,33% = p b ) Sem Reposio
2 - Uma urna tem 2 letras S , 2 R , 3 U , 1 M .Qual a prob. de retirando-se uma a uma formar

Operaes com 2 e 3 Conjuntos


Conceito : Coleo ou agrupamento de objetos , so representados por letra maiscula R = Nmeros reais Q = Nmeros racionais ( sub conjunto dos reais) N = Nmeros naturais ( sub conjunto dos reais e racionais ) Q R

Q esta contido em R R no esta contido em Q


61

Q no contem R

Elemento : objetos que constituem um conjunto OPERAES COM CONJUNTOS Unio AUB = o conjunto de elementos que pertencem a A ou B Ex. A ={4,5,3} B = { 0,3,1} AUB = {4,5,3,0,1} ( no contamos 0 3 duas vezes ) Interseco A B = o conjunto de elementos que pertencem a A e B , simultaneamente Ex. A ={ 4,5,3 } B = { 0,3,1} A B= {3} n(B) = 3 conjunto finito

Nmero de elementos de um conjunto n (A) = 3 N ( R ) = conjunto infinito

NMERO DE ELEMENTOS DA UNIO DE 2 CONJUNTOS n (AUB) = n (A) + n ( B ) - n (A B) Ex. A = { 4,5,3 } A 4 5 X 3 0 1 Un= B B = { 0,3,1} n(A) = 3 n(B) = 3 n(AB) = 1 n(AUB) = 3 + 3 - 1= 5 elementos

Un =conjunto Universo = engloba todos os elementos de certo fenmeno, objeto de estudo X = conjunto de outros elementos que no pertencem a A ou B Exemplo Prtico

Nmero Total de elementos da Unio de 2 conjuntos e conjunto independente B) + X ( outros / nenhum ) n (Un)= n (A) + n ( B ) - n (A
Num levantamento efetuado com 600 aposentados, mostrou que muitos deles mantm convnio mdico com duas empresas particulares : A = Jesus te espera B = Hate Evil, conforme quadro abaixo empresa convenio A 430 B 160 AeB s com INSS 60 a ) filiados s duas empresas ?

Pergunta-se qual a probabilidade de serem

b ) Quantos so filiados exclusivamente Jesus te espera ? Nmero Total de elementos da Unio de 2 conjuntos e conjunto independente
62

Un = 600 =

n (A) + n ( B ) - n A 430 + 160 -

B + X ( outros / nenhum ) AB + 60
600 =430 + 160 - n A

X = conjunto de outros elementos que no pertencem a A nem a B

B + 60

A= 430 380 INSS 60 50

B = 160 110 Un= 600

n( A B ) =650 - 600 Exclusivamente A = 430 50 = 380 Exclusivamente B = 160 50 = 110 Respostas: a ) 50 / 600 b ) 380 / 600

Estude os exerccios abaixo 1 - Numa pesquisa sobre presentes de Natal, uma loja ouviu 2050 meninos, obtendo: 700 querem Play Station 2, 850 querem Autorama e 100 querem PS2 e Autorama Brinquedo Querem PS2 700 Autorama 850 PS2 e Autorama 100 outros

Determine a probabilidade de meninos que: a ) Querem OUTROS presentes ? 600 / 2050 b ) Exclusivamente Play Station 2 ? 600 / 2050 c ) NO querem Autorama ? 1200/2050 Un = n (A) + n ( B ) - n A

B + outros

2050 = 700 + 850 100 + outros Outros = 2050 1450 = 600 PS 2 = 700 600 600 100 Outros A=850 750 U = 2.050

2 - Numa pesquisa margarinas, um supermercado ouviu 2.000 mulheres, obtendo: Margarina Aprovam Doriana 1.150 Milla 800 DeM outras 400

O supermercado quer saber quantas mulheres e respectivo percentual ( probabilidade)


63

a) Aprovam as duas margarinas? b) Exclusivamente Doriana ? c) NO querem Milla? Un = n (A) + n ( B ) - n A

B + outros

2000 = 1150 + 800 - n A

B + 400
M=800

AB = 2350 2000 = 350


D=1150 800 Outros 400 U = 2.000 350

450

3 - Numa pesquisa sobre preservativos uma empresa ouviu 3.000 meninos, obtendo: preservativo. aprovam Jontex 1500 Olla JeO 600 outras 900

Assim, o povo quer saber qual a probabilidade de garotos que aprovam a) as duas marcas ? b )que aprovam exclusivamente Olla ? c )que NO usam Jontex ? d) que aprovam Outras marcas ? Un = n (A) + n ( B ) - n A

B + outros

3000 = 1500 + O 600 + 900 O = 3000 1800 = 1200 J =1.500 900 600 O =1.200 600 U =3.000

900 Outras

NMERO DE ELEMENTOS DA UNIO DE 3 CONJUNTOS n (AUBUC) = n (A) + n ( B ) + n ( C ) - n ( A A B


64

B ) - n ( AC ) - n ( BC ) + n ( ABC )

X = Outros ou nenhum

U=

Nmero Total de elementos da Unio de 3 conjuntos e conjunto independente n (Un)= n (A) + n ( B ) + n ( C ) - n (AIB) - n (AIC) - n (BIC) + n (AIBIC) + X

Un = Universo = engloba todos os elementos de determinado fenmeno, objeto de estudo X = conjunto de outros elementos que no pertencem a A nem a B nem C , denominado de outros ou de nenhum,

Exemplo Prtico Numa pesquisa do Campeonato Paulista 2007, obtivemos as seguintes opinies sobre o futuro Campeo: CAMPEO Santos Corinthians So Paulo S e C S e SP C e SP CeSeSP outros PONTADO 600 800 600 200 150 250 100 1.500 S =600 350 100 100 50 300 1.500 SP = 600 U=? Pergunta-se Quantas pessoas foram ouvidas? Qual a probabilidade de apontarem: a ) exclusivamente o So Paulo c ) o Santos ? atravs da frmula : n (Un)= n (A) + n ( B ) + n ( C ) n (AIB) - n (AIC) - n (BIC) + n (AIBIC) + X U = 600 + 800 + 600 200 150 250 + 100 + 1500 = 3.000 Quando tivermos todos os elementos dos conjuntos poderemos traar o grfico sempre iniciando do valor central no caso 100 torcedores (Interseco dos trs conjuntos).
65

C = 800 450

150 Outros

b ) no mnimo 2 destes times d ) no apontaram o Timo ?

Para resolvermos exerccios deste tipo devemos determinar o nmero total de elementos

Agora deveremos colocar no grfico os elementos das interseces de 2 conjuntos, No esquecer de subtrair os elementos da interseco de 3 conjuntos Santos e Corinthians so 200 -100 = 100 Santos e So Paulo so 150 -100 = 50 So Paulo e Corinthians so 250 100 = 150 O ltimo passo colocarmos no grfico os elementos exclusivos de cada conjunto, adotando o seguinte procedimento: O conjunto do Santos deve conter 600 elementos e j possui 100 da interseco dos trs conjuntos, 100 da interseco com Corinthians e 50 da Interseco com o So Paulo, fazendo um total de 250 elementos. Para completarmos os 600 elementos do conjunto do Santos temos 600 250 = 350 elementos que apontaram exclusivamente o Santos .

De maneira anloga faremos com o conjunto do So Paulo e do Corinthians So Paulo = 600 Exclusivamente SP = 600 -100 - 50 150 = 300 Corinthians = 800 Exclusivamente Corinthians = 800-100 - 100 150 = 450 Somando-se todos os elementos internos dos conjuntos obteremos 1.500 torcedores que adicionado aos 1.500 que apontaram outros times daro os 3.000 elementos ouvidos na pesquisa.

66

BIBLIOGRAFIA CONSULTADA: 1. BUSSAB, W. O. & MORETIN, P. Mtodos Quantitativos: Estatstica Bsica. 4a ed. So Paulo. Atual. 1997. 2. DOWNING, D. & CLARK, J. Estatstica Aplicada. So Paulo. Saraiva 1997. 3. LEVIN, Jack. Estatstica aplicada a cincias humanas. 2a.ed. Trad. COSTA, Srgio Francisco. So Paulo : Harbra, 1987. 4. MARTINS, Gilberto Andrade. Estatstica geral e aplicada. 2a ed. So Paulo: Atlas, 2002. Paulo: Atlas, 1979 6. RICCI, Delcnio Estatstica Bsica para cursos de Administrao e Comrcio Exterior, apostila Uni A 7. SAMARA, Beatriz & Barros, Jos Carlos. Pesquisa de Marketing. So Paulo: Makron Books, 1997. 8. SILVA da, E. M. e colaboradores. Estatstica para os Cursos de Economia, Administrao e Cincias Contbeis. V. 01 e 02. 2a ed. So Paulo. Atlas.1997 9. SMAILES, Joanne; MC GRANE, ngela. Estatstica aplicada administrao com Excel. 1a ed. Trad. BRITO, Christiane. So Paulo: Atlas, 2000. 10. STEVENSON,W. J.Estatstica Aplicada Administrao. 2a ed. So Paulo. Harbra. 1986. 5. MARTINS, Gilberto De Andrade, DONAIRE, Denis. Princpios de Estatstica. 4a ed. So

BIBLIOGRAFIAS SUGERIDAS ANDERSON, David R. Estatstica aplicada administrao e economia. 2a ed. Trad. PAIVA, Lus Srgio Castro. So Paulo: Pioneira, 2002. FREUND, John E. & SIMON Geray A. Estatstica aplicada para economia, administrao e cincias contbeis. 9a ed., Trad. FARIA, Alfredo Alves de. Porto Alegre: Bookman, 2000. 67

FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatstica. 6a.ed. Sao Paulo : Atlas,1996. LEVIN, Jack. Estatstica aplicada a cincias humanas. 2a.ed. Trad. COSTA, Srgio Francisco. So Paulo : Harbra, 1987. MARTINS, Gilberto Andrade. Estatstica geral e aplicada. 2a ed. So Paulo: Atlas, 2002. OVALLE, Izidoro Ivo. Estatstica bsica. 2a ed. So Paulo: Atlas,1995. SMAILES, Joanne; MC GRANE, ngela. Estatstica aplicada administrao com Excel. 1a ed. Trad. BRITO, Christiane. So Paulo: Atlas, 2000.

ESTATSTICA NA INTERNET Colaborao: Prof. Gilberto Teixeira (FEA/USP) 1. SOFTWARE DE ESTATSTICA (Vrios) www.awl-ile.com/stats/index.html 2. DATA DESK 6.0 Software de estatstica exploratria www.awl-ile.com/datadesk/index.html 3. ACTIVE STATS Curso online interativo www.awl-ile.com/stats/activestats/index.html 4. ANLISE ESTATSTICA Curso on line www.stat.sc.edu 5. LABORATRIO VIRTUAL DE ESTATSTICA Curso on line com muitos links www.ruf.rice.edu/~lane/hyperstat/contents.html 6. CENTER FOR SOCIAL RESEARCH METHODS Tudo sobre metodologia de pesquisa http://trochim.human.cornell.edu/index.html 7. METODOLOGIA DE PESQUISA Site rico de informaes, tutoriais, softwares, etc www.york.ac.uk/ins/ctipsuch/resources/res.html 8. STATISCOPE Software on line para criao de grficos estatsticos http://www.df.eth.se/~mikaelb/statiscope
68

9. WEBSTAT Software (On line) construdo em JAVA com rotinas de Anlise Estatstica http:www.stat.sc.edu/~west/webstat
10. CLICK AND LEAR REGRESSION

Software para ensinar regresso (US$ 35,00) http://nsns.com/click/


11. ACTIVSTATS Software para ensinar estatstica Curso completo

http:www.awl-ile.com/stats/activstats/index.html 12. BUSINESS STATISTICS Livro com curso completo de estatstica on line (122pg) http://ubmail.ubalt.edu/~harsham/business-stat/opre564.hb4 Verso interativa em: http://ubonline.edu/courses/msb/demo/opre504c.nsl

69