À METODOLOGIA DA PESQUISA CIENTÍFICA, PARA TEMAS MILITARES.

ESTATÍSTICA APLICADA

EsAO

À METODOLOGIA DA PESQUISA CIENTÍFICA, PARA TEMAS MILITARES. Volume 1

ESTATÍSTICA APLICADA

Clayton Amaral Domingues - Cap Art

por

1ª Edição

RIO DE JANEIRO EDITORA EsAO --2004

© 2004 by Domingues, Clayton Amaral.

Diagramação: Clayton Amaral Domingues – Cap Art

Revisão: José Fernando Chagas Madeira – Maj Com Luiz Eduardo Possídio Santos – Cap MB Clayton Amaral Domingues – Cap Art

Dados Internacionais de Catalogação na Publicação (CIP) D 671 Domingues, Clayton Amaral. Estatística aplicada: à metodologia da pesquisa científica para temas militares/ Clayton Amaral Domingues. - Rio de janeiro: EsAO, 2004. 85 p. ; il. ; 21 cm. Inclui Bibliografia 1. Estatística – metodologia. 2 Pesquisa – metodologia. I Título. CDD 310

Escola de Aperfeiçoamento de Oficiais Avenida Duque de Caxias, 2071. Rio de Janeiro/ RJ - CEP 21615-220

.................................................1......................... DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS DISCRETAS...........................3 MODA.........3............................................................................4 O COEFICIENTE DE VARIAÇÃO..................................................................................SUMÁRIO 1 2 2.. 2..................2 MEDIANA..........................2...................1 AMOSTRAGEM INTENCIONAL........................... 19 19 19 21 23 24 25 25 25 27 28 28 30 31 2.. 32 INTRODUÇÃO.............................................................1 MÉDIA....................... 3.............................. 3..2......................... INTRODUÇÃO À ESTATÍSTICA DESCRITIVA..........................................1................1 AMOSTRAGEM ALEATÓRIA SIMPLES.....................2........... CONSIDERAÇÕES SOBRE MEDIDAS DE ASSIMETRIA E CURTOSE.........1.............AMOSTRAGEM....................................................3 2...............2 AMOSTRAGEM VOLUNTÁRIA..1...................2 2.....................................................2......2 MEDIDAS DE DISPERSÃO............................2....................... 2.............................2 AMOSTRAGEM ALEATÓRIA.........................3 O DESVIO-PADRÃO....2...................................2........... VARIÁVEIS QUALITATIVAS...................... CAPÍTULO 2 ......2..................................................2........... ...............................3.....................2 AMOSTRAGEM SISTEMÁTICA.........1 3..... 13 CARACTERÍSTICAS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS...1 CAPÍTULO 1 ..1 A AMPLITUDE TOTAL.INTRODUÇÃO À CIÊNCIA ESTATÍSTICA........................................................... 3........... MEDIDAS DE POSIÇÃO............................... MEDIDAS DE ACHATAMENTO OU CURTOSE.... 32 AMOSTRAGEM...............................3....3.... 2....3.. 33 33 33 33 33 33 34 34 3....................................2..............2......4 2........................ 3.............................................2............................................................1...3.... 1 4 4 5 5 6 7 9 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS CONTÍNUAS.......................... 2...3.......................... VARIÁVEIS QUANTITATIVAS...... TÉCNICAS DE DESCRIÇÃO GRÁFICA.3 AMOSTRAGEM ESTRATIFICADA..............ESTATÍSTICA DESCRITIVA.....2......1 MEDIDAS DE ASSIMETRIA............................... 2.................................................... 2.............. 3................... 2...........1 2.......... 2.......................................................................................................................................................................................................1.....................................2.... AMOSTRAGEM NÃO ALEATÓRIA...............................................5 3 3............3....3..............2... 2........4 QUARTIS E PERCENTIS...................................................................................2 2........3..... CAPÍTULO 3 ......................3..........3 2............2 A VARIÂNCIA.................3...................................................................................... DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUALITATIVAS.....2 3.......1...1.....................................2 2...............1 2..3 2...............................................3................................2....2........................................................1 2..................................

................................................................................................ DISTRIBUIÇÃO NORMAL ... ESPAÇO AMOSTRAL ............................ 75 ..................................................... 38 38 39 40 41 41 EXPERIMENTO ALEATÓRIO................... ANEXO I ..............8 6.................................1..........CURVA NORMAL....... EVENTOS...................................................... DISTRIBUIÇÃO DE PROBABILIDADE...5 6............................2 4............................................ CORRELAÇÃO E CAUSA...VALORES CRÍTICOS DOS COEFICIENTES DE CORRELAÇÃO 74 ANEXO VII TABELA PARA TRANSFORMAÇÃO DE r PARA Z.......RELAÇÃO ENTRE VARIÁVEIS...................1 5....2 4.....2 4............. 60 LINHA DE MELHOR AJUSTAMENTO E ERRO DE PREDIÇÃO..4 5 5.............. REGRESSÃO LINEAR...........................1 4.......................................................2........................................3 6.......................................PROBABILIDADE...6 6.............................................................................. CAPÍTULO 6 – CORRELAÇÃO E REGRESSÃO.................. 73 ANEXO VI ....................................................2 6...... 64 ANEXO III ........................7 6......... PODER........................4 AMOSTRAGEM POR CONGLOMERADOS.....ESTATÍSTICA DESCRITIVA...........................................................................................................................................3.3........ 43 ALFA (ERRO TIPO I) ......................................2...................ÁREA SUBTENDIDA PELA CURVA NORMAL REDUZIDA DE 0 A Z.................................................................................................................4 6..3 4........... CORRELAÇÃO PARCIAL.......................1 4.......................................................9 CAPÍTULO 4 ..................................................... INTRODUÇÃO.......................................................................................TABELA DE NÚMEROS ALEATÓRIOS............... REGRESSÃO MÚLTIPLA..........2 4.....................3.......................... EVENTOS COMPLEMENTARES...................................... EVENTOS MUTUAMENTE EXCLUSIVOS.............................................. ANEXO IV ............3 4......................................1 4.....................................................................................................3...........................................2................................................. DISTRIBUIÇÃO BINOMIAL........ 71 ANEXO V ..................3 5.................................................. 35 4 4.................................. ANEXO II ..................................4 6 6...................................................................................2 5.................................................. 45 46 46 49 49 49 51 55 57 57 57 60 61 63 65 66 69 70 72 INTERPRETAÇÃO DE “r” ........................2.... SIGNIFICADO..................... TRANSFORMAÇÃO “Z” DO “r” .................... 38 PROBABILIDADE...... EVENTOS INDEPENDENTES................... VARIÁVEL ALEATÓRIA............. CAPÍTULO 5 – DISTRIBUIÇÃO BINOMIAL E NORMAL.........3.......................2. COEFICIENTE DE CORRELAÇÃO DE PEARSON.............................................. 44 BETA (ERRO TIPO II) .......................................................................................................................................................................................................................COMPARAÇÕES ENTRE AMOSTRAS.......1 6.......................... 39 EMPREGO DA PROBABILIDADE PARA COMPROVAÇÃO DE HIPÓTESES.............1 4..3 4..............1.....

A Estatística Descritiva apresenta duas formas básicas para a redução do número de dados com os quais devemos trabalhar. A razão pela qual consideramos a Estatística uma ferramenta importante para a tomada de decisões está no fato de que ela não deve ser considerada como um fim em si própria. INTRODUÇÃO À CIÊNCIA ESTATÍSTICA Podemos considerar a Estatística como a ciência que se preocupa com a organização. Neste contexto. abandono de dados duvidosos etc. e a Estatística Indutiva*(são também utilizados as termos Estatística Inferencial ou Inferência Estatística.Capítulo 1 A Ciência Estatística 1. procede-se primeiramente a sua organização e descrição. chamadas variável discreta e variável contínua. análise e interpretação dos dados experimentais. o que permite a visualização instantânea dos mesmos. A organização dos dados consiste na ordenação e crítica quanto à correção dos valores observados. A Estatística é. A representação dos dados – Os dados estatísticos podem ser mais facilmente compreendidos quando apresentados por meio de uma representação gráfica.O entendimento e a compreensão de grande quantidade de dados através da simples leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador. que cuida da análise e interpretação dos dados. A Estatística Descritiva na sua função de organização e descrição dos dados tem as seguintes atribuições: A obtenção dos dados estatísticos é feita normalmente através de questionário ou de observação direta de uma população ou amostra. É razoável também que. podemos considerar a Ciência Estatística como dividida basicamente em duas partes: a Estatística Descritiva que se preocupa com a organização e descrição dos dados experimentais. falhas humanas. omissões. uma ciência meio que tem utilidade em outros variados campos do conhecimento. para realizar-se a análise e interpretação dos dados observados. ainda. . Evidentemente. portanto. mas como um instrumento (ferramenta) fornecedor de informações que subsidiarão a tomada de melhores decisões. ou. visando à tomada de decisões. tanto a parte de organização e descrição dos dados como aquela que diz respeito a sua análise e interpretação são importantes. A redução dos dados . descrição. baseadas em fatos e dados. Indução Estatística).

um processo de raciocínio em que. obtidos diretamente da observação de um fenômeno coletivo. O próprio termo "indutiva" decorre da existência de um processo de indução. um subconjunto necessariamente finito de uma população. Uma amostra é. tratada mais detalhadamente no capítulo 2. O objetivo da Estatística Indutiva é tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações. Grande parte das vezes. Será ela constituída apenas por aqueles que. por exemplo. pois. procura-se tirar conclusões sobre a realidade. isto é. Isso parece extremamente simples. coeficientes) que facilitam a descrição dos fenômenos observados. taxas. temos também o problema de definir a característica comum que distingue perfeitamente cada um dos elementos da população que realmente nos interessa pesquisar (do Efetivo Profissional ou também deveríamos incluir os do Efetivo Variável?). . que será tratada no volume 2. queremos deixar bem claro desde já qual a finalidade da Estatística Indutiva. em geral. porém. pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado. proporções. com o que chamaremos de Estatística Descritiva. Para tanto. é interessante que se entenda dois conceitos: Dados brutos . estão na ativa? Ou deveremos incluir também os que já estão na reserva? Além de tudo.é uma seqüência de valores numéricos não organizados. é um conjunto de elementos com pelo menos uma característica comum. tendências. podemos estar interessados em realizar uma pesquisa sobre a idade dos militares do Comando Militar do Leste. partindo-se do conhecimento de uma parte.2 CIÊNCIA ESTATÍSTICA A obtenção de algumas informações que auxiliam a descrição do fenômeno observado (médias. Para darmos prosseguimento a apresentação da Estatística Descritiva. Devemos então limitar nossas observações a uma parte da população. mas na verdade ainda não temos exatamente caracterizada a população que nos interessa. Uma vez que o conceito usual do que seja a Estatística se relaciona. Essa característica comum deve delimitar inequivocamente quais os elementos que pertencem à população e quais os que não pertencem. Uma população ou universo. o passo seguinte é o levantamento de dados acerca da característica (ou características) de interesse no estudo em questão. ou mesmo nem é possível. no sentido geral. realizar o levantamento dos dados referentes a todos os elementos da população. Uma vez perfeitamente caracterizada a população. partindo-se do conhecimento do todo. a população física que nos interessa examinar é aquela constituída pela totalidade dos militares existentes no Comando Militar do Leste. isto é. não é conveniente. no todo (o oposto ocorre nos processos de dedução. Assim. Rol . Logo. em que. dois conceitos fundamentais devem ser apresentados: o de população ou universo e o de amostra. concluímos exatamente sobre o que deve ocorrer em uma parte) . a uma amostra proveniente dessa população. índices.é uma seqüência ordenada de dados brutos. no momento atual.

para que no Volume 2 possamos abordar os aspectos da inferência e dos testes de hipóteses com mais profundidade. e faz parte dos objetivos da Estatística Indutiva. quanto maior a amostra. indicam as análises inferenciais adequadas para as diversas situações de pesquisa. especialmente se a população for muito grande. à necessidade de recorrer-se apenas aos elementos de uma amostra. então. podemos citar o custo do levantamento de dados e o tempo necessário para realizá-lo. É intuitivo que. Isso ocorre devido ao fato de que a decisão final depende não somente das restrições matemáticas. direta ou indiretamente. ao qual se denomina censo ou recenseamento. Entre elas. erros grosseiros e conclusões falsas ocorrem devido a falhas na amostragem. estamos sempre sujeitos a erro. ou. conforme indicado no diagrama da Fig. não descrevem os procedimentos a serem adotados em cada situação particular. em realidade. 1. Esse fato é fundamental para que uma indução (ou inferência) possa ser considerada estatística. As três ferramentas necessárias para a Inferência Estatística serão abordadas neste volume. mas também dos objetivos do estudo e da própria natureza dos achados que serão produzidos. É claro que. que recorra às técnicas da Estatística Indutiva. no processo de amostragem.3 CIÊNCIA ESTATÍSTICA É fácil perceber que um processo de indução não pode ser exato. Muitas vezes. em geral. entretanto. Amostragem Estatística Descritiva Estatística Indutiva Cálculo de Probabilidades Figura 1 . porém.Esquema geral de um curso de Estatística. 3. podemos não ter acesso fácil ou possível a todos os elementos da população. tópicos de Estatística Descritiva. concluiríamos que os resultados mais perfeitos seriam obtidos pelo exame completo de toda a população. Assim. Ocorre. irá envolver também. Contudo. A Estatística Indutiva. portanto. . certos cuidados básicos devem ser tomados no processo de obtenção dessas amostras. é importante ter em mente que as tabulações apresentadas constituem um mapa de referência para auxiliar o pesquisador na escolha do procedimento mais adequado para cada situação de pesquisa. para se desenvolver um curso razoável de Estatística. se nossas conclusões referentes à população irão basear-se no resultado de amostras. Um outro problema que surge paralelamente é o de amostragem. que diversas razões levam. Levando esse raciocínio ao extremo. Em resumo. II e III. Esse problema será tratado com maior destaque no Cap. ou seja. um estudo estatístico completo. etc. Os ANEXOS I. mais precisas e mais confiáveis deverão ser as induções realizadas sobre a população. todos esses assuntos devem ser abordados em maior ou menor grau. dentro de uma seqüência. irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade. Ao induzir. Cálculo de Probabilidades e Amostragem.

se houver n elementos fisicamente considerados no estudo. S. ou seja. ORDINAL (QUALITATIVA) escores em geral E. portanto. Espectro ordenado com Flexões de braço 0a+ INTERVALAR intervalos quantificáveis (QUANTITATIVA) Peso 0a+ Espectro ordenado com Força . quando apenas uma característica de interesse está associada a cada elemento do conjunto examinado. Essa característica poderá ser. digamos. No presente capítulo.Variáveis e seus níveis de medidas. esses elementos fornecerão n valores da variável idade. mas com alguma(s) característica(s) desses elementos que seja(m) fundamental(is) ao nosso estudo. MB. Categorias não ordenadas Quadro 1 . Teremos. AB. Nos problemas de Estatística Indutiva. Ou seja. Três ou mais categorias: polinomial. no Cap. variáveis qualitativas ou quantitativas. esses elementos constituem uma amostra retirada da população que se deseja estudar. o conjunto observado pode constituir a população inteira. Para iniciarmos o tratamento dos dados é preciso antes que se tenha(m) bem definida(s) qual(is) a(s) característica(s) de interesse que deverá(ão) ser verificada(s). que a Estatística trabalha com informações referentes ao conjuntos de elementos observados. B. É claro que não iremos nem poderemos fazer qualquer tratamento matemático com os militares que formam esse conjunto. vamos apenas tratar do caso de variáveis unidimensionais. A idade é uma variável cujos valores (dados numericamente organizados em alguma escala de unidade). R. o conjunto de elementos a ser estudado pode ser a população de uma Brigada. Por exemplo.F. FR. Em muitos casos.Capítulo 2 Estatística Descritiva 2.<0< + RAZÃO intervalos quantificáveis (QUANTITATIVA) Aceleração . Este é o conjunto dos elementos.O Categorias ordenadas grau de dor. (3) Podem ser contínuas ou discretas. como nos exemplos que seguem no Quadro 1. a idade dos militares.<0< + (2) Duas categorias: dicotômica ou binária. É preciso definir qual(is) característica(s) desses militares nos interessa(m) averiguar. TIPO NOMINAL CARACTERÍSTICA .1 INTRODUÇÃO À ESTATÍSTICA DESCRITIVA Vimos. não iremos trabalhar estatisticamente com os elementos existentes. I. 1. B. A. Diferença entre intervalar e razão está na presença do zero absoluto (razão). os quais serão então tratados convenientemente pela Estatística Descritiva. Esta característica poderá ser qualitativa ou quantitativa. entretanto. dependerão dos elementos considerados. F. VARIÁVEL DADO Sexo M. I. mas o tratamento estatístico é o mesmo. (QUALITATIVA) grupo sangüíneo A. fisicamente definido e considerado. Ou seja.

ainda.2. nos últimos cinco anos. peso líquido (3/4ton.1 VARIÁVEIS QUALITATIVAS ESTATÍSTICA DESCRITIVA A variável será qualitativa quando resultar de uma classificação por tipos ou atributos.3. teoricamente.2 VARIÁVEIS QUANTITATIVAS A variável será quantitativa quando seus valores puderem ser expressos em números.).33.1.. 2. 1ton. As variáveis quantitativas podem ser subdividas em quantitativas discretas e quantitativas contínuas. número de filhos (1... . a restrição de estarem compreendidos entre 1 e 6. idade (18.5.2. carga transportada por uma viatura.. R$ 1234. 18. o ponto obtido em cada jogada (1. .). havendo. pode assumir apenas valores pertencentes a um conjunto enumerável..4.5m. 5ton. sexo (masculino ou feminino).). como nos exemplos que seguem: a) População: Variável: b) População: Variável: c) População: Variável: d) População: Variável: militares de uma Brigada. 1.3. etc). ao contrário..56. diâmetro externo (5mm. Como variáveis quantitativas contínuas.. . as jogadas possíveis com um dado.. 1. castanhos. cor dos olhos (pretos. A variável discreta. verdes). . 19. Assim.).).6). uma variável contínua será aquela que... salários dos militares. descontos em contracheque (R$ 333.3.. número de defeitos por unidade (1. Apresentamos a seguir exemplos de variáveis quantitativas discretas: a) População: Variável: b) População: Variável: c) População: Variável: casais residentes na Vila Militar. no caso (b). pode assumir qualquer valor num certo intervalo razoável de variação. R$ 1. 3cm.1. qualidade (perfeita ou defeituosa).39. candidatos a um exame para o Quadro Complementar de Oficiais..5. peças produzidas por uma máquina. cânceres..5ton.005. causa mortis (moléstias cardiovasculares.3333. pois seus possíveis valores são apenas números inteiros não-negativos. peças produzidas por uma máquina. óbitos em um Hospital de Guarnição. temos os exemplos que seguem: a) b) c) d) População: Variável: População: Variável: População: Variável: População: Variável: militares residentes na Vila Militar.. Essas variáveis são todas discretas.. munições produzidas em uma linha de montagem..2. azuis.5 2.). Essa classificação corresponde aos conceitos matemáticos de discreto e contínuo. moléstias do aparelho digestivo.

os dados referentes a variáveis discretas ou contínuas serem análogos.6 ESTATÍSTICA DESCRITIVA Pelos exemplos apresentados. ao fato de. Assim. isso significa que o casal tem exatamente dois filhos. um valor 7. Após observar as diferenças mencionadas entre as variáveis quantitativas discretas e contínuas. em geral. apenas na interpretação e descrição gráfica dos resultados é que haverá diferenças a serem consideradas.62 mm. estamos sempre fazendo uma aproximação. Isso decorre do fato de não existirem instrumentos de medida capazes de oferecer precisão absoluta. Por exemplo. Assim. ao passo que os valores das variáveis contínuas resultam.2 TÉCNICAS DE DESCRIÇÃO GRÁFICA O primeiro passo para se descrever graficamente um conjunto de dados observados é verificar as freqüências (quantas vezes o valor aparece na série) dos diversos valores existentes da variável. é a de que se trata de um valor aproximado. Outra diferença entre os dois tipos de variáveis quantitativas está na interpretação de seus valores.6. resulta que qualquer valor apresentado de uma variável contínua deverá ser interpretado como uma aproximação compatível com o nível de precisão e com o critério utilizado ao medir. for dado por 7. A Estatística Descritiva pode descrever os dados através de gráficos. . de uma medição. 2. Isso se deve. o leitor poderá ficar surpreso ao verificar que as técnicas da Estatística Descritiva serão praticamente idênticas em ambos os casos. Assim.62 mm devido ao fato de a precisão adotada na medida ser apenas de centésimos de milímetros. a interpretação de um valor de uma variável discreta é dada exatamente por esse mesmo valor. e. Quando dizemos que um casal tem dois filhos. se o diâmetro externo de uma munição. podemos perceber que os valores das variáveis discretas são obtidos mediante alguma forma de contagem. deveremos considerar que o valor exato desse diâmetro será algum valor entre 12. valor correspondente a uma precisão de décimos. conforme veremos a seguir.625 mm. distribuições de freqüência ou medidas associadas a essas distribuições.615 e 12.60 indica que a variável em questão foi medida com a precisão de centésimos. não sendo exatamente o mesmo que 7. sendo freqüentemente dados em alguma unidade de medida. conforme veremos. mesmo que existissem. Assim. pois os valores da variável contínua serão sempre apresentados dentro de um certo grau de aproximação. não haveria interesse nem sentido em se querer determinar uma grandeza contínua com todas as suas casas decimais. medido em milímetros. Uma convenção útil adotada no presente texto é a de ser a precisão da medida automaticamente indicada pelo número de casas decimais com que se escrevem os valores da variável. no entanto. ao executarmos a medição de algum valor de uma variável contínua. formalmente. ao contrário. que foi aproximado para 7. A interpretação de um valor de uma variável contínua.

2593 Engenharia 15 . Tomemos. bastando computar as freqüências ou freqüências relativas das diversas classificações existentes. Denotaremos a freqüência do i-ésimo valor observado por fi. um gráfico conveniente. a descrição gráfica é muito simples. Definimos a freqüência relativa (ou proporção) de um dado valor de uma variável (qualitativa ou quantitativa). e as freqüências relativas observadas definem a distribuição de freqüências que essa variável apresentou. temos: fri = fi n sendo fri = 1 = 100/100 = 100% Se de 50 alunos (n) de um curso de pós-graduação 20 (fi) alunos terminarem o curso com menção MB. 40.22 25.Formação específica de militares por graduação.2815 Cavalaria 30 . verifica-se imediatamente que o somatório de todas as freqüências individuais é igual ao número de observações: fi = n A associação das respectivas freqüências a todos os diferentes valores observados define a distribuição de freqüências. “fri” = freqüência relativa e “%” = porcentagem Formação %* 28. denotando por fri a freqüência relativa ou proporção do iésimo elemento observado. poderemos dizer que: fri=20/50 = . respectivamente as freqüências.40 (freqüência relativa) ou 40. elaborando. sendo n o número total de elementos observados. ou seja. em que a formação acadêmica se distribui entre esses candidatos.1111 Outros 17 . a seguir.7 ESTATÍSTICA DESCRITIVA Definimos a freqüência de um dado valor de uma variável (qualitativa ou quantitativa) como o número de vezes que esse valor foi observado. um grupo de 135 candidatos a vagas em um curso de pósgraduação do Centro de Estudos de Pessoal. poderemos usar as freqüências relativas. classificados segundo sua formação específica de graduação (arma/quadro/serviço). conforme a Tab. Esse gráfico poderá ser um diagrama de barras.0% . Tabela 1 . como o quociente de sua freqüência pelo número total de elementos observados. e as freqüências relativas dadas em porcentagens.59 100.00% (percentagem).93 11. A variável qualitativa considerada no presente exemplo é dada por essa formação.2222 Artilharia 35 . Número de militares fi fri* Infantaria 38 . 1 As duas colunas referentes ao número de militares contêm.1259 Total 135 1. Ou seja.15 22.000 * Para fins didáticos.1 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUALITATIVAS No caso de variáveis qualitativas.00% dos alunos terminaram o curso com menção MB 2. como exemplo.11 12. Alternativamente. um diagrama circular ou outro qualquer tipo de diagrama equivalente.2.

6% Engenharia 11.Na Fig. Esses dados podem ser graficamente representados de diversas formas.8 ESTATÍSTICA DESCRITIVA CANDIDATOS POR GRADUAÇÃO A UM CURSO DE PÓS-GRADUAÇÃO DO CEP Infantaria 38 FORMAÇÃO ACADÊMICA Cavalaria 30 Artilharia 35 Engenharia 15 Outros 17 0 5 10 15 20 25 30 35 40 CANDIDATOS Figura 2 . na Fig. A vantagem da representação gráfica está em possibilitar uma rápida impressão visual de como se distribuem as freqüências ou as freqüências relativas no conjunto de elementos examinados.9% Figura 3 .2% Artilharia 25. .Diagrama circular da formação específica de militares por graduação. 3 por um diagrama circular. 2 eles estão representados por meio de um diagrama de barras e.Diagrama de barras da formação específica de militares por graduação.1% Infantaria 28. CANDIDATOS POR GRADUAÇÃO A UM CURSO DE PÓS-GRADUAÇÀO DO CEP Outros 12.1% Cavalaria 22.

Calculando-se as porcentagens correspondentes. . Região Norte Centro-oeste Nordeste Sudeste Sul Total Superfície (km2) 3. o que não havia no caso das variáveis qualitativas. 2.Regiões geográficas do Brasil. feita por meio de um diagrama de barras.9 ESTATÍSTICA DESCRITIVA Entretanto deve-se mencionar ainda a possibilidade de se considerarem distribuições segundo outros critérios que não propriamente a freqüência ou a freqüência relativa das observações. conforme dados do IBGE (Instituto Brasileiro de Geografia e Estatística). pode-se construir o diagrama circular dado na Fig. apresentadas na Tab.90 18.30 18.30 10.0 8. Tabela 2 .077.2 577.00 ÁREA TERRITORIAL NACIONAL CORRESPONDENTE A CADA REGIÃO DO BRASIL 10.80 6. Como exemplo.70% 45. 2. seus valores numéricos podem ser representados num eixo de abscissas.869.2. Note-se que.8 927.286.177.561. A diferença em relação ao caso anterior está em que.637. aqui.1 % 45. sendo a variável quantitativa. desde que se disponha da tabela de freqüências.2 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS DISCRETAS No caso das variáveis quantitativas discretas.2 1. existe uma enumeração natural dos valores da variável.80% 6. pode ser facilmente construída se conhecemos todos os valores da variável no conjunto de dados.Diagrama circular das regiões geográficas do Brasil. A construção do diagrama de barras é feita.612. tomemos as superfícies das cinco regiões geográficas que compõem o Brasil. Esta. por sua vez. a representação gráfica será também. o que facilita a representação. 4.393.90% 18.9 1.547. As barras do diagrama podem ser verticais ou horizontais conforme a disposição das variáveis nos eixos cartesianos. normalmente.30% Norte Centro-oeste Nordeste Sudeste Sul 18.70 100.30% Figura 4 .214.

Distribuição de freqüências de erros de decriptografia por mensagem. 3. podemos construir a distribuição de freqüências dada na Tab. .Diagrama de barras para freqüências de erros de decriptografia por mensagem. Tabela 3 . constituído hipoteticamente por vinte valores da variável “número de erros de decriptografia” obtidos a partir de mensagens recebidas em um centro de mensagens. a partir da qual elaboramos o diagrama de barras correspondente. ERROS DE DECRIPTOGRAFIA POR MENSAGEM xi 0 1 2 3 4 5 fi= fi 4 7 5 2 1 1 20 ERROS DE DECRIPTOGRAFIA AVALIADAS 20 MENSAGENS No 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 NÚMERO DE ERROS 4 2 1 1 7 5 Figura 5 . representar graficamente o conjunto dado a seguir. 5. Sejam os seguintes os valores obtidos: 2 3 0 1 4 1 1 3 2 0 1 0 1 5 2 1 2 1 0 2 Usando a letra x para designar os diferentes valores da variável.10 ESTATÍSTICA DESCRITIVA Vamos. a titulo de exemplo. dado pela Fig.

350 . O diagrama de barras. às vezes. ERROS DE DECRIPTOGRAFIA POR MENSAGEM xi 0 1 2 3 4 5 fi 4 7 5 2 1 1 fi= 20 fri . em qualquer ponto do eixo das abscissas.0% 30. as quais denotaremos por Fi. conforme já mencionamos. é definida como a soma das freqüências de todos os valores menores ou iguais ao valor correspondente a esse ponto. uma outra forma de representação gráfica é também possível.0% 10.0% 20. Tabela 4 .050 fri= 1 ERROS DE CRIPTOGRAFIA POR MENSAGEM 40. a partir da qual elaboraríamos o diagrama de barras correspondente.0% 0 1 2 3 4 5 NÚMERO DE ERROS Figura 6 .200 .0% 35.0% 5. teríamos as freqüências relativas acumuladas. A freqüência acumulada. Tratando-se de variáveis quantitativas.Distribuição fri dos erros de decriptografia por mensagem. dado pela Fig. 4. 3 poderíamos representá-la conforme a Tab.050 . mostra a distribuição das freqüências no conjunto de dados.Diagrama de barras para freqüências relativas de decriptografia por mensagem. tendo.11 ESTATÍSTICA DESCRITIVA Caso o interesse fosse pela representação gráfica das freqüências relativas da Tab.0% 0.0% 15.100 . Fi= fi e Fri= fri . Analogamente. com base nas freqüências acumuladas. 6.0% 25.250 . interesse.

8 pode-se identificar que apenas 20.. Da mesma forma. 16 mensagens contêm até 2 erros de decriptografia.12 ESTATÍSTICA DESCRITIVA Voltando ao exemplo.350 . Erros de decriptografia por mensagem xi 0 1 2 3 4 5 fi 4 7 5 2 1 1 20 Fi 4 11 16 18 19 20 fri .00% das mensagens contêm até 3 erros de decriptografia. podemos facilmente verificar que as freqüências acumuladas (Fi) e as freqüências relativas acumuladas (Fri). são as dadas na Tab.100 . 7.0% 0. Figura 8 . correspondentes aos valores notáveis da variável. 8.0% 40.500 .800 .0% 0 1 2 3 4 5 Nº DE ERROS Figura 7 .0% 60.0% 100.900 .Freqüências acumuladas dos erros de decriptografia em 20 mensagens. 90. 5 pode-se construir o gráfico das freqüências acumuladas apresentado na Fig.500 1 Fri .00% das mensagens não contêm erro de decriptografia.Freqüências relativas acumuladas dos erros de decriptografia em 20 mensagens.Distribuição Fi e Fri dos erros de decriptografia por mensagem. 55.250 . 11 mensagens contêm até um erro de decriptografia. 5. ERROS DE CRIPTOGRAFIA POR MENSAGEM Fi 25 20 15 10 5 0 0 1 2 3 4 5 Nº DE ERROS ERROS DE CRIPTOGRAFIA POR MENSAGEM Fri 120. de acordo com a Fig.950 1.0% 80. .00% das mensagens contêm até um erro de decriptografia. 7 pode-se identificar que 4 mensagens não contêm erro de decriptografia. Tabela 5 .000 - A partir da Tab.200 . De acordo com a Fig. e assim por diante. e assim por diante.200 .0% 20. e o gráfico das freqüências relativas acumuladas. dado na Fig.550 .

6 21.25 21. devemos lembrar a correta interpretação dos valores das variáveis contínuas.35 e 21.320 .7 21. Logo.9 21.4 significa.4.75 21.3 21. Entretanto o diagrama de barras não mais se presta à correta representação da distribuição de freqüências.3 21.13 ESTATÍSTICA DESCRITIVA 2.8 21.4 21.6 21.65 21. Fi e Fri do diâmetro de peças produzidas por uma máquina. conforme a tabela primitiva abaixo: 21.6 21.25 21.6 21. constituída por 25 valores da variável diâmetro de peças produzidas por uma máquina.35 21. o procedimento até a obtenção da tabela de freqüências pode ser análogo ao visto no caso anterior.092 .15 21.6 21. fri. devido à natureza contínua da variável.7 21.132 . . Isso se faz por meio de uma figura formada com retângulos cujas áreas representam as freqüências dos diversos intervalos existentes.2 . dados em milímetros. porém. sabemos que a freqüência 5 associada ao valor 21.5 21.45 21.072 1.2 21.152 .4 21.5 21.5 21.752 .048 . na verdade.00 Fri .5 Na Tab.4 21.928 1. simples e acumuladas. 9. Examinemos um exemplo: tomemos a amostra a seguir.3 21.85 21.128 . Tabela 6 .040 10 10 21.600 .35 21.85 21.95 = 21. Diâmetro de peças produzidas por uma máquina Classe Medida fi Fi fr (i) (xi) 21.45 21.4 21.5 21.Distribuições fi.4 21. 6 temos esses mesmos dados organizados em termos de freqüências e de freqüências relativas.45. Assim.000 - Ao passarmos à representação gráfica. no processo de medição.8 21. que temos cinco valores compreendidos entre os limites 21. que foram aproximados.75 21.45. Tal figura chama-se histograma e é apresentada na Fig.4 21.9 23 47 70 38 32 12 18 250 33 80 150 188 220 232 250 . para 21.2.280 .5 21.55 21.9 21.7 21.65 21.5 21.55 21.880 . uma representação gráfica correta deverá associar a freqüência 5 ao intervalo 21 .7 21. por exemplo.35 2 1.3 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS CONTÍNUAS No caso das variáveis quantitativas contínuas.5 21.040 .188 .

Histograma das medidas do diâmetro de peças produzidas por uma máquina (representação pelas classes). pode ser feita no caso de variáveis contínuas é dada pelo polígono de freqüências.65 21.Histograma das medidas do diâmetro de peças produzidas por uma máquina (representação pelos pontos médios das classes). as freqüências serão. que se obtêm unindo-se os pontos médios dos patamares.25 21. na verdade. Vemos que. no caso das variáveis contínuas. A tais intervalos chamaremos classes de freqüências. DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA fi 80 70 60 50 40 30 20 10 0 21.55 21.2 21.35 21. . conforme a Fig.5 21.85 21. 10.65 21.6 21.3 21. Para completar a figura.7 21.8 21.15 21.9 mm Figura 10 . Uma outra representação gráfica que. associadas a intervalos de variação da variável e não a valores individuais. consideram-se duas classes laterais com freqüência nula.14 ESTATÍSTICA DESCRITIVA DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA fi 80 70 60 50 40 30 20 10 0 21. como o histograma. As classes de freqüências são comumente representadas pelos seus pontos médios.95 mm Figura 9 .45 21.4 21.

Podemos ainda construir o polígono de freqüências acumuladas.1 0 21. 10.85 21. pois não haveria sentido em se considerar um intervalo com valores negativos.65 21.4 21.6 0.00% das peças estariam aprovadas.35 21.Ogiva de Galton (Fi) dos diâmetros de peças produzidas por uma máquina.9 0.4 0.5 21. 12a) podemos notar que 188 peças estariam fora das especificações.a .55mm ou mais.15 21. .45 21. conforme os dados da Tab.55 21. DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA Fi 275 250 225 200 175 150 125 100 75 50 25 0 21. Caso uma peça. por meio da Ogiva de Galton Fi (Fig. 12b). não pudesse medir menos que 21.15 21. por meio da Ogiva de Galton Fri (Fig.35 21.25 21.45 21.1 1 0.65mm.b .3 0.25 21.75 21. 11 temos o polígono de freqüências correspondente ao histograma da Fig.7 0.Polígono de freqüências das medidas do diâmetro de peças produzidas por uma máquina. Este é traçado simplesmente verificando-se as freqüências acumuladas (Fi ou Fri) ao final de cada uma das classes.3 21.12a) ou das freqüências acumuladas relativas (Fig.2 21.15 ESTATÍSTICA DESCRITIVA Uma exceção bastante comum a essa regra aparece no caso de variáveis essencialmente positivas cujo histograma se inicia no valor zero. Pode ser construído em termos das freqüências acumuladas (Fig.7 21.2 0. para ser aprovada.8 0.75 21.Ogiva de Galton (Fri) dos diâmetros de peças produzidas por uma máquina. DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA fi 80 70 60 50 40 30 20 10 0 21.85 21. 12b) é possível notar que 60. Figura 12. Na Fig.6 21.95 mm DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA Figura 12.65 21.5 0.55 21.9 mm Figura 11 .8 21. 6.95 mm Fri 1.Se as peças produzidas não pudessem medir 21.

amplitude do intervalo de classes. tendo em vista obter uma representação mais adequada. limite mínimo da classe (valor real). a consideração de classes de freqüências é fundamental para a correta representação gráfica. O problema prático a resolver. é o de determinar qual o número de classes a constituir.16 ESTATÍSTICA DESCRITIVA No exemplo anterior vimos que. propositalmente deixamos de lado uma parcela da informação contida nos dados originais. chega-se sem grande dificuldade a valores satisfatórios para h. uma representação satisfatória dos dados somente é conseguida pelo seu agrupamento em classes de freqüências que englobam diversos valores da variável. É claro que. apresentados sob formas que não correspondem ao significado real dos valores contidos na classe. no caso das variáveis contínuas. a fim de se obter uma representação mais conveniente). recomenda-se. A obtenção de soluções simples é. por simplificação. k e para os limites das classes. . entretanto. diferença entre os limites (Li-li) limite máximo da classe (normalmente aparente). a construção de classes de mesma amplitude. o que foi suficiente para a obtenção de uma representação gráfica satisfatória. nesse caso. em geral. número de classes. log n Vamos definir a amplitude do conjunto de dados como sendo a diferença entre o maior e o menor dos valores observados. desejável. Diversos autores apresentam soluções diferentes. É claro que. Para fins de orientação adotaremos a fórmula proposta por Sturges: k= 1+3. Entretanto. Notemos também que os limites das classes são. qual o tamanho ou amplitude dessas classes e quais os seus limites. pois isso impossibilitaria uma correta subdivisão em classes.3 . Vamos designá-la por AT. em muitos casos. A questão do número de classes é teoricamente controvertida. Muitas vezes. amplitude total da distribuição de freqüência (Lmax – lmin). Ou seja. Naquele exemplo as classes consideradas tinham por pontos médios os próprios valores originais do conjunto de dados disponíveis. igual à soma das freqüências de todos os valores existentes dentro da classe (esse procedimento também pode ser aplicado no caso de variáveis discretas. O procedimento descrito corresponde a uma diminuição proposital da precisão com que os dados foram computados. maior valor da distribuição de freqüências. com um pouco de bom-senso e experiência. uma vez fixado k: h=AT k Entretanto é importante notar que a amplitude das classes não deverá ser fracionária em relação à precisão com que os dados são apresentados. em tais casos. A freqüência de cada classe será. Usaremos a seguinte notação: n: k: AT: Lmax: lmin: h: Li: li: número total de dados disponíveis. menor valor da distribuição de freqüências. muitas vezes.

pode ser conveniente a determinação dos limites reais das classes. pois h será inteiro (5) Quadro 3 – Cálculo da amplitude de classe de uma distribuição de freqüências. log n Onde: n = 50 log 50= 1. A representação gráfica dessa distribuição.3 .606601 (6 ou 7?) Quadro 2 – Cálculo do número de classes de uma distribuição de freqüências.69897 Logo: k= 1+3.606601 k= 6. Em tais casos.28571 *Adotaremos k = 6.Gráfico de colunas do resultado obtido por 50 soldados no exercício remador Vamos determinar o número de classes: Dado que: k= 1+3. Tomemos como exemplo o conjunto de valores a seguir. que temos limites aparentes. 1. então. . RESULTADO OBTIDO POR 50 SOLDADOS NO EXERCÍCIO REMADOR Nr 7 6 5 4 3 2 1 0 41 43 44 46 48 49 50 51 53 54 55 56 57 58 59 61 62 63 64 65 67 68 71 Nr de repetições Figura 13 . que suporemos sejam as observações do número de repetições do exercício remador executado por n = 50 soldados organizados no ROL (dados brutos obtidos. apresentada na Fig. 13 deixa de ser conveniente para esses dados.17 ESTATÍSTICA DESCRITIVA Dizemos.69897 k= 1+ 5. Notemos que o valor de k pode ser adequado de acordo com AT para que se acomodem os dados de acordo com o intervalo de classe mais conveniente: Dado que: h=AT/k Onde: AT = 71-41= 30 k=6 k=7 Logo: h =30/6 = 5 * h =30/7 = 4.3 . organizados em ordem crescente ou decrescente) abaixo: ROL do número de repetições do exercício remador 41 50 53 55 61 43 50 53 55 62 44 50 54 55 62 46 51 54 56 63 46 51 54 56 64 48 51 54 57 64 48 51 54 57 65 48 53 54 58 67 49 53 55 59 68 49 53 55 61 71 É fácil verificar que a distribuição de freqüências diretamente obtida a partir desses dados seria dada por uma tabela razoavelmente extensa.

5 47.5 59.5 59. Nessa tabela.5 54.5 70. correspondentes ao agrupamento feito.5 64. 14 Vemos que essa representação gráfica é muito mais apropriada do que a anteriormente obtida.5 64.Agrupamento em classes de freqüências do resultado obtido por 50 soldados no exercício remador.5 44. Tabela 7 . se os dados provém de uma amostra.5 62.5 57. Note-se que não há possibilidade de dúvida quanto a que classe cada elemento pertence.Representação gráfica dos dados agrupados. eles estão sugerindo qual seria.5 44.5 = fi 3 8 16 12 7 3 1 50 O histograma e o polígono de freqüências. Muitas vezes. As duas primeiras são formas usualmente empregadas e correspondem a limites aparentes.5 74. estudada pelo Cálculo de Probabilidades.5 57.5 52.5 69. Classes Limites aparentes Primeira notação 40 45 50 55 60 65 70 45 50 55 60 65 70 75 Segunda notação 40 45 50 55 60 65 70 44 49 54 59 64 69 74 39.5 67.5 49.5 69. a distribuição da população. . aproximadamente. RESULTADOS DO EXERCÍCIO REMADOR Nr 20 15 10 5 0 42. Um modelo freqüentemente usado é o da distribuição normal.5 70. apresentamos os limites das classes dados de três maneiras equivalentes.5 54. são dados na Fig.5 47. para a qual poderíamos adotar algum modelo ideal de distribuição.5 67.5 62.5 52.5 49. o polígono de freqüências obtido sugere o traçado de uma curva contínua.18 ESTATÍSTICA DESCRITIVA Na Tab 7 são dados os limites das classes e as freqüências respectivas.5 Limites reais Ponto médio (xi) 42.5 Repetições Figura 14 .Em outras palavras. A terceira indica os limites reais dessas classes.

Quadro 4 – Cálculo da média aritmética. Os percentis por sua vez dividem a distribuição de freqüência em cem partes iguais (note que: D1 = P10. x2=43. As medidas de posição e de dispersão são as mais importantes.. ou a média ponderada (quando os resultados estão categorizados em uma tabela de freqüências) Sendo xi (i = 1. de dispersão..1 MEDIDAS DE POSIÇÃO As medidas de posição servem para localizar a distribuição de freqüências sobre o eixo de variação da variável em questão.. costuma-se dizer também que são medidas de tendência central. D5 = P50.62 ~ 55 = Poderíamos dizer que "em média"..n) os valores da variável. Normalmente utiliza-se a média aritmética (quando os resultados dispostos em tabela primitiva ou ROL). A média e a mediana indicam. o centro da distribuição de freqüências. e D9 = P90).n = total de abdominais executadas pelos 50 soldados.19 ESTATÍSTICA DESCRITIVA – MÉDIA 2. (x1=41. de assimetria e de curtose.. x50=71). 2731. x5=. os soldados executaram 55 abdominais.17. ou seja. Onde: xi= 27311 n = 50 Dado que: X= xi / n Logo: X= 2731 / 50 X= 54. utilizaremos os dados do Rol apresentado na Pág. Temos assim..3 CARACTERÍSTICAS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS Além da descrição gráfica. 2. Q2.3. os quartis e os percentis. D7 = P70.1. x3=46. Estudaremos cinco dos principais tipos de medidas de posição: a média. Q3) dividem o conjunto ordenado de valores em quatro subconjuntos com igual número de elementos (25% dos elementos da seqüência). a mediana.2. e fi a média aritmética pode ser calculada pela seguinte fórmula: X= xi / n Por exemplo. por critérios diferentes. As medidas de assimetria e de achatamento ajudam a caracterizar a forma das distribuições. a moda. por procurarem quantificar alguns de seus aspectos de interesse. Notemos que X.1 MÉDIA ( X ) A média de uma distribuição de freqüências é o valor obtido quando todos os dados observados são somados e divididos pelo número de observações. x4=46. . as chamadas medidas de posição. muitas vezes é necessário sumariar certas características das distribuições de freqüências por meio de certas quantidades. D6 = P60. para tanto utilizamos os decis (não abordados neste manual por tratarem-se de um tipo particular de percentis). D4 = P40. servindo para localizar as distribuições e caracterizar sua variabilidade. D3 = P30. 2. Os quartis (Q1. que iremos estudar a seguir. D8 = P80.3. Por essa razão.. Pode haver o interesse em dividir a seqüência de dados em dez partes iguais.. A moda indica a região de maior concentração de freqüências na distribuição. tendo grande aplicação em problemas de Estatística Indutiva. Tais quantidades são usualmente denominadas de medidas da distribuição de freqüências. D2 = P20.

multiplicando-se todos os valores de uma variável por uma constante.1 21.85 21.4 Fórmula da média ponderada: X= fixi Considerando: n xi= ponto médio da classe fi= freqüência de cada classe n= número de observações Onde: Logo: n = 25 fixi= 538. Como hoje é muito comum dispor-se de calculadoras eletrônicas ou softwares que realizam esses cálculos.45 21. os dados da Tab.5 86.6 21. apresentados na Tab 8. 54 Poderíamos dizer que as peças produzidas pela máquina possuem um diâmetro médio de 21.4 65.3 21.54mm.45 21.75 21. somando-se ou subtraindo-se uma constante a todos os valores de uma variável.20 ESTATÍSTICA DESCRITIVA Para o cálculo da média ponderada tomemos.2 42. Tabela 8. Quadro 5 – Cálculo da média ponderada. por exemplo. o que será particularmente útil se os valores xi forem elevados e o cálculo precisar ser feito manualmente.65 21. A média assim calculada para os dados agrupados em classes deverá ser aproximadamente igual à média aritmética exata dos n dados originais.8 43. Considerando uma distribuição por classes de freqüências.5 21. Cálculo da média ponderada.65 21.35 21.8 538. Dentre as propriedades da média.75 21.55 21. a média do conjunto fica acrescida ou diminuída dessa constante.2 21. a média do conjunto fica multiplicada por essa constante.6 107 150.4 21. 6. não nos preocuparemos com essa questão. Diâmetro de peças produzidas por uma máquina Classe (i) 21. podemos introduzir simplificações no cálculo da média.25 21.8 21.15 21.4 X= 538. b.9 fi 1 2 5 7 4 3 1 2 25 fixi 21. substituindo os xi pelos pontos médios das classes e considerando as fi corno as respectivas freqüências (ou freqüências relativas se for o caso).95 = (xi) 21.55 21.4 / 25 X= 21. .35 21. Utilizando as propriedades citadas. podemos definir sua média como o valor obtido. podemos destacar as seguintes: a.7 21.25 21.85 21.

1. Dados os valores: 12 14 14 15 16 16 17 20 Dado que: n/ 2< Md < (n/ 2) +1 8/ 2< Md < (8/ 2) +1 4º< Md < 5º Md =(15+16)/2 Md =15. Quadro 7 – Cálculo da mediana com n par.5 e 50%dos valores serão maiores ou iguais a 15. Md= 5º elemento Isto quer dizer que ela possui o valor de x5.3.21 2. a Md poderia ser definida como valor médio entre o de ordem n/2 e o de ordem (n/2) + 1. Quadro 6 – Cálculo da mediana com n impar.5.2 MEDIANA (Md) ESTATÍSTICA DESCRITIVA A mediana é uma quantidade calculada com base na ordem dos valores que formam o conjunto de dados.5 Isto quer dizer que ela possui o valor médio entre o 4° e o 5° elemento da série (x4+x5)/2 que é (15+16)/2 = 15. A mediana é geometricamente interpretada como ponto tal que uma vertical por ele traçada divide a área sob o histograma em duas partes iguais. Onde: n=8 Logo: 15 < Md < 16 Notemos que o valor 15. é o valor que divide a série estatística ao meio. Nas variáveis discretas: Sendo n impar. embora por vezes não tenha um significado real para a variável.5. Dados os valores: 35 36 37 38 40 40 41 43 46 Dado que: Md= (n + 1)/2 Onde: n=9 Logo: Md= (9 + 1)/2 Md = 40 Notemos que o x5 (40). Definimos a mediana de um conjunto de n valores ordenados como o valor ou dado que divide a série estatística ao meio (50%dos valores serão menores e 50%dos valores serão maiores que o valor da mediana). 50%dos valores são menores ou iguais a 15. a Md é igual ao valor de ordem (n + 1)/2 desse conjunto.5. Se n for par. 50% dos valores são menores ou iguais a 40 e 50%dos valores serão maiores ou iguais a 40. é o valor que divide a série Estatística ao meio. .

800 2.500 4. que a mediana fornece uma melhor idéia do centro da distribuição.300 7. Tabela 9. h f Onde: l: p` : fi: Fant: h: f: tal que: p`= fi 2 limite inferior da classe que contém a Md número que define a posição em que se encontra a Md (classe que contém a Md) número de elementos do conjunto de dados freqüência acumulada da classe anterior à classe que contém a Md amplitude da classe que contém a Md freqüência da classe que contêm a Md Quadro 8 – Fórmula da mediana para variáveis contínuas.65 21.6 21.45 Fant= 8 7 f=7 Md =21.35 21. pois não sobre a influência de valores extremos. em geral.22 ESTATÍSTICA DESCRITIVA Considerando. 9. A mediana pode ser usada como alternativa. Tomemos. Notemos que o valor 21. em relação à média. melhor indicador central que a média.500 3.0.51mm é o valor que divide a série estatística ao meio.000 A média desses doze valores é 10.1 Escolhemos a 4ª classe.55-21. imaginemos um conjunto de doze pessoas com as seguintes rendas mensais (R$): 2. Em certos casos. a mediana é.Fant).8 21.000 5.h f Logo: Md = 21. ao passo que sua mediana é 4.35 21.000 4.2 1 1 3 21.75 21.1 Onde: l=21. uma distribuição em classes de freqüências.25 21.600.55 21. Diâmetro de peças produzidas por uma máquina Classe Medida fi Fi (i) (xi) 21. muito maior que os demais valores.55 21.000 3. não tendo sido influenciada pelo valor extremo 80.85 21.45 21.Fant) . Vemos. .65 21. Como ilustração.3 2 21. efetivamente.5 Dado que: Md = l + (p` .9 5 7 4 3 1 2 25 8 15 19 22 23 25 Onde: fi=25 n = 25 Dado que: p`= fi 2 Logo: p`= 25/2 = 12.700 5. 6 apresentados na Tab.45 21. para caracterizar o centro do conjunto de dados. seu uso é mais conveniente.000. Por exemplo.75 21.15 21. nesse caso.95 = 21.51 h=21.000 3.4 21.45+ (12.5-8). Cálculo da mediana.500.200 80. podemos calcular um valor para sua mediana pela expressão: Md = l + ( p` . Quadro 9 – Cálculo da mediana. os dados da Tab. no caso de distribuições de rendas.45=0. por exemplo. agora.7 21. pois ela contém p`.25 21.85 21.5 21.200 6.

freqüência da classe posterior à classe que contêm a Mo. freqüência da classe anterior à classe que contêm a Mo. 7 apresentados na Tab.45 21.75 21.65 21.65 21.49 h= 21.95 = 21. freqüência da classe que contêm a Mo. pois indica a região das máximas freqüências. Diâmetro de peças produzidas por uma máquina Classe Medida fi Fi (i) (xi) 21.7 21.Mo = 3( X – Md) .1 Quadro 11 – Cálculo da moda. No caso de distribuições de freqüências em classes de mesma amplitude.13.85 21. por exemplo.1 2= 3 2+3 l= 21.35 21.35 21. Assim.45 + 2 . mediana e moda A seguinte relação empírica em geral subsiste aproximadamente para os conjuntos de dados observados: X .55 21.4 21. 7.2 1 1 21.85 21. amplitude da classe que contém a Mo.1. os dados da Tab.3.55-21. Quadro 10 – Fórmula da moda. 10. Definimos a moda (ou modas) de um conjunto de valores. Para o cálculo da moda tomemos.8 21.fant 2 = f* .9 2 5 7 4 3 1 2 25 3 8 15 19 22 23 25 Dado que: Onde: kMo= 4ªclasse f*=7 fant= 5 fpost= 4 Logo: 1=7–5=2 2=7–4=3 1 = f*-fant 2 = f*-fpost Dado que: Mo = l + Onde: Logo: 1= 2 Mo = 21.h 1+ 2 Relação empírica entre média.45=0. a moda é 54 pois é o valor que mais se repete.fpost limite inferior da classe que contém a Mo.25 21. 0.75 21. Tabela 10.45 21.23 2.3 21. Cálculo da moda.h 1+ 2 tal que: 1 = f* . como o valor (ou valores) de máxima freqüência. a classe modal (kMo) é a 50 55. dado por Mo = l + Onde: l: f*: fant: fpost: h: 1 . no exemplo da Fig.55 21.15 21. é comum definir-se também a moda como um ponto pertencente á classe modal.5 21.45 Mo = 21. 1 .6 21. no caso da Tab.25 21.3 MODA (Mo) ESTATÍSTICA DESCRITIVA A moda é uma medida de posição.

dividem um conjunto ordenado de valores em quatro subconjuntos com igual número de elementos. 2. O segundo quartil (Q2). os quartis (Q1. como vimos. Q2. então podemos concluir que o valor de Q1 = P25.24 ESTATÍSTICA DESCRITIVA Essa expressão pode ser apresentada sob diversas formas e indica geometricamente que a mediana situa-se entre a média e a moda.h f Onde: l: p` : fi: Fant: h: f: c: tal que: p` c fi = 100 limite inferior da classe que contém a posição desejada posição em que se encontra o percentil (classe que contém a P) número de elementos do conjunto de dados freqüência acumulada da classe anterior à classe que contém a P amplitude da classe que contém a P freqüência da classe que contêm a P porcentagem que se deseja obter Quadro 12 – Fórmula geral para quartis e percentis. Q3). sendo sua distância à moda o dobro de sua distância à média.5 Os valores dos quartis também podem ser obtidos em distribuições contínuas. é a própria mediana. de acordo com a fórmula dos percentis (fórmula genérica este tipo de medida de posição). obviamente. ou seja: 25% dos valores < Q1 < 75% dos valores 75% dos valores < Q3 < 25% dos valores 12 14 14 Q1 =14 15 16 16 17 Q3 =16. então deveríamos calcular P15.1. Como dito anteriormente.5 20 Md =15. Sua verificação na prática tende a ser mais perfeita para conjuntos maiores de dados e sendo a moda calculada com base em dados agrupados em classes de freqüências.Fant) . sendo que 15% dos valores sejam menores ou iguais a este valor. Essa idéia pode ser generalizada. logo c=15 Sabemos que Q1 é o valor que divide a distribuição de freqüências em 25% e 75%. P = l + ( p`. logo c=25 . Se a mediana divide a distribuição de freqüências ao meio.3. logo c=25 Sabemos que Q3 é o valor que divide a distribuição de freqüências em 75% e 25%. de acordo com o quadro 12. Sua determinação seria feita de modo semelhante á da mediana.4 QUARTIS (Q) E PERCENTIS (P) A idéia de mediana. é a de dividir o conjunto ordenado de dados em dois subconjuntos com igual número de elementos. os quartis dividem a dividem em ¼ e 3/4 . então podemos concluir que o valor de Q3 = P75. Para obtermos o valor que divide uma distribuição de freqüências.

2. onde xi são os pontos médios das classes e fi as respectivas freqüências. é definida como a diferença entre o maior e o menor valores do conjunto de dados: AT = Lmax – lmin. a variância. Analogamente ao cálculo da média. e que utilizamos o artifício matemático de elevarmos esta diferença ao quadrado [(xi – X)² ] . por depender de apenas dois valores do conjunto de dados.2.1 A AMPLITUDE TOTAL (AT) A amplitude total. pois caso contrário o somatório teria o valor zero [ (xi – X)=0]. 2.2 MEDIDAS DE DISPERSÃO ESTATÍSTICA DESCRITIVA As informações fornecidas pelas medidas de posição podem ser insuficientes para compararmos e classificarmos as séries estatísticas quanto a sua homogeneidade. já mencionada no item 2.25 2.3. As medidas de dispersão surgem como maneira de indicar o quanto os dados se apresentam dispersos em torno da região central (medida de posição). tornando sem sentido a fórmula matemática.3.3. vamos executar o cálculo da variância de um conjunto pequeno de dados. o grau de variação existente no conjunto de valores.3. . formado pelos 20 valores seguintes: 10 12 10 12 10 12 11 13 11 13 11 13 11 13 12 14 12 14 12 14 A Tab. e para dados ordenados em tabelas primitivas ou ROL é dada por: s2 = (xi – X) 2 n-1 Notemos que xi – X corresponde ao desvio que cada elemento possui em relação à média. 2. s2 = (xi – X ) 2fi n-1 Como exemplo. se os dados constituírem uma distribuição por classes de freqüências. poderemos calcular sua variância pela expressão abaixo. Caracterizam. 11 mostra o cálculo de X de s2. dispersão ou afastamento dos dados. portanto.2 A VARIÂNCIA (s2) A variância é a média dos quadrados das diferenças dos valores em relação à sua própria média. a amplitude total contém relativamente pouca informação quanto à dispersão. É claro que o valor de AT está relacionado com a dispersão dos dados. Entretanto. o desvio-padrão e o coeficiente de variação. As principais medidas de dispersão são: a amplitude total. a amplitude total não é muito utilizada como medida de dispersão. Salvo aplicações no controle da qualidade.2.

para demonstrarmos que a variância é oriunda dos desvios de cada elemento (ou ponto médio de classe).11. = 20 X= 240/20=12 Utilizamos o exemplo da Tab. Esse inconveniente é sanado com a definição do desvio padrão.68 Quadro 13 – Cálculo da variância. o que nem sempre faz sentido. . mais homogênia será a distribuição de freqüências. menor será a concentração dos dados em torno da média. conhecido N e a média populacional µ deve-se utilizar a fórmula abaixo: 2 = (xi – µ) 2 N A variância tem. Neste sentido. somando-se ou subtraindo-se uma constante a todos os valores de uma variável a variância não se altera.26 Tabela 11. em relação à média da série estatística. a variância do conjunto fica multiplicada pelo quadrado dessa constante. caso se deseje calcular a variância populacional. multiplicando se todos os valores de uma variável por uma constante. A importância de estudarmos a variância dos dados está no fato da possibilidade de compararmos distribuições amostrais e populacionais. quanto menor a variância. Cálculo da variância (s2) xi 10 11 12 13 14 fi 3 4 6 4 3 fixi 30 44 72 52 42 240 xi-X ( xi-X )² -2 -1 0 1 2 0 4 1 0 1 4 10 ( xi-X )²fi 12 4 0 4 12 32 ESTATÍSTICA DESCRITIVA O somatório dos desvios em relação à média é igual a zero. ela tem o inconveniente de se expressar uma unidade quadrática em relação à da variável em questão. b. que é a raiz quadrada da variância . Do ponto de vista prático. as seguintes propriedades: a. A variância é uma medida de dispersão extremamente importante na teoria estatística. No entanto esta fórmula refere-se ao fato de se estar calculando a variância de uma amostra. quanto maior a variância. incluindo-se n-1 como fator de correção. Por outro lado. Pelo artifício matemático podemos observar o quadrado dos desvios. entre outras. Dado que: s2 = (xi – X) 2fi n-1 Onde: Logo: s2 =32/20 (xi – X) 2fi= 32 n=5 s2 = 1.

Quando uma curva de freqüência é simétrica como a curva abaixo. e 99% entre 21.8 538.6 21.27 2.4 (xi – X ) 2fi .4 21.05mm Quadro 15 – Interpretação do desvio padrão.2 21.45 21.00144 . 95% entre 21.7 21.8 43.3 21.35 21.06948333 s= s = 0.06760 .44% dos dados da série X + 3s contém 99.6 107 150.16416 Quadro 14 – Cálculo do desvio padrão.4 65.5 86. O desvio-padrão é notado da seguinte forma: s= (xi – X ) 2fi n-1 Tabela 12.55 21.5 21.9 fi 1 2 5 7 4 3 1 2 25 fixi 21. ele é mais realístico para efeito da comparação de dispersões e juntamente com a média possibilita uma visão mais consistente a respeito da homogeneidade da série estatística.54 Interpretação do desvio-padrão O desvio-padrão é sem dúvida a medida de dispersão mais importante.45 21.11560 .1 21.75 21.25920 .00980 .8 21.2 42.74% dos dados da série Caso a Tab 2.88mm.3 O DESVIO-PADRÃO (s) ESTATÍSTICA DESCRITIVA Definiremos o desvio-padrão como a raiz quadrada positiva da variância.25 21.65 21.95 = (xi) 21.07680 .64676 Dado que: Logo: s= s= (xi – X ) 2fi n-1 64676 24 0.00112 .85 21.12 possuísse distribuição normal poderíamos dizer que: Aproximadamente 68% das peças produzidas possuem diâmetro que varia entre 21.37 e 21.20 e 21.2.75 21.26% dos dados da série X + 2s contém 95. Cálculo do desvio-padrão (s) Classe 21. Sendo expresso na mesma unidade da variável.4/25=21.55 21.3.15 21.11520 .35 21.85 21. .25 21. X= 538.71mm.13 e 22. podemos afirmar que: X + s contém 68.65 21.

16a e Fig. sendo freqüentemente expresso em porcentagem: Cv = s / X Sua vantagem é caracterizar a dispersão dos dados em termos relativos a seu valor médio. tendo em vista que Cv2> Cv1. conforme sejam positivas. quanto maior o coeficiente de variação mais dispersos estarão os dados em relação à média.009252=0.65mm. As distribuições alongadas à direita são ditas positivamente assimétricas.76% Supondo-se que outra máquina avaliada. negativamente assimétricas.2003mm. . ou seja.3. As medidas de assimetria.15 0.28 2.2.Assimetria positiva Figura 16b . procuram indicar o tipo de distribuição quanto a esse aspecto. o Cv = 0. como Cv1 =0. 2. e menos homogênia será a série estatística. Nas Fig. poderíamos afirmar que a segunda máquina é menos precisa que a primeira. permitindo-se comparar séries estatísticas. obteríamos um Cv2 =0. produzisse peças com diâmetro médio X=21.76%. e as alongadas à esquerda.Classificação da distribuição de freqüência em relação a sua assimetria.007621=0.54=0.16416/ 21. Classificação Praticamente simétrica Moderadamente assimétrica Fortemente assimétrica Quadro 16 . definido como segue: A= 3(X – Md) S Relação A < 0.16b são mostrados dois tipos de assimetria. No exemplo visto. negativas ou aproximadamente nulas. RESULTADO DO 1º TESTE DE APTIDÃO FÍSICA DE RECRUTAS DE UM BATALHÃO DE INFANTARIA Nr 140 120 100 80 60 40 20 0 I R B MB E Conceitos RESULTADO DO 1º TESTE DE APTIDÃO DE TIRO DE RECRUTAS DE UM BATALHÃO DE INFANTARIA 140 120 100 80 60 40 20 0 I R B MB E Conceito Nr Figura 16a . 15 < A < 1 A > 1.Assimetria negativa Para a caracterização do poder da assimetria utiliza-se o coeficiente de assimetria de Pearson.4 O COEFICIENTE DE VARIAÇÃO (Cv) ESTATÍSTICA DESCRITIVA O coeficiente de variação é definido como o quociente entre o desvio-padrão e a média.3. e desvio-padrão s=0.93%.3 MEDIDAS DE ASSIMETRIA Essas medidas procuram caracterizar como e quanto a distribuição de freqüências se afasta da condição de simetria.

1478 I R B MB E Conceitos S A= 0 Simétrica Figura 17b – Assimetria nula.5 S= 3.0087 A= 3(X – Md) = 78 A= -.Positiva moderada Figura 17c – Assimetria positiva moderada. DISTRIBUIÇÃO B classe 02 06 10 14 18 06 10 14 18 22 xi 4 8 12 16 20 = fi 5 21 26 21 5 78 Nr 30 25 20 15 10 5 0 RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES A= 3(X – Md) Onde: X= 12 Md= 12 S= 4.347 Ass.6039 I R B MB E Conceitos S A= +.92 Md= 13. .08 Md= 10. DISTRIBUIÇÃO C classe 02 06 10 14 18 06 10 14 18 22 xi 4 8 12 16 20 = fi 6 30 24 12 6 78 Nr 35 30 25 20 15 10 5 0 RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES A= 3(X – Md) Onde: X= 11.483 Ass. Consideremos que os conceitos de uma pista Tiro de Ação Reflexa obedeçam a seguinte ordenação de valores (sendo o número de tiros executado por cada militar igual a 22): DISTRIBUIÇÃO A classe 02 06 10 14 18 06 10 14 18 22 xi 4 8 12 16 20 fi 6 12 24 30 6 RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES Nr 35 30 25 20 15 10 5 0 I R B MB E Conceitos S Onde: X= 12.5 S= 5.29 Considerações a respeito da assimetria ESTATÍSTICA DESCRITIVA Nos exemplos abaixo poderemos verificar o formato e as características de séries estatísticas com um mesmo número de elementos. Negativa moderada Figura 17a – Assimetria negativa moderada.

FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 3ª COMPANIA DE FUZILEIROS Nr 70 60 50 40 30 20 10 0 5 15 25 35 45 55 65 75 85 95 105 110 115 Repetições Figura 18c – Distribuição Leptocúrtica.30 2. Nr 70 60 50 40 30 20 10 0 FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 2ª COMPANIA DE FUZILEIROS 5 15 25 35 45 55 65 75 85 95 105 110 115 Repetições Figura 18b – Distribuição Mesocúrtica. As Fig. .3. 18a. Fig. apresentam os três tipos característicos de distribuição: classe 5 15 25 35 45 55 65 75 85 95 105 110 115 = classe 5 15 25 35 45 55 65 75 85 95 105 110 115 = classe 5 15 25 35 45 55 65 75 85 95 105 110 115 = xi 4 7 9 11 12 13 13 13 12 11 9 7 4 125 xi 4 7 9 11 12 13 13 13 12 11 9 7 4 125 xi 0 0 1 2 6 24 59 24 6 2 1 0 0 125 FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 1ª COMPANIA DE FUZILEIROS 70 60 50 40 30 20 10 0 5 15 25 35 45 55 65 75 85 95 105 110 115 Repetições Nr Figura 18a – Distribuição Platicúrtica. A comparação é feita em relação à distribuição normal. modelo teórico de distribuição estudado pelo Cálculo de Probabilidades (veja o capítulo 4). e Fig.4 MEDIDAS DE ACHATAMENTO OU CURTOSE ESTATÍSTICA DESCRITIVA As medidas de curtose caracterizam a forma da distribuição quanto a seu achatamento. 18c. 18b.

testes paramétricos. características da distribuição normal. distribuições mesocúrticas apresentam os dados normalmente dispersos em relação à média. distribuições leptocúrticas apresentam os dados muito próximos da média. com a qual estamos trabalhando. os testes paramétricos aumentam as chances de se rejeitar a hipótese nula. As distribuições mais achatadas que a normal são denominadas platicúrticas (forma de prato) e as menos achatadas são denominadas leptocúrticas (forma de chapéu mexicano). para comprovarmos o pressuposto a. Sempre que estes pressupostos são alcançados. o que caracteriza uma forma de distribuição heterogênia.. deveremos verificar se a amostra. b.5 CONSIDERAÇÕES SOBRE MEDIDAS DE ASSIMETRIA E CURTOSE No volume 2 trataremos sobre a Estatística Inferencial.P10) Onde: Q1 = 1º quartil. o que caracteriza uma forma de distribuição normal. Desta forma é possível verificar que: a.263 curva leptocúrtica C > 0. se a distribuição for pelo menos aproximadamente simétrica. possuem três pressupostos básicos sobre a distribuição dos dados: a. a amostra extraída deve ter as mesmas variações na variável estudada. c. dado pela fórmula abaixo: Classificação quanto à curtose C = 0. mencionaremos apenas o coeficiente percentílico de curtose. desta forma os testes de assimetria e curtose tratados no presente capítulo crescem em importância no sentido de que. onde veremos duas categorias de testes estatísticos: os paramétricos e os não-paramétricos. b. o que denominamos poder do teste (trataremos este conceito no item 4. a classificação quanto à curtose dá-se em função do achatamento da distribuição de freqüências. Neste momento é importante que se diga que a primeira categoria. em termos práticos. distribuições platicúrticas apresentam os dados bem dispersos em relação à média. 2. uma distribuição normal tem um achatamento mediano.263 curva platicúrtica C= Q3 . Q3 = 3º quartil.Q1 2(P90 . a população estudada deve possuir uma distribuição normal.3 do capítulo 4).263 curva mesocúrtica C < 0. é simétrica e mesocúrtica.3. P10 = Percentil 10 e P90 = percentil 90 Quadro 17 . A caracterização do achatamento de uma distribuição só tem sentido.31 ESTATÍSTICA DESCRITIVA Como dito anteriormente. Deste modo. as observações devem ser independentes. e c.Classificação da distribuição de freqüência em relação a sua curtose. o que caracteriza uma forma de distribuição homogênia Entre as possíveis medidas de achatamento. o que chamamos distribuição mesocúrtica (forma de boca de sino). .

o que identifica diretamente a forma da distribuição da variável e seus parâmetros. Algumas reclamações de alunos sugerem que a sopa não está satisfazendo o padrão de qualidade nutricional exigido pela escola. com o objetivo de estimar os parâmetros da distribuição. A qualidade de uma estimação depende basicamente da representatividade da amostra que consiste na capacidade de a amostra reproduzir as características importantes da população. de fato. A estimação é um processo que consiste em avaliar os parâmetros de uma distribuição através de estimadores obtidos em uma amostra. a amostra é bem representativa da população. A nutricionista de uma escola militar foi encarregada de avaliar a qualidade nutritiva de uma sopa preparada por um fornecedor (contratado). No entanto. Quando é razoável a aplicação de um censo. O procedimento viável nesta situação é fazer esta avaliação através de uma amostra.Capítulo 3 Amostragem 3. a sopa não atender o padrão de qualidade contratado. através da Estimação (por meio de amostras). com base no cálculo de probabilidades (instrumental que viabiliza avaliar parâmetros da distribuição a partir dos estimadores). o que permitirá à nutricionista fazer a avaliação com alto grau de precisão. Existem dois processos de abordagem para a solução deste problema. Neste caso.Vamos desenvolver o segundo processo. a busca de informações é direcionada para estabelecer a forma da distribuição da variável que descreve o fenômeno e os parâmetros desta distribuição.. pode ocorrer que a amostra selecionada não seja representativa da população. o problema está resolvido. Se. Vamos examinar a seguinte situação. Em particular quando este fenômeno é aleatório.O segundo processo consiste em obter estas informações indiretamente. que será servida a seus alunos. a escola devolve a sopa e exige o pagamento da multa contratual.1 INTRODUÇÃO A busca de informações a respeito de um fenômeno qualquer é necessária para lastrear a tomada de decisões que envolvem este fenômeno. . conseguirá um bom grau de homogeneidade no produto e uma pequena amostra retirada nestas condições irá conter os ingredientes aproximadamente na mesma proporção em que figuram na sopa. o que conduzirá a um erro de avaliação e a suas conseqüências. Note que se a nutricionista tiver o cuidado de mexer suficientemente a sopa. O primeiro processo consiste em aplicar um Censo. se a nutricionista não tiver o cuidado de mexer a sopa.

mesmo mexendo a sopa. podemos atribuir a cada elemento um número. Em particular.1 AMOSTRAGEM NÃO ALEATÓRIA: 3. o que inviabiliza o controle da qualidade da estimação. procede-se da seguinte forma: .33 AMOSTRAGEM Se a nutricionista. e escolhida uma amostra de 30 sargentos. 3. 3. garantindo a mesma chance para cada um deles. caso a população seja finita. Estas amostras não permitem o controle da variabilidade amostral. À medida que esta variabilidade aumenta. Uma maneira equivalente de sortear os elementos da amostra consiste no uso de uma Tabela de Números Aleatórios (TNA) (ANEXO IV). Para se obter uma amostra aleatória simples. a maneira de conseguir boa representatividade consiste em aumentar o tamanho da amostra.1 AMOSTRAGEM ALEATÓRIA SIMPLES É aquela em que se atribui aos grupos de mesma quantidade de elementos a mesma probabilidade de participar da amostra. O sorteio das fichas identifica os elementos que deverão participar da amostra. 3.1. é necessário aumentar o tamanho da amostra aleatória para manter sua representatividade.2. A análise desta situação leva-nos a concluir que populações com pequeno grau de variabilidade de seus elementos podem ser estudadas a partir de pequenas amostras. Este conjunto de técnicas pode ser subdividido em dois grupos básicos: a amostragem aleatória e a amostragem não aleatória. pelo Almanaque podemos colocá-los em ordem de antiguidade.2 AMOSTRAGEM VOLUNTÁRIA Ocorre quando o componente da população se oferece voluntariamente para participar da amostra independentemente do julgamento do pesquisador. Fichas com esses números podem ser misturadas em uma urna. Esta tabela contém números previamente sorteados.2.2. 3.2.2 AMOSTRAGEM É o conjunto de técnicas utilizadas para a seleção de uma amostra. desconfia do grau de homogeneidade da sopa. de forma que.2.1. se iniciarmos em um ponto qualquer dessa tabela e anotarmos os números na seqüência das linhas ou colunas a partir deste ponto inicial. cada elemento da população tem a mesma probabilidade de participar da amostra.2.1 AMOSTRAGEM INTENCIONAL Ocorre quando o pesquisador seleciona intencionalmente os componentes da amostra. Por exemplo. dada uma população finita de 500 sargentos da Vila Militar dos quais nos interessa uma característica comum (possuidores do Curso de Aperfeiçoamento de Sargentos).2 AMOSTRAGEM ALEATÓRIA: 3.

e o ponto inicial será o número contido na 5ª linha e 3ª coluna. 451. 69. 184. . 2. 2. 3. Notemos que o número correspondente ao ponto inicial é igual a 8. 041.3 AMOSTRAGEM ESTRATIFICADA Pode ocorrer que a população seja formada por subgrupos diferentes. 329. Usando o número inteiro mais próximo anterior a esse resultado. 046. Digamos que o resultado foi 12. 299. 274. 7. 031. 5976. 3. 100.).2. 75. 116. 429. 241. 451. 017. 004. 274. 467. 429. por faixa etária. 322.2. 046. 1. 9. 65. de cima para baixo.34 AMOSTRAGEM Primeiramente adotaremos um critério para a leitura da TNA: começaremos lendo os números da direita para a esquerda. 243. 066. 56. SU. 401. proporcional ao tamanho desse grupo.. 299. U.2 AMOSTRAGEM SISTEMÁTICA Quando se conhece uma listagem dos elementos da população pode-se obter uma amostra aleatória de n elementos dividindo-se o número de elementos da população pelo tamanho da amostra. o terceiro seria o 78°. 053. 017. Ordenados os números obtidos da TNA poderemos selecionar os sargentos baseados na antiguidade. 009. selecionamos os elementos da lista que ocorrem com esta periodicidade. Sorteia-se um número ao acaso entre 1 e 33. dada uma população finita de 1000 oficiais do CML dos quais nos interessa uma característica comum (possuidores do Curso de Aperfeiçoamento de Oficiais). procede-se da seguinte forma: 1. 6. 241. mas cada um deles homogêneo (por Pelotões. 586. 353. 041. 112. 322. O primeiro elemento a ser relacionado na amostra seria o oficial que ocupasse a 12ª posição na lista. 467. 56. 053. 99. 047. pelo Almanaque podemos colocá-los em ordem de antiguidade e escolhida uma amostra de 30 oficiais. 082. 4 e 5(caso o número seja 500) . 004. 302. 245.33 que é aproximadamente 33. o segundo seria o 45°. 112. 401. 100. 116. através de uma urna ou pela Tabela de Números Aleatórios.2. 243. 066. 082. e assim somaríamos o número 33 até obtermos os 30 elementos da amostra. 047. vamos selecionar aleatoriamente uma quantidade de cada grupo para formar a amostra. 031. 69. etc. 192. 5. 134. 184. Por exemplo. Dividimos o N da população (1000) pelo valor de n da amostra (30) y = 1000 / 30 = 33. 98. Logo passaremos a ler os números com 3 dígitos tomando o cuidado de observar que os números formados devem iniciar por 0. 009.2. tomados 3 a 3 (a população tem n=500) . 3. 007. 192. Neste caso. 3.. 302. 353. 245. 134. 329. 007.

2. ou mesmo para termos a certeza de que a amostra selecionada irá bem representar a população interesse. Dividiremos então o n amostral (600) pelo número de Pelotões para sabermos quantos soldados de cada pelotão deveremos avaliar. no tocante a estes objetivos comuns de instrução.4 AMOSTRAGEM POR CONGLOMERADOS Em algumas situações. 3. procede-se da seguinte forma: 1. estipular uma margem de erro para rejeição da hipótese nula. estipular a margem de erro admitida entre a média amostra X e a média populacional µ .35 AMOSTRAGEM Por exemplo. Para iniciarmos a amostragem propriamente dita devemos: a. Considerando-se que existe uma formação comum aos soldados do Efetivo Variável (EV) durante o Período Básico de Instrução. 3. Notemos. 3. porém.3 FÓRMULAS PARA A DETERMINAÇÃO DO TAMANHO DA AMOSTRA Ao iniciarmos um estudo normalmente nos deparamos com a dúvida de qual o tamanho amostral necessário para que possamos generalizar os resultados de nossa pesquisa. no entanto. b. Inicialmente precisamos saber quantos Pelotões existem no CML. julgamos que um n amostral maior do que o previsto implicará em uma maior precisão na estimação. 4. o que nos dará um valor aproximado de 303 pelotões. 05 (trataremos deste tipo de erro no Cap.2. e ainda que os Objetivos de Instrução são comuns às Armas. e o segundo será o 32°. suporemos 33 homens por Pelotão.98 que é aproximadamente 2. Neste caso. bastaria verificar o estado atual dos soldados de um determinado Comando Militar de Área para que se obter inferências sobre todos Soldados EV do Exército. podemos identificar um grupo de elementos que tenha aproximadamente a mesma composição de população. dada uma população finita de 10000 soldado do efetivo variável incorporados no CML dos quais nos interessa uma característica comum (resultado no 1° TAF) sabendo-se que estão dispostos em pelotões em suas respectivas Unidades podemos colocá-los em ordem de antiguidade e escolhida uma amostra de 600 soldados. Uma opção seria um sorteio de descarte de 6 soldados relacionados. O primeiro elemento a ser relacionado de cada pelotão será o 7° militar da listagem do pelotão. normalmente = 0. possivelmente não seria necessária uma amostragem âmbito nacional para se verificar o estado da tropa. o que pode ser feito por sorteio de 1 a 33 ou pela Tabela de números Aleatórios (suporemos que foram sorteados os números 7 e 32). e c. 5. y = 500 / 33 = 1. 2. O próximo passo será determinarmos randomicamente de que posições no pelotão serão retirados os 2 elementos. Quadro e Serviço. recomendamos portanto que se mantenham os 606 soldados na amostra. que se tomarmos 2 soldados por Pelotão ao final da seleção teremos 606 soldados. 4). sendo que a amostra necessária é de 600 soldados. pode ser interessante realizar a amostragem usando somente os elementos desse grupo. nos certificar se a população de interesse é finita ou infinita (podemos considerar que uma população é infinita se N > 10000).

esta informação poderá ser utilizada no cálculo de n.5. Erro padrão de estimativa ao quadrado. e a proporção de respostas sim foi de 20% (20 dos 100).N e² ( N-1) + z²( /2) . p. Quando não se dispõe de informações sobre o valor de p deve-se realizar uma préamostragem com n1 elementos.µ.96) ² . completa-se a pré-amostra selecionando-se (nn1) elementos. Número de elementos da população.96) ² pois (1.2 0. Quadro 18 – Fórmulas para o cálculo do tamanho amostral. POPULAÇÃO INFINITA n = z²( /2) . Se não houver informações a respeito de p e não pudermos realizar uma a préamostragem. 0. o cálculo de n com p=0. p. Em algumas situações.N Número de elementos da amostra.=95%) 0.2 . 0.03) ² /2) n= 683 militares Portanto necessitaríamos entrevistar mais 583 militares (683 . Um pesquisador pretende avaliar a proporção de militares que responderão sim a uma determinada pergunta. Para isto. .N e² n= (1. p. Caso valor de n for maior que n1. para a margem de erro adotada está descrito no Quadro 19. levará a um tamanho da amostra com o conseqüente problema de custo de amostragem associado (a amostra será muito grande). Onde: n1= z²( /2)= p= q= N= e² = Dado que: 100 (1.q. selecionou ao acaso uma pré-amostra (n1 = 100 militares). Neste caso.q. Se o valor de n calculado nestas condições. Probabilidade aceita para o erro tipo I Proporção esperada de sucesso do evento. for menor que n1.03)² Logo: n = z²( . Exemplo 1.100) Quadro 19 – Cálculo do tamanho amostral para população infinita. a pré-amostra já conterá um número suficiente de elementos para garantir a precisão determinada. O cálculo do n amostral que bem representará a população de estudo.N e² Onde: n= z²( /2)= p= q= N= e² = POPULAÇÃO FINITA n= z²( /2) . sendo p = 1 –q . p. (0.8 INFINITA (0. O Quadro 18 apresenta 2 fórmulas para o cálculo do n amostral levando em consideração se a população é finita ou infinita. Proporção esperada de insucesso do evento.q. onde e= X . o problema pode conter uma informação a respeito de p.36 AMOSTRAGEM Para um melhor ajuste do tamanho amostral deve-se ainda levar em consideração a proporção esperada de sucesso do evento estudado (p) em relação ao seu insucesso (q). com 95% de confiança de que não errará por mais de 3%.8 .q.

=90%) 0. 50% dos militares faz uso e 50% não faz uso do protweb). 0.625. cujas funções poderiam ser otimizadas pelo uso da ferramenta. 0.400 n= 199 militares Portanto necessitaria entrevistar mais 119 militares (199-80) Dado que: n = 30 (1. e não existindo estudo anterior que lhe permitisse estimar o valor de p. 0.5 (ou seja. consultando-os por telefone. Onde: n1 = z²( /2)= p= q= N= e² = z²( /2) . 0. 0. Um pesquisador está interessado em estimar a proporção de militares que faz uso do protweb em suas OM.N Logo n= (1.625 . p.375. p.625 400 (0.64) ² pois (1.5.q.78 = 353 militares Portanto necessitaria entrevistar mais 353 militares Notemos a diferença em relação ao estudo que foi realizado com pré-amostragem.q. Caso desejasse determine o tamanho da amostra necessária para estimar esta proporção com 90% de confiança.04) ² . Onde: n1 = z²( /2)= p= q= N= e² = z²( /2) . foi obrigado a considerar p=0. 0.5 400 (0.5. (353-199=154) Dado que: n = ---(1. 399 +(1. Um pesquisador está interessado em estimar a proporção de militares que faz uso do protweb nas OM da Vila Militar do Rio de Janeiro (N= 400 militares). e verificando que 30 faziam uso diário do protweb.375.37 AMOSTRAGEM Exemplo 2.N e² ( N-1) + z²( /2) . p.q.375 0.04)² Quadro 21 – Cálculo do tamanho amostral para população finita (sem possibilidade de pré-amostragem) .64) ² pois (1. amostrou 80 militares de um cadastro de N = 400.64) ² .5.N e² ( N-1) + z²( /2) . 400 (0.400 n= 352. 0. p.=90%) 30/80=0.5 0.q.5 .64) ² . 400 (0.N Logo n= (1.04)² Quadro 20 – Cálculo do tamanho amostral para população finita (pré-amostra menor que a amostra necessária) Exemplo 3. e com erro um máximo de 4% em relação à proporção populacional deveria executar os cálculos conforme o Quadro 20. 0.64) ² . Para isto. 399 +(1. e com erro um máximo de 4% em relação à proporção populacional deveria executar os cálculos conforme o Quadro 21. Não sendo possível realizar uma pré-amostragem. Caso desejasse determine o tamanho da amostra necessária para estimar esta proporção com 90% de confiança.04) ² .64) ² .

(Co. ou cara no primeiro e coroa no segundo. Procuramos resumir aqui os conhecimentos que julgamos necessários para termos um ponto de apoio em nossos primeiros passos no caminho da Estatística Inferencial.Assim. um conjunto de vários resultados possíveis que recebe o nome de espaço amostral. vezes sob condições semelhantes. em maior ou menor grau.1 EXPERIMENTO ALEATÓRIO Em quase tudo. Ca). Fenômenos como esse são chamados fenômenos aleatórios ou experimentos aleatórios. ele perca. 3. 4. da afirmação “ é provável que o meu time ganhe a partida de hoje” pode resultar: a) que. mesmo repetidos várias. 2. Já ao lançarmos um dado há seis resultados possíveis: 1. em geral. Como vimos. ou coroa no primeiro e cara no segundo.1.1 ESPAÇO AMOSTRAL (S) A cada experimento correspondem. ao lançarmos uma moeda. sua inclusão neste manual se justifica pelo fato de a maioria dos fenômenos de que trata a Estatística ser de natureza aleatória ou probabilística. o resultado final depende do acaso. há dois resultados possíveis: ocorrer cara ou ocorrer coroa. 3. que são aqueles que. Assim. 4. ou coroa nos dois lançamentos. vislumbramos o acaso. Cada um dos elementos de S recebe o nome de ponto amostral. o conhecimento dos aspectos fundamentais do cálculo de probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial. c) que empate. Do mesmo modo. Co)}. (Co. como pensamos. Co} b) Lançamento de um dado: S = {1. (Ca. 4.Capítulo 4 Probabilidade Embora o cálculo das probabilidades pertença ao campo da Matemática. Os dois experimentos citados anteriormente têm os seguintes espaços amostrais: a) Lançamento de uma moeda: S = {Ca. notado por S. apesar do favoritismo. 5 ou 6. Co). que trata da conceituação de variável aleatória e das duas principais distribuições de probabilidades de variáveis discretas e contínuas. ele ganhe. 2 é um ponto amostral de S.. 2 S . Conseqüentemente. 5. como em dois lançamentos sucessivos de uma moeda podemos obter cara nos dois lançamentos. apresentam resultados imprevisíveis. o espaço amostral é: S = {(Ca. 4. Esses passos serão apresentados no capítulo seguinte. 6}. Ca). 2. b) que.

Um evento é sempre definido por uma sentença. 4. 6} S.2 EVENTOS PROBABILIDADE Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório (os eventos são denotados por letras arábicas maiúsculas). Exemplo: No lançamento de um dado. B é um evento certo de S (B = S). a probabilidade de se obter cara no lançamento de uma moeda é de ½ ou 50. Co} n(S) = 2 n(A) = 1 A = {Ca} n(S) 2 Ou seja.00%. Assim.00% S = {Ca.” “ Obter um número maior que 6 na face superior. Se E = S.1. E é chamado evento impossível. B = {l. D é um evento impossível de S. logo.” 4. sendo S o seu espaço amostral.2 PROBABILIDADE Dado um experimento aleatório. E é chamado evento certo (com probabilidade 1 ou 100%). logo. que S é um conjunto equiprovável. 2. n(S) é o número de elementos de S. Assim. logo. A é um evento de S. vamos admitir que todos os elementos de S tenham a mesma chance de acontecer. 3. qualquer que seja E. Considerando o lançamento de uma moeda e o evento A “ obter cara” . os eventos acima podem ser definidos pelas sentenças: “ Obter um número par na face superior. onde S = {l. 3. Se E S e E é um conjunto unitário. Chamamos de probabilidade de um evento A (A P(A) = n(A) n(S) S) o número real P(A).39 4. 5. então E é um evento de S. logo. 4.” “ Obter o número 4 na face superior. 6} S. 2. C é um evento elementar de S. C = {4} S. D = ø S.” “ Obter um número menor ou igual a 6 na face superior. Se E = ø. 4. temos: Dado que: P(A) = n(A) n(S) Onde : Logo : P(A) = n(A) = 1 = 50. Exemplos: a. temos: A = {2. tal que: onde: n(A) é o número de elementos de A. . ou seja. 5. se E S (E está contido em S). 6}. E é chamado evento elementar.

a probabilidade de se obter um número par na face superior de um dado lançado é de ½ ou 50. 3.1 EVENTOS COMPLEMENTARES Sabemos que um evento pode ocorrer ou não. 2. 2. 5.00% n(S) 6 C=ø n(D) = 0 Ou seja. 4. a probabilidade de não tirar o valor 4 no lançamento de um dado é: q = 5/6 . 3. 4. 2. Considerando o lançamento de um dado. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso).00% (a probabilidade do evento certo é igual a 1).00% (a probabilidade do evento impossível é igual a zero). para um mesmo evento existe sempre a relação: p+q=1 q=1-p Assim. 3.00% c. vamos calcular a probabilidade do evento C “ obter um número maior que 6 na face superior” : Dado que: P(A) = n(A) n(S) Onde : Logo : S = {1. 3. 4. 2. a probabilidade de que ele não ocorra é: q = 1 –p q = 1. a probabilidade de se obter um número maior que 6 na face superior de um dado lançado é de 0 ou 0. Considerando o lançamento de um dado. Considerando o lançamento de um dado. vamos calcular a probabilidade do evento A “ obter um número par na face superior” : Dado que: P(A) = n(A) n(S) Onde : Logo : S = {1. 4. 6} n{B) = 6 n(S) 6 Ou seja. 6} n(S) 6 2 n(A) = 3 Ou seja. se a probabilidade de se realizar um evento e p = 1/5. 4. d. vamos calcular a probabilidade do evento B “ obter um número menor ou igual a 6 na face superior” : Dado que: P(A) = n(A) n(S) Onde : Logo : S = {1. 6} n(S) = 6 P(A) = n(A) = 6 = 1 = 100. 5.00% B= {1. 6} n(S) = 6 P(A) = n(A) = 0 = 0 = 0.1/5 q = 4/5 Sabemos que a probabilidade de tirar o valor 4 no lançamento de um dado é: p = 1/6 Logo. 5. 6} n(S) = 6 P(A) = n(A) = 3 = 1 = 50. 4.00% A = {2.2. 5. a probabilidade de se obter um número menor ou igual a 6 na face superior de um dado lançado é de 1 ou 100.40 PROBABILIDADE b.

41 4.2.2 EVENTOS INDEPENDENTES

PROBABILIDADE

Dizemos que dois eventos são independentes quando a realização ou a não-realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos. Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por: P(1;2) = p1 . p2 Exemplo: Considerando o lançamento de dois dados, vamos calcular a probabilidade do evento D “ obter o número 1 no primeiro dado e o número 3 no segundo dado” : Dado que: P(1;2) = p1 . p2 Onde : Logo : p1 = 1/ 6 P(1;2) = 1 . 1 = 1 p2 = 1/ 6 6 6 36 Ou seja, a probabilidade de se obter o número 1 no primeiro dado e o número 3 no segundo dado, lançados ao mesmo tempo é de 1/36 ou 2,78%. 4.2.3 EVENTOS MUTUAMENTE EXCLUSIVOS Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento “ tirar cara” e o evento “ tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: P(1;2) = p1
+

p2

a. Considerando o lançamento de um dado, vamos calcular a probabilidade do evento E “ obter o número 2 ou o número 3” : Dado que: P(1;2) = p1 + p2 Onde : Logo : p1 = 1/ 6 P(1;2) = 1 + 1 = 1 p2 = 1/ 6 6 6 3 Ou seja, a probabilidade de se obter o número 2 ou o número 3 no lançamento de um dado é de 1/3 ou 33,33%.

42

PROBABILIDADE

b. Considerando o lançamento de um dado, vamos calcular a probabilidade do evento E “ obter o número 1 ou o número 6” : Dado que: P(1;2) = p1 + p2 Onde : Logo : p1 = 1/ 6 P(1;2) = 1 + 1 = 1 p2 = 1/ 6 6 6 3 Ou seja, a probabilidade de se obter o número 2 ou o número 3 no lançamento de um dado é de 1/3 ou 33,33%. EXERCÍCIOS RESOLVIDOS 1) Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52 cartas? Como só há um ás de ouros, o número de elementos do evento é 1, logo: p = 1/52 2) Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas? Como há 4 reis, o número de elementos do evento é 4; logo: p = 4/52 = 1/13 3) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a. a probabilidade de essa peça ser defeituosa, temos: p = 4/12 = 1/3 b. a probabilidade de essa peça não ser defeituosa. Sendo este evento e o anterior complementares, temos: p =1 - 4/12 = 2/3 4) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. O evento é formado pelos elementos (1, 4), (2, 3), (3, 2) e (4, 1). Como o número de elementos de S é 36, temos: Sendo: n(A)=4 n(S)=36 logo p = 4/36 = 1/9

5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus? Temos: Dado que: P(R;5) = pR . p5 Onde : Logo : pR = 4/ 52 = 1/ 13 P(R;5)= 1 . 1 = 1 p5 = 1/52 13 52 676

43

PROBABILIDADE

6) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde? Temos: p1 = 3/9 = 1/ 3 ; p2= 2/8 = 1/4 ; p3 = 4/9 Como os três eventos são independentes e simultâneos, vem: P(1;2;3) = p1 . p2 . p3 P(1;2;3) =1/3 . 1/4 .4/9 = 1/27 7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus? A probabilidade de sair o ás de paus na primeira carta é: pA = 1/52 Após a retirada da primeira carta, restam 51 cartas no baralho, já que a carta retirada não foi reposta. Assim, a probabilidade de a segunda carta ser o rei de paus é: PR = 1/51 Como esses eventos são independentes, temos: P(A;R) = pA . pR P(A;R) =1/52 . 1/51 = 1/2652 4.3 EMPREGO DA PROBABILIDADE PARA COMPROVAÇÃO DE HIPÓTESES Normalmente se pergunta quais as chances de que certas coisas aconteçam. Usamos a probabilidade nos eventos diários. Quais são as chances de que chova? Ouvimos um meteorologista dizer que a probabilidade de chuva é de 90/o. Queremos saber se isto significa que irá chover em 90% dos lugares ou, melhor, que as chances são de 90% de que irá chover onde estamos. Os termos probabilidade subjetiva ou probabilidade personalística são usados para descrever esse conceito. Um segundo conceito de probabilidade é chamado de eventos igualmente prováveis. Por exemplo, ao jogarmos um dado, as chances dos números de 1 a 6 ocorrerem são igualmente prováveis. A terceira abordagem da probabilidade envolve o limite da freqüência relativa. Para ilustrar, suponha que joguemos uma moeda 100 vezes esperaríamos 50 caras, mas se obtivermos 45, então fr= 0,45. Jogando 1000 vezes, esperaríamos 500 caras, entretanto, podemos obter 490 caras, fr= 0,490. Se jogarmos 100000, e obtivéssemos 49995 caras, fr=0,49995, note que, quanto maior o valor de n, o limite da freqüência relativa tende a probabilidade real do evento ocorrer, ou seja, 0,5. Em um teste estatístico, extraímos uma amostra de uma população de sujeitos e eventos. Usamos afirmativas de probabilidade para descrever a confiança que depositamos nos achados estatísticos.

44

PROBABILIDADE

Freqüentemente, encontraremos um teste estatístico seguido pelo enunciado da probabilidade tal como p < 0,05. Esta interpretação seria que uma diferença ou relação deste tamanho seria esperada menos do que 5 vezes em 100, como um resultado de chance. 4.3.1 ALFA ( ) Em pesquisa, o teste estatístico é comparado a uma tabela de probabilidade para aquela estatística, a qual lhe dirá qual a chance de ocorrência. O experimentador pode estabelecer um nível aceitável de chance de ocorrência ( ) antes do estudo. Este nível de chance de ocorrência pode variar de baixo a alto, mas nunca ser eliminado. Em pesquisa comportamental, alfa (a probabilidade de ocorrência de chance) é freqüentemente de 0,05 ou 0,01 (as possibilidades de que os achados são devidos à chance são ou de 5 em 100 ou de 1 em 100). Em um estudo o experimentador pode cometer 2 tipos de erro: O erro tipo I é rejeitar a hipótese nula quando a hipótese nula é verdadeira. Por exemplo, um pesquisador conclui que existe diferença entre dois métodos de treinamento, mas na verdade não existe. O erro tipo II é não rejeitar a hipótese nula quando a hipótese nula é falsa. No exemplo anterior um pesquisador poderá concluir que não existe diferença entre os dois métodos de treinamento, mas na verdade existe. A Tab.13 é chamada de tabela da verdade, a qual demonstra erros tipo I e II. Como você pode ver, aceitar uma hipótese nula verdadeira, ou rejeitar uma falsa é a decisão correta. Controlamos os erros tipo I estabelecendo alfa. Por exemplo, se alfa é estabelecido em 0,05, então, se 100 experimentos são realizados, uma hipótese nula verdadeira de não-diferença ou de não relação entre as variáveis, seria rejeitada somente em 5 ocasiões. Embora as chances do erro ainda existam, o experimentador especificou-as exatamente pelo estabelecimento de alfa antes do estudo. Tabela 13 - Tabela da verdade Aceitação Rejeição Ho verdadeira Decisão correta Erro tipoII ( ) Ho falsa Erro tipoI ( ) Decisão correta

Deve-se de estipular o “ tamanho” do erro tipo I que se está disposto a cometer, antes do inicio de um experimento. Por exemplo, é mais importante que evitemos concluir que um método de treinamento é melhor do que o outro, quando ele realmente não é (Tipo I), do que concluirmos que um método não é melhor do que outro quando ele realmente é (Tipo II)?

Mesmo quando os experimentadores estabelecem o alfa em um nível específico (p. Por outro lado. Usando a informação estatística (significância e significado).3. O experimentador está garantindo que a droga tem todas as oportunidades de mostrar sua efetividade.... ex. Se o alfa for movido para cima ou para baixo. cuja magnitude é determinada por beta ( ). ex. estabelecer um alfa de 0. 4. o pesquisador deve interpretar os resultados dentro da teoria e hipóteses que foram formuladas. eles freqüentemente relatam o alfa para os efeitos específicos do estudo no nível que ocorreu (p. podemos também conter o erro tipo II. Distribuição da amostragem sob Ho Distribuição da amostragem se Ho é falsa 1- Y X Figura 17. Áreas de distribuição do erro tipo II .2 BETA ( ) Embora a magnitude do erro tipo I seja especificada pelo alfa. se existe alguma chance da droga fazer efeito.01 são amplamente utilizados na comunidade científica.05) antes da pesquisa. Em vez de tomar uma decisão somente estatística.45 PROBABILIDADE Por exemplo.30 sempre. embora as chances de acontecer um erro tipo I possam ser aumentadas.012).. certifique-se de justificar a razão. o experimentador pode estabelecer um alfa de 0. podemos notar a sobreposição da distribuição de escores na variável dependente para X (a distribuição da amostragem se a hipótese nula é verdadeira) e Y (a distribuição da amostragem se a hipótese nula é falsa).024) associado com o teste estatístico (p.001 diminui enormemente as chances do erro tipo I ocorrer. p 0. t). Assim. r. 0. Não há nada de errado com este procedimento. Observando a Fig. podemos dizer que os níveis 0. o experimentador pode não querer aceitar a hipótese nula de “ nenhum efeito” . entretanto. Uma abordagem mais adequada pode ser a de relatar o nível exato de probabilidade (p. e que considerou pesquisas relacionadas. ex. na medida em que estão somente demonstrando em que grau o nível de probabilidade excedeu o nível especificado. Não podemos dizer onde estabelecer o alfa. p 0. em um estudo do efeito de um remédio para o câncer. 19 . Então avaliaremos o significado da diferença ou relação.05 ou 0. ex. esta abordagem coloca a responsabilidade da tomada de decisão onde ela deve estar no pesquisador que colocou o estudo em um modelo teórico.

e divide a diferença pelo desvio-padrão. 0. Isto coloca a diferença entre as médias na métrica comum chamada de “ unidades de desvio-padrão” .5 aproximadamente é um TE moderado. se a média de Y localiza-se em algum lugar entre a média de X e o Y especificado.3. Se um pesquisador pode identificar o tamanho de um importante efeito por meio de pesquisas prévias ou simplesmente estimar um tamanho do efeito (p. você não rejeita a hipótese nula quando. indicamos que a média de Y (dado uma certa distribuição) deve ser em uma distância especificada da média de X antes da hipótese nula ser rejeitada.5 é um TE moderado. Assim. ex.. O significado da diferença entre duas médias pede ser estimado de várias formas. a hipótese nula é sempre falsa! O que este enunciado reflete é que em pesquisa comportamental as médias dos dois grupos nunca são as mesmas. até certo ponto. então o tamanho da amostra necessário para o estudo pode ser estimado.3.8 ou maior é um TE grande. . Como podemos ver. existe uma relação entre alfa e beta. Quantos sujeitos são necessários para declarar uma diferença importante como significante? Entendendo o conceito de poder pode-se responder às duas questões anteriores.1969). existe uma diferença verdadeira. se suficientes sujeitos são obtidos (uma forma de obter poder). detectando uma diferença real). também chamado delta. As questões mais interessantes em pesquisa comportamental são: 1. 4.46 PROBABILIDADE Pela especificação do alfa.2 ou menos é um TE pequeno.. Ter poder na análise estatística é importante porque isto aumenta as chances de rejeitar a hipótese nula falsa. estudiosos precisam se preocupar com o significado dos resultados em suas pesquisas.4 PODER Poder é a probabilidade de rejeitar a hipótese nula quando esta é falsa (p. Entretanto. A fórmula do Tamanho do Efeito (TE) é: TE = (M1 . ex.8). quaisquer duas médias podem ser declaradas significativamente diferentes. ). 0.M2 )/ s Esta fórmula subtrai a média de um grupo (M1) da média do segundo grupo (M2 ). O quanto uma diferença é importante na teoria e/ou na prática? 2. mas uma forma que tem ganhado muita atenção recentemente é o tamanho do efeito (sugerido por Cohen. na pesquisa comportamental. isto é. beta torna-se maior. 4. ex. por exemplo. você poderá estar cometendo um erro tipo II ( ).. a qual pode ser comparada às orientações para a pesquisa comportamental sugeridas por Cohen (1969): 0. 0. ou a probabilidade de tomar a decisão correta. de fato. estabelecer quanto de poder é aceitável (p. à medida que alfa é diminuído. uma estimativa comum em ciência comportamental é 0.3 SIGNIFICADO (tamanho do efeito) Além de reportar a significância dos resultados. É claro que.

70 favorecendo o grupo experimental nos resultados desses estudos. Considere o seguinte exemplo: No planejamento de um estudo.05. Entretanto.5 0.5 100 TE=0.9 Poder Figura 20 . beta 0.beta (1.3 0.4 100 TE=0.4 0.Curva do tamanho do efeito para = 0.0. 502).01. teste bicaudal.2 = 0. a seriedade do erro do tipo I para o tipo II deverá ter a razão de 1 para 4 (0.6 0. . p. Green.5 0.7 0.7 TE=0.7 TE=0.9 Poder Figura 21 . teste bicaudal. 1991.20) porque Cohen (1988) sugeriu que em ciências comportamentais.01.7 0.8 0.8 (freqüentemente recomendado como poder adequado em pesquisa comportamental.3 TE=0.5 TE=0.0 .05 e quer proteger beta em 4 vezes o nível de alfa (assim. n para 400 cada grupo 300 200 TE=0.20). existem vários estudos relacionados e o investigador calculou um TE médio = 0. (eixo y).3 0.47 PROBABILIDADE As Figuras 20 e 21 oferecem uma visão da relação entre o tamanho da amostra.2 TE=0. e o tamanho do efeito (curva TE).05 x 4 = 0.Curva do tamanho do efeito para = 0. O investigador decide estabelecer alfa = 0. n para cada grupo 500 400 300 200 TE=0.05 ou 0.6 TE=0.8 0. mas ele não sabe quantos sujeitos são necessários para cada grupo para detectar uma diferença significativa entre os tratamentos.8 050 0.2 TE=0.8 500 TE=0. o poder (eixo x).8). então o poder é estabelecido em 0.4 0.4 TE=0.3 0. o investigador terá dois grupos que serão randomicamente formados. quando alfa é 0. Uma vez que o poder é 1 .6 050 TE=0.6 0.

20.8) e TE (0.70 por onde atravessa o eixo x (poder) em 0. que para um alfa mais rigoroso (p.. 0.05) para 50.01). . e então. TE e poder). onde alfa 0.8. o número de sujeitos necessários aumenta de 30 (como na Fig. nota-se que para o mesmo nível de poder (0.70). Analisando a Fig. ex. Conforme o número de sujeitos em cada grupo é reduzido.05 a 0. um maior número de sujeitos é requerido para detectar uma diferença significativa. o poder é reduzido (dado o mesmo TE). Pode-se verificar. ler através do eixo y (tamanho da amostra) e observar que 30 sujeitos serão necessários para cada grupo. 20 Deve-se ler a curva TE 0. 21 (alfa = 0.01).48 PROBABILIDADE Quando as informações prévias são conhecidas (alfa. então o número de sujeitos necessários em cada um dos dois grupos pode ser estimado da Fig.

(Ca. 15. é apresentar dois modelos teóricos de distribuição de probabilidade.Resultados possíveis do lançamento simultâneo de 2 moedas. (Co. o que permitirá a solução de grande número de problemas práticos. Tabela 14 . Ca) (Ca. e que.00% x 2 1 1 0 4 . 14.23% 7. (Co. Co).08% 100. Número de punições 0 1 2 3 4 5 6 7 8 total fi 2 3 4 1 5 2 1 2 6 26 Probabilidade de ocorrência 7. aos quais um experimento aleatório estudado possa ser adaptado. Ca). se o espaço amostral relativo ao “ lançamento simultâneo de duas moedas” é 4 {(Ca.Punições disciplinares durante o primeiro semestre do ano de instrução. de acordo com a Tab.38% 3. sendo seus valores indicados por letras minúsculas. Co) (Co.53% 15. Ponto amostral (Ca. Co)} e se X representa “ o número de caras” que aparecem.69% 11. Ca).1 VARIÁVEL ALEATÓRIA Suponhamos um espaço amostral S. então. de acordo com a Tab. Assim.85% 7. Ca) (Co.85% 19. definida uma função chamada variável aleatória. indicada por uma letra maiúscula. Tabela 15 .Capítulo 5 Distribuições Binomial e Normal O que pretendemos neste capítulo.69% 3.69% 23. Co) total 5. 5.2 DISTRIBUIÇÃO DE PROBABILIDADE Consideremos a distribuição de freqüências relativa ao número de punições semanais em uma companhia. Fica. durante o primeiro semestre do ano de instrução. a cada ponto amostral seja atribuído um número. a cada ponto amostral podemos associar um número para X.

1/2=1/4 1/2 ..85% 19. Co) total x 2 1 1 0 4 P(X)=fri 1/2 . Ca) (Co.. definem uma distribuição de probabilidade.53%.00% Seja X uma variável aleatória que pode assumir os valores x1. b.38%.69% 3. Tabela 16 .. de forma que a probabilidade de sair cara uma vez é 1/4 + 1/4 = 2/4. e d. ocorrerem oito punições disciplinares é de 23.08% 100. 15 as seguintes observações: a. a cada valor xi a probabilidade fri de ocorrência de tais pontos no espaço amostral. x2. voltando à Tab.xn.1/2=1/4 Verifiquemos que os pontos amostrais (Ca. e suas correspondentes fr1. frn... temos: fri = 1 Os valores x1.08%.xn. Co) e (Co. x3. 17: Tabela 17 .50 DISTRIBUIÇÕES BINOMIAL E NORMAL Em suma. Assim.69% 23. a cada valor xi correspondem pontos do espaço amostral.. denominada tabela de distribuição de probabilidade. então. pode-se extrair da Tab.69% 11. Associamos. Da Tab.69%.Verificação das freqüências em que aparece o resultado cara Ponto amostral (Ca.. temos a Tab.23% 7.1/2=1/4 1/2 .. c. .85% 7. x2. Ca) (Ca.Probabilidade de ocorrência de punições disciplinares durante o primeiro semestre do ano de instrução Número de punições 0 1 2 3 4 5 6 7 8 total fi 2 3 4 1 5 2 1 2 6 26 Probabilidade de ocorrência 7. 16.53% 15. Assim. fr2.. a probabilidade estimada de ocorrerem duas punições disciplinares é de 15.. Ca) apresentam cara uma vez. a probabilidade estimada de ocorrer uma punição disciplinar é de 11. 15 poderíamos escrever a Tab.. Co) (Co. fr3. a probabilidade estimada de não ocorrer punição disciplinar é de 7.1/2=1/4 1/2 . 16.38% 3.. x3.

Assim. ao lançarmos um dado. No decorrer do experimento. O experimento “ obtenção de caras em cinco lançamentos sucessivos e independentes de uma moeda” satisfaz essas condições. podemos escrever a Tab. nas mesmas condições. um número finito de vezes P(X) 1/6 1/6 1/6 1/6 1/6 1/6 1 P(X)= b. . da qual resulta a distribuição de probabilidade Tab..Distribuição de probabilidade do lançamento de um dado. Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n tentativas. c. Esta correspondência define uma função. assim definida. é denominada função probabilidade representada por: f(x) = P (X = xi) A função P (X = xi) determina a distribuição de probabilidade da variável aleatória X.. 2 n) formam o domínio da função e os valores P (i = 1.3 DISTRIBUIÇÃO BINOMIAL Vamos. Número de caras 2 1 0 fri fri 1/4 2/4 1/4 1 Ao definirmos a distribuição de probabilidade. os valores x (i = 1. n). 6. 19: Tabela 19 . d. 2. isto é. As provas repetidas devem ser independentes. . 17.. pode tomar os valores 1. a variável aleatória X. 3. definida por “ pontos de um dado” . Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso. fica definida uma função de probabilidade. a probabilidade p do sucesso e a probabilidade q (q = 1p) do insucesso manter-se-ão constantes. Essa função. X 1 2 3 4 5 6 5. considerar experimentos que satisfaçam as seguintes condições: (n). O experimento deve ser repetido. o seu conjunto imagem. Como a cada um destes valores está associada uma e uma só probabilidade de realização e P(xi) = 1. neste item. 18: Tabela 18 . .. o resultado de uma não deve afetar os resultados das sucessivas. de acordo com a Tab.Verificação das freqüências em que aparece o resultado cara. 2. conforme sua distribuição de probabilidades.51 DISTRIBUIÇÕES BINOMIAL E NORMAL Logo. 3. a... estabelecemos uma correspondência unívoca entre os valores da variável aleatória X e os valores da variável P.

podemos escrever: Dado que: P(X = k) = n! . (2/3)6-4 4! (6. pk . jogam entre si 6 vezes. 1/8 . 1) Uma moeda é lançada 5 vezes seguidas e independentes.p = q. quando da realização de um experimento qualquer em uma única tentativa. 1/81 . podemos escrever: Dado que: P(X = k) = Onde: n=6 k=4 p=1/3 q=2/3 n! . a probabilidade de não-realização desse mesmo evento (insucesso) é 1 . 1/4 3x2x1x2x1 P(X = 3) = 5/16 2) Dois times de futebol. p é a probabilidade de que o evento se realize em uma só prova sucesso. pk . que realizemos a mesma prova n vezes sucessivas e independentes. Pela lei binomial. A probabilidade de que um evento se realize k vezes nas provas é dada pela função: f(X) = P(X = k) = n! k! (n. qn-k k! (n. (1/2)3 . k! (n. Suponhamos. (1/3)4 .3)! p=1/2 q=1/2 P(X = 3) = 5x4x3x2x1 . se a probabilidade de realização de um evento (sucesso) é p. 4/9 4x3x2x1x2x1 P(X = 4) = 20/243 . pk . denominada lei binomial. qn-k k! (n. (1/2)5-2 3! (5. Calcule a probabilidade de serem obtidas 5 caras nessas 5 provas.4)! P(X = 4) = 6x5x4x3x2x1 .52 DISTRIBUIÇÕES BINOMIAL E NORMAL Sabemos que.k)! Onde: n=5 Logo: k=3 P(X = 3) = 5! . Pela lei binomial.k)! Essa função. Encontre a probabilidade de o time A ganhar 4 jogos.k)! Logo: P(X = 4) = 6! . define a distribuição binomial. q é a probabilidade de que o evento não se realize no decurso dessa prova n! é o coeficiente binomial de n sobre k. EXERCÍCIOS RESOLVIDOS insucesso.k)! . qn-k na qual: P(X = k) é a probabilidade de que o evento se realize k vezes em n provas. A e B. agora.

Seja X a variável aleatória que representa os diâmetros dos cartuchos de 9mm produzidos por certa máquina. simétrica em torno da média (X).04 mm. observe a Fig.CURVA NORMAL Entre as distribuições teóricas de variável aleatória contínua.05 mm É fácil notar que essa probabilidade. ambas as probabilidades são iguais a 0.53 DISTRIBUIÇÕES BINOMIAL E NORMAL 5.4 DISTRIBUIÇÃO NORMAL . Quando temos em mãos uma variável aleatória com distribuição normal. X Para uma perfeita compreensão da distribuição normal. alcançá-lo. por meio de um exemplo concreto. 22 e procure visualizar as seguintes propriedades: a. A variável aleatória X pode assumir todo e qualquer valor real. a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média. correspondente à área hachurada na Fig. contudo. d.5. A área total limitada pela curva e pelo eixo das abscissas é igual a 1. indicada pó P(9 < X < 9. A representação gráfica da distribuição normal é uma curva em forma de sino. supondo que essa variável tenha distribuição normal com média X = 9 mm e desvio padrão S = 0. isto é. que recebe o nome de curva normal ou de Gauss. Figura 22 . Pode haver interesse em conhecer a probabilidade de um cartucho ter um diâmetro com valor entre 9 e 9. c. já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.5. 23. aproxima-se indefinidamente do eixo das abscissas sem. A curva normal é assintótica em relação ao eixo das abscissas. uma das mais empregadas é a distribuição normal descrita na Fig.Aspecto gráfico de uma distribuição normal.05). 22. Escrevemos: P(X> X) = P(X < X) = 0. Como a curva é simétrica em torno da X. . nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. e e. isto é. Vejamos como proceder. b.

calcular o valor de z que corresponde a x = 9. então a variável z tem distribuição normal reduzida.25 s 0.25) = 0. precisamos.2. que. O cálculo direto dessa probabilidade exige um conhecimento de Matemática mais avançado do que aquele que dispomos no curso de 2° grau.25. encontramos. Queremos calcular P(9 < X < 9.04 donde: P(9 < X < 9. não havendo necessidade de serem calculadas. agora.05 = 1.05 – 9 = 0. que corresponde ao último algarismo do número 1. no Anexo V o valor de z = 1. que se X é uma variável aleatória com distribuição normal de média X e desvio padrão s. em primeiro lugar.54 DISTRIBUIÇÕES BINOMIAL E NORMAL 9 9. Para obter essa probabilidade. então. podemos escrever: P(X< X < x) = P(0 < Z < z). com z = xi – X s Voltemos. então: z = xi – X = 9. z = xi – X s As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas.04 0. Na intersecção da linha e coluna correspondentes encontramos o valor 0.05) = P(0 < X < 1. o valor 5. Temos. então. Entretanto. ao nosso problema. Na primeira coluna encontramos o valor 1. podemos contornar facilmente esse problema.05 Figura 23 . sem demonstração. isto é: P(0 < Z < z) Temos. que nos dá a probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z. tem distribuição normal de média o e desvio padrão 1.05mm. na primeira linha.Probabilidade de X encontrar-se entre 9mm e 9. Em seguida.25) Procuremos. Basta aceitar. O Anexo V contém é uma tabela de distribuição normal reduzida.05).25. isto é.3944 . se X é uma variável aleatória com distribuição normal de média X e desvio padrão s. pois X = 9).05 (x = 9 z = 0.3944. o que nos permite escrever: P(0 < Z < 1.

c.05) = P(0 < Z < 1.8) = 0.0.3944.3944 ou 39.25) = 0. Escrevemos.25) = 0.5 < Z < 0)+ P( 0 < Z < 1.8 < Z < 1.44% EXERCÍCIOS RESOLVIDOS 1.5 0 1.0.fabricada por essa máquina. então: P(9 < X < 9.48) Como: .25 < Z< 0) = P(0 <Z < 1.0.1026 Obtemos: P( 0.23) .48 P( .25 0 P( .1915 P( 0 < Z< 1.2881 P( 0 < Z< 0.25) = 0.25 < Z < 0) A probabilidade procurada corresponde à parte hachurada da figura: Sabemos que: P(0 < Z < 1.0.1.2881 -0.23 ) = 0.23) = P( 0 < Z < 1.05mm é 0.5 < Z < 1.6221 1.8) Como: 00.a.1.0. Determine as probabilidades: 1.5 < Z < 1.4306 = 0.P( 0 < Z < 0.55 DISTRIBUIÇÕES BINOMIAL E NORMAL Assim.48) = 0. P( -1.8 1.23 P( 0 < Z< 1. temos: .5 < Z < 1.3944 Pela simetria da curva.48) = P(.1915 +0.4306 Obtemos: P(. P(0.1855 .23) = 0.5 < Z< 0) = P(0 <Z < 0. a probabilidade de uma munição 9mm .5) = 0.0. P(.23) A probabilidade procurada corresponde à parte hachurada da figura: Temos que P( 0.b.8 < Z < 1. apresentar um diâmetro entre a média 9mm e o valor x = 9.48) A probabilidade procurada corresponde à parte hachurada da figura: Temos que P(.1026 = 0.48) =0.3944 1.8 < Z < 1.

d. P(Z < 0.6) = 0.8 + 8.6 P( Z > 0) = 0.5 + 0.2810 Se então zxi = xi – X s xi = zxi .4000) por interpolação o zxi = 1. P(Z > 0. logo.P( 0 < Z < 0.00% / 39. e em se querendo selecionar 10% destes alunos para realizarem um curso de aperfeiçoamento.92) A probabilidade procurada corresponde à parte hachurada da figura: Temos que P( Z < 0.5 – 0.56 1.5248 .2258 Obtemos: P( Z > 0.6 ) = 0.8212 2.97% zxi = 1.e.2258 = 0.6 ) = 0.5 e P( 0 < Z < 0.2810 .3212= 0.3212 Obtemos: P( Z > 0.92) = 0. que nota deveria ser o ponto de corte para a seleção? Devemos inicialmente determinar os valores da variável de distribuição reduzida.92) Como: 0 0.00%.6) DISTRIBUIÇÕES BINOMIAL E NORMAL A probabilidade procurada corresponde à parte hachurada da figura: Temos que P( Z > 0.2742 1. 0.6 ) = P( Z > 0) .5= 9.92 P( Z < 0) = 0.8. Assim: Temos que zxi deve conter todos os valores menores que o ponto de corte que é de 10. devemos encontrar o valor de z que represente 40% dos valores maiores que a média (0.6) Como: 0 0. Admitindo-se que 500 alunos de um curso de pós-graduação estão distribuídos normalmente em torno de um grau final de curso 8.5 e P( 0 < Z < 0. s +X 0 zxi logo: xi = 1.28 .5 e com desvio padrão de 0.92 ) = P( Z < 0) + P( 0 < Z < 0. 40.

como o peso corporal. 24a e Fig. incluindo as correlações parciais. que quanto mais próxima de uma reta. Portanto.00. conforme a Fig. existe uma variável critério (ou dependente) e uma variável preditora (ou independente). Freqüentemente um pesquisador está interessado no grau de relacionamento entre variáveis. conforme as Fig.00 (correlação perfeita) tanto na direção positiva quanto na negativa. como quando alguém investiga o relacionamento entre um critério (variável dependente) tal como força muscular e duas ou mais variáveis determinantes (variáveis independentes). como também três ou mais variáveis (correlação múltipla).00. A correlação é uma técnica estatística utilizada para determinar o relacionamento entre duas ou mais variáveis.Capítulo 6 Correlação e Regressão 6. a significância dos coeficientes correlacionais. a correlação tende a 0. negativa ou nula. formam uma elipse.2 COEFICIENTE DE CORRELAÇÃO DE PEARSON O coeficiente de correlação de Pearson (r) é um valor quantitativo do relacionamento entre duas ou mais variáveis. a correlação pode ser positiva. CORRELAÇÃO POSITIVA Y 145 130 115 100 85 70 55 40 20 30 40 50 60 70 X CORRELAÇÃO NULA Y 145 130 115 100 85 70 55 40 20 30 40 50 60 70 X Y 145 130 115 100 85 70 55 40 20 CORRELAÇÃO NEGATIVA 30 40 50 60 70 X Figura 24a – Correlação positiva Figura 24b – Correlação nula Figura 24c – Correlação negativa . 6. Isso denota independência entre os grupos de escores. O r pode ser calculado pela fórmula: r= n XY – ( X). que não exibem um padrão discernível.00 < r < +1. Nesse tipo de correlação. resistência muscular.1 INTRODUÇÃO Este capítulo discute brevemente vários tipos de correlação. 24b. Quando os escores de cada par ordenado são plotados em um gráfico de dispersão. podendo variar entre 0.1. porcentagem de gordura. bem como o uso de correlações para previsões.00 (correlação nula) e 1. A correlação pode envolver duas variáveis (correlação simples). tais como o relacionamento entre a altura e o peso.( Y) n X² – ( X)² n Y² – ( Y)² De acordo com a força da relação entre as variáveis. . mais perfeita será a correlação entre as variáveis. Quando virtualmente não existe relação entre variáveis. 24c.

e uma grande quantidade da variável X é associada com uma grande quantidade da variável Y. A correlação não é perfeita porque encontramos sujeitos mais leves que são mais fortes do que sujeitos mais pesados. 68998 – 720.58 CORRELAÇÃO E REGRESSÃO Uma correlação positiva existe. Tabela 20 – Cálculo do coeficiente de correlação de Pearson. 299. quando uma pequena quantidade da variável X é associada com uma pequena quantidade da variável Y . O peso corporal e a força muscular estão correlacionados positivamente nos sujeitos mais pesados. 141231 – 2169729 1103968 – 1060560 540160 – 518400 2259696 – 2169729 43408 147. 33760 – 518400 16.5127 .( Y) n Y² – ( Y)² r= r= 16. 7 e 8. CORRELAÇÃO ENTRE FORÇA MUSCULAR E PESO CORPORAL Lb 145 130 115 100 X=92. A Tab.945 r= = r = 0. . 9 e 10. 13 e 14. 1473 16. já que esses são geralmente mais fortes do que os mais leves. i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Peso Força (X) (Y) 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 720 58 68 65 78 80 76 92 90 100 98 103 104 114 112 115 120 1473 XY 1740 2176 2210 2808 3040 3040 3864 3960 4600 4704 5150 5408 6156 6272 6670 7200 68998 X² 900 1024 1156 1296 1444 1600 1764 1936 2116 2304 2500 2704 2916 3136 3364 3600 33760 Y² 3364 4624 4225 6084 6400 5776 8464 8100 10000 9604 10609 10816 12996 12544 13225 14400 141231 Sendo: Cálculo de r n X² – ( X)² n = 16 X = 720 e ( X)²= 518400 Y = 1473 e ( Y)²= 2169729 XY = 68998 X² = 33760 Y² = 141231 r = n XY – ( X).1 85 70 55 40 20 X=45 30 40 50 60 70 Kg figura 25 – Gráfico de dispersão da relação força muscular X peso corporal. 20 apresenta o cálculo de r para as variáveis: peso corporal (X) e força muscular (Y).98107) quase perfeita. como por exemplo os sujeitos: 2 e 3.98107 A Fig. 5 e 6. 25 é uma ilustração gráfica da correlação positiva (r = 0.

o peso corporal pode fornecer uma tendência. 26 é uma ilustração gráfica da correlação positiva (r = – 0.99579) quase perfeita.59 CORRELAÇÃO E REGRESSÃO Uma correlação negativa existe. desta forma. CORRELAÇÃO ENTRE PESO CORPORAL E FLEXÕES NA BARRA Nr 21 18 15 12 X=9. indicando freqüentemente que pessoas mais pesadas tendem a executar um número menor de barras do que as pessoas mais leves. 154 16.21 apresenta o cálculo de r para as variáveis: peso corporal (X) e flexão na barra (Y).( Y) n Y² – ( Y)² r= 16. 11350 – 1400. Tabela 21 – Cálculo do coeficiente de correlação de Pearson.99579 A Fig.6 9 6 3 0 45 55 X=45 65 75 85 95 105 115 125 Kg figura 26 – Gráfico de dispersão da relação peso corporal X flexões na barra.585 r= r= = r = 0. 92. A flexão na barra é executada pela suspensão do peso corporal até o queixo passar acima da barra. 131000– 1960000 16. e uma grande quantidade da variável X é associada com uma pequena quantidade da variável Y. 2018 – 23716 181600 – 215600 2096000 – 1960000 32288 – 23716 – 34000 368. A Tab.782 . i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Peso (X) 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 1400 Flexões (Y) 20 18 16 15 14 13 12 10 8 7 6 5 4 3 2 1 154 XY 1000 990 960 975 980 975 960 850 720 665 600 525 440 345 240 125 11350 X² 2500 3025 3600 4225 4900 5625 6400 7225 8100 9025 10000 11025 12100 13225 14400 15625 131000 Y² 400 324 256 225 196 169 144 100 64 49 36 25 16 9 4 1 2018 Sendo: Cálculo de r n X² – ( X)² n = 16 X = 1400e ( X)²= 1960000 Y = 154 e ( Y)²= 23716 XY = 11350 X² = 131000 Y² = 2018 r = n XY – ( X). quando uma pequena quantidade da variável X é associada com uma grande quantidade da variável Y . .

4227 é significante com 20 gl. dever-se-ia levar em consideração outras variáveis que provavelmente tenham correlação com o resultado do tiro. Por exemplo. simplesmente. Por outro lado.99579). vemos que é necessária uma correlação de 0.2 = 16 . necessariamente.1946 é significante com 100 gl. Pesquisadores inexperientes (ou desatentos) talvez concluíssem que quanto maior o posto/graduação. Para o exemplo de correlação entre o peso corporal e as flexões na barra (r = – 0. Não se pretende dizer que uma variável não possa ser a causa de outra. 6. e ler a tabela de acordo com os graus de liberdade (gl) adequados [gl são baseados no número de sujeitos (n) corrigidos para tendências amostrais (2 variáveis)]. gl= n -2 . tais como: experiência do atirador (quanto mais se pratica melhor tende a ser o resultado) e o “ nervosismo” do atirador (com a prática prolongada o atirador tende a ficar menos nervoso durante a performance. Desta forma.5742 no nível 0. e 0.2 = 14. os graus de liberdade são n . Ao ler-se a tabela no gl 14. r = 0.4 INTERPRETAÇÃO DE “ r” Existem muitas formas de se interpretar o r. . deve-se entender o que significa. e se é positivo ou negativo.2500 é significante com 60 gl. Para tal.60 6. A única forma de demonstrar uma causa é com um experimento no qual uma variável independente pode ser manipulada para produzir um efeito.01.98107 é significante. satisfatório ou insatisfatório. O nível significância pode ser estabelecido por meio de cálculos matemáticos ou. bastaria que promovêssemos todos os recrutas ao posto de coronel para que só houvesse excelentes atiradores de pistola no Exército (parece lógico?!).05. que uma variável causa a outra. A correlação necessária para um determinado nível de significância diminui com o aumento do número de sujeitos. logo.3 CORRELAÇÃO E CAUSA CORRELAÇÃO E REGRESSÃO Uma correlação entre duas variáveis não significa. consultando a Tabela “ r” (Anexo VI). (onde n refere-se ao número de pares de escores).05 ou 0. Logo se pode concluir que uma correlação de r = – 0. (Explicaremos teste uni-caudal ou bi-caudal na seção sobre a interpretação de t no Volume II).05. No nível 0. que. que representa a probabilidade de obter-se uma relação similar se o estudo fosse repetido n vezes. sendo um dos critérios sua significância (confiabilidade).01). Além de se verificar o valor de r. em termos de ser alto ou baixo. coeficientes de correlação muito baixos podem ser significantes para uma amostra ampla de sujeitos. melhorando seu resultado). podemos citar um estudo que pretendesse verificar a relação entre o posto/graduação de militares e seu desempenho no tiro prático de pistola. tais como 0.01 do que no nível 0. para r. melhor seria o resultado no teste de tiro prático de pistola.4863 para a significância de um teste bi-caudal no nível 0. uma maior correlação é exigida para a significância no nível 0.5 (e 0. e as variáveis intervenientes podem ser controladas. No exemplo ilustrativo acima. deve-se selecionar o nível desejado. uma correlação de 0. mas que não se pode inferir somente com o resultado de uma correlação. Muito provavelmente encontraríamos capitães com muito bons resultados e recrutas com péssimos resultados.

09. fica evidente que uma relação mais substancial é necessária para explicar uma grande quantidade de variação comum. e 51% (1. e 0. uma correlação maior é exigida para a significância no nível 0.900 0.0 .01.500 0. ou devida à variação na outra medida. . porque a distribuição de amostras dos coeficientes de correlação não é normal. pelo acaso. esperasse cometer este erro somente uma vez a cada 100 experimentos devido ao acaso. Uma correlação de 0.81. Com uma correlação de 0.400 0.600 0. No nível 0.300 Explicada 81% 64% 49% 36% 25% 16% 9% Variação Não Explicada 19% 36% 51% 64% 75% 84% 91% O tamanho comparativo das correlações devidas ao coeficiente de determinação também pode ser observado.70.5 TRANSFORMAÇÃO “ Z” DO “ r” Um pesquisador pode estar interessado em determinar a média de duas ou mais correlações. 6.90 não é simplesmente três vezes maior do que uma correlação de 0. então 64% da performance em um teste são associados com. O critério mais comumente usado para a interpretação de r . que indica a porção da variação total em uma medida que pode ser explicada. ou explicados pelos.00 . ou 81%).900²= 0. é o coeficiente de determinação (r2). assumiria-se a possibilidade de se rejeitar a hipótese nula (de que não existe relação).300² = 0.80.70 entre duas variáveis. A variação não explicada (1.05. A Estatística pode responder se os efeitos são confiáveis. o teste de significância no nível 0.05 significa que se 100 experimentos fossem conduzidos. É estatisticamente insuficiente tentar calcular a média dos coeficientes por eles mesmos. somente em 5 das 100 ocasiões.700 0.30. existe 49% de variação comum (explicada). Se r = 0.r2) refere-se à variação em uma variável (dependente) que não ocorre em função da manipulação da outra variável (independente). é nove vezes maior (0. Para uma correlação de 0. Quando se utiliza o coeficiente de determinação para interpretar os coeficientes de correlação.61 CORRELAÇÃO E REGRESSÃO O nível 0. ou 9%.01. fatores envolvidos na performance do outro teste.800 0. A Tabela 22 apresenta a relação entre o coeficiente de correlação e as variações explicadas e não explicadas um breve exemplo Tabela 22 – Relação entre r e as variações explicadas e não explicadas r 0. e se eles são significantes.01 é mais preciso do que no nível 0. apenas cerca da metade (49%) da variação (ou influências) em um teste é associada com a outra. Logo.702) de variação de erro (não explicada).0. portanto. pois quanto maior for a correlação mais desviada se torna a distribuição. conforme sua significância. e.

Uma comparação de diferenças poderia ser feita utilizando um teste de qui-quadrado para os valores de Z com contrapeso (o qui-quadrado é uma técnica não-paramétrica discutida no Volume 2).020 0. Suponha. Todavia.007. por exemplo. Tabela 23 Cálculo da média dos coeficientes de correlação (transformação Z).886 Passos da utilização dos valores Z para o cálculo da correlação média. Grupo etário 18-25 26-33 34-40 41-47 n 33 35 34 35 r 0. a. d.010 38. basta utilizar a Tabela para transformação de r para z.204 1.528 31. que nesse processo é n – 3. Alguns autores afirmam que para calcular a média das correlações pela transformação Z. não necessitamos utilizar a fórmula de Fisher para calcular as transformações.007 o r médio é 0. .929 = n-3 30 32 31 32 125 Z com peso 26.835 0. Para combinarmos essas correlações de amostras a fim de se obter uma estimativa válida e confiável da relação entre essas duas variáveis. converter o valor médio do Z contrapesado a uma correlação média consultando-se novamente a Tabela para transformação de r para z. e. A transformação Z é também utilizada para os testes estatísticos (tais como aqueles para a significância do coeficiente de correlação) e para determinar a significância da diferença entre dois coeficientes de correlação. contrapesar os valores Z multiplicando-os pelos graus de liberdade para cada amostra. Z = 1.728 125. deve-se primeiro estabelecer que não existem diferenças significativas entre as correlações testadas. b.62 CORRELAÇÃO E REGRESSÃO O método mais satisfatório de aproximação da normalidade de uma distribuição de amostras de relações lineares é pela transformação dos r para valores Z (transformação Z de Fisher).765. Tal procedimento envolve o uso de logaritmos naturais. que obtivemos correlações entre a distância percorrida e a freqüência cardíaca durante a corrida do TAF (correr-caminhar por 12 minutos) em quatro grupos de sujeitos de diferentes de idades.770 0.620 29.867 1. converter cada correlação para um valor Z utilizando a Tabela para transformação de r para z (Anexo VII). c. somar os valores contrapesados de Z. calcular a média do valor Z dividindo-se pela amostra total [ (n-3)]: 125. devese proceder conforme a Tab. localizando o valor Z correspondente para qualquer coeficiente de correlação em particular.735 Z 0. 23.886/125 = 1.700 0.

98107 . Utilizando os dados da Tab. em função de uma variável independente. As médias e os desvios-padrão são os seguintes: Medida X S r Peso 45. Quanto mais alta for a relação entre as duas variáveis.00 a = 2. Sempre que se deseja estudar determinada variável dependente (sobre a qual deseja-se fazer uma estimativa) .995.00 9.63 6.100 Y = 201. Geralmente utilizam-se as fórmulas abaixo descritas para o cálculo da linha de melhor ajustamento (reta de regressão) Y= a+bX Sendo: a = Xy – bXx b= r (Sy/Sx) Onde: Y = variável dependente (critério) a = o ponto de intersecção b = a inclinação da linha de regressão X = variável independente (preditor) Xy e Sy = média e desvio padrão de y Xx e Sx= média e desvio padrão de x r = correlação entre X e Y Quadro 22 – Fórmula da regressão linear A letra a da fórmula de regressão indica a intersecção da linha de regressão no eixo y.285 + 1.285 + 1.X Quadro 23 – Cálculo da equação de regressão linear Para qualquer peso corporal (X). o qual chamaremos de erro de predição. peso corporal (X) e força muscular (Y). ou seja a correlação não é perfeita.522) b = 1. podemos calcular o escore de força muscular (Y) predito.285 Logo : Y = 2.995 a = Xy – bXx = 92.06 . Deste modo é possível dizer que existe um erro na estimativa de Y a partir de X.onde a correlação entre o peso corporal (X) e força muscular (Y) foi r = 0.361 0.995. A inclinação da linha (b) significa a quantidade de mudança em Y que acompanha uma mudança de 1 unidade de X. (19.361/9. a é o valor de Y quando X = 0.285 + 1.1.785 Quando prevemos a força muscular a partir do peso corporal a correlação (r = 0.98107.995 . .522 0. utiliza-se uma equação de predição (regressão) baseada na correlação entre X e Y.06 19.6 REGRESSÃO LINEAR CORRELAÇÃO E REGRESSÃO Um dos propósitos da correlação pode ser a previsão. 45. mais precisamente poder-se-á prever Y a partir de X. Por exemplo.X = 2. 20.98107 Força 92. Em outras palavras.00.98107 Sendo: Y= a+bX Onde: b = r (Sy/Sx)= 0. um sujeito pesando 100 Kg teria um escore Y (força predita): Y = 2.98107) é menor do que 1.995.

1 80 60 40 20 a= (0. Ao mesmo tempo.99Kg.30 = 62. e um baixo (30kg) e aplicamos a fórmula de predição. vemos que existe algum erro na predição. Lb Kg CORRELAÇÃO ENTRE FORÇA MUSCULAR E PESO CORPORAL 120 100 X=92. O escore de força previsto para o sujeito de 60kg foi de 121.64 CORRELAÇÃO E REGRESSÃO 6. predize-se Y= 2. 25 mostra que a dispersão dos escores de peso e força não forma uma linha reta.995.285) 0 0 20 40 X=45 60 80 100 120 Kg Figura 27 – Regressão linear da relação força muscular X peso corporal. Se computássemos todos os escores residuais. . Para tal pode-se eleger um escore X alto (60Kg). mas em torno da mesma. Essas diferenças entre o escore Y previsto e o real representam erros de predição e são chamados de escores residuais. 27 mostra essa linha de melhor ajustamento.99Kg. mais próximos da linha de melhor ajustamento estarão os escores plotados.285 + 1. Conseqüentemente.995. uma diferença de -1. pode-se notar que os escores não se situam na linha reta. devemos calcular uma linha de melhor ajustamento para prever Y a partir dos escores X. uma diferença de – 4. Para um peso corporal de 30Kg. Quanto mais próximo da perfeição estiver o nível de correlação entre as variáveis X e Y. 2.x). Para um peso corporal de 60kg.285 + 1. esperava-se que o sujeito de 30Kg obtivesse 62. prediz-se Y = 2.60= 121.14Kg no dinamômetro.14Kg. Na construção dessa linha de melhor ajustamento. e na verdade ele obteve 58Kg. a média seria zero e o desvio-padrão seria o erro de predição padrão. selecionamos um alto peso corporal (60) e um peso corporal baixo (30) e predizemos seus valores Y Quando examinamos seus valores Y reais. mas ele obteve apenas 120Kg.7 LINHA DE MELHOR AJUSTAMENTO E ERRO DE PREDIÇÃO A Fig. mas sim uma elipse. Desta forma. ou erro de estimativa padrão (Sy. plotar esses dois valores previstos no gráfico de dispersão e conectá-los com uma linha reta. Essa linha passa pela intersecção das médias X e Y A Fig.14. Deve-se então.99.

995.50 = 102.013759 Sy. O erro de predição padrão é interpretado da mesma forma que o desvio-padrão.x= 2.0.x ) em 95.8 CORRELAÇÃO PARCIAL Quando existe pouca ou nenhuma correlação entre duas variáveis X e Y. Por exemplo.x ) em 99.x = 19.98107 1-r² Logo: Sy. mais ou menos o erro de estimativa padrão. menor será o erro.02 Kg (Y + 3Sy. ocorrerá aproximadamente 68 vezes em 100. Este intervalo é chamado de “ amplitude de predição” Quanto maior a correlação.x = erro de predição padrão Sy = desvio padrão de Y r = correlação entre X e Y Quadro 24 – Fórmula do erro de predição padrão (Sy. . positiva e provavelmente alta.04 Kg mais ou menos o erro de predição.x = 19.65 CORRELAÇÃO E REGRESSÃO Uma forma mais simples de se obter o erro de predição padrão é utilizar a fórmula Sy.x = Sy 1-r² Sendo: Sy. Além disso. a correlação entre duas variáveis como resultado no tiro prático de pistola dos sujeitos e seu posto/graduação será. quanto menor o desvio padrão do critério. Sendo: Sy. quase certamente.36 Kg (Y + 2Sy.38 Kg e 104. e pode ser difícil de interpretar. que não seja causada por sua dependência comum a uma terceira variável Z.361 .x ) em 68. Ao medirmos a força muscular de um sujeito de 50Kg.06 Kg e 110. em função do fator experiência no esporte (anos de prática) com o qual elas estão altamente correlacionadas.44% dos casos. O valor predito (força) de um sujeito.26% dos casos.74% dos casos.x). 6.72 Kg e 107.66 Quadro 25 – Cálculo de Sy. em uma ampla faixa etária (18 a 47 anos).x para força muscular X peso corporal.70 Kg (Y + Sy. um sujeito de 50Kg teria uma força predita de Y = 2.361 1 . provavelmente encontraremos uma força muscular variando: entre 99.98107 Sy. Para o exemplo utilizado até o presente momento.361 e r = 0. menor será o erro de predição. e entre 94. entre 96. . a correlação entre X e Y é algumas vezes equivocada.x = Sy Onde: Sy = 19.285 + 1.

Logo.765.0. . Quando o efeito da terceira variável (experiência) é removido. o que significa que a correlação entre as duas variáveis é devida à influência comum de uma outra variável (experiência no esporte).850 1 .3 r2.017 0.9 REGRESSÃO MÚLTIPLA A regressão múltipla consiste em uma variável dependente (usualmente um critério de algum tipo) e duas ou mais variáveis preditoras (variáveis independentes).068 Quadro 26 – Fórmula e cálculo da correlação parcial.47497 . ou eliminar-se os efeitos da idade estatisticamente mantendo-a constante.3 o qual significa a correlação entre as variáveis 1 e 2 com a variável 3 mantida constante Lembremos novamente a correlação entre o resultado do tiro prático de pistola e o posto/graduação do sujeito. tendo em vista que o uso de mais de uma variável preditora. Esse é um exemplo de correlação espúria.748 0. Sendo: r12.r1.3 = r12. A correlação parcial é principalmente utilizada no desenvolvimento de equações de regressão múltipla com duas ou mais variáveis preditoras. a correlação pode diminuir muito se a variabilidade causada pelas diferenças de experiência for eliminada.2256 0.3 = r12.3 é a correlação parcial entre as variáveis 1 e 2. 6.2775 0.765 – 0. e 3 = experiência (anos de prática). 2 = posto /graduação.66 CORRELAÇÃO E REGRESSÃO Na verdade. r13 = 0.880. Podemos ajustar alguns coeficientes de correlação entre três variáveis: r12 = 0. r12. .880 .850. 0. podendo-se controlar esse fator por meio de duas formas: selecionar apenas sujeitos da mesma idade. a correlação entre o resultado do tiro prático de pistola e o posto/graduação diminui ou desaparece completamente.880² 1.0. Caso se desejasse predizer a capacidade de um atirador dever-se-ia analisar a correlação de várias habilidades inerentes ao tiro para se predizer a sua performance com o decorrer dos anos de prática.3 = 0.850 Correlação entre 1 e 2 Correlação entre 1 e 3 Correlação entre 2 e 3 r12. com 3 sendo mantida constante. Chamaremos as três variáveis a seguir: 1 = resultado no tiro prático de pistola.765 .0. e r23 = 0.850² 0. 0. O símbolo para a correlação parcial é r12. ou seja utilizando vários preditores ao invés de apenas um.3 = 1-r23² Logo: r12.3 1-r13² Onde: r12 = 0. Pode-se notar que a correlação entre o resultado do tiro prático de pistola e o posto/graduação cai à cerca de zero quando a experiência do atirador é isolada.880 r23 = 0.3 = 0. usualmente aumenta a precisão da predição.52678 r12.765 r13 = 0.

são excluídas. Algumas vezes o pesquisador irá determinar um nível de probabilidade para entrada.. a seleção de variáveis adicionais é determinada pelo efeito combinado. como 0. Segue-se então que R2 representa a quantidade de variância do critério que é explicada pela associação/combinação dos preditores (mesmo conceito do coeficiente de determinação r2).67 CORRELAÇÃO E REGRESSÃO O coeficiente de correlação múltipla (R) indica a relação entre um critério e o somatório dos pesos suas variáveis preditoras. Inicia-se com todas as variáveis independentes e exclui-se aquelas que não contribuem significativamente para a predição do critério. portanto é importante saber o quanto cada um dos mecanismos de predição contribui para a variação total explicada. No método de regressão múltipla regressiva. diferindo apenas na existência de mais de uma variável X. Em outras palavras.. as variáveis são acrescentadas até que elas não possam mais aumentar de forma significativa a predição do critério. Dessa forma. O R2 máximo é o método no qual o chamado melhor de todos os modelos possíveis de urna única variável é selecionado. Existem vários métodos de regressão múltipla.05 ou 0.05 ou 0. não apenas pelo efeito aditivo. encontrando as variáveis que melhor reduzirão os erros de predição. Se uma variável independente não contribui. a regressão múltipla regressiva. Após o primeiro passo. a regressão múltipla progressiva. Ao utilizarmos R. a inclusão de ambas não é melhor do que utilizar apenas uma. Sempre que duas variáveis possa estar medindo a mesma coisa. progressivamente.o método do R2 máximo e o método de regressão gradativa O método de regressão múltipla progressiva consiste em adicionarmos.01. ela é então excluída (removida) da combinação linear. significando que a soma residual de quadrados constitui erro. Determina-se um nível de probabilidade para entrada.+biXi . assim como o melhor modelo de duas variáveis. e as variáveis que não alcançam o nível de significância. o processo identifica qual das variáveis preditoras restantes explicará a maior quantidade de variação inexplicada. Neste manual abordaremos apenas as mais comumente utilizadas. As variáveis devem ser introduzidas conforme a sua importância e o processo termina quando não existe mais uma contribuição significativa para a predição. as variáveis independentes são eliminadas por sua falta de importância. o processo leva em consideração as inter-relações entre as variáveis X. até um critério predeterminado que termina quando o cálculo é alcançado. como 0. O método de regressão gradativa é um procedimento de regressão similar à seleção progressiva exceto pelo fato de que a cada passo todas as variáveis independentes são avaliadas para se verificar se cada uma continua contribuindo para a predição.01. A equação de predição da regressão múltipla segue o modelo de regressão de duas variáveis (Y = a + bX). uma nova variável preditora. o melhor modelo de três variáveis e assim por diante. desejamos encontrar a combinação de variáveis que fornecerá a predição mais precisa do critério. A primeira variável selecionada deve ser aquela com a maior correlação com o critério. As variáveis selecionadas produzem cumulativamente a soma residual mínima de quadrados. conforme a equação: Y= a+ b1X1+ b2X2+. Após cada variável X ser introduzida.

mais precisa será a predição. Todavia. e a razão entre o número de sujeitos versus o número de variáveis. Ao selecionarmos o número de sujeitos de uma amostra devemos tomar o cuidado de observar a razão R2 = k . Os resultados de uma fórmula de predição para adolescentes provavelmente perderiam muita precisão se aplicada em adultos. O termo especificidade de população também se relaciona a esse fenômeno. uma limitação da predição relaciona-se com a generalização das constatações. pois as equações de regressão desenvolvidas por uma amostra. pois ao buscarmos uma maior precisão por meio de procedimentos de seleção das variáveis preditoras (o que reforça as características específicas da amostra).1 / n – 1. Existe uma relação direta entre a correlação. o pesquisador deve selecionar cuidadosamente uma amostra em relação à população para a qual os resultados deverão ser generalizados. quanto maior a amostra. o que chamamos de redução. Um grande problema com pequenas amostras em estudos de regressão múltipla é que a correlação pode ser espuriamente alta. freqüentemente perdem em precisão quando aplicadas a outras amostras. tornamos mais difícil a generalização dos achados para outras populações.68 CORRELAÇÃO E REGRESSÃO A premissa básica em uma regressão múltipla é a mesma que na regressão linear simples. Em estudos de previsão. Quanto maior a correlação. . Assim. Por fim. é recomendável manter-se uma razão de 10 sujeitos ou mais para cada variável. mais provavelmente ela representará a população da qual foi retirada. ou seja. O grau no qual o valor esperado de R2 excederá zero quando é zero na população depende de dois fatores: o tamanho da amostra (n) e o número de variáveis (k). o tamanho da correlação entre as variáveis de estudo.

Box & Ordinal. Mais Séries. DISTRIBUIÇÃO NÃO-NORMAL . Desvio Padrão. DISTRIBUIÇÃO NORMAL . Mediana. Máximo. Primeiro Quartil. Série de Distribuição). Terceiro Quartil. Ogiva (Função de Razão Mediana.69 ANEXO I ESTATÍSTICA DESCRITIVA ANEXOS O quadro abaixo indica os tipos de técnicas estatísticas que podem ser aplicadas para a descrição de conjuntos de dados para se obter um resumo ou descrição geral deles. Distribuição). Mais Séries. . Gráfico de Nominal Freqüências. Série Temporal*. Uma ou Pictograma. Mínimo.ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de Escala Análises Aplicáveis Gráficos Aplicáveis Amostras Numérica Média. Box & Ordinal. Temporal*. Mais Séries. Série Temporal*. Coeficiente Histograma. Desvio Padrão. Gráfico de Intervalar ou Mínimo. Ogiva (Função Razão Terceiro Quartil. * Quando uma das variáveis registradas for o tempo. de Variação. Intervalo de Uma ou Whiskers. Coeficiente de Variação. Histograma. Gráfico de Intervalar ou Confiança. Intervalo de Confiança. Primeiro Quartil. Uma ou Whiskers. Moda. Moda.ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de Escala Análises Aplicáveis Gráficos Aplicáveis Amostras Numérica Média. Máximo. * Quando uma das variáveis registradas for o tempo.

Intervalar ANOVA de Kruskal-Wallis Amostras ou Razão Três ou Mais Nominal Teste de Qui-Quadrado Amostras * Variável com apenas dois valores ou duas categorias (variável binária).ESTATÍSTICA DESCRITIVA E GRÁFICOS Tipo de N° de Amostras Escala Numérica Análises Aplicáveis Relação Duas Amostras Intervalar ou Razão Teste t de Student Pareado Pareadas Três ou Mais Intervalar ou Razão ANOVA c/ Medidas Repetidas Amostras Duas Amostras Intervalar ou Razão Teste t de Student Não-Pareadas Três ou Mais ANOVA c/ Grupos Intervalar ou Razão Amostras Independentes * Variável com apenas dois valores ou duas categorias (variável binária).ESTATÍSTICA DESCRITIVA E GRÁFICOS Tipo de N° de Amostras Escala Numérica Análises Aplicáveis Relação Ordinal. Intervalar ANOVA de Friedman Amostras ou Razão Três ou Mais Nominal Teste Q de Cochran Amostras Teste Mann-Whitney U. DISTRIBUIÇÃO NÃO-NORMAL . Intervalar Wolfowitz Runs Test. WaldOrdinal. Duas Amostras ou Razão Wilcoxon Matched-Pairs Test Nominal Duas Amostras Teste de McNemar Dicotômica* Pareadas Três ou Mais Ordinal.70 ANEXO II COMPARAÇÕES ENTRE AMOSTRAS ANEXOS O quadro abaixo indica as técnicas estatísticas que podem ser aplicadas para a comparação entre os parâmetros de dois ou mais grupos de dados. DISTRIBUIÇÃO NORMAL . Intervalar Teste de Friedman. . Sign-Test. Duas Amostras ou Razão Kolmogorov-Smirnov TwoSample Test Teste de Qui-Quadrado Duas Amostras Nominal Não-Pareadas (Homogeneidade) Três ou Mais Ordinal.

Três ou Nominal Análise Discriminante --Mais Regressão Linear Três ou Intervalar e/ou Razão Múltipla.Y). Dispersão (X. Mais Observação Regressão Linear Três ou Intervalar e/ou Razão Múltipla.71 ANEXO III RELAÇÃO ENTRE VARIÁVEIS ANEXOS O quadro a seguir mostra as técnicas analíticas e procedimentos gráficos aplicáveis quando se quer verificar a existência e/ou caracterizar as relações entre duas ou mais variáveis. Regressão --Mais Não-Linear Nominal Dicotômica* (VariávelTrês ou --Resposta) e/ou Nominal e/ou Ordinal Regressão Logística Mais e/ou Intervalar e/ou Razão * Variável com apenas dois valores ou duas categorias (variável binária). Diagrama de Duas Intervalar e/ou Razão Regressão Linear Dispersão (X. DISTRIBUIÇÃO NORMAL .ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de Gráficos Escala Numérica das Variáveis Análises Aplicáveis Variáveis Aplicáveis Correlação de Diagrama de Duas Ordinal e/ou Intervalar e/ou Razão Spearman.ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de Gráficos Escala Numérica das Variáveis Análises Aplicáveis Variáveis Aplicáveis Correlação de Pearson.Y). Diagrama Três ou Intervalar e/ou Razão Regressão Múltipla Previsão vs. --Três ou Correlação Partial Rank Diagrama de Ordinal e/ou Intervalar e/ou Razão Mais de Kendall Dispersão (X. .Y). Simples. Duas Nominal Teste de Qui-Quadrado. Regressão --Mais Não-Linear Nominal Dicotômica* (VariávelTrês ou Resposta) e/ou Nominal e/ou Regressão Logística --Mais Ordinal e/ou Intervalar e/ou Razão * Variável com apenas dois valores ou duas categorias (variável binária). DISTRIBUIÇÃO NÃO-NORMAL .

72 ANEXO IV TABELA DE NÚMEROS ALEATÓRIOS ANEXOS 57720039848441796771402113975649865408932968745483 28805351590993988758702771771706320278621674696517 92591852873048869748352518887403629838586586424103 90381291743019758907506415597188137495305278301175 80911694675860820666904756184645111235324550411343 22017031329691927540165429727499009597610098243007 56241004302046299053531105844121647919762951626066 79449262029686643000945669302059878735442250977819 53996645088978507753372577412762380223576201416035 18928735885505213651392850146685793019797266643145 53085896630561257022504128966266436306630132798522 03588029287689511824888946474859192987031033996712 27078188656949980028047051300147189733218582454324 05210859010622249891811755446616077307661012317858 40361327843082333639694205586461123389278952667193 54602528858820001059610536613372010119016110512091 71516340767111737352373160458892734371280498090248 61020181739260667358533442682638340327449604466593 82559313463095265506961765917239799612495280632699 89985414217413576819862860894733152628774538480808 00998484146795137758901450794273633106604340125504 62415078204805884352980319939203049725849595036331 94279069246809921186076383193299511555710927026700 44892928843628251582877418972576106326760226745328 97307695332110542695666552049936584803089363581796 39165804448015595983909554668184396085388866333569 60781103266750340961313020769366308351093383647605 03192347628957779133884760593754394877674985384391 41285267562539599665513690322239330522990339979699 77549850392537425297100356049281668670014889558210 28634161916424838137344883279638716973067750256460 74244885401233596750149814264279791352896978804471 00240337964668750532421663332897263647277365383446 05414769694536167118955197220413239658600369487983 62698497974723665156130869115275592686818043009892 .

0040 0.9 0.2 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890 2.8 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999 3.0359 0.5 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998 3.7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852 0.5 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441 1.4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319 1.2 4993 4993 4994 4994 4994 4994 4994 4995 4995 4995 3.0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621 1.73 ANEXO V ANEXOS ÁREA SUBTENDIDA PELA CURVA NORMAL REDUZIDA DE 0 A Z z 0 1 2 3 4 5 6 7 8 9 0.5000 0.5000 .5000 0.8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706 1.5000 0.0 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990 3.0080 0.9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767 2.0239 0.8 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981 2.3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916 2.6 4998 4998 4999 4999 4999 4999 4999 4999 4999 4999 3.0199 0.7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974 2.7 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999 3.5000 0.3 4032 4049.3 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997 3.6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964 2.5000 0.3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517 0.0 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389 1.1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0754 0.0 0.2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015 1.0279 0. 4066 4082 4099 4115 4131 4147 4162 4177 1.8 2881 2910 2939 2867 2996 3023 3051 3078 3106 3133 9.6 4452 4463 4474 4484 4496 4505 4515 4525 4535 4545 1.5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224 0.0 4772 4778 4783 4788 4793 4798 4803 4808 4812 4817 2.4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879 0.5000 0.0319 0.7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633 1.1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830 1.0160 0.4 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998 3.6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549 0.1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857 2.9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986 3.5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952 2.0000 0.0120 0.2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141 0.5000 0.5000 0.4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936 2.5000 0.1 4990 4991 4991 4991 4992 4992 4992 4992 4993 4993 3.

5742 0.4821 0.6851 0.4575 0.001 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100 0.9000 0.4896 0.5487 0.8329 0.3568 0.2500 0.4259 0.9172 0.7084 0.3541 0.1829 0.3810 0.5974 0.9249 0.3246 0.6524 0.6581 0.7603 0.2746 0.4438 0.2422 0.5923 0.4973 0.8114 0.4555 0.3384 0.3494 0.5494 0.3721 0.3578 0.6120 0.5214 0.4683 0.6226 0.3044 0.4093 0.5760 0.3799 0.2319 0.4869 0.7348 0.9343 0.6339 0.4973 0.4409 0.6664 0.74 ANEXO VI ANEXOS VALORES CRÍTICOS DOS COEFICIENTES DE CORRELAÇÃO (TABELA r ) 0.3598 0.2960 0.2172 0.6411 0.7420 0.9800 0.1638 0.2428 0.05 0.3783 0.2875 0.0000 0.4921 0.5155 0.5577 0.7293 0.025 0.5751 0.2301 0.7246 0.4648 0.7067 0.2565 0.4227 0.6932 0.8233 0.7887 0.2573 0.4433 0.9507 0.8982 0.2732 0.3375 0.9912 0.1946 0.6055 0.3887 0.9900 0.5189 0.3233 0.6021 0.3248 0.5139 0.6652 0.9741 0.7498 0.9587 0.2948 0.6614 0.3809 0.7800 0.6835 0.9995 0.2306 0.4078 0.2830 0.9969 0.8471 0.10 0.9990 0.3218 0.9500 0.9999 0.5285 0.8343 0.4124 0.5614 0.01 0.2540 1.5897 0.7646 0.05 df n – 2 Nível de significância para teste caudal 0.4329 0.8783 0.8745 0.6694 0.5541 0.7079 0.2737 0.5324 0.6319 0.7155 0.4182 0.4000 0.1954 0.6787 0.5529 0.9877 0.2108 0.3211 .1726 0.005 0.01 0.5368 0.5425 0.7977 0.8822 0.5822 0.2050 0.2673 0.8721 0.3932 0.5034 0.8010 0.0005 Nível de significância para teste bicaudal 0.7545 0.3017 0.02 0.4762 0.4487 0.8054 0.3687 0.6215 0.4451 0.

265 0.829 0.665 0.800 0.580 0.157 1.557 1.645 0.100 0.282 0.025 0.625 0.605 0.040 0.208 0.075 0.960 0.221 1.238 1.156 0.280 0.767 0.555 0.288 0.350 0.035 0.466 0.225 0.918 0.136 0.256 1.315 0.670 0.445 0.965 0.560 0.071 1.626 0.640 0.142 1.055 0.520 0.950 0.070 0.575 0.611 0.355 0.345 0.655 0.705 0.595 Z 0.720 0.685 0.151 0.499 1.430 0.758 0.015 0.185 2.304 0.678 0.000 0.525 0.590 0.360 0.293 0.220 0.085 0.867 0.335 0.517 0.370 0.515 0.127 1.390 0.840 0.141 0.348 0.887 0.100 0.975 0.435 0.070 0.647 2.080 0.984 0.900 0.490 0.360 0.395 Z 0.010 0.620 0.550 0.549 0.008 1.623 1.648 0.255 0.120 0.996 1.365 0.315 0.685 r 0.720 0.760 0.725 0.354 1.213 0.600 0.945 0.200 0.886 1.985 0.650 0.030 0.615 0.710 0.425 0.182 0.198 r 0.980 0.388 0.670 0.058 1.701 0.784 0.394 0.790 0.870 0.556 0.146 0.274 1.436 0.337 0.020 1.275 0.310 0.535 0.709 0.105 0.330 0.150 0.455 0.733 0.805 0.165 0.215 0.717 0.406 0.383 0.010 0.815 0.332 0.400 0.693 0.030 0.472 0.430 0.424 0.333 1.020 0.895 0.848 0.590 0.995 ANEXOS Z 1.440 0.261 0.655 0.447 1.565 0.940 0.523 0.528 1.230 0.245 0.192 0.005 0.085 r 0.105 0.365 0.990 0.298 2.820 0.940 0.204 1.832 1.472 1.385 0.811 0.545 0.725 0.126 0.055 0.585 0.775 0.014 2.188 1.025 0.600 0.121 0.285 0.239 0.015 0.935 0.680 0.510 0.099 1.505 0.410 0.478 0.320 0.745 0.380 0.697 1.540 0.838 0.658 1.530 0.75 ANEXO VII TABELA PARA TRANSFORMAÇÃO DE r PARA Z r 0.205 0.570 0.140 0.946 2.491 0.994 .075 0.589 1.962 0.377 0.845 0.145 0.835 0.618 0.234 0.543 0.630 0.915 0.970 0.530 0.850 0.475 0.497 0.583 0.172 0.250 0.635 0.897 0.218 0.695 0.955 0.260 0.400 0.442 0.905 0.040 0.865 0.536 0.465 0.755 0.880 0.802 0.050 0.973 0.793 0.610 0.855 0.930 0.910 0.130 0.830 0.662 0.035 0.172 1.313 1.305 0.005 0.633 0.185 0.418 r 0.890 0.485 0.785 0.675 0.504 0.640 0.485 0.783 1.405 0.224 0.277 0.371 0.375 0.448 0.167 0.750 0.425 0.885 0.920 0.240 0.175 0.110 0.092 2.270 0.500 0.740 0.045 1.510 0.195 Z 0.020 0.113 1.131 0.354 0.470 0.033 1.050 0.929 0.229 0.877 0.095 0.825 0.570 0.210 0.454 0.925 0.155 0.090 0.770 0.310 0.450 0.090 0.443 2.950 0.765 0.412 0.326 0.415 0.858 0.177 0.321 0.245 0.604 0.235 0.343 0.095 0.775 0.730 0.045 0.300 0.271 0.180 0.460 0.060 0.908 0.293 1.460 0.065 0.738 1.735 0.000 0.660 0.250 0.080 0.860 0.398 1.085 0.266 0.045 0.116 0.810 0.060 0.780 0.576 0.690 0.187 0.563 0.875 0.295 0.715 0.700 0.750 0.125 0.420 0.495 0.161 0.110 0.190 0.290 0.203 0.340 0.115 0.741 0.065 0.135 0.480 0.255 0.299 0.422 1.376 1.795 Z 0.597 0.170 0.

Niterói: EDUFF. Probabilidade: aplicações à estatística. A. GUERRA. GOES. A. Elementos de probabilidades e inferência. 2. W. ed. 17. L. J.. v. 1997. 1940. R. Rio de Janeiro: Editora Fundo de Cultura. v. 1.. B. M. P. PEARSON. A. SILVA. DONAIRES. ed.S. CHACON. São Paulo: Saraiva. ed. 1978. 1984. GUEDES. A.. 1979. New York: Holt. J. Estatística para os cursos de economia. São Paulo: Atlas. E. Estatística geral e aplicada à economia... 1985. São Paulo: Atual. GATTÁS. 2. 2. Estatística aplicada à administração. R. H. 1993.. STEVENSON. Rinehart and Winston FONSECA. M. KARMEL. 5. São Paulo: Atlas. J. Vol. D. SPIEGEL.S. Princípios de estatística. ed. Probabilidade e processos estatísticos. ed. Biometrika tables for statisticians. MORETIN. administração e ciências contábeis. 1969. CRESPO. COCHRAN. MEYER. R. São Paulo: Harbra. M. S. 1976.L. São Paulo: Atlas. GUEDES. São Paulo: Edgard Blücher.A. São Paulo: McGraw – Hill. 1.C. ed. 2001 EDWARDS. São Paulo: Saraiva. G. E. Ribeirão Preto: FUNPEC. Curso breve de estatística. P. 1965.. 1988. W. Estatística indutiva. 3.REFERÊNCIAS BEIGUELMAN. Curso prático de bioestatística. R. D. Statistical Methods. ed. MUROLO. 2.. 1. 2. HARTLEY. DONAIRES. . DISNEY. A. Bioestatísca. O. 3. COSTA NETO. C. MARTINS. 2002. E. L. Londres: Cambridge University Press. Estatística: uma abordagem decisorial. 3.. ed. Curso de estatística. A. J. M. Técnicas de amostragem. M. São Paulo: Atlas. G. Rio de Janeiro: Ao Livro Técnico S. P. L. 2. ed. O. V.L. P. 1965. 1979. São Paulo: Atlas. P. 1986. MARTINS. Estatística. L.. P. H. 1977. 4. Estatística básica. G. SILVA.O. BUSSAB. ed. 1990. G. 1. C. ed. LCT.. A. POLASEK. Estatística. A. E.S. RODRIGUES.. Estatística fácil. Universidad de Duesto. GONÇALVES. 1981. Aumentada. Rio de Janeiro: LTC. W. São Paulo: LCT. Bioestatística. ed. B. ed. A. CLARKE.

Estatística aplicada à economia e administração. 2002. J. Rio de Janeiro: LCT. T.77 REFERÊNCIAS THOMAS.. 3. Métodos de pesquisa em atividade física. H. Porto Alegre: ARTMED. WONNACOTT. . K. ed. NELSON.. 1981. R. R. J. WONNACOTT. J.

Sign up to vote on this title
UsefulNot useful