P. 1
Manual de a Aplicada a Mpc

Manual de a Aplicada a Mpc

|Views: 3.501|Likes:
Publicado porRenata D. S. Salem

More info:

Published by: Renata D. S. Salem on Aug 22, 2011
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

04/29/2013

pdf

text

original

Sections

  • 2.1 INTRODUÇÃO À ESTATÍSTICA DESCRITIVA
  • 2.1.1 VARIÁVEIS QUALITATIVAS
  • 2.1.2 VARIÁVEIS QUANTITATIVAS
  • 2.2 TÉCNICAS DE DESCRIÇÃO GRÁFICA
  • 2.2.1 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUALITATIVAS
  • 2.3 CARACTERÍSTICAS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS
  • 2.3.1 MEDIDAS DE POSIÇÃO
  • 2.3.2 MEDIDAS DE DISPERSÃO
  • 2.3.2.1 A AMPLITUDE TOTAL (AT)
  • 2.3.2.2 A VARIÂNCIA (s2
  • 2.3.2.3 O DESVIO-PADRÃO (s)
  • 2.3.2.4 O COEFICIENTE DE VARIAÇÃO (Cv)
  • 2.3.3 MEDIDAS DE ASSIMETRIA
  • 2.3.4 MEDIDAS DE ACHATAMENTO OU CURTOSE
  • 2.3.5 CONSIDERAÇÕES SOBRE MEDIDAS DE ASSIMETRIA E CURTOSE
  • 3.1 INTRODUÇÃO
  • 3.2 AMOSTRAGEM
  • 3.2.1 AMOSTRAGEM NÃO ALEATÓRIA:
  • 3.2.1.1 AMOSTRAGEM INTENCIONAL
  • 3.2.1.2 AMOSTRAGEM VOLUNTÁRIA
  • 3.2.2 AMOSTRAGEM ALEATÓRIA:
  • 3.2.2.1 AMOSTRAGEM ALEATÓRIA SIMPLES
  • 3.2.2.2 AMOSTRAGEM SISTEMÁTICA
  • 3.2.2.3 AMOSTRAGEM ESTRATIFICADA
  • 3.2.2.4 AMOSTRAGEM POR CONGLOMERADOS
  • 4.1 EXPERIMENTO ALEATÓRIO
  • 4.1.1 ESPAÇO AMOSTRAL (S)
  • 4.1.2 EVENTOS
  • 4.2 PROBABILIDADE
  • 4.2.1 EVENTOS COMPLEMENTARES
  • 4.2.2 EVENTOS INDEPENDENTES
  • 4.2.3 EVENTOS MUTUAMENTE EXCLUSIVOS
  • 4.3.4 PODER
  • 5.1 VARIÁVEL ALEATÓRIA
  • 5.2 DISTRIBUIÇÃO DE PROBABILIDADE
  • 5.3 DISTRIBUIÇÃO BINOMIAL
  • 6.1 INTRODUÇÃO
  • 6.2 COEFICIENTE DE CORRELAÇÃO DE PEARSON
  • 6.3 CORRELAÇÃO E CAUSA
  • 6.4 INTERPRETAÇÃO DE “r”
  • 6.5 TRANSFORMAÇÃO “Z” DO “r”
  • 6.6 REGRESSÃO LINEAR
  • 6.7 LINHA DE MELHOR AJUSTAMENTO E ERRO DE PREDIÇÃO
  • 6.8 CORRELAÇÃO PARCIAL
  • 6.9 REGRESSÃO MÚLTIPLA
  • VALORES CRÍTICOS DOS COEFICIENTES DE CORRELAÇÃO (TABELA r )
  • TABELA PARA TRANSFORMAÇÃO DE r PARA Z

À METODOLOGIA DA PESQUISA CIENTÍFICA, PARA TEMAS MILITARES.

ESTATÍSTICA APLICADA

EsAO

À METODOLOGIA DA PESQUISA CIENTÍFICA, PARA TEMAS MILITARES. Volume 1

ESTATÍSTICA APLICADA

Clayton Amaral Domingues - Cap Art

por

1ª Edição

RIO DE JANEIRO EDITORA EsAO --2004

© 2004 by Domingues, Clayton Amaral.

Diagramação: Clayton Amaral Domingues – Cap Art

Revisão: José Fernando Chagas Madeira – Maj Com Luiz Eduardo Possídio Santos – Cap MB Clayton Amaral Domingues – Cap Art

Dados Internacionais de Catalogação na Publicação (CIP) D 671 Domingues, Clayton Amaral. Estatística aplicada: à metodologia da pesquisa científica para temas militares/ Clayton Amaral Domingues. - Rio de janeiro: EsAO, 2004. 85 p. ; il. ; 21 cm. Inclui Bibliografia 1. Estatística – metodologia. 2 Pesquisa – metodologia. I Título. CDD 310

Escola de Aperfeiçoamento de Oficiais Avenida Duque de Caxias, 2071. Rio de Janeiro/ RJ - CEP 21615-220

........... CAPÍTULO 2 .......................... 2...................................................................2............................................................................................... VARIÁVEIS QUANTITATIVAS..............2 MEDIANA...............................4 O COEFICIENTE DE VARIAÇÃO..............SUMÁRIO 1 2 2............3 2.................................................................. 3. 3.................................................... CAPÍTULO 3 ............................1..3.... 3.....................2............. 3...............................3.......................... 19 19 19 21 23 24 25 25 25 27 28 28 30 31 2..............1 2..............1............................................................... 32 INTRODUÇÃO.AMOSTRAGEM..........2 A VARIÂNCIA.... 2..........................1 MEDIDAS DE ASSIMETRIA.. 2.......3 2.2........................ 3...3............................2.....4 2.... DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS DISCRETAS...................................1....................................3.1.................... ............................................................................................................................... MEDIDAS DE ACHATAMENTO OU CURTOSE.................2..............................2 2....... 32 AMOSTRAGEM.........3........................................... AMOSTRAGEM NÃO ALEATÓRIA...................3............. 2.................2.....3 AMOSTRAGEM ESTRATIFICADA........ MEDIDAS DE POSIÇÃO.2 3...................5 3 3.........................2 AMOSTRAGEM ALEATÓRIA.............................................................................................................3....................2..2 MEDIDAS DE DISPERSÃO............3 2......................................... TÉCNICAS DE DESCRIÇÃO GRÁFICA.... 13 CARACTERÍSTICAS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS..................................3.1........2.........2 AMOSTRAGEM SISTEMÁTICA..............................................1 2..... 2...............2...........3......2........................... 33 33 33 33 33 33 34 34 3... 1 4 4 5 5 6 7 9 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS CONTÍNUAS.................... INTRODUÇÃO À ESTATÍSTICA DESCRITIVA..3... 2..............................1 A AMPLITUDE TOTAL...........1 3........................................................INTRODUÇÃO À CIÊNCIA ESTATÍSTICA....................1........3 O DESVIO-PADRÃO..................................................3 MODA......................................................................3............ CONSIDERAÇÕES SOBRE MEDIDAS DE ASSIMETRIA E CURTOSE.......2........................................................................................................................2......................... 2....... 2....2..................................4 QUARTIS E PERCENTIS............................................. VARIÁVEIS QUALITATIVAS..............................................ESTATÍSTICA DESCRITIVA.....2....... DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUALITATIVAS...1 CAPÍTULO 1 ...................1 MÉDIA.......................2.............................................1......1 2.2................................................3.....................................................................................3.....................1 AMOSTRAGEM INTENCIONAL...........................2....2 2......... 2..........2 AMOSTRAGEM VOLUNTÁRIA....2 2...................1 AMOSTRAGEM ALEATÓRIA SIMPLES....................................1..........

.......4 6 6....................................... DISTRIBUIÇÃO DE PROBABILIDADE.........................................................ÁREA SUBTENDIDA PELA CURVA NORMAL REDUZIDA DE 0 A Z..................5 6......................................CURVA NORMAL.......................................................................... 39 EMPREGO DA PROBABILIDADE PARA COMPROVAÇÃO DE HIPÓTESES.............................2 4.................... 35 4 4...................1 4.....................3.................. 64 ANEXO III ...................................................................................................................VALORES CRÍTICOS DOS COEFICIENTES DE CORRELAÇÃO 74 ANEXO VII TABELA PARA TRANSFORMAÇÃO DE r PARA Z...........................2 5............................1.......................................................................................... 38 38 39 40 41 41 EXPERIMENTO ALEATÓRIO...1 4................................................................................................................................................................................................. CORRELAÇÃO PARCIAL.........................................1 4.................4 AMOSTRAGEM POR CONGLOMERADOS...... VARIÁVEL ALEATÓRIA....ESTATÍSTICA DESCRITIVA................................... DISTRIBUIÇÃO NORMAL ......... CAPÍTULO 6 – CORRELAÇÃO E REGRESSÃO......................................3............................... INTRODUÇÃO.............1 6................................................................ 71 ANEXO V .................................................. SIGNIFICADO................. REGRESSÃO MÚLTIPLA............... ANEXO II ......................................RELAÇÃO ENTRE VARIÁVEIS..............7 6....3 4................................................2.........................................2....6 6.................3 5..........................................................COMPARAÇÕES ENTRE AMOSTRAS..............................................................1 4..... 38 PROBABILIDADE......................... 44 BETA (ERRO TIPO II) ..............2 6...........3........................................................................................................ 60 LINHA DE MELHOR AJUSTAMENTO E ERRO DE PREDIÇÃO...........................8 6.....................3 4................................. CAPÍTULO 5 – DISTRIBUIÇÃO BINOMIAL E NORMAL............................................. 75 ........................ PODER................................................3.........................................................................2.........2 4...................................2.................................. EVENTOS INDEPENDENTES.....2 4... EVENTOS MUTUAMENTE EXCLUSIVOS.....................2 4........... ANEXO I ......................... REGRESSÃO LINEAR..... EVENTOS COMPLEMENTARES..4 5 5......................... COEFICIENTE DE CORRELAÇÃO DE PEARSON.............................4 6... CORRELAÇÃO E CAUSA.................................PROBABILIDADE.... 73 ANEXO VI ................................... DISTRIBUIÇÃO BINOMIAL............TABELA DE NÚMEROS ALEATÓRIOS...............3 4....................................... 43 ALFA (ERRO TIPO I) .........3 6..................2.................................................................... TRANSFORMAÇÃO “Z” DO “r” .1................................................................................9 CAPÍTULO 4 ....3.......................................... ESPAÇO AMOSTRAL ................ 45 46 46 49 49 49 51 55 57 57 57 60 61 63 65 66 69 70 72 INTERPRETAÇÃO DE “r” ............. EVENTOS.......1 5................... ANEXO IV ..........................................................

Neste contexto. A Estatística Descritiva na sua função de organização e descrição dos dados tem as seguintes atribuições: A obtenção dos dados estatísticos é feita normalmente através de questionário ou de observação direta de uma população ou amostra. para realizar-se a análise e interpretação dos dados observados. que cuida da análise e interpretação dos dados. A redução dos dados .O entendimento e a compreensão de grande quantidade de dados através da simples leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador. A Estatística Descritiva apresenta duas formas básicas para a redução do número de dados com os quais devemos trabalhar. uma ciência meio que tem utilidade em outros variados campos do conhecimento. A representação dos dados – Os dados estatísticos podem ser mais facilmente compreendidos quando apresentados por meio de uma representação gráfica. A razão pela qual consideramos a Estatística uma ferramenta importante para a tomada de decisões está no fato de que ela não deve ser considerada como um fim em si própria. abandono de dados duvidosos etc. podemos considerar a Ciência Estatística como dividida basicamente em duas partes: a Estatística Descritiva que se preocupa com a organização e descrição dos dados experimentais. A organização dos dados consiste na ordenação e crítica quanto à correção dos valores observados. Evidentemente. e a Estatística Indutiva*(são também utilizados as termos Estatística Inferencial ou Inferência Estatística. chamadas variável discreta e variável contínua. portanto. visando à tomada de decisões. procede-se primeiramente a sua organização e descrição. ou. tanto a parte de organização e descrição dos dados como aquela que diz respeito a sua análise e interpretação são importantes. falhas humanas. É razoável também que. INTRODUÇÃO À CIÊNCIA ESTATÍSTICA Podemos considerar a Estatística como a ciência que se preocupa com a organização.Capítulo 1 A Ciência Estatística 1. baseadas em fatos e dados. o que permite a visualização instantânea dos mesmos. descrição. ainda. A Estatística é. mas como um instrumento (ferramenta) fornecedor de informações que subsidiarão a tomada de melhores decisões. omissões. . análise e interpretação dos dados experimentais. Indução Estatística).

dois conceitos fundamentais devem ser apresentados: o de população ou universo e o de amostra. a população física que nos interessa examinar é aquela constituída pela totalidade dos militares existentes no Comando Militar do Leste. queremos deixar bem claro desde já qual a finalidade da Estatística Indutiva. Uma vez que o conceito usual do que seja a Estatística se relaciona. proporções. porém. no sentido geral. isto é. ou mesmo nem é possível. Para tanto. por exemplo. no momento atual. coeficientes) que facilitam a descrição dos fenômenos observados. tratada mais detalhadamente no capítulo 2. concluímos exatamente sobre o que deve ocorrer em uma parte) . é interessante que se entenda dois conceitos: Dados brutos . Para darmos prosseguimento a apresentação da Estatística Descritiva. Grande parte das vezes. um processo de raciocínio em que. taxas. no todo (o oposto ocorre nos processos de dedução. realizar o levantamento dos dados referentes a todos os elementos da população. pois. Uma vez perfeitamente caracterizada a população. mas na verdade ainda não temos exatamente caracterizada a população que nos interessa. isto é. a uma amostra proveniente dessa população.2 CIÊNCIA ESTATÍSTICA A obtenção de algumas informações que auxiliam a descrição do fenômeno observado (médias. Isso parece extremamente simples. é um conjunto de elementos com pelo menos uma característica comum. Será ela constituída apenas por aqueles que. procura-se tirar conclusões sobre a realidade. um subconjunto necessariamente finito de uma população. Logo. Essa característica comum deve delimitar inequivocamente quais os elementos que pertencem à população e quais os que não pertencem. índices. Rol . Assim. Devemos então limitar nossas observações a uma parte da população. pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado.é uma seqüência ordenada de dados brutos. temos também o problema de definir a característica comum que distingue perfeitamente cada um dos elementos da população que realmente nos interessa pesquisar (do Efetivo Profissional ou também deveríamos incluir os do Efetivo Variável?). partindo-se do conhecimento do todo. que será tratada no volume 2. . em geral. em que. Uma população ou universo. com o que chamaremos de Estatística Descritiva. estão na ativa? Ou deveremos incluir também os que já estão na reserva? Além de tudo.é uma seqüência de valores numéricos não organizados. podemos estar interessados em realizar uma pesquisa sobre a idade dos militares do Comando Militar do Leste. O próprio termo "indutiva" decorre da existência de um processo de indução. tendências. não é conveniente. obtidos diretamente da observação de um fenômeno coletivo. O objetivo da Estatística Indutiva é tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações. o passo seguinte é o levantamento de dados acerca da característica (ou características) de interesse no estudo em questão. Uma amostra é. partindo-se do conhecimento de uma parte.

Ao induzir. . quanto maior a amostra. Esse problema será tratado com maior destaque no Cap. então. Cálculo de Probabilidades e Amostragem. um estudo estatístico completo. em geral. em realidade. Esse fato é fundamental para que uma indução (ou inferência) possa ser considerada estatística. Isso ocorre devido ao fato de que a decisão final depende não somente das restrições matemáticas. direta ou indiretamente. ou seja. se nossas conclusões referentes à população irão basear-se no resultado de amostras. A Estatística Indutiva. É intuitivo que. Amostragem Estatística Descritiva Estatística Indutiva Cálculo de Probabilidades Figura 1 . conforme indicado no diagrama da Fig. para que no Volume 2 possamos abordar os aspectos da inferência e dos testes de hipóteses com mais profundidade. irá envolver também. que diversas razões levam. à necessidade de recorrer-se apenas aos elementos de uma amostra.Esquema geral de um curso de Estatística. ao qual se denomina censo ou recenseamento. para se desenvolver um curso razoável de Estatística. As três ferramentas necessárias para a Inferência Estatística serão abordadas neste volume. É claro que. especialmente se a população for muito grande. porém. II e III. Levando esse raciocínio ao extremo. irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade. entretanto. Ocorre. que recorra às técnicas da Estatística Indutiva. no processo de amostragem. Contudo. certos cuidados básicos devem ser tomados no processo de obtenção dessas amostras. podemos não ter acesso fácil ou possível a todos os elementos da população. Entre elas.3 CIÊNCIA ESTATÍSTICA É fácil perceber que um processo de indução não pode ser exato. 1. Muitas vezes. portanto. concluiríamos que os resultados mais perfeitos seriam obtidos pelo exame completo de toda a população. etc. é importante ter em mente que as tabulações apresentadas constituem um mapa de referência para auxiliar o pesquisador na escolha do procedimento mais adequado para cada situação de pesquisa. 3. tópicos de Estatística Descritiva. mais precisas e mais confiáveis deverão ser as induções realizadas sobre a população. podemos citar o custo do levantamento de dados e o tempo necessário para realizá-lo. indicam as análises inferenciais adequadas para as diversas situações de pesquisa. ou. mas também dos objetivos do estudo e da própria natureza dos achados que serão produzidos. todos esses assuntos devem ser abordados em maior ou menor grau. erros grosseiros e conclusões falsas ocorrem devido a falhas na amostragem. e faz parte dos objetivos da Estatística Indutiva. não descrevem os procedimentos a serem adotados em cada situação particular. dentro de uma seqüência. Os ANEXOS I. Um outro problema que surge paralelamente é o de amostragem. Assim. Em resumo. estamos sempre sujeitos a erro.

Em muitos casos. no Cap. É claro que não iremos nem poderemos fazer qualquer tratamento matemático com os militares que formam esse conjunto. VARIÁVEL DADO Sexo M. ORDINAL (QUALITATIVA) escores em geral E. R.Variáveis e seus níveis de medidas. AB. I. B. A idade é uma variável cujos valores (dados numericamente organizados em alguma escala de unidade). Teremos. que a Estatística trabalha com informações referentes ao conjuntos de elementos observados.<0< + (2) Duas categorias: dicotômica ou binária. Ou seja. Espectro ordenado com Flexões de braço 0a+ INTERVALAR intervalos quantificáveis (QUANTITATIVA) Peso 0a+ Espectro ordenado com Força . (3) Podem ser contínuas ou discretas. como nos exemplos que seguem no Quadro 1. F. os quais serão então tratados convenientemente pela Estatística Descritiva. vamos apenas tratar do caso de variáveis unidimensionais. Diferença entre intervalar e razão está na presença do zero absoluto (razão). Este é o conjunto dos elementos. quando apenas uma característica de interesse está associada a cada elemento do conjunto examinado. B. A. FR. TIPO NOMINAL CARACTERÍSTICA . digamos. esses elementos constituem uma amostra retirada da população que se deseja estudar. É preciso definir qual(is) característica(s) desses militares nos interessa(m) averiguar. esses elementos fornecerão n valores da variável idade.<0< + RAZÃO intervalos quantificáveis (QUANTITATIVA) Aceleração . (QUALITATIVA) grupo sangüíneo A. dependerão dos elementos considerados.O Categorias ordenadas grau de dor. No presente capítulo. o conjunto observado pode constituir a população inteira. Essa característica poderá ser. mas o tratamento estatístico é o mesmo. Três ou mais categorias: polinomial. Por exemplo. o conjunto de elementos a ser estudado pode ser a população de uma Brigada. Nos problemas de Estatística Indutiva.Capítulo 2 Estatística Descritiva 2. mas com alguma(s) característica(s) desses elementos que seja(m) fundamental(is) ao nosso estudo. Esta característica poderá ser qualitativa ou quantitativa. variáveis qualitativas ou quantitativas. entretanto. 1. MB. I. Categorias não ordenadas Quadro 1 . portanto. se houver n elementos fisicamente considerados no estudo. ou seja. a idade dos militares. Para iniciarmos o tratamento dos dados é preciso antes que se tenha(m) bem definida(s) qual(is) a(s) característica(s) de interesse que deverá(ão) ser verificada(s). não iremos trabalhar estatisticamente com os elementos existentes. fisicamente definido e considerado. Ou seja.1 INTRODUÇÃO À ESTATÍSTICA DESCRITIVA Vimos. S.F.

cor dos olhos (pretos.5ton. teoricamente. cânceres...).33.5 2.. 2. como nos exemplos que seguem: a) População: Variável: b) População: Variável: c) População: Variável: d) População: Variável: militares de uma Brigada. . sexo (masculino ou feminino).2.).5m. salários dos militares. 19... ainda. descontos em contracheque (R$ 333..3. .1.005. peças produzidas por uma máquina. número de filhos (1.. castanhos.56. Assim. verdes).5. pode assumir qualquer valor num certo intervalo razoável de variação. a restrição de estarem compreendidos entre 1 e 6.3. ao contrário. óbitos em um Hospital de Guarnição. temos os exemplos que seguem: a) b) c) d) População: Variável: População: Variável: População: Variável: População: Variável: militares residentes na Vila Militar.. Apresentamos a seguir exemplos de variáveis quantitativas discretas: a) População: Variável: b) População: Variável: c) População: Variável: casais residentes na Vila Militar... carga transportada por uma viatura.. Essa classificação corresponde aos conceitos matemáticos de discreto e contínuo. 5ton. . As variáveis quantitativas podem ser subdividas em quantitativas discretas e quantitativas contínuas. R$ 1. o ponto obtido em cada jogada (1. idade (18.2 VARIÁVEIS QUANTITATIVAS A variável será quantitativa quando seus valores puderem ser expressos em números. Como variáveis quantitativas contínuas. peças produzidas por uma máquina. nos últimos cinco anos.6). pode assumir apenas valores pertencentes a um conjunto enumerável. diâmetro externo (5mm.). as jogadas possíveis com um dado.... no caso (b).2.. azuis. qualidade (perfeita ou defeituosa).3.).5. 1ton.39. uma variável contínua será aquela que. munições produzidas em uma linha de montagem.).3333. 3cm.1. A variável discreta. etc). pois seus possíveis valores são apenas números inteiros não-negativos. 1.2. R$ 1234.1 VARIÁVEIS QUALITATIVAS ESTATÍSTICA DESCRITIVA A variável será qualitativa quando resultar de uma classificação por tipos ou atributos. 1. número de defeitos por unidade (1.). 18. moléstias do aparelho digestivo. Essas variáveis são todas discretas. havendo. . peso líquido (3/4ton. causa mortis (moléstias cardiovasculares.4. candidatos a um exame para o Quadro Complementar de Oficiais..

Por exemplo. podemos perceber que os valores das variáveis discretas são obtidos mediante alguma forma de contagem. conforme veremos a seguir. . ao fato de. o leitor poderá ficar surpreso ao verificar que as técnicas da Estatística Descritiva serão praticamente idênticas em ambos os casos. estamos sempre fazendo uma aproximação. pois os valores da variável contínua serão sempre apresentados dentro de um certo grau de aproximação. Após observar as diferenças mencionadas entre as variáveis quantitativas discretas e contínuas.615 e 12. A Estatística Descritiva pode descrever os dados através de gráficos. resulta que qualquer valor apresentado de uma variável contínua deverá ser interpretado como uma aproximação compatível com o nível de precisão e com o critério utilizado ao medir. de uma medição.62 mm. medido em milímetros.2 TÉCNICAS DE DESCRIÇÃO GRÁFICA O primeiro passo para se descrever graficamente um conjunto de dados observados é verificar as freqüências (quantas vezes o valor aparece na série) dos diversos valores existentes da variável. mesmo que existissem. é a de que se trata de um valor aproximado. em geral. conforme veremos. for dado por 7. Isso decorre do fato de não existirem instrumentos de medida capazes de oferecer precisão absoluta. Outra diferença entre os dois tipos de variáveis quantitativas está na interpretação de seus valores. apenas na interpretação e descrição gráfica dos resultados é que haverá diferenças a serem consideradas. e. sendo freqüentemente dados em alguma unidade de medida. ao passo que os valores das variáveis contínuas resultam. Assim. os dados referentes a variáveis discretas ou contínuas serem análogos. Quando dizemos que um casal tem dois filhos. distribuições de freqüência ou medidas associadas a essas distribuições. não sendo exatamente o mesmo que 7.6. no entanto. deveremos considerar que o valor exato desse diâmetro será algum valor entre 12. 2.60 indica que a variável em questão foi medida com a precisão de centésimos. ao contrário.625 mm. ao executarmos a medição de algum valor de uma variável contínua. a interpretação de um valor de uma variável discreta é dada exatamente por esse mesmo valor. um valor 7. que foi aproximado para 7. Isso se deve. isso significa que o casal tem exatamente dois filhos.62 mm devido ao fato de a precisão adotada na medida ser apenas de centésimos de milímetros. Assim. A interpretação de um valor de uma variável contínua. Uma convenção útil adotada no presente texto é a de ser a precisão da medida automaticamente indicada pelo número de casas decimais com que se escrevem os valores da variável. se o diâmetro externo de uma munição. Assim. formalmente. Assim. não haveria interesse nem sentido em se querer determinar uma grandeza contínua com todas as suas casas decimais. valor correspondente a uma precisão de décimos.6 ESTATÍSTICA DESCRITIVA Pelos exemplos apresentados.

Tabela 1 . elaborando.59 100.2815 Cavalaria 30 . A variável qualitativa considerada no presente exemplo é dada por essa formação. conforme a Tab.7 ESTATÍSTICA DESCRITIVA Definimos a freqüência de um dado valor de uma variável (qualitativa ou quantitativa) como o número de vezes que esse valor foi observado.00% (percentagem). como o quociente de sua freqüência pelo número total de elementos observados. Alternativamente. Número de militares fi fri* Infantaria 38 . poderemos dizer que: fri=20/50 = .000 * Para fins didáticos. a descrição gráfica é muito simples. e as freqüências relativas dadas em porcentagens.Formação específica de militares por graduação.93 11. em que a formação acadêmica se distribui entre esses candidatos. Esse gráfico poderá ser um diagrama de barras. classificados segundo sua formação específica de graduação (arma/quadro/serviço). Ou seja.1259 Total 135 1.1111 Outros 17 . sendo n o número total de elementos observados.2593 Engenharia 15 . e as freqüências relativas observadas definem a distribuição de freqüências que essa variável apresentou. a seguir. um gráfico conveniente. Tomemos. um diagrama circular ou outro qualquer tipo de diagrama equivalente. 1 As duas colunas referentes ao número de militares contêm. respectivamente as freqüências. poderemos usar as freqüências relativas. ou seja. como exemplo. bastando computar as freqüências ou freqüências relativas das diversas classificações existentes. temos: fri = fi n sendo fri = 1 = 100/100 = 100% Se de 50 alunos (n) de um curso de pós-graduação 20 (fi) alunos terminarem o curso com menção MB. Denotaremos a freqüência do i-ésimo valor observado por fi.11 12. denotando por fri a freqüência relativa ou proporção do iésimo elemento observado.0% . um grupo de 135 candidatos a vagas em um curso de pósgraduação do Centro de Estudos de Pessoal.2222 Artilharia 35 .40 (freqüência relativa) ou 40. 40. Definimos a freqüência relativa (ou proporção) de um dado valor de uma variável (qualitativa ou quantitativa).2. verifica-se imediatamente que o somatório de todas as freqüências individuais é igual ao número de observações: fi = n A associação das respectivas freqüências a todos os diferentes valores observados define a distribuição de freqüências.22 25.00% dos alunos terminaram o curso com menção MB 2. “fri” = freqüência relativa e “%” = porcentagem Formação %* 28.15 22.1 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUALITATIVAS No caso de variáveis qualitativas.

2% Artilharia 25.6% Engenharia 11.1% Cavalaria 22. . 2 eles estão representados por meio de um diagrama de barras e. CANDIDATOS POR GRADUAÇÃO A UM CURSO DE PÓS-GRADUAÇÀO DO CEP Outros 12. A vantagem da representação gráfica está em possibilitar uma rápida impressão visual de como se distribuem as freqüências ou as freqüências relativas no conjunto de elementos examinados. Esses dados podem ser graficamente representados de diversas formas.Diagrama de barras da formação específica de militares por graduação.1% Infantaria 28. 3 por um diagrama circular. na Fig.Diagrama circular da formação específica de militares por graduação.8 ESTATÍSTICA DESCRITIVA CANDIDATOS POR GRADUAÇÃO A UM CURSO DE PÓS-GRADUAÇÃO DO CEP Infantaria 38 FORMAÇÃO ACADÊMICA Cavalaria 30 Artilharia 35 Engenharia 15 Outros 17 0 5 10 15 20 25 30 35 40 CANDIDATOS Figura 2 .Na Fig.9% Figura 3 .

30% Figura 4 . .30 18.2 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS DISCRETAS No caso das variáveis quantitativas discretas. aqui.214.80 6. pode ser facilmente construída se conhecemos todos os valores da variável no conjunto de dados. seus valores numéricos podem ser representados num eixo de abscissas. conforme dados do IBGE (Instituto Brasileiro de Geografia e Estatística).286. o que facilita a representação.077. tomemos as superfícies das cinco regiões geográficas que compõem o Brasil.393.80% 6.2.30 10. pode-se construir o diagrama circular dado na Fig.0 8.869.90 18. A construção do diagrama de barras é feita.2 1.2 577. apresentadas na Tab.Regiões geográficas do Brasil. Região Norte Centro-oeste Nordeste Sudeste Sul Total Superfície (km2) 3. 4. sendo a variável quantitativa.637.9 ESTATÍSTICA DESCRITIVA Entretanto deve-se mencionar ainda a possibilidade de se considerarem distribuições segundo outros critérios que não propriamente a freqüência ou a freqüência relativa das observações.30% Norte Centro-oeste Nordeste Sudeste Sul 18.1 % 45. Note-se que.177.547. 2. A diferença em relação ao caso anterior está em que.70 100. por sua vez.8 927. desde que se disponha da tabela de freqüências. Calculando-se as porcentagens correspondentes. Como exemplo. a representação gráfica será também. normalmente. o que não havia no caso das variáveis qualitativas. As barras do diagrama podem ser verticais ou horizontais conforme a disposição das variáveis nos eixos cartesianos.70% 45.Diagrama circular das regiões geográficas do Brasil.561.9 1. Esta. existe uma enumeração natural dos valores da variável. 2. Tabela 2 .00 ÁREA TERRITORIAL NACIONAL CORRESPONDENTE A CADA REGIÃO DO BRASIL 10.90% 18. feita por meio de um diagrama de barras.612.

constituído hipoteticamente por vinte valores da variável “número de erros de decriptografia” obtidos a partir de mensagens recebidas em um centro de mensagens. podemos construir a distribuição de freqüências dada na Tab. Sejam os seguintes os valores obtidos: 2 3 0 1 4 1 1 3 2 0 1 0 1 5 2 1 2 1 0 2 Usando a letra x para designar os diferentes valores da variável. 3. . a titulo de exemplo. dado pela Fig.Distribuição de freqüências de erros de decriptografia por mensagem. a partir da qual elaboramos o diagrama de barras correspondente. 5.10 ESTATÍSTICA DESCRITIVA Vamos. representar graficamente o conjunto dado a seguir. Tabela 3 . ERROS DE DECRIPTOGRAFIA POR MENSAGEM xi 0 1 2 3 4 5 fi= fi 4 7 5 2 1 1 20 ERROS DE DECRIPTOGRAFIA AVALIADAS 20 MENSAGENS No 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 NÚMERO DE ERROS 4 2 1 1 7 5 Figura 5 .Diagrama de barras para freqüências de erros de decriptografia por mensagem.

tendo. teríamos as freqüências relativas acumuladas.100 .250 .350 . 3 poderíamos representá-la conforme a Tab.Diagrama de barras para freqüências relativas de decriptografia por mensagem.0% 0 1 2 3 4 5 NÚMERO DE ERROS Figura 6 .0% 0.200 . as quais denotaremos por Fi. 6. O diagrama de barras.11 ESTATÍSTICA DESCRITIVA Caso o interesse fosse pela representação gráfica das freqüências relativas da Tab. dado pela Fig. A freqüência acumulada.0% 15.0% 25. em qualquer ponto do eixo das abscissas. Tratando-se de variáveis quantitativas. mostra a distribuição das freqüências no conjunto de dados. às vezes.0% 30. conforme já mencionamos. a partir da qual elaboraríamos o diagrama de barras correspondente.0% 20. Analogamente. 4.0% 10. ERROS DE DECRIPTOGRAFIA POR MENSAGEM xi 0 1 2 3 4 5 fi 4 7 5 2 1 1 fi= 20 fri . com base nas freqüências acumuladas. é definida como a soma das freqüências de todos os valores menores ou iguais ao valor correspondente a esse ponto.050 fri= 1 ERROS DE CRIPTOGRAFIA POR MENSAGEM 40. Tabela 4 .0% 5. Fi= fi e Fri= fri . interesse. uma outra forma de representação gráfica é também possível.050 .0% 35.Distribuição fri dos erros de decriptografia por mensagem.

Figura 8 .500 .100 . 7 pode-se identificar que 4 mensagens não contêm erro de decriptografia.0% 80.Distribuição Fi e Fri dos erros de decriptografia por mensagem.Freqüências relativas acumuladas dos erros de decriptografia em 20 mensagens. Tabela 5 . 16 mensagens contêm até 2 erros de decriptografia. 8 pode-se identificar que apenas 20.0% 0 1 2 3 4 5 Nº DE ERROS Figura 7 .000 - A partir da Tab. 5 pode-se construir o gráfico das freqüências acumuladas apresentado na Fig. 11 mensagens contêm até um erro de decriptografia. e assim por diante.00% das mensagens contêm até um erro de decriptografia. De acordo com a Fig. 8.. e o gráfico das freqüências relativas acumuladas. dado na Fig.500 1 Fri . 7.0% 100. 5. Erros de decriptografia por mensagem xi 0 1 2 3 4 5 fi 4 7 5 2 1 1 20 Fi 4 11 16 18 19 20 fri .00% das mensagens contêm até 3 erros de decriptografia.950 1.550 .Freqüências acumuladas dos erros de decriptografia em 20 mensagens. correspondentes aos valores notáveis da variável.350 . . e assim por diante. ERROS DE CRIPTOGRAFIA POR MENSAGEM Fi 25 20 15 10 5 0 0 1 2 3 4 5 Nº DE ERROS ERROS DE CRIPTOGRAFIA POR MENSAGEM Fri 120.900 . 55. Da mesma forma.12 ESTATÍSTICA DESCRITIVA Voltando ao exemplo. 90.200 . de acordo com a Fig.200 .0% 60.250 .0% 40.0% 0. podemos facilmente verificar que as freqüências acumuladas (Fi) e as freqüências relativas acumuladas (Fri).0% 20.800 . são as dadas na Tab.00% das mensagens não contêm erro de decriptografia.

880 . constituída por 25 valores da variável diâmetro de peças produzidas por uma máquina. sabemos que a freqüência 5 associada ao valor 21. uma representação gráfica correta deverá associar a freqüência 5 ao intervalo 21 .188 . 6 temos esses mesmos dados organizados em termos de freqüências e de freqüências relativas.5 Na Tab.25 21.752 .9 21.45.6 21.55 21.600 .072 1. que foram aproximados. que temos cinco valores compreendidos entre os limites 21. para 21. Examinemos um exemplo: tomemos a amostra a seguir.3 21. Assim.65 21.6 21.5 21.85 21.4. o procedimento até a obtenção da tabela de freqüências pode ser análogo ao visto no caso anterior. Tabela 6 .000 - Ao passarmos à representação gráfica. Entretanto o diagrama de barras não mais se presta à correta representação da distribuição de freqüências.75 21. 9.65 21. Logo.280 .5 21.4 21. Tal figura chama-se histograma e é apresentada na Fig. Diâmetro de peças produzidas por uma máquina Classe Medida fi Fi fr (i) (xi) 21.35 21.9 21. na verdade.5 21.5 21.7 21.75 21.040 10 10 21.4 21. dados em milímetros. porém.95 = 21.5 21.4 21.85 21.132 .3 21.092 .6 21.6 21.55 21. no processo de medição. Fi e Fri do diâmetro de peças produzidas por uma máquina.Distribuições fi. Isso se faz por meio de uma figura formada com retângulos cujas áreas representam as freqüências dos diversos intervalos existentes.7 21.152 .5 21.4 21.2.45 21.35 21. fri.048 .25 21.3 21. devido à natureza contínua da variável.45 21.5 21.3 DESCRIÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS CONTÍNUAS No caso das variáveis quantitativas contínuas.928 1.8 21.4 significa. simples e acumuladas.35 e 21.320 .15 21. . devemos lembrar a correta interpretação dos valores das variáveis contínuas.7 21.2 21.128 .040 .35 2 1.45.13 ESTATÍSTICA DESCRITIVA 2.6 21.00 Fri .2 . por exemplo.7 21.8 21.4 21. conforme a tabela primitiva abaixo: 21.4 21.9 23 47 70 38 32 12 18 250 33 80 150 188 220 232 250 .

consideram-se duas classes laterais com freqüência nula. no caso das variáveis contínuas. como o histograma.9 mm Figura 10 . As classes de freqüências são comumente representadas pelos seus pontos médios.2 21.5 21. na verdade. .95 mm Figura 9 .45 21.Histograma das medidas do diâmetro de peças produzidas por uma máquina (representação pelas classes). pode ser feita no caso de variáveis contínuas é dada pelo polígono de freqüências.35 21. Vemos que.65 21. Para completar a figura.3 21. DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA fi 80 70 60 50 40 30 20 10 0 21. associadas a intervalos de variação da variável e não a valores individuais. conforme a Fig.8 21.4 21. Uma outra representação gráfica que. 10.15 21.Histograma das medidas do diâmetro de peças produzidas por uma máquina (representação pelos pontos médios das classes).25 21. A tais intervalos chamaremos classes de freqüências.55 21.65 21.6 21. que se obtêm unindo-se os pontos médios dos patamares.85 21.7 21. as freqüências serão.14 ESTATÍSTICA DESCRITIVA DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA fi 80 70 60 50 40 30 20 10 0 21.

7 21. pois não haveria sentido em se considerar um intervalo com valores negativos.25 21.4 0.2 0.65 21.9 mm Figura 11 .55mm ou mais.65 21.3 21.15 21. Podemos ainda construir o polígono de freqüências acumuladas. .1 0 21.8 0. por meio da Ogiva de Galton Fri (Fig.85 21.45 21.15 21.95 mm Fri 1. 11 temos o polígono de freqüências correspondente ao histograma da Fig.6 21. Pode ser construído em termos das freqüências acumuladas (Fig.65mm.Se as peças produzidas não pudessem medir 21. 12b).75 21.Polígono de freqüências das medidas do diâmetro de peças produzidas por uma máquina.3 0. por meio da Ogiva de Galton Fi (Fig.35 21.8 21.85 21.5 21.25 21. Caso uma peça.a .4 21. conforme os dados da Tab.2 21.6 0.9 0.7 0.35 21.1 1 0.55 21. 6.Ogiva de Galton (Fri) dos diâmetros de peças produzidas por uma máquina. DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA Fi 275 250 225 200 175 150 125 100 75 50 25 0 21. Na Fig.5 0. 12a) podemos notar que 188 peças estariam fora das especificações. 12b) é possível notar que 60. Figura 12.45 21. Este é traçado simplesmente verificando-se as freqüências acumuladas (Fi ou Fri) ao final de cada uma das classes.95 mm DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA Figura 12. para ser aprovada.Ogiva de Galton (Fi) dos diâmetros de peças produzidas por uma máquina.75 21.15 ESTATÍSTICA DESCRITIVA Uma exceção bastante comum a essa regra aparece no caso de variáveis essencialmente positivas cujo histograma se inicia no valor zero.55 21.12a) ou das freqüências acumuladas relativas (Fig.b . 10.00% das peças estariam aprovadas. não pudesse medir menos que 21. DIÂMETRO DE PEÇAS PRODUZIDAS POR UMA MÁQUINA fi 80 70 60 50 40 30 20 10 0 21.

16 ESTATÍSTICA DESCRITIVA No exemplo anterior vimos que. Notemos também que os limites das classes são. a fim de se obter uma representação mais conveniente). menor valor da distribuição de freqüências. log n Vamos definir a amplitude do conjunto de dados como sendo a diferença entre o maior e o menor dos valores observados. em geral. entretanto. O procedimento descrito corresponde a uma diminuição proposital da precisão com que os dados foram computados. k e para os limites das classes. Entretanto. Muitas vezes. propositalmente deixamos de lado uma parcela da informação contida nos dados originais. Para fins de orientação adotaremos a fórmula proposta por Sturges: k= 1+3. é o de determinar qual o número de classes a constituir. qual o tamanho ou amplitude dessas classes e quais os seus limites. . tendo em vista obter uma representação mais adequada. A freqüência de cada classe será. Diversos autores apresentam soluções diferentes. A obtenção de soluções simples é. a consideração de classes de freqüências é fundamental para a correta representação gráfica. Vamos designá-la por AT. com um pouco de bom-senso e experiência. diferença entre os limites (Li-li) limite máximo da classe (normalmente aparente). uma representação satisfatória dos dados somente é conseguida pelo seu agrupamento em classes de freqüências que englobam diversos valores da variável. limite mínimo da classe (valor real). em muitos casos. em tais casos. pois isso impossibilitaria uma correta subdivisão em classes. nesse caso. É claro que. muitas vezes. por simplificação. número de classes. É claro que. A questão do número de classes é teoricamente controvertida. Naquele exemplo as classes consideradas tinham por pontos médios os próprios valores originais do conjunto de dados disponíveis.3 . igual à soma das freqüências de todos os valores existentes dentro da classe (esse procedimento também pode ser aplicado no caso de variáveis discretas. desejável. amplitude total da distribuição de freqüência (Lmax – lmin). maior valor da distribuição de freqüências. apresentados sob formas que não correspondem ao significado real dos valores contidos na classe. uma vez fixado k: h=AT k Entretanto é importante notar que a amplitude das classes não deverá ser fracionária em relação à precisão com que os dados são apresentados. no caso das variáveis contínuas. recomenda-se. Usaremos a seguinte notação: n: k: AT: Lmax: lmin: h: Li: li: número total de dados disponíveis. Ou seja. a construção de classes de mesma amplitude. o que foi suficiente para a obtenção de uma representação gráfica satisfatória. amplitude do intervalo de classes. chega-se sem grande dificuldade a valores satisfatórios para h. O problema prático a resolver.

1.17 ESTATÍSTICA DESCRITIVA Dizemos. A representação gráfica dessa distribuição. Tomemos como exemplo o conjunto de valores a seguir. que suporemos sejam as observações do número de repetições do exercício remador executado por n = 50 soldados organizados no ROL (dados brutos obtidos.28571 *Adotaremos k = 6.3 . que temos limites aparentes.606601 (6 ou 7?) Quadro 2 – Cálculo do número de classes de uma distribuição de freqüências. 13 deixa de ser conveniente para esses dados.3 .Gráfico de colunas do resultado obtido por 50 soldados no exercício remador Vamos determinar o número de classes: Dado que: k= 1+3. log n Onde: n = 50 log 50= 1. RESULTADO OBTIDO POR 50 SOLDADOS NO EXERCÍCIO REMADOR Nr 7 6 5 4 3 2 1 0 41 43 44 46 48 49 50 51 53 54 55 56 57 58 59 61 62 63 64 65 67 68 71 Nr de repetições Figura 13 .606601 k= 6. Em tais casos. organizados em ordem crescente ou decrescente) abaixo: ROL do número de repetições do exercício remador 41 50 53 55 61 43 50 53 55 62 44 50 54 55 62 46 51 54 56 63 46 51 54 56 64 48 51 54 57 64 48 51 54 57 65 48 53 54 58 67 49 53 55 59 68 49 53 55 61 71 É fácil verificar que a distribuição de freqüências diretamente obtida a partir desses dados seria dada por uma tabela razoavelmente extensa. . pode ser conveniente a determinação dos limites reais das classes.69897 Logo: k= 1+3. então. pois h será inteiro (5) Quadro 3 – Cálculo da amplitude de classe de uma distribuição de freqüências. apresentada na Fig.69897 k= 1+ 5. Notemos que o valor de k pode ser adequado de acordo com AT para que se acomodem os dados de acordo com o intervalo de classe mais conveniente: Dado que: h=AT/k Onde: AT = 71-41= 30 k=6 k=7 Logo: h =30/6 = 5 * h =30/7 = 4.

estudada pelo Cálculo de Probabilidades.5 70.5 44.5 Repetições Figura 14 .5 64.5 54.5 67.5 47. eles estão sugerindo qual seria. para a qual poderíamos adotar algum modelo ideal de distribuição.5 69.5 57.5 69. Classes Limites aparentes Primeira notação 40 45 50 55 60 65 70 45 50 55 60 65 70 75 Segunda notação 40 45 50 55 60 65 70 44 49 54 59 64 69 74 39.5 Limites reais Ponto médio (xi) 42.5 44.5 52. apresentamos os limites das classes dados de três maneiras equivalentes. se os dados provém de uma amostra. são dados na Fig.5 70. Muitas vezes. . A terceira indica os limites reais dessas classes.5 67. Um modelo freqüentemente usado é o da distribuição normal. As duas primeiras são formas usualmente empregadas e correspondem a limites aparentes.5 74.5 54. Note-se que não há possibilidade de dúvida quanto a que classe cada elemento pertence.18 ESTATÍSTICA DESCRITIVA Na Tab 7 são dados os limites das classes e as freqüências respectivas.5 49. aproximadamente.5 59. 14 Vemos que essa representação gráfica é muito mais apropriada do que a anteriormente obtida. o polígono de freqüências obtido sugere o traçado de uma curva contínua.5 62.5 52.5 62.5 49. Tabela 7 .5 59. Nessa tabela.Agrupamento em classes de freqüências do resultado obtido por 50 soldados no exercício remador. RESULTADOS DO EXERCÍCIO REMADOR Nr 20 15 10 5 0 42.5 64. a distribuição da população.5 = fi 3 8 16 12 7 3 1 50 O histograma e o polígono de freqüências.5 57. correspondentes ao agrupamento feito.Em outras palavras.5 47.Representação gráfica dos dados agrupados.

As medidas de posição e de dispersão são as mais importantes.1 MEDIDAS DE POSIÇÃO As medidas de posição servem para localizar a distribuição de freqüências sobre o eixo de variação da variável em questão. a mediana. Temos assim.. 2..n = total de abdominais executadas pelos 50 soldados. Os percentis por sua vez dividem a distribuição de freqüência em cem partes iguais (note que: D1 = P10. de dispersão. D4 = P40.3 CARACTERÍSTICAS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS Além da descrição gráfica. D7 = P70.. Notemos que X. ou seja. que iremos estudar a seguir. a moda. 2. o centro da distribuição de freqüências. Tais quantidades são usualmente denominadas de medidas da distribuição de freqüências.. x50=71). A moda indica a região de maior concentração de freqüências na distribuição. as chamadas medidas de posição. (x1=41. ou a média ponderada (quando os resultados estão categorizados em uma tabela de freqüências) Sendo xi (i = 1. os soldados executaram 55 abdominais.1 MÉDIA ( X ) A média de uma distribuição de freqüências é o valor obtido quando todos os dados observados são somados e divididos pelo número de observações. Onde: xi= 27311 n = 50 Dado que: X= xi / n Logo: X= 2731 / 50 X= 54. Q2. e D9 = P90). por critérios diferentes. tendo grande aplicação em problemas de Estatística Indutiva.62 ~ 55 = Poderíamos dizer que "em média".. Q3) dividem o conjunto ordenado de valores em quatro subconjuntos com igual número de elementos (25% dos elementos da seqüência).19 ESTATÍSTICA DESCRITIVA – MÉDIA 2.3. os quartis e os percentis. muitas vezes é necessário sumariar certas características das distribuições de freqüências por meio de certas quantidades. D3 = P30.. servindo para localizar as distribuições e caracterizar sua variabilidade.1. D5 = P50. Normalmente utiliza-se a média aritmética (quando os resultados dispostos em tabela primitiva ou ROL). Pode haver o interesse em dividir a seqüência de dados em dez partes iguais.2. x4=46. por procurarem quantificar alguns de seus aspectos de interesse.. x2=43.17. D8 = P80. Estudaremos cinco dos principais tipos de medidas de posição: a média.n) os valores da variável. A média e a mediana indicam. 2731. Quadro 4 – Cálculo da média aritmética. e fi a média aritmética pode ser calculada pela seguinte fórmula: X= xi / n Por exemplo..3. x3=46. . x5=. D2 = P20. utilizaremos os dados do Rol apresentado na Pág. costuma-se dizer também que são medidas de tendência central. de assimetria e de curtose. As medidas de assimetria e de achatamento ajudam a caracterizar a forma das distribuições. D6 = P60. Os quartis (Q1. para tanto utilizamos os decis (não abordados neste manual por tratarem-se de um tipo particular de percentis). Por essa razão.

não nos preocuparemos com essa questão. Dentre as propriedades da média.8 538.45 21. a média do conjunto fica multiplicada por essa constante.55 21.6 21.6 107 150.65 21. por exemplo.2 42.55 21.4 X= 538.5 21.75 21.45 21. Como hoje é muito comum dispor-se de calculadoras eletrônicas ou softwares que realizam esses cálculos.35 21. substituindo os xi pelos pontos médios das classes e considerando as fi corno as respectivas freqüências (ou freqüências relativas se for o caso).54mm. podemos definir sua média como o valor obtido.9 fi 1 2 5 7 4 3 1 2 25 fixi 21.4 65. apresentados na Tab 8. Diâmetro de peças produzidas por uma máquina Classe (i) 21.75 21. Considerando uma distribuição por classes de freqüências.8 21.3 21. a média do conjunto fica acrescida ou diminuída dessa constante.4 / 25 X= 21.7 21.15 21. os dados da Tab.5 86. Tabela 8.4 21. Utilizando as propriedades citadas. .85 21. somando-se ou subtraindo-se uma constante a todos os valores de uma variável.8 43.25 21.1 21. b.65 21.2 21. o que será particularmente útil se os valores xi forem elevados e o cálculo precisar ser feito manualmente.20 ESTATÍSTICA DESCRITIVA Para o cálculo da média ponderada tomemos. 54 Poderíamos dizer que as peças produzidas pela máquina possuem um diâmetro médio de 21. Quadro 5 – Cálculo da média ponderada. Cálculo da média ponderada. podemos destacar as seguintes: a. A média assim calculada para os dados agrupados em classes deverá ser aproximadamente igual à média aritmética exata dos n dados originais.25 21. multiplicando-se todos os valores de uma variável por uma constante. 6. podemos introduzir simplificações no cálculo da média.85 21.4 Fórmula da média ponderada: X= fixi Considerando: n xi= ponto médio da classe fi= freqüência de cada classe n= número de observações Onde: Logo: n = 25 fixi= 538.35 21.95 = (xi) 21.

embora por vezes não tenha um significado real para a variável. Definimos a mediana de um conjunto de n valores ordenados como o valor ou dado que divide a série estatística ao meio (50%dos valores serão menores e 50%dos valores serão maiores que o valor da mediana). 50% dos valores são menores ou iguais a 40 e 50%dos valores serão maiores ou iguais a 40. Onde: n=8 Logo: 15 < Md < 16 Notemos que o valor 15.5. Se n for par.5 e 50%dos valores serão maiores ou iguais a 15.2 MEDIANA (Md) ESTATÍSTICA DESCRITIVA A mediana é uma quantidade calculada com base na ordem dos valores que formam o conjunto de dados. 50%dos valores são menores ou iguais a 15.5. Md= 5º elemento Isto quer dizer que ela possui o valor de x5. Dados os valores: 12 14 14 15 16 16 17 20 Dado que: n/ 2< Md < (n/ 2) +1 8/ 2< Md < (8/ 2) +1 4º< Md < 5º Md =(15+16)/2 Md =15.3. Quadro 6 – Cálculo da mediana com n impar. A mediana é geometricamente interpretada como ponto tal que uma vertical por ele traçada divide a área sob o histograma em duas partes iguais. é o valor que divide a série Estatística ao meio. . Quadro 7 – Cálculo da mediana com n par. a Md é igual ao valor de ordem (n + 1)/2 desse conjunto.21 2. a Md poderia ser definida como valor médio entre o de ordem n/2 e o de ordem (n/2) + 1. Nas variáveis discretas: Sendo n impar.5 Isto quer dizer que ela possui o valor médio entre o 4° e o 5° elemento da série (x4+x5)/2 que é (15+16)/2 = 15.1. Dados os valores: 35 36 37 38 40 40 41 43 46 Dado que: Md= (n + 1)/2 Onde: n=9 Logo: Md= (9 + 1)/2 Md = 40 Notemos que o x5 (40).5. é o valor que divide a série estatística ao meio.

melhor indicador central que a média.85 21.Fant) . Por exemplo. .45 21.15 21. uma distribuição em classes de freqüências. a mediana é.35 21. podemos calcular um valor para sua mediana pela expressão: Md = l + ( p` .55 21.45=0.75 21.200 6.45+ (12. por exemplo.6 21. nesse caso. agora.500 3.1 Escolhemos a 4ª classe.55-21.51 h=21.h f Logo: Md = 21. não tendo sido influenciada pelo valor extremo 80.22 ESTATÍSTICA DESCRITIVA Considerando.45 21.1 Onde: l=21.75 21. Tomemos. no caso de distribuições de rendas. Em certos casos.9 5 7 4 3 1 2 25 8 15 19 22 23 25 Onde: fi=25 n = 25 Dado que: p`= fi 2 Logo: p`= 25/2 = 12.45 Fant= 8 7 f=7 Md =21. h f Onde: l: p` : fi: Fant: h: f: tal que: p`= fi 2 limite inferior da classe que contém a Md número que define a posição em que se encontra a Md (classe que contém a Md) número de elementos do conjunto de dados freqüência acumulada da classe anterior à classe que contém a Md amplitude da classe que contém a Md freqüência da classe que contêm a Md Quadro 8 – Fórmula da mediana para variáveis contínuas. Cálculo da mediana.500 4.3 2 21.0.65 21.000.35 21. Como ilustração.7 21.500.4 21.600.51mm é o valor que divide a série estatística ao meio. 9. A mediana pode ser usada como alternativa.700 5. em geral.85 21.Fant).2 1 1 3 21. 6 apresentados na Tab. Notemos que o valor 21.5 Dado que: Md = l + (p` .000 5.25 21. imaginemos um conjunto de doze pessoas com as seguintes rendas mensais (R$): 2. muito maior que os demais valores.000 3.5-8).25 21.200 80. seu uso é mais conveniente.000 A média desses doze valores é 10. que a mediana fornece uma melhor idéia do centro da distribuição.000 3.5 21. Vemos. em relação à média. pois ela contém p`.000 4.65 21. pois não sobre a influência de valores extremos.55 21. efetivamente.95 = 21. Diâmetro de peças produzidas por uma máquina Classe Medida fi Fi (i) (xi) 21.8 21. os dados da Tab. ao passo que sua mediana é 4.300 7.800 2. Tabela 9. Quadro 9 – Cálculo da mediana. para caracterizar o centro do conjunto de dados.

no exemplo da Fig. Cálculo da moda.fpost limite inferior da classe que contém a Mo. freqüência da classe que contêm a Mo. pois indica a região das máximas freqüências.1. Tabela 10. como o valor (ou valores) de máxima freqüência.13.1 Quadro 11 – Cálculo da moda.23 2. Para o cálculo da moda tomemos. mediana e moda A seguinte relação empírica em geral subsiste aproximadamente para os conjuntos de dados observados: X .4 21. no caso da Tab. por exemplo.25 21.35 21. freqüência da classe anterior à classe que contêm a Mo. Diâmetro de peças produzidas por uma máquina Classe Medida fi Fi (i) (xi) 21.35 21.9 2 5 7 4 3 1 2 25 3 8 15 19 22 23 25 Dado que: Onde: kMo= 4ªclasse f*=7 fant= 5 fpost= 4 Logo: 1=7–5=2 2=7–4=3 1 = f*-fant 2 = f*-fpost Dado que: Mo = l + Onde: Logo: 1= 2 Mo = 21. Definimos a moda (ou modas) de um conjunto de valores. a moda é 54 pois é o valor que mais se repete.5 21.55-21.3 MODA (Mo) ESTATÍSTICA DESCRITIVA A moda é uma medida de posição.3.65 21.49 h= 21.15 21.85 21. Quadro 10 – Fórmula da moda.h 1+ 2 tal que: 1 = f* .45 21.Mo = 3( X – Md) .45=0. 10. Assim.25 21.45 Mo = 21. é comum definir-se também a moda como um ponto pertencente á classe modal. a classe modal (kMo) é a 50 55.2 1 1 21.95 = 21. No caso de distribuições de freqüências em classes de mesma amplitude.1 2= 3 2+3 l= 21. 0. amplitude da classe que contém a Mo.6 21.fant 2 = f* .3 21.85 21.55 21. 7 apresentados na Tab.7 21. 1 . os dados da Tab.8 21.45 21. freqüência da classe posterior à classe que contêm a Mo.75 21.55 21.45 + 2 .65 21. 7. dado por Mo = l + Onde: l: f*: fant: fpost: h: 1 .h 1+ 2 Relação empírica entre média.75 21.

logo c=25 .24 ESTATÍSTICA DESCRITIVA Essa expressão pode ser apresentada sob diversas formas e indica geometricamente que a mediana situa-se entre a média e a moda.Fant) . logo c=15 Sabemos que Q1 é o valor que divide a distribuição de freqüências em 25% e 75%.4 QUARTIS (Q) E PERCENTIS (P) A idéia de mediana. como vimos. de acordo com a fórmula dos percentis (fórmula genérica este tipo de medida de posição). 2. O segundo quartil (Q2). Q2. Sua determinação seria feita de modo semelhante á da mediana. Para obtermos o valor que divide uma distribuição de freqüências.1. sendo sua distância à moda o dobro de sua distância à média. Essa idéia pode ser generalizada. ou seja: 25% dos valores < Q1 < 75% dos valores 75% dos valores < Q3 < 25% dos valores 12 14 14 Q1 =14 15 16 16 17 Q3 =16. os quartis dividem a dividem em ¼ e 3/4 . é a própria mediana. de acordo com o quadro 12. Sua verificação na prática tende a ser mais perfeita para conjuntos maiores de dados e sendo a moda calculada com base em dados agrupados em classes de freqüências.5 Os valores dos quartis também podem ser obtidos em distribuições contínuas. então podemos concluir que o valor de Q3 = P75. P = l + ( p`. então deveríamos calcular P15. é a de dividir o conjunto ordenado de dados em dois subconjuntos com igual número de elementos. então podemos concluir que o valor de Q1 = P25. sendo que 15% dos valores sejam menores ou iguais a este valor.3. logo c=25 Sabemos que Q3 é o valor que divide a distribuição de freqüências em 75% e 25%. Q3).h f Onde: l: p` : fi: Fant: h: f: c: tal que: p` c fi = 100 limite inferior da classe que contém a posição desejada posição em que se encontra o percentil (classe que contém a P) número de elementos do conjunto de dados freqüência acumulada da classe anterior à classe que contém a P amplitude da classe que contém a P freqüência da classe que contêm a P porcentagem que se deseja obter Quadro 12 – Fórmula geral para quartis e percentis. Se a mediana divide a distribuição de freqüências ao meio. dividem um conjunto ordenado de valores em quatro subconjuntos com igual número de elementos.5 20 Md =15. obviamente. os quartis (Q1. Como dito anteriormente.

2.3.3. o grau de variação existente no conjunto de valores. já mencionada no item 2. e para dados ordenados em tabelas primitivas ou ROL é dada por: s2 = (xi – X) 2 n-1 Notemos que xi – X corresponde ao desvio que cada elemento possui em relação à média. se os dados constituírem uma distribuição por classes de freqüências. As medidas de dispersão surgem como maneira de indicar o quanto os dados se apresentam dispersos em torno da região central (medida de posição).2. . dispersão ou afastamento dos dados. a variância. Salvo aplicações no controle da qualidade. É claro que o valor de AT está relacionado com a dispersão dos dados. s2 = (xi – X ) 2fi n-1 Como exemplo. Analogamente ao cálculo da média. e que utilizamos o artifício matemático de elevarmos esta diferença ao quadrado [(xi – X)² ] . portanto. tornando sem sentido a fórmula matemática. é definida como a diferença entre o maior e o menor valores do conjunto de dados: AT = Lmax – lmin. a amplitude total contém relativamente pouca informação quanto à dispersão. Caracterizam.2. 11 mostra o cálculo de X de s2. vamos executar o cálculo da variância de um conjunto pequeno de dados. formado pelos 20 valores seguintes: 10 12 10 12 10 12 11 13 11 13 11 13 11 13 12 14 12 14 12 14 A Tab.2 A VARIÂNCIA (s2) A variância é a média dos quadrados das diferenças dos valores em relação à sua própria média.1 A AMPLITUDE TOTAL (AT) A amplitude total. por depender de apenas dois valores do conjunto de dados.25 2.3.3. o desvio-padrão e o coeficiente de variação. As principais medidas de dispersão são: a amplitude total.2 MEDIDAS DE DISPERSÃO ESTATÍSTICA DESCRITIVA As informações fornecidas pelas medidas de posição podem ser insuficientes para compararmos e classificarmos as séries estatísticas quanto a sua homogeneidade.2. poderemos calcular sua variância pela expressão abaixo. Entretanto. onde xi são os pontos médios das classes e fi as respectivas freqüências. a amplitude total não é muito utilizada como medida de dispersão. pois caso contrário o somatório teria o valor zero [ (xi – X)=0]. 2.

para demonstrarmos que a variância é oriunda dos desvios de cada elemento (ou ponto médio de classe). ela tem o inconveniente de se expressar uma unidade quadrática em relação à da variável em questão.26 Tabela 11.68 Quadro 13 – Cálculo da variância. conhecido N e a média populacional µ deve-se utilizar a fórmula abaixo: 2 = (xi – µ) 2 N A variância tem. b. A importância de estudarmos a variância dos dados está no fato da possibilidade de compararmos distribuições amostrais e populacionais. Esse inconveniente é sanado com a definição do desvio padrão. multiplicando se todos os valores de uma variável por uma constante. Pelo artifício matemático podemos observar o quadrado dos desvios. quanto maior a variância.11. mais homogênia será a distribuição de freqüências. . = 20 X= 240/20=12 Utilizamos o exemplo da Tab. o que nem sempre faz sentido. somando-se ou subtraindo-se uma constante a todos os valores de uma variável a variância não se altera. Neste sentido. as seguintes propriedades: a. caso se deseje calcular a variância populacional. Cálculo da variância (s2) xi 10 11 12 13 14 fi 3 4 6 4 3 fixi 30 44 72 52 42 240 xi-X ( xi-X )² -2 -1 0 1 2 0 4 1 0 1 4 10 ( xi-X )²fi 12 4 0 4 12 32 ESTATÍSTICA DESCRITIVA O somatório dos desvios em relação à média é igual a zero. em relação à média da série estatística. que é a raiz quadrada da variância . entre outras. Do ponto de vista prático. Dado que: s2 = (xi – X) 2fi n-1 Onde: Logo: s2 =32/20 (xi – X) 2fi= 32 n=5 s2 = 1. menor será a concentração dos dados em torno da média. a variância do conjunto fica multiplicada pelo quadrado dessa constante. incluindo-se n-1 como fator de correção. quanto menor a variância. A variância é uma medida de dispersão extremamente importante na teoria estatística. Por outro lado. No entanto esta fórmula refere-se ao fato de se estar calculando a variância de uma amostra.

55 21.3. 95% entre 21. O desvio-padrão é notado da seguinte forma: s= (xi – X ) 2fi n-1 Tabela 12. e 99% entre 21.11520 .2 42.88mm.00144 .2. . ele é mais realístico para efeito da comparação de dispersões e juntamente com a média possibilita uma visão mais consistente a respeito da homogeneidade da série estatística. X= 538.00980 .71mm.3 21.9 fi 1 2 5 7 4 3 1 2 25 fixi 21.85 21.27 2.3 O DESVIO-PADRÃO (s) ESTATÍSTICA DESCRITIVA Definiremos o desvio-padrão como a raiz quadrada positiva da variância.65 21.54 Interpretação do desvio-padrão O desvio-padrão é sem dúvida a medida de dispersão mais importante.45 21.12 possuísse distribuição normal poderíamos dizer que: Aproximadamente 68% das peças produzidas possuem diâmetro que varia entre 21.13 e 22.95 = (xi) 21.37 e 21.85 21.06948333 s= s = 0.75 21.4 65.7 21.26% dos dados da série X + 2s contém 95.64676 Dado que: Logo: s= s= (xi – X ) 2fi n-1 64676 24 0.20 e 21.5 86.6 21.35 21.8 21.55 21.75 21.1 21.11560 .65 21.25920 .44% dos dados da série X + 3s contém 99.5 21.6 107 150.25 21.4/25=21. podemos afirmar que: X + s contém 68.35 21. Sendo expresso na mesma unidade da variável.05mm Quadro 15 – Interpretação do desvio padrão.4 (xi – X ) 2fi .45 21.07680 . Cálculo do desvio-padrão (s) Classe 21.8 538. Quando uma curva de freqüência é simétrica como a curva abaixo.16416 Quadro 14 – Cálculo do desvio padrão.25 21.2 21.8 43.74% dos dados da série Caso a Tab 2.06760 .00112 .15 21.4 21.

poderíamos afirmar que a segunda máquina é menos precisa que a primeira. negativamente assimétricas.76%.76% Supondo-se que outra máquina avaliada. RESULTADO DO 1º TESTE DE APTIDÃO FÍSICA DE RECRUTAS DE UM BATALHÃO DE INFANTARIA Nr 140 120 100 80 60 40 20 0 I R B MB E Conceitos RESULTADO DO 1º TESTE DE APTIDÃO DE TIRO DE RECRUTAS DE UM BATALHÃO DE INFANTARIA 140 120 100 80 60 40 20 0 I R B MB E Conceito Nr Figura 16a . produzisse peças com diâmetro médio X=21. e as alongadas à esquerda. sendo freqüentemente expresso em porcentagem: Cv = s / X Sua vantagem é caracterizar a dispersão dos dados em termos relativos a seu valor médio.Assimetria positiva Figura 16b .93%.3 MEDIDAS DE ASSIMETRIA Essas medidas procuram caracterizar como e quanto a distribuição de freqüências se afasta da condição de simetria. 2.3.15 0. As medidas de assimetria. No exemplo visto. ou seja.2003mm.16416/ 21. quanto maior o coeficiente de variação mais dispersos estarão os dados em relação à média. permitindo-se comparar séries estatísticas.4 O COEFICIENTE DE VARIAÇÃO (Cv) ESTATÍSTICA DESCRITIVA O coeficiente de variação é definido como o quociente entre o desvio-padrão e a média. Nas Fig.65mm. As distribuições alongadas à direita são ditas positivamente assimétricas.009252=0. 16a e Fig. o Cv = 0.Classificação da distribuição de freqüência em relação a sua assimetria.28 2. tendo em vista que Cv2> Cv1. .16b são mostrados dois tipos de assimetria. 15 < A < 1 A > 1. definido como segue: A= 3(X – Md) S Relação A < 0. conforme sejam positivas.54=0.Assimetria negativa Para a caracterização do poder da assimetria utiliza-se o coeficiente de assimetria de Pearson.3. e menos homogênia será a série estatística. obteríamos um Cv2 =0. negativas ou aproximadamente nulas. como Cv1 =0. Classificação Praticamente simétrica Moderadamente assimétrica Fortemente assimétrica Quadro 16 . e desvio-padrão s=0.2.007621=0. procuram indicar o tipo de distribuição quanto a esse aspecto.

6039 I R B MB E Conceitos S A= +.347 Ass.08 Md= 10.5 S= 3. Consideremos que os conceitos de uma pista Tiro de Ação Reflexa obedeçam a seguinte ordenação de valores (sendo o número de tiros executado por cada militar igual a 22): DISTRIBUIÇÃO A classe 02 06 10 14 18 06 10 14 18 22 xi 4 8 12 16 20 fi 6 12 24 30 6 RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES Nr 35 30 25 20 15 10 5 0 I R B MB E Conceitos S Onde: X= 12. DISTRIBUIÇÃO C classe 02 06 10 14 18 06 10 14 18 22 xi 4 8 12 16 20 = fi 6 30 24 12 6 78 Nr 35 30 25 20 15 10 5 0 RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES A= 3(X – Md) Onde: X= 11.483 Ass. .5 S= 5.1478 I R B MB E Conceitos S A= 0 Simétrica Figura 17b – Assimetria nula.Positiva moderada Figura 17c – Assimetria positiva moderada.92 Md= 13.0087 A= 3(X – Md) = 78 A= -.29 Considerações a respeito da assimetria ESTATÍSTICA DESCRITIVA Nos exemplos abaixo poderemos verificar o formato e as características de séries estatísticas com um mesmo número de elementos. Negativa moderada Figura 17a – Assimetria negativa moderada. DISTRIBUIÇÃO B classe 02 06 10 14 18 06 10 14 18 22 xi 4 8 12 16 20 = fi 5 21 26 21 5 78 Nr 30 25 20 15 10 5 0 RESULTADO DO TIRO DE AÇÃO REFLEXA DE SOLDADOS DE UMA BATERIA DE OBUSES A= 3(X – Md) Onde: X= 12 Md= 12 S= 4.

e Fig. As Fig. Fig. FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 3ª COMPANIA DE FUZILEIROS Nr 70 60 50 40 30 20 10 0 5 15 25 35 45 55 65 75 85 95 105 110 115 Repetições Figura 18c – Distribuição Leptocúrtica. 18a. apresentam os três tipos característicos de distribuição: classe 5 15 25 35 45 55 65 75 85 95 105 110 115 = classe 5 15 25 35 45 55 65 75 85 95 105 110 115 = classe 5 15 25 35 45 55 65 75 85 95 105 110 115 = xi 4 7 9 11 12 13 13 13 12 11 9 7 4 125 xi 4 7 9 11 12 13 13 13 12 11 9 7 4 125 xi 0 0 1 2 6 24 59 24 6 2 1 0 0 125 FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 1ª COMPANIA DE FUZILEIROS 70 60 50 40 30 20 10 0 5 15 25 35 45 55 65 75 85 95 105 110 115 Repetições Nr Figura 18a – Distribuição Platicúrtica.30 2. 18c. .4 MEDIDAS DE ACHATAMENTO OU CURTOSE ESTATÍSTICA DESCRITIVA As medidas de curtose caracterizam a forma da distribuição quanto a seu achatamento.3. 18b. modelo teórico de distribuição estudado pelo Cálculo de Probabilidades (veja o capítulo 4). Nr 70 60 50 40 30 20 10 0 FLEXÕES DE BRAÇO REALIZADAS POR SOLDADOS DA 2ª COMPANIA DE FUZILEIROS 5 15 25 35 45 55 65 75 85 95 105 110 115 Repetições Figura 18b – Distribuição Mesocúrtica. A comparação é feita em relação à distribuição normal.

Classificação da distribuição de freqüência em relação a sua curtose. As distribuições mais achatadas que a normal são denominadas platicúrticas (forma de prato) e as menos achatadas são denominadas leptocúrticas (forma de chapéu mexicano). Sempre que estes pressupostos são alcançados.5 CONSIDERAÇÕES SOBRE MEDIDAS DE ASSIMETRIA E CURTOSE No volume 2 trataremos sobre a Estatística Inferencial. em termos práticos.263 curva platicúrtica C= Q3 . deveremos verificar se a amostra. 2. distribuições platicúrticas apresentam os dados bem dispersos em relação à média. e c. as observações devem ser independentes. mencionaremos apenas o coeficiente percentílico de curtose. . a classificação quanto à curtose dá-se em função do achatamento da distribuição de freqüências. desta forma os testes de assimetria e curtose tratados no presente capítulo crescem em importância no sentido de que.31 ESTATÍSTICA DESCRITIVA Como dito anteriormente.Q1 2(P90 . com a qual estamos trabalhando. distribuições leptocúrticas apresentam os dados muito próximos da média.263 curva mesocúrtica C < 0.3.263 curva leptocúrtica C > 0.P10) Onde: Q1 = 1º quartil. o que chamamos distribuição mesocúrtica (forma de boca de sino). a população estudada deve possuir uma distribuição normal. uma distribuição normal tem um achatamento mediano. Desta forma é possível verificar que: a. P10 = Percentil 10 e P90 = percentil 90 Quadro 17 . distribuições mesocúrticas apresentam os dados normalmente dispersos em relação à média. os testes paramétricos aumentam as chances de se rejeitar a hipótese nula. a amostra extraída deve ter as mesmas variações na variável estudada. c. dado pela fórmula abaixo: Classificação quanto à curtose C = 0. para comprovarmos o pressuposto a. Neste momento é importante que se diga que a primeira categoria. Q3 = 3º quartil. possuem três pressupostos básicos sobre a distribuição dos dados: a. o que caracteriza uma forma de distribuição normal. características da distribuição normal. o que denominamos poder do teste (trataremos este conceito no item 4. b. A caracterização do achatamento de uma distribuição só tem sentido. se a distribuição for pelo menos aproximadamente simétrica. Deste modo.. o que caracteriza uma forma de distribuição homogênia Entre as possíveis medidas de achatamento. testes paramétricos. o que caracteriza uma forma de distribuição heterogênia. b.3 do capítulo 4). é simétrica e mesocúrtica. onde veremos duas categorias de testes estatísticos: os paramétricos e os não-paramétricos.

1 INTRODUÇÃO A busca de informações a respeito de um fenômeno qualquer é necessária para lastrear a tomada de decisões que envolvem este fenômeno. Vamos examinar a seguinte situação. a amostra é bem representativa da população. O procedimento viável nesta situação é fazer esta avaliação através de uma amostra. o que conduzirá a um erro de avaliação e a suas conseqüências. Neste caso.. o que permitirá à nutricionista fazer a avaliação com alto grau de precisão. a escola devolve a sopa e exige o pagamento da multa contratual. que será servida a seus alunos. No entanto. Em particular quando este fenômeno é aleatório.O segundo processo consiste em obter estas informações indiretamente. de fato. Note que se a nutricionista tiver o cuidado de mexer suficientemente a sopa. conseguirá um bom grau de homogeneidade no produto e uma pequena amostra retirada nestas condições irá conter os ingredientes aproximadamente na mesma proporção em que figuram na sopa. através da Estimação (por meio de amostras). o problema está resolvido. a sopa não atender o padrão de qualidade contratado. Existem dois processos de abordagem para a solução deste problema.Vamos desenvolver o segundo processo. . o que identifica diretamente a forma da distribuição da variável e seus parâmetros.Capítulo 3 Amostragem 3. A estimação é um processo que consiste em avaliar os parâmetros de uma distribuição através de estimadores obtidos em uma amostra. A nutricionista de uma escola militar foi encarregada de avaliar a qualidade nutritiva de uma sopa preparada por um fornecedor (contratado). pode ocorrer que a amostra selecionada não seja representativa da população. Algumas reclamações de alunos sugerem que a sopa não está satisfazendo o padrão de qualidade nutricional exigido pela escola. com o objetivo de estimar os parâmetros da distribuição. Se. A qualidade de uma estimação depende basicamente da representatividade da amostra que consiste na capacidade de a amostra reproduzir as características importantes da população. se a nutricionista não tiver o cuidado de mexer a sopa. O primeiro processo consiste em aplicar um Censo. Quando é razoável a aplicação de um censo. com base no cálculo de probabilidades (instrumental que viabiliza avaliar parâmetros da distribuição a partir dos estimadores). a busca de informações é direcionada para estabelecer a forma da distribuição da variável que descreve o fenômeno e os parâmetros desta distribuição.

1 AMOSTRAGEM INTENCIONAL Ocorre quando o pesquisador seleciona intencionalmente os componentes da amostra.2. Fichas com esses números podem ser misturadas em uma urna. dada uma população finita de 500 sargentos da Vila Militar dos quais nos interessa uma característica comum (possuidores do Curso de Aperfeiçoamento de Sargentos). Para se obter uma amostra aleatória simples.2. mesmo mexendo a sopa. 3.2. cada elemento da população tem a mesma probabilidade de participar da amostra. procede-se da seguinte forma: .2 AMOSTRAGEM ALEATÓRIA: 3.2. 3. O sorteio das fichas identifica os elementos que deverão participar da amostra.2.2 AMOSTRAGEM É o conjunto de técnicas utilizadas para a seleção de uma amostra. Este conjunto de técnicas pode ser subdividido em dois grupos básicos: a amostragem aleatória e a amostragem não aleatória. desconfia do grau de homogeneidade da sopa. 3. Esta tabela contém números previamente sorteados. Uma maneira equivalente de sortear os elementos da amostra consiste no uso de uma Tabela de Números Aleatórios (TNA) (ANEXO IV). se iniciarmos em um ponto qualquer dessa tabela e anotarmos os números na seqüência das linhas ou colunas a partir deste ponto inicial. À medida que esta variabilidade aumenta.33 AMOSTRAGEM Se a nutricionista.1. e escolhida uma amostra de 30 sargentos.1 AMOSTRAGEM NÃO ALEATÓRIA: 3.1. podemos atribuir a cada elemento um número. Estas amostras não permitem o controle da variabilidade amostral.2. 3. A análise desta situação leva-nos a concluir que populações com pequeno grau de variabilidade de seus elementos podem ser estudadas a partir de pequenas amostras. a maneira de conseguir boa representatividade consiste em aumentar o tamanho da amostra.2 AMOSTRAGEM VOLUNTÁRIA Ocorre quando o componente da população se oferece voluntariamente para participar da amostra independentemente do julgamento do pesquisador.1 AMOSTRAGEM ALEATÓRIA SIMPLES É aquela em que se atribui aos grupos de mesma quantidade de elementos a mesma probabilidade de participar da amostra. o que inviabiliza o controle da qualidade da estimação. caso a população seja finita. pelo Almanaque podemos colocá-los em ordem de antiguidade. Em particular. é necessário aumentar o tamanho da amostra aleatória para manter sua representatividade. de forma que. garantindo a mesma chance para cada um deles. Por exemplo.

066. 467.2 AMOSTRAGEM SISTEMÁTICA Quando se conhece uma listagem dos elementos da população pode-se obter uma amostra aleatória de n elementos dividindo-se o número de elementos da população pelo tamanho da amostra. 009. 241. 046. 053. dada uma população finita de 1000 oficiais do CML dos quais nos interessa uma característica comum (possuidores do Curso de Aperfeiçoamento de Oficiais). mas cada um deles homogêneo (por Pelotões. 56. 5976. 082. 3. 066. selecionamos os elementos da lista que ocorrem com esta periodicidade. 586. 56. 017. 004. 2. 047. por faixa etária. 75. 009.2. Logo passaremos a ler os números com 3 dígitos tomando o cuidado de observar que os números formados devem iniciar por 0. 031. e assim somaríamos o número 33 até obtermos os 30 elementos da amostra. 99. 299. 100.2. 401. 429. 053. proporcional ao tamanho desse grupo. o terceiro seria o 78°. 100. 245. 274. 353. 017. 5. U. 4 e 5(caso o número seja 500) . 2. 082. Digamos que o resultado foi 12.2. de cima para baixo. 6. 429. 041. 007. 451. 322.2. 302. 401. 192. 241.). pelo Almanaque podemos colocá-los em ordem de antiguidade e escolhida uma amostra de 30 oficiais. 274. 243. 69. 047. Ordenados os números obtidos da TNA poderemos selecionar os sargentos baseados na antiguidade. 329.. procede-se da seguinte forma: 1. 7. Dividimos o N da população (1000) pelo valor de n da amostra (30) y = 1000 / 30 = 33. SU. e o ponto inicial será o número contido na 5ª linha e 3ª coluna. 031.3 AMOSTRAGEM ESTRATIFICADA Pode ocorrer que a população seja formada por subgrupos diferentes. O primeiro elemento a ser relacionado na amostra seria o oficial que ocupasse a 12ª posição na lista. 322. vamos selecionar aleatoriamente uma quantidade de cada grupo para formar a amostra. Neste caso.33 que é aproximadamente 33. 451. Sorteia-se um número ao acaso entre 1 e 33. 116.34 AMOSTRAGEM Primeiramente adotaremos um critério para a leitura da TNA: começaremos lendo os números da direita para a esquerda. tomados 3 a 3 (a população tem n=500) . etc. 116. 007. 243. 134. 245. 134. 1. 046. . 3. 69. 3. 184. 98. 302. 112. 004. o segundo seria o 45°. Usando o número inteiro mais próximo anterior a esse resultado. 353. 192. 329. através de uma urna ou pela Tabela de Números Aleatórios. Notemos que o número correspondente ao ponto inicial é igual a 8. 9. 467. 299. 65. 184. 041.. 112. Por exemplo. 3.

Quadro e Serviço. b. Dividiremos então o n amostral (600) pelo número de Pelotões para sabermos quantos soldados de cada pelotão deveremos avaliar. no entanto. O próximo passo será determinarmos randomicamente de que posições no pelotão serão retirados os 2 elementos.2. nos certificar se a população de interesse é finita ou infinita (podemos considerar que uma população é infinita se N > 10000). 2. 4.4 AMOSTRAGEM POR CONGLOMERADOS Em algumas situações. Neste caso. podemos identificar um grupo de elementos que tenha aproximadamente a mesma composição de população. e o segundo será o 32°. 5. porém. O primeiro elemento a ser relacionado de cada pelotão será o 7° militar da listagem do pelotão. julgamos que um n amostral maior do que o previsto implicará em uma maior precisão na estimação. 05 (trataremos deste tipo de erro no Cap. que se tomarmos 2 soldados por Pelotão ao final da seleção teremos 606 soldados.3 FÓRMULAS PARA A DETERMINAÇÃO DO TAMANHO DA AMOSTRA Ao iniciarmos um estudo normalmente nos deparamos com a dúvida de qual o tamanho amostral necessário para que possamos generalizar os resultados de nossa pesquisa. bastaria verificar o estado atual dos soldados de um determinado Comando Militar de Área para que se obter inferências sobre todos Soldados EV do Exército. e c. procede-se da seguinte forma: 1. Considerando-se que existe uma formação comum aos soldados do Efetivo Variável (EV) durante o Período Básico de Instrução.35 AMOSTRAGEM Por exemplo. 3. 4). dada uma população finita de 10000 soldado do efetivo variável incorporados no CML dos quais nos interessa uma característica comum (resultado no 1° TAF) sabendo-se que estão dispostos em pelotões em suas respectivas Unidades podemos colocá-los em ordem de antiguidade e escolhida uma amostra de 600 soldados. 3. Inicialmente precisamos saber quantos Pelotões existem no CML. suporemos 33 homens por Pelotão. estipular a margem de erro admitida entre a média amostra X e a média populacional µ .2. o que pode ser feito por sorteio de 1 a 33 ou pela Tabela de números Aleatórios (suporemos que foram sorteados os números 7 e 32). y = 500 / 33 = 1. Notemos. Uma opção seria um sorteio de descarte de 6 soldados relacionados. normalmente = 0. estipular uma margem de erro para rejeição da hipótese nula. o que nos dará um valor aproximado de 303 pelotões. ou mesmo para termos a certeza de que a amostra selecionada irá bem representar a população interesse. recomendamos portanto que se mantenham os 606 soldados na amostra. Para iniciarmos a amostragem propriamente dita devemos: a. 3. possivelmente não seria necessária uma amostragem âmbito nacional para se verificar o estado da tropa. e ainda que os Objetivos de Instrução são comuns às Armas. no tocante a estes objetivos comuns de instrução. pode ser interessante realizar a amostragem usando somente os elementos desse grupo.98 que é aproximadamente 2. sendo que a amostra necessária é de 600 soldados.

Caso valor de n for maior que n1.N e² ( N-1) + z²( /2) .q. Quadro 18 – Fórmulas para o cálculo do tamanho amostral. for menor que n1.2 0. onde e= X . para a margem de erro adotada está descrito no Quadro 19. Neste caso. o cálculo de n com p=0. Em algumas situações.q.N e² Onde: n= z²( /2)= p= q= N= e² = POPULAÇÃO FINITA n= z²( /2) . o problema pode conter uma informação a respeito de p.q. p. Quando não se dispõe de informações sobre o valor de p deve-se realizar uma préamostragem com n1 elementos. e a proporção de respostas sim foi de 20% (20 dos 100). Proporção esperada de insucesso do evento. esta informação poderá ser utilizada no cálculo de n. Probabilidade aceita para o erro tipo I Proporção esperada de sucesso do evento. p. POPULAÇÃO INFINITA n = z²( /2) . Exemplo 1.8 INFINITA (0. selecionou ao acaso uma pré-amostra (n1 = 100 militares). Erro padrão de estimativa ao quadrado. Se o valor de n calculado nestas condições. .96) ² .N Número de elementos da amostra. p.36 AMOSTRAGEM Para um melhor ajuste do tamanho amostral deve-se ainda levar em consideração a proporção esperada de sucesso do evento estudado (p) em relação ao seu insucesso (q).5. O cálculo do n amostral que bem representará a população de estudo.100) Quadro 19 – Cálculo do tamanho amostral para população infinita.03) ² /2) n= 683 militares Portanto necessitaríamos entrevistar mais 583 militares (683 .µ. sendo p = 1 –q . 0.q.2 .96) ² pois (1. completa-se a pré-amostra selecionando-se (nn1) elementos.=95%) 0.8 . p. levará a um tamanho da amostra com o conseqüente problema de custo de amostragem associado (a amostra será muito grande).N e² n= (1. com 95% de confiança de que não errará por mais de 3%. a pré-amostra já conterá um número suficiente de elementos para garantir a precisão determinada. Onde: n1= z²( /2)= p= q= N= e² = Dado que: 100 (1. Se não houver informações a respeito de p e não pudermos realizar uma a préamostragem. 0. Um pesquisador pretende avaliar a proporção de militares que responderão sim a uma determinada pergunta. Para isto. (0.03)² Logo: n = z²( . O Quadro 18 apresenta 2 fórmulas para o cálculo do n amostral levando em consideração se a população é finita ou infinita. Número de elementos da população.

04) ² .q.q. Onde: n1 = z²( /2)= p= q= N= e² = z²( /2) .N Logo n= (1.64) ² .64) ² pois (1. Caso desejasse determine o tamanho da amostra necessária para estimar esta proporção com 90% de confiança.5. 0.5 0. 399 +(1.37 AMOSTRAGEM Exemplo 2. (353-199=154) Dado que: n = ---(1.q. Não sendo possível realizar uma pré-amostragem. 0. 0. consultando-os por telefone.04)² Quadro 21 – Cálculo do tamanho amostral para população finita (sem possibilidade de pré-amostragem) . p.625.5. Onde: n1 = z²( /2)= p= q= N= e² = z²( /2) .625 400 (0.N Logo n= (1.5 (ou seja.N e² ( N-1) + z²( /2) . Caso desejasse determine o tamanho da amostra necessária para estimar esta proporção com 90% de confiança. 0. 0. e não existindo estudo anterior que lhe permitisse estimar o valor de p. p.04)² Quadro 20 – Cálculo do tamanho amostral para população finita (pré-amostra menor que a amostra necessária) Exemplo 3.N e² ( N-1) + z²( /2) . cujas funções poderiam ser otimizadas pelo uso da ferramenta.04) ² . 50% dos militares faz uso e 50% não faz uso do protweb).375 0. 0.64) ² .64) ² pois (1.q.5. 399 +(1. p.5 .375.78 = 353 militares Portanto necessitaria entrevistar mais 353 militares Notemos a diferença em relação ao estudo que foi realizado com pré-amostragem. e verificando que 30 faziam uso diário do protweb. foi obrigado a considerar p=0.64) ² . 0.=90%) 30/80=0. e com erro um máximo de 4% em relação à proporção populacional deveria executar os cálculos conforme o Quadro 21. Um pesquisador está interessado em estimar a proporção de militares que faz uso do protweb nas OM da Vila Militar do Rio de Janeiro (N= 400 militares). Um pesquisador está interessado em estimar a proporção de militares que faz uso do protweb em suas OM. p. 0.400 n= 352. e com erro um máximo de 4% em relação à proporção populacional deveria executar os cálculos conforme o Quadro 20.5 400 (0. Para isto.375. 400 (0.=90%) 0. amostrou 80 militares de um cadastro de N = 400.64) ² . 400 (0.625 .400 n= 199 militares Portanto necessitaria entrevistar mais 119 militares (199-80) Dado que: n = 30 (1.

apesar do favoritismo. ele ganhe. ao lançarmos uma moeda.Capítulo 4 Probabilidade Embora o cálculo das probabilidades pertença ao campo da Matemática. Procuramos resumir aqui os conhecimentos que julgamos necessários para termos um ponto de apoio em nossos primeiros passos no caminho da Estatística Inferencial. em geral. 4. vezes sob condições semelhantes.1 ESPAÇO AMOSTRAL (S) A cada experimento correspondem. 4. em maior ou menor grau. que trata da conceituação de variável aleatória e das duas principais distribuições de probabilidades de variáveis discretas e contínuas. um conjunto de vários resultados possíveis que recebe o nome de espaço amostral. 3. Do mesmo modo. 2 S . notado por S. Co). Já ao lançarmos um dado há seis resultados possíveis: 1. Co} b) Lançamento de um dado: S = {1.. vislumbramos o acaso. c) que empate. 2 é um ponto amostral de S. 3. Ca). da afirmação “ é provável que o meu time ganhe a partida de hoje” pode resultar: a) que. Assim. 2. o conhecimento dos aspectos fundamentais do cálculo de probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial. Conseqüentemente. como pensamos. que são aqueles que. o espaço amostral é: S = {(Ca. ou coroa no primeiro e cara no segundo. ou coroa nos dois lançamentos. apresentam resultados imprevisíveis. sua inclusão neste manual se justifica pelo fato de a maioria dos fenômenos de que trata a Estatística ser de natureza aleatória ou probabilística. ou cara no primeiro e coroa no segundo. Fenômenos como esse são chamados fenômenos aleatórios ou experimentos aleatórios. Como vimos. b) que.1. 4. 6}. há dois resultados possíveis: ocorrer cara ou ocorrer coroa. (Co. Ca). (Ca. Os dois experimentos citados anteriormente têm os seguintes espaços amostrais: a) Lançamento de uma moeda: S = {Ca. como em dois lançamentos sucessivos de uma moeda podemos obter cara nos dois lançamentos. 2.Assim. 5. 5 ou 6. 4. Cada um dos elementos de S recebe o nome de ponto amostral.1 EXPERIMENTO ALEATÓRIO Em quase tudo. Esses passos serão apresentados no capítulo seguinte. o resultado final depende do acaso. mesmo repetidos várias. ele perca. (Co. Co)}.

5. 6}. E é chamado evento impossível. Um evento é sempre definido por uma sentença. logo. 3. E é chamado evento elementar. Exemplo: No lançamento de um dado. vamos admitir que todos os elementos de S tenham a mesma chance de acontecer. logo. que S é um conjunto equiprovável. A é um evento de S. . 4. temos: A = {2. Se E S e E é um conjunto unitário. se E S (E está contido em S). n(S) é o número de elementos de S.” “ Obter o número 4 na face superior. Exemplos: a. 4. 6} S.00% S = {Ca. então E é um evento de S. Co} n(S) = 2 n(A) = 1 A = {Ca} n(S) 2 Ou seja. 6} S. 2. logo. sendo S o seu espaço amostral. B = {l. onde S = {l. D = ø S. temos: Dado que: P(A) = n(A) n(S) Onde : Logo : P(A) = n(A) = 1 = 50.39 4.00%. C = {4} S.” 4. C é um evento elementar de S. Chamamos de probabilidade de um evento A (A P(A) = n(A) n(S) S) o número real P(A). os eventos acima podem ser definidos pelas sentenças: “ Obter um número par na face superior. Considerando o lançamento de uma moeda e o evento A “ obter cara” .2 PROBABILIDADE Dado um experimento aleatório.” “ Obter um número maior que 6 na face superior. qualquer que seja E. 3. Se E = S. logo. tal que: onde: n(A) é o número de elementos de A. D é um evento impossível de S. Assim. Assim. ou seja.2 EVENTOS PROBABILIDADE Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório (os eventos são denotados por letras arábicas maiúsculas).1. a probabilidade de se obter cara no lançamento de uma moeda é de ½ ou 50. 2. 5. B é um evento certo de S (B = S). E é chamado evento certo (com probabilidade 1 ou 100%).” “ Obter um número menor ou igual a 6 na face superior. 4. Se E = ø.

2.1 EVENTOS COMPLEMENTARES Sabemos que um evento pode ocorrer ou não. 4. 2.00% c. 5. 2. 6} n(S) 6 2 n(A) = 3 Ou seja. 2. se a probabilidade de se realizar um evento e p = 1/5.2. Considerando o lançamento de um dado. 6} n(S) = 6 P(A) = n(A) = 6 = 1 = 100. vamos calcular a probabilidade do evento B “ obter um número menor ou igual a 6 na face superior” : Dado que: P(A) = n(A) n(S) Onde : Logo : S = {1. 4. 3. vamos calcular a probabilidade do evento A “ obter um número par na face superior” : Dado que: P(A) = n(A) n(S) Onde : Logo : S = {1.00% n(S) 6 C=ø n(D) = 0 Ou seja. 6} n{B) = 6 n(S) 6 Ou seja. 5. 4. 3. 4. 6} n(S) = 6 P(A) = n(A) = 3 = 1 = 50.1/5 q = 4/5 Sabemos que a probabilidade de tirar o valor 4 no lançamento de um dado é: p = 1/6 Logo.00% (a probabilidade do evento certo é igual a 1). d. a probabilidade de não tirar o valor 4 no lançamento de um dado é: q = 5/6 . 4.00% A = {2. Considerando o lançamento de um dado. 3. 5. a probabilidade de se obter um número maior que 6 na face superior de um dado lançado é de 0 ou 0. para um mesmo evento existe sempre a relação: p+q=1 q=1-p Assim. 3. Considerando o lançamento de um dado. 6} n(S) = 6 P(A) = n(A) = 0 = 0 = 0. 5. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso). 4. a probabilidade de que ele não ocorra é: q = 1 –p q = 1. a probabilidade de se obter um número par na face superior de um dado lançado é de ½ ou 50. a probabilidade de se obter um número menor ou igual a 6 na face superior de um dado lançado é de 1 ou 100.00% B= {1. vamos calcular a probabilidade do evento C “ obter um número maior que 6 na face superior” : Dado que: P(A) = n(A) n(S) Onde : Logo : S = {1.00% (a probabilidade do evento impossível é igual a zero).40 PROBABILIDADE b.

41 4.2.2 EVENTOS INDEPENDENTES

PROBABILIDADE

Dizemos que dois eventos são independentes quando a realização ou a não-realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos. Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por: P(1;2) = p1 . p2 Exemplo: Considerando o lançamento de dois dados, vamos calcular a probabilidade do evento D “ obter o número 1 no primeiro dado e o número 3 no segundo dado” : Dado que: P(1;2) = p1 . p2 Onde : Logo : p1 = 1/ 6 P(1;2) = 1 . 1 = 1 p2 = 1/ 6 6 6 36 Ou seja, a probabilidade de se obter o número 1 no primeiro dado e o número 3 no segundo dado, lançados ao mesmo tempo é de 1/36 ou 2,78%. 4.2.3 EVENTOS MUTUAMENTE EXCLUSIVOS Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento “ tirar cara” e o evento “ tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: P(1;2) = p1
+

p2

a. Considerando o lançamento de um dado, vamos calcular a probabilidade do evento E “ obter o número 2 ou o número 3” : Dado que: P(1;2) = p1 + p2 Onde : Logo : p1 = 1/ 6 P(1;2) = 1 + 1 = 1 p2 = 1/ 6 6 6 3 Ou seja, a probabilidade de se obter o número 2 ou o número 3 no lançamento de um dado é de 1/3 ou 33,33%.

42

PROBABILIDADE

b. Considerando o lançamento de um dado, vamos calcular a probabilidade do evento E “ obter o número 1 ou o número 6” : Dado que: P(1;2) = p1 + p2 Onde : Logo : p1 = 1/ 6 P(1;2) = 1 + 1 = 1 p2 = 1/ 6 6 6 3 Ou seja, a probabilidade de se obter o número 2 ou o número 3 no lançamento de um dado é de 1/3 ou 33,33%. EXERCÍCIOS RESOLVIDOS 1) Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52 cartas? Como só há um ás de ouros, o número de elementos do evento é 1, logo: p = 1/52 2) Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas? Como há 4 reis, o número de elementos do evento é 4; logo: p = 4/52 = 1/13 3) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a. a probabilidade de essa peça ser defeituosa, temos: p = 4/12 = 1/3 b. a probabilidade de essa peça não ser defeituosa. Sendo este evento e o anterior complementares, temos: p =1 - 4/12 = 2/3 4) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. O evento é formado pelos elementos (1, 4), (2, 3), (3, 2) e (4, 1). Como o número de elementos de S é 36, temos: Sendo: n(A)=4 n(S)=36 logo p = 4/36 = 1/9

5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus? Temos: Dado que: P(R;5) = pR . p5 Onde : Logo : pR = 4/ 52 = 1/ 13 P(R;5)= 1 . 1 = 1 p5 = 1/52 13 52 676

43

PROBABILIDADE

6) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde? Temos: p1 = 3/9 = 1/ 3 ; p2= 2/8 = 1/4 ; p3 = 4/9 Como os três eventos são independentes e simultâneos, vem: P(1;2;3) = p1 . p2 . p3 P(1;2;3) =1/3 . 1/4 .4/9 = 1/27 7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus? A probabilidade de sair o ás de paus na primeira carta é: pA = 1/52 Após a retirada da primeira carta, restam 51 cartas no baralho, já que a carta retirada não foi reposta. Assim, a probabilidade de a segunda carta ser o rei de paus é: PR = 1/51 Como esses eventos são independentes, temos: P(A;R) = pA . pR P(A;R) =1/52 . 1/51 = 1/2652 4.3 EMPREGO DA PROBABILIDADE PARA COMPROVAÇÃO DE HIPÓTESES Normalmente se pergunta quais as chances de que certas coisas aconteçam. Usamos a probabilidade nos eventos diários. Quais são as chances de que chova? Ouvimos um meteorologista dizer que a probabilidade de chuva é de 90/o. Queremos saber se isto significa que irá chover em 90% dos lugares ou, melhor, que as chances são de 90% de que irá chover onde estamos. Os termos probabilidade subjetiva ou probabilidade personalística são usados para descrever esse conceito. Um segundo conceito de probabilidade é chamado de eventos igualmente prováveis. Por exemplo, ao jogarmos um dado, as chances dos números de 1 a 6 ocorrerem são igualmente prováveis. A terceira abordagem da probabilidade envolve o limite da freqüência relativa. Para ilustrar, suponha que joguemos uma moeda 100 vezes esperaríamos 50 caras, mas se obtivermos 45, então fr= 0,45. Jogando 1000 vezes, esperaríamos 500 caras, entretanto, podemos obter 490 caras, fr= 0,490. Se jogarmos 100000, e obtivéssemos 49995 caras, fr=0,49995, note que, quanto maior o valor de n, o limite da freqüência relativa tende a probabilidade real do evento ocorrer, ou seja, 0,5. Em um teste estatístico, extraímos uma amostra de uma população de sujeitos e eventos. Usamos afirmativas de probabilidade para descrever a confiança que depositamos nos achados estatísticos.

44

PROBABILIDADE

Freqüentemente, encontraremos um teste estatístico seguido pelo enunciado da probabilidade tal como p < 0,05. Esta interpretação seria que uma diferença ou relação deste tamanho seria esperada menos do que 5 vezes em 100, como um resultado de chance. 4.3.1 ALFA ( ) Em pesquisa, o teste estatístico é comparado a uma tabela de probabilidade para aquela estatística, a qual lhe dirá qual a chance de ocorrência. O experimentador pode estabelecer um nível aceitável de chance de ocorrência ( ) antes do estudo. Este nível de chance de ocorrência pode variar de baixo a alto, mas nunca ser eliminado. Em pesquisa comportamental, alfa (a probabilidade de ocorrência de chance) é freqüentemente de 0,05 ou 0,01 (as possibilidades de que os achados são devidos à chance são ou de 5 em 100 ou de 1 em 100). Em um estudo o experimentador pode cometer 2 tipos de erro: O erro tipo I é rejeitar a hipótese nula quando a hipótese nula é verdadeira. Por exemplo, um pesquisador conclui que existe diferença entre dois métodos de treinamento, mas na verdade não existe. O erro tipo II é não rejeitar a hipótese nula quando a hipótese nula é falsa. No exemplo anterior um pesquisador poderá concluir que não existe diferença entre os dois métodos de treinamento, mas na verdade existe. A Tab.13 é chamada de tabela da verdade, a qual demonstra erros tipo I e II. Como você pode ver, aceitar uma hipótese nula verdadeira, ou rejeitar uma falsa é a decisão correta. Controlamos os erros tipo I estabelecendo alfa. Por exemplo, se alfa é estabelecido em 0,05, então, se 100 experimentos são realizados, uma hipótese nula verdadeira de não-diferença ou de não relação entre as variáveis, seria rejeitada somente em 5 ocasiões. Embora as chances do erro ainda existam, o experimentador especificou-as exatamente pelo estabelecimento de alfa antes do estudo. Tabela 13 - Tabela da verdade Aceitação Rejeição Ho verdadeira Decisão correta Erro tipoII ( ) Ho falsa Erro tipoI ( ) Decisão correta

Deve-se de estipular o “ tamanho” do erro tipo I que se está disposto a cometer, antes do inicio de um experimento. Por exemplo, é mais importante que evitemos concluir que um método de treinamento é melhor do que o outro, quando ele realmente não é (Tipo I), do que concluirmos que um método não é melhor do que outro quando ele realmente é (Tipo II)?

podemos também conter o erro tipo II. O experimentador está garantindo que a droga tem todas as oportunidades de mostrar sua efetividade. cuja magnitude é determinada por beta ( ). ex. 0.05 ou 0. Uma abordagem mais adequada pode ser a de relatar o nível exato de probabilidade (p. Áreas de distribuição do erro tipo II . entretanto... o pesquisador deve interpretar os resultados dentro da teoria e hipóteses que foram formuladas. Assim. Observando a Fig.45 PROBABILIDADE Por exemplo. Não há nada de errado com este procedimento. Por outro lado. certifique-se de justificar a razão. Distribuição da amostragem sob Ho Distribuição da amostragem se Ho é falsa 1- Y X Figura 17. Mesmo quando os experimentadores estabelecem o alfa em um nível específico (p. p 0. Usando a informação estatística (significância e significado).. na medida em que estão somente demonstrando em que grau o nível de probabilidade excedeu o nível especificado.. p 0. t). 19 . o experimentador pode não querer aceitar a hipótese nula de “ nenhum efeito” .2 BETA ( ) Embora a magnitude do erro tipo I seja especificada pelo alfa. r.01 são amplamente utilizados na comunidade científica. esta abordagem coloca a responsabilidade da tomada de decisão onde ela deve estar no pesquisador que colocou o estudo em um modelo teórico. ex. estabelecer um alfa de 0. Então avaliaremos o significado da diferença ou relação.001 diminui enormemente as chances do erro tipo I ocorrer. em um estudo do efeito de um remédio para o câncer. 4. e que considerou pesquisas relacionadas. ex.3. embora as chances de acontecer um erro tipo I possam ser aumentadas. eles freqüentemente relatam o alfa para os efeitos específicos do estudo no nível que ocorreu (p. Não podemos dizer onde estabelecer o alfa. o experimentador pode estabelecer um alfa de 0. se existe alguma chance da droga fazer efeito. Em vez de tomar uma decisão somente estatística.30 sempre.024) associado com o teste estatístico (p. podemos notar a sobreposição da distribuição de escores na variável dependente para X (a distribuição da amostragem se a hipótese nula é verdadeira) e Y (a distribuição da amostragem se a hipótese nula é falsa).05) antes da pesquisa.012). podemos dizer que os níveis 0. ex. Se o alfa for movido para cima ou para baixo.

8). estudiosos precisam se preocupar com o significado dos resultados em suas pesquisas. O quanto uma diferença é importante na teoria e/ou na prática? 2. 0. estabelecer quanto de poder é aceitável (p. mas uma forma que tem ganhado muita atenção recentemente é o tamanho do efeito (sugerido por Cohen. 4. Isto coloca a diferença entre as médias na métrica comum chamada de “ unidades de desvio-padrão” . ex.. A fórmula do Tamanho do Efeito (TE) é: TE = (M1 . Quantos sujeitos são necessários para declarar uma diferença importante como significante? Entendendo o conceito de poder pode-se responder às duas questões anteriores. detectando uma diferença real). ex. então o tamanho da amostra necessário para o estudo pode ser estimado. existe uma relação entre alfa e beta. na pesquisa comportamental.2 ou menos é um TE pequeno. a qual pode ser comparada às orientações para a pesquisa comportamental sugeridas por Cohen (1969): 0. você poderá estar cometendo um erro tipo II ( ).5 é um TE moderado. beta torna-se maior. à medida que alfa é diminuído.3.. Assim. ).. a hipótese nula é sempre falsa! O que este enunciado reflete é que em pesquisa comportamental as médias dos dois grupos nunca são as mesmas. As questões mais interessantes em pesquisa comportamental são: 1. até certo ponto. por exemplo. se suficientes sujeitos são obtidos (uma forma de obter poder). isto é. 0. 0. É claro que. Se um pesquisador pode identificar o tamanho de um importante efeito por meio de pesquisas prévias ou simplesmente estimar um tamanho do efeito (p. de fato.3 SIGNIFICADO (tamanho do efeito) Além de reportar a significância dos resultados.5 aproximadamente é um TE moderado. e divide a diferença pelo desvio-padrão. também chamado delta.1969). O significado da diferença entre duas médias pede ser estimado de várias formas.46 PROBABILIDADE Pela especificação do alfa.M2 )/ s Esta fórmula subtrai a média de um grupo (M1) da média do segundo grupo (M2 ). você não rejeita a hipótese nula quando.4 PODER Poder é a probabilidade de rejeitar a hipótese nula quando esta é falsa (p. ex. . uma estimativa comum em ciência comportamental é 0.8 ou maior é um TE grande. Entretanto. Como podemos ver. quaisquer duas médias podem ser declaradas significativamente diferentes. indicamos que a média de Y (dado uma certa distribuição) deve ser em uma distância especificada da média de X antes da hipótese nula ser rejeitada.3. se a média de Y localiza-se em algum lugar entre a média de X e o Y especificado. ou a probabilidade de tomar a decisão correta. existe uma diferença verdadeira. 4. Ter poder na análise estatística é importante porque isto aumenta as chances de rejeitar a hipótese nula falsa.

8 0.8 0.6 0. e o tamanho do efeito (curva TE). o poder (eixo x).01. O investigador decide estabelecer alfa = 0.7 0.2 TE=0. a seriedade do erro do tipo I para o tipo II deverá ter a razão de 1 para 4 (0.6 TE=0.5 0.8 (freqüentemente recomendado como poder adequado em pesquisa comportamental.2 TE=0.beta (1.05. quando alfa é 0. Entretanto. teste bicaudal. então o poder é estabelecido em 0.Curva do tamanho do efeito para = 0.8 500 TE=0.8 050 0. existem vários estudos relacionados e o investigador calculou um TE médio = 0. n para 400 cada grupo 300 200 TE=0. n para cada grupo 500 400 300 200 TE=0.05 ou 0.7 TE=0. teste bicaudal.9 Poder Figura 20 . beta 0. Considere o seguinte exemplo: No planejamento de um estudo. 1991.4 0.2 = 0.4 0.01.6 0.3 TE=0.47 PROBABILIDADE As Figuras 20 e 21 oferecem uma visão da relação entre o tamanho da amostra. o investigador terá dois grupos que serão randomicamente formados.4 100 TE=0. Green.4 TE=0.7 0.Curva do tamanho do efeito para = 0. mas ele não sabe quantos sujeitos são necessários para cada grupo para detectar uma diferença significativa entre os tratamentos. Uma vez que o poder é 1 .20).05 x 4 = 0.5 100 TE=0.3 0.9 Poder Figura 21 .3 0.5 TE=0. .0.3 0.6 050 TE=0.7 TE=0. (eixo y). 502).20) porque Cohen (1988) sugeriu que em ciências comportamentais. p.0 .5 0.8).70 favorecendo o grupo experimental nos resultados desses estudos.05 e quer proteger beta em 4 vezes o nível de alfa (assim.

48 PROBABILIDADE Quando as informações prévias são conhecidas (alfa. TE e poder). então o número de sujeitos necessários em cada um dos dois grupos pode ser estimado da Fig.. 21 (alfa = 0. 20 Deve-se ler a curva TE 0.8) e TE (0. o poder é reduzido (dado o mesmo TE). 20.01). um maior número de sujeitos é requerido para detectar uma diferença significativa.05) para 50. Conforme o número de sujeitos em cada grupo é reduzido. . e então. que para um alfa mais rigoroso (p. Analisando a Fig. 0. nota-se que para o mesmo nível de poder (0.8. onde alfa 0.70 por onde atravessa o eixo x (poder) em 0. o número de sujeitos necessários aumenta de 30 (como na Fig.70). Pode-se verificar.01).05 a 0. ex. ler através do eixo y (tamanho da amostra) e observar que 30 sujeitos serão necessários para cada grupo.

Co).53% 15.69% 3.1 VARIÁVEL ALEATÓRIA Suponhamos um espaço amostral S. definida uma função chamada variável aleatória. de acordo com a Tab. Ponto amostral (Ca. 14. Tabela 14 . Co) (Co. se o espaço amostral relativo ao “ lançamento simultâneo de duas moedas” é 4 {(Ca.85% 19.08% 100. a cada ponto amostral seja atribuído um número. Número de punições 0 1 2 3 4 5 6 7 8 total fi 2 3 4 1 5 2 1 2 6 26 Probabilidade de ocorrência 7. 15. durante o primeiro semestre do ano de instrução. (Co.69% 23. 5.85% 7. é apresentar dois modelos teóricos de distribuição de probabilidade. Fica. Ca). indicada por uma letra maiúscula.Punições disciplinares durante o primeiro semestre do ano de instrução. a cada ponto amostral podemos associar um número para X. aos quais um experimento aleatório estudado possa ser adaptado. Ca). sendo seus valores indicados por letras minúsculas. de acordo com a Tab. Ca) (Co. Co) total 5.69% 11. (Ca. Ca) (Ca. o que permitirá a solução de grande número de problemas práticos. Tabela 15 .00% x 2 1 1 0 4 . e que.Capítulo 5 Distribuições Binomial e Normal O que pretendemos neste capítulo.23% 7. Assim.38% 3.Resultados possíveis do lançamento simultâneo de 2 moedas. então.2 DISTRIBUIÇÃO DE PROBABILIDADE Consideremos a distribuição de freqüências relativa ao número de punições semanais em uma companhia. Co)} e se X representa “ o número de caras” que aparecem. (Co.

denominada tabela de distribuição de probabilidade.50 DISTRIBUIÇÕES BINOMIAL E NORMAL Em suma.. fr3. c. e d.1/2=1/4 1/2 . a cada valor xi a probabilidade fri de ocorrência de tais pontos no espaço amostral. definem uma distribuição de probabilidade. Assim. Assim. pode-se extrair da Tab. Tabela 16 . 15 as seguintes observações: a.Verificação das freqüências em que aparece o resultado cara Ponto amostral (Ca.08%. Ca) apresentam cara uma vez. Da Tab. e suas correspondentes fr1.. temos a Tab. ocorrerem oito punições disciplinares é de 23.85% 19.69% 11..85% 7. Associamos. a probabilidade estimada de ocorrer uma punição disciplinar é de 11. a probabilidade estimada de ocorrerem duas punições disciplinares é de 15. 16....00% Seja X uma variável aleatória que pode assumir os valores x1..69% 23.xn. voltando à Tab.23% 7. Ca) (Co. b. frn.. Co) total x 2 1 1 0 4 P(X)=fri 1/2 .69% 3. x2. Ca) (Ca. fr2. x3. temos: fri = 1 Os valores x1. a cada valor xi correspondem pontos do espaço amostral. x2. Co) e (Co.. então. x3.53%.xn.38% 3.1/2=1/4 1/2 .08% 100. 17: Tabela 17 .1/2=1/4 1/2 . Co) (Co..Probabilidade de ocorrência de punições disciplinares durante o primeiro semestre do ano de instrução Número de punições 0 1 2 3 4 5 6 7 8 total fi 2 3 4 1 5 2 1 2 6 26 Probabilidade de ocorrência 7. .38%.1/2=1/4 Verifiquemos que os pontos amostrais (Ca. a probabilidade estimada de não ocorrer punição disciplinar é de 7.. 15 poderíamos escrever a Tab. de forma que a probabilidade de sair cara uma vez é 1/4 + 1/4 = 2/4.53% 15.. 16.69%.

51 DISTRIBUIÇÕES BINOMIAL E NORMAL Logo. X 1 2 3 4 5 6 5. 2. assim definida. a. considerar experimentos que satisfaçam as seguintes condições: (n). c. As provas repetidas devem ser independentes. neste item. n)..Distribuição de probabilidade do lançamento de um dado. . 2. os valores x (i = 1. d. um número finito de vezes P(X) 1/6 1/6 1/6 1/6 1/6 1/6 1 P(X)= b. Como a cada um destes valores está associada uma e uma só probabilidade de realização e P(xi) = 1. No decorrer do experimento. ao lançarmos um dado. o resultado de uma não deve afetar os resultados das sucessivas. pode tomar os valores 1.. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso. nas mesmas condições. o seu conjunto imagem. da qual resulta a distribuição de probabilidade Tab. Essa função. 6. O experimento deve ser repetido. 3. a variável aleatória X. fica definida uma função de probabilidade. . O experimento “ obtenção de caras em cinco lançamentos sucessivos e independentes de uma moeda” satisfaz essas condições.. de acordo com a Tab. estabelecemos uma correspondência unívoca entre os valores da variável aleatória X e os valores da variável P. 18: Tabela 18 . Assim. conforme sua distribuição de probabilidades.3 DISTRIBUIÇÃO BINOMIAL Vamos.. é denominada função probabilidade representada por: f(x) = P (X = xi) A função P (X = xi) determina a distribuição de probabilidade da variável aleatória X. definida por “ pontos de um dado” . podemos escrever a Tab. Esta correspondência define uma função. isto é. 2 n) formam o domínio da função e os valores P (i = 1. . Número de caras 2 1 0 fri fri 1/4 2/4 1/4 1 Ao definirmos a distribuição de probabilidade.. a probabilidade p do sucesso e a probabilidade q (q = 1p) do insucesso manter-se-ão constantes. Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n tentativas.. 3. 19: Tabela 19 . 17.Verificação das freqüências em que aparece o resultado cara.

pk .p = q.k)! Onde: n=5 Logo: k=3 P(X = 3) = 5! . a probabilidade de não-realização desse mesmo evento (insucesso) é 1 . A probabilidade de que um evento se realize k vezes nas provas é dada pela função: f(X) = P(X = k) = n! k! (n.k)! Logo: P(X = 4) = 6! .3)! p=1/2 q=1/2 P(X = 3) = 5x4x3x2x1 . A e B. qn-k na qual: P(X = k) é a probabilidade de que o evento se realize k vezes em n provas. k! (n.4)! P(X = 4) = 6x5x4x3x2x1 . Encontre a probabilidade de o time A ganhar 4 jogos. que realizemos a mesma prova n vezes sucessivas e independentes. 4/9 4x3x2x1x2x1 P(X = 4) = 20/243 . p é a probabilidade de que o evento se realize em uma só prova sucesso.52 DISTRIBUIÇÕES BINOMIAL E NORMAL Sabemos que. denominada lei binomial. EXERCÍCIOS RESOLVIDOS insucesso.k)! . Calcule a probabilidade de serem obtidas 5 caras nessas 5 provas. Pela lei binomial. Suponhamos. jogam entre si 6 vezes. se a probabilidade de realização de um evento (sucesso) é p. Pela lei binomial. qn-k k! (n. (2/3)6-4 4! (6. pk . (1/2)3 . podemos escrever: Dado que: P(X = k) = n! . pk . qn-k k! (n. quando da realização de um experimento qualquer em uma única tentativa. 1/8 . podemos escrever: Dado que: P(X = k) = Onde: n=6 k=4 p=1/3 q=2/3 n! .k)! Essa função. 1/4 3x2x1x2x1 P(X = 3) = 5/16 2) Dois times de futebol. q é a probabilidade de que o evento não se realize no decurso dessa prova n! é o coeficiente binomial de n sobre k. (1/2)5-2 3! (5. 1) Uma moeda é lançada 5 vezes seguidas e independentes. agora. 1/81 . define a distribuição binomial. (1/3)4 .

A representação gráfica da distribuição normal é uma curva em forma de sino. Quando temos em mãos uma variável aleatória com distribuição normal. já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.5. isto é. nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. b. por meio de um exemplo concreto.53 DISTRIBUIÇÕES BINOMIAL E NORMAL 5. isto é.5. ambas as probabilidades são iguais a 0.Aspecto gráfico de uma distribuição normal.4 DISTRIBUIÇÃO NORMAL .CURVA NORMAL Entre as distribuições teóricas de variável aleatória contínua. Vejamos como proceder. aproxima-se indefinidamente do eixo das abscissas sem. Figura 22 . correspondente à área hachurada na Fig. observe a Fig. simétrica em torno da média (X). A variável aleatória X pode assumir todo e qualquer valor real. Escrevemos: P(X> X) = P(X < X) = 0. A área total limitada pela curva e pelo eixo das abscissas é igual a 1. indicada pó P(9 < X < 9. Seja X a variável aleatória que representa os diâmetros dos cartuchos de 9mm produzidos por certa máquina. e e. A curva normal é assintótica em relação ao eixo das abscissas.05 mm É fácil notar que essa probabilidade. Como a curva é simétrica em torno da X. X Para uma perfeita compreensão da distribuição normal. 22 e procure visualizar as seguintes propriedades: a. 22. que recebe o nome de curva normal ou de Gauss. supondo que essa variável tenha distribuição normal com média X = 9 mm e desvio padrão S = 0. alcançá-lo. uma das mais empregadas é a distribuição normal descrita na Fig.05). a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média.04 mm. . 23. contudo. d. Pode haver interesse em conhecer a probabilidade de um cartucho ter um diâmetro com valor entre 9 e 9. c.

podemos escrever: P(X< X < x) = P(0 < Z < z). então a variável z tem distribuição normal reduzida. agora. que corresponde ao último algarismo do número 1. isto é. que se X é uma variável aleatória com distribuição normal de média X e desvio padrão s.3944.05 (x = 9 z = 0. calcular o valor de z que corresponde a x = 9.54 DISTRIBUIÇÕES BINOMIAL E NORMAL 9 9. Queremos calcular P(9 < X < 9.25. Na intersecção da linha e coluna correspondentes encontramos o valor 0.05 – 9 = 0. Temos.05 Figura 23 . z = xi – X s As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas.05mm. O cálculo direto dessa probabilidade exige um conhecimento de Matemática mais avançado do que aquele que dispomos no curso de 2° grau. encontramos. podemos contornar facilmente esse problema. que.04 donde: P(9 < X < 9. O Anexo V contém é uma tabela de distribuição normal reduzida.05). se X é uma variável aleatória com distribuição normal de média X e desvio padrão s.Probabilidade de X encontrar-se entre 9mm e 9. precisamos. Entretanto. que nos dá a probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z.3944 .25 s 0. sem demonstração. isto é: P(0 < Z < z) Temos. então. Para obter essa probabilidade.05) = P(0 < X < 1.25) = 0. pois X = 9).25. na primeira linha. não havendo necessidade de serem calculadas. Basta aceitar.25) Procuremos.04 0. tem distribuição normal de média o e desvio padrão 1. então: z = xi – X = 9. no Anexo V o valor de z = 1. com z = xi – X s Voltemos. em primeiro lugar.2. então. o que nos permite escrever: P(0 < Z < 1. Em seguida. o valor 5.05 = 1. Na primeira coluna encontramos o valor 1. ao nosso problema.

23 ) = 0.c.5) = 0.05mm é 0.5 < Z < 1.3944 ou 39.1855 .25 0 P( .8 < Z < 1.48) Como: .48) =0. Determine as probabilidades: 1.48) A probabilidade procurada corresponde à parte hachurada da figura: Temos que P(.55 DISTRIBUIÇÕES BINOMIAL E NORMAL Assim.23) = P( 0 < Z < 1.25 < Z < 0) A probabilidade procurada corresponde à parte hachurada da figura: Sabemos que: P(0 < Z < 1.48) = 0.3944 Pela simetria da curva.b. a probabilidade de uma munição 9mm . então: P(9 < X < 9.44% EXERCÍCIOS RESOLVIDOS 1.3944 1.5 0 1.23 P( 0 < Z< 1.1026 = 0.P( 0 < Z < 0.25) = 0.0.0. temos: .0.1.05) = P(0 < Z < 1.5 < Z < 0)+ P( 0 < Z < 1. P(. Escrevemos.4306 = 0.23) A probabilidade procurada corresponde à parte hachurada da figura: Temos que P( 0.0.2881 P( 0 < Z< 0.8) = 0.1026 Obtemos: P( 0.2881 -0.0.5 < Z < 1.6221 1.25) = 0.1915 P( 0 < Z< 1.8 < Z < 1. P( -1.0.25) = 0.8 < Z < 1.8) Como: 00.4306 Obtemos: P(.3944.a.48) = P(.25 < Z< 0) = P(0 <Z < 1.48 P( .23) = 0.1915 +0. apresentar um diâmetro entre a média 9mm e o valor x = 9.23) .5 < Z< 0) = P(0 <Z < 0.5 < Z < 1.fabricada por essa máquina.1.8 1. P(0.

6) = 0. Admitindo-se que 500 alunos de um curso de pós-graduação estão distribuídos normalmente em torno de um grau final de curso 8. que nota deveria ser o ponto de corte para a seleção? Devemos inicialmente determinar os valores da variável de distribuição reduzida.3212= 0.92) = 0. 0.6 P( Z > 0) = 0.2810 Se então zxi = xi – X s xi = zxi .e.4000) por interpolação o zxi = 1.5248 . P(Z > 0.6 ) = 0.5 e com desvio padrão de 0. s +X 0 zxi logo: xi = 1.00%.6) DISTRIBUIÇÕES BINOMIAL E NORMAL A probabilidade procurada corresponde à parte hachurada da figura: Temos que P( Z > 0.97% zxi = 1.56 1.d.6 ) = P( Z > 0) . e em se querendo selecionar 10% destes alunos para realizarem um curso de aperfeiçoamento. logo.5 e P( 0 < Z < 0.5 + 0.28 .5 – 0.92) A probabilidade procurada corresponde à parte hachurada da figura: Temos que P( Z < 0. 40.2810 .8 + 8.92 ) = P( Z < 0) + P( 0 < Z < 0.8.2258 Obtemos: P( Z > 0.6) Como: 0 0.92) Como: 0 0.2258 = 0. devemos encontrar o valor de z que represente 40% dos valores maiores que a média (0.92 P( Z < 0) = 0.5= 9.P( 0 < Z < 0. P(Z < 0. Assim: Temos que zxi deve conter todos os valores menores que o ponto de corte que é de 10.5 e P( 0 < Z < 0.8212 2.2742 1.00% / 39.6 ) = 0.3212 Obtemos: P( Z > 0.

6. bem como o uso de correlações para previsões. negativa ou nula. incluindo as correlações parciais. que quanto mais próxima de uma reta. podendo variar entre 0.1 INTRODUÇÃO Este capítulo discute brevemente vários tipos de correlação. como também três ou mais variáveis (correlação múltipla). O r pode ser calculado pela fórmula: r= n XY – ( X).Capítulo 6 Correlação e Regressão 6. Portanto. conforme a Fig. 24c. a correlação tende a 0. Isso denota independência entre os grupos de escores.00. existe uma variável critério (ou dependente) e uma variável preditora (ou independente). como o peso corporal. a correlação pode ser positiva. 24a e Fig. a significância dos coeficientes correlacionais.00.00 (correlação nula) e 1. formam uma elipse.1. A correlação é uma técnica estatística utilizada para determinar o relacionamento entre duas ou mais variáveis.( Y) n X² – ( X)² n Y² – ( Y)² De acordo com a força da relação entre as variáveis. resistência muscular. porcentagem de gordura. Nesse tipo de correlação. tais como o relacionamento entre a altura e o peso. Quando os escores de cada par ordenado são plotados em um gráfico de dispersão. como quando alguém investiga o relacionamento entre um critério (variável dependente) tal como força muscular e duas ou mais variáveis determinantes (variáveis independentes).00 < r < +1. 24b. que não exibem um padrão discernível.00 (correlação perfeita) tanto na direção positiva quanto na negativa. conforme as Fig. .2 COEFICIENTE DE CORRELAÇÃO DE PEARSON O coeficiente de correlação de Pearson (r) é um valor quantitativo do relacionamento entre duas ou mais variáveis. mais perfeita será a correlação entre as variáveis. Freqüentemente um pesquisador está interessado no grau de relacionamento entre variáveis. CORRELAÇÃO POSITIVA Y 145 130 115 100 85 70 55 40 20 30 40 50 60 70 X CORRELAÇÃO NULA Y 145 130 115 100 85 70 55 40 20 30 40 50 60 70 X Y 145 130 115 100 85 70 55 40 20 CORRELAÇÃO NEGATIVA 30 40 50 60 70 X Figura 24a – Correlação positiva Figura 24b – Correlação nula Figura 24c – Correlação negativa . Quando virtualmente não existe relação entre variáveis. A correlação pode envolver duas variáveis (correlação simples).

141231 – 2169729 1103968 – 1060560 540160 – 518400 2259696 – 2169729 43408 147. já que esses são geralmente mais fortes do que os mais leves. e uma grande quantidade da variável X é associada com uma grande quantidade da variável Y. A Tab.98107 A Fig. 13 e 14.98107) quase perfeita. 20 apresenta o cálculo de r para as variáveis: peso corporal (X) e força muscular (Y).58 CORRELAÇÃO E REGRESSÃO Uma correlação positiva existe. 299. . como por exemplo os sujeitos: 2 e 3. 7 e 8. quando uma pequena quantidade da variável X é associada com uma pequena quantidade da variável Y .945 r= = r = 0. O peso corporal e a força muscular estão correlacionados positivamente nos sujeitos mais pesados. Tabela 20 – Cálculo do coeficiente de correlação de Pearson. 5 e 6. 25 é uma ilustração gráfica da correlação positiva (r = 0. i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Peso Força (X) (Y) 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 720 58 68 65 78 80 76 92 90 100 98 103 104 114 112 115 120 1473 XY 1740 2176 2210 2808 3040 3040 3864 3960 4600 4704 5150 5408 6156 6272 6670 7200 68998 X² 900 1024 1156 1296 1444 1600 1764 1936 2116 2304 2500 2704 2916 3136 3364 3600 33760 Y² 3364 4624 4225 6084 6400 5776 8464 8100 10000 9604 10609 10816 12996 12544 13225 14400 141231 Sendo: Cálculo de r n X² – ( X)² n = 16 X = 720 e ( X)²= 518400 Y = 1473 e ( Y)²= 2169729 XY = 68998 X² = 33760 Y² = 141231 r = n XY – ( X). A correlação não é perfeita porque encontramos sujeitos mais leves que são mais fortes do que sujeitos mais pesados.1 85 70 55 40 20 X=45 30 40 50 60 70 Kg figura 25 – Gráfico de dispersão da relação força muscular X peso corporal. 9 e 10. 33760 – 518400 16.5127 . 1473 16.( Y) n Y² – ( Y)² r= r= 16. 68998 – 720. CORRELAÇÃO ENTRE FORÇA MUSCULAR E PESO CORPORAL Lb 145 130 115 100 X=92.

o peso corporal pode fornecer uma tendência. desta forma. 11350 – 1400. A flexão na barra é executada pela suspensão do peso corporal até o queixo passar acima da barra. indicando freqüentemente que pessoas mais pesadas tendem a executar um número menor de barras do que as pessoas mais leves. .99579) quase perfeita.59 CORRELAÇÃO E REGRESSÃO Uma correlação negativa existe. 154 16. CORRELAÇÃO ENTRE PESO CORPORAL E FLEXÕES NA BARRA Nr 21 18 15 12 X=9. e uma grande quantidade da variável X é associada com uma pequena quantidade da variável Y.21 apresenta o cálculo de r para as variáveis: peso corporal (X) e flexão na barra (Y). 26 é uma ilustração gráfica da correlação positiva (r = – 0.585 r= r= = r = 0.99579 A Fig. A Tab.6 9 6 3 0 45 55 X=45 65 75 85 95 105 115 125 Kg figura 26 – Gráfico de dispersão da relação peso corporal X flexões na barra.782 . quando uma pequena quantidade da variável X é associada com uma grande quantidade da variável Y . 2018 – 23716 181600 – 215600 2096000 – 1960000 32288 – 23716 – 34000 368. Tabela 21 – Cálculo do coeficiente de correlação de Pearson.( Y) n Y² – ( Y)² r= 16. 131000– 1960000 16. 92. i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Peso (X) 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 1400 Flexões (Y) 20 18 16 15 14 13 12 10 8 7 6 5 4 3 2 1 154 XY 1000 990 960 975 980 975 960 850 720 665 600 525 440 345 240 125 11350 X² 2500 3025 3600 4225 4900 5625 6400 7225 8100 9025 10000 11025 12100 13225 14400 15625 131000 Y² 400 324 256 225 196 169 144 100 64 49 36 25 16 9 4 1 2018 Sendo: Cálculo de r n X² – ( X)² n = 16 X = 1400e ( X)²= 1960000 Y = 154 e ( Y)²= 23716 XY = 11350 X² = 131000 Y² = 2018 r = n XY – ( X).

e se é positivo ou negativo.1946 é significante com 100 gl. gl= n -2 . e 0. podemos citar um estudo que pretendesse verificar a relação entre o posto/graduação de militares e seu desempenho no tiro prático de pistola. dever-se-ia levar em consideração outras variáveis que provavelmente tenham correlação com o resultado do tiro.01. Para tal. Por exemplo. No exemplo ilustrativo acima.4227 é significante com 20 gl. que representa a probabilidade de obter-se uma relação similar se o estudo fosse repetido n vezes. que.4863 para a significância de um teste bi-caudal no nível 0.60 6. (Explicaremos teste uni-caudal ou bi-caudal na seção sobre a interpretação de t no Volume II). O nível significância pode ser estabelecido por meio de cálculos matemáticos ou.2 = 16 .4 INTERPRETAÇÃO DE “ r” Existem muitas formas de se interpretar o r. A única forma de demonstrar uma causa é com um experimento no qual uma variável independente pode ser manipulada para produzir um efeito. e ler a tabela de acordo com os graus de liberdade (gl) adequados [gl são baseados no número de sujeitos (n) corrigidos para tendências amostrais (2 variáveis)].05. coeficientes de correlação muito baixos podem ser significantes para uma amostra ampla de sujeitos. Por outro lado. mas que não se pode inferir somente com o resultado de uma correlação. satisfatório ou insatisfatório. A correlação necessária para um determinado nível de significância diminui com o aumento do número de sujeitos. .2500 é significante com 60 gl. necessariamente. deve-se entender o que significa. vemos que é necessária uma correlação de 0. melhorando seu resultado). deve-se selecionar o nível desejado. uma maior correlação é exigida para a significância no nível 0. consultando a Tabela “ r” (Anexo VI). bastaria que promovêssemos todos os recrutas ao posto de coronel para que só houvesse excelentes atiradores de pistola no Exército (parece lógico?!). os graus de liberdade são n . Não se pretende dizer que uma variável não possa ser a causa de outra. No nível 0.05. em termos de ser alto ou baixo. tais como: experiência do atirador (quanto mais se pratica melhor tende a ser o resultado) e o “ nervosismo” do atirador (com a prática prolongada o atirador tende a ficar menos nervoso durante a performance. r = 0. Desta forma.5742 no nível 0.2 = 14. sendo um dos critérios sua significância (confiabilidade).01). Logo se pode concluir que uma correlação de r = – 0.05 ou 0.01 do que no nível 0. Pesquisadores inexperientes (ou desatentos) talvez concluíssem que quanto maior o posto/graduação. melhor seria o resultado no teste de tiro prático de pistola.5 (e 0.3 CORRELAÇÃO E CAUSA CORRELAÇÃO E REGRESSÃO Uma correlação entre duas variáveis não significa. Ao ler-se a tabela no gl 14. Para o exemplo de correlação entre o peso corporal e as flexões na barra (r = – 0. 6. logo.98107 é significante.99579). Muito provavelmente encontraríamos capitães com muito bons resultados e recrutas com péssimos resultados. tais como 0. e as variáveis intervenientes podem ser controladas. uma correlação de 0. para r. (onde n refere-se ao número de pares de escores). Além de se verificar o valor de r. simplesmente. que uma variável causa a outra.

É estatisticamente insuficiente tentar calcular a média dos coeficientes por eles mesmos.09. existe 49% de variação comum (explicada).05.90 não é simplesmente três vezes maior do que uma correlação de 0. conforme sua significância. A Tabela 22 apresenta a relação entre o coeficiente de correlação e as variações explicadas e não explicadas um breve exemplo Tabela 22 – Relação entre r e as variações explicadas e não explicadas r 0.900 0. portanto.5 TRANSFORMAÇÃO “ Z” DO “ r” Um pesquisador pode estar interessado em determinar a média de duas ou mais correlações. e 51% (1.500 0.30.300 Explicada 81% 64% 49% 36% 25% 16% 9% Variação Não Explicada 19% 36% 51% 64% 75% 84% 91% O tamanho comparativo das correlações devidas ao coeficiente de determinação também pode ser observado. Quando se utiliza o coeficiente de determinação para interpretar os coeficientes de correlação. é nove vezes maior (0.80.00 . esperasse cometer este erro somente uma vez a cada 100 experimentos devido ao acaso. uma correlação maior é exigida para a significância no nível 0.01.0. pois quanto maior for a correlação mais desviada se torna a distribuição.700 0. ou 9%.01 é mais preciso do que no nível 0.05 significa que se 100 experimentos fossem conduzidos.800 0.70. porque a distribuição de amostras dos coeficientes de correlação não é normal.900²= 0. 6. e 0. ou explicados pelos. fatores envolvidos na performance do outro teste. ou 81%). O critério mais comumente usado para a interpretação de r . Para uma correlação de 0. A Estatística pode responder se os efeitos são confiáveis.0 . fica evidente que uma relação mais substancial é necessária para explicar uma grande quantidade de variação comum. . o teste de significância no nível 0. e. apenas cerca da metade (49%) da variação (ou influências) em um teste é associada com a outra. Uma correlação de 0. ou devida à variação na outra medida. somente em 5 das 100 ocasiões.81.600 0. que indica a porção da variação total em uma medida que pode ser explicada. e se eles são significantes.702) de variação de erro (não explicada). Com uma correlação de 0.400 0. pelo acaso.61 CORRELAÇÃO E REGRESSÃO O nível 0.01. assumiria-se a possibilidade de se rejeitar a hipótese nula (de que não existe relação). Se r = 0. Logo.r2) refere-se à variação em uma variável (dependente) que não ocorre em função da manipulação da outra variável (independente).300² = 0. No nível 0. A variação não explicada (1. então 64% da performance em um teste são associados com.70 entre duas variáveis. é o coeficiente de determinação (r2).

Para combinarmos essas correlações de amostras a fim de se obter uma estimativa válida e confiável da relação entre essas duas variáveis. Tabela 23 Cálculo da média dos coeficientes de correlação (transformação Z). converter cada correlação para um valor Z utilizando a Tabela para transformação de r para z (Anexo VII). Z = 1. localizando o valor Z correspondente para qualquer coeficiente de correlação em particular.735 Z 0. calcular a média do valor Z dividindo-se pela amostra total [ (n-3)]: 125. Tal procedimento envolve o uso de logaritmos naturais.770 0.020 0. Alguns autores afirmam que para calcular a média das correlações pela transformação Z.007.010 38. que nesse processo é n – 3. que obtivemos correlações entre a distância percorrida e a freqüência cardíaca durante a corrida do TAF (correr-caminhar por 12 minutos) em quatro grupos de sujeitos de diferentes de idades. não necessitamos utilizar a fórmula de Fisher para calcular as transformações. a. converter o valor médio do Z contrapesado a uma correlação média consultando-se novamente a Tabela para transformação de r para z.886 Passos da utilização dos valores Z para o cálculo da correlação média. A transformação Z é também utilizada para os testes estatísticos (tais como aqueles para a significância do coeficiente de correlação) e para determinar a significância da diferença entre dois coeficientes de correlação.728 125. somar os valores contrapesados de Z. basta utilizar a Tabela para transformação de r para z.929 = n-3 30 32 31 32 125 Z com peso 26.765.007 o r médio é 0. deve-se primeiro estabelecer que não existem diferenças significativas entre as correlações testadas.886/125 = 1. d. e. b.700 0. . Todavia. devese proceder conforme a Tab. c. Grupo etário 18-25 26-33 34-40 41-47 n 33 35 34 35 r 0. 23. Uma comparação de diferenças poderia ser feita utilizando um teste de qui-quadrado para os valores de Z com contrapeso (o qui-quadrado é uma técnica não-paramétrica discutida no Volume 2). Suponha. contrapesar os valores Z multiplicando-os pelos graus de liberdade para cada amostra.867 1.62 CORRELAÇÃO E REGRESSÃO O método mais satisfatório de aproximação da normalidade de uma distribuição de amostras de relações lineares é pela transformação dos r para valores Z (transformação Z de Fisher).528 31.620 29.835 0. por exemplo.204 1.

Geralmente utilizam-se as fórmulas abaixo descritas para o cálculo da linha de melhor ajustamento (reta de regressão) Y= a+bX Sendo: a = Xy – bXx b= r (Sy/Sx) Onde: Y = variável dependente (critério) a = o ponto de intersecção b = a inclinação da linha de regressão X = variável independente (preditor) Xy e Sy = média e desvio padrão de y Xx e Sx= média e desvio padrão de x r = correlação entre X e Y Quadro 22 – Fórmula da regressão linear A letra a da fórmula de regressão indica a intersecção da linha de regressão no eixo y. Quanto mais alta for a relação entre as duas variáveis. Por exemplo.995.995. Em outras palavras.98107 Sendo: Y= a+bX Onde: b = r (Sy/Sx)= 0. o qual chamaremos de erro de predição.522 0.285 Logo : Y = 2.361 0. um sujeito pesando 100 Kg teria um escore Y (força predita): Y = 2. utiliza-se uma equação de predição (regressão) baseada na correlação entre X e Y.522) b = 1. (19. 20.995. A inclinação da linha (b) significa a quantidade de mudança em Y que acompanha uma mudança de 1 unidade de X.06 19.995 a = Xy – bXx = 92.785 Quando prevemos a força muscular a partir do peso corporal a correlação (r = 0.6 REGRESSÃO LINEAR CORRELAÇÃO E REGRESSÃO Um dos propósitos da correlação pode ser a previsão.98107.X = 2.361/9.63 6.100 Y = 201.06 . peso corporal (X) e força muscular (Y). mais precisamente poder-se-á prever Y a partir de X.onde a correlação entre o peso corporal (X) e força muscular (Y) foi r = 0. podemos calcular o escore de força muscular (Y) predito. Deste modo é possível dizer que existe um erro na estimativa de Y a partir de X. Utilizando os dados da Tab.285 + 1.98107 Força 92. 45. Sempre que se deseja estudar determinada variável dependente (sobre a qual deseja-se fazer uma estimativa) . ou seja a correlação não é perfeita.285 + 1. As médias e os desvios-padrão são os seguintes: Medida X S r Peso 45.00 9.285 + 1.X Quadro 23 – Cálculo da equação de regressão linear Para qualquer peso corporal (X). .995 .98107) é menor do que 1. em função de uma variável independente.00. a é o valor de Y quando X = 0.00 a = 2.98107 .1.

285) 0 0 20 40 X=45 60 80 100 120 Kg Figura 27 – Regressão linear da relação força muscular X peso corporal. 2.995. Quanto mais próximo da perfeição estiver o nível de correlação entre as variáveis X e Y.285 + 1. 27 mostra essa linha de melhor ajustamento. .99. pode-se notar que os escores não se situam na linha reta. Para tal pode-se eleger um escore X alto (60Kg). Conseqüentemente. vemos que existe algum erro na predição. Para um peso corporal de 60kg. uma diferença de -1. devemos calcular uma linha de melhor ajustamento para prever Y a partir dos escores X.99Kg.14Kg no dinamômetro. 25 mostra que a dispersão dos escores de peso e força não forma uma linha reta. Essas diferenças entre o escore Y previsto e o real representam erros de predição e são chamados de escores residuais. mas ele obteve apenas 120Kg. Para um peso corporal de 30Kg. Deve-se então.995.14.60= 121.99Kg.30 = 62. Essa linha passa pela intersecção das médias X e Y A Fig. Ao mesmo tempo. Na construção dessa linha de melhor ajustamento. esperava-se que o sujeito de 30Kg obtivesse 62.7 LINHA DE MELHOR AJUSTAMENTO E ERRO DE PREDIÇÃO A Fig. Se computássemos todos os escores residuais.64 CORRELAÇÃO E REGRESSÃO 6. uma diferença de – 4. e um baixo (30kg) e aplicamos a fórmula de predição. O escore de força previsto para o sujeito de 60kg foi de 121. ou erro de estimativa padrão (Sy.1 80 60 40 20 a= (0. Desta forma. predize-se Y= 2. selecionamos um alto peso corporal (60) e um peso corporal baixo (30) e predizemos seus valores Y Quando examinamos seus valores Y reais. mas em torno da mesma. mais próximos da linha de melhor ajustamento estarão os escores plotados.14Kg. prediz-se Y = 2. e na verdade ele obteve 58Kg. Lb Kg CORRELAÇÃO ENTRE FORÇA MUSCULAR E PESO CORPORAL 120 100 X=92.x). plotar esses dois valores previstos no gráfico de dispersão e conectá-los com uma linha reta. a média seria zero e o desvio-padrão seria o erro de predição padrão. mas sim uma elipse.285 + 1.

26% dos casos.285 + 1.74% dos casos.361 1 .8 CORRELAÇÃO PARCIAL Quando existe pouca ou nenhuma correlação entre duas variáveis X e Y.x = 19. um sujeito de 50Kg teria uma força predita de Y = 2.x= 2. positiva e provavelmente alta.361 .x = erro de predição padrão Sy = desvio padrão de Y r = correlação entre X e Y Quadro 24 – Fórmula do erro de predição padrão (Sy.38 Kg e 104.65 CORRELAÇÃO E REGRESSÃO Uma forma mais simples de se obter o erro de predição padrão é utilizar a fórmula Sy.04 Kg mais ou menos o erro de predição.x ) em 99.72 Kg e 107. menor será o erro. O erro de predição padrão é interpretado da mesma forma que o desvio-padrão.361 e r = 0. e entre 94. entre 96.36 Kg (Y + 2Sy.02 Kg (Y + 3Sy. mais ou menos o erro de estimativa padrão.x = Sy 1-r² Sendo: Sy. Além disso.x). quase certamente. que não seja causada por sua dependência comum a uma terceira variável Z.x para força muscular X peso corporal. Sendo: Sy.013759 Sy. e pode ser difícil de interpretar.x = Sy Onde: Sy = 19. . Ao medirmos a força muscular de um sujeito de 50Kg. em uma ampla faixa etária (18 a 47 anos). provavelmente encontraremos uma força muscular variando: entre 99.44% dos casos. . a correlação entre duas variáveis como resultado no tiro prático de pistola dos sujeitos e seu posto/graduação será. Este intervalo é chamado de “ amplitude de predição” Quanto maior a correlação. O valor predito (força) de um sujeito.70 Kg (Y + Sy.06 Kg e 110. quanto menor o desvio padrão do critério.x ) em 68. menor será o erro de predição. ocorrerá aproximadamente 68 vezes em 100. Para o exemplo utilizado até o presente momento.x = 19. a correlação entre X e Y é algumas vezes equivocada.50 = 102.66 Quadro 25 – Cálculo de Sy. 6.995.98107 Sy. Por exemplo.0.98107 1-r² Logo: Sy.x ) em 95. em função do fator experiência no esporte (anos de prática) com o qual elas estão altamente correlacionadas.

.3 = r12.3 o qual significa a correlação entre as variáveis 1 e 2 com a variável 3 mantida constante Lembremos novamente a correlação entre o resultado do tiro prático de pistola e o posto/graduação do sujeito. e 3 = experiência (anos de prática). Quando o efeito da terceira variável (experiência) é removido. Chamaremos as três variáveis a seguir: 1 = resultado no tiro prático de pistola.47497 . Pode-se notar que a correlação entre o resultado do tiro prático de pistola e o posto/graduação cai à cerca de zero quando a experiência do atirador é isolada. 6.765 r13 = 0.0.66 CORRELAÇÃO E REGRESSÃO Na verdade.0. 0. A correlação parcial é principalmente utilizada no desenvolvimento de equações de regressão múltipla com duas ou mais variáveis preditoras. r13 = 0.3 1-r13² Onde: r12 = 0.2256 0. Esse é um exemplo de correlação espúria.3 r2. Logo. a correlação entre o resultado do tiro prático de pistola e o posto/graduação diminui ou desaparece completamente.2775 0.850.850 Correlação entre 1 e 2 Correlação entre 1 e 3 Correlação entre 2 e 3 r12.068 Quadro 26 – Fórmula e cálculo da correlação parcial.880 r23 = 0.017 0.r1. ou eliminar-se os efeitos da idade estatisticamente mantendo-a constante. ou seja utilizando vários preditores ao invés de apenas um.850 1 .765. O símbolo para a correlação parcial é r12. tendo em vista que o uso de mais de uma variável preditora.748 0.0.9 REGRESSÃO MÚLTIPLA A regressão múltipla consiste em uma variável dependente (usualmente um critério de algum tipo) e duas ou mais variáveis preditoras (variáveis independentes).3 = r12. Caso se desejasse predizer a capacidade de um atirador dever-se-ia analisar a correlação de várias habilidades inerentes ao tiro para se predizer a sua performance com o decorrer dos anos de prática. r12. Sendo: r12.765 .880.3 = 1-r23² Logo: r12. com 3 sendo mantida constante. . podendo-se controlar esse fator por meio de duas formas: selecionar apenas sujeitos da mesma idade.765 – 0. 2 = posto /graduação.3 é a correlação parcial entre as variáveis 1 e 2.850² 0.3 = 0.52678 r12. Podemos ajustar alguns coeficientes de correlação entre três variáveis: r12 = 0. e r23 = 0. o que significa que a correlação entre as duas variáveis é devida à influência comum de uma outra variável (experiência no esporte). a correlação pode diminuir muito se a variabilidade causada pelas diferenças de experiência for eliminada. 0.3 = 0.880² 1.880 . usualmente aumenta a precisão da predição.

A equação de predição da regressão múltipla segue o modelo de regressão de duas variáveis (Y = a + bX). portanto é importante saber o quanto cada um dos mecanismos de predição contribui para a variação total explicada. significando que a soma residual de quadrados constitui erro. até um critério predeterminado que termina quando o cálculo é alcançado.+biXi . desejamos encontrar a combinação de variáveis que fornecerá a predição mais precisa do critério. As variáveis selecionadas produzem cumulativamente a soma residual mínima de quadrados. e as variáveis que não alcançam o nível de significância. o processo leva em consideração as inter-relações entre as variáveis X. As variáveis devem ser introduzidas conforme a sua importância e o processo termina quando não existe mais uma contribuição significativa para a predição. Determina-se um nível de probabilidade para entrada. não apenas pelo efeito aditivo. Sempre que duas variáveis possa estar medindo a mesma coisa. assim como o melhor modelo de duas variáveis. Se uma variável independente não contribui. a inclusão de ambas não é melhor do que utilizar apenas uma.o método do R2 máximo e o método de regressão gradativa O método de regressão múltipla progressiva consiste em adicionarmos. Após o primeiro passo. a seleção de variáveis adicionais é determinada pelo efeito combinado.05 ou 0. Neste manual abordaremos apenas as mais comumente utilizadas. conforme a equação: Y= a+ b1X1+ b2X2+.. ela é então excluída (removida) da combinação linear. O método de regressão gradativa é um procedimento de regressão similar à seleção progressiva exceto pelo fato de que a cada passo todas as variáveis independentes são avaliadas para se verificar se cada uma continua contribuindo para a predição. A primeira variável selecionada deve ser aquela com a maior correlação com o critério. progressivamente. a regressão múltipla regressiva. Segue-se então que R2 representa a quantidade de variância do critério que é explicada pela associação/combinação dos preditores (mesmo conceito do coeficiente de determinação r2). Dessa forma. a regressão múltipla progressiva. Algumas vezes o pesquisador irá determinar um nível de probabilidade para entrada. o processo identifica qual das variáveis preditoras restantes explicará a maior quantidade de variação inexplicada. as variáveis são acrescentadas até que elas não possam mais aumentar de forma significativa a predição do critério. Inicia-se com todas as variáveis independentes e exclui-se aquelas que não contribuem significativamente para a predição do critério.01. o melhor modelo de três variáveis e assim por diante. No método de regressão múltipla regressiva. como 0. encontrando as variáveis que melhor reduzirão os erros de predição.01. diferindo apenas na existência de mais de uma variável X. Após cada variável X ser introduzida.05 ou 0. Existem vários métodos de regressão múltipla.. como 0. O R2 máximo é o método no qual o chamado melhor de todos os modelos possíveis de urna única variável é selecionado. são excluídas. Ao utilizarmos R. as variáveis independentes são eliminadas por sua falta de importância.67 CORRELAÇÃO E REGRESSÃO O coeficiente de correlação múltipla (R) indica a relação entre um critério e o somatório dos pesos suas variáveis preditoras. uma nova variável preditora. Em outras palavras.

Por fim. Um grande problema com pequenas amostras em estudos de regressão múltipla é que a correlação pode ser espuriamente alta. Todavia.1 / n – 1. freqüentemente perdem em precisão quando aplicadas a outras amostras. . quanto maior a amostra. mais precisa será a predição. o que chamamos de redução. uma limitação da predição relaciona-se com a generalização das constatações. pois ao buscarmos uma maior precisão por meio de procedimentos de seleção das variáveis preditoras (o que reforça as características específicas da amostra). Ao selecionarmos o número de sujeitos de uma amostra devemos tomar o cuidado de observar a razão R2 = k . e a razão entre o número de sujeitos versus o número de variáveis. o pesquisador deve selecionar cuidadosamente uma amostra em relação à população para a qual os resultados deverão ser generalizados.68 CORRELAÇÃO E REGRESSÃO A premissa básica em uma regressão múltipla é a mesma que na regressão linear simples. Assim. ou seja. Quanto maior a correlação. pois as equações de regressão desenvolvidas por uma amostra. O termo especificidade de população também se relaciona a esse fenômeno. Os resultados de uma fórmula de predição para adolescentes provavelmente perderiam muita precisão se aplicada em adultos. Existe uma relação direta entre a correlação. mais provavelmente ela representará a população da qual foi retirada. O grau no qual o valor esperado de R2 excederá zero quando é zero na população depende de dois fatores: o tamanho da amostra (n) e o número de variáveis (k). é recomendável manter-se uma razão de 10 sujeitos ou mais para cada variável. Em estudos de previsão. tornamos mais difícil a generalização dos achados para outras populações. o tamanho da correlação entre as variáveis de estudo.

Primeiro Quartil.ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de Escala Análises Aplicáveis Gráficos Aplicáveis Amostras Numérica Média. Terceiro Quartil. Uma ou Pictograma.ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de Escala Análises Aplicáveis Gráficos Aplicáveis Amostras Numérica Média. Máximo. DISTRIBUIÇÃO NÃO-NORMAL . Moda. Histograma. * Quando uma das variáveis registradas for o tempo. Desvio Padrão. Série Temporal*. Temporal*. Gráfico de Nominal Freqüências. Primeiro Quartil. Mediana.69 ANEXO I ESTATÍSTICA DESCRITIVA ANEXOS O quadro abaixo indica os tipos de técnicas estatísticas que podem ser aplicadas para a descrição de conjuntos de dados para se obter um resumo ou descrição geral deles. Máximo. Mais Séries. DISTRIBUIÇÃO NORMAL . Mais Séries. Série Temporal*. Coeficiente Histograma. Box & Ordinal. Intervalo de Uma ou Whiskers. de Variação. . Série de Distribuição). Box & Ordinal. Gráfico de Intervalar ou Mínimo. Coeficiente de Variação. Ogiva (Função Razão Terceiro Quartil. Ogiva (Função de Razão Mediana. Distribuição). * Quando uma das variáveis registradas for o tempo. Mais Séries. Gráfico de Intervalar ou Confiança. Moda. Mínimo. Desvio Padrão. Intervalo de Confiança. Uma ou Whiskers.

Duas Amostras ou Razão Kolmogorov-Smirnov TwoSample Test Teste de Qui-Quadrado Duas Amostras Nominal Não-Pareadas (Homogeneidade) Três ou Mais Ordinal.ESTATÍSTICA DESCRITIVA E GRÁFICOS Tipo de N° de Amostras Escala Numérica Análises Aplicáveis Relação Duas Amostras Intervalar ou Razão Teste t de Student Pareado Pareadas Três ou Mais Intervalar ou Razão ANOVA c/ Medidas Repetidas Amostras Duas Amostras Intervalar ou Razão Teste t de Student Não-Pareadas Três ou Mais ANOVA c/ Grupos Intervalar ou Razão Amostras Independentes * Variável com apenas dois valores ou duas categorias (variável binária).70 ANEXO II COMPARAÇÕES ENTRE AMOSTRAS ANEXOS O quadro abaixo indica as técnicas estatísticas que podem ser aplicadas para a comparação entre os parâmetros de dois ou mais grupos de dados. Sign-Test. Intervalar Wolfowitz Runs Test. Duas Amostras ou Razão Wilcoxon Matched-Pairs Test Nominal Duas Amostras Teste de McNemar Dicotômica* Pareadas Três ou Mais Ordinal.ESTATÍSTICA DESCRITIVA E GRÁFICOS Tipo de N° de Amostras Escala Numérica Análises Aplicáveis Relação Ordinal. Intervalar ANOVA de Friedman Amostras ou Razão Três ou Mais Nominal Teste Q de Cochran Amostras Teste Mann-Whitney U. WaldOrdinal. DISTRIBUIÇÃO NÃO-NORMAL . DISTRIBUIÇÃO NORMAL . . Intervalar Teste de Friedman. Intervalar ANOVA de Kruskal-Wallis Amostras ou Razão Três ou Mais Nominal Teste de Qui-Quadrado Amostras * Variável com apenas dois valores ou duas categorias (variável binária).

Mais Observação Regressão Linear Três ou Intervalar e/ou Razão Múltipla.Y). Três ou Nominal Análise Discriminante --Mais Regressão Linear Três ou Intervalar e/ou Razão Múltipla. Diagrama Três ou Intervalar e/ou Razão Regressão Múltipla Previsão vs. Dispersão (X. Simples. --Três ou Correlação Partial Rank Diagrama de Ordinal e/ou Intervalar e/ou Razão Mais de Kendall Dispersão (X. DISTRIBUIÇÃO NÃO-NORMAL . Regressão --Mais Não-Linear Nominal Dicotômica* (VariávelTrês ou --Resposta) e/ou Nominal e/ou Ordinal Regressão Logística Mais e/ou Intervalar e/ou Razão * Variável com apenas dois valores ou duas categorias (variável binária). .ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de Gráficos Escala Numérica das Variáveis Análises Aplicáveis Variáveis Aplicáveis Correlação de Pearson. DISTRIBUIÇÃO NORMAL .ESTATÍSTICA DESCRITIVA E GRÁFICOS N° de Gráficos Escala Numérica das Variáveis Análises Aplicáveis Variáveis Aplicáveis Correlação de Diagrama de Duas Ordinal e/ou Intervalar e/ou Razão Spearman. Regressão --Mais Não-Linear Nominal Dicotômica* (VariávelTrês ou Resposta) e/ou Nominal e/ou Regressão Logística --Mais Ordinal e/ou Intervalar e/ou Razão * Variável com apenas dois valores ou duas categorias (variável binária).Y).71 ANEXO III RELAÇÃO ENTRE VARIÁVEIS ANEXOS O quadro a seguir mostra as técnicas analíticas e procedimentos gráficos aplicáveis quando se quer verificar a existência e/ou caracterizar as relações entre duas ou mais variáveis.Y). Diagrama de Duas Intervalar e/ou Razão Regressão Linear Dispersão (X. Duas Nominal Teste de Qui-Quadrado.

72 ANEXO IV TABELA DE NÚMEROS ALEATÓRIOS ANEXOS 57720039848441796771402113975649865408932968745483 28805351590993988758702771771706320278621674696517 92591852873048869748352518887403629838586586424103 90381291743019758907506415597188137495305278301175 80911694675860820666904756184645111235324550411343 22017031329691927540165429727499009597610098243007 56241004302046299053531105844121647919762951626066 79449262029686643000945669302059878735442250977819 53996645088978507753372577412762380223576201416035 18928735885505213651392850146685793019797266643145 53085896630561257022504128966266436306630132798522 03588029287689511824888946474859192987031033996712 27078188656949980028047051300147189733218582454324 05210859010622249891811755446616077307661012317858 40361327843082333639694205586461123389278952667193 54602528858820001059610536613372010119016110512091 71516340767111737352373160458892734371280498090248 61020181739260667358533442682638340327449604466593 82559313463095265506961765917239799612495280632699 89985414217413576819862860894733152628774538480808 00998484146795137758901450794273633106604340125504 62415078204805884352980319939203049725849595036331 94279069246809921186076383193299511555710927026700 44892928843628251582877418972576106326760226745328 97307695332110542695666552049936584803089363581796 39165804448015595983909554668184396085388866333569 60781103266750340961313020769366308351093383647605 03192347628957779133884760593754394877674985384391 41285267562539599665513690322239330522990339979699 77549850392537425297100356049281668670014889558210 28634161916424838137344883279638716973067750256460 74244885401233596750149814264279791352896978804471 00240337964668750532421663332897263647277365383446 05414769694536167118955197220413239658600369487983 62698497974723665156130869115275592686818043009892 .

1 4990 4991 4991 4991 4992 4992 4992 4992 4993 4993 3.0239 0.0160 0.0319 0.5000 .0359 0.4 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998 3.0040 0.2 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890 2.2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015 1.8 2881 2910 2939 2867 2996 3023 3051 3078 3106 3133 9.7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974 2.5000 0.7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852 0.6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549 0.4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936 2.1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830 1.3 4032 4049.1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0754 0.3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517 0.9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767 2. 4066 4082 4099 4115 4131 4147 4162 4177 1.7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633 1.0 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990 3.3 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997 3.2 4993 4993 4994 4994 4994 4994 4994 4995 4995 4995 3.5000 0.0 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389 1.0000 0.0120 0.5000 0.4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319 1.5000 0.8 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999 3.6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964 2.0080 0.5000 0.5 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998 3.2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141 0.5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224 0.8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706 1.0 4772 4778 4783 4788 4793 4798 4803 4808 4812 4817 2.5 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441 1.5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952 2.5000 0.1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857 2.6 4452 4463 4474 4484 4496 4505 4515 4525 4535 4545 1.7 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999 3.0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621 1.3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916 2.5000 0.9 0.0199 0.0 0.5000 0.4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879 0.9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986 3.8 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981 2.6 4998 4998 4999 4999 4999 4999 4999 4999 4999 4999 3.5000 0.0279 0.73 ANEXO V ANEXOS ÁREA SUBTENDIDA PELA CURVA NORMAL REDUZIDA DE 0 A Z z 0 1 2 3 4 5 6 7 8 9 0.

9800 0.01 0.4227 0.7348 0.5139 0.1829 0.3721 0.4821 0.2875 0.8822 0.0000 0.7498 0.2737 0.5189 0.4555 0.2732 0.7646 0.2108 0.6787 0.9172 0.02 0.74 ANEXO VI ANEXOS VALORES CRÍTICOS DOS COEFICIENTES DE CORRELAÇÃO (TABELA r ) 0.9741 0.1726 0.3044 0.8233 0.025 0.5285 0.9990 0.3211 .2306 0.4000 0.4451 0.5494 0.6120 0.4762 0.3494 0.1954 0.5742 0.2172 0.5324 0.3809 0.7977 0.5425 0.1946 0.3598 0.8343 0.9343 0.4409 0.05 0.5214 0.2319 0.8471 0.7545 0.4921 0.6835 0.5897 0.01 0.3799 0.2960 0.8010 0.5529 0.6652 0.3810 0.5614 0.3384 0.9877 0.7420 0.6226 0.2573 0.3248 0.3017 0.7800 0.2301 0.7067 0.7887 0.3783 0.9969 0.2830 0.3233 0.4896 0.5822 0.2050 0.4078 0.6339 0.3568 0.4575 0.5155 0.6319 0.5760 0.9587 0.2428 0.7246 0.6932 0.7293 0.7155 0.8745 0.4973 0.5034 0.4487 0.9995 0.2565 0.2422 0.4683 0.4093 0.2948 0.4438 0.9912 0.6614 0.001 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100 0.2540 1.5368 0.8329 0.8114 0.6524 0.9000 0.6055 0.3375 0.4433 0.4648 0.4259 0.6411 0.8982 0.5577 0.10 0.2500 0.5751 0.6581 0.6021 0.4973 0.9249 0.3887 0.9999 0.7084 0.5541 0.0005 Nível de significância para teste bicaudal 0.3246 0.4124 0.2746 0.9507 0.3578 0.9500 0.3932 0.3218 0.05 df n – 2 Nível de significância para teste caudal 0.3687 0.6664 0.6694 0.7079 0.5923 0.8054 0.4182 0.5974 0.2673 0.4329 0.6851 0.5487 0.6215 0.8783 0.3541 0.4869 0.005 0.1638 0.8721 0.7603 0.9900 0.

565 0.735 0.014 2.420 0.610 0.491 0.605 0.784 0.455 0.910 0.867 0.630 0.320 0.033 1.555 0.240 0.733 0.005 0.485 0.376 1.293 0.157 1.550 0.430 0.210 0.633 0.858 0.192 0.092 2.576 0.172 0.75 ANEXO VII TABELA PARA TRANSFORMAÇÃO DE r PARA Z r 0.218 0.590 0.310 0.305 0.675 0.750 0.640 0.410 0.313 1.886 1.388 0.422 1.200 0.517 0.950 0.383 0.935 0.229 0.035 0.375 0.335 0.271 0.105 0.275 0.020 0.266 0.655 0.395 Z 0.161 0.830 0.010 0.343 0.545 0.645 0.472 1.435 0.580 0.758 0.155 0.225 0.131 0.430 0.760 0.670 0.715 0.920 0.460 0.767 0.060 0.680 0.142 1.640 0.480 0.295 0.288 0.255 0.563 0.185 2.701 0.337 0.466 0.090 0.055 0.835 0.693 0.447 1.113 1.151 0.510 0.293 1.030 0.120 0.597 0.348 0.290 0.221 1.180 0.040 0.685 r 0.970 0.583 0.136 0.075 0.190 0.500 0.717 0.116 0.996 1.121 0.775 0.213 0.785 0.135 0.741 0.475 0.354 0.005 0.025 0.600 0.504 0.265 0.556 0.370 0.055 0.304 0.665 0.400 0.875 0.170 0.720 0.523 0.973 0.085 0.198 r 0.648 0.685 0.145 0.755 0.150 0.424 0.015 0.298 2.450 0.187 0.245 0.811 0.995 ANEXOS Z 1.075 0.850 0.238 1.065 0.270 0.443 2.090 0.130 0.705 0.418 r 0.560 0.611 0.623 1.177 0.945 0.625 0.765 0.570 0.390 0.070 0.626 0.250 0.490 0.855 0.365 0.315 0.371 0.885 0.110 0.845 0.940 0.071 1.810 0.540 0.100 0.647 2.412 0.140 0.377 0.840 0.175 0.470 0.256 1.274 1.360 0.182 0.900 0.955 0.925 0.360 0.285 0.499 1.330 0.245 0.280 0.310 0.865 0.536 0.695 0.697 1.908 0.065 0.700 0.465 0.725 0.085 0.745 0.454 0.877 0.261 0.394 0.570 0.795 Z 0.400 0.095 0.905 0.040 0.315 0.530 0.990 0.604 0.915 0.678 0.156 0.010 0.340 0.425 0.618 0.485 0.510 0.658 1.960 0.589 1.250 0.060 0.350 0.890 0.050 0.045 0.805 0.528 1.195 Z 0.710 0.234 0.940 0.239 0.045 0.860 0.543 0.354 1.282 0.188 1.655 0.535 0.965 0.918 0.460 0.220 0.141 0.635 0.985 0.385 0.725 0.783 1.829 0.793 0.520 0.020 1.478 0.595 Z 0.575 0.730 0.660 0.815 0.930 0.126 0.321 0.962 0.008 1.848 0.825 0.105 0.720 0.929 0.690 0.080 0.897 0.585 0.770 0.620 0.127 1.505 0.832 1.355 0.495 0.738 1.802 0.015 0.025 0.260 0.185 0.600 0.740 0.000 0.035 0.165 0.000 0.070 0.058 1.208 0.615 0.100 0.406 0.445 0.045 1.557 1.800 0.080 0.895 0.255 0.530 0.984 0.750 0.030 0.994 .115 0.975 0.332 0.870 0.590 0.780 0.230 0.525 0.380 0.326 0.448 0.709 0.365 0.333 1.224 0.497 0.950 0.110 0.549 0.790 0.172 1.775 0.405 0.146 0.472 0.235 0.099 1.204 1.095 0.436 0.946 2.277 0.215 0.515 0.203 0.425 0.670 0.838 0.980 0.345 0.205 0.167 0.820 0.440 0.662 0.398 1.085 r 0.887 0.650 0.300 0.442 0.415 0.050 0.020 0.880 0.299 0.125 0.

RODRIGUES. ed. Ribeirão Preto: FUNPEC. COSTA NETO. MARTINS. S. v. O. Niterói: EDUFF. P. L. Elementos de probabilidades e inferência. E. Curso de estatística. 4.. GONÇALVES. 2.. 1984. São Paulo: Atual. A. Biometrika tables for statisticians. Rinehart and Winston FONSECA. G. A. Princípios de estatística. R. GUEDES. ed. MARTINS. GOES. 1. M. P. 1979. 1988. GUERRA. STEVENSON. 2. Curso breve de estatística.S. 1969. Curso prático de bioestatística. 1990. SPIEGEL.S. Rio de Janeiro: Ao Livro Técnico S.. B. Estatística básica. 1940. Vol. Estatística: uma abordagem decisorial. 1965. São Paulo: Harbra. E. Estatística indutiva. HARTLEY. Bioestatísca. Rio de Janeiro: LTC. São Paulo: Saraiva. C. 5. 3. CHACON. 2. M. Londres: Cambridge University Press. M. A. E. 2. PEARSON. POLASEK. DONAIRES. GATTÁS. 1965. MEYER. Estatística. W. MUROLO. v. H. ed. Estatística geral e aplicada à economia..A. DISNEY. 3.. J. A. R.. ed. P. 2001 EDWARDS. L. Probabilidade e processos estatísticos. A. ed.C. 2. São Paulo: Atlas. ed... MORETIN. Universidad de Duesto. Técnicas de amostragem. Statistical Methods. J. 2. P. J. 3. São Paulo: Edgard Blücher.REFERÊNCIAS BEIGUELMAN. V. São Paulo: LCT. P. L. Estatística para os cursos de economia. A. São Paulo: Atlas. L. M. R. 1. O. KARMEL. São Paulo: McGraw – Hill. SILVA. São Paulo: Atlas. 1997. G. 1978. 1981. Estatística. 1. 2002. A.O. H. DONAIRES. E. J. Probabilidade: aplicações à estatística. 1993.. Estatística aplicada à administração. B.. R. 1976. A. C. W. ed. LCT. 17. ed. 1. 1979. 1977. SILVA. São Paulo: Saraiva. ed. 1986. ed. CLARKE. D. D. Aumentada. G.. COCHRAN. . G. Rio de Janeiro: Editora Fundo de Cultura. GUEDES. New York: Holt. ed. São Paulo: Atlas. São Paulo: Atlas. W. Estatística fácil. ed. ed. P.L. CRESPO. administração e ciências contábeis..L. M. Bioestatística.S. 1985. A. BUSSAB.

H. Estatística aplicada à economia e administração. R. 3. NELSON. J. T. K. Métodos de pesquisa em atividade física.. 2002. R.. 1981. WONNACOTT. Rio de Janeiro: LCT. J. .77 REFERÊNCIAS THOMAS. ed. WONNACOTT. J. Porto Alegre: ARTMED.

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->