P. 1
Apostila a Prof. Osni

Apostila a Prof. Osni

|Views: 17.046|Likes:

More info:

Published by: Marcos Tadeu Simões Piacentini on May 20, 2011
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

08/10/2013

pdf

text

original

Sections

  • 1.0 DEFINIÇÕES DE ESTATÍSTICA
  • 1.1 POR QUE ESTUDAR ESTATÍSTICA?
  • 1.2 A NATUREZA DOS DADOS
  • 1.3 TIPOS DE DADOS
  • 1.4 TIPOS DE LEVANTAMENTOS
  • 1.5 PLANEJAMENTO DE EXPERIMENTOS
  • EXERCÍCIOS: E-1
  • 2.0 AMOSTRAGEM
  • 2.1 DEFINIÇÕES
  • 2.3 OUTROS PLANOS DE AMOSTRAGEM
  • 2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA)
  • 2.5 AMOSTRAGEM PROBABILÍSTICA
  • 2.5.1 AMOSTRAGEM SISTEMÁTICA
  • 2.5.2 AMOSTRAGEM ESTRATIFICADA
  • 2.5.3 AMOSTRAGEM POR CONGLOMERADO
  • RESUMO
  • EXERCICIOS: E-2
  • 3.0 ANÁLISE EXPLORATÓRIA DE DADOS
  • 4.0 DISTRIBUIÇÃO DE FREQÜÊNCIA
  • 6.0 APRESENTAÇÃO GRÁFICA
  • 6.1 DIAGRAMA DE ORDENADAS
  • 6.2 DIAGRAMA DE BARRAS
  • 6.3 DIAGRAMA DE CÍRCULOS
  • 6.4 DIAGRAMA DE SETORES CIRCULARES
  • 6.5 DIAGRAMA LINEAR
  • 6.6 O PICTOGRAMA
  • 7.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS
  • 7.1 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS
  • 7.2 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS RELATIVAS
  • 7.3 POLIGONO DE FREQÜÊNCIA ACUMULADA OU OGIVA
  • 7.4 POLIGONO DA FREQÜÊNCIA ACUMULADA RELATIVA
  • 8.0 TIPOS DE DISTRIBUIÇÃO
  • 8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO
  • 8.2 DISTRIBUIÇÃO ASSIMÉTRICA
  • 8.3 DISTRIBUIÇÃO MODAL, AMODAL, BIMODAL E MULTIMODAL
  • 8.4 APRESENTAÇÃO TIPO RAMO-E-FOLHAS
  • 9.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL
  • 9.1 MÉDIA ARITMÉTICA SIMPLES
  • 9.2 MÉDIA ARITMÉTICA PONDERADA
  • 9.3 MEDIANA (x̃)
  • 9.4 MODA ( xˆ)
  • 10.0 MEDIDAS DE VARIABILIDADE (DISPERSÃO)
  • 10.1 AMPLITUDE TOTAL (R.T.)
  • 10.2 DESVIO PADRÃO
  • 10.2.1 DESVIO PADRÃO AMOSTRAL (S)
  • 10.2.2 DESVIO PADRÃO DA POPULAÇÃO (σ)
  • 10.2.3 REPRESENTAÇÃO GRÁFICA DO DESVIO PADRÃO
  • 10.2.4 SISTEMATIZAÇÃO PARA O CÁLCULO
  • 10.3 VARIÂNCIA
  • 11.0 DISTRIBUIÇÃO NORMAL
  • EXERCÍCIOS: E-3
  • 12.0 PROBABILIDADE
  • 12.1 ESPAÇO AMOSTRAL E EVENTOS
  • 12.2 TRÊS ORIGENS DA PROBABILIDADE
  • 12.3 A MATEMÁTICA DA PROBABILIDADE
  • EXERCÍCIOS: E-4
  • 13.0 TECNICAS DE CONTAGEM
  • 13.1 O PRINCIPIO DA MULTIPLICAÇÃO
  • 13.2 PERMUTAÇÃO, ARRANJO E COMBINAÇÃO
  • 13.3 REGRAS DE CONTAGEM
  • EXERCÍCIOS: E-5
  • 14.0 DISTRIBUIÇÃO DE PROBABILIDADES
  • 14.1 DISTRIBUIÇÃO BINOMIAL
  • EXERCICIOS: E-6
  • 14.2 DISTRIBUIÇÃO DE POISSON
  • EXERCICIOS: E-7
  • 15.0 CORRELAÇÃO
  • 15.1 INTRODUÇÃO
  • 15.2 RELAÇÃO FUNCIONAL E RELAÇÃO ESTATÍSTICA
  • 15.3 DIAGRAMA DE DISPERSÃO
  • 15.4 CORRELAÇÃO LINEAR
  • 15.5 COEFICIENTE DE CORRELAÇÃO LINEAR
  • EXERCICIOS: E-8
  • 16.0 REGRESSÃO LINEAR
  • 16.1 AJUSTAMENTO DE CURVAS
  • 16.2 MÉTODO DOS MÍNIMOS QUADRADOS
  • 16.3 ANÁLISE DE REGRESSÃO

FACULDADE DE TECNOLOGIA DE SOROCABA

APOSTILA DE ESTATÍSTICA CURSO: PROCESSAMENTO DE DADOS

Ao escrever esta Apostila não pretendi outra coisa, senão proporcionar aos alunos da disciplina ESTATÍSTICA, a facilidade de dispor de notas de aulas dos temas do Programa da Disciplina. O acompanhamento das aulas e a pesquisa em Bibliografia sobre o assunto, tornam-se necessárias para o adequado aproveitamento do curso.

PROF. OSNI PAULA LEITE

ÍNDICE
1.0 DEFINIÇÕES DE ESTATÍSTICA ......................................................................... 1 1.1 POR QUE ESTUDAR ESTATÍSTICA? ......................................................... 1 1.2 A NATUREZA DOS DADOS ........................................................................ 1 1.3 TIPOS DE DADOS ....................................................................................... 2 1.4 TIPOS DE LEVANTAMENTOS .................................................................... 3 1.5 PLANEJAMENTO DE EXPERIMENTOS ..................................................... 4 EXERCÍCIOS: E-1...................................................................................................... 5 2.0 AMOSTRAGEM ................................................................................................... 6 2.1 DEFINIÇÕES................................................................................................ 6 2.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS ALEATÓRIOS (RANDÔMICOS) ................................................................................................ 8 2.3 OUTROS PLANOS DE AMOSTRAGEM ...................................................... 9 2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA) ................ 9 2.5 AMOSTRAGEM PROBABILÍSTICA ........................................................... 10 2.5.1 AMOSTRAGEM SISTEMÁTICA............................................................... 10 2.5.2 AMOSTRAGEM ESTRATIFICADA ......................................................... 11 2.5.3 AMOSTRAGEM POR CONGLOMERADO............................................. 11 RESUMO.......................................................................................................... 11 EXERCICIOS: E-2.................................................................................................... 13 3.0 ANÁLISE EXPLORATÓRIA DE DADOS........................................................... 14 4.0 DISTRIBUIÇÃO DE FREQÜÊNCIA ................................................................... 15 5.0 REPRESENTAÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS ............... 19

6.0 APRESENTAÇÃO GRÁFICA ............................................................................ 20 6.1 DIAGRAMA DE ORDENADAS................................................................... 20 6.2 DIAGRAMA DE BARRAS........................................................................... 21 6.3 DIAGRAMA DE CÍRCULOS ....................................................................... 22 6.4 DIAGRAMA DE SETORES CIRCULARES ................................................ 23 6.5 DIAGRAMA LINEAR .................................................................................. 25

6.6 O PICTOGRAMA ................................................................................................ 26 7.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS ........................... 27 7.1 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS ................................. 31 7.2 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS RELATIVAS ............ 32 7.3 POLIGONO DE FREQÜÊNCIA ACUMULADA OU OGIVA ........................ 33 7.4 POLIGONO DA FREQÜÊNCIA ACUMULADA RELATIVA ........................ 34 8.0 TIPOS DE DISTRIBUIÇÃO ................................................................................ 35 8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO ........................... 35 8.2 DISTRIBUIÇÃO ASSIMÉTRICA................................................................. 36 8.3 DISTRIBUIÇÃO MODAL, AMODAL, BIMODAL E MULTIMODAL ............. 37 8.4 APRESENTAÇÃO TIPO RAMO-E-FOLHAS .............................................. 38 9.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL ............................... 40 9.1 MÉDIA ARITMÉTICA SIMPLES ................................................................. 40 9.2 MÉDIA ARITMÉTICA PONDERADA .......................................................... 41 9.3 MEDIANA (x̃) .............................................................................................. 41 9.4 MODA (

ˆ x ) ............................................................................................... 43

10.0 MEDIDAS DE VARIABILIDADE (DISPERSÃO).............................................. 44 10.1 AMPLITUDE TOTAL (R.T.) ...................................................................... 44 10.2 DESVIO PADRÃO .................................................................................... 45 10.2.1 DESVIO PADRÃO AMOSTRAL (S) ....................................................... 45 10.2.2 DESVIO PADRÃO DA POPULAÇÃO (σ) ............................................... 46 10.2.3 REPRESENTAÇÃO GRÁFICA DO DESVIO PADRÃO.......................... 46 10.2.4 SISTEMATIZAÇÃO PARA O CÁLCULO ................................................ 47 10.3 VARIÂNCIA .............................................................................................. 48 11.0 DISTRIBUIÇÃO NORMAL .............................................................................. 49 EXERCÍCIOS: E-3.................................................................................................... 55 12.0 PROBABILIDADE............................................................................................ 56 12.1 ESPAÇO AMOSTRAL E EVENTOS......................................................... 57 12.2 TRÊS ORIGENS DA PROBABILIDADE................................................... 58

12.3 A MATEMÁTICA DA PROBABILIDADE ................................................... 59 EXERCÍCIOS: E-4.................................................................................................... 62 13.0 TECNICAS DE CONTAGEM ........................................................................... 63 13.1 O PRINCIPIO DA MULTIPLICAÇÃO........................................................ 64 13.2 PERMUTAÇÃO, ARRANJO E COMBINAÇÃO. ....................................... 65 13.3 REGRAS DE CONTAGEM....................................................................... 68 EXERCÍCIOS: E-5.................................................................................................... 69 14.0 DISTRIBUIÇÃO DE PROBABILIDADES......................................................... 70 14.1 DISTRIBUIÇÃO BINOMIAL ...................................................................... 72 EXERCICIOS: E-6.................................................................................................... 76 14.2 DISTRIBUIÇÃO DE POISSON......................................................................... 77 EXERCICIOS: E-7.................................................................................................... 79 15.0 CORRELAÇÃO ................................................................................................ 80 15.1 INTRODUÇÃO ......................................................................................... 80 15.2 RELAÇÃO FUNCIONAL E RELAÇÃO ESTATÍSTICA ............................. 80 15.3 DIAGRAMA DE DISPERSÃO................................................................... 81 15.4 CORRELAÇÃO LINEAR.......................................................................... 82 15.5 COEFICIENTE DE CORRELAÇÃO LINEAR........................................... 85 15.6 CUDADOS COM OS ERROS COM A INTERPLETAÇÃO DE CORRELAÇÃO ................................................................................................ 87 EXERCICIOS: E-8.................................................................................................... 88 16.0 REGRESSÃO LINEAR .................................................................................... 91 16.1 AJUSTAMENTO DE CURVAS ................................................................. 91 16.2 MÉTODO DOS MÍNIMOS QUADRADOS ................................................ 92 16.3 ANÁLISE DE REGRESSÃO..................................................................... 95 EXERCÍCIOS E-9 ......................................................................................................98

ESTATÍSTICA
1.0 DEFINIÇÕES DE ESTATÍSTICA
Etimologicamente a palavra estatística vem de “status” expressão latina que significa, ”sensu lato”, o estudo do estado. Os primeiros a empregarem esse termo foram os Alemães seguidos pela Itália, França, Inglaterra e ainda por outros paises. Para Levasseur a estatística é : “O estudo numérico dos fatos sociais”.

Yule define estatística como: “Dados quantitativos afetados marcadamente por uma multiplicidade de causas”. Uma definição mais usual nos dias de hoje seria: “Um método cientifico que permite a análise, em bases probabilística, de dados coligados e condensados”

Ou ainda podemos dizer que é: “A coleta, o processamento, a interpretação e a apresentação de dados numéricos que pertencem ao domínio da estatística” 1.1 POR QUE ESTUDAR ESTATÍSTICA?

Por hora podemos dizer que o raciocínio estatístico é largamente utilizado no governo e na administração; assim, é possível que, no futuro, um empregador venha a contratar ou promover um profissional por causa do seu conhecimento de estatística.

1.2 A NATUREZA DOS DADOS

O dados estatísticos constituem a matéria prima das pesquisas estatísticas, eles surgem quando se fazem mensurações ou se restringem observações. Estatística descritiva: Trata-se da descrição e resumo dos dados.

1

Probabilidade: É um estudo que envolve o acaso.

Interferência: É a analise e interpretação de dados amostrais (Amostragem).

Modelo: São versões simplificadas (Abstrações) de algum problema ou situação real. 1.3 TIPOS DE DADOS

Quantitativos Contínuos Discretos Qualitativos Nominais Por postos As variáveis contínuas podem assumir qualquer valor num intervalo contínuo. Os dados referentes a tais variáveis dizem-se dados contínuos. Ex. Peso, comprimento, espessura onde usa-se a mensuração. As variáveis discretas assumem valores inteiros de dados discretos são os resultados da contagem de números de itens. Ex. alunos da sala de aula, número de defeitos num carro novo, acidentes de uma fábrica. Os dados nominais surgem quando se definem categorias e se conta o número de observações pertencentes a cada categoria. Ex.: atuam dentro das variáveis “Qualitativas” as quais devemos associar a valores numéricos para que possamos processar estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e feminino), desempenho (excelente, bom, sofrível, mau) etc. Os dados por postos consistem de valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1ª,2ª,3ª colocadas.

2

TABELA: 1 A mesma população pode originar diferentes tipos de dados.Exemplos os registros civis dos fatos vitais (nascimento. isto é. os dados são levantados diretamente na população no momento da investigação. periódicos e ocasionais: CONTÍNUO: Quando os eventos vão sendo registrados à medida que ocorrem. feito no Brasil a cada dez anos. arquivados. 3 . DADOS SECUNDÁRIOS: Quando o investigador para verificar as sua hipóteses de trabalho utiliza. De classes Homens/Mulheres 3º grau 1.4 TIPOS DE LEVANTAMENTOS Os levantamentos podem ser classificados em contínuos. PERIÓDICOS: Acontecem ciclicamente. Podem ser até mesmo dados gerados pelo Departamento de Estatísticas de Populações da Fundação Instituto Brasileiro de Geografia e Estatística (IBGE). Exemplo é o rescenceamento.se de dados já existentes. parte para a realização de um inquérito. DADOS PRIMÁRIOS: Quando o investigador não encontra dados publicados adequados ao seu estudo. óbitos e casamentos). TIPOS DE DADOS POPULAÇÕES CONTÍNUOS DISCRETOS NOMINAIS POR POSTO Alunos de administração idade/peso N. registrados ou publicados. OCASIONAIS: São aqueles realizados sem a preocupação de continuidade ou periodicidade preestabelecidas. exemplos a maioria dos trabalhos de investigação cientifica.

1. Definição do problema: Um Estudo ou Uma Análise 2. Relatar as conclusões 4 . Analisar e interpretar os dados 5. Formular plano para coleta de dados adequados 3. Coligir os dados 4.5 PLANEJAMENTO DE EXPERIMENTOS 1.

Responder as perguntas: a.25 segundos d.Dar exemplos de como um administrador pode se beneficiar do conhecimento de Estatística? 5 . 2 errados c.Responder a pergunta: Por que estudar estatística? c. b.25 alunos na classe e.17 gramas b.EXERCÍCIOS: E-1 1.O mais aprazível h.5 acidentes no mês de maio 2.Defina o termo Estatística.O mais lento i.tamanho de camisa f.3 certos.Identifique os seguintes exemplos em termos de tipos de dados: a.Km/litro g.

AMOSTRA: é qualquer sub-conjunto da população extraída para se realizar estudos estatísticos .2. POPULAÇÃO AMOSTRA 6 . Restrições ao Censo: Custo Populações infinitas Dificuldade nos critérios (Precisão) Produtos de testes Destrutivos (fósforos.1 DEFINIÇÕES POPULAÇÃO: é o conjunto de indivíduos (ou objetos). munições) Tempo despendido (atualização) Tipos de informações mais restritivas Casos de excessão: Populações pequenas Amostras grandes em relação a população Se exige precisão completa Se já são disponíveis informações completas 2.0 AMOSTRAGEM AMOSTRAGEM VERSUS SENSO: Uma amostra usualmente envolve o estudo de uma parcela dos ítens de uma população. enquanto que o censo requer o estudo de todos os ítens. que tem pelo menos uma variável comum observável.

7 .A estatística indutiva é a ciência que busca tirar conclusões probabilísticas sobre a população. a ação. em pesquisas sociais. A probabilidade e a amostragem estão estreitamente correlacionadas e juntas formam o fundamento da teoria de interferência. com êxito. dele. . quando for o caso.Interferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar apenas uma parte. Dois aspectos nas amostras são fundamentais. isto é.Amostragem é o ato de retirar amostra. . econômicas ou de opinião. em geral os problemas de amostragem são mais simples de resolver. Por outro lado.O que é necessário garantir.Qualitativos: Amostras que representem todas as sub-populações. com base em resultados verificados em amostras retiradas dessa população.Quantitativos: Que possua quantidade de dados suficientes para representar a População. Antes de tudo é preciso garantir que a amostra ou amostras que serão utilizadas sejam obtidas por processos adequados. é que a amostra seja “Representativa” da população. ou a amostra. um trabalho estatístico completo. e que dão a sua representatividade em termos: . em suma. Entretanto não basta que saibamos descrever convenientemente os dados da amostra para que possamos executar. . Na indústria onde amostras são freqüentemente retiradas para efeito de Controle da Qualidade dos produtos e materiais. . a complexibilidade dos problemas de amostragem são normalmente bastante grandes.

Populações finitas: é quando.3. Ex. 2. Populações infinitas: são aquelas que contém. pelo menos hipoteticamente. Amostragem não aleatória não apresenta esta característica. produzidos no Brasil e a serem produzidos (universo volkswagem).. Ex. a amostragem aleatória exige que cada elemento tenha a mesma oportunidade de ser incluído na amostra. Há vários métodos para extrair uma amostra talvez o mais importante seja a amostragem aleatória de modo geral. ou fixos de elementos. dizer “quão próxima” está à amostra da população. Produção de carros V. isto é.W...Amostra é a quantidade de dados especificado para representar a população. em termos de representatividade. Nas Populações contínuas... A probabilidade de qualquer algarismo aparecer em qualquer ponto é 1/10..1. 8 . Portanto todas as combinações são igualmente prováveis.: Peso bruto de 3000 latas de tinta de um certo lote de produção. medidas ou observações. uma amostra aleatória é aquela em que a probabilidade de incluir na amostra qualquer intervalo de valores é igual à percentagem da população que está naquele intervalo. temos constituído por números finitos. Nas Populações discretas uma amostra aleatória é aquela em que cada item da população tem a mesma chance de ser incluído na amostra. Esses números podem ser lidos isoladamente ou em grupos. processo probabilístico.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS ALEATÓRIOS (RANDÔMICOS) As tabelas de números aleatórios contém os dez algarismos 0. Amostragem aleatória permite estimar o valor do erro possível.4..9.2.. podem ser lidos em qualquer ordem. um número infinito de elementos.

A amostragem não probabilística é a amostragem subjetiva. onde a variabilidade amostral não pode ser estabelecida com precisão. Determinar o valor médio de cada compra. ou por julgamento. colocando-as numa urna. poderíamos construir uma tabela de números aleatórios numerando dez bolinhas com os algarismos de 0 a 9 . com reposição. anotando os valores obtidos. 2. a amostragem aleatória pode dar resultados totalmente não representativos. 2. A amostragem aleatória é um exemplo da amostragem probabilística. Registrar as queixas contra o sistema. Em razão disso.Conceitualmente. 9 . a finalidade poderia ser : Estimar a freqüência de compras.3 OUTROS PLANOS DE AMOSTRAGEM Amostragem probabilística versus Amostragem não probabilística Os planos de amostragem probabilística são delineados de tal modo que se conhece a probabilidade de todas as combinações amostrais possíveis. A verdade é que. digamos. misturando bem e extraindo uma de cada vez. ao passo que uma pessoa familiarizada com a população pode especificar quais os itens mais representativos da população. conseqüentemente.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA) Se o tamanho da amostra é bem pequeno. deve-se usar a amostragem probabilística. não é possível nenhuma estimativa do erro amostral. de uns 5 itens. sempre que possível. A titulo de ilustração poderíamos querer selecionar aleatoriamente 15 clientes de uma lista de 830 de um grande magazine. pode-se determinar a quantidade de variável amostral numa amostra aleatória e uma estimativa do erro amostral.

escolhemos o 9º. Nenhum desses grupos podem ser considerados como uma amostra aleatória do público em geral. Podemos ter uma amostragem realmente aleatória. N= 200 e n=10 então K=200/10 = 20 Significa que será escolhido um item a cada seqüência de 20 de uma lista. os resultados poderiam proporcionar uma base para a elaboração de um plano de amostragem aleatório para validar os resultados básicos. após um período de tempo notou-se o aumento das chances de adquirirem câncer de mama. 10 . escolhendo-se cada K-ésima amostra. doenças cardíacas etc. freqüentemente obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntários. Todavia. Os perigos inerentes à pesquisa médica . Por exemplo se der o 9. e seria perigoso tentar tirar conclusões gerais com base em tal estudo.Exemplo: Uma equipe médica deve trabalhar com pacientes que se apresentem com voluntários para testar um novo medicamento. bem como outro tipo de pesquisa. 29º. etc.5. onde K obtem-se dividindo o tamanho da população pelo tamanho da amostra.5 AMOSTRAGEM PROBABILÍSTICA SISTEMÁTICA ESTRATIFICADA CONGLOMERADO 2. 2. Para iniciar pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os grupos. K= N n onde: N= Tamanho da População n= Tamanho da Amostra EX.49º . Exemplo: A aplicação de hormônios em mulheres na menopausa. 39º .1 AMOSTRAGEM SISTEMÁTICA É muito parecida com a amostragem aleatória simples.

B. tornam a amostragem preferível a um estudo completo (Censo) da população. 11 . procedendo então a amostragem de cada sub-grupo. Ex. 2. é comum termos 10% dos itens representarem cerca de 60% do valor total em quanto que os 90% restantes representam só 40% do valor total (Curva A.etc). Ex. Para populações discretas o termo “Aleatório” significa que cada item da população tem a mesma chance de participar na amostra.C.2 AMOSTRAGEM ESTRATIFICADA Pressupõe a divisão da população em sub-grupos Homogêneos (Estratos). faixa etária.5.: Estudo pré-eleitoral para medir a preferência dos eleitores. poder aquisitivo.3 AMOSTRAGEM POR CONGLOMERADO Pressupõe a disposição dos itens de uma população em sub-grupos heterogêneos (sub-populações) representativos da população global.5. (Sub-grupos: sexo. No caso de populações contínuas. Neste caso cada RESUMO A finalidade da amostra é permitir fazer interferência sobre a população após inspeção de apenas parte dela. este objetivo é atingido quando a amostragem é aleatória. ensaios destrutivos e populações infinitas. região da habitação. Pareto. Potencialmente. regra 80/20). conglomerado pode ser encarado como uma minipopulação. Naturalmente espera-se que a amostra seja representativa da população da qual foi extraída. Fatores com custo. significa que a probabilidade de incluir qualquer valor de um dado intervalo de valores é igual à proporção com valores naquele intervalo.2.: Para se fazer o inventário do estoque. educação.

À amostragem não probabilística falta esta característica. . Em certas condições. . com o embaralhamento de cartas. A principal vantagem da amostragem aleatória é que se pode determinar o grau de variabilidade amostral.Utilizando-se uma tabela de números aleatórios para proceder à seleção de uma lista. 12 .Pela utilização de um processo mecânico (Misturadores). o que é essencial na interferência estatística. estratificada (sub-grupos Homogêneos).Através de um processo de mistura. tais como amostragem sistemática (periódica). ou amostragem por aglomerados (sub-grupos convenientes e heterogêneos). podem ser mais eficientes variantes da amostragem aleatória simples.As amostras aleatórias podem ser obtidas: .

da amostragem sistemática.Que é amostragem probabilística e quando deve ser usada? 9.Que è amostragem por julgamento e em que circunstância deve ser usada? 8. da amostragem por conglomerado. contínua b. 4.Explique rapidamente as características: a.EXERCICIOS: E-2 QUESTÕES PARA RECAPITULAÇÃO 1.Descreva os vários métodos de obtenção de uma amostra aleatória. Como escolher o método a ser usado em determinada situação? 5.Defina “Amostra Aleatória”. 7.Quando se deve preferir um censo a uma amostragem? 3. b.Em que circunstância é a amostragem preferível a um censo completo? 2. Discreta 13 . c.Explique o significado de “Amostra Aleatória” quando a população è: a. da amostragem estratificada.

0 ANÁLISE EXPLORATÓRIA DE DADOS Em alguma fase de seu trabalho. da qual os dados (amostras) foram obtidos. a partir do que. Esta é à parte da metodologia da ciência que tem por objetivos a coleta. relevantes ao seu particular objeto de estudos. finalmente. análise e modelagem dos dados.3. De modo geral. 14 . o pesquisador se vê às voltas com o problema de analisar e entender uma massa de dados. podemos dizer que a essência da ciência é a observação e que seu objetivo básico é a interferência. redução. faz-se a interferência para uma população.

Quando se estuda uma variável. Ver resultados anotados na tabela abaixo. o maior interesse do pesquisador é conhecer a distribuição dessa variável através das possíveis realizações (valores) da mesma.0 DISTRIBUIÇÃO DE FREQÜÊNCIA Para cada tipo de variável existem técnicas mais apropriadas para resumir as informações. Exemplo 1: Dados relativos a uma amostra de 36 funcionários de uma população de 2000 funcionários da empresa Milsa.4. podemos adaptá-las para outros. Porem podemos usar algumas técnicas empregadas num caso. 15 .

22 16.8 10.39 7.77 9.99 16.95 9.26 18.76 11.53 10.4O 23.13 9. MIN) ANOS MESES PROCEDÊNCIA 1º grau 1º grau 1º grau 2º grau --1 2 ----0 ----1 --2 ----3 0 --1 2 ----1 ----0 2 2 --0 5 2 --1 3 --2 3 4 4.35 9.66 6.69 14.06 11.OO 12.12 8.56 5.74 8.61 17.79 13.26 6.TABELA 1 Nº ESTADO CIVIL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 solteiro casado casado solteiro solteiro casado solteiro solteiro casado solteiro casado solteiro solteiro casado casado solteiro casado casado solteiro solteiro casado solteiro solteiro casado casado casado solteiro casado casado casado solteiro casado casado solteiro casado casado 1º grau 2º grau 2º grau 2º grau superior 2º grau superior superior 2º grau superior 1º grau superior 2º grau 2º grau 1º grau superior 2º grau 2º grau 2º grau 1º grau 2º grau 2º grau 2º grau 1º grau 2º grau 1º grau 1º grau 1º grau 1º grau 2º grau 2º grau 2º grau GRAU DE Nº DE SALÁRIO IDADE REGIÃO DE INSTRUÇÃO FILHOS (X SAL.44 8.6 13.46 8.71 15.75 19.25 5.59 12.23 13.3O 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 29 40 35 31 36 43 33 48 42 03 10 05 10 07 00 00 04 10 06 06 11 05 02 05 08 07 07 08 04 09 02 00 01 05 00 07 08 06 10 05 04 07 07 11 02 interior capital capital outro outro interior interior capital capital outro interior capital outro outro interior outro capital outro interior interior outro capital outro outro interior outro outro interior interior capital outro interior capital capital capital interior 16 .73 6.59 7.86 7.85 14.

33 2º grau IIIIIIIIIIIIIIIIII 18 50. RELATIVA FR % Censo FREQ. RELATIVA FR % Provável 1º grau 650 32. 17 .00 50.50 16.OO superior I I I I I I TOTAL 6 16.Exemplo 2: Freqüência e percentagem da amostra de 36 empregados da empresa Milsa segundo o grau de instrução.33 2º grau 1020 51.67 2000 100 100 Exemplo 4: Freqüência e percentagens dos 36 empregados (Amostra) da empresa Milsa.OO superior TOTAL 330 15.67 36 100 Exemplo 3: Freqüência e percentagem dos 2000 empregados (População) da empresa Milsa (Censo x Probabilidade) TABELA 3 GRAU DE INSTRUÇÃO FRQÜÊNCIA F FREQ.50 33. RELATIVA F FR % 1º grau IIIIIIIIIIII 12 33. TABELA 2 GRAU DE INSTRUÇÃO TABULAÇÃO FRQÚÊNCIA FREQ.

33 12 I------.8 10 27.20 5 13. segundo Nº de filhos.89 20 I------. TABELA 5 NÚMERO DE FILHOS Xi FREQÜÊNCIA FREQ.78 8 I------. 18 . RELATIVA F FR % 4 I------.16 8 22.78 TOTAL 36 100 Exemplo 5: Freqüências e percentagem dos empregados da empresa Milsa.24 1 2.12 12 33.22 16 I------.TABELA 4 CLASSE DE SALÁRIOS FRQÜÊNCIA FREQ.Representar a distribuicao de frequencia para Idade e a Regiao de procedencia dos funcionarios da Empresa Milsa. RELATIVA F FR % 0 4 20 1 5 25 2 7 35 3 3 15 5 1 5 TOTAL 20 100 EXERCÍCIO .

as modalidades da variável) do conteúdo de cada coluna. o cabeçario. COLUNA INDICADORA é à parte da tabela em que é designada a natureza (as categorias. CABEÇARIO é à parte da tabela em que é designada a natureza (as categorias. mas também permitir ao leitor a possibilidade de consultar o trabalho original de onde procedem as informações. devemos especificar os elementos essenciais para a sua interpretação.5. as colunas indicadoras. FONTE é o indicativo. no rodapé da tabela. podendo-se também usar símbolos gráficos. da entidade responsável pela sua organização ou fornecedora dos dados primários. que são: o título. porem qualquer que seja ele. TÍTULO é a indicação que. indicando a natureza dos fatos estudados (o que). cela ou célula é o cruzamento de uma linha com uma coluna. NOTAS são colocadas no rodapé da tabela para esclarecimentos de ordem geral. informar sobre a variabilidade da mesma. E são numeradas.0 REPRESENTAÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS A representação gráfica da distribuição de freqüências de uma variável tem a vantagem de. Casa. o corpo. e a época (quando) em que o mesmo foi observado. sendo comum o asterisco. Os elementos complementares de uma tabela são: Fontes. rápida e concisamente. as séries Horizontais e verticais de informações. Podemos optar por vários tipos de gráficos. A razão da presença da fonte não é somente honestidade cientifica. Deve ser preciso. claro e conciso. Notas. as modalidades da variável) do conteúdo de cada linha. é colocado na parte superior da mesma. 19 . precedendo a tabela. onde se tem a freqüência com que a categoria (ou categorias) aparecem. CORPO da tabela é o conjunto de linhas e colunas que contem respectivamente.

6. em geral gráficos ou diagramas.Devem ser simples. traça-se perpendiculares cujos comprimentos sejam proporcionais às freqüências.6.0 APRESENTAÇÃO GRÁFICA A apresentação gráfica dos dados e respectivos resultados de sua análise pode também ser feita sob forma de figuras. a partir de pontos eqüidistantes na reta. atrair a atenção do leitor e inspirar confiança. de preferência sem comentários inseridos. Gráficos devem ser auto-explicativos e de fácil compreensão.1 DIAGRAMA DE ORDENADAS Para sua construção é traçada uma reta horizontal (ou vertical) de sustentação. freqüências 12 10 8 6 4 2 0 4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24 Salários 20 .

20 20 I-------24 Salários 21 . freqüências 12 10 8 6 4 2 0 4 I-------8 8 I-------12 12 I-------16 16 I------.6.2 DIAGRAMA DE BARRAS A mesma distribuição acima poderia ser representada por meio de diagrama que levasse em conta a magnitude da área da figura geométrica. já que a vista repousa melhor sobre uma superfície do que sobre uma linha.

α`= 5.27.78 .71.33 % 22 . α`→ 5. α`= 3.6.66 α`→ 1.27 .1416) pelo quadrado do raio (r).00 mm A figura abaixo representa esta distribuição. isto é.8 mm r2 = √ 33. Assim se quisermos representar graficamente a distribuição da tabela 1.77.1 mm r4 = √13.71.√ f portanto.4. com um α` adotado de 3 mm.78 % 33. α`→ 5.22 % 27. f onde α é o fator de proporcionalidade. os raios do círculo deverão ser: r1 = √ 27. f = π.3 DIAGRAMA DE CÍRCULOS Alem do retângulo. C = α. α`→ 4. 3 = 15.72. α`→ 3.78 . Lembrando que a área do círculo é o produto do número irracional π = (3. isto é. 2.77 .33 . r = √ α .r ² .f π Se chamar √ α π de α`. α`= 5. 3 = 14. ou seja. α` = 1. outra figura geométrica utilizada é o círculo ou conjunto de círculos.3 mm r3 = √ 22. 3 = 17. tem-se : r = α`. r ² .72.22. segue-se que: α .1 mm r5 = √ 2. 3 = 5.66. 3 = 11. e desde que as áreas dos diversos círculos devem ser proporcionais às magnitudes das freqüências.89 . os raios dos círculos devem ser proporcionais a raiz quadrada das freqüências das modalidades da variável.7 % 13. α`= 4.89 % 22. C= π.

onde α é o fator de proporcionalidade. F ou seja: α`= 360° Portanto a = 360°.78 = 10° 100 23 . Lembrando que o círculo compreende setores cujas áreas (S) são produto do raio (r) pelo tamanho do arco (a).22 = 80° 100 a2 = 360° x 33. tem-se 360° = α`.4 DIAGRAMA DE SETORES CIRCULARES Outra opção seria através de setores circulares. na qual se divide a área total de um círculo em subáreas (setores) proporcionais as freqüências. isto é. a distribuição de freqüência da tabela 4 representando faixas de salários fica: a1 = 360° x 27.33 = 120° 100 a4 = 360° x 13.f .89 = 50° 100 S5 = 360° x 2. e com S deve ser proporcional a freqüência f.6. a a = α.a. S = r. tem-se S = α`. isto é. os arcos e os respectivos ângulos centrais de um círculo é igual a 360°. então: α . f F F Assim.78 = 100° 100 a3 = 360° x 22. f . tem-se S= α.f = r.f r Se chamarmos α r de α`. e sendo F a freqüência total.

Diagrama de Setores Circular 120° 50° 10° 100° . 80° Diagrama de Setores Circular feito automaticamente pelo excel 33% 22% 28% 14% 3% 24 .

5 DIAGRAMA LINEAR No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de barras e em seguida unir esses pontos por semi-retas contituindo-se desta forma o diagrama linear.6. freqüências 12 x 10 x x 8 6 x 4 2 x 0 4 I-------8 8 I-------12 2 12 I-------16 16 I-------20 20 I-------24 salários 25 .

revistas e relatórios de vários tipos). no caso abaixo representa a população dos Estados Unidos.6. 1920 1930 1940 1950 1960 1970 1980 1990 Cada símbolo = 10 milhões de pessoas Pictograma da população dos Estados Unidos 26 .6 O PICTOGRAMA A figura abaixo mostra um exemplo de apresentação pictográfica de dados temporais (comumente encontrada em jornais.

0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS A análise estatística de dados relativos a uma amostra de uma população. de uma amostra de 100 pacotes extraídos parcialmente de um processo automático de empacotamento. requer uma aglutinação organizada de informações. conforme regras cuja prática demonstrou serem eficientes. A especificação de fabricação é 215 ±15 gramas (200 a 230 gramas) TABELA 6 AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 207 213 210 215 201 210 212 204 209 212 215 216 221 219 222 225 215 218 213 216 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 220 204 213 211 214 217 224 211 220 209 214 208 217 214 209 212 208 215 211 216 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 210 214 219 215 217 213 218 214 215 212 221 211 218 205 220 203 216 222 206 221 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 210 220 213 217 214 219 214 215 223 217 213 218 207 210 208 214 211 205 215 207 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 217 211 213 218 213 216 218 216 206 212 207 213 215 212 223 210 226 224 214 215 O agrupamento destes dados em sub-grupos é feito com base nos seguintes conceitos: 27 .7. em gramas. Consideremos uma relação de pesos de pacotes de manteiga.

): é a diferença entre os valores máximos e mínimos de cada classe.I. Amplitude intervalo de cada classe R. = 226 – 201 = 25 gramas Número de classes (d) : é o número de divisões que estipulamos para a Amplitude Total. 0 ----. para significar que o intervalo compreende os valores da variável maiores do que 0 (excluído) e até 10 (inclusive). 28 .T Número de Classes No caso do exercício temos: Amplitude intervalo de cada classe R. Normalmente pode-se usar d =̃ √ n onde n= número de itens na amostra para o exercício temos d =̃ √ 100 → 10 classes. porem deve-se utilizar sempre que possível número impar de classes no caso 9 classes.T. podemos dai utilizar as seguintes simbologias para os intervalos: 0 ----I 10 intervalo aberto & fechado. temos: R. 3 7 RI adotado = 3 RT adotado = 27 diferenca 2 comeca uma antes do menor e termina um antes do maior valor. = 25 = 2. para que não haja duvida na localização dos valores das variáveis.10 Intervalo aberto & aberto.7 aprox. = R. para significar que compreende os valores da variável a partir de 0 (inclusive) e até 10 (exclusive).Amplitude total (R. No caso da amostra de pacotes de manteiga acima. Amplitude do intervalo de classe (R.I . Classe: é o intervalo de variação das medidas.I . 0 I---. para significar que compreende valores maiores do que 0 e menores do que 10.): é a diferença entre a medida máxima e a medida mínima. As classes devem ser mutuamente exclusivas.T.10 intervalo fechado & aberto.

monta-se um tabela que agrupe as informações obtidas. teremos a seguinte tabela de freqüências: TABELA 7 VALOR COMPRIMENTO CLASSE CLASSE FREQ. de forma de Tabela de Freqüências. para significar que compreende os valores da variável a partir de 0 (inclusive) e até 10 (inclusive). ACUM. Para os pacotes em pauta. TABELA de DISTRIBUIÇÃO das FREQÜÊNCIAS Para a facilidade e metodização do processo de análise estatística.% 1 2 200 ---I 203 I I 203 ---I 206 I I I I I I 2 6 2 6 2 8 2 8 3 4 5 206 ---I 209 I I I I I I I I I I 209 ---I 212 I I I I I I I I I I I I I I I I I I 212 ---I 215 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 10 18 28 10 18 28 18 36 64 18 36 64 6 7 8 9 215 ---I 218 I I I I I I I I I I I I I I I I I I 218 ---I 221 I I I I I I I I I I 221 ---I 224 I I I I I I 224 ---I 227 I I 18 10 6 2 18 10 6 2 82 92 98 100 82 92 98 100 ∑ 100 100% 29 . REL. FREQUENCIA FREQUENCIA FREQUENCIA TABULAÇÃO F RELATIVA % ACUM.0 I----I 10 intervalo fechado & fechado.

Onde: Freqüência (F) = é o numero de vezes que as medidas ocorrem no intervalo de classes Freqüência relativa (FR) = é a percentagem da freqüência de cada classe em relação ao total de elementos. Freqüência acumulada relativa (FAR) = é a soma das freqüências relativas até o intervalo considerado Far3 = Fr1 + Fr2 + Fr3 → 2 + 6 + 10 = 18 30 . Fa5 = F1+ F2 + F3 + F3 + F5 → 2+ 6+ 10+ 18+ 28 = 64 a soma das freqüências até o intervalo de classe Ex. FR = F d x 100 N Freqüência acumulada (FA) = é considerado.

1 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS freqüências 28 POLIGONO DE FREQÜÊNCIAS 21 14 7 1 2 3 4 5 6 7 8 9 CLASSES 31 .7.

2 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS RELATIVAS % 28% POLIGONO DE FREQÜÊNCIA RELATIVA 21% 14% 7% 0 1 2 3 4 5 6 7 8 9 CLASSES 32 .7.

AC.7.3 POLIGONO DE FREQÜÊNCIA ACUMULADA OU OGIVA F. 100 POLIGONO DE FREQÜÊNCIAS ACUMULADA 80 60 40 20 01 2 3 4 5 6 7 8 9 CLASSES 33 .

AC REL.4 POLIGONO DA FREQÜÊNCIA ACUMULADA RELATIVA % 100 % F. 80 % POLIGONO DE FREQÜÊNCIAS ACUMULADA RELATIVA 60 % 40 % 20 % 0 %1 2 3 4 5 6 7 8 9 CLASSES 34 .7.

0 TIPOS DE DISTRIBUIÇÃO As distribuições de freqüência podem se apresentar de diversas formas conforme as figuras a seguir: 8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO A distribuição é simétrica quando os valores se distribuem igualmente em torno da média (X) A) Normal B) Alongada 35 .8.

A) Assimétrica Positiva 36 .2 DISTRIBUIÇÃO ASSIMÉTRICA É aquela em que as freqüências dos valores medidos.C) Achatada 8. se distribuem de forma desigual em torno da média.

AMODAL. BIMODAL E MULTIMODAL Chamamos de moda numa distribuição.3 DISTRIBUIÇÃO MODAL. ao valor da medida ou classe que corresponde à freqüência máxima.B) Assimétrica Negativa 8. Sob o critério da moda as distribuições classificam-se em: A) DISTRIBUIÇÃO MODAL – Quando a distribuição tem freqüência máxima ela è denominada modal. mo B) DISTRIBUIÇÃO AMODAL – Quando a distribuição não tem moda 37 .

São Paulo: 38 .4 APRESENTAÇÃO TIPO RAMO-E-FOLHAS Uma alternativa para o uso da tabela de distribuição de freqüências é usar o gráfico do tipo ramo-e-folhas. mo mo D) DISTRIBUIÇÃO MULTIMODAL – Quando a distribuição tem mais de duas modas mo mo mo 8.C) DISTRIBUIÇÃO BIMODAL – Quando a distribuição tem duas modas. Podermos estudar a partir de um exemplo prático: Observamos os seguintes números de passageiros em 50 viagens de um avião que faz ponte aérea Rio .

A. 2 3 5 7 2 4 0 1 3 5 9 5 7 5 0 0 1 2 3 3 4 6 7 8 8 9 12 19 6 0 1 2 2 4 4 4 4 6 7 8 11 30 7 0 1 1 3 5 5 7 8 9 9 39 8 0 0 2 4 6 9 6 45 9 1 2 5 7 4 49 10 3 1 50 A MEDIANA NESTE CASO SERÁ X̃ = 64 39 .61 52 64 84 35 57 58 95 82 64 50 53 103 40 62 77 78 66 60 41 58 92 51 64 71 75 89 37 54 67 59 79 80 73 49 71 97 62 68 53 43 80 75 70 45 91 50 64 56 86 SOLUÇÃO: F F.

não é bem definida daí parece razoável chamarmos de “tendência central”. 12. porem.6 5 5 40 . 3.  MODA. a medida de tendência central visa a determinar o centro da distribuição. São medidas de tendência central:  MÉDIA ARITMÉTICA SIMPLES/PONDERADA.1 MÉDIA ARITMÉTICA SIMPLES Dada uma distribuição de freqüências. e representa-se por variáveis “n”. = 8 + 3 + 5 + 12 + 10 = 38 = 7. 10. dividida pelo número de = Σx n n Sendo: Σx i= 1 Exemplo: Calcular a média aritmética simples de 8. chama-se de média aritmética desta destituição. Esta determinação.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL Como o próprio nome indica. a soma de todos os valores da variável.9. 9.  MEDIANA. 5.

4 e 1. 2.fi i= 1 = K Σx i= 1 fi onde: f = freqüência dos números x = números Exemplo: Calcular a média ponderada dos números 5.7 10 9. respectivamente os quais ocorrem com as Números Freqüências x = 5. ou a média dos dois valores do meio caso a quantidade de números seja par. O símbolo que usamos para representar a mediana é x̃ lê-se “x til”. 2 f = 3.9. 8. 1 = 3x5 + 4x8 + 2x6 + 1x2 3+4+2+1 = 57 = 5. 4. No caso de calculo da mediana quando estamos trabalhando com distribuição de freqüência determinamos o valor mais provável dessa distribuição a partir de: x̃ = Freqüência acumulada total = 2 FA 2 (para números pares) 41 .3 MEDIANA (x̃) Se ordenarmos uma seqüência de números do menor para o maior e se a quantidade desses números for impar. 6. 6. 2 freqüências 3. 8.2 MÉDIA ARITMÉTICA PONDERADA K Σ xi . 2. então a mediana será o valor do meio.

Ou ainda A posição DA MEDIANA é definida por é { n+1 } 2 -ésimo elemento quando ”n” é í̃mpar temos um número inteiro e dá a posiçã́o da mediana. e a mediana é o valor do 23° elemento. 2 c) n 2 = No caso do exercício da distribuição dos 100 valores de peso de pacotes de manteiga temos: X = n 2 = 100 2 = 50. e a mediana é o valor do 8° elemento. 2 2 88 = 44 e a mediana é o valor correspondente ao valor do 44°elemento. e a mediana é o valor do 50° elemento 50° valor FA 0 2 203 8 206 18 209 36 212 64 215 82 218 92 221 98 224 100 227 X 200 50° 36 212 64 215 (64 – 36) (64 – 50) (215 – 212) Δ 42 . Exemplo: Determine a posição da mediana para a) n=15 b) n=45 c)n=88 a) n+1 = 15+1 = 8. 2 2 b) n+1 = 45+1 = 23.

3. 9. 10 moda = Ф (não existe moda) 3) 2. 8. 4. 8. 4. 5.5 2 43 . 8. 2. isto é. 9 moda = 4 e 8 Para o exemplo do exercício das distribuições de freqüências dos pacotes de manteiga temos que a moda é o ponto médio da classe modal. 8. Classe modal é a 5° classe. o valor mais comum.4 MODA ( ˆ x) Em um conjunto de números a moda é o valor que ocorre com maior freqüência. X = 212 + 1. 4. 7. localiza-se a classe modal como sendo a classe com maior freqüência e em seguida determina-se seu ponto médio. 4. 7. 8.Δ= 14 x 3 = 1. 2. 8.5 portanto a mediana será 212 + Δ 9. 6. 5. 9. 7.5 28 logo.5 = 213. 2. 8. Exemplos: 1) 2. portanto moda = 212 + 215 = 213. 6. 3. 10 moda=8 2) 1.

Em geral o valor da amplitude cresce quando cresce o tamanho da amostra.1 AMPLITUDE TOTAL (R.T. É a diferença entre o maior e o menor valor das observações.Depende do número de observações na amostra.) É a medida mais simples de dispersão. existem duas restrições ao seu generalizado: 1. 2. o valor zero indica ausência de dispersão. = Xmax – Xmin Embora exista simplicidade de cálculo. variância).10. Podemos dizer que dispersão é o grau com o qual os valores numéricos de uma distribuição tendem a se distanciar em torno de um valor médio. ou separados. a dispersão aumenta à proporção que aumenta o valor da medida (amplitude. 44 .T. O seu valor não se modifica mesmo que os valores das observações variem.desvio-padrao. R. Em todos os casos.Utiliza apenas uma parcela das informações contidas nas observações. xx x x x x xxx xxx xx x x a) pequena dispersão xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx b) grande dispersão 10.0 MEDIDAS DE VARIABILIDADE (DISPERSÃO) As medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros. desde que conservem os seus valores Máximo e mínimo.

. e representa a distância do ponto de inflexão da curva até a linha da média. = Grande I X max.I R.T. I R.2 DESVIO PADRÃO É à medida que determina a variação dos valores observados em torno da média da distribuição..T. = pequeno I x max. 10.2. 10. X min...X min. +(Xn- )² 45 .1 DESVIO PADRÃO AMOSTRAL (S) O desvio padrão da amostra representa a dispersão da amostra e é dada pela equação: S= (X1- )² + (X2- )² + (X3n )² + .

...3 REPRESENTAÇÃO GRÁFICA DO DESVIO PADRÃO σ +σ 46 .2 DESVIO PADRÃO DA POPULAÇÃO (σ) O desvio padrão da população representa a o grau de dispersão da população em torno da média é representado por σ.Onde: Xi = Medidas individuais S= Σ ( Xi n )² n = Número de elementos ou valores 10.2. e é dado pela expressão: σ= (X1- )² + (X2- )² + (X3n-1 )² + . também representa a distância do ponto de inflexão.2. +(Xn- )² σ= Σ ( Xi n-1 )² 10..

Calcular o valor da média. . . . 2. Xn Xn - . ( Xn - .2. . )² Σ (Xi- )² 3-Aplicam-se as fórmulas: S= Σ ( Xi n )² σ= Σ ( Xi n-1 )² 47 . . .Montar a tabela abaixo observações medidas Xi Xi - (Xi - )² 1 2 3 X1 X2 X3 X1 X2 X3 - (X1 (X2 (X3 - )² )² )² .10. n . . .4 SISTEMATIZAÇÃO PARA O CÁLCULO Para sistematizar o cálculo do desvio padrão de uma amostra é utilizado o seguinte procedimento: 1.

3 VARIÂNCIA Variância da população é a soma dos quadrados dos desvios de cada observação em relação à média de “x”. O desvio padrão por sua vez. 48 . a Variância fica em metros quadrados. a Variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Se os dados estão em metros. Podemos fazer a mesma analogia com a Variância da Amostra dada por S². Fórmula da variância da Amostra n Σ ( Xi S²= i=1 n )² Fórmula da variância da População n Σ ( Xi σ²= i=1 - )² onde n – 1 = número de graus de liberdade n-1 Como medida de dispersão. Indica-se a Variância da População por σ² . fica com valor na mesma da unidade da variável.10. divide-se por n – 1.

a variável x pode assumir qualquer valor real no intervalo .1σ x +1σ x+ 2σ x+ 3σ Parâmetros da Distribuição Normal µ → Média da População Determinam o formato da curva σ → Desvio padrão da população Equação da Função de Probabilidade – A equação da função de probabilidade é dada pela expressão: . dos ERROS DAS OBSERVAÇÕES) É uma distribuição contínua e simétrica. ou ainda. cujo gráfico tem a forma de um sino.∞< x < +∞ 49 .3σ x.( x .µ )² 2 σ² f(x) = 1 σ√ 2π e Do estudo de estatística concluímos que: .11. A distribuição normal é o resultado da atuação conjunta de causas aleatórias.0 DISTRIBUIÇÃO NORMAL (ou de GAUSS. ou de LAPLACE. F (x) σ x.2σ x.

CARACTERISTICAS DA CURVA DE DISTRIBUIÇÃO NORMAL A curva normal obedece necessariamente às seguintes características: a.a variável x obedecerá a uma Distribuição Normal. 50 ..718 são constantes numéricas.µ )² x0 P( x < x0 ) = f(x0) = 1 σ√ 2π -∞ 2 σ² e dx . entre os valores - ∞ e xo” . Os valores π = 3.1416 e e ( número neperiano) = 2. σ -∞ X0 + ∞ Portanto: “ A probabilidade de ocorrência de um valor menor ou igual à área abaixo da curva. se a probabilidade de que um valor x seja menor ou igual a outro xo for: .A média µ é o valor da variável x para o qual a f(x) é máxima.a integral da expressão representa a área compreendida entre F (x) -∞ e xo.( x .

O desvio Padrão σ. dz Portanto a função da probabilidade.A área total sob a curva normal é igual a 1. pela própria equação da probabilidade.µ σ o que significa adotar como origem dos z o ponto em que x = µ e como unidade de escalados z e o desvio padrão σ. será dada pela expressão: 51 . é a distância entre a média e o ponto de inflexão da curva.z² 2 f(z)= 1 σ√ 2π e Considerando. teremos transformado a expressão da função das probabilidades na distribuição normal reduzida: . em função de Z.Em virtude da simetria as áreas à direita e à esquerda do valor µ são iguais DISTRIBUIÇÃO NORMAL PADRONIZADA Se tomarmos a equação auxiliar: Z= X .b. d. c. a partir da equação auxiliar: dz = dx dx 1 σ = σ.

95 onde é a media. teremos: P(. a área desde Z=0. Se procurarmos a probabilidade de encontrarmos um valor de “x” dentro do intervalo µ ± 0.0 é I(1.26% da área total da curva. Basta construir a tábua das áreas para os valores I(z). Por exemplo.3289 It= 0.6578 ou 65.95 σ < Z < µ + 0. 52 .µ σ podemos transformar valores de x em valores de z e em seguida construir uma tabela com resultados das integrais.z² z f(z)= 1 σ√ 2π 2 e -∞ dz As áreas sob a curva permanecem as mesmas.95 σ) Iz1 = 0. até Z= 1. eixo dos Z).3413 ou 34.0) = 0. que corresponde à área sob a curva xo intervalo de 0 a Z0 identificada por Iz0.Z0 < Z < Z0) = P (µ – 0.. Apresentamos na tabela abaixo alguns dos mais importantes intervalos de distribuição normal para aplicações em exercícios de probabilidade na curva normal. TÁBUAS DE ÁREAS DA CURVA NORMAL A partir da equação auxiliar Z= X . σ é o desvio padrão da população. na tábua 1. dentro do intervalo ± 1 σ temos 68. conseqüentemente.13% da área total da curva.78%. mas agora podem ser tabuladas em função dos valores de Z (Ver figura abaixo.

2σ µ .3σ .F (x) σ x.1σ µ .3σ µ-µ σ µ + 1σ.µ Zo σ µ µ + 1σ µ + 2σ µ + 3σ µ .2σ .µ σ µ + 3σ.µ σ 0 1 2 3 -1 -2 -3 53 .2σ x.3σ x.µ σ µ + 2σ.µ σ µ .1σ x +1σ x+ 2σ x+ 3σ -3 -2 -1 0 1 2 3 Z Transformação de X em Z Xo Z= X .µ σ µ -σ.µ σ µ .

I Zo 0 Zo AREAS I ZO = P (0 ≤ z ≤ Z0) para Z0= (x .25 0.4332 2.2088 1.95 0.30 0.1736 1.50 0.1369 0.45 0.40 0.35 0.3051 1.1179 0.4772 2.50 0.90 0.10 0.4987 0.05 0.4032 1.55 0.75 0.30 0.2881 1.90 0.4599 2.4893 2.3944 1.80 0.15 0.05 0.10 0.30 0.00 0.4996 0.5000 54 .4970 3.75 0.85 0.15 0.1915 1.95 0.40 0.4998 0.2257 1.2422 1.35 0.85 0.10 0.25 0.4554 2.3849 1.40 0.90 0.40 0.35 0.4965 3.15 0.55 0.85 0.4394 2.0398 0.2734 1.60 0.55 0.0000 0.20 0.65 0.80 0.4842 2.45 0.75 0.80 0.60 0.4997 0.35 0.3289 1.4960 3.4978 3.0199 0.4641 2.4918 3.4989 0.0987 0.4995 0.4994 0.1554 1.30 0.20 0.50 0.4821 2.4981 3.25 0.45 0.70 0.4946 3.4798 2.4861 2.05 0.20 0.60 0.65 0.70 0.4906 2.2580 1.4713 2.4993 0.4929 3.3531 1.70 0.95 0.10 0.4678 2.4452 2.4938 3.4192 2.0596 0.3159 1.µ)/ σ I Z0 I Z0 I Z0 I Z0 I Z0 I Z0 Z0 Z0 Z0 Z0 Z0 Z0 0.4999 0.4744 2.4990 0.15 0.00 0.4974 3.05 0.4984 3.25 0.4878 2.00 0.70 0.3643 1.20 0.0793 0.4953 3.4992 0.90 0.3413 1.65 0.00 0.4115 1.4279 2.50 0.3749 1.4505 2.

Que percentagem da população estaria provavelmente dentro dos intervalos: a.EXERCÍCIOS: E-3 1.Trace uma curva normal e sombreie a área desejada a partir das informações: a.Que percentagem da população terá renda superior a R$ 15.área entre z= 2.Suponha uma renda média de uma grande comunidade possa ser razoavelmente aproximada por uma distribuição normal com media anual de R$ 10.9 e.P ( 35 ≤ x ≤ 62) c. a.00? b.2.4505 e área da direita Iz = 0.Ache os valores de z correspondentes as seguintes áreas: a.0 f.área à esquerda Iz= 0.5 d.0 g.0228 c.0 2.P ( x > x ≤ 65) 55) e.4861 3.P ( 55 ≤ d.0 b.área entre z=1.0505 b.000.00 e desvio padrão de R$ 2.área da esquerda de z= 1.área entre z=0 e z= .000.P ( 35 ≤ x ≤ 45) 4.área entre z=0 e z=1.000.00.0 c.Uma distribuição normal tem media 50 e desvio padrão 5.área à esquerda de µ para Iz = 0.P ( x ≤ 60) b.área entre z= -2.00 de renda? 55 .Numa amostra de 50 assalariados. quantos podemos esperar que tenham menos de R$ 8.000.área à direita de z=1.0 e z= 2.5 e z=3.0 e z= 2.área à esquerda de µ para Iz = 0.

Chama-se probabilidade de um acontecimento a razão entre o número de casos favoráveis ao mesmo e o número total de acontecimentos possíveis. Considerando-se “cara” como sucesso e “coroa” como fracasso e representando-se o acontecimento favorável como “P” e o não favorável como “Q”. menor é a chance de ocorrência do evento A.Q) e Q = (1 . inclusive por valores decimais. ao acaso.2. se jogarmos uma moeda “não viciada” para o ar.0 PROBABILIDADE O problema fundamental da estatística consiste em lidar com o acaso e a incerteza. 56 . a probabilidade de cada um ser escolhido. Por exemplo. Um evento certo tem probabilidade de 1. Assim quando se considera uma população limitada de P indivíduos. ou ainda 1/5. Laplace definiu probabilidade como: “O quociente do número de casos favoráveis sobre o número de casos igualmente possíveis”. Quanto mais próxima de 1.00 é P(A). de modo geral não podemos afirmar se vai dar cara ou coroa. é de 1/P. é um número de 0 a 1. que indica a chance de ocorrência do evento A. e quanto mais próxima de Zero. denotada por P (A).12. 2 em 10. 0. A P (K) = ½ ou 50%. Porém existem apenas dois eventos possíveis: sair “cara” ou “coroa” Nesse exemplo existe um caso favorável a esse evento em dois casos possíveis. temos as razões: P= ½ Sendo Então e Q=½ P+Q = 1 P= (1 . As probabilidades podem ser expressas. Um evento impossível atribui-se a probabilidade Zero.P) A probabilidade de um evento A. frações e percentagem como: 20%. maior é a chance de ocorrência do evento A.

12. para predizer Quao Provável é a ocorrência de determinado evento futuro. Há 52 eventos elementares no espaço amostral. o preparo do orçamento. o cálculo dos custos de produção. usa-se ainda a probabilidade mediante determinada combinação de julgamento. tem A B elementos em comum. Quanto aos eventos podemos classificá-los em: ESPAÇO AMOSTRAL COMPLEMENTO A Cartas vermelhas e cartas pretas Não se interceptam cartas de MUTUAMENTE EXCLUDENTE A B copas e cartas de paus NAO SÃO MUTUAMENTE EXCLUDENTE Cartas de copas e figuras. experiência ou dados históricos.Além do uso na interpretação de jogos de azar. copas e COLETIVAMENTE EXAUSTIVO A B C D espadas 57 . Cartas de paus. a avaliação do impacto de uma redução de impostos sobre a inflação – tudo isso contém algum elemento de Acaso. a contratação de um novo empregado.1 ESPAÇO AMOSTRAL E EVENTOS Consideremos o experimento que consiste em “extrair uma carta de um baralho de 52 cartas”. Há numerosos exemplos de tais situações no campo dos Negócios e do Governo. ouro. A previsão da aceitação de um novo produto.

5. O método Clássico. Nestes casos temos: P(cada resultado) = 1 Número de resultados possíveis Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida. O mesmo ocorre com uma coroa. No caso de um dado temos a probabilidade de dar qualquer número: 1. e o método Subjetivo.2 TRÊS ORIGENS DA PROBABILIDADE Há três maneiras diferentes de calcular ou estimar probabilidades.2. O método Empírico. jogo de dados.12. De forma geral vale também a expressão: 58 .66%.4. que se baseia na freqüência relativa de ocorrência de um evento num grande número de provas repetidas. OBJETIVO SUBJETIVO CLÁSSICO (resultados igualmente prováveis) O Método Clássico EMPÍRICO (dados históricos) Opinião Pessoal Os jogos de azar (lançamento de moedas. quando o espaço amostral tem resultados igualmente prováveis. extração de cartas) usualmente apresentam resultados igualmente prováveis.6 é de 1/6 ou de 16. então a probabilidade de extrair cada uma delas é de 1/52 : P (A) = 1/52 1. ou seja ½ ou 50%.3. que utiliza estimativas pessoais baseadas num certo grau de crença. Da mesma forma a probabilidade de termos uma cara no lançamento de uma moeda é ½ ou 50%.92%.

a probabilidade de extração de uma dama. a probabilidade de obter número ímpar no lance de um dado é P(ímpar) = 3 faces 6 faces possíveis = 3 6 ou 50% 12. isto é. Em outras situações. A e B. P(cara)= ½ . Cálculo da Probabilidade da ocorrência de dois eventos “independentes” P(A e B) Se dois eventos são independentes. então a probabilidade da ocorrência de ambos é igual ao produto de suas probabilidades individuais: P(A e B) = P(A) . no espaço amostral.3 A MATEMÁTICA DA PROBABILIDADE Muitas aplicações de estatística exigem a determinação da probabilidade de combinações de eventos. de acordo com esta definição. P(B) Exemplo Jogam-se duas moedas equilibradas. Há duas categorias de eventos de interesse.69% 13 Analogamente. podemos querer a probabilidade de ocorrência de A ou B P(A ou B). Além disso. a probabilidade de ocorrência de ambos os eventos. Logo p(cara e cara) será: 59 . é P (dama) = 4 damas = 4 52 cartas 52 = 1 = 7.P(A) = Número de resultados associados ao evento A Número total de resultados possíveis Por exemplo. Pode ser necessário determinar P(A e B).Qual a probabilidade da ocorrência de ambas darem cara? É razoável admitir que os resultados das duas moedas sejam independentes um do outro. para moedas equilibradas.

P(paus ou dez.33% 6 6 6 Cálculo da Probabilidade da ocorrência de dois eventos “não mutuamente excludente” P(A ou B ou ambos ocorrerão) Suponhamos a probabilidade de extração de uma carta de paus ou um dez de um baralho de 52 cartas . a probabilidade de ocorrência de qualquer um deles é a soma de suas probabilidades individuais.P(dez de paus) = 13 + 52 4 52 .1° moeda ½ x 2°moeda ½ =¼ ou 25% Cálculo da Probabilidade da ocorrência de dois eventos “mutuamente excludente” P(A ou B ocorrerá) Se dois eventos mutuamente excludentes. Como é possível que uma carta seja simultaneamente de “paus” e um “dez”. Então temos: P(paus) = 13 . P( dez de paus) = 1 52 52 . os eventos não são mutuamente excludentes. qual é a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado? P(cinco) ou P(seis) = P (5) + P(6) = 1 + 1 = 2 = 33. 52 P(dez)= 4 . Assim devemos excluir a probabilidade de interseção.ou ambos) = P(paus) + P(dez) . Para dois eventos A e B temos: P(A ou B) = P(A) + P(B) Exemplo.1 52 = 16 52 60 .

Regra de probabilidade P (A e B). para eventos independentes (Multiplicação) P(A) x P(B) P (A ou B).NAIPE PAUS PRETA OUROS VERMELHA K Q J 10 9 8 7 6 5 4 3 2 A COPAS VERMELHA ESPADA PRETA ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♣ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ K Q J 10 9 8 7 6 5 4 3 2 A ♥ ♥ ♥ ♥ ♥ ♥ ♥ ♥ ♥ ♥ ♥ ♥ ♥ K Q J 10 9 8 7 6 5 4 3 2 A ♠ ♠ ♠ ♠ ♠ ♠ ♠ ♠ ♠ ♠ ♠ ♠ ♠ K Q J 10 9 8 7 6 5 4 3 2 A a carta é um dez Carta de paus Os eventos “paus” e “dez” se interceptam.P(A intercepta B) 61 . para eventos mutuamente excludentes (Soma) P(A) + P(B) P (A ou B ou ambos ocorrerão). para eventos não mutuamente excludentes P(A) + P(B) .

30.Uma carta vermelha d. b. determine a probabilidade de obter: a.um número par d.29. 3.um número impar c.um número menor que quatro d.A e b são coletivamente exaustivos? Explique.Joga-se uma vez um dado equilibrado. c. seis ou sete c.Uma figura c.31 e P(B) = 0.um seis b. Determine a probabilidade de obter: a.Joga-se uma moeda três vezes.A e B são mutuamente excludentes? Explique. P(B) = 0.80 e P(A e B) = 0.Qual a probabilidade de ambas as faces serem pares? 6.Um nove vermelho ou um oito preto 2. a.Determine P(A ou B). 7.Um dez de paus f.o número 3 b. a.Extrai-se uma só carta de um baralho de 52.Qual a probabilidade de ambas as faces serem seis? b.Sejam P(A) = 0.o número dez 5.Sejam A e B mutuamente excludentes.Relacione os resultados possíveis do lance de um só dado. determine a probabilidade de sair: a.Doze fichas são numeradas de 0 a 12 e colocadas numa urna.um número menor que quatro 4.Qual a probabilidade de ambas as faces serem dois? c.Determine P(A ou B). Escolhida uma aleatoriamente.15.Um valete b.Determine P (A e B) 8.Uma carta de ouros e. Ache a probabilidade e adicione-as.cinco. P(A) = 0. Qual a probabilidade de aparecer coroa três vezes? Qual a probabilidade de não aparecer coroa nas três vezes? 62 .Joga-se um par de dados equilibrados: a.EXERCÍCIOS: E-4 1. b.

FVF. mas quando o numero de resultados é grande. FV. VFV. FVV. FF Três questões temos VVV. VVF.0 TECNICAS DE CONTAGEM Para utilizar o método clássico (A Priori) da probabilidade. é preciso conhecer o número total de resultados possíveis de um experimento. 63 . Qual a probabilidade de ele responder corretamente todo o teste? A primeira coisa a fazer é determinar o numero total de resultados possíveis. Em seguida podemos ver um diagrama de àrvore para determinar todos os arranjos possíveis.13. esteja dando todas as respostas na base do palpite. Imaginemos que o teste consista de apenas: Uma questão temos V ou F Duas questões temos VV. Suponhamos que um estudante esteja fazendo um teste de 20 questões do tipo “verdadeiro-ou-falso”. Uma das possibilidades é o uso das árvores de decisão. não tenha estudado nada. Suponhamos ainda que ele. Em segundo lugar devemos explorar suas diversas versões. essa lista se torna muito trabalhosa. é necessário então recorrer a formulas matemáticas para determinar o numero total de resultados possíveis. VFF. a listagem se tornara praticamente impossível. VF. o numero de itens for grande. FFV. FFF Conclue-se: Numero de questões : 1 2 3 4 2 4 8 16 Numero de resultados : Nota-se que se.

13. nada se tem a ganhar identificando cada resultado.QUESTÃO N°1 N°2 V V F N°3 RESULTADOS V F V F V V F F V F VVV VVF VFV VFF FVV FVF FFV FFF . teremos: TOTAL DE RESULTADOS 4=4 4 x 4 = 16 4 x 4 x 4 = 64 64 .1 O PRINCIPIO DA MULTIPLICAÇÃO O diagrama mostra que cada questão dobra o numero total de resultados possíveis. o que realmente é necessario é determinar o numero total de resultados. F Alem disso.(com duas alternativas V ou F) temos: NUMERO DE QUESTOES 1 2 3 4 TOTAL DE RESULTADOS 2=2 2 x 2 =4 2x2x2=8 2 x 2 x 2 x 2 = 16 Se fossem quatro escolha para cada questão: NÚMERO DE QUESTÕES 1 2 3 Para solucionar o exercício do teste.

Outros exemplos: 5! = 5 x 4 x 3 x 2 x 1 = 120 12! = 12 x 11 x 10 x 9 x 8 x 7 x ..576 . quase nunca é necessário utilizar-se completamente os fatoriais.. Exemplos: 65 . permitindo cancelamentos: 5! = 7! 5x4x3x2x1 7x6x5x4x3x2x1 = 5! 7 x 6 x 5! 1 7x6 = 1 42 4! = 2! 4 x 3 x 2 x 1 = 4 x 3 x 2! = 4 x 3 = 12 2x1 2! 5! 2! 3! = 5 x 4 x 3! 2 x 1 x 3! = 5 x 4 = 20 = 10 2x1 2 Às vezes os fatoriais podem envolver soma e subtração....048...576 ou 1 1. à medida que aumenta o numerobase. o numero total de resultados é m n. Para o uso na analise combinatória usaremos o numero fatorial representado pelo símbolo ! como por exemplo 4! le-se “Quatro Fatorial” e significa 4 x 3 x 2 x 1 = 24. 20 = 220 = 1. cada uma com “m” escolhas. ... ARRANJO E COMBINAÇÃO... Quando a ordem em que os elementos se dispõem é importante. se ha “n” decisões seqüenciais. 13. . De um modo geral.2x2x2x2x2x. .. ..048. Felizmente. o numero total de resultados possíveis é conhecido como Arranjo ou Permutação.. .... o numero total de resultados possíveis é designado como Combinação.600 Os fatoriais crescem de modo extremamente rápido. . .001..x 1 = 479. .2 PERMUTAÇÃO. pois eles aparecem em grupos.x2 1 2 3 4 5 . . Quando a ordem não interessa..

x = n! ( n – x )! Ou seja. E com os números: 2.( 5 . 7 elementos tomados 3 a 3 A 7. 68. Quando se consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos “eneários” que se podem formar com esses n elementos.3 = 7! ( 7 – 3 )! = 7! 4! 7 x 6 x 5 x 4! = 7 x 6 x 5 = 210 4! PERMUTAÇÃO 66 .2 = 26. B e C são A 3. BA. 86. Assim. 62.2° e 3° lugares? A n. dispomos de todas as formas possíveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos elementos.3 )! = 2! ( 9 . AC. quantos arranjos ha considerando 1°. 5! = e não ( 5! .2 A 3. 1! = 1.2 = AB. 6 e 8 podem ser feitos os seguintes arranjos A 3. Outro exemplo: Se ha sete cavalos num páreo. CB. BC.2 (3 elementos dois a dois) A 3. 28.3! ) 8 x 7 x 6 x 5! = 8 x 7 x 6 3 x 2 x 5! 3x2 = 56 O fatorial de zero é igual a um O fatorial de 1 é igual a um 0! = 1. os arranjos possíveis com as letras A.2 )! = 7! ( 3 + 1)! 8! 3 ( 8 – 3 )! = 4! = 8! 3! . ARRANJOS São agrupamentos que podem variar pela ordem ou natureza dos elementos. 82. CA.

x = n! x! (n . .....nK Pn = n! (n1!) (n2!) (n3!) . 1 P8 = 8! (4!) (3!) (1!) = 280 COMBINAÇÃO Chama-se combinação quando não interessa a ordem para denotar o numero de agrupamentos distintos possíveis.. para agrupamentos de tamanho x extraídos de uma lista de n itens.x )! n x 67 . n2 de outro tipo. dos quais n1 são indistinguíveis de um tipo. Em geral o numero de permutações distintas com n itens... Neste caso cada objeto entra só uma vez em todos os grupos. é: n1. De um modo geral.. n2. o numero de combinações possíveis é: C n. etc. 3.(nk!) Exemplo: Quantas permutações distintas de 3 letras podemos formar com as letras: RRRR UUU N 4 3 1 Solução Ha 8 letras : 4Rs 3Us 1N dai: 4.Denomina-se permutação aos arranjos de objetos tomados n a n. A escolha de batata e cenoura é a mesma que cenoura e batata. Exemplo: é a escolha de 2 tipos de vegetal de um cardápio com 5 tipos.

. C n.nK Pn = n! (n1!) (n2!) (n3!) .(nk!) COMBINAÇÕES: a ordem não importa.1 ) Homens ( 6. Mulheres ( C 4. de um total de 4 mulheres e 6 homens...x )! n x 68 .Quantos comitês distintos.. podemos formar com um grupo de 10 pessoas? C10.x = n! ( n – x )! PERMUTAÇÃO COM REPETIÇÕES (OU DISTINGUIVEIS): alguns itens são idênticos.3 = 10! 7! 3! = 10 x 9 x 8 x 7! = 120 3 x 2 x 7! De quantas maneiras podemos formar um comitê de 1 mulher e 2 homens. e a ordem é importante.2 ) = 4! 3! 1! 6! 4! 2! = 4 x 15 = 60 13.. de 3 pessoas cada um.. n1.3 REGRAS DE CONTAGEM REGRA DA MULTIPLICAÇÃO: o produto do numero de escolhas para uma seqüência de decisões m n onde m = numero de escolhas n = decisões seqüenciais ARRANJOS: numero de agrupamentos em que interfere a ordem A n..x = n! x! (n . n2...

De quantas maneiras podemos escolher dois tipos diferente de pizza? 69 .A 3. cinco cores externas e duas internas. Quantas placas diferentes podemos formar admitindo-se o uso de todas as (26 letras) e os (10 algarismos)? 6.Um vendedor de automóveis deseja impressionar os possíveis compradores com o maior numero de combinações diferentes possíveis. de quantas maneiras podem ser conquistados os três primeiros lugares? 8.6 e. dois tipos de transmissão. as placas de licença constam de três letras e quatro algarismos.A 5.Em um determinado Estado.Se um torneio de basquetebol consiste de 36 times. cogumelos.1 d.1! e.De quantas maneiras diferentes podemos escolher um comitê de cinco pessoas dentre oito? 9.2 b.10! d.2! b.Calcule: a.Quantas permutações distintas podem ser feitas com as letras da palavra BLUEBEARD ? 7.4 c.0! 2. Um modelo pode ser dotado de três tipos de motor.0 4.Calcule: a3 2 b4 4 c5 1 d9 6 3.3! c. Quantas são a escolhas possíveis? 5.A Pizzaria do Joe oferece as seguintes escolhas de pizza: presunto.A 4.EXERCÍCIOS: E-5 1. pimentão. enchovas e muzzarella.A 1.A 9.Determine o numero de arranjos: a.

2 1 = 4 1 2 0. 2 1 = 4 70 .a. 0 CK 1 KC 1 KK 2 Se a moeda é equilibrada.0 DISTRIBUIÇÃO DE PROBABILIDADES Introduzidas às noções fundamentais sobre a teoria das probabilidades.As probabilidades dos diversos resultados são: RESULTADOS PROBABILIDADE DO RESULTADO 1 CC 2 1 CK 2 1 KC 2 1 KK 2 2 . Uma distribuição de probabilidades é uma distribuição de freqüência relativa para os resultados de um espaço amostral (isto é.25 1 0 0. P(K) = P(C) = ½.a.14.25 . Consideremos a variável aleatória “Numero de caras em duas jogadas de uma moeda” eis a lista dos pontos do espaço amostral e os valores correspondentes a v. 2 1 = 4 0. 1 = 4 1 1 0.25 NUMERO DE CARAS P(X) .: (K = cara e C = coroa) Resultados CC Valor da v. para os resultados de uma variável aleatória).25 . que mostra a proporção das vezes em que a variável aleatória tende a assumir cada um dos diversos valores.50 1 1 0. pode-se passar às chamadas Distribuições de Probabilidades.

Assim. pois. como é de esperar.00 Note-se que a soma de todas as probabilidades é 1. a distribuição de probabilidades para o numero de caras em duas jogadas de uma moeda são: NUMERO DE CARAS P(X) 0 0. pois os resultados apresentados são mutuamente excludentes e coletivamente exaustivos.25 1.25 1 0.00 71 .75 2 1.00.50 2 0. NUMERO DE CARAS P(X ou menos) 0 0. A mesma distribuição pode ser apresentada em forma acumulada.25 1 0.

5 E A C U 0.25 E 0.00 1.75 L I D A D 0. A tabela abaixo mostra todas as possibilidades de combinações cara/coroa.Graficamente.25 0 0 1 2 NUMERO DE CARAS 0 1 2 NUMERO DE CARAS 14. os eventos que estas combinações originam e os valores correspondentes da variável aleatória X : Numero de vezes que sai “Cara”.5 L I D A D 0.25 0. 72 .5 0.75 0. as distribuições de probabilidade e acumulada se apresentam: P R 1.25 M U L A D 0 A 1.75 O B A B I 0.OO P R 0.1 DISTRIBUIÇÃO BINOMIAL Suponhamos agora o experimento E4= “Lançamento de 4 moedas”.25 0.00 O B A B I 0.

3.0625 = 0.d. A probabilidade de X=0 é obtida pelo conhecimento de termos 4 coroas.0625 +0. -63Para o calculo da probabilidade X=1 deve-se trabalhar com o evento “1K e 3C” como temos as opções a. a probabilidade final será: 0.5 = 0.0625 +0. o que é o mesmo de se efetuar o produto 4x 0. sabe-se que a probabilidade de sair coroa é ½ . Desta forma analogamente temos: 73 .0625. que são mutuamente exclusiva.25.5x0.0625 +0. 4 CCCC CCCK CCKC CKCC KCCC CCKK CKKC KKCC CKCK KCKC KCCK KKKC KKCK KCKK CKKK KKKK EVENTO VALOR DE X ( N° DE VEZ QUE SAI CARA) 0K e 4C 1K e 3C 0 1 2K e 2C 2 3K e 1C 3 4K e 0C 4 Utilizando as regras do produto para eventos independentes (e) e da adição para eventos mutuamente exclusivos (ou) é possível calcular as probabilidades associadas aos valores de X.c. a regra da soma manda efetuar a adição 0.b.5x0.0625 ou.5x0.POSSIBILIDADE N° 1 2a 2b 2c 2d 3a 3b 3c 3d 3e 3f 4a 4b 4c 4d 5 MOEDA N° 1. 2.

5 1.0625 = 4 X 0.2500 = 4 X 0.5 2 2 = 4p 2 q 2 O.X 0 1 2 3 4 EVENTO 0K e 4C 1K e 3C 2K e 2C 3K e 1C 4K e 0C P(X = x) 0 4 0 4 O.5 X 0.5 q = 1 – p = probabilidade de C = P(C) = 0.0625 = 1 X 0.00 Podemos usar a formula: n! x! (n – x)! = n x = combinações de n individuais tomados x a x.5 3 1 = 6p 3 q 1 O. x n-x P(x) = n! x! (n – x)! p .5 X 0.5 X 0.5 X 0.5 4 0 = 1p 4 q 0 O.5 = 1p q TOTAL n = numero de moedas p = probabilidade de K = P(K) = 0.0625 = 1 X 0. Generalizando temos. q 74 .5 X 0.3750 = 6 X 0.5 1 3 = 1p 1 q 3 O.

117180 2 p(2) = 45 1/1024 = 0.000976 9 p(9) = 10 1/1024 = 0.117180 6 p(6) = 210 1/1024 = 0.043940 1 p(1) = 10 1/1024 = 0.246090 4 p(4) = 210 1/1024 = 0.205070 3 p(3) = 120 1/1024 = 0.Distribuição binomial de x (numero de coroas) para n = 10 X Numero de “Coroas” em 10 jogadas n! x ! (n – x) ! Distribuição Amostral P(X) probabilidade % de encontrar a Amostra 10 p(10) = 10! 10! (10 – 10)! 10! 9! (10 – 9) ! 10! 8! (10 – 8) ! 10! 7! (10 – 7) ! 10! 6! (10 – 6) ! 10! 5! (10 – 5) ! 10! 4! (10 – 4) ! 10! 3! (10 – 3) ! 10! 2! (10 – 2) ! 10! 1! (10 – 1) ! 10! 0! (10 – 0) ! 1 1/1024 = 0.000976 TOTAL = 2 = 1024 75 .205070 5 p(5) = 252 1/1024 = 0.009760 8 p(8) = 45 1/1024 = 0.009760 0 p(0) = 1 10 1/1024 = 0.043940 7 p(7) = 120 1/1024 = 0.

Se sete pessoas pedem cachorrão.Determine a probabilidade de todos os seis ser fumante.Todos voltem dentro de 25 dias para reparo. c.Um revendedor de automóveis novos constatou que 80% dos carros vendidos são devolvidos ao departamento mecânico para corrigir defeitos de fabricação. b.EXERCICIOS: E-6 Use a formula binomial para responder às questões abaixo: 1. determine a probabilidade de que. a. nos primeiros 25 dias apos a venda.Qual a probabilidade de ao menos a metade dos seis serem fumantes.determine a probabilidade de que todos os 15 que reservaram lugar compareçam ao embarque b. b. 4. 76 . O avião comporta 15 passageiros. 3. a.Determine a probabilidade de nenhuma das seis ser fumante. numa amostra de nove mesas: a.Se houve 16 pedidos de reserva. determine a probabilidade de que: a. qual é a probabilidade de que: a.Dos estudantes de um colégio.Só um não volte 5.Doze por cento dos que reservam lugar num vôo sistematicamente faltam ao embarque. Escolhem-se seis ao acaso para darem sua opinião sobre o fumo. Se tal suspeita é correta. determine a probabilidade de uma pessoa ficar de fora.Haja ao menos uma defeituosa b. 41% FUMAM CIGARROS.Não haja nenhuma defeituosa 2.Um fabricante de mesas de bilhar suspeita que 2% de seu produto apresenta algum defeito.Apenas um não a queira.Todos queiram mostarda b.Suponha que 8% dos cachorros-quentes vendidos num estádio de futebol sejam pedidos sem mostarda. De 11 carros vendidos num período de 5 dias.

02 x=5 n. Temos: n = 400 -8 e = 0. ou seja.. 2.p = 400 .p < 10 n = Elementos da População p = Probabilidade Exemplo: n = 150 p = 0.. (0.n. . e x! .5 A formula a ser usada é: x f (x) = (n. Utilize a aproximação de Poisson da distribuição Binomial para achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam algum defeito de encadernação.. 0.05) = 7.000335 p = 2% = 0.05 Temos a distribuição de Poisson com: n.p para x = 1.p = 150 .. Quando “n” é grande e “p” é pequeno podemos usar a aproximação de Poisson para a distribuição Binomial.718 Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam defeitos de encadernação. e= 2.2 DISTRIBUIÇÃO DE POISSON A chamada Distribuição de Poisson ou de Eventos Raros podem ser considerada um caso limite da distribuição binomial.14.02 = 8 77 . Como regra geral podemos usar: n > 100 e n. É difícil dar condições precisas para que se possa usar a aproximação de Poisson. 3.p) .. o que significa quando “n” é grande e “p” pequeno..

temos então: x f (x) = (n.p) . e x! - n.p =

5

-8

8 . e 5!

= (32768). (0,000335) = 10,977 = 0,0915 120 -67120

Outro Exemplo: Supúnhamos que os defeitos em fios para tear possam ser aproximados por um processo de Poisson com media de 0,2 defeitos por metro (p = 0,2) .Inspecionando-se pedaços de fio de 6 metros de comprimento, determine a probabilidade de menos de 2 (isto é 0 ,1) defeitos. Temos : n = 6 p = 0,2 n . p = 6 . 0,2 = 1,2 x =1 e X=2

0

-1,2

f(0) =

1,2 0!
1

e

= 1 . 0,301 = 0,301 1

-1,2

f(1) =

1,2 1!

e

= 1,2 . 0,301 = 0,3612 1

P(x< 1) = P(0) + P(1)

(0,301 + 0,3612) = 0,6622

78

EXERCICIOS: E-7

1- Verifique, em cada caso, se os valores de “n” e “p” satisfazem as regras empíricas para a utilização de Poisson como aproximação da Binomial: abcn = 500 e n = 100 n = 60 e e p = 0,001 p = 0,12 p = 0,002

2- Se 0,6% dos detonadores fornecidos a um arsenal são defeituosos, utilize a aproximação de Poisson para a distribuição Binomial para determinar a probabilidade de que, em uma amostra aleatória de 500 detonadores, quatro sejam defeituosos. 3- Em uma certa cidade 3,2% dos habitantes se envolve em, ao menos, um acidente de carro em um ano. Com o auxilio da aproximação de Poisson para a distribuição Binomial, determine a probabilidade de que, dentre 200 motoristas escolhidos aleatoriamente nessa cidade. a- Exatamente seis se envolvam em ao menos um acidente em um ano; b- No Maximo oito se envolvam em ao menos um acidente em um ano; c- Cinco ou mais se envolvam em ao menos um acidente em um ano;

4- Suponha que, em media 2% das pessoas sejam canhotas. Encontre a probabilidade de 3 ou mais canhotos em 100 pessoas

79

15.0 CORRELAÇÃO
15.1 INTRODUÇÃO
Até agora nossa preocupação era descrever a distribuição de valores de uma única variável. Com esse objetivo, aprendemos a calcular medidas de tendência central e variabilidade. Quando porem, consideramos observações de duas ou mais variáveis, surge um novo problema: as relações que podem existir entre duas ou mais variáveis estudadas.

Assim, quando consideramos variáveis como peso e altura de um grupo de pessoas, uso do cigarro e incidência do câncer, a potencia gasta e a temperatura da água no chuveiro, Procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação.

Para isso, é necessário o conhecimento de novas medidas.

Sendo a relação entre as variáveis de natureza quantitativa, a correlação é o instrumento adequado para descobrir e medir essa relação.

Uma vez caracterizada a relação, procuramos descreve-la através de uma função matemática. A regressão é o instrumento adequado par a determinação dos parâmetros dessa função.

15.2 RELAÇÃO FUNCIONAL E RELAÇÃO ESTATÍSTICA
Como sabemos, o perímetro e o lado de um quadrado estão relacionados. A relação que liga é perfeitamente definida e pode ser expressa por meio de uma sentença matemática: P=4L P= PERIMETRO L= LADO DO QUADRADO 80

pode acontecer que a estaturas diferentes correspondam a pesos iguais ou que estaturas iguais correspondam a pesos diferentes. formada por 98 alunos de uma classe da Uniso e pelas notas obtidas por eles em Matemática e Estatística: NOTAS Nº MATEMATICA (xi) ESTATISTICA (yi) 01 08 24 38 44 58 59 72 80 92 5. As relações do tipo peso-estatura.0 81 .0 2.0 8.0 3.0 9. Assim.0 7. É evidente que essa relação não é do mesmo tipo da anterior.0 7. Porem.0 8.0 6.0 10. 15. Quando duas variáveis estão ligadas por uma Relação Estatística.0 8. é possível determinar exatamente o valor do perímetro. ela é bem menos precisa. em média.0 5.0 9.0 6.Atribuindo-se.0 7.0 4.0 10.3 DIAGRAMA DE DISPERSÃO Consideremos uma amostra aleatória. então.0 8.0 6. como relações estatísticas. As relações do tipo perimetro-lado são conhecidas como relações funcionais. um valor qualquer de L. dizemos que existe uma correlação entre elas. Considerando. quanto maior a estatura.0 2. agora a relação que existe entre o peso e a estatura de um grupo de pessoas. maior o peso.

8 . Podemos imaginar que. . os parâmetros (xi . . 6 . vistos em conjunto formam uma elipse em diagonal. que a correlação de forma elíptica tem como “imagem” uma reta. . . 4 . da correlação existente: yi 10 . 82 . . . em um sistema de coordenadas cartesiano ortogonal.4 CORRELAÇÃO LINEAR Os pontos obtidos. 6 . então. quanto mais fina for a elipse mais ela se aproximará de uma reta. . . o o o o o o 4 . 2 .Representando. Dizemos. . Esse diagrama nos fornece uma idéia grosseira. 10 xi 15. porem útil. 2 o o . yi). . obtemos uma nuvem de pontos que denominamos DIAGRAMA DE DISPERSAO. . o o 8 . por isso denominada de Correlação Linear. sendo.

. . 83 .Linear negativa se os pontos tem como ”imagem” uma reta descendentes. . . concluímos que não há relação alguma entre as variáveis em estudo. 8 . . b. as relações funcionais são chamadas Relações Perfeitas. .Nao-linear se os pontos tem como “imagem” uma curva. . 2 o o . c. 4 . Assim uma correlação é: a. 2 . yi 10 . 6 .É possível verificar que cada correlação esta associada como “imagem“ uma relação funcional. Por esse motivo. . não oferecendo uma “imagem” definida. o RETA IMAGEM o 8 .Linear Positiva se os pontos do diagrama tem com “imagem” uma reta ascendente. o o o o o o 4 . . . . 6 . Se os pontos apresentam-se dispersos. ela é chamada de Correlação Linear Positiva. 10 xi Como a correlação em estudo tem como “imagem” uma reta ascendente.

Temos: Y o oo ooo oo ooooo ooo ooooo oo o oo correlação linear positiva X Y o oo ooo oo ooooo ooo ooooo oo o oo correlação linear negativa Y X o o oo oo oooo ooo oo oo ooo ooooo o correlação não-linear ooo oooo ooooo ooo oo oo o oooo oo ooo Y oo o o o o o o o oooo ooo o ooo oo ooo oooo oooo oooo o o oo ooo ooooo o o ooo oo o ooooo X não há correlação X 84 .

Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e.6 ≤ | r | ≤ 1 ≤ | r | < 0.5 COEFICIENTE DE CORRELAÇÃO LINEAR O instrumento empregado para a medida de Correlação Linear é o Coeficiente de Correlação.15. Faremos uso do coeficiente de correlação de Person. que é dado por : r= n Σ xi yi – (Σxi ) (Σyi) √ Onde: [ n Σ x²i – (Σxi)²] [ n Σ y²i – (Σyi)²] n = número de observações Os valores limites de r são -1 e +1. B.Se não há correlação entre as variáveis ou a relação é por ventura não-linear. é necessário que: 0. então r = +1. Assim: A. Se 0. há uma correlação relativamente fraca entre as variáveis. o sentido dessa correlação (positivo ou negativo). provavelmente trata-se de uma relação curvilínea. ainda. isto é.3 85 . o valor de r pertence ao intervalo [ -1 e +1].Se a correlação é perfeita e negativa.Se a correlação entre duas variáveis é perfeita e positiva. Uma maneira pratica de verificarmos a linearidade da relação é a inspeção do Diagrama de Dispersão: se a elipse apresenta saliências ou reentrâncias muito acentuadas. então r = -1 C. NOTAS - Para que uma relação possa ser descrita por meio do Coeficiente de Correlação de Person é imprescindível que ela se aproxime de uma função Linear. então r = 0.6. - Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas.

nada podemos concluir sobre a relação entre as variáveis em estudo.225) √ 585 x 525 Dai: r = 0.91 Resultado que indica uma correlação linear positiva altamente significativa entre as duas variáveis.0 3. 86 . praticamente.0 7.0 8.0 5.0 10.3.810 – 4.750 – 4.18 = 0. O modo mais pratico para obtermos r é abrir.0 Σ=65 ESTATISTICA (yi) 6.0 9.0 8.0 2. colunas correspondentes aos valores de xi yi.0 9.0 7. a correlação é muito fraca e.0 8.225) (4.0 4.0 8.554.0 6. -81Em seguida vamos calcular o coeficiente de correlação relativos ao exercício anterior. x²i e y²i.0 2.0 Σ=65 xi yi 30 72 56 100 30 49 72 12 48 04 Σ=473 x²i 25 64 49 100 36 49 81 09 64 04 Σ=481 y²i 36 81 64 100 25 49 64 16 36 04 Σ=475 Logo: r= 10 x 473 – 65 x 65 = 505 = 550 4.0 6. na tabela. Assim: MATEMATICA (xi) 5.911 √ (4.0 7.0 10.Se 0 < | r | < 0.

Devemos evitar a conclusão de que a correlação implica em casualidade. A conclusão de que não há correlação linear significativa não quer dizer que x e y não estejam relacionados de alguma forma provavelmente possa haver uma correlação não linear. suprimimos a variação entre os indivíduos ou elementos.6 CUDADOS COM OS ERROS COM A INTERPLETAÇÃO DE CORRELAÇÃO Identificamos a seguir três dos erros mais comuns cometidos na interpretação de resultados que envolvem correlação. 1. 87 . 3. Quando utilizamos taxas ou médias para os dados. Porem essas duas variáveis são afetadas pelas condições econômicas que envolvem não só o professor de Estatística.Surge outra fonte de erro potencial quando os dados se baseiam em taxas ou médias. Um estudo mostrou uma correlação entre salários de professores de Estatística e o consumo individual de cerveja.Um terceiro erro diz respeito à propriedade de linearidade.15. aparece neste caso uma terceira variável oculta. e isto pode levar a um coeficiente de correlação inflacionado. 2.

..... = . 12.…...0 ……. – .. …… …… 14. ONDE: r = 88 . √ (....... ..0 …….... x ... x . .........0 Σ= Σ= 12.....) (... = .. – ...EXERCICIOS: E-8 1....0 Σ= Σ= Σ= Logo: r= ..... x ... ……........... = ..) √ ... – ..Complete o esquema de cálculo do coeficiente de correlação para os valores das variáveis xi e yi : xi yi 4 12 6 10 8 8 10 12 12 14 Temos: (xi) (yi) xi yi x²i y²i 4.........

1 3.6 6.8 3. A- (xi) 34 30 40 34 39 35 42 45 43 Σ= BΣ= (yi) 21 22 25 28 15 24 24 22 17 xi yi x²i y²i Σ= Σ= Σ= (xi) (yi) xi yi x²i y²i 3.9 4.4 4.Padronize cada conjunto de escores e calcule o coeficiente de correlação.0 2.0 Σ= 46 46 52 50 48 40 42 44 Σ= Σ= Σ= Σ= 89 .2.2 4.

Com os dados abaixo.6 4. monte o gráfico para os dados e calcule o coeficiente de correlação.4 2.1 5.9 4.2 4.0 2.0 2.Determine o coeficiente de correlação para os dois conjuntos de valores abaixo: 1ª AVALIAÇÃO 2ª AVALIAÇÃO estudante 1 2 3 4 5 6 7 8 9 10 11 (xi) 82 84 86 83 88 87 85 83 86 85 87 Σ= (yi) 92 91 90 92 87 86 89 90 92 90 91 Σ= xi yi x²i y²i Σ= Σ= Σ= 4.0 3.8 3. Crimes Violentos/ 1000 residentes 5. sobre crimes violentos e a temperatura média entre 21 e 2 horas das noites de sábado numa grande comunidade.7 3.3.1 temperatura média (°F) 87 50 75 90 55 54 68 85 82 80 45 58 66 90 .1 4.2 2.

0 8. através de um modelo matemático.16.0 7.0 7.0 4. Assim.0 REGRESSÃO LINEAR Sempre que desejamos estudar determinada variável em função de outra fazemos sempre uma análise de regressão.0 ESTATISTICA (yi) 6. vamos procurar determinar o ajustamento de uma reta a relação entre essa variáveis.0 8.0 7.0 10.0 8. como.0 8. entre as quais exista uma correlação acentuada.0 9. Sejam duas variáveis X e Y. 16. vamos obter uma função definida por: Y = ax + b onde a e b são parâmetros. Podemos dizer que a analise de regressão tem por objetivo descrever.0 2.0 10. embora não perfeita. por exemplo.0 91 .0 6. a relação entre duas variáveis. as do exercício já apresentado: MATEMATICA (xi) 5.0 6. partindo de n observações das mesmas.0 9.1 AJUSTAMENTO DE CURVAS A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente.0 2. supondo X a variável independente e Y a dependente.0 5.0 3. ou seja.

de modo a permitir o ajustamento de uma reta.Cujo Diagrama de Dispersão é dado por: yi 10 . 6 . . 8 . .2 MÉTODO DOS MÍNIMOS QUADRADOS Vamos então. 2 . . Σyi n ΣXi² . pela forma do diagrama. 4 . . .Σxi . . imagem da função definida por: Y = ax+ b 16.(Σxi)² e b = Y . . . 6 . . . 10 xi Podemos concluir. 2 o o . . que se trata de uma correlação retilínea.a X 92 . calcular os valores dos parâmetros a e b com a ajuda das fórmulas: a = n Σ Xi Yi . o RETA IMAGEM o 8 . o o o o o o 4 .

Sendo assim.0 8.0 6.4225 = 505 = 0.0 8. escrevemos: Y^ = a X + b Onde Y^ é o Y estimado A tabela de valores: MATEMÁTICA (xi) ESTATÍSTICA (yi) xi yi x²i 5.0 4.0 10.0 5. o resultado.0 9.4225 585 93 . é uma estimativa da verdadeira equação de regressão.0 9.0 10.0 7.0 7.8632 10 x 481 – (65)² 4810 .0 Σ=65 30 72 56 100 30 49 72 12 48 04 Σ=473 25 64 49 100 36 49 81 09 64 04 Σ=481 a = 10 x 473 – 65 x 65 = 4730 .0 7.0 8.0 2.0 2.Onde : n é o número de observações X é média dos valores de Xi (X = Σ Xi ) n Y é média dos valores de Yi (Y = Σ Yi ) n Nota: Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros.0 6.0 Σ=65 Temos assim 6. na realidade.0 3.0 8.

5 – 0. 4 . . 0. .6108 = 0. . 5. 6 .86 e b = 0.86 X + 0.8632 x 6. 4 . 10 xi 94 .19 Assim temos: yi 10 . . Donde: a = 0.89 Y^ = 0. 8 . . basta determinar dois de seus pontos: X=0 X=5 Y^ = 0.5 .5 = 6. 2 .5.86 x 5 + 0.5 10 e Y = 56 = 6.86 X + 0. o o o o o o o o o o Y^ = 0.89 . 6 .Como: X = 65 = 6.89 Para traçarmos a reta no gráfico.89 = 5.19 . .89 . 2 . .5 10 Vem: b = 6.8892.89 Logo: ˆ Y = 0. 8 . .

95 . e analisaremos a seguir. proporções. e b . variâncias e desvio padrão. se fundamentarmos nosso trabalho em outra amostra de mesmo tamanho n o método de mínimo quadrado poderia gerar valores diferentes de para a poderia gerar valores para Y^ diferentes. com certo grau de confiança valores de Y^. como também Para prever essas diferenças é possível estabelecermos um intervalo para o qual possamos afirmar.3 ANÁLISE DE REGRESSÃO Quando recorremos a uma reta de mínimos quadrados. O cálculo desses intervalos segue os mesmos raciocínios visto anteriormente para as médias .16. precisamos saber qual é a precisão dos valores obtidos para a e b na equação de mínimos quadrados? Qual a precisão da estimativa Y^? Os valores calculados são apenas estimativas baseadas em dados amostrais e.

e finalmente um outro cachorro. outro cachorro após 12 horas cometeu 6 erros.A tabela a seguir mostra quantas semanas seis pessoas trabalharam em um posto de inspeção de automóveis e quantos carros foram inspecionados entre 12 e 14 horas. cometeu apenas 1 erro.y = 10 . Σy = 107. apos 18 horas.Com o auxilio da parte a.Estabeleça a equação da reta de mínimos quadrados que permite predizermos y em termos de x.y = 8 1/3 x 2.½ x b. estime quantos carros uma pessoa que venha trabalhando no posto de inspeção ha 8 semanas poderá inspecionar? 96 . qual das duas retas se ajusta melhor aos três pontos. em determinado dia: Número de semanas Trabalhadas Número de carros inspecionados 2 7 9 1 5 12 13 21 23 14 15 21 Para esses dados temos: Σx = 36. Σx² = 304. b. no sentido de mínimos quadrados? a. Σy² = 2001 e 3040 Σx.Após 6 horas de treinamento. Denotando por x o número de horas de treinamento e por y o número de erros cometidos.EXERCICIOS: E-9 1. um cachorro cometeu 5 erros em uma exposição canina.y =721 a.

Σy² = 15.5 1.Com a equação da reta de mínimos quadrados. estime o resíduo de cloro na piscina 5 horas após ter sido tratada.P.6 A leitura de zero horas foi feita imediatamente após completado o tratamento químico. após ter sido tratada com produtos químicos: X Número de Horas Y Resíduo de cloro (P.4 1.Ajuste uma reta de mínimos quadrados que nos permita predizer o resíduo de cloro em termos do número de horas após a piscina ter sido tratada com produtos químicos. b. estime o resíduo de cloro na piscina 8 horas após ter sido tratada.9 Para esses dados temos: Σx = 42.1 1. a.) 0 2 4 6 8 10 12 2. Σx² = 364.52 e Σx .3. 97 .1 da tabela. Σy = 10.Os dados abaixo se referem ao resíduo de cloro em uma piscina em vários momentos.1 0. Por que razão o resultado diverge do valor 1.M.y =48.2 1.8 1. c.Com a equação da reta de mínimos quadrados.

Rio de Janeiro: LTC. e SIMON. administração e contabilidade.. São Paulo: Saraiva. São Paulo: McGraw-Hill. Métodos Estatísticos para a Melhoria da Qualidade. 2000.5 S734e) 98 . Introdução à estatística.BIBLIOGRAFIA BIBLIOGRAFIA BÁSICA FREUND. São Paulo:Gente. John E. Estatística aplicada à Economia e à Administração. (519. São Paulo: Makron Books.Blucher. 2000. RAMOS A. TRIOLA. São Paulo: Saraiva. BIBLIOGRAFIA COMPLEMENTAR KUME. Giuseppe e ANGELINI. Porto Alegre: Bookman. Flávio. Estatística básica. CEP para Processos Contínuos e em Bateladas. 1995. DOWNING Douglas e CLARK Jeffrey. São Paulo:E.2002. 1982. SPIEGEL.B. Gary A. KAZMIER. 2000. 1993. 1999. MILONE. L. Estatística aplicada. Estatística. Hitoshi. Mário F. Estatística aplicada –economia. Pedro A.W. Wilton O e MORETTIN.1993. BUSSAB. Murray R. Estatística aplicada. São Paulo: Atlas.

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->