Mtodo Estatstico Amostra Populao Estatstica Descritiva Teoria de Probabilidades Inferncia Estatstica Aula 4A Inferncia Estatstica: Um pouco de Histria Um pouco mais de histria: A Fsica Social No tempo de Quetelet (Incio do seculo 19) Probabilidades e Estatstica eram utilizadas basicamente para anlise de erros experimentais e para clculo de seguros. Quetelet acreditava ser possvel estender seu uso para todo tipo de fenmeno humano no que chamava de Fsica Social. Publicou em 1834 seu Essai de physique sociale. Introduziu a Quetelet: 1796-1874 Essai de physique sociale. Introduziu a idia do homem mdio. Galton e Darwin: Bioestatstica Aps ler a Origem das Espcies, escrito por seu primo mais velho, Galton passou a se dedicar Gentica, dando origem ao ramo que levaria Estatstica moderna. Em 1869 Galton publicou Hereditary Genius tentando demonstrar quantitativamente que as caractersticas e habilidades as caractersticas e habilidades humanas seriam hereditrias. Francis Francis Galton Galton (1822 (1822- -1911) 1911) Charles Darwin Charles Darwin (1809 (1809- -1882) 1882) Quincunx de Galton Galton props o aparato ao lado para ilustrar a formao da distribuio formao da distribuio normal. http://www.jcu.edu/math/isep/Quincunx/Quincunx.html Karl Pearson: Departamento de Estatstica Protegido de Galton, Pearson escreveu sua biografia. Em 1911 foi responsvel pela criao do primeiro Departamento de Estatstica no mundo no University College London . Sobre o trabalho de Galton escreveu: Eu interpretei que... Galton ... quis dizer que h uma categoria mais ampla do que a conexo causal, que a correlao,... e que este novo conceito que a correlao,... e que este novo conceito de correlao fez da psicologia, da antropologia, da medicina e da sociologia passveis de tratamento matemtico. Foi Galton quem primeiro me libertou do preconceito de que boa matemtica poderia apenas ser aplicada a conexes de causa e efeito em fenmenos naturais. Seu livro a Gramtica da Cincia foi a primeira leitura da Academia Olmpica, grupo de estudos liderado por Einstein quando tinha 23 anos. Carl (Karl) Pearson (1857-1936) Gosset (Student):Controle de Qualidade William Gosset trabalhava na cervejaria Guinness. Em 1906, assistiu a um curso com Pearson. Juntos tiveram a idia de aplicar mtodos estatsticos no controle de qualidade da cervejaria. Por trabalhar na cervejaria, publicou seus artigos utilizando o pseudnimo Student, pelo qual hoje conhecemos sua principal Student, pelo qual hoje conhecemos sua principal contribuio : o teste t de Student para testarmos hipteses sobre a mdia amostral (veja exemplo dos Shoshoni e a razo urea na Aula 2). William Gosset (1876-1937) Fisher: Estatstica Moderna Em 1913 Fisher enviou uma carta para Gosset Contendo uma justificativa terica para a distribuio t. Esta seria o incio de uma seqncia deu forma a boa parte da Estatstica Moderna. Em 1919 Fisher foi contratado pela Estao de Experimentos Agrcolas de Rothamstead , onde desenvolveu um grande nmero de ferramentas tericas para exame de impactos agrcolas, entre tericas para exame de impactos agrcolas, entre elas estavam mtodos para estimao estatstica, planejamento experimental e anlise de varincia. William Gosset (1876-1937) Aula 4B A Distribuio Normal A Distribuio Normal FUVEST 2007 - Distribuio dos pontos na Primeira Fase (incluindo Bnus e ENEM) Candidatos Inscritos - Total das Carreiras de Exatas A distribuio normal uma curva em forma de sino que aparece freqentemente em todo tipo de observaes. Os parmetros da distribuio normal A distribuio Normal totalmente descrita pela mdia e pelo desvio padro . Se mudarmos a mdia apenas deslocamos a curva pela abscissa. Se diminuirmos o desvio padro tornamos a curva menos dispersa. m s Probabilidades de ocorrncia m A freqncia de ocorrncia dos dados em uma distribuio normal bem definida para cada intervalo em torno da mdia. Escore z Sua altura de 1,56 m. Voc alta? Sua nota na FUVEST foi 60. Sua nota foi alta ? O escore z permite que comparemos um valor especfico com O escore z permite que comparemos um valor especfico com a populao levando-se em conta o valor tpico e a disperso. A cada valor de z est associado um percentil. valor mdia desvio padro Escore z http://techniques.geog.ox.ac.uk/mod_2/tables/z-score.htm Peso de Meninos por Idade Como fui na FUVEST? http://www.fuvest.br/scr/hist1f.asp?anofuv=2007&tipo=1&carreira=HUM Mdia = 41,1 Desvio Padro = 15 Z = (60 41,1)/15 = 1,26 P(Z<1,26) = 89,6% Sua a nota foi alta. Voc baixinha? Amostra : n=115 (alunos da EACH) MDIA = 1,71 m DP = 9 cm Z = (1,56 1,71)/0,09 = -1,67 P(Z<-1,67) = 4,7 % Voc muito provavelmente no das mais altas ! Aula 4B Distribuio Amostral e Estimao Estatsticas Uma estatstica uma quantidade calculada a partir de amostras medidas em uma populao. 0.693 0.662 0.690 0.606 0.570 Exemplo: A razo urea e as molduras Shoshoni. 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 A mdia, o desvio padro, a mediana, os quartis, o mximo e o mnimo so estatsticas. Distribuies amostrais Uma distribuio amostral a distribuio que obtemos quando calculamos uma estatstica em vrias amostras de uma populao Suponhamos que o quadro abaixo represente nossa populao. 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 nossa populao. Distribuies amostrais 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 A mdia de nossa populao = 0,6605 e o desvio padro populacional =0,09. A distribuio est representada ao lado. 0.670 0.606 0.611 0.553 0.933 Coletando 4 amostras com tamanho n=2 obtivemos: =0.721 =0.6435 =(0.628+0.668)/2=0.648 =(0.844+0.576)/2=0.710 Distribuies amostrais 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 A mdia amostral (mdia das mdias de amostras) a = 0,668 e o desvio padro amostral a=0.066. Mdias amostrais. Repare que esta mais 0.670 0.606 0.611 0.553 0.933 Coletando 4 amostras com tamanho n=2 obtivemos: =0.721 =0.6435 =(0.628+0.668)/2=0.648 =(0.844+0.576)/2=0.710 esta mais estreita que a distribuio populacional Distribuies amostrais 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 E se as amostras forem maiores, n=8 por exemplo. 0.670 0.606 0.611 0.553 0.933 Aqui temos 2 amostras com tamanho n=8 a= 0,6606 a=0,025 Distribuies amostrais Resumindo Tamanho da Amostra (n) Mdia das mdias de amostra a Desvio padro amostral a 2 0,6680 0,066 8 0,6606 0,025 20 (populao) 0,6605 0,09 Teorema do Limite Central Para uma variedade ampla de distribuies a distribuio das mdias amostrais tende a uma http://www.chem.uoa.gr/applets/AppletCentralLimit/Appl_CentralLimit2.html tende a uma distribuio normal quando o nmero de amostras grande. Exemplo: Estimando a altura mdia da Populao Amostra : n=115 (alunos da EACH) 1,71 m um estimador para a mdia populacional O desvio padro DP=9cm um estimador para o desvio padro populacional. Exemplo: Estimando a altura mdia da Populao A distribuio amostral para amostras de tamanho n=115 ter mdia igual mdia populacional e desvio padro igual ao desvio padro populacional dividido por 115 , ou seja 0,09/ 115 = 0,01 1,71 0,01 m Nossa estimativa ser portanto O quanto podemos confiar nessa estimativa da mdia ? Exemplo: Estimando a altura mdia da Populao O quanto podemos confiar nessa estimativa para a altura mdia ? 1,72m 1,70m 1,74m 1,68m Note que: esta a distribuio para nosso erro de estimativa da altura mdia. Qualidade de Estimadores: Vis e Eficincia Vis grande eficincia alta Vis pequeno eficincia baixa Vis grande eficincia baixa Vis pequeno eficincia alta Qualidade de Estimadores: Vis e Eficincia Mdia Amostral= (x1 + x2 + x3 + ... + xn)/n no-viesado e eficiente (eficincia mxima) Desvio Padro Amostral = RAIZ{ [(x1-Media) 2 + (x2-Media) 2 + ... (xn-Media) 2 ]/ (n-1)} no-viesado.