Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 6A
Reviso
Mtodo Estatstico
Amostra
140 120 100 80 60 40 20 0 0 0,2 0,4 0,6 0,8 1 1,2 ndice de Desenvolvimento Humano
Boxplot
Mdia e Desvio Padro Sumrio dos 5 nmeros: Min, Segundo Quartil (25%), Mediana (50%), Terceiro Quartil (75%), Mx + robusto Moda e Largura a Meia altura
Mtodo Estatstico
Amostra
Dada uma nica amostra de tamanho n, qual seria o intervalo que conteria a mdia populacional desconhecida em 95 % das vezes ?
1. Imaginamos um nmero bem grande de amostras aleatrias do mesmo tamanho. 2. Imaginamos que calculamos valores estimados em cada um delas. Estes valores estimados estariam distribudos em torno do valor desconhecido da grandeza. 3. A Teoria de Probabilidades nos permite ento descrever a distribuio destes valores.
Inferncia Estatstica
Amostra
Populao
Inferncia Estatstica
A teoria de probabilidades nos permite estimar a partir de uma amostra um intervalo com confiana definida para os valores na populao. Para isso calculamos um estimador de intervalo.
Inferncia Estatstica
Suponha que queiramos determinar a MDIA POPULACIONAL de uma quantidade. A amostra tem tamanho n. Calculamos a mdia amostral:
O intervalo de confiana :
Estatstica T
Quando a amostra for pequena teremos que fixar uma confiana (por exemplo, 95%) e procurarmos pelo valor de c em uma tabela conhecida como estatstica T.
http://www.dim.fm.usp.br/info/tabelat/tabelat.php
Por exemplo, nossa amostra de crnios etruscos tem n=4: 141 148 132 138 Digamos que desejamos estimar um intervalo com confiana 95% para a mdia da populao. Comeamos por calcular a mdia: Mdia=(141+148+132+138)/4 = 139,75 Calculamos em seguida o desvio padro amostral: DPA = 6,65
Estatstica T
Por exemplo, nossa amostra de crnios etruscos tem n=4: 141 148 132 138 Digamos que desejamos estimar um intervalo com confiana 95% para a mdia da populao. Comeamos por calcular a mdia: Mdia=(141+148+132+138)/4 = 139,75 Calculamos em seguida o desvio padro amostral: DPA = 6,65 O nmero de graus de liberdade n-1=3 (df=3). Consultando a tabela usamos t(0.975), pois queremos um intervalo com 2,5% em cada lado (95% no total, portanto). Na tabela obtemos t(0.975)= 3,18. Assim teremos o seguinte intervalo com confiana de 95%: 139,75-3,18*6,65/RAIZ(4) < MDIA POP < 139,75+3,18*6,65/RAIZ(4) IC_MdiaPop(95%) = [129,150]
Aula 6B
Regresso
http://www.stat.wvu.edu/SRS/Modules/Applets/Regression/regression.html http://www.math.csusb.edu/faculty/stanton/probstat/regression.html
Regresso Linear
As distncias entre as observaes e a reta escolhida so aleatrias. A melhor reta aquela que minimiza a soma total destas distncias (mnimos quadrados) A qualidade do ajuste medida pelo R2 (quadrado da correlao de Pearson) que significa a frao da variao que explicada pelo ajuste. Assim R2=1 indica ajuste perfeito.
http://www.stat.wvu.edu/SRS/Modules/Applets/Regression/regression.html http://www.math.csusb.edu/faculty/stanton/probstat/regression.html
Aula 6C
Testes de Hipteses
http://www.amstat.org/publications/jse/v16n3/pvalueapplet.html
Grupo controle
Grupo em tratamento
Suponhamos duas amostras em um experimento com dois tratamentos. AS distribuies amostrais so representadas acima
variabilidade baixa
Dependendo da variabilidade observada a diferena entre mdias ser mais ou menos significativa.
A estatstica T mede a relao sinal rudo da diferena entre as mdias amostrais . Aps calcular o valor t. Basta observar a significncia em uma tabela T. A Hiptese nula corresponde a mdias idnticas. A hiptese alternativa a mdias diferentes.
Tipos de Erros
Inocente Condenado Liberado Erro TIPO I Correto Culpado Correto Erro TIPO II
Tipos de Erros
http://www.intuitor.com/statistics/CurveApplet.html H0 verdadeira Rejeita H0 No rejeita H0 Erro TIPO I Correto inocente H1 verdadeira Correto Erro TIPO II culpado
Inocentes suspeitos
O poder de um teste a probabilidade de que o teste rejeite uma hiptese nula falsa. Ou seja a probabilidade de que H1 seja julgada verdadeira quando realmente for verdadeira. Alternativamente a chance de que o teste no cometa um erro do Tipo II, ou seja ser 1-=1-P(Erro Tipo II). A probabilidade de erros do tipo I a significncia do teste =P(Erro Tipo I). Normalmente fixa-se primeiro a significncia (1% ou 5%), a partir disso define-se o intervalo de rejeio da hiptese nula. O poder do teste conseqncia desta escolha, do tamanho da amostra e da prpria amostra. Testes com poder muito baixo so pouco informativos. http://www.intuitor.com/statistics/CurveApplet.html