Escolar Documentos
Profissional Documentos
Cultura Documentos
PREFCIO
O presente relatrio busca apresentar os recursos mais utilizados do Minitab em cursos de Estatstica Bsica por meio de exerccios resolvidos. Organizado em seis captulos, o texto aborda Estatstica Descritiva, Probabilidade e Testes de Hipteses. O trabalho foi desenvolvido durante o perodo de abril a dezembro de 2008, como atividade integrante do Programa de Monitoria de Graduao PMG/UFMG, contando com o apoio de bolsa desse programa. Os autores agradecem o apoio recebido para o desenvolvimento deste trabalho. Sugestes e correes sero muito bem recebidas aprimoramento e desenvolvimento de prximas verses. e ajudaro no
Renzo Joel Flores Ortiz (renzojfo@gmail.com) Ela Mercedes Medrano de Toscano (mercedes@est.ufmg.br)
Sumrio
Captulo 1 Introduo ...................................................................................... 4 Captulo 2 Descrio e Caractersticas do Minitab.......................................... 5 2.1 Barra de Menus ..................................................................................... 5 2.2 Barra de Ferramentas............................................................................ 6 2.3 Janela Session ...................................................................................... 7 2.4 Planilha (Worksheet).............................................................................. 7 Captulo 3 Estatstica Descritiva...................................................................... 8 3.1 Grficos ................................................................................................. 9 3.1.1 Grfico de Barras ............................................................................ 9 3.1.2 Grfico de Setores (Grfico de Pizza)........................................... 12 3.1.3 Histograma.................................................................................... 14 3.1.4 Grfico de Pontos.......................................................................... 16 3.1.5 Boxplot .......................................................................................... 17 3.1.6 Ramo-e-Folhas.............................................................................. 19 3.2 Medidas Descritivas............................................................................. 20 Captulo 4 Probabilidade ............................................................................... 25 4.1 Nmeros Aleatrios ............................................................................. 26 4.1.1 Gerao de Nmeros Aleatrios ................................................... 26 4.1.2 Amostragem Aleatria Simples ..................................................... 31 4.2 Clculo de Valores de Distribuies de Probabilidade ........................ 33 4.3 Ajuste de Distribuies ........................................................................ 42 Captulo 5 Teste de Hipteses ...................................................................... 48 5.1 Teste para a Mdia Populacional com conhecido ......................... 49 5.2 Teste para a Mdia Populacional com desconhecido ................... 54 5.3 Teste de Hipteses para Uma Proporo............................................ 59 Captulo 6 Inferncia a Partir de Duas Amostras .......................................... 63 6.1 Teste para Comparar Mdias Populacionais: Duas Amostras Dependentes (Teste t - Pareado) ................................................................. 64 6.2 Teste para Comparar Mdias Populacionais: Duas Amostras Independentes com 1 = 2 .......................................................................... 67 6.3 Teste para Comparar Mdias Populacionais: Duas Amostras Independentes com 1 2 .......................................................................... 70 6.4 Teste para Comparar Varincias Populacionais.................................. 73 Referncias Bibliogrficas ................................................................................ 77
Captulo 1 Introduo
Trabalhando em qualquer campo do conhecimento estamos sujeitos a analisar e a entender conjuntos de dados. Seja em universidades, bancos, indstrias ou hospitais, o estatstico prope solues para profissionais das mais diversas reas. Com a demanda por resultados mais rpidos e eficientes, hoje o profissional de Estatstica amparado de softwares (pacotes) especificamente voltados para a anlise estatstica. Desenvolvido em 1972 na Universidade Estadual da Pensilvnia, o Minitab um exemplo de pacote estatstico largamente utilizado por empresas e universidades ao redor do mundo. No mercado o Minitab aplicado a empresas dos mais variados segmentos, como por exemplo: General Electric, LG, Nokia, AT&T, Rolls Royce, Samsung, Xerox Corporation, dentre outras. Nas universidades, disciplinas de Estatstica integram o currculo de muitos cursos de graduao: desde as engenharias, passando pelas cincias humanas at a rea da sade, possvel ver como a Estatstica essencial para a formao de profissionais qualificados, independente das reas de atuao. Considerando a importncia do computador como ferramenta de apoio ao ensino, Estatstica Usando Minitab visa apresentar, de forma simples e objetiva, os recursos mais utilizados do Minitab em cursos de estatstica bsica. Trabalharemos em referncia a verso 15, entretanto no descartamos o uso de sua verso precedente, a verso 14, que possui uma interface semelhante.
Barra de Menus
Barra de Ferramentas
Janela Session
Planilha
File Menu relacionado a operaes com arquivos (abrir, salvar,...). Edit Menu relacionado a operaes para editar arquivos (copiar, colar,...). Data Menu relacionado a manipulao de dados na planilha (transpor colunas, exibir postos...).
Calc Menu relacionado clculos (estatsticas, probabilidades,...). Stat Menu relacionado anlise estatstica (estatstica descritiva, teste de hipteses,...). Graph Menu relacionado a construo de grficos (histograma, grfico de pontos,...). Editor Menu relacionado a comandos na janela Session. Tools Menu que contm utilidades diversas como bloco de notas, calculadora, etc. Window Menu que gerencia as janelas do Minitab (minimizar, restaurar,...). Help Menu que disponibiliza ajuda sobre o ambiente do Minitab.
Assinalar frmula a uma coluna. Inserir linha. Inserir coluna. Mover colunas.
A janela Session estar habilitada para o uso de session commands quando aparecer um cursor piscando e o procedimento para executar comandos consiste, basicamente, em escrev-los e teclar Enter ao final de cada linha.
Os autores agradecem a Profa. Glaura Franco do Departamento de Estatstica da UFMG pelos dados cedidos.
3.1 Grficos
Um grfico uma forma de apresentao de dados que permite uma leitura rpida e global de um fenmeno estudado. Os tipos de grficos disponveis no Minitab se encontram no menu Graph.
O Grfico de Barras representado no plano cartesiano com os valores da varivel no eixo das abscissas e as frequncias ou porcentagens no eixo das ordenadas. A cada valor da varivel temos uma barra com altura correspondendo sua frequncia ou porcentagem. um grfico que se adapta bem s variveis discretas ou qualitativas ordinais.
Exemplo 3.1.1 Construa o Grfico de Barras para a varivel Nota Matemtica 1 Etapa.
Selecione Graph Bar Chart Janela Bar Charts: Escolha a opo Counts of unique values em Bars represent e a seguir selecione Simple OK
Janela Bar Chart - Counts of unique values, Simple: Selecione a coluna C2 Nota Matemtica 1 Etapa para o campo Categorical variables OK
10
Os grficos possuem opes com que podemos acrescentar mais ou menos informaes. Um incremento que poderamos incluir ao grfico de barras seria exibir as porcentagens das respectivas barras. Para isso, siga os prximos passos a partir da janela Bar Chart - Counts of unique values, Simple:
Janela Bar Chart - Counts of unique values, Simple: Clique em Chart options e marque a opo Show Y as Percent OK
Janela Bar Chart - Counts of unique values, Simple: Clique em Labels Data Labels e marque a opo Use y-value labels OK
11
O Grfico de Setores ou de Pizza consiste num crculo dividido em setores correspondentes s porcentagens ou frequncias das variveis representadas. indicado para representar variveis qualitativas.
Selecione Graph Pie Chart Janela Pie Chart: Marque a opo Chart counts of unique values e selecione a coluna C1 Sexo para o campo Categorical variables OK
12
Pode-se incluir ao grfico de setores os nomes e as frequncias dos respectivos setores, alm das porcentagens, como feito no exemplo do grfico de barras. Para isso, siga os prximos passos a partir da janela Pie Chart:
Janela Pie Chart: Clique em Labels Slice Labels e marque as opes Category name, Frequency e Percent OK
13
3.1.3 Histograma
O histograma um grfico de distribuio de frequncias em barras justapostas com bases que so faixas de valores da varivel e cuja rea igual a frequncia relativa da respectiva faixa. A construo de histogramas tem carter preliminar em qualquer estudo e um importante indicador da distribuio dos dados. Indica, por exemplo, se os dados seguem uma distribuio normal. A suposio de que os dados seguem uma distribuio normal assumida para a maioria dos mtodos estatsticos mais utilizados, como o teste t de Student, ANOVA, regresso linear e intervalos de confiana. Este fato somado a resultados tericos fundamentais (Teorema Central do Limite) faz com que a distribuio normal seja a distribuio terica mais importante em Estatstica.
Exemplo 3.1.3 Construa o Histograma para a varivel Nota Matemtica 2 Etapa ajustando a esse grfico uma curva normal com sua respectiva mdia e desvio padro.
14
Janela Histogram - With Fit: Selecione a coluna C3 Nota Matemtica 2 Etapa para o campo Graph variables OK
15
O Grfico de Pontos consiste em representar dados por pontos ao longo de uma reta provida de escala. Valores repetidos so empilhados um em cima do outro.
Exemplo 3.1.4 Construa o grfico de pontos para a varivel Nota Matemtica 1 Etapa.
Janela Dotplot - One Y, Simple: Selecione a coluna C2 Nota Matemtica 1 Etapa para o campo Graph variables OK
16
3.1.5 Boxplot
O Boxplot um grfico no formato de caixa, cujos limites so o primeiro quartil e o terceiro quartil. A mediana representada por um trao no interior da caixa e segmentos de reta so colocados da caixa at os valores mximo e mnimo, que no sejam observaes discrepantes. Este grfico fornece informaes sobre posio, disperso, assimetria, caudas e a presena de dados discrepantes, sejam atpicos ou outliers.
17
Janela Boxplot - One Y, Simple: Selecione a coluna C3 Nota Matemtica 2 Etapa para Graph variables OK
18
3.1.6 Ramo-e-Folhas
O diagrama de Ramo-e-Folhas consiste em representar dados separando cada valor em duas partes: o ramo e a folha (est ltima, localizada direita do ramo). As folhas representam as unidades e o ramo representa as dezenas. No Minitab h ainda uma fila esquerda do ramo que funciona como contador de suas respectivas folhas. Alm de mostrar como um conjunto de valores est distribudo, esse diagrama til, pois no h perda de informao dos dados.
Exemplo 3.1.6 Construa o diagrama de Ramo-e-Folhas para a varivel Nota Matemtica 1 Etapa.
Selecione Graph Steam-and-Leaf Janela Steam-and-Leaf: Selecione a coluna C2 Nota Matemtica 1 Etapa para Graph variables OK
19
Selecione Calc Calculator Janela Calculator: Selecione Mean Select. Depois escolha a coluna C2 Nota Matemtica 1 Etapa Select. No campo Store result in variable indique a coluna onde deseja armazenar o resultado. OK
20
Nota: Na janela Calculator possvel calcular valores provindo de diversas operaes como, por exemplo, aritmticas, estatsticas, trigonomtricas, dentre outras.
Exemplo 3.2.2 Calcule a moda, mediana, mdia, amplitude, varincia e desvio padro para a varivel Nota Matemtica 2 Etapa. Ao invs de calcularmos as medidas separadamente na janela Calculator (como visto no exemplo 3.2.1), optemos por outro caminho:
Selecione Stat Basic Statistics Display Descriptive Statistics Janela Display Descriptive Statistics: Selecione a coluna C3 Nota Matemtica 2 Etapa para o campo Variables e a seguir clique em Statistics.
21
Janela Descriptive Statistics - Statistics: Selecione as medidas de interesse; Mode (moda), Median (mediana), Mean (mdia), Range (amplitude), Variance (varincia) e Standard deviation (desvio padro). OK
Nota: Observe que na janela Descriptive Statistics - Statistics possvel encontrar outros valores de interesse como, por exemplo, First quartile (primeiro quartil), Third quartile (terceiro quartil), Interquartile range (intervalo interquartil), etc.
22
Nota: No Minitab tambm podemos fazer a anlise descritiva de um conjunto de dados atravs de comandos na janela Session.
Na janela Session digite o seguinte comando: MTB > Describe C3. Ou MTB > Desc C3.
Exemplo 3.2.3 Obtenha uma sada que permita a anlise exploratria da varivel Nota Matemtica 1 Etapa.
Selecione Stat Basic Statistics Graphical Summary Janela Graphical Summary: Para o campo Variables selecione a coluna C2 Nota Matemtica 1 Etapa. Verifique o nvel de confiana em Confidence level OK
23
24
Captulo 4 Probabilidade
O Minitab atende a certos tpicos comumente abordados em cursos introdutrios de Probabilidade. So estes:
25
Podemos gerar nmeros aleatrios de acordo com um tipo de distribuio de probabilidade. No Minitab essas distribuies encontram-se no menu Calc Random Data.
Exemplo 4.1.1 Gere 1000 nmeros aleatrios segundo uma distribuio Binomial com parmetros n = 80 e p = 0,57.
Selecione Calc Random Data Binomial Janela Binomial Distribution: No campo Number of rows of data to generate digite a quantidade de nmeros a gerar; no campo Store in column(s) escolha a coluna em que esses nmeros sero gerados e nos campos Number of Trials e Event probability informe o valor dos parmetros n e p, respectivamente, da distribuio Binomial. OK
26
De forma equivalente, na janela Session, digite os seguintes comandos: MTB > Random 1000 C1; SUBC> Binomial 80 0,57.
Exemplo 4.1.2 Gere 300 nmeros aleatrios segundo uma distribuio de Poisson com parmetro = 8.
Selecione Calc Random Data Poisson Janela Poisson Distribution: No campo Number of rows of data to generate digite a quantidade de nmeros a gerar; no campo Store in column(s) escolha a coluna em que esses nmeros sero gerados e no campo Mean informe o valor da mdia da distribuio de Poisson (para uma Poisson a mdia igual ao valor de seu parmetro ). OK
27
De modo equivalente, na janela Session, digite os seguintes comandos: MTB > Random 300 C2; SUBC> Poisson 8.
Exemplo 4.1.3 Gere 800 nmeros aleatrios segundo uma distribuio Normal com parmetros = 200 e = 9.
Selecione Calc Random Data Normal Janela Normal Distribution: No campo Number of rows of data to generate digite a quantidade de nmeros a gerar; no campo Store in column(s) escolha a coluna em que esses nmeros sero gerados e
28
nos campos Mean e Standard deviation informe o valor da mdia e do desvio padro, respectivamente, da distribuio Normal. OK
De forma equivalente, na janela Session, digite os seguintes comandos: MTB > Random 800 C3; SUBC> Normal 200 9.
Exemplo 4.1.4 Gere 250 nmeros aleatrios segundo uma distribuio Uniforme com parmetros = 475 e = 800.
29
Janela Uniform Distribution: No campo Number of rows of data to generate digite a quantidade de nmeros a gerar; no campo Store in column(s) escolha a coluna em que esses nmeros sero gerados e nos campos Lower endpoint e Upper endpoint informe o valor dos parmetros e , respectivamente, da distribuio Uniforme. OK
De modo equivalente, na janela Session, digite os seguintes comandos: MTB > Random 250 C4; SUBC> Uniform 475 800.
30
No prximo exemplo mostraremos como o Minitab pode ser usado para obter amostras aleatrias simples, com e sem reposio, de um conjunto de dados.
Exemplo 4.1.5 De uma urna contendo bolas numeradas de 1 a 10, obtenha duas amostras aleatrias de tamanho 5: uma com e outra sem reposio.
Selecione Calc Make Patterned Data Simple Set of Numbers para primeiro gerarmos nmeros de 1 a 10 correspondentes s bolas da urna. Janela Simple Set of Numbers: Em Store patterned data in escolha coluna em que os nmeros sero armazenados. Em From first value em To last value, digite qual deve ser o primeiro e o ltimo valor serem gerados, respectivamente. E no campo In Steps of informe intervalo de cada nmero em relao ao seguinte. OK a e a o
Para gerar nmeros de 1 a 10 na janela Session digite os comandos: MTB > Set C1 DATA> 1:10/1 DATA> End.
Para obter as duas amostras aleatrias de tamanho 5 digite os comandos: MTB > Sample 5 C1 C2. MTB > Sample 5 C1 C3; SUBC> Replace. (Amostra Sem Reposio) (Amostra Com Reposio)
31
32
Exemplo 4.2.1 Obtenha os valores da funo densidade de probabilidade de uma distribuio Binomial com parmetros n = 90 e p = 0,43.
Selecione Calc Make Patterned Data Simple Set of Numbers para primeiro gerarmos nmeros de 1 a 90 correspondentes aos ensaios da distribuio Binomial. Janela Simple Set of Numbers: Em Store patterned data in escolha coluna em que os nmeros sero armazenados. Em From first value em To last value, digite qual deve ser o primeiro e o ltimo valor serem gerados, respectivamente. E no campo In Steps of informe intervalo de cada nmero em relao ao seguinte. OK a e a o
33
Selecione Calc Probability Distributions Binomial Janela Binomial Distribution: Marque a opo Probability e em Number of trials e Event Probability informe o valor dos parmetros n e p, respectivamente, da distribuio Binomial. Em Input column e em Optional storage informe, respectivamente, a coluna de entrada e sada da funo de probabilidade. OK
De forma equivalente, na janela Session, digite os seguintes comandos: MTB > PDF; SUBC> Binomial 90 0,43.
34
Exemplo 4.2.2 Encontre os valores da funo de probabilidade acumulada de uma varivel aleatria que tem distribuio de Poisson com parmetro = 1.
Na janela Session digite os seguintes comandos: MTB > CDF; SUBC> Poisson 1.
35
Exemplo 4.2.3 Calcule P(X 27) de uma distribuio Normal com parmetros = 28 e = 1.
Na janela Session digite os seguintes comandos: MTB > CDF 27; SUBC> Normal 28 1.
Exemplo 4.2.4 Seja X ~ Normal(0, 1). Encontre x tal que P(X x) = 0,975.
Selecione Calc Probability Distributions Normal Janela Normal Distribution: Marque a opo Inverse cumulative probability e em Mean e Standard Deviation informe o valor da mdia e do desvio padro, respectivamente, da distribuio Normal. Marque a opo Input constant e nesse campo informe o valor da funo de probabilidade para o qual estamos procurando a inversa. OK
36
De forma equivalente, na janela Session, digite os seguintes comandos: MTB > Invcdf 0,975; SUBC> Normal 0,0 1,0.
Nota: Este procedimento til, por exemplo, em Testes de Hipteses para encontrar os valores crticos de uma distribuio de referncia. Esses mesmos valores tambm so encontrados em tabelas de distribuies: Normal, Fisher, Qui-quadrado, etc.
Exemplo 4.2.5 Gere 10000 nmeros aleatrios segundo uma distribuio Normal com parmetros = 2 e = 3,5. Calcule sua funo densidade de probabilidade e faa seu grfico.
Selecione Calc Random Data Normal Janela Normal Distribution: No campo Number of rows of data to generate digite a quantidade de nmeros a gerar; no campo Store in column(s) escolha a coluna em que esses nmeros sero gerados e nos campos Mean e Standard deviation informe o valor da mdia e do desvio padro, respectivamente, da distribuio Normal. OK
37
Selecione Calc Probability Distributions Normal Janela Normal Distribution: Marque a opo Probability density e nos campos Mean e Standard deviation informe o valor dos parmetros e , respectivamente, da distribuio Normal. Em Input column e em Optional storage informe a coluna de entrada e sada, respectivamente, da funo de probabilidade. OK
Selecione Graph Scatterplot With Connect Line OK Janela Scatterplot - With Connect Line: Selecione as ordenadas e abscissas correspondentes distribuio Normal. OK
De forma equivalente, na janela Session digite os seguintes comandos: MTB > Random 10000 C1; SUBC> Normal 2,0 3,5. MTB > PDF C1 C2; SUBC> Normal 2,0 3,5. 38
Ortiz, R. J. F.; Toscano, E. M. M., 2010 MTB > Plot C2*C1; SUBC> Symbol; SUBC> Connect.
Exemplo 4.2.6 Gere duas amostras de tamanho 15000: uma de Poisson com parmetro = 7 e outra Exponencial com parmetro = 5. Em seguida faa o que se pede.
Podemos gerar as duas amostras na janela Session digitando os seguintes comandos: MTB > Random 15000 C1; SUBC> Poisson 7. MTB > Random 15000 C2; SUBC> Exponential 0,2.
Na janela Session digite os seguintes comandos: MTB > PDF C1 C3; SUBC> Poisson 7. MTB > PDF C2 C4; SUBC> Exponential 0,2. MTB > CDF C1 C5; SUBC> Poisson 7.
39
Ortiz, R. J. F.; Toscano, E. M. M., 2010 MTB > CDF C2 C6; SUBC> Exponential 0,2.
b) Represente num mesmo grfico as funes densidade e acumulada da amostra de Poisson encontrada no item a. Faa o mesmo para a amostra Exponencial.
Selecione Graph Scatterplot With Connect Line OK Janela Scatterplot - With Connect Line: Selecione as ordenadas e abscissas correspondentes a cada uma das distribuies e a seguir clique em Multiple Graphs.
Janela Scatterplot - Multiple Graphs: Selecione a opo In separate panels of the same graph OK
40
Ou da mesma forma, na janela Session digite os seguintes comandos: MTB > SUBC> SUBC> SUBC> Plot C3*C1 C5*C1; Symbol; Connect; Panel. MTB > SUBC> SUBC> SUBC> Plot C4*C2 C6*C2; Symbol; Connect; Panel.
41
Exemplo 4.3.1 Gere uma amostra de tamanho 5000 segundo uma distribuio Normal com parmetros = 5 e = 2,5. A seguir teste se a amostra ajusta uma distribuio Normal.
Optemos por gerar os nmeros na janela Session. Para isso, digite os seguintes comandos: MTB > Random 5000 C1; SUBC> Normal 5 2,5.
Selecione Graph Probability Distribution Plot Single OK Janela Probability Plot - Single: No campo Graph variables escolha a coluna onde esto os dados a serem testados e a seguir clique em Distribution.
Janela Probability Plot - Distribution: Escolha a distribuio a ser testada para o conjunto de dados em Distribution OK
42
43
Na janela Session, para verificar se o conjunto de dados se ajusta bem a uma distribuio Normal, digite os seguintes comandos: MTB > SUBC> SUBC> SUBC> SUBC> SUBC> SUBC> PPlot C1; Normal; Symbol; FitD; Grid 2; Grid 1; MGrid 1. Ou simplesmente MTB > PPlot C1; SUBC> Normal.
Interpretao dos Resultados: Obtemos que o p-valor = 0,462 > = 0,05 (nvel de significncia) e, portanto podemos afirmar que o conjunto de dados se ajusta bem a uma distribuio Normal. Vale notar tambm, do grfico, que os pontos esto situados em torno de uma reta.
Stat Basic Statistics Normality Test Janela Normality Test: Em Variable selecione a coluna onde esto os dados a serem testados e escolha um dos testes de normalidade: Anderson-Darling, Ryan-Joiner ou Kolmogorov-Smirnov. OK
44
Verifique que chegaremos mesma concluso: o conjunto de dados se ajusta bem a uma distribuio Normal.
Exemplo 4.3.2 Teste se os valores abaixo se ajustam bem a uma distribuio Weibull.
Valores 14,4189 10,9302 1,53627 4,07240 4,55370 8,55290 7,99175 13,9009 5,77815 1,72682 7,13175 24,1585 2,71879 8,93994 5,46169 5,88014 2,94740 2,85988 16,4731 1,69562 3,15996 14,3234
Selecione Graph Probability Distribution Plot Single OK Janela Probability Plot - Single: No campo Graph variables escolha a coluna onde esto os dados a serem testados e a seguir clique em Distribution.
Janela Probability Plot - Distribution: Escolha a distribuio a ser testada para o conjunto de dados em Distribution OK
45
46
Na janela Session, para verificar se o conjunto de dados se ajusta bem a uma distribuio Weibull, digite os seguintes comandos: MTB > SUBC> SUBC> SUBC> SUBC> SUBC> SUBC> PPlot C1; Weibull; Symbol; FitD; Grid 2; Grid 1; MGrid 1. Ou simplesmente MTB > PPlot C1; SUBC> Weibull.
Interpretao dos Resultados: Obtemos que o p-valor > 0,250 > = 0,05 (nvel de significncia) e, portanto podemos afirmar que o conjunto de dados se ajusta bem a uma distribuio Weibull. Vale notar tambm, do grfico, que os pontos esto situados em torno de uma reta.
47
48
4,9
5,1
4,6
4,4
4,7
4,6
Para este exemplo temos: Hipteses: H0: = 5 H1: 5 Nvel de Significncia: = 0,05
Estatstica de Teste:
Usando o Minitab:
Selecione Stat Basic Statistics 1-Sample Z Janela 1-Sample Z: Selecione Samples in Columns (amostras em colunas) e escolha a coluna da amostra a ser testada. Introduza o valor
No Minitab, valores crticos de uma distribuio de referncia podem ser calculados usando a funo de probabilidade acumulada inversa como visto no exemplo 4.2.4 do Captulo 4.
49
de em Standard deviation (desvio padro); marque a opo Perform hypothesis test (fazer teste de hipteses) e informe o valor da mdia populacional em Hypothesized mean. A seguir clique em Options.
Janela 1-Sample Z - Options: Introduza o nvel de confiana em Confidence Level e para Alternative (hiptese alternativa), selecione not equal (teste bilateral: 0). OK
Janela 1-Sample Z: OK
Resultados: Como o valor de zobs = -3,17 pertence regio crtica: {z < -1,96 ou z > 1,96}, rejeitamos H0 ao nvel de 5% de significncia.
50
Como o valor-p = 0,002 < = 0,05, rejeitamos H0 ao nvel de 5% de significncia3. Como o intervalo de 95% de confiana no contm o valor de sob H0 ( = 5), rejeitamos H0 ao nvel de 5% de significncia.
Concluso: H evidncia estatstica suficiente para rejeitarmos a afirmativa de que a mdia populacional seja igual a 5.
Exemplo 5.1.2 A tenso de ruptura de cabos produzidos por um fabricante apresenta mdia () de 1800 kg e desvio padro () de 100 kg. Mediante nova tcnica de produo, proclamou-se que a tenso de ruptura pode ter aumentado. Para testar essa declarao, selecionou-se uma amostra de 50 cabos, chegando-se a uma mdia amostral de 1830 kg. Pode-se confirmar a declarao ao nvel de 5% de significncia? Para este exemplo temos: Hipteses: H0: = 1800 H1: > 1800 Nvel de Significncia: = 0,05
Estatstica de Teste:
Usando o Minitab:
3
51
Selecione Stat Basic Statistics 1-Sample Z Janela 1-Sample Z: Selecione Summarized data e preencha os campos Sample size (tamanho da amostra), Mean (mdia amostral) e Standard deviation (desvio padro). Marque a opo Perform hypothesis test (fazer teste de hipteses) e informe o valor da mdia populacional em Hypothesized mean. A seguir clique em Options.
Janela 1-Sample Z - Options: Introduza o nvel de confiana em Confidence Level e para Alternative (hiptese alternativa), selecione greater than (teste unilateral: > 0). OK
Janela 1-Sample Z: OK
52
Resultados: Como o valor de zobs = 2,12 pertence regio crtica: {z > 1,96}, rejeitamos H0 ao nvel de 5% de significncia. Como o valor-p = 0,017 < = 0,05, rejeitamos H0 ao nvel de 5% de significncia. Como o limite inferior do intervalo de 95% de confiana maior que o valor de sob H0 ( = 1800), rejeitamos H0 ao nvel de 5% de significncia.
Concluso: A nova tcnica produz cabos com uma tenso de ruptura mdia () significativamente diferente de 1800 kg.
53
10,2
9,7
9,8
10,4 10,2
Ao nvel de 1%, testar a hiptese de que o contedo mdio das latas do lubrificante igual a 10 dl. Assumir que os dados seguem uma distribuio normal. Para este exemplo temos: Hipteses: H0: = 10 H1: 10 Nvel de Significncia: = 0,01
Valores Crticos: t(11; 0,005) = 3,106 e -t(11; 0,005) = -3,106 (Valores Tabelados)
Usando o Minitab:
54
Selecione Stat Basic Statistics 1-Sample t Janela 1-Sample t: Selecione Samples in Columns (amostras em colunas) e escolha a coluna da amostra a ser testada. Marque a opo Perform hypothesis test (fazer teste de hipteses) e informe o valor da mdia populacional em Hypothesized mean. A seguir clique em Options.
Janela 1-Sample t - Options: Introduza o nvel de confiana em Confidence Level e para Alternative (hiptese alternativa), selecione not equal (teste bilateral: 0). OK
Janela 1-Sample t: OK
55
Resultados: Como o valor de tobs = 1,41 no pertence regio crtica: {t < -3,106 ou t > 3,106}, deixamos de rejeitar H0 ao nvel de 1% de significncia. Como o valor-p = 0,185 > = 0,01, deixamos de rejeitar H0 ao nvel de 1% de significncia. Como o intervalo de 99% de confiana contm o valor de sob H0 ( = 10), deixamos de rejeitar H0 ao nvel de 1% de significncia. Concluso: No h evidncia suficiente para rejeitar a afirmativa que o contedo mdio das latas de lubrificante seja igual a 10 dl.
Exemplo 5.2.2 Um artigo do New York Times observou que a vida mdia de 35 regentes homens de orquestras sinfnicas era de 73,4 anos, em contraste com a vida mdia de 69,5 anos para os homens da populao em geral. Supondo que os 35 regentes tenham tempo mdio de vida com um desvio padro de 8,7 anos, use o nvel de significncia 0,05 para testar a afirmativa de que regentes homens de orquestras sinfnicas tm tempo mdio de vida maior do que 69,5 anos. Assumir que a varivel de interesse segue uma distribuio normal. Para este exemplo temos: Hipteses: H0: = 69,5 H1: > 69,5 Nvel de Significncia: = 0,05
56
Usando o Minitab:
Selecione Stat Basic Statistics 1-Sample t Janela 1-Sample t: Selecione Summarized data e preencha os campos Sample size (tamanho da amostra), Mean (mdia amostral) e Standard deviation (desvio padro). Marque a opo Perform hypothesis test (fazer teste de hipteses) e informe o valor da mdia populacional em Hypothesized mean. A seguir clique em Options.
Janela 1-Sample t - Options: Introduza o nvel de confiana em Confidence Level e para Alternative (hiptese alternativa), selecione greater than (teste unilateral: > 0). OK
57
Janela 1-Sample t: OK
Resultados: Como o valor de tobs = 2,65 pertence regio crtica: {t > 1,691}, rejeitamos H0 ao nvel de 5% de significncia. Como o valor-p = 0,006 < = 0,05, rejeitamos H0 ao nvel de 5% de significncia. Como o limite inferior do intervalo de 95% de confiana maior que o valor de sob H0 ( = 69,5), rejeitamos H0 ao nvel de 5% de significncia. Concluso: O tempo mdio de vida significativamente diferente de 69,5 anos. de regentes homens
58
Usando o Minitab:
Selecione Stat Basic Statistics 1 Proportion Janela 1 Proportion: Selecione Summarized data e preencha os campos Number of events (nmero de eventos) e Number of trials (nmero de ensaios). Marque a opo Perform hypothesis test (fazer
59
teste de hipteses) e informe o valor da proporo populacional p a ser testada em Hypothesized proportion. A seguir clique em Options.
Janela 1 Proportion - Options: Introduza o nvel de confiana em Confidence Level e para Alternative (hiptese alternativa), selecione not equal (teste bilateral: p p0). Marque a opo Use test and interval based on normal distribution (o Minitab calcula a estatstica de teste e o intervalo de confiana fazendo a aproximao da distribuio Binomial pela Normal). OK
Janela 1 Proportion: OK
60
Resultados: Como o valor de zobs = -2,46 pertence regio crtica: {z < -1,96 ou z > 1,96}, rejeitamos H0 ao nvel de 5% de significncia. Como o valor-p = 0,014 < = 0,05, rejeitamos H0 ao nvel de 5% de significncia. Como o intervalo de 95% de confiana no contm o valor de p sob H0 (p = 0,25), rejeitamos H0 ao nvel de 5% de significncia.
Nota 1: No teste de hiptese para propores, a distribuio de probabilidade que se usa uma aproximao da distribuio Binomial a Normal se, e somente se, np > 5 e np(1-p) > 5, onde n o nmero de ensaios (ou eventos) e p a proporo em teste. Neste exemplo a distribuio Normal pode ser usada satisfatoriamente. Nota 2: Caso no tivssemos marcado a opo Use test and interval based on normal distribution na janela 1 Proportion - Options, o Minitab iria usar o Teste da Razo de Mxima Verossimilhana para testar a proporo. A concluso seria a mesma do processo anterior.
61
Como o intervalo de 95% de confiana no contm o valor de p sob H0 (p = 0,25), rejeitamos H0 ao nvel de 5% de significncia.
62
Nota: Nos exemplos deste captulo, as entradas dos testes so conjuntos de dados, mas tambm podem ser os dados sumarizados isto , os valores dos parmetros: mdia, desvio padro e tamanho de amostra.
63
6.1 Teste para Comparar Mdias Populacionais: Duas Amostras Dependentes (Teste t - Pareado)
Exemplo 6.1 Captropil um medicamento desenvolvido para baixar a presso sangnea sistlica. Na tabela a seguir esto as leituras de presso sangnea sistlica (em mm de mercrio) de pacientes antes e depois da ingesto do medicamento. Use um nvel de significncia de 0,05 para testar a afirmativa de que as medidas de presso sangnea sistlica so mais baixas depois do uso de Captropil.
A 200 191
B 174 170
C 198 177
D 170 167
E 179 159
F 182 151
G 193 176
H 209 183
I 185 159
J 155 145
K 169 146
L 210 177
Para este exemplo temos: Hipteses: H0: d = 0 H1: d > 0 d = Antes - Depois
64
Usando o Minitab:
Selecione Stat Basic Statistics Paired t Janela Paired t: Selecione Samples in Columns (amostras em colunas) e escolha as colunas para First sample (primeira amostra) e Second Sample (segunda amostra). A seguir clique em Options.
Janela Paired t - Options: Introduza o nvel de confiana em Confidence Level e o valor da mdia d a ser testada em Test mean. Para Alternative (hiptese alternativa), selecione greater than (teste unilateral: d > 0). OK
65
Janela Paired t: OK
Resultados: Como o valor de tobs = 6,37 pertence regio crtica: {t > 1,796}, rejeitamos H0 ao nvel de 5% de significncia. Como o valor-p = 0,000 < = 0,05, rejeitamos H0 ao nvel de 5% de significncia. Como o limite inferior do intervalo de 95% de confiana maior que o valor de sob H0 ( = 0), rejeitamos H0 ao nvel de 5% de significncia.
Concluso: A medida de presso sangunea sistlica significativamente diferente de zero depois do uso de Captropil.
66
6.2 Teste para Comparar Mdias Populacionais: Duas Amostras Independentes com 1 = 2
Exemplo 6.2 Dois grupos de ratos foram alimentados apresentando alto e baixo contedo de protena. A tabela abaixo d o peso, em gramas, para cada rato ao final do experimento. Apesar de no conhecidas, as varincias populacionais para os dois grupos de ratos so consideradas iguais com base em estudos anteriores. Testar se as dietas so equivalentes ou no.
Alto Baixo
123 134 146 104 119 124 161 107 70 118 101 85 107 132 94
83
129
97
113
Para este exemplo temos: Hipteses: H0: Alto = Baixo H1: Alto Baixo H0: Alto - Baixo = 0 H1: Alto - Baixo 0
Valores Crticos: t(17; 0,025) = 2,110 e -t(17; 0,025) = -2,110 (Valores Tabelados)
67
Usando o Minitab:
Selecione Stat Basic Statistics 2-Sample t Janela 2-Sample t: Selecione Samples in different columns (amostras em colunas diferentes) e escolha as colunas para First (primeira amostra) e Second (segunda amostra). Marque a opo Assume equal variances (assumir varincias iguais) e a seguir clique em Options.
Janela 2-Sample - Options: Introduza o nvel de confiana em Confidence Level e o valor da diferena entre as mdias populacionais testadas: 1 - 2 em Test difference. Para Alternative (hiptese alternativa), selecione not equal (teste bilateral: 1 - 2 0). OK
68
Janela 2-Sample t: OK
Resultados: Como o valor de tobs = 1,89 no pertence regio crtica: {t < -2,110 ou t > 2,110}, deixamos de rejeitar H0 ao nvel de 5% de significncia. Como o valor-p = 0,076 > = 0,05, deixamos de rejeitar H0 ao nvel de 5% de significncia. Como o intervalo de 95% de confiana contm o valor de Alto - Baixo sob H0 (Alto - Baixo = 0), deixamos de rejeitar H0 ao nvel de 5% de significncia.
Concluso: No h evidncia estatstica suficiente para rejeitar a afirmativa de que as dietas com alto e baixo contedo de protenas sejam equivalentes.
69
6.3 Teste para Comparar Mdias Populacionais: Duas Amostras Independentes com 1 2
Exemplo 6.3 Consulte os dados amostrais listados abaixo e use um nvel de significncia de 0,05 para testar a afirmativa de que a quantidade mdia de alcatro em cigarros tamanho king-size com filtro menor do que a quantidade mdia de alcatro em cigarros tamanho king-size sem filtro. Sabe-se que as varincias populacionais so diferentes, sendo seus valores desconhecidos. Todas as medidas esto em miligramas e os dados so da Comisso Federal de Comrcio dos Estados Unidos.
16 11 23
15 14 23
16 13 24
14 13 26
16 13 25
1 16 26
16 16 21
18 8 24
10 16
14 11
12
Para este exemplo temos: Hipteses: H0: Com Filtro = Sem Filtro H1: Com Filtro < Sem Filtro H0: Com Filtro - Sem Filtro = 0 H1: Com Filtro - Sem Filtro < 0
v=
70
Usando o Minitab:
Selecione Stat Basic Statistics 2-Sample t Janela 2-Sample t: Selecione Samples in different columns (amostras em colunas diferentes) e escolha as colunas para First (primeira amostra) e Second (segunda amostra). Como foi mencionado que as varincias populacionais so desconhecidas e diferentes, deixamos de marcar a opo Assume equal variances (assumir varincias iguais). A seguir clique em Options.
Janela 2-Sample t - Options: Introduza o nvel de confiana em Confidence Level e o valor da diferena entre as mdias populacionais
71
testadas: 1 - 2 em Test difference. Para Alternative (hiptese alternativa), selecione Less than (teste unilateral: 1 - 2 < 0). OK
Janela 2-Sample t: OK
Resultados: Como o valor de tobs = -10,59 pertence regio crtica: {t < -1,708}, rejeitamos H0 ao nvel de 5% de significncia. Como o valor-p = 0,000 < = 0,05, rejeitamos H0 ao nvel de 5% de significncia. Como o limite superior do intervalo de 95% de confiana menor que o valor de Com Filtro - Sem Filtro sob H0 (Com Filtro - Sem Filtro = 0), rejeitamos H0 ao nvel de 5% de significncia. Concluso: A quantidade mdia de alcatro em cigarros tamanho kingsize com filtro significativamente diferente da quantidade mdia de alcatro em cigarros tamanho king-size sem filtro.
72
Exemplo 6.4 Coletaram-se dados amostrais em um estudo suplementos de clcio e seus efeitos sobre a presso sangnea. valores da amostra esto listados a seguir. No nvel de significncia 0,10, teste a afirmativa de que os dois grupos amostrais originam-se populaes com a mesma varincia.
de Os de de
Placebo
124,6 118,1
128,8
107,2
123,1
Clcio
129,1 109,6
120,9 121,4
104,4 113,2
116,3
Para este exemplo temos: Hipteses: H0: 2Placebo = 2Clcio H1: 2Placebo 2Clcio Nvel de Significncia: = 0,10
Estatstica de Teste: F com 14 e 12 graus de liberdade. (S12 representa o maior valor das duas varincias amostrais)
12; 0,95)
= 0,395 e F(14;
12; 0,05)
= 2,637 (Valores
73
Usando o Minitab:
Selecione Stat Basic Statistics 2 Variances Janela 2 Variances: Selecione Samples in different columns (amostras em colunas diferentes) e escolha as colunas para First (primeira amostra) e Second (segunda amostra). A seguir clique em Options.
Janela 2 Variances - Options: Preencha os campos Confidence Level (nvel de confiana) e Title (caso queira atribuir um ttulo ao grfico do teste de varincias). OK
74
Janela 2 Variances: OK
75
Resultados: Como o valor de Fobs = 1,25 no pertence regio crtica: {F < 0,395 ou F > 2,637}, deixamos de rejeitar H0 ao nvel de 10% de significncia. Como o valor-p = 0,685 > = 0,10, deixamos de rejeitar H0 ao nvel de 10% de significncia. Concluso: H evidncia estatstica suficiente para afirmar que os dois grupos provenham de populaes com varincias iguais.
Nota 1: Da perspectiva de estatsticas de teste importante esclarecer que escolhendo as colunas para First (primeira amostra) e Second (segunda amostra) estamos definindo, tambm, que elas correspondem s amostras do numerador e denominador, respectivamente, da estatstica de teste F. Essa informao necessria para determinar os valores crticos e, consequentemente, a regio crtica. Nota 2: Usualmente encontramos tabelas da distribuio F correspondentes cauda direita. O valor crtico da cauda esquerda pode ser encontrado tomando o recproco do valor crtico da cauda direita com os graus de liberdade invertidos. No exemplo temos: F(14; 12; 0,95) = 1 / F(12; 14; 0,05) = 1 / 2,534 = 0,395
76
Referncias Bibliogrficas
BUSSAB, W. O.; MORETTIN, P. A. Estatstica Bsica. 5. ed. So Paulo: Saraiva, 2002. FARIAS, A. A.; CSAR, C. C.; SOARES, J. F. Introduo Estatstica. 2. ed. Rio de Janeiro: Livros Tcnicos e Cientficos, 2003. MAGALHES, M. N.; Pedroso de Lima, A. C. Noes de Probabilidade e Estatstica. 6. ed. So Paulo: Edusp, 2008. MEYER, P. L. Probabilidade: Aplicaes Estatstica. 2. ed. Rio de Janeiro: Livros Tcnicos e Cientficos, 1995. ROSS, S. M. A First Course in Probability. 7. ed. Upper Saddle River: Prentice Hall, 2005. TRIOLA, M. F. Introduo Estatstica. 9. ed. Rio de Janeiro: Livros Tcnicos e Cientficos, 2005.
77