Voc visita regularmente seu site favorito sobre o clima ou verifica a previso todas as manhs no celular? Algumas pessoas so realmente obcecadas pelas condies climticas. Nos Estados Unidos, temos um canal de televiso unicamente dedicado a isso, e tenho amigos que prestam mais ateno a este canal do que s notcias, ao seu time favorito... talvez mais que s suas esposas! Quando voc verifica o tempo, pode obter apenas a previso do dia seguinte ou ir adiante e consulta a previso de 5 ou at 10 dias. Mas voc j se perguntou at que ponto essas previses so confiveis? Muitas pessoas contam com essas previses do tempo de longo prazo, mas elas so realmente confiveis ou esto mais para o equivalente a previses feitas em bola de cristal? Neste artigo, observaremos os dados de temperatura e usaremos vrias ferramentas estatsticas para avaliar at que ponto a previso confivel.
Coleta de dados
Visitamos um dos principais sites sobre condies climticas e coletamos as temperaturas mais altas previstas para o dia seguinte, 5 dias e 10 dias (em C) para State College, Pensilvnia, onde se localiza a sede mundial da Minitab. Fizemos isso todos os dias durante 30 dias e registramos as temperaturas previstas, alm da temperatura real de cada dia, no Minitab Statistical Software. Em seguida, usando o Calc > Calculator, computamos as diferenas entre as 3 temperaturas mximas previstas e a leitura real de temperatura de cada dia.
Registramos as previses de 10 dias, 5 dias e para o dia seguinte no Minitab. Depois, calculamos a diferena entre as temperaturas mximas previstas e reais.
O grfico abaixo mostra que a previso foi mais confivel em alguns dias, em comparao aos outros. Ele mostra ainda os aumentos e quedas de temperatura que ocorreram em State College durante a ltima primavera.
Podemos usar o Grfico Sequencial para comparar a previso com a temperatura real de cada dia do estudo. Para comparar facilmente o centro e a disperso para a diferena entre a temperatura real e as trs precises, podemos usar o Grfico > de valores individuais.
O grfico de valor individual mostra que a previso de 10 dias exibe mais variao do que as outras duas previses. Com um desvio padro de 3,4 graus, podemos ver que a previso de 10 dias super estimou a temperatura mxima em at 5 graus e a subestimou em 10 graus, como mostrado no grfico abaixo. As previses de 5 dias e dia seguinte foram menos variveis, com desvios padro de 2,4 e 1,2, respectivamente. Agora, essa diferena de varincia entre as 3 previses estatisticamente significativa ou esses exemplos observados so provveis, dado que as varincias so verdadeiramente iguais? Vamos usar um teste de varincias iguais para descobrir.
Existem vrias formas de conduzir um teste de varincias com o Minitab. Neste caso, usaremos os Testes de > hiptese do assistente para obter um relatrio abrangente dos nossos resultados. Com um valor p de 0,000 (no mostrado), podemos concluir que existe uma diferena estatisticamente significativa entre as varincias. Especificamente, a varincia da diferena da previso do dia seguinte significativamente menor que as varincias das diferenas da previso de 5 dias e 10 dias. Concluso: A previso do dia seguinte significativamente mais precisa que as outras duas previses. Agora, vamos usar os Testes de > hiptese do Assistente para realizar uma ANOVA de Welch para varincias no iguais e avaliar a preciso das previses. Usando um valor alfa de 0,05, o valor p de 0,011 significativo. Portanto, as trs mdias no so iguais (veja a figura abaixo). Especificamente, a mdia superestimada de 0,4 da previso do dia seguinte significativamente maior que a mdia subestimada de -1,7 da previso de 10 dias. Concluso: As diferenas de mdias do dia seguinte e de 5 dias parecem ser igualmente precisas, ambas com intervalos de confiana incluindo 0.
A disparidade mdia da previso do dia seguinte significativamente menor que a previso de 10 dias.
Previso de 5 dias
Embora a previso de 5 dias seja mais varivel que a do dia seguinte, ainda queremos uma bola de cristal: queremos ver no futuro e talvez em mais de 24 horas. Para avaliar visual e estatisticamente o quanto podemos prever a temperatura real usando a previso de 5 dias, podemos realizar uma anlise de regresso com o Grfico de linhas de > regresso > Stat
Podemos usar um grfico de linhas para explorar a relao entre a temperatura real e a previso de 5 dias. O valor p de 0,000, encontrado na janela Session, indica que uma relao linear significativa existe entre a temperatura real e a previso de 5 dias. O valor R ao quadrado informa que este modelo responsvel por 77% da variao vista na temperatura mxima real, o que provavelmente melhor que a mdia da sua bola de cristal. Alm disso, usando grficos residuais (no mostrados), podemos verificar as previses do modelo e concluir que a anlise vlida.
Como esses pontos caem perto da linha, o modelo de regresso parecer ser bem adequado. Usando intervalos de previso, podemos calcular um intervalo provvel de valores para uma determinada previso do dia seguinte. Por exemplo, podemos estar 95% certos de que uma previso de dia seguinte de 25C provavelmente corresponder a uma temperatura real entre 22,3 e 26,9C. importante observar que, embora a regresso informe se existe uma relao linear, ela no informa se uma relao de 1 para 1. Em outras palavras, nosso valor p pode ser significativo, porque uma previso de 25C indica uma mxima real de 25C, ou pode ser significativo porque uma previso de 25C fez um bom trabalho ao prever uma mxima real de, digamos 12,5C (p. ex. se o coeficiente de inclinao for de 0,5). Para ver se existe uma relao de 1 para 1, podemos calcular os intervalos de confiana para o coeficiente usando os Resultados > gerais de > regresso de > Stat.
Podemos usar um intervalo de confiana para avaliar o coeficiente quanto interceptao y e inclinao. Como o intervalo de confiana da constante (-0,76; 3,38) mostrado na sada acima inclui 0 e o intervalo de confiana para o coeficiente de inclinao (0,85; 1,01) inclui 1, podemos concluir que a relao entre a previso do dia seguinte e a temperatura real , na realidade, uma relao de 1 para 1.
Concluso
Diante de todos os fatores de influncia, o clima inegavelmente um processo complexo, e como todo processo pode conter muita variao. No entanto, se voc for fazer planos com base no tempo e quiser minimizar a variao, os dados que coletamos sugerem que melhor apostar na previso do dia seguinte.
No h muitos recursos que possamos usar para prever precisamente 5 dias frente, portanto falando relativamente, a previso de 5 dias o que existe mais prximo disso em nossas vidas. Quanto previso de 10 dias, provavelmente os meteorologistas sabem exatamente o quanto as condies climticas podem ser imprevisveis 10 dias frente. E ainda assim eles a fornecem aos observadores do clima, pois ainda queremos ter alguma ideia do futuro, apesar da no confiabilidade das previses. Mas bom saber em quais previses podemos realmente confiar e quais delas so mais prximas de uma leitura da sorte! Michelle Paret Gerente de marketing de produto, Minitab Inc.
Simular a gama de resultados possveis para ajudar a tomar uma deciso Prever resultados financeiros ou estimar cronogramas de projetos Compreender a variabilidade em um processo ou sistema Encontrar problemas em um processo ou sistema Gerenciar riscos atravs da compreenso das relaes de custo/benefcio
Depois, s repitir este processo para o comprimento do mbolo (L) e cursos por minutos (RPM).
O Minitab calcular rapidamente o resultado de cada linha de dados simulados. Agora voc est pronto para examinar os resultados. Selecione Stat > Basic Statistics > Graphical Summary e selecione a coluna Fluxo. O Minitab gerar um grfico sumrio que inclui quatro grficos: um histograma de dados com uma curva normal sobreposta, boxplot e intervalos de confiana para a mdia e mediana. O grfico sumrio tambm exibe os resultados do teste de normalidade de Anderson-Darling, estatsticas descritivas e intervalos de confiana para a mdia, mediana e desvio padro.
O grfico sumrio dos resultados da sua simulao de Monte Carlo ter esta aparncia:
Para os dados aleatrios gerados para escrever este artigo, a taxa de fluxo mdia 12,0004 baseada em 100.000 amostras. Em mdia, estamos no alvo, mas o menor valor foi 8,882 e o maior, 15,594. Isto um intervalo bastante grande. A variao transmitida (de todos os componentes) resulta em um desvio padro de 0,757 ml, excedendo em muito o alvo de 0,2 ml. Tambm, ns vemos que o alvo de 0,2 ml est fora do intervalo de confiana do desvio padro. Parece que esse design de bomba exibe muita variao e precisa ser refinado ainda mais antes de ir produo; a simulao de Monte Carlo com o Minitab permitiu descobrir isso sem incorrer em despesas de fabricao e teste de milhares de prottipos. Para voc no ficar imaginando se estes resultados simulados se sustentam, tente voc mesmo! Criar diferentes conjuntos de dados aleatrios simulados resulta em variaes pequenas, mas o resultado final (uma quantidade inaceitvel de variao na taxa de fluxo) ser sempre consistente. Este o poder do mtodo de Monte Carlo.
Depois que o Minitab criar seu experimento projetado, ser necessrio executar seus 13 ensaios experimentais, coletar os dados e registrar a rugosidade de superfcie das 13 peas finalizadas. O Minitab facilita a anlise dos resultados do DOE, reduz o modelo e verifica as suposies usando grficos de resduos. Usando o modelo final e o otimizador de resposta do Minitab, possvel encontrar as configuraes timas para suas variveis. Neste caso, voc definiu a tenso em 7,74 e ASF em 77,8 para obter um valor de rugosidade de 39,4. O DOE de superfcie de resposta produz a seguinte equao de transferncia para a simulao de Monte Carlo: Rugosidade = 957.8 189.4(Vdc) 4.81(ASF) + 12.26(Vdc2) + 0.0309(ASF2)
O sumrio mostra que apesar das entradas subjacentes serem distribudas normalmente, a distribuio do RMS da rugosidade no normal. O sumrio tambm mostra que a variao transmitida de todos os componentes resulta em um desvio padro de 0,521 e o conhecimento do processo indica que este um bom resultado para o processo. Baseado em um DOE com apenas 13 ensaios, possvel determinar a realidade que seria vista no processo.
diferentes em tabelas e grficos (por exemplo, Incio, Fim e Meio), pode ser confuso e distra-lo da mensagem. Felizmente, com o recurso de ordem de valores do Minitab, voc pode garantir que seus resultados apaream na ordem correta, resultando em grficos e tabelas bem mais fceis de entender.
Os grficos que apresentam informaes em uma ordem inesperadas podem ser mais difceis de interpretar. Por exemplo, no primeiro grfico de barras abaixo, os dados de dia da semana em ordem alfabtica no mostram um padro aparente. Depois que voc aplica a ordem de valores dos dias da semana, fica mais fcil detectar as tendncias dos dados.
Depois: Uma ordem de valores de dia da semana permite que voc veja as tendncias dos dados com o tempo. A ordem de valores de uma coluna afeta a ordem em que as categorias so representadas em muitos grficos, incluindo grficos de barras, grficos de valores individuais, boxplots, grficos de interaes e grficos de efeitos principais.
Legendas
Um problema semelhante ocorre com legendas, que listam itens na ordem em que so representados. Pode ser difcil compreender uma legenda com itens em uma ordem inesperada. Por exemplo, considere o primeiro grfico de setores abaixo, em que os nveis de educao esto listados em ordem alfabtica. Uma ordem de valores de educao fornece uma apresentao mais clara.
O resultado ser confuso se no estiver na ordem correta, como mostrado na primeira tabela dos dados de classificao do produto abaixo. Os leitores tero dificuldades para ler as informaes da tabela na ordem lgica. Depois que a ordem de valores correta aplicada, fica mais fcil seguir as informaes.
Antes: difcil compreender essa tabela quando as categorias esto em uma ordem inesperada.
Por exemplo, suponha que sua empresa tenha trs nveis de planos de suporte: Gold, Silver e Bronze. O plano Gold oferece o nvel mais alto de suporte e mais caro, o plano Bronze oferece o nvel mais baixo de suporte e mais barato e o plano Silver fica entre os dois. Voc tem uma coluna contendo o tipo de plano de suporte para cada cliente.
Voc deseja comparar as contagens de cada plano, portanto cria um grfico de barras. Os planos so exibidos em ordem alfabtica no grfico.
Voc deseja alterar a ordem de valores da coluna Support Plan para que Gold sempre aparea primeiro, seguido de Silver e Bronze.
1. Com a coluna Support Plan ativa, clique com o boto direito do mouse e selecione Column > Value Order. 2. Selecione User-specified order. 3. Em Define an order, especifique a ordem correta. 4. Clique em OK.
Agora, quando voc cria um grfico de barras, os planos so exibidos na ordem especificada. Voc pode ver facilmente que conforme os planos vo ficando mais baratos, mais clientes os adquirem.
Observe que a coluna da planilha tem a mesma aparncia: a ordem de valores no fica aparente at voc exibir o resultado e permanece com a coluna at voc alter-la novamente.
Duplicao simples
Em vrias ocasies, voc simplesmente precisa de uma cpia de um grfico j existente. Em vez de preencher uma caixa de dilogo e editar o grfico para recri-lo, voc pode usar Editor > Duplicate Graph para criar uma cpia idntica.
Suponha que voc tenha criado um grfico de barras de dados sobre defeito para um relatrio mensal. Voc quer usar o grfico em vrios pontos da sua apresentao, sempre com uma finalidade diferente.
Selecione Editor > Duplicate Graph para fazer quantas cpias precisar. Voc poder adicionar anotaes descritivas a um, rtulos de dados a outro e assim por diante. O comando Duplicate Graph tem muitos outros aplicativos teis, alm da produo de cpias idnticas. possvel us-lo para fazer uma cpia de backup de um grfico antes de alterar o original significativamente. Ou se um grfico for atualizado automaticamente, voc pode usar Duplicate Graph e desativar a atualizao automtica para criar um instantneo de momentos especficos, enquanto a cpia original mudar com o tempo.
gerar rapidamente uma cpia de um grfico que tenha todos os atributos do original, mas com dados diferentes.
Suponha que voc tenha criado este histograma de medidas de uma pea de corte manual na sua fbrica. Voc incluiu uma linha de referncia no valor alvo e alterou as cores padro do grfico. Agora, voc quer criar um histograma idntico, mas com dados de outra fbrica.
Selecione Editor > Make Similar Graph e substitua a varivel antiga pela nova. Agora, voc tem um novo grfico sem ter partido do zero. Com o recurso Make Similar Graph, voc pode reter todas as edies importantes feitas na verso original do grfico, sem precisar lembrar os caminhos, selees de galerias, opes etc.
Suponha que voc tenha criado esse boxplot para preencher os dados de peso de uma mquina na sua instalao. Voc quer criar um grfico semelhante com dados de outra mquina. Selecione Editor > Copy Command Language e todos os comandos session usados para criar o grfico atual sero copiados na rea de transferncia.
Selecione Edit > Command Line Editor e cole os comandos na janela. ( possvel editar esses comandos como voc quiser.) Altere a varivel representada e clique em Submit Commands.
Seu novo grfico retm todas as caractersticas do original, exceto pelos itens alterados. Usar Copy Command Language para fazer cpias alteradas de grficos uma boa forma de se acostumar com a linguagem de comando que a base de todos os comandos do Minitab. Quando voc ficar mais familiarizado com a linguagem de comando do
Minitab, poder usar Copy Command Language como a base de macros e execs que automatizam suas anlises recorrentes.
Comparar e contrastar
Depois: Os painis separam as observaes por grupo proporcionando uma comparao mais fcil.
Antes: A enorme quantidade de pontos (300) nesta carta de controle torna difcil a decifrao do grfico.
Depois: O grfico foi dividido em trs painis. Cada um deles contm 100 observaes gerenciveis.
Depois: Os painis dividem o grfico em grupos lgicos, sem fazer alteraes complicadas na planilha.
Painis na prtica
H trs mtodos para dividir um grfico em painis:
Na maioria dos casos, as partes ou painis so definidos por uma varivel categrica chamada By Variable (Varivel de Agrupamento) . Um painel separado criado para cada valor da By Variable. Acesse essa opo na caixa de dilogo principal do grfico, clicando em Multiple Graphs > By Variables. Com cartas de controle, a cadeia contnua de observaes dividida em painis que contm o nmero desejado de segmentos de tamanhos iguais. Acesse essa opo na caixa de dilogo principal do grfico, clicando em Options > Display. Depois de criar um grfico, voc pode adicionar painis escolhendo Editor > Panel.
O problema
Voc quer representar a relao entre peso e pulsao. Voc considera que gnero e nvel de atividade so cruciais para compreender essa relao, portanto os inclui como variveis de agrupamento. O grfico resultante uma mistura de tipos diferentes de smbolos e linhas de regresso.
1. Abra a planilha EXH_TABL.MTW. 2. Selecione Graph > Scatterplot. 3. Clique em With Regression and Groups. 4. Clique em OK. 5. Em Y variables, insira Weight. 6. Em X variables, insira Pulse. 7. Em Categorical variable for grouping, insira Gender e Activity. 8. Clique em OK. Editar em painis
Use uma das variveis categricas como varivel de criao de painis para reduzir a desorganizao.
2. Em By variables with groups in separate panels, insira Activity. 3. Clique em OK. Examine o novo grfico
O grfico ainda est agrupado por gnero, mas agora dividido em painis por nvel de atividade. Como resultado, voc pode comparar facilmente os efeitos do nvel de atividade e contrastar essas observaes para homens e mulheres.