Escolar Documentos
Profissional Documentos
Cultura Documentos
• o que é um modelo;
1
O diferentes tipos de modelo podem ser classificados em:
• Físicos;
• Finalidade
• Forma
• Tratamento de Incerteza
• Modelo Descritivo
Descreve variáveis chaves e relações
Ex: relação entre serviço e vendas
• Modelo Preditivo
Prevê resultados com base no conhecimento de relações
• Modelo de Decisão
Fornece solução para um problema
Ex: qual modal/rota de transporte utilizar ?
• Verbal
• Esquemática
• Matemática
• Gráfica
2
• Modelo Estocástico: incerteza é incorporada ao modelo
Exemplo: assume-se que os tempos de viagem obedeçam a uma
distribução normal
MODELOS
FÍSICOS MATEMÁTICOS
SIMULAÇÃO
• os modelos físicos são regidos por leis da física e servem para dar
respostas a experimentos cujo equacionamento matemático não é
totalmente conhecido. Às vezes, este processo utiliza analogias entre
sistemas distintos, como por exemplo, os sistemas mecânico e elétrico,
ou elétrico e hidráulico. Na área naval, tem-se como exemplo a
construção de modelos em escala reduzida de navio ou plataforma
oceânica para análise do comportamento no mar, extrapolando-se os
resultados para um sistema em escala real;
3
• os modelos matemáticos usam notação apropriada juntamente com
equações matemáticas para representarem um sistema;
4
Chwif(1999) fez uma compilação das técnicas de representação de modelos de
simulação encontrados na literatura, que estão resumidos a seguir:
5
entradas, saídas e estados. De maneira geral, essa técnica modela a
mudança de estado de um sistema, considerando dois casos básicos:
no primeiro, durante um intervalo de tempo não ocorre nenhum evento
externo e o sistema muda de um estado para outro, que já estava
previamente programado; no segundo, durante um intervalo de tempo
ocorre um evento externo, que muda o estado do sistema
imediatamente após a ocorrência desse evento.
6
1.3 – Identificação da Técnica de Pesquisa Operacional a ser aplicada ao Sistema
em estudo
7
Tabela 1 - Tipos de Modelos - Eom et. al
Tipos de Modelos
Modelos Determinísticos
Programação Linear
Modelos de Transporte
Modelos de Estoque
Programação Inteira
Programação Não-Linear
Programação Dinâmica
Modelos Estocásticos
Modelos de Fila
Modelos de Simulação
Árvores de Decisão
Outros
Gráficos
Inteligência Artificial
Linguagens de Busca
Outros
8
Harrington, et al. () mostram o impacto financeiro nas áreas de logística e
marketing obtido através de decisões racionais usando técnicas de simulação, num
cenário caracterizado pelo aumento de competição externa, incertezas econômicas
e flutuações do mercado financeiro.
Tomada de Decisão
Agregado Produção
Nível: Geral Representação exata
Algoritmos
Método: Otimização
Heurísticas
9
Analogamente, Pidd () ao abordar diversas formas de modelagem para o
processo de decisão, mostra o uso de modelos otimizantes, heurísticas e simulação.
Quanto à simulação computacional, o autor recomendada que a mesma seja usada
em sistemas que sejam:
10
Com relação à aplicação da simulação em um sistema de manufatura, tem-se na
literatura um exemplo descrito por McClelland (), o qual se baseou na
necessidade de haver uma racionalização e uma eficiente alocação de recursos
escassos de uma empresa face à crescente competitividade do mercado mundial.
Neste estudo buscou-se integrar o plano estratégico de manufatura (onde se inclui
projeto e desenvolvimento do produto, concepção da linha de montagem, número de
estágios de produção, processos de manufatura e capacidade de produção) com a
política global administrativa da empresa.
Mosef(1997) situa a simulação dentro do contexto do processo de decisão
com três abordagens distintas:
11
Pesquisou-se também na literatura técnica princípios que orientassem o processo de
modelagem, uma vez que isto é tido como uma "arte", ou "consequência de um
processo intuitivo, o qual é raramente explicitado ou explicado" conforme mostra
Morris (). Este autor, contudo, indica uma série de diretrizes que norteiam o
processo de desenvolvimento de modelos:
12
• Buscar analogias - a possibilidade do uso de uma analogia tem que ser
considerada antes que o problema tenha sido bem definido, uma vez
que estas podem direcionar o caminho em que o problema poderia se
tornar mais específico;
• eliminar variáveis;
• suprimir a aleatoriedade;
Isto porque o objetivo real da análise de sistemas não é simplesmente estudar cada
vez mais maiores problemas, mas sim achar maneiras de transformar grandes
problemas em menores, de forma que as soluções destes pequenos possam ser
combinados de alguma forma fácil, visando fornecer as soluções de grandes
problemas.
Finalmente cabe ressaltar que a escolha da técnica a ser utilizada na solução de
problemas pode estar relacionada com o ambiente de planejamento que se está
aboradando. Esse ambiente de planejamento pode ser classificado em três níveis:
13
• Nível Tático – É um planejamento que busca garantir, dentro de um
médio prazo, a alocação racional e eficiente dos recursos existentes,
visando atender às diretrizes globais traçadas no planejamento
estratégico.
14
Problema 1
Considere o problema de alocação de veículos de uma determinada frota, onde se
pretende transportar a cada viagem(rotas fixas e com demanda conhecida a cada
dia) uma determinada quantidade de pallets, tendo-se o custo por viagem por tipo
de veículo, bem como o número de veículos disponíveis por tipo e a capacidade
máxima de pallets por tipo de veículo, a saber:
Determine a melhor alocação de frota, de tal forma que o Custo de Transporte seja o
menor possível ?
Problema 2
Embalagens com oxigênio líquido devem ser semanalmente distribuídas para
unidades fabris.O transporte desse produto é feito por veículos a partir de uma base
e junto as unidades fabris esse produto é descarregado. As características do
processo estão mostradas abaixo:
Número de Unidades Fabris = 42
Capacidade de cada veículo = 200 embalagens
Velocidade do veículo = 35 km/hora
Tempo máximo de operação por dia do veículo = 12 horas
Taxa de descarga nas unidades fabris = 60 unidades/hora
15
Coordenada X e Y da Base são conhecidas, assim como as coordenadas das
unidades, assim como a demanda semanal de cada uma por oxigênio (em
embalagens)
Determine quantos veículos são necessários e quais as rotas a serem formadas
para que o custo de transporte seja o menor possível ?
Problema 3
Na tabela abaixo são mostrados os tempos entre chegadas dos veículos a uma
lanchonete e o tempo de atendimento de cada um. Avalie o desempenho
operacional desse serviço.
Veículo 1 2 3 4 5 6 7 8 9 10 11 12
Intervalo 2 3 3 3 5 0 1 5 1 4 1 2
Duração 1 2 1 1 3 2 1 4 2 3 1 3
Problema 4
Pretende-se analisar o setor de atendimento de um almoxarifado, que atualmente
tem um funcionário para atender os pedidos durante 24 horas em turnos de 6 horas.
O intervalo entre chegadas de pedidos é conhecido, bem como o tempo de
atendimento (composto do picking, montagem, embalagem e despacho). Em
determinados instantes, caracterizados pelos intervalo entre paradas, este
funcionário é chamado para intervir com urgência em determinado local e para o que
está fazendo, retomando o serviço quando voltar. O intervalo entre chamadas
externas e o tempo de cada parada externa são conhecidos. Modelo o problema em
busca de informações sobre o desempenho do sistema.
16
roteirização, que dependendo do seu porte (número de clientes, janelas de tempo e
etc.) poderá ser resolvido por meio de heurísticas.
Os problemas 3 e 4 descrevem mais detalhadamente a operação de um sistema.
Em ambos pede-se a avaliação do desempenho operacional do sistema, sem
qualquer menção a otimização do sistema. É para essa classe de problemas que a
simulação é mais recomendada para ser aplicada.
Cabe destacar que nos problemas 3 e 4 fica evidenciado a presença da formação de
filas (de automóveis no problema 3 e de pedidos no problema 4).
A formação de fila de itens devido a existirem recursos ocupados e que estão sendo
usados por itens que chegaram anteriormente, mostra a necessidade de conhecer
mais detalhadamente conceitos básicos de Teoria de Filas, que serão apresentados
no próximo capítulo.
Os problemas 3 e 4 serão abordados com mais detalhes durante o curso.
17
2 - Introdução à Teoria de Filas
Uma fila se caracteriza pela espera de pessoas, veículos e qualquer outro elemento,
que ao buscarem serviço num ou em vários postos de atendimento, não podem ser
atendidos no momento que chegam pois todos os postos disponíveis estão
ocupados.
A teoria de filas se ocupa com a elaboração e solução de modelos matemáticos que
representem os processos de fila, com a finalidade de obter estimativas de boa
qualidade para parâmetros importantes do processo, tais como tempo médio de
espera, tempo médio de permanência no sistema, número médio de elementos no
sistema e na fila, e outras características menos agregadas, como distribuição do
tempo de espera e distribuição do número de clientes no sistema.
2.1 - Introdução
18
Retomando o problema 3 apresentado na seção 1.4, abaixo enunciado:
Na tabela abaixo são mostrados os intervalos entre chegadas dos veículos a uma
lanchonete e o tempo de atendimento de cada um (em minutos). Avalie o
desempenho operacional desse serviço.
Veículo 1 2 3 4 5 6 7 8 9 10 11 12
Intervalo 2 3 3 3 5 0 1 5 1 4 1 2
Duração 1 2 1 1 3 2 1 4 2 3 1 3
10
11
12
19
2.2 - Processos de Chegadas e de Atendimentos
Quando o cliente entra no sistema, ele poderá esperar em fila algum tempo
enquanto aguarda até que um servidor esteja disponível. As filas são sempre
regidas por algumas regras de funcionamento. Assim, deve-se especificar uma
disciplina de serviço para o sistema. Entre as disciplinas comumente utilizadas,
destacam-se:
20
2.4 - Estrutura do Sistema
A estrutura mais simples de um sistema com fila é formada por uma fila e um único
servidor, como representado na figura 3.
Servidor
Chegada Saída
de
clientes
Clientes em fila
Uma estrutura mais próxima daquela encontrada dentro de uma agência bancária é
representada na figura 4. Neste caso, existe uma fila única de clientes que são
atendidos por um dos servidores disponíveis em paralelo.
Servidores
Chegada Saída
de
clientes
Clientes em fila
21
mecânico, a seguir pela furadeira e, por último, pela máquina fresadora. Cada
máquina tem a sua própria distribuição do tempo de atendimento e cada peça pode
esperar em fila antes de ser atendida por cada máquina. Um sistema deste tipo é
chamado de “rede de filas”. A figura 5 exemplifica essa situação, onde os clientes
são atendidos em série pelas máquinas. Apesar da sua importância, a obtenção de
resultados analíticos para este tipo de sistema é extremamente difícil e não faz parte
do escopo deste trabalho.
Servidores
Chegada
de Saída
clientes
Clientes em fila
22
b: indica o processo de atendimento dos elementos em cada posto de serviço,
definido pela distribuição estatística do tempo de serviço com as mesmas
abreviações utilizadas para os tempos entre chegadas sucessivas. Os postos de
serviço podem estar dispostos em paralelo ou em série;
c: é o número de postos de serviços em paralelo;
d: é a disciplina de atendimento dos elementos da fila como descrita na seção 3:
FCFS, LCFS, SIRO e GD.
e: é o número máximo de elementos no sistema (fila mais postos de serviço). Um
caso típico desse exemplo é a limitação da área da baía de espera num porto, que
obriga os navios excedentes buscarem refúgio em portos próximos, desistindo de
esperarem em fila naquele local;
f: é o número de elementos que freqüentam o sistema. No caso de terminais
privados, como o da Petrobrás, por exemplo, o número de navios que lá atracam é
finito e conhecido. No caso de terminais portuários públicos, pode-se considerar o
número de navios que lá freqüentam como infinito, ou seja o processo de chegadas
não é influenciado pela população de navios que freqüentam o terminal.
Por exemplo, 0/*/3/FCFS/5/∝, significa um sistema em que:
23
Pela sua experiência, ele sabe que existem horários de pico de atendimento (almoço
ou jantar), em que a taxa de chegadas de clientes aumenta repentinamente. Em
uma situação como esta, fica a dúvida: o sistema deve ser estudado em um intervalo
de tempo curto (somente os horários de pico) ou longo (ao longo do dia)?
A resposta para esta pergunta depende de uma análise empírica dos dados. Se a
variação da taxa de surgimento de clientes for alta a ponto de comprometer os
valores médios, de fato a análise forçosamente deverá ser realizada para um
período curto de tempo. Contudo, em intervalos de tempo menores o estado inicial
do sistema pode afetar diretamente o comportamento médio do sistema. No caso do
restaurante, por exemplo, se já existia alguma fila de atendimento às 11:30 hs (início
do horário do almoço), essa fila pode nunca se dissipar ao longo da próxima hora,
afetando diretamente o desempenho do sistema dentro do período de análise.
Portanto, o sistema deve ser analisado no seu regime transitório, que é dependente
das condições iniciais do sistema.
Por outro lado, se as condições iniciais do sistema dissipam-se, ou seja, o período
de análise é suficientemente longo para que as condições iniciais não afetem o
comportamento médio do sistema, a análise é feita para o estado estacionário.
Devido à natureza matemática do problema, o regime transitório é de análise
extremamente difícil. Neste trabalho, consideraremos apenas a análise de estado
estacionário.
/ = λ:
Está formula também pode ser colocada em função do numero esperado de clientes
na fila (tamanho médio da fila) / e do número esperado de clientes em atendimento
/ .
24
Por exemplo, considere um sistema com apenas um servidor que, em média, recebe
30 clientes por hora. Se o tempo médio de atendimento é de 5 minutos, temos neste
caso, λ = 30 clientes/h e :=5/60 h. Portanto, o número esperado de clientes neste
sistema será de:
5
/ = λ: = 30 × = 2,5 clientes.
60
∞
ρ
/=∑
MS =
=0 1− ρ
RX
ρ2
/=ρ+
1− ρ
1
:=
µ −λ
λ 1
: = e : =
µ (µ − λ ) µ
−1 1 λ 1 λ
−1
Vµ
S0 = ∑ +
=0 Q! µ V! µ Vµ − λ
25
( Vρ )
S = S0 M = 1,..., V
M!
( Vρ )
S = − S0 M = V, V + 1, V + 2,...
V!V
A probabilidade de existência de fila é dada por:
( Vρ )
3( M ≥ V) = S0
V!(1 − ρ )
Consequentemente:
3 ( M ≥ V) ρ
/ =
1− ρ
λ
/ =
µ
ρ 2 (1 + α 2 )
/′ = ρ +
2(1 − ρ )
26
L’
ρ
0 1
Para finalizar esse rápido estudo da fila 0/*/1, convém ressaltar que, em virtude de
que os tempos de atendimento têm memória, esta fila não pode ser estudada num
instante genérico W e todos os resultados obtidos se referem aos instantes escolhidos
para observação do sistema.
27
2.11 - Estudo de caso: Expansão de um terminal portuário
28
NV é calculado em função do volume de importação anual dividido pela capacidade
do navio. Fixado um número de berços (NB), pode-se determinar a ocupação do
terminal para incrementos do nível de importação e pela teoria de filas, adotando-se
um modelo (M/M/c):(FIFO/∞/∞), pode-se determinar um valor para o tempo médio de
espera de cada navio (TE).
A tabela 2 mostra para cada ano de operação do terminal, o nível de importações, o
número de navios que freqüentam o terminal por ano (NV) e a taxa de chegada (λ)
de navios por dia.
A tabela 3 mostra para cada número de berços no terminal, a evolução do tempo
médio de espera dos navios (TE), o custo total do sistema (CT) e a taxa de
ocupação do terminal (ρ)
29
Tabela 2 - Nível de importação, número de navios e taxa de chegadas de navios
1 1000 25 0.0684
Pela tabela 3, nota-se que o terminal portuário com NB=1 atinge a saturação (ρ>1).
No o sétimo ano de operação e para NB=2, após o 14° ano e, para NB=3, após o 18
° ano.
30
Até o 4° ano de operação o custo total com 1 berço é menor que o custo total com o
terminal dotado de 2 e 3 berços, porém no 5° ano já é vantajoso operar o terminal
com 2 berços, pois o custo total é menor do que com 1 só berço. Dessa forma, o 2°
berço deveria ter sua construção iniciada já no início do 2° ano.
Idêntica análise pode ser feita para a ampliação do terminal de 2 para 3 berços. No
13° ano de operação o custo anual do terminal com 2 berços supera o custo anual
do terminal com 3 berços. Portanto, o 3° berço deveria ter sua construção iniciada
no 10° ano.
31
Tabela 3 - Custo total e ocupação do sistema
Número de
bercos=1 (NB)
Número de
bercos=2 (NB)
32
11 8.63 25599. .720
Número de
bercos=3 (NB)
33
2.12 – Limitações da Teoria de Filas
34
7DEHOD ± 5D]kR GR 7HPSR HP ILOD SHOR 7HPSR PpGLR GH $WHQGLPHQWR HP
IXQomRGD2FXSDomRGR3RVWRHGRQ~PHURGH3RVWRV
35
3 – Introdução à Simulação Discreta
36
Pedgen(1995), criador da linguagem SIMAN, empregada no desenvolvimento de
projetos e pesquisas, mostra que a simulação discreta tem que ter como objetivo a
descrição do comportamento de sistemas; a construção de teorias ou hipóteses que
explicam o comportamento observado e, finalmente, o uso do modelo para prever
um comportamento futuro (efeitos produzidos por mudanças no sistema ou na sua
forma de operar).
Para isso, faz-se necessário o uso da abordagem sistêmica, pois a mesma procura
considerar o desempenho total do sistema e não se concentrar nas partes. Isto se
baseia no fato de que mesmo que cada elemento ou subsistema esteja otimizado do
ponto de vista de dimensionamento, projeto ou operação, o desempenho global do
sistema pode estar subotimizado devido às interações entre as partes.
Como benefícios do uso da simulação como ferramenta de apoio à decisão, Pedgen
indica que:
• podem ser testadas diversas hipóteses sobre como ou por que certos
fenômenos ocorrem, buscando sempre a viabilidade do sistema;
37
Como desvantagens tem-se que:
• os dados de saída podem ser de difícil interpretação, pois uma vez que o
modelo está buscando capturar a aleatoriedade do sistema real, é geralmente
difícil determinar se o resultado de um processamento é devido às interações
presentes no sistema, ou se é devido à aleatoriedade embutida no modelo.
38
3.1.1 - Caracterização dos processos de chegada e atendimento
39
- sorteia-se um número aleatório uniformemente distribuído entre 0 e 1, para cada
atividade prevista no modelo;
- utilizando-se a função inversa da distribuição de probablilidade e o número
aleatório, determina-se o intervalo de tempo.
Procedimento semelhante pode ser usado se a distribuição de probabilidade
de uma função estiver definida numa tabela de frequências acumuladas.
Os números aleatórios entre 0 e 1, em geral, são calculados por algoritmos,
que partem de um valor inicial denominado "semente" e, por meio de diferentes
manipulações matemáticas, geram os chamados números pseudo-aleatórios.
Um exemplo de gerador de números aleatórios é o método da congruência ou
resíduo. Considerando a, b, P e a semente Co como parâmetros iniciais; o
algoritmo é descrito abaixo:
40
- teste de independência, que checa se existe correlação na sequência de números
obtida pelo método empregado.
Cabe ressaltar a importância de se alterar as sementes dos geradores de
números aleatórios a cada novo processamento da simulação de um modelo, cuja
sistemática será discutida em seções adiante.
- Função Normal
Y = (X - µ)/σ
42
3.1.4 – Montando uma Simulação
43
A tabela 5 mostra na coluna 2 os intervalos entre chegadas consecutivas de
clientes e na coluna 3 mostra os instantes de chegada dos clientes (evento chegada
do cliente ao banco), que são os valores acumulados da coluna 2.
Tabela 5 - Intervalos entre chegadas consecutivas e os instantes de
clientes (em segundos)
1 0 0
2 186 186
3 85 271
4 266 537
5 492 1029
6 381 1410
7 157 1567
8 125 1692
9 145 1837
10 427 2264
11 89 2353
12 187 2540
13 9 2549
14 264 2813
15 43 2856
16 62 2918
17 693 3611
18 440 4051
19 217 4268
20 199 4467
21 253 4720
44
Conhecida a quantidade de clientes gerada no tempo total de simulação de
4800 minutos, pode-se gerar o tempo de atendimento de cada cliente usando-se a
distribuição estatística da atividade de atendimento do cliente (exponencial com
média de 400 segundos).
A tabela 6 mostra o tempo de atendimento sorteado para cada cliente.
Note-se que somente um evento foi perfeitamente caracterizado, ou seja a
chegada de cliente, que depende somente do sorteio da distribuição estatística
associada.
O processo de simulação caracteriza-se pela determinação de todos os
eventos envolvidos no sistema, durante o período de análise, para que sejam
posteriormente ordenados cronologicamente. Neste exemplo falta calcular os
eventos de início e fim de atendimento de cada cliente.
45
Tabela 6 - Tempos de atendimento dos clientes (em segundos)
1 431
2 374
3 641
4 419
5 646
6 524
7 538
8 581
9 672
10 72
11 417
12 273
13 256
14 150
15 487
16 579
17 364
18 776
19 15
20 23
21 244
46
A tabela 7 mostra na coluna 3 o instante de início de atendimento, na coluna 4
o instante de fim de atendimento de cada cliente nas colunas 5 e 6 o tempo de
espera e permanência de cada cliente respectivamente.
Algumas propriedades do sistema já podem ser calculadas usando-se a
tabela 7. São elas:
- tempo médio de espera dos clientes.
Basta calcular a somatória da coluna 5 da tabela 7 e dividir pelo número total
de clientes gerados no período ( No exemplo o valor é de 165 segundos). O tempo
médio de espera, retirando-se aqueles clientes que não esperam em fila, também
pode ser calculado de maneira semelhante.
- tempo médio de permanência dos clientes no banco.
Este valor é dado pela somatória da coluna 6 da tabela 7 e dividido pelo
número total de clientes gerados no período ( No exemplo o valor é de 266
segundos).
47
Tabela 7 - Eventos chegada, inicio e fim de atendimento de cada cliente e tempo de
espera e permanência no banco (em segundos)
48
Uma visualização importante do processo de simulação pode ser fornecida
pelo gráfico de estado do sistema, que dá para cada instante do processo de
simulação o número de elementos no sistema, sejam estes esperando em fila ou
sendo atendidos.
A tabela 8 mostra para todos os eventos, cronologicamente ordenados, o
estado do sistema (coluna 2), o instante de ocorrência de cada evento (coluna 3), o
tempo em que o sistema permaneceu naquele estado (coluna 4) e a descrição dos
eventos (coluna 5).
A figura 7 mostra o gráfico do estado do sistema, cuja abscissa contém os
eventos os eventos ocorridos no período simulado
Com as informações da tabela 8 pode-se calcular:
a - o número médio de elementos na fila
A formação de fila se caracteriza toda vez que o número de elementos no sistema
ultrapassa o valor 2. Calculando-se a somatória dos tempos de fila vezes o número
de elementos em fila, para cada trecho do diagrama de estado e dividindo-se pelo
tempo total simulado, obtem-se o número médio dos elementos em fila ( No exemplo
o valor é de 0.722 clientes);
b - número médio de elementos no sistema (em fila mais nos caixas)
De forma semelhante ao cálculo do número médio de elementos em fila, pode-se
achar a média ponderada dos tempos de permanência do sistema de 0 até n
elementos e dividir pelo tempo total simulado ( No exemplo o valor é de 2,45
clientes).
c - o índice de ocupação dos caixas
O índice de ocupação dos caixas é também calculado por meio de uma média
ponderada dos tempos em que as mesmas ficaram vazias, com pelo menos uma
ocupada e com as dias ocupadas, dividido pelo tempo total simulado (No exemplo, o
valor é 73 %).
49
Tabela 8 : Eventos crologicamente ordenados (tempo em segundos)
1 1 0 0 C1=I1
3 3 271 85 C3
5 3 537 106 C4
6 2 560 23 F2=I4
7 1 979 419 F4
8 2 1029 50 C5=I5
9 1 1072 43 F3
11 3 1567 157 C7
13 3 1692 17 C8
14 4 1837 145 C9
15 3 1934 97 F6=I8
17 3 2264 51 C10
18 4 2353 89 C11
20 4 2540 25 C12
21 5 2549 9 C13
22 4 2587 38 F10=I11
24 6 2856 43 C15
50
25 5 2885 29 F9=I12
26 6 2918 33 C16
27 5 3004 86 F11=I13
30 2 3308 48 F14=I16
35 1 4111 60 F17
37 1 4288 15 F19
39 1 4490 23 F20
41 1 4827 80 F18
42 0 4964 0 F21
Ci = Chegada do Cliente i
51
Elementos do Sistema
6
5
4
3
2
1
0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 Eventos
Veículo 1 2 3 4 5 6 7 8 9 10 11 12
Intervalo 2 3 3 3 5 0 1 5 1 4 1 2
Duração 1 2 1 1 3 2 1 4 2 3 1 3
52
Pede-se com base nos valores intervalo médio entre chegadas e do tempo médio
de atendimento, a simulação da chegada de 5000 veículos na lanchonete com a
avaliação das mesma estatíticas solicitadas anteriormente, assumindo que os
processos de chegada e de atendimento são regidos por distribuições exponenciais.
53
4 - O Processo de Simulação
54
validação, por outro lado, estabelece que o comportamento do modelo representa,
de forma válida, o sistema do mundo real que está sendo simulado.
,3URMHWR)LQDOGR([SHULPHQWR - consiste em projetar experimentos que irão gerar as
informações desejadas e determinar como cada um dos processamentos
computacionais no projeto será executado;
-([SHULPHQWDo}HVH$QiOLVHGH6HQVLELOLGDGH - consistem em executar a simulação
para gerar os dados desejados e realizar análises de sensibilidade;
.$QiOLVH H,QWHUSUHWDomRGRV5HVXOWDGRV - consiste em realizar inferências sobre
os dados obtidos pela simulação;
/,PSOHPHQWDomR H 'RFXPHQWDomR - são a disponibilização e aplicação dos dados
utilizados e dos resultados obtidos, além de uma documentação do modelo e de seu
uso.
Retomando o exemplo do posto bancário delineado no início do capítulo 3, a
descrição e a montagem do sistema bancário foram bastante simplificadas, pois é
sabido que o problema real de um posto bancário existem fatores que tornam o
probelma mais complexo, como por exemplo o horário de funcionamento, a
preferência pelos idosos e gestantes no atendimento, eventuais falhas no sistema
que interrompem o atendimento em alguns periódos e etc. Se o analista
necessitasse de respostas globais de ocupação e fila desse posto em curto espaço
de tempo, tal enunciado seria suficiente para descrever o sistema bancário em
questão. Com isso, os passos “A”, “B” e “C” do processo de simulação estariam
cumpridos.
O modelo conceitual, que corresponde ao passo ”D” para simulação deste exemplo
com as hipóteses simplificadoras que foram adotadas, segue as fases abaixo
indicadas:
55
As propriedades do sistema que podem ser calculadas neste exemplo são as
seguintes: comprimento médio da fila, tempo médio de espera em fila, tempo médio
de permanência dos clientes no posto e ocupação dos caixas e que representam a
fase “E” do processo de simulação.
O próximo passo do processo de simulação seria, segundo Pedgen(1995) a “F -
Preparação dos dados de entrada”, que basicamente, seria buscar as distribuições
de probabilidade para a geração dos intervalos entre chegada dos clientes e seus
tempos de atendimento, respectivamente. Em seguida o passo “G – Codificação do
modelo” poderia ser executado.
Nota-se, no entanto, que deve haver uma modificação importante nesse
processo de simulação entre os passos “F” e “G”, que é apresentada a seguir.
56
Figura 8 - Ciclo completo de um projeto de simulação. Fonte: Knepell(1993)
57
discreta. Em caso positivo, devem alterar o modelo conceitual de simulação, que
passaria a considerar o atendimento diferenciado em cada caixa.
Defende, portanto o autor, que o processo de simulação tenha a alteração
mostrada na tabela 9 abaixo.
58
• o cliente libera o caixa e sai do posto.
59
1tYHO- Teste de Aceitação Final - visa estabelecer credibilidade suficiente no
modelo de tal forma que este possa ser aceito e utilizado pelo cliente.
Problema
Comunicado
Problema
Formulado
Técnica Proposta
Apoio Integrado
de Solução
à Simulação
(Simulação)
Resultados da Simulação
Apresentação
Formulação do Modelo
Definição do
Sistema e dos
Objetivos
Qualificação do Modelo
Redefinição Modelo
Conceitual
Representação
do Modelo
VV&T do Modelo
Esquemático
Resultados da VV&T dosDados
Simulação Modelo
Esquemático
VV&T do Modelo
Experimental VV&T do Modelo
Programado Programação
Modelo
Programado
VV&T do Projeto
de Experimentos
Modelo
Experimentos
Experimental
Projeto de
Experimentos
60
sistema. Os resultados parciais de VV&T devem direcionar a continuidade
do desenvolvimento do modelo. Contudo, o grau de utilização de um modelo
é influenciado pelo grau de credibilidade do mesmo, conforme pode ser
observado na figura 10.
61
adequados ao problema. Além disso, é imprescindível ter domínio do
problema, expertise em modelagem e em técnicas de VV&T.
Problema
Formulado
O problema
formulado contém Não
Cometido Erro
completamente o Tipo III
problema real?
Sim
O modelo
formulado é representado por
Sim um modelo que Não
possui credibilidade ?
Pode-se Pode-se
assegurar a credibilidade Não Não assegurar a credibilidade
dos resultados da dos resultados da
simulação ? simulação ?
Sim Sim
Os Os
Resultados da Não Não resultados da
simulação são simulação são
aceitos ? aceitos ?
Sim
63
Erro Tipo III - acontece quando se resolve o problema errado e seus resultados são
aceitos, apesar do problema formulado não refletir, na realidade, o problema
real.
10. Os erros devem ser detectados o quanto antes num ciclo de vida de um estudo
de simulação.
Isto deve ser uma meta a ser buscada, visando eliminar o retrabalho. Outro
fator complicador é a possível influência de uma alteração em um estágio
inicial, em etapas do estudo de simulação mais avançadas.
12. Testes bem sucedidos nos submodelos não implicam na credibilidade do modelo
como um todo.
Apesar de individualmente estarem validados, o modelo só estará
completamente validado quando o mesmo estiver testado com todas as
parte integradas e interagindo entre si.
13. O problema de dupla validação tem que ser identificado e ser resolvido
adequadamente.
0 problema de dupla validação ocorre quando existem dados disponíveis
sobre a entrada e a saída de um sistema real e, dessa forma, procura-se
comparar estes valores com os resultados de uma simulação. Nesta ocasião
surge o problema de dupla validação que consiste, em primeiro lugar,
garantir que os dados de entrada de ambos os sistemas (real e modelado)
são equivalentes, para depois se validar os resultados obtidos.
64
14. A validação de um modelo de simulação não garante a credibilidade e a
aceitação dos resultados da simulação.
A validação de um modelo de simulação é uma condição necessária mas
não suficiente para a aceitação dos resultados da simulação. Isto porque a
validação tem que ser feita em relação aos objetivos do estudo de
simulação, comparando o modelo e o sistema como foram definidos. Se os
objetivos foram identificados incorretamente ou o sistema foi definido de
forma incorreta, o modelo poderá ser válido em relação a estas
especificações, contudo inválido com relação ao sistema real.
15. A precisão com que o problema foi formulado afeta grandemente a aceitação e a
credibilidade dos resultados da simulação.
Ainda segundo Balci, o objetivo maior da simulação não é apenas produzir a
solução para um problema, mas fornecer uma solução que tenha suficiente
credibilidade e aceitação e seja implementada pela equipe responsável por
tomadas de decisão. Também alega que a responsabilidade pela aceitação
e uso do modelo acaba recaindo principalmente sobre a equipe de
desenvolvimento e que esta aceitação é função da precisão da formulação
do modelo. Por sua vez, a formulação é função direta da definição do
problema, bem como da participação do usuário final na definição do
problema.
65
5 – Utilizando o Programa ARENA para modelar Sistemas Logísticos
Process
são usados para construir o fluxograma dentro da área de trabalho. Cada comando
pode ser repetidamente colocado quantas vezes se fizerem necessárias para a
construção do modelo. Possuem pontos de entrada e saída, usados para
estabelecer interconexões e criar o fluxo do processo. Um duplo clique neste módulo
abre uma janela que permite configurar as ações referentes a ele. Também é
possível editar estes dados na janela de planilha, que fica logo abaixo da área de
trabalho. A planilha apresentada irá mudar conforme forem selecionados diferentes
módulos. Exemplo: módulo Process. Os comandos encontram-se agrupados em “
templates”, que podem ser acessados utilizando-se as opções “ file” “template panel”
“ Attach” na barra de ferramentas.
&RPDQGRVGH'DGRV:
66
apesar de aparecerem na janela do template, não são colocados na área de
trabalho. Ao serem selecionados, apresentam sua lista de dados na área de
planilha, onde podem ser editados, excluídos ou inseridas novas informações.
Exemplo: módulo Entity
É essencial sempre que o processo de simulação enunciado no capítulo 4 tenha
sido seguido e o modelo conceitual do sistema a ser resolvido tenha sido formulado
antes de partir-se para a codificação em ARENA.
Ao construir um fluxograma do modelo conceitual ou simplesmente enunciando-o, é
usado o ponto de vista da parte dinâmica do sistema, ou seja, aquilo que se
movimenta ou “passa” dentro do sistema. Por exemplo, em um processo de uma
linha de produção, este elemento é uma peça, se for um hospital, são os pacientes,
se for uma agência bancária, são os clientes. Essa parte que percorre o fluxo é
chamada de “entidade”, e o fluxograma representa a estrutura estática ou fixa do
sistema, assim como os processos de decisão e desvio correspondentes.
Entidades:
circulam pelo
modelo,
interagindo
com os
68
O Template Basic Process
&UHDWH
Create
Definição do tipo de
Descrição do entidade a ser criada
módulo (sem
acentuação)
Definição do
intervalo de tempo
entre chegadas
Quantas entidades
deverão chegar a cada
vez
Quantidade máxima de
Momento da
entidades a serem inseridas
primeira
por este módulo Create
criação
69
3URFHVV
Process
O módulo de fluxograma Process tem a função de representar qualquer ação dentro
do sistema que leve um tempo para ser cumprida. Também é capaz de representar
a ocupação de uma máquina ou operador (recurso). A janela de opções do módulo
Process está apresentada a seguir:
70
'HFLGH
True
Decide
False
O módulo de fluxograma Decide representa uma ramificação no fluxo do processo.
Ele serve para alterar o rumo das entidades baseado em uma condição do sistema
ou de um percentual probabilístico. Sua janela de opções é esta:
'LVSRVH
Dispose
Este módulo de fluxograma tem função inversa à do módulo Create. Ele tem a
função de retirar as entidades do sistema. Um duplo clique sobre ele abre a seguinte
janela de opções:
71
(QWLW\
O módulo de dados Entity reúne as definições e parâmetros referentes a todos os
tipos de entidades usados pelo modelo. A entrada de dados é realizada através da
área de planilha ou de uma caixa de diálogo. Para abrir a caixa de diálogo para um
módulo de dados, clique com o botão direito sobre a planilha e escolha a opção “Edit
via Dialog”. As opções de entrada para a caixa de diálogo de Entity estão explicadas
abaixo:
Nome do tipo de entidade
Nome da figura
usada para
representar a
entidade
72
5HVRXUFH
O módulo de dados Resource relaciona todos os recursos usados no modelo.
Por recurso, entende-se uma estrutura que será usada pela entidade, a qual irá
despender uma certa quantidade de tempo neste processo. Um recurso, então,
poderia ser uma máquina onde a peça sofre um processo, um caixa bancário que
atende a um cliente ou uma mesa de cirurgia por onde passa o paciente. Do mesmo
modo que o módulo Entity, seus dados podem ser editados pela planilha ou pela
caixa de diálogo. As opções de entrada para a caixa de diálogo de Resource estão
explicadas abaixo:
Nome do recurso
Capacidade ou schedule
correspondente
73
5.1.3 -Tempo de Simulação e Parâmetros
Os estudos de simulação geralmente são feitos em um período limitado de
tempo ou um conjunto de períodos idênticos. No ARENA, isto pode ser configurado
na janela “Replication Parameters, acessada através do menu RUN, opção SETUP,
e clicando na aba correspondente:
Número de intervalos de
tempo a serem simulados
Tempo de preparação do
sistema ou aquecimento
Duração de cada
processamento do modelo
processo durante uma semana, deve ser configurado para rodar 7 replicações
74
5.2 – Modelagem do Posto Bancário
cada cliente
geram se os Libera do caixa
entra em fila e
intervalos entre depois de ser
aguarda a
chegadas de atendido e sai do
liberacao de um
clientes ao posto sistema
0 dos dois caixas 0
Comando DI SPOSE
Comando CREATE Comando0PROCESS
Tempo Espera medio No. medio de clientes em fila Ocupacao dos Caixas
0 . 0 0 0 . 0 0 0 . 0 0 0
Cada comando acima tem suas peculiaridades e devem ser preenchidos de acordo
com o sistema a ser resolvido.
A partir desse momento, o analista passará a utlizar intensamente o programa
ARENA, visando aprimorar os conceitos sobre o programa e permitindo que vários
sistemas logísticos, enunciados no próximo capítulo, possam ser modelados ao
longo do curso.
75
6 – Enunciados de Sistemas Logísticos a serem modelados em ARENA
76
6.3 – Terminal Marítimo Importador
Pretende-se implantar um terminal marítimo importador de trigo com 2 berços
de atracação, sendo um berço para navios menores que 20.000 t e outro para
navios até 80.000 t. Os berços estarão dispostos lado a lado no mesmo píer, de tal
forma que o único carregador de navio possa atender tanto um berço como o outro
berço, bastando para tanto girar a lança carregadora. Esse tipo de operação é
interrompida sempre que ocorrer chuvas. Assuma as distribuições de chegada de
navios (1 a cada 3 dias com distribuição exponencial, sendo 50% de navios de
80000 t e 50% de navios de 20000t), de carregamento ( taxa de carregamento de
12000 t/dia com distribuição normal e coeficiente de variação de 30%), de intervalo
entre chuvas e tempo de chuva (1 ocorrência em média a cada 10 dias com
distribuição exponencial e com duração normal de média 10 horas e desvio de 3
horas).
Pede-se o modelo conceitual desse sistema e a codificação em ARENA.
Mostre o tempo médio em fila dos navios e do índice de congestionamento do
terminal.
77
6.5 – Dimensionamento de Estoques - 1
em lotes fixos, com tempo variável. Sendo os intervalos entre pedidos regidos
entre ressuprimentos, para que o estoque não atinja valor zero em mais que 5 %
Considere que o estoque não deve chegar ao valor zero em mais que 5 % do
6.7 – Balanceamento de uma Linha de Manufatura
A chegada de pedidos de manufatura de um determinado produto segue um
de cada parte do produto final, de tal forma que o tempo médio de permanência
das partes no sistema sejam próximos e o a fila de espera dos pedidos não seja
maior que 2.
6.8 – Análise de um Provedor de Internet
79
¾ tempo de atendimento é função do tamanho da mensagem (50% são pequenas,
30% são médias e 20 % são grandes) e o tempo é regido por uma distribuição
uniforme com limites entre 10-20 para pequena, 15-30 para média e 25 a 50 para
grande( tempos em milisegundos). O tempo de permanência da mensagem no
“status” de postergada é de 60 segundos e a mesma volta a fila do provedor com
alta priridade
¾ o tamanho da mensagem nada tem a ver com a sua multiplicação em função da
lista;
¾ quando a mensagem chega ao sistema (há um só provedor mono usuário e as
chegadas ocorrem 1 a cada 60 milisegundos), dependendo do seu tamanho
“pequena” ou “grande”, ela pode receber uma prioridade de “alta” para “baixa” ,
respectivamente;
¾ da mesma forma, se a mensagem for desdobrada (multiplicada) em mais
mensagens, esse lote poderia receber uma prioridade de “alta” para “baixa” para
ocupar a fila de atendimento;
¾ o fato de ser enviada, postergada ou devolvida deve ser estudado para efeitos de
modelagem com base numa séria de dados históricos que aponte a
probabilidade da ocorrência de cada situação.
6.9 – Dimensionamento de uma Frota de Caminhões
NO PORTO E NA FÁBRICA.
80
NO. POSTOS DE CARGA NA FÁBRICA = 5
MOVIMENTO
TEMPOS EM MINUTOS
ATENDIDAS EM 8 HORAS.
81
6.11– Dimensionamento de Pessoal
82
7 - Bibliografia
83
$1(;2$±7UDWDPHQWRGH'DGRVHP6LPXODomR'LVFUHWD
,1752'8d2
Nota-se que os autores que escrevem na área de simulação e filas não dedicam
espaço suficiente ou não desenvolvem adequadamente os tópicos relativos ao
tratamento de dados.
Por esse motivo, desenvolveu-se um procedimento simples e eficiente para que
alunos e outros interessados possam desde o início do desenvolvimento de um
projeto de simulação, percorrer o correto caminho do tratamento e análise de dados.
O procedimento que é apresentado neste texto, embora simples, porque reúne
conceitos e técnicas estatísticas conhecidas, preenche uma lacuna das literaturas
nacional e internacional, na área de simulação discreta.
Para tanto, com relação aos dados necessários para o desenvolvimento de um
modelo de simulação ou aplicação de Teoria de Filas, esse procedimento deverá,
nessa ordem:
a) Ordenar e analisar previamente a amostra de dados;
b) Descrever e comparar;
c) Limpar os dados discrepantes;
d) Pesquisar grupos existentes, separando-os ou agrupando-os;
e) Selecionar a distribuição de probabilidade conveniente.
84
Tabela 1 - Síntese do procedimento proposto
3DVVR 0HWRGRORJLD3URJUDPD8WLOL]DGRV $QiOLVHV
Comparação da média,
moda e mediana
Comparação da amplitude
e intervalo entre quartis
Avaliação do Coeficiente
de Variação
Avaliar concentrações de
dados nas classes de
freqüência.
Visualizar a associação e
calcular correlação linear.
85
Tabela 1 - Síntese do procedimento proposto (continuação)
4 – Limpeza de Dados Gráfico de Caixas, Discrepâncias Para cada variável
Bidimensionais/MINITAB independentemente:
Avaliar gráficos de
dispersão em busca de
pontos que induzem a
avaliações de associações
erradas
Verificar se os gráficos de
caixa por fator são
diferentes entre si ;
Efetuar comparação de
médias pela ANOVA.
86
Probabilidades ANALYSER Buscar uma distribuição
teórica que seja aderente
aos dados “limpos” e
“agrupados” ou adotar a
distribuição empírica.
87
os meios de transporte utilizados e seus volumes de vendas. No entanto, nem
sempre dispõe:
dos endereços de seus clientes em meio magnético;
dos volumes de vendas por cliente;
do número de entregas efetuada por veículo, etc.
• Medição;
88
semelhantes em outras empresas devem estar sempre associados a fatores que
permitam comparar os processos.
Diante desses cenários de obtenção de dados para simulação, depara-se o
analista com mais um problema: “Como retirar informações úteis da massa de
dados obtida ?”. A resposta será delineada na próxima seção.
• Avaliação Descritiva;
• Agrupamento;
89
Nesta etapa, com a ordenação de cada variável presente nos dados, alguns
valores limites (os maiores e/ou os menores) já podem se apresentar como
discrepantes, tanto no formato quanto na ordem de grandeza. Como por exemplo,
encontrar num determinado campo reservado ao tempo de operação de um navio no
porto, um dado alfanumérico. Outro exemplo até mais comum, é encontrar valores
“zero” para esse mesmo tempo de operação.
Cabe sugerir ao analista que fique atento também ao não preenchimento de
dados. Por exemplo, um conjunto de dados que contenha além da coluna do tempo
de operação do navio no porto, outras quatro colunas com os tempos de atracação e
de desatracação, de inspeções e de paradas, pode apresentar linhas em que nem
todos os campos estão preenchidos. Esse fato prejudica uma análise de correlação
entre as variáveis, pois o analista deverá eliminar uma quantidade muito grande de
linhas do conjunto de dados.
Outra análise possível e recomendada nessa etapa é a busca por
informações duplicadas, como por exemplo, um mesmo número de registro de navio
com mais de um nome para designá-lo. Na área empresarial é comum achar o
mesmo nome de uma empresa com diversos números de CNPJ – “Cadastro
Nacional da Pessoa Jurídica” diferentes.
Para a execução dessa etapa, os dados podem ser ordenados utilizando-se o
programa EXCEL ou o próprio programa MINITAB.
90
o INPUT ANALYSER do ARENA, não trazem todas as análise abaixo
recomendadas. São elas
2.2.2.1 - Separatrizes
As separatizes separam valores da amostra ordenada em porcentagens de 25
% (Quartis), 10% (Decis) ou 1% (Percentis).
Considere um conjunto de dados ordenados relativo à quantidade de água
solicitada por plataformas de petróleo. Suponha que seja de interesse caracterizar
os pedidos de água que sejam excessivamente altos e, para isso, baseado nos
dados ordenados, define-se como pedidos altos aqueles que estão entre os 5% mais
altos, ou seja, se o seu valor supera pelo menos 95% dos outros pedidos. O pedido
que supera 95% dos demais é denominado de 95o percentil da distribuição dos
pedidos de água. Os percentis também são medidas de posição e define-se o x 0
91
percentil, x ∈ [0,100] como o valor que supera x% da amostra ordenada; os 10 0 ,
20 0 , ..., 100 0 percentis recebem os nomes de, respectivamente, 1 0 , 2 0 , ..., 100 decis,
25 0 , 50 0 , 75 0 e 100 0 percentis são denominados de 1 0 , 2 0 e 3 0 quartis,
respectivamente.
Esse tipo de análise propicia ao analista dos dados um conhecimento inicial
do banco de dados.
92
2.2.2.5 – Mediana
2.2.2.7 – Amplitude
$ = [ ( ) − [ (1)
93
A principal vantagem da amplitude é sua simplicidade de cálculo e fácil
entendimento, ao passo que a principal desvantagem é a instabilidade decorrente do
uso apenas dos valores extremos; isto é, caso exista a presença de um valor
aberrante, a dispersão para o conjunto todo será muito influenciada por tal valor.
2.2.2.8 - Intervalo Inter-Quartil
O intervalo inter-quartil (,,4) é definido como a diferença entre o terceiro e o primeiro
quartis, isto é, denotando o primeiro quartil por 4 e o terceiro por 4 , tem-se que
,,4 = 43 − 41 .
Essa medida tende a eliminar os efeitos dos valores extremos que podem
estar presentes na amostra. Sua comparação direta com a amplitude reflete a
existência ou não de valores extremos que podem ser discrepantes. Uma
desvantagem desta medida é que não é tão intuitiva quanto a amplitude, além de
não ser popular. Da mesma forma que a amplitude, o ,,4 utiliza igualmente apenas
dois valores no seu cálculo.
" "
1 1
V2 = ∑ [ # − [ = # ∑ [ # − [
2 2 2
Q =1
# Q =1
Uma das desvantagens da variância é que sua unidade de medida é o
quadrado da unidade de medida dos dados originais. Para resolver este problema
94
define-se o desvio-padrão, dado por σ, que corresponde à raiz quadrada de σ2 , isto
é,
$
1
∑ [ % − [
2
=
Q =1
%
Deve ser notado que tanto a variância quanto o desvio-padrão fazem uso de
todos os elementos do conjunto de dados em seu cálculo. Dessa forma, valores
aberrantes têm seu efeito diluído no valor final da medida. Entretanto, ambas as
medidas estão sujeitas a instabilidades devido a tais valores. Apesar disso, uma das
principais vantagens da variância diz respeito à facilidade de manipulação algébrica.
Outra vantagem é que a variância aparece de forma natural nas derivações teóricas
para a estimação da média feita na inferência estatística, fornecendo assim
resultados importantes para o uso de testes estatísticos.
&9 =
[
O coeficiente de variação fornece uma medida de variabilidade relativa à
média, isto é, ele permite a comparação (com relação à variabilidade) de diferentes
conjuntos de dados, medidos em diferentes unidades. Note-se que &9 é
adimensional. O coeficiente de variação não está definido quando a média for zero,
além disso, ele está sujeito à influência de observações discrepantes.
Um resultado imediato do CV é saber a proporção do desvio-padrão em
relação a média. Valores pequenos indicam amostras com pequena variabilidade.
Em função da análise dos resultados da estatística descritiva é possível iniciar o
entendimento do comportamento das variáveis, de modo a perceber a necessidade
de utilizar outras técnicas que sejam capazes de efetivamente definir o
comportamento de tais variáveis.
Para ilustrar o módulo do MINITAB, que calcula medidas descritivas,
considere uma coluna de dados intitulada “tempo”, que contenha os intervalos de
95
tempo entre as chegadas consecutivas de navios de carga geral em um porto, ao
longo de um ano.
O comando do MINITAB a ser utilizado para descrever os dados é
%Describe '
tempo'
;
Confidence 95%.
Descriptive Statistics
Variable N Mean Median Tr Mean StDev SE Mean
tempo 150 2,4206 2,4110 2,4184 0,2361 0,0193
Variable Min Max Q1 Q3
tempo 1,9308 3,0729 2,2651 2,5961 ,
96
Descriptive Statistics
Variable: tempo
Mean 2.42057
StDev 0.23607
Variance 5.57E-02
Skewness 6.83E-02
Kurtosis -2.4E-01
1.9 2.1 2.3 2.5 2.7 2.9 3.1 N 150
Minimum 1.93081
1st Quartile 2.26505
Median 2.41103
3rd Quartile 2.59611
95% Confidence Interval for Mu Maximum 3.07288
95% Confidence Interval for Mu
2.38248 2.45866
2.38 2.43 2.48 95% Confidence Interval for Sigma
0.21204 0.26630
95% Confidence Interval for Median
95% Confidence Interval for Median
2.37703 2.47726
2.2.3.1 - Histograma
O histograma é um gráfico composto por retângulos contíguos, cujas bases
representam os intervalos dos possíveis valores observados e as alturas
correspondentes ao número de valores observados nos intervalos, ou a freqüência
relativa ao total (porcentagens, por exemplo), ou ainda a uma outra medida
chamada GHQVLGDGHGHIUHTrQFLD, definida de tal forma que a área dos retângulos
correspondem às freqüências relativas correspondentes.
98
quantidades de interesse. Caso esta relação seja OLQHDU, ela pode ser quantificada
através da FRUUHODomROLQHDUGH3HDUVRQ denotada pela letra U e definida por
&
∑ ([' − [ )( \ ' − \ )
'
U = & =1
&
∑ ' =1 ( [ − [ ) ∑' =1 ( \ − \ )
' 2 ' 2
2.1.4. Limpeza dos Dados
De posse das análises e resultados obtidos nas três etapas anteriores, é
possível ao analista compreender o comportamento das variáveis do banco de
dados, de modo a identificar aquelas que deverão compor o sistema a ser
modelado, colaborando, assim para o levantamento das possíveis correlações entre
as variáveis. No entanto, a base de dados pode encobrir valores discrepantes que
não deveriam ser considerados.
Esta quarta etapa, definida como limpeza de dados, refere-se à retirada dos
valores sem coerência ou consistência, bem como, àqueles se apresentarem
discrepantes com relação à aplicação da metodologia de gráfico de caixas ou “%R[
3ORW´.
Essa limpeza deve acontecer devido a alguns problemas comuns a vários
conjuntos de dados, muitas vezes acarretados por falta de cuidado no registro ou na
mensuração das variáveis. Para ilustrar esses problemas, podem ser citadas as
informações sobre o tempo gasto para realizar uma determinada viagem. O registro
desse tempo foi de responsabilidade do motorista que realizou o trajeto. Na
seqüência de dados mostrada na tabela 2 abaixo, apresenta-se a tabulação feita
pelo MINITAB.
Tempo Freqüência
0 55
2 1
4 1
5 59
99
6 2
7 3
8 2
9 1
10 28
13 2
15 10
20 6
28 1
30 2
35 2
40 1
44 1
50 1
57 1
60 1
70 2
75 2
95 1
660 1
1245 1
N= 187
100
viagens não foi informado. Logo, essas informações devem ser excluídas de
futuras análises;
percebe-se a existência de um número excessivo de viagens com tempo de
duração múltiplo de 5: 5, 10, 15 horas, etc. Existe uma tendência observada na
população em geral em arredondar valores numéricos para múltiplos de 5. Trata-
se de uma informação imprecisa, também motivada por falta de cuidado no
fornecimento da informação;
repare-se que dois valores apresentam-se muito superiores aos demais (660 e
1245). Tecnicamente esses valores são denominados "discrepantes",
"aberrantes", ou "extremos", ou ainda, RXWOLHUV. A seguir, será feita uma discussão
sobre valores discrepantes e suas conseqüências em uma análise dos dados que
serão limpos com o emprego desses métodos.
101
Tabela 3 - Medidas descritivas para a variável tempo
102
estudo relativa à variável. Esses critérios devem ser utilizados apenas para eleger
aquelas observações que merecem uma investigação mais cuidadosa. São eles:
Gráfico de caixas;
Valores discrepantes bidimensionais.
103
Gráfico de caixas da variável TEMPO - Amostra Completa
1000
Tempo
500
104
utilizado em um certo tipo de distribuição simétrica. No entanto, pode ser utilizado
com cautela em distribuições não muito assimétricas.
Na figura 4, apresenta-se o gráfico de caixas da variável tempo, omitindo os
valores discrepantes. Note-se que ainda há vários pontos destacados no gráfico.
Esses pontos seriam, em princípio, possíveis valores discrepantes. Contudo, eles
podem ter ocorrido como conseqüência de uma alta assimetria dos dados e, nesse
caso, não seriam valores estranhos à amostra. A decisão final sobre a natureza
desses pontos deve ser tomada por alguém que conheça essa variável e saiba fazer
tal julgamento.
60
50
40
30
20
10
0
105
construído para o estudo da associação entre duas variáveis. É importante notar a
existência de uma forte associação linear positiva.
Regression Plot
Y = 1.76247 + 0.593284X
R-Sq = 0.993
6
Y
0 1 2 3 4 5 6 7 8 9 10
106
A figura 8 ilustra um valor aberrante unidimensional, tanto em X como em Y,
que também é aberrante bidimensional.
Regression Plot
Y = 3.62498 + 0.191149X
R-Sq = 0.182
6
Y
0 5 10 15
Regression Plot
Y = 4.97996 + 0.183785X
R-Sq = 0.026
15
10
Y
0 1 2 3 4 5 6 7 8 9 10
107
Figura 8 - Exemplo de um ponto que é discrepante em Y, não é em X e é
bidimensional
Regression Plot
Y = -1.72308 + 1.34585X
R-Sq = 0.760
25
20
15
Y
10
0 5 10 15
Regression Plot
Y = 2.20055 + 0.453895X
R-Sq = 0.585
6
Y
0 1 2 3 4 5 6 7 8 9 10
108
Figura 10 - Exemplo de um ponto que não é discrepante em X, não é em Y e é
bidimensional
A figura 10, por sua vez, ilustra uma situação em que foi adicionado um ponto
que é aberrante unidimensional em X e em Y, mas não é aberrante bidimensional,
uma vez que sua localização não é inesperada ao se considerar a variação
simultânea de X e Y.
Regression Plot
Y = 1.91167 + 0.563024X
R-Sq = 0.997
12
Y
0 10 20
109
Regression Plot
Y = 1 + 3.59E-17X
R-Sq = 0.000
1.1
1.0
y‘
0.9
0 1 2 3 4 5 6 7 8 9 10
Regression Plot
Y = -3.7E-02 + 0.237352X
R-Sq = 0.515
3
y‘
0 5 10 15
110
Por esse motivo esse método de investigação de pontos discrepantes
bidimensionais é imprescindível em qualquer análise de dados.
111
9
8
7
6
tempo
5
4
3
2
1
0
Conteiner Carga Geral Refrigerado
Tipo
Figura 14 - Gráfico de caixas para o tempo entre as chegadas de três tipos de navios
112
2.2.5.2 - Análise de Variância
1. Definir Ho e H1;
2. Definir um estimador para o parâmetro que está sendo testado, e sua
correspondente distribuição de probabilidades;
3. Supondo Ho verdadeira, calcular a probabilidade de se obter um valor para o
estimador tão ou mais desfavorável à hipótese nula do que o fornecido pela
amostra. Este valor, usualmente denotado por p, é denominado nível descritivo
(ou em inglês, SYDOXH);
4. Fixar um valor para o nível de significância α. Se o nível descritivo for inferior a
este valor, rejeitar a hipótese Ho; caso contrário, aceitá-la.
Visto que devem existir nos dados a identificação de pelo menos um fator
para cada dado amostral, que no caso do exemplo acima é o tipo de navio, pode-se
113
utilizar a ANOVA – Análise de Variância, para testar se, por exemplo, as médias
amostrais dos grupos identificados pelo gráfico de caixas da figura 13 podem ser
consideradas iguais. Alguns requisitos básicos para aplicação da ANOVA a casos
como esses referem-se à igualdade entre variâncias nos conjuntos a serem
testados. Na prática, isso nem sempre acontece, mas Scheffé(1958) admite que se
a razão entre a maior e a menor variância amostral for menor que 5 (cinco), a
ANOVA pode ser aplicada sem maiores problemas.
114
2QH:D\$QDO\VLVRI9DULDQFH
Analysis of Variance on ,17(59$/2B&+(*
Source DF SS MS ) p
C26 8 3.386E+11 4.232E+10 0.000
Error 180 1.192E+12 6.622E+09
Total 188 1.531E+12
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev -+---------+---------+---------+-----
1 23 1,0800 1,09000 (-----*-----)
2 20 2,4000 0,6000 (-*-)
3 25 7,2000 3,4000 (---*---)
Tukey'
s pairwise comparisons
Family error rate = 0.0500
Individual error rate = 0.00197
&ULWLFDOYDOXH
115
2.2.5.3 - Análise de Agrupamentos (&OXVWHUV$QDO\VLV)
A 10000 40000
B 5800 12000
C 3000 15000
D 12000 19000
E 8500 30000
F 4200 8000
G 6000 18500
H 2800 9000
I 7000 25000
116
Visto que o número de contêineres e a área não têm a mesma unidade, cabe
padronizar os dados, subtraindo-se a média e dividindo-se o resultado pelo desvio-
padrão, conforme mostra a tabela 5.
A 1,09 1,94
B -0,25 -0,73
C -1,14 -0,44
D 1,73 -0,06
E 0,61 0,99
F -0,76 -1,11
G -0,19 -0,11
H -1,21 -1,01
I 0,13 0,51
117
Tabela 6 - Distâncias euclidianas entre os nove terminais
Terminais A B C D E F G H
B 2,99
C 3,27 0,94
Terminais A B C D E G FH
B 2,99
C 3,27 0,94
118
Observação: As distâncias entre os terminais não agrupados permanecem as
mesmas. A distância FH e o terminal A, por exemplo, é igual à média entre as
distâncias F-A e H-A, mostradas na tabela 6.
B 2,99
C 3,27 0,94
Segunda Redução
Terminais/grupos A C D E GB FH
C 3,27
D 2,10 2,90
119
Terceira Redução
Terminais/grupos A D E GB FHC
D 2,10
E 1,07 1,53
Quarta Redução
Terminais/grupos A D GB FHC
D 2,10
GB 2,70 2,00
Quinta Redução
Terminais/grupos A D FHCGB
D 2,10
grupos (continuação)
Sexta Redução
Terminais/grupos D FHCGB
FHCGB 2,45
120
Sétima e Última Redução
Terminais/grupos FHCGB
IEAD
121
Além dos clássicos testes de aderência, apresenta-se também um método
gráfico.
Nos problemas de fila e de simulação é necessário caracterizar-se os
processos de chegada e atendimento dos elementos, por meio da identificação das
distribuições de probabilidades que regem esse processos. Para que isso seja
possível, deve-se proceder inicialmente a uma coleta de dados sobre os intervalos
de tempo entre as chegadas consecutivas e os tempos de atendimento em cada
posto. Algumas estatísticas devem ser retiradas dos conjuntos de dados, bem como
deve-se proceder a uma limpeza dos dados, conforme discutido nas seções
anteriores.
Concluída a etapa de agrupamento, em que grupos foram identificados e
separados ou amostras foram reunidas, pode-se elaborar para cada conjunto uma
tabela de freqüências acumuladas para as distribuições observadas.
Para a aplicação de simulação é interessante, mas não necessário, que as
distribuições observadas tenham um modelo teórico associado, como por exemplo
uma exponencial, erlang, uniforme, normal, etc. Deve-se, portanto, proceder a um
teste de aderência para verificar qual modelo teórico se adapta à distribuição
observada.
O primeiro problema a ser enfrentado ao se realizar uma análise inferencial é
a identificação de uma distribuição de probabilidades que possa vir a modelar os
dados.
Utiliza-se como exemplo as informações sobre o intervalo de tempo entre as
chegadas de navios dos tipos contêiner, carga geral e refrigerado a um porto, ao
longo de um ano. Para a validade das técnicas a serem apresentadas, supomos que
exista independência entre esses intervalos de tempo.
122
2.2.6.1 - Investigação gráfica
O primeiro passo para a seleção do modelo probabilístico é a visualização
dos dados. Nas figuras 15, 16 e 17, apresentam-se os histogramas relativos aos
intervalos de tempo entre as chegadas dos três tipos de navios. Podem-se comparar
as formas desses histogramas com as distribuições teóricas conhecidas, que
apresenta e discute distribuições de probabilidades. À primeira vista, tem-se que:
Contêiner (figura 15): distribuição fortemente assimétrica (descarta-se a normal e
a uniforme) e seu histograma é semelhante ao das distribuições exponencial,
Weibull ou gama;
Carga Geral (figura 16) - distribuição simétrica, eventualmente normal;
Refrigerado (figura 17) - não fosse a altura da segunda coluna, poderia ser uma
distribuição próxima à uniforme.
0.45
0.40
0.35
0.30
Density
0.25
0.20
0.15
0.10
0.05
0.00
0 1 2 3 4 5 6 7 8
tempo
123
2
Density
1
0.8
0.7
0.6
0.5
Density
0.4
0.3
0.2
0.1
0.0
6 7 8 9
tempo
124
2.2.6.2 - Gráfico de probabilidades
1 0,03257 11 0,94661
2 0,09560 12 1,05534
3 0,14279 13 1,26731
4 0,20426 14 1,31419
5 0,21507 15 1,31554
6 0,25680 16 1,62219
7 0,61596 17 1,98849
8 0,68740 18 2,28708
9 0,76079 19 2,48113
10 0,77090 20 3,81403
)(
− L − 0.5
)([( ) = 1− H 1,094
= .
20
Isolando [* + vem que:
L − 0.5
ln1 −
20
[, = − ,
1,094
126
Tabela 10 - Determinação da amostra esperada sob a hipótese de distribuição
exponencial com média 1,094
127
By C5.
Set c4
1( 1 : 20 / 1 )1
End.
Let c6 = (c4-0,5)/20
Let c7 = -(LOGE(1-c6))/1,094
3.5
3.0
Dados previstos
2.5
2.0
1.5
1.0
0.5
0.0
0 1 2 3 4
Dados observados
128
o que acontece. Parece, então, razoável a hipótese dos dados terem sido gerados
através de uma distribuição exponencial.
Na figura 20 tem-se um gráfico de probabilidades normal para o histograma
de navios de carga geral, mostrado na figura 19. Note-se que a menos de um valor
muito pequeno, os pontos têm um comportamento compatível com a hipótese de
normalidade dos dados. Esse valor pequeno pode ser uma observação discrepante.
Mean: 1.24348
Fail. Rate: 0.804194
99
98
Percent
97
96
95
93
90
80
70
60
50
30
10
0 1 2 3 4 5 6 7
Data
129
Ele também pode ser obtido, via Menu, através da seguinte seqüência:
GRAPH - PROBABILITY PLOT.
Mean: 2.42057
99
StDev: 0.236075
95
90
80
70
Percent
60
50
40
30
20
10
Data
99 99
Mean: 7.30497 Log Base 10
StDev: 0.963221 Mean: 0.85991
95 95 StDev: 0.05738
90 90 Log Base e
Mean: 1.98002
80 80 StDev: 0.13213
70 70
Percent
60 60
Percent
50 50
40 40
30 30
20 20
10 10
5 5
1 1
5 6 7 8 9 10 4.8 5.0 5.2 5.4 5.6 5.8 6.0 6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6 7.8 8.0 8.2 8.4 8.6 8.89.09.29.49.69.810.0
Data Data
Weibull Probability Plot for tempo Exponential Probability Plot for tempo
99
Shape: 8.63310 Mean: 7.30497
95
90 Scale: 7.72978 98 Fail. Rate: 0.136893
80
97
70
60 96
50 95
40
93
Percent
Percent
30
90
20
10 80
70
5
60
3 50
2 30
10
1
3.8 4.0 4.2 4.4 4.6 4.8 5.0 5.2 5.4 5.6 5.8 6.0 6.2 6.4 6.6 6.8 7.0 7.2 7.47.67.8 8.08.28.48.68.89.09.29.49.69.8
10.0 0 10 20 30 40
Data Data
130
Na figura 22 apresentam-se os gráficos de probabilidades gerados pelo
MINITAB para o histograma referente aos navios refrigerados, mostrados na figura
22. Note-se que em nenhum deles tem-se um comportamento dos pontos
compatível com a distribuição de probabilidades assumida.
8
Valor Esperado
6 7 8 9
Valor Observado
131
2.2.6.3 - Testes de aderência
A -Teste de Kolmogorov-Smirnov
' = sup
- ) [ − 6 [ ,
132
Na tabela 12, apresenta-se a seqüência de comandos do MINITAB, utilizada
para testar a hipótese de que os dados sobre os intervalos de tempo entre as
chegadas de navios do tipo contêiner seguem uma distribuição exponencial.
133
Tabela 12 - Comandos para a determinação da estatística do teste de Kolmogorov-
Smirnov para a distribuição exponencial
B - Teste do Qui-Quadrado
Ok − Tk
Ek =
Tk
K
E = ∑ Ek2
K =1
135
maior que Ecrítico, rejeita-se a hipótese de que a amostra observada provém de
uma população com a distribuição teórica adotada.
observados
136
Assumindo α igual a 5%, e k-1-n igual a 6, o valor Ecrítico é de 12.589. Como
E é menor que Ecritico, aceita-se que a distribuição normal adere aos dados
observados.
137