Você está na página 1de 18

A Review and Evaluation of Logistics Metrics

Introdução

Em razão de pressões externas, muitas empresas estão modificando sua cadeia de


suprimentos. Para gerir propriamente essa com outras estruturas mais avançadas, a alta
gerência precisa possuir métricas de desempenho precisas e adaptáveis ao mesmo
tempo.

Os autores afirmam que o problema não está nas métricas de desempenho já existentes e
sim na forma utilizada pelas empresas. É necessária a reavaliação (ou até mesmo a
análise pela primeira vez) do sistema de medida de desempenho.

O artigo em questão leva em consideração um dos componentes do processo de


avaliação: métricas individuais. Para isso, destaca três objetivos: estabelecer critérios
úteis que podem ser aplicados para avaliar medidas de desempenho logístico; identificar
algum trade-off existente na seleção de medidas de desempenho; como também
classificar e criticar medidas de desempenho existentes de um processo.

Os autores afirmam que a principal motivação para analisar as métricas individualmente


é que elas representam blocos de construção de um sistema completo de gerenciamento.
Se existe algum problema nos blocos, independente de quão bom o design desse sistema
seja, os sinais enviados para dos tomadores de decisão serão imprecisos.

IMAGEM DE UMA PONTE SENDO SUPORTADA PELAS MÉTRICAS DE


DESEMPENHO. SE EXISTE UM PROBLEMA NELAS, TODOS OS CARROS CAEM.

Um exemplo trazido pelo autor sobre o uso incorreto de uma métrica logística de
desempenho é o seguinte: Uma manufatura de produtos de saúde usa a métrica para
avaliar o serviço do cliente para seus distribuidores. A métrica “porcentagem de envio
dentro do tempo” é reportada a cada quatro meses e tem um papel fundamental no plano
de compensação e bônus do gerente. Entretanto, a métrica considera que o envio foi
realizado dentro do tempo se e somente se a carga segue a rota no mesmo mês que o
pedido é realizado. Diante deste fato, podemos perceber que esta métrica é inconsistente
com o ponto de vista do cliente.

Um segundo exemplo trazido pelo autor é de um atacadista que usa os custos de


distribuição das operações do armazém para tomar decisões estratégicas e para avaliar a
performance de gerentes logísticas de grupos específicos de produtos. Gerentes são
recompensados por atingir menores custos logísticos por cada item e esses custos são
usados para ajudar no planejamento do canal de marketing e distribuição. Entretanto, a
métrica utilizada “custo de item distribuído” é calculada pelo custo total de distribuição
(trabalhadores, custo de armazenagem, custo de transporte, entre outros) dividido pelo
número de unidades de cada grupo de produto processado. Sem nenhuma outra base,
como densidade, fragilidade, valor ou nível de demanda.
Esses exemplos ilustram a importância de examinar as métricas individuais no qual são
entradas para um sistema de mensuração maior.

O artigo não desenvolve novas métricas de desempenho. Entretanto, apresenta um


conjunto de ferramentas no qual os gerentes logísticos podem fazer uso para avaliar e
selecionar métricas de desempenho individuais para uso num sistema de medida
desempenho maior.

Critério de avaliação

A seleção de métricas de desempenho depende do usuário final, da estrutura


organizacional, do ambiente de negócio atual, entre outros diversos fatores. Entretanto,
algumas características gerais podem ser identificadas para auxiliar no desenvolvimento
de boas métricas de desempenho.

Alguns pesquisadores trazem diversos critérios que podem ajudar na avaliação de


métricas de desempenho.

Como podemos perceber na tabela, existem diversas compatibilidades entre esses


estudos quanto à importância de certas características. Entretanto, nenhum outro estudo
anteriormente parece capturar todos os aspectos. Além disso, alguns não consideram as
implicações comportamentais e todos eles desconsideram um trade-off inerente que
existe entre os critérios, assumindo independência entre esses.

Os autores então sugerem oito critérios que captura de maneira mais abrangente as
características essenciais das métricas de desempenho individual e identifica e examina
suas interações.
Validade

Uma métrica é válida se ela reflete a real atividade sendo executada e controla qualquer
fato exógeno que esteja fora do controle do gerente de processo. Por exemplo, se um
departamento de tráfego envia produtos em uma ampla variedade de comprimentos de
caminho, usando vários modos e respondendo a prazos de entrega muito diferentes,
medir a produtividade como custo por tonelada-milha não é particularmente válido. Por
exemplo, qualquer mudança no padrão de pedidos para modais menores e mais
sensíveis ao tempo causará um aumento no custo de tonelada-milha, fazendo com que o
gerente fique mal visto, independentemente do desempenho real do trabalho. Segmentar
o custo por tonelada-milha de acordo com o comprimento do transporte, o nível de
serviço ou outras características tornaria as métricas mais válidas, pois esses fatores
adicionais têm um efeito significativo sobre os custos de transporte.

Robustez

Uma métrica é robusta se for amplamente aceita, interpretada de forma semelhante por
diferentes usuários e puder ser usada para comparações ao longo do tempo, locais e
organizações. Usando o mesmo exemplo, o custo por tonelada-milha, embora não seja
uma métrica válida, é robusta porque (1) as toneladas transportadas e as milhas
percorridas são fáceis de coletar, (2) a tonelada-milha é amplamente aceita no setor de
transporte e (3) é difícil interpretar erroneamente uma tonelada-milha. Um exemplo de
medida que não é muito robusta é o custo de mão de obra direta da logística, geralmente
usado como medida de insumo. Ele não é comparável entre as empresas, pois a
definição de mão de obra direta difere muito entre as empresas.

Utilidade
Uma métrica é útil se ela pode ser facilmente entendida pelo tomador de decisão e
sugere um curso de ação ou direção para ser tomada. Por exemplo, uma métrica que
rastreia o uso de transporte rápido, como a porcentagem de remessas que usam
transporte noturno, é útil porque é facilmente entendida e dar uma direção ao gestor, isto
é, toma conta dos modais de transportes usados. Por outro lado, uma métrica composta
que combina vários fatores em um único índice não é tão útil para um gerente, pois o
método pelo qual o índice foi calculado pode ser considerado uma “caixa preta” e o
índice, como um valor abstrato, não sugere uma ação específica a ser tomada.

Integração

Uma métrica é integrativa quando incorpora todos os principais componentes e aspectos


do processo que está sendo medido e promove a coordenação entre funções, divisões ou
empresas na cadeia de suprimentos. O principal objetivo desse critério é promover a
coordenação entre os participantes envolvidos no processo. Por exemplo, em uma
fábrica de montagem de automóveis, descobriu-se que, se os carros acabados fossem
sequenciados para produção de acordo com a ordem de entrega dos revendedores, os
custos de distribuição seriam significativamente reduzidos. No entanto, isso exigia que
o gerente de produção modificasse ligeiramente suas operações e, como todas as suas
métricas de desempenho eram seladas dentro da planta, ele não tinha incentivo para
mudar. Assim, perdeu-se uma oportunidade de reduzir os custos gerais. Se uma métrica
integradora melhor, como o custo total do carro até a entrega tivesse sido usada, o
gerente de produção teria sido incentivado a fazer essas mudanças.

Economia

Uma métrica é econômica se o benefício de rastreá-la supera o custo de coletá-la,


processá-la e relatá-la. Essa é uma decisão mais criteriosa do que uma comparação
estrita de custo-benefício, de modo que o critério de economia deve ser usado para
selecionar possíveis métricas, e não para decidir se qualquer métrica deve ser usada. Por
exemplo, um sistema de controle de estoque capta o tempo gasto no estoque para cada
item individual em uma fábrica de lápis provavelmente não é tão econômico quanto
uma métrica que informa os valores agregados em dólares do estoque.

Compatibilidade

Uma métrica é compatível com a coleta de dados existente, os sistemas de informação e


os sistemas de controle de qualidade. A medição do desempenho pontual em termos de
horas adiantadas ou atrasadas não é compatível com um sistema que só reconhece as
entregas em intervalos semanais. Por exemplo, medir o desempenho pontual em termos
de horas adiantadas ou atrasadas não é compatível com um sistema que reconhece
apenas as entregas em intervalos semanais. Embora a compatibilidade tenha alguma
sobreposição com o critério econômico, no sentido de que qualquer sistema pode ser
compatibilizado com uma métrica proposta, com o tempo e o dinheiro necessários, eles
não são a mesma coisa. Uma métrica que é econômica em termos de coleta e relatório
de dados pode nem sempre ser compatível com o fluxo de informações existente.
Nível de detalhe

Uma métrica tem o nível correto de detalhamento se capturar e relatar os dados em um


nível de agregação ou granularidade que seja útil para o tomador de decisões. Por
exemplo, uma medida de nível de inventário que é feita mensalmente pode ser
insuficientemente definida para termos de valor que exijam monitoramento diário, ao
passo que um rastreamento semanal dos níveis de inventário dos estoques de carvão em
uma usina de energia durante operações normais seria excessivamente detalhado. O
nível de detalhe depende muito do usuário. Por exemplo, um gerente de armazém pode
rastrear a produtividade da equipe, um gerente distrital pode transformá-la em
produtividade para armazéns regionais e um gerente nacional provavelmente
combinaria as medidas do armazém em medidas funcionais.

Solidez comportamental

Uma métrica que seja comportalmente sólida desencoraja qualquer ação


contraproducente ou jogo de azar por parte das pessoas ou organizações que estão sendo
medidas. Embora sempre se espere que uma medida alinhe as ações das pessoas com os
objetivos gerais da organização, em muitos casos ela pode fornecer incentivos para que
se faça o contrário. Por exemplo, a métrica de desempenho on-line usada pelo fabricante
de produtos de saúde na introdução cria um incentivo para manipular o padrão de
chegada de pedidos de modo a maximizar a quantidade de "lead time" para o
departamento de distribuição. Para o cliente e para a organização, no entanto, isso é
contraproducente, pois o tempo de ciclo do pedido aumentará, enquanto o gerente do
departamento não será penalizado.
Na verdade, o gerente será recompensado, pois, no papel, a porcentagem de
"pontualidade" aumentará! Fisher se refere a esse tipo de comportamento como
"atividades disfuncionais", pois as pessoas cujas ações estão sendo medidas estão
agindo em seu próprio interesse e estão sendo recompensadas pela organização maior
quando, na verdade, suas ações prejudicam o desempenho geral da organização. As
métricas que não são suficientemente integradas, ou seja, que incluem apenas as ações
de uma única função, não serão comportamentalmente sólidas.
Além disso, a forma como uma métrica é relatada pode influenciar o
comportamento. Por exemplo, uma taxa de preenchimento de itens (IFR) pode ser
relatada como a porcentagem de itens preenchidos no prazo ou como as partes por
milhão (PPM) que foram preenchidas incorretamente. Assim, por exemplo, se 99.000
itens de linha foram preenchidos de 100.000 solicitados, a taxa de preenchimento seria
apresentada como 99% e 10.000 PPM, respectivamente. Embora sejam representações
igualmente válidas dos mesmos eventos, a última escala acentua o problema de falta de
estoque. A apresentação de relatórios como porcentagem torna-se menos útil à medida
que a organização se aproxima de níveis mais altos de desempenho. As pessoas reagirão
mais à escala PPM do que a uma porcentagem, pois a diferença entre a falta de 1.000 e
1.100 itens de linha mudará a primeira em apenas 0,1%, mas a escala PPM aumentará
de 1.000 para 11.000. Assim, os relatórios em PPM podem ser mais adequados do ponto
de vista comportamental.
Trade-off entre critérios

Apesar de desejarmos buscar desenvolver métricas que se destaque em cada um dos oito
critérios, isso não é praticamente possível. Devido à existência de compensação entre os
diferentes critérios de avaliação de uma métrica de desempenho.

Mais especificamente, os quatro primeiros critérios (validade, robustez, utilidade, e


integração) tendem a ser muito interconectados enquanto que os quatro últimos critérios
(economia, compatibilidade, nível de detalhe, e solidez comportamental) tendem a ser
mais independentes.

Na Figura 1 é representando o trade-off entre os critérios. As linhas pretas representam


os trade-offs principais (integração versus utilidade e robustez versus validade)
enquanto que as linhas cinzas representam um trade-off secundário.

O trade-off entre validade e robustez implica que quanto mais aspectos de situações
específicas de um processo são inclusos em uma métrica, menos comparável ela se
torna. Customizar uma métrica para particularidades de um processo ou produto torna
ela muito precisa para aquela situação, mas consequentemente torna cada vez mais
distante de uma utilização para outras situações, até mesmo semelhantes. De forma
contrária, uma métrica designada especificamente para comparações como
benchmarking precisa ser suficientemente gerais, menos específicas, para abrir ainda
mais a aplicabilidade e deve incorporar aspectos que são compartilhados por diferentes
funções ou departamentos. O trade-off é então entre ser mais geral ou mais específico.

O trade-off entre integração e utilidade sugere que o quão mais uma métrica promove
coordenação além de diferentes funções ou firmas, menos direção ela vai fornecer para
um gestor de firma ou função particular. Por exemplo, uma métrica de time como valor
do inventário em todas as suas formas (seja matéria-prima, work in process (WIP) ou
produtos acabados) passa por toda a cadeia de suprimentos de fornecedor para
distribuidor. Enquanto esta métrica é de fato integrativa, ela perde um pouco de sua
utilidade para os gerentes intermediários, que são responsáveis de apenas uma parte
deste processos porque isso inclui muito mais do que eles podem controlar diretamente.
De maneira distinta, o monitoramento do valor de inventário de cada uma das partes
separadamente vai aumentar a utilidade da métrica de inventário para cada gestor, mas
tipicamente irá desencorajar coordenação entre as funções. A métrica mais útil para um
gestor interno é uma que foca somente na sua função, sem nenhum fator adicional. O
trade-off é então entre o escopo da métrica e a amplitude de controle.

Resolver esses dois trade-offs pode ser muito dificultoso, especialmente no


desenvolvimento de métricas de benchmarking para cadeia de suprimentos.

O trade-off secundário são menos restritivos. Utilidade se balanceia com validade no


sentido em que uma métrica que captura todos os detalhes de um processo (muito
válido) tende a se tornar mais complexo e assim mais difícil de entender (menos útil).
Por exemplo, medidas de Total Factor Productivity (TFP) pode melhor captar a
produtividade geral de uma organização. Similarmente, o recentemente desenvolvido
método de Data Envelopment Analysis (DEA), no qual precisamente caracteriza a
eficiência de múltiplos processos, não é amplamente usado num nível organizacional
por conta do fato de que sua abordagem multi-dimensional não é intuitiva para muitos
gestores que precisam tomar decisões baseados no valor DEA. Não é dizendo que uma
metodologia é pior que a outra, somente que as métricas trocam um pouco da utilidade
pela validade ou o contrário.

O resultado natural é que nenhuma métrica atinja todas as características desejadas. Os


gerentes precisam tomar certas decisões que irão determinar quais métricas individuais
podem ser combinadas para compor todo o sistema de medida.

Taxonomia e crítica das métricas de desempenho de processos

Atividades de negócio são tipicamente modeladas como processos transformadores


convertendo entradas em saídas através de algum trabalho aplicado. O maior objetivo
do gerente é maximizar o output (em termo de quantidade, qualidade ou ambos)
enquanto minimiza o input consumido.

A função transporte, por exemplo, é normalmente modelada na conversão de trabalho


manual, equipamento e outros recursos em medidas de distância percorrida, onde o
gerente de transporte tem como objetivo fazer sua equipe percorrer a distância
necessária com o menor custo possível.

Três formas primárias de medir pode ser usada para capturar o desempenho de um
processo transformador: utilização, produtividade e eficácia.

A utilização é uma medida do uso de insumos e geralmente é apresentada como uma


proporção ou porcentagem da quantidade real de um insumo usado em relação a algum
valor padrão.

A produtividade é uma medida de eficiência transformacional e, normalmente, é


relatada como a relação entre os resultados reais produzidos e os insumos reais
consumidos.
A eficácia é uma medida da qualidade do resultado do processo e, normalmente, é
relatada como uma razão entre o resultado do processo e um resultado normal (padrões
determinado ou competitivos).

A figura ilustra como, individualmente, cada dimensão captura um aspecto único do


processo enquanto coletivamente, capturam o desempenho geral.
Medidas de Utilização

As métricas de utilização rastreiam o uso de recursos de entrada em um processo. Para a


logística, os insumos podem ser caracterizados como: financeiros, ativos físicos ou
estoque. Da mesma forma, as métricas de utilização podem ser categorizadas quanto à
(1) medidas de gastos, (2) medidas de recursos não financeiros ou (3) medidas de
inventário.

Medidas de gastos:

Capturam o quanto é gasto e, portanto, o custo de todo o processo logístico ou de


qualquer parte dele. Embora existam muitos métodos para relatar os gastos no processo
de logística, todos seguem o mesmo padrão de monitoramento de gastos em um
determinado período de tempo, comparando-os com alguns valores normais e
analisando qualquer variação dessas normas. Alguns exemplos de métricas de gastos
incluem: custos de distribuição como porcentagem das vendas, variação dos custos de
transporte em relação ao orçamento. As diferenças entre as várias métricas estão na
seleção de (1) escopo da medida e o (2) valor da norma a ser usado para comparação.
Cada uma dessas seleções requer a realização de uma das duas principais trocas
discutidas anteriormente.

A seleção do escopo determina quanto do processo logístico está incluído e varia de


uma atividade única e específica a uma cadeia de suprimentos inteira. Essa é uma troca
entre ser integrativa ou útil. Ter um escopo mais amplo é integrador, pois mais
atividades são incluídas, mas a utilidade para os gerentes de funções intermediárias é
reduzida, pois são incluídas atividades fora de seu controle.

A seleção de um valor de norma determina com que o input real deve ser comparado, e
normalmente, é um dos três tipos: histórico, base ou padrão/orçamento. A comparação
com valores históricos indica tendências ao longo do tempo, mas não é fácil de ser
comparada ao longe das empresas ou fábricas, então não é muito robusta. A comparação
com valores de base, como o custo total de distribuição ou a receita total de vendas,
aumenta a robustez da métrica (as comparações podem ser feitas em diferentes
períodos, fábricas ou empresas), mas dilui a validade e utilidade pela introdução de
valores não controláveis pelo gerente de processo. Por fim, a comparação com um
orçamento é mais uma medida de controle do que de desempenho, pois rastreia a adesão
aos planos e não a excelência gerencial.

Em resumo, as duas principais compensações são feitas ao selecionar uma medida


específica de gastos de utilização. A decisão do escopo troca a integração pela utilidade
(para os gerentes dentro do processo), enquanto a seleção do valor normativo troca a
robustez (comparabilidade) pela validade e utilidade.

Medidas de recursos não financeiros:

As medidas de recursos não financeiros capturam ativos duráveis e de longa duração,


como equipamentos de carregamento, frotas de caminhões e instalações de distribuição.
Há duas maneiras gerais de medir o uso de recursos não financeiros: índices de
utilização e custo amortizados.

Um índice de utilização compara a quantidade do ativo realmente consumida com a


quantidade disponível, como horas de equipamentos usadas divididas pelas horas
disponíveis ou portas de doca usadas por dia divididas pelas portas disponíveis. A
principal desvantagem dessas medidas é o fato de serem todas específicas para cada
função ou facilidade. Essas taxas de uso são comparáveis ao longo do tempo para a
mesma instalação, mas geralmente não são comparáveis entre empresas ou funções.

O segundo método é amortizar os custos (pela quantidade consumida ou pela


quantidade disponível) e incluir esse valor em dólares. A maneira mais simples e mais
comum de distribuir o custo inicial ao longo da vida útil esperada do item é com o fato
de valor presente da série uniforme. A amortização pelo que é “realmente consumido”
captura com mais precisão a eficiência do processo, mas ignora os custos adicionais
incorridos por decisões gerenciais ruins, como a compra da capacidade excessiva. A
amortização pelo que está “disponível” leva em conta todos os insumos duráveis
acessíveis para uso pelos gerentes de processo.

Em resumo, as taxas de uso físico não válidas e úteis em nível operacional, mas não são
expansíveis (integrativas) nem comparáveis (robustas). Por serem tão limitados, não é
necessário tomar decisões de troca. A amortização dos custos dos insumos duráveis
transforma o ativo em uma medida de gastos e, portanto, essas compensações se
aplicam. Além disso, como tanto a vida útil do ativo quanto a taxa de juros podem ser
selecionadas arbitrariamente, há a possibilidade de jogos, de modo que as métricas
podem não ser totalmente sólidas do ponto de vista comportamental.

Medidas de inventário:

Embora existam inúmeras métricas para medir o estoque, elas podem ser divididas em
duas categorias gerais: métricas estáticas e métricas de fluxo. As métricas estáticas
capturam o nível do estoque (expresso em termos físicos, financeiros ou outros) em um
ponto específico no tempo, enquanto as métricas de fluxo capturam a velocidade do
estoque à medida que ele flui pelo sistema em um período de tempo. As medidas
estáticas de estoque podem ser expressas como uma simples contagem de objetos ou
como um valor ponderado usando volume, peso, valor financeiro ou outros atributos. Os
relatórios em unidades físicas permitem comparações com os níveis históricos ou de
meta de cada produto para indicar tendências. Ponderação por valor financeiro também
permite a comparação com outros usos de capital. Medidas de inventário não são nem
válidas e nem úteis, visto que capturam apenas um ponto no tempo. Elas também não
são robustas, desde que um valor absoluto não pode ser facilmente comparado com
outras companhias ou indústrias. De maneira geral, essas métricas não são
recomendadas para medir processos logísticos.

Por outro lado, as métricas de fluxo de estoque são bem adequadas para a medição do
processo logístico. As duas métricas de fluxo de estoque mais comuns são o índice de
rotatividade de estoque (ITR) e os dias de fornecimento (DOS). O ITR capta quantas
vezes o estoque foi substituído ou "virado" durante um período de tempo, enquanto o
DOS mede o nível médio de estoque em termos de dias sem esgotamento. As relações
gerais são:

ITR = (Valor das mercadorias vendidas no período) / (Valor médio do estoque em


mãos)

DOS = (dias no período) * (valor médio do estoque em mãos) / (valor dos produtos
vendidos no período)

Como mostrado acima, o DOS é apenas o inverso do ITR multiplicado pelo número de
dias no período para obter as unidades corretas. As duas métricas de fluxo de estoque
são intercambiáveis. Embora essas métricas possam ser expressas em termos financeiros
ou físicos, elas quase sempre são calculadas usando dados financeiros, pois esses dados
estão prontamente disponíveis. Um ITR mais alto (DOS mais baixo) indica que o
estoque está fluindo pelo sistema mais rapidamente e, portanto, os níveis médios de
estoque são mais baixos.

A decisão de selecionar métricas de fluxo de estoque envolve novamente uma


compensação entre ser integrador e útil. A inclusão de mais atividades, funções e
empresas na métrica aumenta a coordenação entre os participantes (integrativa), mas a
métrica perde o significado para os gerentes internos [útil]. Ao padronizar o valor do
estoque pela quantidade vendida, a métrica aumenta sua robustez, já que agora é mais
comparável ao longo do tempo, das fábricas e das empresas.

RESUMO DAS MÉTRICAS DE UTILIZAÇÃO

Os principais fatores a serem considerados ao avaliar as métricas de utilização são a


definição do escopo e o usuário principal da métrica. A questão do escopo determina a
quantidade de entradas do processo a serem incluídas; quanto mais amplo for o escopo
(seja em estoque, dólares ou instalações físicas), maior será a coordenação entre os
jogadores. No entanto, isso diminuirá a quantidade de controle que cada jogador tem. A
questão do usuário principal determina a especificidade da métrica. Se ela for usada
como referência externa, devem ser usadas as definições mais gerais das atividades,
enquanto uma métrica interna pode ser mais específica. Em suma, a seleção da métrica
de utilização é uma questão de fazer as duas principais compensações: integração versus
utilidade e robustez versus validade.

Métricas de Produtividade

As medidas de produtividade capturam a eficiência de um processo e são definidas


como a razão entre a quantidade de produtos reais produzidos e a quantidade de
insumos reais consumidos. São discutidos três tipos de medidas de produtividade:
medidas parciais, que comparam um subconjunto de produtos a um subconjunto de
insumos; produtividade total dos fatores (TFP), que compara todos os insumos e
produtos relevantes; e medidas de produtividade financeira, que convertem todos os
fatores em valores financeiros antes de comparar insumos e produtos.

Medidas de produtividade parcial:

As medidas de produtividade parcial capturam a quantidade de mudança de


produtividade que pode ser considerada por um único fator ou um subconjunto de
fatores, mantendo todos os outros constantes. Os índices de produtividade de fator único
(SFP) são as métricas de produtividade usadas com mais frequência, com algumas das
mais comuns mostradas na Tabela 4. Embora exista um número quase ilimitado de
possíveis índices SFP, a estrutura geral dessas medidas é muito genérica, especialmente
a seleção dos produtos e insumos usados.

O resultado usado em uma razão SFP é normalmente o gerador de custos da função que
esta sendo medida. Por exemplo, o número de pedidos de compras (POs) pode ser o
principal gerador de custos para a função de recebimento de pedidos, enquanto o peso, o
volume e a distância de cada remessa têm pouco efeito sobre seus custos. Esses fatores,
entretanto, podem ser os geradores de custos para a função de transporte que, por sua
vez, não é influenciada pelo número de pedidos. O insumo usado em um índice SFP
baseia-se principalmente no que é controlável em uma determinada função,
normalmente o recurso de insumo. Isso geralmente é expresso em termos de custos
(geralmente variáveis), horas de mão de obra (geralmente apenas direta) ou horas de
máquina. A maioria dos índices SFP, portanto, é composta de direcionadores de custos
divididos pelo recurso de entrada mais controlável, como pedidos processados por
homem-hora para recebimento de pedidos e toneladas-milhas transportadas por custo
para transporte.

Essa estrutura comum fornece uma visão dos principais pontos fortes e limitações de
todos os índices SFP. Os pontos fortes são o fato de serem fáceis de obter, prontamente
compreendidos por profissionais que não são da área de logística e muito comparáveis
ao longo do tempo e das organizações. Assim, eles são normalmente muito econômicos,
compatíveis, úteis e robustos. Todos esses pontos fortes decorrem da capacidade de
definir facilmente o principal gerador de custos da atividade.

Essa necessidade de uma única forma de resultado (direcionador de custos) também é a


fonte dos principais pontos fracos dos índices SFP, especialmente para funções ou
processos mais complexos. Para todas as atividades, exceto as menores, uma única
definição de resultado não é adequada. Por exemplo, em um CD, a saída pode ser
expressa em termos de veículos, volume, peso, paletes, SKUs ou alguma outra forma de
unidades manuseadas. Nenhuma expressão única pode capturar totalmente a natureza da
saída produzida. No entanto, é possível estimar algum tipo de unidade "equivalente" de
modo que cinco paletes de produto equivalem a uma tonelada de material solto, são
difíceis de estimar e limitam a comparabilidade. Por terem um foco tão interno e
restrito, os índices SFP não são interativos e são mais adequados para a tomada de
decisões operacionais em nível funcional. Como medidas parciais, sua validade também
é limitada, pois apenas um aspecto da atividade pode ser considerado por vez.

Medição da produtividade total dos fatores:

A produtividade total dos fatores (PTF) é definida como uma medida da produção total
produzida por unidade de insumo, em que os vários insumos e produtos são combinados
por meio de índices agregados ou estimados usando funções de custo ou produção
especificadas. Infelizmente, a TFP é difícil de calcular, bem como de entender e
interpretar.

Houve pouquíssimos usos da PTF para medir o desempenho no nível da empresa ou da


função ou para a tomada de decisões gerenciais. O principal ponto forte das métricas de
PTF é seu nível de validade devido à captura de todos os efeitos de fatores relevantes. O
preço que se paga por isso, no entanto, é uma robustez muito baixa, pois são difíceis de
comparar e dependem muito da metodologia utilizada. As métricas de PTF também não
são particularmente econômicas, compatíveis, integradoras ou úteis para uso em nível
gerencial. Embora sejam bastante apropriadas para uso em análises econômicas de larga
escala, as métricas de PTF não parecem particularmente adequadas para uso como
métricas de desempenho gerencial.

Medição da produtividade financeira:

O terceiro tipo de métrica de produtividade é a financeira, que usa valores monetários


tanto para as entradas quanto para as saídas. A principal métrica de produtividade
financeira usada é o retorno sobre o investimento (ROI), geralmente definido como
receitas de saída menos custos de entrada divididos pelos ativos atuais e fixos. Essas
medidas são projetadas para centros de lucro ou de investimento, respectivamente, de
modo que qualquer uso delas para a logística exige a tradução da produção logística
física em um valor financeiro, geralmente por meio de algum tipo de preço de
transferência.

Os problemas com o ROI já foram documentados. O modelo de ROI pode ser enganoso,
pois muitos dos componentes estão sujeitos à localização arbitrária de custos indiretos e
podem diferir significativamente de empresa para empresa, o que o torna menos
robusto. Além disso, embora mostre as relações entre os fatores financeiros, o ROI
ignora o próprio processo logístico. O uso do ROI como uma medida de desempenho:

1. é propenso à inflação, o que favorecerá investimentos mais antigos, uma vez que o
capital original é subestimado e a renda atual é superestimada,

2. permite a aparência de maior desempenho por meio de "novos acordos de


financiamento e propriedade" em vez de melhor gerenciamento de ativos, e

3. fornece o incentivo para aumentar os ganhos de curto prazo às custas de pesquisa e


desenvolvimento, distribuição ou nível de serviço.

As métricas de produtividade financeira são facilmente compreendidas pelos gerentes e,


portanto, são amplamente utilizadas. No entanto, como já foi dito acima, elas estão
sujeitas a muitas distorções e, portanto, não são tão válidas ou tão úteis quanto a maioria
dos gerentes pensa. As métricas, como o ROI, podem se tornar muito integrativa
simplesmente aumentando o escopo. Como as informações financeiras já são coletadas
para fins de contabilidade financeira, essas métricas são econômicas e compatíveis. No
entanto, há muito potencial para jogos na seleção de como os ativos e o estoque são
avaliados, de modo que as métricas não são muito sólidas do ponto de vista
comportamental. Além disso, a arbitrariedade na alocação dos custos indiretos (uma
porcentagem substancial dos custos) limita sua robustez.

Resumo das métricas de produtividade:

As métricas de produtividade são algumas das formas mais intuitivas e comuns de


métricas utilizadas. A ideia de comparar os resultados produzidos com as entradas
consumidas é muito atraente. Na prática, no entanto, é muito difícil isolar vários
resultados ou determinar como eles podem ser combinados. Assim, os principais
problemas com as métricas de produtividade são as limitações práticas que os métodos
impõem. Os índices de produtividade de fator único requerem entradas e saídas únicas
e, portanto, são muito limitados em termos de abrangência e validade. As métricas de
produtividade de fator total permitem várias entradas e saídas, melhorando assim a
validade, mas o fazem ao preço de uma menor comparabilidade (robustez/segurança) e
utilidade. Por fim, as métricas financeiras, que parecem combinar a simplicidade dos
índices SFP com a precisão do TFP, são, na verdade, propensas à arbitrariedade (solidez
comportamentalidade e distorção no cálculo dos valores em dólares [validade]).

Medidas de eficácia

A eficácia foi definida anteriormente como uma medida da qualidade do resultado de


um processo. Isso envolve dois tipos distintos de medição para determinar: (1) como os
padrões de qualidade são definidos e (2) como eles são cumpridos. Por exemplo, uma
métrica para pontualidade de entrega exige que tanto o padrão do que constitui ser
"pontual" (entrega em uma hora, três dias, uma semana ou o que for) quanto o
desempenho real (85% das entregas são pontuais) sejam medidos quanto à eficácia. É
defendido que existem dois tipos de eficácia: aquele que mede a disponibilidade
(habilidade de entregar de acordo com o desejo do consumidor) e a confiabilidade
(desejo de entregar de acordo com o prometido).

O documento se refere a esses dois aspectos da eficácia como a definição de padrões


(estão sendo oferecidos os serviços certos nos níveis certos de desempenho?) e a adesão
aos padrões (os padrões acordados estão sendo cumpridos?), respectivamente.

É muito importante não confundir esses duas formas de medir a eficácia. Há uma
relação inversa entre o estabelecimento de padrões de eficácia e a adesão a eles, de
modo que, à medida que os padrões se tornam cada vez mais rigorosos, a adesão a eles
pode diminuir. Se alguém medir apenas a adesão a um padrão sem determinar a
exatidão do próprio padrão, a verdadeira eficácia do processo será obscurecida. O
restante desta seção discute esses dois aspectos da eficácia.

Definição dos padrões

A principal motivação para avaliar se os padrões de serviço estão sendo definidos


corretamente deve-se à revolução do atendimento ao cliente. Frases como "exceder as
expectativas do cliente", "atender aos desejos do cliente" e "encantar o cliente" agora
são comuns. Como uma empresa não pode medir o desempenho em relação a algum
"desejo" ou "expectativa" efêmero do cliente, ela precisa definir algum tipo de padrão
de serviço para o marketing e em relação ao qual o desempenho logístico possa ser
medido. A empresa precisa definir "resultado de qualidade" em termos práticos e, em
seguida, comparar o resultado real com esses padrões de serviço oferecidos.

Os padrões de serviço podem ser focados interna ou externamente. Os padrões de


produção focados internamente, como um limite para a porcentagem de remessas feitas
por correio expresso noturno, são, na verdade, substitutos para métricas de utilização ou
controle de custos. O objetivo dessa medida não é melhorar a qualidade da produção,
mas sim limitar os gastos com velocidade desnecessária. Os padrões focados
externamente, por outro lado, estão preocupados em alcançar o resultado final de
satisfazer os requisitos de serviço dos clientes. Isso significa que a definição de
"qualidade" da empresa deve corresponder à de seus clientes.
Infelizmente, é difícil estabelecer padrões de serviço que valham a pena. Embora
estudos tenham demonstrado que a eficácia pode ser medida de um n úmero quase
ilimitado de maneiras, na prática, a maioria das medidas de eficácia rastreia duas coisas:
(1) a pontualidade das entregas e (2) a disponibilidade e a condição do produto. Foi
observado que 63% dos gerentes pesquisados afirmaram que a disponibilidade do
produto e o tempo de ciclo do pedido eram os aspectos mais importantes da eficácia.
Ainda é muito difícil determinar as expectativas dos clientes, mesmo com esse escopo
reduzido de eficácia.

Os dois métodos mais comuns para determinar a adequação dos padrões logísticos são
as pesquisas com clientes e a análise comparativa com a concorrência. As pesquisas
com clientes podem ajudar a determinar se os serviços corretos estão sendo oferecidos
nos níveis corretos, enquanto a comparação com as ofertas de serviços da concorrência
indica se os padrões são adequados. O benchmarking exige o uso de métricas mais
robustas, o que tende a diminuir a validade dessas métricas.

O principal compromisso envolvido na definição de padrões de serviço é entre ser mais


útil para os gerentes de processo (foco interno) e ser mais integrador (foco externo). Um
foco externo também leva a padrões mais válidos e sólidos do ponto de vista
comportamental, pois eles capturam os drivers de desempenho de longo prazo
selecionados pelos gerentes. Quando possível, deve ser usado um foco externo para
estabelecer padrões de eficácia.

Aderência aos padrões

O objetivo das métricas de eficácia é orientar o comportamento da equipe de logística


para criar o maior número possível de "entregas perfeitas". A forma exata de uma
entrega perfeita, definida como uma transação entre o comprador e o cliente que atende
ou excede todos os padrões de serviço acordados, varia de cliente para cliente,
dependendo de suas necessidades específicas de serviço. Uma vez que esses padrões de
serviço tenham sido determinados e a "qualidade" tenha sido definida, é possível
desenvolver métricas para rastrear a adesão a esses padrões. Algumas das métricas mais
comuns são mostradas na Tabela 5. A avaliação das métricas de eficácia envolve as
duas principais compensações entre ser integrativo versus útil e robusto versus válido.
Essas compensações podem ser vistas mais facilmente na definição da métrica de
eficácia em termos do local da métrica, do período de tempo considerado e do nível de
detalhe selecionado.

Todas as métricas de eficácia designam um local de medição e um intervalo de tempo.


Essas características determinam o escopo da métrica. Por exemplo, a definição da taxa
de preenchimento como a porcentagem de itens de linha coletados durante o ciclo de
coleta semanal define o local da métrica de eficácia no CD e o período de tempo em que
a métrica é aplicada.

O período de tempo é definido como um ponto único no tempo, ou seja, ou o item está
disponível no momento ou não está. Definir a taxa fiII como a porcentagem de itens
recebidos pelo cliente em até três dias após o pedido define a localização na fábrica do
cliente e o intervalo de tempo como um período de tempo. Esses dois exemplos ilustram
a troca entre ser o'e/o/ para os gerentes internos (primeiro exemplo) e ser mais
informativo ao incluir todas as atividades necessárias para levar o produto até o local do
cliente (segundo exemplo).

Resumo das Métricas de Eficácia

As medidas de eficácia devem monitorar a qualidade do resultado do processo,


comparando o resultado real com os padrões de serviço predeterminados. Dessa forma,
são necessários dois tipos de medições para rastrear tanto a adequação dos padrões de
serviço quanto à adesão a esses padrões. A medição da adequação dos padrões inclui
comparações com a concorrência e pesquisas com os clientes. A medição da aderência
aos padrões envolve as compensações entre enfatizar a integração versus utilidade e
robustez versus validade. A definição da métrica em termos de local, período de tempo,
agregação, reconhecimento da condição e fator de ponderação influenciam essa troca.

Conclusão

O objetivo deste documento foi estabelecer critérios para avaliar melhor as métricas de
desempenho de logística. Foram selecionados oito critérios: validade, robustez,
utilidade, integração, economia, compatibilidade, nível de detalhe e solidez
comportamental. Os quatro primeiros critérios representam as compensações primárias
envolvidas na medição d o desempenho: utilidade (fornecer orientação acionável)
versus integração (promover a coordenação) e validade (capturar aspectos específicos)
versus robustez (permitir a comparabilidade). O primeiro trade-off indica que, à medida
que uma métrica se torna mais inclusiva, ela perde sua utilidade direta para alguns dos
gerentes do processo. É importante lembrar isso ao projetar um sistema de medição
orientado para a cadeia de suprimentos; uma métrica que capta o desempenho em todas
as funções dissipa o controle e a responsabilidade de cada gerente de função. O segundo
trade-off implica que métricas detalhadas e complexas têm o preço de uma menor
comparabilidade. Esse é um aspecto importante a ser lembrado quando se tenta fazer
benchmark de processos em diferentes organizações ou setores.

A taxonomia das métricas de desempenho demonstrou que, embora haja um número


quase incontável de métricas específicas para cada situação disponíveis para uso, as
estruturas subjacentes são essencialmente as mesmas para cada um dos três tipos de
medição: utilização, produtividade e eficácia. Além disso, foi demonstrado que as duas
principais compensações são essenciais para a formulação de qualquer métrica.

Conforme declarado na introdução, o objetivo deste documento não era desenvolver ou


sugerir novas métricas, mas sim aumentar a compreensão geral das métricas de
desempenho e fornecer uma estrutura para validar as métricas que já estão disponíveis.
Compreender a estrutura subjacente e as compensações inerentes às métricas de
desempenho deve levar a uma avaliação e seleção de métricas mais informadas.

Você também pode gostar