Escolar Documentos
Profissional Documentos
Cultura Documentos
Faremos uma breve introdução à estatística descritiva, mostrando como técnicas gráficas
e numéricas simples podem ser utilizadas para resumir a informação em dados de amostra.
A utilização de distribuições de probabilidade para modelar o comportamento dos
parâmetros do produto num processo ou lote é então discutida.
Não há duas unidades de produto produzidas por um processo que sejam idênticas. É
inevitável que haja alguma variação.
A estatística é a ciência que analisa dados e tira conclusões, tendo em conta a variação
dos dados. Existem vários métodos gráficos que são muito úteis para resumir e apresentar
dados. Uma das técnicas gráficas mais úteis é a representação de caule e folhas.
Suponha que os dados são representados por x1, x2, . . . , xn e que cada número xi é
composto por pelo menos dois dígitos. Para construir um diagrama de caule e folhas,
dividimos cada número xi em duas partes: um caule, constituído por um ou mais dos dígitos
iniciais; e uma folha, constituída pelos restantes dígitos.
Uma vez escolhido um conjunto de caules, estes são listados ao longo da margem
esquerda do ecrã e, ao lado de cada caule, todas as folhas correspondentes aos valores
de dados observados são listadas pela ordem em que são encontradas no conjunto de
dados.
Se n, o número de observações, for ímpar, é fácil encontrar a mediana. Basta organizar por
ordem crescente. Em seguida, a mediana será a observação na posição [(n - 1)/2 + 1]
nesta lista. Se n for par, a mediana é a média da (n/2) e (n/2 + 1) observações ordenadas.
Por último, embora a apresentação de caule e folhas seja uma excelente forma de mostrar
visualmente a variabilidade dos dados, não tem em conta a ordem temporal das
observações.
É claro que podemos simplesmente traçar os valores dos dados em função do tempo; este
tipo de gráfico é designado por gráfico de séries temporais ou gráfico de execução.
Esta visualização indica claramente que o tempo é uma importante fonte de variabilidade
neste processo. Mais especificamente, o tempo de ciclo de processamento para os
primeiros 20 pedidos é substancialmente mais longo do que o tempo de ciclo para os
últimos 20 pedidos.
Algo pode ter mudado no processo (ou ter sido deliberadamente alterado pelo pessoal
operacional) que é responsável pela melhoria do tempo de ciclo..
Se possível, as caixas devem ter a mesma largura para melhorar a informação visual no
histograma.
A selecção do número de posições deve ser feita com algum discernimento, para que se
possa desenvolver uma visualização razoável. O número de posições depende do número
de observações e da quantidade de dispersão dos dados. Um histograma que utilize um
número demasiado pequeno ou demasiado grande de posições não será informativo.
Em geral, considera-se que entre 5 e 20 posições é satisfatório na maioria dos casos e que o
número de posições deve aumentar com n. A escolha de um número de posições
aproximadamente igual à raiz quadrada do número de observações funciona bem na
prática..
Por vezes, as frequências em cada posição são divididas pelo número total de
observações (n) e, assim, a escala vertical do histograma representa as frequências
relativas. São desenhados rectângulos sobre cada posição e a altura de cada retângulo é
proporcional à frequência (ou frequência relativa). A maioria dos pacotes estatísticos
constrói histogramas.
Autor: Luís Almeida
Ano Académico: 2023/2024
Descrição da Variação 17
Observe que o ponto médio do primeiro compartimento é 415Å e que o histograma tem
apenas oito compartimentos que contêm uma frequência diferente de zero. Um
histograma, tal como um gráfico de caule e folhas, dá uma impressão visual da forma da
distribuição das medições, bem como alguma informação sobre a variabilidade inerente
aos dados.
Por esta razão, preferimos pensar no histograma como uma técnica mais adequada para
conjuntos de dados maiores contendo, digamos, 75 a 100 ou mais observações.
Note que, ao passar dos dados originais ou de um diagrama de caule e folhas para um
histograma, perdemos, de certa forma, alguma informação, porque as observações
originais não são preservadas.
Os histogramas são sempre mais fáceis de interpretar se as caixas tiverem a mesma largura.
Se as caixas forem de largura desigual, é habitual desenhar rectângulos cujas áreas (em
oposição às alturas) são proporcionais ao número de observações nas caixas.
A figura a seguir mostra uma variação do histograma (ou seja, o gráfico de frequência
acumulada). Nesse gráfico, a altura de cada barra representa o número de observações
que são menores ou iguais ao limite superior do compartimento.
Quando se utilizam dados categóricos, as barras devem ser desenhadas de forma a terem
a mesma largura..
Allen, T. T. (2019). Introduction to engineering statistics and lean six sigma: Statistical quality
control and design of experiments and systems. Springer London.
Montgomery, D. C. (2019). Introduction to statistical quality control. John wiley & sons.
Selvamuthu, D., & Das, D. (2018). Introduction to statistical methods, design of experiments
and statistical quality control. Singapore: Springer Singapore.
Sower, V. E. (2017). Statistical process control for managers. Business Expert Press.
Autor: Luís Almeida
Ano Académico: 2023/2024
MUITO OBRIGADO PELA ATENÇÃO!
29
Volenti Nihil Difficili -“A quem quer, nada é difícil”