Você está na página 1de 19

Análise de

Dados e
Estatística.

Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb


https://sites.google.com/view/profmarsa
Objetivos

O objetivo deste e-book


não é apresentar os
conceitos matemáticos mais
profundos e mergulhar você
em um emaranhado de
complexidades, aliás muito
pelo contrário. É aos poucos
apresentar formas mais
simplificadas, a ponto de
permitir que você visualize, o
grande salto que pode se dar
com auxílio das ferramentas
de análises de dados hoje
disponíveis.

Mas para tanto,


obrigatoriamente terei que
passar por explicações
básicas sobre assuntos que
fundamentam;

 Estatística;
 Softwares de análises;
 Processos e etc.

Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb


https://sites.google.com/view/profmarsa
Dados
Coleta e Análises

Em um mundo cada vez necessita entre outras


mais conectado, grandes coisas;
fluxos de dados podem estar
passando, todos os dias, em  Limpeza e classificação
canais cada vez mais da base de dados
acessíveis. adequada;

Dados estruturados e  domínio, dos conceitos


dados não estruturados, estatísticos, para a
podem ser tratados e correta interpretação;
transformados em
informação, e em seguida  Escolha adequada das
em decisões capazes de ferramentas estatísticas a
transformar negócios. serem utilizadas;

Este “tratamento” dos  Domínio do processo


dados, passa por estudado.
observações, coleta e análise
para enfim gerar informação


de valor e servir como base
para alteração de processos.

Muito embora , a coleta


dos dados pareça mais fácil
que análise, isso não
necessariamente o é; pois
esta última ,
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Amostras e
Desvio-padrão
Amostras  A amostra realmente
A coleta de amostras, deve representa a população ?
ser feita com grande
 As diversas proporções estão
atenção e cuidado, pois
sendo levadas em conta ?
através destes,
intencionamos, extrair com o  A amostra tem o tamanho
máximo de fidelidade uma mínimo para a representar a
representação da população. População ?
Amostras coletadas sem
 A amostra é normal ?
uma planejamento prévio,  Se não for ?
podem nos levar a coleta de
uma base de dados  Existem elementos na
invalidada. população que podem não
fazer parte deste ?
Muito embora possamos  São dados Discretos ou
falar por horas, e aperfeiçoar contínuos ?
o conceito de amostras, vou


focar em transferir questões  A amostra é homogenia ?
práticas que devem ser
Todas estas questões podem ser
observadas ao se coletar analisadas em Softwares
dados; específicos, que em minutos
processaram toda a informação e
apresentaram índices específicos
para serem analisados.
E neste ponto, mais que nunca se
faz necessário o conhecimento,
básico teórico a respeito destes
diversos índices.
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Índices

Desvio-padrão

Um dos mais importantes se Através do correto


não o mais, é o desvio- dimensionamento do desvio-
padrão. Pois este importante padrão, será possível iniciar
indicador mede a projetos para a diminuição
variabilidade do processo. sistemática das
Desta forma, quantificá-lo, e variabilidades do processos
conhecê-lo profundamente atacando as causas especiais
sempre será bastante e causas comuns, que
recomendável e necessário. normalmente compõem os
sistemas.
Este índice registra a
diferença entre o valor das
amostras é a média.

Média


Desvio-padrão
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Índices

Medidas de Tendência
Central

As medidas de tendência Resumindo a utilização da


central (média, mediana), média ou mediana sempre
são de extrema utilidade, deve passar pela
muito embora a que se característica do processo
observar que cada uma estudado e os objetivos a
possui características serem atingidos, caso exista
particulares, que devem a possibilidade de grandes
sempre ser levadas em variações no processos e
conta. seja necessário a detecção
A média é um índice muito imediata desta variação, o
sensível a entrada de novos monitoramento através do
valores, sendo assim o indicador média será muito
impacto de um valor muito útil, caso contrário a
alto sobre a média e utilização da mediana é mais
extremamente recomendável.
desestabilizador uma vez


que a média sofre grande
alteração também. O
mesmo não acontece com o
índice chamado mediana,
pois este sofre pouca
variação quando são
inseridos valores altos em
sua lista de valores.
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Número de Amostras

Quando ocorre decisão de se Sendo assim podemos


trabalhar com estatística, calcular o número adequado
também admitimos que de amostras para validar os
existem riscos associados, dados.
isto significa que podem
ocorrer resultados diferentes Todo esse processo aos
dos previstos nas análises. poucos torna a análise cada
vez mais robusta e aplicável,
Então qual seria a vantagem garantindo que as previsões
de utilizar esta ferramenta ? e decisões baseadas nestes
dados sejam cada vez mais
Utilizamos análises seguras.
estatísticas sempre que;

A avaliação da população
em sua totalidade é inviável
por questões de tempo ou de


investimentos.

Desta forma a coleta de um


número limitado, de
amostras, que garantam a
confiabilidade de 95% é
totalmente valida.

Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb


https://sites.google.com/view/profmarsa
Intervalo de confiança

Ao inserirmos os dados nos do processo e até mesmo


softwares estatísticos para confrontar os dados do
imediatamente, muitas processo com suas
equações e cálculos se especificações.
iniciam, para que diversos
índices de avaliação desta
base de dados esteja
disponível assim que
solicitados.

Não é diferente com o


intervalo de confiança.
Este importante indicador
que representa os limites
mínimo e máximos
garantidos estatisticamente
que ocorrerão em 95% das


oportunidades, é gerado
quase que simultaneamente
a inserção dos dados.

Estes limites são importantes


uma vez que podem ser
comparados com
expectativas que temos a
respeito
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Distribuição Normal

A maioria dos eventos Dentre os vários indicadores


naturais, quantificáveis calculados pelos softwares,
possuem uma certa um deles se chama p-value
“normalidade” isso implica (valor de Pearson).
em dizer que em sua
maioria, na verdade 95% dos Este índice determina se a
eventos considerados base de dados estudada é ou
naturais também possuem não um distribuição normal.
uma distribuição de dados
considerada normal.  p-value > 0,05 – é uma
No entanto os outros 5% de distribuição normal;
eventos não possuem uma
distribuição considerada  p-value < 0,05 – não é
normal. uma distribuição normal.

Isso nos obriga em uma


análise de dados excluir a
possibilidade de estar
tratando uma distribuição
“Não normal” como uma
distribuição normal. p- value
Mas então o que é ser
considerada uma base de
dados com distribuição
normal ?
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Distribuição Normal
Por que é importante a Então assim através da
determinação da determinação da
“normalidade” da “Normalidade” de uma
distribuição ? distribuição podemos
predizer vários dados com
Porque através desta relação a esta distribuição
informação podemos de dados.
garantir que esta base de
dados tem as seguintes Incluindo cálculo de
características; probabilidades, de um
determinado evento ocorrer
1. 68,27% dos dados estão ou não.
concentrados no primeiro
desvio da distribuição;

2. 95,45% dos dados estão


concentrados até o segundo
desvio da distribuição;

3. 99,73% dos dados estão


concentrados até o terceiro


desvio da distribuição;

4. Os dados podem ser


representados pela média e
pelo desvio-padrão;

5. A curva é simétrica;

6. A média, mediana e moda são


praticamente iguais.
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Causas Comuns e
Causa especiais
Um processo tende a ter Ou serviços com defeitos.
falhas e estas quase sempre
estão associadas a causas. Em resumo as causas
comuns, são previsíveis e
Estas causas podem ser evitáveis e normalmente
classificadas como causas estão sobre controle, já as
comuns ou causas especiais. causas especiais, acontecem
inesperadamente e seu
As causas comuns controle exige um robusto
normalmente podem ser plano de ação imediato para
previstas e prevenidas, deste que esta causa não ocorra
modo podemos dizer que novamente (recorrência).
existe um certa
previsibilidade quando
tratamos as falhas que se
originam das causas
comuns, tornado estas mais
“controláveis”.


Já as causas especiais, não
podem ser previstas e as
falhas associadas a elas,
podem ocorrem
inesperadamente em um
processo, desestabilizando-o
e tornando-o gerador de
produtos,
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Dados contínuos e
Dados por atributo
Esta classificação de dados A classificação destes em
também é muito importante, contínuos ou por atributo
pois através desta, podemos são importantes, pois
analisar as cartas de determinam os tipos de
controle, que são tão cartas de controles que
importantes para o Controle poderão ser utilizadas.
Estatístico do processo.
Para cada tipo de dados
Os dados contínuos são os existem cartas de controle
dados mensuráveis. Como específicas.
por exemplo, comprimentos,
larguras, áreas, enfim toda a
medida que pode ser
transformada em números e
suas casas decimais.

Já os dados por atributo são


obtidos através de análise


não quantitativa. Exemplo :
Lista de defeitos em uma
peça, verificação passa-não-
passa de um calibrador, nível
de satisfação de um cliente e
etc.

Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb


https://sites.google.com/view/profmarsa
Cartas de Controle

As cartas de controle, são mesmas, garantindo a


projetadas para a análise produção de produtos
estatística do processo. dentro das especificações.

O controle estatístico do
processo é um método
preventivo de detecção de
padrões de tendências de
descontrole dos processos,
sendo assim se os processos
não sofrerem intervenção,
poderão gerar produtos ou
processos defeituosos.
Desta forma as principais
cartas de controle para
dados contínuos são;
Carta X barra R e Carta I-M,

já para dados por atributo


são;
Carta tipo P e Carta Tipo U.
Ao longo da análise destas
cartas o usuário poderá
configurar o padrões de
detecção de causas especiais
tornando-o mais ou menos
sensíveis as,
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Capabilidade

Através das bases de dados Em resumo quanto maior o


coletadas nos processos, um indicador Cp e Cpk ou Pp e
estudo de capabilidade Ppk, maior a probabilidade
poderá ser feito, tendo a do processo gerar produtos
especificação de limites ou serviços dentro da
inferiores e superiores dos especificação requerida pelo
produtos. cliente.
Serão comparados os dados
dos processos e as
especificações requeridas
para o produto ou serviço.

A medida que o processo


consegue atender as
especificações do produto ou
serviço, dizemos que este
processo é “mais capaz”,
caso contrário dizemos que o

6
processo é “menos capaz”.

Processos “robustos”, são


processos cuja o índice Cp e
Cpk ou Pp e Ppk são ¹acima
de 1,67
¹Processos que possuem Ppk´s acima de
1.67 geram no máximo 1 peça defeituosa
para 1.000.000 de peças produzidas.

Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb


https://sites.google.com/view/profmarsa
MSA
Measurement System Analysis
Análise do sistema de medição

Todo o processo necessita de medição necessita de


medições em seus produtos avaliação estatística para a
e serviços para verificação se análise dos indicadores
estes estão de acordo com Repetibilidade e
as especificações Reprodutibilidade (RR).
combinadas com o cliente.
Estes importantes índices
Muito bem, mas para tanto definem se o sistema de
os sistema de medições medição esta ou não apto a
destes processos devem medir os produtos e garantir
estar livres de “falhas” de a confiabilidade destes.
medição.

Equipamentos de medição
são suscetíveis a falhas
como um outro mecanismo
qualquer e precisam ser
aferidos e calibrados para

6
que garantam que a
medição não esta;

 Aprovando produto ruim


ou;
 Reprovando produto bom

Além disso todo o sistema


de,
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Regressões Lineares

As regressões lineares são Assim sendo as avaliações


ferramentas importantes sobre esta base de dados e
para a análise dos dados, certificação de que esta se
particularmente neste caso trata de uma regressão
para certificar se os dados linear, possibilitará a
podem ser previstos partindo previsão de dados futuros
do pressuposto que com grande precisão uma
obedecerão uma equação de vez que o modelo já é
reta. conhecido e validado.

Y = A + Bx + e

Onde “e “ são os erros


residuais.

Os dados são inseridos nos


softwares e desta forma,
inicia-se uma análise dos
principais índices como R²


juntamente com o p-value,
para verificar o quanto a
variável Y é explicada pela
base de dados disponível e
se existe correlação nos
dados.

Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb


https://sites.google.com/view/profmarsa
DOE
Design of Experiments
Projeto de experimentos

O projeto de experimentos, Através desta ferramental é


tem como base a coleta de possível, analisar e chegar
dados devidamente ao ponto-ótimo de uma
planejada e estatisticamente infinidade de processos
aleatorizada, para garantir industriais, pois são gerados
que os dados não tenham relatórios orientando
erros de tendência (viés). exatamente quais são os
parâmetros de maior
Através de uma folha de impacto e quais os valores
experimentos, todos os de cada um destes
ensaios, são gerados em parâmetros para obtenção
ordem sequencial as quais de um produto de extrema
devem ser executados. qualidade.
DOE é uma ferramenta
muito poderosa e tem como
objetivo otimizar parâmetros
de processos para atingir
níveis de excelência nos

6
produtos.

Para tanto todo o processo


de planejamento do estudo
juntamente com a execução
dos ensaios precisam ser
muito bem gerenciados.

Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb


https://sites.google.com/view/profmarsa
Conclusões
Os conceitos estatísticos
juntamente com os
softwares disponíveis de
hoje, podem alavancar
muitos negócios e carreiras
de profissionais.

Deste modo a análise de


dados, estatística e
conhecimento nos processos
específicos, podem gerar
grandes oportunidades em
um mercado cada vez mais
exigente.

Entender profundamente
estas ferramentas e praticá-
las, com relativa facilidade
pode fazer uma grande
diferença.

6
Enfim me despeço fazendo
um convite, esteja comigo
em meus canais para
aprendermos juntos, será
uma grande honra para
mim.
Att.

Prof. Msc. Marcelino


Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa
Autor

6
Prof. Msc. Marcelino Siqueira de Carvalho
Email : profmarsa@gmail.com

Visite meu site


https://sites.google.com/view/profmarsa/cursos-e-eventos

Esteja comigo no YouTube


Lean Six Sigma YouTube : https://www.youtube.com/channel/UC5MKgK_zXowNogTlvvpw1yQ...

Esteja comigo no Grupo Lean Six Sigma no Fcebook


Lean Six Sigma Facebook :
https://www.facebook.com/groups/2283331901882245

Telegram
https://t.me/leansixsigma40#seissigma
Prof. Mestre Marcelino Siqueira de Carvalho, Mba, Mbb
https://sites.google.com/view/profmarsa

Você também pode gostar