Você está na página 1de 37

ANÁLISE DE

DADOS

Aprenda, Aplique, Destaque-se

Neste breve e-book nós compilamos 9 de nossos melhores posts sobre análise de
dados. São diversas técnicas e exemplos que podem ajudar você a aprender e
aplicar conhecimentos, assim como se destacar em seu trabalho.
Análise de Dados

Análise de Dados
APRENDA, APLIQUE, DESTAQUE-SE

Sumário
LEITURA 1 – COMO ANALISAR DADOS PARA ENTENDER CORRELAÇÕES............................. 2
LEITURA 2 – ANÁLISE DE DADOS DA ECONOMIA ............................................................... 5

LEITURA 3 – O PDSA E A ANÁLISE DE DADOS..................................................................... 8

LEITURA 4 – PDSA: SEGURANÇA PÚBLICA EM ANÁLISE.................................................... 13

LEITURA 5 – IPCA, IGP-M E OUTRAS ANÁLISES DA CRISE ................................................. 19


LEITURA 6 – ANÁLISE DO PREÇO DOS IMÓVEIS ............................................................... 23

LEITURA 7 – COMO FAZER UMA ANÁLISE DE CORRELAÇÃO USANDO O EXCEL? ............... 26

LEITURA 8 – ANÁLISE DE 20 ANOS DE POUPANÇA ........................................................... 32


LEITURA 9 – O ENDIVIDAMENTO DAS FAMÍLIAS .............................................................. 34

Página 1
Análise de Dados

LEITURA 1 – COMO ANALISAR DADOS PARA ENTENDER CORRELAÇÕES

Análise de dados: olá, caro leitor. Tudo bom? Como estão as coisas no trabalho? Pressão por resultados?
Ou as coisas estão se acalmando um pouco? E os projetos? Como andam? Muita análise de dados ou a
coisa está mais para análise de opiniões? Como estão as reuniões de projeto? As equipes levam
diagnósticos teóricos, baseados em horas de lorotas compiladas ou lançam mão da análise de dados
mais fundamentada?

Brainstorming infinitos ou gráficos de tendências (ou linhas)? E a análise dos problemas? Rola uma
investigação prévia, utilizando um Ishikawa para fundamentar as hipóteses ou a coisa é mais Paretar
Paretar Paretar? Por que pergunto isto? Porque analisar dados não é algo fácil. Depois de fazer
seu Green Belt e sair cheio de vontade fazer a análise de dados aprendida nele, você foi surpreendido
em reuniões com coisas como estas? Quantas vezes um gestor, mal-informado sobre o tema, pediu para
você fazer um gráfico mais bonito, mesmo que não fosse o correto para aquela situação? Quantas vezes,
ao mostrar sua análise, alguém falou que os dados estavam errados? Dados esses, que a equipe dele lhe
passou por meio da extração de uma base de dados do sistema oficial?

Calma. A coisa é assim mesmo. O Brasil não é conhecido por ser um país de expoentes na esfera da
análise de dados na empresa. Não é todo mundo que como você, quer se esforçar para alcançar
resultados com consistência, que estudou bastante e procura fatos e dados concretos para tomar
decisão. Há muito mais em jogo, que exigirá de você habilidade para dominar as circunstâncias, ter
paciência e resiliência. Mudar cultura não é fácil, mas é possível.

Análise de Dados
Agora, chega de papo e vamos brincar um pouco. Desabafo feito, vamos para a análise de dados. Vamos
começar analisando o índice “salário real médio” publicado pela FIESP que mede os salários na indústria
e tem a base 100, fixada no ano de 2006.

Figura 1: salário real médio (fonte: FIESP).

Página 2
Análise de Dados

Pela figura 1, fica claro o período de salários reais médios na indústria mais altos, parece que começou a
terminar. Se olhamos para a série história, no início de 2016 o valor já é o mesmo de 2005. Parece-me
que houve um retrocesso nos salários reais de 11 anos, o que parece ser não muito agradável para os
colaboradores. E por que será que isto aconteceu? Numa análise básica, poderíamos intuir que uma das
possíveis causas seja o desemprego, concordam? Como realizar uma análise de dados para comprovar
isto?

Figura 2: regressão entre salário médio real e taxa de desemprego.

A figura 2, que mostra que a relação entre salário real médio e taxa de desemprego é comprovada
estatisticamente. Não tem lorota, achismo ou história que possa ir contra o resultado desta análise.
Também, é possível verificar que 71% da variação do salário real pode ser explicada pelo índice de
desemprego. Com exceção de dezembro de 2006, um ponto fora da curva, há uma forte correlação
entre estes dois indicadores. Portanto, só veremos salário maiores quando possuirmos uma demanda
por emprego maior. E qual seria o modelo para predizer o valor do salário real médio em função do
desemprego?

Previsão

Página 3
Análise de Dados

Figura 3: relatório de previsão do salário real médio em função da taxa de desemprego.

Como a série história disponível sobre os salários reais tem o último valor disponível no mês 8, podemos
utilizar o dado da taxa de desemprego para inferir o índice de salários. O último dado divulgado de
setembro, mostra que o desemprego foi de 11,8%. Diante disto, espera-se um índice de 92, o mesmo de
2001, ou seja, voltamos 15 anos atrás. Com isto, não é difícil intuir os motivos pelo qual a população se
revoltou com o status quo e respondeu com mudanças em grande parte dos municípios.

Neste exemplo, é possível analisar como aplicamos os conceitos que aprendemos no Green
Belt e Black Belt na prática. Com uma simples regressão, realizada por meio do assistente do Minitab, é
possível entender a relação forte que há entre vários indicadores. Agora, fé no método e aproveite para
afinar suas análises de dados.

Página 4
Análise de Dados

LEITURA 2 – ANÁLISE DE DADOS DA ECONOMIA

No artigo de hoje vamos voltar a falar sobre análise de dados. O leitor que quiser conhecer melhor sobre
essa técnica, pode ver nosso curso de Green Belt, que explica melhor as ferramentas aqui usadas. E com
esta Economia pujante que temos em 2015, nada melhor do que comparar alguns índices do
mercado financeiro. Para isto, vamos começar comparando o dólar (temido dólar) com a bolsa de
valores. Qual será que foi o comportamento do Ibovespa divido pelo dólar? Quem cresceu mais ao longo
destes anos?

Figura 1: gráfico de tendência do Ibovespa/dólar (PTAX).

Pela figura 1, tenho 13 anos. Voltamos em 1997. Em dólar, as empresas que compõem o índice estão com
o mesmo valor de 1997. A coisa não está fácil. E como será que esta o comportamento dólar e do Ibovespa
separadamente? Figura 2.

Figura 2: gráfico de tendência do dólar e do Ibovespa.

Página 5
Análise de Dados

Por meio desta pesquisa quantitativa, é possível verificar que a bolsa ainda se arrasta, mas o dólar foi o
carro chefe. Pela análise, bateu o valor de 3,80 que havia alcançado em outro de 2002, quando Lula foi
eleito. E a dívida?

Figura 3: dívida mobiliária interna federal.

A dívida continua forte, cada vez subindo mais. Como o gráfico da figura 3 não nos diz muito coisa, um
bom exercício é calcularmos a variação mensal desta dívida. Será que esta dívida está crescendo mais
rápido ou mais devagar nos últimos anos?

Figura 4: análise do crescimento da dívida mês.

O crescimento da dívida está sob controle. Cresce sempre dentro do intervalo conhecido, com uma média
de 1,53% variando de -5 a +8%. Se continuarmos assim, a coisa complica. Imagine se na sua casa você
aumentasse o quanto à família deve em 1,5% ao mês. Sua dívida aumentaria 20% ao ano. Olha que coisa

Página 6
Análise de Dados

boa, você começa o ano devendo 100 mil e termina devendo 120 mil. Em 20 anos (tempo médio para
pagar um imóvel) você estaria devendo 35 vezes o valor inicial. Independente de ser azul ou vermelho, o
Brasil precisa urgente de um choque de gestão. E a dívida externa? Será que melhorou em dólar?

Figura 5: gráfico de tendência da dívida externa bruta em dólares.

Dívida externa bombando também. Olha só que maravilha. Depois de 2009 a dívida dobrou, parece que
a saída da crise adotada pelo governo levou a esta crise que vivemos hoje.

Figura 6: taxa de desocupação nas regiões metropolitanas.

Por último, vamos à tradicional taxa de desocupação nas regiões metropolitanas. Em agosto, o índice
alcançou 7,9%. Continuamos crescendo. Brasileiros e Brasileiras…. A coisa não está mole, mas como disse

Página 7
Análise de Dados

em outro post: não vamos viver a crise. Vamos aproveitá-la para tirar os projetos do papel e sairmos dela
muito melhor do que entramos. Conte com a FM2S para te ajudar nesta atividade.

LEITURA 3 – O PDSA E A ANÁLISE DE DADOS


Neste artigo, gostaríamos de mostrar como aproveitar dois grandes ativos gratuitos disponíveis (PDSA
e Google Trends) para você aumentar seus ganhos em tempos de crise. Imagine que a situação está difícil
e para melhorar um pouco suas perspectivas você decida empreender em algum novo negócio. Porém,
você tem dúvidas: qual negócio abrir? Qual mercado é interessante para eu entrar? Para lhe ajudar em
decisões estratégicas como esta, vamos utilizar o PDSA (disponível e gratuito) e o Google Trends
(disponível e ainda gratuito também).

PDSA: Plan

Questões Predições (O que achamos antes do estudo)

1) Quais os termos de busca relacionados à loja 1) Termos relacionados à roupa, principalmente


virtual com maior volume? as femininas.

2) Quais as regiões que mais pesquisam estes 2) A regiões com maior volume de busca são as
termos? cidades e Estados com populações mais numerosas

3) Algumas cidades mais afastadas dos centros


3) Quais são as regiões mais carentes dos
financeiros do país – eixo Porto Alegre -> Rio de
produtos que podemos focar?
Janeiro

Objetivo: descobrir um bom negócio para se comercializar por meio de uma loja virtual.

Para responder as questões iremos utilizar a ferramenta Google Trends disponível no


site: http://www.google.com.br/trends/explore. Para responder a primeira questão, pesquisaremos os
termos de buscas relacionados à loja virtual, e-commerce e outras palavras sugeridas pela ferramenta.
Depois de encontrados, analisaremos a evolução destes ao longo do tempo, por meio de um gráfico de
tendência.

Em seguida, analisaremos as buscas regionais pelos termos encontrados. Para isto, utilizaremos gráfico de
dispersão e tendência.

Por último, tentaremos cruzar as buscas com o mercado. Para isto, vamos buscar dados das vendas ou
lançamentos relacionados aos termos.

PDSA: Do
Pesquisas realizadas e problemas não foram encontrados.

Página 8
Análise de Dados

PDSA: Study

Figura 1: evolução da busca pelos termos loja virtual e e-commerce.

Pela figura 1 pode-se ver que loja virtual, ao contrário de e-commerce, é a palavra chave das buscas no
Brasil. Além disto, vê-se que o maior interesse pelo tema deu-se entre os anos de 2010 e 2011, mas que
ainda há interesse.

Figura 2: interesse no termo loja virtual por região.

A figura 2 nos diz que o Estado que mais pesquisa o termo é São Paulo, seguido por Espírito Santo, Minas
Gerais, Rio, Mato Grosso, Santa Catarina e Sergipe. Quanto a São Paulo, estava de acordo com nossas
predições, pois é o Estado mais populoso do país, mas os demais nos trazem dados interessantes. Nunca
imaginei que Sergipe fosse um Estado tão interessado pelo tema, dado sua pequena população.

Página 9
Análise de Dados

Figura 3: população dos Estados e seu número de buscas.

Quando dividimos a população pelas buscas, nos saltam aos olhos Sergipe, Mato Grosso e Espírito Santo.
A população destes Estados interessa-se mais por loja virtual do que os outros.

Figura 4: termos relacionados à loja virtual.

Na figura 4 temos os termos relacionados à loja virtual. A mais procurada é a loja vivo, depois Hering,
Facebook e Boticário. Desta maneira, nossa ideia inicial de que roupas femininas eram as lojas mais
quentes na internet foram por terra.

Para entender mais sobre estas lojas, a ferramenta nos permite clicar no termo loja vivo e nos abre várias
informações sobre ele. Com estas informações, podemos ver a evolução das pesquisas ao longo do tempo
e a região em que aconteceram.

Página 10
Análise de Dados

Figura 5: análise termo loja vivo.

Pela figura 5 é possível enxergar que as buscas pela loja vivo foram muito fortes no passado, atingindo o
auge em 2010 e praticamente se extinguindo em 2015. Pode-se observar o bom de pesquisas veio do
Estado do Espírito Santo, o que ajuda a explicar a nossa análise anterior. Se quiséssemos, poderíamos
continuar a busca e irmos explorando termo a termo até encontrarmos aquele relacionado à um negócio
que nos interessasse. Porém, como o espaço do artigo é curto, encerramos por aqui.

Como conclusão do estudo nós aprendemos que roupas femininas não é o termo mais buscado quando
pensamos em loja virtual. Aprendemos que além das roupas, compram-se perfumes, celulares além de
vários outros itens. Vimos também que não necessariamente as regiões mais populosas são as mais
interessadas no tema, encontrando 4 Estados que se destacaram dos demais. Por último, vimos que cada
termo apresenta um histórico diferente sendo desta forma, importante estudarmos mais para
respondermos a terceira questão do PDSA.

PDSA: Ação
Como ação pós-estudo, sugiro a continuidade da pesquisa para os termos que vocês mais se interessam.
Se quiser abrir uma loja relacionada ao esporte tênis. Podemos procurar “raquete de tênis”, como na
figura 6.

Página 11
Análise de Dados

Figura 6: buscas por raquete de tênis.

Quando olhamos esta busca, por exemplo, vemos que as cidades de Campinas e Ribeirão Preto são as
líderes. Para abrir o seu Tênis Shop, estas duas são as mais promissoras.

Quer ajuda numa análise? Envie-nos a demanda. Faremos com prazer, pois dados, negócios e análise é o
nosso negócio.

Página 12
Análise de Dados

LEITURA 4 – PDSA: SEGURANÇA PÚBLICA EM ANÁLISE

Segurança pública: no artigo de hoje nós vamos analisar os dados de segurança pública do Estado de São
Paulo. E para analisar dados, nada melhor do que um ótimo PDSA para nos ajudar. Vamos para o
terceiro PDSA que a FM2S disponibiliza. É no Green Belt e no Black Belt que você construirá todas suas
ferramentas para melhoria.

Objetivo: entender como está a evolução da segurança pública no Estado de São Paulo de janeiro de 2013
até maio de 2015.

Questões Predições

Como será que está a evolução dos homicídios Estável. Não houve mais rebeliões generalizadas,
dolosos no Estado? mas não houve um decréscimo grande.

E as tentativas de homicídio? Reduziram bastante.

Com o aumento no número de veículos, não há


E os homicídios culposos causados por acidente de
como este indicador ter se reduzido, mesmo com
trânsito?
os investimentos em segurança e conscientização.

Reduziram-se. A reforma administrativa na polícia


E os roubos?
reduziu estes indicadores.

Plano de Coleta de Dados


Para responder a estas questões iremos coletar os dados de segurança disponíveis no site da Secretaria
de Segurança Pública do Estado de São Paulo. Lá, estão todos os dados disponíveis dos principais tipos de
delitos de janeiro de 2013 até maio de 2015.

Para analisar a evolução dos crimes iremos utilizar gráficos de tendência e gráficos de controle.

Do
Dados coletados sem encontrarmos problemas.

Estudo

Página 13
Análise de Dados

Figura 1: evolução dos homicídios dolosos no Estado.

Pela figura 1 é possível identificar uma leve tendência de queda no número de homicídios nos últimos
meses, mas nada significativo ainda. Os dados estão sob Controle Estatístico de processo. Analisaram-
se os dados por meio de outro gráfico de controle, o x-barra com um subgrupo de tamanho 3 (fig. 2).
Neste a queda do último trimestre mostrou-se bem acentuada. Isto nos enche de esperança que
finalmente este crime terrível está reduzindo-se.

Figura 2: x-barra para homicidios dolosos.

Página 14
Análise de Dados

Figura 3: evolução das tentativas de homicídio.

Na figura 3 podemos observar a evolução do crime de tentativa de homicídio. Neste está claro a redução
do indicador nos últimos 4 meses. Percebe-se que houve uma mudança no patamar de patamar, conforme
a figura 4 mostra.

Figura 4: mudança no número de tentativas de homicídios.

Percebe-se que a média sai de 474 para 357, mostrando uma bela redução. Agora, só nos resta aguardar
para ver se este novo patamar se mantem.

Página 15
Análise de Dados

Figura 5: evolução dos homicídios por acidente.

Quando olhamos para os homicídios (dolosos e culposos) por acidente, o número permanece sob Controle
Estatístico. Neste caso não é possível afirmarmos que alguma coisa melhorou de 2013 para cá, por isto,
nossa predição mostrou-se correta. Apesar dos esforços e campanhas, todo ano já sabemos que mais de
4 mil vidas serão perdidas nas estradas paulistas, ou seja, 8,8 pessoas a cada 100 mil habitantes.

Figura 6: evolução no número de roubos.

Quando olhamos para o número de roubos (fig. 6), podemos perceber que o negócio está feio. Apesar da
estabilidade em alguns tipos de roubos (banco e carga) e da redução no número de roubos de veículos
(fig. 7), o número de roubos classificados como outros aumentou. Este aumento fica mais claro quando
olhamos para o gráfico da figura 8.

Página 16
Análise de Dados

Figura 7: evolução no número de roubos de veículos.

Figura 8: evolução nos roubos classificados como outros.

Pela figura 7 é possível enxergar um pulo no patamar deste tipo de crime ocorrido em janeiro de 2014. O
indicador salta de 21 mil de média mensal para 26 mil, um aumento considerável.

Conclusão
Pode-se concluir que houve redução em:

Homicídios dolosos;

Roubo de veículos;

Tentativa de homicídio;

Página 17
Análise de Dados

E houve aumento em:

Roubo – outros;

E permaneceram estáveis:

Homicídios dolosos e culposos por acidentes de trânsito.

Act

Após aprendermos como estão os índices de segurança pública no Estado de São Paulo, podemos
acompanhar os índices em algumas cidades específicas. A análise por cidade irá nos fornecer informações
mais estratificadas sobre os problemas. Por meio desta análise é possível auxiliar os prefeitos,
comandantes e secretários de segurança pública dos municípios o que eles devem atacar.

Uma análise interessante seria procurar as cidades que mais melhoraram os indicadores nos últimos anos
e torna-las benchmark de segurança. Depois, poderíamos avaliar quais as piores cidades e promovermos
um intercâmbio de melhores práticas e disseminação de mudanças. Com isto conseguiríamos revolucionar
o modelo da segurança no Estado e no Brasil. E aí? Vamos fazer estes exercícios? Ano que vem tem
eleições e eu gostaria muito que meu candidato pensasse desta maneira. Não importa o partido, se um
município for benchmark, deveríamos copiá-lo. Gestão na prática pessoal.

Página 18
Análise de Dados

LEITURA 5 – IPCA, IGP-M E OUTRAS ANÁLISES DA CRISE

IPCA: neste post vamos continuar aplicando a Estatística que ensinamos em nossos cursos
de greenbelt e blackbelt para entendermos um pouco mais do nosso cenário macroeconômico.
Vamos começar pelo PIB mensal, calculado pelo Banco Central. Para primeira análise, vamos utilizar o
gráfico de tendência, figura 1.

Figura 1: gráfico de tendência do PIB mensal.

IPCA
Pela figura 1, vemos que o PIB cresceu bastante nos últimos anos, mas agora parece estar iniciando um
período de estabilidade.

Na segunda etapa, vamos ver o comportamento dos índices de inflação IPCA e IGP-M mensais ao longo
dos anos, de 1995 até 2015. Isto pode ser conferido na figura 2 e 3. Para o IPCA e IGP-M iremos utilizar a
variação mensal .

Página 19
Análise de Dados

Figura 2: análise IPCA mensal.

IGP-M

Figura 3: análise IGP-M.

Página 20
Análise de Dados

Figura 4: gráfico de dispersão entre IPCA e IGP-M.

Pelos gráficos das figuras 2, 3 e 4 é possível observar que o IPCA e o IGP-M saíram do controle várias
vezes durantes os governos passados. Quando olhamos especificamente para este, vê-se que a Dilma
está em maus lençóis, haja vista que janeiro, fevereiro e março de 2015 o indicador estava fora de
controle. Este desvio fica mais claro na figura 5.

Página 21
Análise de Dados

Figura 5: análise IPCA no governo Dilma.

Outra análise interessante é o famoso “tempering” que o governo Dilma utiliza para controlar a
inflação. Está claro que o quando a inflação cai muito o governo atua e quando sobe também, mas que a
capacidade de controlar a inflação com as medidas heterodoxas estão a se esgotar. Prova disto são os
três meses consecutivos fora do controle no ano de 2015. E aí pessoal? Será que a equipe da Dilma
conseguirá se reinventar? Pelo visto, a tentativa de controle está mais para replicação do modelo FHC,
já que a taxa de juros voltou a subir, conforme figura 6.

Figura 6: taxa de juros e IPCA.

Na figura 6 é possível verificar que mesmo com uma taxa de juros nos níveis de 2011, nosso IPCA está
muito maior. Para acompanhar se o remédio está fazendo bem, só nos resta esperar. E aí? Qual será o
prazo para a taxa de juros domar a inflação? Mais 3 meses? 6? Vamos aguardar.

Se você gostou da análise e deseja aprender a elaborá-las, participe de nossos cursos. Há on-
line e presencial. Para levar um presencial para sua cidade é fácil, basta entrar em contato
conosco.Nossos cursos de green belt e blac kbelt são ótimos para isto.

Página 22
Análise de Dados

LEITURA 6 – ANÁLISE DO PREÇO DOS IMÓVEIS

No artigo de hoje nós vamos analisar alguns dados provenientes da construção civil. Fazer um curso
de Greenbelt o ajuda na hora comprar imóveis, pois permite que você analise os dados e veja se está na
hora certa, ou se é melhor esperar um pouco. Para isto, fizemos uma excursão no banco de dados do IBGE
(http://seriesestatisticas.ibge.gov.br/) que está disponível on-line.

E por onde começar? Na minha percepção é melhor começarmos seguindo a dica de Robert Shiller, Nobel
de Economia em 2013. Shiller fala que o segredo para entender se os preços dos imóveis estão caros ou
baratos é compará-los aos índices de inflação. Para isto, compara-se o índice de custos da construção com
o IPCA.

Figura 1: comparação entre índice de custos na construção civil e IPCA.

Pela figura 1 não é possível concluir muita coisa. Vamos tentar uma comparação mais longa entre o preço
dos imóveis e o IPCA. Comecemos em janeiro de 1995, colocando o IPCA na base 100.

Página 23
Análise de Dados

Figura 2: comparação entre índice de custos na construção civil e IPCA.

Pela figura 2 fica mais fácil ver que a inflação já está no encalço dos custos da construção civil, fato este
iniciado em 2011. Já em 2015, parece que o crescimento da inflação ultrapassou o crescimento dos custos
na construção civil, e desta forma, espera-se que a própria inflação corrija os altos preços dos imóveis.
Como Shiller dizia, o custo dos imóveis, no longo prazo, acompanha os índices de inflação. Se há um
descolamento muito grande, haverá correção.

Agora me veio uma dúvida: será que o índice de custos da construção acompanha os preços de venda dos
imóveis? Vamos lançar mão de mais uma ferramenta Greenbelt: análise de regressão. Vamos verificar se
há correlação entre o índice FIPE/ZAP Composto (a partir de agosto de 2010) com o custo da construção
civil fornecido pelo IBGE.

Página 24
Análise de Dados

Figura 3: regressão entre FIPE/ZAP e Custo da Construção Civil.

Pela figura 3 é possível afirmar que a variabilidade dos custos da construção civil afeta a variabilidade do
índice FIPE/ZAP para preço de venda. Mas como será que estes dois indicadores se comportaram ao longo
de tempo? Para isto, utiliza-se o gráfico de tendência, outra ferramenta muito utilizada e discutida nos
cursos de Greenbelt.

Figura 4: gráfico de tendência do FIPE/ZAP e do Custo, ambos na base 100 em agosto de 2010.

Olha que interessante o gráfico da figura 4. Mostra que os dois índices cresciam juntos, porém, em 2013
os custos deram uma “soluçada”. Porém, já no final de 2014, os dois encontraram-se novamente e
diminuíram a tendência de alta. Parece que 2015 foi o ano que chegamos a um ponto de inflexão da curva.
Com a tendência de inflação para o ano de 2015 acima da meta, penso compensar os investimentos que
paguem próximo a 100% do CDI e comprar o imóvel, se for a vista, só em 2016. Parece que a correção que
Shiller comenta no preço dos imóveis, feita pela própria inflação, está começando no Brasil.

Dúvidas sugestões, fiquem a vontade. Ideias para postagens? Podem enviar também. Este é um espaço
para compartilhar conhecimentos, análises e experiências.

Página 25
Análise de Dados

LEITURA 7 – COMO FAZER UMA ANÁLISE DE CORRELAÇÃO USANDO O


EXCEL?

Correlações: o post de hoje tem por objetivo ajudá-lo a entender uma das ferramentas mais utilizadas
em estatística para se verificar a existência de correlação entre variáveis. Já explicamos como interpretar
uma regressão linear e hoje iremos ensinar a como fazê-la no Excel. Ensinamos isto em nossa
certificação Green Belt e revisamos na Black Belt.

A primeira etapa da regressão é a coleta de dados. Para uma boa análise, uma boa coleta é fundamental.
Um extrato dos dados do nosso exemplo pode ser conferido na tabela 1 e correspondem a um call
center. A análise de interesse neste caso é saber se a variabilidade no número de atendimentos do call
center está correlacionada ao tamanho da equipe disponível para atendê-los. Esta análise é importante,
pois dirá à empresa se é necessário fazer contratações para que a meta de atendimentos seja cumprida.

Tabela 1: Extrato da tabela oriunda do formulário de coleta de dados.

Intervalo de
Dia Dia da Semana Time slot Chamadas atendidas Equipe
Tempo

1 Mon 1 6-6:30 6 3

2 Tue 1 6-6:30 7 6

3 Wed 1 6-6:30 7 4

4 Thu 1 6-6:30 10 5

5 Fri 1 6-6:30 9 6

6 Mon 1 6-6:30 11 4

7 Tue 1 6-6:30 12 4

Após coletar e organizar os dados, partimos para elaboração da análise. Existem duas maneiras de se
fazer isto no Excel, uma via gráfico de dispersão e outra mais completa, utilizando o módulo de análise
de dados do Excel. É este que utilizaremos neste exemplo. Para acompanhar a análise, basta
acompanhar o passo a passo a seguir.

Página 26
Análise de Dados

Figura 1: Montar tabela de dados no Excel, ir ao menu dados e clicar em análise de dados.

Figura 2: Selecionar regressão.

Página 27
Análise de Dados

Figura 3: Selecionar o intervalo de dados desejado para as variáveis X e para as variáveis Y.

Figura 4: Selecionar o nível de confiança de 95% e Plotar resíduos e Plotar de probabilidade normal.

Página 28
Análise de Dados

Figura 5: Resultado da análise de regressão do Excel.

Figura 6: Resultado organizado.

Após realizar a sequência (fig. 1 a 6), você deve analisar o resultado obtido. Se você pedir ao Excel
uma análise de regressãopadrão ele não irá traçar os gráficos de resíduos, que são importantes para

Página 29
Análise de Dados

verificar a qualidade da sua análise. Muita gente incorre neste erro, até porque o Excel favorece esta
análise errônea.

Correlações: Análise
No exemplo deste artigo pedimos ao Excel que além da análise padrão (Estatística da Regressão) ele nos
mostrasse os resíduos da regressão. Com os resíduos expostos, pedimos ao Excel que ele nos mostrasse
a plotagem dos resíduos, a plotagem de probabilidade normal e a plotagem de ajuste de linha.

Estes gráficos servem para entendermos o comportamento dos resíduos, para analisarmos se
há causas especiais ou se os resíduos estão sob controle. Caso haja, não é recomendável utilizar a
análise de regressão elaborada. O outro gráfico, plotagem de probabilidade, serve para avaliarmos se
a distribuição dos resíduos é uma curva normal ou se é necessário transformar as variáveis. Caso este
gráfico seja uma reta, podemos concluir que a distribuição dos resíduos é normal.

O último gráfico, plotagem de ajuste de linha, nos informa o valor previsto e o compara com os dados
reais, permitindo a análise visual do comportamento dos resíduos ao longo do X. Se observarmos o
resíduo aumentar ao longo do eixo X, temos um forte indício de que algo está errado ou que a previsão
se deteriora a medida que X aumenta.

Somente após estas muitas análises é que podemos verificar se a nossa regressão é adequada ou não.
Caso não seja, uma das saídas possíveis é realizar a transformação das variáveis, como por exemplo,
para log. É muito comum em análises de regressão de dados econômicos, como o PIB, termos de
aplicar a transformação log nas variáveis, tanto na dependente (Y) como na independente (X). Ao
fazermos isto, repetimos a análise e verificamos se o comportamento dos resíduos está adequado. Caso
esteja, verificamos o novo R² e o novo coeficiente de correlação.

Correlações
Nesta vida de consultor de empresas, já observei várias barbaridades quando o assunto é regressão
linear. O primeiro erro é o fato de muitas pessoas pensarem que regressão é previsão. Não é. Regressão
é uma maneira de correlacionarmos variabilidade entre as variáveis. Outro erro é verificar a qualidade
da regressão pelo R². Também está errado. Precisamos avaliar o gráfico dos resíduos antes.

Ao ver tantos conceitos entendidos e aplicados de maneira errada, pergunto-me: qual será a razão para
isto? Acho que a principal é a falha do sistema educacional que forma pessoas sem os mínimos
conhecimentos técnicos em estatística, mas outra razão pode estar no Excel. O programa é muito bom,
não há dúvida, mas por ser muito fácil, permite que as pessoas façam coisas sem saber bem o porquê.
Permite que, qualquer pessoa, sem o conhecimento básico de estatística vá lá e extraia o R² de um
conjunto de dados.

Conceitos
Sem a devida revisão e aproveitando-se do pouco conhecimento estatístico disponível nas empresas,
este R² foge ao controle e vai parar numa reunião de planejamento estratégico. Lá, ele encontra a paixão
grega que nos persegue até hoje pela retórica, argumentação e elaboração de teorias sem
fundamentação nos experimentos e, após um ano, o estrago costuma ser grande. Portanto, ao usarmos

Página 30
Análise de Dados

o Excel, devemos ir com calma. O software pressupõe que você domina o conceito por trás dele,
portanto, aprenda estatística básica, antes de utilizar o Excel.

Uma das coisas boas do Minitab é que ele é mais complicado de mexer, a primeira vista, pois exige que o
operador esteja mais por dentro dos conceitos antes de utilizar a ferramenta para sair cuspindo dados e
análises rebuscadas.

Como dica: invistam no estudo e na capacitação da sua equipe nas ferramentas e conceitos de
estatística. Cada centavo investido retorna na proporção de 1:10 em menos de 1 ano. Só a quantidade
de deslizes que sua equipe deixará de fazer, vai economizar muito dor de cabeça e prejuízos.

Página 31
Análise de Dados

LEITURA 8 – ANÁLISE DE 20 ANOS DE POUPANÇA

Dando continuidade aos nossos posts de análise de dados e da situação da construção de civil, vamos
olhar mais alguns indicadores. Como primeiro, vamos analisar o comportamento do cofre que paga tudo
isto, a poupança. Para isto, coletamos os dados de janeiro de 1995 até janeiro de 2015. São 10 anos de
análise do patrimônio liquido deste tipo de investimento.

Figura 1: evolução do saldo líquido da poupança. Fonte: SBPE-SFH/BACEN

Por meio da figura 1 é possível afirmar que o valor captado pela poupança cresceu bastante de 95 para
cá. Mas para uma avaliação mais criteriosa, vamos analisar a captação líquida mensal. Assim, teremos
uma visão dos meses que mais se capta e dos que mais se gasta.

Página 32
Análise de Dados

Figura 2: captação líquida mensal da poupança. Fonte: SBPE-SFH/BACEN

Pela figura 2, é possível verificar que há uma grande variação mensal na captação da poupança e, que
janeiro de 2015 a coisa foi realmente feia. Mas para parar de achar, vamos lançar mão de nosso famoso
gráfico x. Este irá nos informar se a variação está fora de controle e qual é a tendência da captação ao
longo dos anos.

Figura 3: gráfico x-barra da captação líquida mensal da poupança. Fonte: SBPE-SFH/BACEN

Pela figura 3 é possível verificar que a coisa realmente está complicada. Percebe-se que as piores médias
foram em 1999 e 2003, anos de crise brava. Porém, 2015 promete ser ainda pior, mas vamos aguardar

Página 33
Análise de Dados

mais dados para termos certeza disto, já que com apenas 1 mês é impossível predizermos os próximos 11.
Neste post, utilizamos os conceitos Seis Sigma ensinado nos cursos Green Belt e Black Belt da FM2S.

LEITURA 9 – O ENDIVIDAMENTO DAS FAMÍLIAS

Endividamento da famílias: para terminar a semana vai um post rápido, mostrando a evolução do
endividamento das famílias brasileiras. Coletei os dados no Banco Central de duas séries histórias:

19882 – Endividamento das famílias com o Sistema Financeiro Nacional em relação à renda acumulada
dos últimos doze meses – %

20400 – Endividamento das famílias com o Sistema Financeiro Nacional exceto crédito habitacional em
relação à renda acumulada dos últimos doze meses – %

Este indicador é interessante, pois mede o grau de endividamento das famílias em relação a sua renda
acumulada. Este percentual só poderia subir em duas ocasiões: ou a renda das famílias está caindo ou o
endividamento aumentando. Como é de praxe em nossas análises, fiz 3 gráficos. Vamos aos gráficos:

Figura 1: evolução do endividamento das famílias com o Sistema Financeiro Nacional em relação à renda
acumulada dos últimos doze meses e endividamento das famílias com o Sistema Financeiro Nacional
exceto crédito habitacional em relação à renda acumulada dos últimos doze meses, ambos em %.

Página 34
Análise de Dados

Figura 2: evolução da variação mensal do endividamento das famílias com o Sistema Financeiro Nacional
em relação à renda acumulada dos últimos doze meses.

Figura 3: evolução da variação mensal do endividamento das famílias com o Sistema Financeiro Nacional
exceto crédito habitacional em relação à renda acumulada dos últimos doze meses.

Endividamento da famílias subindo


Pela figura 1 já fica claro que o crescimento do endividamento das famílias brasileiras está crescendo,
principalmente o endividamento imobiliário. Quando tiramos o setor habitação do gráfico, o
endividamento dá um claro sinal de estar estabilização em 30%. O mesmo fato pode ser observado na
figura 2 e 3 em que analisando a variação mensal no endividamento.

Por este gráfico é possível verificarmos que as famílias só estão aumentando seu endividamento para
adquirem um imóvel. Parece-me que as famílias não estão querendo contrair mais dívidas ou os bancos

Página 35
Análise de Dados

estão sendo mais criteriosos na concessão de mais crédito, não deixando as famílias se endividarem
mais que os 30%.

Isto por um lado é bom, pois mostra que uma possível crise de calote dificilmente irá acontecer, mas por
outro lado, o crescimento da economia puxado por este aumento no endividamento das famílias está
chegando ao fim. Assim, as perspectivas para o crescimento econômico nos próximos anos não são as
melhores.

Vamos ficar de olho no que vai acontecer, mas por estes dados para crescer mais o Brasil precisará de
mudanças que não sejam mais do mesmo. Se a produtividade do país não aumentar, as únicas
mudanças possíveis serão o perigoso aumento do endividamento a ser realizado por meio dos bancos
públicos. Se isto acontecer, melhor abrirmos o olho.

Sendo um Green Belt ou Black Belt da FM2S, você não é enrolado pelos jornais.

Página 36

Você também pode gostar