Você está na página 1de 7

ESTÁCIO - CURSO DE ADMINISTRAÇÃO

Prof.: Carlos Eduardo Rebello

 ESTATÍSTICA & PROBABILIDADE 

UNIDADE 1: ANÁLISE DE DADOS QUATITATIVOS

ANÁLISE ESTATÍSTICA
Análise estatística é uma ciência que tem como propósito coletar, explorar e demonstrar dados em
busca de descobertas de padrões e tendências. Com o avanço tecnológico as análises estatísticas
evoluíram, e continuam progredindo, aumentando, assim, a precisão no encontro de padrões e
tendências.
Ainda que existam diversas maneiras de realizar esse tipo de análise, porém, no geral, ela segue cinco
etapas fundamentais, sendo:
 Descrição dos dados a serem analisados;
 Exploração dos dados;
 Criação de um modelo para compreender os dados;
 Provação ou refutação da validade do modelo;
 Uso de análises preditivas.

Portanto, independentemente do método escolhido no momento de desenvolver uma análise


estatística, ela seguirá esses passos.

TIPOS DE ANÁLISE ESTATÍSTICA


Há basicamente dois tipos de análise estatística: descritiva e conclusiva, sendo cada uma delas usada
em situações diferentes dentro do ambiente empresarial.

Análise Descritiva: A análise descritiva é um dos tipos de análise estatística usada para resumir os
dados do mercado de atuação da empresa. Assim sendo, esse tipo de análise mostra informações sobre
o setor com o uso de mapas, gráficos e tabelas.
Considerando que esses três elementos são componentes primários em uma análise, eles são usados
para facilitar a compreensão de dados brutos. Portanto, isso favorece a interpretação do panorama do
mercado. Entretanto, como o próprio nome sugere, é feita apenas uma descrição do cenário, não
chegando a uma conclusão efetiva.

Análise Conclusiva: A análise conclusiva, por sua vez, é um dos tipos de análise estatística elaborada
para estudar os dados de forma mais objetiva. Para isso, você deve realizar perguntas mais específicas
que devem ser respondidas por meio de um processo analítico.
Esse tipo de análise permite que você teste hipóteses e chegue a conclusões sobre a causalidade dos
fatores analisados. Por exemplo, a análise descritiva pode mostrar o perfil da população de um
determinado mercado, mas somente uma análise conclusiva encontra quais os fatores que resultam
nesse comportamento.

Estatística e Probabilidade – Unidade 1 1


A análise conclusiva tem por característica permitir que você, como gestor, teste hipóteses para
chegar a uma determinada conclusão. Nesse sentido, as conclusões são chamadas de proposição
estatística que apontam:
 Estimativas: um valor aproximado de algum parâmetro que interessa à empresa;
 Intervalo de confiança: margem de oscilação na qual o parâmetro se insere;
 Intervalo de predição: conjunto de valores que contém a crença no resultado posterior.
Para se chegar à proposição estatística, você pode adotar os seguintes métodos: Média, Moda e
Mediana:
Vale dizer que a Média Aritmética é a mais conhecida. Nesse caso, soma-se uma lista de números e
divide-se pelo total de itens existentes na lista. Ela é útil para definir a tendência geral de um conjunto
de dados. No entanto, a análise isolada da média não diz muita coisa. Por isso, ela é usada em
conjunto com a Moda e Mediana.
A Moda, por sua vez, é o valor mais frequente de um conjunto de dados. Ou seja, dentro de uma
amostra é o número que apareceu mais vezes.
Já a Mediana é o valor central dessa amostragem. Portanto, para encontrá-la é fundamental colocar
os números em ordem crescente ou decrescente.

DESVIO PADRÃO: É uma medida que mostra o grau de dispersão do conjunto de dados. Ele
indica, portanto, o quanto esse conjunto é uniforme ou disforme. Dessa forma, quanto mais próximo
de 0 o desvio padrão for, mais próximos os dados se alinham com a média, e quanto mais distante de
0, mais dispersos eles estão da média.
Para calculá-lo é preciso subtrair todos os dados da média aritmética e depois fazer a divisão pela
quantidade total de dados.
Vale dizer que assim como a média, em alguns casos o desvio padrão pode não trazer muitas
informações quando analisado sozinho. Isso ocorre em uma curva anormal, ou quando há dados muito
distantes da média.

REGRESSÃO: É um dos tipos de análise estatística mais usadas. Ela pode ser dividida em três
grupos:
 Regressão linear simples;
 Regressão linear múltipla;
 Regressão não linear.
A Regressão Linear Simples é a mais usada e permite modelar uma relação entre dois conjuntos de
variáveis. Vale dizer que a linha de regressão mostra se o relacionamento entre os conjuntos é forte
ou fraco. Esse é um método muito usado na ciência, mas no mercado ele pode em alguns casos não
trazer informações precisas. Uma vez que o produto mais vendido da empresa se for muito além dos
outros, ficará mais distante da média.

AMOSTRAGEM: É o conjunto de dados em si. Quanto maior for a amostra mais precisa ela será.
Por exemplo, se você tem 2 mil clientes e quer lançar um novo produto.
Ao entrevistar os 2 mil, os dados serão mais precisos. No entanto, ao entrevistar apenas 20 deles, terá
uma amostragem tão pequena, que o desvio padrão será muito alto, fazendo com que a confiança no
resultado em si seja baixa.

Estatística e Probabilidade – Unidade 1 2


Por outro lado, uma amostragem muito alta representa mais custo no momento de levantar dados. Por
isso, o ideal é encontrar uma quantidade de amostragem que ofereça um desvio padrão razoável a
ponto de apontar uma tendência com segurança.

A IMPORTÂNCIA DE UMA ANÁLISE ESTATÍSTICA


Os diferentes tipos de análise estatística apontam diversas tendências, o que faz os gestores
identificarem boas oportunidades de negócios dentro do mercado, principalmente em tempos de
economia digital.
Além disso, com base nos resultados passados, a análise prevê algumas tendências. Para isso, vale
reforçar novamente a importância da escolha da amostragem. Quanto maior for a amostra, mais
precisão haverá na interpretação dos dados e melhor será a sua tomada de decisão.
Por exemplo, um dos tipos de análise estatística pode apontar se um novo recurso de um banco digital
foi bem aceito pelos usuários, ou se é preciso remodelá-lo. Além disso, ela pode mostrar uma
determinada necessidade do consumidor que está enfrentando uma dificuldade que até então não
havia resolução.

FASES DA ANÁLISE ESTATÍSTICA


1 – Determine o Objetivo da Análise: O primeiro passo é saber o que você quer extrair de uma
análise estatística. Afinal, ninguém levanta dados com o simples intuito de tê-los. Portanto avalie se
a pesquisa é para encontrar um problema no produto, melhorar a estratégia venda, compreender uma
demanda reprimida ou qualquer outro dado. Quanto mais claro e preciso for o objetivo, mais fácil
será determinar as perguntas que levarão ao levantamento dos dados.
2 – Defina o Tamanho da Amostra: Depois de estabelecer o objetivo é necessário definir o tamanho
da amostra. Aqui é muito importante não errar. Isso porque uma amostra muito grande geralmente
encarece o preço da pesquisa. Por outro lado, uma amostra pequena demais gera uma imprecisão
maior na coleta de dados, uma vez que aumenta o desvio padrão.
3 – Crie Perguntas Fechadas: Uma vez determinado o tamanho da amostra, é necessário criar
perguntas fechadas para que o resultado seja quantificável. Caso contrário, será mais difícil
estabelecer parâmetros para gerar resultados. Lembre-se de que as perguntas precisam ir ao encontro
do objetivo estabelecido. Essa é uma forma de interpretar os dados com mais eficiência.
4 – Aplique o Questionário Junto à Amostragem: Uma vez feito o questionário é preciso aplicá-lo
junto a amostragem selecionada para levantar os dados. Isso pode ser feito de maneira online. Tenha
em mente que quanto menor a amostra, mais rápido será o processo, e quanto maior a amostra, mais
demorada será essa etapa.
5 – Compile Todos os Dados: Depois que você levantou todos os dados é preciso compilá-los em
um banco de dados. Isso pode ser feito por meio de uma planilha em Excel ou então em um sistema.
A compilação dos dados não é capaz de gerar resultados significativos. Portanto, após compilados, é
necessário aplicar um método para você interpretar os dados.
6 – Aplique a Regressão Linear: A regressão realiza a modelagem das associações entre as variáveis
dependentes e expectativas. Essa linha de regressão definirá se as associações são fortes ou fracas.
Isso pode ser feito por meio do diagrama de dispersão, o que facilita os dados coletados. Aqui pode
ser encontrado algum ponto fora da curva.

Estatística e Probabilidade – Unidade 1 3


7 – Faça o Teste T: Depois de aplicar a regressão você poderá fazer o teste de hipótese conhecido
como Teste T. Com ele você analisará a veracidade de uma associação do conjunto de dados
selecionados. Nesse sentido, se a pesquisa foi feita de forma aleatória, acusará que ela não tem
veracidade. Esse tipo de teste é muito usado no gerenciamento de negócios bem como em estudos
científicos.

8 – Descreva e Interprete os Dados: Os dados devem ser descritos através de tabelas e gráficos e
somente então serem interpretados. Pode-se nessa parte aplicar também outros elementos como
Média, Moda, Mediana e Desvio Padrão para indicar estimativas, intervalos de confiança e predição.
Os avanços tecnológicos permitiram uma maior exatidão na coleta, interpretação e análise desses
dados. Por isso, usar a tecnologia a seu favor faz uma grande diferença em uma análise estatística
atual.

IMPORTÂNCIA DA ANÁLISE ESTATÍSTICA


A análise estatística colabora para que os gestores tenham mais embasamento no momento de tomar
decisões dentro de uma empresa. Afinal, como há dois tipos de análise estatística, é possível projetar
cenários, avaliar indicadores de vendas e criar dados conclusivos que amparem as decisões.
Quando bem aplicado, você sabe as características dos produtos que os clientes mais dão valor, e as
principais dores e necessidades enfrentadas. Essa é uma maneira de evitar achismos, principalmente
na questão mercadológica, encontrando oportunidades que os seus concorrentes ainda não
encontraram.
Em alguns casos a pesquisa serve somente para comprovar um teste que já estava em curso dentro da
sua empresa, já em outros ela serve para que toda a estratégia do negócio seja refeita para se encontrar
o melhor caminho.

A TECNOLOGIA E A ANÁLISE ESTATÍSTICA


A tecnologia veio para melhorar a análise estatística. Por meio de um bom software é possível colher
e compilar dados de forma muito mais eficiente. Fora que ele permite a geração de gráficos e tabelas
de maneira muito mais simples o que possibilita visualizar cenários e tendências mais facilmente.
Além disso, a compilação dos dados é muito mais rápida e isso facilita cálculos mais complexos como
a regressão e o desvio padrão de uma amostragem.

FERRAMENTAS DE ANÁLISE EXPLORATÓRIA DE DADOS


ANÁLISE EXPLORATÓRIA DE DADOS (AED)
Em inglês chamado de Exploratory Data Analysis (EDA), a Análise Exploratória de Dados é uma
forma de abordagem usada para analisar e investigar dados. É com ela que o profissional tem uma
visão panorâmica dos dados, tenta dar algum sentido a eles e extrai conhecimento desses dados.
A Análise Exploratória de Dados é um processo importante do trabalho do cientista de dados porque
é a partir dela que o cientista de dados vai obtendo insights e coletando informações que vão alimentar
os modelos de machine learning.
Machine Learning (aprendizado de máquina) é uma tecnologia em que os computadores têm a
capacidade de identificar padrões e aprender com base nos dados que consomem. A partir disso, os
computadores passam a efetuar tarefas específicas de maneira autônoma.

Estatística e Probabilidade – Unidade 1 4


Exemplo de ferramentas que usam machine learning são os tradutores automáticos e os recursos de
combate a fraudes em sistemas de pagamento.
A partir da (AED) Análise Exploratória de Dados é possível direcionar as tomadas de decisões de
negócios. Para entender melhor, vamos imaginar uma planilha do Excel em que são colocadas todas
as informações sobre vendas de cursos da Estácio. Ou seja, nesta planilha tem: nomes dos estudantes,
faixa etária, o curso adquirido, a área do curso, a data da compra, se algum cupom de desconto foi
usado, de qual bairro o estudante é, etc.
Diante de todos esses dados, há várias perguntas que você pode fazer: quantos cursos foram vendidos
no total? Qual curso tem o maior número de estudantes? Como foi a venda do curso de Administração
nos últimos três meses? Como está a compra de cursos na região Oeste?
A partir desta análise, é possível saber, por exemplo, que um curso específico está tendo uma queda
no número de vendas. Neste caso, os responsáveis vão procurar entender o que está acontecendo e
definir algumas atitudes a serem tomadas. Fazer promoções, convidar o professor do curso para
promover eventos ou falar do curso nas redes sociais são algumas soluções.
Na Análise Exploratória de Dados, você não sabe o que os dados têm para te dizer ainda. Diante de
uma base de dados, você faz uma análise exploratória para obter as respostas para as suas perguntas.
Neste processo, o pesquisador vai conversar com os dados, praticamente. Ele pergunta e o software
responde. E, assim, insights para negócios são gerados. No final das contas, o que se quer é
potencializar um negócio.

ANÁLISE EXPLORATÓRIA DE DADOS

Para gerar insights de negócios tendo como base os dados, é preciso que esses dados estejam corretos.
Assim, a probabilidade de o resultado dos insights sair como esperado é maior. E, para assegurar a
qualidade dos dados, é possível usar a Análise Exploratória de Dados. Através dela é possível
identificar erros e detectar desvios.
Vamos imaginar que uma equipe de marketing de uma loja de roupas quer fazer uma promoção e
enviar cupons de desconto via e-mail para seus clientes. O cientista de dados pode identificar quem
são os clientes que têm mais chances de usar o cupom.
Porém, para isso, ele precisa checar se as informações dos clientes (e-mail, localização, frequência
de compra, por exemplo) que constam na base de dados da loja estão corretas, isto é, fazer uma análise
exploratória dos dados. Caso elas estejam incorretas, a ação da equipe de marketing não dará
resultado. A Análise Exploratória de Dados dá ideia da qualidade dos dados e nos diz se o campo é
confiável.

Tipos Primários de Análises Exploratórias de Dados


Univariada Sem Gráficos: Esta é a maneira mais simples de analisar dados. O seu objetivo é
descrever os dados e encontrar padrões que possam existir neles. Aqui, o profissional vai olhar apenas
uma variável, ou seja, uma única característica do que está sendo analisado. A análise univariada sem
gráficos mais simples que se tem é a média.
Imagine que você tem um conjunto de dados onde se tem a lista das notas dos estudantes de um curso
e você quer resumir em um único número a nota da sala. Para isso, você pode tirar a média dessas
notas. Isto é, somar todas as notas e dividir pela quantidade de estudantes. O número obtido será a
nota média da sala. Esta nota média é o resultado de uma análise univariada sem gráficos.

Estatística e Probabilidade – Unidade 1 5


Multivariada Sem Gráficos: Já a análise multivariada sem gráficos vai analisar e descrever a relação
entre duas ou mais variáveis. Esta análise pode ser feita por meio de tabulação cruzada, por exemplo.
Vamos supor que uma empresa que produz sucos industrializados entrevistou mil pessoas para
descobrir o suco de frutas favorito delas. Para isso, podem ser criadas tabelas onde vão ser listadas a
faixa etária dos entrevistados juntamente com as suas respostas.

Diante dessas duas variáveis (suco preferido e idade), pode-se tentar fazer uma relação para ver como
a idade pode afetar a preferência de suco das pessoas. Além disso, pode-se listar outras informações
como gênero ou de onde a pessoa é, por exemplo.

Univariada Com Gráficos: A análise com gráficos mostra uma imagem dos dados. No caso da
univariada, ela vai analisar apenas uma variável. Um tipo comum de gráfico univariado é o
histograma. No histograma, cada barra representa a frequência de casos para uma variedade de
valores.
Por exemplo: abaixo, temos uma tabela em que mostra opções de alturas e a quantidade de estudantes
que se encaixam nesses dados. Ao lado da tabela, temos um histograma que contém as informações
desta tabela.

Estatística e Probabilidade – Unidade 1 6


O histograma é uma forma simples de aprender rapidamente sobre os seus dados. Com ele, é possível
resumir grandes conjuntos de dados de forma visual, comparar os resultados e comunicar as
informações de forma rápida. Olhando o histograma acima, é fácil identificar que a maior parte dos
estudantes tem entre 1,70m e 1,75m de altura, enquanto apenas 13 têm entre 1,45m e 1,50m.

Multivariada Com Gráficos: A análise multivariada com gráficos utiliza imagens para exibir a
relação entre duas ou mais variáveis. Um tipo comum deste tipo de análise é o mapa de calor. Esta é
uma representação gráfica de dados em que os valores são retratados por cores.
Se uma empresa deseja entender o comportamento dos consumidores que acessam o seu site, por
exemplo, ela pode utilizar o mapa de calor. Neste tipo de representação, uma escala de cores é usada,
do vermelho ao azul, em que as cores quentes indicam os locais com maior atividade, e as mais frias,
os com menos interações. Analisar este tipo de mapa ajuda a entender o comportamento dos usuários
no site e, a partir daí, é possível otimizar a estratégia para incrementar a experiência do usuário.

Estatística e Probabilidade – Unidade 1 7

Você também pode gostar