Você está na página 1de 20

As três grandes

áreas da estatística
Introdução
Todas as vezes que precisamos fazer uma análise, o que queremos é contar uma
história sobre os dados que temos. E mesmo com a utilização de uma mesma base,
é possível contar múltiplas histórias. Pense em um modelo de negócio, com o
passar das semanas as perguntas mudam, mas os dados continuam os mesmos. O
grande desafio da análise de dados é determinar qual história deve ser contada.
Quando estamos desenvolvendo nossos estudos, supomos que os
dados possuem duas partes, o sinal e o ruído. O sinal é o real problema
que queremos capturar e descrever em detalhes, quando conseguimos
entender de forma detalhada esse sinal, podemos criar modelos
matemáticos para prever novos casos.

Já o ruído, é tudo aquilo que atrapalha o desenvolvimento dos modelos.


Esse ruído pode ser gerado por um erro de digitação, um dado faltante,
um sensor quebrado ou tudo aquilo que pode nos direcionar a um
caminho equivocado durante a análise dos dados.
O objetivo da análise de dados é,
portanto, separar o sinal do ruído e
encontrar informações que sejam
relevantes e úteis nos dados, com o
objetivo de tomar decisões precisas e
livres de vieses.

Para eliminar ou reduzir os ruídos, é


possível utilizar técnicas e pré-
processamento de dados, como
limpeza, normalização, filtragem e
tratamento dos dados.
O conceito sobre sinal e ruído é muito
utilizado em diversas áreas, como
Engenharia, Física, Matemática, entre
outras, mas o termo está fortemente
associado ao livro: O sinal e o ruído: por
que tantas previsões falham e outras
não, do escritor e estatístico Nate Silver
(Editora Intrínseca, 2013).

Nesse livro, o autor explora como as


previsões são feitas em diferentes
campos, como esportes, política e
meteorologia, e destaca a importância de
distinguir o sinal do ruído para fazer
previsões precisas.
Quando começamos a explorar a área de dados para diferenciar o sinal do
ruído, optamos por utilizar os mais diversos tipos de análises estatísticas, que
se dividem em áreas como:

1 análise descritiva;

1 análise inferencial;

1 análise preditiva;

1 análise prescritiva;

1 análise exploratória de dados.


Três grandes áreas da estatística
Todas essas análises podem ser agrupadas em três grandes áreas da
estatística: Estatística Descritiva, Inferência Estatística e Métodos
Estatísticos Aplicados.

Mas, antes de entrar nas três grandes áreas, alguns conceitos básicos como
população, amostra e parâmetros – descritos a seguir – são essenciais para o
entendimento dessa ciência.
População

Conjunto completo de elementos ou pessoas que têm uma característica


comum entre si.

Por exemplo, um gestor de saúde gostaria de saber o grau de satisfação


de todos os pacientes que foram a uma consulta no último ano, a
população de estudo é, portanto, todos os pacientes que utilizaram o SUS
no ano anterior.
Amostra

Corresponde a uma parcela representativa da população. Com base no


exemplo anterior, o gestor deverá escolher – aleatoriamente ou não –
alguns pacientes para compor a pesquisa de satisfação.

A escolha da amostra é importante, pois os resultados obtidos podem ser


usados para fazer inferências sobre a população como um todo. Porém, se
a amostra não for representativa da população, as conclusões obtidas
podem ser imprecisas. Nesse sentido, a estatística utiliza técnicas de
amostragem e inferência estatística para fazer previsões e generalizações
sobre a população com base nas informações coletadas na amostra.
Parâmetros

Medida numérica que descreve uma característica de uma determinada


população. Por exemplo, a média populacional, a proporção populacional, o
desvio padrão populacional e a variância populacional são exemplos de
parâmetros.
Estatística Descritiva

Utilizada para organizar, resumir e descrever os aspectos importantes de


um conjunto de dados com base nas características observadas e comparar
essas características através de gráficos e tabelas.

Imagine que você precisa fazer uma apresentação para a diretoria


informando tudo o que aconteceu no último mês, incluindo histórico por dia,
valores executados, número de pacientes atendidos ou mesmo quantidade
de pedidos médicos. Para isso, você deverá criar gráficos de setores,
gráficos de linha de tendência para exibir a evolução diária, tabelas
comparativas com cada procedimento e assim por diante. Ao finalizar essa
análise, você terá um relatório descritivo com todos os indicadores
observados no período. Esse tipo de análise é umas das mais importantes
no universo de dados, pois permite que os dados complexos tornem-se
mais fáceis de serem compreendidos.
Estatística Inferencial

Imagine que você foi encarregado de realizar uma pesquisa do perfil de


todos os pacientes do Sistema Único de Saúde. Sabemos que, dada a
dimensão do SUS, seria praticamente impossível falar com todos os
usuários para realizar essa análise. Portanto, os dados serão coletados
de uma amostra da população, e a inferência estatística é aplicada para
extrapolar as informações para a população como um todo.

A melhor maneira de se obter uma análise precisa ao usar estatísticas


inferenciais envolve (i) identificar a população que está sendo medida ou
estudada, no nosso caso, a população brasileira que utiliza o SUS, (ii) criar
uma amostra para essa parte da população e (iii) realizar as análises e
projeções, extrapolando o resultado para toda a população.
Estatística Inferencial

Existem duas abordagens principais na inferência estatística:

1. Estimação de parâmetros

Quando não é possível conhecer o valor total da população, o analista de


dados utiliza a informação da amostra para estimar o parâmetro da
população. Esses parâmetros podem incluir a média, a variância, a
proporção, entre outros. O resultado é uma aproximação do valor
verdadeiro do parâmetro na população.
Estatística Inferencial

2. Teste de hipóteses

Nesta abordagem, os analistas tentam responder às questões de


pesquisa usando dados de amostra e fazendo suposições envolvendo os
parâmetros da população. A hipótese pode ser sobre a média, a
proporção ou outra característica da população. Com base nos resultados
do teste de hipóteses, a hipótese é aceita ou rejeitada.
Diferença entre Estatística Inferencial e Estatística Descritiva

A estatística descritiva apresenta dados de forma clara e objetiva, e a


estatística inferencial, por meio de amostras aleatórias de dados de um
segmento da população, faz inferências sobre a população como um
todo. Então, se você perguntar a 100 pessoas se elas preferem a marca
de medicamentos A ou B, e 60 delas escolherem a marca A, a estatística
inferencial supõe que os resultados da pesquisa seriam válidos para toda
a população que compra medicamentos em geral.

A estatística descritiva, por outro lado, não extrapola os resultados dessa


maneira. Esta apenas informa que, em uma pesquisa realizada em uma
determinada região, 60% das pessoas pesquisadas compram o
medicamento da marca A.
Diferença entre Estatística Inferencial e Estatística Descritiva

Em outras palavras, a estatística descritiva informa como as coisas estão,


com base nos dados, e a estatística inferencial usa esses dados para a
previsão de resultados futuros. Naturalmente, a estatística inferencial
precisa de mais ferramentas para atingir seus objetivos, e algumas
dessas ferramentas exigem conhecimentos específicos e envolvem
cálculos, gráficos e diagramas.

Devemos observar apenas que as duas estatísticas têm uma


característica comum: ambas dependem do mesmo conjunto de dados.
Métodos Estatísticos Aplicados

Os métodos estatísticos aplicados envolvem o uso de técnicas


estatísticas para analisar e interpretar dados em diferentes áreas de
estudo. Por exemplo, em Saúde, esses métodos são usados para analisar
dados clínicos e de ensaios clínicos, avaliar a eficácia de tratamentos e
medicamentos, além de entender as tendências de doenças em
diferentes populações.

Os métodos estatísticos aplicados podem incluir análise de regressão,


análise de variância, análise de séries temporais, modelagem estatística,
análise multivariada, entre outros. A escolha do método a ser utilizado
dependerá dos dados e das perguntas de pesquisa em questão.
Métodos Estatísticos Aplicados

Imagine que você precisa analisar o histórico de notificações de uma


determinada doença para emitir boletins e alertas sobre o aumento de
novos casos.

Após analisar todo o histórico utilizando a análise descritiva, você


encontra um padrão sazonal que ocorre na temporada de verão, com
isso, agora é possível utilizar um modelo de série temporal para prever
qual será a quantidade de notificações projetadas para o próximo mês,
ou ainda utilizar a regressão logística prever a probabilidade de um
paciente vir a óbito dada a característica da notificação.
Métodos Estatísticos Aplicados

Como a área de métodos estatísticos é bem ampla e está em constante


evolução, existem muitas técnicas, cada uma com sua própria finalidade,
um conjunto de pressupostos e diferentes métodos de cálculo e
interpretação. Algumas das técnicas mais comuns incluem: análise de
regressão, análise de variância, teste de hipóteses, análise multivariada,
análise de séries temporais, análise de classificação, entre outras.

Cada técnica estatística é adequada para resolver um tipo específico de


problema e é importante que o analista de dados escolha a técnica
correta para sua análise. A escolha adequada da técnica estatística
também depende do tipo de dados coletados, do tamanho da amostra,
do objetivo da análise e de outros fatores importantes relacionados ao
estudo em questão.

Você também pode gostar