A estatística básica é uma disciplina fundamental que lida com a coleta,
análise, interpretação e apresentação de dados. Seu objetivo principal é extrair informações significativas e úteis a partir de conjuntos de dados, permitindo a compreensão e a tomada de decisões fundamentadas em diversas áreas, desde a ciência até os negócios e a vida cotidiana. Neste resumo, abordaremos os principais conceitos da estatística básica, incluindo medidas de tendência central, dispersão, distribuições de probabilidade e intervalos de confiança.
Medidas de Tendência Central:
As medidas de tendência central são utilizadas para descrever o valor central
de um conjunto de dados. As três medidas mais comuns são a média, a mediana e a moda. A média é calculada somando todos os valores e dividindo pelo número total de observações. A mediana é o valor que divide os dados em duas metades iguais quando eles estão ordenados. A moda é o valor mais frequente no conjunto de dados.
Medidas de Dispersão:
As medidas de dispersão fornecem informações sobre a variabilidade ou a
dispersão dos dados em torno da medida de tendência central. A variância e o desvio padrão são as medidas mais utilizadas para quantificar a dispersão dos dados em relação à média. A variância é a média dos quadrados das diferenças entre cada valor e a média, enquanto o desvio padrão é a raiz quadrada da variância. Quanto maior a variância ou o desvio padrão, maior é a dispersão dos dados. Distribuições de Probabilidade:
Uma distribuição de probabilidade descreve as probabilidades associadas aos
diferentes resultados de um experimento aleatório. A distribuição normal, ou gaussiana, é uma das distribuições mais importantes na estatística. É caracterizada por sua forma de sino e é amplamente utilizada devido ao Teorema Central do Limite, que afirma que a média de um grande número de observações independentes de uma variável aleatória seguirá uma distribuição normal, independentemente da distribuição subjacente dos dados.
Além da distribuição normal, outras distribuições importantes incluem a
distribuição binomial, que descreve o número de sucessos em um número fixo de tentativas independentes com uma taxa de sucesso constante, e a distribuição de Poisson, que modela a ocorrência de eventos raros em um intervalo fixo de tempo ou espaço.
Intervalos de Confiança:
Um intervalo de confiança é uma faixa de valores em torno de uma estimativa
de parâmetro que tem uma determinada probabilidade de conter o verdadeiro valor do parâmetro. É utilizado para quantificar a incerteza associada a uma estimativa e é calculado a partir dos dados amostrais e do nível de confiança desejado. Quanto maior o nível de confiança, maior será o intervalo de confiança, refletindo uma maior incerteza na estimativa do parâmetro.