Você está na página 1de 4

CONCEITOS BÁSICOS DE ESTATÍSTICA

1. Mediadas de posição

1.1 Média

Para calcular a média basta somarmos os números da amostra e dividir pela


quantidade de de números (n) tamanho da amostra.

Ex.: 30+24+2+5+12+7+60 / 7 = 140 / 7 = 20,0

Portanto podemos afirmar que foram vendidos em média 20 carros por mês.
Sendo assim utilizamos uma fórmula geral para média, onde n sejam os números de
X1,X2,X3, ... , Xn.. O símbolo X/ é utilizado para indicar a média.

Fórmula: x/= X1,X2,X3, ... , Xn / n

1.2 Mediana

Mediana é na verdade o ponto ao meio nos dados ex.: 35,38,36,34,25,32,30, a


mediana da amostra é o número 34 onde possuem 3 números de maior valor e 3 de
menor valor, neste caso foi mais fácil pois o número de (n) era ímpar, quando este for par
teríamos um pouco mais de trabalho ex.: 27,32,35,36,41,42,44,49,50,52, neste caso a
mediana seria o número que está no meio do caminho entre os dois números mais
próximos do meio ,ou seja, 41 e 42 para se achar a mediana podemos nos utilizar do
caçulo da média entre eles: (41+42) / 2 = 41,5.

Contanto podemos concluir que tal como a média, a mediana é uma medida que
damos o nome de tendência central da distribuição, pode –se dizer que a média ou a
mediana nos dá em geral uma idéia de qual tamanho do número vamos escolher se
selecionarmos aleatoriamente um valor na lista.

1.3 Moda

Pode –se dizer que a moda e o número que mais aparece na amostra, como exemplo
podemos citar uma amostra com os valores 12,23,45,62,34,53,12,33,44,16,21,23,12, onde
o número 12 se repetiu por três vezes logo então podemos afirmar que este e o valor da
moda, pois se repetiu mais vezes que os demais.
1.4 Percentil

Percentil indica que há x% de dados inferiores, ou seja, este dividem os valores em


100 partes iguais sendo assim nós temos 99 percentis, ex.: P65 (65º percentil) isso quer
dizer que temos 65% de dados inferiores, para calcular o percentil de uma amostra
utilizamos a fórmula abaixo:

L=(k/100).n

L= posição do percentil desejado.

K= percentil desejado.

N= número total de indivíduos na amostra.

No caso do valor de L não dar um número inteiro arredondar este para o maior
número inteiro mais próximo do resultado, ex.: L= ( 25/100).13 = 3,25 < ficaria igual a 4.

2. Medidas de disperção

2.1 Erro Padrão

Para definir o erro padrão de média suponha que amostras aleatórias de tamanho n são
retiradas de uma população e que em cada amostra seja estimada a média. Se for
computado o desvio padrão da população formada por todas as estimativas de médias
obtidas, o valor encontrado é conhecido como erro padrão de média. O erro padrão de
média (σx) é dado pela razão entre o desvio padrão populacional e a raiz do tamanho da
amostra.

σx =
O erro padrão da média é uma medida da dispersão das médias amostrais em torno da
média da população. É fácil perceber que quanto menor for seu valor, mais provável será
a chance de obter a média da amostra nas proximidades da média da população e quanto
maior for, menos provável esse evento.
2.2 Variância

Variância é o método mais conveniente e prático em relação ao desvio médio


absoluto, onde elevamos todos os desvios ao quadrado e tomamos as suas médias ao
quadrado. Para calcularmos por exemplo a variância da venda de tortas de maçã na feira
somamos os quadrados de cada desvio em relação a média, ex.:

(40-45)² + (55-45)² + (39-45)²+(48-45)²+(43-45)² =


= 5²+10²+6²+3²+2² =
= 25+100+36+9+4 =
= 174

Então dividimos esse valor por 5, pois são cinco números na lista:

Var = 174/5 = 34,8

O símbolo da variância e o σ² ( sigma ao quadrado) ou por Var(x).

A fórmula geral da variância é

Σ²= (x1-x/)²+(x2-x/)²+...(xn-x/)²/n = Ʃni = 1 (xi-x/)² / n


Para que possamos entender melhor os símbolos existentes na fórmula geral da
variância onde o x/ representa a média e o x/² representa o quadrado do valor da média,
iremos utilizar um exemplo prático conforme o apresentado acima onde x/ = 45 e x/² =
45² = 2.025 para facilitar o aprendizado, ex.:

X²/ = 40²+55²+39²+48²+43²/5 =
= 1600+3025+1521+2304+1849/5 =
= 10.299/5 = 2.059,8

Logo então a variância é

Var(x)= x/²-x/² = 2.025 - 2.059,8 = 34,8

Sendo assim idêntico ao resultado anterior.


2.3 Análise de variância (ANOVA)

A análise de variância tem como objetivo dividir a variação total em fontes


controladas pelo pesquisador e em fontes aleatórias de variação.
A soma de quadrados total está associada a n-1 graus de liberdade (GL) e a soma de
quadrados total está associada a 1 grau de liberdade, referente ao único parâmetro de
regressão estimado. A soma de quadrados de resíduos (SQR) é obtida por diferença,
assim como devem ser obtidos os graus de liberdade correspondentes. Os graus de
liberdade do resíduo são representados por v e dados por v = n – 2. Na análise de
variâncias são denominadas especialmente por quadrados médios (QM). Os quadrados
médios referentes a cada fonte de variação são obtidos pela divisão das somas de
quadrados correspondentes pelos respectivos graus de liberdade (QM = SQ/GL). O
estimador de σ² (variância residual) é dado por S² = QMRes = SQRes/(n – 2). O QM
devido a regressão é dado por QMRegressão = SQRegressão. Uma vez que os QM da
regressão e de resíduo foram calculados, pode-se utilizar o teste de F para hipóteses H0:
β1 = 0. Assim, a estatística obtida por:
Fc = QMRegressão
QMRes
Possui distribuição F com v1 = 1 e v2 = n – 2 graus de liberdade, sob H0. Portanto, a
hipótese nula deve ser rejeitada se o valor calculado superar o valor crítico, quantil
superior da distribuição F dado por Fα,v1,v2.
Dentre as formas que mais se destacam estão, análise dos resíduos por meio de gráficos
de dispersão e de testes de ajustes à distribuição normal e a estimação por intervalos.

3.0 Frequência