Escolar Documentos
Profissional Documentos
Cultura Documentos
discreta
quantitativa
Variável continua
nominal
qualitativa
ordinal
População / amostra
Designa-se a variável por uma letra maiúscula X, o valor da variável por uma letra
minúscula x. O índice (i=1,…k) representa cada uma das k modalidades da característica
em estudo.
A frequência absoluta da variável X na categoria i representa-se por Fi correspondendo ao
número de vezes que o valor da variável é observado nesta modalidade.
A partir do valor das frequências absolutas e do conhecimento da dimensão da amostra, que se
assume aqui ser n, é possível calcular as frequências relativas, frequências absolutas
acumuladas e as frequências relativas acumuladas.
Frequências-Definiçao
A frequência relativa de xi, representada por fi, é definida pelo quociente entre a
frequência absoluta e a dimensão da amostra, ou seja,
Representa a proporção de ocorrências do valor da variável na categoria i. A frequência
absoluta acumulada de xi, representada por Ni, corresponde à soma do número de
ocorrências para os valores da variável inferiores ou iguais a xi.
De forma idêntica é definida a frequência relativa acumulada de xi, representada por Fi.
Esta corresponde à soma da proporção de ocorrências registada para os valores da variável
inferiores ou iguais a xi.
Distribuição de frequência
Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los em
uma tabela, chamada, tabela de frequências.
Tabela frequência dados desagrupados
Valores da Frequencia Acumulladada Frequencia Acumulladada
variável () absoluta() Frequência relativa() Frequência
absoluta() relativa()
50%
Se n (dimensão da amostra) é impar, por Ex:
Ex.: 12, 78, 69, 75, 80, 71, 82, 73, 285 ordenar 12, 69, 71, 73, 75, 78, 80, 82, 285
Me=
Se n é par Me=)Ex.: 12, 69, 71, 73, 78, 80, 82, 785, 995 1000. Me==79
E se os dados tiverem numa tabela de
frequência?
Quartis
O primeiro quartil tem aproximadamente 25% de observações inferiores a
Q1, o segundo quartil Q2 tem cerca de 50% e o terceiro quartil, Q3 tem cerca de 75% de
observações à sua esquerda.
Qi
Box Plot / diagrama de extremos equaqqqquar
mimmim
outliers
Alem das medidas de localização é também necessário recorrer a medidas que nos
indiquem se as observações estão concentradas em torno da média, ou se pelo
contrário, as observações se encontram muito dispersas
A dispersão é definida tendo em consideração a posição das observações
relativamente a uma referência fixa que deve ser o valor escolhido para identificar a
localização da distribuição de frequências. Assim, se a localização escolhida for a
média a dispersão deve quantificar o comportamento do conjunto dos desvios em
relação à média.
A amplitude do intervalo de variação corresponde à diferença entre o maior
valor da amostra e o menor valor da amostra.
Medidas de Dispersão
Desvio médio absoluto
ou
Medidas de assimetria e Achatamento
Se As = 0, será simétrica
Se As < 0, será assimétrica esquerda (negativa)
Se As > 0, será assimétrica direita (positiva)
C=