Escolar Documentos
Profissional Documentos
Cultura Documentos
CAPÍTULO 0 - INTRODUÇÃO
ii. Uma determinada instituição financeira tem recebido, por meio do seu serviço de
atendimento ao cliente, sucessivas reclamações de clientes que alegam esperar muito
tempo antes do início do atendimento nas agências. Deve ser elaborado um
diagnóstico que forneça subsídios a uma possível elaboração de um plano de acção
para melhoria do atendimento. O que deve ser medido? Como? Deve-se incluir todas
as agências ou não? Em caso negativo, quais devem ser incluídas no estudo? Que
medidas devem ser tomadas e em quais dias da semana? Em quais horários? Os
clientes devem ser entrevistados? Em caso afirmativo, como seleccioná-los e o que
perguntar.
iii. Considere que você está a “tentar” investir no mercado de acções e decide
acompanhar a performance de um conjunto de empresas, na Bolsa de Valores, por um
determinado período de tempo, antes de tomar uma decisão sobre investir ou não.
Quais as melhores alternativas para acompanhamento dos valores / variações diárias
nas cotações das acções das diferentes empresas sob análise? É possível comparar /
relacionar a performance das acções de uma determinada companhia com aquela
divulgada diariamente para a Bolsa como um todo?
iv. Acaba de ser divulgado um estudo informando o resultado da renda per capita
Angolano no último ano e também da expectativa de vida de homens e mulheres em
nosso país. O que significam exactamente estes valores? Como interpretá-los de forma
adequada? Seriam necessárias medidas estatísticas complementares para permitir um
melhor entendimento da renda per capita e da expectativa de vida? Quais e por quê?
INFERÊNCIA ESTATÍSTICA I
Voltando no Tempo
1.1 - A Estatística
INFERÊNCIA ESTATÍSTICA I
Ou
E no plural (estatísticas):
Estatística Descritiva: É a parte que utiliza números para descrever fatos. Compreende
a organização, resumo e, em geral, a simplificação de informações. trata da
apresentação de dados em gráficos e tabelas e do cálculo de parâmetros numéricos
para descrição de dados, tais como frequências, médias, medianas, percentagens e
faixas de variação;
Probabilidade: Útil para analisar situações que envolvem o acaso (incerteza) quanto à
ocorrência ou não de um evento futuro;
INFERÊNCIA ESTATÍSTICA I
Observação: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária
traz o grande risco de erros de transcrição.
(variáveis:
"Característica" que pode assumir distintos resultados para cada um dos "objectos" ou pessoas
estudados.
1.1. DISCRETA: assume apenas um número finito ou enumerável de valores (geralmente está associada
a um processo de contagem).
Ex.: número de filhos, quantidade de defeitos, quantidade de clientes
1.2. CONTÍNUA: assume qualquer valor num intervalo (geralmente está associada a mensuração).
Ex.: peso ou altura de um indivíduo, tempo para execução de uma tarefa.
2.1. NOMINAL: não existe nenhuma ordenação nas possíveis realizações (resultados).
Ex.: procedência ou naturalidade (cidades de origem);
Sexo - masculino ou feminino;
Estado civil - solteiro, casado, viúvo, outros.
2.2. ORDINAL: existe uma possibilidade de ordenação / hierarquização dos resultados.Ex.: classe sócio-
econômica - possíveis realizações: A1, A2, B1, B2, C, D, E;
Grau de instrução - possíveis realizações: analfabeto; 1o grau incompleto, 1º grau completo, 2º grau
incompleto, 2º grau completo, graduação incompleto, graduação, pós-graduação).
Resumo
A colecta de dados pode dar-se via dados secundários, já disponíveis como fruto da
colecta de outra pessoa, grupo ou organização (que incluem estatísticas oficiais,
estatísticas não oficiais e estatísticas obtidas dentro de empresas) ou primários,
aqueles que são colectados pelo pesquisador / instituição que conduz o estudo (que
podem ser obtidos por observação, experimentação, entrevistas - com ou sem
aplicação de um questionário formal, fontes de documentação disponibilizadas por
algumas organizações).
Deve-se ter especial cuidado com o mau uso (ou uso inadequado / distorcido) da
Estatística, sendo necessário um estado de alerta para que ela não seja utilizada para
manipulação de dados, no mau sentido, para "legitimar" premissas inconsistentes ou
induzir, deliberadamente, interpretações equivocadas o que, definitivamente, não é
um papel ao qual ela se preste.
INFERÊNCIA ESTATÍSTICA I
Def.: Considere uma amostra (de dimensão n) de indivíduos com a característica X que
apresenta n modalidades observadas X1, X2, …, Xn.
Xi Frequências
Absolutas (ni)
X1 n1
X2 n2
X3 n3
! !
Xn nk
INFERÊNCIA ESTATÍSTICA I
Nº do 1 2 3 4 5 6 7 8 9 1 1 1
Cliente 0 1 2
Grau 4 3 5 1 4 4 2 5 4 3 4 5
de
satisfa
ção
Para se analisar os dados, pode-se tabular o número de vezes que cada valor de grau
de satisfação ocorreu, que é a frequência de cada valor:
Valor Frequência
1 1
2 1
3 2
4 5
5 3
Total 12
INFERÊNCIA ESTATÍSTICA I
6
Frequência 5
4
3 Série1
2
1
0
1 2 3 4 5
Grau de satisafação
Def.: Chama-se frequência absoluta de xi, e representa-se por ni, ao número de vezes
que este valor é observado. Por outras palavras a frequência absoluta de um
acontecimento é dado pelo número de ocorrências deste acontecimento.
Def.: A frequência relativa de xi, e representa-se por fi, é definida pelo quociente
entre a frequência absoluta e a dimensão da amostra, ou seja, fi = ni / n.
INFERÊNCIA ESTATÍSTICA I
Existem algumas regras básicas que deverão ser seguidas na construção dos intervalos:
Não existe fórmula exacta para o cálculo do número de classes. O bom senso diz-nos
que não deverá ser um nº muito grande, mas também não muito pequeno.
Existem algumas regras básicas que deverão ser seguidas na construção dos intervalos:
4. Os limites das classes são definidos de modo a que cada valor da variável é
incluído num e só num intervalo.
6. Deverão ser evitadas classes abertas embora nem sempre seja possível fazê-lo;
A amplitude das classes (ai) poderá ser calculada, se pretendermos todas as classes
com a mesma amplitude, da seguinte maneira: ai=R/K em que R é a diferença entre os
valores máximo e mínimo da variável e K o nº de classes.
Obs: existem diversas maneiras de expressar os limites das classes. Eis algumas:
O caso ii. é o mais usado: um intervalo fechado à esquerda e aberto à direita. O ponto
médio da classe é a média aritmética entre o limite superior e o limite inferior da
classe. Assim, se a classe for [10,12[ o ponto médio será (10+12)/2=11.
Uma vez definidas as classes e as frequências absolutas para cada classe o cálculo das
frequências relativas e acumuladas é idêntico ao das variáveis discretas.
INFERÊNCIA ESTATÍSTICA I
Exemplo:
O Sr. Mateus trabalha na agência do Lobito do banco Kwanza e tem por missão prestar
assistência a 86 clientes do balcão.
Recolheu, para tal, o saldo, em KZ, apresentado por cada um dos 86 clientes:
0 – 200
200 – 400
400 – 600
600 – 800
800 – 1000
1000 – 1200
INFERÊNCIA ESTATÍSTICA I
Frequências Frequências
Classes Absolutas Relativas
0 – 200 23 23/86
200 – 400 9 9/86
400 – 600 19 19/86
600 – 800 12 12/86
800 – 1000 18 18/86
1000 –
1200 5 005/86
Total 86
Obtida a amostra aleatória (X1,X2,…,Xn) será com base na sua realização, conjunto de
dados (x1,x2,…,xn) que serão calculadas as medidas descritivas. Estas, dividem-se
genericamente em três grupos:
- Medidas de forma
1 n
x= å xi (dados em bruto)
n i=1
1 K K
fi K
x= å
n i =1
xi ´ f i = å
i =1
xi ´
n
= å
i =1
xi ´ f i '
X G = n x1 x2 ! xn
10,15,10,15,20,20,20,20,20,15,5
INFERÊNCIA ESTATÍSTICA I
A mediana amostral é o valor que divide a distribuição amostral em duas partes iguais
(tantas observações à sua esquerda como à sua direita), sendo que todas as
observações à sua esquerda lhe são inferiores.
Desde logo pela definição, resulta que para o cálculo desta medida os dados deverão
estar ordenados. Entre várias notações para representar a amostra ordenada usar-se-á
a seguinte:
X(1),X(2),…,X(n)
ì æ n +1ö
ïX ç 2 ÷ ; se n ímpar
ïï è ø
Me = í æ n ö æn ö
ï X ç ÷ + X ç + 1÷; se n par
ï è2ø è2 ø
ïî 2
A moda amostral é o valor que mais vezes se apresenta na distribuição amostral, isto
é, o valor com mais frequência. Assim sendo, pode não existir moda para algumas
distribuições amostrais (amostra amodal); pode existir um só valor com maior
frequência (amostra modal); podem existir várias modas (amostra plurimodal).
Observação: destas três medidas, a média é a única que utiliza todos os dados
disponíveis; é ainda a mais estável. Contudo para dados qualitativos, quando as
categorias admitem uma ordem entre si (expressos numa escala ordinal), a mediana
possui uma relativa vantagem.
Outras medidas amostrais, por vezes designadas de medidas de tendência não central
são os quantis, os quais descrevem a posição relativa de certas observações na
distribuição. Os quantis mais característicos são os quartis, os decis e os percentis, os
quais dividem a distribuição amostral em partes iguais, em número de quatro, dez e
cem, respectivamente.
INFERÊNCIA ESTATÍSTICA I
Existem 3 quartis:
(Q1/4) Primeiro quartil: valor até onde se acumula o primeiro quarto (25%) dos dados,
ou seja, ¼ dos dados. Neste caso p=25% é a percentagem correspondente.;
(Q2/4) Segundo quartil: valor até onde se acumula a primeira metade (50%) dos dados,
ou seja, 2/4 dos dados;
(Q3/4) Terceiro quartil: valor até onde se acumulam os primeiros três quartos (75%)
dos dados, ou seja, 3/4 dos dados;
Por exemplo:
- D3/10 (terceiro decil) é o valor até ao qual são acumulados os primeiros 30% dos
dados;
- D5/10 (quinto decil) é o valor até ao qual são acumulados os primeiros 50% dos dados
Por exemplo:
P70/100 (septuagésimo percentil) é o valor até ao qual são acumulados os primeiros
70% dos dados;
P50/100 (quinquagésimo percentil) é o valor até ao qual são acumulados os primeiros
50% dos dados - Mediana;
Média Amostral
INFERÊNCIA ESTATÍSTICA I
Exemplo:
O valor diário das vendas (em Kz) de uma loja, ao longo de 40 dias, teve a seguinte distribuição
de frequências:
110-120 1 0,025
120-130 3 0,075
130-140 7 0,175
140-150 14 0,35
150-160 8 0,2
160-170 5 0,125
170-180 2 0,05
Vendas Nº de dias
(Xi) (Fi) fi Ci fi.Ci
logo
1 n C i ´ Fi
x= å
n i =1 N
= å C i ´ f i = 147
INFERÊNCIA ESTATÍSTICA I
em que:
0,5 - acum f ( Me - 1)
Me = li( Me) + a( Me)
f ( Me)
Exemplo:
Classes Fi
35-45 5
45-55 12
55-65 18
65-75 14
75-85 6
85-95 3
soma 58
N
i. Calcula-se = 29
2
ii. Identifica-se a classe mediana: [55,65[
iii. Calcula-se a mediana, utilizando a fórmula para frequências absolutas:
INFERÊNCIA ESTATÍSTICA I
29 - 17
Me=55+ ´ 10 = 61,67
18
Moda Amostral
Para variáveis contínuas, para o cálculo da moda é necessário definir primeiro a classe modal e
depois aplicar a seguinte fórmula:
F ( Mo + 1) Moda (frequências
Mo = li( Mo) + a( Mo)
F ( Mo - 1) + F ( Mo + 1) absolutas)
absolutas)
f ( Mo + 1)
Mo = li( Mo) + a( Mo)
f ( Mo - 1) + f ( Mo + 1) Moda (frequências
absolutas)
relativas)
Em que:
Quantis
ni - Facum(i - 1)
Qi = l inf i + ai
Fi
Classes Fi acumFi
4_9 8 8
9_14 12 20
14_19 17 37
19_24 3 40
Total 40
O 4º decil é o valor que divide a amostra em duas partes iguais, uma com 40% dos elementos e
a outra com 60%. Assim o 4º decil deverá corresponder aquele que acumula 16 observações,
uma vez que o nº total de observações é 40. A classe que contém o 4º decil é [9,14[
Logo o 4º decil é
16 - 8
D4 = 9 + ´ 5 = 12,33
12
O cálculo do 72º percentil será idêntico. P72 será o valor da variável que acumula 0,72x40=28,8
observações. A classe escolhida será [14,19[.
1 n K
M K' = å xi
n i =1
( dados em bruto)
1 J K
M K' = å xi f i
n i =1
INFERÊNCIA ESTATÍSTICA I
MK =
1 n
(
å xi - x
n i =1
)K
MK =
1 r
n i =1
(
å xi - x )K
´ fi
1.
Variância Amostral: A variância amostral de uma distribuição amostral
será dada pelo resultado seguinte:
1 n
s2 = å (x i - µ )2
n i =1 ( com média µ da população correspondente
conhecida)
2
s' =
1 n
n - 1 i =1
(
å xi - x )
2
(com µ desconhecido)
INFERÊNCIA ESTATÍSTICA I
Esta medida tem mais utilidade quando se pretende comparar a dispersão entre duas
ou mais distribuições de variáveis.
1. Coeficiente de Assimetria
x - Mo
G1 =
s'
INFERÊNCIA ESTATÍSTICA I
Q 3 + Q 1 - 2 Me
G2 = 4 4
Q3 - Q1
4 4
M3
b2 =
M 3'
Q3 - Q1
b3 = 4 4
æ ö
2çç P99 - P 10 ÷÷
-
è 10 100 ø
M4
b2 =
M 4'
INFERÊNCIA ESTATÍSTICA I
INFERÊNCIA ESTATÍSTICA I