Inferência EstatísticaI - Capitulo I - Versão Actual

UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS
CAPÍTULO 0 - INTRODUÇÃO
§1. Utilizando a Estatística
Relatam-se quatro situações que ocorrem em diferentes contextos e para as quais os

recursos estatísticos podem ser utilizados de forma a dar grande contribuição, seja
para: estruturação de uma pesquisa e análise dos dados levantados; acompanhamento
e relacionamento de valores de natureza económica; interpretação de medidas até
certo ponto "populares" (como é o caso de renda per capita e expectativa de vida, que
são duas médias, do ponto de vista estatístico).
i. A área de recursos humanos de uma empresa deseja implementar uma pesquisa de

clima organizacional (satisfação dos empregados) para posterior elaboração de um
"plano de retenção de talentos". Como fazer? O que medir ou avaliar? Quantos
empregados entrevistar? Como seleccioná-los?
ii. Uma determinada instituição financeira tem recebido, por meio do seu serviço de
atendimento ao cliente, sucessivas reclamações de clientes que alegam esperar muito
tempo antes do início do atendimento nas agências. Deve ser elaborado um
diagnóstico que forneça subsídios a uma possível elaboração de um plano de acção
para melhoria do atendimento. O que deve ser medido? Como? Deve-se incluir todas
as agências ou não? Em caso negativo, quais devem ser incluídas no estudo? Que
medidas devem ser tomadas e em quais dias da semana? Em quais horários? Os
clientes devem ser entrevistados? Em caso afirmativo, como seleccioná-los e o que
perguntar.
iii. Considere que você está a “tentar” investir no mercado de acções e decide
acompanhar a performance de um conjunto de empresas, na Bolsa de Valores, por um
determinado período de tempo, antes de tomar uma decisão sobre investir ou não.
Quais as melhores alternativas para acompanhamento dos valores / variações diárias
nas cotações das acções das diferentes empresas sob análise? É possível comparar /
relacionar a performance das acções de uma determinada companhia com aquela
divulgada diariamente para a Bolsa como um todo?
iv. Acaba de ser divulgado um estudo informando o resultado da renda per capita
Angolano no último ano e também da expectativa de vida de homens e mulheres em
nosso país. O que significam exactamente estes valores? Como interpretá-los de forma
adequada? Seriam necessárias medidas estatísticas complementares para permitir um
melhor entendimento da renda per capita e da expectativa de vida? Quais e por quê?
INFERÊNCIA ESTATÍSTICA I
O DOCENTE: HENDA MONDLANE

Voltando no Tempo
Existem sinalizações históricas de que já se realizavam censos no Egito, Babilônia,

Grécia, Império Romano e China (isto mais de 2500 anos antes de Cristo).
O livro de Números, Antigo Testamento da Bíblia, registra logo em seu segundo

versículo que Moisés deveria levantar "o censo de toda congregação dos filhos de
Israel, segundo as suas famílias, segundo a casa de seus pais, contando todos os
homens, nominalmente, cabeça por cabeça." (aproximadamente 1400 anos antes de
Cristo). Ainda segundo a Bíblia, sob governo do Rei Davi (aproximadamente 1000 anos
antes de Cristo), ordenou-se a Joabe, chefe do Exército, que fosse feito um censo do
povo de todas as tribos de Israel, que teria durado pouco mais de nove meses para sua
realização. Mais adiante, por ocasião do reinado de César Augusto (27 a.C. a 14 d.C.),
foi tornado público um mandado convocando toda a população do Império Romano
para recensear-se (cada um alistando-se em sua própria cidade, por isto José e Maria
viajaram para Belém e ali nasceu Jesus).
Em 1086, os novos "legisladores" normandos da Inglaterra, liderados por Guilherme, o

Conquistador (William, the Conqueror), ordenaram um levantamento completo de
informações no país, que deveria contemplar dados sobre terras, seus proprietários e
o uso a elas destinado, seus empregados e animais, para subsidiar o cálculo de
impostos.
Ainda na Inglaterra, em 1662, John Graunt publicou informes/análises sobre

nascimentos e mortes, secundado por estudos de mortalidade e taxas de morbidade,
tamanho de populações, rendas e taxas de desemprego.
1.1 - A Estatística
Embora os censos sejam uma "manifestação" bastante concreta e familiar da

Estatística, há muitas outras possibilidades de estudos contemplados por esta área do
conhecimento. Convém lembrar que, mesmo com aplicações históricas que datam de
milénios, como as já apresentadas, o termo, tal como hoje é conhecido, só surgiu na
literatura em meados do século XVIII.

Assim podemos entender a Estatística como:
• Ramo da Matemática Aplicada que fornece métodos para recolha,

organização, descrição, análise e interpretação de dados e para a utilização dos
mesmos na tomada de decisões.
Ou
• Ramo do conhecimento que consta de um conjunto de processos cujo

objectivo é a observação, a classificação formal e a análise de fenómenos colectivos ou
de massa (finalidade descritiva) e, também, de investigar a possibilidade de fazer
inferências indutivas válidas a partir de dados observados e buscar métodos para
permitir essa inferência (finalidade indutiva).
E no plural (estatísticas):
• Qualquer colecção consistente de dados numéricos reunidos com a finalidade

de fornecer informações acerca de uma actividade
qualquer
Exemplos: estatísticas económicas - taxa de desemprego;

Índices de inflação;
PIB (produto interno bruto).
Como grandes áreas ou funções da Estatística, temos:
Estatística Descritiva: É a parte que utiliza números para descrever fatos. Compreende
a organização, resumo e, em geral, a simplificação de informações. trata da
apresentação de dados em gráficos e tabelas e do cálculo de parâmetros numéricos
para descrição de dados, tais como frequências, médias, medianas, percentagens e
faixas de variação;
Probabilidade: Útil para analisar situações que envolvem o acaso (incerteza) quanto à
ocorrência ou não de um evento futuro;
Inferência: Refere-se a um processo de generalização a partir de dados particulares

(em geral obtidos / levantados em uma amostra). Trata de técnicas que permitam tirar
conclusões ou tomar decisões sobre uma população a partir de evidências
apresentadas pelos dados numéricos relativos à população, ou a uma amostra dela.

Os "alicerces" da estatística inferencial foram construídos por matemáticos bastante

reconhecidos, como Bernoulli, DeMoivre e Gauss, embora apenas a partir do início do
século passado é que métodos e técnicas pertinentes à Inferência passaram a ser
estabelecidos por outros estudiosos famosos da Estatística, como Pearson, Fisher e
Gosset.
1.2 Conceitos fundamentais
População estatística ou Universo amostral: conjunto dos elementos cujos atributos

são objecto de um determinado estudo e interessam ao investigador. Assim, as
populações são os conjuntos fundamentais para efectuar análises estatísticas.
Unidade estatística: facto ou entidade elementar que é objecto de observação,

qualquer que seja a sua natureza, desde que possa corresponder a uma definição
precisa (ser vivo uma instituição um objecto vivo, instituição, objecto, um facto
qualquer, etc.).
Amostra: Colecção de dados representativa da população; subconjunto da população

para efeitos de estudo
Dimensão ou tamanho da amostra: é o número de dados da amostra. Representa-se

normalmente por n.
N representa a dimensão da população.
1.3. Fases do método estatístico
1º - DEFINIÇÃO DO PROBLEMA: Saber exactamente aquilo que se pretende pesquisar

é o mesmo que definir correctamente o problema.
2º - PLANEAMENTO: Como levantar informações? Que dados deverão ser obtidos?

Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de
actividades? Os custos envolvidos? etc.
3º - RECOLHA DE DADOS: Fase operacional. É o registo sistemático de dados, com um

objectivo determinado.
3.1 Recolha de Dados
Tendo em vista que os dados constituem a matéria prima da Estatística, a fim de

viabilizar estudos dos mais diferentes fenómenos e de variáveis a eles associadas, é
muito importante que sua recolha seja feita da forma mais adequada, sendo que há
duas formas básicas pelas quais eles podem ser obtidos:
• Dados Secundários - dados já coletados por outra pessoa ou organização.

• Dados Primários - oriundos de nosso próprio processo de coleta.

Observação: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária
traz o grande risco de erros de transcrição.
( fenómenos: Qualquer evento (acontecimento), seja ele natural, social, económico ou

biológico, que se pretenda analisar e cujo estudo seja passível da utilização de técnicas
estatísticas)
(variáveis:
"Característica" que pode assumir distintos resultados para cada um dos "objectos" ou pessoas
estudados.
1. QUANTITATIVA: representa uma realização numérica (números resultantes de uma contagem ou

mensuração)
1.1. DISCRETA: assume apenas um número finito ou enumerável de valores (geralmente está associada
a um processo de contagem).
Ex.: número de filhos, quantidade de defeitos, quantidade de clientes
1.2. CONTÍNUA: assume qualquer valor num intervalo (geralmente está associada a mensuração).
Ex.: peso ou altura de um indivíduo, tempo para execução de uma tarefa.
2. QUALITATIVA: representa uma qualidade ou atributo do "indivíduo" pesquisado.
2.1. NOMINAL: não existe nenhuma ordenação nas possíveis realizações (resultados).
Ex.: procedência ou naturalidade (cidades de origem);
Sexo - masculino ou feminino;
Estado civil - solteiro, casado, viúvo, outros.
2.2. ORDINAL: existe uma possibilidade de ordenação / hierarquização dos resultados.Ex.: classe sócio-
econômica - possíveis realizações: A1, A2, B1, B2, C, D, E;
Grau de instrução - possíveis realizações: analfabeto; 1o grau incompleto, 1º grau completo, 2º grau
incompleto, 2º grau completo, graduação incompleto, graduação, pós-graduação).
4º - APURAMENTO DOS DADOS: Resumo dos dados através de sua contagem e

agrupamento. É a condensação e tabulação dos dados.
5º - APRESENTAÇÃO DOS DADOS: Há duas formas de apresentação, que não se

excluem mutuamente. A apresentação tabular ou seja é uma apresentação tabular,
numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo
regras práticas fixadas. A apresentação gráfica dos dados numéricos constitui uma
apresentação geométrica permitindo uma visão rápida eclara do fenómeno.
6º ANÁLISE E INTERPRETAÇÃO DOS DADOS:
A última fase do trabalho estatístico é a mais importante e delicada. Está ligada

essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é
descrever o fenómeno (estatística descritiva) descritiva).

Na estatística indutiva a interpretação dos dados se fundamentam na teoria da

probabilidade.
Resumo
Foi apresentada uma breve "localização" histórica de levantamentos estatísticos (com

destaque para os censos), mostrando que, a despeito de conceitos teóricos, a
necessidade de dispor de dados confiáveis a respeito de determinados fenómenos, de
uma população (ou universo) e algumas de suas características (ou variáveis), sempre
se fez presente na história, desde anos anteriores ao nascimento de Cristo.
Os conceitos introdutórios de Estatística incluem variáveis (quantitativas e

qualitativas), censo e amostragem, universo / população (todos os indivíduos ou
objectos) e amostra (uma parte do universo). Suas grandes áreas ou funções são
Estatística Descritiva, Probabilidade e Inferência.
Estatísticas dizem respeito a conjuntos numéricos (taxas, índices / indicadores)
vinculados a determinados fenómenos (económicos, sociais, demográficos).
A colecta de dados pode dar-se via dados secundários, já disponíveis como fruto da
colecta de outra pessoa, grupo ou organização (que incluem estatísticas oficiais,
estatísticas não oficiais e estatísticas obtidas dentro de empresas) ou primários,
aqueles que são colectados pelo pesquisador / instituição que conduz o estudo (que
podem ser obtidos por observação, experimentação, entrevistas - com ou sem
aplicação de um questionário formal, fontes de documentação disponibilizadas por
algumas organizações).
Deve-se ter especial cuidado com o mau uso (ou uso inadequado / distorcido) da
Estatística, sendo necessário um estado de alerta para que ela não seja utilizada para
manipulação de dados, no mau sentido, para "legitimar" premissas inconsistentes ou
induzir, deliberadamente, interpretações equivocadas o que, definitivamente, não é
um papel ao qual ela se preste.

CAPÍTULO I – ESTATÍSTICA DESCRITIVA
Estatística Descritiva é um conjunto de técnicas – analíticas e gráficas – que permitem

descrever, resumir e representar de forma compreensível a informação contida em
conjuntos significativamente grande de dados.
Perante um conjunto desorganizado de dados torna-se difícil, frequentemente, a

compreensão da informação neles contida. Para além das representações gráficas, a
Estatística Descritiva trata de calcular um conjunto de medidas que têm por objectivo
descrever e resumir a informação subjacente aos dados. Tais medidas são designadas
por parâmetros quando os dados dizem respeito a própria População – o que
raramente acontece e traduzem realizações de estatísticas quando tratamos de
amostras
§1. Distribuição de frequências
1.1. De variáveis discretas
A distribuição de frequências constitui o método de organização de informação mais

utilizado em estatística.
Os quadros e gráficos de frequências permitem agregar e sintetizar grandes

quantidades de informação sem perda duas características fundamentais.
Def : Considere se uma população (de dimensão N) ou
Def.: Considere uma amostra (de dimensão n) de indivíduos com a característica X que
apresenta n modalidades observadas X1, X2, …, Xn.
Dá-se o nome de distribuição de frequências ao conjunto de todos os valores ou

modalidades possíveis de uma variável e das frequências ou número de ocorrências
correspondentes
Como construir o quadro de distribuição de Frequências?
Numa coluna colocam-se todos os valores que a variável apresenta;
Xi Frequências
Absolutas (ni)
X1 n1
X2 n2
X3 n3
! !
Xn nk

Ex.: Medidas do grau de satisfação com os serviços de homebanking de um dado

banco para uma amostra de 12 clientes do banco (1 = completamente insatisfeito; 5=
completamente satisfeito):
Nº do 1 2 3 4 5 6 7 8 9 1 1 1
Cliente 0 1 2
Grau 4 3 5 1 4 4 2 5 4 3 4 5
de
satisfa
ção
Para se analisar os dados, pode-se tabular o número de vezes que cada valor de grau
de satisfação ocorreu, que é a frequência de cada valor:
Valor Frequência
1 1
2 1
3 2
4 5
5 3
Total 12
O exemplo acima corresponde ao que se chama de uma distribuição de frequências.

Pode-se apresentar os mesmos dados através de um diagrama de frequências, que dá
uma ideia da “forma” da distribuição ao cobrir todos os resultados possíveis:

6
Frequência 5
4
3 Série1
2
1
0
1 2 3 4 5
Grau de satisafação
Def.: Chama-se frequência absoluta de xi, e representa-se por ni, ao número de vezes
que este valor é observado. Por outras palavras a frequência absoluta de um
acontecimento é dado pelo número de ocorrências deste acontecimento.
A partir das frequências absolutas podem-se calcular as frequências relativas, as

frequências absolutas acumuladas e as frequências relativas acumuladas
Def.: A frequência relativa de xi, e representa-se por fi, é definida pelo quociente
entre a frequência absoluta e a dimensão da amostra, ou seja, fi = ni / n.
Def.: As frequências acumuladas são a soma do número de ocorrências para os

valores da variável inferiores ou iguais ao valor dado. Representam, assim, o número
ou proporção de elementos observados que possuem o valor da característica igual ou
inferior à modalidade em causa.
A frequência acumulada em b é dada pela soma das frequências absolutas (ou

relativas) dos valores da b variável inferiores ou iguais a b.
Na prática podem entretanto, ser calculadas e interpretadas frequências acumuladas

em sentido descendentes.
1.2 Distribuição de Frequências em Variáveis Contínuas
As variáveis contínuas por poderem tomar um nº infinito não-numerável de valores,

obrigam-nos à definição de classes (intervalos) de valores, que passam a ser as
modalidades da característica em estudo. Para definir estas classes é necessário
introduzir alguns novos conceitos: o nº de classes, a amplitude, limite e ponto médio
ou centro das classes.

Existem algumas regras básicas que deverão ser seguidas na construção dos intervalos:
Não existe fórmula exacta para o cálculo do número de classes. O bom senso diz-nos
que não deverá ser um nº muito grande, mas também não muito pequeno.
Existem algumas regras básicas que deverão ser seguidas na construção dos intervalos:
1. Em geral, o nº de classes (K) deverá estar compreendido entre 4 e 14;
2. Nenhuma classe deverá ter uma frequência nula;
3. As classes deverão ter, sempre que possível, amplitudes iguais;
4. Os limites das classes são definidos de modo a que cada valor da variável é
incluído num e só num intervalo.
5. Os pontos médios das classes deverão ser nºs de cálculo fácil;
6. Deverão ser evitadas classes abertas embora nem sempre seja possível fazê-lo;
Nota: um método que muitas vezes é adoptado é a fórmula de Sturges

K=1+3,22*log(n)
A amplitude das classes (ai) poderá ser calculada, se pretendermos todas as classes
com a mesma amplitude, da seguinte maneira: ai=R/K em que R é a diferença entre os
valores máximo e mínimo da variável e K o nº de classes.
Obs: existem diversas maneiras de expressar os limites das classes. Eis algumas:
i. [10,12]: compreende todos os valores entre 10 e 12;

ii. [10,12[: compreende todos os valores entre 10 e 12, excluindo o 12;
iii. ]10,12]: compreende todos os valores entre 10 e 12, excluindo o 10.
O caso ii. é o mais usado: um intervalo fechado à esquerda e aberto à direita. O ponto
médio da classe é a média aritmética entre o limite superior e o limite inferior da
classe. Assim, se a classe for [10,12[ o ponto médio será (10+12)/2=11.
Uma vez definidas as classes e as frequências absolutas para cada classe o cálculo das
frequências relativas e acumuladas é idêntico ao das variáveis discretas.

Exemplo:
O Sr. Mateus trabalha na agência do Lobito do banco Kwanza e tem por missão prestar
assistência a 86 clientes do balcão.
Preocupado em ter sempre presente o maior nº de respostas possíveis, resolveu fazer

um estudo desses clientes, em termos do saldo das suas contas.
Recolheu, para tal, o saldo, em KZ, apresentado por cada um dos 86 clientes:
127 831 627 187 417 891

141 729 898 218 932 521
433 143 945 514 505 729
1049 218 1080 817 815 149
80 185 78 510 910 429
327 205 49 495 125 129
890 1190 194 921 714 91
415 890 215 118 694 329
325 439 198 811 200
214 753 425 94 496
87 650 329 37 148
23 659 405 73 518
814 437 400 921 714
Valor mínimo(xi): 23,
Valor máximo (xi):1190
Considerando classes com amplitude 200, pode-se definir as classes, da seguinte

forma:
0 – 200
200 – 400
400 – 600
600 – 800
800 – 1000
1000 – 1200
Definiram-se assim 6 classes, representadas por 6 intervalos, com amplitude constante

Construção do quadro de frequências: para construção do quadro de frequências, é

necessário ter consideração que, uma observação de valor 200, por exemplo, deverá
pertencer ao intervalo 200- 400, uma observação de valor 800, pertence à classe 800-
1000. Logo tem-se:
Frequências Frequências
Classes Absolutas Relativas
0 – 200 23 23/86
200 – 400 9 9/86
400 – 600 19 19/86
600 – 800 12 12/86
800 – 1000 18 18/86
1000 –
1200 5 005/86
Total 86
§2. Tipos de Medidas
As medidas que a seguir veremos têm como objectivo descrever e resumir um

determinado conjunto de dados, com base nestes ou a partir da distribuição de
frequências.
Obtida a amostra aleatória (X1,X2,…,Xn) será com base na sua realização, conjunto de
dados (x1,x2,…,xn) que serão calculadas as medidas descritivas. Estas, dividem-se
genericamente em três grupos:
- Medidas de localização (posição ou tendência central)
- Medidas de dispersão (variação)
- Medidas de forma
2.1 Medidas de localização
2.1.1 Variáveis Discretas
Os valores destas medidas tendem a informar sobre a localização de certos valores

importantes da distribuição amostral. Usam-se para descrever ou resumir o conjunto
de valores que a variável assume.
I. Média Amostral: a média amostral mais utilizada designa-se frequentemente

por média aritmética, representa-se por x e calcula-se do modo seguinte:

1 n
x= å xi (dados em bruto)
n i=1
1 K K
fi K
x= å
n i =1
xi ´ f i = å
i =1
xi ´
n
= å
i =1
xi ´ f i '
(distribuição de frequências: K é o mínimo de observações distintas na distribuição de

frequências)
f i - frequência absoluta
f i ' - frequência relativa
Nota: por vezes é comum diferenciar a média da Amostra em relação a média da
População
1 n
x = å xi - média da amostra
n i =1
n
1
µ=
N
å x - média da população
i =1
i
i. Quando os dados resultam de variáveis aleatórias cujas variações sejam

proporcionais ao valor inicial, tornar-se-á mais recomendado o uso da média
geométrica (por exemplo dados relativos a índice de preços ao consumidor ou outros):
X G = n x1 x2 ! xn
ii. Se os dados resultam de variáveis aleatórias indicando proporcionalidade

inversa, a média harmónica caracterizará melhor esses dados
1 1
XM = K = K
1 1 1 1 '
å
n i=1 xi
fi å
n i=1 xi
fi
(Quando todos os fi forem iguais a um, tem-se K=n)
Exemplo: As temperaturas observadas em certa localidade, em 10 dias consecutivos,

sempre à mesma hora foram as seguintes (em C º ):
10,15,10,15,20,20,20,20,20,15,5
a. Calcule a média amostral mais recomendada

b. Calcule as outras médias

II. Mediana Amostral (Me)
A mediana amostral é o valor que divide a distribuição amostral em duas partes iguais
(tantas observações à sua esquerda como à sua direita), sendo que todas as
observações à sua esquerda lhe são inferiores.
Desde logo pela definição, resulta que para o cálculo desta medida os dados deverão
estar ordenados. Entre várias notações para representar a amostra ordenada usar-se-á
a seguinte:
X(1),X(2),…,X(n)
onde X(1)=min {x1,x2,…,xn}

X(n)=máx {x1,x2,…,xn}
ì æ n +1ö
ïX ç 2 ÷ ; se n ímpar
ïï è ø
Me = í æ n ö æn ö
ï X ç ÷ + X ç + 1÷; se n par
ï è2ø è2 ø
ïî 2
III. Moda Amostral
A moda amostral é o valor que mais vezes se apresenta na distribuição amostral, isto
é, o valor com mais frequência. Assim sendo, pode não existir moda para algumas
distribuições amostrais (amostra amodal); pode existir um só valor com maior
frequência (amostra modal); podem existir várias modas (amostra plurimodal).
Observação: destas três medidas, a média é a única que utiliza todos os dados
disponíveis; é ainda a mais estável. Contudo para dados qualitativos, quando as
categorias admitem uma ordem entre si (expressos numa escala ordinal), a mediana
possui uma relativa vantagem.
Outras medidas amostrais, por vezes designadas de medidas de tendência não central
são os quantis, os quais descrevem a posição relativa de certas observações na
distribuição. Os quantis mais característicos são os quartis, os decis e os percentis, os
quais dividem a distribuição amostral em partes iguais, em número de quatro, dez e
cem, respectivamente.
Quartis: dividem a distribuição em 4 partes iguais;

Existem 3 quartis:
(Q1/4) Primeiro quartil: valor até onde se acumula o primeiro quarto (25%) dos dados,
ou seja, ¼ dos dados. Neste caso p=25% é a percentagem correspondente.;
(Q2/4) Segundo quartil: valor até onde se acumula a primeira metade (50%) dos dados,
ou seja, 2/4 dos dados;
(Q3/4) Terceiro quartil: valor até onde se acumulam os primeiros três quartos (75%)
dos dados, ou seja, 3/4 dos dados;
Decis: dividem a distribuição em 10 partes iguais;

Existem 9 decis;
Por exemplo:
- D3/10 (terceiro decil) é o valor até ao qual são acumulados os primeiros 30% dos
dados;
- D5/10 (quinto decil) é o valor até ao qual são acumulados os primeiros 50% dos dados
Percentis: dividem a distribuição em 100 partes iguais;

Existem 99 decis;
Por exemplo:
P70/100 (septuagésimo percentil) é o valor até ao qual são acumulados os primeiros
70% dos dados;
P50/100 (quinquagésimo percentil) é o valor até ao qual são acumulados os primeiros
50% dos dados - Mediana;
Note-se que a mediana é um quantil que se verifica para p=0.5.
2.1.2 Variáveis Contínuas
Média Amostral
Para o caso de variáveis contínuas, para efectuar o cálculo da média, é necessário

considerar as várias classes ou intervalos em que a variável se encontra dividida. O
primeiro passo consiste na definição dos centros ou pontos médios das
1 n C ´ Fi
classes: x = å i = å Ci ´ f i
n i =1 N

Exemplo:
O valor diário das vendas (em Kz) de uma loja, ao longo de 40 dias, teve a seguinte distribuição
de frequências:
Vendas (Xi) Nº de dias (Fi) Fi
110-120 1 0,025
120-130 3 0,075
130-140 7 0,175
140-150 14 0,35
150-160 8 0,2
160-170 5 0,125
170-180 2 0,05
Calculam-se os centros de cada classe:
Vendas Nº de dias
(Xi) (Fi) fi Ci fi.Ci
110-120 1 0,025 115 2,875
120-130 3 0,075 125 9,375
130-140 7 0,175 135 23,625
140-150 14 0,35 145 50,75
150-160 8 0,2 155 31
160-170 5 0,125 165 20,625
170-180 2 0,05 175 8,75
logo
1 n C i ´ Fi
x= å
n i =1 N
= å C i ´ f i = 147
IV. Mediana Amostral (Me)

Para o caso de uma variável contínua agrupada em classes, o cálculo da

mediana pode ser assim definido:
N
i. Calcula-se a ordem . Sendo a variável contínua não há necessidade de
2
diferenciar entre N par e ímpar;
ii. Pelas frequências acumuladas identifica-se a classe que contém a
mediana e que será a classe mediana;
iii. Calcula-se o valor exacto da mediana através da seguinte fórmula:
N - F ( Me - 1)
Me = li(Me) + 2
acum
a(Me)
F (Me)
(cálculo da Mediana usando frequências absolutas)
em que:
li(Me): limite inferior da classe mediana;
Facum(Me-1): frequência absoluta acumulada das classes anteriores à classe mediana;
F(Me): frequência absoluta da classe mediana;
a(Me): amplitude da classe mediana
0,5 - acum f ( Me - 1)
Me = li( Me) + a( Me)
f ( Me)
(cálculo da Mediana usando frequências relativas)
Exemplo:
Classes Fi
35-45 5
45-55 12
55-65 18
65-75 14
75-85 6
85-95 3
soma 58
N
i. Calcula-se = 29
2
ii. Identifica-se a classe mediana: [55,65[
iii. Calcula-se a mediana, utilizando a fórmula para frequências absolutas:

29 - 17
Me=55+ ´ 10 = 61,67
18
Moda Amostral
Para variáveis contínuas, para o cálculo da moda é necessário definir primeiro a classe modal e
depois aplicar a seguinte fórmula:
F ( Mo + 1) Moda (frequências
Mo = li( Mo) + a( Mo)
F ( Mo - 1) + F ( Mo + 1) absolutas)
absolutas)
f ( Mo + 1)
Mo = li( Mo) + a( Mo)
f ( Mo - 1) + f ( Mo + 1) Moda (frequências
absolutas)
relativas)
Em que:
li(Mo): limite inferior da classe modal;
F ( Mo - 1) , f ( Mo - 1) : frequências absoluta e relativa, respectivamente, da classe anterior à

classe modal;
F ( Mo + 1) , f ( Mo + 1) : frequências absoluta e relativa, respectivamente, da classe a seguir à

classe modal;
a(Mo): amplitude da classe modal
Quantis
Para o cálculo dos quantis, recorre-se à fórmula genérica:
ni - Facum(i - 1)
Qi = l inf i + ai
Fi
linfi: limite inferior da classe escolhida;
ni: número de observações;
Facum(i-1): frequências acumuladas até à classe anterior à escolhida;


Fi: frequências da classe escolhida;
ai: amplitude da classe escolhida
Exemplo: Calcular o 4º decil e o 72º percentil da seguinte distribuição:
Classes Fi acumFi
4_9 8 8
9_14 12 20
14_19 17 37
19_24 3 40
Total 40
O 4º decil é o valor que divide a amostra em duas partes iguais, uma com 40% dos elementos e
a outra com 60%. Assim o 4º decil deverá corresponder aquele que acumula 16 observações,
uma vez que o nº total de observações é 40. A classe que contém o 4º decil é [9,14[
Logo o 4º decil é
16 - 8
D4 = 9 + ´ 5 = 12,33
12
O cálculo do 72º percentil será idêntico. P72 será o valor da variável que acumula 0,72x40=28,8
observações. A classe escolhida será [14,19[.
2.2 Medidas de dispersão
As medidas de dispersão têm como objectivo descrever a variabilidade das

observações da distribuição amostral.
Iremos antes definir os momentos de uma distribuição;
i. Momentos de ordem K em relação à origem
Os Momentos de ordem K ou momento ordinal de ordem K em relação à origem

podem ser definidos como sendo a média das potências de expoente K das
observações da distribuição amostral, representa-se por E(X)K, tem-se:
1 n K
M K' = å xi
n i =1
( dados em bruto)
1 J K
M K' = å xi f i
n i =1

Note-se que em particular, tem-se M’1= média
ii. Momentos centrais de ordem K
Os Momentos centrais de ordem K ou momentos de ordem K relativamente a

média, podem definir-se como sendo a média das potências de expoente K dos
desvios entre as observações e a média amostral
MK =
1 n
(
å xi - x
n i =1
)K
MK =
1 r
n i =1
(
å xi - x )K
´ fi
Analisemos agora as medidas de dispersão;
1.
Variância Amostral: A variância amostral de uma distribuição amostral
será dada pelo resultado seguinte:
1 n
s2 = å (x i - µ )2
n i =1 ( com média µ da população correspondente
conhecida)
2
s' =
1 n
n - 1 i =1
(
å xi - x )
2
(com µ desconhecido)
Este último resultado é o mais utilizado, pois normlamente desconhece-se a

média da população µ. Ao substituir esse parametro pela média –
estimativa de µ, deve-se dividir a soma dos quadrados por n-1.
Note-se que a variãncia amostral está directamente relacionada com o

2 n
momento central de ordem dois: s ' = M2
n -1

A variancia tem uma desvantagem que se prende com a dificuldade da sua

interpretação em várias situações, pelo facto de se expressar no quadrado
das unidades da variável. No exemplo em causa, a variancia seria 25(ºC)2.
Assim surge a necessidade de definir a medida de dispersão seguinte:
2. Desvio Padrão Amostral
Esta medida é definida como sendo a raiz quadrada positiva da variância e

representa-se por s ou s’
3. Amplitude amostral - Esta medida é calculada pela diferença entre a

observação máxima e a observação mínima: A=X(n) – X(1)
4. Coeficiente de Variação - esta medida é geralmente expressa em

2 s'
percentagem e é calculada por: CV s ' = ´ 100%
x
Esta medida tem mais utilidade quando se pretende comparar a dispersão entre duas
ou mais distribuições de variáveis.
2.3 Medidas de Forma
As medidas de forma – coeficiente de assimetria e coeficiente de achatamento – têm

por objectivo informar-nos sobre a forma da distribuição amostral.
1. Coeficiente de Assimetria
Há várias maneiras de analisar a simetria de uma distribuição amostral.
i. Comparando as três medidas de tendência central
Mo £ Me £ x Þ Distribuição ! assimétrica a direita

Mo = Me = x Þ Distribuição ! assimétrica
x £ Me £ Mo Þ Distribuição ! assimétrica a esquerda
ii. Calculando os coeficientes de Pearson
x - Mo
G1 =
s'

Q 3 + Q 1 - 2 Me
G2 = 4 4
Q3 - Q1
4 4
Gi < 0 Þ distribuiçãoassimétric a esquerda

Se Gi = 0 Þ distribuiçãosimétrica
Gi > 0 Þ distribuiçãoassimétric a direita
iii. Coeficiente baseado em momentos centrais
M3
b2 =
M 3'
ì< 0 Þ distribuição assimétrica à esquerda

ï
b1 = í= 0 Þ distribuição assimétrica à esquerda
ï> 0 Þ distribuição assimétrica à esquerda
î
2. Coeficiente de achatamento (curtose)
Ao calcular um coeficiente de achatamento pretende-se analisar o grau de

achatamento de uma distribuição, isto é, pretende-se saber se a distribuição é
muito ou pouco espalmada. Podem usar-se os seguintes coeficientes de
achatamento:
i. Baseado nos quantis
Q3 - Q1
b3 = 4 4
æ ö
2çç P99 - P 10 ÷÷
-
è 10 100 ø
ì< 0.263 Þ distribuição menos achatada

ï
b3 = í= 0.263 Þ distribuição normalmente achatada
ï> 0.263 Þ distribuição mais achatada
î
ii. Baseado em momentos centrais
M4
b2 =
M 4'

ì< 3 Þ distribuição mais achatada

ï
b2 = í= 3 Þ distribuição normalmente achatada
ï> 3 Þ distribuição menos achatada
î

Inferência EstatísticaI - Capitulo I - Versão Actual

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Inferência EstatísticaI - Capitulo I - Versão Actual

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE AGOSTINHO NETO - FACULDADE DE CIÊNCIAS

§1. Utilizando a Estatística

Relatam-se quatro situações que ocorrem em diferentes contextos e para as quais os

i. A área de recursos humanos de uma empresa deseja implementar uma pesquisa de

O DOCENTE: HENDA MONDLANE

Existem sinalizações históricas de que já se realizavam censos no Egito, Babilônia,

O livro de Números, Antigo Testamento da Bíblia, registra logo em seu segundo

Em 1086, os novos "legisladores" normandos da Inglaterra, liderados por Guilherme, o

Ainda na Inglaterra, em 1662, John Graunt publicou informes/análises sobre

Embora os censos sejam uma "manifestação" bastante concreta e familiar da

O DOCENTE: HENDA MONDLANE

Assim podemos entender a Estatística como:

• Ramo da Matemática Aplicada que fornece métodos para recolha,

• Ramo do conhecimento que consta de um conjunto de processos cujo

• Qualquer colecção consistente de dados numéricos reunidos com a finalidade

Exemplos: estatísticas económicas - taxa de desemprego;

Como grandes áreas ou funções da Estatística, temos:

Inferência: Refere-se a um processo de generalização a partir de dados particulares

O DOCENTE: HENDA MONDLANE

Os "alicerces" da estatística inferencial foram construídos por matemáticos bastante

1.2 Conceitos fundamentais

População estatística ou Universo amostral: conjunto dos elementos cujos atributos

Unidade estatística: facto ou entidade elementar que é objecto de observação,

Amostra: Colecção de dados representativa da população; subconjunto da população

Dimensão ou tamanho da amostra: é o número de dados da amostra. Representa-se

N representa a dimensão da população.

1.3. Fases do método estatístico

1º - DEFINIÇÃO DO PROBLEMA: Saber exactamente aquilo que se pretende pesquisar

2º - PLANEAMENTO: Como levantar informações? Que dados deverão ser obtidos?

3º - RECOLHA DE DADOS: Fase operacional. É o registo sistemático de dados, com um

3.1 Recolha de Dados

Tendo em vista que os dados constituem a matéria prima da Estatística, a fim de

• Dados Secundários - dados já coletados por outra pessoa ou organização.

O DOCENTE: HENDA MONDLANE

( fenómenos: Qualquer evento (acontecimento), seja ele natural, social, económico ou

1. QUANTITATIVA: representa uma realização numérica (números resultantes de uma contagem ou

2. QUALITATIVA: representa uma qualidade ou atributo do "indivíduo" pesquisado.

4º - APURAMENTO DOS DADOS: Resumo dos dados através de sua contagem e

5º - APRESENTAÇÃO DOS DADOS: Há duas formas de apresentação, que não se

6º ANÁLISE E INTERPRETAÇÃO DOS DADOS:

A última fase do trabalho estatístico é a mais importante e delicada. Está ligada

O DOCENTE: HENDA MONDLANE

Na estatística indutiva a interpretação dos dados se fundamentam na teoria da

Foi apresentada uma breve "localização" histórica de levantamentos estatísticos (com

Os conceitos introdutórios de Estatística incluem variáveis (quantitativas e

O DOCENTE: HENDA MONDLANE

CAPÍTULO I – ESTATÍSTICA DESCRITIVA

Estatística Descritiva é um conjunto de técnicas – analíticas e gráficas – que permitem

Perante um conjunto desorganizado de dados torna-se difícil, frequentemente, a

§1. Distribuição de frequências

1.1. De variáveis discretas

A distribuição de frequências constitui o método de organização de informação mais

Os quadros e gráficos de frequências permitem agregar e sintetizar grandes

Def : Considere se uma população (de dimensão N) ou

Dá-se o nome de distribuição de frequências ao conjunto de todos os valores ou

Como construir o quadro de distribuição de Frequências?

Numa coluna colocam-se todos os valores que a variável apresenta;

O DOCENTE: HENDA MONDLANE

Ex.: Medidas do grau de satisfação com os serviços de homebanking de um dado

O exemplo acima corresponde ao que se chama de uma distribuição de frequências.

O DOCENTE: HENDA MONDLANE

A partir das frequências absolutas podem-se calcular as frequências relativas, as

Def.: As frequências acumuladas são a soma do número de ocorrências para os