Você está na página 1de 254

PE

ISEL ENGENHARIA CIVIL



EST ATisTICA

• interpretar

ESTATisTICA

Q conjunto de instrumentos adequados para:

• recolher

conjuntos de dados

• explorar

• descrever

Populacao

. Q coleccao de unidades individuais, com uma ou mais.i.caracteristicas ... comuns (caracteristicas de interesse), que se pretendem analisar.

Razoes que conduzern it recolha de urna arnostra, em virtude de nao ser possivel estudar toda a populacao

(Nem sempre e possivel estudar exaustivamente todos os elementos de uma populacao - censo)

• Impossibilidade material (dimensao da populacao infinita);

• Observacao destrutiva (estudo da populacao pode levar adestruicao da mesma);

• Economia(estudo da populacaopode ser muito dispendiose.em-rempccu.dinheiro).

Arnostra

Q subconjunto representativo de dados ou observacoes recolhidas aleatoriamente de uma populacao, que se estuda com o objective de tirarconclusoes para a populacaode onde foi recolhida, relativamente a caracteristica(s) de interesse.

1) Fase de recolha da amostra ~ muito importante

Amostra deve ser recolhida por urn processo aleatoric e deve ser tao representativa quanta possivel da populacao que se pretende estudar, pois vai ser a partir do estudo da amostra que vamos tirar conclusoes para a populacao (Inferencia Estatistica).

Observaeoes:

2) Se 0 conjunto de dados nao for recolhido aleatoriamente, este pode nao ser representativo da populacao, pelo que nao devemos designa-lo por amostra; mas por coleceao de dad os.

I

Metodo estatistico de resolueao de urn problema

o Identificacao do problema em analise;

@ Recolher a informacao (dados) necessaria de acordo com 0 objectivo do problema;

8Classificar e organizar os dados (construcao de uma base de dados em suporte informatico );

o Aconselhar a decisao mais adequada e a conclusao final para toda a popolacao.

o Analise dos dados e apresentacao dos resultados conclusivos;

.I

... ~

• reduz a quantidade de informacao atraves de medidas de estatistica descritiva (media, variancia, ... ), tabelas e graficos;

EST ATisTICA DESCRITIV A

• consiste na classificacao e organizacao dos dados;

• Sao muito diferentes WlS dos outros?

• possibilita a identificacao de uma estrutura subjacente aos dados, caso ela exista,

Questoes relevantes relativas ao conjunto de dados:

G Os dados sao quase todos iguais?

• De que modo e que sao diferentes?

• Existe alguma estrutura subjacente ou alguma tendencia?

• Existem alguns agrupamentos especiais?

• )3xistem alguns dados muito diferentes da maior parte?

~--------~

n Pretende

~ estudar-se

Dado Estatistico

resultado da-medieao-ou classificacao de uma de uma dada , . ~<uacteristica de interesse, para cada elemento da amostra; ou seja, valor observado de uma variavel aleat6ria.

Dado Bruto

dado tal como e recolhido, antes de qualquer tratamento.

Ordenaeao

urn tipo de tratamento estatistico dos dados brutos. Esta ordenacao e usualmente crescente, pois tern mais interesse estatistico.

Tabela de frequencias tabela que resume os dados ordenados de modo a poderem ser interpretados. Pode tambem designar-se por Quadro de freguencias ou Distribuis;ao de freguencias.

D I Ordena(:iio crescente

Dado Ordenado ~i)

D I Construyao ( Tabela de Frequencias 1

:,', '.~., .

Escalas de Medida

Dados gualitativos (nao metricos):

Escala nominal - relacao de igualdade entre as categorias (Ex. local da obra onde se aplica 0 betao)

(caso particular - escala binaria ou dicotomica)

Escala ordinal - relacao de ordem entre as categorias

(Ex. classes de betao - pensando que cada classe corresponde a uma certa qualidade de betao)

Dados guantitativos (metricos):

Discretos ou Continuos

Escala de intervalos ~ para alem das propriedades da escala ordinal, tern uma outra: a distancias iguais correspondem quantidades iguais.

(Ex. temperatura do ar em graus Fahrenheit - escala continua)

Com estes dados alteracoes nas unidades de medidanao.afectam.os .racios entre .dois val ores.

Escala de racios

para alem das propiiedades da escala de intervalos continua, possui urn zero absoluto como valor minimo.

o racio entre 0 peso de duas sacas de cimentoe sempre 0 mesmo qualquer que seja a unidade de medida (quilos, gramas, etc). lOoC=50°F e 30°C=86°F mas 10°CI30°Ct50°F/86°F

(Ex. tempo de execucao de uma tarefa, peso de sacas de cimento, comprimento de vigas)

TIPOS DE DADOS (qualitativos ou quantitativos)

Varuivel

c::; caracteristica comum;que assume valores diferentes de individuo para individuo.

c::; Representam a informacao que identifica alguma qualidade, categoria ou caracteristica, nao susceptivel de medida, mas de classificacao, assumindo varias

modalidades.

DADOS QUALITATIVOS

Exemplos:

• 0 local onde 0 betao e aplicadonuma obra e uma variavel qualitativa nominal corn varias categorias, como por exemplo: vigas, lages, escadas e pilares/paredes .

• A classe de betao pode ser considera e uma variavel qualitativa ordinal pois podemos estabelecer uma relacao de ordem entre as diferentes categorias, por exemplo, 0 betao da classe C20/25 e mais fraco em termos de qualidade de betao, relativamente ao betao

C25/30.

~ Categorias (~)

• Frequencias absolutas (Fj)

• Frequencias relativas (fj)

n --) dimensao ou n" de elementos daamostra

Organiza~ao dos dados --) Tabela de frequencias

f. = Fj

J n

I

L:f·=l .i=I J

I

Variavel aleatoria em estudo:

i.xemplo: (Tabela de frequencias para dados qualitativos)

N° de vezes que se aplicou betao
Local nesse local
Vigas 40
Lages 39
Escadas 16
Pilares e paredes 24
Total 119 ~ Local da obra onde foi utilizado 0 betao

DADOS QUANTITATIVOS

q Representarn a informacao resultante de caracteristicas susceptive is de serem medidas, apresentando-se com diferentes intensidades, que podem ser de natureza discreta (dados discretos) ou continua (dados continuos).

Vartavel Continua ~

Pode assurnir todos os val ores numericos, inteiros ou nao, compreendidos no seu intervalo de variacao .

Varravel Discreta ~

Se so pode assumir urn numero finito ou infinito numeravel de valores distintos.

. Organizaeao ~ Tabela de Frequencias

•. para as varlaveis continuas tern que construir-se classes, e posteriormente contar quantos dos individuos ou objectos pertencem a cada classe.

• para as variavels discretas, a construcao da tabela e analoga it que foi feita para os dados qualitativos, mas em vez das categorias consideram-se os valores distintos que surgern na arnostta;

I II

,

TABELAS DE FREQuENCIAS (varia vel discreta)

aj

(Valores distintos assumidos pela v.a.)

Fj (Frequencies Absolutas)

~

(Frequencias Relativas)

TOTAL

1

Exemplos: (Tabelas de frequenciasde dados discretos)

Caracteristica de interesse (v. a.) Numero de sacas de. cimento.que chegam diariamente a uma central de betao (em centenas)

Nota: f = F/n (i = 1,2, ... , n)

a,

(Valores distintos assumidos _pela v.a.)

o 1 2 3 4 5

n

£

1

(Frequencies Relativas)

0,100 0,067 0,200 0,267 0,233 0,133

Fj (Frequencies Absolutas)

3 2 6 8 7 4

TOTAL

Caracteristica de interesse (v.a.) Numero de individuos por agregado domestico privado

Numero de IndividuosFrequencias Absolutas . Frequencias Relativas

I

1 2 3 4 5

~6

n=30

1

1138 2748 2304 2082

848 520

0,118 0,285 0,239 0,216 0,088 0,054

TOTAL

1,000

9640

Fonte: lnqueritos aos Orcamentos Familiares 1989/1990, I.N.E., Lisboa, 1992.

II

, .'

.. : ::, '.

Exemplo: (Tabela defrequeaeias para dados discretos)

Os seguintes valores representam 0 numero de acidentes de trabalho por mes, nao mortais, que ocorrem em determinada fabrica, entre Janeiro de 2001 e Outubro de 2003 (34 valores):

Valores observados Freq. Abs. Freq. ReI. Freq. Abs, Ac, Freq, ReI. Ac. I
1 3 0,088 3 0,088
2 9 0,264 12 0,352
5 6 0,177 18 0,529
7 6 0,177 24 - 0,706 .
8 2 0,059 26 0,765
9 2 0,059 28 0,824
- 12 3 0,088 31 0,912
14 2 0,059 33 0,971
.
15 1 0,029 34 1,000
Total 34 ·1,000 ----- ----- :
I 5,2, 1,2,2, 15,9, 8,2, 1,8, 7, 5, 14,2,9, 1, 7, 7,2, 2, 5, 12,5,2, 7, 7, 14, 5, 12,2,5, 7,

12

1°) Ordenar os val ores

1, 1, 1,2,2,2,2,2,2,2,2,2,5,5,5, 5, 5, 5, 7, 7, 7, 7, 7, 7, 8, 8,9,9, 12, 12, 12, 14, 14,

2°) Construcao da tabela

!

II

TABELA DE FREQuENCIAS - V ARIA VEL CONTINuA

ROL DE V ALORES -) DADOS AGRUPADOS (ou CLASSIFICADOS)

1- Determinacao da AMPLITUDE TOTAL 2 - Defini~ao das CLASSES

3 - Contagem da FREQUENCIA (absoluta) de cada classe

I = max (x;) - min ( x )

1 - Amplitude total

2 - Definif;ao das classes

2.1 - Numero de classes (m) - Algumas regras

1. 0 menor inteiro m tal que 2 m ~ n;

2. Formula de Sturges: m a 1+[3,22xlogJo(n)];

(100 < n < 10 000), embora seja esta a regra mais usada, mesmo para n fora do intervalo considerado valido para esta regra;

3. m = 5 para n s 25 e m := -Jll para n > 25 .

4. Em alternativa a regra ou formula de Sturges, em especial para valores

baixos de n, pode indicar-se a:
(& Tabela de Kelley:

~
n m
5 2
10 4
25 6
50 8
100 10
200 12
500 15
1000 20 [h,4[

2.2 - Amplitude das classes

t

a = - (arredonda-se 0 valor por excesso)

m

2.3 - Defini';3o das classes

» Construir classes que nao se interceptem, de modo que tenham todas a mesma amplitude, e cuja uniao contenha todos os elementos da amostra.

Metodologia para a construcao das classes c, = [Cj,Ci+l [:

• Primeira classe

C1 = [ minimo da amostra, minimo da amostra+a]

• Outras classes

C, = [ minimo da amostra +(i - l)a, minimo da amostra + ia [ , i = 2, ... ,m.

» Conta-se 0 numero de elementos da amostra, que pertencem a cada classe; esses valores serao as frequencias absolutas das classes, a sernelhanca do caso discreto.

3-Contagem II~II~

Classes

TABELAS DE FREQUENCIAS

(variavel continua)

F

I

(Frequencies Absolutas)

f

(Frequencies Relativas)

[1,; 12[ [12; 13[

f

I

TOTAL

Nota: :ti = F/n (i = 1, 2, ... , n)

Exemplos: (fabelas de frequsncias.de-dadoseoaunaes). - .. ,-, .. ,

Caracteristica de interesse (v.a.) Tensao derotura .acompressao.ipara 0 betao da classe C25/30 (em Mpa)

Classes de Fj ~
resistencia (Frequencies (Frequencias
Absolutas) Relativas)_
[28; 31,5[ 2 0,02
[31,5; 35[ 9 0,09
[35; 38,5[ 28 0,28
[38,5; 42[ 34 0,34
[42; 45,5[ 16 0,16
[45,5; 49[ 8 0,08
[49; 52,5[ 3 0,03
TOTAL n=100 1 1

n

Caracteristica de interesse (v.a.) Resistencia a compressao numa determinada liga de aluminio e lftio (em psi=medida que representa uma libra por area de superficie)

.,,,:=<":,.

Classes de Resistencia

Frequencias.Absolutas ,

Frequen_d~s Relativas

[70; 90[ [90; 130[ [130; 150[ [150; 170[ [170; 210[ [210; 230[ [230; +oo[

2 9 14 22 27

4 2

0,025 0,113 0,175 0,1]5 0,338 0,050 0,025

TOTAL

n=80

1

Exemplo: (Tabela defrequeneiaspara dados continuos)

Considerern-se os seguintes dados relativos asempos de CPU (em segundos) gastos por urn prograrna que utiliza urn determinado Software de Estatistica (20 valores observados):

~ Amplitude de classe: 7,7/5 = 1,54 => a = 1,6

12,1 8,9 8,2 9,8 15,1 14,5 13,4 14,7 7,5 8,8 12,4
15,2 13,5 13,8 14,6 7,8 12,5 13,2 11,0 10,5
1°) Ordenar a amostra
7,,5 7,8 8,2 8,8 8,9 9,8 10,5 11,0 12,1 12,4 12,5 13,2
13,4 13,5 13,8 14,5 14,6 14,7 15,1 15,2
4.~J"Constru~ao da tabela
.. '"~~ Dimensao da arnostra: n = 20
%~>~~:.
-:_,::.-
~ Amplitude da amostra: I = 15,2 - 7,5 = 7,7 ~ Numero de classes: m = 5 (pois m == 1 + [3,22x log 10(20)] = 5,19 - Regra de Sturges)

~ Classes:

C1 = [7,5; 7,5 + 1,6[ = [7,5; 9,1[ C2 = [9,1; 9,1 + 1,6[ = [9,1; 10,7[

C3 = [10,7; 10,7 + 1,6[ = [10,7; 12,3[ C4 = [12,3; 12,3 + 1,6[ = [12,3; 13,9[ C5 = [13,9; 13,9 + 1,6[ = [13,9; 15,5[

~ Tabela de frequencias:

.~:~,:
.•. Classes freq. abs. freq. reI. freq. abs. ac. freq. rel. ac.
c, = l7,5; 9,1[ 5 0,25 5 0,25
C2 = [9,1; 10,7[ 2 0,10 7 0,35
C3 = [10,7; 12,3 [ 2 0,10 9 0,45
C4 = [12,3; 13,9 [ 6 0,30 15 0,75
C5 = [13,9; 15,5 [ 5 0,25 20 1,00
Total 20 1,00 ----- ----- Representaeao Gratica de Dados

Variaveis discretas ~ Diagrama de Barras

q Representacao grafica num sistema de eixos coordenados, que consiste ern marcar no eixo das abcissas os diferentes valores observados, e nesses pontos barras verticais de altura igual a frequencia absoluta ou a frequencia relativa que lhes corresponde.

Os extremos das barras podem unir-se com uma linha que se designa por poligono de f req uencias.

Exemplo:(Diagrama de Barras I Poligono de Frequencias)

Relativamente ao exemplo anterior sobre a construcao da tabela para dados discretos, temse 0 seguinte grafico de barras relativamente as frequencies relativas:

0,300 0,250 0,200 0,150 0,100 0,050 0,000





II .. ..
I I I I 1 2 5 7 8 9 12 14 15

N° de acid detrahalho

o graficp de barras relativo as frequencias'relativas'aeumuladas - e{)·'$~guime:

1,000
0,800
0,600
0,400
0,200
0,000 •
1 2 5 7 8 9 12 14 15

N° de acid. de trabalho

Var iaveis continuas --) Histograma (diagrama de areas)

II II

Q representacao grafica de dados continuos, constituido por uma sucessao de rectangulos adjacentes, tendo cada urn por base urn intervalo de classe e por area a frequencia relativa ou a frequencia absoluta. A area total do histograma e assim igual a 1 ou igual a n, respectivarnente. A linha poligonal que une os pontos cujas abcissas sao os pontos medics de cada c1asse e as ordenadas a respectiva frequencia dessa classe, designa-se por poligono de frequencias.

Observaeoes:

Para q~e a area do rectangulo, correspondente a classe Cj, seja fi ou F;_, a altura desse

··-s,

rectangulo devera ser fj Jaj ou F, Jaj , sendo aj a amplitude da classe Cj•

Se todas as classes tiverem igual amplitude (aj = a), simplifica-se a construcao do histograma, considerando para alturas dos rectangulos as frequencies relativas, nao esquecendo que a area total ocupada pelo histograrna e igual 1. Se em vez das frequencias relativas, utilizarmos as frequencias absolutas, entao a area do histograrna tern que ser igualan.

,

, ....

0,35 -,------------------,

0,30 +----------.-/---:7"" :::=--'i-----J

~:;: V'" / \

~'~~ p ....... "'----L-T-l

o:~if I f\

O:~-+_--~---~--~---~-----J I~ ~ -.

I Tempos de CPU I

L- ~

C1 C2

C3

C4

Exemplo: (Histograma I Poligono de Frequencias)

Relatisamente ao exemplo anterior relativo a construcao da tabela de frequencies para dados continuos, 0 histograma de frequencias relativas vern:

C5

1,20

1,00 ~
0,80
0,60 /

0,40 ;_...-
- --
0,20 ~
0,00-
C1 C2 C3 C4 C5 I Tempos de CPU I o histograma das frequencias relativas acurnuladas vern:

.-- r---
I- .--
I-- r-
I-- rrU I to

Aspectos mais frequentes de urn Histograma

Distribui~oes SimHricas:

Distribuicao das frequencies e aproximadamente simetrica, relativamente a uma classe media.

Dlstribuicoes Enviesadas:

~-:~

Distribuicao das frequencies e acentuadarnente assimetrica.

enviesada a esquerda ou assimetrica positiva

enviesada a direita ou assimetrica negativa

11

Distribuicoes com Caudas Longas:

Distribuicao das frequencias com grande numero de classes nos extremos, CUJ3S frequencias sao pequenas, relativamente as classes centrais.

Distribui~oes com vartos "picos" ou modas:

Distribuicao das frequencias apresenta 2 ou mais "picos" designados por modas (dados constituidos por grupos distintos).

~ ~

CARACTERiSTICAS A.MQ§;TRAIS

Tabelas e graficos q processos de resumir a informacao contida nos dados

Estatisticas Q outro processo de resurrur essa informacao consiste na

utilizacao de deterrninadas medidas calculadas a partir dos dados

Carac.teriza~ao dos dados

l1

Atraves de medidas de:

• Localizaeao

(localizam 0 centro da amostra)

• Dispersao

( medem a variabilidade dos dados )

• i\ssi~etria

( avaliam a simetria dos dados )

• Achata~ento (indicam a intensidade das frequencias na vizinhanca dos valores centrais)

Amostra

Amostra ordenada

ordenar

MEDIDAS"DE LOCALIZA<;AO

Dados Nao ~g.r_~lp~.~9s 00 Nao Classificados

Medidas de tendencia central: media, mediana e moda.

Mediaaritmetica amostral

,,;:.;.:.;:

Mediana ~ valor (pertencente ou nao a amostra) que a divide em duas partes iguais

{X(n/2) +X(nj2+1)

Med= 2

X«n+l)/2)

, sen par

, senimpar

• .Se n e par, a mediana e a media entre os elementoscentrals (de ordem n/2 e

n/2 + 1);

• Se n.e impar, a mediana e 0 elemento central (de ordem (n + 1)/2).

Moda ~ eo valor que tern maior frequencia.

A utilizacao desta medida de localizacao faz mais sentido em amostras grandes de uma variavel discreta.

Qp={~(xnp:n+xnp+l:n) , senpinteiro

X[np]+ l:n ' se np nao e inteiro

Medidas de telldencia nao central: quartis,decis e percentis.

Quantis-» 0 quantil de ordem p (0 < p < 1)

[a] a parte inteira dea.

Dependendo do valor de p os quantis podem ter outras designacoes:

• p = 1/2

quantil de ordem 1/2 (mediana);

• p =3/4

quanti! de ordem 3/4 (30 quartil ou quartil superior);

• p = 1/4

quantil de ordem 1/4 (10 quartil ou quartil inferior);

I

• p = if10 0 (i = 1,2,. . .,99) quantis designam-se por percentis.

• p = i/10 (i = 1,2,. . .,9) quantis designam-se por decis;

Dados Agrupados ou Classificados

Dados Discretos:

Sejam:

J ~ numero de valores distintos observados na amostra;

F-

I

~ frequencia absoluta do valor i;

f.

I

~ frequencia relativa do valor i;

a· 1

~ valor i assumido pela variavel discreta.

Media

1 j j

x = - "a·f. = "a·f.

L.II L.Il·

n i=l i=l

A mediana, os quantis e a moda calculam-se de modo analogo aoapresentado para dados nao agrupados.

Dados Continuos:

Sejam:

m ~ numero de classes;

Fi ~ frequencia absoluta da classe i;

fi ~ frequencia relativa da classe i;

x'i ~ ponto medic da classe 1, 0 qual e considerado como elemento representativo da classe.

Media

- lz_:m'F mZ_:'f

x:::::- x·· - x··

- 11- II

ni=l i=l

Observaeees:

• Mediapode ser enviesada por valores extremos; e muito sensivel a valores muito grandes ou muito pequenos (nao e resistente).

• Media pode deixar de ser representativa se a distribuicao formuito assimetrica, visto 0 seu

calculo considerar todas os valores observados.

/

• A mediana e uma medida mais resistente do que a media, uma vez que s valores extremos, quer sejam grandes ou pequenos, nao afectam 0 seu valor.

,2~

qCaracterizam a variabilidade .ou dispersao dos dados relativamente a uma medida de localizacao da amostra

--!\iiioIDAS DE DISPERSAO

EXEMPLO:

Amostra Dados Media Mediana
1 15 15 15 15 15 15 15
2 10 13 15 17 20 15 15
3 0 7 15 23 30 15 15 * Amostras com a mesma media e a mesma mediana

* Amostras com variabilidades distintas

Medida de Localizaeao

Nao chega para caracterizar uma amostra

Medida de Dispersao

Determinar variabilidade ou dispersao dos dados relativamente a medida de Iocalizacao da amostra

,- c: ,('J

2 In 21n22

s =- L(xi -x) =- LXi - x

ni=l ni=l

C"=>Medidas de dispersao para dados nio agropados 00 nao classificados

Varlfmcia-e- medida de dispersao que se obtem somando os quadrados dos desvios das observacoes, relativamente it media, e dividindo pelo numero de observacoes:

Observaeees:

* A variancia e sempre nao negativa.

* A variancia nao se exprime na mesma unidade que os dados originais; pelo que, e necessario outra medida de dispersao ~ desvio-padrao.

Desvio padrao

- Observacoes:

* 0 desvio padrao assume sempre valores nao negativos . .. .; Quanto menor for s menor sera a dispersao dos dados. ~ Na pr3tica, sobretudo em amostras peguenas ~

deve utilizar-se a variancia corrigida e 0 desvio padrao corrigido, para eliminar 0 erro sistematico ouenviesamento.

,2 1 n _ 2 1 n 2 n_2

s =-- L (Xi -x) =-- L xi ---x

n -1 i=l n -1 i=l n-l

Variancia corrigida~ medida de dispersao que se obtem somando os quadrados dos desvios das observacoes, relativamente a media, e dividindo pelo numero de observacoes menos uma:

, ) 1 n _ 2 lIn 2 n_2

s = -- L(xi -x) =11-- LX· ---x

n-1i=1 vn-1i=11 n-l

Relaeao entre a variancia e a variancia corrigida:

Desvio padrao corrigido

Amplitude amostral

Int6"rvalo inter-quartis

• 0 intervalo inter-quartis e mna medida nao negativa; cujo valor reflecte a variabilidade dos dados;

• Se 0 intervalo inter-quartis for igual a zero, isso nao implica que os dados nao apresentem variabilidade.

Observaeoes:

• 0 intervalo inter-quartis contem aproximadamente 50% dos elementos do meio da amostra;

==> Medidas de dispersao para dados agropados 00 classificados

Dados discretos:

Sejam:

J

~ numero de valores distintos da amostra; ~ valor i assumido pela variavel;

at

F-

t

~ frequencia absoluta do valor i;

Variancia corrigida

,2 1 J _ 2 1 2 n_2

s =-- L(aj -x) Fj =-- La- Fj ---x

n-l i=l n-l 1 n-l

Dados continuos:

Sejam:

m ~ numero de classes;

&"".!). V

X'j ~ ponto medic da classe i (x'i=(lim inf +lim sup)/2);

Fj ~ frequencia absoluta da classe i;

Variancia corrigida

I

I

,2 1 ~(' -)2F 1 ,2F n_2

s =-- c: Xj-X i=--LX- j---X

n-l i=I n-l I n-l

~ medidas de dispersao independentes da unidade de medida dos dados

M"F,l)IDAS DE DISPERSAO RELATIV A

==l Para comparar a dispersao de varias amostras, utilizam-se:

did d di ....; -' 1 ° medida de dispersao absoluta

me 1 a e ispersao re ativa =-----~-----

medida de localizacao

Medidas de dispersao absoluta ~ Se sao verificadas as tres condicoes seguintes:

• as dados de varias amostras distintas se exprimem na mesma unidade

• As amostras tern localizacoes identicas

• Os fenomenos em estudo sao da mesma natureza

s: .. ~.

'S\:; Medidas de dispersao relativa ~ Se pelo menos uma das tres condicoes seguintes

se verificar:

• as dados de varias amostras distintas se exprimem em diferentes unidades

• As amostras nao tern a mesrna localizacao

• as fen6rnenos em estudo nao sao da rnesma natureza

Coeficiente de dispersao

Coeficiente de varia.yao

s'

CV =-xl00% x

• CVsI5%

~ dados apresentam pouca variabilidade

• CV ~30%

~ dados apresentam elevada dispersao

• 15% < CV < 30% ~ dados apresentam uma dispersao media

X· (Xi - X) 2 Xi (Xi - X) 2 Xi (Xi - X) 2
1
3 36 3 36 3 144
6 9 6 9 6 81
8 1 9 ° 9 36
12 9 12 9 12 9
16 49 15 36 45 900
Total 104 90 1170
X = 9 9 15
-, ,2 16,640 14,400 1-87,200
-s =
c.:.~w.
i.::,::.~
.,.._ ..... S' = 4,079 13,682
3,795
cd = 0,453 0,422 0,912 Xi (Xi - X) 2 X· (Xi - X) 2
1
. : . ..5 ° 50 0
8 9 80 900
2 9 20 900
Total 18 1800
0
.
x = 5 50
S,2 = 4 400 I
s' = 2,000 20,000
)1
cd = 0,400 0,400 v ARIA VEL ESTANDARDIZADA (NORMALIZADA)

{U=O

U'

1 S~ = 1

X' -x ( )

L Fi Ui L Fi ___!---- L Fi xi - Fi X

; = i = -"--- __ s_ = i = nx - nx = 0

n ns ns

n

31

~ ~ 11"'1 11"'1 11"'1 \0 0 0
rIl t-- ~ '<:t ~ ...... 0
-
~ '<:t~ r-- ~ t:--- t:---~ o~
I~ ~ 0 o~ 0 ...... ~
I I I
x-
"-"
II
::r
ii,
0\
t.:i r-
0
~ x- ~ \0 00 ('.I \0 ~
l-< ~ ~
U
rIl
.....
-e
....... II II
v
,~ I~ rIl
.....
ta
> ,
rIl r- \0 \0 t:--- 0 0 0 1\
- 00 0\ ('.I 00 t:--- 0
~ ~ 0\ ('.I ~ r-- 0
I~ ~ 0 o~ 0 ~
~ ~ ~
I I
x-
"-"
II
::r
'<:t
~
~
0 0 t:--- t:--- ~ I/")
x- ~ ~ ...... 0 oo~
I I/") I/")
I ~ '<:t '<:t
_e .... ...,._.
~-:;~~::i <
~
SS ~ I/") 11"'1 '<:t '<:t 0\ 0 0
i rIl \0 I/") 0\ ...... 0\ 0
-
~ ('.I" t:--- ...... ~ O\~ 0"
I~ ~ 0 <:5 <:5 ~ ~
I I I
x-
<;»
0 II
Z ::r
~
~ t:---
~
0
0 0 I/") 0\ 00
x- I/") 11"'1 ...... I/") ~ ~ 0\
11"'1 ...... ~ ~ ~
>-
~\
. Metodo rnais sirn les ara se rnedir 0 rau de assirnetria de urna distribui 30

MEDIDAS DE ASSIMETRIA

A assimetria resulta da existencia na amostra de valores extremamente elevados ou

pequenos

cornparacao de tres medidas de tendencia central: a media (X), a mediana (Med) e a moda(Mod).

x = Med = Mod Distribuicao simetrica

Distrtbuieao simetrica

-+ a media, a moda e a mediana sao iguais

Dlstrlbuicao assimetrica positiva ou enviesada it esquerda -+ a media ~ mediana ~ moda

Distribuleao assimetrica negativa ou enviesada it direita -+ a media ~ mediana ~ moda

I -,

Mod

Med X

X Med Mod

Distribuicao assimetrica positiva ou enviesada a esquerda

Oistribui~o assimetrica negativa ou enviesada a direita

G1 E [-3, 3]

Q075 +Qo 25 -2 Med

G 2 =' I Q (coeficiente

mais

Coeficientes de assimetria

Coeficiente de Pearson ~

iG _- X-sM, odi

, _ (s6 pode ser usado quando existe moda, 0

que rnuitas vezes nao acontece)

GE[-3,3]

Gl = 3(x-Med)

s'

(so

valido

para

curvas

Coeficiente de assimetria ~

moderadamente assimetricas)

Coeficiente de Bowley ~

resistente a outliers)

Coeficiente baseado nos momentos ~

(este e 0 coeficiente que na rnaioria das vezes aparece nos outputs dos programas estatisticos; e independente da unidade em que se exprime tern a vantagern de fomecer 0 sinal da assimetria).

Sendo II1k 0 memento de ordem k em rela~o a media

m)r.'f<+ Para qualquer urn dos 4 coeficientes deassimetria anteriores tem-se:

• Se G = 0 a distribuicao e simetrica.

• Se G > 0 a distribuicao e assimetrica positiva ou enviesada a esquerda.

• Se G < 0 a distribuicao e assimetrica negativa ou enviesada a dire ita.

Curtose ~ grau de achatamento de uma distribuicao

MEDIDAS DE ACHATAMENTO OU "CURTOSE"

q indicam a intensidade das frequencies na vizinhanca dos valores centrais

Coeficiente de achatamento ~

K = 2(PO,90 - PO,10)

IQ

sendo:

IQ

= Intervalo inter-quartis

PO,90 = quantil de ordern 0,90 ; Po 10 =quantildeordernO,10.

,

~"f_:'.~ ~~~}

• Se K = 0,263 a distribuicao de frequencies tern urn achatamento medic

~ mesocurtiea.

• Se K < 0,263 a distribuicao de frequencies tern urn achatamento elevado ~ platicurtica

• Se K > 0,263 a distribuicao de frequencies tern urn achatamento fraco

~ leptocurtica

Coeficientes baseados nos momentos ~

• Se c = 0 a distribuicao de frequencies tern urn achatamento medic ~ mesoeartiea.

• Se c < 0 a distribuicao de frequencies tern urn achatamento elevado ~ platieurtica

• Se c> 0 a distribuicao de frequencias tern urn achatamento fraco ~ leptocurtica

leptocurtica

~
ro
13
0
.ro
s::: T'"
0 Q)
U) Cl
'6 ro
U) Q.
0
"'C
ro
"'C
X
W cs
e ~
_ < 'C
,Q
i:!
~
CS
'C
e

'"
i
e
e
I :_ e
It'S
=
'"
.;
'"
=

e
'"

....
=

'C
...
~
=

'C
0
=
~
'C
i
a
~
~ J ~ ~ <Ii ~
] 0 0
~ ~ Po. Po. a
8 \0 ~ G) .Ei .§
'" a> a ~
ell ell I-< '" 0
~ 'i 'g a on M G) ell ell .....
0 s '1:: G) '" ~ gj gj ~ g
I=: ~ ~ ] G) .13 !
0 El a ~ ..... ~
'5 :;::l
.g ...... ell
~ ........ ........ ........ M
'5 M M .... \0
N Ii
'G) ;:- M M .... 0
...!.... I I
....... ....... /\
0\ 0 0 0 0 0 0 0 0 0 0 00 ~ M N 0 0
on 0 0 0 0 0 0 0:- t"- o 0 00 r- \0 0 0
0 q o~ 0 0 0 0 M .... 0 0 \0 0\ 0\ r- o ......
..0- on N N ~ N N~ r-: ..,f ..,f ..0- 0 \0 o~ 0 0 0
.... .- ....
~
0\
on
0
..0-
* ~ r-
,-., ....
...... 0 ..,f
M 0 t"- \0
~ .- .... -- --
*
e ,-., -e ,-., ,-., ,-.,
N 0\ on on
0\ -- ,-.,
.4h\~-.~ -- ,-., on I * N
,-., M !::! on 0 ,-., 0\ N I
,-.. ':0 'N N
on ,-.. .... ,-., ...... .... ..0- ..0 I 10" I .-
,-.. \0 -- -- 0 '-'
+ 0\ N M ~ N '.<",", -- t-- '0\ ..0 .00 *
N >< >< >< N 0\ N r- .- on + t!-
oo 00 .- ~ '-'
'-' G) II II .- ..... I I ..f' 0 * cs
,;"::---.~ v II ~ II II r-: on 00 ..0- M
M 0 0 .- .... II II '-' \0
k~' ::; -- 13 I=: ~ ~ 0\ .... II II II
,:::~~~. \0 ~ II II II
0 ~ .... M 0 g- o e t> .... 8
N El 0 0 p.. -ell -til p:: ..... o 0 0 ::.a
,-..
....
e
,-.. ~ €
\0 ,-.,
....: ,-., t!- .... r
'm 0\ ~ + ,-.,
f 0 ....
(U ,-..
13 .... i +
,-., + M
0 .... II '>(
.ea + 10
C ~ ,-.. II C\I
00 ....
0 '>( + ,-., Q)
If) II .... !i
II ......
'5 ,-.. \0 + 0..
,-., .... 0 ~
If) .- +
0 + ~
'0 ........ .....
ea ...... on '>( .......
'0 10 .0 II '>(
N ~ ~ II ~
x -<; '-' 0
w ,-.. '>( >< 0\ 0 ~
0 ....
,-.. II II o~
00 s p.. p
.... ~ ~ p..
>< ~ 0 9'
.- M ·il 0 ,-..
+ 0 0 0\
0 ·il .... ..._
= ,-.. ~ 0 0 .E 0 "2-
CJ t"- .E
0 ·c .... g. ·il ·il ~ t!- fa
,Q >< .E II 0 I 'til ii
~ '-' !tIS ~ ..._
.g \0 = ,-..
= II ,g ,g o~ -.:to~ '>! "2- a 0
-= v 13 ~ fa ....
= M '" 1=1 1=1 ..... M 0 ~ * g-
-= ~ El '0 on 10 II II :g -til ii N
,5 ~ .0 .g 0
e §' §' 't;j 0 I
G) 0 0 g- Il ~ ~ ~ .... a ::t 0
:g bIl ::t * I M 0\
.~ §' §' -.:to -.:to '" ,-., "2- 0 0
't;j .9 <1:1 ..... ..... til .... .... C<I
* 43 '>( 0 '" ~ :§ ~
~ Ih Ih :a +
-.:to v ,-., g. ~ *
e til M M 0\ I 'G) ..§ g N
e til Ih Ih 6" 6" .- ~ ~ ..§ ....
II Po. 0 0 -- .!::l M -til * 0
= .- ..... -til 0
'G) .... .- .._, 0 .._, M .._,
.= '" ~ ~ -- 0 II e '>( II II .....
= :g v 0 II II II
M .... M 0\ ...... ~ II II e >- II
.ra II II ~ ~ ~ 0 ..... 8
C<I El I=: -; Po. -til -til p:: ..... o 0 ::.a
'"
= '"
~ .... ]
e -; = =
~ ~
'" '" u
... e
~ = e .!l J! e
= ~ .= ~
~ u = = '" s C<I -=
-= .! = e .g 1 e ~ = ~ 'E a
'r;:; ... 0 0 '! 'bh .= til i G) ~ G)
CJ ::! ~ '"
= = 0\ .- ~ c C<I .13 ~ i3 0
~ <~ <~ ! ! .~ ~ 'E 8. ~ ..... .§ ~ ~
~ til S =
-= "CI :~ 8 i1 gj '5
e = = 0 :a ; p..
= ~ ~ ~ ~ "CI ,g ~ :s .s .g .g .g ~ CIS G)
"0
e ~ ~ .g G) ~ 8 43 ~ ~ G) ~ G) ~ G)
"CI "CI "CI G) G) "CI -=
"0 .g G) 5 ij 5 5 5
..s ; ; ~ ~ I'll C<I C<I ] ! ; '"
C<I $ $ ~ '0 Po. § CIS
Co :g ~ fa -= g ! c&i 0 ~ ~ :g '0 '0 '0 -e ~
e t 1 :a .~ - 1 1 ~ 1 ...
"CI ii '5 i i "CI I
~ ~ i::r i::r ~ ~ ~ ~ 8
r.l ~ ~ ~ ~ 0 0 >- ~ o o o o o o
.... ...... Po. Po.
-.31 Ex. dados disc. classificados

Exemplo do n° de acidentes mensais naomortais em .dada fabrica

raj Fi fi ai*fi ai*Fi aiA2*Fi
1 3 0,088 0,088 3 3
2 9 0,265 0,529 18 36
5 6 0,176 0,882 30 150
7 6 0,176 1,235 42 294
8 2 0,059 0,471 16 128
9 2 0,059 0,529 18 162
12 3 0,088 1,059 36 432
14 2 0,059 0,824 28 392
15 1 0,029 0,441 15 225
Total 34 1,000 6,059 206 1822 n

media

ou 206/34

Variancia 18

Corrigida 1822/33-(34/33)*6,059A2=

Desvio Padrao 17,39037"(1/2)= Corrigido

Page 1

6,059

17,390

4,170

I,

~
ro
'0
s
c -e-
..... <1l
c C)
8 ro
e,
t/)
0
"'C
ro
"'C
X
W " •. ~ i

...:

.~

13 o t«l C

~ 8

en o "0 co "0

Jj

~ :t ~ S!

& 8 ~ ~

N -...

o .t= .2 .S

V)

II

g-

II

o .....

o .!:l .2 .S

V) e-

n ... g- 0 <j;l

I=: (3

o .....

o

0\ II 0..

o .....

00

;::

~

o .t= .2 .8

N II

g-

o N II I=:

(3

o

..... -...

i ~ 0.. ]

ell

000

;;0 ~ ~ ~ ..0 N~ t-.:' ..,;

~

V) r-

oo • ..... .....

* ;--.

0\

.....

o ~

'tZ

o o .....

*

~

~ -€ ~

II

> U

o

..... .... -... -... ....

~ \0 N ci II

8

II

G

o 0-

g

* N

g

II ~

I

I

Ex. dados cont. classificados

:';',_.; Exemplo dos tempos de CPU (em segundos)

Classes Fi fi x'i x'i*fi x'i*Fi X'iA2*Fi
C1 5 0,250 8,3 2,075 41,5 344,45
C2 2 0,100 9,9 0,990 19,8 196,02
C3 2 0,100 11,5 1,150 23,0 264,50
C4 6 0,300 13,1 3,930 78,6 1029,66
C5 5 0,250 14,7 3,675 73,5 1080,45
Total 20 1,000 -- 11,820 236,4 2915,08 n media
ou 236,4/20= 11,82
Vartancla
Corrigida 2915,08/19-(20/19)*11,821\2= 6,36
Desvio Padrao 6,361\( 1/2)= 2,522
Corrigido Page 1

insensfveis a presenca de erros grosseiros ou valores anormais (outliers), ou insensfveis a urn grande numero de pequenos erros (arredondamentos)

ANALISE EXPLORAT6RIA DE DADOS - AED

• complicada

• influenciada fortemente pelos valores aberrante ou anormais -OU1LIERS

• as premissas e hip6teses da analise - OBSERV AC;OES INDEPENDENTES e IDENTICAMENTE DISTRIBUIDAS - podem ou nao verificar-se e tal nunca e inteiramente claro

• morosa

A abordagem chis sica e:

• metodos ROBUSTOS

Modernamente, procura-se:

validos para urn largo leque de hip6teses ou modelos te6ricos

• metodos RESISTENTES

A ~

Objectivos da analise de dados:

• exploraeao dos dados para identificar os padroes de maior interesse

• representaeao dos dados para chamar a atencao paraeses padroes

A analise exploratoria de dados procura as:

• pistas e a

• evldencia, muitas vezes pouco clara

• analisa

A analise confirmatoria de dados:

• avalia a forca dos resultados detectados

• Representacao grafica do resumo de 5 numeros

CAIXA DE BIGODES (Box-and-whiskers)

10 quartil 30 quartil
-::';!."
~ /
I I
I

/ 1 -,
minimo ' .
maxnno
mediana ~ Caixa-de-bigodes sem outliers

1-

• con junto dos valores da amostra compreendidos entre 0 10 e 0 30 quartis, Q1/4 e Q3/4e representado por umrectangulo (caixa) com a mediana indicada por uma barra.

• Consideram-se seguidamente duas linhas que unem os centros dos lados do rectangulo com 0 rninimo e maximo da amostra.

Os tres exemplos seguintes de histogramas e caixas-de-bigodes correspondem a diferentes tipos de distribuicao dos dados.

~l I II----i

Dados simetricos

Enviesamento para a direita

Enviesamento para a esquerda

_ Caixa-de-higodes com outliers

BARREIRAS INTERNAS: INFERIOR E SUPERIOR

BIl = Q1I4 - 1.5 IQ e BIS = Q3/4 + 1.5 IQ

V ALORES ADJACENTES: INFERIOR E SUPERIOR

VAl = Max {~1)' BIl} VAS = Min {~n)' BIS}

. (Soexistemoutliers quando os valores adjacentes coincidem com as respectivas barreiras)

BARREIRAS EXTERN AS: INFERIOR E SUPERIOR (s6 e necessario calcula-las

quando existem outliers)

BEl = Qtl4 - 3 IQ e BES = Q3/4 + 3 IQ

~ V'

OUTLIERS

• Identificacao

• Interpretacao

trata-se de erros ( de medicao ou registo) ou erros naturais?

• Eliminar?

• Outliers correctamente identificados so para N .> 500

• Transformacoes

• Isolarvalores

f:) • Caixa-de-bigodes modificada (ver exemplo)

outliers moderados ~. e D

outliers severos ~ +

REGRAS pRA. TICAS PARA DETECTAR OUTLIERS

OlITLIER MODERADO

BEl < Xi < BII ou BIS < Xi < BES

OUTLIER SEVERO

Xi < BEl ou Xi > BES

(/) Q) -0 o Cl

:0 cb

-0 o

(IJ X 'ro o


a
a
~
L- L- L-
0 0 0 L- 0- L- a
·c ·c ·c 0 0 0 <0
CD CD Q) ·c ·c ·c
0- 0- 0- Q) CD Q)
::J .....
::J ::J ..... '+- C
(/) (/) (/) E c
c:tJ (IJ Q) 0- CD c:tJ c:tJ
C C - 0 L- - C C
0... 0... C ·c 0 C 0... 0...
CD CD Q) CD ·c CD CD CD
X - 0 0- CD 0 - X
CD .s co ::J ..... c:tJ E CD -es a
U (/) c:tJ C U -es '" <0
~ c:tJ ~ c:tJ '" ....
0... c:tJ 0 C 0 c:tJ 0... .... .~
.~ 'Qj t .~ Qi ~ 0
0... t <- ;g -g
L- 0 c:tJ -0 c:tJ 0 <-
<- 0... (ij ::J CD (ij <- <- 0
(IJ eel ::J eel eel
m m > 0 ~ 0 > m m 0 -ee
"" -<==
\ \ -<== .g
.g
i ~ ~
0'
~~~
-Ill - III
11 ~ 11 fl
~ = 00· ....
t- :> §'~ ~ a
N
a
8 ~ f$ a ~ 8 a
<0 g -
a
<0
OW!XlJW

-_ .. " a
<0 \
-.
(/) (/)
Q) 0.... rouadns ouenb
"0; Q) (/)
'~
o (/) 0....
O)._ Q)
'-.c ._
-93"5 eue!paw -.
(/) (/)
Q) I 0 Q) 0....
V-gE "OQ) (/)
o~ 0....
~ <p Q) O).~ Q)
._ X (/) '-.c =
aJ 0 JOlJaJU! ouenb -93"5
0.0 ~ Q) I 0
'--' V-gE
~ <p 0
.- X 0
OW!U!W aJ 0
0.0
..........
a
N
a 0> ex> t- <0 to ~ t") N ~ a
- ,

I

• Comparar

It~ amostras de uma so variavel Xi> i = 1,2, ... , n

CORRELA<;AO E REGRESSAO LINEAR

Estudamos ate aqui modos de:

• Descrever

• Explorar

Considerando amostras de pares de variaveis (x; Yi), i = 1,2, ... , n:

PROBLEMA: Estudo das relacoes que possam existir entre os fenomenos observados.

REGRESSAO E CORRELA<;AO (ocupam-se da variacao em media)

I

I:

• Descrever

• Pesquisar

• Caracterizar

Relacoes de caracter quantitativo (Relacoes estatisticas)

• Existe entre elas uma relacao estatistica que as liga;

,. Existe eorrelaeao entre duas variaveis se:

Exemplo: Relacao entre 0 raio e 0 perimetro de urna circunferencia

• A intensidade de urn fenomeno associado a pnmerra variavel e acompanhada tendencialmente pela intensidade do outro .num dado sentido no sentido oposto ( correlacao positiva ou negativa).

Relaeoes estatisticas extremas:

1. Relacao funcional (nao interessam directamente a estatistica )

2. Ausencia de relacao entre os fenomenos {variaveis independentes )

Exemplo: No lancamento de 2 dados perfeitos, nao existe relayao entre 0 n" de pontos obtidos no 1° dado e 0 n"

~& de pontos obtidos no 2°.

Variaveis independentes:

Conhecer 0 valor de urna delas nao da qualquer informacao sobre 0 valor que se vai obter para a outra.

DIAGRAMA DE DISPERSAO

QUESTOES:

(que se colocam ao analisar dados relativos a duas variaveis)

1) As variaveis sao correlacionadas?

2) De que modo estao correlacionadas? Positiva ou negativamente?

.. -;

3) Como medir 0 grau de correlacao?

Para efectuar uma regressao simples e necessaria uma amostra bivarlada:

x

Y

Yl

Yn

Diagrama de dispersao ~ Representacao dos pontos (xi, yi) num eixo cartesiano.

y

• •

- - \II ..

,I I.



Yi

x

Varios tipos de correlacao

y y

•• • ••

• • ••

• • • • ••

• • • • • •••

• •• • ••

y

.: . ••

• • •• • • •



x x

x

Correlacao nula Correlacao posit. fraca

Correlacao posit. forte

• •

y

••

• ....

. .. - .

y

• • • •

• •

• •

• • • • • •

••

x

Correlacao negat. fraca

Correlacao negat. forte

Analise do diagrama de dispersao

permite conc1uir se:



Existe correlacao ou nao entre as variaveis

• A correlacao e positiva ou negativa;

• A correlacao e forte ou fraca;

• 0 tipo de regressao ( ajustamento linear, linearizavel ou nao linear)

mR~G19 Se 0 diagrama de dispersao sugere 0 ajustamento de uma aos pontos dados, como estimar essa recta?

• Recta dos minimos quadrados

• Recta resistente dos tres grupos

50

RECTA DOS MINIMOS QUADRADOS

~~~ ~~

... :..~ .....

n n

LYi-na-b Lxi =0

i=l i=l

<=>

n n n

- L Yixi +a L xi +b L x7 =0

i=l i=l i=l 1

n n na-i-b Lxi = LYi

i=l i=l

n n n

a L xi + b L x7 = L Yi xi

i=l i=l 1 i=l

Equacoes normais

Resolvendo 0 sistema, obtem-se os coeficientes da recta dosminimos quadrados:

b = LXi Y i - n x Y = cov( x, Y)

LX[-n x2 s~

(declive da recta de reg. y = a + bx )

..0..

variacao no valor de y, quando se aumenta x em uma unidade

I a=y-bx I

(ordenada na origem da recta de reg. y = a + bx )

..0..

valor de Y quando x assume 0 valor zero

51

ANALISE GRAFICA DE REsiDUOS

~ Padriio ideal associado aos "bons" residuos

~ Distribuicao simetrica em tomo de zero, com pequena dispersao.

~ Diagramas de dispersao

~ Permitem detectar paddles "patol6gicos" nos residuos, ou seja, padroes que questionam 0 bom ajustamento da recta.

;;'.~ """

~;:.j

Grificos de residuos:

Banda inclinada --)- Indica que urn novo termo linear pode ser inserido no modelo.

Banda curva --)-

Indica uma relacao nao linear, sugerindo uma transformacao das variaveis ou 0 ajustamento de uma regressao curvilinea

• •

o E'necessario urn metodo de ajustamento que ao estimar. os coeficientes da

recta resista, tanto quanto possivel, aos outliers.

Cunha ~ Mostra que a dispersao dos residuos esta relacionada com a variavel X, e sugere uma transformacao dos dados para estabilizar a dispersao dos residuos, ou a minimizacao da soma do quadrado dos desvios ponderados, com ponderacoes de acordo com os valores de x.

c; A regressao dos minimos quadrados e pouco resistente, po is basta existir uma observacao discrepante para distorcer os resultados.

Outliers ~ Grandes residuos

Nota:

A utilizacao de urn metodo de ajustamento resistente nao dispensa a posterior analise de residuos.

53

RECT A RESISTENTE DOS TRES GRUPOS

:1

l

II

* Baseia-se na resistencia da mediana e na ideia de dividir os pontos (xi, yi) i = 1, 2, ... , n em tres grupos: esquerdo, central e dire ito, em funcao da ordem de grandeza das abcissas.

Grupos n=3m n=3m+l n=m+2
Esquerdo L m m m+l
Central C m m+l m
Dire ito R m m m+l I

• Se nao houver abcissas repetidas, 0 n" de pontos em cada grupo depende da divisao de n por 3.

• Se houver abcissas repetidas, ha que alterar ligeiramente 0 numero de pontos de cada grupo, de modo a nao separar em grupos diferentes, pontos com a mesma abcissa.

• Apos os grupos formados, determinam-se os pontos representativos de _,_:__cada grupo: (XL, yd, (Xc, yc), (XR' yiJ, sendo:

XL, Xc e XR as medianas dasabcissas dos -pontos· da cada urn dos grupos

YL, Yc e YR as medianas das ordenadas dos pontos da cada urn dos grupos

(Calculadas separadamente).

• 0 ajustamento da recta resistente y versus x: I y = ao + bo{x - xc) f urn processo iterativo que em geral converge.

ao=4[(YL -bO(XL-xd)+Y C+(YR -bO(XR-xd~

1- Iteraeao

Declive:

Nivel:

Tendo ao e bo, calculam-se os residuos da recta ajustada na 13 iteracao:

/.- <,

~~:.j 28 Iteraeao

Consideram-se os pontos (Xi, r.), i = 1, 2, ... ,0, e processa-se do mesmo modo que com os pontos (Xi, Yi)·

Os grupos definidos inicialmente pelas abcissas mantem-se obviamente

nas varias iteracoes.

e:'4, ~

• Se a recta ajustada aos residuos for: I ~ = (11 + 131 (x i-x c)1 entiio a recta resistente ao fim da 23 iteracao e !Yi =(ao+(1I)+(bo+13I)(Xi-xc)~ e assim sucessivamente.

-. Se ha convergencia, as iteracoes terminam; quando.amelhoria obtida .~:. na ultima iteracao para 0 declive for inferior a 1%, ou 0,1%, relativamente ao declive anterior.

• Em cada iteracao, 0 declive e 0 nivel sao acrescidos, respectivamente, do declive e nivel obtidos nessa iteracao:

bo=> bo + J31 + J32'"' ao=>aO+ul+u2···

5S

r = cov(x,Y) = b Sx

SxSy sy

-1~r~1

QUALIDADE DO AJUSTAMENTO LINEAR

E necessario avaliar 0 grau de associacao linear entre as variaveis, isto e, determinar ate que ponto e correcto ajustar uma recta aos pontos dados. Uma medida para efectuar esta avaliacao e:

COEFICIENTE DE CORRELA<;AO LINEAR DE PEARSON

~-,i,:,r = 0 ~ Nao existe relacao linear entre as variaveis

.-:';_~T = ±1 ~ Existe uma relacao linear exacta entre as variaveis

• r = 1 ~ Correlacao linear positiva

• r = -1 ~ Correlacao linear negativa

COEFICIENTE DE DETERMINA<;AO

r ~ determina a percentagem de variabilidade da variavel Y explicada pela variabilidade na variavel X, 0 ~ r ~ 1

56

PREVISAO COM A RECTA' DE REGRESSAO

-+ A utilizacao maisusual da recta de regressao e a previsao:

• Preyer 0 comportamento da variavel explicada Y com base em valores conhecidos da variavel explicativa x.

• Esta previsao e de "boa qualidade" se as condicoes do passado se mantiverem no futuro, e obviamente se a recta for 0 melhor ajustamento em relacao aos dados utilizados para efectuar a regressao.

• A recta de regressao y = a + bx so pode.ser utilizada. para prever valores de y com base em valoresconhecidos de x. Amesmarecta so poderia ser usada para preyer valores de x com base em valores de y, caso as duas variaveis sejam totalmente correlacionadas, ou seja, que r=± 1, pois neste caso as duas rectas de regressao coincidem.

• Caso -1 < r < 1, as duas rectas de regressao nao coincidem, sao concorrentes, e assim, caso se pretenda prever valores de x com base em valores conhecidos de y, tern que utilizar-se a recta de regressao de x versus y: x = al + bl y. Para estimar os coeficientes desta recta

procede-se como para a outra trocando as variaveis x e y, ou seja:

b .. 1'.:.'-- LXiYi -n x y __ cov(x,y)

(declive.da.recta de.reg .. x ;::;al+ bl y)

Ly~-n y2 Sy

.n,

variacao no valor de x, quando se aumenta y em uma unidade

~ (ordenada na origem da recta de reg. x = al + bl y)

~ndo y assume 0 valor zero

• Se r = 0 as duas rectas de regressao sao perpendiculares.

• b· bI = ~

• r tern valores iguais para as duas rectas de regressao, bern como ~.

51

n

ERRO PADRAO DAS ESTIMATIV AS

(Desvio padrao dos residuos - regressao de Y em X)

=> medida de dispersao dos valores de Y em relacao aos valores de Y

y=a+ bx

s* =

H .. ·.::::

y:x:

n

Lyf -aLYi - bLXiYi i

S2* y.x

Note-se que:

Assim:

Para a outra recta de regressao linear:

Tern-se:

~ ~

-c
<
~
u ,-.... ,-....
~ ,-.... ~ ,-.... -6 ,-....
~ ..s -6 ~
~ .......
<t: ....... _g
...... >(
x ~
~ >( :>t - .......
'-" ..s "--" ....... <;»
'-"
~ '-"
CIl
~
0
<t: .0 ~
C>
~ .a ..s ~ ....... , ~ ....... , ~
~ .0 .0 as .0
+ + + + +
0 as as as .0 as
~ ..s ..s II II II
CIl II II ....... I~ ....... 1>- ~
~ ~ >-
.s .a
~ ~ .0 I ~
~ .0 .0 ~ .0
....... + +
.0 ~ +
as «I as as as
II II II II 11
~ >- ~ ~ ~
0
<t:
C> 0
~ laS
g-
~ ~
......
as rn
...... <!) <!) -
g as .-< .-< 0
<!) ...... 0 0 0
~ 0 .0 -£ laS
~ ;.....
0 <<!) ,<!) '<!) 0-
~ ...... 0... 0... §
0 ...... . .....
~ p... ~ ~ ~ I I

(\J
x >.
t I
• .- II
I
a .II
III
(I)
(J) Q.
E
'iii
<X) "-
co
(I)
c:
I'-- 0 ......
ICO ~
e- ~
co
<D Gi 0
"-
"- II
0 a-
U
l{) (I)
"0
(I)
-
~ c:
(I)
·U
;;::
(I)
C') 0
0
(\J
a a a a a a a a
I'-- <D l{) ~ C') (\J ::>: 0 0 0 <0 0 (') «)ON 0 tl) 0 ~
X N 0 U) ..... <0 co N(f)(') to U) N ......
..... (f) -q eo -q ............ ..... ...... ..... N
...... C\I (f) ...... ...... N
......
<'4> -q 0 U) -q -q ..... -qoq-<o 0 ...... io to
'<t 0 C\I <0 C\I '<t C\I <0 ..... 0 C\I C\I -q
..... -q <0 eo -q o ...... m ..... U) N U)
r ..... N ...... ...... 0
......
-- --
:N o U) -e- oq- 0 m <0 tl) -q'<t tl) "'<t 0
X ON N o N ...... C\I <0 <0 N N 0
...... N (f) '<ttl) m C\I eo 0 0 N
N-q (f) N ...... U)
......
-:>. _.-_._---------------_ .. - -- -
NOl{)tOtO ...... NN'<tomU) <0
...... NN ...... N(f)-qtl) ...... (')(") ......
(")
X 0 U) to N 0 (") ~ U) to co U) C\I 0
..... ..... -e--' N N io <0 U) '<t (") U)
(")
- - (ij
-
en .,_.. 0
0 0 ..... N(f)-qU)<Ot-tOm 0 -e--' N I-
(J) ..... ..... .....
C CO
c( o
C x
a
1 I'--

0
<D
• I
• I
1 a
I l{)
a
let I
(/) • I
a: i
w a
0. -t- ~
(/)
C I
w
c • a ~
et i- co
~
~ • i I'
o i a
et • .L
C (\J I


• a


>. I··----+- -t----j---. i- 0
a a a a a a a
<D l{) ~ C') (\J
6tJ en w ...J 0.

~

en

0::: « UJ z :J o .« en (f)

UJ 0::: o w 0::: w o . «

-~

w 0::: 0::: o o

.<.=:-:- -c,
t:~~~ en
w
....I
a.
~
en
0:::
«
w
z
::::i
0

en
en
w
0:::
o
w
0:::
w
0

-0
«
....I
w
0:::
0:::
0 0
o
- - 0 N
I'- -;- -e--'
x
\ --
en ..-
», - ..--
.\ Q) 0 ,
"0 <D ,
, ; 0 - 0
! \ '('0 , ..-
0 en
lC1l ; en
Q) .........
(fJ , \ ._ - m
I OJ 0
(fJ I Q) --- I!) >-
Q) I ._
L.- \: Q) , I
0> "0 _J_ eo
,
Q) >, ~ d- >- ;
L.- -. I w
0 - ;
Q) UJ ,
X I '<3" (fJ r I'-
"'0 Q) 0 ,
(fJ "0 I , ::J !
Q) 0 i :Q t <D
10 1(1] I
UJ (fJ I
0- UJ 0
ro ~ co ~
::J -':J) ) I!)
0- ~ (fJ
Q) Q) 0 ~
'''0 "'0 '<3"
en d- o Q) <:
« N
W ~ (fJ
::> - (')
0 'ro
~ c:
(fJ 0 « ~
« \ ..- ->, N
I I r-,
\ ~
, ..-
I I I I I I a 0 0 s 0 0 0
0 a 0 0 0 0 0
0 0 0 0 0 0 0 N <ri ~ c:i l' co N
<D I!) '<3" (') N ..- ..-- I ..-
I

~ ..- I'- '<3" 0> eo <D I!) N I!)\<D ~II'-II!)
I!) '<3" (') 0> N ..- 0 (") ..--N I!) 0 -e--'
x a 10 0> -e-- N -e- I'- '<3" mi..- ~Im W
0 I • I • ..- ..- ' I . I I II!)
ICU X I
en - i
en 0> I'- '<3" 0> N '<3" I!) co 1!)1'<3" <DII'- 0
s, e '<3" '<3" (") 0> I'- co 0> co ..-I'-I!)O 0
Q) 0)>- -x 0> 0 I'- (") I'- ..- <D a ~iccilcci ~ 0
'- !- N N ..- N (') I!) <0 i \'<3" '<3" I!)
..0 ftJ en ; ! I (')
0
0 (/) 'lJX a I!) co N 0 (") .q I!)rolro ~!Nlo
lC1l X en Q) x..- -e-' -e-' N N 10 <o11!)! .ql(');~
(J) Q) o'lJ
(fJ >- :l
Q) "0 'lJ NO I!)ro -ro "-NN.qIOI~I~!<O
0 ..- '0 >-..- N N ..- N (") """ 1!)1'- (') (')i"-
L.- eo
0> X lro Q) , , ! 1(")
Q) (/) t- o::: <0 I'- roio>iol..-!Ni--
(/) ('t) ..- N (").q I!)
L.- Q) Q) j i i j I 1 -r-:~:-r-i
'- ..-
Q) ..0 '-
-0 0 0> + ,
(/) Q) >- ,
(fJ '- "<;t
Q) >- Q) - 0 ! C'I m i '<t l\m\Nj<D '<3"iro ~;r-- I'- (') 0
Q) "0 ..0 en >'I~I~ ~ ~\":l~ I!) 'N o e<) en m 0
10 "0 en : ',NIN mlcci oie<)
0- 0 + 0 I!) ..-;N\..-- N <D 0
X <.0 >-1 • ' II I I I 'I' ..- - I
C1l 0 lro - ICU -!
::J ·ro lO 0- ro • en - ! I
0- (/) N ro en 1m <D m m1N1<D ~Iro mil'- (')\1'- 0
(/) :J II II Q)
Q) Q) ..- 0- ... -I~ ~I~ ~":I~ I!)N ml(,) 00 0
<.0 - -
'- W C) x >, '<t 1'-1 0> mON "-iro e<)(') <Dleo <0
(fJ 0> X X i Q)
« Q) 0 , ... -- ..- -e--' ..- ;NIN .q1'<3" ~1-r- (') N ..-
L.. + ftJ f/) .L i i -1--- co
Q) , "0 >- -~--
X ..- , 'NIO'I!) ro!~I~ NiN '<3"0 m'l!) <0
"0 .0 en i f/) Q) >-I..-,NIN (')1'<3" U)i.,.- (')1(') ..-
0 <.0 0 "0 I ! . 1 -+-- e<)
I - 1--_1-_
lro + v :l 1 ---L_
0- ro co :2 oil!) ro NOe<) '<3" I!) ~Iro I!) N 0
ro en x T"'"""T""""T""" NN I!) <0 '<:1"(') I!)
:J II II Q) i (')
0" - - 0::: -
W >- >- -e--' N e<) '<:1" I!) <0 I'-ro m\~ ..- N
..- ..-
61

.... C\I
<,
-,
x >- ~
t I
• /
/
I • 0
<,
<, III
<, Gl
'.. (J) 0.
/' E
/'
/' III
/' ...
• - CO 1"11
I e
C
.__ I'-- 0 M
<, IC'II N
<, o- M
<, 1"11
--... <D Cii 0
...
... II
, 0 L..
"\. ; o
.. + II) Gl
./ I "0
Gl
./ ....
C
• ~ Gl
I U
I I;:
Gl
• C') 0
I 0
.__ C\I
<,
"-
0 0 0 0 0 0 0 0
I'-- <D II) ~ C') C\I ~ 0 II) 0 00 0 0 0 0 N 0 LO LO \0
X C\I C\I 0 ('t) <0 <0 00 LO N C\I \0 m C\I
T-" C\I ('t) ("') N ()') \0 T-" 00 ()') 00
-e-' T-" .- .- 00
~ ---------_.
«:tLOLOT-"()')«:t«:t 0 T-" «:t T-" LO ("')
«:tC\lC\l<O «:tC\l 0 00 CO <0 C\I 00
.- <0 <0 ("') T-" 0 m t- C') N C\I
T-" T-" <0
-:'.-<').: 0 .- «:t «:t 0 0 0 LO «:t 0 LO m C\I
0 CO «:t 0 0 0 N <0 0 C\I ~ ()')
-e--' .- «:t ()') <0 N ("') <0 0 C\I <0
.- «:t ("') .- C\I ('t) r-,
..--
. _---_ _.- ..... -- ... _.,_, ..... _---- . -
> C\I LO LO ()') eo N N 0 ()') 00 ()') LO ()')
-e--' C\I C\I .- -e--' C') ("') N -e-' ("') «:t
C\I
-.-- _--- .... _ -"_"-- • __ 0.
x 0 (J) C\I C\I 0 0 0 LO 00 0 LO t- OO
v-' ..-- C\I eo «:t <0 LO «:t «:t LO 00
("')
----- CO
(J) ~ (5
0 0 ...- C\I C') «:t LO <0 t- CO ()') 0 -e-' C\I l-
e II) ...- ..-- .-
(U
c( 0
e •



o .« (J)

a::

~ .. (J)

is

w o

« ::2:

~

G « is



x
0
T I'--
I
+ 0
<0
• i
0
II)
0
-r- ~
• -. 0
C')
• J._ 0
C\I
• 0 '>, I·---j---·-

LO 0 II)

C') C') C\I



.-t- .. -r-r-r- ···-----r----1- 0

OlI)O lO 0

N

• •

/."".

t;.j/ en

W ...J a..

~

en

0:: « W z :::i o 1« (J) en W 0:: (9 W 0::

W o 1«

. <>

::s

W 0:: 0:: o o

Q) "'0 (J) Q) to om .:J '0-

Q)

(J) « :::> o (J)

«

-U)

x Q) "'0 o

~

U)

~

Ol

~

Q) "'0

0- W

,

\

~ \

\ \

,

"\ \

x -..: rn

,.-:;

"0 o '(U (f) U) Q)

~

Ol Q)

~

'0 -+- lO

L

I~

(\

\ \

, ~

,

x ..-\

\

o 0 0 0 0 0 0 0 0 0 0 ~ ID lO ~ M N..- ~ ~ ~

Q) '"'0 (J) Q) to oro :J 0- Q)

(J)

«

x ~

.D o en

>. Q) "D

o ICO en en

~

Ol

~

Q) "D

o 'CO 0. CO :J C1" ill

X .!l

+ CO II

x ~ o io

..--

o + ~ reo eo

lO

..--

>.. ~

.D o en

X Q) "D

o 'CO en en

~

Ol

~

Q) "D

o 'CO oCO :J 0- W

.!l +

CO II

x

II

x

>-



(J) o :J

:Q

(J)

~

(J) o "'0 Q) .~

'm c

«

o tCU en en

e

Ox

~.._

C'G en "t:I>en Q) 0'0 :::l

:2

en Q)

0:::

I

I

~

o 0 0 .0 0

o 0 0 0 0

to ci to ci to

..- ..- .

o 0

o 0

ci to

..- -e--'

• I

o o

ci ~

o

..-

II

OO)NNOOOlOCOOlO~CO

X,"- ..- N (') ~ «) lO ~ ~ lO c:o

I (')

NlOlOo)(,)NNOo)COo)lOo)

>- ..-N N -e-' e--' (') (') N..- (') ~

,..- N co ~ 10 «> ~ eo 0) 0 ..- NI I I I T""~:-r-:

co

10) ~ 0)'10) 0 0 0 «> -e-' 0 ~I<o 0

1(') N ID ..- 0) ~ 0) ID ID 0) ~!"'" 0

->. ~ ~ ~ ill co 0 -e-' lO ~ -e-' Nj·-.i m

"-..-..-..-..-NNNNNNN~

: i I ; N

I'NilO io 0) (') N NOm co mlil[) m >. ..-!N N..- ..- (') eo N..- M ~

I N

I-I- --+--4--1I--+-+--+--+-+--I--j-.+--I omNNOOOIOCOOlOf"-CO X"- ..- N(')~IDlO~~tOCO M

lO

~~:'~J~ en

w ....I c...

~

en

a:: « w z ::::i

o 0« en en w a:: o w a::

w o .«

-0

::5

w a:: a::

le'??\ 0 ~~~1' (_)

x
0
I'-

• ..!- 0
<0

.i, 0
LO
0 •

CI)
a::
w • 0
Q. ...
en
is
w •
0 0
« co
::2:
~ •
o
« • 0
N
is •
• •
• 0 , - N
/

"\
\
• 0
I 1/1
t CI)
... 0) c..
E
I 'iii
• 00 ....
-r- ~
I I CI)
I
i c:
I I en
, + I'- 0 10
I .~ CX?
()o
i ~ 0
+ <0 Gi
.... II
....
0 ~
o
x >. LO CI)
t I / "tJ
CI)
• / ....
ff c:
I ... CI)
\ 'u
\ l;::
CI)
• eo 0
/ 0
/
,/ N
I
0 0 0 0 0 0 0 0
I'- <0 LO '<t eo N ~ 0 0 0 ~ 0 1.0 <ONN<O 0 1.0 0
0 t-- 1.0 <0 <0 "¢ ...... 0)(1)0 <0 N <X>
"¢ t.O "¢ "¢ (Y) (I) "¢ ~"¢"¢ <0 (I) (Y)
1.0
N>- O"¢ t.O ...... ~ 1.0 <0 "¢ ...... <» ...... t.O t.O
O"¢ N "¢ N N c» ~ <X> "¢ N N ......
<O"¢ <0 <X> (Y) N ...... ...... ...... <0
...... ...... t.O
....
"'"">< 0 t.O "¢ <0 0 0) <0 ...... "¢ "¢ 0 t.O "¢
0 N N t.O 0 N t.O <X> 0 <0 0 N <0
...... N (I) N ~ t.O ...... <0 (Y) (Y) <0 N ......
.'., -e-' ...... N (I) (I) "¢ <X>
......
- -
>- 0 <X> t.O 0) <X> t.O "¢ N <» t-- ...... t.O (I)
"¢ (I) N N ...... -e-' ...... -e-' ...... N
N
-- --.----------- ._. __ ._----_ .. - _".
X o t.O <X> <0 0 (I)"¢ ...... <X> <X> 0 t.O <X>
............ -e--' ...... N N (I) "¢ "¢ t.O <0 <0 0

-- ro
-
(J) --- 0
0 0 ...... N(I) "¢I.O <0 ...... <X> 0) 0 ...... N ._
CJ) ...... .- ......
a <U
ct 0
a >. l" --. ----I- -----j--+--.---- - - -.--- - -4------ -e- 0 o LO 0 LO 0 LO 0 LO 0

... (") (") N N

en w ...J a. ::i! Ci5 a:: « w z ::i

S.

en en ui a::

C) w a::

w o K( -c.>

:5

ui a:: a::

fi)8

~ 0 N
I'-
X ..-
--
tJ)
>. / -- -e-r-
Q) ..-
D / 0
0 "- co
.m 0
tJ) / -e--'
0 tJ)
Q)
~ro L.- ....--..
(J) 0> ,/ 0)
Q) 0 -
(J) L.- - LO >-
Q) Q) /
,._ D I
0) 0- -- 00
Q) >. ~ ,
,._ -- W >-
tJ)
Q) 0 ---
X <r (J) I'-
"'0 Q)
D 0
(J) 0 , ::l
Q) ,
·m , :"Q + «)
10 tJ) !
0. tJ) , , 0 (J)
f"" Q) T co Q) i
L.- , ,
::r ... 0> , !J I ,._ i LO
Q) \ T
0" .._ \ 1 (J) ,
\ 1 0 I
Q) Q) \ I I
-0 \ t "'0 ~
en" 0- \ I 0 ..;t
\ Q)
« w ~ N
.~ >
::::> I I - (')
0 I 'ro -.
I I C
(J) ! 0 « ~
« I i ..- ->. N
,
I I ~
, ..-
I I I I I I I I , 0 0 0 0 0 0 0
EI 0 0 0 0 0 0 0
10 0 LO 0 10 0 LO 0 10 0 LO N <ri ..j c:i .,j <ri N
..;t ..;t (') (') N N ..- -e-' , -e--' , , -e--'
,

~ 0 (') I'- N ..;t 10 0) I'- N V 0) «) 0
-x 00 0) I'- 0 00 -e-' 10 V N (') 0 v 0
, cD o::i eo (') ..;t «> eo N ci -: I£) -e--' ci
0 , , -e-' ..- , , ..- ..-
t«I ~ , ,
en
en 0 I'- I'- N V 10 0) I'- 00 «> ..- v 0
>. Q) N 0 I'- 0 (X) ..- 10 V I'- <0 0) 10 0
...
Q) 0) >. -x (") eo ..;t 0) v m 0 (') I'- 0 ~ eo to
CI) N ..- (") (") v v V I£) ~ I£) 0
'- ... - ~
.0 en
0 CU )(
0 U) "C 0 I£) 00 «> 0 (") v -e-' 00 00 0 I£) en
CI) X"-"-"-"-NN(,,)~V 10<0<00
-ro,/ X en "C I 1 I -v
C1)' Q) 0
~ -- --- -
C1): -0 >. " '0100 10 0) oollOr~ N 0) I'- ..- 10 <'>
0>,'" 0 U; >- ~ ("') N C\I r-l-r-:'l~. "r" ..- N
Cil}·: ~ N
X lro <X) CI) I ,
0> U) co j ~ -e-' ' N , co Iv i 10 i «>-j--I'- i 00 i 0)
,._ Q) U) -r o "-!N\
'- Q) / i i : ; ; 1 i "-1..-/..-1
0> .0 '- ..-
"'0 0 0> ,
Q) >.
U) '- ~
CI) >. Q) - I"- ::--1011'-10) 1 00 il'- i(") (010) 0(') <oiN Cl
0>
'0 Q) "0 .0 N >'I-:--:i~i"-:i~:"-:i~ LOjO) ..;tl'- 1'-;(') Cl
"0 (J) , O)IO)/..-i..-'I'-IO) ~iN lOiN
0. x 0 + 0 NO 0
eo 0 lro Cl ~ II II! I 'I ' , i
- 1 t«I , I , I ,
::l 1(Il -e--' 0- ro <0 en - ! , !
0" (/) (") ro , en 01(,)10)IN11'-1(') ~I~ o I'- ..;tlOO 0
(/) -e--' :J II II CI)
Q) Q) II) cr - - ... ~'~I"-: ~i"-:!~ VN ~i~ 0
(J) "- W x x 0) )( ->. 01001«> I'-ILOI..;t 00 ..;t ..- <0 LOIN co
0> Cl CI)
-c Q) , ... - ,('),N N NiNIN -,;-!~ ..- , ("I
"- en .. --Ll~-L-L---:__. ("I
Cl CU >. I-'-;___ _.i- t--
Q) X I"- "0 10100'LOI0)1°01O ..;tiN O)il'- ~lLO co
"0 .0 N en CI) >...;t (') k>l ("II ..-1..- ..-1..- ..-! ("I
0 Cl 0 "C : ! iii i _j_ ("I
~(Il + <0 ~ --to II£) I-rofw+or~ -+- ,_L --
o- ro co :2 X1..-!..-j..- ..-IN N ..;tl..- 00100 rolLO 00
(Il en ~i..;t VILO <0<0 0
:J II II CI) i I: v
tr - - ~
W >. >. ..- N (") V!LO!<O I'-joo 0) 0 "-IN
i ..- ..- ..- ..........
.~::-./ (f)
w
_J
a.
:2:
Ci)
a:::
-c
w
z
:::i
0
.<{
(f)
(f)
w
a:::
o
w
a:::
w
0
.<{
-0
<{
_J
w
a:::
a:::
(;~ 0
') ()
. >:J 0 0 '¢'¢ 0 '¢ <0 0 <0 '¢ 0 '<t N
X 1.0 0 ..- ..- 0 '¢ <X) \0 m 0 \0 <X) 0>
..- eo '<t 1.0 <0 ..- \0 \0 ..- N ..- <X)
(") '<t (") N ..- <0
..-
N>. 1.0 0 m m 1.0 '<t ..- 0 '¢ m 0 0> 1.0
N 0 N '¢ N <X) <X) 0 '<t <0 0 <0 ......
N '¢ 1.0 <0 ...... '¢ 0> <X) ..- \0 M <X)
(") '¢ M N ..- <X)
..-
.. -
'''''x 0 1.0 '<t -e- 0 c» <0 \0 '¢ '¢ 1.0 '¢ 0
0 N N 0 C\I T"" N <0 <0 C\I N 0
..- C\I (") '¢ \0 m N (") 0 0 C\I
._. N '¢ (") C\I ..- 1.0
..-
">. 1.0 0 (") ...... 1.0 <X) m 0 N (") 0 ...... en
..- C\I N C\I N 1.0 ...... <0 ..- \0 (") 0

.- -----_ ... _--_._ ..... _._ .. _--_ ... _---- -
X OI.O<x)NO(,,)'¢I.O<x)<x)I.ON 0
-e-' ..- ..- N N 1.0 <0 1.0 '¢ (") 1.0
(")
ro
(J) 0 (5
0 If) -e-' C\I (") '¢ 1.0 <0 ...... <X) m 0 ..- C\I ._.
C\l ..- ..- ..-
C 0
<
0 T N
..- !
-e-'
;
0 1\
1/1
CI)
- m a.
i E
I ·in
...
-I- co cu
I
I CI)
I .=
t <o;t
r-, o N
..... ! IIV m
..... <, (,)I m
.... .... cu m
~ <D f ~
... 0
0
o II
lO CI) ...
~
CI)
-
~ c
CI)
·0
;0::
CI)
x >- (") 0
t I 0
• N
I
0 0 0 0 0 0 0 0
t- <D 1.0 '<t (") N x I:
0
......

0
<0


0
1.0
0
.« •
t/)
It:
w t 0
0. ~
t/)
c
w i
0 • I 0
<{ + co
:!: i
~ • I II
o
« • t 0
N
C • I
!
• I
I
• i 0
'j'
>- c---t. ~ 0
0 0 0 0 0 0 0 0
t- <D 1.0 ~ (") N
6£ -_- ..... en
w
....J
a.
:2
en
a:
«
w
z
....J
0

en
CI)
w
a:
o
w
a:
w
0

-0-
«
....J
w
a:
a:
to 0
0 r a
r-, F, N
, .-
~ ,
,
; tl ..-
i -e--'
-- a
x co
-- a
(f) : ..-
0 ... - ;.,
~CO - --- Q) ,
_..-.--- --.
(/) -0
0 ,. a - -~ Ol
(/) ·ro I!) , >- !
Q) (/) , I i
L- (f)
0) Q) i I IX>
Q) L.. !
CJ) >-
L- Q) I
;., L.. I a -- ~
Q) .._ Q) I ~ (/) t-
"'0 (/) -0 !
x 0- i 0 I
(/) Q) ______.". I ::::l
Q) -0 W ~
~O 0 »> ----- i co
0. a<U 1 a (/)
co." (/) C') ~
fIl
::::l ~ (/) I!)
0'" CJ)
Q) ~ 0
"'0
(J) Q) a Q) ~
« -0 N
0- (/)
::::> w -
0 'co C')
c
(/) a «
« ..- ~
-;., N
I
~
-e--'
a a a a
a a a a a a a a a
a a ._,: c> ._,:
t- so I!) ~ C') N -e-' I

I~ N a Nt- C') to N Ol ~!~ t- ~ICl
-x a a 00 0 a N N t- 0 ..- ~1~
-I .
. 0 0 00 0 a 0 a 00 a C?w
0 I I I I I i I
t<U I~ Cl
(1)
(1) <X> 0 N C') C') I!) N Ol ~I(!) t- o Cl
s, CI) 0> 0 0 0> 0 a N N NO> -e-- ..-- Cl
L. -x
C) >. 0> to <X> -e-' 0 C') ~ to t- t- I!) N Cl
a> CI) ..- ..-- N N to eo to; ~ C') 1.0
L.. L. _ , C')
..0 CIS (1)
0 "0>< 0 to <X> N 0 C') ~ to a:: I co to Nlo
0 f/)
(1) CI) x -e-' ..-- ..- N N to eo to. ~ C'),I.O
l<O.· X iIi I C')
w: a> 0"0 I
::l
(/) "'0 >- "0 to 0 C')t-tO <X> O>I~IN!C') a t-I<»
~;. 0 I'- u; >,"- N N N N to t- (!),..- I!) C') 0
It) i . I , , :~
0): X ~ro 0 CI) , ,
(1)' f/) 0:: (!)1t-1<X>1~":"IN!
f/) 0 ..- N C')!~!I!)
L- a> a> : ! i ,-i,--I,--!
L- ..- ' I
(1) ..0 L..
"0 0 0> +
f/) a> >-
(/) L.. 1.0
(1) >- a> - (J) :::-I C') I 0 I NIt- i C') II!) C')jOl I!)i~ r--Io a
~O a> "'0 ..0 0 ~~I~ ~i~,~I~ NIN t-,o ~!~ 0
"'0 -e--' a a 01010 a 010 0:0 ob
0. 0 + t.ri 0 a
<0 0 X ~ro - t<U ;., I I I I I 11 I i
::::l ~ro N 0- ro I (1) -- 1: 1
0'" f/) ~ ro (1) C') ~1<x>It-it- to t-!.- I!)i~ C')!o a
f/) (j) :::l II II CI) - .~ ~I~I~I~ ~ t--:it--: r-:o ~i~
Q) a> 0- - L. 0
(J) - - I -
L- W X g>>< >'I!) a Nlt-I~ t- <X> «n N,C') Ol\(!) en
(/) 0> X
« ~ 0 L. _ ..-NN NN I!)!(!) <.Di~ ~ 'C') 0
+ CIS (1) , I"· , ~
---4u; ~~ i t-~ to <X> -_'_---
a> X "C >. Olio --
..- NiC') °It- Ol
"'0 ..0 It) I/) CI) >'..-NN NN I!)!t- (!): -e--' I!) '(V) a
0 <X) 0"0 , j ~
lro + 0 ::l - --t- _....L_ I--
0- ro 1.0 "0 a I!) <X> NO (V) ~II!) <X> I <X> I!) IN a
ro 'in x.,-,--.,- NN I!)I(!) I!)! ~C') I!)
:::l II II CI) i i i C')
0- - - 0::: OlI~ -r:IN-
w >- >- ..- NC') ~ to co t-<X>
...-,...- :!:~ ..... ~~ en
'i::.::::'~ w
_l
0..
~
en
0::
«
w
z
:::i
0

en
(/)
w
0::
C>
w
0::
w
0

0-
«
_l
w
0::
0::
() 0
<.)
" ... • T N
-e--'
\.
\. ..-
~ ..-
\.
~ - 0
..-
\ (I)
" <I)
c» c..
E
\ 'iii
• ~ CO ...
III
\ <I)
\ c:
• - t- O 00
\ '1Il t--
; (.» a>
~ , III
, ill Ci) 0
1
i ... II
...
\ I 0 '-
I o
• t 10 CI)
\ "C
\ CI)
...
tt '<I" e
CI)
x >. \ ·u
t I • l;::::
('I) <I)
• \ 0
0
I \
4t N
\
"" .' ..-
0 0 0 0 0 0 0
N 0 CO <0 '<I" N
-e-' ..-
X
>: 0 en M m ..- <0 ~ ~ N ..- 10 ..- 10 • N
X M C\i en -; C\i en M en M ~ r....: 1 ..-
..- ..-
N 10 m M 0 !'- l"- eo ('I) 0 N co m
..- ('\j N ('I) '<I" <0 eo 0 ('\j M
-e-' ..- 10 •
• 0
<> 0 <0 N <0 N ..- M 0 N <0 m ..- m ! -e-'
en en to M cri ci ci M ci cD r....: 0 M
N m N ('\j ..- ~ M ~ 10 ti'; 10 LO ~ \
10 <0 o» N <0 ..- co m <0 ...,. (') •
..- ..- N N C") ...,. <0 eo ..- LO
..- ...,.
0 • 4- co
let I
U) \
~; ..- ~ m <0 10 <0 m ~ ..- 0 ..- ~ 0 Q: •
-e-' N (") ~ <0 co 0 N 10 W ,
: ..•. -e-' ..- ..- <0 Q. I
U) !
is • <0
W :
0 •
:;;: "------.---"---"--------:c___=_ '0 et
~~~~"!~"!"!~~~~
C") <0 0 10 0 <0 ('I) ..- 0 0 ('I) !'- !'- :a: i
N N C") ('1)'<1" '<I" 10 <0 r-, eo m 0 <0 ~ • '" <r
..- <0 I
e
-c • ,
"-x ._-----_ .... -._._ .. ---_._---------- ~ is
.,-N('I) '<1"10<0 !'-eo m O"-N
..- -e--' ..- l"- j . N

• i
i
-. <I'l ""----t"--" ----j--"--;- -- +----t-----~"" 0
g - 15
0 -e-' N C") ~ 10 <0 !'- eo m 0 ..- N I- >.0 0 0 0 0 0 0
U) -e--' ..- ..- c:i c:i c:i c:i c:i c:i
<I'l 0
C§ 0 N 0 co <0 V N
..- ..- .- CI)
i,::.:.;.:.':- W
_J
a.
~
CI)
0:::
~
w
z
:::i
0
.~
CI)
CI)
w
0:::
<.9
w
0:::
ur
0
.~
o-
-c
_J
w
0:::
0:::
G 0
o
. 0 I N
I'- T -.-
X
~ --
If) - -e-'
»-, -e-'
j'\ a> I 0
.1 :
\J <0
, i 0
~ 0 ,
'\ 'm I I -.-
0 If) I I
If) I I
la::I a> ,
CI) ~ '- 0 I .--.. - 0>
OJ ,
f/) i ~ I 10 I -
Q) ~ I >-
L- a> ,
0> \J I CO
Q) >. : , 0- I >-
L- -- W 0
(f) , I .._
Q) X i -.;t f/) I'-
-0 a> I 0
f/) \J I I ~
Q) a I :Q !
tCO I "t" <0
10 (f) I 0 f/) i
o- (f) C') ~ I
a::I a> i
'-
_, OJ f/) 10
0- Ol
'- 0
Q) Ol -0
'0 0
en 0- N Q) -.;t
« w f/)
:::> - /
'a::I C')
0 C
f/) 0 «
-e-'
« N
~
-
,.,
. -e--'
a ~O 0 0 0 0 a
0 0 0 a a 0 0 0 0 0 0 0 a
0 0 a 0 0 0 C'-i <Xi ..r 0 ..r <Xi
<0 10 -.;t C') N -e-' -.- , ,

- N 0> -.;t -.;t 101<0 -.;t 10 0 co -.;t 10 -.-
-x -.- 0 -.;t <0 C')O> 10 N I'- C') <0 -.- 0
a 0 0 C') C') C') C') C') N 0> <0 co +
0 , I w
ICU x to
f/) -
f/) -I~ -.- <0 <0 IOj-.;t <0 to a N <0 10 ~
>. e 0> 10 C') <00 -.;t I'- C') <0 C') co I'-
a> 0)>- xo -e--' N 0 -.-iN C') -.;t <0 c:il~ C') N
.... !_ i , C')
.0 '" f/) i
0 "0)(
0 (/) ,!o 10 co N c::IM -.;tltO co co 10 N a
la::I X f/) (I) XI~lT"" -.- NIN 10 <0 10 -.;t C') to
so 0"0 C')
a> :::l
f/) 'U >. "0 IN -0 ·to . «> '00 1-.- <'I i N -.;t 00> to <0
~ 0 ..- ';; ~!'- <'I <'I T"' j <'I ,-C') l-.;t 10 -.- M M -e-'
('t) I C')
0> X 1m t-- (I)
(/) 0::
Q) (/) ('t) h-'N "T'l 10: <0 \1'- i co 0> 01,- N
L- a> a> ; ; T"""i'r"i-r-I
.... -e--'
Q) .0 ....
-0 0 0> + I
(/) a> >.
.... "'"
sn >.. a> - a c-IOli-.;t -'-IOlIN:<O -.;tico ~ l'-iC') 0
Q) a> 'U .0 Q) I >,1 10 I C') 10 I <0 . I'- 10 ~!~ Olim a
10 'U + Q) ,1C'-ijC'i u:i ..----:iC'i'''----: OlI<O C') C'il<ri a
o- 0 <D 0 >'i~ ,It, ~~ , I
a::I 0 X 1m - !CO - I:
ICO 0- co • en --1m "'~Ia;IN""
~ (/) to m en I'- 21:; a
0- (/) N ::J II II (I) 110 <D -.;t <D 1'-·10 lOIN C') a
Q) a> ..- 0' L. ->,i~lr__: oi oilci'C'i .! .
<D - - 0) T"""i<XJ C')IC') <0 co <D
.... ill X X )( '-'-1-'- -'-1 [NiN ....r:~ -.;t -.- C') N -.-
f/) 0) a (I) I C')
« a> ... en
.__ + i CIS ----'--_J__ll' .!- 1 j
"0 >- -+--
a> X ..- I [N\O IOlcojroj-.- (',j'N -.;tlo ~11O <D
'U .0 Q) 1 en (I) >,'-'- N N -.- N C')!-.;t 10 -e--' C') C') -e--'
0 <D 0 "0 ' . J ___ i C')
I~ + "'" :::l ! ;
m <X) "0 1-.- N C') -.;t 101<0 1'-1 co 0> 0 -.- N 00
m u; Xi -e-' -.- -.- I'-
::J (I II (I) 1 , I
0' - - 0:: I i I
ill >. e-, -.- N C') -.;t 101<0 I'-Ico 0> a -.- N
i -.- -e--' -.- 69

,( ') en

--- w ..J a..

~

en

a:: -c w z ..J

o .« en en w a::

C> w a:: w o .« -0

:5

w a:: a::

_= 0

~o

oo o

+oJ

C

(J)

E J!!oo ~ (J)

....... >

ro'ro oo.N o s...

-om ~ .c

-Ooo J!! (J)

- 10 :J 0- oo C

~ :J

'+oo oo

o ro -0-0 o

E

:J oo Q)

a:::

Q) o

lro 0 (/) I~' L.. (/)

~(/) (/) -~ .- al "OQ) Q) L.. "0 Q) ro"O E ro rot)

L.. Q) alL.. ro

o

a a
a a a a a a
0 0 a a a a
N a 0 0 0 0
T- co <D '¢ N
->. >:

o Q) '<1l X ~ Q) Q)-O Q_(/) .~ 0 -0-0 Q) <1l -0 c: <1l Q)

E.2

<1l 0

'Olen <1l Q)

-- '-

0.2 <1l

2:-

>. f-----: - -t---+ - ---,--- -+----ta a a a a a a o c::i 0 0 c::i 0 0 N a 00 <D '¢ N

g x o

a
(J)
00
,.._
+
co
io

<'1 1.



N

I

to

Amostragem

Teoria da amostragem

Populaeao Conjunto de unidades com 14----------=---\

caracteristicas comuns

Inferencia

subconjunto da populacao

Amostragem -+ Processo de obtencao de informacao sobre parte da populacao, Esta informacao e a caracteristica (ou caracteristicas) especifica da populacao em estudo na qual 0 investigador esta interessado.

Fases do processo de amostragem

1) Identificar dados a recolher e instrumento a utilizar para a recolha

• E necessario desenvolver um processo sistematico que assegure a fiabilidade e comparabilidade dos dados.

• E necessario que se estabelecaapriori urn plano deamostragem de acordo com a populacao alvo, com definicao da populacao a inqumr e com urn processo adequado de.iadministracao do inquerito.

2) Definir processo de amostragem adequado ao tipo de dados e ao instrumento de analise

• Deve comecar-se por determinar a extensao geografica em que o processo de amostragem deve ser conduzido.

'11

Identitlcaeae da populaeao

I

!

II

Etapas da construeao da amostra

1) Identificacao da populacao alvo/populacao inquirida

2) Metodos de seleccao da amostra

3) Dimensao da amostra (a estudar posteriormente)

q E imprescindivel definir a populacao clara e objectivamente.

Populaeao Alvo ..... Totalidade dos elementos sobre os quais se deseja obter determinado tipo de informacao.

P.opula~ao Inq uirida-e elementos sobre os quais se pode efectivamente

(Base de sondagem) obter as informacoes pretendidas.

nao acontece, pelo que a amostra e recolhida.a .partir.da.populacao inquiridae, portanto, as inferencias indutivas.dizem.respeito a essa populacao (e abusivo inferir sobre a populacao alvo).

q 0 ideal seria que estas populacoes coincidissem, mas muitas vezes isto

,~~<\F,ro.cesso amostral

·'ilf,.'i'''''·

Dimensi P da amostra

Metodo de I ~olha de dados

Desenvolvimento de urn plano amostral

I PopulaC;ao Alvo I

n

Populac;ao Inguirida

Metodos de seleeea» da amostra

• Metodos probabilisticos ou amostragem aleatoria casual

• Metodos nao probabilisticos ou.amostragem.dirigida

Vamos apenas estudar os pnmeiros, pots sao aqueles que possibilitam efectuar inferencia estatistica, extrapolando as conclusoes da amostra a toda a populacao com urn certo grau de incerteza. Permite medir 0 erro cometido ao usar a amostra em vez da populacao.

Os segundos metodos nao possibilitam qualquer tipo de calculo de erro. Sao na maioria dos casos usados em estudos de mercado.

metodo que permita que 0 ·erro nos resultados, -devido .a-questoes amostrais, seja 0 mais pequeno possivel.

Amostragem aleatorla:

• Qualquer que seja 0 tipo de amostragem a escolher, 0 principio orientador deve ser a eficiencia, traduzida na obtencao de informacao o mais rigorosa possivel, com 0 minimo de custo.

• As vantagens e desyantagens dos varies tipos de amostragem aleatoria devem ser ponderadas em cada estudo. Deve optar-se pelo

Principais tipos de amostragem aleatoria

• Estratificada

• Simples

• Sistematica

€:#

_. ~,.",,"

• Por "Clusters"

• Multi-etapas

• Multi- fases

Caracteriza-se por:

Amostragem aleatoria simples

• . Qualquer elemento da populacaotem igualprobabilidade n/N de ser seleccionado para a amostra.

• Qualquer uma das C~ amostras aleatoria simples possiveis, de n elementos retirada de uma populacao de N elementos, tern a mesma probabilidade 11 C~ de ser seleccionada .

Passos para obter uma amostra aleat6ria simples

1) Numerar consecutivamente os elementos da populacao de 1 aN.

,3) Recolher para a amostra os elementos da. populaeae ·correspondentes aos numeros aleatorios escolhidos.

2) Escolher n mimeros utilizando uma tabela de numeros aleatorios, ou atraves da geracao cornputacional de numeros aleatorios. Os mimeros tern que ser distintos e inferiores aN.

Desvantagens da amostragem aleatoria simples

1) E muitas vezes impraticavel por exigir a enumeracao de todos os elementos da populacao. Esta identificacao e tanto rnais cornplicada quanto maior for a populacao.

- 2) Como neste tipo de arnostragern cada elemento da populacao tern igual probabilidade de serescolhido,aamostrapo<le ser muito dispersa geograficamente. Se forem necessariasentrevistas -pessoais tal amostra seria muito dispendiosa e morosa de implementar, sobretudo em amostras de grande dimensao.

Quando usar amostragem aleateria simples:

1) Populacoes pequenas

2) Se existirem listas com os elementos da populacao (base de sondagem)

3) Se a dispersao geografica dos elementos nao constituir urn problema

16

Numa obra encomendaram-se 1000 lajes rusticas e de grande valor que vern numeradas. Quando a encomenda chega a obra 0 responsavel pelo controlo de qualidade do material decide investigar. Obviamente nao vai verificar as 1000 lajes .. Decide recolher uma amostra de 15 lajes e analisalas de modo a avaliar 0 numero de defeituosas.

Pega numa tabela de mnneros aleatorios e escolhe aleatoriamente, por exemplo, a 28 coluna para comecar, considera.por exemplo .os.d.primeiros digitos e regista os primeiros 15 numeros entre 1 e 1000;que--serao no caso da nossa folha da tabela de mimeros aleatorios os seguintes:

51, 882, 752, 653, 587, 115, 191,835,91,683, 649, 111,631, 758, 995. o controlador avaliara entao estas 15 lajes.

Exemplo:

• Seleccionar aleatoriamente urn elemento i de entre os primeiros k elementos da base de sondagem, e adicionar a amostra todos os restantes n-l elementos que a partir do i-esimo se distanciam de kern

k.

, II

Amostragem Sistematica ou quasi-aleateria

Caracteriza-se por:

Passos para obter uma amostra sistematica

Admitindo que existe uma lista com a populacao enumerada, 0 processo de recolha eo seguinte:

3) Partindo desse numero, adicionar . sucessivamente 0 valor k, seleccionando assim os elementos: i, i+k, i+2k, i+ 3k, ... , i+(n-l )k, obtendo assim os n elementos pretendidos.

1) Ca1cular 0 intervalo da amostra k como sendo 0 mrmero inteiro arredondado mais proximo de N/n.

2) Escolher aleatoriamente urn numero i entre 1 e k.

ocorrencia.

Desvantagens da amostragem sistematica

1) A seleccao de qualquer elemento, a excepcao do primeiro, depende do que foi seleccionado inicialmente, originando uma amostra que nao e verdadeiramente aleat6ria. Neste tipo de amostra, a probabilidade de seleccao nao e a mesma para todos os elementos. Este metodo nao da a todas as amostras a mesma probabilidade de

2) Pode comprometer a representatividade da amostra se a listagem da populacao tiver sido elaborada obedecendo a uma periodicidade ou criterio de regularidade. Deve, pois, ter-se em conta 0 modo como a lista e construida.

1) Muito util pela rapidez desde que a lista utilizada nao distorca a realidade.

Quando usar amostragem sistematica:

2) Pode evitar a intervencao do factor pessoal na escolha dos elementos da amostra, como por exemplo, na realizacao de entrevistas.

Escolhe-se

k= 1 00000/500=200.

Computacionalmente,

gera-se

Exemplo:

No final duma linha de producao diaria que habitualmente produz 100000 parafusos, e feito um controlo de qualidade sobre as respectivas dimensoes. Suponha-se que diariamente se recolhe uma amostra de 500 parafusos.

aleatoriamente urn numero entre 1 e 200. Suponhamos que se obtinha 0 numero 82. Observam-se entao os parafusos 82, 82+200 (282), 82+2x200 (482), 82+3x200 (682), ... , 82+499X200 (99882).

Amostragem Estratificada

Caracteriza-se por:

• Nesta amostragem a populacao nao e considerada com urn todo como acontecia nos dois metodos de amostragem anterior. Neste metodo conseguem identificar-se sub-grupos mutuamente exclusivos, que resultam na divisao da populacao emgrupos ou estratos, que sao grupos homogeneos relativamente a caracteristica ou caracteristicas em estudo, mas que variam muito entre si. Isto faz com que os resultados da amostragem sejam superiores ao da amostragem simples, pois a estratificacao reduz a variancia da populacao.

• Cada estrato e considerado como sendo uma populacao independente, e dentro de cada urn deles selecciona-se uma amostra aleat6ria simples.

• Se NJ, N2, ... , NL representam 0 numero de elementos de cada urn dos L estratos, e n., n2, ... , fiL 0 numero de elementos seleccionados aleatoriamente em cada estrato, entao 0 numero total de amostras estratificadas possiveis e igual a:

eNI XeN2 x ... XeNL < eN (numero de amostras simples)

nl »z nj, n

• A probabilidade de urn elemento ser seleccionado depende do estrato a que pertence, mas a semelhanca da amostragem aleatoria simples, essa probabilidade e igual a n/Ni (i=l, 2, ... , L)

. ~:.

21

Passos para obter uma amostra estratificada

1. Definir os estratos:

Estudos piloto, informacao de estudos anteriores, opinioes de conhecedores da populacao ou intuicao,

Variaveis geograficas, demograficas, econ6micas ou outras podem ser relevantes para 0 parametro que se estaa estudar, dai que a idade, o sexo, a categoria s6cio-econ6mica, a regiao, etc, sejam frequentemente utilizadas para a definicao dos.estratos (variaveis de

estratificacao ).

2. Seleccionar os elementos dentro de cada estrato (independentemente uns dos outros)

Nesta fase, a opcao por uma estratificacao proporcional ajuda a determinar quantos elementos devem ser incluidos na amostra.

Na populacao de dimensao N, se sao identificados L estratos com dimensoes Nj, N2, ••• , NL• Sendo N = N1+N2+ ... +NL e se os elementos a retirar de cada estrato forem n., fi2, ••. , IlL e possivel

escrever:

Existe urn outro processo de estratificacao nao proporcional (Neyman), que nao sera aqui nao abordado.

3. Conjugar os elementos seleccionados em cada estrato, que na sua totalidade constituem a amostra.

~ v

Quando usar amostragem estratificada:

• Se a estratificacao resultar em estratos homogeneos no que respeita a caracteristica em estudo entao ha ganhos de precisao relativamente a amostragem aleatoria simples.

• Reducao da variancia da populacao

~~~,:~.

Exemplo:

Suponhamos que num dado pais ha tres fabricas de cimento A, B e C em zonas vgeograficas distintas, pertencentes a uma dada empresa. No departamento de controlo de qualidade da empresa pretende-se recolher uma amostra de sacas de cimento de cada uma das fabricas, Suponha-se que a producao diana total da empresa e de 600000 sacas, sendo 300000 produzidas pela fabrica A, 200000 pela B e as restantes pela C. Note-se, no en tanto, que 0 processo de fabrico difere ligeiramente de fabrica para fabrics, Supondo que se pretende recolher uma amostra de 800 sacas, terse-ia que recolher:

-,,- ..

n 800

llA =N x- = 300000x = 400

A N 600000

n 800

llB=N x-=200000x =267

B N 600000

n 800

ne=N x-=lOOOOOx =133

c N 600000

• A amostragem por "clusters" e um processo amostral em que alguns dos "clusters" sao escolhidos aleatoriamente e dentro de cada "cluster" todos os elementos sao.seleccionados.rouseja, so existe uma etapa de amostragem. Trata-se afinal de urn processo de amostragem aleatoria simples em que cada unidade e um "cluster".

I

I

I

Amostragem por "Clusters"

Caracteriza-se por:

• E urn processo de amostragem que nao requer base de sondagem que liste os elementos da populacao individualmente (0 que por vezes e impraticavel ou mesmo impossivel).

• Este tipo de amostragem so exigequese.disponhade"umalistagem completa das unidades amostrais primarias, que .constituem grupos desses elementos populacionais.

• 0 termo "cluster" define urn grupo de unidades elementares da populacao.

• Este metodo e particularmente util quando a populacao se encontra dividida num reduzido numero de grupos ou "clusters" caracterizados por terem uma dispersao identica a da populacao total.

• Numa populacao organizada em "clusters" estes passam a ser as unidades amostrais primarias, de entre as quais se selecciona a amostra. Tal como na amostragem estratificada estes grupos sao exclusivos e exaustivos.

Clusters

Amostra

Seleccao aleatoria dos grupos A e C

Passos para obter uma amostra "por clusters"

1~ Especificar os "clusters" eescolher aleetoriamente-algans-deles.

2. Seleccionar todos os elementos dentro de cada "cluster" para a amostra.

Desvantagens da amostragem por "clusters"

• Os elementos de urn "cluster" geralmente sao fisicamente.proximos e por esse facto tem caracteristicas muito similares.

·\.,..:~'o ideal sena que cada "cluster" apresentasse-uma-variabilidade Identica it da populacao,

• A representatividade da amostra pode nao ficar garantida.

• A amostragem por "clusters" e em muitos casos a mais economica.

Quando os "clusters" sao unidades-geograficas e estao em causa entrevistas pessoais toma 0 trabalho rapido e economico.

Quando usar amostragem por "clusters"

• Esta amostragem e muitas vezes a (mica possivel porque nao existern bases de sondagens.

_,e. Para urn determinado custofixo, a amostragern por "clusters" possibilita recolher uma amostrade:maiordimensaopodendo assim obter maior precisao nos resultados.

Exemplo:

Uma dada empresa distribui tijolos com determinadas dimensoes em camioes para todos os seus clientes em todo 0 pais. Os tijolos, vao acondicionados segundo determinado sistema, identico para todos os camioes, que esta a ser testado pela empresa que pretende servir os seus clientes da melhor forma e, portanto, quer que a sua mercadoria seja entregue nas melhores condi90es~Note-se;no"entanto;'quenem todos os clientes encomendam 0 mesmo numerodetijolos.jaque.o.fazem.de acordo com as suas necessidades, mas independentemente . das dimensoes dos camioes 0 acondicionamento a ser testado e 0 mesmo.

Aqui os camioes representam os "clusters", po is constituern agruparnentos de tijolos.

o responsavel pelo estudo de arnostragern escolhera aleatoriarnente alguns dos camioes, sejam por exemplo 5 a serern entregues a clientes diferentes, cujos tijolos serao todos inspeccionados no acto da entrega ao cliente.

"clusters" .

Amostragem Multi-etapas

Caracteriza-se por:

• A amostragem rnulti-etapas e uma extensao da amostragem por

• Seleccionam-se aleatoriamente urn ou varies "clusters" e depois numa fase posterior recolhemosurnaamostraalea~6riadeelementos de cada urn dos "clusters" seleccionados.

• Este processo pode multiplicar-se por mais de duas etapas se os grupos estiverem divididos em subgrupos.

• Possiveis erros de amostragem podem multiplicar-se, dado que ao longo do processo se vao utilizando varias-eub-amostras com possibilidade de erros de amostragem em cada urna delas.

Desvantagens da amostragem Multi-etapas

• Em cada uma das etapas do metodo ha urna preocupacao constante com a dimensao e a precisao da amostra.

Exemplo:

Suponha-se que se pretende conhecer a aceitacao de urn novo tipo de oleo lubrificante no mercado nacional. Numa prime ira etapa escolhem-se aleatoriamente algumas cidades. Em cada uma das cidades escolhem-se aleatoriamente alguns dos ramos de actividade que utilizam tallubrificante. Em cada urn dos ramos escolhidos escolhem-se aleatoriamente algumas

empresas que constituem a amostra.

Clusters

Seleccao aleatoria de 2 cidades BeD [AJ [ill ca [] [gl

~rrb

12345 1234567

~~~~+

4 ramos de actividade

13 empresas

• A amostra principal e usada como base de sondagem.

Amostragem Multi-Fases

Caracteriza-se por:

• Em cada fase de amostragem esta sempre a ser usado 0 mesmo tipo de unidade amostral, obtendo-se de algumas unidades mais informacoes do que de outras, enquanto que na amostragem multietapas as unidades amostrais variam de uma etapa para outra.

"'_"

Exemplo:

Para avaliar as necessidades do mercado nacional relativamente a urn novo tipo de pecas produzidas por empresas do mercado nacional, podera ser melhor realizar primeiro urn inquerito telef6nico a nivel nacional para diferentes sectores de actividade e empresas de diferentes dimensoes que sao os grandes compradores do produto. Depois, procede-se a listagem das em~esas com basena resposta doinquerito,

De:S~' listagem seria retirada uma amostra-para-a.qual.se-estuderia mais pormenorizadamente 0 comportamento do consumidor, 0 tipo de vendedor que pretende, 0 responsavel na empresa pela compra das pe~as, os principais utilizadores das pecas, etc.

o numero de entrevistados em cada empresa depende do orcamento disponivel, caso houvesse orcamento deveriam ser entrevistados todos os intervenientes.

I

DISTRIBUICAO DO QUI-QUADRADO

X n x{n) (0 parametro caracterizador desta distribuicao eon E IN e indica 0 n° de graus de liberdade)

Fun~ao densidade de probabilidade do Qui-quadrado:

e -x/2 xn/2-1 f[x] = 2 nJ2 r (nj2) ,

n>O,x>O

sendo

E(X) = n e Var(X) = 2n

Teoremas:

1. Xi, i = 1,2, ... ,n v.a.' s independentes

n 2 n

c:::> .LXi n X(m)' m= Lni

1=1 i=l

f& 2.

~------------------------------------------~

'2

Kn N (J.1; 0) =? Z = X: J.1 nN(O;l) =? Z2= (X: J.1) n ~1)

3.

4. Quando n ~ 00 :

.r) r-. ' .. L)

o

"C

EN "C II

~..J .'it o :::s o

N

o

o

"tS eo

~

-g II

:::S..J .2" o :::s

o

-

><

~

co

c:o o

o

<0 o

o

v o

o

N o

ci

o (')

to N

o

to ci

N

o

o

"tS

fll) "tS II ca :::s..J

.2" o :::s a

<0

- -
)( ><
i;:" -
'to-
(11
0
co <0 v N co <0 v N 0
v_ N_ eo <0 v N_ o 0- 0 0 0 0
ci 0 0 0 0 0- 0- 0 0- 0 0- 0- a
I"-
0 !I
"C
coo t
r-CW') II'
-g II
0
::S_. co
.2'" C)
::s
a
0
L.O (n+ 1) n+I

r ( )--

-2- x2 2

f(x) = (n) 1+-;- ,

.JD.it r -

2

XEIR, n o O

DISTRIBUICAO T DE STUDENT

X n t(n) (0 parametro caracterizador desta distribuicao eon E IN e indica 0 nO de graus de liberdade)

Fun~ao densidade de probabilidade da t de Student:

n

E(X) = 0 e Var(X) = - (para n> 2). n-2

Teoremas:

1. X e Y v.a.'s independentes

XnN (0; 1) e Y n xfn)

I' I

2~>Quando n ~ 00 :

Xnt(n) ~ X;'N (0; ~ n ) ~ n-2

x 0

innN (0; 1)

~~

&f"'\ ~

~ ~ ~ ~
c c
~ ~
~ ~
~ ~
~ ~
00 00
~ ~ ~ ~
m m
~ U)
II II
_J _J
~ ~
~
t~
~ m
~ C>
II ~
_J II
~ _J
~
~
y
1
~ ~ ~
~ c
c ~
~ ~
~ ~
~
~ ~
~ 00
~ ~ ~ ~
I (



~

I

~

I

«)

~--------------------------------------~~I

DISTRIBUICAO F DE SNEDCOR

X n F( m,n) (m e n sao os parametros caracterizadores da distribuicao)

r(m+n)

2 (m'\ m/2 X<m-2)/2

f[x] = -r(-~-)-r-(~-) -;;) (1+ :xt+n)/2 '

X>O e m.n c- O

Funeao densidade de probabilidade da F de Snedcor:

n 2n2 (m+n-2)

E(X) = - (para n> 2) e Var(X) = (para n> 4)

n-2 m(n-2)2 (n-4)

Teoremas:

1. X n F(m,n) => l/X n F(n,m)

£~ ~

2. X e Y v.a.'s independentes

'Xf 2

Xn "In) e Y n X(n)

X/m

.---"\. F = -- n F.(m n)

'---V Yin '

(D o

~ C'! - N
~ 0 ~
0 N
T"" 6
- ....
~ ........
8 '-
0
"0 o
Q) ~ "0
C (J)
en c
u, C/)
u,
co eo
ci 0- ~o

o

~ ~
ci 0
.()
N N
0- 0 (D ci

o

N N
~ ~.
-- .........
to 0
to T"""
.._ 0
L-
a T"""
0 ..- .._..
~
'"'0 0
(]) 0
0 c: '"'0
. en Q)
u. c:
co en co
ci LL ci
.'
(D_ (D
0 ci o

N cs

o

£>:. ~

DISTRIBUI<;OES AMOSTRAIS DE ALGUMAS ESTATisTICAS

• POPULA<;OESBERNOULLI

Funeao massa de probabilidade:

x=O,l

Ospsl

Estatisticas:

• Sn = Xi + X2 + ... + Xn ~ frequencia absoluta do mimero de sucessos

P* Sn fr " . lati d' d -

• = - ~ equencla re ativa 0 numero e sucessos - proporcao

n .

* Distrlbuieao de Sn

A SnnBi(n,p)

[ ] (nl x n-x

P Sn = X = x) p (1- P ) , x = 0,1, ... , n

E[Sn] = np e Var[Sn] = np(l- p)

A Se n grande ( n> 30 ), aplicando 0 TLC: Sn - np _ n N( 0, 1) -Jnp(l- p)

* Sn . )

A P =-nBl(n,p

n

* Dlstribuiea« da proporeao amostral

r, * _ ]_ [Sn _ ] _ f, _ ] _ (n ) ny n-ny _ 1 ~ n

.PlP =v -P --y -PLsn-ny - P (l-p) ,y-O,-, ... ,

n ny nn n

...... '?' ... '.-

Sfn -p

A Se n grande (n>30), aplicando 0 Tl.C: n r'l N(O,l)

~P(l-PYn

* Distribuieao da diferenea entre duas proporeoes amostrais

sn1nBi(nI;p.) e Sn2nBi(n2;P2)} Sni e Sn2 v.a. ' s independentes

nI, n2 > 30

Pt(1-Pt) +P2(1-P2»)

nt n2

Se PI* = P2* = p* (mais usual na pratica), entao:

onde:

niPt + n2P2 P=

nt +n2

Você também pode gostar