Você está na página 1de 14

Disciplina cujo objectivo de estudo fundamental a recolha, compilao, anlise e interpretao de dados, com vista a uma melhor compreenso

o de um determinado fenmeno.
Populao Amostra

Estatstica Descritiva Inferncia Estatstica Teoria das Probabilidades

Fases do mtodo de Anlise Estatstica 1. 2. 3. 4. Identificao do problema Recolha de dados Anlise dos dados Anlise e interpretao dos resultados

1. Tipos de Dados
Escala Nominal
Os dados so identificados pela atribuio de um nome. Ex: Classificao de pessoas pela cor do Cabelo

Dados Qualitativos
estudo de caractersticas no numricas da populao

Escala Ordinal
Os dados so identificados pela atribuio de um nome, no entanto existe a possibilidade de estabelecer uma ordenao, segundo um critrio relevante. Ex: Classificaes obtidas pelos alunos num teste de Estatstica: mau, medocre, suficiente, bom e muito bom.

Escala de Intervalos
Os dados esto ordenados numa da escala cuja origem arbitrria. Pode atribuir-se um significado diferena entre dois nmeros, mas no sua razo. Ex: Temperatura.

Discretos
Assumem um n finito, ou infinito numervel, de observaes

Dados Quantitativos
so dados que se conseguem medir, ou seja, descrevem caractersticas numricas

Contnuos
Assumem valores num intervalo ou subintervalo real tomando uma infinidade (no numervel) de valores. 2

Escala de Razo
As mesmas caractersticas que na escala intervalar, no entanto a origem fixa. A razo entre dois nmeros tem significado. Ex: Peso, altura, comprimento.

EXEMPLO 1
Parques Elicos com Telemedidas com a REN
(http://www.centroinformacao.ren.pt/content/DPE_List.xls)

Subestao REN

Parque Cabril Pinheiro Fonte da Quelha Alto do Talefe Lameira So Pedro Trandeiras Alvo Terras Altas de Fafe Cho Falco Candeeiros Pampilhosa da Serra Pinhal Interior Videmonte Penamacor Nave Mourisca Caramulo (Bodiosa) Gardunha So Joo Serra Alvoaa Serra Leomil Testos Alto do Minho I Arada-Montemuro Cabeo da Rainha II Lagoa D.Joo e Feiro Ribabelide Lousa II Toutio

Nvel de Tenso (kV)

Torro

63

Valdigem Riba d'Ave Batalha Rio Maior Pereiros / Vila Ch 2 Falagueira Chafariz Ferro Bodiosa Castelo Branco Penela Ferro Valdigem Pedralva Carrapatelo Cabeo da Rainha II Lagoa D.Joo e Feiro Ribabelide Penela Pereiros / Vila Ch 2

63 150 63 63 220 150 63 220 63 150 63 63 63 150 63 63 63 63 63 220

X varivel em estudo: representa determinada caracterstica de uma populao ou de uma amostra Nvel de Tenso (kV) nas subestaes xi - i-sima observao amostral i=1,,n n nmero de elementos da amostra (dimenso da amostra) n=21

EXEMPLO 1
Amostra ordenada

Subestao REN Torro Valdigem Batalha Rio Maior Chafariz Bodiosa Penela Ferro Valdigem Carrapatelo Cabeo da Rainha II Lagoa D.Joo e Feiro Ribabelide Penela Riba d'Ave Falagueira Castelo Branco Pedralva Pereiros / Vila Ch 2 Ferro Pereiros / Vila Ch 2

Nvel de Tenso (kV) 63 63 63 63 63 63 63 63 63 63 63 63 63 63 150 150 150 150 220 220 220

2. Representao Tabular e Grfica dos Dados


Frequncia Absoluta: Fi - n de ocorrncias do valor Xi Frequncia Relativa:

EXEMPLO 1
Tabela de Frequncias Xi
63 150 220

Fi
14 4 3 0.667 0.190 0.143

Acumuladas 0,667 0,857 1

Diagrama de Barras
0,8 0,7
Frequncia Relativa

0,6 0,5 0,4 0,3 0,2 0,1 0 63 150 Nvel de Tenso 220

Polgono de Frequncias Acumuladas ou Ogiva

1,2

Frequncia Relativa Acumulada

1 0,8 0,6 0,4 0,2 0 63 150 Nvel de Tenso 220

EXEMPLO 2
Parques Elicos com Telemedidas com a REN
(http://www.centroinformacao.ren.pt/content/DPE_List.xls)

Parque

Potncia Instalada (MW)

Cabril Pinheiro Fonte da Quelha Alto do Talefe Lameira So Pedro Trandeiras Alvo Terras Altas de Fafe Cho Falco Candeeiros Pampilhosa da Serra Pinhal Interior Videmonte Penamacor Nave Mourisca Caramulo (Bodiosa) Gardunha So Joo Serra Alvoaa Serra Leomil Alto do Minho I Testos Arada-Montemuro Cabeo da Rainha II Lagoa D.Joo e Feiro Ribabelide Lousa II Toutio

20,2 21,6 13,5 13,5 10,4 10 18,2 22,8 106 34,5 111 114 144 32 79,9 38 38 49,2 116,85 21,7 36,1 16,1 227,55 24,6 71,8 15,2 34 6 12,5 24

EXEMPLO 2
Amostra ordenada

Parque

Potncia Instalada (MW)

Ribabelide So Pedro Lameira Lousa II Fonte da Quelha Alto do Talefe Cabeo da Rainha II Serra Leomil Trandeiras Cabril Pinheiro So Joo Alvo Toutio Testos Videmonte Lagoa D.Joo e Feiro Cho Falco Serra Alvoaa Nave Mourisca Caramulo (Bodiosa) Arada-Montemuro Penamacor Terras Altas de Fafe Candeeiros Pampilhosa da Serra Gardunha Pinhal Interior Alto do Minho I

6 10 10,4 12,5 13,5 13,5 15,2 16,1 18,2 20,2 21,6 21,7 22,8 24 24,6 32 34 34,5 36,1 38 38 49,2 71,8 79,9 106 111 114 116,85 144 227,55

EXEMPLO 2
Para representar estes dados necessrio agrupa-los em classes. Definio dos intervalos de classe: o N de classes k=5 para n<25; k= n para n 25. Ou o k1+3.22 log n (Regra de Sturges).

Tabela de Frequncias Intervalo


[6, 50.31] ]50.31, 94.62] ]94.62,138.93] ]138.93,183.24] ]183.24,227.55]

Xi
28,155 72,465 116,775 161,085 205,395

Fi
22 2 4 1 1

fi 0,733 0,067 0,133 0,033 0,033

fi Acumuladas 0,733 0,800 0,933 0,967 1,000

Histograma e Polgono de Frequncias Acumuladas

25

1,00 0,90

Frequncia Absoluta

20

0,80 0,70

15

0,60 0,50

10

0,40 0,30

0,20 0,10

0 50,31 94,62 138,93 183,24 227,55

0,00

Bin

OBS: Cada um dos rectngulos do histograma tem rea dada por (h x f i) onde h representa a amplitude de cada um dos intervalos de classe e fi representa a frequncia relativa da classe i. Quando os intervalos de classe no tm todos a mesma amplitude, a constante de proporcionalidade entre as reas dos rectngulos e as respectivas frequncias deixa de ser idntica para todos os intervalos. Neste caso, o histograma deve ser construdo utilizando para cada rectngulo a altura f i/hi. 8

3. Medidas de Localizao Central 3.1.


Mdia

Calculo da Mdia utilizando as frequncias: Para dados discretos e agrupados segundo os diferentes valores de X:

No entanto, se os dados estiverem agrupados em intervalos de classe:

Sobre a Mdia: o

X
n i1

X 0;

o uma medida influenciada por todos os valores observados. Mediana (Me) valor da varivel que ocupa a posio central na sucesso de observaes. o valor da varivel ao qual corresponde uma frequncia relativa acumulada igual (ou superior) a 0.5. Calculo da Mediana: Depois de se colocarem os dados por ordem crescente: Se n impar: Me o valor para a observao central de ordem (n+1)/2; Se n par: Me a mdia dos valores das observaes centrais de ordem n/2 e (n+2)/2. Sobre a Mediana: o No influenciada pelos valores extremos na amostra.

3.2.

3.3.

Moda (Mo) - valor da varivel que mais frequente. Para variveis contnuas, a ocorrncia de dados com valor idntico excepcional. Neste caso, a moda definida como um valor do intervalo de classe modal. Sobre a Moda: o Uma amostra pode no ter moda ou pode ter mais de uma moda; o No influenciada pelos valores extremos na amostra. 9

Moda, Mediana e Mdia


1 2 3 Distribuio Simtrica: Mdia = Mediana = Moda Moda < Mediana < Mdia Mdia < Mediana < Moda

Distribuio Assimtrica positiva ou enviesada esquerda : Distribuio Assimtrica negativa ou enviesada direita :

A mdia a medida de tendncia central mais utilizada e tambm aquela que mais eficiente quando se pretende inferir sobre uma populao; Como no so influenciadas por valores extremos da amostra, a moda e a mediana so medidas importantes para a caracterizao de amostras assimtricas.

4. Medidas de Localizao no Central


Quartis: Dividem a mostra (ordenada) em 4 partes: Q1 : 1 quartil Q2 : 2 quartil Q3 : 3 quartil 25% das observaes tm um valor inferior (ou igual) a Q1 50% das observaes tm um valor inferior (ou igual) a Q2 (Mediana) 75% das observaes tm um valor inferior (ou igual) a Q3 Amplitude interquartis: Q3 - Q1

10

5. Medidas de Disperso
5.1. Varincia Amostral

Sendo

Vem

Para dados discretos e agrupados segundo os diferentes valores de X:

5.2.

Varincia Amostral Corrigida

Para dados discretos e agrupados segundo os diferentes valores de X:

5.3. 5.4.

Desvio Padro: Desvio Padro corrigido:

5.5.

Coeficiente variao: 11

EXEMPLO 1
Nvel de Tenso (kV) Mdia Erro-padro Mediana Moda Desvio-padro Varincia da amostra Curtose Assimetria Intervalo Mnimo Mximo Soma Contagem Q1 Q3 S 102 13,11868896 63 63 60,11738517 3614,1 -0,223784219 1,155012704 157 63 220 2142 21 63 150 58,66856058

EXEMPLO 2
Potncia Instalada [MW]
Mdia Erro-padro Mediana Moda Desvio-padro Varincia da amostra Curtose Assimetria Intervalo Mnimo Mximo Soma Contagem Q1 Q3 S 49,43866667 9,318376896 28,3 13,5 51,03885226 2604,96444 3,980474334 1,927114669 221,55 6 227,55 1483,16 30 16,625 66,1125 50,181

12

6. Representao Grfica das Medidas


Diagrama de Caixas (Caixas de Bigodes, Boxplot, Box-and-Whisker Plot)

*
Outlier: valor superior a 1,5[Q3+(Q3-Q1)] (ou inferior a 1,5[Q1-(Q3-Q1)]) Maior valor que no um outlier Q3

Me=Q2

Q1 131 Menor valor que no um outlier

Extremo: valor superior a 3[Q3+(Q3-Q1)] (ou inferior a 3[Q1-(Q3-Q1)])

13

EXEMPLO 1

80 ,0 0

12 0,00

16 0,00

20 0,00

Te nso

EXEMPLO 2

0,00

50 ,0 0

10 0,00

15 0,00

20 0,00

Potncia

14

Você também pode gostar