Escolar Documentos
Profissional Documentos
Cultura Documentos
o de um determinado fenmeno.
Populao Amostra
Fases do mtodo de Anlise Estatstica 1. 2. 3. 4. Identificao do problema Recolha de dados Anlise dos dados Anlise e interpretao dos resultados
1. Tipos de Dados
Escala Nominal
Os dados so identificados pela atribuio de um nome. Ex: Classificao de pessoas pela cor do Cabelo
Dados Qualitativos
estudo de caractersticas no numricas da populao
Escala Ordinal
Os dados so identificados pela atribuio de um nome, no entanto existe a possibilidade de estabelecer uma ordenao, segundo um critrio relevante. Ex: Classificaes obtidas pelos alunos num teste de Estatstica: mau, medocre, suficiente, bom e muito bom.
Escala de Intervalos
Os dados esto ordenados numa da escala cuja origem arbitrria. Pode atribuir-se um significado diferena entre dois nmeros, mas no sua razo. Ex: Temperatura.
Discretos
Assumem um n finito, ou infinito numervel, de observaes
Dados Quantitativos
so dados que se conseguem medir, ou seja, descrevem caractersticas numricas
Contnuos
Assumem valores num intervalo ou subintervalo real tomando uma infinidade (no numervel) de valores. 2
Escala de Razo
As mesmas caractersticas que na escala intervalar, no entanto a origem fixa. A razo entre dois nmeros tem significado. Ex: Peso, altura, comprimento.
EXEMPLO 1
Parques Elicos com Telemedidas com a REN
(http://www.centroinformacao.ren.pt/content/DPE_List.xls)
Subestao REN
Parque Cabril Pinheiro Fonte da Quelha Alto do Talefe Lameira So Pedro Trandeiras Alvo Terras Altas de Fafe Cho Falco Candeeiros Pampilhosa da Serra Pinhal Interior Videmonte Penamacor Nave Mourisca Caramulo (Bodiosa) Gardunha So Joo Serra Alvoaa Serra Leomil Testos Alto do Minho I Arada-Montemuro Cabeo da Rainha II Lagoa D.Joo e Feiro Ribabelide Lousa II Toutio
Torro
63
Valdigem Riba d'Ave Batalha Rio Maior Pereiros / Vila Ch 2 Falagueira Chafariz Ferro Bodiosa Castelo Branco Penela Ferro Valdigem Pedralva Carrapatelo Cabeo da Rainha II Lagoa D.Joo e Feiro Ribabelide Penela Pereiros / Vila Ch 2
X varivel em estudo: representa determinada caracterstica de uma populao ou de uma amostra Nvel de Tenso (kV) nas subestaes xi - i-sima observao amostral i=1,,n n nmero de elementos da amostra (dimenso da amostra) n=21
EXEMPLO 1
Amostra ordenada
Subestao REN Torro Valdigem Batalha Rio Maior Chafariz Bodiosa Penela Ferro Valdigem Carrapatelo Cabeo da Rainha II Lagoa D.Joo e Feiro Ribabelide Penela Riba d'Ave Falagueira Castelo Branco Pedralva Pereiros / Vila Ch 2 Ferro Pereiros / Vila Ch 2
Nvel de Tenso (kV) 63 63 63 63 63 63 63 63 63 63 63 63 63 63 150 150 150 150 220 220 220
EXEMPLO 1
Tabela de Frequncias Xi
63 150 220
Fi
14 4 3 0.667 0.190 0.143
Diagrama de Barras
0,8 0,7
Frequncia Relativa
0,6 0,5 0,4 0,3 0,2 0,1 0 63 150 Nvel de Tenso 220
1,2
EXEMPLO 2
Parques Elicos com Telemedidas com a REN
(http://www.centroinformacao.ren.pt/content/DPE_List.xls)
Parque
Cabril Pinheiro Fonte da Quelha Alto do Talefe Lameira So Pedro Trandeiras Alvo Terras Altas de Fafe Cho Falco Candeeiros Pampilhosa da Serra Pinhal Interior Videmonte Penamacor Nave Mourisca Caramulo (Bodiosa) Gardunha So Joo Serra Alvoaa Serra Leomil Alto do Minho I Testos Arada-Montemuro Cabeo da Rainha II Lagoa D.Joo e Feiro Ribabelide Lousa II Toutio
20,2 21,6 13,5 13,5 10,4 10 18,2 22,8 106 34,5 111 114 144 32 79,9 38 38 49,2 116,85 21,7 36,1 16,1 227,55 24,6 71,8 15,2 34 6 12,5 24
EXEMPLO 2
Amostra ordenada
Parque
Ribabelide So Pedro Lameira Lousa II Fonte da Quelha Alto do Talefe Cabeo da Rainha II Serra Leomil Trandeiras Cabril Pinheiro So Joo Alvo Toutio Testos Videmonte Lagoa D.Joo e Feiro Cho Falco Serra Alvoaa Nave Mourisca Caramulo (Bodiosa) Arada-Montemuro Penamacor Terras Altas de Fafe Candeeiros Pampilhosa da Serra Gardunha Pinhal Interior Alto do Minho I
6 10 10,4 12,5 13,5 13,5 15,2 16,1 18,2 20,2 21,6 21,7 22,8 24 24,6 32 34 34,5 36,1 38 38 49,2 71,8 79,9 106 111 114 116,85 144 227,55
EXEMPLO 2
Para representar estes dados necessrio agrupa-los em classes. Definio dos intervalos de classe: o N de classes k=5 para n<25; k= n para n 25. Ou o k1+3.22 log n (Regra de Sturges).
Xi
28,155 72,465 116,775 161,085 205,395
Fi
22 2 4 1 1
25
1,00 0,90
Frequncia Absoluta
20
0,80 0,70
15
0,60 0,50
10
0,40 0,30
0,20 0,10
0,00
Bin
OBS: Cada um dos rectngulos do histograma tem rea dada por (h x f i) onde h representa a amplitude de cada um dos intervalos de classe e fi representa a frequncia relativa da classe i. Quando os intervalos de classe no tm todos a mesma amplitude, a constante de proporcionalidade entre as reas dos rectngulos e as respectivas frequncias deixa de ser idntica para todos os intervalos. Neste caso, o histograma deve ser construdo utilizando para cada rectngulo a altura f i/hi. 8
Calculo da Mdia utilizando as frequncias: Para dados discretos e agrupados segundo os diferentes valores de X:
Sobre a Mdia: o
X
n i1
X 0;
o uma medida influenciada por todos os valores observados. Mediana (Me) valor da varivel que ocupa a posio central na sucesso de observaes. o valor da varivel ao qual corresponde uma frequncia relativa acumulada igual (ou superior) a 0.5. Calculo da Mediana: Depois de se colocarem os dados por ordem crescente: Se n impar: Me o valor para a observao central de ordem (n+1)/2; Se n par: Me a mdia dos valores das observaes centrais de ordem n/2 e (n+2)/2. Sobre a Mediana: o No influenciada pelos valores extremos na amostra.
3.2.
3.3.
Moda (Mo) - valor da varivel que mais frequente. Para variveis contnuas, a ocorrncia de dados com valor idntico excepcional. Neste caso, a moda definida como um valor do intervalo de classe modal. Sobre a Moda: o Uma amostra pode no ter moda ou pode ter mais de uma moda; o No influenciada pelos valores extremos na amostra. 9
Distribuio Assimtrica positiva ou enviesada esquerda : Distribuio Assimtrica negativa ou enviesada direita :
A mdia a medida de tendncia central mais utilizada e tambm aquela que mais eficiente quando se pretende inferir sobre uma populao; Como no so influenciadas por valores extremos da amostra, a moda e a mediana so medidas importantes para a caracterizao de amostras assimtricas.
10
5. Medidas de Disperso
5.1. Varincia Amostral
Sendo
Vem
5.2.
5.3. 5.4.
5.5.
Coeficiente variao: 11
EXEMPLO 1
Nvel de Tenso (kV) Mdia Erro-padro Mediana Moda Desvio-padro Varincia da amostra Curtose Assimetria Intervalo Mnimo Mximo Soma Contagem Q1 Q3 S 102 13,11868896 63 63 60,11738517 3614,1 -0,223784219 1,155012704 157 63 220 2142 21 63 150 58,66856058
EXEMPLO 2
Potncia Instalada [MW]
Mdia Erro-padro Mediana Moda Desvio-padro Varincia da amostra Curtose Assimetria Intervalo Mnimo Mximo Soma Contagem Q1 Q3 S 49,43866667 9,318376896 28,3 13,5 51,03885226 2604,96444 3,980474334 1,927114669 221,55 6 227,55 1483,16 30 16,625 66,1125 50,181
12
*
Outlier: valor superior a 1,5[Q3+(Q3-Q1)] (ou inferior a 1,5[Q1-(Q3-Q1)]) Maior valor que no um outlier Q3
Me=Q2
13
EXEMPLO 1
80 ,0 0
12 0,00
16 0,00
20 0,00
Te nso
EXEMPLO 2
0,00
50 ,0 0
10 0,00
15 0,00
20 0,00
Potncia
14