Você está na página 1de 30

04-11-2015

Captulo 1 - Estatstica Descritiva:


1. Introduo organizao e ao processamento de
dados.
2. Amostra e populao; cuidados a ter na recolha
da amostra.
3. Ordenao dos dados. Agrupamento dos dados.
Tabela de frequncias.
4. Medidas de localizao e de disperso.
5. Representao grfica dos dados: grfico de
barras, grfico de sectores, grfico de caule-e-
folhas, caixa-de-bigodes, histograma.

INTRODUO:

Um objectivo comum dos inquritos e de


outros processos de obteno de dados a
recolha de informao de uma parte de um
grupo maior, de modo a aprender algo sobre o
grupo maior. Por exemplo, podemos perguntar
a 10% dos alunos qual a sua nota de entrada na
Universidade e assim ter alguma informao
sobre a totalidade dos alunos.

Aquilo que se est a estudar chama-se varivel estatstica (ex: se estudarmos a


altura, a varivel estatstica a altura)

1
04-11-2015

Tratamento de Dados: um estudo


estatstico onde se pretende tirar concluses
sobre alguma coisa

2
04-11-2015

Etapas (Fases) do Mtodo Estatstico:

1. Identificao do problema ou situao;


2. Recolha de dados (contnua, peridica, ocasional);
3. Crtica dos dados (suprimir valores anormais que
possam enviesar as concluses do estudo);
4. Apresentao dos dados (organizar e classificar
os dados de forma prtica, racional e para um melhor
entendimento do fenmeno a estudar);
5. Anlise e interpretao dos dados.
Ver slide seguinte igualmente

RECOLHA DE DADOS:

-Envolve a obteno, a reunio e o


registo dos dados;
-Recorre-se a mtodos como a observao
directa, inquritos com questionrio,
entrevistas ou pesquisa
bibliogrfica ou documental.

3
04-11-2015

Resultam de Contagens
(nmeros inteiros)
Resultam de Medies
(nmeros que podem
no ser inteiros)

,nem contar.
(No do origem a nmeros)

Resultam de medies ou contagens (do origem a nmeros)

4
04-11-2015

PORQU USAR UMA AMOSTRA?

-A populao infinita ou finita, mas numerosa;


-Reduo de custos (dinheiro, esforo, tempo);
-Testes ou observaes podem ser destrutivos
dos indivduos a observar.

CUIDADOS A TER NA RECOLHA DA AMOSTRA


Imparcialidade:
Todos os indivduos devem ter a mesma oportunidade
(probabilidade) de fazer parte da amostra;
Representatividade:
Deve conter na mesma proporo todas as caractersticas
da populao;
Dimenso suficiente:
Suficientemente grande para que as caractersticas da
amostra se aproximem das da populao-universo.

CUIDADOS A TER NA RECOLHA DA AMOSTRA

5
04-11-2015

Neste tipo de amostras os elementos da populao so


escolhidos por um processo decidido antes de se iniciar a
seleco, so escolhidos a partir de uma regra estabelecida
priori.

Amostragem Estratificada
Neste tipo de amostras os elementos da populao so escolhidos de
acordo com o nmero que os diferentes grupos da populao tm.

Subdividir a populao em, pelo menos, dois subgrupos distintos que


partilham alguma caracterstica e, em seguida, recolher uma amostra de cada
um dos subgrupos (ou estratos).

Quando a populao est dividida em grupos que tm quantidades


diferentes, a escolha do nmero de elementos de cada grupo dever ser
proporcional quantidade de elementos desse grupo.

6
04-11-2015

[Grupos]

Exemplo:

RESUMINDO: Pretende-se conhecer a opinio dos 180 alunos do 8 ano de uma escola sobre o local onde
gostariam de realizar a viagem de finalistas do 9ano. Para isso efectuou-se uma sondagem com
uma amostra de dimenso 36. A amostra foi escolhida por um dos processos:

A) Numeraram-se todos os alunos de 1 a 180 e colocaram-se em papel dentro de um saco.


Retiraram-se 36 nmeros ao acaso que so seleccionados.

B) Numeraram-se os 180 alunos de 1 a 180. Como 180: 36 = 5, ento basta escolher um aluno em
cada 5. Assim sorteia-se um nmero entre 1 e 5. Por exemplo, se sair o 3, os alunos escolhidos so:

3-8-13-18-23.178.

C) Os 180 alunos dividem-se em 8 turmas ABCDEFGH que tm respectivamente 27, 27, 24, 24, 19,19,
27, 12 alunos. Assim, o nmero de alunos da amostra ser escolhido em proporo ao nmero de
alunos de cada turma. A escolha seria:

Turmas Alunos % N alunos


Amostra Identificar a tcnica de seleco da
ABG 27 27/180 x 100 = 36 x 0,15 5 amostra em cada processo:
15%
CD 24 24/180 x 100 = 36 x 0,133 5 A  Amostragem aleatria simples
13,3%
EF 19 19/180 x 100 = 36 x 0,11 4 B  Amostragem sistemtica
11%
H 12 12/180 x 100 = 7% 36 x 0,07 3 C  Amostragem estratificada

7
04-11-2015

8
04-11-2015

(ou o nmero total


de observaes).

Frequncia relativa x 100 = Percentagem

DADOS AGRUPADOS EM CLASSES:

Quando num estudo estatstico a varivel quantitativa


(mtrica) DISCRETA ou CONTNUA mas com uma grande
variedade de valores , utilizam-se classes para agrupar os
dados e tornar mais fcil a a sua leitura e as concluses
posteriores.

[a,b[
 classe de a a b (a-b)
 na forma de intervalo

O valor a pertence a esta classe


O valor b no pertence a esta classe
Na representao de dados agrupados em classes
usam-se HISTOGRAMAS
Nota: Tabela Distribuio de Frequncias para Quantitativos Discretos
Para dados Qualitativos usam-se as Frequncias simples( Absoluta e Dados Contnuos constroem-se geralmente
Relativa). classes

Nota: Tabela Distribuio de Frequncias para dados agrupados por


classes

9
04-11-2015

10
04-11-2015

POLGONO DE FREQUNCIAS ORDINRIAS [Dados Agrupados em Classes]

NOTA: Em cada extremo coloca-se, habitualmente,


uma classe adicional de frequncia nula.

de Galton NOTA 1: Em Histogramas para dados agrupados em Classes de diferentes


amplitudes necessrio corrigir proporcionalmente as frequncias dentro de
cada classe [como se todas tivessem a mesma amplitude] e representam-se as
frequncias corrigidas.

NOTA 2: Para traar Histogramas de Distribuio de Frequncias Acumuladas


no necessrio proceder s correces das frequncias, quando as classes
tm diferentes amplitudes.

NOTA 3: Embora no tenha sentido construir um diagrama de barras


quando temos uma amostra de dados contnuos, o mesmo no se passa
em relao ao histograma e aos dados discretos.
Na verdade, podemos ter uma amostra de dados discretos, em que o
nmero de valores distintos que surgem na amostra demasiado
grande, para que se considerem todos como classes, pelo que
representamos graficamente essa amostra segundo a forma de um
histograma !

uma representao utilizada essencialmente para dados


qualitativos.

11
04-11-2015

Diagrama de Caule-E-Folhas: dados discretos ou contnuos


1 Traar uma linha vertical
2 O lado esquerdo da linha o Caule
3 O lado direito da linha so Folhas
4 No Caule coloca-se o dgito (ou dgitos) da classe de maior grandeza, seguido dos
restantes na Folha. No exemplo abaixo, na Folha coloca-se s o algarismo das Unidades
5 Colocam-se os algarismos no Diagrama por ordem crescente
6 Colocar uma Legenda com a indicao da forma como se devem ler os dados

Legenda: 7 | 3 significa 73

Existem vrios critrios quando os valores envolvidos no so inteiros e para


inteiros maiores que 99. Para valores inteiros da varivel no superiores a 99, no
Caule" vai o algarismo das dezenas e na "folha" vai um dgito, o algarismo das
unidades

Caixa- de- Bigodes


ou
Diagrama de Extremos e Quartis-Outliers

Nota: Observaes que se afastam do padro geral


dos dados - so candidatos a OUTLIERS

12
04-11-2015

VALOR ADJACENTE INFERIOR AI, como sendo o menor valor da


amostra (eventualmente o mnimo) que maior que b1(BARREIRA
INFERIOR)
VALOR ADJACENTE SUPERIOR AS, como sendo o maior valor da
amostra (eventualmente o mximo) que menor que b2 (BARREIRA
SUPERIOR)
OUTLIER um valor que no est compreendido no [AI, AS]

Outliers Extremos ou Severos:

13
04-11-2015

[Ou de Localizao Central]

Utilizamos a mdia Aritmtica quando se trata de grandezas directamente


proporcionais, como por exemplo, velocidade e distncia.

14
04-11-2015

A mdia geomtrica usada frequentemente em Estatstica Econmica, por


exemplo: no clculo da taxa mdia de retorno de um investimento ou no clculo
da taxa equivalente de uma aplicao financeira.
Exemplo: Variaes percentuais em sequncia
Ex: Com um aumento salarial de 20% aps um ms, 12% aps 2 meses e 7% aps 3 meses, qual o
percentual mdio mensal de aumento do salrio?

Utilizamos a mdia Harmnica quando se trata de grandezas inversamente


proporcionais, como por exemplo, velocidade e tempo e custo mdio dos
bens comprados com uma quantia fixa.

15
04-11-2015

Obs: A moda utilizada quando desejamos obter uma medida rpida e


aproximada de posio ou quando a medida de posio deva ser o valor
mais tpico da distribuio. J a mdia aritmtica a medida de posio
que possui a maior estabilidade.

DADOS AGRUPADOS EM CLASSES DADOS AGRUPADOS EM CLASSES

Nota: No clculo da Moda para dados


agrupados em Classes de diferentes amplitudes
necessrio corrigir proporcionalmente as
frequncias dentro de cada classe [como se
todas tivessem a mesma amplitude] e escolher
a classe modal para frequncias corrigidas:

DADOS AGRUPADOS EM CLASSES

DETERMINAO DA MODA POSICIONADA


NUMA CLASSE EXTREMA, QUER POR FRMULA
QUER GRAFICAMENTE:

Considera-se que a frequncia da


ou
(inexistente) classe anterior da
moda zero, no caso de a classe modal
ser a primeira.
Se a classe modal fosse a ltima
procedia-se de modo idntico:
considerava-se nula a frequncia da
(no existente) classe seguinte.

Nota: Para a Matemtica,


zero nem sempre o
Ordenar os dados por ordem crescente ou decrescente
mesmo que nada ou vazio!
[s se calcula para variveis Quantitativas]

16
04-11-2015

DADOS AGRUPADOS EM CLASSES (FRMULA COM FREQUNCIA RELATIVA


SIMPLES E ACUMULADA)

Nota: No clculo da Mediana para Classes de diferente


amplitude no necessrio proceder correco das
frequncias

DADOS AGRUPADOS EM CLASSES (FRMULA COM FREQUNCIA ABSOLUTA Nota1: Como medida de localizao, a mediana mais robusta
SIMPLES E ACUMULADA)
- MEDIANA OBTM-SE POR INTERPOLAO LINEAR do que a mdia, pois no to sensvel aos dados !

Nota 2: A MODA especialmente til para reduzir a informao

de um conjunto de dados qualitativos, apresentados sob a

forma de nomes ou categorias, para os quais no se pode

calcular a mdia e por vezes a mediana (se no forem

susceptveis de ordenao).

Nota3: EXISTE UMA RELAO ENTRE MDIA, MEDIANA E MODA, PARA UMA DISTRIBUIO
DE DADOS APROXIMADAMENTE NORMAL (RAZOAVELMENTE SIMTRICA), TRADUZIDA
ANALITICAMENTE POR:

[DADOS NO AGRUPADOS]

Ao valor QP d-se o nome de Quantil de ordem p ou


percentagem 100p%.

Quartis p = 1/4, 2/4, 3/4;


0 < p <1 Decis- p = 1/10, 2/10,, 9/10;
Percentis p = 1/100, 2/100,, 99/100.

17
04-11-2015

Quartis so medidas de localizao que dividem


os dados em 4 partes em que cada uma dessas
partes contm 25% dos dados. Os Quartis
representam-se por Q1, Q2 e Q3 e tem-se que:

DADOS AGRUPADOS EM CLASSES (FRMULA COM FREQUNCIA RELATIVA


SIMPLES E ACUMULADA)
RESUMINDO:

Q1 1Quartil  Mediana da 1 metade do conjunto de


dados.
Q2 2Quartil  Mediana do conjunto de dados
(Q2 =Me).

Q3 3 Quartil
 Mediana da 2 metade do conjunto de
dados.

Amplitude inter-quartis: Q3 - Q1
Quartis p = 1/4, 2/4, 3/4;
Decis- p = 1/10, 2/10,, 9/10;
Percentis p = 1/100, 2/100,, 99/100.

DADOS AGRUPADOS EM CLASSES (FRMULA COM FREQUNCIA ABSOLUTA


SIMPLES E ACUMULADA)

Normalmente os DECIS e os PERCENTIS s tm


interesse para um grande nmero de valores, isto ,
para DADOS AGRUPADOS.

18
04-11-2015

Exemplo: Num concurso os primeiros 17


classificados realizaram uma prova nos
seguintes tempos, em minutos:

a) Indique os extremos da distribuio


b) Qual a mdia dos 17 concorrentes
c)Determine os Quartis da distribuio
d)Desenhe o diagrama de extremos e
quartis

Resoluo (USANDO A FRMULA DOS QUANTIS):


a) Indique os extremos da distribuio:
mximo 25
mnimo  07
b) Qual a mdia dos 17 concorrentes:
14,35
c)Determine os Quartis da distribuio:
Q1=9
Q2=Me=13
Q3= 18
7 7 8 8 9 11 12 12 13 15 16 18 18 20 22 23 25

OBSERVAO: Mtodo inclusivo


 O VALOR DA MEDIANA
ENTRA NAS DUAS SEMI-SRIES.

19
04-11-2015

20
04-11-2015

EM RESUMO:

21
04-11-2015

Medidas Descritivas-Disperso ou
de Variao:
Amplitude de um conjunto de dados (Intervalo de Variao)
Varincia

Desvio - Padro
Amplitude Inter-Quartil (Intervalo Inter-Quartis)
Desvio mdio

Coeficiente de variao

Amplitude de um conjunto de dados


So medidas que avaliam o quanto uma
distribuio de pontos se afasta ou se  Chama-se amplitude e representa-se por R (range) ou
(AT ou Atot) de um conjunto de dados diferena entre
aproxima do valor da mdia. Essas
o mximo e o mnimo desse conjunto de dados:
medidas indicam a confiabilidade que
podemos ter na mdia da distribuio.  Para dados agrupados em classes, calcula-se a diferena

Quanto menor a disperso, mais confivel entre o limite superior da ltima classe e o limite
inferior da primeira classe:
o valor mdio.

Exemplo:
Esta medida muito pouco resistente para Observe os seguintes conjuntos de dados representados por diagramas de pontos

avaliar a disperso de dados pelas seguintes correspondentes a trs conjuntos de observaes.

razes:

a amplitude insensvel a qualquer


alterao dos valores intermdios;
a presena de uma nica observao muito Calcule a amplitude e comente a resistncia desta medida para avaliar a disperso
dos conjuntos de dados apresentados
alta ou muito baixa tem uma grande
Resposta: Para qualquer um dos trs conjuntos de dados, a amplitude 15-7=8.
influncia sobre o valor da amplitude. A amplitude igual mas as disperses so muito diferentes como mostram os
prprios grficos de pontos.

22
04-11-2015

 Quando se utiliza ?
VARINCIA Quando a varivel representa uma amostra.

 A varincia no geralmente utilizada como A frmula dada por:


onde:
medida de disperso mas necessria para o
: representa a mdia
clculo do desvio padro. : representa o tamanho da amostra
: representa a varivel
 Temos duas expresses para calcular a
varincia: e . Nota:

 Quando se utiliza ? Exemplo:

Quando a varivel representa a populao.


O Pedro registou as temperaturas mximas em C, em 7 dias
A frmula dada por:
consecutivos, no local onde esteve a passar frias.
onde: Os dados so os seguintes:

: representa a mdia da populao

: representa o tamanho da populao (dimenso)

: representa a varivel Determine a varincia da amostra.

RESOLUO:
Xi Fi Fi*xi Xi-mdia (Xi-mdia)^2.Fi
DESVIO PADRO:
26 1 26 -4 16
28 1 28 -2 4  O desvio-padro representa-se por S ou
29 1 29 -1 1
30 1 30 0 0 conforme a varincia seja ou .
32 2 64 2 8
33 1 33 3 9  Assim:
7 210 38

Mdia 30

Varincia 6,33

23
04-11-2015

PROPRIEDADES DO DESVIO PADRO:


 sempre no negativo:
Quanto maior for o seu valor, maior ser a disperso dos
dados em relao mdia;
Se o desvio padro igual a zero porque no existe
variabilidade, isto , os dados so todos iguais.

Amplitude Inter-Quartil:
EXEMPLO:
 Um defesa marcou em cinco pocas consecutivas os seguintes golos:
Desvio Mdio:
2 3 6 6 8
Calcule o desvio padro.

Nota:

AMPLITUDE INTER-QUARTIL OU DESVIO PADRO ?


Do mesmo modo que a questo foi posta relativamente s duas medidas de
localizao mais utilizadas - mdia e mediana, tambm aqui se pode por o problema
de comparar estas duas medidas de disperso.

1. A amplitude inter-quartil mais robusta, relativamente presena de "outliers",


do que o desvio padro, que mais sensvel aos dados.

2. Para uma distribuio dos dados aproximadamente normal, verifica-se a seguinte


relao: Amplitude inter-quartil 1.3 x desvio padro

3. Se a distribuio enviesada, j no se pode estabelecer uma relao anloga


anterior, mas pode acontecer que o desvio padro seja muito superior amplitude
inter-quartil, sobretudo se se verificar a existncia de "outliers".

24
04-11-2015

EM RESUMO: PARA RELEMBRAR:

No que diz respeito recolha, organizao e


apresentao de dados, um estudo estatstico
para dados contnuos igual ao que se faz para
dados discretos. Continuamos a recorrer a
tabelas e grficos, como vimos anteriormente.

Dados Agrupados por Classes (Dados contnuos


ou Discretos com valores muito distintos):

6. O ponto mdio de uma classe (ou marca da classe)


determina-se adicionando os limites da classe (inferior e
superior) e dividindo por dois.

7. Amplitude da Classe a diferena entre dois Int significa o inteiro mais


limites superiores consecutivos ou dois limites prximo ou a parte inteira de

inferiores consecutivos.

Obs: 1 ABORDAGEM  Nmero de classes (habitualmente entre 5 e


20).
Existem outras Regras arbitrrias (critrios)Pg Seguinte

25
04-11-2015

CRITRIOS PARA DETERMINAO DOS INTERVALOS DE CLASSE

Nmeros de classes a considerar (k):


A) Tabela de Truman L. Kelley
n 5 10 25 50 100 200 500 1000

k 2 4 6 8 10 12 15 15

B) Regra Juran, Quality Control Handbook


n 20-50 51-100 101-200 201-500 501-1000 >1000

K 6 7 8 9 10 11-20
excesso
C) Montgomery, D.C., Introduction to Statiscal Quality Control
n classes =

D) BesterField, DH, Quality Control


Classes 4 a 20
n <100 100-500 >500
K 5-9 8-17 15-20

Obs: Qualquer regra para determinao do n de classes no nos levam a uma deciso
final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado
natureza dos dados.

Determine os intervalos de classe e construa a tabela de frequncias

Exemplo: Determine o n de classes e os respectivos intervalos


para uma amostra:
n = 125
Valor mnimo da amostra = 73,967
Valor mximo da amostra = 74,030

26
04-11-2015

Foram efectuadas 100 medies de dimetro de determinadas peas e os resultados


obtidos foram os seguintes:

22 25 15 13 27 30 18 10 16 12

n = 125 19 27 24 22 27 27 30 18 19 23

15 20 20 27 25 29 17 15 26 24
Por ex: 8 classes
32 14 20 20 27 21 15 22 16 19

25 27 18 13 23 25 25 27 24 32
A = 74,030-73,967 = 0,063
a = 0,063/8 =0,07875 0,008 27 30 22 24 16 19 23 25 30 30

e = k.a-A = 0,001 27 22 21 22 24 29 17 19 22 26
c1= 73,967-0,0005 73,966 23 21 24 26 30 32 15 19 20 20

17 22 20 27 29 19 26 30 16 20
[73,966;73,974[
17 23 16 22 24 23 24 23 22 22
.
Agrupe os dados e calcule:
a) A Mdia
b) A Mediana
c) A Amplitude Total
d) A Varincia e o Desvio Padro

1Fase Agrupar os dados (para reduzir os clculos)


Qual o n de classes a escolher?

Na maior parte dos casos entre 5-20, como 1ABORDAGEM

Poucas classes  Perda de Informao


Muitas classes
O problema do n de elementos no foram resolvidas (tem que se fazer muitas contas)

Classes de igual amplitude: Regra emprica: k = 1+ 3,32.log10 n

n = 100
 k = 7,6 8 classes de igual amplitude

a = (32-10)/8 = 2,75 3 mm
Por exemplo: comear em 9,5 (para o 1 ponto a englobar ser o 10)

Classe i Ponto Frequncia Frequncia Freq. Freq.


mdio da Absoluta (fi) Relativa (fri) Absoluta Relativa
classe (xi) Acumada Acumulad
(Fai) a (Fri)
[9.5,12.5[ 11 2 0,02 2 0,02
[12.5,15.5[ 14 8 0,08 10 0,10
[15.5,18.5[ 17 12 0,12 22 0,22
[18.5,21.5[ 20 18 0,18 40 0,40
[21.5,24.5[ 23 26 0,26 66 0,66
[24.5,27.5[ 26 21 0,21 87 0,87
[27.5,30.5[ 29 10 0,1 97 0,99
[30.5,33.5[ 32 3 0,03 100 1,00
100 1

27
04-11-2015

MDIA PARA DADOS AGRUPADOS EM CLASSES

28
04-11-2015

DADOS AGRUPADOS EM CLASSES (FRMULA COM FREQUNCIA ABSOLUTA


SIMPLES E ACUMULADA)

Calculado por Regras Empricas, por exemplo:

Quartis p = 1/4, 2/4, 3/4;


Decis- p = 1/10, 2/10,, 9/10;
Percentis p = 1/100, 2/100,, 99/100.

29
04-11-2015

FIM!!!!

30

Você também pode gostar