Você está na página 1de 92

UTFPR

ESTATÍSTICA
SANDMANN

Prof: Sandmann 1
EMENTA
 Estatística descritiva;
 Delineamentos experimentais;
 Inferência Estatística;
 Intervalo de confiança;
 Testes de hipóteses;
 Análise de variância;
 Análise de regressão;
 Controle estatístico do processo;
 Aplicações com softwares.

Prof: Sandmann 2
BIBLIOGRAFIA
 Básica:
 BARBETTA, Pedro Alberto; REIS Marcelo Menezes; BORNIA Antonio
César. Estatística: para cursos de engenharia e Informática. São Paulo:
Atlas, 2004.
 GONÇALVES, Cristina F. Fidelis. Estatística Londrina: Ed. Uel, 2002.
 CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 1997.
 Recomendada:
 FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de
Estatística. Ed. Atlas, 1993.
 VIEIRA, S. Estatística experimental. São Paulo: Atlas, 1999.
 COSTA NETO, Pedro Luís Oliveira, Estatística, Editora Edgard Blücher.
 MARTINS & DONAIRE. Princípios de Estatística. Editora Atlas.

Prof: Sandmann 3
INTRODUÇÃO
 A estatística é um ramo do conhecimento humano que
surgiu da necessidade de manipulação de dados
coletados, e de como extrair informações de interesse
dos mesmos.

 Origem na Roma Antiga: levantamentos que


buscavam o registro de todos os indivíduos de alguma
camada social, bem como inventário de suas
propriedades, com a finalidade de se determinar como e
quem deveria ser taxado e/ou convocado ao serviço
militar.

Prof: Sandmann 4
CONCEITUAÇÃO
 Estatística: conjunto de técnicas voltadas à coleta,
organização, análise e interpretação de dados,
objetivando descrever populações.
 População: corresponde ao sistema ou ao todo que se
quer descrever. É sempre um conjunto de elementos
com características em comum.
 Censo: atividade de inspecionar todos os elementos de
uma população, em relação a uma ou mais variáveis
descritoras.
 Amostra: é uma parte representativa da população que
se pretende estudar.

Prof: Sandmann 5
CONCEITUAÇÃO
 Amostragem:estudo das relações existentes entre a
amostra e a população de onde se foi extraída.
 Objetivo: estimar parâmetros da população;

 Parâmetros: valor desconhecido associado a uma

característica da população, média, variância.


 Estimador: função que estima o valor de um

parâmetro baseando-se nas observações de uma


amostra;

1 n
y   yi
n i 1

Prof: Sandmann 6
CONCEITUAÇÃO
 Tipos de amostragem:
 Amostragem simples: é aquela retirada de
uma população de tal forma que cada possível
amostra de um dado tamanho tem chance
igual de ser selecionada.(homogênea)
 Amostragem estratificada: são populações
heterogêneas, mas podemos distinguir nela
sub-populações mais ou menos homogêneas.
 Amostragem sistemática: é aquela onde a
população está naturalmente ordenada.

Prof: Sandmann 7
CONCEITUAÇÃO
PLANEJAMENTO DE UMA PESQUISA
 Etapas de uma pesquisa:
 Objetivo: devem estar claramente definidos, pois formam

a diretriz básica para a sua perfeita execução;


 População: deve ser bem definida, identificando

corretamente os seus elementos.


 Dados a serem coletados : verificar se os dados

levantados são essenciais para a pesquisa em questão.


 Métodos e medidas: antes de coletar os dados, é

necessário e importante que esteja bem definida toda a


metodologia de sua obtenção, declaração de entrevistados,
por telefone, questionário, etc.

Prof: Sandmann 8
CONCEITUAÇÃO
PLANEJAMENTO DE UMA PESQUISA
 Continuação:
 Unidade de amostra: definir qual é a unidade de amostragem,
uma pessoa, uma família, uma empresa, etc.
 Escolha do tipo de amostra: de acordo com objetivo da pesquisa
e do tipo da população, deve-se escolher a melhor técnica para se
solucionar a amostra.
 Pré-verificação: é a verificação e correção de eventuais falhas na
estrutura adotada.
 Análise dos dados coletados:apurados os resultados, os mesmos
devem ser analisados estatisticamente, podendo ser apresentados
em forma de tabelas ou gráficos.

Prof: Sandmann 9
TIPOS DE VARIÁVEIS

 Variáveis qualitativas: confere um atributo,


qualidade ou característica.
 Ex: casado ou solteiro

 Nominal: sem ordenação no atributo.


Ex: solteiro ou casado.

 Ordinal: com ordenação no atributo.


Ex: nível de escolaridade.

Prof: Sandmann 10
EXEMPLO

VARIÁVEL QUALITATIVA ORDINAL

Grau de Instrução Freqüência Porcentagem

Fundamental 12 33.33
Médio 18 50.00
Superior 6 16.67
Total 36 100.00

Prof: Sandmann 11
EXEMPLO
VARIÁVEL QUALITATIVA NOMINAL
(sexo, religiao, time do coração, cor de pele, aceitação
de um produto, etc)
Produto: 1970 1980 1990 1992 2000

Coca - cola 50 50 60 75

Minuano 50 50 40 25 Fora de
linha

Prof: Sandmann 12
TIPOS DE VARIÁVEIS
 Variáveis quantitativas: resultado de contagem,
medida ou mensuração.
 Ex: peso, nº. de filhos, idade.

 Discreta: conjunto finito e enumerável.


 Ex: - nº. de filhos;
- nº. de peças com defeito.
 Contínua: conjunto infinito de valores.
 Ex: - peso;
- altura.

Prof: Sandmann 13
EXEMPLOS

VARIÁVEL QUANTITATIVA DISCRETA

No. de Filhos Freqüência Porcentagem


0 4 20
1 5 25
2 7 35
3 3 15
5 1 5
Total 20 100

Prof: Sandmann 14
EXEMPLOS

VARIÁVEL QUANTITATIVA CONTÍNUA

Classe de Salários Freqüência Porcentagem


[4,00 – 8,00) 10 33.33
[8,00 – 12,00) 12 40.00
[12,00 – 16,00) 8 26.67
Total 30 100.00

Prof: Sandmann 15
RESUMO DA CLASSIFICAÇÃO DE
VARIÁVEIS

Prof: Sandmann 16
EXERCÍCIOS
 Classifique as variáveis abaixo em qualitativas (nominal ou ordinal) e
quantitativas (contínuas ou discreta):
 Universo: alunos de uma escola
 Variável: cor dos cabelos

 Universo: casais de uma cidade


 Variável: número de filhos

 Universo: peças produzidas por uma certa máquina


 Variável: número de peças produzidas por hora

 Universo: peças produzidas por uma certa máquina


 Variável: diâmetro externo

 Universo: alunos de uma cidade


 Váriável: cor dos olhos

Prof: Sandmann 17
EXERCÍCIOS

 Universo: bolsa de valores


 Variável: número de negociações

 Universo: funcionários de uma empresa


 Variável: salários

 Universo: pregos produzidos por uma máquina


 Variável: comprimento

 Universo: casais residentes em uma cidade


 Variável: sexo dos filhos

 Universo: aparelhos produzidos em uma linha de pesquisa


 Variável: número de defeitos por unidade

Prof: Sandmann 18
TABELA

 É um quadro que resume um conjunto de observações.


 A tabela compõe-se de:
 Corpo: conjunto de linhas que contém informações sobre a variável em estudo;

 Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas;

 Coluna indicadora: parte da tabela que especifica o conteúdo das linhas;

 Linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados


que se inscrevem nos seus cruzamentos com as colunas;
 Casa ou célula: espaço destinado a um só número;

 Título:conjunto de informações, as mais completas possíveis, respondendo às


perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.
 Fonte: colocados no seu rodapé.

Prof: Sandmann 19
SÉRIES ESTATÍSTICAS

PRODUÇÃO DE BORRACHA NATURAL TÍTULO


CIDADE “Y” 1998 - 2000

CABEÇALHO ANOS TONELADAS

COLUNA INDICADORA COLUNA INDICADORA


1998 85498
CASA OU CÉLULA
CORPO
1999 32548
LINHAS
2000 42358
RODAPÉ FONTE: IBGE

Prof: Sandmann 20
DISTRIBUIÇÃO DE CÉLULAS E CASAS
 Um traço horizontal ( — ) quando o valor é zero.

 Três pontos (…) quando não temos os dados.

 Um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão


de determinado valor.

 Zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade
utilizada.

 Zero virgula zero (0,0) Se os valores são expressos em numerais


decimais.

 Anos consecutivos: 1978 – 82 (78 à 82)

 Anos não – consecutivos: 1978 – 1982 só 78 e 82

Prof: Sandmann 21
SÉRIES ESTATÍSTICAS
 Quando realizamos um levantamento estatístico, o que
obtemos como resultado é chamado de série estatística. O
modo de condensação ou apresentação das informações pode
ser na forma de tabelas ou de gráficos que facilitam a
visualização do fenômeno, permitem a comparação com
outros elementos ou, ainda, fazer previsões.
 Diferenças de Séries Estatísticas:
 A época: (fator temporal ou cronológico) a que se refere o
fenômeno observado;
 O local: (fator geográfico) onde o fenômeno acontece;
 O fenômeno: (fator específico) que é descrito.

Prof: Sandmann 22
TIPOS DE SÉRIES

Série histórica, cronológica, temporal ou marcha:


quando os resultados das observação do fenômeno são
registrados ao longo do tempo.
POPULAÇÃO DO BRASIL
1960-90

ANOS HABITANTES

1960 70.070
1970 93.139
1980 118.562
1990 155.822
FONTE:IBGE

Prof: Sandmann 23
TIPOS DE SÉRIES

Série geográfica, espacial, territorial ou de


localização: o local varia,permanecendo fixos o tempo
e o fenômeno.
ÁREA TERRESTRE - BRASIL

REGIÕES RELATIVA ( % )
NORTE 45,25
NORDESTE 18,28
SUDESTE 10,85
SUL 6,76
CENTRO - OESTE 18,86
FONTE: IBGE

Prof: Sandmann 24
TIPOS DE SÉRIES

Série específica ou categórica: quando o fenômeno é


observado segundo algumas categorias, permanecendo
fixos o tempo e o local.
PRODUÇÃO BRASILEIRA DE AÇO BRUTO
1999
PROCESSOS QUANTIDADE
OXIGÊNIO 30.698
BÁSICO
FORNO ELÉTRICO 10.567

EOF 1.245
FONTE: IBS

Prof: Sandmann 25
TIPOS DE SÉRIES
 Distribuição de Freqüências: neste tipo de série estatística o
tempo, o local e o fenômeno permanecem fixos. O fenômeno considerado
é uma variável quantitativa (discreta ou contínua) e seus valores
observados são descritos considerando o número de vezes que ocorreram
na série (freqüência).

Prof: Sandmann 26
ARREDONDAMENTO DE DADOS
0, 1, 2, 3 e 4 -> arredondamento por falta
 Ex: 10,4 = 10 27,83 = 27,8

6, 7, 8 e 9 -> arredondamento por excesso


 Ex: 15,7 = 16 9,67 = 9,7

Se ao 5 seguirem números maiores que zero, arredonda-se por excesso


 Ex: 26,51 = 27 6,53 = 6,6

Prof: Sandmann 27
EXERCÍCIOS

 Arredondar para décimos (total 100,0)


 37,15+10,45+15,32+17,32+19,59=

 37,15+15,32+10,45+7,21+29,69=

 40,46+28,82+7,29+23,55=

 38,39+15,51+41,07+5,12=

 27,42+25,15+8,13+31,69+7,45=

 31,87+9,68+23,65+22,39+12,36=

 13,75+28,03+12,15+46,07=

Prof: Sandmann 28
EXERCÍCIO

Utilizando os dados básicos de uma pesquisa econômica – social e


considerando as variáveis “tipo de ocupação” e “nível de
escolaridade” organizar a série estatística e completar com
porcentagens calculadas em décimos.
Tipo de Nível de escolaridade
ocupação
10 grau % 20 grau % Superior %

Comércio 11 1 ...
Público 3 4 1
Banco 1 7 2
Indústria 7 4 ...
Liberal ... 1 8
Total 22 100,0 17 100,0 11 100,0

Prof: Sandmann 29
DISTRIBUIÇÃO DE FREQÜÊNCIA

 Tabela de Distribuição de frequência: são tabelas que relacionam


cada medida possível em uma observação à frequência com que ocorreu
nos dados.

 Dados Brutos: são os dados coletados, que ainda não foram


numericamente organizados.

 Rol: é a organização dos dados brutos em ordem crescente ou


decrescente de grandeza.

Prof: Sandmann 30
DISTRIBUIÇÃO DE FREQÜÊNCIA

 Elementos de uma distribuição de freqüência:

1. Classe de freqüência: são intervalos de variação da variável.

2. Limites de classe: são os valores extremos de cada classe. O menor


número é o limite inferior da classe (Li) e o maior número, o limite
superior da classe (Ls).

3. Amplitude amostral: é a diferença entre o valor máximo e o valor


mínimo da amostra e indicada por A :
A = x(máx.) – x(min.)

4. Amplitude total da distribuição (At): é a diferença entre o limite


superior da última classe (limite superior máximo) e o limite inferior da
primeira classe (limite inferior mínimo).

Prof: Sandmann 31
DISTRIBUIÇÃO DE FREQÜÊNCIA

5. Amplitude de um intervalo de classe ou, simplesmente,


intervalo de classe é a medida do intervalo que define a classe.
Ela é obtida pela diferença entre os limites superior e inferior dessa
classe e indicada por c.
c = Ls – Li

6. Ponto Médio de uma classe (PM): é o ponto médio que divide o


intervalo de classe em duas partes iguais.

PM = (Li + Ls)/2

7. Freqüência simples ou absoluta de uma classe: é o número de


observações correspondentes a essa classe ou a esse valor.

Prof: Sandmann 32
TABELA DE DISTRIBUIÇÃO DE
FREQÜÊNCIA
 Primeiro Roteiro (utilizado por Scott, 1979).

1. Determinar o nº de classes (k): em geral, até 100 dados usa-se


tomar o inteiro mais próximo da raiz do nº de dados (n). Para
mais que 100 observações, usa-se o inteiro mais próximo de
5.log(n).

1. Determinar a amplitude de cada classe (c): toma-se a amplitude


total dos dados (representada por A), e divide-se tal valor pelo nº
de classes menos 1.
c = A / (k - 1)

Prof: Sandmann 33
TABELA DE DISTRIBUIÇÃO DE
FREQÜÊNCIA
3. Determinar o limite inferior da primeira classe Li1 e os demais limites
de classe:
Li1= menor valor da amostra – (c / 2)
Ls1= Li2= Li1 + c

4. Determinar a freqüência de dados observados em cada classe


(por meio da contagem simples dos dados que caem entre os limites
da classe) e construir a tabela.

Prof: Sandmann 34
EXEMPLO

Dados referentes ao salário semanal, em dólares, de 100


trabalhadores.
49 48 55 49 46 52 49 49 57 48
47 50 53 52 54 45 52 50 46 49
46 55 52 50 61 50 53 51 50 50
60 43 46 47 49 52 45 45 51 51
50 50 48 46 53 47 45 40 61 47
54 39 46 44 53 49 50 50 50 47
44 51 52 48 51 46 50 47 60 45
48 51 52 50 57 48 50 46 54 52
47 52 47 51 53 49 45 49 54 51
56 56 55 51 53 51 51 50 51 50

Fonte: Hoel, 1986

Prof: Sandmann 35
RESOLUÇÃO DO EXEMPLO UTILIZANDO O
ROTEIRO DE SCOTT
 1º Passo:
 K=10
 2º Passo:
 A = 61 – 39 = 22
 3º Passo:
 c = 22 / (10 - 1)  2,44
 4º Passo:
 Li1 = 39 – (2,44 / 2) = 37,78
 Ls1 = Li2 = 37,78 + 2,44 = 40,22
 Ls2 = Li3 = 40,22 + 2,44 = 42,66
 5° Passo:
 Construção da tabela de distribuição de freqüência

Prof: Sandmann 36
DISTRIBUIÇÃO DE FREQÜÊNCIA DOS
SALÁRIOS SEMANAIS DE 100
TRABALHADORES

Classe de Salário Semanal Ponto Médio da Classe Freqüência Observada


37,78  40,22 39,00 2
40,22  42,66 41,44 0
42,66  45,10 43,88 9
45,10  47,54 46,32 16
47,54  49,98 48,76 15
49,98  52,42 51,20 37
52,42  54,86 53,64 10
54,86  57,30 56,08 7
57,30  59,74 58,52 0
59,74  62,18 60,96 4
   100

Prof: Sandmann 37
TABELA DE DISTRIBUIÇÃO DE
FREQÜÊNCIA

 20 Roteiro (utilizado pelo Excel).

1. Determina-se o nº de classes (k): Não há uma regra exata para


determinar o número de classes, apenas orientações práticas para o
analista.

k  n
 k  1  3,322  log(n).
 2k  n
Arredondando o resultado para o valor inteiro menor ou maior.

Prof: Sandmann 38
TABELA DE DISTRIBUIÇÃO DE
FREQÜÊNCIA

 20 Roteiro (utilizado pelo Excel).

2. Determina-se o cálculo da amplitude amostral (A):

A=maior valor da amostra subtraído do menor valor da amostra

3. Determina-se o cálculo da amplitude de classe (c):

c=A/k

4. Encontra-se os limites da tabela:


Li1 = menor valor da amostra
Ls1= Li1+c = Li2

Prof: Sandmann 39
TABELA DE DISTRIBUIÇÃO DE
FREQÜÊNCIA

 20 Roteiro (utilizado pelo Excel).

5. Determina-se a frequência de dados observados em cada classe


(por meio da contagem simples dos dados que caem até o limites
da classe) e constrói a tabela.

Prof: Sandmann 40
DISTRIBUIÇÃO DE FREQÜÊNCIA DOS
SALÁRIOS SEMANAIS DE 100
TRABALHADORES
Bloco Freqüência
49 48 55 49 46 52 49 49 57 48 39 1
47 50 53 52 54 45 52 50 46 49 41,2 1
46 55 52 50 61 50 53 51 50 50 43,4 1
60 43 46 47 49 52 45 45 51 51 45,6 8
50 50 48 46 53 47 45 40 61 47 47,8 16
54 39 46 44 53 49 50 50 50 47 50 31
44 51 52 48 51 46 50 47 60 45 52,2 21
48 51 52 50 57 48 50 46 54 52 54,4 10
47 52 47 51 53 49 45 49 54 51 56,6 5
56 56 55 51 53 51 51 50 51 50 58,8 2
Mais 4
Total 100

Prof: Sandmann 41
Exercícios
 Dado as tabelas abaixo, construa:
 A tabela de distribuição de freqüência utilizando as funções do Excel.
 A tabela de distribuição de freqüência utilizando a ferramenta análise de dados
do Excel.
TABELA1 Grau Alcoólico
(°GL) em Aguardente
de Cana, UFLA, 1999
TABELA 2 Estatura de 40 Alunos da Escola A (cm)
37 41 36 40 40
166 160 161 150 162 160 165 167 164 160
39 42 40 40 45

162 161 168 163 156 173 160 155 164 168 44 41 39 42 40

46 43 41 35 40
155 152 163 160 155 155 169 151 170 164
40 14 41 40 40
154 161 156 172 153 157 156 158 158 161
40 39 38 38 41

48 35 30 36 33

Prof: Sandmann 53 41 39 38 47 42
EXERCÍCIO

 Dado a tabela abaixo, construa a distribuição de


freqüência.

Consumo Mensal de Energia Elétrica, por 50 Usuários Particulares - KWH


58 62 80 57 8 126 136 96 144 19
90 86 38 94 82 75 148 114 131 28
66 95 121 158 64 105 118 73 83 91
50 92 60 52 89 58 10 90 94 74
9 75 72 157 125 76 88 78 84 36

Prof: Sandmann 43
TIPOS DE FREQÜÊNCIAS

 Freqüência Simples ou Absoluta (f) são os valores


que realmente representam o número de dados de cada
classe.
 Freqüência Percentual: é cada um dos valores
representado pela sua porcentagem em relação ao total.
 Freqüência Acumulada: é o total das freqüências de
todos os valores inferiores ao limite superior do intervalo
de uma classe.
 Freqüência Percentual Acumulada: é o total das
freqüências percentuais de todos os valores inferiores ao
limite superior do intervalo de uma dada classe.

Prof: Sandmann 44
GRÁFICOS ESTATÍSTICOS

 Os principais tipos de gráficos são:


1. Diagramas: são figuras geométricas dispostas em duas
dimensões. São os mais usados na representação de
séries estatísticas.

1. Cartogramas: gráficos representadas em cartas


geográficas, largamente difundidas em geografia e
história.

1. Pictogramas: gráficos que tem por objetivo despertar a


atenção do público em geral.

 Veja nos próximos slides alguns exemplos de gráficos:


Prof: Sandmann 45
SÉRIE ESTATÍSTICA
PROCESSO DE CONSTRUÇÃO DE
GRÁFICA

Produção "t" na região "x" Largura: número de classes vezes


Produto "A" 1983-90 quantos centímetros pretende deixar.
Anos Produção "t"
Ex: 8 X 1cm=8cm
1983 508
1984 240 Altura: ¾ vezes o valor da largura.
1985 412
Ex: ¾ X 8cm = 6cm
1986 187
1987 625 Escala: maior valor dividido pela altura.
1988 950 Ex: 950/6 = 158,33...
1989 684 1cm = 160 t
1990 326
fonte "m"

Prof: Sandmann 46
Diagrama
Gráfico linear ou em linha poligonal ou em linha
curva.
Produção "t" na re gião "X"
Produto "A" 1983-90

960

800

640

480

320

16 0

0
19 8 3 19 8 4 19 8 5 19 8 6 19 8 7 19 8 8 19 8 9 19 9 0
A no s

Prof: Sandmann 47
Série Estatística
Processo de Construção de Gráfica

Produção "t" na região "x" Largura: número de classes vezes


Produto "A" 1983-90 quantos centímetros pretende deixar.
Anos Produção "t"
1983 508 Ex: 8 X 1,5cm=12cm
1984 240
Altura: ¾ vezes o valor da largura.
1985 412
1986 187 Ex: ¾ X 12cm = 9cm
1987 625
Escala: maior valor dividido pela altura.
1988 950
Ex: 950/9 = 105,5
1989 684
1cm =105,5 t
1990 326
fonte "m"

Prof: Sandmann 48
Série Estatística
Processo de Construção de Gráfica

Produção "t" na região "x" Largura: número de classes vezes


Município "A" 1992 quantos centímetros pretende
Produtos Produção "t" deixar.
A 310 Ex: 6 X 1cm=6cm
7 x 0,5 =3,5cm
B 450
C 615 Altura: ¾ vezes o valor da
D 728 largura.
E 802 Ex: ¾ X 9,5cm = 7,1cm
F 1076
fonte "m" Escala: maior valor dividido pela
altura.
Ex: 1076/7,1 = 151,54 = 150 t
1cm = 150 t
Prof: Sandmann 49
Diagrama
Gráfico em colunas.

Produção "t" na região "x"


Município "A" 1992

1200 1076
1050
900 802
Produção "t"

728
750 615
600 Seqüência1
450
450 310
300
150
0
A B C D E F
Produtos

Prof: Sandmann 50
Série Estatística
Processo de Construção de Gráfica
Largura: número de classes vezes
Demissões nas empresas quantos centímetros pretende
Município "A" 1991-92 deixar.
Anos Ex: 6colunas X 1,5cm=9cm
7espaços x 0,5 =3,5cm
Empresas 1991 1992
A 157 296 Altura: ¾ vezes o valor da largura.
B 251 315 Ex: ¾ X 12,5cm = 9,4cm
C 342 403
Escala: maior valor dividido pela
D 390 502 altura.
E 434 610 Ex: 610/9,4 = 64,89 = 65t
F 485 537 1cm = 65 demissões
fonte "m"

Prof: Sandmann 51
Diagrama
Gráfico em Barras.

De m is s õe s nas e m pr e s as M unicípio "A"


1991-92

F 537
485
Em pre sa s

E 610
434

D 502
390

C 403
342

B 315
251

A 296
157

0 65 130 195 260 325 390 455 520 585 650


Demissões

1991 1992

Prof: Sandmann 52
Série Estatística
Processo de Construção de Gráfica

Matrículas na Escola "x" Largura: número de classes vezes


Município "y" - 1990
quantos centímetros pretende deixar.
Sexo
Ex: 8séries X 1cm=8cm
Séries M F
9espaços x 0,5 =4,5cm
1° 228 282
2° 150 132 Altura: ¾ vezes o valor da largura.
3° 123 87
4° 80 102 Ex: ¾ X 12,5cm = 9,4cm
5° 75 78 Escala: maior valor dividido pela altura.
6° 93 52 Ex: 282/9,4 = 30
7° 43 90 1cm = 30 matrículas
8° 68 43
fonte "m"

Prof: Sandmann 53
Diagrama
Gráfico em colunas justapostas.

M atr ículas na Es cola "x" M unicípio "y" - 1990

282
300
270 228
M a t r íc u la s

240
210
180 150
150 132 123
102 93 90
120 87 80 7578
90 68
52 43 43
60
30
0
1° 2° 3° 4° 5° 6° 7° 8°
Sé r ie s

M F

Prof: Sandmann 54
Série Estatística
Processo de Construção de Gráfica

Largura: número de classes vezes


Funcionários das Empresas Município "y" - 1990 quantos centímetros pretende
Funcionários deixar.
Empresas Efetivos Temporários Total Ex: 5colunas X 1cm=5cm
A 420 96 516 6espaços x 0,5 =3cm
B 604 51 655
C 312 45 357 Altura: ¾ vezes o valor da largura.
D 507 13 520
E 241 30 271
Ex: ¾ X 8cm = 6cm
Escala: maior valor dividido pela
altura.
Ex: 655/6 = 110
1cm = 110 pessoas

Prof: Sandmann 55
Diagrama
Gráfico em colunas complementares.

Funcionários da Empresa "x"


Município "y" - 1990

700
51
600
F uncio nários

500 13
96
400 Temporários
45
300 604 Efetivos
507 30
200 420
312
100 241
0
A B C D E
Em presas

Prof: Sandmann 56
Diagrama
Gráfico em Setores

Vendas por Trimestre


Vendas por Trimestre
Empresa "m" Município "y" - 1992
Trimestre Vendas % Graus % X 3,6
1° 3025 42,1 151° 2071

2° 1272 17,7 64° 3025 2°
3° 813 11,3 41°

4° 2071 28,9 104°
Total 7181 100 360° 813 4°
Fonte "m" 1272

Prof: Sandmann 57
GRÁFICO POLAR

Prof: Sandmann 58
CARTOGRAMA

Prof: Sandmann 59
PICTOGRAMA

Prof: Sandmann 60
MEDIDAS DE TENDÊNCIA CENTRAL

 VALOR ESPERADO (MÉDIA - X ): é a mais utilizada.


 MÉDIA ARITMÉTICA: soma de todos os valores dividida
pelo número de valores.

x i
x i 1

n
Ex : Determine a média dos valores abaixo :
2  3  4  6  6  4  3 28
2,3,4,6,6,4,3 x  4
7 7

Prof: Sandmann 61
MEDIDAS DE TENDÊNCIA CENTRAL

• MÉDIA PONDERADA: se dá pela freqüência de


ocorrência de cada ponto médio de classe.
n

x f  f i xi
1 3 x i 1
n
2
3
4
5 
i 1
fi
4 6
5 3
6 2 (1* 3)  ( 2 * 4)  (3 * 5)  ...  (7 *1)
7 1 x  3,5
Total 24 24

Prof: Sandmann 62
MEDIDAS DE TENDÊNCIA CENTRAL

• MÉDIA PONDERADA: se dá pela freqüência de


ocorrência de cada ponto médio de classe.
n

x f Pm  f i * Pm i
[2 ,4[ 3 3 x  i 1
n
[4 , 6[
[6 , 8[
4
5
5
7

i 1
fi
[8 , 10[ 6 9
[10 , 12[ 3 11
(3 * 3)  (5 * 4)  (7 * 5)  (9 * 6)  (11 * 3)
Total 21 x  7,2
21

Prof: Sandmann 63
MEDIDAS DE TENDÊNCIA CENTRAL

 VALOR CENTRAL (MEDIANA - Md ): é a mais


utilizada quando os dados estão dispostos em ordem
crescente ou decrescente.

 DADOS BRUTOS:
 1 2 3 Md=2
 1 2 3 4 Md=2,5

Prof: Sandmann 64
MEDIDAS DE TENDÊNCIA CENTRAL

 EXPRESSÃO PARA O CÁLCULO:


n 
  FAA 
Md  LiMd   2 .cMd
 FMd 
 
 
Li Md  Limite inferior da classe que contém a mediana;
FAA  Freqüência acumulada anterior a classe que contém a mediana;
FMd  Freqüência da classe que contém a mediana;
c Md  Amplitude da classe que contém a mediana;
n  Número total de valores da série.

Prof: Sandmann 65
MEDIANA - EXEMPLOS

É o valor situado de tal forma que separa em dois


subconjuntos de mesmo número de elementos.
Ex1: 5, 13, 10, 2, 18, 15, 6, 16, 9
Rol crescente: 2, 5, 6, 9, 10, 13, 15, 16, 18
Md = 10
Ex2: 2, 6, 7, 10, 12, 13, 18, 21
Md = (10+12)/2 = 11

Prof: Sandmann 66
MEDIANA - EXEMPLOS

Tabela de dados agrupados


Encontre a mediana da tabela de distribuição abaixo:
x f fa
n 34
0
1
2
6
2
8
P   17
2 10 18
2 2
3 12 30
4 4 34
Total 34

Como temos 34 valores, nossa mediana será o termo que


ocupa o 17° lugar, ou seja, posição 2.

Prof: Sandmann 67
MEDIANA - EXEMPLOS

Tabela de dados agrupados


Encontre a mediana da tabela de distribuição.
x f fa P  20, Li  158, c  4,
[150 , 154[ 4 4
[154 , 158[ 9 13
F  11, FAA  13
[158 , 162[ 11 24
[162 , 166[ 8 32 (20  13) * 4
[166 , 170[ 5 37 Md  158   160,5
[170 , 174[ 3 40 11
Total 40

Prof: Sandmann 68
MEDIDAS DE TENDÊNCIA CENTRAL

 Moda: é o valor que ocorre com maior freqüência em


uma série de valores.

 Ex1: 7, 8, 9, 10, 10, 11, 12, 13, 15


 A moda é 10.

 Ex2: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
 A moda é 4, 7.

Prof: Sandmann 69
MEDIDAS DE TENDÊNCIA CENTRAL

 Moda: é o valor que ocorre com maior freqüência em


uma série de valores.

x f
1 2 No caso ao lado a moda é bi-modal
2 3 com valores 4 e 7, pois eles aparecem
3 4 seis vezes cada um.
4 6
5 2
6 4
7 6
Total 27

Prof: Sandmann 70
MEDIDAS DE TENDÊNCIA CENTRAL

EXPRESSÃO PARA O CÁLCULO:

 d1 
Mo  LiMo   .cMo
 d1  d 2 
Li Mo  Limite inferior da classe modal;
d1  Diferença entre a freqüência da classe que contém
a moda e a anterior;
d 2  Diferença entre a freqüência da classe que contém
a moda e a posterior;
c Mo  amplitude da classe modal.

Prof: Sandmann 71
MEDIDAS DE TENDÊNCIA CENTRAL

 Moda: é o valor que ocorre com maior freqüência em


uma série de valores.

x f fa Li  158, c  4, d1  11  9  2,
[150 , 154[ 4 4 d 2  11  8  3
[154 , 158[ 9 13
[158 , 162[ 11 24
[162 , 166[ 8 32 2*4
[166 , 170[ 5 37 Mo  158   159,6
[170 , 174[ 3 40 23
Total 40

Prof: Sandmann 72
MEDIDAS DE TENDÊNCIA CENTRAL

Média Geométrica: São empregadas em observações


positivas referentes a crescimentos exponenciais (como
taxas de avanço de doenças, número de habitantes de
regiões em colonização, crescimento de produtividade e
lucro em alguns negócios, etc...). A média geométrica é a
raiz n-ésima do produto das n observações.
Ex: O conjunto de dados {2,6,15,59} tem média
geométrica igual á:

G  4 2.6.15.59  10,15

Prof: Sandmann 73
MEDIDAS DE TENDÊNCIA CENTRAL

Média Harmônica: Para fenômenos que dependem


fortemente do menor dos dados, calculadas pelo inverso
da média dos inversos. Um exemplo é o cálculo do
tamanho efetivo de populações naturais submetidas a
processos de devastação ecológica (gargalos
populacionais).
Ex: O número de elefantes de uma região ao longo de quatro
gerações foi de {2000, 20, 250,1500}, a média harmônica desta
amostra é: 1
H  72,51
1 1 1 1 1 
.    
4  2000 20 250 1500 

Prof: Sandmann 74
EXERCÍCIO

 Encontre a média, moda e a mediana das classes abaixo:

Porcentagem de Gordura do Leite de


Cabra - 1997
Porcentagem F Fa
[1,6 - 2,2[ 4 4
[2,2 - 2,8[ - 4
[2,8 - 3,4[ 7 11
[3,4 - 4,0[ 8 19
[4,0 - 4,6[ 17 36
[4,6 - 5,0[ 4 40
Total 40  
Fonte: Pesquisa “y”

Prof: Sandmann 75
EXERCÍCIO

 Os dados abaixo representam o diâmetro das


tubulações para cabos. Com esses dados monte a
distribuição de freqüência e calcule a média, moda e a
mediana.
10,938 10,948 11,872 11,912 11,936 11,998 12,264 12,320
12,432 12,452 12,900 12,934 12,980 13,184 13,250 13,282
13,875 13,936 13,952 13,997 18,308 18,408

Prof: Sandmann 76
SEPARATRIZES

 Tipos:
 Mediana: divide a série em duas partes iguais;

 Quartil: divide a série em quatro partes iguais;

 Decil: divide a série em dez partes iguais;

 Percentil ou Centil: divide a série em cem partes

iguais.

Prof: Sandmann 77
SEPARATRIZES

(P  FAA ) * c
S  Li 
F
Li  limite inferior;
P  posição da separatriz;
FAA  Freqüência acumulada anterior;
F  Freqüência da classe selecionada;
c  amplitude de classe.

Prof: Sandmann 78
SEPARATRIZES

Exemplos:
Pesos f fa Calcule:
[150 , 154[ 4 4
[154 , 158[ 9 13 a) Os pesos de 30% menores;
[158 , 162[ 11 24
[162 , 166[ 8 32 b) Os pesos 25% maiores;
[166 , 170[ 5 37
[170 , 174[ 3 40 c) Os pesos que separam os 20%
Total 40 pesos medianos.

Prof: Sandmann 79
SEPARATRIZES

a) Os 30% menores pesos estão no início, então


retiramos os dados: P=30% de 40 (total) = 12;
Li=154; FAA=4; c=4 e F=9.
(12  4) * 4
S  154   157,56
9
b) Os 25% maiores estão no final, então são 75% da
série: P=75% de 40=30, Li=162, FAA=24,c=4 e F=8.

(30  24) * 4
S  162   165
8
Prof: Sandmann 80
SEPARATRIZES

c) Nesse caso temos dois valores os 20% medianos;


esses 20% ficam no meio da série, então: 20% é
40% de 40=16; Li =154; FAA=4, c=4 e F=9

(16  4) * 4
S  154   159,33
9
d) Adicionando mais 20% temos 60% de 40=24; Li=158,
FAA=24, c=4 e F=11
(24  24) * 4
S  158   158
11

Prof: Sandmann 81
SEPARATRIZES

Exercício:
Salário F Fa Calcule:
[500 , 700] 18 18
a) O valor que separa 25% dos
[700 , 900] 31 49 salários menores;
[900 , 1100] 15 64 b) O valor acima do qual estão 20%
[1100 , 1300] 3 67 dos salários maiores;
[1300 , 1500] 1 68 c) Os valores que separam 30%
[1500 , 1700] 1 69 dos salários medianos.
[1700 , 1900] 1 70

Total 70  

Prof: Sandmann 82
MEDIDAS DE POSIÇÃO

1. Amplitude Amostral: é a diferença entre o maior


valor coletado da amostra e o menor valor coletado
da amostra.
Exemplo
A produção diária de leite em vacas da raça holandeza no
período de lactação está entre 2,5 e 25 kg/dia , no estado de
Minas Gerais.
A=25-2,5=22,5 Kg/dia

Prof: Sandmann 83
MEDIDAS DE POSIÇÃO

2. Desvio Médio: é construído tomando a média dos


desvios em relação à média geral dos dados.

Exemplo
1. Considere a amostra {2,3,5,7,9}: Encontre o seu desvio
médio:
A média é 5 e seus desvios são: {-3,-2,0,2,3}. Os módulos dos
desvios são {3,2,0,2,3} e seu desvio médio igual a 2.

Prof: Sandmann 84
MEDIDAS DE POSIÇÃO

3. Desvio Quadrático Médio – Variância (2 ou s2): é a


eliminação dos desvios negativos sem utilizar módulos.
Conseguido utilizando potências pares dos mesmos.

n n

  xi  x    
2 2
Pm  x . fi
s2  i 1
s2  i 1

n -1 n -1
para dados NÃO AGRUPADOS para dados AGRUPADOS

Prof: Sandmann 85
MEDIDAS DE POSIÇÃO

4. Desvio Padrão (  ou s): é a raiz quadrada da variância.


n n

  xi  x    
2 2
Pm  x . fi
s i 1
s i 1
n -1 n -1

para dados NÃO AGRUPADOS para dados AGRUPADOS


xi  são os valores observados. Pm  ponto médio das classes.
x  é a média dos dados da amostra.
n  é o tamanho da amostra ou o nº de observações.
f i  é a freqüência de cada classe.

Prof: Sandmann 86
COEFICIENTE DE VARIAÇÃO
É a relação entre o desvio padrão e a média da distribuição. Utilizada
quando o objetivo é comparar a variabilidade de diferentes distribuições,
com diferentes valores para sua esperança. Se der menor que 10%, a
amostra é homogênea, se for entre 10% e 30% é uma amostra fraca, se
for maior que 30% é uma amostra heterogênea
σ Desvio padrão sobre a
CV%=
μ média
ERRO PADRÃO DA MÉDIA
Essa medida é importante por indicar precisão que se atingiu no cálculo
da média com amostras de tamanhos diferentes.

σ s
σx  sx 
n n
Prof: Sandmann 87
EXEMPLO
Como exemplo, sejam as seguintes amostras: A={1,2,3}, B={3,4,5} e
C{2,4,6}. O CV destas amostras são:
A=CV%=50% B=CV%=25% C=CV%=50%
Ou seja, embora A e B tenham a mesma variabilidade absoluta, em relação
às suas médias A é muito mais variável que B. Embora C tenha a maior
variabilidade absoluta dentre as três, em relação à suas médias, é tão
variável quanto A.
Já para o erro padrão da média, encontramos os seguintes resultados:
1 1 2
A : SY  B : SY  C : SY 
3 3 3
Ou seja, embora as amostras A e C tenham a mesma variabilidade, o erro no
cálculo da média por amostras em C é o dobro do cometido em A.

Prof: Sandmann 88
MEDIDAS DE ASSIMETRIA
 É o grau de desvio ou afastamento da simetria de
uma distribuição.
 Distribuição simétrica:
 Quando a média = mediana = moda

 Distribuição assimétrica à esquerda:


 Quando a média < mediana < moda

 Distribuição assimétrica à direita:


 Quando a média > mediana > moda

Prof: Sandmann 89
MEDIDAS DE ASSIMETRIA
 Coeficiente de Assimetria de Pearson:
 É dado pela expressão:

x  Mo Quando As for positivo é assimétrica à esquerda


As  Quando As for negativo é assimétrica à direita
s
Quando As for 0 é simétrica
Onde :
As  Coeficiente de Assimetria de Pearson;
x : é a média amostral;
Mo : é a moda;
s : é o desvio padrão.

Prof: Sandmann 90
MEDIDAS DE CURTOSE

 É o grau de achatamento de uma distribuição em relação


a uma distribuição padrão, denominada curva normal.
 Leptocúrtica:
 Quando a distribuição apresenta uma curva de

freqüência mais fechada que a normal.


 Platicúrtica:
 Quando a distribuição apresenta uma curva de

freqüência mais aberta que a normal.


 Mesocúrtica:
 É a curva normal, adotada como base referencial.

Prof: Sandmann 91
MEDIDAS DE CURTOSE

 Coeficiente de curtose de Keley:


 É dado pela expressão abaixo:

Q3  Q1 Se :
C
2 D9  D1 
C  0 ,263 mesocúrtica;
Onde :
C  0 ,263 leptocúrtica, mais afilada;
C : Coeficiente de Keley;
C  0 ,263 platicúrtica, mais chata.
Q1 : Primeiro quartil;
Q3 : Terceiro quartil;
D1 : Primeiro decil;
D9 : Nono decil.

Prof: Sandmann 92

Você também pode gostar