Escolar Documentos
Profissional Documentos
Cultura Documentos
2010.1
O que Estatstica?
Poder-se-ia sintetizar como sendo a cincia dos dados. Historicamente surgiu a partir de dois fenmenos distintos: a necessidade de dados censitrios e o desenvolvimento da teoria do clculo das probabilidades.
2010.1
2010.1
por exemplo, com as idades dos alunos, poderemos melhor compreender o comportamento da varivel expressa no conjunto de dados sob anlise.
2010.1
2010.1
2010.1
ELEMENTOS So as entidades sobre os quais os dados so coletados, por exemplo, na tabela anterior, cada empresa um elemento. VARIVEL uma caracterstica de interesse para os elementos (quatro variveis na tabela anterior).
2010.1
VARIVEL QUALITATIVA Bolsa de valores constitui uma varivel qualitativa. O smbolo do painel eletrnico tambm constitui uma varivel qualitativa. VARIVEL QUANTITATIVA Vendas anuais denotam uma varivel desse tipo.
2010.1 Prof. Dr. Hercules de Souza 9
DADOS QUANTITATIVOS Indicam quantidade, ex: 215,70 milhes de reais. DADOS QUALITATIVOS Podem ser numricos ou no, por exemplo, podemos especificar que um significa uma ao comercializada na Bolsa de valores de SP.
2010.1 Prof. Dr. Hercules de Souza 10
2010.1
11
2010.1
12
COLUNA
2010.1
13
PIZZA Petrobrs
2010.1
14
BARRA
2010.1
15
TABELA 1
7,2 4,8 3,6 11,0 7,9 8,0
2010.1
Ao arranjo dos dados numricos brutos da tabela anterior em ordem crescente (poderia ser decrescente) chama-se de ROL, e denomina-se como AMPLITUDE TOTAL dos dados como sendo a diferena entre o maior e o menor nmero do ROL.
2010.1 Prof. Dr. Hercules de Souza 17
DISTRIBUIO DE FREQNCIA
um sumrio tabular de dados que mostra a freqncia de observaes em cada uma das diversas classes no sobrepostas.
2010.1
20
DISTRIBUIO DE FREQNCIA
Freqncia absoluta de cada classe Total de elementos em cada classe. Freqncia relativa Para um conjunto de dados com N observaes, a freqncia relativa de cada classe como segue: Freqncia relativa = freqncia absoluta da classe/N A freqncia percentual de uma classe a freqncia relativa multiplicada por 100.
2010.1 Prof. Dr. Hercules de Souza 21
2010.1
22
Histograma e polgono de freqncia (grfico de ogiva) tambm so adequados para a representao de variveis quantitativas.
2010.1
23
2010.1
24
2. Nmero de classes So formadas especificando-se os intervalos que sero usados para agrupar as observaes no conjunto de dados. Nmero de Classes (Frmula de Sturges): k 1+3,33log n (n = nmero de elementos que se deseja representar).
2010.1 Prof. Dr. Hercules de Souza 25
3. Tamanho do intervalo de cada classe (h): (pode ser representado por intervalo fechado, aberto ou misto) h R/k
2010.1
26
Com isso possvel construir um histograma, que uma representao grfica de freqncia por meio de retngulos justapostos. Este histograma pode ser de freqncias absolutas, de freqncias relativas ou de freqncias percentual ou um polgono de freqncia que seria a ligao, atravs de retas, do ponto mdio de cada retngulo.
2010.1 Prof. Dr. Hercules de Souza 27
O histograma pode ser de freqncias absolutas, de freqncias relativas ou de freqncias percentual ou um polgono de freqncia que seria a ligao, atravs de retas, do ponto mdio de cada retngulo.
2010.1
28
2010.1
29
Faa uma distribuio de freqncia absoluta, relativa, percentual e acumulada e em seguida construa um histograma de freqncia absoluta e um polgono com os dados da TABELA 1
2010.1
30
DIAGRAMA DE PARETO
O diagrama de Pareto uma homenagem ao engenheiro, economista, filsofo e socilogo italiano Vilfredo Frederico Samaso Pareto (1848 1923).
2010.1
31
DIAGRAMA DE PARETO
O diagrama de Pareto consiste em um grfico onde so combinados as freqncias simples e as freqncias acumuladas, como pode ser visto no exemplo abaixo, com uma amostra com 23 elementos: 2, 2, 4, 4, 4, 4, 4, 6, 6, 6, 6, 6, 6, 6, 6, 6, 8, 8, 8, 8, 8, 10, 10.
2010.1 Prof. Dr. Hercules de Souza 32
Classe 24 4 6 6 8 810 10 12
Freqncia 2 5 9 5 2
Classe 6 8 4 6 8 10 2 4 10 12
Freqncia 9 5 5 2 2
2010.1
33
Histograma
10 Freqncia 8 6 4 2 0 6 4 8 Bloco 2 Mais 120,00% 100,00% 80,00% 60,00% 40,00% 20,00% ,00%
Freqncia % cumulativo
2010.1
34
Exemplo da utilizao de um diagrama de Pareto para tipos de defeitos que ocorreram no processo de produo de placas de circuito impresso.
2010.1
35
2010.1
36
Grfico de ogiva
Os grficos chamados de ogivas correspondem a um polgono de freqncias acumuladas, nas quais estas freqncias so localizadas sobre perpendiculares levantadas nos limites inferiores ou superiores das classes, dependendo se a ogiva representar as freqncias acumuladas.
2010.1 Prof. Dr. Hercules de Souza 37
2010.1
38
Freqncia relativa
Freqncia cumulativa
3 8 16 25 30
2010.1
39
Grfico de ogiva e um grfico de freqncia cumulativa que mostra o nmero de valores, em um conjunto de dados, que so iguais ou inferiores a um dado valor x. Freqncia cumulativa
30
25
30
20
16
10
3 0
66,5
78,5
90,5
102,5
114,5
126,5
minutos
Prof. Dr. Hercules de Souza 40
2010.1
2010.1
42
2010.1
43
2010.1
44
2010.1
45
MEDIDAS DE POSIO
2010.1
46
So medidas que possibilitam representar um conjunto de dados relativos observao de determinado fenmeno de forma resumida. Estas medidas nos orientam quanto posio da distribuio no eixo dos nmeros reais, possibilitam comparaes de conjuntos de dados. Enfim, representam os fenmenos pelos seus valores mdios.
2010.1
47
(Mdia
aritmtica
ou
mdia
amostral )
i
x=
x F
i =1 i
(Mdia
ponderada )
x=
w x
i =1 n i
w
i =1
(Mdia (Mdia
geomtrica) harmnica )
F1 2 Fn mg = n x 1 x xF 2 n
n mh = n Fi i =1 x i
Prof. Dr. Hercules de Souza 48
2010.1
EXERCCIO
Dada a seguinte distribuio: Calcule a mdia aritmtica ou mdia amostral.
Xi Fi 1 1 2 3 3 5 4 1
2010.1
49
EXERCCIO
Sejam X1, X2, X3,.........,Xn, valores de X associados s freqncias absolutas F1, F2, F3,......Fn. Calcule as mdias geomtricas para as tabelas a seguir:
2010.1
50
Xi Fi
1 8
2 6
3 5
5 3
Xi
12
24
48
2010.1
51
EXERCCIO
Sejam X1, X2, X3,.........,Xn, valores de X associados s freqncias absolutas F1, F2, F3,......Fn, respectivamente. Calcule a mdia harmnica e geomtrica para a mostra: 2, 2, 2, 5, 5, 5, 5, 8, 8.
2010.1
52
MEDIANA
uma medida de posio que divide a amostra ou a populao em duas partes iguais.
2010.1
53
2010.1
54
EXEMPLO
Xi 1 2 3 4 Fi 1 3 5 2 Fac 1 4 9 11 =11
Como existem 11 elementos a mediana pode ser calculada por (n+1)/2, logo (11+1)/2=6 elemento. Nesse caso a mediana ser o nmero 3.
2010.1 Prof. Dr. Hercules de Souza 55
EXEMPLO
Xi 82 85 87 89 90 Fi 5 10 15 8 4 Fac 5 15 30 38 42 =42 Como existem 42 elementos a mediana pode ser calculada: 42/2 = 21 elemento e 42/2 +1=22 elemento. O 21 elemento o 87 e o 22 tambm, logo a mediana ser (87+87)/2=87.
2010.1
56
2010.1
57
1- Utilize a equao:
Mediana = L md
N f h 2 + Fmd
Lmd = limite inferior da classe Md; N = tamanho da amostra; f = soma das freqncias anteriores classe Md; h = amplitude da classe Md; Fmd = freqncia da classe Md.
2010.1
58
EXEMPLO
Classes 3545 4555 5565 6575 7585 8595 Fi 5 12 18 14 6 3 Fac 5 17 35 49 55 58 =58
2010.1 Prof. Dr. Hercules de Souza 59
Mediana
= 55 +
(29 17 ) 10
18
= 61 , 67
2010.1
60
MODA
o valor que mais se repete na distribuio.
2010.1
61
Para distribuies simples (sem agrupamento em classes), a identificao da moda se faz simplesmente pela observao do elemento que apresenta maior freqncia. Xi Fi 20 2 25 9 28 10 21 4 30 5
2010.1
62
Para dados agrupados em classes pode-se utilizar a frmula de Czuber: 1- Identificar a classe modal, ou seja, aquela que possui a maior freqncia. 2- Aplica-se a frmula:
2010.1
63
1- A classe modal a 3
2-
2010.1
2010.1
65
Separatrizes
A principal caracterstica das medidas separatrizes consiste na separao da srie em partes iguais que apresentam o mesmo nmero de valores.
2010.1
66
Separatrizes
AS PRINCIPAIS SO OS QUARTIS, DECIS E PERCENTIS.
2010.1
67
Quartis
Os quartis so valores de um conjunto de dados ordenados, que os dividem em quatro partes iguais. necessrio, portanto, trs quartis (Q1, Q2 e Q3) para dividir um conjunto de dados ordenados em quatro partes iguais.
2010.1
68
Quartis
Q1 : deixa 25% dos elementos abaixo dele. Q2 : deixa 50% dos elementos abaixo dele e coincide com a mediana. Q3 : deixa 75% dos elementos abaixo dele.
2010.1
69
Quartis
A frmula para o caso da mediana (Q2) pode ser adaptada para o clculo de Q1 (n/4) e Q3 (3n/4).
2010.1
70
Decis e percentis
Identicamente para o caso do clculo dos quartis, os decis e os percentis podem ser obtidos pela adaptao da equao para o clculo da mediana, o que muda : D1 = n/10, D2 = 2n/10 ......D9 = 9n/10 P1 = n/100, P2 = 2n/100... P99 = 99n/100
2010.1 Prof. Dr. Hercules de Souza 71
Utilize os dados da TABELA 1 para calcular: Q1, Q2, Q3, D4, D7, P20, P60.
2010.1
72
BOX-PLOT
Visto as chamadas medidas de posio de dados estatsticos, vamos retornar a uma representao grfica da sntese desses dados chamada de Box-plot. um tipo grfico muito utilizado, representando a disperso dos dados, a mediana e os quartis.
2010.1 Prof. Dr. Hercules de Souza 73
2010.1
74
Assim sendo podemos sumarizar esses dados simplesmente fornecendo apenas 5 valores: valor mnimo = 0,4, Q1=3, mediana = 4,25, Q3=5,75 Valor mximo = 200
2010.1 Prof. Dr. Hercules de Souza 75
M
77
2010.1
78
MEDIDAS DE DISPERSO
2010.1
79
Amplitude total: a diferena entre o maior e o menor valor de uma distribuio. Amplitude = Maior Valor Menor Valor
2010.1
80
Varincia: trata-se da mdia aritmtica dos quadrados dos desvios. Pode ser calculada tanto para uma amostra quanto para uma populao.
2010.1
81
Desvio padro a raiz quadrada da varincia. Tambm pode ser calculado tanto para uma amostra quanto para uma populao.
2010.1
82
Coeficiente de variao de Pearson uma medida til para a comparao, em termos relativos, do grau de concentrao em torno da mdia de sries distintas.
2010.1
83
(x
i =1
( D.P. amostral )
S=
(x
i =1
x) 2
n 1
populacional = 2
( Varincia amostral ) = S 2
S2 =
(x
i =1
x) 2 Fi ou
n 1
2 n n x i Fi 1 x 2 F i =1 S2 = i i n 1 i =1 n
2010.1
84
2010.1
85
Ponto mdio 5 15 25 35 45
Freqncia 2 1 5 8 4 N=20
2010.1
86
S = 141,84
2
2010.1
87
2010.1
88
Utilize os dados da TABELA 1 para calcular: A varincia, o desvio padro amostrais e o coeficiente de variao.
2010.1
89
TEOREMA DE TCHEBYCHEFF
Muitas vezes interessante descobrirmos, utilizando a mdia e o desvio padro, a posio relativa de uma observao com relao a uma amostra.
2010.1
90
O Teorema de Tchebycheff permite fazer observaes sobre o percentual dos dados que esto dentro de um nmero especfico de desvios padres da mdia.
2010.1
91
Para qualquer distribuio amostral com mdia e desvio padro S, tem-se: (X S) - O intervalo contm, no mnimo 68% de todas as observaes amostrais. (X 2S) O intervalo contm, no mnimo 75% de todas as observaes amostrais. (X 3S) O intervalo contm, no mnimo 89% de todas as observaes amostrais.
2010.1 Prof. Dr. Hercules de Souza 92
ASSIMETRIA
Assimetria o grau de desvio, ou afastamento de uma distribuio da unidade de simetria.
2010.1
93
CURTOSE
Curtose o grau de achatamento de uma distribuio, pode ser denominada leptocrtica (delgada), platicrtica (achatada) ou mesocrtica (nem delgada nem achatada).
2010.1
94
2010.1
95
OBSERVAO
O software Excel apresenta-se como uma poderosa ferramenta de anlise estatstica, permitindo ao seu usurio uma anlise das vrias medidas estatsticas, vistas nesta apostila. Para tanto basta que o usurio selecione a opo Anlise de Dados no menu Ferramentas do Excel, e analise as vrias possibilidades estatsticas ali existentes.
2010.1 Prof. Dr. Hercules de Souza 96
EXERCCIOS
2010.1
97
1. Suponha a idade de 50 funcionrios de uma empresa, construa um histograma de freqncias absolutas e um histograma de freqncias relativas. Calcule a mdia amostral, moda, mediana, desvio padro, Q1, Q3, P60 e D3. Interprete o Teorema de Tchebycheff.
18 29 36 41 49
20 29 36 43 50
20 30 37 44 51
21 30 37 44 53
22 31 37 45 54
24 31 37 45 54
25 32 38 45 56
25 33 38 46 58
26 34 38 47 62
27 35 40 48 65
2010.1
98
2. Construa grficos de barra e pizza, analise os dados e resuma seus resultados, a partir das tabelas abaixo. Causas de problemas de coluna Quedas Veculos Esportes Violncia Outros Total Percentagem (%) 20,8 47,7 14,2 14,6 2,7 100,0
2010.1
99
3. Construa grficos de barra e pizza, analise os dados e resuma seus resultados, a partir das tabelas abaixo. Causas de problemas de coluna por esporte Mergulho Futebol Ginstica Equitao Esportes de inverno Esqui na neve Surfe Trampolim Luta Outros Total
2010.1 Prof. Dr. Hercules de Souza
Percentagem (%) 66,0 6,1 2,2 2,0 2,3 3,8 3,1 2,6 2,3 9,6 100,0
100
4. Dados relativos a uma amostra aleatria. 4,5 1,0 2,0 a) b) c) d) e) 6,5 7,5 3,0 2,0 3,0 3,5 2,5 2,0 3,5 4,0 3,0 3,0 3,5 3,5 3,0 5,0 3,5 4,0 3,0 5,0 1,5 5,0 6,0 1,5 5,5 4,5 2,5
Posicione os dados em uma distribuio ramo-e-folha; Elabore a distribuio de freqncia relativa e percentual; Elabore um histograma de percentagem; Elabore um polgono de percentagem. Calcule a mdia aritmtica a moda a mediana, Q1, Q3, P80 e D4, a varincia e o coeficiente de variao e em seguida construa um diagrama de Pareto e um boxplot.
2010.1 Prof. Dr. Hercules de Souza 101
5. Distribuies de freqncias para contas a receber. Freqncia (maro) MONTANTE R$ 0,00 R$ 2.000,00 6 13 17 10 4 0 50 Freqncia (abril) 10 14 13 10 0 3 50
R$ 2.000,00 R$ 4.000,00 R$ 4.000,00 R$ 6.000,00 R$ 6.000,00 R$ 8.000,00 R$ 8.000,00 R$ 10.000,00 R$ 10.000,00 R$ 12.000,00 Total
a) Construa o histograma de freqncia absoluta para cada ms; b) Construa o polgono de percentagem e um diagrama de Pareto para cada ms. c) Calcule a mdia aritmtica a moda a mediana o desvio padro e o coeficiente de variao. Interprete o Teorema de Tchebycheff.
2010.1 Prof. Dr. Hercules de Souza 102
6. Suponha a seguinte tabela onde temos os dias gastos para auditorias em empresas. Construa um histograma de freqncias absolutas, um histograma de freqncias relativas e um histograma de freqncias percentual. Calcule a mdia amostral, moda, mediana, desvio padro. Calcule tambm qual a probabilidade das observaes amostrais estarem entre a mdia mais ou menos dois desvios padres. 12 15 20 22 14 14 15 27 21 18 19 18 22 33 16 18 17 23 28 13
2010.1
103
7. Calcular a mdia geomtrica e harmnica para as sries: a) 8, 15, 10, 12. b) 3, 4, 5, 6, 7, 8. c) 5, 7, 12, 15. d) 3, 3, 3, 4, 4, 4, 4, 5, 6, 6.
8. Calcule a mdia geral das turmas de uma escola na disciplina de matemtica, cujas mdias por turma so as seguintes: turma A (40 alunos), mdia 6,5, turma B (35 alunos), mdia 6,0, turma C (35 alunos), mdia 4,0 e turma D (20 alunos), mdia 7,5.
2010.1
104
9. Uma determinada instituio financeira possui 3 operadores trabalhando na bolsa de valores de So Paulo. A tabela abaixo apresenta uma amostra com o nmero de operaes fechadas por um desses operadores nos ltimos dois anos. Utilize o Excel para as concluses estatsticas possveis. 14 13 12 14 13 15 11 13 12 12 13 14 16 13 14 14 14 13 15 15 17 14 16 12 11 12
2010.1
105
10. A classe mdia brasileira gasta em mdia R$ 65,88 por ms jantando fora de casa. Uma amostra com adolescentes forneceu, no ltimo ms, os seguintes gastos em R$, que os mesmos gastam em refeies ou lanches feitos fora de casa: 253 0 198 178 151 101 225 95 104 55 245 80 129 161 152 467 113 124 0 134 131 69 11 118 169
Calcule a mdia, mediana, moda, varincia e o desvio padro. Qual a concluso que se pode tirar com relao aos gastos desses adolescentes com relao mdia da classe mdia brasileira.
2010.1
106
11. Um levantamento foi realizado com relao habilidade dos fabricantes de computadores de resolverem os problemas tcnicos com rapidez. Foram obtidos os seguintes resultados: Empresa Compaq Packard Bell Quantex Dell Nec Ast Acer Dias p/ resolver 13 27 11 14 14 17 16 Empresa Gateway Digital IBM HP AT&T Toshiba Mcron Dias p/ resolver 21 27 12 14 20 37 17
Calcule a mdia, a mediana, a varincia e o desvio padro dessa distribuio. Qual a concluso que se chega a partir dessas medidas de posio e disperso?
2010.1 Prof. Dr. Hercules de Souza 107
12.
2010.1