Você está na página 1de 23

ESTATSTICA

Populao denominada como um todo; Amostra s uma parte de um todo; POPULAO Populao todos os peixes de um lago Todos os contribuintes do Brasil Todos os eleitores do Brasil AMOSTRAGEM Peixes selecionados para estudo Contribuintes selecionados para a pesquisa 2 mil eleitores do Brasil

CENSO Estuda a populao Pesquisa de satisfao de clientes dos bancos no Brasil

AMOSTRAGEM Estuda uma amostra deste populao Pesquisa uma parcela desses clientes que possuem contas em bancos

NMEROS DISCRETOS So nmeros inteiros positivos. Ex. 1,

NMEROS CONTNUOS Nmeros fracionados. Ex. 1,8, 2,7,

2, 3, 4 Nmero de nibus nas capitais do pas Nmero de filhos na famlia 1, 2, 3,...

3,6 Quantidade de combustvel em cada nibus Mdia de filhos por famlia 1,8, 3,5, 2,9, ...

Variveis qualitativas trazem qualidade ou atributo naquilo que estudamos; Variveis quantitativas trazem nmeros.

VARIVEIS QUALITATIVAS Qualitativa Exemplo Pesquisa sobre o governo

VARIVEIS QUANTITATIVAS Quantitativa Exemplo Tempo de estudo que as pessoas

Bom, regular ou ruim Exemplo Tempo de estudo Suficiente, insuficiente, pouco

estudam por dia (minutos) 20, 30, 40, ... Exemplo Conceito de governo 0, 5, 7,...

VARIVEIS QUALITATIVAS Qualitativa Ordinal que pode ser ordenado Nominal no pode ser ordenado

VARIVEIS QUANTITATIVAS Quantitativa Discreta nmeros inteiros e positivos Contnua nmeros fracionados

VARIVEIS QUALITATIVAS Exemplos Varivel qualitativa nominal Olhos castanhos, verdes, pretos, azuis (no tem como ser ordenado, no se fala em ordem alfabtica) Varivel qualitativa ordinal Tempo de espera pouco, muito, mdio, excessivo,... (aqui pode-se ordenar, entre o pouco e o excessivo) Varivel qualitativa ordinal Faixa salarial - 1 a 4, 5 a 10, 11 a 15,... ( uma varivel qualitativa ordinal, porque tem como ordenar as faixas, sem falar que uma pegadinha de concurso para confundir a questo

TABELA DE FREQUNCIA

Tabela de freqncia utilizada para melhorar apresentao dos dados; Exemplo quantidade de livros comprados: 2, 1, 2, 1, 3, 4, 0, 2, 2, e 2.

Ordenar todos os nmeros: 0, 1, 1, 2, 2, 2, 2, 2, 3, 4. Livros 0 Frequncia 1 Frequncia acumulada 1 Frequncia relativa 10%

1 2 3 4 Total

2 5 1 1 10

= 3 = 8 = =

20% 50% 10% 10% 100%

9 10

DADOS AGRUPADOS

Amplitude distncia dos intervalos (limite superior e inferior) da classe. Exemplo: intervalo entre 1 e 5 o resultado 4, pois, 5 1 = 4. Intervalo entre 6 e 10 o resultado 4, pois, 10 6 = 4.

Ponto mdio o meio do intervalo de classe. Exemplo: intervalo entre 1 e 5 o resultado 3, pois, Exemplo: intervalo entre 6 e 10 o resultado 8, pois,
1 6 2 7 3 8 4 9 5
10

As classes so formadas conforme a necessidade da pessoa que est montando os dados agrupados. Exemplo: (maior valor menor valor) dividido pelo nmero de classe desejado.
Menor idade 12 anos; maior idade 92 anos. 92 12 = 80 => 80/4 (qtd de classes) = 20 anos.

IDADE DE 12 A 92 ANOS FORMADO 4 CLASSES (92 12)/4 = 20 ANOS 4 CLASSES COM INTERVALO DE 20 ANOS DE UMA IDADE PARA OUTRA.

IDADE 12 32 32 52 52 72 72 - 92

APRESENTAO DE DADOS ESTATSTICOS Histograma

Histograma Leite 00 73 73 146 146 219 219 292 262 365 Total Frequncia 92 230 398 256 14 990

40 0 35 0 30 0 25 0 20 0 15 0 10 0 50 0 Fre u cia q n 0 73 73 - 146 14 21 6 9 21 29 9 2 26 - 36 2 5

Polgono de freqncia Polgono: uma regio plana, fechada, limitada por segmentos de retas.

Polgono de frequncia Tarifa DOC Frequncia Ponto Bancos mdio 1,00 2,99 3,00 4,99 5,00 6,99 7,00 8,99 9,00 10,99 Total 8 49 32 61 14 164 1,995 3,995 5,995 7,995 9,995

Ogiva Ogiva: diferencia-se do polgono de freqncia, porque ao invs de trabalhar com a freqncia de classe, ir trabalhar com a freqncia acumulada, essa a nica diferena entre as duas apresentaes, onde o eixo horizontal teremos os intervalos de classe e no eixo vertical a quantidade da srie trabalhada.

Salrio mdio 1.000 a 2.000 2.000 a 3.000 3.000 a 4.000 4.000 a 5.000 5.000 a 6.000 Total

Frequncia 12 74 32 12 6 136

Grfico de Setores

Salrio mdio 1.000 a 2.000 2.000 a 3.000 3.000 a 4.000 4.000 a 5.000 5.000 a 6.000 Total

Frequncia 12 74 32 12 6 136

Grfico de barras Frequncia 12 74 32 12 6 136

Salrio mdio 1.000 a 2.000 2.000 a 3.000 3.000 a 4.000 4.000 a 5.000 5.000 a 6.000 Total

Ramo e folhas Observar que os dois primeiros dgitos permanecem, na coluna seguinte e a variao do terceiro digito em cada casa.

4,31%, 4,34%, 4,34%, 4,38%, 4,39%, 4,45%, 4,55% e 4,20% 4,2 4,3 4,4 4,5 0 1, 4, 8, 9 5 5

Diagrama de disperso Frequncia 50 40 30 20 10 150

pagantes 5000 10000 15000 20000 25000 Total

Box-plot

Nesse grfico colocado o mximo, o mnimo, mediana, o quartil, para achar a nota mdia dos alunos ou que quiser ser comparado. MEDIDAS DE POSIO Essas so medida de estatsticas bastante recorrentes em concurso pblico, ou seja, so medidas bastante usuais.

- Esse smbolo representado quando estiver sendo falado sobre populao;


esse smbolo representa a amostragem de determinada populao.
Mdia aritmtica Exemplo: Time 1 17, 16, 17, 16, 18, 40. Time 2 19, 20, 21, 20, 21, 21.

Mdia de idade Time 1 124/6 = 20,7 Mdia de idade Time 2 122/6 = 20,3 Perceba que apesar da maioria da idade dos jogadores do primeiro time ser baixa, o ltimo jogar tem 40 anos, que eleva a mdia de idade do time. J no segundo time, a idade dos jogadores mais alta em relao ao time 1, ficando prxima a mdia de idade. Para chegar a estes nmeros foi somado a idade de todos os jogadores do time 1 e dividido pela quantidade ( (soma de todas as idades)/n(quantidade de jogadores)). Mdia interna Exemplo: Time 1 17, 16, 17, 16, 18, 40. Time 2 19, 20, 21, 20, 21, 21. Mdia de idade Time 1 (124 16 40)/4 = 17 anos de mdia interna Mdia de idade Time 2 (122 19 21)/4 = 20,5 anos de mdia interna A mdia interna mais utilizada quando houver um nmero que de uma distoro na mdia em relao aos outros nmeros. Sendo assim para achar a mdia interna, deve-se excluir o maior nmero e o menor nmero ou os maiores nmeros ou os menores nmeros, conforme o tamanho da mdia que se procure. No caso acima foi tirado o menor e o maior nmero de idade dos dois times para chegar a mdia interna ( (soma de todas as idades, excludos a menor e a maior idade)/n(quantidade de jogadores)), chegando a 17 anos no primeiro time e 20,5 anos de idade no segundo. Desta forma conseguiu-se chegar mdia de idade mais prxima da realidade nos dois times.

Mdia ponderada A mdia ponderada a mdia aritmtica s que adaptada, onde se pega todos os nmeros, multiplica-se pelo seus pesos e dividi pela soma de todos esses pesos. Ou seja, Mdia ponderada = (X1,P1,...Xn,Pn)/n

= soma dos dados X pesos n = (P1+...+Pn) Exemplo: No final de determinado curso, sendo: Portugus = P3 Estatstica = P2 Direito = P2 Notas de um determinado aluno; Portugus = 7 Estatstica = 10 Direito = 10 Frmula: Mp = (7*3)+(10*2)+(10*2) = 8,7 3+2+2 Se esses valores fossem medidos pela mdia aritmtica seria: Ma = (7+10+10) / 3 = 9 Mdia geomtrica mdia aritmtica, menos afetada por valores de distoro. Mg = (X1+...+Xn)/ Exemplo: Qual a mdia geomtrica de 4, 6 e 8? Mg = 4*6*8 ou Mg = (6*4*8)/ = 5,8 A mdia aritmtica daria 6

Mdia harmnica A mdia harmnica o inverso da mdia aritmtica, sendo que para a mesma srie de dados, ser menor que a Ma e Mg. Mh = _______n___________ (1/X1+...+1/Xn)

MEDIANA A mediana o ponto central, onde ela ser exatamente o nmero que se encontra no meio, onde a metade dos nmeros estar para cima e a outra para baixo. A mediana muito til quando se tem valores extremos, que distorcem a medida. Para achar a mediana deve-se ordenar a srie de nmeros como o primeiro passo. Exemplo: Qual a mdia da srie de nmeros: 10, 8, 9, 12, 14, 18, 19, 54 e 978. = 1.122/9 = 124,7 Para achar mediana tem que ordenar a srie e achar o nmero do meio, ou seja, 8 9 10 12 14 18 19 54 978

Observa-se que o nmero da media ficou bem no meio, tendo 4 nmeros tanto do lado esquerdo e quatro do direito. Se a srie for par, como dever agir? Temos os nmeros: 100, 14, 16, 11, 5, 20, 20, 30 5 1 1 14 16 20 20 30 100

No primeiro momento a srie foi ordena, e como se percebe, os nmeros para ficarem igualmente distribudos em cada lado sero necessrios pegar os nmeros 16 e 20. Para achar a media nesta srie pegaremos (16+20)/2 = 18), ou seja, a media desta srie ser, o nmero 18. MODA A moda o valor que mais se repete em determinada srie. Exemplo: 5 1 1 14 16 20 20 30 100

Na srie acima, o nmero que mais se repete o nmero 20. Caso em uma srie tenha mais de um nmero se repetindo, chamaremos esta situao de distribuio bimodal. 5 1 1 14 14 16 20 20 30 100

Moda = 14 e 20 QUANTIS Os quantis tambm so conhecidos como medidas separatrizes. 1 - Quartil

Quartil consiste em pegar uma srie de dados e dividir em 4 partes. Como separado em 4 partes, teremos 3 Quartis.

Q1 Frmula:

Q2

Q3

Elemento = [n * (N + 1) / d], sendo: n = ordem do elemento; N = quantidade de elementos na distribuio; d = Quartil:4 ou Decil: 10 ou Percetil: 100. Exemplo: Srie 2, 4, 6, 8, 9, 10, 8, 11 e 14. Ordenar a srie 2, 4, 6, 8, 8, 9, 10, 11, 14. Pergunta: Qual o terceiro quartil? Resposta 10,5 Q3 = 3*(9+1)/4, sendo 3(quartis), vezes (9 (quantidade de nmeros)+1(da frmula), dividido por 4 (quatro partes). Q3 = 3*10/4 => Q3 = 3*0,25 = 7,5, ou seja, o quartil ser o stimo e meio elemento da sequncia ordenada. Como a sequncia 2, 4, 6, 8, 8, 9, 10, 11, 14, logo o 7,5 elemento ficar entre o nmero 10 e o nmero 11, sendo assim (10+11)/2 = 10,5. Colocando o nmero achado a sequncia ficar a seguinte: 2, 4, 6, 8, 8, 9, 10, 10,5, 11, 14. Conforme a rgua acima que com tem a escala com Q1, Q2 e Q3, que representa os trs quartis de uma determinada sequncia, pegaremos o exemplo acima e acharemos Q1, Q2 e Q3, de acordo com a escala: Srie: 2, 4, 6, 8, 8, 9, 10, 11, 14, para achar Q1. Q1 = 1*(9+1)/4 => 1*2,5 = 2,5, ou seja o Q1 ser o 2,5 elemento da sequncia. Como o elemento estar entre o nmero 4 e 6, logo utilizaremos a (Ma) simples (4+6)/2 = 5, sendo assim o 2,5 elemento ou Q1 ser o nmero 5 na sequncia -> 2, 4, 5, 6, 8, 8, 9, 10, 11, 14. Srie: 2, 4, 6, 8, 8, 9, 10, 11, 14, para achar Q2. Q2 = 2*(9+1)/4 => 1*2,5 = 5, ou seja o Q2 ser o 5 elemento da sequncia, logo o 5 elemento ou Q1 ser o nmero 5 na sequncia -> 2, 4, 6, 8, 8, 9, 10, 11, 14.

Q3 = 3*10/4 => Q3 = 3*0,25 = 7,5, ou seja, o Q3 ser o 7,5 elemento da sequncia ordenada. Como o elemento estar entre o nmero 10 e 11, logo utilizaremos a (Ma) simples (10+11)/2 = 10,5, sendo assim o 7,5 elemento ou Q3 ser o nmero 10,5 na sequncia -> 2, 4, 6, 8, 8, 9, 10, 10,5, 11, 14. Demonstrando os valores encontrados em uma escala teremos: 2 4 5 Q1 6 8 8 Q2 9 10 10,5 Q3 11 14

Conforme citado acima, o quartil separado em quatro partes, onde encontraremos 3 quartis dentro de uma determinada sequncia (Q1, Q2 e Q3).

2 - Decil

Decil consiste em pegar uma srie de dados e dividir em 10 partes. Como separado em 10 partes, teremos 9 Decis.

D1 Exemplo:

D2

D3

D4

D5

D6

D7

D8

D9

Tomares a mesma srie acima como exemplo: Srie 2, 4, 6, 8, 9, 10, 8, 11 e 14. Ordenar a srie 2, 4, 6, 8, 8, 9, 10, 11, 14. A pergunta: Qual o quinto Decil? Resposta 8 D5 = 5*(9+1)/10, sendo 5(decil), vezes (9 (quantidade de nmeros)+1(da frmula), dividido por 10 (dez partes).

D5 = 5*10/10 => D5 = 5*1 = 5, ou seja, o decil ser o quinto elemento da sequncia ordenada. Como a sequncia 2, 4, 6, 8, 8, 9, 10, 11, 14, logo o 5 elemento ser o nmero 8. Destacando o 5 elemento achado na sequncia ficar a seguinte: 2, 4, 6, 8, 8, 9, 10, 11, 14.

3 - Percetil ou centil

Percetil consiste em pegar uma srie de dados e dividir em 100 partes. Como separado em 100 partes, teremos 99 Percetil ou centil.

P1

P2

P3

P4

P5

P6

P7

P8

P9 P10 P11 P12 P13 P14 P15 P16 .............

P99

Exemplo: Tomares a mesma srie exposta acima como exemplo: Srie 2, 4, 6, 8, 9, 10, 8, 11 e 14. Ordenar a srie 2, 4, 6, 8, 8, 9, 10, 11, 14. A pergunta: Qual o qinquagsimo percentil? Resposta 8 P50 = 50*(9+1)/100, sendo 50(percetil), vezes (9 (quantidade de nmeros)+1(da frmula), dividido por 100 (cem partes). P50 = 50*10/100 => P50 = 50*0,1 = 5, ou seja, o percetil ser o quinto elemento da sequncia ordenada. Como a sequncia 2, 4, 6, 8, 8, 9, 10, 11, 14, logo o 5 elemento ser o nmero 8. Destacando o 5 elemento achado na sequncia ficar a seguinte: 2, 4, 6, 8, 8, 9, 10, 11, 14. 4 - Intervalo interquartil Para achar o intervalo inter quartil (Iqr), que representa uma parte central de uma sequncia, deveremos pegar Iqr = Q3 Q1, assim ser eliminado os extremos. Conforme sequncia exemplificada acima e os resultados encontrados para:

Q1 = 5

Q2 = 8

Q3 = 10,5, logo acharemos:

Irq = Q3 Q1 => 10,5 5 = 5,5. Neste momento achamos o nmero 5,5 que representa o meio da sequncia. Agora para entender melhor o boxpot necessrio dar uma olhada na aula anterior, para entender todos aqueles nmeros representados no grfico.

MEDIA DE DADOS AGRUPADOS Para achar a freqncia nas tabelas de distribuio de freqncia teremos a seguinte frmula: (X1*F1+...+Xn*Fn) / n, onde: X1 = ponto mdio F1 = freqncia Exemplo: Filmes/ Semestre 01 - 10 11 20 21 - 30 Total Frequncia/ Ponto mdio pessoas 14 114 8 136 5,5 15,5 25,5

Para acharmos a mdia de quantidade de filmes devemos: (5,5*14+15,5*114+25,5*8) / 136 = 2048/136 = 15,01, ou seja, estar na segunda fila, entre 11 e 20 filmes por semestre, por sua vez, onde concentra-se a maior quantidade de pessoas. Outro exemplo: Polgono de frequncia Tarifa DOC Frequncia Ponto Bancos mdio 1,00 2,99 3,00 4,99 5,00 6,99 7,00 8,99 9,00 10,99 Total 8 49 32 61 14 164 1,995 3,995 5,995 7,995 9,995

Para acharmos a mdia da tarifa mais cara devemos: (1,995*8+3,995*49+5,995*32+61*7,995+9,995*14) / 164 = 1.031,17/164 = 6,29, ou seja, a mdia de preo de tarifao de DOC praticado entre esses 164 bancos de 6,29, encontrando-se na terceira linha do quadro acima. MODA DE DADOS AGRUPADOS Para achar a moda de dados agrupados utilizaremos a seguinte formula: Moda = Li + ( d1 ] * am) , onde

(d1 + d2) Li = limite inferior da classe modal d1 = a diferena do nmero de elementos da classe modal e da classe anterior. D2 = a diferena do nmero de elementos da classe modal e da classe posterior. am = a amplitude da classe mediana. Exemplo: Filmes/ Semestre 01 - 10 11 20 21 - 30 Total Frequncia/ pessoas 14 114 8 136

Como sabemos que a moda onde o valor mais se repete, logo, temos a segunda classe, onde temos 114 pessoas que assistiram filmes no semestre.

Utilizando a frmula temos: Moda = Li + d1 d1 + d2 * am , onde d1 = 114 14 = 100, substituindo na frmula am = 20 11 = 9, na classe 2 e 11 o limite

11 +

100 100 + 106

* 9 , => 11 +

100 206

*9

=> 11 + 0,49 * 9

=> 11 + 4,41 = 15,41

MEDIANA DE DADOS AGRUPADOS Para achar a moda de dados agrupados utilizaremos a seguinte formula: Mediana = Li + N/2 - fam nm Li = limite inferior da classe. N = nmero total de observaes. fam = freqncia acumulada classe anterior mediana. nm = nmero de elementos da classe mediana. am = a amplitude da classe mediana. Filmes/ Semestre 01 - 10 11 20 21 - 30 Total Mediana = 11 + 136/2 - 14 114 Frequncia/ pessoas 14 114 8 136 * 9 (20-11) => 15,23 Frequncia acumulada 14 128 136 * am , onde

MEDIDA DE DISPERSO A medida de disperso tem como objetivo, captar a variabilidade dos dados

Amplitude total

A amplitude total a distncia entre o maior e menor nmero de uma determinada srie. LUCRO (EMPRESA A) R$ 100.000 MIL/MS + 450.000 MIL

- 100.000 MIL

- 50.000 MIL

LUCRO (EMPRESA B) R$ 100.000 MIL/MS + 80.000 MIL + 100.000 MIL + 120.000 MIL

Amplitude da Empresa A Lucro (R$ Mil) = - 100, + 450 e 50 Amplitude total = 450 (- 100) = 550

Amplitude da Empresa B Lucro (R$ Mil) = + 100, + 80 e + 120 Amplitude total = 120 (+ 80) = 40

Desvio Mdio Absoluto

Frmula Dma = i = 1|Xi - | n Exemplo: Vendas mensais = 1.000 + 1.215 + 996 + 1.114 + 1.196 = 5.521 => 1.104,20 Venda 1.000 1.104,20 1.215 1.104,20 996 1.104,20 1.114 1.104,20 1.196 1.104,20 X mdia 104,20 110,80 108,20 9,80 91,80 424,80

Dma = 424,80 / 5 = 84,96

DESVIO PADRO

(sigma) = esse smbolo representa o desvio padro da populao.

=1

(Xi X )

n
Exemplo: Em um nmero de 5 lotes, foram achado as seguintes quantidades de peas defeituosas:

10, 12 , 17, 20 e 8. M = S/n (onde S a soma de todas as peas defeituosas e n a quantidade de vezes que ocorreu os defeitos, ento: M = (10+12+17+20+8) 5 => M = 13,40

Com esse resultado vamos compor a tabela Peas defeituosas A 10 12 17 20 8 = 13,4 Mdia B 13,4 13,4 13,4 13,4 13,4 Desvio AB=C - 3,4 - 1,4 3,6 6,6 - 5,4 (Desvio) C 11,56 1,96 12,96 43,56 29,16 99,20

V (varincia) = Dp / n => V = 99,2/5 = 19,84 Dp = 19,84 = 4,5, ou seja, o desvio padro 4,5 Obs.: No esquecer que esse um desvio padro para a populao

= esse representa o desvio padro de uma amostra.

=1

(Xi X )

n-1

Vamos pegar o mesmo exemplo anterior: Em um nmero de peas em uma amostra de 5 lotes, onde continha mil lotes, foram achado as seguintes quantidades de peas defeituosas nesses lotes observados: 10, 12 , 17, 20 e 8. M = S/n (onde S a soma de todas as peas defeituosas e n a quantidade de vezes que ocorreu os defeitos, ento: M = (10+12+17+20+8) 5 => M = 13,40 Com esse resultado vamos compor a tabela Peas defeituosas A 10 12 17 20 8 = 13,4 Mdia B 13,4 13,4 13,4 13,4 13,4 Desvio AB=C - 3,4 - 1,4 3,6 6,6 - 5,4 (Desvio) C 11,56 1,96 12,96 43,56 29,16 99,20

V (varincia) = Dp / n => V = 99,2/5 1 (frmula) = 24,8 Dp = 24,8 = 5 (arredondamento), ou seja, o desvio padro 5. Obs.: No esquecer que esse um desvio padro para a amostragem

Teorema de Tchebichev

Esse teorema consiste me demonstrar que em uma determinada amostra, teremos 75% de peas defeituosas ou o que seja que voc estiver trabalhando. Ele utiliza a seguinte frmula: 1 (1/n), para n > 1.

Representaremos isso graficamente:

-2

-1

1 (1/ 2) = 1 (1/4) = 1 0,25 = 0,75 ou 75%

Utilizando o exemplo das peas defeituosas e sabendo que a mdia de peas defeituosas = 13,4 e o desvio padro = 5, logo teremos

3,4

8,4

13,4

18,4

23,4

13,4 * 1,75 = 23,4 e na outra extremidade 13,4 *-75% = 3,4

Sendo assim e conforme Tchebichev, teremos uma variao de 3,4 a 23,4 de peas defeituosas, que representa 75% de tudo e nos outros 25%, teremos peas com defeito abaixo de 3,4 e acima de 23,4. Distribuio normal Regra bsica Desvio padro negativo Desvio padro positivo Porcentagem

- 1 - 2 - 3

+ 1 + 2 + 3

68,2% 95,4% 97,7%

Coeficiente de variao Pegaremos o mesmo exemplo anterior, onde se refere a quantidade peas defeituosas e o resultados encontrados. Exemplo: 10, 12 , 17, 20 e 8. (peas defeituosas por lote) Desvio padro encontrado = 5 Mdia = 13,4 Frmula Cv = Dp / mdia Cv = 5 / 13,4 = 37,3%, onde esse percentual varia para mais ou para menos em relao a mdia.