Você está na página 1de 7

ESTATISTICA - MEDIA Obtm-se somando os valores de todos os dados e dividindo a soma pelo numero de dados.

EX: 10, 15, 90, 78, 80 N1 + N2 + ... + N5 N 10 + 15 + 90 + 70 + 80 = 265 = 53 a mdia 53 5 5

- MODA Moda a medida de tendncia central que consiste no valor observado com mais freqncia em um conjunto de dados. EX: 3, 2, 0, 3, 0, 4, 3, 2, 1, 3, 1 a moda igual a 3

- MEDIANA Mediana uma medida de tendncia central que indica exatamente o valor central de uma amostra de dados. OBS: 1. se a quantidade de valores da amostra for mpar, a mediana o valor central da amostra. Nesse caso, h a mesma quantidade de valores acima e abaixo desse valor; EX: 4,0; 4,0; 5,0; 7,0; 7,0. A mediana 5,00 2. a quantidade de valores da amostra for par, preciso tirar a mdia dos valores centrais para calcular a mediana. Nesse caso, 50% dos valores da amostra esto abaixo e 50% dos valores da amostra esto acima desse valor. EX: 1, 2, 3, 3, 5, 7, 8, 10, 10, 10

- QUARTIS Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3 ) para dividir a srie em quatro partes iguais. Obs: O quartil 2 ( Q2 ) sempre ser igual a mediana da srie Quartis em dados no agrupados Exemplo: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } A srie j est ordenada, ento calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5 O quartil 1 ser a mediana da srie esquerda de Md : { 1, 1, 2, 3, 5, 5 } Q1 = (2+3)/2 = 2,5 O quartil 3 ser a mediana da srie direita de Md : {6, 7, 9, 9, 10, 13 } Q3 = (9+9)/2 = 9

- DESVIO PADRO Desvio padro O desvio padro uma medida de disperso usada com a mdia. Mede a variabilidade dos valores volta da mdia. O valor mnimo do desvio padro 0 indicando que no h variabilidade, ou seja, que todos os valores so iguais mdia. A frmula de clculo do desvio padro para os valores x1, x2, x3,, xn de uma amostra a seguinte:

EX: Consideremos os seguintes dados: Nome Paula Manuel Carla Maria Joo Idade 22 24 26 23 21 Gonalo Pedro Cristina Sofia Susana Nome Idade 22 20 24 28 30

A mdia das idades : M = (22+24+26+23+21+22+20+24+28+30) /10 = 24 anos. O desvio padro :

- VARINCIA A varincia a soma dos quadrados dividida pelo nmero de observaes do conjunto menos uma. A varincia representada por s2, sendo calculada pela frmula: s2 = SQ / (n-1) EX: Utilizando a tabela acima S2 = (22-24)2 + (24-24)2 + (26-24)2 ... + (30-24)2 S2 = 10

- TABELA DE FREQUENCIA A frequncia absoluta, ou apenas frequncia, de um valor o nmero de vezes que uma determinada varivel assume esse valor. Ao conjunto das frequncias dos diferentes valores da varivel d-se o nome de distribuio da frequncia (ou apenas distribuio). A frequncia relativa, a percentagem relativa frequncia. A frequncia relativa acumulada, a percentagem relativa frequncia acumulada. A tabela de frequncias uma forma de representao da frequncia de cada valor distinto da varivel. Juntamente com as frequncias, esta poder incluir frequncias relativas, frequncias acumuladas e frequncias relativas acumuladas.

EX: Consideremos a seguinte tabela Nome Paula Manuel Carla Maria Joo Temos, Sexo Masculino: Frequncia absoluta : 4 Frequncia relativa: 4 em 10 = 40% Sexo Feminino: Frequncia absoluta : 6 Frequncia relativa: 6 em 10 = 60% Assim a tabela de frequncias da varivel Sexo ser: varivel Sexo M F Total freq. absoluta (n) 4 6 10 freq. relativa (%) 40% 60% 100% F M F F M Sexo Gonalo Pedro Cristina Sofia Susana Nome M M F F F Sexo

- PROBABILIDADE Simples:

EX: Tabela 12: Relao entre paternidade e uso de cinto de segurana. Paternidade Usam cinto No usam cinto Total Com crianas Sem crianas Total 15 15 30 5 65 70 20 80 100

A partir da informao na Tabela 12 podemos calcular probabilidades simples (ou marginais ou incondicionais), conjuntas e condicionais. A probabilidade de uma pessoa amostrada aleatoriamente usar cinto de segurana 30/100=0,30.

A probabilidade de uma pessoa ter criana e usar cinto de segurana 15/100=0,15. A probabilidade de uma pessoa usar cinto de segurana dado que tem criana 15/20=0,75. A probabilidade de uma pessoa ter criana dado que usa cinto de segurana 15/30=0,50.

- HIPTESE ESTATSTICA: Hiptese, em estatstica, uma suposio formulada a respeito dos parmetros de uma distribuio de probabilidade de uma ou mais populaes. A hiptese nula estabelece a situao normal, isto , a moeda equilibrada. H0 : p = 0,50 A hiptese alternativa seria simplesmente a moeda no equilibrada, e investigaramos ento desvios em ambas as direes. H1: p 0,50 Entretanto, se estivssemos apostando, digamos, em caras, ento nossa preocupao seria somente com um nmero pequeno de caras. A hiptese alternativa seria aparecem muito poucas caras. H1: p < 0,50

- BOX PLOT O boxplot, ou diagrama de caixa, um grfico que capta importantes aspectos de um conjunto de dados atravs do seu resumo dos cinco nmeros, formado pelos seguintes valores: valor mnimo, primeiro quartil, segundo quartil, terceiro quartil e valor mximo.

3 Q1

6 Q2 = M

7 Q3

12

EX: Encontre o resumo dos cinco nmeros, a amplitude interquartil e determine se h valores discrepantes no seguinte conjunto de dados: 1 4 3 7 7 2 7 12 8 6 5 4 Os dados ordenados so: 1 2 3

7 7

12

A mediana a mdia das observaes de ordem 6 e de ordem 7 na lista ordenada Q2 = (5 + 6)/2 = 5,5 Considerando as 6 primeiras observaes, o primeiro quartil a mdia da terceira e da quarta observaes Q1 = (3 + 4)/2 = 3,5 Considerando as 6 ltimas observaes, o terceiro quartil a mdia da terceira e da quarta observaes nessa sublista Q3 = (7 + 7)/2 = 7 Resumo dos cinco nmeros: {1; 3,5; 5,5; 7; 12} AIQ = 7 3,5 = 3,5 Q1 1,5 AIQ = 4,25 Q3 + 1,5 AIQ = 12,25 No h valores atpicos

Fonte: http://www.uff.br/cdme/conheceboxplot/conheceboxplothtml/conheceboxplot_const.html - HISTOGRAMA um grfico de colunas justapostas que representa uma distribuio de freqncia paradados contnuos ou uma varivel discreta quando esta apresentar muitos valores distintos. No eixo horizontal so dispostos os limites das classes segundo as quais os dados foramagrupados enquanto que o eixo vertical corresponde s freqncias absolutas ou relativas dasmesmas.Quando os dados so distribudos em classes de mesma amplitude, Figura 09 (a), todas ascolunas apresentam bases iguais com alturas variando em funo das suas freqncias absolutas ourelativas. Neste caso, tem-se que a rea de cada retngulo depende apenas da sua altura enquantoque no caso de dados agrupados em classes de dimenses diferentes, como mostra a Figura 9 (b), area de cada coluna j no mais proporcional sua altura. Como a altura de cada classe precisavariar simultaneamente com sua largura, necessrio que a rea de cada uma das colunas permanea em proporo conveniente, o que pode ser obtido dividindo-se as freqncias das classespelas respectivas amplitudes e construindo-se o histograma a partir destas freqncias. Portanto,pode-se dizer que no primeiro caso, o eixo dos valores informa sobre a freqncia relativa de cadaclasse, no segundo caso, tal procedimento perde todo significado, e necessrio comparar as reaspara interpretar as informaes que so expostas.

- ORGIVA um grfico que permite descrever dados quantitativos por meio da freqncia acumulada.A ogiva um grfico de linha que une os pontos cujas abscissas so os limites superiores dasclasses, e, ordenadas suas respectivas freqncias acumuladas. Convm observa-se que o ponto inicial desse grfico o limite inferior do primeiro intervalo, com freqncia acumulada zero, poisno existe qualquer valor inferior a ele. Pela Figura 11, nota-se que no existem alunos com idade inferior a 18 anos enquanto queabaixo de 34 anos existem vinte alunos.

http://pt.scribd.com/doc/52716576/14/Grafico-da-frequencia-acumulada-ou-Ogiva

- RAMOS E FOLHAS O diagrama Ramo-e-Folhas, criado por John Tukey, um procedimento utilizado para armazenar os dados sem perda de informao. utilizado para se ter uma idia visual da distribuio dos dados. Para constru-lo, divide-se cada nmero em duas partes. A primeira denominada ramo e a segunda, folhas. O ramo consistir de um ou mais dgitos iniciais se o valor da varivel for um nmero inteiro e do nmero inteiro, se o valor da varivel for um nmero com decimais. Nas folhas,colocamse os dgitos restantes se o valor observado for nmero inteiro, ou os decimais, caso contrrio

- DISPERO As medidas de disperso auxiliam as medidas de tendncia central a descrever o conjunto de dados adequadamente. Indicam se os dados esto, ou no, prximos uns dos outros. Amplitude Total A amplitude total de um conjunto de dados a diferena entre o maior e o menor valor observado. A medida de disperso no levar em considerao os valores intermedirios perdendo a informao de como os dados esto distribudos e/ou concentrados. At = Xmax Xmin

Amplitude Interquartlica A amplitude interquartlica a diferena entre o terceiro e o primeiro quartil. Esta medida mais estvel que a amplitude total por no considerar os valores mais extremos. Esta medida abrange 50% dos dados e til para detectar valores discrepantes. dq = Q3 Q1 Por outro lado, a amplitude semi-interquartlica definida como a mdia aritmtica dadiferena entre a mediana e os quartis: Dqm = Q3 Q1 2