Você está na página 1de 20

Estatística e Probabilidades

INDÍCE
INTRODUÇÃO .......................................................................................................................................... 2 1. QUADRO DE FREQUÊNCIA PARA DADOS ORGANIZADOS EM CLASSES OU INTERVALO ...................... 3 1.1. Dados Agrupados em Classes .................................................................................................... 3 1.2. Distribuição de frequências de dados agrupados em classes. .................................................... 4 2. REPRESENTAÇÃO GRÁFICA (HISTOGRAMA) ...................................................................................... 6 3. Medidas de Tendência Central: Média, moda e mediana ................................................................. 8 3.1. Média ....................................................................................................................................... 8 3.2. Moda ...................................................................................................................................... 10 3.3. Mediana ................................................................................................................................. 10 4. MEDIDAS DE DISPERSÃO (MEDIDAS DE VARIABILIDADE) ................................................................ 12 4.1. Razõe que justificam o calculo de uma medida de dispersão ................................................... 12 4.2. Amplitude do intervalo de variação ......................................................................................... 13 4.3. Amplitude do intervalo interquartis ........................................................................................ 13 4.4. Desvio absoluto médio (dm).................................................................................................... 13 4.5. Coeficiente de variação (cv) .................................................................................................... 14 5. MEDIDAS DE TENDÊNCIA NÃO - CENTRAL (Quartis, Decis, Percentis) ............................................ 15 5.1. Quartis (Qi).............................................................................................................................. 15 5.2. Decis(Di): ................................................................................................................................ 16 5.3. Percentis ( Pi ).......................................................................................................................... 18 CONCLUSÃO .......................................................................................................................................... 19 BIBLIOGRAFIA ........................................................................................................................................ 20

Electrica II 2012

Pag. 1

Estatística e Probabilidades

INTRODUÇÃO A utilização da Estatística é cada vez mais acentuada em qualquer atividade profissional da vida Moderna onde pretende organizar, sintetizar e analisar os dados obtidos no estudo de variáveis relativas a uma população de modo a permitir caracterizar a população e conhecer o seu comportamento sendo assim são compilada e sintetizada em tabelas e gráficos e através do cálculo de indicadores numéricos. O desafio da Estatística Descritiva consiste não na própria construção das tabelas ou dos gráficos mas na escolha mais adequada destas ferramentas de modo a caracterizar correctamente as variáveis em estudo No cálculo de medidas que possibilitem representar um conjunto de dados relativos à observação de determinado fenômeno de forma resumida.

Electrica II 2012

Pag. 2

24 . Ex: Utilizando os mesmos dados anteriores: 11 .Estatística e Probabilidades 1. no ano de 1850.16 .15 15 .11 . Ex: Utilizando os mesmos dados anteriores: A = 26 . nas quais todos os elementos são fixos.Dados Agrupados em Classes 1. 14 .24 . onde é feita a correspondência entre categorias ou valores possíveis e as frequências respectivas. Rol .25 .12 .13 .16 . Dados Brutos .21 . Amplitude total ou ”range” (A) .13 . Isto e nao foram numericamente organizados. 4.É o número de vezes que o elemento aparece na amostra ou onúmero de elementos pertencentes a uma classe.23 .1.14 .24 -14 11 -15 .22 .23 .18 .É o arranjo dos dados brutos em uma determinada ordem crescente ou decrescente.15 -16 .26 .23 .25 .15 .12 . Agora os dados referentes ao fenômeno são apresentados através de gradações.25 .É a diferença entre o maior e o menor valor observado da variável em estudo. Frequência absoluta simples (fi) .15 .23 24 -11 .20 .21 .21 2.12 .É o conjunto dos dados numéricos obtidos após a coleta dos dados.20 .11 .21 . Electrica II 2012 Pag.13 .13 .24 .25 . QUADRO DE FREQUÊNCIA PARA DADOS ORGANIZADOS EM CLASSES OU INTERVALO Constituem-se num caso particular das séries estatísticas. 3 .21 22 .16 .23 -23 .11 .21 . 1.11 = 15.15 .12 .26 3.16 .16 .15 . Ex: Idade dos alunos selesionado para do curso de engenharia naval.18 .

As tabelas de frequências podem representar tanto valores individuais como valores agrupados em classes. por outro lado. Este tipo de tabela informa. Quando a variável objeto de estudo for contínua geralmente será conveniente agrupar os valores observados em classes.É a soma das frequências simples absolutas de todos os elementos observados Para melhor os dados.Distribuição de frequências de dados agrupados em classes. a variável for discreta e o número de valores representativos dessa variável for muito grande. Classe pode ser definida como sendo os subintervalos da Amplitude Total de uma variável (grupo de valores).  Impossibilidade ou dificuldade de visualização do comportamento do fenômeno como um todo. utilizaremos os dados agrupados em classes e não mais individualmente.2. Muitas vezes com o objetivo de resumir os dados originais em uma distribuição de frequências. o procedimento visa a evitar certos inconvenientes. tanto quanto os dados brutos. Nesse último caso. além de proporcionar uma visão panorâmica do comportamento da variável. como:  Grande extensão da tabela.Estatística e Probabilidades 5. a leitura e a interpretação dos resultados apurados. 4 . o que seria impossível de se fazer a partir da lista dos dados brutos. bem como de sua variação. Se. Frequência total (ft) . a tendência de a série se concentrar em torno de um valor central. dificultando. Electrica II 2012 Pag. recomenda-se o agrupamento dos dados em classes. 1. de imediato.  O aparecimento de diversos valores da variável com frequência nula. é aconselhável a elaboração de distribuições de frequência.

1.Estatística e Probabilidades Ex: Utilizando os mesmos dados anteriores. 5 . e não somente de regras muitas vezes arbitrárias e pouco flexíveis. onde n é o tamanho da amostra Mesmo tendo outros critérios de determinação do número de classes. (a) k = 5. Definição do número de classes . Electrica II 2012 Pag. Para determinar o número de classes há diversos métodos. para n ≤ 25 e k = √n . temos: I 1 2 3 4 5 Idade 11 |– 14 14 |– 17 17 |– 20 20 |– 23 23 |– 26 Total Frequência ( fi ) 7 8 1 5 9 30 O símbolo |– indica a inclusão do limite inferior do intervalo naquela classe. (b) Fórmula de Sturges: K = 1+3. É importante que a distribuição conte com um número adequado de classes. 3 log10 n. o que se deve ter em mente é que a escolha dependerá sobretudo da natureza dos dados e da unidade de medida em que eles se encontram. os dados originais ficarão tão comprimidos que pouca informação poderá ser extraída desta tabela.É representado por k. Se esse número for escasso. para n > 25.

enquanto o valor 14 é denominado limite superior da primeira classe. REPRESENTAÇÃO GRÁFICA (HISTOGRAMA) Representação gráfica dos dados tem por finalidade representar os resultados obtidos.Os limites de classe são seus valores extremos. Ex: Utilizando os mesmos dados anteriores: 2. O tamanho da amostra é dado pelo número de elementos (ou itens ou observações) que a compõem e pode ser arbitrariamente considerado como pequeno. Pontos Médios ou Centrais da Classe (xj) . No exemplo anterior de distribuição de frequência. médio ou grande.Estatística e Probabilidades 2. Histograma . Electrica II 2012 Pag. Amplitude do Intervalo de Classe (h) . a depender das características da variável. A escolha do gráfico mais apropriado fica a critério do analista. 3. o valor 11 é denominado limite inferior da primeira classe. 6 .A amplitude de um intervalo de classe corresponde ao comprimento desta classe. de forma que a área de cada retângulo seja proporcional à frequência da classe que ele representa. Ex: Utilizando os mesmos dados anteriores: h = 14 − 11 = 3 4.É a média aritmética simples entre o limite superior e o inferior de uma mesma classe.É um gráfico formado por um conjunto de retângulos justapostos. sua amplitude pode ser definida como a diferença existente entre os limites superior (ou inferior) de duas classes consecutivas. Limites de Classe . permitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se relacionam seus valores. Numericamente.

Estatística e Probabilidades Para as amostras médias e grandes. em seguida. ou seja.00 ---------------- ------------------- Electrica II 2012 Pag.27 0. O número de classes a ser considerado.53 4 5 Total 5 9 30 0. a freqüência absoluta em cada classe.17 0. 7 . é necessário. O essencial para a construção do histograma é elaboração da tabela de freqüências. é conveniente classificá-las ou agrupá-las em subconjuntos.23 0. 1 2 7 8 0.30 1. contar o número de ocorrências. primeiramente. A Tabela abaixo apresenta um resumo do cálculo das freqüências absolutas.das freqüências relativas. obtidas pelo número de ocorrências em cada classe. entre os quais destaca-se o histograma. o número de classes deve estar compreendido entre 5 e 6. de modo a se ter uma melhor compreensão do padrão de variabilidade da variável em questão.00 0. Para se construir um histograma.23 0. resultantes da divisão das freqüências absolutas por N= 30 e das freqüências relativas acumuladas. agrupar as observações em classes e. cujo tamanho é N = 30. Esse expediente dá origem a diversos tipos de gráficos. depende do tamanho da amostra. NC Intervalo classe (Idade) 11 |– 14 14 |– 17 17 |– 20 20 |– 23 23 |– 26 de Frequência Absoluta (fi) Frequência relativas (fri) Freqüências acumuladas(Fri). Tabela de Frequência Idade dos alunos selesionado para do curso de engenharia naval. De acordo com as recomendações mencionadas. representado por NC.03 0.7 1.5 3 1 0. no ano de 1850. tomemos NC = 5.

Electrica II 2012 Pag. sendo representada por X ou por μ conforme se trate. que a forma do histograma é muito sensível ao número. dependendo daquilo que se pretende conhecer a respeito dos dados. os intervalos de classes e. 8 . 3. as freqüências absolutas e/ou relativas. da média amostral (estatística) ou da média populacional (parâmetro). em abscissas. MODA E MEDIANA As medidas de posição são números que resumem e representam características importantes da distribuição de frequências e podem apresentar-se de várias formas. respectivamente.1. 3.o qual é um simples gráfico de barras tendo. à largura e aos limites dos intervalos de classe.Estatística e Probabilidades Com base nos elementos da Tabela. MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA. devido à tendência de os dados observados se concentrarem em torno desses valores centrais que se localizam em torno do meio ou centro de uma distribuição.Média A média é uma medida de localização de tendência central. A média de um conjunto de dados quantitativos obtém-se somando todos os valores e dividindo o resultado pelo nº total de valores. em ordenadas. É importante ressaltar. As medidas de posição são chamadas de medidas de tendência central. entretanto. pode-se construir o histograma.

….1.Estatística e Probabilidades 3. No caso dos dados estarem agrupados em classes a média será dada por: Onde: xi – valores observados da variável ou ponto médio das classes f i . Média aritmética para dados agrupados Se o valor da variável forem agrupados em uma distribuição de frequências será usa a média aritmética dos valores x1 x2 x3. I(xi) Idade 1 2 3 4 5 11 |– 14 14 |– 17 17 |– 20 20 |– 23 23 |– 26 Total Frequência ( fi ) 7 8 1 5 9 30 7 16 3 20 45 91 Electrica II 2012 Pag. f2. ….1. fn. xn ponderadas pelas respectivas frequências absolutas: f1. 9 .frequência simples absoluta Σ f i = n – número de elementos da amostra Determinar a media aritmética da tabela aseguir. f3.

Se todos os valores forem diferentes não há moda. a mediana é o valor médio dos dois valores centrais do conjunto de dados ordenados. sendo aplicada tanto a fenómenos qualitativos quanto quantitativos. por isso a mediana e considerada uma medida separatriz.Mediana A mediana é o valor que ocupa a posição central de um conjunto de valores ordenados. sua aplicação não depende do nível de mensuração da variável. medida divide a distribuição de valores em duas partes iguais: 50% acima e 50% abaixo do seu valor. ou seja. 10 . trimodal ou multimodal Moda para dados agrupados com classes Para este caso a passos a tomar-se em conta tais como: 1º) Identifica-se a classe (a de maior frequência) 2º) Passo: aplica-se a fórmula: 1º) Processo: Moda bruta : Sendo.limite inferior da classe modal ls –limite superior de classe modal 2º) Processo: Fórmula de Czuber 3. há dois valores centrais. Moda de um conjunto de valores é o valor que ocorre com maior frequência. valor dominante ou valor típico. um conjunto pode ter mais do que uma moda: bimodal. por outro lado.Moda Também chamada de norma.3. Electrica II 2012 Pag. li -. neste caso.Estatística e Probabilidades 3.2. Quando o conjunto possui quantidade par de valores.

1. 11 .2. Electrica II 2012 Pag. Mediana para dados agrupados em classe 1º) Calcula-se a posição.  A mediana não é tão afectada pelos valores extremos como a média aritmética.3. se diz que a mediana é uma medida robusta. A mediana é fácil de ser calculada. por isso.3.frequência acumulada anterior à classe da Md H – intervalo da classe da Md FMd – frequência simples absoluta da classe da Md 3.Estatística e Probabilidades 3. 3º) Aplica-se a fórmula: Onde.  Simplicidade. Propriedades da mediana  Unicidade. Existe somente uma mediana para um conjunto de dados. 2º) Pela fi identifica-se a classe que contem a Md. LMd – limite inferior da Md = 16 n – tamanho da amostra Fa .

padrão. da variância e do desvio.Estatística e Probabilidades 4. ou dispersão dos valores observados em torno da media aritmética. Razõe que justificam o calculo de uma medida de dispersão Como os próprios termos dispersão e variação o indicam. Electrica II 2012 Pag. É o caso do desvio absoluto médio. 4. Servem para verificarmos a representatividade das medidas de localização (media) e proporcionam conhecer o nível de homogeneidade ou heterogeneidade dentro de cada grupo analisado. A segunda categoria de medidas de dispersão utiliza uma medida de localização como termo de comparação. MEDIDAS DE DISPERSÃO (MEDIDAS DE VARIABILIDADE) São medidas utilizadas paa medir o grau de variabilidade. ao cálculo prévio de uma medida de localização. Estas medidas podem ser divididas em duas categorias. cujos valores se apresentam na mesma unidade de medida dos valores originais e não recorrem. Pois é muito comum encontrarmos variáveis que. Existem duas razões importantes que justificam o calculo uma medida de dispersão a saber:  A primeira consiste na necessidade de se obter um instrumento que nos permita avaliar a representatividade do valor médio num conjunto de dados. 12 . São exemplos de medidas de distância: o intervalo de variação e o intervalo interquartis. este tipo de medidas de estatística descritiva indicam o modo como os valores observados se afastam das medidas de tendência central. Uma primeira categoria inclui as medidas de distância.1. apesar de terem a mesma media. o coeficiente de variação. Se existir uma grande variação dos valores observados. Quando se pretende comparar a dispersão entre dois ou mais conjuntos de dados pode ainda utilizar-se uma terceira categoria – uma medida de dispersão relativa – como por exemplo. são compostas de valores bem distintos. uma medida de tendência central por si so pouco informação nos dá.

podemos determinar pela formula: Electrica II 2012 Pag. Amplitude do intervalo de variação A amplitude do intervalo de variação (R) é a diferença entre os valores máximo e mínimo da variável. Desvio absoluto médio (dm) É uma medida de dispersão não – negativa e quanto maior o seu valor.2. 4. entre os valores observados da variável e a sua média.4.3. A sua utilização tem como principal desvantagem o facto de ter em conta apenas os valores extremos que a variável toma e. Amplitude do intervalo interquartis É definida como a diferença entre o terceiro e o primeiro quartis e corresponde ao intervalo que engloba 50% das observações centrais. maior a dispersão da variável. portanto. 13 . não ser sensível aos valores intermédios. Calcula-se pela formula: 4. o desvio absoluto médio de dispersão é a media aritmética dos desvios absolutos dos valores da variável relativamente à sua média. Quando os dados estão desagregados o desvio absoluto médio (MD) é igual á soma das diferenças.Estatística e Probabilidades  A segunda razão pretende-se com a necessidade de conhecer a dispersão dos valores com o objectivo de serem tomadas medidas concretas para a controlar. Tem a desvantagem de não influenciar por metade dos valores observados e que são valores extremos. em valor absoluto. Podemos determinar pela fórmula: 4. divididas pelo número total de observações: Para dados já agrupados.

Electrica II 2012 Pag.2. a variância é a soma do quadrado das diferenças entre os valores da variável e a média. Variância Para dados não agrupados. 14 .5.Estatística e Probabilidades 4. em termos percentuais.5.1. Coeficiente de variação (cv) É uma medida relativa de dispersão. dividida pelo número total de observações. de distribuição frequências distintas.6. entre o desvio-padrão e a media da distribuição. Variância e desvio – padrão 4. útil para a compreensão em termos termos relativos do grau de concentração em torno das medidas. É dado pela relação. E determina-se pela fórmula: Para os dados agrupados. a variância é a media aritmética do quadrado dos desvios dos valores da variável relativamente à sua média: Ou 4. Desvio médio É a raiz quadrada da variância.5. E determina-se pela fórmula: 4.

Percentis) Para além das medidas de tendência Central existem outras medidas que nos dão a localização dos valores da variável: em termo geral são chamados quantis .CENTRAL (Quartis. MEDIDAS DE TENDÊNCIA NÃO .1. usaremos a seguinte expressão: Electrica II 2012 Pag. que São elas: 5.Estatística e Probabilidades 5. Decis. Essas São as medidas que separam a distribuição de frequências em partes iguais. Vimos que a mediana divide a distribuição em duas partes iguais quanto ao número de elementos de cada parte. para determinar a ordem ou posição do quartil a ser calculado. Agora vamos estudar outras medidas que dividem a distribuição em partes iguais. Deixa 75% dos elementos antes do seu valor. 15 . Quartis (Qi) Quartis são os valores dia a variável que divide a distribuição de frequencia em quatro partes iguais: Q1: 1o quartil. Q2: 2o quartil. Deixa 50% dos elementos antes do seu valor. Deixa 25% dos elementos antes do seu valor. Coincide com a mediana Q3: 3o quartil. Genericamente.

16 . Para dados agrupados em classes.Estatística e Probabilidades Onde: i = número do quartil a ser calculado n = número de observações. 5.2. Decis(Di): Os decis são os valores da variável que divide a distribuição de frequencia em dez partes iguais: Electrica II 2012 Pag. encontraremos os quartis de maneira semelhante à usada para o cálculo da mediana: Onde. l = limite inferior da classe que contém o quartil desejado h = amplitude do intervalo de classe EQi = posição do quartil Fant = frequência acumulada até a classe anterior à classe mediana f Qi = frequência absoluta simples da classe quartílica.

Exemplo: Com base na tabela de distribuição de frequências abaixo calcule o quarto decil (4º decil). para calcular os decis. recorreremos à expressão que define a ordem em que o decil seencontra: Para dados agrupados em classes. encontraremos os decis de maneira semelhante à usada para cálculo da mediana e dos quartis. 17 .Estatística e Probabilidades De maneira geral. Intervalo (Idade) 4 |– 9 9 |– 14 14 |– 19 19 |– 24 de classe Frequência ( fi ) Fant 8 12 17 3 40 8 20 37 40 Electrica II 2012 Pag.

Estatística e Probabilidades 5. Exemplo: Com base na tabela de distribuição de frequências acima calcule 72º percentil (P72). encontraremos os centis de maneira semelhante à utilizada para cálculo da mediana. Percentis ( Pi ) Percentis são as medidas que dividem a amostra em 100 partes iguais. 18 .3. Assim O elemento que definirá a ordem do centil será encontrado pelo emprego da expressão: Onde: i = número identificador do centil n = número total de observações Para dados agrupados em classes. Electrica II 2012 Pag. dos quartis e dos decis.

Para a representação gráfica dos dados em forma de histograma. conseguimos ainda ter uma noção de como podemos determinar as diferentes medidas que ao logo do trabalho fomos abordando. 19 . tem como papel muito importante o estudo dos quadros de frequências para dados organizados em classes ou intervalos. temos como conclusão. Electrica II 2012 Pag. que nos dão uma imagem clara do que se pretende com os diferentes dados colectados durante um estudo ou observação estatística.Estatística e Probabilidades CONCLUSÃO De acordo com o abordado ao longo do trabalho. que para o estudo e aprofundamento da estatística.

Medidas de tendência central .com. 2009 PDF.google. Lisboa.htm Acesso: 25/03 /2012 03h:00 Electrica II 2012 Pag. Medidas de disperção . Elizabeth ESTATÍSTICA DESCRITIVA 7ª Edição -2ª impressão .br/estatisica%descritiva%doc1.In: www.com. 20 .br/estatisica%descritiva%doc Acesso: 20/03 /2012 10h:13 PDF.Estatística e Probabilidades BIBLIOGRAFIA REIS.google.EM: www.