P. 1
WEB AULAS + EXERCÍCIOS ESTATÍSTICA

WEB AULAS + EXERCÍCIOS ESTATÍSTICA

|Views: 7.760|Likes:
Publicado porDuduka Luis Eduardo

More info:

Published by: Duduka Luis Eduardo on Apr 12, 2011
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

05/28/2013

pdf

text

original

WEB AULA 1 ESTATÍSTICA DESCRITIVA Olá pessoal, antes de iniciarmos a nossa disciplina vou me apresentar para vocês: eu sou

o Professor Marcelo Caldeira Viegas, Graduado em Engenharia Química pela UEM (1996), Mestre em Engenharia Química pela UNICAMP (1999) e Doutor em Engenharia Química pela UNICAMP (2003), atuo há mais de oito anos como pesquisador de uma empresa multinacional, onde sempre utilizei a Estatística como ferramenta fundamental para execução do meu trabalho e tomada de decisões estratégicas, além de atuar também como professor em cursos de PósGraduação da UNOPAR na área de Gestão da Qualidade. Como temos muito trabalho pela frente, proponho a você muito estudo durante esta disciplina, a qual passamos a apresentar em seguida. Estatística Aplicada à Gestão Empresarial No moderno ambiente administrativo e econômico global, qualquer pessoa pode ter acesso a uma enorme quantidade de informações estatísticas. Os gerentes e gestores mais bem-sucedidos são aqueles capazes de entender a informação e usá-la de maneira eficaz. A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa. Por meio de sondagens, de coleta de dados e de recenseamento de opiniões, pode conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazos. A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e de qualidade do produto e mesmo dos possíveis lucros e/ou perdas. 1. INTRODUÇÃO Considere as seguintes notícias de jornais e revistas: “O Comércio Varejista do país iniciou 2010 com crescimentos de 2,7% no volume de vendas e de 3,0% na receita nominal, na comparação com dezembro (ajustadas sazonalmente). Nas demais comparações, obtidas das séries originais (sem ajuste), o varejo nacional obteve, em termos de volume de vendas, acréscimos da ordem de 10,4% sobre janeiro do ano anterior e de 6,2% no acumulado dos últimos 12 meses. Para os mesmos indicadores, a receita nominal de vendas apresentou taxas de variação de 12,3% e de 10,1%, respectivamente.” (Fonte IBGE – Instituto Brasileiro de Geografia e Estatística, 11/03/10) - http://www.ibge.gov.br/home/ (acessado em 21/03/2010) “Em janeiro de 2010, o emprego industrial mostrou variação positiva de 0,3% frente ao mês anterior, já descontadas as influências sazonais, após queda de 0,6% em dezembro. Ainda na série com ajuste sazonal, o índice de média móvel trimestral manteve a trajetória ascendente iniciada em agosto último, ao registrar acréscimo de 0,3% entre os trimestres encerrados em dezembro e janeiro.” (Fonte IBGE – Instituto Brasileiro de Geografia e Estatística, 11/03/10) http://www.ibge.gov.br/home/ (acessado em 21/03/2010) Diariamente, somos expostos a uma grande quantidade de informações numéricas, semelhantes às relatadas. Dependendo das situações, ora somos consumidores destas informações, ora precisamos produzi-las. Assim, necessitamos de capacitações para compreendermos informações numéricas produzidas por outros, bem como nos habilitarmos a construí-las. O emprego dos procedimentos, técnicas e métodos estatísticos é fundamental para nos auxiliar na execução dessas tarefas.

O QUE É A ESTATÍSTICA? Vamos desvendar esta ciência? Então, vamos lá... ESTATÍSTICA: A estatística é a ciências dos dados. Ela nos fornece métodos para coleta, organização, descrição, análise e interpretação de dados para a utilização dos mesmos na tomada de decisões. É objetivo da estatística: extrair informação de um conjunto de dados para obter uma melhor compreensão das situações que representam. A Estatística é dividida basicamente em duas áreas: Estatística Descritiva e Inferencial. No nosso curso serão abrangidas estas áreas conforme veremos. Para melhor compreendermos os propósitos da Estatística, é necessário conhecermos as algumas definições: População: É a totalidade dos elementos, objetos ou pessoas que estão sendo considerados inicialmente. Amostra: É todo subconjunto de unidades retiradas de uma população para obter a informação desejada. Uma amostra tem que representar e ter as mesmas características da população original, portanto, a amostra só traz informação sobre a população da qual foi retirada. Em outras palavras, a amostra é parte da população que é selecionada para análise. A preocupação central é que a amostra seja representativa da população inicial. Amostragem: É o método de retirada de amostras de uma população. Consiste em selecionar parte de uma população, para observar, de forma que seja possível estimar algo sobre toda a população. Estatística Descritiva: Os objetivos da estatística descritiva envolvem coleta, organização e descrição de um conjunto de dados quantitativos ou qualitativos. Com a construção de gráficos, tabelas e com o cálculo de medidas com base em uma coleção de dados numéricos, poderemos compreender melhor o comportamento da variável expressa no conjunto de dados sob análise. Estatística Inferencial: È a área da estatística responsável pela análise e interpretação dos dados, associado a uma margem de incerteza. Nesta fase são empregados métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais. Por que estudarmos a amostra e não a população? Abaixo, seguem algumas razões que nos levam a trabalhar com as amostras, e não com toda a população: • Alto custo e demora dos censos; • Em alguns casos populações muito grandes; • Impossibilidade física de se examinar toda a população; • Comprovado valor cientifico das informações coletadas por meio de amostras; A condução de uma pesquisa eleitoral ilustra o processo da inferência estatística. O pesquisador, impossibilitado de entrevistar todos os eleitores (população), seleciona uma amostra de eleitores e questiona sobre suas preferências eleitorais. Baseado nas respostas amostrais, conclui sobre todo o conjunto dos eleitores. Junto com suas conclusões, o pesquisador informa a probabilidade de confiança de que seus resultados amostrais refletem o comportamento de todos os eleitores (população). Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital, procure pelo livro: LARSON, R.; FARBER, B. Estatística Aplicada. 2ª Edição. São Paulo: Editora Pearson, 2008 e leia o capítulo 1 da página 2 a 6. Outras Definições Básicas da Estatística Atributos: Quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo.

50. 45. 51. 52. 51. 60. 42. 58. Variáveis quantitativas ou numéricas: Quando os dados são de caráter nitidamente quantitativo. Dados Brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. 3º Fase. Exemplo: 41. 41. 58. 41.Variável: É uma condição ou característica das unidades da população. Por exemplo. D. É o registro sistemático de dados. obtidos por meio de uma amostragem. • o Dados primários (coleta direta): Quando são publicados pela própria pessoa ou organização que os tenha coletados. 3. etc. 44. a idade das pessoas residentes no Brasil. • Ordinal (exemplo: classe social: A. 57.Execução da Pesquisa. C. Exemplo: 45.).. 50. e o conjunto dos resultados possui uma estrutura numérica. etc. etc. ROL: É a tabela obtida após a ordenação dos dados brutos (de forma crescente ou decrescente). Exemplo de variável contínua: peso de uma pessoa (60. Seus valores são expressos por atributos: São exemplos de variáveis qualitativas: sexo. ou classe social são variáveis. Dados: São os valores da variável em estudo. Organização de Dados Estatísticos (Fases do Método Estatístico) A Estatística Descritiva tem por objetivos planejar uma pesquisa. 58. São exemplos de variáveis quantitativas: idade. É difícil formarmos uma idéia exata do comportamento do grupo como um todo. Os dados são do mesmo do tipo que as variáveis.. 58. por exemplo.Planejamento da pesquisa: Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Cronograma de atividades? Custos envolvidos? Etc. número de estudantes em uma sala de aula. Definir Objetivos: Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema inicial.masculino e feminino). 52.Definição do Problema. Segue abaixo algumas perguntas que precisam ser respondidas no planejamento de um levantamento de dados estatísticos • o o o O quê? – Características a serem observadas: VARIÁVEIS Quem? – Os elementos a serem pesquisados: POPULAÇÃO / AMOSTRA Como? – O instrumento de coleta de dados: MÉTODO DE AMOSTRAGEM A SER UTILIZADO. tipo sanguíneo (O. 54. 1. Seguindo este raciocínio a Estatística divide o estudo e análise dos dados em algumas fases que são descritas a seguir: 1º Fase. As variáveis são classificadas em dois tipos: Qualitativas e Quantitativas Variáveis qualitativas ou atributos: Quando os dados são distribuídos em categorias mutuamente exclusivas. AB). A. uma variável discreta produz dados discretos. 50. 41. Exemplos: Tabelas do censo demográfico do . 60. 54. E). 42. retirando o maior número possível das informações nelas contidas com o objetivo de utilizá-las na tomada de decisões. 46. 42 43. 60. 41. • Variável Contínua: A variável contínua pode assumir qualquer valor num dado intervalo. São exemplos de variáveis discretas: número de filhos (0. ETC. 46.50 Kg). focando o objetivo determinado inicialmente. 44. a partir de dados não ordenados ou dados brutos. Coleta de Dados: Fase operacional. B. taxa de colesterol. etc. QUESTIONÁRIO /ENTREVISTA ESTRUTURADA. Estas variáveis são classificadas em dois tipos: • Nominal (exemplo: gênero . 2º Fase. cor da pele. As variáveis quantitativas ou numéricas são classificadas em dois tipos: • Variável Discreta: A variável discreta só pode assumir apenas valores inteiros.. 46. 57. 50. B. estatura.. descrever e analisar dados. 42 43. cidade de nascimento. 46. coletar informações. 2. 60. 41.

Apuração dos Dados: Resumo dos dados através de sua contagem e agrupamento.É uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado. Exemplo: Quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. cuja finalidade principal é descrever a variável estudada. em função dos objetivos práticos desta web aula. As notas esclarecem aspectos relevantes do levantamento dos dados A Tabela 01 apresenta um exemplo de tabela que obedece às normas técnicas. 1993) Apresentação gráfica dos dados numéricos .Interpretação dos Dados e Conclusões Obtidas a partir dos dados (estatística inferencial): A última fase do trabalho estatístico é a mais importante e delicada. O rodapé é reservado para observações pertinentes à tabela. 2009 e leia o capítulo 1 (itens 1. É a condensação e tabulação de dados. 4º Fase.Análise e Apresentação dos Dados: Há duas formas de apresentação. População residente no Brasil. Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital. 5º Fase. • Corpo. uma empresa realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. A fonte dos dados é a entidade responsável pelos dados numéricos. WEB AULA 2 APRESENTAÇÃO DE DADOS EM TABELAS Existem regulamentações para construção de tabelas estatísticas. sem abreviações. Uma tabela deve apresentar a seguinte estrutura: • Cabeçalho. precedida da palavra Fonte ou Fontes (IBGE. o que se deve buscar são representações simples que possibilitem ao leitor a compreensão do fenômeno sem muito esforço. Dados secundários (coleta indireta): Quando são publicados por outra organização. não serão adotadas normas rígidas para elaboração de tabelas.constitui uma apresentação gráfica permitindo uma visão rápida e clara da variável estudada. procure pelo livro MCCLAVE. O cabeçalho da tabela especifica o conteúdo das colunas. Está ligada essencialmente ao cálculo de medidas e coeficientes.1 a 1. Tabela 01. Temos que ter em mente que a tabela deverá ser uma forma objetiva de se demonstrar o comportamento de variáveis. de acordo com o censo demográfico de 2000 . • Rodapé. Deve conter o suficiente para que sejam respondidas as questões: O que está representado (fato)? Onde ocorreu (local)? Quando ocorreu (tempo)? O corpo da tabela é representado por colunas e subcolunas dentro das quais serão registrados os dados numéricos e informações. que não se excluem mutuamente: • o o Apresentação de dados em tabelas . deverá ser colocada na parte inferior. 6º Fase. Observação: É mais seguro trabalhar com dados primários. “Estatística para Administração e Economia”. com palavras claras e concisas.o IBGE. todavia. construídas segundo normas técnicas citadas pela Fundação Instituto Brasileiro de Geografia e Estatística (IBGE. O uso de dados secundários traz o grande risco de erros de transcrição. por extenso. 10º Edição.3) da página 2 a 8. São Paulo: Pearson Prentice Hall. segundo o sexo. bem como para registro e identificação da fonte de dados. 1993).

Neste tipo de série a variável é o local e são fixos o fato e a época.Fonte: IBGE (2003) Conforme critério de agrupamento as tabelas. sendo que o fato e o local permanecem fixos. a) Série Cronológica É a série estatística em que todos os dados são observados segundo a época de ocorrência. Regime de Trabalho dos Professores de Química – 2010 (Londrina – Jd Piza) Fonte: Coordenadoria de Recursos Humanos (Unopar) d) Distribuição de Frequências .Tabela 03.2008 Fonte: Departamento e Marketing da Companhia Alfa (Dados Fictícios) b) Série Geográfica ou de Localização É a série estatística em que os dados são observados segundo a localidade de ocorrência. Vendas da Companhia Alfa – 2004 . podem representar diversas séries estatísticas que são descritas a seguir. varia o fato e permanece constante a época e o local. Nesta série a variável é o tempo. Tabela 02. Vendas de Computadores por Empresa – 2006 (Alagoinhas – Bahia) Fonte: Dados Fictícios c) Série Específica É a série estatística em que os dados são agrupados segundo a modalidade de ocorrência. Tabela 03. A Tabela 02 apresenta um exemplo de tabela que descreve uma série cronológica. Exemplo (Tabela 04) Tabela 04. Exemplo . ou seja.

classificamos cada unidade da amostra em uma dada categoria. A frequência relativa é dada por: Apresentação de Dados Qualitativos: Quando observamos dados qualitativos. Dados numéricos podem ser apresentados em tabelas de distribuição de frequências (com ou sem intervalos de classe) conforme veremos a seguir. Opinião dos consumidores sobre determinado produto Fonte: Dados Fictícios Apresentação de Dados Quantitativos: Os dados numéricos são apresentados na ordem em que são coletados. obtendo. Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado. A idéia é resumir as informações na forma de uma tabela que mostre as contagens (frequências) em cada categoria. Para construir . é mais indicado efetuar o agrupamento dos valores em vários intervalos de classe. Exemplo .É uma série estatística em que os dados são agrupados com suas respectivas frequências absolutas. uma tabela de distribuição de frequência.Tabela 06. Tabela 06. é usual fornecer a proporção (frequência relativa) de unidades que caem em cada categoria. então. Para uma amostra de tamanho razoável esta distribuição de frequência é inconveniente. A Tabela 05 apresenta um exemplo de distribuição de frequência de dados qualitativos. conforme veremos a seguir. Distribuição do número de faltas de 30 empregados de uma determinada empresa no semestre. devem ser apresentados em tabelas de distribuição de frequência com intervalos de classes. Distribuição de frequência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seus valores. tanto dados discretos quanto contínuos. desde que em grande número. Por esta razão. Tabelas com grande número de dados não oferecem ao leitor visão rápida e global do fenômeno. Nas tabelas de distribuição de frequências. já que exige muito espaço. Tabela 05.

e n é o número de dados (tamanho da amostra). 4º Passo) Decidido o número de classes. O primeiro elemento das classes seguintes sempre será formado pelo último elemento da classe anterior. Que é definido por: Assim como no caso do número de classes (K). portanto: A = Maior Medida – Menor Medida. que pode ser obtido por vários métodos. mas não deve ser entendido como obrigatório. Assim. de maneira que a primeira contenha o menor valor observado. que é a diferença entre os valores máximo e mínimo. usa-se K=7.7. 1º Passo) Organize os dados brutos em um ROL. se K=6. sendo os mais usuais: Onde: K é o número de classes. Dados Brutos: 1º Passo) A partir dos dados brutos construir o ROL (ordenação dos dados em ordem crescente) . O indicado é sempre o arredondamento do valor de K obtido para um valor mais alto.uma tabela de distribuição de frequência com intervalos de classe siga os procedimentos a seguir. usa-se h=2 5º Passo) Organize as classes.4. 3º Passo) Calcule o número de classes (K): O número de classes de uma representação será um número inteiro próximo de K. Observação: O cálculo de K por meio de fórmulas pode servir como referência. a amplitude das classes (h) deve ser aproximada para o maior valor inteiro. e h=1. Exemplo (Construção de uma tabela de distribuição de frequência com intervalos de classe): Vamos construir uma tabela de distribuição de frequências das idades dos funcionários de uma amostra de 50 elementos selecionados de uma empresa. calcule então o tamanho do intervalo de classe (h). 2º Passo) Encontre o valor máximo e mínimo do conjunto de dados e calcule a Amplitude Total (A).

Distribuição de frequências que representa a idade dos funcionários de certa empresa (n=50) Aprofundando o conhecimento: Agora.Menor Valor A = 65 . APRESENTAÇÃO DE DADOS EM GRÁFICOS Gráficos ajudam a visualizar a distribuição das variáveis. sendo 4º Passos) Cálculo do Tamanho do intervalo de classe (h): Quanto aos limites das classes. Gráficos de Linhas/Dispersão Os gráficos de linhas e dispersão exibem uma série como um conjunto de pontos conectados por uma única linha. trataremos das formas de apresentar dados em gráficos. é preciso escolher o número de classes (K): Pela Regra de Sturges temos que: que n=50. Todo gráfico deve apresentar título e escala.UNOPAR. As escalas devem ser crescentes da esquerda para a direita e de baixo para cima. e leia o capítulo 2 da página 33 a 40.2º Passo) Determinar a Amplitude Total (A): A . procure pelo livro GARCIA. A Tabela 07 mostra um exemplo de uma tabela de distribuição de frequência para variável contínua. Estatística. portanto: . ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística (IBGE). Nesta etapa. sugiro que você abra a biblioteca digital. O título deve ser colocado abaixo do gráfico. Tabela 07. utilizaremos o seguinte critério a |— b (incluiremos nesta classe todos os elementos maiores ou iguais a a e menores do que b). São Paulo: Editora: Pearson Education do Brasil. 2009. R.18 = 47 3º Passo) Como os dados serão agrupados em classes. As linhas dos gráficos são usadas para representar grandes quantidades de . . seguindo as normas nacionais.Maior Valor .

Opinião dos consumidores sobre determinado produto (Gráfico de Colunas) No gráfico de barras. Para ilustrar o gráfico de colunas. originando assim a Figura 02 (gráfico de colunas com linhas auxiliares – grades e rótulos). .dados que ocorrem em um período de tempo contínuo. como apresentado na Figura 03. Figura 01: Gráfico de Linhas (Exemplo) Gráficos de Colunas / Barras No gráfico de colunas as barras são apresentadas na posição vertical. as barras são apresentadas na posição horizontal. Figura 02. É o gráfico que melhor representa a evolução conjunta de duas variáveis quantitativas. serão utilizados os dados apresentados na Tabela 05. A Figura 01 mostra um gráfico de linhas que contém três séries. sendo que X é considerada a variável independente e Y a variável dependente.

2008 (Gráfico se setores) Histograma . por meio de setores. Opinião dos consumidores sobre determinado produto (Gráfico de Barras) Gráficos de Setores É a representação gráfica de uma série estatística. A partir dos dados apresentados na Tabela 02. Vendas da Companhia Alfa – 2004 . Figura 04. em um círculo. foi obtido o gráfico de setores apresentado na Figura 04.Figura 03. É utilizado quando se pretende comparar cada valor da série com o total.

Figura 05.É o gráfico que melhor apresenta as frequências de uma variável quantitativa contínua agrupada em classes. agrupar os dados em classes e a partir desta desenhar um histograma. Quando os dados são contínuos e a amostra é grande é mais conveniente condensar os dados. organizar uma tabela de distribuição de frequências. As medidas de tendência central mais utilizadas são: média aritmética. de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. Para ilustrar o histograma serão utilizados os dados apresentados na Tabela 07. cujas bases se localizam sobre o eixo horizontal. formado por um conjunto de retângulos justapostos. obtendo-se assim a Figura 05. Média Aritmética ( ) . fica fácil perceber que a maior quantidade de funcionários tem idade entre 32 e 38 anos. Observar: O histograma contém as mesmas informações da tabela de distribuição de frequências. isto é. Histograma para idade de 50 funcionários de certa empresa O histograma dispõe de informações de modo que seja possível a visualização da forma de distribuição do conjunto de dados e também a percepção do valor central e da dispersão dos dados em torno deste valor central. São os cálculos estatísticos que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência (histograma). São representações que buscam a organização e sintetizarão de grupos de dados quantitativos. Pelos dados da Figura 04. nosso objetivo aqui é a determinação de medidas que ofereçam o posicionamento da distribuição dos valores de uma variável que desejamos analisar. WEB AULA 1 MEDIDAS DE TENDÊNCIA CENTRAL Como o próprio título sugere. O histograma é a representação gráfica de uma distribuição de frequência. moda e mediana.

Fn. Onde: xi são os valores da variável e n o número de valores. 1... x2. obtemos: . Solução: Temos cinco observações: n=5. então: Quando a amostra é muito grande e os dados são discretos.. Exemplo 1: Encontrar a média aritmética para um conjunto de observações: 5. é razoável organizar os dados em uma tabela de distribuição de frequências e trabalharmos com dados agrupados. determinar a média. 4. ponderados pelas respectivas frequências absolutas: F1. 6. 2. podem ocorrer valores repetidos. Assim: Exemplo (Cálculo da média sem intervalos de classe): Dada a seguinte distribuição de frequência.. Uma maneira prática para resolvermos este problema é a composição da seguinte tabela (lembre-se que ΣFi=n): Aplicando a equação acima.A medida de tendência central mais comum para um conjunto de dados é a média aritmética. F2..xn. A média aritmética amostral de um conjunto de dados é o quociente entre a soma dos valores do conjunto e o número total dos valores.. Quando os dados estiverem agrupados numa distribuição de freqüência. F3. x3. Nesse caso como vimos anteriormente (web aula 2).. usaremos a média aritmética dos valores x1..

Quando o número de elementos da série estatística for par. Por exemplo: Em {5. haverá coincidência da mediana com um dos elementos da série. 5. 10.50. 3. Dada a seguinte distribuição de frequência: Aplicando a equação anterior temos que: Mediana (Md) A mediana é o valor que ocupa a posição central do conjunto de dados ordenados (ROL). 5. onde xi é o ponto médio da classe. convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio. 65} a média = 20 e a mediana = 10 A média do segundo conjunto de valores é maior do que a do primeiro. a mediana será = (2+3) / 2. ou seja. e determinamos a média aritmética ponderada por meio da fórmula anterior. 0. 4. dados que têm um ou mais valores bem maiores ou menores que os demais. É o caso de conjuntos com dados discrepantes. 15} a média = 10 e a mediana = 10 Em {5. O valor que divide a esta série em duas partes iguais é igual a 9. depois de ordenada a amostra de n elementos dispostos segundo uma ordem (crescente ou decrescente): Quando o número de elementos (n) da série estatística for ímpar. 7. Para a sua determinação utiliza-se a seguinte regra. 6}. isto é. A mediana será sempre a média aritmética dos 2 elementos centrais da série de dados.Exemplo (Cálculo da média com intervalos de classe): Neste caso.Em algumas circunstâncias. a medida melhor descreve a tendência central dos dados. 13. por influência dos valores extremos. 10. ao passo que a mediana permanece a mesma. nunca haverá coincidência da mediana com um dos elementos da série de dados. 1. 7. 2. 6. Cálculo da mediana em dados agrupados e sem intervalos de classe (variável discreta): Neste caso. Por exemplo. 13. 15}. 1. é o bastante identificar a frequência acumulada imediatamente superior à metade da . Por exemplo. e esse valor será a mediana. 9. portanto está localizada na posição central. logo a mediana é 9. o conjunto de dados {0. e os demais 50% são maiores. 3. m = 2. 13. o conjunto de dados {2. Portanto. tal que 50% dos valores são menores que a mediana. 10. Neste caso existirá um único valor de posição central. a mediana no exemplo será a média aritmética do 5º e 6º termos da série.

soma das frequências. • Quando o somatório das frequências (n) for ímpar o valor mediano será o termo de ordem dado pela fórmula: Onde: n= nº. . portanto. Neste exemplo. logo a mediana (m) será a média entre os valores de ordem . Observe: será o xi correspondente à classe que contiver a ordem calculada. encontra-se o valor de xi correspondente a mediana. Assim. é par. total de elementos. n=11 é impar. a mediana =3. será o valor 3. a mediana corresponde à média: (4º elemento + 5º elemento) / 2 = (15 + 16) / 2 = 15. A mediana será aquele valor da variável (x) que corresponde a tal frequência acumulada. ou seja. logo a mediana (m) será o elemento de ordem .5 Cálculo da mediana em dados agrupados e com intervalos de classe (variável contínua): Devemos seguir os seguintes passos: . Por meio das frequências acumuladas. Exemplo (n = par): Dada a distribuição de frequência: Neste caso n=8. ou seja: . fi=frequência acumulada • Quando o somatório das frequências (n) for par a mediana será a média entre os elementos de ordem Exemplo (n = impar): Dada a distribuição de frequência: Neste caso.

não se preocupe se n é par ou ímpar. calcular a mediana. 4º Passo) Calculamos a Mediana pela seguinte fórmula: Onde: lMd = limite inferior da classe mediana. FAA= 17. FAA = é a frequência acumulada da classe anterior à classe mediana. 1º Passo: Calcula-se . 3º Passo: Aplica-se a fórmula: Neste caso: lMd = 55. n = 58. FMd = é a frequência da classe mediana. Logo: . como a variável é contínua. Como n=58. FMd = 18. h = é a amplitude do intervalo da classe mediana. h = 10. 2º Passo) Calculamos . Tal classe será a classe mediana (classe Md). 3º Passo) Marcamos a classe correspondente à frequência acumulada imediatamente superior à ∑fi/2 . Exemplo: Dada a distribuição amostral.1º Passo) Determinamos as frequências acumuladas (∑fi = n). temos que 2º Passo: Identifica-se a classe mediana (Md) pela frequência acumulada. Neste caso a classe mediana é a 3º. n = tamanho da amostra ou número de elementos.

9} apresenta duas modas: 4 e 7. pode haver dois ou mais valores de concentração. 7. de acordo com definição. 8.Moda (Mo) Dentre as principais medidas de posição. podemos afirmar que a moda. Há séries nas quais não exista valor modal.frequência da classe anterior à da classe modal d2 = frequência da classe modal . Essa classe mostra a área em que os dados estão concentrados. procurar o valor que mais se repete. Indica-se Mo=248 (moda) Valores Agrupados com intervalos de classe: A classe que apresenta a maior frequência é denominada classe modal. nas quais nenhum valor apareça mais vezes que outros. 2º Passo) Aplicar a fórmula: Onde: l = limite inferior da classe modal d1 = frequência da classe modal . Pela definição. 10. 6. neste caso. 4. É importante destacar a classe de maior frequência. Dizemos. isto é. a chamada classe modal.frequência da classe posterior à da classe modal h = amplitude da classe modal Exemplo: Determinar a moda para a seguinte distribuição de frequência: . 8. É o valor da amostra que mais se repete. ou seja. 4. 10. Por exemplo. 5. o conjunto de dados {3. 10. 7. 12} não apresenta moda. no conjunto de dados {7. então. 5. 4. Por exemplo. Por exemplo. destaca-se a Moda. Neste caso a série é bimodal. Assim. Distribuições Simples: Quando uma tabela de distribuição de frequência apresenta grande quantidade de dados. Em outros casos. que a série tem dois ou mais valores modais. 10. 8. A série é amodal. 7. é o valor dominante que está compreendido entre os limites da classe modal. 12} a moda é igual a 10. 3. 9. A Moda quando os dados não estão agrupados: A moda é facilmente reconhecida: basta. 11. Um dos métodos para determinação da moda é a aplicação da fórmula de CZUBER: 1º Passo) Identifique a classe modal (aquela que possuir maior frequência). o conjunto de dados {2. valor que ocorre com maior frequência. para a distribuição: A moda será 248 (maior frequência).

pois há menor diversificação entre cada um de seus valores e a média representativa. é mais homogêneo que o conjunto Z. Medidas de Dispersão Absoluta: Amplitude Total (A) É a diferença entre o maior e o menor valor observado no conjunto de dados. por sua vez. desvio-médio. já que todos os valores são iguais à média. FARBER. 160} 70. procure pelo livro: LARSON. ainda que consideradas como números que têm a faculdade de representar uma série de dados. conforme segue: Amplitude = Valor máximo — Valor mínimo Exemplo: . 71. Estatística Aplicada. d1 = 17-10=7. 70. 2ª Edição. portanto. 70} 72} Podemos observar que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70 Entretanto. concluímos então que o conjunto X apresenta DISPERSÃO NULA e que o conjunto Y apresenta uma DISPERSÃO MENOR que o conjunto Z. Y = {68. 69. 70. dos valores em torno da média..A seguir. trata-se da 3¿ classe 2 I. 70. Z = {5. MEDIDAS DE DISPERSÃO São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão. são apresentadas as principais medidas de dispersão da estatística: amplitude. Portanto. 15.1º Passo) Identifica-se a classe modal. R. não podem por si mesma destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto e. Aplica-se a fórmula dada acima: Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital. h = 1. São Paulo: Editora Pearson. Então. WEB AULA 2 MEDIDAS ESTATÍSTICAS Por causa da variabilidade as medidas de tendência central. é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z. B. não bastam para descrever um conjunto de dados. As medidas de tendência central são tanto mais descritivas de um conjunto de dados quanto menor for a variabilidade. desvio-padrão e variância. 120. quando apresentamos medidas de tendência central para descrever um conjunto de dados. 2008 e leia o capítulo 2 da página 47 a 57. devemos indicar também uma medida de variabilidade ou dispersão. d2 = 17-8=9.3. 2º Passo) Sabendo que: l = 2. O conjunto Y. 50. Consideremos os seguintes conjuntos de valores das variáveis X. Neste caso. Y e Z: X = {70.

A definição de variância populacional (σ2) é dada por: Observações: 1. a amplitude total é dada por: Amplitude = 38 — 10 = 28 Observação: A utilização da amplitude total como medida de dispersão é muito limitada.22. Isto é: Portanto. pela fórmula acima podemos perceber que o desvio em relação à média (di) é a diferença entre cada elemento de um conjunto de valores e a média aritmética. pois. σ2 indica variância populacional e lê-se sigma ao quadrado. Porém. x = média amostral. é extremamente importante na inferência estatística e em combinações de amostras. 2. 4. Variância populacional (σ2) e amostral (S2) A variância é uma medida que tem pouca utilidade como estatística descritiva.38.25. evitando-se assim que a soma fosse nula. Fi = frequência. Mas a soma de todos os desvios é igual a zero. é instável.12. Onde: n= número de elementos. não sendo afetada pela dispersão dos valores internos.33.Para a série: 10. sendo uma medida que depende apenas dos valores externos.20. 3. é interessante a análise dos desvios em torno da média. X= média da população (populacional) Fi = frequência N = tamanho da população Para o caso do cálculo da variância amostral (S2). Veja que os desvios foram considerados em módulo. Desvio-Médio (DM) Quando desejamos medir a dispersão dos dados em relação à média. é conveniente o uso da seguinte fórmula: . Isto é: O desvio médio (DM) é a média aritmética dos valores absolutos dos desvios tomados em relação à média.

precisamos do valor da média. • Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero). conforme vimos anteriormente na web aula 3.Onde: x = média amostral. o desvio padrão não se altera. se a unidade da variável for. Exemplo: Calcular o desvio-médio (DM). pois leva em consideração a totalidade dos valores da variável em estudo. extrair a raiz quadrada desse resultado. n = tamanho da amostra. Para se ter a unidade original. Dessa forma. Resolução: Primeiramente. dentre as quais destacamos: • Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável. metro (m) teremos como resultado metro ao quadrado (m2). que é a raiz quadrada da variância – o desvio padrão. nota-se que a é uma soma de quadrado. O desvio padrão possui algumas propriedades. Desvio Padrão populacional (σ) e amostral (S) O desvio padrão é a medida de dispersão mais geralmente empregada. necessita-se definir outra medida de dispersão. É um indicador de variabilidade bastante estável. por exemplo. o desvio padrão fica multiplicado (ou dividido) por essa constante. Observando-se a fórmula original para o cálculo da variância. em seguida. Assim temos: Resumindo: para o cálculo do desvio-padrão deve-se primeiramente determinar o valor da variância e. a variância (S2) e o desvio-padrão (S) da seguinte distribuição amostral. OBS. temos que: 1º) Cálculo do Desvio-Médio (DM) Para o cálculo do DM deverão ser abertas novas colunas. conforme segue: .: O desvio padrão tem a mesma dimensão de unidades dos valores da média.

06. Isto é. É dado por: . uma nova coluna deverá ser considerada na tabela anterior: 3º) Cálculo desvio-padrão Amostral (S) Como Resumindo: A distribuição possui média 8. seus valores estão em torno de 8.20. medido pelo desvio-padrão.2º) Cálculo da Variância Amostral (S2) Para calcularmos a variância amostral (S2). é preciso encontrar o valor de ∑di2Fi. Medida de Dispersão Relativa: Coeficiente de Variação (CV) Trata-se de uma medida relativa de dispersão útil para comparação em termos relativos do grau de dispersão em torno da média de séries distintas. e de 1. Para tanto.69.06 e seu grau de dispersão é de 1. medido pelo desvio-médio.

Resposta gabarito Amostra. Comentário do gabarito O número de funcionários de uma empresa trata-se de uma variável que só pode assumir apenas valores inteiros. Nota Excelente Uma parte ou subconjunto da população selecionada para análise denomina-se: Sua resposta Amostra.00.00. portanto. uma variável quantitativa discreta.00 com desvio-padrão de R$ 1200. S= desvio-padrão amostral X = média populacional. Resposta gabarito Quantitativa Discreta. Nota Questão 2 Excelente O número de funcionários de uma empresa é uma variável: Sua resposta Quantitativa Discreta. x = média amostral Exemplo: Numa empresa. que é selecionada para análise estatística (Estatística Descritiva). podemos concluir que nesta empresa os salários das mulheres apresentam maior dispersão relativa que os dos homens.Onde: σ = desvio-padrão populacional. Então: Logo.00 com desvio-padrão de R$ 1500. a amostra é uma parte ou subconjunto da população. Questão 1 . e os das mulheres é em média de R$ 3000. o salário médio dos homens é de R$ 4000. Comentário do gabarito Conforme vimos anteriormente.

e variaram de 3 a 51 defeitos.85 ~ 7(arredondar para o maior valor inteiro). 8. Resposta gabarito 21. 4. C = {1. Nota Questão 5 Excelente Assinale a alternativa que melhor apresenta gráfico usualmente empregado para representar a evolução conjunta de duas variáveis quantitativas. 9. 5. representada pela tabela abaixo. 4. em relação às afirmativas. 10}. 2. 8. B = {6. afirmamos que: I) A é unimodal. sendo que X é considerada a variável independente e Y a variável dependente. Os resultados obtidos foram tabulados em classes de frequências.85 %. 4. e a moda é 10. 4. A quantidade de defeitos contidas em cada produto foi contada.Questão 3 Nota Excelente Considerando a pesquisa de opinião dos consumidores de certo produto. h=7.3 = 48. determine a porcentagem de consumidores que preferem o produto “C”. 12}. Nota Não gerada Dados os conjuntos de valores: A = {1. Sua resposta Gráfico de Dispersão. número de classes (K): K= 1 + 3. Resposta gabarito Gráfico de Dispersão. 9. 9. e as modas são 4 e 9. 5. ou seja. Comentário do gabarito O gráfico que é usualmente empregado para representar a evolução conjunta de duas variáveis quantitativas. Sua resposta 7 Resposta gabarito 7 Comentário do gabarito Amplitude total (A)= 51 . 9. II) B é unimodal. h=48/7=6. é CORRETO afirmar que: Questão 1 . Em relação à moda. 11. Portanto. Então. sendo que o número de classes foi obtido segundo a regra de Sturges. 10. 3. Comentário do gabarito Cálculo da porcentagem de consumidores que preferem o produto C = (Frequência Relativa) *100%: (600/2745)*100 = 21. construídas conforme os procedimentos formais da estatística. 9. 8. 8.85 %. 10}. 1. 9. 5. 2. Calcule o tamanho do intervalo de cada classe (h).3*log (64) = 6.85 % Nota Questão 4 Excelente A gerência industrial de certa empresa coletou uma amostra formada 64 produtos produzidos. III) C é bimodal. Sua resposta 21. 4.96 ~ 7 classes (arredondar para o maior valor inteiro). sendo que X é considerada a variável independente e Y a variável dependente é o gráfico de dispersão. 9. 7. tamanho do intervalo das classes (h) é dado por: h=A/K. e a moda é 9. 8.

qual o valor da mediana: Questão 2 Sua resposta 21.Sua resposta Somente II e III são verdadeiras. foram calculados o rendimento médio (retomo esperado) e o risco. respectivamente. (-1%). nestes cinco meses. 5%. Com base. os rendimentos da bolsa de valores foram iguais a 4%.65%.85 Questão 4 Calcular a média para distribuição de frequência: Nota Não gerada Sua resposta 10.80 e 3. a receita média mensal do ano e o desvio-padrão amostral respectivamente são: Sua resposta 8. Nota Não gerada Durante cinco meses consecutivos. dado pelo desvio padrão amostral (s). Os resultados obtidos foram: Sua resposta Média = 2. Nota Não Questão 3 gerada Dada a distribuição de frequência.61 Questão 5 Nota Não gerada Dadas as receitas mensais de certa empresa. em US$ milhões.40% e desvio padrão = 3.66 . (-2%) e 6%.

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->