P. 1
slides de estat+¡stica - 2010

slides de estat+¡stica - 2010

|Views: 119|Likes:
Publicado porAlex Alcantara

More info:

Published by: Alex Alcantara on Jun 06, 2011
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PPT, PDF, TXT or read online from Scribd
See more
See less

05/12/2014

pdf

text

original

ESTATÍSTICA DESCRITIVA

Prof. MSc. Marcos Antônio Resende Miranda

1

1 - Introdução Estuda-se estatística para aplicar seus conceitos como auxílio nas tomadas de decisão diante de incertezas, justificando cientificamente as decisões. Os princípios estatísticos são utilizados em uma grande variedade de situações ± no governo, nos negócios e na indústria, bem como no âmbito das ciências sociais, biológicas e físicas.
2

Estatística é a ciência ou método científico que estuda os fenômenos multicausais, coletivos ou de massa e procura inferir as leis que os mesmos obedecem. Método estatístico é um processo para se obter, apresentar e analisar características ou valores numéricos para uma melhor tomada de decisão em situações de incerteza. Os passos da metodologia estatística são os seguintes:
3

de tal modo que estas sejam facilmente entendidas por quem as for usar na tomada de decisões. 4 . Coleta. Divulgação de relatório com as conclusões.     Definição cuidadosa do problema. resumo e apresentação das unidades de observação ou de seus valores numéricos. Análise dos resultados. Formulação de um plano para coleta das unidades de observação.

elaboração. tabulação. Descritiva: corresponde aos procedimentos relacionados com a coleta. análise. 5 . é aceita a divisão da estatística em dois grandes grupos: estatística descritiva indutiva. interpretação e apresentação dos dados.Em geral.

O objetivo da estatística descritiva é tornar as coisas mais fáceis de entender. 6 . inclui as técnicas que dizem respeito à sintetização e à descrição de dados numéricos. Tais métodos podem ser gráficos e envolvem a utilização de recursos computacionais. relatar e discutir.Isto é.

A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a população. Exemplos de utilização: Pesquisas na Educação.Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da população) e conclui sobre a população. Pesquisa de opinião pública. amostragem. inferência estatística. 7 . Pesquisa de Mercado. Utiliza técnicas como a teoria das probabilidades. Ensaios de medicamentos e em praticamente todo experimento.

Com maior freqüência utilizamos o estudo da amostra do que da população, não só por serem menos dispendiosas e consumirem menos tempo no processamento dos dados, mas também porque muitas vezes não dispomos de todos os elementos da população.

8

O esquema a seguir tente sintetizar as etapas de uma pesquisa estatística:

Fig. 1.1 ± Etapas de uma pesquisa estatística
9

Definições: População: coleção completa de todos os elementos (valores, pessoas, medidas,...) a serem estudados. Amostra: subcoleção de elementos extraídos da população. Censo: coleção de dados relativos a todos os elementos de uma população.
10

Parâmetro: medida numérica que descreve uma característica de uma população Estatística: medida numérica que descreve uma característica de uma amostra 11 .Amostragem: coleção de dados relativos a elementos de uma amostra.

Características: perfil sócio-econômico. População ou universo: todos os pais dos alunos. 12 .Exemplos: i) Deseja-se conhecer o perfil sócioeconômico dos pais dos alunos de uma escola.

em 2009. 13 . População ou universo: todos as residências que estavam ligadas a rede elétrica em Teófilo Otoni . Características: X = consumo anual de energia elétrica em MWh.ii) Deseja-se conhecer o consumo de energia elétrica em MWh nas residências da cidade de Teófilo Otoni no ano de 2009.

existia algum tipo de controle ambiental. em 2009. População ou universo: indústrias situadas no Estado de Minas Gerais em 2009.iii) Deseja-se saber se nas indústrias situadas no Estado de Minas Gerais. Característica: X = existência ou não de algum tipo de controle ambiental na indústria. 14 .

iv) Estudo sobre a precipitação pluviométrica na Região Sudeste no ano 2009. 15 . Característica: X = precipitação pluviométrica. População ou universo: área referente à Região Sudeste.

16 . as populações podem ser classificadas em finita ou infinita. dependendo do número de elementos que a compõe.Populações finitas e infinitas: Quanto ao número de elementos. Exemplos : i) População finita: empresas do Pólo Petroquímico de Camaçari. ii) População infinita: as pressões atmosféricas ocorridas nos diversos pontos do Continente em determinado momento.

e/ou o processo de investigação leva a destruição do elemento observado. como os universos são grandes. investigar todos os elementos populacionais para determinarmos a característica necessita muito tempo. como no caso de populações infinitas. estudar parte da população constitui-se um aspecto fundamental da Estatística (amostra).Em geral. e/ou o custo é elevado. ou. é impossível observar a totalidade da população. Assim. 17 .

tempo. ensaios destrutivos e populações infinitas tornam a amostragem preferível a um estudo completo (censo). onde todos os indivíduos da população têm a mesma chance de serem selecionados. Os principais tipos de amostragem utilizados são os probabilísticos. 18 .Amostragem O objetivo da amostragem é permitir fazer inferências sobre uma população após Inspeção de apenas parte dela. Fatores como custo.

Os planos de amostragem probabilística são delineados de tal modo que se conhece todas as combinações amostrais possíveis e suas probabilidades. podendo-se então determinar o erro amostral. Os métodos mais comuns de amostragem probabilística são: 19 .

 Amostragem estratificada: subdivide-se a população em. dois estratos (subpopulações) que compartilham a mesma característica e em seguida escolhe-se  20 .Amostragem aleatória simples: os elementos de uma população são escolhidos de tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar uma tabela de números aleatórios ou um programa de geração de números aleatórios. no mínimo.

uma amostra de cada.. Exemplo: homens e mulheres.  Amostragem por conglomerados: divide-se a população em conglomerados (áreas).. selecionam-se os outros. 803°. 403°.  Amostragem sistemática: escolhe-se um ponto de partida e então. 21 . 1203°. sistematicamente. Por exemplo: bairros. Indivíduos. Por exemplo: o 3°. em seguida sorteiam-se algumas áreas e analisamse todos os elementos dos conglomerados escolhidos..

22 .

23 .

24 .

25 .

Este tipo de amostragem não permite avaliar o erro amostral. 26 .Amostragens não probabilísticas são utilizadas quando a população em estudo é muito pequena ou de difícil obtenção. Neste caso a análise de uma amostra poderia causar distorções. EX: doença rara. Uma pessoa familiarizada com a população pode indicar melhor as unidades amostrais.

As características ou variáveis podem ser divididas em dois tipos: qualitativas e quantitativas. 27 .Tipos de Variáveis A característica que nos interessa analisar recebe o nome de variável.

) QUANTITATIVA  CONTÍNUA (PESO.. NÚMERO DE CARROS. ALTURA... GRAU DE INSTRUÇÃO. COR DOS OLHOS.)  DISCRETA (NÚMERO DE FILHOS...)  ORDINAL (CLASSE SOCIAL..) 28 .QUALITATIVA  NOMINAL (SEXO...

tamanho da família. estado civil. Exemplos: sexo. grau de escolaridade. 29 . etc. etc.quando o resultado da observação é um número. peso.Variáveis qualitativas . decorrente de um processo de mensuração ou contagem. Exemplos: número de filhos. Variáveis quantitativas . salário mensal.quando o resultado da observação é apresentado na forma de qualidade ou atributo. idade. altura.

1.Para resumir as informações levantadas durante uma pesquisa usaremos a técnica e a representação mais apropriada.2 ± Natureza dos dados . Natureza dos Dados Variáveis Quantitativas Qualitativas Discreta Contínua Atributos / categorias Contagens Medidas Ex: grau de escolaridade Ex: número de habitantes de uma cidade Ex: renda per capita de uma cidade 30 Fig. a depender do tipo de variável que estamos analisando.

a fim de auxiliar o pesquisador na análise e facilitar a compreensão das conclusões apresentadas ao leitor. Uma tabela possui elementos essenciais. há a necessidade de dispor os dados e os resultados obtidos a partir deles em uma forma ordenada e resumida. Os dados e os resultados são então apresentados na forma de tabelas.Apresentação Gráfica de Dados Após a apuração. tais como: 31 .

onde se especifica o conteúdo de cada coluna.  32 . É colocado no fim da tabela.  Cabeçalho ± é a parte superior da tabela.  Coluna indicadora ± é a parte da tabela em que se especifica o conteúdo de cada linha. Deve ser colocado na parte superior da tabela.  Corpo da tabela ± é o conjunto de linhas e colunas onde se encontram as informações sobre o fato observado.  Fonte ± é a indicação da entidade responsável pelo fornecimento ou elaboração dos dados.Título ± é obrigatório.

1: Ranking das torcidas no futebol brasileiro Clubes A B C D E F G H I Porcentagem de torcedores (%) 15 11 7 6 5 4 4 3 2 33 Fonte: Rede Globo.Tab. 06 de jan. 1. de 2004 .

os gráficos dão. 34 . visão de tendências e ajudam a interpretar um fenômeno. Desde que não haja necessidade de grande precisão.Os dados estatísticos. melhor do que as tabelas. apresentados em tabelas. também podem ser expostos em gráficos.

8. conforme representado na Fig. 35 . gráficos e medidas podem ser utilizados para descrever ou explorar um conjunto de dados. geográficas e categóricas. 1. ou comparar dois ou mais conjuntos. É mais comum a apresentação das barras em posição vertical.  Gráfico de Barras: usado para apresentar séries cronológicas.Tabelas.

conforme representado na Fig.No entanto. 1. principalmente nos casos em que essas categorias têm nomes muito longos.9. as barras em posição horizontal facilitam a identificação das categorias. 36 .  Gráfico de Barras Vertical: facilidade de identificação das categorias.

de 2004 Fig.9 ± Gráfico de barras vertical 37 . 1. 1.8 ± Gráfico de barras Fonte: Rede Globo.Ranking das torcidas I H G l bes F E D C B A 0 5 10 15 20 Ranking de torcedores 16 14 12 10 8 6 4 2 0 orcentage detorcedores (% A B C E C bes l F G I orcentage de torcedores (% Fonte: não identificada Fig. 06 de jan.

conforme representado pela Fig.11. 1. 38 . Gráfico de Setores: usado para comparar proporções. conforme representado pela Fig.10.  Gráfico de Linhas: usado para apresentar séries cronológicas. 1.

12. 1.9 2 .Consumo de refrigerantes 8% 10% 38% Os br a s i le i r o s d e f ér i a s n o e xt e r i o r Milhõe s d e via ja n t e 5 4 3 2 1 0 1 2 3 An o 4 5 6 4. conforme representado na Fig. 1. 39 . lado a lado.9 Coca-Cola Guaraná Antártica Fanta Sprite Outros 26% 18% Fonte: não identificada Fig. para melhor estabelecer a comparação de um fenômeno.11 ± Gráfico de linhas Gráficos Comparativos: são desenhados dois gráficos. 14 de jan.10 ± Gráfico de setor Fonte: Revista Veja.9 2 .3 1 .7 1 . 1. de 2004 Fig.2 2 .

00% 50. 1.Com ao menos 1/3 do corpo docente com título de mestre ou doutor 3 ± Têm menos de três cursos de pós-graduação recomendados pela Capes Situação das Instituições Fonte: Folha de São Paulo.As universidades e o cumprimento da LDB 100.00% Porcentagem 60. 2 .00% 1 2 3 Privadas Públicas Total Situações das Instituições: 1 ± Com ao menos 1/3 do corpo docente trabalhando em regime integral.12 ± Gráfico comparativo 40 . 12 de jan.00% 10. de 2004 Fig.00% 30.00% 90.00% 70.00% 20.00% 80.00% 0.00% 40.

a) Cada cigarro Camel tem 16.359 pés. Identifique cada número como discreto ou contínuo. 1.13 mg de Alcatrão. c) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de um serviço de informação on-line. b) O altímetro de um avião da Varig indica uma altitude de 21.Exercícios. 41 .

 e) De 1000 consumidores pesquisados.d) O tempo total gasto anualmente por um motorista de táxi de Nova York ao dar passagem a pedestres é de 2367 segundos.  f) Apresente dois exemplos de dados discretos ou contínuos de sua empresa / pesquisa. 42 . 930 reconheceram a marca da ³CocaCola´.

devendo contactar por telefone 1500 consumidores. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike.2. Por que razão é incorreta a utilização de listas telefônicas como população para fornecer a amostra? 43 .

44 . Identifique o tipo de amostragem utilizado: a) Um psicólogo de uma Universidade seleciona 12 homens e 12 mulheres de cada uma das quatro turmas de inglês. Um relatório patrocinado pela Florida Citrus Comission concluiu que os níveis de colesterol podem ser reduzidos mediante ingestão de produtos cítricos.3. Por que razão a conclusão poderia ser suspeita? 4.

mistura-se e extrai 3 nomes. 45 . d) A empresa Sony seleciona cada 200º CD de sua linha de produção e faz um teste de qualidade rigoroso. c) Um pesquisador médico da USP entrevista todos os portadores de leucemia em cada um dos 20 hospitais selecionados aleatoriamente.b) Um cabo eleitoral escreve o nome de cada vereador da cidade. em cartões separados.

3 para representar a escola em um evento na cidade. 46 . f) A supervisora escolhe dentre os 28 professores.e) Um professor seleciona 15% de mulheres e 15% de homens de uma turma para responder a uma pergunta.

12 elementos da amostra foram retirados do primeiro estrato. Qual é o número de elementos da amostra? 47 . com tamanhos.5. Ao se realizar uma amostragem estratificada proporcional. Uma população se encontra dividida em três estratos. A = 80. B = 120 e C = 60. respectivamente.

a) Essa amostra será representativa da população ou poderá apresentar algum vício? b) Que tipo de amostragem foram usados no procedimento? Justifique. Uma amostragem entre os moradores de uma cidade é realizada da seguinte forma: em cada bairro. de cada quarteirão. 48 . são sorteadas cinco residências.6. sorteia-se um certo número de quarteirões proporcional à área do bairro. cujos moradores são entrevistados.

8. durante uma determinada noite. Discuta sobre o planejamento de um experimento enfatizando a importância dos métodos de boa amostragem. 49 . (ENEM/2006) Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns canais de televisão. entre 20h e 21h.7. Os resultados obtidos estão representados no gráfico de barras abaixo.

Nº de residências ligadas em um determinado canal de TV. I) O número de residências atingidas nessa pesquisa foi aproximadamente de: a) 100 b) 135 c) 150 d) 200 e) 220 50 . 1.Nº de residências 100 80 60 40 20 0 A B C D nenhum Fig. entre 20h e 21h.13 . durante uma noite.

II) A porcentagem de entrevistados que declararam estar assistindo ao canal B é aproximadamente: a) 15% b) 20% c) 22% d) 27% e) 30% 51 .

O quadro abaixo apresenta o número de novos casos de AIDS notificados anualmente no Brasil no período considerado: 20.000 1991 1992 1993 1994 1995 1996 1997 Fig.Número de novos casos de AIDS notificados anualmente no Brasil 52 .14 .000 16.000 14.000 10.9. 1.000 12.000 18.

e)o número máximo de aidéticos ocorreu em 1996. 53 . c)a maior taxa de variação no número de aidéticos ocorreu em 1996. no período considerado: a)a partir de 1997.As informações contidas no gráfico permitem concluir corretamente que. d)a maior taxa de variação no número de aidéticos ocorreu em 1992. b)o número aproximado de aidéticos no país. era de 112.000. em 1997. certamente caiu o número de novos casos de aidéticos.

A título de ilustração. relativo ao tempo de parada(em minutos) de uma máquina para manutenção (Tab. considere o exemplo a seguir.1 ± Introdução Ao estudarmos grandes conjuntos de dados. 54 .2. REPRESENTAÇÃO GRÁFICA E DISTRIBUIÇÃO DE FREQÜÊNCIA 2. 2. construindo uma tabela de freqüências. é conveniente organizá-los e resumi-los.1). de dados brutos. A construção de uma distribuição de freqüência consiste na elaboração de classes a partir de intervalos. fixando um número adequado de classes.

2.1 .Tab.Tempo de parada (em minutos) de uma máquina para manutenção 7 8 9 5 4 8 6 9 3 5 3 7 8 8 10 9 4 3 1 7 8 9 7 7 9 8 9 10 8 3 7 8 5 7 9 3 7 8 9 1 55 .

Tab.O primeiro procedimento a ser tomado para a elaboração de uma distribuição de freqüências de uma variável contínua consiste na ordenação dos dados (rol).2 . 2.Tempo de parada (em minutos) de uma máquina para manutenção 1 1 3 3 3 3 3 4 4 5 5 5 6 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 10 10 56 . 2.2). para permitir uma melhor manipulação (Tab.

a precisão de medida é (x = 1. mas carregam alguma inexatidão devido à precisão de medida. mas sim uma nota que pode estar acontecendo em qualquer ponto entre 4. um valor de 5 não representa necessariamente uma nota de exatamente 5. No exemplo dos tempos de parada. Assim.5. Deve-se atentar que os valores presentes no conjunto de dados não são exatos.5 e 5. 57 2.A precisão de medida corresponde ao menor valor detectável pelo instrumento ou procedimento de medida empregado.2 ± Distribuição de Freqüências .

Em geral.Amplitude de Classe: consiste na diferença entre o limite superior e o limite inferior de uma classe em uma distribuição de freqüência.A elaboração de uma distribuição de freqüência para variáveis contínuas requer a apresentação de alguns conceitos: 1 ± Amplitude: corresponde à diferença entre o maior e o menor valor de um conjunto de dados. é simbolizada por ³A´. 58 . Será aqui simbolizada por ³c´. 2 .

Se esse número for escasso. É importante que a distribuição conte com um número adequado de classes. Se. forem utilizadas muitas classes. Passo 1 ± Escolhe-se um número de classes k. 59 .A seguir. haverá algumas com freqüência nula ou muito pequena. por outro lado. apresentando uma distribuição irregular e prejudicial à interpretação do fenômeno. temos o algoritmo para obtenção de uma distribuição de freqüência relativa à uma variável contínua. os dados originais ficarão tão comprimidos que pouca informação poderá ser extraída desta tabela.

para n > 25. onde n é o tamanho da amostra.58 $ 7 60 . (2) Fórmula de Sturges: k = 1 + 3.k! n Para determinar o número de classes há diversos métodos. Veremos dois deles: (1) k = 5. para n e 25 e k = ¥n .3 log 49 = 6. Ex: Se n = 49 teríamos: k=7 k = 1 + 3.3 log n.

e não somente de regras muitas vezes arbitrárias e pouco flexíveis.Mesmo tendo outros critérios de determinação do número de classes. sobretudo da natureza dos dados e da unidade de medida em que eles se encontram. 61 . Para facilitar a análise é conveniente que se mantenham os intervalos de classe sempre constantes. Passo 2 ± Calcula-se a amplitude total A dos dados: A = MVO ± mvo onde MVO: maior valor observado e mvo: menor valor observado. o que se deve ter em mente é que a escolha dependerá.

através de: fazendo o arredondamento igual ao número de casas decimais dos dados. c  k x Passo 4 ± O limite inferior LI1 da 1ª classe é obtido por: LI1 = mvo .  c  x k Passo 3 ± Calcula-se a amplitude de classe c.(x/2 62 .

sendo que LS1 = LI2 e assim.O limite superior LS1 da 1ª classe é obtido por: LS1 = LI1 + c. sendo o limite superior da primeira classe o inferior da segunda. são contados quantos dados estão em cada classe (freqüências absolutas de cada classe). Passo 6 ± Construídas as classes.Passo 5 . 63 . sucessivamente ± soma-se ao valor do limite inferior da primeira classe a amplitude de classe e obtém-se o limite superior.

tendo como resultado uma porcentagem 64 . Trata-se.São calculadas as freqüências relativas e percentuais de cada classe. de um número relativo. Passo 7 . em relação ao número total de observações. Obs: a freqüência relativa (fr) representa a proporção de observações de um valor individual ou de uma classe.Obs: a freqüência absoluta (fa) é o número de repetições de um valor individual ou de uma classe de valores da variável. portanto. Obs: a freqüência percentual (fp) é o produto da freqüência relativa por 100.

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->