ESTATÍSTICA DESCRITIVA

Prof. MSc. Marcos Antônio Resende Miranda

1

1 - Introdução Estuda-se estatística para aplicar seus conceitos como auxílio nas tomadas de decisão diante de incertezas, justificando cientificamente as decisões. Os princípios estatísticos são utilizados em uma grande variedade de situações ± no governo, nos negócios e na indústria, bem como no âmbito das ciências sociais, biológicas e físicas.
2

Estatística é a ciência ou método científico que estuda os fenômenos multicausais, coletivos ou de massa e procura inferir as leis que os mesmos obedecem. Método estatístico é um processo para se obter, apresentar e analisar características ou valores numéricos para uma melhor tomada de decisão em situações de incerteza. Os passos da metodologia estatística são os seguintes:
3

de tal modo que estas sejam facilmente entendidas por quem as for usar na tomada de decisões. 4 . Formulação de um plano para coleta das unidades de observação. Coleta.     Definição cuidadosa do problema. Divulgação de relatório com as conclusões. Análise dos resultados. resumo e apresentação das unidades de observação ou de seus valores numéricos.

é aceita a divisão da estatística em dois grandes grupos: estatística descritiva indutiva. tabulação. Descritiva: corresponde aos procedimentos relacionados com a coleta. elaboração. 5 . análise. interpretação e apresentação dos dados.Em geral.

relatar e discutir.Isto é. O objetivo da estatística descritiva é tornar as coisas mais fáceis de entender. inclui as técnicas que dizem respeito à sintetização e à descrição de dados numéricos. Tais métodos podem ser gráficos e envolvem a utilização de recursos computacionais. 6 .

Pesquisa de opinião pública.Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da população) e conclui sobre a população. 7 . inferência estatística. A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a população. Exemplos de utilização: Pesquisas na Educação. Utiliza técnicas como a teoria das probabilidades. Pesquisa de Mercado. amostragem. Ensaios de medicamentos e em praticamente todo experimento.

Com maior freqüência utilizamos o estudo da amostra do que da população, não só por serem menos dispendiosas e consumirem menos tempo no processamento dos dados, mas também porque muitas vezes não dispomos de todos os elementos da população.

8

O esquema a seguir tente sintetizar as etapas de uma pesquisa estatística:

Fig. 1.1 ± Etapas de uma pesquisa estatística
9

Definições: População: coleção completa de todos os elementos (valores, pessoas, medidas,...) a serem estudados. Amostra: subcoleção de elementos extraídos da população. Censo: coleção de dados relativos a todos os elementos de uma população.
10

Amostragem: coleção de dados relativos a elementos de uma amostra. Parâmetro: medida numérica que descreve uma característica de uma população Estatística: medida numérica que descreve uma característica de uma amostra 11 .

Exemplos: i) Deseja-se conhecer o perfil sócioeconômico dos pais dos alunos de uma escola. Características: perfil sócio-econômico. 12 . População ou universo: todos os pais dos alunos.

em 2009. População ou universo: todos as residências que estavam ligadas a rede elétrica em Teófilo Otoni .ii) Deseja-se conhecer o consumo de energia elétrica em MWh nas residências da cidade de Teófilo Otoni no ano de 2009. Características: X = consumo anual de energia elétrica em MWh. 13 .

existia algum tipo de controle ambiental. 14 . Característica: X = existência ou não de algum tipo de controle ambiental na indústria. em 2009. População ou universo: indústrias situadas no Estado de Minas Gerais em 2009.iii) Deseja-se saber se nas indústrias situadas no Estado de Minas Gerais.

População ou universo: área referente à Região Sudeste. 15 . Característica: X = precipitação pluviométrica.iv) Estudo sobre a precipitação pluviométrica na Região Sudeste no ano 2009.

Exemplos : i) População finita: empresas do Pólo Petroquímico de Camaçari. ii) População infinita: as pressões atmosféricas ocorridas nos diversos pontos do Continente em determinado momento.Populações finitas e infinitas: Quanto ao número de elementos. dependendo do número de elementos que a compõe. 16 . as populações podem ser classificadas em finita ou infinita.

estudar parte da população constitui-se um aspecto fundamental da Estatística (amostra). Assim. e/ou o processo de investigação leva a destruição do elemento observado.Em geral. 17 . é impossível observar a totalidade da população. como no caso de populações infinitas. e/ou o custo é elevado. como os universos são grandes. ou. investigar todos os elementos populacionais para determinarmos a característica necessita muito tempo.

Os principais tipos de amostragem utilizados são os probabilísticos. onde todos os indivíduos da população têm a mesma chance de serem selecionados. Fatores como custo. 18 .Amostragem O objetivo da amostragem é permitir fazer inferências sobre uma população após Inspeção de apenas parte dela. tempo. ensaios destrutivos e populações infinitas tornam a amostragem preferível a um estudo completo (censo).

Os métodos mais comuns de amostragem probabilística são: 19 . podendo-se então determinar o erro amostral.Os planos de amostragem probabilística são delineados de tal modo que se conhece todas as combinações amostrais possíveis e suas probabilidades.

 Amostragem estratificada: subdivide-se a população em.Amostragem aleatória simples: os elementos de uma população são escolhidos de tal forma que todos tenham a mesma chance de serem escolhidos. dois estratos (subpopulações) que compartilham a mesma característica e em seguida escolhe-se  20 . no mínimo. Pode-se utilizar uma tabela de números aleatórios ou um programa de geração de números aleatórios.

403°.. 21 .. selecionam-se os outros.  Amostragem sistemática: escolhe-se um ponto de partida e então.. sistematicamente. Por exemplo: o 3°. 1203°. Por exemplo: bairros.uma amostra de cada.  Amostragem por conglomerados: divide-se a população em conglomerados (áreas). Exemplo: homens e mulheres. 803°. Indivíduos. em seguida sorteiam-se algumas áreas e analisamse todos os elementos dos conglomerados escolhidos.

22 .

23 .

24 .

25 .

Uma pessoa familiarizada com a população pode indicar melhor as unidades amostrais. 26 . Neste caso a análise de uma amostra poderia causar distorções. Este tipo de amostragem não permite avaliar o erro amostral.Amostragens não probabilísticas são utilizadas quando a população em estudo é muito pequena ou de difícil obtenção. EX: doença rara.

As características ou variáveis podem ser divididas em dois tipos: qualitativas e quantitativas. 27 .Tipos de Variáveis A característica que nos interessa analisar recebe o nome de variável.

.... GRAU DE INSTRUÇÃO.QUALITATIVA  NOMINAL (SEXO.. NÚMERO DE CARROS. ALTURA.) QUANTITATIVA  CONTÍNUA (PESO.)  ORDINAL (CLASSE SOCIAL. COR DOS OLHOS..)  DISCRETA (NÚMERO DE FILHOS...) 28 .

Exemplos: número de filhos. idade. estado civil. etc.Variáveis qualitativas .quando o resultado da observação é um número. tamanho da família. Variáveis quantitativas . etc. altura. Exemplos: sexo. grau de escolaridade. salário mensal. decorrente de um processo de mensuração ou contagem. 29 .quando o resultado da observação é apresentado na forma de qualidade ou atributo. peso.

Para resumir as informações levantadas durante uma pesquisa usaremos a técnica e a representação mais apropriada.2 ± Natureza dos dados . a depender do tipo de variável que estamos analisando. 1. Natureza dos Dados Variáveis Quantitativas Qualitativas Discreta Contínua Atributos / categorias Contagens Medidas Ex: grau de escolaridade Ex: número de habitantes de uma cidade Ex: renda per capita de uma cidade 30 Fig.

Os dados e os resultados são então apresentados na forma de tabelas. a fim de auxiliar o pesquisador na análise e facilitar a compreensão das conclusões apresentadas ao leitor. tais como: 31 . Uma tabela possui elementos essenciais.Apresentação Gráfica de Dados Após a apuração. há a necessidade de dispor os dados e os resultados obtidos a partir deles em uma forma ordenada e resumida.

 32 .  Corpo da tabela ± é o conjunto de linhas e colunas onde se encontram as informações sobre o fato observado.  Coluna indicadora ± é a parte da tabela em que se especifica o conteúdo de cada linha. É colocado no fim da tabela.  Cabeçalho ± é a parte superior da tabela.  Fonte ± é a indicação da entidade responsável pelo fornecimento ou elaboração dos dados. onde se especifica o conteúdo de cada coluna.Título ± é obrigatório. Deve ser colocado na parte superior da tabela.

Tab. 06 de jan. de 2004 .1: Ranking das torcidas no futebol brasileiro Clubes A B C D E F G H I Porcentagem de torcedores (%) 15 11 7 6 5 4 4 3 2 33 Fonte: Rede Globo. 1.

Desde que não haja necessidade de grande precisão. apresentados em tabelas. também podem ser expostos em gráficos.Os dados estatísticos. os gráficos dão. melhor do que as tabelas. visão de tendências e ajudam a interpretar um fenômeno. 34 .

geográficas e categóricas.Tabelas. conforme representado na Fig. ou comparar dois ou mais conjuntos.  Gráfico de Barras: usado para apresentar séries cronológicas.8. gráficos e medidas podem ser utilizados para descrever ou explorar um conjunto de dados. É mais comum a apresentação das barras em posição vertical. 1. 35 .

as barras em posição horizontal facilitam a identificação das categorias.9.No entanto. principalmente nos casos em que essas categorias têm nomes muito longos. 36 . conforme representado na Fig.  Gráfico de Barras Vertical: facilidade de identificação das categorias. 1.

8 ± Gráfico de barras Fonte: Rede Globo. 1.9 ± Gráfico de barras vertical 37 .Ranking das torcidas I H G l bes F E D C B A 0 5 10 15 20 Ranking de torcedores 16 14 12 10 8 6 4 2 0 orcentage detorcedores (% A B C E C bes l F G I orcentage de torcedores (% Fonte: não identificada Fig. 06 de jan. 1. de 2004 Fig.

1. 1. conforme representado pela Fig. 38 . conforme representado pela Fig.11.10. Gráfico de Setores: usado para comparar proporções.  Gráfico de Linhas: usado para apresentar séries cronológicas.

11 ± Gráfico de linhas Gráficos Comparativos: são desenhados dois gráficos.9 2 .2 2 .Consumo de refrigerantes 8% 10% 38% Os br a s i le i r o s d e f ér i a s n o e xt e r i o r Milhõe s d e via ja n t e 5 4 3 2 1 0 1 2 3 An o 4 5 6 4.10 ± Gráfico de setor Fonte: Revista Veja. 1. 14 de jan. lado a lado. para melhor estabelecer a comparação de um fenômeno. 1.3 1 .9 Coca-Cola Guaraná Antártica Fanta Sprite Outros 26% 18% Fonte: não identificada Fig.12.7 1 . de 2004 Fig. 39 . 1. conforme representado na Fig.9 2 .

00% Porcentagem 60.As universidades e o cumprimento da LDB 100.Com ao menos 1/3 do corpo docente com título de mestre ou doutor 3 ± Têm menos de três cursos de pós-graduação recomendados pela Capes Situação das Instituições Fonte: Folha de São Paulo. de 2004 Fig.00% 0.12 ± Gráfico comparativo 40 . 12 de jan.00% 30.00% 1 2 3 Privadas Públicas Total Situações das Instituições: 1 ± Com ao menos 1/3 do corpo docente trabalhando em regime integral.00% 90.00% 20.00% 70. 1.00% 40. 2 .00% 80.00% 50.00% 10.

1. a) Cada cigarro Camel tem 16. c) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de um serviço de informação on-line.359 pés. b) O altímetro de um avião da Varig indica uma altitude de 21.Exercícios. 41 .13 mg de Alcatrão. Identifique cada número como discreto ou contínuo.

42 .  f) Apresente dois exemplos de dados discretos ou contínuos de sua empresa / pesquisa.d) O tempo total gasto anualmente por um motorista de táxi de Nova York ao dar passagem a pedestres é de 2367 segundos. 930 reconheceram a marca da ³CocaCola´.  e) De 1000 consumidores pesquisados.

2. Por que razão é incorreta a utilização de listas telefônicas como população para fornecer a amostra? 43 . Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike. devendo contactar por telefone 1500 consumidores.

Identifique o tipo de amostragem utilizado: a) Um psicólogo de uma Universidade seleciona 12 homens e 12 mulheres de cada uma das quatro turmas de inglês. 44 .3. Um relatório patrocinado pela Florida Citrus Comission concluiu que os níveis de colesterol podem ser reduzidos mediante ingestão de produtos cítricos. Por que razão a conclusão poderia ser suspeita? 4.

mistura-se e extrai 3 nomes. d) A empresa Sony seleciona cada 200º CD de sua linha de produção e faz um teste de qualidade rigoroso. 45 . c) Um pesquisador médico da USP entrevista todos os portadores de leucemia em cada um dos 20 hospitais selecionados aleatoriamente. em cartões separados.b) Um cabo eleitoral escreve o nome de cada vereador da cidade.

3 para representar a escola em um evento na cidade.e) Um professor seleciona 15% de mulheres e 15% de homens de uma turma para responder a uma pergunta. f) A supervisora escolhe dentre os 28 professores. 46 .

Qual é o número de elementos da amostra? 47 . com tamanhos. A = 80. B = 120 e C = 60.5. 12 elementos da amostra foram retirados do primeiro estrato. respectivamente. Uma população se encontra dividida em três estratos. Ao se realizar uma amostragem estratificada proporcional.

Uma amostragem entre os moradores de uma cidade é realizada da seguinte forma: em cada bairro. sorteia-se um certo número de quarteirões proporcional à área do bairro.6. de cada quarteirão. cujos moradores são entrevistados. são sorteadas cinco residências. 48 . a) Essa amostra será representativa da população ou poderá apresentar algum vício? b) Que tipo de amostragem foram usados no procedimento? Justifique.

Discuta sobre o planejamento de um experimento enfatizando a importância dos métodos de boa amostragem. 49 . (ENEM/2006) Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns canais de televisão. 8. entre 20h e 21h. Os resultados obtidos estão representados no gráfico de barras abaixo. durante uma determinada noite.7.

I) O número de residências atingidas nessa pesquisa foi aproximadamente de: a) 100 b) 135 c) 150 d) 200 e) 220 50 . durante uma noite. entre 20h e 21h.13 .Nº de residências 100 80 60 40 20 0 A B C D nenhum Fig.Nº de residências ligadas em um determinado canal de TV. 1.

II) A porcentagem de entrevistados que declararam estar assistindo ao canal B é aproximadamente: a) 15% b) 20% c) 22% d) 27% e) 30% 51 .

O quadro abaixo apresenta o número de novos casos de AIDS notificados anualmente no Brasil no período considerado: 20. 1.000 1991 1992 1993 1994 1995 1996 1997 Fig.000 10.9.000 12.14 .000 14.000 16.000 18.Número de novos casos de AIDS notificados anualmente no Brasil 52 .

d)a maior taxa de variação no número de aidéticos ocorreu em 1992. em 1997.As informações contidas no gráfico permitem concluir corretamente que. b)o número aproximado de aidéticos no país. era de 112. e)o número máximo de aidéticos ocorreu em 1996. no período considerado: a)a partir de 1997. c)a maior taxa de variação no número de aidéticos ocorreu em 1996. certamente caiu o número de novos casos de aidéticos. 53 .000.

1). 54 . construindo uma tabela de freqüências. fixando um número adequado de classes. é conveniente organizá-los e resumi-los. REPRESENTAÇÃO GRÁFICA E DISTRIBUIÇÃO DE FREQÜÊNCIA 2. relativo ao tempo de parada(em minutos) de uma máquina para manutenção (Tab.1 ± Introdução Ao estudarmos grandes conjuntos de dados. A título de ilustração.2. 2. de dados brutos. A construção de uma distribuição de freqüência consiste na elaboração de classes a partir de intervalos. considere o exemplo a seguir.

2.Tempo de parada (em minutos) de uma máquina para manutenção 7 8 9 5 4 8 6 9 3 5 3 7 8 8 10 9 4 3 1 7 8 9 7 7 9 8 9 10 8 3 7 8 5 7 9 3 7 8 9 1 55 .Tab.1 .

O primeiro procedimento a ser tomado para a elaboração de uma distribuição de freqüências de uma variável contínua consiste na ordenação dos dados (rol). Tab. 2.2). 2.2 . para permitir uma melhor manipulação (Tab.Tempo de parada (em minutos) de uma máquina para manutenção 1 1 3 3 3 3 3 4 4 5 5 5 6 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 10 10 56 .

mas carregam alguma inexatidão devido à precisão de medida. No exemplo dos tempos de parada.5. Assim. a precisão de medida é (x = 1.A precisão de medida corresponde ao menor valor detectável pelo instrumento ou procedimento de medida empregado. Deve-se atentar que os valores presentes no conjunto de dados não são exatos. 57 2. um valor de 5 não representa necessariamente uma nota de exatamente 5.2 ± Distribuição de Freqüências .5 e 5. mas sim uma nota que pode estar acontecendo em qualquer ponto entre 4.

Amplitude de Classe: consiste na diferença entre o limite superior e o limite inferior de uma classe em uma distribuição de freqüência. 2 . é simbolizada por ³A´. Será aqui simbolizada por ³c´. 58 .A elaboração de uma distribuição de freqüência para variáveis contínuas requer a apresentação de alguns conceitos: 1 ± Amplitude: corresponde à diferença entre o maior e o menor valor de um conjunto de dados. Em geral.

haverá algumas com freqüência nula ou muito pequena. forem utilizadas muitas classes. Se. apresentando uma distribuição irregular e prejudicial à interpretação do fenômeno. temos o algoritmo para obtenção de uma distribuição de freqüência relativa à uma variável contínua. Se esse número for escasso. 59 .A seguir. os dados originais ficarão tão comprimidos que pouca informação poderá ser extraída desta tabela. por outro lado. É importante que a distribuição conte com um número adequado de classes. Passo 1 ± Escolhe-se um número de classes k.

Veremos dois deles: (1) k = 5.3 log 49 = 6. para n > 25. (2) Fórmula de Sturges: k = 1 + 3. para n e 25 e k = ¥n . onde n é o tamanho da amostra.k! n Para determinar o número de classes há diversos métodos. Ex: Se n = 49 teríamos: k=7 k = 1 + 3.3 log n.58 $ 7 60 .

e não somente de regras muitas vezes arbitrárias e pouco flexíveis.Mesmo tendo outros critérios de determinação do número de classes. o que se deve ter em mente é que a escolha dependerá. 61 . Passo 2 ± Calcula-se a amplitude total A dos dados: A = MVO ± mvo onde MVO: maior valor observado e mvo: menor valor observado. sobretudo da natureza dos dados e da unidade de medida em que eles se encontram. Para facilitar a análise é conveniente que se mantenham os intervalos de classe sempre constantes.

c  k x Passo 4 ± O limite inferior LI1 da 1ª classe é obtido por: LI1 = mvo . através de: fazendo o arredondamento igual ao número de casas decimais dos dados.  c  x k Passo 3 ± Calcula-se a amplitude de classe c.(x/2 62 .

sendo o limite superior da primeira classe o inferior da segunda.O limite superior LS1 da 1ª classe é obtido por: LS1 = LI1 + c. Passo 6 ± Construídas as classes. sendo que LS1 = LI2 e assim.Passo 5 . sucessivamente ± soma-se ao valor do limite inferior da primeira classe a amplitude de classe e obtém-se o limite superior. 63 . são contados quantos dados estão em cada classe (freqüências absolutas de cada classe).

Trata-se.Obs: a freqüência absoluta (fa) é o número de repetições de um valor individual ou de uma classe de valores da variável.São calculadas as freqüências relativas e percentuais de cada classe. em relação ao número total de observações. Passo 7 . de um número relativo. tendo como resultado uma porcentagem 64 . Obs: a freqüência percentual (fp) é o produto da freqüência relativa por 100. portanto. Obs: a freqüência relativa (fr) representa a proporção de observações de um valor individual ou de uma classe.

Sign up to vote on this title
UsefulNot useful