Você está na página 1de 102

Universidade do Estado do Rio de Janeiro - UERJ

Faculdade de Forma çã o de Professores - FFP

Departamento de Matemá tica

Material de apoio ao aprendizado das disciplinas de

Estatí stica e Bioestatí stica

das disciplinas de Estat í stica e Bioestat í stica Professora: Viviane C á tia K

Professora: Viviane Cá tia K öhler

Sã o Gonç alo-RJ

Introdução

A Estatística encontra-se presente em todas as áreas do conhecimento humano: ciências sociais, ciências humanas, ciências exatas, etc. Isso ocorre porque cresce cada vez mais a utilização de suas ferramentas com a finalidade de encontrar respostas a perguntas do tipo:

Qual o consumo médio mensal de combustível de uma determinada região do Estado?

Qual o índice de preços ao consumidor do mês de dezembro?

Qual a proporção de peças defeituosas da linha de produção de uma empresa X?

Será que o índice de reprovação foi reduzido com a introdução de novas técnicas de ensino?

Que porcentagem de determinado elemento químico está presente numa amostra de dejetos da empresa X?

Qual deverá ser o possível valor médio de retorno financeiro de um determinado evento?

Qual a preferência do eleitorado em relação aos candidatos à Presidência da República?

O que é Estatística?

De acordo com o dicionário Aurélio, Estatística pode ser definida como:

“parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou sobre uma coleção de seres quaisquer, e os métodos de tirar conclusões ou predições com base nesses dados”.

O termo estatísticas, no plural, tem o significado de dados numéricos representativos de uma variável analisada, enquanto estatística, no singular, é o método utilizado na manipulação de dados, isto é, o método de coleta, de elaboração, de análise e de interpretação dos dados numéricos. Apesar de sua simplicidade, essas definições nos permitem enxergar os vastos campos de ação da Estatística. Podemos dizer que não há praticamente nenhum ramo do conhecimento humano em que ela não tenha utilização. Estatística é uma ferramenta que nos ensina procedimentos lógicos de observação e de análise, necessários para aproveitar ao máximo os conhecimentos de outras ciências. Com base nos conceitos de Estatística apresentados anteriormente, daremos, a seguir, a definição que será adotada como base para o seu aprendizado.

A Estatística consiste em um conjunto de métodos e processos quantitativos que nos auxiliam a coletar, analisar e interpretar dados de acontecimentos coletivos e tirar conclusões em situações em que a variação e a incerteza estão presentes.

Dados

Um trabalho estatístico envolve um levantamento e uma análise de dados. O que são dados?

Dados são informações obtidas através de observações, contagens ou respostas fornecidas por pessoas.

Exemplos:

• 25% dos eleitores da cidade do Rio de Janeiro votarão no candidato do partido XY.

Isso significa que, através de uma pergunta feita a eleitores da cidade do Rio de Janeiro, obteve-se a resposta de que 25% do total votaria no candidato do partido XY.

• Apenas 11% dos consumidores preferem consumir um produto de marca ou empresa

que possui propaganda mais chamativa e envolvente. (Fonte: Instituto EM Data, julho de 2004)

Pode-se dizer que, a partir de um levantamento da opinião dos consumidores que foram entrevistados pelo Instituto EM Data, apenas 11% preferem adquirir um produto de marca ou empresa que possui propaganda mais chamativa.

Depois que os dados são coletados, devem passar por algum tratamento. Esse tratamento permite ordená-los, por exemplo, em ordem crescente, tornando-os mais fáceis de serem trabalhados. Os dados que não sofrem qualquer tratamento são denominados dados brutos.

Dados brutos são informações obtidas através de observações, contagens ou respostas fornecidas por pessoas, mas que não sofreram nenhum tratamento estatístico.

Exemplos:

• Será realizada uma pesquisa eleitoral com 2.400 eleitores da cidade de São Gonçalo.

Os dados brutos são as respostas da preferência dos eleitores sem nenhum tratamento estatístico, ou seja, os dados de respostas não estão em ordem crescente nem organizados de acordo com as respostas dadas pelos entrevistados. Isto é, o que se tem são apenas as respostas dos eleitores entrevistados, mas não há nenhuma informação tratada sobre eles. Não se sabe quantos votarão no candidato X ou no candidatoY.

• Foi realizado um levantamento das idades de 1.000 estudantes do ensino médio em Niterói. Não foi determinado o número de alunos em cada idade. Tem-se apenas um número de alunos e valores referentes às idades, porém sem nenhum tratamento estatístico mais detalhado, ou seja, somente o resultado de uma contagem.

Etapas da Estatística

O estudo da Estatística pode ser conduzido dividindo-se todo o conteúdo em 4 etapas:

determinação do objetivo, coleta de dados, análise dos dados e conclusões e inferências.

Determinação do objetivo

A determinação do objetivo é a etapa inicial de um trabalho estatístico. Pode-se dizer que é

uma das etapas mais importantes da Estatística, pois nela está concentrado todo o formato que a pesquisa deverá tomar. Se o objetivo da pesquisa estatística não estiver bem definido, de forma bem clara e detalhada, os dados coletados poderão não indicar as verdadeiras características daquilo que será analisado. Nesse caso, a coleta de dados estará comprometida, assim como o processo de análise de dados e, conseqüentemente, as conclusões que serão utilizadas para se fazer inferências. A coleta de dados, etapa seguinte no processo estatístico, pode demandar muito tempo e, conseqüentemente, alto custo, caso o objetivo não tenha sido pré-definido. Essa coleta pode não ser útil ou ser insuficiente, por exemplo quando a determinação dos objetivos leva à definição de outros dados que devem ser coletados. O ideal é que se faça um levantamento de todos os fatores que poderão influenciar o trabalho de pesquisa para que este possa ser executado rapidamente e com o menor custo possível.

Os principais objetivos são, em geral, voltados para o desenvolvimento de novos produtos, investigação de problemas que porventura estejam atrapalhando o processo de produção de uma empresa, inspeção para a garantia da qualidade de um produto, avaliação do relacionamento existente entre alguns itens e melhoria dos resultados de um processo.

Exemplos:

Objetivos de uma pesquisa eleitoral - determinar a região em que o candidato tem maior aceitação, a faixa de renda dos eleitores, bem como idade, nível de escolaridade, etc.

Após a determinação dos objetivos, poderemos fazer o levantamento de dados referentes a nível de escolaridade, taxa de renda, idade, etc.

Objetivos de uma pesquisa de aceitação de um produto no mercado - determinar a faixa de renda do consumidor, região onde mora, ponto de venda do produto, o que o consumidor mais gosta e o que menos gosta no produto etc.

Após a definição dos objetivos, ficam mais fáceis a elaboração do questionário e a definição de quem serão os entrevistados. Ganha-se tempo para a coleta de informações.

Depois de definirmos os objetivos, passamos à etapa seguinte, que é a de coleta de dados.

Coleta de dados

Após a determinação do objetivo da pesquisa estatística, devem-se coletar os dados ou informações que serão necessárias para a análise. Para que os dados possam realmente representar o objetivo especificado, deve-se escolher o método de apresentação mais adequado, de forma que as conclusões obtidas possam apresentar um alto grau de confiabilidade.

O levantamento de dados pode ser realizado com todo o material coletado ou apenas com uma parte representativa dele. O conjunto de todos os dados é chamado de população e a parte que o representa é chamada de amostra.

População é o conjunto de todos os dados sobre os quais desejamos obter informações. É o conjunto de todos os itens produzidos, todas as pessoas de uma localidade, todas as peças analisadas, enfim, de tudo o que é objeto de uma pesquisa estatística. Pode também ser definida como o conjunto de elementos com determinadas características em comum.

Observe que população não é necessariamente formada por moradores de uma cidade e que a população em um problema depende da informação que queremos obter.

Se o objetivo de uma pesquisa é conhecer o nível social de cada um dos moradores de uma cidade do interior de Minas Gerais, então a coleta de dados será o levantamento dos rendimentos de todos os moradores da cidade. Essa coleta pode ser realizada através de questionários entregues à população, por telefone (o que tornaria o custo da pesquisa muito alto) ou através de pesquisadores que entrevistariam todos os moradores de casa em casa.

A população de dados dessa pesquisa seria a renda de todos os moradores, isto é, o conjunto de todos os dados da pesquisa.

Se o objetivo de uma pesquisa é determinar quantas peças produzidas por uma pequena empresa, em um dia, apresentaram defeito, a população será toda a produção de peças daquele dia. Por exemplo, se a empresa produz 5.000 peças, por dia, então a população é de 5.000 peças. Se o objetivo de uma pesquisa é determinar quantos automóveis a cidade X possui circulando em suas vias, a população é constituída de todos os automóveis da cidade X que estão em circulação.

Censo é a contagem de todos os elementos de uma população. O censo não se refere somente ao Censo realizado pelo IBGE, mas também a qualquer levantamento de todas as informações de uma população de dados. Por isso, o censo proporciona informações mais detalhadas sobre a população, mas, na maioria das vezes, é caro e difícil de ser realizado.

A população pode ser considerada finita e infinita. Vamos ver a diferença.

População finita: quando todos os itens de uma população são conhecidos e fixos, isto é, permanecem inalterados.

O Censo da população brasileira é realizado periodicamente pelo IBGE – Instituto Brasileiro de Geografia e Estatística. Os censos produzem informações imprescindíveis para a definição de políticas públicas estaduais e municipais e para a tomada de decisões de investimento, sejam eles provenientes da iniciativa privada ou de qualquer órgão do governo.

Exemplos:

•O número de peças de plástico de um automóvel da marca X.

•Uma sala de aula com 50 alunos.

• Um hotel da rede XYZ, que apresenta 100 unidades habitacionais.

Exemplos:

• As bolas de uma urna utilizada para sorteios.

Se elas são retiradas e repostas repetitivamente após cada sorteio, então as bolas podem ser retiradas infinitas vezes.

• Todas as peças possíveis de serem manufaturadas.

Nesse caso, tem-se uma população de peças que serão manufaturadas, mas é impossível obter

a lista de todas elas, pois a produção não tem fim.

• Todas as visitas possíveis de clientes a uma loja.

 

É

impossível contabilizar a população de clientes, pois não se sabe quantos irão visitar tal

loja.

EXERCÍCIO:

 

Elaborar um exemplo de pesquisa em que se descreve seu objetivo e se indique quais seriam os dados coletados.

Amostra

Na maior parte das situações, a população, mesmo finita, é grande demais para que seja prático levantar todos os dados. Por isso, utilizamos uma parte que represente a população. Essa parte é chamada de amostra.

Amostra: é uma parte representativa da população. Pode também ser definida como um subconjunto de uma população por meio do qual se estabelecem ou se estimam as propriedades e características dessa população.

A amostra é utilizada quando necessitamos de uma resposta mais rápida sobre a população

ou quando a realização do levantamento de dados de uma população é muito dispendiosa. Por exemplo, é preferível pesquisar as respostas de uma parte representativa dos eleitores de uma cidade

a ter que fazer o levantamento das respostas de todos os seus eleitores. Com isso, ganha-se tempo nos resultados obtidos e consegue-se um custo de pesquisa muito inferior ao que seria gasto com toda a população.

Exemplos:

• Uma fábrica possui 1.000.000 de peças em estoque. Se estamos interessados em analisar a espessura das peças, podemos, por exemplo, tomar uma amostra de apenas 500 peças.

A opção pela escolha da análise de uma amostra é melhor neste caso, pois ganha-se em tempo e em custo da pesquisa.

• Uma amostra da opinião de 2.000 moradores de uma cidade sobre a economia do país.

Observe a expressão “parte representativa da população” na definição de amostra. O que quer

dizer?

Quer dizer que, se tomarmos uma parte muito pequena da população, o levantamento de dados pode ser muito diferente da população como um todo. Por exemplo, fazer uma pesquisa eleitoral com apenas 10 eleitores em uma cidade com 1.000.000 de eleitores não é representativo. Mas qual número ou percentual da população total é representativo?

Essa é uma questão um pouco mais complexa. Uma análise detalhada não consta dos objetivos desta disciplina. Os métodos e técnicas utilizados para se realizar uma amostragem serão analisados com maiores detalhes em Técnicas de Amostragem.

A opção por trabalhar com toda a população ocorre em virtude de se desejar obter informações sobre todo o universo objeto de pesquisa, que é o caso do censo demográfico, ou

quando a população é pequena (a população pode ser considerada pequena quando os custos e o tempo de análise das informações não são empecilho para tal realização).

EXERCÍCIO

1)

Definir amostra.

2)

Dar exemplos de amostra.

3)

Em que situações é preferível trabalhar com uma amostra ao invés de com a população?

4)

Determinar uma amostra para cada uma das populações mencionadas a seguir:

a) 25.000 é o total de peças produzidas pela empresa X;

b) duas toneladas da substância XYZ estão infectando o solo de um lixão;

c) todos os consumidores de cereais do país;

d) os salários de todos os 1.000 funcionários de uma empresa.

5)

Dadas as sentenças abaixo, indicar falso (F) ou verdadeiro (V).

 

(

) A amostra é um subconjunto da população.

(

) A população é uma parte representativa da amostra.

( ) A amostra é a melhor opção quando a análise de todos os dados da população toma muito tempo e é considerada de alto custo.

( ) A análise de todas as peças produzidas por uma pessoa, durante um dia, pode ser considerada uma amostra.

Análise dos Dados

Após determinar o método de levantamento de dados mais adequado, é necessário fazer uma análise dos dados, colhendo informações relativas ao objetivo especificado. Para uma melhor análise dos dados, é usual organizá-los sob a forma de tabelas e gráficos e, então, sintetizá-los através de medidas. Essa organização e resumo das informações em medidas é chamada Estatística Descritiva.

Estatística Descritiva: é a parte da Estatística que utiliza métodos gráficos e numéricos para organizar, resumir e simplificar as informações para que possam ser interpretadas e utilizadas com maior facilidade.

Estudaremos, nas próximas aulas, algumas ferramentas utilizadas pela Estatística Descritiva, tais como:

• Representações gráficas e tabulares da Distribuição de Freqüência;

• Medidas de Posição;

• Medidas de Dispersão;

• Medidas de Assimetria.

Exemplos:

• A média de idade dos alunos que estão matriculados na disciplina de Estatística é de 34 anos.

• A média é uma das medidas de posição mais utilizadas para representação dos dados.

• 30% dos estados brasileiros estão sem verbas para educação e saúde.

A representação

estatísticos.

percentual

é uma

forma

bastante

utilizada

para

descrever

os dados

• O desvio padrão das aplicações financeiras analisadas é muito alto.

O desvio padrão é uma medida de dispersão muito utilizada para descrever a variação dos

dados estatísticos.

• O coeficiente de assimetria para a distribuição de freqüência dos pesos de uma peça é muito pequeno.

O coeficiente de assimetria é uma medida que nos informa sobre o formato, simétrico ou não,

das curvas representativas de uma distribuição de freqüências.

Conclusões e Inferências

Essa é a parte final do processamento estatístico, em que os resultados obtidos nas análises são dispostos e avaliados com relação ao objetivo proposto no início da pesquisa. Essa parte da Estatística é chamada Estatística Indutiva ou Inferencial.

Estatística Indutiva ou Inferencial: é a parte da Estatística que interpreta os dados amostrais e faz generalizações sobre um experimento em estudo. Ela vai determinar, também, a precisão e a confiabilidade dos resultados obtidos.

Os resultados de uma estatística inferencial são induções ou estimativas sobre as variáveis

obtidas da amostra. Elas podem ser conclusivas e podem levar o pesquisador a uma tomada de decisão sobre toda a população. Por exemplo, com base em uma amostra de 2.000 eleitores, o instituto de pesquisa pode generalizar o resultado obtido para todos os eleitores, isto é, se um candidato obteve 32% de escolha entre os 2.000 eleitores, pode-se dizer que 32% de todos os eleitores da cidade pesquisada votariam nesse candidato. Mas, como o resultado é baseado em uma amostra, a estimativa do resultado vem acompanhada de uma margem de erro. A margem de erro ocorre porque a pesquisa não foi realizada com todos os eleitores.

O cálculo exato da margem de erro é um assunto matematicamente complexo e foge dos

objetivos deste curso.

A ferramenta básica no estudo da Estatística Inferencial é a probabilidade, pois lida com a

incerteza.

Variáveis Quantitativas

Os principais tipos de variáveis e as séries estatísticas utilizadas na representação de dados

estatísticos. As variáveis são classificadas em quantitativas e qualitativas, e as séries estatísticas são representações gráficas de acordo com o tipo de variável utilizada.

Variáveis Quantitativas: como a própria palavra diz, são variáveis que indicam uma quantidade. São o resultado de uma contagem de itens, dados ou informações sobre o objeto em questão.

As variáveis quantitativas se dividem em dois subgrupos: discretas e contínuas.

Variáveis Quantitativas Discretas: quando seus valores são, em geral, uma contagem do número de itens de uma determinada característica, isto é, assumem valores inteiros.

Exemplos:

• 25 funcionários trabalham no setor de compras de uma empresa.

• A inspeção da produção acusou que apenas 10 peças apresentaram algum defeito.

• 40 alunos fizeram matrícula em Geografia no semestre passado.

• 1.200 pessoas fizeram inscrição para o concurso público.

Em todos os exemplos apresentados tem-se apenas o resultado de uma contagem, ou seja, valores inteiros.

Variáveis Quantitativas Contínuas: quando seus valores podem assumir qualquer valor real dentro de um intervalo contínuo. Isto é, assumem todos os valores intermediários entre dois valores reais ou entre dois limites. As variáveis contínuas estão associadas a: altura, peso, comprimento, espessura, temperatura, pressão sanguínea, velocidade, tempo, etc.

As variáveis contínuas também podem ser consideradas como aquelas cujo valor somente poderá pertencer a um intervalo.

Exemplos:

• A temperatura prevista para a cidade de Belo Horizonte, durante um certo dia, variou de 25º C a 28º C.

• O paciente pesava entre 120 e 140 quilos.

• As peças inspecionadas na revisão têm espessuras que variam de 2 a 5 milímetros.

• A velocidade do automóvel utilizado na viagem de Belo Horizonte ao Rio de Janeiro variou de 10 a 110 quilômetros por hora.

• As pessoas presentes em um seminário têm alturas que variam de 1,60 metros a 1,92 metros

• A idade das pessoas presentes em um evento variou entre 40 e 45 anos.

A diferença entre variáveis quantitativas discretas e as contínuas é que numa variável discreta, todo valor é exato, enquanto a variável contínua assume um valor dentro de um intervalo contínuo, isto é, todo valor é aproximado.

Exemplos da diferença entre variável contínua e discreta:

1) Discreta: 10 pessoas com 25 anos. Contínua: o peso das 10 pessoas.

2) Discreta: 100 peças na cor preta. Contínua: as espessuras de 100 peças variam de 1,5 a 3,0 milímetros.

3) Discreta: 25 moradores de uma localidade. Contínua: cor de pele dos moradores.

4) Discreta: 200 tubulações de PVC. Contínua: os diâmetros das tubulações compradas pela empresa X variam de 1,5 a 10 polegadas.

Variáveis Qualitativas

Vimos

que

variáveis

quantitativas

expressam

quantidades.

precisamos expressar atributos ou qualidades.

No

entanto,

muitas

vezes

Variáveis Qualitativas: variáveis que indicam uma classificação, consistindo em atributos ou registros não-numéricos.

As variáveis qualitativas se dividem em dois subgrupos: ordinais e nominais. Variáveis Qualitativas Ordinais: variáveis que estão classificadas por uma ordem.

Exemplos:

• Os filmes listados a seguir estão classificados por ordem de preferência do público.

1º – Van Helsing 2º – Tróia 3º – Diário de uma motocicleta

A variável é a ordem de preferência.

• A equipe X terminou o campeonato em 4º lugar.

• O 1º colocado do concurso.

A variável é a ordem de chegada.

• Os cinco primeiros colocados no campeonato de futebol estarão classificados para a próxima fase.

A colocação é a variável.

Os exemplos ilustram bem a ordem em que as variáveis analisadas estão dispostas. Fica bem claro que a variável ordinal tem a principal característica de indicar uma ordem ou seqüência.

Variáveis Qualitativas Nominais: variáveis que indicam uma classificação. Os dados podem ser classificados em categorias, grupos ou marcas.

Exemplos:

• Cores dos automóveis de certo modelo.

• Marcas de refrigerante: Coca-Cola, Sprite, Fanta, Mate-Couro, etc.

• Partidos políticos: PMDB, PSDB, PT, PV, PSTU, etc.

• Classificação dos itens de um estoque: A, B, C, D, etc.

Estes exemplos mostram que os dados podem ser classificados sem a necessidade de um número, ou seja, podem simplesmente ser mencionados de acordo com uma classe ou categoria a que pertencem.

Atividades

1) Dados os exemplos a seguir, determinar a classificação de cada um deles de acordo com o tipo de variável quantitativa (discreta ou contínua) ou qualitativa (nominal ou ordinal).

a) Consumo dos refrigerantes da marca Coca-Cola e Pepsi;

b) 1500 eleitores;

c) Camisas tamanho P;

d) Descrição das classificações dos tenistas pelo ranking da ATP:

1º - Rogerio Federer 2º - Guilhermo Gaudio 3º - Andre Agassi

e) Temperatura em São Gonçalo para hoje: mínima de 28º C e máxima de 35º C;

f) 2.000 pessoas inscritas para as provas do concurso.

2)

Elaborar alguns exemplos de variáveis quantitativas discretas e contínuas.

3)

Elaborar alguns exemplos de variáveis qualitativas nominais e ordinais.

Planejamento de um estudo Estatístico

Para o planejamento de um estudo estatístico, é de extrema importância considerar os seguintes itens:

1 - OBJETIVO

É de grande importância a definição clara do objetivo para um levantamento estatístico, pois

facilitará a análise dos resultados obtidos.

2 - POPULAÇÃO

É o todo para efeito de análise; é o universo de dados que será analisado. A população deverá

ser especificada claramente pelo pesquisador. Quanto maior a quantidade de informações

conhecidas sobre a população, mais fácil será o processo de amostragem.

3

- A COLETA DOS DADOS

Deve-se evitar a inclusão de dados desnecessários no processo de amostragem. Essa inclusão poderá atrapalhar a análise dos dados, o tempo gasto será maior e o resultado obtido não terá finalidade. Os dados ou informações coletadas fazem parte do que é chamado banco de dados, que é composto por características numéricas − as variáveis.

Um banco de dados de um levantamento estatístico terá, em geral, várias tabelas com múltiplas variáveis.

Banco de dados é uma coleção organizada e inter-relacionada de dados persistentes. É o registro de conceitos e informações organizado.Programas de computador são utilizados para gerenciar um banco de dados.

4 - GRAU DE PRECISÃO

Ao iniciar o processo de amostragem, deve-se especificar o grau de precisão desejado nos

resultados. Deve-se considerar que elevar a precisão da pesquisa implica aumentar o tamanho da amostra, o que aumenta também o tempo e o custo. Quanto maior a amostra, maior a precisão do resultado, isto é, menor a margem de erro. Por exemplo, uma pesquisa realizada com 10.000 eleitores para determinar a preferência eleitoral em uma cidade apresenta resultado mais preciso do que outra realizada com apenas 1.000 eleitores.

5 - ANÁLISE DOS DADOS

A análise

dos

dados

é

realizada

através

de

medidas

estatísticas

que

descrevem

o

comportamento dos dados. É usual organizá-los, primeiramente, em gráficos e tabelas.

6 - CONCLUSÃO

A conclusão é a fase final do processo estatístico, em que os resultados são dispostos e avaliados com relação ao objetivo proposto. Os resultados são interpretados de acordo com o objetivo da pesquisa, e decisões são tomadas acerca das populações, utilizando-se a inferência estatística.

Técnicas de amostragem

O grande problema encontrado para a escolha dos elementos da amostra dentro da população está em determinar qual técnica de amostragem deverá ser utilizada. Isto é, qual técnica ou método será utilizado para se escolher quais elementos dentro da população serão selecionados para a amostra. Existem dois métodos para a seleção da amostra: métodos probabilísticos ou aleatórios e métodos não-probabilísticos.

Os métodos probabilísticos são aqueles nos quais todos os itens da população têm a mesma

probabilidade de ser incluídos na amostra, independentemente da pessoa que realiza a pesquisa.

Já os métodos não-probabilísticos são aqueles em que todos os itens da população têm uma oportunidade conhecida de ser incluídos na amostragem. Esses métodos são muito utilizados quer pela sua simplicidade, quer pela impossibilidade de se usar os métodos probabilísticos. São também conhecidos como amostragem subjetiva ou amostragem por julgamento.

Se o tamanho da amostra é bem pequeno, com menos de 10 itens, por exemplo, a amostragem probabilística pode não dar resultados representativos da população, ao passo que uma pessoa com conhecimento mais profundo da população pode especificar os elementos que melhor representariam a população.

Exemplo: O proprietário de uma rede de 10 postos de gasolina deseja implementar um novo serviço de pagamento, com cartão fidelidade para a sua rede de postos. Problemas de custo podem fazer com que essa implementação seja experimentada em apenas 3 postos, talvez por apresentarem maior número de consumidores, melhor localização e maior faturamento. Em vez de utilizarmos uma técnica estatística para a escolha dos postos usados como teste para a implementação do serviço de pagamento, é melhor confiar no julgamento e conhecimento do proprietário para fazer a escolha.

Diante de situações como essa, a ênfase será dada aos tipos de amostragens probabilísticas, pois tem-se o conhecimento da probabilidade de todas as combinações possíveis e é possível fazer uma estimativa do erro da amostra.

Os métodos probabilísticos podem ser com reposição ou sem reposição.

Amostragem com reposição: cada elemento da população pode ser escolhido mais de uma vez na amostra.

Exemplos:

- Amostragem dos eleitores de uma cidade.

- Amostragem dos consumidores de um determinado produto.

- Amostragem dos moradores de um bairro.

Em todos esses exemplos de amostragem, as pessoas poderão ser entrevistadas novamente, ou seja, todos têm a mesma probabilidade de ser escolhidos novamente.

Amostragem sem reposição: cada elemento da população pode ser escolhido apenas uma vez na amostra.

Exemplos:

- Testes de balística. É um teste muito utilizado pela polícia. É um teste destrutivo.

- Testes de resistência de um equipamento eletrônico.

- Verificação da resistência de um copo de vidro.

- Verificação da qualidade de um pára-brisa blindado.

Os itens destrutíveis podem ser escolhidos apenas uma vez, pois torna-se impossível a sua reposição.

É importante destacar que, em estudos estatísticos, em que o processo de amostragem apresenta um custo elevado, é aconselhável evitar o exame repetido dos elementos.

Quatro técnicas de amostragem probabilística serão abordadas:

a) amostragem aleatória simples;

b) amostragem estratificada;

c) amostragem por conglomerado;

d) amostragem sistemática.

Essas técnicas se diferenciam pela maneira como a amostra é escolhida dentro da população.

Amostragem Aleatória Simples

Esta é a técnica mais comumente utilizada para a seleção de amostras. Os processos de amostragem aleatória podem ser realizados pela utilização de Tabelas de Números Aleatórios ou por sorteio.

Tabela de Números Aleatórios é uma tabela que contém todos os algarismos de 0 a 9 dispostos isoladamente ou em grupos; podem ser lidos de cima para baixo, na mesma coluna, ou da esquerda para a direita. A principal característica da tabela é que os algarismos estão dispostos aleatoriamente, isto é, não têm uma ordem ou seqüência de aparição.

Para a obtenção de amostras aleatórias utilizando as Tabelas de Números Aleatórios (TNA)2 adota-se a seguinte seqüência:

a) Enumeram-se os itens da população de 1 a N.

b) Seleciona-se aleatoriamente um ponto onde iniciar a linha e a coluna da tabela de números aleatórios com o mesmo número de algarismos quantos forem os de N.

c) Escolhe-se uma direção, por exemplo, na mesma coluna, de cima para baixo, ou na

mesma linha, da esquerda para a direita, e anotam-se os números obtidos, descontando os números maiores do que N. Prossegue-se na direção escolhida até que se complete a amostra.

d) Se a amostragem for com reposição, registram-se as repetições; se for sem reposição,

abandonam-se as repetições.

O exemplo a seguir ilustra a seleção de uma amostra utilizando uma tabela de números aleatórios.

Exemplo: Há 500 pessoas participando de um seminário sobre Administração de Negócios. Uma amostra de 20 participantes deverá ser selecionada para responder a algumas questões.

Solução:

- De acordo com a seqüência acima, devem-se enumerar todos os participantes do

seminário de 1 a 500, o que pode ser feito através da distribuição de senhas para cada um.

- Deve-se, agora, escolher aleatoriamente um ponto na Tabela de Números Aleatórios

onde

iniciar

a

contagem

dos

20

números

que

farão

parte

da

amostra.

- O próximo passo é anotar os números de três algarismos (porque o maior número de

participantes é 500, isto é, apresenta três algarismos) que forem menores do que 500. A leitura dos números deve ser realizada de cima para baixo, da esquerda para a direita.

- A amostragem não será com reposição, pois a mesma pessoa não poderá responder ao mesmo questionário mais de uma vez. Portanto, os números que forem repetidos deverão ser descartados, assim como os números maiores do que 500.

Suponha que o lugar escolhido aleatoriamente na tabela tenha sido a linha 3, coluna 1. O número obtido foi o 582. Como não existe uma pessoa com a senha 582, esse número é, então, descartado e passa-se ao próximo, na linha imediatamente abaixo. O número 642 também não existe, nem 573 O primeiro número escolhido é o 347, o segundo é o 196.

O processo deverá continuar até que todos os 20 participantes sejam selecionados.

Acompanhe a escolha dos 20 números na tabela de Números Aleatórios abaixo:

893

964

947

369

482

587

856

599

617

940

983

628

998

504

083

295

538

421

582

029

022

132

059

193

876

829

600

642

788

787

347

197

306

466

051

514

573

839

569

413

053

345

018

757

998

962

321

451

807

903

573

305

269

102

347

094

672

434

526

648

484

880

950

196

543

307

103

980

243

496

958

835

914

858

766

581

106

386

300

587

490

429

358

059

011

836

405

516

152

484

244

491

061

181

615

372

524

884

762

048

558

743

360

179

586

270

682

234

034

050

200

713

238

039

562

510

134

904

115

097

965

315

753

150

385

593

780

267

433

206

038

568

380

210

111

871

887

982

521

239

209

122

247

780

046

890

074

929

895

174

405

899

497

588

025

444

041

776

785

704

693

233

347

359

725

317

149

796

838

208

545

966

278

274

615

596

414

727

128

406

680

033

223

664

596

469

770

976

981

316

822

520

177

873

567

801

336

665

818

143

839

906

067

276

648

676

961

073

926

758

366

355

831

059

087

227

768

504

733

678

531

024

653

489

120

455

231

232

136

542

723

954

290

929

137

955

235

659

752

864

986

774

530

488

342

017

718

957

968

651

743

791

095

481

572

088

631

562

909

456

436

656

094

681

647

161

050

113

977

797

252

554

383

520

287

621

948

327

992

317

347

250

597

127

523

458

717

425

125

609

094

627

370

228

578

600

762

597

039

980

114

989

907

456

550

767

181

938

680

761

416

722

336

348

694

010

541

515

694

281

873

936

621

911

002

605

333

155

824

486

541

393

356

273

587

952

261

273

470

276

026

489

786

587

952

261

273

470

276

026

489

786

879

421

623

217

108

073

414

707

Tem-se

uma

amostra

de

20

participantes

com

os

seguintes

números:

347; 196; 429; 244; 048; 034; 046; 316; 073; 455; 137; 488; 095; 252; 317; 125; 181; 010; 002 e

273.

Repare que o número 347 aparece duas vezes e, na segunda vez, é descartado, pois já havia sido escolhido, e o processo de escolha não permite que o entrevistado responda ao mesmo questionário mais de uma vez.

EXERCÍCIO

1)

Uma empresa possui 250 funcionários. Escolher uma amostra aleatória simples composta de 30 pessoas para fazer um levantamento e descrever os passos que serão adotados.

2)

Descrever os passos para a escolha aleatória simples de 20 estudantes dentro de uma faculdade com 1.000 alunos.

Amostragem Aleatória por sorteio

Outra

maneira

de

realizar

uma

amostragem

simples

é

por

sorteio.

Exemplo: Deseja-se fazer uma pesquisa de opinião com os eleitores de Salvador. Eles serão submetidos a um questionário sobre as propostas dos novos candidatos ao governo.

Torna-se impraticável entrevistar todos os eleitores de um bairro de Salvador sobre as propostas dos novos candidatos ao governo, pois a análise tomaria muito tempo e o custo dessa pesquisa seria altíssimo. Então, utiliza-se uma amostragem aleatória. Serão escolhidos, aleatoriamente, 500 eleitores para a pesquisa. Se o número de moradores do bairro é conhecido e todos podem ser listados, então, a escolha desses eleitores pode ser realizada por sorteio.

A amostragem aleatória por sorteio é mais simples. Todos os elementos da população deverão estar enumerados ou listados. Pode-se utilizar uma urna que contenha todos os números dos elementos e, então, iniciar o sorteio. Esse sorteio é realizado de forma semelhante à forma como são sorteados os números de jogos da Loteria Federal. Da mesma forma que o exemplo anterior, os moradores que já foram entrevistados não deverão participar novamente da pesquisa. Assim, diz-se que o processo foi realizado sem reposição, ou seja, todos os itens já escolhidos numa primeira amostragem serão descartados quando aparecerem pela segunda vez. Essa é bastante simples, não é mesmo?

Amostragem Estratificada

Esta técnica de amostragem é utilizada quando é necessário que haja um representante de cada segmento da população incluído na amostra. Por exemplo, para coletar uma amostra dos moradores de uma cidade, podem-se dividir as residências por níveis socioeconômicos e depois escolher, aleatoriamente, uma amostra dos moradores. É importante que uma característica comum seja escolhida para a coleta das informações amostrais. No caso do exemplo, a característica é o nível socioeconômico. Dependendo do objetivo da pesquisa, os elementos da população podem ser divididos em subgrupos maiores com características similares, como idade, peso, nível social, localização geográfica, raça, etc.

Portanto, uma amostragem estratificada é obtida separando-se a população em subgrupos com características homogêneas ou similares e selecionando-se, independentemente, uma amostra aleatória simples em cada um desses subgrupos.

Existem dois tipos de amostragem estratificada:

a) as que têm o mesmo tamanho;

b) as proporcionais.

Na amostragem estratificada de mesmo tamanho sorteia-se um número igual de elementos em cada subgrupo. Esse processo é utilizado quando o número de elementos por subgrupo for igual ou aproximadamente o mesmo.

Quando cada subgrupo apresenta números diferentes de elementos utiliza-se, então, a amostragem estratificada proporcional, em que o número de elementos que devem ser escolhidos em cada grupo é proporcional ao número de elementos do grupo. O processo de amostragem é realizado da seguinte maneira:

S - é o número de subgrupos;

Ni - é o número de elementos de amostragem no subgrupo i;

N - é o número de elementos da população;

n - é o número de elementos da amostra.

Cada subgrupo possui características similares. Com isso, têm: N = N1 + N2 + N3

Cada subgrupo possui características similares.

Com isso, têm: N = N1 + N2 + N3 +

+ NS

Determina-se a fração de amostragem f dada por:

f = n

N

Fração de amostragem é a razão entre o número de elementos da amostra e o número total de elementos da população.

O número de elementos sorteados em cada subgrupo é definido pelo produto deste fator f e

do número de elementos de amostragem em cada subgrupo:

N1.f, N2.f,

NS.f

Exemplo:

Deseja-se obter uma amostra de 20 participantes de um seminário, para aplicação de um questionário sobre o tema abordado nas palestras da série “Violência nas Grandes Cidades”. Sabe- se que a informação que as pessoas prestam está relacionada à região onde moram. O seminário possui participantes de 4 Estados brasileiros, sendo assim compostos:

50 do Rio de Janeiro;

100 de São Paulo;

30

de Minas Gerais e

20

da Bahia.

Como deverá ser realizada a amostragem para se escolher os participantes do seminário?

Solução:

Deve-se utilizar a técnica de amostragem estratificada, pois é importante que se tenham

representantes de todos os 4 Estados em número proporcional ao número de representantes de cada Estado.

O primeiro passo é separar os participantes em subgrupos de Estados. Depois, deve-se fazer a

amostragem dentro de cada subgrupo.

A população do seminário em questão é de 200 participantes.

Os subgrupos serão:

Rio de Janeiro:

N1

50 participantes

São Paulo:

N2

100 participantes

Minas Gerais:

N3

30 participantes

Bahia:

N4

20 participantes.

O

A

O

tamanho da população é:

N = N1 + N2 + N3 + N4 N = 50 + 100 + 30 + 20 = 200 participantes

fração de amostragem será:

f =

n

20

N =

200 = 0,10

número de elementos sorteados em cada subgrupo será definido pelo produto desse fator

de amostragem f pelo número de elementos de amostragem em cada subgrupo.

N1 . f = 50 . 0,10 = 5 participantes escolhidos aleatoriamente no subgrupo 1. N2 . f = 100 . 0,10 = 10 participantes escolhidos aleatoriamente no subgrupo 2. N3 . f = 30 . 0,10 = 3 participantes escolhidos aleatoriamente no subgrupo 3. N4 . f = 20 . 0,10 = 2 participantes escolhidos aleatoriamente no subgrupo 4.

O total de participantes escolhidos por amostragem estratificada foi de 20, sendo 5 do Rio de

Janeiro, 10 de São Paulo, 3 de Minas Gerais e 2 da Bahia.

Exemplos:

Deseja-se realizar uma amostra de 1.000 moradores de uma certa cidade para a aplicação de um questionário sobre consumo. É necessário que sejam entrevistadas pessoas com rendas baixa, média e alta. A cidade possui 2 milhões de habitantes divididos da seguinte maneira:

Renda

baixa:

1.400.00

habitantes

Renda

média:

500.000

habitantes

Renda alta: 100.000 habitantes

Como deverá ser o plano de amostragem para esta pesquisa?

Solução:

Deve-se utilizar a técnica de amostragem estratificada, pois é importante que se obtenham

respostas dos três níveis de renda. Como o número de pessoas em cada nível de renda é diferente,

utiliza-se

O primeiro passo é separar as pessoas em subgrupos de nível de renda e, então, fazer a amostragem dentro de cada subgrupo.

amostragem estratificada proporcional.

a

A

população do cidade é de 2.000.000 de pessoas.

O

subgrupos são divididos da seguinte forma:

Renda baixa: N1 = 1.400.000 pessoas Renda média: N2 = 500.000 pessoas Renda alta: N3 = 100.000 pessoas

O

N = N1 + N2 + N3

N

tamanho da população:

= 1.400.000 + 500.000 + 100.000 = 2.000.000 pessoas

A fração de amostragem será:

f =

n

1.000

N

= 2.000.000 = 0,0005

O

número de elementos sorteados em cada subgrupo será definido pelo produto do fator de

amostragem f pelo número de elementos de amostragem em cada subgrupo. Tem-se:

N1 . f = 1.400.000 . 0,0005 = 700 pessoas devem ser escolhidas, aleatoriamente, no subgrupo de baixa renda.

N2 . f = 500.000 . 0,0005 = 250 pessoas devem ser escolhidas, aleatoriamente, no subgrupo de renda média.

N3 . f = 100.000 . 0,0005 = 50 pessoas devem ser escolhidas, aleatoriamente, no subgrupo de renda alta.

O total de pessoas escolhidas nesta amostragem estratificada é de 1.000, sendo 700 de baixa

renda, 250 de renda média e apenas 50 de renda alta. Viu que não é difícil entender essa história de amostragem estratificada proporcional? Agora é só usar sempre que você precisar.

Amostragem por conglomerado

A amostragem por conglomerado é uma amostra aleatória simples em que cada unidade de

amostragem é um subgrupo com características heterogêneas, ou um conglomerado de elementos representativos da população. São minipopulações. Geralmente são grupos que se acham ligados por um pequeno contato físico. Ex.: casas, quarteirões, bairros, etc.

Primeiramente, devem-se especificar adequadamente os conglomerados. O número de elementos num conglomerado deverá ser pequeno em relação ao tamanho da população, e o número de conglomerados deverá ser razoavelmente grande.

Neste tipo de amostragem, a população é dividida em subgrupos com características heterogêneas, e são selecionadas amostras aleatórias simples de subgrupos. Com isso, todos os elementos dos subgrupos (conglomerados) selecionados farão parte da amostra.

A amostragem por conglomerado pode ser utilizada quando não se tem uma lista com todos

os elementos da população ou quando a obtenção dessa listagem é uma tarefa muito longa e cara.

Exemplo 1:

Deseja-se fazer uma pesquisa com os moradores de um bairro da cidade. O objetivo é saber a opinião deles sobre a construção de um grande centro de compras.

Como o bairro é grande e não se tem a listagem completa de todos os moradores e sua obtenção tornaria a pesquisa muito cara e demorada, utiliza-se uma amostragem por conglomerados. Para a realização da amostragem por conglomerados, deve-se separar o bairro em subgrupos de características heterogêneas, como, por exemplo, quarteirões. Nos quarteirões tem-se uma representação da população de moradores do bairro. O quarteirão pode ser considerado uma mini população, pois os moradores de cada quarteirão têm as mesmas características dos moradores do bairro.

Área do bairro

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

Essa imagem mostra a área do bairro, composta por 15 quarteirões. Para a escolha dos quarteirões, utiliza-se uma amostragem aleatória, e todos os moradores selecionados são entrevistados. Uma amostragem de 4 quarteirões pode ser realizada por sorteio. Colocam-se todos os números correspondentes a cada quarteirão dentro de uma urna, de onde serão tirados apenas 4. Suponha que tenham sido escolhidos os quarteirões 3, 7, 9 e 15. A todos os moradores desses quarteirões serão aplicados os questionários sobre a construção do centro de compras.

Exemplo 2:

O prefeito de uma cidade deseja realizar uma pesquisa sobre as despesas familiares de seus habitantes. Uma forma de extrair uma amostra nesta situação consiste em dividir a área total da cidade em diversas áreas menores, como quarteirões ou bairros. Selecionam-se, então, aleatoriamente, alguns desses quarteirões, com a amostra final constituída de todas as famílias residentes em alguns deles.

Nesse tipo de amostragem, torna-se muito menos dispendioso, em termos de custo e tempo, trabalhar com uma amostra em que as famílias estão mais próximas, em conglomerados, do que com famílias selecionadas aleatoriamente sobre toda a área de uma cidade. Se a amostra aleatória fosse realizada em toda a cidade, o custo e o tempo de análise das respostas seriam muito maiores, pois os pesquisadores teriam que rodar distâncias mais longas para realizar as entrevistas com as famílias. Diante dos conceitos e características apresentados sobre amostragem por conglomerados, é a sua vez de colocar em prática o que aprendeu.

EXERCÍCIO

1) Suponha que uma pesquisa seja realizada na cidade de Petrópolis-RJ. O objetivo é determinar as principais marcas de preferência de consumo de determinado produto pelos moradores de cada bairro. Elaborar um plano de amostragem dos moradores dos bairros por conglomerados.

Amostragem sistemática

A amostragem sistemática consiste em escolher os elementos da população de forma periódica, isto é, os elementos da população serão escolhidos em intervalos regulares. Esses intervalos serão determinados pela fórmula que definiremos a seguir.

É utilizado um sistema de seleção semelhante ao da amostragem aleatória simples. A diferença entre a amostragem aleatória simples e a amostragem sistemática é que esta última utiliza um fator periódico para a escolha dos elementos, enquanto a aleatória simples não utiliza critério algum.

Não é aconselhável a utilização deste método nos casos em que os itens estão agrupados ou listados em caráter periódico, pois a amostra poderá apresentar características tendenciosas, contendo apenas elementos com características semelhantes. Para obter uma amostragem sistemática é necessário:

1) obter uma lista da população e numerá-la de 1 a N;

k = N

n

2) calcular

chamado de passo da escolha;

, onde N é o tamanho da população e n é o tamanho da amostra. O k é

3) dividir a população em grupos de k elementos;

4) escolher aleatoriamente um número na TNA para determinar onde começar. Os elementos seguintes serão escolhidos somando-se ou subtraindo-se k ao número anterior.

Exemplo 1: A tabela a seguir apresenta os lucros líquidos, em reais, obtidos por uma empresa de eventos na realização de 30 apresentações de uma mesma banda. Queremos obter uma amostra sistemática de 5 valores de lucros líquidos, em reais.

05

20.000 17.500 12.000 10.000

15

16.200 15.000 11.000 19.000 28.000 16.800 17.000 11.200 19.600

25

9.000

10.000 15.000 14.000 10.000

11.500 14.000 13.000 15.000

8.000

12.500 11.000 14.000 18.000

01

02

03

13

23

04

14

24

06

16

26

07

17

27

08

18

28

09

19

29

11 12

21 22

10

15.200

20

14.800

30

19.200

Solução:

• A lista de todos os lucros obtidos na realização dos 30 eventos já está na tabela exibida.

• Deve-se escolher o passo que será utilizado para a escolha dos valores de lucro. O fator passo será:

k = N

= 30

n 5

=

6

• Então, devem ser escolhidos os lucros com passos de 6 em 6.

• Escolher, na TNA, um número aleatório de apenas um algarismo.

• Suponha que o número escolhido tenha sido o 3; então, o primeiro elemento da amostra de lucro

líquido é o 3. Somando-se k = 6 a esse número obtido na tabela, tem-se uma amostra de 5 itens.

3º + 6 = 9º + 6 = 15º + 6 = 21º + 6 = 27º

05

8.000

15

16.200 15.000 11.000 19.000 28.000 16.800 17.000 11.200 19.600

25

9.000

20.000 17.500 12.000 10.000

12.500 11.000 14.000 18.000

01

02

03

13

23

04

14

24

06

16

26

07

17

27

08

18

09

19

29

10

15.200

20

14.800

30

11 12

21 22

28

11.500 14.000 13.000 15.000 19.200

10.000 15.000 14.000 10.000

Então, os valores de lucro escolhidos pela amostragem sistemática são:

12.000; 18.000; 28.000; 10.000 e 14.000

EXERCÍCIO: Deseja-se selecionar uma amostra sistemática de 10 aparelhos, de um total de 200, que estão guardados no estoque. Qual seria o plano de amostragem adotado?

Casos em que uma Amostragem não se justifica

Existem três ocasiões em que é preferível analisar todos os itens de uma população.

1 - Quando a população é muito pequena. Uma população pode ser considerada pequena

quando o custo e o tempo de análise dos dados são pouco maiores do que seriam para a realização de uma amostra.

Exemplo: A análise dos dados dos 10 funcionários de uma empresa.

Neste caso, como a população é pequena, torna-se desnecessária a aplicação de uma técnica de amostragem. A análise dos dados obtidos de 10 funcionários toma muito pouco tempo e tem baixo custo.

2 - Quando há uma grande variação entre as respostas obtidas. A amostra deverá ser muito

grande para ser representativa da população; uma amostragem pequena pode levar a erros de interpretação dos resultados.

Exemplo: Se as respostas dadas a um questionário aplicado a 2.000 moradores de um bairro forem muito diferentes umas das outras, é essencial que se trabalhe com uma amostragem muito alta. Essa amostragem pode estar próxima do tamanho da população. Nesse caso, opta-se por trabalhar com toda a população, pois obtém-se um resultado mais confiável.

3 - Quando é necessária uma precisão muito alta. Nesse caso, a análise da população é a opção mais adequada.

Exemplo: Censo demográfico

EXERCÍCIO

1)

Dar exemplos de amostragem aleatória simples e de amostragem sistemática.

2)

Quais são as diferenças que você pode notar entre as amostragens aleatória simples e a sistemática?

3)

Em que situações é preferível adotar o levantamento e a análise de toda a população, ao invés de utilizar uma técnica de amostragem?

4)

Uma empresa possui 400 funcionários. Determinar um plano de amostragem aleatória para a escolha de 40 funcionários.

5)

Você é responsável por determinar a opinião dos profissionais graduados em Administração de Empresas e que atuam no mercado de trabalho de uma determinada cidade, sobre a produção industrial. Identificar a técnica de amostragem que deverá ser utilizada para cada uma das amostras representadas nos itens a, b e c, a seguir.

a) Selecionar aleatoriamente uma empresa e aplicar o questionário aos administradores

que nela trabalham.

b) Dividir a população de administradores em relação ao ramo de atividade da empresa,

realizar uma amostra aleatória dos profissionais e fazer perguntas a alguns

administradores de cada ramo.

c) Listar o nome de todos os profissionais e escolher, aleatoriamente, um certo número

deles. Os administradores escolhidos serão entrevistados no que diz respeito à produção industrial.

Séries Estatísticas

Não é conveniente apresentar os dados para uma análise exatamente da forma como são coletados. Um dos objetivos da Estatística é resumir os dados de forma clara para se ter uma visão global das características das variáveis. O principal objetivo desta nossa aula é mostrar as formas de apresentação de dados mais utilizadas, de acordo com a variável de interesse. Após a coleta dos dados, torna-se necessária a disposição deles em tabelas ou gráficos, para que haja um melhor entendimento. Na maioria das vezes, eles se encontram na forma bruta, isto é, sem qualquer ordenação ou classificação. Portanto, é necessário colocá-los em ordem crescente ou decrescente, ou até mesmo classificá-los de acordo com as variáveis que os representam. Exemplo: Uma amostra da altura de 122 pessoas presentes em um evento.

Os valores referentes às alturas podem ser colocados em ordem crescente e estar associados a um grupo de pessoas que apresentam a mesma altura. Isto é, os valores de alturas estarão posicionados em ordem crescente, como apresentado na tabela abaixo.

Alturas, em centímetros Nº de pessoas

150

├── 160

5

160

├── 170

25

170

├── 180

48

180

├── 190

32

190

├── 200

10

200

├── 210

2

Total

122

A forma como essa tabela é construída será estudada com maiores detalhes em Distribuição de Freqüência.

A disposição dos dados em tabelas evita uma análise errônea, principalmente se os dados e informações coletados forem muito extensos.

se os dados e informações coletados forem muito extensos. Com a utilização de tabelas e gráficos,

Com a utilização de tabelas e gráficos, é possível fornecer informações rápidas sobre as variáveis em estudo. A tabela é uma apresentação numérica de dados coletados e ordenados de forma bem clara; o gráfico é uma apresentação geométrica mais rápida e mais clara de ser visualizada. Veja o exemplo de representação gráfica da tabela das alturas, mostrada anteriormente.

Observe que toda representação tabular usa um dos 3 fatores seguintes:

Fator cronológico ou temporal - determina a época ou o período do tempo em que ocorre.

Fator espacial ou geográfico - determina o local onde ocorre.

Fator Especificativo ou a espécie do fato - tem somente a espécie do fato ou a categoria.

De maneira geral, as representações tabulares são chamadas Séries Estatísticas.

A Série Estatística é um agrupamento dos dados referentes a uma mesma ordem de classificação.

Assim, as séries estatísticas podem ser classificadas em:

- Série Temporal

- Série Geográfica

- Série Específica

Vamos aos exemplos de cada um desses 3 tipos de série.

1. Série Temporal

Apresenta somente o fator cronológico ou temporal como variável de análise.

Exemplo:

Produção Brasileira de Motos

1996-1998

Ano

Produção (unidades)

1996

288.073

1997

426.547

1998

476.655

Fonte: Revista ISTO É – n o 1546

Apresentação do tempo:

Toda série temporal consecutiva deve ser apresentada, em uma tabela, por seus períodos inicial e final ligados por um hífen (-). Exemplos:

1991 – 1995 apresenta dados numéricos para os anos de 1991, 1992, 1993, 1994, 1995; Out 1991 – Mar 1992 apresenta dados numéricos para os meses de outubro, novembro e dezembro de 1991 e janeiro, fevereiro e março de 1992.

Toda série temporal não consecutiva deve ser apresentada, em uma tabela, por seus períodos inicial e final ligados por barra (/). Ex: 1991/1995 apresenta dados para os anos entre 1991 e 1995, deixando de apresentar dados numéricos para algum (ns) dos anos desta série.

Série Geográfica: usada para apresentar dados de diferentes regiões geográficas, em determinado tempo.

Exemplo:

Vacinação contra a Poliomielite

1993

Regiões

Quantidade

Norte

211.209

Nordeste

631.040

Sudeste

1.119.708

Sul

418.785

Centro-Oeste

185.823

Fonte: Ministério da Saúde

Série Categórica: usada para apresentar dados que se distribuem em diferentes categorias, em determinado tempo e local. Exemplo:

Avicultura Brasileira

1992

Espécies

Número

(1.000 cabeças)

Galinhas Galos, frangos, frangas e pintos Codornas

204.160

435.465

2.488

Fonte: IBGE

Séries Mistas ou Conjugadas (tabela de dupla entrada): quando são feitas combinações de duas ou mais séries.

Exemplo:

Exportação Brasileira

1985/1995

Importadores

1985

1990

1995

América Latina EUA e Canadá Europa Ásia e Oceania África e Oriente Médio

13,0

13,4

25,6

28,2

26,3

22,2

33,9

35,2

20,7

10,9

17,7

15,4

14,0

8,8

5,5

Fontes: MIC e SECEX Nota: Valores em percentagem

REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS

Os gráficos produzem uma visão mais rápida e viva do fenômeno em estudo, ajudando a visualizar as tendências e a interpretar os valores representativos deste fenômeno.

Requisitos Fundamentais na Representação Gráfica:

O gráfico deve ser simples, claro e deve expressar a verdade sobre o fenômeno em estudo;

Todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja necessidade de esclarecimentos adicionais no texto;

O título do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE escreve o título acima do gráfico;

As variáveis devem ser claramente identificadas;

A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados são muito altos, deve ser feita uma interrupção no eixo, com indicação clara da posição do zero;

O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que a parte do gráfico que se pretende evidenciar;

Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o gráfico é feito dentro de um retângulo.

Principais Tipos de Gráficos: Diagramas Cartogramas Pictogramas

Cartogramas: São representações através de mapas (cartas geográficas). Este gráfico é empregado quando o objetivo é o de relacionar os dados estatísticos diretamente com áreas geográficas ou políticas.

Pictogramas: É a representação gráfica através de figuras. Por se tratar de uma apresentação atraente, é um gráfico que desperta muito a atenção do leitor.

Diagramas:

São

gráficos

geométricos

construídos,

em

geral,

no

sistema

cartesiano.

Principais Diagramas: Gráfico em Linha, Gráfico em Colunas, Gráfico em Barras, Gráfico em Colunas ou em Barras Múltiplas e Gráfico em Setores.

Gráfico em Linha: Usado para apresentar as séries temporais. Representado num sistema de coordenadas cartesianas, cada par de valores da série corresponde a um ponto. Estes pontos são unidos por segmentos de reta. Exemplo:

Tabela 1

PRODUÇÃO BRASILEIRA DE CAFÉ

1991-1995

ANOS

PRODUÇÃO (1.000 t)

1991

2.535

1992

2.666

1993

2.122

1994

3.750

1995

2.007

FONTE: IBGE

PRODUÇÃO BRASILEIRA DE CAFÉ

1991-1995

4.000 3.500 3.000 2.500 2.000 1.500 1.000 500 0 1991 1992 1993 1994 1995 PRODUÇÃO
4.000
3.500
3.000
2.500
2.000
1.500
1.000
500
0
1991
1992
1993
1994
1995
PRODUÇÃO (1.000t)

ANOS

Regras para a elaboração de um gráfico em linhas:

Fixe a largura (l) do gráfico;

Determine a altura máxima e a altura mínima de acordo com as normas a seguir:

h mín = 60% da largura e h máx = 80% da largura

Determine os limites da escala, dividindo o maior valor a representar pela altura máxima e pela altura mínima;

Determine a escala, escolhendo um valor, de preferência inteiro, entre os valores encontrados para limites;

Trace um sistema de coordenadas cartesianas;

Determine, graficamente, todos os pontos da série;

Ligue esses pontos, dois a dois, por segmentos de reta;

Identifique, claramente, as variáveis nos dois eixos;

Acrescente o Título, a Fonte e a Legenda (quando necessária).

Gráfico em Colunas: Usado para representar as séries cronológicas, geográficas e categóricas. Representado por meio de retângulos de mesma base, dispostos verticalmente (em colunas).

Exemplo:

Tabela 1

PRODUÇÃO BRASILEIRA DE CAFÉ

1991-1995

ANOS

PRODUÇÃO (1.000 t)

1991

2.535

1992

2.666

1993

2.122

1994

3.750

1995

2.007

FONTE: IBGE

PRODUÇÃO BRASILEIRA DE CAFÉ

1991-1995

4.000 3.500 3.000 2.500 2.000 1.500 1.000 500 0 1991 1992 1993 1994 1995 PRODUÇÃO
4.000
3.500
3.000
2.500
2.000
1.500
1.000
500
0
1991
1992
1993
1994
1995
PRODUÇÃO (1.000t)

ANOS

Gráfico em Barras: Usado para representar as séries geográficas e categóricas. Representado por meio de retângulos dispostos horizontalmente (em barras).

Exemplo:

Tabela 2

EXPORTAÇÕES BRASILEIRAS MARÇO – 1995

ESTADOS

VALOR (US$ milhões)

São Paulo Minas Gerais Rio Grande do Sul Espírito Santo Paraná Santa Catarina

1.344

542

332

285

250

202

FONTE: SECEX

E X P O R T A Ç Õ E S B R A S
E
X
P
O
R
T A Ç
Õ
E
S
B
R
A S
IL E
IR
A S
M
A R
Ç
O
-
1 9 9 5
S
a
n t a
C
a t a
r in a
P a r a n á
E
s p í r it o
S
a n t o
R
io
G
r a n d e
d o
S
u
l
M
in a s
G
e r a
is
S ã o
P a u lo
0
5 0 0
1
. 0
0 0
1
. 5 0 0
V a l o r
( U
S $
m
i l h õ e s )

OBSERVAÇÕES:

1) O procedimento para a construção de um gráfico em colunas (ou barras) é análogo ao do gráfico em linhas, observando que no gráfico em barras deve-se fazer a inversão nos eixos cartesianos (o eixo x corresponde a altura e o eixo y corresponde a largura). 2) Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferência ao gráfico em barras (séries geográficas e específicas).

Gráfico em Colunas ou em Barras Múltiplas: Usado para representar as séries conjugadas.

Exemplo:

Tabela 3

BALANÇA COMERCIAL DO BRASIL 1989 – 1993

ESPECIFICAÇÕES

VALOR (US$ 1.000.000)

1989

1990

1991

1992

1993

Exportação (FOB) Importação

34.383

31.414

31.620

35.793

38.783

18.263

20.661

21.041

20.554

25.711

FONTE: Ministério da Fazenda

BALANÇA COMERCIAL DO BRASIL

1989-1993

45.000 40.000 35.000 30.000 25.000 20.000 15.000 10.000 5.000 0 1989 1990 1991 1992 1993
45.000
40.000
35.000
30.000
25.000
20.000
15.000
10.000
5.000
0
1989
1990
1991
1992
1993
Exportação (FOB)
Importação
Valor (us$ 1.000.000)

Gráfico em Setores: Construído com base em um círculo, este gráfico é usado para comparar proporções.

Exemplo:

Tabela 4

REBANHO SUINO DO SUDESTE DO BRASIL

1992

ESTADOS

QUANTIDADE (mil cabeças)

Minas Gerais Espírito Santo Rio de Janeiro São Paulo

3.363,7

430,4

308,5

2.035,9

Total

6.138,5

FONTE: IBGE

REBANHO SUÍNO DO SUDESTE DO BRASIL 1992

33% 55% 5% 7%
33%
55%
5%
7%
Minas Gerais Espírito Santo Rio de Janeiro São Paulo

Minas Gerais

Minas Gerais Espírito Santo Rio de Janeiro São Paulo

Espírito Santo

Minas Gerais Espírito Santo Rio de Janeiro São Paulo

Rio de Janeiro

Minas Gerais Espírito Santo Rio de Janeiro São Paulo

São Paulo

Regras para a elaboração de um gráfico em setores:

Trace uma circunferência. A área do círculo representa o total, isto é, 100%, devendo ser dividida em tantos setores quantas sejam as partes.

Lembre-se de que uma circunferência tem 360 ° . Então, se ao total correspondem 360 ° , a cada parte corresponderá um setor cujo ângulo x é dado

PARTE × 360

por:

x =

TOTAL

Marque os valores dos ângulos calculados na circunferência e trace os raios, separando os setores.

Para facilitar a distinção, faça um tracejado diferente em cada setor.

Coloque título e legenda no gráfico. OBS.: Para clareza dos dados, deve-se usar no máximo sete setores.

DISTRIBUIÇÃO DE FREQUÊNCIAS

Freqüentemente, ao coletar dados, o pesquisador se depara com uma grande massa de valores numéricos, que se repetem algumas vezes, dificultando sua análise e interpretação. Surge então a necessidade de organizar esses dados em uma tabela onde os valores observados se apresentam associados individualmente ou em classes com os números de suas repetições, isto é, com suas respectivas freqüências. Esta tabela recebe o nome de Distribuição de Freqüências.

De acordo com a disposição dos dados têm-se dois tipos de distribuição:

Distribuição de Freqüências Simples (dados não agrupados ou não

tabulados em classes de valores)

É uma tabela onde os valores da variável analisada aparecem individualmente correlacionados com os números de suas repetições (freqüências).

Esse tipo de distribuição é normalmente usado para representar variáveis discretas.

Exemplo:

Tabela 1

Número de Acidentes Registrados na ponte Rio-Niteroi em Janeiro de 2009

Nº de Acidentes

Nº de Dias

0

18

1

5

2

2

3

2

4

3

5

1

Total

31

FONTE: Dados Hipotéticos

Distribuição de Freqüências por Classes

tabulados em classes de valores)

(dados

agrupados ou

Quando a variável analisada apresenta um grande número de valores torna-se mais vantajoso o agrupamento destes em classes de freqüência, evitando assim grande extensão da tabela e facilitando a visualização do fenômeno como um todo.

A distribuição de freqüências por classes é uma tabela onde os valores observados são agrupados em classes, isto é, em intervalos de variações da variável em questão. Esse tipo de distribuição é normalmente usado para representar variáveis contínuas. É utilizada também para representar variáveis discretas em um grande número de valores observados.

Exemplo:

Tabela 2

Salários dos funcionários da UERJ

Salários (R$)

Nº de funcionários

1000

1200

2

1200

14001200 6

6

1400

16001400 10

10

1600

18001600 5

5

1800

20001800 2

2

 

Total

 

25

FONTE: Dados Hipotéticos

A seguir são apresentados alguns conceitos fundamentais para a compreensão dessas séries.

Dados Brutos

É

a apresentação dos dados observados na seqüência em que foram coletados, isto

é,

sem nenhuma ordenação numérica.

Exemplo:

O número de peças defeituosas obtidas da produção de uma máquina durante vinte

dias foi:

2 – 4 – 2 – 1 – 2 – 3 – 1 – 0 – 5 – 1 – 0 – 1 – 1 – 2 – 0 – 1 – 3 –

0 – 1 –

2

Rol

É a organização dos dados brutos em ordem crescente ou decrescente.

Exemplo:

O

rol do exemplo anterior é:

0

– 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 2 – 2 – 3 – 3 – 4 – 5

Amplitude Total (A T )

É a diferença entre o maior valor e o menor valor da seqüência dos dados observados.

A T = valor máximo – valor mínimo

Exemplo:

A amplitude total do rol apresentado é:

A T = 5 –

0 = 5

Freqüência Absoluta Simples (ou simplesmente freqüência)

Denotada por F i , a freqüência indica o número de ocorrências de cada valor ou o número de valores pertencentes a uma classe.

Na Tabela 1: F 6 = F(5) = 1

Na Tabela 2: F 2 = 6

Regras para a elaboração de uma Distribuição de Freqüências Simples

a) Escreve-se, ordenadamente, os dados observados na coluna indicadora.

b) Obtém-se as freqüências absolutas simples dos dados (F i ). Essas freqüências constituem o corpo da tabela.

Exemplo:

Sejam os dados abaixo representativos de uma pesquisa sobre o número de irmãos de 20 alunos da Turma Biologia/Geografia.

Dados Brutos:

1 – 3 – 0 – 5 – 2 – 1 – 1 – 0 – 0 – 1 – 4 – 3 – 1 – 0 – 1 – 2 – 2 – 1 – 3 – 1

Rol:

0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 3 – 3 – 3 – 4 – 5

A distribuição de freqüências do rol apresentado é:

Tabela 3

Número de Irmãos de 20 alunos da Turma Geo/Bio

i

Número de Irmãos (x i )

Repetições (F i )

1

0

4

2

1

8

3

2

3

4

3

3

5

4

1

6

5

1

 

Total

F i = 20

1ª Coluna (i) – número de ordem dos valores distintos da variável número de irmãos. 2ª Coluna (x i ) – valores distintos da variável número de irmãos. 3ª Coluna (F i ) – número de repetições dos valores distintos da variável número de irmãos.

Nota:

k

i

F

i

=

1

= n , onde n é igual ao número de dados observados (n = 20)

Observa-se que neste tipo de tabela não há perda de informação, podendo os dados originais serem reconstituídos a partir da distribuição elaborada.

1.6.4 Tipos de Freqüências

Para a interpretação dos resultados de uma pesquisa, conforme os tipos de informações requeridas utilizam-se diversos tipos de freqüências de dados.

A seguir serão apresentados os tipos de freqüências, derivados da distribuição de freqüências absolutas, bastante úteis na interpretação de dados.

Freqüência Total

É a soma de todas as freqüências absolutas simples em uma tabela.

k

i

F

i

=

1

=

n

A freqüência total de uma distribuição de freqüências é igual ao número total de observações (n).

Exemplo:

Na Tabela 3, temos:

6

5

F

i

=

F

1

+

F

2

+

F

3

+

F

4

+

F

i

=

1

+

F

6

=

4

+ +

8

3

+ + +

3

1

1

=

20

Freqüência Relativa Simples, ou simplesmente, Freqüência Relativa

Simbolizada por f i , a freqüência relativa simples fornece a proporção de cada valor ou de casos ocorridos em cada classe, em relação ao número total de observações. Portanto, é um número relativo. Para calcular a freqüência relativa, basta dividir a freqüência absoluta da ordem em questão pelo número de observações.

f

i =

F

i

n

As comparações expressas através de porcentagem são mais usuais. Para obter a porcentagem de cada valor ou de casos ocorridos em cada classe, multiplica-se o quociente obtido por 100, ou seja:

Nota:

k

=

i

1

f

i

=

1

Exemplo:

ou 100%

Na Tabela 3, temos:

f

1

f

f

2

3

F

1

= =

20

F

2

= =

20

4

20

8

20

=

F

3

3

=

20 20

=

=

=

0,20

×

100

=

20

%

0,40

×

100

= 40%

0,15

×

100

=

15

%

f

i

=

F

i

n

×

100

f

4

f 5

f

6

=

=

=

F

4

20

F

5

20

=

=

3

20

1

20

F

6

1

=

20 20

=

=

=

0,15

×

100

=

15

%

0,05

×

100

=

5

%

0,05

×

100

=

5

%

Freqüência Absoluta Acumulada

Denotada por Fac i , a freqüência absoluta acumulada fornece a informação de quantos elementos se situam até determinado valor. A freqüência acumulada do i- ésimo valor ou i-ésima classe (freqüência acumulada de ordem i) é obtida somando-se a freqüência desse valor ou classe com as freqüências anteriores, ou seja, é a soma de todas as freqüências de ordens menores ou igual a da ordem em questão.

Exemplo:

Fac 3 =

3

i =1

4

Fac 4 =

i =1

Exemplo:

F i = F 1 + F 2 + F 3

F i = F 1 + F 2 + F 3 + F 4

Na tabela 3, temos:

Fac 1 = F 1 = 4

Fac 2 = F 1 + F 2 = 4 + 8 = 12

Fac 3 = F 1 + F 2 + F 3 = 12 + 3 = 15

Freqüência Acumulada Relativa

Fac 4 = F 1 + F 2 + F 3 + F 4 = 15 + 3 = 18

Fac 5 = F 1 + F 2 + F 3 + F 4 + F 5 = 18 + 1 = 19

Fac 6 = F 1 + F 2 + F 3 + F 4 + F 5 + F 6 = 19 + 1 = 20

Denotada por fac i , fornece a proporção de elementos situados até determinado valor. Consiste na soma da freqüência relativa de cada valor ou classe com as freqüências relativas dos valores ou classes anteriores, ou seja, é a soma das

freqüências simples relativas de ordens menores ou iguais a da ordem em questão.

.

Exemplo:

fac 3 =

3

i =1

f i = f 1 + f 2 + f 3

Exemplo:

Na tabela 3, temos:

fac 1 = f 1 = 0,20 = 20%

fac 2 = f 1 + f 2 = 0,20 + 0,40 = 0,60 = 60%

fac 3 = f 1 + f 2 + f 3 = 0,60 + 0,15 = 0,75 = 75%

fac 4 = f 1 + f 2 + f 3 + f 4 = 0,75 + 0,15 = 0,90 = 90%

fac 5 = f 1 + f 2 + f 3 + f 4 + f 5 = 0,90 + 0,05 = 0,95 = 95%

fac 6 = f 1 + f 2 + f 3 + f 4 + f 5 + f 6 = 0,95 + 0,05 = 1 = 100%

A freqüência relativa acumulada de ordem i pode ser também calculada através do quociente:

Exemplo:

fac

=

15

3 20

=

0,75

=

75

%

=

Com relação à Tabela 3, utilizando todos os tipos de freqüências definidas anteriormente, podemos construir a seguinte distribuição de freqüências:

Tabela 4

Número de Irmãos de 20 alunos da Turma Geo/Bio

i

x

i

F

i

f

i

f i (%)

Fac i

fac i

fac i (%)

1

0

4

0,20

20

4

0,20

20

2

1

8

0,40

40

12

0,40

40

3

2

3

0,15

15

15

0,75

75

4

3

3

0,15

15

15

0,90

90

5

4

1

0,05

5

5

0,95

95

6

5

1

0,05

5

5

1,00

100

Total

 

20

1,00

100

FONTE: Dados Fictícios

Interpretação:

f 3 = 0,15; 15% dos alunos responderam que têm 2 irmãos.

F 2 = 8; 8 alunos responderam que têm 1 irmão;

fac 3 = 0,75; 75% dos alunos responderam que têm entre 0 e 2 irmãos.

Representação Gráfica de uma Distribuição de Freqüências Simples

A distribuição de Freqüências Simples é representada graficamente por um Gráfico em Hastes, um diagrama onde as freqüências são representadas por segmentos de retas perpendiculares ao eixo das abcissas. Cada segmento é determinado pelos pontos (x i ,F i ) e (x i ,0).

Exemplo: Representação gráfica da Tabela 3.

F i 8 4 3 1 0 1 2 3 4 5 x i (numero
F i
8
4
3
1
0
1
2
3
4
5
x i (numero de irmãos)

EXERCÍCIOS COMPLEMENTARES

1. Considere a seguinte distribuição de freqüências correspondente aos diferentes preços de um determinado produto pesquisados em 20 lojas.

Preços do Produto A

i

Preço (R$)

Número de Lojas

1

50

2

2

51

5

3

52

6

4

53

6

5

54

1

 

Total

20