Você está na página 1de 25

Disciplina: Estatística Básica

Professor: Alexandre da Silva Adão

1. INTRODUÇÃO À ESTATÍSTICA

1.1 Um pouco da história

A palavra estatística tem origem na palavra em latim status, traduzida como o estudo do Estado e
significava, originalmente, uma coleção de informação de interesse para o estado sobre população e
economia. Essas informações eram coletadas objetivando o resumo de informações indispensáveis para
os governantes conhecerem suas nações e para a construção de programas de governo.

Os primeiros usos da estatística envolviam compilação de dados e gráficos que descreviam vários
aspectos de um estado ou país. Em 1662, John Graunt publicou informação estatística acerca de
nascimentos e mortes. O trabalho de Graunt foi seguido por estudos sobre taxas de mortalidade e de
doenças, tamanhos de população, renda e taxas de desemprego. As famílias, os governos e as empresas
se apoiam fortemente nos dados estatísticos para orientação. Por exemplo, taxas de desemprego, taxas
de inflação, índices do consumidor e taxas de nascimento e morte são cuidadosamente compiladas de
modo regular, e os dados resultantes são usados para tomar decisões que afetam futuras contratações,
níveis de produção e expansão para novos mercados. Assim, necessitamos entender os conceitos
básicos da Estatística, bem como as suposições necessárias para o seu emprego de forma criteriosa, em
cada tipo de problema a ser analisado.

A seguir, Cordeiro (2006) nos apresenta um pouco da cronologia da Ciência Estatística.

5000 a.C. Surgiram os primeiros registros egípcios de presos de guerra.


2000 a.C. Houve o primeiro censo Chinês.
695 Primeira utilização da média ponderada pelos árabes na contagem de moedas.
1303 Origem dos números combinatórios (Shihcieh Chu).
1654 Pierre de Fermat e Blaise Pascal, dois famosos matemáticos, estabelecem os Princípios do
Cálculo das Probabilidades.
1763 Primeiras ideias das técnicas de Inferência Estatística (Thomas Bayes).
1930 Início das técnicas de Controle Estatístico de Qualidade nas indústrias.
1940 Invenção do Computador Eletrônico.
1.2 O que é Estatística?

Consideramos que a Estatística representa um conjunto de técnicas e métodos de pesquisa que


fornecem técnicas que nos permite coletar, organizar, descrever, analisar e interpretar dados oriundos
de estudos ou experimentos realizados, em qualquer área do conhecimento. Estamos denominando por
dados a um (ou mais) conjunto de valores, numéricos ou não. A aplicabilidade das técnicas a serem
discutidas se dá nas mais variadas áreas das atividades humanas. Nesse sentido, o principal objetivo da
Estatística é nos auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de
informações numéricas.

A Estatística pode ser dividida em três áreas, a saber:

 Estatística Descritiva: conjunto de técnicas destinadas a descrever e resumir os dados, a fim de


tirarmos conclusões a respeito de características de interesse. Em geral utilizamos a Estatística
Descritiva na etapa inicial da análise quando tomamos contato com os dados pela primeira vez.
Objetivando tirar conclusões de modo informal e direto, a maneira mais simples seria a observação dos
valores colhidos. Entretanto ao depararmos com uma grande massa de dados percebemos,
imediatamente, que a tarefa pode não ser simples. Para tentar retirar dos dados informações a respeito
do fenômeno sob estudo, é preciso aplicar algumas técnicas que nos permitam simplificar a informação
daquele particular conjunto de valores. A finalidade da Estatística Descritiva é tornar as coisas mais
fáceis de entender, de relatar e discutir. A média industrial Dow-Jones, a taxa de desemprego, o custo
de vida, o índice pluviométrico, a quilometragem média por litro de combustível, as médias de
estudantes são exemplos de dados tratados pela Estatística Descritiva.

 Probabilidade: teoria matemática utilizada para se estudar a incerteza associada a fenômenos


aleatórios. Jogos de dados e de cartas, ou o lançamento de uma moeda para o ar enquadram-se na
categoria do acaso. A maioria dos jogos esportivos também é influenciada pelo acaso até certo ponto. A
decisão de um fabricante de cola de empreender uma grande campanha de propaganda visando a
aumentar sua participação no mercado, a decisão de parar de imunizar pessoas com menos de vinte
anos contra determinada doença, a decisão de arriscar-se a atravessar uma rua no meio do quarteirão,
todas utilizam a probabilidade consciente ou inconscientemente.

2
 Inferência Estatística: denominação usualmente empregada ao estudo de técnicas que
possibilitam a extrapolação a um grande conjunto de dados (população), das informações e conclusões
obtidas a partir de um subconjunto de valores (amostra). Deve-se notar que se tivermos acesso a todos
os elementos que desejamos estudar, não é necessário o uso das técnicas de inferência estatística;
entretanto, elas são indispensáveis quando existe a impossibilidade de acesso a todo o conjunto de
dados, por razões de natureza econômica, ética ou física.

Estudos complexos envolvendo o tratamento estatístico dos dados usualmente envolvem as três áreas
mencionadas anteriormente. Para exemplificar tal procedimento, considere o esquema apresentado na
Figura 1, a seguir:

Figura 1. Estatística na prática.


Fonte: Adaptado de Oliveira e Oliveira (2009).

A Figura 1 ilustra como a Estatística funciona na prática. Suponha, inicialmente, que estamos
interessados em estudar algumas características em um grande conjunto de dados que denominaremos
população. Deve-se considerar que, na terminologia estatística, população refere-se não somente a
uma coleção de indivíduos, mas ao alvo no qual reside nosso interesse. Assim, todos os clientes de um
banco, todos os alunos de uma faculdade, todos os automóveis de uma determinada marca, ou mesmo
todo o sangue no corpo de uma pessoa são exemplos de possíveis populações. Algumas vezes,
podemos acessar todos os dados da população (nesse caso, dizemos que o censo foi realizado), mas, em
muitas situações, tal procedimento não pode ser realizado. Em geral, razões econômicas e éticas são as
mais determinantes dessas situações. Para contornar esse fato, tomamos alguns elementos da população
para formar um grupo a ser estudado. Esse subconjunto da população, em geral, com dimensão
sensivelmente menor, é denominado amostra.

3
A seleção de uma amostra pode ser feita de várias maneiras, dependendo, entre outros fatores, do grau
de conhecimento que temos da população, da quantidade de recursos disponíveis, e assim por diante.
Existem técnicas adequadas de amostragem que nos auxiliam na obtenção de um subconjunto de
valores o mais parecido possível com a população que lhe dá origem. Algumas dessas técnicas serão
vistas posteriormente.

Obtida uma amostra, o próximo passo é utilizar as técnicas de Estatística Descritiva para organizar e
descrever os resultados contidos na amostra. A partir daí, podemos usar técnicas de Inferência
Estatística para estimar quantidades desconhecidas, realizar extrapolação dos resultados e testar
algumas hipóteses de interesse sobre a população.

1.3 A natureza da Estatística

Para realizarmos um estudo estatístico, normalmente, existem várias etapas a serem realizadas. Essas
etapas são chamadas de fases do método estatístico. Quando você tiver bem definido essas fases, e tiver
condições de realizá-las de forma adequada, a chance de sucesso em um trabalho estatístico ou que
envolva estatística será muito maior. O método Estatístico consiste em técnicas utilizadas na pesquisa
de fenômenos coletivos. É composto das seguintes fases:

 Definição do problema;
 Planejamento do processo de resolução;
 Coleta dos dados;
 Organização de dados;
 Apresentação de dados;
 Análise e interpretação dos resultados.

A seguir, são apresentadas cada uma dessas fases de forma detalhada.

 Definição do Problema
Esta fase consiste na definição e na formulação correta do problema a ser estudado. Para isso, você
deve procurar outros estudos realizados sobre o tema escolhido, pois, desse modo, você evitará cometer
erros que já tenham sido cometidos por outros. Sendo assim, essa primeira fase pode responder à
definição de um problema ou, simplesmente, dar resposta a um interesse de profissionais.

4
 Planejamento
Após definir o problema, é preciso determinar um processo para resolvê-lo e, em especial, a forma de
como obter informações sobre a variável ou as variáveis em estudo. É nessa fase que devemos decidir
pela observação da população ou de uma amostra. Portanto, será necessário:
 Determinar os procedimentos necessários para resolver o problema, em especial, como levantar
informações sobre o assunto objeto do estudo;
 Planejar o trabalho tendo em vista o objetivo a ser atingido;
 Escolher e formular corretamente as perguntas;
 Definir o tipo de levantamento – censitário ou por amostragem;
 Definir cronograma de atividades, custos envolvidos, delineamento da amostra etc.

 Coleta dos dados


Agora que você já planejou o seu trabalho, vamos para a terceira etapa, que consiste na coleta de dados.
Essa fase que deve ser seguida com cuidado, pois dados mal coletados resultam em estatísticas
inadequadas ou que não refletem a situação que você deseja estudar. Os dados podem ser coletados, por
exemplo, por meio de questionário, observação, experimentação ou pesquisa bibliográfica.

A coleta dos dados pode ser feita de forma direta ou indireta.

A coleta é dita direta, quando são obtidos diretamente da fonte primária, como os levantamentos de
campo através de questionários. Há três tipos de coleta direta:
 Coleta Contínua: quando os dados são obtidos ininterruptamente, automaticamente e na vigência
de um determinado período: um ano, por exemplo. É o caso dos registros de casamentos, óbitos e
nascimentos, escrita comercial, as construções civis.
 Coleta Periódica: quando feita em intervalos constantes de tempo, como o recenseamento
demográfico a cada dez anos e o censo industrial, anualmente.
 Coleta Ocasional: quando os dados forem colhidos esporadicamente, atendendo a uma conjuntura
qualquer ou a uma emergência, como por exemplo, um surto epidêmico.

A coleta é dita indireta quando é inferida a partir dos elementos conseguidos pela coleta direta, ou
através do conhecimento de outros fenômenos que, de algum modo, estejam relacionados com o
fenômeno em questão. Um instrumento por meio do qual se faz a coleta das unidades estatísticas é o
questionário. Deve ficar bem claro no questionário, que ele é organizado de acordo com dispositivos
legais, que há sansões e que o sigilo sobre as informações individuais será absoluto. É aconselhável que
5
um pequeno percentual dos exemplares do questionário seja tirado e aplicado a uma parcela de
informantes, com objetivo de testar a aceitação do mesmo, constituindo tal iniciativa, a pesquisa piloto.
A boa aceitação dos questionários determinará a tiragem completa dos exemplares ou a sua alteração.

 Organização de dados
Agora que temos os dados precisamos organizá-los, pois somente coletar os dados não é suficiente.
Essa organização consiste em “resumir” os dados através da sua contagem e agrupamento. Desse
modo, obtemos um conjunto de informações que irá conduzir ao estudo do atributo estatístico.
Geralmente, essa organização é feita em planilhas eletrônicas (tipo Excel) para posterior tratamento
estatístico.

 Apresentação de dados
Agora que temos os dados organizados, precisamos apresentá-los e, para tanto, existem duas formas de
apresentação que podem ser utilizadas, que não se excluem mutuamente, a saber: apresentação por
tabelas e apresentação por gráficos. Essas formas de expor as informações coletadas permitem
sintetizar uma grande quantidade de dados (números), tornando mais fácil a compreensão do atributo
em estudo e permitindo uma futura análise.

 Análise e interpretação de dados


Nessa fase, novos números são calculados com médias embasadas nos dados coletados. Esses novos
números permitem fazer uma descrição do fenômeno em estudo, evidenciando algumas das suas
características particulares. Nessa fase, ainda é possível, por vezes, “arriscar” alguma generalização a
qual envolverá sempre algum grau de incerteza.

1.4 Tipos de Variáveis

Qualquer característica associada a uma população é chamada de variável. Ela recebe esse nome
porque ela “varia” de alguma forma. A idade de um indivíduo, o sexo ou o estado civil são possíveis
exemplos de variáveis. Alguns conjuntos de dados consistem de números (tais como, altura de 1,50 m a
2,15 m), enquanto outros são não numéricos (tais como, cor dos olhos: verde e castanho). Os termos
dados quantitativos e dados qualitativos são, em geral, usados para distinguir entre esses dois tipos.
Dessa forma, as variáveis podem ser classificadas como Qualitativas ou Quantitativas. Vejamos um
exemplo.

6
Exemplo 1. A MD Indústria e Comércio, desejando melhorar o nível de seus funcionários, montou um
curso experimental e indicou 25 funcionários para a primeira turma. Os dados estão dispostos na Tabela
1. Como havia dúvidas quanto à adoção de um único critério de avaliação, cada instrutor adotou seu
próprio sistema de aferição.

De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais de um)
resultado correspondendo à realização de uma característica (ou características). Por exemplo,
considerando a variável conceito em inglês, para cada funcionário, pode-se associar um dos resultados,
A, B, C ou D.

Tabela 1. Informações sobre seção, grau de instrução, números de filhos, notas e conceitos nas
disciplinas redação, inglês, metodologia e política de 25 empregados da MD Indústria e Comércio.
Func. Seção Grau de instrução N° de filhos Redação Inglês Metodologia Política
1 Pessoal Ensino Médio 0 8,6 B A 9,0
2 Pessoal Fundamental 2 7,0 B C 6,5
3 Pessoal Ensino Médio 3 8,0 D B 9,0
4 Pessoal Ensino Médio 1 8,6 D C 6,0
5 Pessoal Superior 2 8,0 A A 6,5
6 Pessoal Superior 1 8,5 B A 6,5
7 Pessoal Fundamental 1 8,2 D C 9,0
8 Técnica Fundamental 2 7,5 B C 6,0
9 Técnica Superior 3 9,4 B B 10,0
10 Técnica Ensino Médio 4 7,9 B C 9,0
11 Técnica Fundamental 2 8,6 C B 10,0
12 Técnica Ensino Médio 3 8,3 D B 6,5
13 Técnica Superior 1 7,0 B C 6,0
14 Técnica Superior 1 8,6 A B 10,0
15 Venda Ensino Médio 0 8,6 C B 10,0
16 Venda Fundamental 1 9,5 A A 9,0
17 Venda Superior 0 7,3 D C 10,0
18 Venda Fundamental 0 7,6 C C 6,0
19 Venda Superior 3 7,4 D C 6,0
20 Venda Superior 2 7,5 C B 6,0
21 Venda Fundamental 1 7,7 D B 6,5
22 Venda Ensino Médio 2 8,7 C A 6,0
23 Venda Fundamental 1 7,3 C C 9,0
24 Venda Superior 0 8,5 A A 6,5
25 Venda Superior 1 7,0 B A 9,0
Fonte: Adaptado de Bussab e Morettin (2006).

Algumas variáveis, como seção, grau de instrução, conceito em inglês e conceito em metodologia,
apresentam como possíveis resultados uma qualidade (ou atributo) do indivíduo pesquisado. Logo,

7
essas variáveis são chamadas de variáveis qualitativas. Dentre as variáveis qualitativas, ainda
podemos fazer uma distinção entre dois tipos, a saber: variável qualitativa nominal ou variável
qualitativa ordinal.

Uma variável é qualitativa nominal se não existe nenhuma ordenação nos possíveis resultados.
Possíveis exemplos são seção a que o funcionário pertence, sexo, raça etc.

Uma variável é qualitativa ordinal se existe uma ordem natural nos seus resultados. Alguns exemplos
são grau de instrução, conceito em inglês, classe social etc.

As variáveis, nota em redação, nota em política e número de filhos, apresentam como possíveis
resultados números resultantes de uma contagem ou mensuração. Essas variáveis são chamadas de
variáveis quantitativas. As variáveis quantitativas também podem sofrer uma classificação
dicotômica: discreta ou contínua. Uma variável é quantitativa discreta se os seus possíveis valores
formam um conjunto finito ou infinito enumerável de números, e que resultam, frequentemente, de
uma contagem. Alguns exemplos são números de filhos, números de carros na família etc. Uma
variável é quantitativa contínua se os seus possíveis valores pertencem a um intervalo de números
reais, e que resultam de uma mensuração. Possíveis exemplos são nota em redação e política, peso,
altura etc.

Para cada tipo de variável existem técnicas apropriadas para resumir as informações dos dados obtidos
da amostra. Por exemplo, a utilização de uma tabela é um meio de descrever os dados de uma forma
resumida. Veremos mais detalhes sobre tabelas e gráficos nas próximas seções.

Em algumas situações, podemos atribuir valores numéricos às várias qualidades ou atributos de uma
variável qualitativa e, depois, se proceder à análise como se esta fosse quantitativa, desde que o
procedimento seja passível de interpretação.

Existe um tipo de variável qualitativa para a qual essa quantificação é muito útil: a chamada variável
dicotômica. Para essa variável, podem ocorrer somente duas realizações, usualmente, chamadas de
sucesso e fracasso. Exemplos de variáveis dicotômicas são sexo, hábito de fumar (sim ou não) etc.

8
1.5 Técnicas de Amostragem
Como podemos determinar quantas pessoas em uma população apresentam certa característica? Por
exemplo, quantos eleitores apoiam um candidato à presidência? Ou então, da população de
determinado estado, quantas pessoas são crianças, quantas vivem em centros urbanos, quantas estão
desempregadas?

Uma forma de responder a essas questões consiste em entrevistar todas as pessoas. Mas este é um
processo demorado e caro. Outro processo possível consiste então em consultar um grupo de pessoas,
que constituem uma amostra. Se a amostra representa de fato toda a população, podemos utilizar as
características dos seus elementos para estimar as características de toda população.

A amostragem é naturalmente usada em nossa vida diária. Por exemplo, para verificar o tempero de um
alimento em preparação, podemos provar (observar) uma pequena porção desse alimento. Nesse caso,
estamos fazendo uma amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com
propósito de avaliarmos sobre a qualidade do tempero de todo o alimento.

Por que realizar amostragem?


Existem várias razões para o uso de amostragem em levantamento de grandes populações. Algumas
delas, entre outras, são as seguintes:
 Economia: em geral, torna-se bem mais econômico o levantamento de somente uma parte da
população.
 Tempo: numa pesquisa eleitoral, a três dias de uma eleição presidencial, não haveria tempo
suficiente para pesquisar toda a população de eleitores do país.
 Operacionalidade: é mais fácil realizar operações de pequena escala. Um dos problemas típicos
nos grandes censos é o controle dos entrevistadores.

Quando o uso de amostragem não é interessante?


 População pequena: não há necessidade de utilizar técnicas estatísticas, pois nesse caso, é
aconselhável realizar o censo (análise de toda a população).
 Característica de fácil mensuração: talvez a população não seja tão pequena, mas a variável que
se quer observar é de tão fácil mensuração que não compensa investir num plano de amostragem. Por
exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de
trabalho, podemos entrevistar toda a população no próprio local de trabalho. Essa atitude pode ser
politicamente mais recomendável.

9
 Necessidade de alta precisão: a cada dez anos, o IBGE (Instituto Brasileiro de Geografia e
Estatística) realiza um censo demográfico para estudar diversas características da população brasileira.
Dentre essas características, tem-se o número total de habitantes, uma informação fundamental para o
planejamento do país. Dessa forma, o número de habitantes precisa ser avaliado com grande precisão e,
por isso, se pesquisa toda a população.

A amostragem pode ser dividida basicamente em amostragem probabilística e não probabilística. A


primeira, por seguir as leis estatísticas, permite a expressão da probabilidade matemática, ou seja, de se
encontrar na amostra as características da população, ao passo que a segunda depende de critério e
julgamento estabelecido pelo pesquisador para a produção de uma amostra fiel.
As vantagens e desvantagens dos dois tipos é que a amostra não probabilística é mais rápida e menos
onerosa, enquanto, que a probabilística confere maior confiabilidade aos resultados obtidos, na medida
em que, nesta, cada elemento da população possui a mesma probabilidade, previamente conhecida e
diferente de zero, de ser incluído na amostra, além de que numa amostragem probabilística é
possível extrair conclusões que podem ser generalizadas para toda a população – algo que não se pode
fazer na amostragem não probabilística. As técnicas da estatística pressupõem que as amostras
utilizadas sejam probabilísticas, o que muitas vezes não se pode conseguir. No entanto o bom senso irá
indicar quando o processo de amostragem, embora não sendo probabilístico, pode ser, para efeitos
práticos, considerado como tal. Isso amplia consideravelmente as possibilidades de utilização do
método estatístico em geral.
A utilização de uma amostragem probabilística é a melhor recomendação que se deve fazer no sentido
de se garantir a representatividade da amostra, pois o acaso será o único responsável por eventuais
discrepâncias entre população e amostra, o que é levado em consideração pelos métodos de análise da
Estatística Indutiva. A seguir, são apresentadas algumas técnicas de amostragem probabilística.

 Amostragem Aleatória Simples (AAS)


A técnica de amostragem aleatória é o método mais simples e um dos mais utilizados para a seleção de
uma amostra. Para a seleção de uma AAS, precisamos ter uma lista completa dos elementos da
população. Esse tipo de amostragem consiste em selecionar a amostra através de um sorteio. Sua
principal característica está no fato de todos os elementos da população ter igual probabilidade de
serem escolhidos.

 Procedimento para o uso desse método


1. Numerar todos os elementos da população (de 1 a N) e

10
2. Efetuar sucessivos sorteios até completar o tamanho da amostra (n).
Para realizar esse sorteio, podemos utilizar urnas, tabelas de números aleatórios, ou algum software que
gere números aleatórios. A Tabela 2 foi construída usando-se o software Excel® (comando
“aleatorio()”).

Exemplo 2. Estamos interessados em estudar a qualidade da gasolina nos postos de uma determinada
cidade. Essa cidade possui N = 40 postos. A empresa que estudará a qualidade pode investigar apenas
uma amostra de n = 4 postos. Para selecionar uma amostra aleatória simples, basta escolhermos uma
posição de qualquer linha da tabela de números aleatórios e extrairmos conjuntos de dois algarismos
(pois N, que é o tamanho da população, possui 2 casas decimais), até completarmos os 4 elementos da
amostra. Se o número sorteado não existir, simplesmente, não consideramos e prosseguimos o
processo.
Escolhendo a primeira linha da tabela de números aleatórios, temos a seguinte amostra de 4 elementos:
AAS = {16, 24, 18, 27}.

Tabela 2. Tabela de números aleatórios.


1 6 81 5 29645 7 0 2 4 8 5 8 3 6 6 8 4 4 6 6 7 1 8 7 2 2 7 5 1 2 5 1 6 7 5
3 9 65 3 83330 3 2 0 0 6 4 2 1 7 3 1 3 3 6 5 9 6 7 6 8 6 8 9 3 5 7 2 6 4 5
8 5 20 4 75392 0 1 4 1 6 0 5 6 3 8 1 5 6 3 2 5 2 2 1 3 2 5 8 2 3 5 1 8 4 3
3 9 20 9 03562 2 3 5 7 2 5 5 8 2 2 3 6 8 5 3 4 7 3 5 2 6 6 4 1 3 7 2 7 3 5
6 2 90 4 51431 6 9 2 8 8 2 5 1 4 0 9 5 7 3 2 6 3 9 9 3 8 2 1 4 5 4 0 9 6 2
2 4 48 7 17313 7 7 0 5 6 3 1 4 3 9 5 4 1 0 5 9 5 6 9 8 9 8 7 6 7 5 2 6 4 8
0 8 83 2 22778 9 3 5 9 1 8 9 8 2 4 2 2 2 1 7 1 8 3 1 1 6 4 8 4 8 1 9 5 8 7
9 3 12 6 29341 1 3 8 1 0 7 1 1 3 7 3 9 2 9 5 7 2 8 2 5 6 7 4 4 7 2 7 1 7 8
2 2 94 1 51347 6 1 1 5 8 4 4 4 0 3 2 9 3 8 5 4 7 8 6 8 0 7 4 5 5 3 8 9 8 5
7 6 36 6 49121 8 6 7 3 8 3 8 1 8 8 8 9 8 8 7 8 6 3 1 6 8 6 7 5 5 2 6 8 5 7
5 8 55 9 43669 8 1 2 0 3 3 7 4 5 6 6 0 1 6 8 5 8 5 7 6 4 6 0 5 6 4 3 1 1 2
9 4 14 8 68452 9 3 2 1 5 1 8 5 3 3 6 6 1 3 6 3 5 3 6 7 2 1 7 2 8 9 5 7 4 6
7 8 47 4 82618 5 6 0 5 7 9 3 9 0 0 4 3 2 4 3 4 3 9 6 7 2 7 5 5 6 4 6 6 7 6
3 0 48 6 63412 7 3 8 7 4 4 8 2 9 8 9 0 8 2 0 1 5 5 3 3 5 8 1 7 4 6 2 2 4 2
4 1 18 2 43934 1 2 3 4 5 5 2 4 4 4 8 4 6 2 4 4 5 1 1 3 2 5 1 4 0 3 4 1 2 7
Fonte: Excel

11
 Amostragem Sistemática (AS)
É utilizada quando a população está naturalmente ordenada, como listas telefônicas, fichas de
cadastramento e em sistemas de produções contínuos, como produções de garrafas de cervejas etc.

 Procedimento para o uso desse método


1. Seja N o tamanho da população, e n o tamanho amostral. Calcula-se o intervalo de
amostragem i = N/n (considera-se apenas a parte inteira do número i).
2. Sorteia-se, utilizando-se a tabela de números aleatórios, um número x entre 1 e i, formando a
amostra: {x, (x + i), (x + 2*i), ... , (x + (n-1)*i)}.

Exemplo 3. Considerando uma turma com 49 alunos, retire uma amostra de tamanho 5, utilizando a
técnica de amostragem sistemática.

Solução: Temos que N  49, e n  5 . Logo,


1) i = N/n = 49/5 = 9,8. Considerando a parte inteira do número, temos que i = 9;
2) Sortear um número x entre 1 e i = 9 da tabela de números aleatórios que contenha um algarismo,
pois i possui 1 casa decimal. Escolhendo a última linha, temos que o primeiro número que está entre 1
e 9 é 4. Logo, a amostra será composta dos seguintes elementos:
AS = {4, 13, 22, 31, 40}.

 Amostragem Estratificada Proporcional (AEP)


A população é dividida em subgrupos, denominados estratos (por exemplo, por sexo, classe de renda,
bairro etc.), e a AAS ou AS é utilizada na seleção de uma amostra de cada estrato. Esses estratos devem
ser internamente mais homogêneos do que a população toda, com respeito às variáveis em estudo.
Aqui, um conhecimento prévio sobre a população em estudo é fundamental.

A AEP tem as seguintes características:


 dentro de cada estrato há uma grande homogeneidade (pequena variabilidade);
 entre os estratos há uma grande heterogeneidade (grande variabilidade).

É comum os estratos terem tamanhos diferentes. Nesses casos, a proporcionalidade do tamanho da


amostra de cada estrato da população deve ser mantida na amostra. Por exemplo, se um estrato
corresponde a 20% do tamanho da população, ele também deve corresponder a 20% da amostra.

12
Exemplo 4. Com o objetivo de realizar uma pesquisa de opinião sobre a gestão atual da reitoria, em
uma determinada universidade, realizaremos um levantamento por amostragem. A população é
composta por 70 professores, 80 servidores técnicos-administrativos e 800 alunos, que identificaremos
da forma apresentada na Tabela 3.

Tabela 3. Listagem da população.


Professores P01 P02 ... P70
Servidores S01 S02 ... S80
Alunos A001 A002 ... A800
Fonte: Autor

Supondo que a opinião sobre a gestão atual da reitoria possa ser relativamente homogênea, dentro de
cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para obter uma
amostra global de tamanho n = 15. A Tabela 4 mostra as relações de proporcionalidade.

Tabela 4. Relações de proporcionalidade.


Estrato Proporção na população Tamanho do subgrupo na amostra
Professores 70/950 = 0,074 (7,4 %) np = 15 x 0,074 ≈ 1
Servidores 80/950 = 0,084 (8,4%) ns = 15 x 0,084 ≈ 1
Alunos 800/950 = 0,842 (84,2%) na = 15 x 0,842 ≈ 13
Fonte: Autor

Para selecionar aleatoriamente um professor, podemos usar a tabela de números aleatórios, tomando
valores com dois algarismos. Usando a primeira linha, encontramos o seguinte professor selecionado:
{P16}. Para o servidor, usando a segunda linha da tabela, temos: {S39}. Para os alunos, precisamos
extrair números de três algarismos. Usando a terceira linha da tabela, temos: {A047, A539, A201, A416,
A056, A381, A563, A252, A213, A258, A235, A184, A339}. A amostra {P16, S39, A047, A539, A201, A416, A056, A381,
A563, A252, A213, A258, A235, A184, A339} é uma amostra estratificada proporcional da comunidade da
universidade. Cada indivíduo dessa amostra deverá ser pesquisado para se obter a opinião em relação à
gestão atual da reitoria.

 Amostragem por Conglomerado (AC)


A população é dividida em subpopulações (conglomerados) distintas (quarteirões, residências, famílias,
bairros etc.). Alguns dos conglomerados são selecionados, segundo a AAS, e todos os indivíduos nos
13
conglomerados selecionados são observados. Em geral, é menos eficiente que a AAS ou AE, mas, por
outro lado, é bem mais econômica. Tal procedimento amostral é adequado, quando é possível dividir a
população em um grande número de pequenas subpopulações.

A AC tem as seguintes características:


 dentro de cada conglomerado há uma grande heterogeneidade (grande variabilidade);
 entre os conglomerados há uma pequena variabilidade (grande homogeneidade).

Exemplo 5. Realização de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais. Usando a
técnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e, em
seguida, entrevistar todos os eleitores dessas zonas selecionadas:

3
Zona 9
6 11
1

7 12
2
4 10

8
Entrevistar todos os
eleitores dessas zonas

É fácil confundir amostragem estratificada com amostragem por conglomerado, porque ambas
envolvem a formação de subgrupos. A diferença é que a amostragem por conglomerado usa todos os
membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa uma amostra de
membros de todos os estratos.

A seguir, são apresentadas algumas técnicas de amostragem probabilística.

 Amostragem por acessibilidade (AA)


Este pode ser considerado o menos rigoroso de todos os tipos de amostragem, uma vez que se procede
a seleção dos elementos aos quais se tem acesso para que a realização da pesquisa se torne possível
Infelizmente esta situação ocorre com muita frequência na prática, uma vez que nem sempre é possível
se ter acesso a toda a população objeto de estudo, sendo assim é preciso dar segmento a pesquisa
utilizando-se a parte da população que é acessível na ocasião da pesquisa.

Exemplo 6. Entrevistar os gerentes gerais dos hotéis x e y, pois foram os que autorizaram a entrevista;
14
Exemplo 7. Ao se buscar pesquisar a população constituída por todas as peças produzidas por certa
máquina que se encontra em funcionamento, não ser possível se ter acesso à parte da população
constituída pelas peças que ainda serão produzidas;
Exemplo 8. Se fôssemos recolher uma amostra de um monte de minério, poderíamos por simplificação
retirar a amostra de uma camada próxima da superfície do monte, pois o acesso às porções interiores
seria problemático.

 Amostragem por conveniência (APC)


É uma técnica de amostragem em que, como o próprio nome implica, a amostra é identificada
primeiramente por conveniência. Elementos são incluídos na amostra sem probabilidades previamente
especificadas ou conhecidas de eles serem selecionados.

Exemplo 9. Um professor que faz pesquisas em uma universidade pode utilizar estudantes voluntários
para compor uma amostra, simplesmente porque eles estão disponíveis e participarão como objetos de
experiência por pouco ou nenhum custo.

APC tem as seguintes características:


 pode ocorrer quando, embora se tenha a possibilidade de atingir toda a população, retiramos a
amostra de uma parte que seja prontamente acessível;
 uma amostra por conveniência tanto pode produzir bons resultados como não, já que, nenhum
procedimento estatisticamente justificável possibilita uma análise de probabilidade e inferência sobre a
qualidade dos resultados da amostra.

 Amostragem intencional ou por julgamento (AI)


Nas amostras intencionais enquadram-se os diversos casos em que o pesquisador deliberadamente
escolhe certos elementos para pertencer à amostra, por julgar tais elementos bem representativos da
população.

AI tem as seguintes características:


 a intencionalidade torna uma pesquisa mais rica em termos qualitativos;
 o emprego deste tipo de amostra requer conhecimento da população e dos elementos selecionados;
 o perigo deste tipo de amostragem é obviamente grande, pois o pesquisador pode facilmente se
equivocar em seu pré-julgamento.

15
Exemplo 10. Ao se almejar investigar variáveis inerentes a uma comunidade, proceder à aplicação dos
questionários junto aos líderes desta mesma, por julgar que estes sejam representativos da mesma.

Exemplo 11. Em uma pesquisa que tenha por objetivo identificar atitudes políticas de um grupo de
operários, como a pesquisa tem como objetivo a mobilização do grupo envolvido, será interessante
selecionar trabalhadores conhecidos como elementos ativos em relação aos movimentos sindicais e
políticos, bem como trabalhadores sem qualquer participação em movimentos dessa natureza. As
informações que estes dois grupos de trabalhadores podem transmitir serão muito mais ricas as que
seriam obtidas com base em critérios rígidos de seleção de amostras. Estas informações não são
generalizáveis para totalidade da população, mas podem proporcionar os elementos necessários para
identificação da dinâmica do movimento.

 Amostragem por cotas (ACO)


A amostragem por cotas é um tipo de amostragem por julgamento. Em uma amostra por cota, fixam-se
cotas de acordo com determinados critérios, mas, dentro das cotas, a escolha dos itens da amostra
depende de julgamento pessoal.

ACO tem as seguintes características:


 Apresenta maior rigor dentre as amostragens não probabilísticas;
 o custo por entrevistado pode ser relativamente pequeno para uma amostra por cota, mas há
numerosas oportunidades de vícios que podem invalidar os resultados.

Exemplo 12. Em uma pesquisa sobre audição de rádio, o entrevistador pode ser mandado entrevistar
500 pessoas residentes em determinada área, de tal forma que, de cada 100 pessoas entrevistadas, 50
sejam donas de casa, 30 sejam fazendeiros e 20, crianças de menos de 15 anos. Dentro destas cotas, o
entrevistador tem liberdade de escolher os entrevistados.

1.6 Apresentação de dados estatísticos

A apresentação de dados estatísticos na forma tabular consiste na reunião ou grupamento dos dados em
tabelas ou quadros com a finalidade de apresentá-los de modo ordenado, simples e de fácil percepção e
com economia de espaço.

16
 Componentes Básicos

Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos:


Título
CABEÇALHO

Coluna
Linha

Rodapé

 Principais Elementos de uma Tabela

Título: Conjunto de informações, as mais completas possíveis, localizado no topo da tabela,


respondendo às perguntas: O quê? Onde? Quando?

Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas.

Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas.

Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos
seus cruzamentos com as colunas.

Casa ou Célula: Espaço destinado a um só número.

Rodapé: são mencionadas a fonte, se a série é extraída de alguma publicação e, também, as notas ou
chamadas que são esclarecimentos gerais ou particulares relativos aos dados.

17
Exemplo 13:

A apresentação tabular de dados estatísticos é normalizada pela resolução nº 886 de 26-10-1966 do


Conselho Nacional de Estatística a fim de uniformizar a apresentação de dados.

1.7 Séries estatísticas

É toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função de três
elementos: época, local e espécie. Esses elementos determinam o surgimento de quatro tipos
fundamentais de séries estatísticas:

 Séries Temporais ou Cronológicas


São aquelas nas quais os dados são reunidos segundo o tempo que varia, permanecendo fixos o local e
a espécie.

Exemplo 14:
Tabela 5. Produção de petróleo bruto – Brasil
1966 – 1970.
Anos Quantidade (cm³)
1966 6.748.889
1967 8.508.848
1968 9.509.639
1969 10.169.531
1970 9.685.641
Fonte. Brasil em dados.
 Séries Geográficas

São aquelas nas quais os dados são reunidos segundo o local que varia permanecendo fixos o tempo e a
espécie.

18
Exemplo 15:
Tabela 6. Rebanhos bovinos – Brasil 1970.
Regiões Bovinos (1000)
Norte 2.132
Nordeste 20.194
Sudeste 35.212
Sul 18.702
Centro-oeste 15.652
Fonte. Brasil em dados.

 Séries Específicas

São aquelas nas quais os dados são reunidos segundo o espécie que varia permanecendo fixos o tempo
e o local.

Exemplo 16:
Tabela 7. Produção pesqueira (mar) – Brasil 1969.
Itens Produção (ton.)
Peixes 314
Crustáceos 62
Moluscos 3
Mamíferos 12
Fonte. Brasil em dados.

 Séries Composta ou Mista

É a combinação de dois ou mais fundamentais de séries estatísticas.

Exemplo 17: Geográfica – Temporal.

Tabela 8. Evolução do transporte de carga marítima nas 4 principais bacias brasileiras de 1968– 1970.
Anos
Bacias
1968 1969 1970
Amazônica 233.768* 324.350 316.557
Nordeste 16.873 20.272 20.246
Prata 177.705 203.966 201.464
São Francisco 53.142 48.667 57.948
Fonte. Brasil em dados. * Os dados estão em toneladas.

1.8 Gráficos Estatísticos

O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir,
no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já
que os gráficos falam mais rápido à compreensão que as séries.

19
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser
realmente útil:
 Simplicidade: o gráfico deve ser destituído de detalhes de importância secundária, assim como de
traços desnecessários que possam levar o observador a uma análise com erros;
 Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do
fenômeno em estudo;
 Veracidade: o gráfico deve expressar a verdade sobre o fenômeno em estudo.

 Gráfico de linhas
É um dos mais importantes gráficos; representa observações feitas ao longo do tempo. O gráfico em
linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas
cartesianas.
Exemplo 18:

Figura 2. Gráfico de linhas da Intenção de voto para presidente do Brasil de Julho a Setembro de 2010.
.

 Gráfico em setores (Pizza)

É um gráfico construído no círculo, dividido em setores correspondentes aos termos da série e


proporcionais aos valores numéricos dos termos da série.

20
Exemplo 19:

Figura 3. Gráfico em setores sobre a preferência por modalidades esportivas na escola Paulo XVII em
2004

 Gráficos em Barras (ou em colunas)


É a representação de uma série por meio de retângulos, dispostos horizontalmente (em barras) ou
verticalmente (em colunas).
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos
respectivos dados.

Exemplo 20:

Figura 4. Gráfico em barras sobre o Estado Civil dos Funcionários da Empresa “Trabalhadores” em
2010
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos
dados.

21
Exemplo 21:

Figura 5. Gráfico em barras sobre o Estado Civil dos Funcionários da Empresa “Trabalhadores” em
2010

 Pictograma
Constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo
atraente e sugestiva. A representação gráfica consta de figuras.

Exemplo 22:

1950

1960

1970

1980

* Cada símbolo representa 10.000.000 de habitantes

Figura 5. Pictograma da População brasileira entre 1950 a 1980

22
EXERCÍCIOS

1. Para as situações descritas, a seguir, identifique a população e a amostra correspondente e discuta a


validade do processo de inferência estatística para cada um dos casos.
a. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
b. Para verificar a audiência de um programa de TV, 563 indivíduos foram entrevistados, por telefone,
com relação ao canal em que estavam sintonizados.
c. A fim de avaliar a intenção de voto para presidente dos brasileiros, 122 pessoas foram entrevistadas
em Brasília.

2. Classifique cada uma das variáveis abaixo em qualitativa (nominal ou ordinal), ou quantitativa
(discreta ou contínua).
a. Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de “não
sei”).
b. Perda de peso de maratonistas na Corrida de São Silvestre, em quilos.
c. Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve, moderada, forte).
d. Grau de satisfação da população brasileira com relação ao trabalho de seu presidente (valores de 0 a
5, com 0 indicando totalmente insatisfeito, e 5, totalmente satisfeito).
e. Número de peças produzidas por uma máquina num dia de trabalho (500, 1000 etc).

3. Refaça o Exemplo 4, considerando agora n = 50 indivíduos. Encontre todos os professores,


funcionários e alunos que constituem a amostra estratificada proporcional.

4. Um administrador, especialista em avaliar através de sistemas informatizados as ações da


BOVESPA, está interessado em fazer uma pesquisa nos preços das ações, para indicar aos seus clientes
se hoje é um dia favorável a fazer investimentos. Ele sabe que existe N = 500 ações em venda. Como o
tempo de estudo de cada ação é de aproximadamente 10 min., decidiu-se verificar apenas n = 25 ações.
Utilizando-se as técnicas de amostragem aleatória simples e sistemática, quais ações serão
selecionadas?

5. Um depósito em uma determinada empresa produtora de materiais eletrônicos possui N = 100


computadores, que estão separados em duas qualidades: N1 = 40 computadores Pentium 3, e N2 = 60
computadores Pentium 4. O custo para verificar se cada computador está sob controle é muito alto. O
administrador responsável disse que a empresa tem condições de verificar apenas n = 12 computadores.

23
Utilizando-se a técnica de amostragem estratificada proporcional, no primeiro estágio, e a AAS, no
segundo estágio, quais computadores devem ser selecionados?

6. Uma cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa eleitoral
vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que estão dentro dessas
zonas eleitorais, isto é, foi utilizada amostragem por conglomerado. Apresente quais serão as 15 zonas
eleitorais amostradas.

7. Em uma academia há 450 pessoas matriculadas, sendo 220 no período da manhã, 180 à tarde e 50 à
noite. Obtenha uma amostra proporcional estratificada de 65%.

8. Deseja-se fazer uma pesquisa em uma população constituída por um número maior de homens que
de mulheres. Como você faria para selecionar uma amostra:
a) Com o mesmo número de homens e mulheres?
b) Com mais mulheres do que homens?

9. Suponha que 40% da população mencionada no problema anterior seja constituída por mulheres.
Numa amostra estratificada proporcional formada por 50 indivíduos, qual seria o número de homens e
o número de mulheres? E numa amostra composta de 150 pessoas, quais seriam esses números?

10. Identifique o tipo de amostragem utilizado.


a) Ao escalar um júri um tribunal de justiça decidiu selecionar aleatoriamente 4 pessoas brancas, 3
morenas, e 4 negras.
b) Um cabo eleitoral escreve o nome de cada senador do Brasil, em cartões separados, mistura e extraí
10 nomes.
c) Um administrador hospitalar faz uma pesquisa com as pessoas que estão na fila de espera para serem
atendidas pelo sistema SUS, entrevistando uma a cada 10 pessoas da fila.

24
11. Usando o gráfico em barras, represente a tabela:

Consumo de borracha na indústria no Brasil – 1988

ESPECIFICAÇÃO QUANTIDADE
(toneladas)
Pneumáticos 238.775
Câmaras de ar 14.086
Correias 4.472
Material de conserto 19.134
Outros 4.647

Fonte: ANFAVEA****.
** Associação Nacional dos Fabricantes de Veículos Automotores

12. Represente a tabela por meio de gráfico de setores:

Área terrestre no Brasil - 1992

REGIÕES RELATIVA (%)


Norte 45,25
Nordeste 18,28
Sudeste 10,85
Sul 6,76
Centro-Oeste 18,86

Fonte: IBGE

25