Você está na página 1de 17

Ministério da Educação

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ


Campus Curitiba
Diretoria de Graduação e Educação Profissional
Departamento Acadêmico de Estatística

CONCEITOS BÁSICOS EM ESTATÍSTICA


Notas de Aulas

Profª Drª Silvana Heidemann Rocha

Curitiba,
Fevereiro/2021
SUMÁRIO

1 SIGNIFICADOS DE ESTATÍSTICA ....................................................................................... 2


2 CONCEITOS BÁSICOS EM ESTATÍSTICA ........................................................................ 2
3 TIPOS DE POPULAÇÃO, EM ESTATÍSTICA ..................................................................... 5
4 CLASSIFICAÇÃO DAS VARIÁVEIS .................................................................................... 6
5 ESCALA DAS VARIÁVEIS ..................................................................................................... 7
6 PESQUISA E LEVANTAMENTO ESTATÍSTICO ............................................................... 9
7 DIFERENÇA ENTRE DADO, INFORMAÇÃO, PROPAGANDA, CONHECIMENTO,
SABEDORIA............................................................................................................................. 11
8 NOÇÃO SOBRE AMOSTRAGEM ....................................................................................... 11
REFERÊNCIAS .......................................................................................................... 16
2

1 SIGNIFICADOS DE ESTATÍSTICA

O termo "estatística" tem vários significados, a depender do contexto em que é


usado. "Estatística" pode significar a ciência ou área do conhecimento que objetiva
descrever populações com base em amostras, por meio da coleta de dados, sendo
escrita com letra maiúscula, geralmente, nesse caso. Em estimação, "estatística"
significa uma função matemática com base numa amostra, por exemplo, na função 𝑋̅,
𝑥1 + 𝑥2+ ,…+ 𝑥𝑛
definida por 𝑋̅: 𝑅 𝑛 → 𝑅 com 𝑥̅ = 𝑋̅(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) = , em que (𝑥1, 𝑥2, … , 𝑥𝑛 )
𝑛
representa uma amostra de tamanho 𝑛 da variável 𝑋, 𝑅 representa o conjunto dos
números reais, 𝑅 𝑛 representa o produto cartesiano 𝑅 × 𝑅 × … × 𝑅 , 𝑛 vezes, 𝑋̅ é uma
estatística. Em linguagem popular, "estatística" significa o resultado de algum cálculo
obtido a partir de uma amostra, por exemplo, as estatísticas de um jogo de futebol.

2 CONCEITOS BÁSICOS EM ESTATÍSTICA

Em Estatística, o vocabulário básico é formado pelos seguintes termos:

• População ou universo: é o conjunto de elementos que têm pelo menos uma


característica em comum, a qual é objeto de investigação. É a totalidade dos itens
ou elementos considerados. Exemplos de população: pessoas, bichos, vegetais,
objetos, locais, substâncias e eleitores. Geralmente, o tamanho de uma população
é representado por N.
• Unidade elementar: é cada elemento de uma população. Exemplo: Num
reflorestamento, cada árvore é uma unidade elementar e o reflorestamento é a
população;
• Atributo: particularidade ou característica das unidades elementares. Exemplo:
Num reflorestamento, o tipo de árvore é um atributo.
• Variável: é cada atributo ou característica que pode ser avaliada, qualitativa ou
quantitativamente, numa unidade elementar. Exemplos: local de nascimento, grau
de escolaridade, idade, número de batimentos cardíacos num intervalo de tempo,
diâmetro, temperatura, aceleração, número de defeitos por metro quadrado, sexo,
religião. Geralmente, uma variável é representada por letras maiúsculas do nosso
alfabeto: X, Y, Z, T, S, dentre outros.
3

• Dado: é cada resultado de uma variável. Exemplo: para a variável "diâmetro", o


valor "2 cm" é um dado, onde "cm" representa a unidade de medida da variável;
• Amostra: é qualquer parte da população, é qualquer subconjunto não-vazio de
uma população. Exemplo: Num reflorestamento com 500 árvores, qualquer
conjunto com 10 árvores é uma amostra, sendo também uma amostra qualquer
conjunto com uma única árvore. Geralmente, o tamanho de uma amostra é
representado por n.
• Unidade amostral: é cada elemento de uma amostra;
• Recenseamento: é o processo para levantar dados em uma população;
• Censo: é um conjunto de dados referentes à uma população. Em Estatística, após
realizado um recenseamento, é usual denominar o "censo" de "população", ou
seja, o termo "população" pode significar tanto o conjunto de unidades
elementares como o conjunto de dados referentes a essa população, por
exemplo, para a variável (X) altura, medida em centímetros (cm), em uma
população de tamanho 5 (N = 5) de pessoas adultas, obteve-se o censo X: 179,
181, 165, 172, 168, sendo usual dizer "Seja a população X: 179, 181, 165, 172,
168";
• Amostragem: é o processo ou a técnica usada para levantar dados em uma
amostra;
• Informação: são dados interpretados de acordo com a realidade demonstrável
cientificamente;
• Previsão: suposição sobre o que ainda não ocorreu, baseada em metodologia
científica;
• Parâmetro: é um valor quantitativo de referência calculado sobre uma população,
é uma medida calculada para descrever uma característica de uma população.
Exemplos: média populacional, mediana populacional, variância populacional,
desvio-padrão populacional, proporção populacional, quartil populacional.
Geralmente, os parâmetros são representados por letras gregas minúsculas, por
exemplo, média populacional (𝜇), variância populacional (𝜎 2 ), desvio-padrão
populacional (𝜎), proporção populacional (𝜌);
• Estimação: é o processo de prever o valor de um parâmetro, a partir do estudo
de uma amostra;
• Estatística: Em estimação, "estatística" significa uma função matemática com
base numa amostra, por exemplo, na função 𝑋̅, definida por 𝑋̅: 𝑅 𝑛 → 𝑅 com
4

𝑋1 + 𝑋2+ ,…+ 𝑋𝑛
𝑥̅ = 𝑋̅(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = , em que (𝑋1, 𝑋2 , … , 𝑋𝑛 ) representa todas
𝑛
as amostras de tamanho 𝑛 da variável 𝑋, 𝑅 representa o conjunto dos números
reais, 𝑅 𝑛 representa o produto cartesiano 𝑅 × 𝑅 × … × 𝑅 , 𝑛 vezes, 𝑋̅ é uma
estatística. É uma medida calculada para descrever uma característica de uma
amostra. Exemplos: média amostral, variância amostral, desvio-padrão amostral,
proporção amostral, quartil amostral. Geralmente, usa-se letras maiúsculas do
nosso alfabeto para representar uma estatística. Exemplos: média amostral (𝑋̅),
mediana amostral (𝑋̃), variância amostral (𝑆 2 ), desvio-padrão amostral (𝑆),
proporção amostral (𝑃), quartil amostral (𝑄);
• Estimador: é uma função matemática calculada numa amostra e usada para
prever o valor de um parâmetro. Exemplo: média amostral, mediana amostral,
variância amostral, desvio-padrão amostral, proporção amostral, quartil amostral.
Em estimação, todo estimador é uma estatística, mas nem toda estatística é um
estimador. Geralmente, para representar um estimador usa-se a letra grega que
representa o parâmetro de interesse com um acento circunflexo. Exemplos: média
̂2 ), desvio-padrão amostral (𝜎̂), proporção
amostral (𝜇̂ ), variância amostral (𝜎
amostral (𝜌̂), estimador genérico (𝜃̂). Lê-se: 𝜇̂ mi chapéu, 𝜎̂ sigma chapéu, 𝜌̂ rô
chapéu, 𝜃̂ teta chapéu;
• Estimativa: é cada valor numérico de um estimador. Exemplo: para a variável X
"altura" e o parâmetro "média populacional 𝜇", ao selecionar uma amostra
(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) e usar o estimador "média amostral 𝜇̂ , com 𝜇̂ = 𝑋̅ ", pode-se obter a
estimativa "𝑥̅ =1,70 m", em que "m" representa a unidade de medida da variável;
nesse caso, 𝑥̅ representa um valor para o estimador 𝑋̅, ou seja, 𝑥̅ é uma estimativa
do estimador 𝑋̅, sendo 𝑥̅ uma quantidade e 𝑋̅ uma função matemática; a estimativa
𝑥̅ é o valor da função 𝑋̅ no ponto (𝑥1 , 𝑥2 , … , 𝑥𝑛 );
• Erro: é a diferença entre o valor de um parâmetro e o valor de seu estimador.
Genericamente, representa-se por 𝜃 − 𝜃̂ ;
• Tendenciosidade: característica do que é tendencioso, parcial, que privilegia
uma parte em detrimento de outra;
• Vício ou viés: maneira tendenciosa de agir; diferença persistente entre o valor do
parâmetro e o valor de seu estimador. Representa-se por 𝐸(𝜃̂) – 𝜃, em que 𝐸(𝜃̂)
representa a esperança matemática ou valor esperado para o estimador teta
chapéu;
5

• Estudo inferencial: tipo de estudo que visa generalizar ou extrapolar para a


população as conclusões obtidas com base em amostras;
• Estudo descritivo: tipo de estudo que visa descrever detalhadamente a
população, no caso de recenseamento, ou a amostra, no caso de amostragem,
sem generalizar para a população as conclusões obtidas com base em amostras;
• Estatística descritiva: ramo da ciência Estatística que objetiva descrever uma
população ou uma amostra, após a coleta de dados. Exemplo: elaboração de
tabelas, gráficos, cálculo de medidas estatísticas, tais como, amplitude, média,
moda, mediana, quartis, variância, desvio-padrão, coeficiente de variação, dentre
outras;
• Estatística inferencial: ramo da ciência Estatística que objetiva generalizar para
a população as informações obtidas nas amostras, ou seja, objetiva criar
raciocínios do tipo inferência. Exemplo de técnicas inferenciais, em Estatística:
intervalo de confiança para parâmetros, testes de hipótese, análise de variância,
análise de regressão, dentre outros;

3 TIPOS DE POPULAÇÃO, EM ESTATÍSTICA

• População finita: a quantidade de unidades elementares é finita;


• População infinita: a quantidade de unidades elementares é infinita;
• População-alvo: conjunto de unidades elementares para o qual se pretende
generalizar as conclusões obtidas com base nas amostras. Exemplo: moradores
de uma cidade;
• População referenciada ou população referida: conjunto de unidades
elementares para o qual há uma definição operacional que permita identificar as
unidades elementares. Exemplo: moradores de uma cidade, na região urbana,
exceto moradores de domicílios coletivos (quartéis, internatos, alojamentos,
pensões);
• População amostrada: conjunto de unidades elementares sobre o qual
efetivamente as amostras foram selecionadas. Só pode ser descrita após a
realização do levantamento de campo. Exemplo: moradores de uma cidade, na
região urbana, exceto moradores de domicílios coletivos, e que havia alguém no
domicílio para receber o entrevistador;
6

• População homogênea em relação à variável de interesse: todas as unidades


elementares são semelhantes ou uniformes em relação à variável de interesse,
isto é, possuem a mesma natureza, estrutura ou função se comparadas entre si;
a população possui um único estrato, assim, para compor a amostra, cada
unidade elementar pode ser selecionada independente do seu lugar na
população. Exemplos: sangue de uma pessoa em exames laboratoriais, um
alimento temperado uniformemente em relação ao sabor;
• População heterogênea em relação à variável de interesse: as unidades
elementares não são uniformes em relação à variável de interesse, isto é, não
possuem a mesma natureza, estrutura ou função se comparadas entre si; a
população possui mais de um estrato, grupo ou camada, assim, para compor a
amostra, cada unidade elementar não pode ser selecionada de qualquer lugar na
população. Exemplos: homens e mulheres são subpopulações heterogêneas em
relação à variável altura, modelos diferentes de carros são subpopulações
heterogêneas em relação ao consumo de combustível.

Em Estatística, é desejável que a população-alvo e a população amostrada sejam


coincidentes, mas nem sempre isso é possível. Em pesquisas de desenvolvimento de
alguns medicamentos ou vacinas, a população-alvo são todas as pessoas que tomarão
o medicamento ou a vacina, mas a população amostrada geralmente é formada por
voluntários(as), não coincidindo a população-alvo com a população amostrada.

4 CLASSIFICAÇÃO DAS VARIÁVEIS

Em Estatística, inicialmente, uma variável pode ser classificada em qualitativa ou


quantitativa, a depender se seus resultados (os dados) são expressos por atributos ou
por quantidades. Se ela for qualitativa, ainda pode ser classificada em nominal ou
ordinal. Se ela for quantitativa, ainda pode ser classificada em discreta ou contínua.
Uma variável é classificada qualitativa nominal se seus resultados expressam
características não quantitativas que não possuem relação de ordem ou hierarquia entre
si. Exemplos: sexo, religião, naturalidade, nacionalidade, tipo de árvore, cor, raça, etnia.
Uma variável é classificada qualitativa ordinal se seus resultados expressam
características não quantitativas que possuem relação de ordem ou hierarquia entre si.
Exemplos: grau de escolaridade, classe social, cargos dos funcionários numa organização.
7

Uma variável é classificada quantitativa discreta se seus resultados expressam


quantidades e o conjunto delas é finito ou enumerável. Por conjunto enumerável
entende-se um conjunto infinito cujos elementos podem ser colocados em
correspondência biunívoca (um a um) com o conjunto dos números naturais {0, 1, 2, 3,
4, ...}. Uma variável quantitativa discreta resulta de um processo de contagem,
geralmente. Exemplos: número de filhos, número de batimentos cardíacos num intervalo
de tempo, número de peças fabricadas por uma máquina.
Uma variável é classificada quantitativa contínua se seus resultados expressam
quantidades e o conjunto delas é infinito do tipo contínuo, por exemplo, os subconjuntos dos
números reais, também denominados de intervalos, são conjuntos contínuos. Uma variável
quantitativa contínua resulta de um processo de medição, geralmente. Exemplos:
temperatura, diâmetro, aceleração, pressão, volume, área, comprimento, idade.
Outro tipo de classificação de variáveis, em Estatística, é aquele que considera
uma variável como categórica ou como contínua, sendo que uma variável categórica
é aquela que pode ser qualitativa nominal, qualitativa ordinal ou quantitativa discreta e
uma variável contínua é a quantitativa contínua.
Ao se classificar uma variável, deve-se tomar cuidado para não interpretar
quaisquer algarismos como números ou quantidades, pois eles podem também
representar códigos. Exemplo: Para a variável sexo, pode-se usar os códigos 1, 2 e 3,
da seguinte maneira 1-Masculino, 2-Feminino e 3-Outros. Nesse caso, os algarismos 1,
2 e 3 não representam quantidades, mas apenas códigos numéricos.
Também não se deve confundir a variável com sua unidade de medida. Assim, a
natureza de uma variável é diferente da precisão do instrumento de medida, por exemplo,
a variável idade é uma variável quantitativa contínua, por natureza, pois representa
tempo de vida, independentemente de sua unidade de medida ser em anos completos.

5 ESCALA DAS VARIÁVEIS

Em todo estudo estatístico é preciso, primeiro, identificar as variáveis presentes e


classificá-las adequadamente. Ainda, é necessário identificar a escala de mensuração
dos dados para cada variável. Os tipos de escala são:
• Escala nominal: os dados não possuem relação de ordem entre si, tais como,
menor, maior, primeiro, segundo, crescente, decrescente, melhor, pior, dentre
outros. Assim, não é válido calcular medidas estatísticas como média, variância,
8

desvio-padrão, quartil, percentil, por exemplo, pois não é adequado apurar


diferença matemática entre dois dados quaisquer;
• Escala ordinal: os dados possuem relação de ordem entre si, tais como, menor,
maior, primeiro, segundo, crescente, decrescente, melhor, pior, dentre outros.
Assim, não é válido calcular medidas estatísticas como média, variância, desvio-
padrão, quartil, percentil, por exemplo, pois não é adequado apurar diferença
matemática entre dois dados quaisquer;
• Escala de intervalo ou intervalar: os dados possuem relação de ordem entre si
de modo ser possível apurar a diferença matemática entre dois dados quaisquer,
sendo que essa diferença matemática é igual entre qualquer ponto da escala. É
um tipo de escala métrica em que é possível apurar a diferença entre dois pontos
quaisquer, mas não é válido apurar razão de proporcionalidade. Por exemplo, a
temperatura de 32ºC e 34ºC tem a mesma diferença matemática de 2ºC do que a
temperatura entre 40ºC e 42ºC. No entanto, numa escala intervalar, não há
relação de proporcionalidade, por exemplo, uma temperatura de 40ºC não é
necessariamente o dobro de calor do que uma temperatura de 20ºC, pois a escala
Celsius (ºC) não tem um zero absoluto a partir do qual as medições da agitação
das moléculas são feitas. O zero na escala Celsius é apenas um zero matemático,
não um zero físico. Assim, não é necessariamente válido calcular medidas
estatísticas como média, variância, desvio-padrão, ainda que tais cálculos sejam
usuais, pois não é adequado apurar a proporção matemática entre dois dados
quaisquer; mas é adequado calcular quartis e outras medidas de posição como
percentis, decis, dentre outros.
• Escala de razão ou de proporcionalidade: os dados atendem a escala intervalar
e, além disso, existe um zero absoluto (o zero matemático coincide com o zero
físico) de modo que a proporcionalidade das medições é válida. É um tipo de
escala métrica em que é válido apurar tanto a diferença entre dois pontos
quaisquer como a proporção entre pontos quaisquer (proporção: igualdade entre
duas razões). Exemplo: uma criança com altura 0,90 m e um adulto com altura
1,80 m, além do adulto ser 0,90 m mais alto que a criança ele é o dobro da altura
da criança, da mesma maneira que outra criança com altura de 1,0 m e um adulto
com altura de 2,0 m tem o dobro da altura dessa segunda criança. Assim, é válido
calcular medidas estatísticas como média, variância, desvio-padrão, quartil,
percentil, por exemplo.
9

Conforme [1]:

Escalas Fahrenheit e Celsius (centígrado) são escalas de intervalo, e não de


proporcionalidade; a demarcação do "0" é arbitrária, não é real. Ninguém poderia
afirmar que, ao meio-dia, uma leitura de temperatura de 76 graus Fahrenheit é duas
vezes mais alta que a leitura de temperatura de 38 graus Fahrenheit. Porém, quando
medida a partir de um zero absoluto, como na escala Kelvin, a temperatura está numa
escala de proporcionalidade, porque dobrar a temperatura é, na verdade, dobrar a
velocidade média das moléculas que compõem a substância.

Quadro 1 - Exemplos de classificação de variável e identificação da escala de medição,


em Estatística
Classificação da Escala de medição
Variável Dados
variável da variável
Sexo Feminino, Masculino, Outros Qualitativa nominal Nominal

Filiação a partido político Sim, Não Qualitativa nominal Nominal


Insatisfeito, Indiferente,
Grau de satisfação Qualitativa ordinal Ordinal
Satisfeito
Quantidade de vezes que Nunca, Raramente, Quantitativa
Ordinal
vai ao mercado Frequentemente, Sempre discreta
Classificação de hotéis *, **, ***, ****, ***** Qualitativa ordinal Ordinal
Quantitativa
Notas dos alunos A, B, C, D, E, F Ordinal
contínua
Em graus Celsius ou Quantitativa
Temperatura Intervalar
Fahrenheit contínua
Quantitativa De Razão ou
Temperatura Em graus Kelvin
contínua Proporcionalidade
Quantitativa De Razão ou
Altura Em centímetros
contínua Proporcionalidade
Quantitativa De Razão ou
Idade Em dias ou anos
contínua Proporcionalidade
Nota: A classificação da variável leva em conta a natureza da variável. Já a escala de medição da
variável leva em conta as opções dos resultados possíveis para a variável.

6 PESQUISA E LEVANTAMENTO ESTATÍSTICO

Existe vários tipos de pesquisa e todas elas necessitam se delinear com clareza
o problema a ser investigado, os objetivos e a metodologia. Como exemplo de tipos de
pesquisa, tem-se a qualitativa, a quantitativa, a básica, a aplicada, a tecnologia, a
exploratória, a experimental, a histórica, a de campo, a de laboratório, a operacional, a
descritiva, a explicativa, o levantamento estatístico, a bibliográfica, a documental, a
etnográfica, o método do caso, o estudo de caso, a pesquisa-ação, a pesquisa
participante. Uma pesquisa pode abranger mais de um tipo e é comum em várias delas
realizar levantamentos estatísticos ou levantamento de dados. Nem sempre o problema,
os objetivos e a metodologia da pesquisa coincidem com o problema, os objetivos e a
10

metodologia do levantamento estatístico, uma vez que o levantamento de dados pode


ser uma parte da pesquisa.
No caso de um levantamento estatístico, suas fases são:
1. Definição do problema: quanto melhor delimitado o problema do levantamento
de dados, mais fácil será as próximas etapas;
2. Definição clara dos objetivos: objetivo geral e objetivos específicos;
3. Planejamento ou metodologia: será um recenseamento ou amostragem? Se
amostragem, qual a técnica de amostragem, o tamanho da amostra e o plano
amostral? Quais as variáveis a serem investigadas? Quais os instrumentos de
medição ou avaliação das variáveis (questionário, formulário, aparelhos)? Os
instrumentos de medição das variáveis estão calibrados adequadamente? Qual a
classificação das variáveis e as respectivas escalas de medição? Quais os
recursos humanos, materiais e financeiros disponíveis? Qual o cronograma?
Quais os resultados esperados? Realizar pesquisa-piloto para detectar as falhas
nos procedimentos, nos instrumentos de medição das variáveis, no plano de
levantamento de dados.
4. Coleta dos dados: levantar os dados nas unidades elementares ou nas unidades
amostrais, conforme o caso;
5. Crítica dos dados: analisar se os dados coletados apresentam ou não valores
valores discrepantes da massa de observações. Averiguar se eventuais valores
discrepantes correspondem à realidade ou se foram erros no registro dos dados,
no momento da coleta ou da digitação para apuração;
6. Apuração dos dados: realizar a contagem e o agrupamento dos dados
coletados;
7. Apresentação dos dados: sintetizar os dados apurados em quadros, tabelas e
gráficos de modo a fornecer uma visão objetiva, ampla, profunda, rápida e concisa
do problema investigado;
8. Análise e interpretação dos dados: se o estudo for amostragem, usar técnicas
estatísticas que permitam generalizar ou extrapolar adequadamente para a
população os resultados observados na(s) amostra(s); se for recenseamento
fazer os estudos descritivos adequados, apurar o censo; elaborar relatório com os
resultados encontrados e interpretá-los conforme à realidade, os fatos.

Após um levantamento estatístico, vem a tomada de decisão, a qual não é


necessariamente técnica, mas pertence à esfera político-administrativa.
11

7 DIFERENÇA ENTRE DADO, INFORMAÇÃO, PROPAGANDA, CONHECIMENTO,


SABEDORIA

• Dado: é cada resultado de uma variável;


• Informação: são dados interpretados de acordo com a realidade demonstrável
cientificamente;
• Propaganda: divulgação de uma ideia ou produto com a intenção de incitar
alguém a fazer alguma coisa;
• Conhecimento: entendimento consciente sobre algo; domínio de uma ciência,
arte, método ou procedimento;
• Sabedoria: conhecimento adquirido pela experiência, mas que demonstra
reflexão e sensatez; capacidade de compreender a complexidade das relações.

Em Estatística, busca-se obter informação por meio de dados. No entanto, é


comum confundir dado com informação e informação com propaganda. Para isso, é
preciso conhecimento e sabedoria para discernir os contextos, os objetivos, a
metodologia e interpretar os fatos de acordo com a realidade demonstrável e ampla.

8 NOÇÃO SOBRE AMOSTRAGEM

Nem sempre é possível fazer recenseamento, pois a população ou universo pode


ser inacessível, infinita, envolver ensaios destrutivos ou demandar muitos recursos
humanos, materiais, financeiros ou tempo para se investigar todas as unidades
elementares. Assim, técnicas de amostragem são adotadas criteriosamente, a fim de
selecionar amostras que realmente representem a população, uma vez que o objetivo
principal da amostragem é aprofundar o conhecimento sobre uma população, a partir do
estudo de uma parte dessa população. Como exemplo de ensaios destrutivos tem-se as
amostras sanguíneas, testes de airbags em veículos e testes sobre a resistência de
palitos de fósforo.
Os princípios de uma amostragem são:
1. Representatividade: cada amostra deve representar a população,
fidedignamente, a fim do estudo merecer confiança, autenticidade, ser verídico;
2. Aleatoriedade: a seleção das unidades amostrais deve se dar de acordo com o
acaso, garantindo que todas as unidades elementares tenham a mesma
probabilidade de serem sorteadas para compor a amostra; os(as)
12

pesquisadores(as) não podem ser tendenciosos na composição da amostra,


viciando ou viesando o estudo, intencionalmente ou por descuido;
3. Economicidade: não se trata apenas de economizar ou poupar recursos
financeiros, mas de selecionar uma amostra parcimoniosa o suficiente para
responder com precisão os objetivos do levantamento de dados.

Uma amostragem pode ser:


• Probabilística: todas as unidades elementares da população têm uma
probabilidade conhecida de ser sorteada para compor a amostra. Amostras
probabilísticas podem ser usadas tanto para estudos descritivos como para
estudos inferenciais;
• Não-probabilística: todas as unidades elementares não têm uma probabilidade
conhecida de ser sorteada para compor a amostra. Amostras não-probabilísticas
não podem ser usadas para estudos inferenciais, somente para estudos
descritivos;
• Aleatória: na composição da amostra, todas as unidades elementares têm a
mesma probabilidade de ser sorteada; é uma amostragem probabilística; apenas
o acaso favorece o sorteio de uma unidade elementar e não de outra;
• Não-aleatória: na composição da amostra, as unidades elementares não têm a
mesma probabilidade de serem sorteadas; é uma amostragem não-probabilística;
algo ou alguém, além do acaso, favorece o sorteio de algumas unidades
elementares em detrimento de outras;
• Com reposição: cada unidade elementar sorteada para compor a amostra é
recolocada na população antes do próximo sorteio; a mesma unidade elementar
pode ser sorteada mais de uma vez para compor a amostra;
• Sem reposição: a unidade elementar sorteada para compor a amostra não é
recolocada na população antes do próximo sorteio; a mesma unidade elementar
não pode ser sorteada novamente para compor a amostra;
• Independente: amostras independentes são amostras selecionadas
aleatoriamente para que as unidades amostrais não estejam relacionadas entre
si, considerando-se à variável de interesse. Exemplo: altura de uma pessoa e
altura de outra pessoa que não é seu familiar; os números obtidos no lançamento
de dois dados;
13

• Dependente: amostras dependentes são amostras em que as unidades


amostrais estão relacionadas entre si, considerando-se à variável de interesse.
Exemplo: altura de pais e filhos;
• Experimentalmente possível: procedimento usado para possibilitar a coleta de
amostras, em estudos exploratórios. Exemplo: amostragens de conveniência;
• Matematicamente idealizada: procedimento usado para simplificar cálculos
matemáticos em demonstrações algébricas. Exemplo: considerar amostragem
com reposição, nas demonstrações matemáticas, como aproximação de
amostragens sem reposição.

As técnicas de amostragem mais comuns são:


• Amostragem aleatória simples ou casual: pelo método da cumbuca, as N
unidades elementares são misturadas e n unidades elementares são sorteadas
ao acaso para compor a amostra; é aplicada para população homogênea em
relação à variável de interesse, sendo que a variabilidade está entre as unidades
elementares; é uma amostragem probabilística; pode ser com reposição ou sem
reposição. Exemplo: para selecionar 10 peças de um lote com 50 peças de um
mesmo tipo, enumera-as de 01 a 50. Numa urna tipo bingo ou cumbuca, coloca-
se bolinhas ou papéis enumerados de 01 a 50, mistura-se bem e retira-se sem
reposição 10 bolinhas ou papéis, sempre misturando as bolinhas ou papéis
restantes, após cada retirada; então, seleciona-se as 10 peças que correspondem
aos números sorteados nas bolinhas ou papéis;
• Amostragem sistemática: para compor a amostra, as n unidades elementares
são selecionadas a partir das N unidades elementares da população, mediante a
razão n/N, sorteando-se ao acaso o primeiro elemento entre 01 e N/n e
selecionando os próximos n - 1 elementos contando-se de N/n em N/n, a partir da
posição do primeiro sorteado; é aplicada para população homogênea em relação
à variável de interesse e que esteja pré-ordenada, sendo que a variabilidade está
entre as unidades elementares; é uma amostragem probabilística; é uma
amostragem sem reposição. Exemplo: Numa sala de aula, os 40 estudantes estão
enfileirados em filas de 6 estudantes, aproximadamente. Para compor uma
amostra de 5 estudantes para formar uma comissão para falar com a direção da
escola, a professora usa a razão 5/40 = 1/8. Ela sorteia um número entre 1 e 8 e
a partir dali conta de 8 em 8 até selecionar os 5 estudantes. Ao final, por exemplo,
os estudantes que comporão a amostra são aqueles que estavam nas posições
14

(3ª, 11ª, 19ª, 27ª, 35ª). Outros exemplos: um policial rodoviário para um carro a
cada 10 minutos, numa rodovia, para averiguar a documentação do motorista; um
técnico seleciona uma peça a cada 30, numa esteira de produção, para inspeção
de qualidade;
• Amostragem proporcional estratificada: para compor a amostra, as n unidades
elementares são selecionadas proporcionalmente a partir de k estratos, sendo
que em cada estrato a subpopulação é homogênea em relação à variável em
estudo e de estrato para estrato as subpopulações são heterogêneas em relação
à variável em estudo; é aplicada para população heterogênea em relação à
variável de interesse, a qual encontra-se dividida em estratos, grupos ou
camadas, de modo que em cada estrato as unidades elementares são uniformes
em relação à variável de interesse e de estrato para estrato elas não são
uniformes; a variabilidade persistente está entre os estratos e a variabilidade ao
acaso está dentro dos estratos; é uma amostragem probabilística; pode ser com
ou sem reposição. Exemplo: Num lote com 100 peças, 10 são do tipo I, 30 são do
tipo II e 60 são do tipo III. Para investigar a ocorrência de certo tipo de defeito,
uma amostra de 20 peças é selecionada da seguinte maneira: 2 peças do tipo I,
6 peças do tipo II e 12 peças do tipo III, sendo que essas quantidades são
sorteadas do respectivo estrato por amostragem aleatória simples ou casual.
• Amostragem por conglomerados: para compor a amostra, é sorteado um
conglomerado dentre os k conglomerados disponíveis e todas as unidades
elementares do conglomerado sorteado são estudadas; é aplicada para
população heterogênea em relação à variável de interesse, a qual encontra-se
dividida em conglomerados, de modo que em cada conglomerado as unidades
elementares não são uniformes em relação à variável de interesse e de
conglomerado para conglomerado elas são uniformes; a variabilidade persistente
está dentro do conglomerado e a variabilidade ao acaso está entre os
conglomerados; é uma amostragem probabilística; pode ser com reposição ou
sem reposição. Exemplo: (BOLFARINE; BUSSAB, 2005, p. 188) Uma população
com 2000 elementos foi dividida em 200 conglomerados de tamanhos iguais a 10
elementos. Dessa população, uma amostra de 20 conglomerados foi selecionada,
de acordo com a amostragem aleatória simples com reposição, e todos os
elementos nos conglomerados selecionados foram observados com relação à
determinada característica populacional.
15

• Amostragem de conveniência: para compor a amostra, as unidades


elementares são selecionadas de acordo com a disponibilidade delas e não de
acordo com o acaso; são amostras não-aleatórias e não-probabilísticas; só
servem para estudos descritivos e não para estudos inferenciais; geralmente
usada em pesquisas exploratórias. Exemplo: amostra formada por voluntários;
• Amostragem por quotas: semelhante à amostragem proporcional estratificada,
mas é uma amostragem por conveniência, na qual os(as) pesquisadores(as)
selecionam um número arbitrário de unidades elementares de cada estrato da
população, não respeitando a proporcionalidade dos respectivos estratos para
compor a amostra; aplicada para população heterogênea em relação à variável
de interesse; é uma amostragem não-aleatória e não-probabilística; serve apenas
para estudos descritivos e não para estudos inferenciais.

EXERCÍCIOS

Fazer a lista de exercícios 1.


16

REFERÊNCIAS

[1] D. M. LEVINE; M. L. BERENSON; D. STEPHAN. Estatística: teoria e aplicações usando


Microsoft Excel em português. Rio de Janeiro - RJ: LTC, 2000.
[2] H. BOLFARINE; W. O. BUSSAB. Elementos de amostragem. São Paulo - SP: Blucher,
2005.
[3] S. BOSLAUGH. Statistics in a nutshell: a desktop quick reference. 2 ed. Sebastopol-CA-
USA: O'Reilly, 2013.
[4] D. M. LEVINE; D. F. STEPHAN. Even you can learn statistics: a guide for everyone who
has ever been afraid of statistics. 2 ed. New Jersey - USA: Pearson Education, 2010.
[5] M. F. TRIOLA. Introdução à estatística. 7 ed. Rio de Janeiro - RJ: LTC, 1999.
[6] A. C. PEDROSA; S. M. A. GAMA. Introdução computacional à probabilidade e
estatística com Excel. 3 ed. Porto - PT: Porto, 2016.
[7] M. N. MAGALHÃES; A. C. P. d. LIMA. Noções de probabilidade e estatística. 6 ed. São
Paulo - SP: EDUSP, 2008.
[8] B. MURTEIRA; C. S. RIBEIRO; J. A. E. SILVA; C. PIMENTA; F. PIMENTA. Introdução
à estatística. 3 ed. Lisboa - PT: Escolar, 2015.
[9] D. MOORE. Estatística básica e sua prática. Rio de Janeiro - RJ: LTC, 2000.
[10] R. E. WALPOLE; R. H. MYERS; S. L. MYERS; K. YE. Probabilidade e estatística para
engenharia e ciências. 8 ed. São Paulo - SP: Pearson Prentice Hall, 2009.
[11] D. C. MONTGOMERY; G. C. RUNGER. Estatística aplicada e probabilidade para
engenheiros. 2 ed. Rio de Janeiro - RJ: LTC, 2008.
[12] R. JOHNSON; P. KUBY. Estat. São Paulo - SP: Cengage Learning, 2013.
[13] G. A. CHURCHILL Jr; T. J. BROWN; T. A. SUTER. Pesquisa básica de marketing. 7 ed.
São Paulo - SP: Cengage Learning, 2011.

Você também pode gostar