Você está na página 1de 13

1.

Introdução a Estatística e a Pesquisa

1.1 A Estatística
Estatística pode ser pensada como a ciência de aprendizagem a partir de dados. Em linhas
gerais, a Estatística fornece métodos que auxiliam o processo de tomada de decisão. A Estatística
está presente em todas as áreas da ciência que envolvam métodos para a coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de
decisões.

1.1.1 Divisões da Estatística


Usualmente a estatística pode ser dividida em duas partes que se inter-relacionam:
1) Estatística descritiva – tem por objetivo descrever uma situação por intermédio do estudo das
propriedades de uma amostra. Os procedimentos estatísticos são usados para coletar, organizar e
apresentar os dados numéricos por intermédio de gráficos e tabelas.

2) Estatística indutiva ou inferencial – conhecidas certas propriedades da amostra da população


por intermédio dos resultados obtidos na estatística descritiva, a estatística indutiva procura analisar
e interpretar os dados, inferir, induzir ou estimar as leis de comportamento para a totalidade ou parte
da população. O processo de generalização gera uma margem de incerteza devido ao fato de
que a conclusão, que se pretende obter para todos os indivíduos do conjunto analisado baseia-se
apenas em uma parcela da totalidade dos sujeitos.

1.1.2 Conceitos Básicos de Estatística

1.1.2.1 População x Amostra


 População (N) – Conjunto de todos os elementos relativos a um determinado fenômeno que
possuem pelo menos uma característica em comum, a população é o conjunto Universo, podendo
ser finita ou infinita.
 Finita - apresenta um número limitado de observações, que é passível de contagem.
 Infinita - apresenta um número ilimitado de observações que é impossível de contar e
geralmente está associada a processos.
 Amostra (n) – É um subconjunto da população e deverá ser considerada finita, a amostra deve
ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente
todas as características da população como se fosse uma fotografia desta.

1.1.2.2 Censo x Amostragem


Pesquisa Estatística é qualquer informação retirada de uma população ou amostra,
podendo ser através de Censo ou Amostragem.
 Censo – É a coleta exaustiva de informações das "N" unidades populacionais.
 Amostragem – É o processo de retirada de informações dos "n" elementos amostrais, no qual
deve seguir um método criterioso e adequado, são os tipos de amostragem.
1.1.2.3 Dados x Variável
 Dados – observações de uma ou mais variáveis. Dados usualmente provem de uma amostra, a
qual representa uma população de interesse.
 Variável – É aquilo que se deseja observar para se tirar algum tipo de conclusão, é a
característica dos elementos da amostra que nos interessa averiguar estatisticamente, por ex.,
idade, sexo, peso e outras.

Tipos de Variáveis

1.1.2.4 Parâmetros x Estatísticas


 Parâmetros – Característica sobre a população. Valores calculados usando dados da
população. Esse valor é obtido somente através do censo.
 Estatísticas ou Estimadores – Característica sobre a amostra. Valores calculados usando dados
da amostra. Essa medida é obtida através de um estimador, uma regra utilizada para calcular uma
estimativa. Torna-se possível neste caso utilizarmos as teorias inferências para que possamos fazer
conclusões sobre a população.
1.2 Fases do Método Estatístico
Estatística é uma ciência exata que estuda a coleta, a organização, a análise e registro de
dados por amostras. Utilizada desde a Antiguidade, quando se registravam os nascimentos e as
mortes das pessoas, é um método de pesquisa fundamental para tomar decisões. Isso porque
fundamenta suas conclusões nos estudos realizados. Para tanto, as fases do método estatístico são:

1º) Definição do problema – determinar como a recolha de dados pode solucionar um problema
2º) Planejamento – elaborar como fazer o levantamento dos dados
3º) Coleta de dados – reunir dados após o planeamento do trabalho pretendido, bem como
definição da periodicidade da coleta (contínua, periódica, ocasional ou indireta)
4º) Correção dos dados coletados – conferir dados para afastar algum erro por parte da pessoa
que os coletou
5º) Apuração dos dados – organização e contagem dos dados
6º) Apresentação dos dados – montagem de suportes que demonstrem o resultado da coleta dos
dados (gráficos e tabelas)
7º) Análise dos dados – exame detalhado e interpretação dos dados

1.3 Séries Estatísticas


Uma série estatística é um conjunto de dados ordenados segundo uma característica
comum, as quais servirão posteriormente para se fazer análises e inferências. Classificação das
Séries:

 Série temporal, cronológica, evolutiva ou histórica – É a série estatística em que os dados são
observados segundo a época de ocorrência. O tempo é variável e o fato e o local são fixos.

 Série geográfica ou de localização – É a série estatística em que os dados são observados


segundo a localidade de ocorrência. O local varia e o tempo e o fato são fixos.
 Série Específica ou Qualitativa – Os dados são agrupados segundo a modalidade de ocorrência.
Fato variável, tempo e local fixos.

 Série Mista – A combinação entre duas ou mais séries constituem novas séries denominadas
compostas e apresentadas em tabelas de dupla entrada. O nome da série mista surge de acordo
com a combinação de pelo menos dois elementos.
Exemplo: Local + Época = Série Geográfica Temporal

1.4 Gráficos Estatísticos


A representação gráfica dos dados estatísticos tem por objetivo apresentar de forma rápida
e concisa os resultados obtidos, permitindo-se chegar a conclusões sobre a evolução do fenômeno
ou sobre como se relacionam os valores da série. Existem várias maneiras de se representar
graficamente os dados estatísticos de acordo com os tipos de séries : Gráfico em Colunas ou Barras;
Gráfico de Setor ou Pizza; Gráfico de Linha; Diagrama de Dispersão; Histograma, etc.

1.4 Tabelas Estatísticas


Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A
elaboração de tabelas obedece à Resolução no 886, de 26 de outubro de 1966, do Conselho
Nacional de Estatística. As normas de apresentação são editadas pela Fundação Brasileira de
Geografia e Estatística (IBGE).

1.4.1 Representação Esquemática


Uma tabela deve apresentar o título, o cabeçalho, o corpo e o rodapé.
1.4.2 Elementos de uma Tabela
1) Título – O título deve responder as seguintes questões:
- O que? (Assunto a ser representado (Fato));
- Onde? (O lugar onde ocorreu o fenômeno (local));
- Quando? (A época em que se verificou o fenômeno (tempo)).
2) Cabeçalho – parte da tabela na qual é designada a natureza do conteúdo de cada coluna.
3) Corpo: parte da tabela composta por linhas e colunas.
4) Linhas – parte do corpo que contém uma sequência horizontal de informações.
5) Colunas – parte do corpo que contém uma sequência vertical de informações.
6) Coluna Indicadora – coluna que contém as discriminações correspondentes aos valores
distribuídos pelas colunas numéricas.
7) Casa ou célula – parte da tabela formada pelo cruzamento de uma linha com uma coluna.
8) Rodapé – É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas
de natureza informativa (fonte, notas e chamadas).
9) Fonte – refere-se à entidade que organizou ou forneceu os dados expostos.
10) Notas e Chamadas – são esclarecimentos contidos na tabela

1.4 Distribuição de frequência

1.4.1 Tabela Primitiva e Rol


A tabela em que os elementos não foram organizados numericamente chama-se tabela
primitiva. Por exemplo, considere o levantamento de dados da estatura de 40 alunos da escola A
(variável x), cujos resultados, em centímetros, mostrados na tabela a seguir, estão colocados na
sequência como foram obtidos.

O primeiro passo para a organização dos dados é ordená-los de forma crescente ou


decrescente. A tabela assim organizada recebe o nome de rol.

A simples organização dos dados em um rol de ordem crescente já permite determinar


diretamente o menor valor (x = 150 cm), o maior valor (x = 173 cm), o valor que mais ocorre (x = 160
cm), e a amplitude da variação (a distância entre o maior e o menor, x = 173 - 150 = 23 cm).
1.4.1 Tabela de Distribuição de frequência
Uma maneira mais concisa de mostrar os dados do rol é apresentar cada um seguido pelo
número de vezes que ocorre, ao invés de repeti-los.
O número de ocorrências de um determinado valor recebe o nome de frequência. A tabela
que contém todos os valores com a sua frequência recebe o nome de tabela de distribuição de
frequência.
Uma Tabela de distribuição de frequência pode ser classificada em:
a) Distribuição de Frequência Discreta – É uma série de dados agrupados na qual o número de
observações está relacionado com um ponto real.
b) Distribuição de Frequências Continua – Os valores estão distribuídos em intervalos. Na distribuição
de frequência, os intervalos parciais deverão ser apresentados de maneira a evitar dúvidas quanto
à classe a que permanece determinado elemento.

Veja abaixo uma distribuição de frequência construída a partir do rol anterior:

Ainda assim, o processo exige muito espaço em especial quando o número de valores da
variável (n) aumenta. O mais razoável nestes casos, em especial quando a variável é contínua, é
agrupar os valores por intervalos. Deste modo, ao invés de listar cada um dos valores que ocorrem,
listam-se os intervalos de valores e a frequência correspondente, isto é, ao invés de colocar 1 aluno
com 150 cm, 1 aluno com 151 cm, etc., coloca-se 4 alunos entre 150 e 154 cm. Este intervalo é
escrito como 150 ⊢ 154 que corresponde a 150  x < 154 (a variável pode estar desde 150 inclusive
até 154 exclusive), portanto valores 150, 150.1, 151, 152, 153, 153.5, 153.99 estariam neste intervalo,
mas 154 não. Definindo o rol de acordo com intervalos, tem-se a seguinte tabela:

Procedendo desta forma perde-se a informação detalhada das estaturas, mas ganha-se
em simplicidade, pois a análise dos dados fica simplificada. Frequentemente procedemos desta
forma numa análise estatística, pois o objetivo da estatística é justamente fazer o apanhado geral
das características de um conjunto de dados, desinteressando-se por casos particulares.
1.4.1 Elementos de uma Distribuição de Frequência

1) Classe (k) – As classes são intervalos (linhas) de variação de uma variável. As classes são
representadas simbolicamente por i, sendo i = 1, 2, ... , k, onde k é o número total de classes. O
número total de valores é simbolizado por n. Para determinar o número de classes a partir dos dados
não tabelados, podemos usar a Fórmula de Sturges.

n(K) = 1+ 3.3 log n

Exemplo: considerando o exemplo anterior n = 40


• Pela formula de Sturges: K= 1+3,3log40 = 6,28 → K = 6
• Adotando K = n , temos k = 40 =6,3 → K = 6

2) Limite de Classe (li ou Li) – São os valores extremos de cada classe.


Limite inferior (l inf)
Limite superior (Lsup)

3) Amplitude do intervalo de classe (h) – É a diferença entre dois limites inferiores ou superiores
consecutivos. A amplitude do intervalo de classe deve ser constante em todo a distribuição de
frequências continua.
𝐀
𝐡=
𝐤
Exemplo, considerando o exemplo anterior:
h = 23/ 6 = 3,83 → h = 4

4) Amplitude total (H) – É a diferença entre o limite superior da última classe e o limite inferior da 1ª
classe, ou a diferença entre último e o primeiro elemento de um conjunto de dados postos em
ordem crescente.

5) Ponto médio de classe (Xi) – É a média aritmética simples do limite inferior com o limite superior
de uma mesma classe.

6) Frequência simples (Fi) – É a quantidade de valores em cada classe.

7) Frequência Acumulada (Fac) – É o somatório da frequência absoluta da i-ésima classe com a


frequência absoluta das classes anteriores, ou a frequência acumulada da classe anterior.

8) Frequência Relativa simples (Fri) – É o quociente entre a frequência absoluta da i-ésima classe
com o somatório das frequências.

9) Frequência Relativa Acumulada (Frac) – É o somatório da frequência relativa da i-ésima classe


com as frequências relativas das classes anteriores.
10) Frequência Relativa Percentual simples (Fri %) – É obtida multiplicando a frequência relativa
simples por 100.

11) Frequência Relativa Percentual Acumulada (Frac %) – É obtida multiplicando a frequência


relativa acumulada por 100.

Lista de Exercícios

1) Em 20 dias de aula, um professor de estatística anotou o número de alunos ausentes. Depois, fez
a seguinte tabela de frequências. A letra B representa qual número?

2) Analise a tabela de distribuição de frequência abaixo:


TABELA: anos de serviço na PM, militares do 185º BPM, dezembro de 2017:

Sabe-se que f é a frequência absoluta, fac é a frequência absoluta acumulada, fr% é a frequência
relativa (percentual) e frac% é a frequência relativa (percentual) acumulada. Considerando as
informações da tabela, calcule os valores de A, B, C, D.

3) Classifique as variáveis (qualitativa nominal, qualitativa ordinal, quantitativa discreta, quantitativa


contínua):
a) Vitamina (A, B1, B2, B6, B12)
b) Quantidade de caloria na batata frita.
c) Desfecho de uma doença (curado, não curado)
d) Classificação de uma lesão (lesão fatal; severa; moderada; pequena).
e) Grupo sanguíneo (A,B,AB,O)
f) Paridade (primeira gestação, segunda gestação, terceira ...)
g) Estado geral de um paciente (bom, regular, ruim)
h) Número de nascidos vivos em certo hospital em junho/99
i) Idade
j) Concentração de flúor na água
k) Atividade esportiva preferida

4) Considerando as notas de um teste de inteligência aplicado a 100 alunos, apresentar os


resultados numa distribuição de frequência absoluta e relativa. Utilize a regra de Sturges.

5) Complete o quadro de distribuição de frequências.

6) A cantina de uma escola selecionou 50 alunos ao acaso e verificou o número de vezes por
semana que eles compravam lanche, obtendo os seguintes resultados: 0; 2; 2; 4; 3; 2; 2; 1; 1; 2; 1; 1;
0; 1; 1 ; 1; 1; 1; 1; 2; 2; 2; 3; 2; 2; 2; 0; 2; 2; 1; 1; 0; 2; 0; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 1; 2; 5; 4.
a)Construa uma tabela de distribuição de frequências.
b)Quantos alunos compram pelo menos 2 lanches por semana?

7) Um dado foi jogado 20 vezes. Em cada jogada foram obtidos os seguintes pontos: 1, 5, 6, 5, 2, 2,
2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4, 2.
a)Elabore um quadro com distribuição de frequências.
b)Quantas vezes o número 3 foi obtido no dado?
c)Quantas vezes o número obtido no dado foi menor que 5?
d)Qual o índice, em porcentagem, em que o número 6 foi obtido no dado?
e)Qual o índice, em porcentagem, em que números maiores que 4 foram obtidos?
8) A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes. Com
referência a essa tabela, determine:

a)A amplitude total.


b)O limite superior da quinta classe.
c)O limite inferior da oitava classe.
d)O ponto médio da sétima classe (xi).
e)A amplitude do intervalo da segunda classe.
f) A frequência da quarta classe.
g)A frequência relativa da sexta classe.
h)A frequência acumulada da quinta classe.
i)O número de lotes cuja área não atinge 700m².
j)O número de lotes cuja área atinge e ultrapassa 800m².
k)A porcentagem dos lotes cuja área não atinge 600m².
l) A classe do 72º lote.
m)A porcentagem dos lotes cuja área é de 500 m2, no mínimo, mas inferior a 1000 m2.
n)A porcentagem dos lotes cuja área seja maior ou igual a 900 m2.

9) Considere as alturas de 30 pessoas, conforme tabela a seguir:

a) determine o limite inferior e o limite superior da distribuição.


b) utilizando a fórmula de Sturges, determine a quantidade de classes
c) determine a amplitude de cada classe.
d) construa uma tabela de frequências.
e) qual o ponto médio da terceira classe?
f) qual a classe que possui maior frequência?
g) quantas pessoas possuem altura inferior a 1,73?
h) qual o limite superior da quarta classe?
i) qual o limite inferior da quinta classe?
j) a qual classe pertence a 20ª altura?
k) a qual classe pertence a 16º altura?
l) a qual classe pertence a 22º altura?
Gabarito
1) 5
2) 41; 89; 30,50; 90,50.
3)
a) qualitativa ordinal
b) quantitativa contínua
c) qualitativa nominal
d) qualitativa ordinal
e) qualitativa ordinal
f) qualitativa ordinal
g) qualitativa ordinal
h) quantitativa discreta
i) quantitativa contínua
j) quantitativa contínua
k) qualitativa nominal
4)

5)

6)a)

b)32
7)a)

b) 2
c)11
d)20%
e)45%
8) a) 900
b) 800
c) 1000
d) 950
e) 100
f) 76
g) 15,5%
h) 262
i)194
j)138
k) 29,5%
l) 3ª classe
m) 78%
n) 19%
9) a) Li=1,58 Ls=1,85
b) 6
c) 0,05
d)

e) 1,705
f) 5ª
g) 16
h) 1,78
i) 1,78
j) 4ª
k) 3ª
l) 5ª

1.5 Medidas de Posição (média, mediana, moda, quartis, decis e percentis)


1.6 Medidas de dispersão ou variabilidade (amplitude total, variância e desvio padrão,
coeficiente de variação)

1.7 Medidas de forma (assimetria e curtose)