Você está na página 1de 13

Fases do Trabalho Estatístico e

Organização de Dados

Themis C. Abensur Leão

Departamento de Estatística – ICE/UFAM

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 1 / 13


Método Científico
Em alguma fase do seu trabalho, o pesquisador se depara com o problema
de analisar e entender um conjunto de dados relevantes ao seu objeto de
estudo.

O método científico é utilizado pelos cientistas/pesquisadores para testar


suas teorias ou problemas.

Fases do Método Científico:

(i) formulação de questões, problemas ou teorias;

(ii) coleta de informação relevante, para isso o pesquisador pode planejar


um experimento;

(iii) conclusões tiradas através dos resultados do passo (ii).

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 2 / 13


Método Estatístico

O método estatístico é bastante utilizado para resolver as fazes (i), (ii) e


(iii) do método científico e tem por objetivo transformar dados em
informação útil e, para isso, podemos fazer uso das três áreas da
Estatística:

Análise Exploratória de Dados (ou Estatística Descritiva);

Probabilidade;

Inferência Estatística.

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 3 / 13


Análise exploratória de dados (AED)

AED é um conjunto de técnicas destinadas a descrever e resumir os dados,


a fim de que possamos tirar conclusões a respeito das características de
interesse.

É utilizada na etapa inicial da análise de dados, quando temos contato com


os dados pela primeira vez.

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 4 / 13


Probabilidade

A probabilidade é uma área da Matemática utilizada para se estudar a


incerteza proveniente de fenômenos aleatórios.

Fenômenos aleatórios podem ocorrer com um grau de incerteza sob os


resultados de um experimento. Por exemplo: dar cara no lançamento de
uma moeda viciada, ou uma face de um dado honesto, se irá chover
amanhã, etc.

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 5 / 13


Inferência Estatística

Inferência é o estudo de técnicas que possibilitam a extrapolação (a um


grande conjunto de dados denominado população) das informações e
conclusões obtidas a partir de um subconjunto de valores chamado
amostra.

População é o conjunto de todos os resultados possíveis sob investigação


que contém uma característica de interesse.

Amostra é um subconjunto da população. Supõe-se que as observações


amostrais apresentem mesmo comportamento da população, porém não
conhecemos os valores da característica de interesse.

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 6 / 13


Análise Exploratória
de Dados

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 7 / 13


Organização de dados

A Estatística tem por objetivo transformar um conjunto de dados brutos


em informação.

Um conjunto de dados apresenta resultados relacionados às características


de indivíduos (ou casos) sob investigação. Tais características recebem o
nome de variáveis.

O processo de transformação de dados em informação envolve a síntese dos


dados, análise e interpretação dos resultados.

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 8 / 13


Tipos de variáveis

Qualitativas: são representadas por possíveis realizações de qualidade


(ou atributo).
Ordinal: a qual existe uma ordem natural em seus resultados indicando
intensidades crescentes.

Nominal: a qual não é possível estabelecer uma ordenação natural de


seus resultados.

Quantitativas: são aquelas de natureza numérica resultante de uma


contagem ou mensuração.
Discreta: aquela cuja natureza é de contagem, assumindo assim,
valores inteiros, finitos ou enumeráveis.

Contínua: assume valores em intervalos de números reais e,


geralmente, são provenientes de uma mensuração.

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 9 / 13


Exemplo 1: Dados referentes a 25 compras feitas numa loja de departamento com
informação de 8 variáveis

Compra: código da compra;

Nome: nome do cliente que fez a compra;

Bairro: bairro onde o cliente mora;

Gênero: gênero do cliente (F para feminino; M para masculino);

Idade: idade do cliente no momento da compra (em anos inteiros);

Renda: renda mensal do cliente (em R$);

Itens: número de itens comprados (0, 1, 2, 3, . . .);

Valor: valor da compra (em R$).

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 10 / 13


Informações dos dados de 25 compras numa loja de departamento
Compra Nome Bairro Gênero Idade Renda Itens Valor
1 Márcio Colina M 26 1890,00 3 41,00
2 Juliana Centro F 17 1090,00 5 58,00
3 Diogo Bom Descanso M 22 2030,00 5 55,00
4 Thaís Prainha F 16 920,00 2 26,00
5 Arnaldo Colina M 43 2045,00 2 30,00
6 Tiago Prainha M 49 2235,00 3 35,00
7 Arthur Centro M 37 1955,00 2 26,00
8 Mariana Bom Descanso F 15 950,00 3 28,00
9 Vítor Centro M 45 2175,00 3 39,00
10 Marina Centro F 18 910,00 1 25,00
11 Gustavo Bom Descanso M 36 1940,00 2 20,00
12 Marília Prainha F 20 950,00 1 10,00
13 Maria Colina F 60 930,00 1 14,00
14 Neila Prainha F 21 1120,00 4 50,00
15 Pedro Prainha M 37 2155,00 4 50,00
16 José Colina M 16 1640,00 2 23,00
17 Vanessa Prainha F 22 1040,00 2 22,00
18 Samanta Centro F 17 940,00 2 23,00
.. .. .. .. .. .. .. ..
. . . . . . . .
25 Vinícius Bom Descanso M 32 1980,00 3 41,00

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 11 / 13


Variáveis como Tamanho (pequeno, médio, grande) ou Classe Social (baixa,
média, alta) são classificadas como qualitativas ordinais.

Variáveis como Nome, Bairro e Gênero são classificadas como qualitativas


nominais.

Variáveis como quantidade de itens e número de filhos são classificadas como


quantitativas discretas.

Variáveis como Renda, Valor e Peso são classificadas como quantitativas


contínuas.

Observação importante:
algumas variáveis contínuas podem ser discretizadas para se obter melhor
interpretação de sua ocorrência nos dados. Por exemplo, temos a Idade (medida
em anos). Em geral, variáveis que medem tempo são classificadas por sua
natureza como quantitativas contínuas pois o tempo pode ser medido
considerando os anos + meses + dias + horas + ....

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 12 / 13


Definições importantes

Dados Brutos: Conjunto de dados que ainda não foram numericamente


organizados, obtidos após a coleta de n valores.

Rol: é um arranjo dos dados brutos em ordem crescente.

Amplitude Total (AT): é a diferença entre o maior e o menor valor


observado,
AT = max − min.

Exemplo 2: Idades de 15 estudantes do Curso de Engenharia Civil da UFAM.


dados brutos: 19 23 21 20 20 19 22 25 20 23 22 21 20 19 24
rol: 19 19 19 20 20 20 20 21 21 22 22 23 23 24 25

AT = 25 − 19 = 6.

Themis Leão (DE-UFAM) Pesquisa e Organização de Dados 13 / 13

Você também pode gostar