Você está na página 1de 3

Análise Exploratória de Dados (AED) – Aula 1 – Prof.

Ronaldo Rocha Bastos


1) Mensuração, Tipos de variáveis e suas Escalas

Mensuração:
Atribuição de numerais (por exemplo: 3, III, 11) a objetos de acordo com certas
regras.

Escalas de Mensuração1

Escala de
Regras Matemáticas permitidas
Mensuração
1. Nominal† - correspondência um a um
2. Ordinal† - correspondência um a um
- relações de ordem com transformação
monotônica
3. Intervalar‡ - correspondência um a um
- atribuição de postos (“ranking”)
- igualdade de diferenças
4. Razão‡ - correspondência um a um
- atribuição de postos (“ranking”)
- igualdade de diferenças
- divisão e multiplicação
1. e 2. são usualmente chamados de dados categóricos ou dados qualitativos.
3. e 4. são usualmente chamados de dados numéricos ou dados quantitativos
† 2 categorias apenas: binárias (dicotômica, booleana [V,F], Bernoulli [0,1])
‡ discretas / contínuas ; temporais (duração / momento (início ou fim de um evento)
Exemplo de um conjunto de dados descrito em estrutura de casos. Classificar variáveis B a H
A B C D E F G H
No. Nome Sexo Data nasc. Alt. (cm) Nation. Cor dos olhos Escolaridade
1 Aurélio M 24/04/1965 170 BR castanho fundamental
2 Adriano M 25/02/1956 163 BR azul médio
3 Júlio M 12/03/1982 162 ARG preto superior
4 Emília F 30/12/1981 165 BR verde fundamental
5 Estevão M 23/05/1974 182 BR castanho fundamental
6 Marco M 12/01/1978 178 IT preto médio

1
Stevens, S.S. 1951. Mathematics, measurement and psychophysics. In Stevens, S.S. (ed.), Handbook of Experimental
Psychology. New York: Wiley.
Fonte: Adrienko, N. e Adrienko, G. 2005. EDA: tasks, tools, principles. Fraunhofer Institute AIS.

Apresentação de dados; AED; Visualização de Dados e Ciência de Dados.

Exemplo de dados quantitativos: Notas em uma prova (considerada difícil) de


Introdução à Estatística:

62, 74, 22, 72, 72, 60, 62, 67, 96, 82, 63, 55, 71, 61, 72, 61, 76, 63, 74, 71

Estratégias propostas por Tukey para AED de dados estruturados:


a) Conjunto de dados / Amostra / População
b) Gráfico de pontos
c) Gráfico de ramo-e-folhas
d) Medidas de posição: mediana, quartil
e) Gráfico de Tukey: “Box-plot”
f) Medidas de tendência central: mediana, moda, média aritmética

“The greatest value of a


picture is when it forces
us to notice what we
never expected to see”.
John W. Tukey
Análise de Dados:

Existe apenas uma forma de análise para responder às questões de pesquisa


propostas?

Uma medida única é suficiente para descrever uma tendência ou padrão?

Quanto mais dados melhor?

Toda informação é relevante?

Tomadores de decisão conhecem os dados e suas discrepâncias?

Um exemplo:

Há algumas décadas atrás a Universidade da Califórnia em Berkeley analisou dados


de entrada de alunos de pós-graduação, onde 44% dos candidatos do sexo
masculino foram aceitos e apenas 35% das candidatas foram aprovadas no processo
seletivo.

Você acredita que havia um viés de gênero na seleção de estudantes de PG na UC


Berkeley?

Para representar esta discrepância, que operações aritméticas poderíamos fazer com
as duas proporções calculadas (0,44 e 0,35, respectivamente) ?

Análises mais detalhadas poderiam ser feitas, como, por exemplo, a verificação dos
dados a um nível mais desagregado (os departamentos, onde as decisões são
tomadas). Para os seis maiores departamentos os resultados foram estes:

Que padrão surge?

Você também pode gostar