Você está na página 1de 1

A investigação científica é um processo de aprendizado iterativo.

Objetivos relacionados à
explicação de um fenômeno social ou físico devem ser especificados e testados através da
coleta e análise de dados. Por sua vez, uma análise dos dados coletados por experimentação
ou observação geralmente sugere uma explicação modificada do fenômeno. Durante todo
esse processo de aprendizado iterativo, as variáveis são frequentemente adicionadas ou
excluídas do estudo. Assim, as complexidades da maioria dos fenômenos exigem que um
investigador colete observações sobre muitas variáveis diferentes. Este livro trata de métodos
estatísticos projetados para extrair informações desses tipos de conjuntos de dados. Como os
dados incluem medições simultâneas em muitas variáveis, esse corpo de metodologia é
chamado de análise multivariada.

A necessidade de entender as relações entre muitas variáveis torna a análise multivariada um


assunto inerentemente difícil. Freqüentemente, a mente humana é sobrecarregada pela
grande quantidade de dados. Além disso, é necessária mais matemática para derivar técnicas
estatísticas multivariadas para fazer inferências do que em um ambiente univariado. Optamos
por fornecer explicações baseadas em conceitos algébricos e evitar as derivações de
resultados estatísticos que requerem o cálculo de muitas variáveis. Nosso objetivo é introduzir
várias técnicas multivariadas úteis de maneira clara, utilizando intensamente exemplos
ilustrativos e um mínimo de matemática. No entanto, será necessária alguma sofisticação
matemática e um desejo de pensar quantitativamente.

Grande parte de nossa ênfase será na análise de medidas obtidas sem controlar ou manipular
ativamente nenhuma das variáveis nas quais as medidas são feitas. Somente nos Capítulos 6 e
7 trataremos alguns planos experimentais (projetos) para gerar dados que prescrevem a
manipulação ativa de variáveis importantes. Embora o projeto experimental seja normalmente
a parte mais importante de uma investigação científica, é frequentemente impossível controlar
a geração de dados apropriados em certas disciplinas. (Isso é verdade, por exemplo, nos
negócios, economia, ecologia, geologia e sociologia.) Você deve consultar [7] e [8] para relatos
detalhados dos princípios de design que, felizmente, também se aplicam a situações
multivariadas. Tornar-se-á cada vez mais claro que muitos métodos multivariados se baseiam
em um modelo de probabilidade subjacente conhecido como distribuição normal multivariada.

Outros métodos são ad hoc por natureza e são justificados por argumentos lógicos ou de senso
comum. Independentemente de sua origem, técnicas multivariadas devem, invariavelmente,
ser implementadas em um computador. Os recentes avanços na tecnologia de computadores
foram acompanhados pelo desenvolvimento de pacotes de software estatístico bastante
sofisticados, facilitando a etapa de implementação.

Você também pode gostar