Você está na página 1de 22

Introdução à Estatística Descritiva

ACH0021 – Tratamento e Análise de Dados/Informações


Prof. Regis Rossi A. Faria
1º sem. 2020
Programa e referências
• Estatística descritiva
• População e amostra
• Técnicas estatísticas. Etapas de pesquisa estatística.
• Tipos de dados. Tipos de variáveis.
• Referência para estudo:
• Capítulo 2 (Resumo de dados) do livro texto Bussab e
Morettin
Estatística – definições
• "A branch of mathematics dealing with the
collection, analysis, interpretation, and
presentation of masses of numerical data."
(Merriam-Webster)
• "Ciência que tem por objetivo a coleção, análise e
interpretação de dados numéricos a respeito de
fenômenos coletivos ou de massa, bem como a
indução das leis a que tais fenômenos cabalmente
obedecem e, ainda, a representação numérica e
comparativa, em tabelas ou gráficos, dos resultados
da análise desses fenômenos." (Michaelis)
Estatística – definições
• A estatística está interessada nos métodos científicos
para coleta, organização, resumo, apresentação e
análise de dados, bem como na obtenção de
conclusões válidas e na tomada de decisões razoáveis
baseadas em tais análises. (Spiegel)
• A estatística é a ciência que estuda os métodos de
coleta, análise, interpretação e apresentação de dados
experimentais. (Ara et al)
• A estatística descritiva cuida da organização e descrição
dos dados e a inferência estatística se refere à análise e
interpretação dos mesmos.
Origem da Estatística
• Estatística: palavra derivada do latim status, que
significa "estudo do estado".
• Segundo o dicionário Webster, o primeiro uso conhecido do
termo data de 1770.
• Termo empregado, de início, para designar o conjunto
de dados referentes a assuntos de interesse do estado,
com a finalidade de controle fiscal ou de segurança
nacional.
• Os dados referiam-se, particularmente:
• à população;
• às transações comerciais internas ou com outros países;
• ao controle de mortalidade;
• aos problemas de taxação e de proporcionalidade de tarifas e
impostos.
Origem da Estatística
• A prática de descrever quantitativamente seus
aspectos socioeconômicos das civilizações é muito
antiga:
• Os censos (demográficos, agropecuários ou
socioeconômicos), nos moldes como conhecemos hoje,
foram implantadas em cidades antigas da Grécia, Roma
e Palestina;
• Inglaterra: em 1085 e 1086 foi realizado um grande
estudo para conhecer o dono e o valor de cada
propriedade, para fins de taxação e eliminação de
disputas locais.
Classes de técnicas estatísticas
• A estatística engloba um grande leque de técnicas de
análise, que podem ser divididas em duas classes
gerais:
• Estatística descritiva: destina-se a duas finalidades principais:
• Estatística descritiva univariada: utilizada quando se necessita
sumarizar ou descrever a distribuição de uma única variável;
• Estatística descritiva bivariada ("duas variáveis") ou multivariada
("mais de duas variáveis"): utilizada quando se necessita descrever
a associação entre duas ou mais variáveis.
• Inferência estatística: consiste em obter e generalizar
conclusões; ou seja, inferir propriedades a respeito da
população de interesse, a partir da amostra analisada.
(Definições básicas de população e amostra serão apresentadas nos
próximos slides.)
Estatística descritiva univariada
• É muito difícil captar intuitivamente informações relevantes pela
observação direta dos dados brutos coletados.
• É necessário, portanto, que as informações sejam resumidas até o ponto
em que as informações possam ser interpretadas mais claramente.
• As funções da estatística descritiva univariada:
• Organização e classificação dos dados
• Sua apresentação através de gráficos e tabelas;
• Cálculos de medidas resumo (médias, porcentagens, etc).
• O processo de usar poucos números para sumarizar vários é chamado
frequentemente de redução de dados.
• Exemplo: Suponha que lhe fossem fornecidas as informações de rendas
anuais de uma comunidade de 10.000 famílias para analisar.
• Você simplesmente listaria as rendas em uma tabela e a divulgaria?
• Que tipos de resumos informativos seria possível obter?
Estatística descritiva multivariada
• Essa classe de técnicas é voltada a ajudar-nos a
compreender os relacionamentos entre duas ou mais
variáveis.
• Medidas de associação: permitem quantificar a força e a
direção do relacionamento entre variáveis.
• Tais medidas podem ajudar a investigar duas questões de grande
importância teórica e prática:
• Causalidade (relações de causa e efeito);
• Previsão: quando duas variáveis têm uma alta medida de
associação, é possível prever (com certo grau de convicção) o valor
de uma a partir da outra.
• Importante: forte associação entre dois fatores não implica
imediatamente em relação causal entre os fatores.
• Mas ajuda o investigador a pesquisar possíveis causas para essa
associação.
Exemplo
• Suponha que estejamos analisando os dados de um grupo de
estudantes, e o interesse seja analisar o desempenho de duas variáveis:
Quantidade de tempo de estudo e nota final obtida.
• Suponha que tenhamos encontrado uma associação positiva forte entre
essas duas variáveis.
• Isso indicaria que "tempo de estudo" e "nota" teriam relação próxima (força do
relacionamento) e à medida em que uma variável aumentasse de valor, a outra
também aumentaria (direção do relacionamento).
• Você poderia fazer previsões de uma variável a partir de outra:
• "Quanto maior o tempo de estudo, maior a nota final"

• Questão: Todavia, seria possível estabelecer uma relação causal?


"Um maior tempo de estudo leva a uma maior nota final"
• Resposta: não, pois outras variáveis podem interferir, e precisariam ser
analisadas em conjunto com "tempo de estudo" e "nota final".
Inferência estatística
• Essa classe de técnicas estatísticas se torna
relevante quando se deseja generalizar os
resultados da amostra para a respectiva população
em estudo.
• Técnicas baseadas na Teoria das Probabilidades.

• Inferência (definição geral):


• the act of passing from statistical sample data to
generalizations (as of the value of population
parameters) usually with calculated degrees of certainty.
(Merriam-Webster)
População e amostra
• População: coleção de casos (unidades individuais), que
podem ser pessoas, animais, resultados experimentais, com
uma ou mais características em comum, que se pretende
analisar.
• Congrega todas as variáveis que sejam relevantes para o estudo de
uma ou mais características dos casos.
• Populações podem ser muito grandes (p.ex. toda a humanidade) ou
muito pequenas (alunos do 1º ano do curso de Lazer e Turismo da
EACH).
• Definição da população depende, naturalmente, do escopo da
pesquisa.
• Amostra: subconjunto de casos cuidadosamente obtido da
população, que se observa com o objetivo de se fazer as
inferências para a população.
• Importante: representatividade, ausência de viés de escolha.
(Princípios de amostragem serão vistos futuramente)
Etapas da pesquisa estatística
• Esquema geral das etapas de uma pesquisa estatística:

Fonte: Ferreira et al., 2002.


Variáveis
• Uma variável é qualquer atributo/característica
que:
• possa mudar de caso para caso;
• possa exercer influência no fenômeno estudado.

• As técnicas estatísticas variam de acordo com o


tipo de variável.

• Por essa razão, veremos inicialmente as principais


classes de variáveis.
Classificação de variáveis
• Qualitativas: se os resultados das observações são
expressos por categorias que se distinguem por alguma
característica não numérica.
• Ex: Sexo, nível de escolaridade, cor da pele, marca (do produto).
• Podem ser de dois tipos:
• Nominais
• Ordinal
• Quantitativas: se os resultados das observações são sempre
expressos por números que representam contagens ou
medidas.
• Ex: Idade, altura, renda, concentração de metano.
• Podem ser de dois tipos:
• Contínuas
• Discretas
Classificação de variáveis qualitativas
• Nominais:
• Caracterizam-se por dados que consistem apenas em
nomes, rótulos ou categorias;
• Nesse nível mais básico de mensuração, a única
operação matemática permitida é comparar os
tamanhos relativos das categorias
• Ex: "Há mais alunos do sexo masculino do que do sexo
feminino nesta turma".
• Categorias não podem ser:
• dispostas de acordo com um sistema de ordenação.
• adicionadas, divididas ou manipuladas matematicamente;
• Exemplos: Estado civil, religião, marca (de produto), sexo
Classificação de variáveis qualitativas
• Ordinais:
• Envolvem dados que podem ser dispostos em alguma ordem,
mas as diferenças entre os seus valores não podem ser
determinados ou não fazem sentido;
• Operações matemáticas (adição, subtração, etc) e estatísticas
como média não são, a rigor permitidas.
• Exemplos:
• Nível de escolaridade
• Classe social (A, B, C, D, E)
• Grau de satisfação ou de concordância
• Incluindo os graus numerados:
1=discorda totalmente
2=discorda
3=nem discorda nem concorda
4=concorda
5=concorda totalmente
Variáveis qualitativas
• Para a maior parte das técnicas de estatística descritiva,
as variáveis qualitativas (nominais ou ordinais)
precisam satisfazer algumas condições:
1. As categorias precisam ser mutuamente exclusivas entre si,
de forma que não haja ambiguidade sobre a categoria (ou
nível) de nenhum caso;
• Cada caso precisa possuir um e somente uma categoria/nível.
2. As categorias precisam ser exaustivas, ou seja, deve haver
uma categoria para cada caso que possa ser observado
• Mesmo que seja uma categoria "Outros".
3. Categorias deveriam ser relativamente homogêneas
• Deve-se evitar criar categorias excessivamente gerais ou que
incorporem elementos muito distintos.
Variáveis qualitativas
• Exemplo abaixo apresenta alguns erros na
categorização das preferências religiosas.
• Três primeiros exemplos correspondem à violação das
condições 1, 2 e 3, respectivamente;
• Exemplo 4 é um exemplo de categorização adequada.
Classificação de variáveis quantitativas

• Contínuas:
• Podem ser vistas como resultantes de um processo de mensuração,
assumindo, portanto, valores pertencentes a um determinado
intervalo de números reais.
• Precisão do valor só depende da forma/instrumento de mensuração
• Ex: tempo, distância, área, etc.
• Todas as operações matemáticas são permitidas.
• Exemplos: altura, peso, velocidade, idade (em dias), salário

• Discretas:
• Podem ser vistas como resultantes de um processo de contagem,
assumindo, assim, valores inteiros não negativos.
• Todas as operações matemáticas são permitidas.
• Exemplos: Número de filhos, número de alunos
ca: (a) variáveis quantitativas discretas, cujos possíveis valores formam um conjunto finito
ou enumerável de números, e que resultam, freqüentemente, de uma contagem, como por
exemplo número de filhos (0, 1, 2, ...); (b) variáveis quantitativas contínuas, cujos possíveis

Classificação de variáveis: resumo


valores pertencem a um intervalo de números reais e que resultam de uma mensuração,
como por exemplo estatura e peso (melhor seria dizer massa) de um indivíduo.
A Figura 2.1 esquematiza as classificações feitas acima.
Figura 2.1: Classificação de uma variável.

Para cada tipo de variável existem técnicas apropriadas para resumir as informações,
donde a vantagem de usar uma tipologia de identificação como a da Figura 2.1. Entre-
tanto, verificaremos que técnicas usadas num caso podem ser adaptadas para outros.
Exercício em sala
• Trabalhando com uma planilha de dados online,
compartilhada, para levantar (amostragem) dados
dos alunos que caracterizam a turma
• 1a etapa: construção de uma tabela com dados
coletando a idade dos alunos, em número (inteiro) de
anos e números de meses (fração de ano incompleto)
• Ferramenta: google docs, planilha

Você também pode gostar