Você está na página 1de 37

Introdução à estatística

Prof. Diego dos Santos


Estatística constitui a ciência dos dados
Fornece métodos para coleta, organização, descrição,
análise e interpretação de dados.

Dados é o termo geral para informações que serão


coletadas.

Há diferentes tipos de dados, exemplos:


 Temperaturas de diferentes cidades ao redor do mundo;
 As filiações políticas de 20 eleitores pesquisados em uma pequena
comunidade;
 Os pesos das crianças de 1ª à 4ª série em uma determina escola;
 O tempo que uma pizzaria leva para fazer a entrega nas casas dos

clientes;
Existem diferentes razões para a coleta de dados

 Uma das razões é para ganhar uma compreensão dos dados,


organizando e representando graficamente os valores individuais.

Exemplo: Pode-se aprender sobre os pesos das crianças de 1ª a 4ª


série representando esses pesos em um gráfico. Podemos então
responder algumas questões de interesse sobre esses pesos:
 Qual o peso médio das crianças;
 Existem muitas crianças que estão obesas? Ou desnutridas?
 Como os peso das crianças estão distribuídos;

 A segunda razão, é coletar dados para tirar conclusões sobre a


grupo maior de informação.
A Estatística basicamente se divide em:

 Estatística Descritiva: Compreende a coleta, a organização, o resumo e


apresentação de dados.

 Estatística Inferencial: Se refere à análise e interpretação de dados


amostrais, a partir do que, tira-se conclusões sobre a população na qual
os dados (amostra) foram obtidos.

População é um conjunto
completo (todos os sujeitos a
serem estudados) de
indivíduos (valores, medidas, Amostra é qualquer parte
pessoas, objetos, animais) (subconjunto) da população.
que apresentam pelo menos
uma característica em
comum.
Indivíduos e variáveis
Qualquer conjunto de dados contém informações a respeito de um grupo de
indivíduos. A informação é organizada em variáveis.

Os indivíduos são os sujeitos descritos por um conjunto de dados,


podendo ser pessoas, animais, plantas ou objetos.

 Exemplo: Estudantes, cachorros, plantas de milho, células, ratos, …

Uma variável é qualquer característica de um indivíduo. Uma variável pode


assumir valores diferentes para indivíduos diferentes.

 Exemplo: Idade, altura, peso, raça, comprimento de folha de uma


determinada planta…
Questões preliminares
1. Escreva uma frase descrevendo o que a palavra estatística
significa para você.
2. Registre na tabela as respostas dos estudantes da sala para as
seguintes questões:
a) Qual seu sexo? (M / F)
b) Qual dos termos descreve melhor sua visão política: liberal,
moderado ou conservador? (L / M / C)
c) Você concorda com a afirmativa: “Atividade de mulheres casadas
são restritas à casa e à família?” (Sim / Não)
d) Quantas horas você gasta mexendo no Facebook semanalmente?
e) Classifique sua opinião para o valor da estatística na sociedade
em uma escala numérica de 0 (completamente inútil) até 10 (muito
importante).
f) Quantas palavras há na frase que você escreveu na resposta da
questão número 1?
Classificação das variáveis
 Variável qualitativa: posiciona um indivíduo em um dos diversos
grupos ou categorias.

 VARIÁVEL QUALITATIVA NOMINAL: seus resultados possíveis são


diferentes categorias não ordenadas, em que cada observação pode
ser classificada. Exemplos: raça, nacionalidade, cor, tipo de carro;

 VARIÁVEL QUALITATIVA ORDINAL: seus resultados possíveis são


diferentes categorias ordenadas em que cada observação pode ser
classificada. Exemplos: classe social, nível de instrução, tamanho do
carro);
Classificação das variáveis
 Variável quantitativa: quando seus valores são expressos em
números que representam contagem ou medidas, com os quais faz
sentindo efetuar operações aritméticas (como subtração e cálculo
de médias).

 VARIÁVEL DISCRETA: Seus valores são expressos geralmente através


de números inteiros não negativos. Resulta normalmente de
contagens. Exemplo: nº de alunos presentes às aulas de estatística,
número de folhas por planta, número de sementes germinadas...

 VARIÁVEL CONTÍNUA: Resulta normalmente de uma mensuração, e


podem assumir, teoricamente, qualquer valor entre dois limites. São
resultados cujos valores podem ser fracionários. Exemplo: temperatura
atual do seu corpo, a altura; massa seca de parte aérea, comprimento
de raíz...
Distribuição de uma variável

 Como o termo variável sugere, os valores assumidos


por uma variável diferem de caso para caso;
 Dados exibem variabilidade. O padrão desta
variabilidade é chamado de distribuição de um variável.
 Muito da pratica da estatística diz respeito à
apresentação visual, resumo numérico e descrição
verbal das distribuições de variáveis.

 Basicamente a distribuição de uma variável informa os


valores/resultados que uma variável assume e com que
frequência assume esses valores/resultados.
DISTRIBUIÇÕES DE FREQUÊNCIA DE
VARIÁVEIS QUALITATIVAS E SUAS
REPRESENTAÇÕES EM TABELAS E GRÁFICO

Uma distribuição de frequência é a correspondência


entre as categorias ou valores de uma variável e as
respectivas frequências que foram observadas. Ela
pode ser representada sob a forma tabular ou gráfica.
Outro exemplo...

Figura 2 - Principais atividades produtivas de 110 Unidades de Produção do Núcleo


Luta Camponesa – PR, 2012.
DISTRIBUIÇÕES DE FREQUÊNCIA DE
VARIÁVEIS QUANTITATIVAS E SUAS
REPRESENTAÇÕES EM TABELAS E GRÁFICO
Exemplo...
Exemplo de um Histograma...

Figura 3 - Distribuição de frequência das notas da primeira avaliação de


Estatística Básica da turma (43 estudantes) de Agronomia da UFFS campus
Laranjeiras do Sul, 2013.
Interpretação de histogramas
 Construir um gráfico não é um fim em si mesmo. Seu propósito
consiste em nos ajudar a entender os dados.
 Depois de construir um gráfico, sempre pergunte: “O que vejo?”
 Depois de mostrar a distribuição, você pode ver aspectos
importantes da seguinte maneira:

EXAME DE UMA DISTRIBUIÇÃO:

Em qualquer gráfico de dados, procure pelo padrão geral


e por afastamentos notáveis deste padrão.
Você pode descrever o padrão geral de um histograma por
sua forma, centro e dispersão.
Um tipo importante de afastamento é um ponto
discrepante – um valor individual que se afasta do padrão
geral da distribuição;
Interpretação de histogramas
 Ao descrever uma distribuição, concentre-se nos aspectos
principais:

 Procure os picos mais importantes, não os altos e baixos


secundários nas colunas do histograma;

Obs.: A linha não


precisa ser
desenhada!

Linha demonstrando um Linha suave demonstrando


exame muito detalhado de o padrão geral da
altos e baixos secundários distribuição
Interpretando e descrevendo o padrão geral...
 Você pode descrever o padrão geral de um histograma por sua forma,
centro e dispersão.

 Forma: Comente se a distribuição apresenta um único pico principal ou


mais que um, e quais valores esse(s) pico(s) representa(m). Procure por
simetria aproximada ou clara assimetria – se a distribuição é simétrica ou
assimétrica (para direita ou para esquerda);

 Centro: Por enquanto, cabe descrever o centro de uma distribuição por


seu ponto do meio, ou seja, o valor tal que aproximadamente metade das
observações apresenta valores abaixo dele e metade acima dele.

 Dispersão: Por enquanto, podemos descrever a dispersão de uma


distribuição, fornecendo o menor (valor mínimo) e o maior valor (valor
máximo) – a diferença entre o máximo e o mínimo é o que chamamos de
amplitude total dos dados.
Pontos discrepantes (valores atípicos) ou “Outliers”
Um tipo importante de afastamento. Eles são obervações que se
afastam do padrão geral da distribuição. Sempre analise os pontos
discrepantes e tente explica-los.

No exemplo ao lado, o
padrão geral é
razoavelmente simétrico,
exceto por dois pontos que
claramente se afastam
desse padrão. As
observações, representam
dois estados americanos
que têm representações Alaska Florida
atípicas do número de
idosos na população.
Uma grande lacuna na
distribuição é um sinal
típico de ponto discrepante.
Distribuições simétricas e assimétricas
 Uma distribuição é simétrica se os dados direito e
esquerdo do histograma são praticamente a imagem no
espelho um do outro;

Distribuição
simétrica
Distribuições simétricas e assimétricas
 Uma distribuição é Distribuição
assimétrica
assimétrica para a direita se
o lado do histograma (que
contém a metade das
observações com valores
maiores) se estende muito
mais do que o lado esquerdo.

 Ela é assimétrica para a


esquerda se o lado esquerdo
do histograma se estende
muito mais do que o lado
direito.
Outras formas….

 Nem todas as distribuições têm uma forma geral simples,


especialmente quando há poucas observações;
 Muitas distribuições têm formas irregulares, apresentam outros
padrões tais como conglomerados.

Distribuição multimodal
Construindo um histograma…

É um processo interativo – tente e tente novamente.

Qual tamanho da classe (amplitude de classe) devo usar?

 Não muitas classes com nenhuma ou uma observação cada;


 Não tão poucas de forma a resumir demais os dados e perder toda
informação;
 Não tão detalhado que não resuma em nada os dados;

 Inicie fazendo de 5 a 10 classes;


Observe sua distrbuição e redefina as classes
caso julgue necessário;
(Não há uma única ou “perfeita” solução)
Mesmo conjunto de dados

Não resumiu
suficientemente os
dados

Resumiu excessivamente
os dados
Análise estatística é um processo de investigação que
torna ideias vagas em um estudo científico, fazendo o
seguinte:

1. Formulando uma questão que pode ser respondida com dados;


2. Fazendo um planejamento para coletar dados apropriados;
3. Analisando os dados coletados através de métodos gráficos e
numéricos;
4. Interpretando os resultados de modo que possam esclarecer a
questão original.
O primeiro passo no estudo estatístico requer que
o pesquisador formule uma questão que será o
objetivo do estudo

Esses tipos de questões são chamadas


perguntas estatísticas:

“Antecipa variabilidade nos dados e conta


com essa variabilidade na análise”
Pergunta estatística

Uma pergunta estatística bem escrita se refere a uma população de


interesse, uma medida de interesse, e supõe variabilidade nas
respostas.
 Qual a idade do professor de estatística?

Não é uma pergunta estatística porque há


somente um único sujeito e, por isso não há
variação.

 Qual a idade dos professores da UFFS?

É uma pergunta estatística porque “professores da


UFFS” é a população, “idade” é a variável a
ser medida, e nós esperamos que haja diversas
idades (variação nas idades).
Pergunta não-estatística
 Muito amplas:
 As pessoas gostam de pizza?

...Transformando em uma Pergunta estatística:


• Os estudantes do primeiro período de educação do campo
noturno gostam de pizza de pepperoni?

– A população é: estudantes do primeiro período de educação


do campo noturno;
– A variável medida: gosta ou não gosta de pizza de
pepperoni.
– E nós esperamos que algumas pessoas gostam e outras
não gostam desse sabor de pizza.
Pergunta não-estatística
 Muito específicas:
 Quantas palavras há nessa frase?

...Transformando em uma Pergunta estatística:


• Quantas palavras há nas frases desta apresentação?

– A população é: todas as frases desta apresentação.


– A variável medida é: tamanho das frases.
– E nós esperamos que as frases sejam de tamanhos
variados.
EXERCÍCIOS 1
 Hipótese: o esporte favorito dos estudantes da turma do primeiro
ano de educação do campo é futebol.
 Para confirmar ou rejeitar minha hipótese vou perguntar aos
estudantes: “Quem gosta de assistir jogo de futebol?”
 Explique porque essa é uma pergunta estatística.
Resposta
 A população: todos os estudantes da turma
 A variável medida é: “se um estudante gosta de assistir futebol”.
 Variação nas respostas é esperada, pois alguns estudantes
respondem “sim” e outros “não”.
EXERCÍCIO 2
 Quantos metros de distância eu posso pular?

A. Explique porque esta não é uma pergunta estatística?


B. Reescreva a questão para que se torne uma pergunta estatística.
Resposta
A. Não há variabilidade – há somente uma distância.

B. Quantos metros de distância os estudantes dessa sala podem


pular?
Atividade para entregar
 Pensar e propor um estudo de seu interesse;
 Escreva as questões estatísticas que deveriam ser feitas para
atingir ao objetivo desse estudo;
 Quais são as variáveis em estudo? Classifique-as (qualitativa/
quantitativa);

Você também pode gostar