Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução
A Estatística hoje se configura como uma das ciências que mais vem
crescendo em termos de utilização e importância. A importância do
conhecimento das ferramentas de análise de dados é destacada pelos
seguintes aspectos:
Em uma pesquisa, muitas vezes, são realizados estudos
experimentais ou observacionais que culminam em uma coleção de
dados numéricos que devem ser organizados e resumidos.
O padrão de variação nos dados faz com que a resposta não seja
óbvia, ou seja, somente tratando os dados adequadamente é que
poderemos verificar o comportamento das variáveis de estudo.
Uma análise estatística é composta por métodos para coleta e
descrição dos dados, viabilizando a verificação da força da evidência nos
dados pró ou contra as hipóteses de pesquisa. A presença de uma
variação não previsível nos dados faz disso, muitas vezes, uma tarefa
pouco trivial.
EXEMPLO PRÁTICO:
“Uma empresa operadora de T.V. a cabo deseja realizar uma pesquisa com
seus clientes da cidade de Porto Alegre referente ao grau de satisfação dos
mesmos com o serviço prestado. Ao todo, essa operadora possui, nessa
cidade, 217.193 assinantes dos quais foram selecionados 620 para
participarem dessa pesquisa.”
Para essa situação, teremos:
População: 217.193 assinantes da operadora de T.V. a cabo de Porto
Alegre.
Amostra: 620 assinantes da operadora de T.V. a cabo de Porto Alegre
que participaram da pesquisa.
Outro conceito muito importante é o da Variável, que vem a ser a matéria
prima de qualquer pesquisa, ou seja, quando se termina uma coleta de dados,
em um primeiro momento, dispomos de um conjunto de valores ou ainda
respostas pertinentes às nossas variáveis de pesquisa.
Uma variável (x) é uma característica dos elementos investigados que difere
de um elemento para outro e do qual temos interesse em estudar. Cada
unidade (elemento) da população que é escolhido como parte de uma amostra
fornece uma medida de uma ou mais variáveis, também chamadas
observações.
EXEMPLO PRÁTICO:
0102332104
3100421010
Fonte: Pesquisa
Como calculamos a porcentagem da tabela de frequência?
GRÁFICOS ESTATÍSTICOS
GRÁFICO DE SETORES
Fique de olho!
GRÁFICO DE COLUNAS
Fique de olho!
O gráfico de colunas é um gráfico que não possui restrições, pode ser utilizado
para representar variáveis qualitativas e quantitativas. Quando o número de
categorias for muito extenso, podemos utilizar legendas com cores distintas
para a identificação das categorias.
GRÁFICO DE BARRAS
Fique de olho!
O gráfico de barras é um gráfico que não possui restrições, pode ser utilizado
para representar variáveis qualitativas e quantitativas. Quando o número de
categorias for muito extenso, podemos utilizar legendas com cores distintas
para a identificação das categorias. É um excelente gráfico para os casos em
que as categorias das variáveis são expressas através de frases ou palavras
muito extensas.
GRÁFICO DE LINHAS
Este gráfico utiliza-se de uma linha para representar uma série estatística. Seu
principal objetivo é evidenciar a tendência ou a forma como o fenômeno está
crescendo ou decrescendo através de um período de tempo. Seu traçado deve
ser realizado considerando o eixo "x" (horizontal) a escala de tempo e o eixo
"y" (vertical) frequência observada dos valores.
Figura 6: Exemplo de gráfico de linhas.
Fique de olho!
Introdução
MÉDIA
Exemplo
Média:
Interpretação:
MEDIANA
Notação:
Md ou Me
Mediana (Md)
Interpretação:
“Metade dos clientes dessa loja possuem renda de 9,1 salários mínimos ou
menos, e metade dos clientes possui renda de 9,1 salários mínimos ou mais.”
EXEMPLO 2: Quando o tamanho da amostra “n” for par.
3º) Calcular o ponto médio entre estes dois valores centrais (somando os dois
valores e dividindo por dois)
MODA
Notação:
Mo
EXEMPLO
Mo = 210 reais (esse valor se repete quatro vezes na amostra, foi o valor de
diária que mais se repetiu).
Interpretação:
“O valor da diária para um casal que ocorreu com maior frequência foi de 210
reais”.
MEDIDAS DE VARIABILIDADE
DESVIO-PADRÃO
COEFICIENTE DE VARIAÇÃO
O MODELO BINOMIAL
Exemplo:A probabilidade da ocorrência de peças defeituosas em um lote
produzido por uma fábrica é de 5%. Cinco lotes são investigados, qual é a
probabilidade de:
I n t e r p r e t a ç ã o :
Temos 77,38% de chance do lote conter 1 item defeituoso.
O MODELO POISSON
A probabilidade de ocorrerem exatamente “x” eventos é dada por:
Fique de olho!
Atenção!
Pede-se:
Podemos considerar essa distribuição como uma das mais importantes, pois
diversas ferramentas estatísticas necessitam da suposição de que os dados se
distribuam normalmente para serem utilizadas. Os parâmetros da Normal são a
média ( µ ) e o desvio-padrão ( σ ), que permitem infinitas curvas normais com
diferentes formatos (mas sempre simétricas).
C A R A C T E R Í S T I C A S D A
D I S T R I B U I Ç Ã O N O R M A L
Sua curva de probabilidades tem forma de sino;
A área total sob a curva é igual a 1;
No ponto mais alto na curva, encontra-se a média da distribuição;
A curva é simétrica em relação à média;
O desvio padrão determina a largura da curva. Quanto maior o desvio
padrão, mais larga e mais plana tende a ser a curva, mostrando a
variabilidade nos dados;
As probabilidades para a variável aleatória normal são dadas por áreas
sob a curva.
Devemos dividir esse número em duas partes: a primeira composta pela parte
inteira do número e a primeira casa após a vírgula que representa os décimos;
a segunda parte é composta pela segunda casa após a vírgula que representa
o centésimo.
Exemplo
Fique de olho!
ATENÇÃO: Vamos verificar a seguir outras situações de probabilidades em
que devemos estabelecer algumas regras.
SITUAÇÃO 1
P( x ≥ a ) = 100% – P( x ≤ a )
Voltando ao exemplo:
Probabilidade de falhar após 7500 horas
SITUAÇÃO 2:
Agora, vejamos o terceiro e último tipo de área/probabilidade a ser
calculada: ENTRE dois valores.
Nesse caso, teremos dois valores de “x” que deverão ser padronizados
resultando em dois valores de probabilidade, uma referente à área inferior a
7400 e outra inferior a 6300.
Para obter a área de interesse, devemos subtrair uma área da outra. Então,
poderemos estabelecer a seguinte regra:
P( a ≤ x ≤ b ) = P( x ≤ b ) – P( x ≤ a )
Então:
P( 6300 ≤ x ≤ 7400 ) = 74,86% – 12,10%
AMOSTRAGEM E ESTIMAÇÃO
Introdução
AMOSTRAGEM E ESTIMAÇÃO
AMOSTRAGEM
Amostra Sistemática:
Uma amostra sistemática poderá ser tratada como uma amostra aleatória
simples se os elementos da população estiverem ordenados aleatoriamente, e
a seleção será realizada através da escolha sistemática, por exemplo, de um a
cada cinco elementos.
Amostra Estratificada:
Esta técnica consiste em dividir a população em subgrupos, que são
denominados estratos. Esses estratos devem ser internamente mais
homogêneos do que a população toda, com respeito às variáveis em estudo.
Informações do problema:
EXEMPLO PRÁTICO
Informações do problema:
Onde:
N = tamanho da população
Informações do problema:
N = 1.450
ε = 0,05
EXEMPLO PRÁTICO
Uma pequena indústria fabricante de gêneros alimentícios deseja realizar uma
pesquisa em um supermercado de uma região de São Leopoldo com o objetivo
de estimar a proporção de consumidores que preferem o leite embalado em
sacos plásticos. Qual deve ser o tamanho mínimo da amostra considerando um
nível de confiança de 95% e um erro máximo de estimação de 5%?
Informações do problema:
ε = 0,05
ESTIMAÇÃO
Seja “X” uma variável aleatória que apresenta distribuição normal com desvio-
padrão s, o intervalo de confiança para a média µ pode ser assim determinado:
Observe que nesse intervalo utilizaremos a distribuição t-student, que é uma
distribuição muito semelhante à distribuição normal e é utilizada em casos de
pequenas amostras ou ainda quando s é desconhecido. A tabela t-student
apresentada abaixo possui (n – 1) graus de liberdade:
EXEMPLO PRÁTICO
Uma pesquisa foi realizada em uma livraria com o objetivo de estimar o preço
de livros de literatura. Em um estudo realizado com uma amostra de 25 livros,
verificou-se um preço médio de 54,7 reais com um desvio-padrão de 5,2 reais.
Construa o Intervalo de Confiança (IC) 95% para o verdadeiro preço médio de
todos os livros de literatura dessa livraria.
Dados do Problema:
Interpretação:
Estima-se com 95% de confiança que o verdadeiro preço médio dos livros de
literatura dessa livraria seja um valor entre 52,55 reais e 56,85 reais.
t = 2,064
EXEMPLO PRÁTICO
Dados do Problema:
Introdução
Exemplos:
O lucro médio mensal da empresa é de 500 mil reais.
As vendas médias da loja A são superiores às da loja B.
O tempo médio de entrega da mercadoria é de 7 dias.
TESTES DE HIPÓTESES
1. HIPÓTESES DE PESQUISA
2. ESTATÍSTICA DO TESTE
3. REGRA DE DECISÃO
Após a regra de decisão, o teste deve ter uma conclusão experimental onde o
pesquisador, de acordo com o contexto do problema, finalizará a sua análise.
Na conclusão experimental, o pesquisador terá subsídios científicos que o
auxiliarão na tomada de decisão sobre o objeto de estudo.
Regra de decisão
Uma fábrica de móveis afirma que o tempo médio de entrega de seus produtos
vendidos é de 18 dias. Para verificar essa afirmação, uma amostra de 30
pedidos dessa empresa foi analisada verificando-se um tempo médio de
entrega de 17,8 dias com um desvio-padrão de 5,6 dias. Analise os dados e
conclua ao nível de significância de 5%.
Passo 4 – Regra de Decisão
H0 : µ = 18 dias
Fique de olho!
Para esse teste, não teremos um valor de referência a ser comparado, mas sim
duas amostras provenientes de dois grupos distintos e o objetivo desse teste
é comparar as médias dessas duas amostras independentes verificando
se existe ou não diferença significativa entre elas.
Esse teste é muito semelhante ao anteriormente visto, porém aqui não teremos
um valor de referência a ser comparado, mas sim duas amostras provenientes
de dois grupos distintos, e o objetivo aqui é comparar as médias dessas duas
amostras independentes verificando se existe ou não diferença significativa
entre elas.
Regra de decisão
Introdução
ANÁLISE DE CORRELAÇÃO
DIAGRAMA DE DISPERSÃO
TIPOS DE CORRELAÇÕES
1.
Fique de olho!
ATENÇÃO!
Sua fórmula é:
Etapas do cálculo:
3º) Multiplique cada valor de x por seu valor y correspondente e obtenha a sua
soma: Σx.y
EXEMPLO PRÁTICO
Uma cadeia de supermercados financiou um estudo para verificar a relação
entre a renda mensal (salários mínimos) e as despesas semanais em
supermercados de 8 famílias selecionadas aleatoriamente.
Para esse exemplo, temos as seguintes informações:
n = 8 famílias
Tabela de cálculos:
Interpretação:
A relação linear simples entre duas variáveis “x” e “y” pode ser investigada de
duas formas: através da Análise de Correlação, onde quantificamos a
intensidade dessa relação, e a outra através da Análise de Regressão onde a
forma dessa relação é explicitada.
Y = a + b (X)
y = a + bx
ATENÇÃO!
O coeficiente angular “b” da reta de regressão mede a direção e a
magnitude da relação à magnitude da inclinação da regressão pode ser lida
como segue: para cada acréscimo unitário na variável (x), a variável
dependente aumentará/diminuirá “b” unidades de y.
Quando as duas variáveis estão correlacionadas positivamente, a
inclinação (valor de b) também será positiva, enquanto quando as duas
variáveis estão correlacionadas negativamente, a inclinação (valor de b)
será negativa.
EXEMPLO PRÁTICO
Os dados abaixo representam x: tempo de experiência em anos, e os
respectivos y: salários (em salários mínimos) de uma amostra de 8
profissionais:
Para este exemplo, temos as seguintes informações:
n = 8 profissionais
Tabela de cálculos:
QUESTÃO IMPORTANTE:
Conclusão
Estima-se que, para um tempo de experiência de 15 anos, o salário mensal de
um profissional seja em torno de 13,27 salários mínimos.
Referências
LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São
Paulo: Ed. Pearson, 2012.