Escolar Documentos
Profissional Documentos
Cultura Documentos
BIBLIOTECONOMIA I
Março de 2010
1
O que é estatística? Por quê
ela é importante?
2
Estatística aplicada à biblioteconomia
Os indicadores obtidos a partir de levantamentos
estatísticos acerca das atividades de uma biblioteca ou
serviço de informação são relevantes subsídios para
tomadas de decisão de bibliotecários e gestores de
informação.
Não basta coletar dados, é preciso dar sentido a eles.
3
População e amostra
População - conjunto de indivíduos ou objetos com
características em comum. O tipo de levantamento que
abrange toda uma certa população em estudo chama-se
censo, exemplo característico da parte da estatística
denominada descritiva, pois envolve a busca, a
organização e a apresentação de informações de forma
resumida.
Amostra - uma parcela representativa de uma população,
a partir da qual os resultados dela obtidos são
generalizados para toda a população. O tipo de
levantamento neste caso chama-se amostragem,
caracterizando a parte da estatística classificada como
indutiva ou inferencial. 4
Censo x amostragem
É apropriado o uso do censo para os seguintes casos:
populações pequenas, levantamentos exaustivos (detalhados) e
para contagens populacionais.
6
O uso da amostragem
Grande parte dos casos exige pesquisa por
amostragem, processo pelo qual medidas acerca de uma
parcela da população são induzidas (inferidas) para toda
a população (parâmetros).
Quando usar a amostragem:
- População infinita
- Facilidade de atualização (tempo)
- Menor custo (economia)
- Procedimentos padronizados
- Margem de erro pré-determinada
7
Exemplo de indução (proporções)
curva normal (Gauss)
95% de
confiança
p - erro p p + erro
30-3=27 30% 30+3=33
9
Tipos de amostragem aleatória
Amostragem aleatória simples – cada item da população em estudo tem a mesma chance de ser incluído na amostra.
Amostragem estratificada – divisão da população em subgrupos homogêneos, intitulados estratos, de forma que as
heterogeneidades populacionais sejam proporcionalmente retratadas na amostra. Ex.: pesquisas de opinião.
Amostragem sistemática – a coleta deve obedecer a uma freqüência periódica, de modo que o sistema inclua a
possibilidade de mudança de resultados entre as coletas. Ex.: controle estatístico de qualidade de serviços.
Amostragem por conglomerado – classificação da população tendo em vista a proximidade física, para fins de
constituir a amostra. Ex.: pesquisas por bairros, quarteirões.
10
Estratificação da amostra
Com base em estudos das características da população, devem
ser definidas as variáveis que constituem os subgrupos
homogêneos: em tese, as diferenças entre os grupos implicam
diferenças de opinião quanto ao tema pesquisado. Cada variável
deve ser dividida em suas respectivas classes.
1ª etapa: definição das variáveis de estratificação.
Ex.: idade, sexo, classe social
2ª etapa: definição do número de classes para cada variável
Ex.: idade 18 a 25, 26 a 35 e acima de 35 (3 classes); sexo
masc. e fem. (2 classes), classes sociais A/B, C, D/E (3 classes).
3ª etapa: número total de estratos = produto do número de
classes. Ex.: 3 x 2 x 3 = 18 estratos
Estrato 1: sexo masc., 18 a 25 anos, classe A/B
Estrato 2: sexo masc, 18 a 25 anos, classe C 11
Tamanho da amostra por estrato
12
Estratificação da amostra
Com base em estudos das características da população, devem
ser definidas as variáveis que constituem os subgrupos
homogêneos: em tese, as diferenças entre os grupos implicam
diferenças de opinião quanto ao tema pesquisado. Depois, cada
variável deve ser dividida em suas respectivas classes.
Ex.: A pesquisa Top of Mind, realizada pela Segmento Pesquisas com a
revista Amanhã, identifica as marcas mais lembradas pelos gaúchos.
variável classes população % nº de classes
16 a 24 24
idade 25 a 39 37 3
40 ou mais 39
masculino 48
sexo 2
feminino 52
A/B 27
classe social C 38 3 13
D/E 35
Cálculo do número de estratos
estratos % população amostra
sexo masc. idade 16 a 24 classe social A/B 3 36
sexo masc. idade 16 a 24 classe social C 5 60
sexo masc. idade 16 a 24 classe social D/E 7 84
20
Tipos de frequências
Distribuição do número de dias para empréstimo de obras - nov./2005
freqüências simples freqüências acumuladas
Nº de dias
absolutas relativas absolutas relativas
1 24 9 24 9,0
2 35 13 59 22,1
3 47 18 106 39,7
4 53 20 159 59,6
5 38 14 197 73,8
6 29 11 226 84,6
7 23 9 249 93,3
8 ou mais 18 7 267 100,0
total 267 100 - -
21
Séries estatísticas
Aquisição de materiais
SBU - Unicamp
ano unidades Podem ser somente históricas ou
1996 22892 conjugar duas ou mais variações
1997 25277 históricas, categóricas e
1998 23790 geográficas.
1999 14617
Fonte: Unicamp
1 2 3 4 5 6 7 8 ou
mais
23
Gráfico de distribuições de
frequência por intervalo
48 50
36 39
26
24
Outros tipos de gráficos
Em colunas, para variações de gênero, espécie,
categoria ou tempo
Número de consultas por área do conhecimento na
biblioteca A - nov./2007
356 378
319
287 300
humanas 378
exatas 356
sociais 319
da terra 300
outras 287
26
Outros tipos de gráficos
Em setores (pizza, torta): para proporções
da terra
18%
exatas
22%
sociais
19%
27
Outros tipos de gráficos
600
400
200
0
jan. fev. mar abr mai jun jul ago set out nov dez
28
A pesquisa científica
Uma pesquisa é um procedimento científico que
tem como objetivo proporcionar respostas aos
problemas formulados, às chamadas hipóteses.
A investigação científica toma por referência
concepções teórico-metodológicas consagradas para
a produção de novos conhecimentos.
Para tanto, o pesquisador precisa planejar e
executar a sua pesquisa levando-se em conta os
objetivos relacionados ao tema, ou problema de
pesquisa, bem como as características
determinantes do fenômeno em estudo.
29
Estágios da pesquisa
Definição do problema, hipóteses e objetivos
Objetivos principal e específicos
Hipótese de pesquisa
Planejamento
Fonte de dados
Método de coleta
Determinação da população, amostra, tipo de amostragem
Execução da pesquisa
Coleta de dados (campo)
Organização e análise
Apresentação (comunicação, divulgação)
Relatório, publicação, dissertação, tese
30
Projeto de pesquisa
33
O problema de pesquisa
34
Determinação dos objetivos
35
Formulação de hipóteses
36
Determinação da metodologia
da pesquisa
Após a formulação do problema de pesquisa, da
determinação das hipóteses e da definição dos
objetivos, o planejamento da metodologia da deve
determinar:
-O tipo de pesquisa: se qualitativa ou
quantitativa, se exploratória, descritiva,
experimental, caso, etc.
-Método e técnica de coleta de dados.
-A população, o tamanho da amostra e o
processo de amostragem.
-O Planejamento da coleta de dados.
37
Tipos de pesquisa
Quanto a natureza:
40
Tipos de pesquisa
Quanto aos seus objetivos
45
Planejamento da coleta de dados
Deve prever:
46
Método e técnica de coleta de dados
Dados de identificação
Solicitação para cooperar e agradecimento
Instruções para a sua utilização
Perguntas com as respectivas formas de
registrar respostas
Dados para classificar sócio-economicamente o
respondente (quando for importante)
48
A elaboração do questionário
50
Questões com respostas
dicotômicas
São de uso muito restrito pois apenas se aplicam
a características binomiais mutuamente excludentes.
- Uso adequado:
Você já ouviu falar do produto A?
( ) sim ( ) não
- Uso inadequado:
Você gostou da aula de hoje?
( ) sim ( ) não
51
Questões de múltipla escolha
Devem ser oferecidas todas as possibilidades para o
respondente se manifestar.
Exemplo de opções : avaliação de evento sobre educação
( ) organização ( ) conteúdo da palestra ( ) recursos
empregados ( ) pontualidade ( ) programa ....
Pergunta: marque um X no fator que você considera como
mais crítico. Problema: o respondente considera que houve vários
fatores críticos.
Pergunta: assinale os fatores que você considerou positivos.
Problema: certamente o respondente não considera os itens
escolhidos como de igual importância.
52
Escalas para questões fechadas
Escala ordinal de ranking: 1 é o item mais importante, 2 o segundo e
3 o terceiro na escala de importância.
Importância absoluta: 5 é muito importante, 4 importante, até 1 que é
fraca ou sem importância.
Escala diferencial semântico: de 0 (péssimo) a 10 (excelente, o
respondente assinala um X para fazer uma avaliação.
Escala de Likert: o respondente marca um X para “plenamente”, “em
grande parte”, “em pequena parte”, “em nenhuma parte”, para
expressar satisfação.
Escala de frequência: opções do tipo “sempre”, “muitas vezes”,
“poucas vezes”, “nunca”.
Escala gráfica: respondente escolhe, por exemplo, “careta” triste ou
sorridente para expressar nível de satisfação.
53
Escalas para questões fechadas
1) Escala ordinal de ranking
Marque 1 para o item mais importante, 2 para o segundo mais
importante e 3 para o terceiro.
A( ) B( ) C( ) D( ) E( ) F( )
Na tabulação, cada item assinalado com 1 tem peso 3,
cada 2 tem peso 2 e cada fator marcado como 3 tem peso 1.
2) Importância absoluta
Ex.: avaliação de evento – muito bom (MB) vale 4, bom (B) 3,
regular (R) vale 2 e péssimo (P) 1.
Preparação MB B R P
iniciativa para realização
horário de realização
época de realização
local do evento
54
Escalas para questões fechadas
concordo parcialmente
discordo parcialmente
concordo totalmente
discordo totalmente
3) Escala de Likert: atribuição de
grau de satisfação, concordância
6) Escala gráfica
56
Medidas de tendência central
Média aritmética simples - aplica-se a dados em série ou
em rol (relação crescente ou decrescente), não dispostos
em distribuição de freqüências
x1 ... xn 1 n
X
n
n
xi
i 1
f1 X 1 .... f K X K i=1 fi X i
X K
f1 .... f K fi
i 1
57
Medidas de tendência central
Mediana - principal medida do grupo das separatrizes;
divide uma amostra em duas partes iguais: metade
abaixo e metade acima da mediana.
Para dados em série, Md será o valor do meio, após
ordenados em rol (crescente ou decrescente).
Em alguns casos, quando a distribuição ou série for
muito assimétrica, a Md pode ser mais útil por não se
influenciar por dados atípicos (muito altos ou muito
baixos).
Ex.: Para a série 1 – 4 – 5 – 7 – 10 - 15 – 15
Md = 7
58
Medidas de tendência central
Quartil (Q), Decil (D), Centil (C) - as separatrizes que
dividem uma amostra em quatro, dez e cem partes
iguais, respectivamente, são quartil, decil e centil
(percentil)
Moda - medida que se sobressai pela sua freqüência
com relação às demais; as séries poderão ter uma
moda (unimodal), duas modas (bimodal) ou nenhuma
(amodal).
59
Introdução à probabilidade
Há dois métodos de calcular probabilidades: o método
clássico, que considera que o espaço amostral tem resultados
igualmente prováveis, e o método empírico, que leva em
conta a freqüência relativa da ocorrência de um evento a
partir de um experimento que repita várias provas.
resultados associados a “A”
P (A) = método clássico
todos os resultados possíveis
Ex.: probabilidade de ocorrer cara na moeda = 1/2 = 0,5 ou 50%
63
Probabilidade
Experimento: inscrição de três usuários numa biblioteca,
sendo P(A) = probabilidade de ser do sexo feminino e
P(O) de ser do sexo masculino
Levando-se em conta mesmas probabilidades (50%), o
espaço amostral do experimento será dado por:
S = { AAA, OOO, AOO, OAO, OOA, OAA, AOA, AAO }
Exclusão: em cada inscrição A exclui B e cada uma
das oito formulações exclui as outras
Complementaridade: ocorrer inscrições do mesmo
sexo (2/8) complementa sexos diferentes (6/8)
Independência: cada inscrição é independente com
relação ao anterior (como cara e coroa na moeda)
64
Regras de probabilidade
Exemplo: 57 amostras de material das áreas humanas
(22) e exatas (35) de bibliotecas de um mesmo grupo:
Área de conhecimento Biblioteca A Biblioteca B Total
Humanas 10 12 22
Exatas 15 20 35
Total 25 32 57
66
Distribuição Binomial
O experimento deve proporcionar dois tipos de eventos
possível, que se excluem: ocorrer ou não certo resultado.
P( x ) p (1 p)
x
n x n x
n
x
n!
x!( n x )!
n = tentativas; x = sucessos; p = probabilidade de ocorrer 1
sucesso; q = probabilidade de não ocorrer 1 sucesso (1 – p)
Pressupõe-se independência entre as tentativas, ou seja, a
cada tentativa é como se não tivesse ocorrido nenhuma.
Excetuando-se populações muito grandes, o modelo Binomial
não se aplica a experimentos sem reposição, casos em que
deve ser utilizada a distribuição Hipergeométrica.
67
Distribuição binomial
68