Escolar Documentos
Profissional Documentos
Cultura Documentos
1
1 - Introdução
Estuda-se estatística para aplicar seus
conceitos como auxílio nas tomadas de
decisão diante de incertezas, justificando
cientificamente as decisões.
Os princípios estatísticos são utilizados
em uma grande variedade de situações –
no governo, nos negócios e na indústria,
bem como no âmbito das ciências sociais,
biológicas e físicas.
2
Estatística é a ciência ou método científico
que estuda os fenômenos multicausais,
coletivos ou de massa e procura inferir as
leis que os mesmos obedecem.
5
Isto é, inclui as técnicas que dizem respeito
à sintetização e à descrição de dados
numéricos. Tais métodos podem ser gráficos
e envolvem a utilização de recursos
computacionais.
O objetivo da estatística descritiva é tornar as
coisas mais fáceis de entender, relatar e
discutir.
6
Indutiva (ou inferencial): parte de uma ou
mais amostras (subconjuntos da população)
e conclui sobre a população. Utiliza técnicas
como a teoria das probabilidades, inferência
estatística, amostragem.
Exemplos de utilização: Pesquisas na Educação,
Pesquisa de Mercado, Pesquisa de opinião pública,
Ensaios de medicamentos e em praticamente todo
experimento.
A inferência estatística procura com base nos
dados amostrais tirar conclusões sobre a população.
7
Com maior freqüência utilizamos o estudo da
amostra do que da população, não só por
serem menos dispendiosas e consumirem
menos tempo no processamento dos dados,
mas também porque muitas vezes não
dispomos de todos os elementos da
população.
8
O esquema a seguir tente sintetizar as etapas
de uma pesquisa estatística:
10
Amostragem: coleção de dados relativos a
elementos de uma amostra.
Parâmetro: medida numérica que descreve
uma característica de uma população
Estatística: medida numérica que descreve
uma característica de uma amostra
11
Exemplos:
12
ii) Deseja-se conhecer o consumo de
energia elétrica em MWh nas residências
da cidade de Teófilo Otoni no ano de
2009.
População ou universo: todos as
residências que estavam ligadas a rede
elétrica em Teófilo Otoni , em 2009.
Características: X = consumo anual de
energia elétrica em MWh.
13
iii)Deseja-se saber se nas indústrias
situadas no Estado de Minas Gerais, em
2009, existia algum tipo de controle
ambiental.
População ou universo: indústrias situadas
no Estado de Minas Gerais em 2009.
Característica: X = existência ou não de
algum tipo de controle ambiental na
indústria.
14
iv) Estudo sobre a precipitação pluviométrica
na Região Sudeste no ano 2009.
População ou universo: área referente à
Região Sudeste.
Característica: X = precipitação pluviométrica.
15
Populações finitas e infinitas: Quanto ao
número de elementos, as populações podem
ser classificadas em finita ou infinita,
dependendo do número de elementos que a
compõe.
Exemplos :
i) População finita: empresas do Pólo
Petroquímico de Camaçari.
ii) População infinita: as pressões
atmosféricas ocorridas nos diversos pontos do
Continente em determinado momento. 16
Em geral, como os universos são grandes,
investigar todos os elementos populacionais
para determinarmos a característica
necessita muito tempo, e/ou o custo é
elevado, e/ou o processo de investigação
leva a destruição do elemento observado,
ou, como no caso de populações infinitas, é
impossível observar a totalidade da
população. Assim, estudar parte da
população constitui-se um aspecto
fundamental da Estatística (amostra).
17
Amostragem
19
Amostragem aleatória simples: os elementos
de uma população são escolhidos de tal forma
que todos tenham a mesma chance de serem
escolhidos. Pode-se utilizar uma tabela de
números aleatórios ou um programa de
geração de números aleatórios.
Amostragem estratificada: subdivide-se a
27
QUALITATIVA
NOMINAL (SEXO, COR DOS OLHOS...)
QUANTITATIVA
CONTÍNUA (PESO, ALTURA...)
DISCRETA (NÚMERO DE FILHOS, NÚMERO
DE CARROS...) 28
Variáveis qualitativas - quando o resultado da
observação é apresentado na forma de
qualidade ou atributo. Exemplos: sexo; estado
civil; grau de escolaridade; etc.
Variáveis quantitativas - quando o resultado
da observação é um número, decorrente de
um processo de mensuração ou contagem.
Exemplos: número de filhos; salário mensal;
altura; peso; idade; tamanho da família; etc.
29
Para resumir as informações levantadas
durante uma pesquisa usaremos a técnica e a
representação mais apropriada, a depender do
tipo de variável que estamos analisando.
N a tu re z a d o s D a d o s
V a riá v e is
C o n ta g e n s M e d id a s E x : g ra u d e e s c o la rid a d e
E x : n ú m e ro d e h a b ita n te s d e u m a c id a d e E x : re n d a p e r c a p ita d e u m a c id a d e
Clubes Porcentagem de
torcedores (%)
A 15
B 11
C 7
D 6
E 5
F 4
G 4
H 3
I 2
Fonte: Rede Globo, 06 de jan. de 2004
33
Os dados estatísticos, apresentados em
tabelas, também podem ser expostos em
gráficos. Desde que não haja necessidade de
grande precisão, os gráficos dão, melhor do
que as tabelas, visão de tendências e ajudam
a interpretar um fenômeno.
34
Tabelas, gráficos e medidas podem ser
utilizados para descrever ou explorar um
conjunto de dados, ou comparar dois ou mais
conjuntos.
Gráfico de Barras: usado para apresentar
36
Ranking das torcidas
Ranking de torcedores
I
16
H
14
G
12
F
Porcentagemdetorcedores
10
Clubes
E 8
(%)
D 6
C 4
B 2
A 0
A B C D E F G H I
0 5 10 15 20
Clubes
Porcentagem de torcedores (%)
37
Gráfico de Setores: usado para comparar
proporções, conforme representado pela Fig.
1.10.
38
Os brasileiros de férias no exterior
Consumo de refrigerantes
100,00%
Situações das Instituições:
90,00%
1 – Com ao menos 1/3 do corpo docente
80,00%
trabalhando em regime integral.
70,00%
2 - Com ao menos 1/3 do corpo docente com
Porcentagem
60,00%
50,00%
título de mestre ou doutor
3 – Têm menos de três cursos de pós-graduação
40,00%
Privadas recomendados pela Capes
30,00%
20,00% Públicas
10,00%
Total
0,00%
1 2 3
40
Exercícios.
1. Identifique cada número como discreto ou
contínuo.
a) Cada cigarro Camel tem 16,13 mg de
Alcatrão.
b) O altímetro de um avião da Varig indica
uma altitude de 21.359 pés.
c) Uma pesquisa efetuada com 1015
pessoas indica que 40 delas são
assinantes de um serviço de informação
on-line.
41
d) O tempo total gasto anualmente por um
motorista de táxi de Nova York ao dar
passagem a pedestres é de 2367
segundos.
e) De 1000 consumidores pesquisados,
930 reconheceram a marca da “Coca-
Cola”.
f) Apresente dois exemplos de dados
discretos ou contínuos de sua empresa /
pesquisa.
42
2. Uma pessoa foi encarregada de pesquisar
o reconhecimento da marca Nike, devendo
contactar por telefone 1500 consumidores.
Por que razão é incorreta a utilização de
listas telefônicas como população para
fornecer a amostra?
43
3. Um relatório patrocinado pela Florida Citrus
Comission concluiu que os níveis de
colesterol podem ser reduzidos mediante
ingestão de produtos cítricos. Por que razão a
conclusão poderia ser suspeita?
46
5. Uma população se encontra dividida em
três estratos, com tamanhos, respectivamente,
A = 80, B = 120 e C = 60. Ao se realizar uma
amostragem estratificada proporcional, 12
elementos da amostra foram retirados do
primeiro estrato. Qual é o número de
elementos da amostra?
47
6. Uma amostragem entre os moradores de
uma cidade é realizada da seguinte forma: em
cada bairro, sorteia-se um certo número de
quarteirões proporcional à área do bairro; de
cada quarteirão, são sorteadas cinco
residências, cujos moradores são entrevistados.
a) Essa amostra será representativa da
população ou poderá apresentar algum vício?
b) Que tipo de amostragem foram usados
no procedimento? Justifique.
48
7. Discuta sobre o planejamento de um
experimento enfatizando a importância dos
métodos de boa amostragem.
80
60
40
20
0 A B C D nenhum
Fig. 1.13 - Nº de residências ligadas em um determinado canal de TV, entre 20h e 21h, durante uma noite.
51
9. O quadro abaixo apresenta o número de novos
casos de AIDS notificados anualmente no Brasil no
período considerado:
20.000
18.000
16.000
14.000
12.000
10.000
1991 1992 1993 1994 1995 1996 1997
52
As informações contidas no gráfico permitem
concluir corretamente que, no período
considerado:
a)a partir de 1997, certamente caiu o número de
novos casos de aidéticos;
b)o número aproximado de aidéticos no país,
em 1997, era de 112.000;
c)a maior taxa de variação no número de
aidéticos ocorreu em 1996;
d)a maior taxa de variação no número de
aidéticos ocorreu em 1992;
e)o número máximo de aidéticos ocorreu em
1996. 53
2. REPRESENTAÇÃO GRÁFICA E DISTRIBUIÇÃO
DE FREQÜÊNCIA
2.1 – Introdução
Ao estudarmos grandes conjuntos de dados, é
conveniente organizá-los e resumi-los, construindo
uma tabela de freqüências. A título de ilustração,
considere o exemplo a seguir, de dados brutos,
relativo ao tempo de parada(em minutos) de uma
máquina para manutenção (Tab. 2.1).
A construção de uma distribuição de freqüência
consiste na elaboração de classes a partir de
intervalos, fixando um número adequado de classes.
54
Tab. 2.1 - Tempo de parada (em minutos) de uma
máquina para manutenção
7 3 4 9 5
8 5 3 8 7
9 3 1 9 9
5 7 7 10 3
4 8 8 8 7
8 8 9 3 8
6 10 7 7 9
9 9 7 8 1
55
O primeiro procedimento a ser tomado para a
elaboração de uma distribuição de
freqüências de uma variável contínua consiste
na ordenação dos dados (rol), para permitir
uma melhor manipulação (Tab. 2.2).
Tab. 2.2 - Tempo de parada (em minutos) de uma máquina para
manutenção
1 4 7 8 9
1 5 7 8 9
3 5 7 8 9
3 5 7 8 9
3 6 7 8 9
3 7 8 8 9
3 7 8 9 10
4 7 8 9 10
56
2.2 – Distribuição de Freqüências
A precisão de medida corresponde ao
menor valor detectável pelo instrumento ou
procedimento de medida empregado. No
exemplo dos tempos de parada, a precisão
de medida é x = 1. Deve-se atentar que os
valores presentes no conjunto de dados não
são exatos, mas carregam alguma inexatidão
devido à precisão de medida. Assim, um valor
de 5 não representa necessariamente uma
nota de exatamente 5, mas sim uma nota que
pode estar acontecendo em qualquer ponto
entre 4,5 e 5,5. 57
A elaboração de uma distribuição de freqüência para
variáveis contínuas requer a apresentação de alguns
conceitos:
1 – Amplitude: corresponde à diferença entre o
maior e o menor valor de um conjunto de dados. Em
geral, é simbolizada por “A”.
2 - Amplitude de Classe: consiste na diferença entre
o limite superior e o limite inferior de uma classe em
uma distribuição de freqüência. Será aqui
simbolizada por “c”.
58
A seguir, temos o algoritmo para obtenção de uma
distribuição de freqüência relativa à uma variável
contínua.
Passo 1 – Escolhe-se um número de classes k. É
importante que a distribuição conte com um
número adequado de classes. Se esse número
for escasso, os dados originais ficarão tão
comprimidos que pouca informação poderá ser
extraída desta tabela. Se, por outro lado, forem
utilizadas muitas classes, haverá algumas com
freqüência nula ou muito pequena, apresentando
uma distribuição irregular e prejudicial à
interpretação do fenômeno.
59
k n
Ex: Se n = 49 teríamos:
k=7
k = 1 + 3,3 log 49 = 6,58 7
60
Mesmo tendo outros critérios de determinação
do número de classes, o que se deve ter em
mente é que a escolha dependerá, sobretudo
da natureza dos dados e da unidade de
medida em que eles se encontram, e não
somente de regras muitas vezes arbitrárias e
pouco flexíveis. Para facilitar a análise é
conveniente que se mantenham os intervalos
de classe sempre constantes.
62
Passo 5 - O limite superior LS1 da 1ª classe é
obtido por: LS1 = LI1 + c, sendo que LS1 = LI2 e
assim, sucessivamente – soma-se ao valor do
limite inferior da primeira classe a amplitude de
classe e obtém-se o limite superior, sendo o
limite superior da primeira classe o inferior da
segunda;
Passo 6 – Construídas as classes, são
contados quantos dados estão em cada classe
(freqüências absolutas de cada classe);
63
Obs: a freqüência absoluta (fa) é o número de
repetições de um valor individual ou de uma
classe de valores da variável.
Passo 7 - São calculadas as freqüências
relativas e percentuais de cada classe.
Obs: a freqüência relativa (fr) representa a
proporção de observações de um valor
individual ou de uma classe, em relação ao
número total de observações. Trata-se,
portanto, de um número relativo.
Obs: a freqüência percentual (fp) é o produto
da freqüência relativa por 100, tendo como
resultado uma porcentagem 64