Escolar Documentos
Profissional Documentos
Cultura Documentos
CM
MY
CY
CMY
K
Universidade do Sul de Santa Catarina
Probabilidade e Estatística
Disciplina na modalidade a distância
Palhoça
UnisulVirtual
2011
Probabilidade e Estatística
Livro didático
Design instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher
2ª edição
Palhoça
UnisulVirtual
2011
Designer Instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher (2ª edição)
Diagramação
Fernanda Fernandes
Revisão
Contextuar
ISBN
978-85-7817-336-4
519.5
D75 Dornelles Júnior, Luiz Arthur
Probabilidade e estatística : livro didático / Luiz Arthur Dornelles
Júnior; revisão e atualização de conteúdo Gabriel Oscar Cremona Parma ;
design instrucional Karla Leonora Dahse Nunes, Sabrina Bleicher. – 2. ed. –
Palhoça: UnisulVirtual, 2011.
336 p. : il. ; 28 cm.
Inclui bibliografia.
ISBN 978-85-7817-336-4
Apresentação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Palavras do professor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
Plano de estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Equipe UnisulVirtual.
Bons estudos!
o livro didático;
o Sistema Tutorial.
Ementa
Conceitos gerais de população, amostra, parâmetro, estatística,
tipos de dados, níveis de mensuração, planejamento de
experimentos. Histogramas. Medidas de locação e de
variabilidade. Boxplot. Ramo e folhas. Probabilidade e
distribuições de probabilidade. Principais distribuições
discretas. Principais distribuições contínuas. Estatísticas e
distribuições amostrais. Estimação pontual de parâmetros de
processos. Inferência estatística para uma amostra. Inferência
estatística para duas amostras. Análise de variância com um
único fator. Correlação e regressão linear. Gráficos de controle.
Objetivos
Geral
Adquirir competências para pesquisar; coletar dados, organizar
e analisá-los; e delinear conclusões, testando-as na solução de
problemas, sob o ponto de vista da estatística e da probabilidade.
Específicos
Compreender os conceitos, procedimentos e estratégias
para uma pesquisa.
Carga Horária
A carga horária total da disciplina é 60 horas-aula.
12
Conteúdo programático/objetivos
Veja, a seguir, as unidades que compõem o livro didático desta
disciplina e os seus respectivos objetivos. Estes se referem aos
resultados que você deverá alcançar ao final de uma etapa de
estudo. Os objetivos de cada unidade definem o conjunto de
conhecimentos que você deverá possuir para o desenvolvimento
de habilidades e competências necessárias à sua formação.
Unidades de estudo: 6
13
14
Agenda de atividades/Cronograma
Atividades obrigatórias
15
Introdução à Estatística
Objetivos de aprendizagem
Identificar o processo estatístico de pesquisa.
Identificar variáveis.
Seções de estudo
Seção 1 Conceitos básicos da Estatística
Seção 2 Variáveis
Seção 3 Dados
Seção 4 Séries
18
Unidade 1 19
20
Unidade 1 21
Produção
População de dados
Amostra
Estatística
Descritiva
Estudo da amostra
Características tabelas
populacionais gráficos
medidas
Estatística
Indutiva
Características
amostrais
População e amostra
Quando você prepara um alimento, pode provar (observar)
uma pequena porção. Neste procedimento, você está fazendo o
processo de amostragem, ou seja, extraindo do todo (população)
uma parte (amostra), com o propósito de inferir (avaliar) a
qualidade de todo o alimento. A partir do exemplo, podemos
distinguir dois importantes conceitos da Estatística descritiva:
população e amostra.
22
Unidade 1 23
»» é barata e rápida;
»» é atualizada;
»» é sempre viável.
24
Amostragem
Como já foi exposto nesta unidade, as pesquisas são realizadas
por meio de estudo dos elementos que compõem uma amostra
extraída da população que se pretende analisar. O conceito de
população é intuitivo. Trata-se do conjunto de indivíduos ou
objetos que apresentam, em comum, determinadas características
definidas para o estudo. Amostra é um subconjunto da
população. O estudo de todos os elementos da população
possibilita conhecimento preciso das variáveis que estão sendo
pesquisadas; todavia nem sempre é possível obter as informações
de todos os elementos da população.
Unidade 1 25
26
Seção 2 – Variáveis
Variáveis são conjuntos de características que podem ser
observadas e/ou medidas em cada elemento da população ou
amostra, sob as mesmas condições.
Unidade 1 27
28
Seção 3 – Dados
Dados estatísticos são medidas da presença de um determinado
conjunto de valores de uma variável numa população ou amostra.
Os tipos de dados estatísticos são:
percentagens;
coeficientes;
taxas;
índices.
Unidade 1 29
Percentagens e proporções
Permitem padronizar distribuições de frequência quanto ao
tamanho, ou seja, comparam grupos de diferentes frequências totais.
(Porcentagem)
30
Unidade 1 31
Coeficientes e taxas
São razões que comparam o número de ocorrências de certo evento
com ele mesmo, acrescido das não ocorrências (mas que poderiam
ter ocorrido); e a razão entre variáveis da mesma espécie.
Coeficientes
32
Número de nascimentos
Coeficiente de natalidade =
População total
Número de óbitos
Coeficiente de mortalidade infantil =
Número de nascimento total
Taxas
Índices
População
Densidade demográfica =
Superfície
Número de alunos
Densidade aluno/professor =
Número de professores
Número de alunos
Densidade aluno/ sala de aula =
Número de sala de aula
Unidade 1 33
Índices econômicos
Consumo de bem
Consumo per capita =
População
Renda
Renda per capita =
População
Seção 4 – Séries
Série estatística define-se como toda e qualquer coleção de
dados estatísticos referidos a uma mesma ordem de classificação.
Quantitativa em seu sentido mais amplo, o termo série refere-se a
uma sucessão de números referidos a qualquer variável.
34
Tipos de séries
Para diferenciar uma série estatística de outra, há que levar em
conta três caracteres presentes na tabela que se apresenta:
Anos Nº de nascidos
1984 2.559.038
1985 2.619.604
1986 2.779.253
Unidade 1 35
Tabela 1.4 – Mulheres de dez anos ou mais de idade, total, tiveram filhos nascidos vivos –
Censo de 2000 - segundo as Mesorregiões
Tabela 1.5 – Pessoas de dez anos ou mais de idade que viviam em companhia de cônjuge
ou companheiro(a), por natureza da união, segundo as Mesorregiões – Santa Catarina –
Censo de 2000
36
Tabela 1.6 – Quantidade de mortes por acidente de trânsito em São Paulo, nos anos de
1997 e 1998 (dados fictícios)
Síntese
Unidade 1 37
Atividades de autoavaliação
38
Variável Exemplo
Qualitativa nominal
Qualitativa ordinal
Quantitativa discreta
Quantitativa contínua
Unidade 1 39
Idade do cliente
Sexo do cliente
Classe econômica
Estado civil
Grau de instrução
Número de filhos
Comprimento da peça
40
Tabela A – Pessoas de dez anos ou mais de idade, por estado civil e condição de
convivência – Santa Catarina – Censo de 2000
Desquitado(a)
Estado civil Casado(a) ou separado(a) Divorciado(a) Viúvo(a) Solteiro(a)
judicialmente
Mesorregiões
Grande Florianópolis 267.867 18.697 16.779 28.224 333.974
Norte Catarinense 380.222 21.098 13.630 38.037 379.194
Oeste Catarinense 439.967 16.130 9.174 38.856 399.587
Serrana 142.373 6.738 4.814 15.834 150.964
Sul Catarinense 314.348 14.021 12.068 32.261 302.894
Vale do Itajaí 443.839 25.825 20.433 46.595 439.800
41
Saiba mais
42
Distribuição de frequências e
representação gráfica
Objetivos de aprendizagem
Organizar dados brutos de acordo com os tipos de
variáveis.
Seções de estudo
Seção 1 Representação numérica
Dados brutos
44
I M R P I I P R
P R I P P I R I
P P P M I P P P
M P I I I M P R
M R R P M M P R
I R M P P I R P
M P I P P M P I
Quadro 2.1 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
Fonte: Elaboração do autor (2006).
Legenda do quadro:
I – Investimentos imobiliários
M – Investimento em mercado de ações
P – Investimento em poupança
R – Investimento em fundos de renda fixa
Unidade 2 45
1 1 4 1 0 0 1 6
5 0 0 0 0 0 0 0
0 1 0 0 1 0 3 2
4 2 0 0 2 0 1 0
0 0 3 3 0 0 4 0
0 1 0 2 0 0 1 0
3 0 0 0 3 0 0 0
Quadro 2.2 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
Fonte: Elaboração do autor (2006).
Dados agrupados
Dados agrupados são sequências de valores numéricos, ou não, os
quais se encontram já organizados, ou por semelhança (qualitativas),
ou por ordenação numérica (quantitativas), em tabelas.
46
I I I I I I I I
I I I I I I M M
M M M M M M M M
P P P P P P P P
P P P P P P P P
P P P P P P R R
R R R R R R R R
Quadro 2.4 – Levantamento sobre o tipo de investimento que os clientes do banco mais confiavam
Fonte: Elaboração do autor (2006).
Legenda do quadro:
I – Investimentos imobiliários
M – Investimento em mercado de ações
P – Investimento em poupança
R – Investimento em fundos de renda fixa
2º passo: agora você vai escrever, em uma coluna, cada uma das
opções verificadas. Contar o número de vezes em que cada tipo
aparece e marcar com traços, ao lado, para representar as aparições.
Em seguida, conte o número de traços para obter o número de vezes
que cada opção aparece. Observe, a seguir, a contagem dos dados.
I = 14
M = 10
P = 22
R = 10
Unidade 2 47
Imobiliário 14
Mercado de ações 10
Poupança 22
Fundos de renda fixa 10
Total 56
48
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 1 1 1 1 1 1 1
1 1 2 2 2 2 3 3
3 3 3 4 4 4 5 6
Quadro 2.5 – Levantamento sobre o número de defeitos por peça de uma fábrica de rolamentos
Fonte: Elaboração do autor (2006).
0 33
1 9
2 4
3 5
4 3
5 1
6 1
Unidade 2 49
50
Unidade 2 51
critério da raiz ;
Observe que:
1. Ainda que existam dois critérios, em geral, o critério
utilizado é o da raiz: .
2. O número do intervalo (k), em alguns casos, pode ser
predefinido.
3. As tabelas devem ter, no mínimo, 5 e, no máximo,
20 intervalos de classes, para que não haja nem perda,
nem excesso de informação.
AT = L(máx) – l(mín)
52
No exemplo:
h.K > AT
Unidade 2 53
sete intervalos;
A este valor, some o h (2,8) e encontre o limite superior deste intervalo: 15,90 |--- 18,70
15,9 + 2,8 = 18,7. Você deve escrever na tabela:
54
Tabela 2.3 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
Unidade 2 55
Tabela 2.4 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
1 15,9 18,7 12
2 18,7 21,5 8
3 21,5 24,3 12
4 24,3 27,1 5
5 27,1 29,9 3
6 29,9 32,7 6
7 32,7 35,5 10
Total ( ) 56
Tabela 2.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
56
Frequência acumulada
Na tabela, na coluna da frequência acumulada, você deverá
escrever o valor acumulado das frequências, ou seja, para
começar, repita a frequência simples da primeira linha e,
nas linhas seguintes, some a frequência simples à frequência
acumulada anterior.
fa = fa(ant) + f i
Sendo:
Unidade 2 57
58
Sendo:
Unidade 2 59
fp = fr . 100
Sendo:
60
Sendo:
Unidade 2 61
62
Unidade 2 63
todo gráfico deve ter título e fonte (no rodapé), para que
o leitor não tenha a necessidade de voltar ao texto para
saber do que se trata;
64
Unidade 2 65
Diagramas
Os diagramas são gráficos geométricos de, no máximo, duas
dimensões; para sua construção, em geral, fazemos uso do
sistema cartesiano (eixo X e Y). Os principais diagramas são os
gráficos de linhas, colunas, barras, setores ou pizza e o gráfico
polar. Veja cada um desses tipos.
Gráfico de colunas
É usado para apresentar séries temporais, geográficas e
específicas. Formado por retângulos dispostos verticalmente, de
mesma largura (arbitrária), com altura proporcional às grandezas
(variáveis) do fenômeno a ser representado.
66
Gráfico 2.5 – Porcentagem de mulheres, com filhos antes dos 20 anos, 2000
Fonte: Population Reference Bureau (2000).
Unidade 2 67
Gráfico de barras
Segue as mesmas normas do gráfico de coluna, porém os
retângulos ocupam posição horizontal e, por isso, terão
base comum no eixo y. É também mais indicado para séries
geográficas e específicas.
Gráfico de linhas
É comum, para quem trabalha na área de administração e
negócios, observar o comportamento de uma variável ao longo do
tempo. Por exemplo, um executivo que acompanha a cotação diária
das ações da sua empresa, um gerente que acompanha o volume
semanal de vendas de sua loja ou um engenheiro de produção que
acompanha características de qualidade do produto que fabrica.
68
Tabela 2.11 – Balança Comercial brasileira (Valores em US$ Milhões), 2005 a 2009
Gráfico 2.6 – Balança comercial brasileira (Valores em US$ milhões), 2005 a 2009
Fonte: Portal Brasil (2010).
Unidade 2 69
Gráfico Polar
É o gráfico mais indicado quando temos necessidade de
representar variações cíclicas, ou seja, que se repetem em períodos
predeterminados.
Cartograma
O cartograma é a representação sobre um mapa. Este gráfico é
empregado quando o objetivo é o de figurar os dados estatísticos
diretamente relacionados com áreas geográficas ou políticas.
Pictogramas
Pictogramas são construídos a partir de figuras ou conjunto de
figuras representativas da intensidade ou das modalidades do
fenômeno.
70
Histograma
Este gráfico é muito semelhante ao de colunas, ou seja, é formado
por um conjunto de retângulos justapostos, de maneira que a
altura de cada retângulo seja proporcional à frequência simples da
classe por ele representada.
Unidade 2 71
Total 70
Gráfico 2.7 – Emissão de óxido de enxofre nos últimos 70 meses (em toneladas)
Fonte: Elaboração do autor (2006).
72
Polígono de frequências
Unindo por linhas retas os pontos médios das bases superiores
dos retângulos do histograma, obtém-se outra representação dos
dados, denominada polígono de frequências.
Unidade 2 73
Síntese
74
Atividades de autoavaliação
Unidade 2 75
4 8 6 6 4 5
6 5 8 5 6 5
8 5 7 6 8 7
3 3 4 4 3 3
5 5 4 6 5 5
7 7 6 8 8 7
76
Unidade 2 77
78
Unidade 2 79
Saiba mais
80
Objetivos de aprendizagem
Conhecer os tipos de medidas de posição.
Seções de estudo
Seção 1 Medidas de posição
Por isso, nesta unidade, você vai estudar, também, medidas que
irão auxiliá-lo na avaliação do comportamento das séries de
dados com relação a sua média. Chamamos essas medidas de
medidas de dispersão.
82
Unidade 3 83
Notação:
Em que:
n = número de valores da série (ou tamanho da amostra).
x i = valores da série.
84
Em que:
n = número de valores da série (ou tamanho da amostra)
x i = valores da série
f i = frequência simples de cada xi
Unidade 3 85
Passo 1: some a coluna das frequências simples (fi) para obter Σfi
(frequência total).
= 56
xi.f i = 92
86
Em que:
n = número de valores da série (ou tamanho da amostra)
PM = ponto médio do intervalo
f i = frequência simples de cada intervalo
Passo 1: some a coluna das frequências simples (fi) para obter Σfi
(frequência total).
= 56
Unidade 3 87
ΣPMi.f i = 1386
Tabela 3.2 – Quantidade emitida de óxido de enxofre (SO), em toneladas, pelas fábricas
do distrito industrial de Florianópolis
(15,9 + 18,7)
⁄2 = 17,3
Qtde. de SO Nº de meses PM PM.fi
(em ton.) (fi)
15,9 |--- 18,7 12 17,3 207,6 17,3×12 = 207,6
18,7 |--- 21,5 8 20,1 160,8
21,5 |--- 24,3 12 22,9 274,8 20,1×8 = 160,8
24,3 |--- 27,1 5 25,7 128,5 22,9×12 = 274,8
27,1 |--- 29,9 3 28,5 85,5
29,9 |--- 32,7 6 31,3 187,8 25,7×5 = 128,5
32,7 |--- 35,5 10 34,1 341
Total (Σfi) 56 1386 Σxi.fi = 92
Somar as
Fonte: Elaboração do autor (2006). frequências simples
88
Notação:
Unidade 3 89
Veja passo a passo como calcular a mediana para dados brutos quando
o (n) é ímpar
Calcular a mediana da série X: 5, 30, 27, 9, 15, 19, 24, 20, 31.
Me = 20
1º 2º 3º 4º 5º 6º 7º 8º 9º
5 9 15 19 20 24 27 30 31
90
Veja passo a passo como calcular a mediana para dados brutos quando
o (n) é par
Para você encontrar a mediana, é preciso calcular o ponto médio
dos dois valores que ocupam as posições calculadas.
Passo 1: ordene de forma crescente 5, 9, 15, 19, 20, 24, 27, 30.
1º 2º 3º 4º 5º 6º 7º 8º
5 9 15 19 19,5 20 24 27 30
Unidade 3 91
92
Unidade 3 93
Passo 5: Após o clique, irá abrir a seguinte janela, na qual você irá
selecionar o item “Estatística Descritiva” e clicar em OK.
Notação:
Mo = Moda.
Unidade 3 95
Veja os exemplos:
Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.
Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
96
Afetada
Existência Leva em pelos Vantagens e
Medida Definição Frequência conta todos valores desvantagens
os valores? extremos?
Usada em toda
Soma de todos os Estatística;
valores divididos funciona bem
Média Mais usada. Existe sempre. Sim. Sim.
pelo número de com muitos
valores. métodos
estatísticos.
Costuma ser
uma boa
Mediana Valor que divide a Usada Existe sempre. Não. Não. escolha se há
série na metade. comumente. alguns valores
extremos.
Pode não
Valor que mais existir ou, Apropriada para
Usada às
Moda se repete (maior ainda, pode Não. Não. dados ao nível
vezes.
frequência). haver mais de nominal.
uma.
Quadro 3.1 – Resumo das vantagens e desvantagens de cada medida de tendência central
Fonte: Elaboração do autor (2006).
Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer
outros aspectos relativos ao conjunto de valores, além de um valor
central ou valor típico. Algumas informações relevantes podem
ser obtidas através do conjunto de medidas: média, extremos,
quartís, decís, percentís etc. Veja, a seguir, mais detalhes e
exemplos de como calcular as separatrizes.
Unidade 3 97
Q2 = D5 = P50 = Me
Passo 1: ordene de forma crescente (rol) 15, 16, 20, 20, 20, 22, 22,
22, 25, 26, 28.
98
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
1º 2º 3º 4º 5º
15 16 20 20 20
Unidade 3 99
1º 2º 3º 4º 5º
15 16 20 20 20
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º
15 16 20 20 20 22 22 22 25 26 28
100
Percentis
Observação: para calcular a posição dos percentis use a seguinte
fórmula:
Unidade 3 101
Decís
Se você notar, poderá comparar os decís com alguns percentis, ou seja:
Decís 1º 2º 3º 4º 5º 6º 7º 8º 9º
Percentis 10º 20º 30º 40º 50º 60º 70º 80º 90º
102
Então, D3 = 20.
Unidade 3 103
é simples de construir
104
8, 9, 11, 17, 17, 19, 20, 44, 45, 53, 57, 57, 57, 58, 70, 81, 82, 83,
100, 104.
8, 9
11, 17, 17, 19
20
44, 45
53, 57, 57, 57, 58
70
81, 82, 83
100, 104
0 89
1 1779
2 0
3 -
4 45
RAMO 5 37778 FOLHAS
6 -
7 0 Legenda:
8 123 5 | 3 = 53 meses
9 - 10| 4 = 104 meses
10 4
Figura 3.8 – Construção de um diagrama de ramo e folhas
Fonte: Elaboração do autor (2011).
Unidade 3 105
106
998 0 89
99876610001 1 1779
3111 2 0
5444322 3 -
55 4 45
8651 5 37778
8 6 -
0 7 0
31 8 123
- 9 -
- 10 04
5 11 -
- 12 -
- 13 - Legenda:
- 14 - 5 | 5 | = 55 meses para homem
7 15 - | 5 | 3 = 53 meses para mulher
Unidade 3 107
limite inferior;
limite superior;
primeiro quartil;
terceiro quartil;
mediana.
posição;
dispersão;
assimetria;
caudas;
108
Unidade 3 109
110
Unidade 3 111
112
Unidade 3 113
d) clique em Avançar;
114
Tabela 3.3 – Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos
Grupos Escores (em pontos) obtidos por pessoa (10 pessoas) Total
Grupo 1: 6 6 6 6 6 6 6 6 6 6 60
Grupo 2: 1 8 9 2 6 10 5 8 7 4 60
Grupo 3: 5 6 7 7 6 5 6 7 5 6 60
Unidade 3 115
Para o grupo 1:
Para o grupo 2:
Para o grupo 3:
116
População Amostra
σ2 (x) → variância S2(x) → variância
Unidade 3 117
Variância
Desvio padrão
σ = 18ª letra do alfabeto grego, chama-se sigma.
Quadro 3.3 – Fórmulas para o cálculo de medidas de dispersão com dados brutos
Fonte: Elaboração do autor (2006).
118
Unidade 3 119
120
Variância
Desvio padrão
Quadro 3.4 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados sem intervalos
Fonte: Elaboração do autor (2006).
Unidade 3 121
Nº de
Nº de salários -
funcionários x i . (fi) (x i − x ) (x − x )
2 2
(x − x ) . (fi)
mínimos (x i )
(fi)
1 29 29 -2,33 5,4 1 157,4381
2
Σ fi Σ x i .f i Σ ( x i − x ) .f i
Fonte: Elaboração do autor (2006).
Passo 1: inicie por somar a coluna das frequências simples (fi) para
obter Σfi (frequência total); Σfi = 135.
122
1 − 3,33 = −2,33
2 − 3,33 = −1,33
3 − 3,33 = −0,33
4 − 3,33 = 0,67
5 − 3,33 = 1,67
6 − 3,33 = 2,67
7 − 3,33 = 3,67
(−2,33)2 = 5,4289
(−1,33)2 = 1,7689
(−0,33)2 = 0,1089
(0,67)2 = 0,4489
(1,67)2 = 2,7785
(2,67)2 = 7,1289
(3,67)2 = 13,4689
Unidade 3 123
5,4289 . 29 = 157,4381
1,7689 . 28 = 49,5292
0,1089 . 20 = 2,1780
0,4489 . 18 = 8,0802
2,7785 . 16 = 44,4560
7,1289 . 15 = 106,9335
13,4689 . 9 = 121,1607
124
Variância
Desvio padrão
Quadro 3.5 – Fórmulas para o cálculo de medidas de dispersão com dados agrupados com intervalos
Fonte: Elaboração do autor (2006).
Unidade 3 125
Tabela 3.5 – Volume de vendas mensal, em milhares de reais, dos representantes de uma
empresa que fabrica remédios – outubro/2010
55,5025.12 = 666,0300
17,3 − 24,75 = −7,45
(−7,45) 2 = 55,5025
Nº de
Nº de vendas
representantes PM PM. fi PM i − x (PM i − x )
2 2
(PM i − x ) . fi
(em mil reais)
(fi )
15,9 | -- 18,7 12 17,3 207,6 −7,45 55,5025 666,0300
Σ fi Σ PM i . fi 2
Σ ( PM i − x ) .f i
126
(−7,45)2 = 55,5025
(−4,65)2 = 21,6225
(−1,85)2 = 3,4225
(0,95)2 = 0,9025
(3,75)2 = 14,0625
(6,55)2 = 42,9025
(9,35)2 = 87,4225
55,5025 . 12 = 666,0300
21,6225 . 8 = 172,9800
3,4225 . 12 = 41,0700
0,9025 . 5 = 4,5125
14,0625 . 3 = 42,1875
42,9025 . 6 = 257,4150
87,4225 . 10 = 874,2250
Unidade 3 127
128
Figura 3.18 – Quanto mais distantes da média, mais dispersos os dados estão
Fonte: Triola (1999, p. 42).
Unidade 3 129
130
Grupo 1 Grupo 2
Média: Média:
μ = 122 pontos μ = 122 pontos
Desvio padrão: Desvio padrão:
σ(x) = 4,5 pontos σ(x) = 7,5 pontos
Fonte: Elaboração do autor (2006).
Unidade 3 131
132
Unidade 3 133
»» Para o grupo 1:
»» Para o grupo 2:
134
Síntese
Unidade 3 135
Atividades de autoavaliação
136
Unidade 3 137
15 19 13 21 16 17 15 12 13
b) Conjunto 2
17 18 14 14 15 15 16 16
138
7 6 5 8 2 1 3 2 1
1 7 6 8 5 1 2 2 7
b) Conjunto 02
5 6 8 2 3 5 3 3
2 6 5 8 3 2 5 6
c) Conjunto 03
5 6 3 7 5 3 2 1
1 6 7 2 8 4 8 4
Unidade 3 139
4 6 8 2 5 9 4 3 8 9 5 4
140
Unidade 3 141
142
Unidade 3 143
11.1)
Série A Série B
μ = 57; σ(x) = 5,6 μ = 96; σ(x) = 8,2
11.2)
Série A Série B
μ = 64; σ(x) = 12 μ = 96; σ(x) = 18
11.3)
Série A Série B
μ = 195; σ(x) = 12 μ = 125; σ(x) = 12
11.4)
Série A Série B
μ = 869; σ(x) = 201 μ = 625; σ(x) = 198
144
40,208
42,303
43,262
48,914
49,46
52,681
52,764
52,87
57,784
61,411
68,02
71,615
72,471
74,176
75,973
78,769
81,412
81,736
82,756
106,354
Unidade 3 145
Saiba mais
146
Cálculo e distribuição de
probabilidades
Objetivos de aprendizagem
Calcular e interpretar probabilidades.
Seções de estudo
Seção 1 Principais conceitos
Bons Estudos!
148
Unidade 4 149
Espaço amostral
Observe que quando se trabalha com experimentos que admitem
mais de um resultado, torna-se interessante definir o conjunto
de todos esses resultados; nesse caso, você pode chamar esse
conjunto de espaço amostral.
O símbolo para representar o
conjunto do espaço amostral é S
(letra maiúscula).
Espaço amostral é o conjunto de todos os possíveis
resultados de um experimento (fenômeno) aleatório.
150
S = {C1, C2, P1, P2, P3}: observe que são todas as possibilidades
entre as pessoas do grupo.
Unidade 4 151
S = {D1, D2, D3, D4, D5, P1, P2}: observe que são todas as
possibilidades entre as pessoas do grupo.
Sabendo que, nesse grupo, você tem três pessoas com cabelos
pretos, duas com cabelos louros, três com cabelos castanhos
e uma com cabelos ruivos, como fica o conjunto do espaço
amostral? Pense e anote a seguir como você acha que fica o
conjunto do espaço amostral do exemplo:
S = {______________________________________}
S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que são todas
as possibilidades entre as pessoas do grupo.
No exemplo 1: n(S) = 6;
No exemplo 2: n(S) = 5;
No exemplo 3: n(S) = 7;
No exemplo 4: n(S) = 9.
152
Eventos
Quando você tiver que estudar algum experimento aleatório,
deverá identificar as diferentes variações de resultados possíveis
dentro do espaço amostral. Você pode chamar de evento
cada uma dessas variações, ou seja, cada uma dessas partes
(subconjuntos) do espaço amostral é um evento.
O símbolo para representar
Um evento é qualquer subconjunto do espaço amostral
o subconjunto de um
determinado pelo experimento (fenômeno) aleatório em estudo. evento é A (letra
maiúscula).
Unidade 4 153
Sabendo que nesse grupo você tem três pessoas com cabelos
pretos, duas com cabelos louros, três com cabelos castanhos e
uma com cabelos ruivos, como fica o subconjunto do evento
pessoas com cabelos ruivos?
154
No exemplo 1: n(A) = 3;
No exemplo 2: n(B) = 3;
No exemplo 3: n(C) = 5;
No exemplo 4: n(D) = 1.
Tipos de eventos
Existem três tipos de eventos, que são:
D = {R1} ⇒ n(D) = 1.
F = { } ⇒ n(F) = 0
Unidade 4 155
União de eventos
Se existem os eventos A e B de um espaço amostral S, a união
desses eventos existe se pode ocorrer A ou B.
A B
Interseção de eventos
Se existem os eventos A e B de um espaço amostral S,
a interseção desses eventos existe se pode ocorrer A e B,
simultaneamente.
156
Complemento de um evento
É um evento formado por todos os elementos pertencentes a S,
mas que não pertencem a A.
S
A
A’
Unidade 4 157
Subtração de eventos
Você pode dizer que A menos B é se, e somente se, ocorre A e
não ocorre B.
A B
Eventos excludentes
Dois ou mais eventos são ditos excludentes (mutuamente
exclusivos) se a realização de um dos eventos excluir a realização
do outro ou de outros eventos.
S
A
B
C
Probabilidade clássica
Antes de conhecer como se calcular a probabilidade clássica,
saiba como ela é possível.
= P = sucesso
= q = fracasso
Unidade 4 159
n(S) = 8;
n(A) = 2;
n(B) = 3.
160
b) comerciário?
c) comércio informal?
Unidade 4 161
n(S) = 118
n(A) = 29
n(B) = 11
n(C) = 17
Para o evento A
Para o evento B
Para o evento C
162
n(S) = 118
n(D) = 24
n(E) = 20
n(F) = 17
Para o evento D
Para o evento E
Para o evento F
Unidade 4 163
Frequência Relativa
A frequência relativa de um evento A é calculada dividindo o
número de vezes que ocorre o evento A pelo total de observação
do experimento. É chamada, também, de probabilidade
avaliada ou probabilidade estimada.
164
Unidade 4 165
Algumas considerações
Consideremos S um espaço amostral, e A, B, C são eventos
contidos em S, então:
b) P(S) = 1 ↔
166
Unidade 4 167
168
Unidade 4 169
170
Unidade 4 171
A: errar a questão
S: todas as opções (a, b, c, d, e)
172
→ a probabilidade de sucesso é,
então, p = 0,8.
B: acertar a questão
S: todas as opções (a, b, c, d, e)
q = 0,2
Observe:
p + q = 0,8 + 0,2 = 1 ou 100%
Unidade 4 173
Sendo:
Notação: n!
174
– a probabilidade de sucesso é,
então, p = 0,8.
B: acertar a questão
S: todas as opções (a, b, c, d, e)
n(B) = 1 (se somente uma está correta)
n(S) = 5
– a probabilidade de fracasso, então
q = 0,2
Unidade 4 175
176
Total 1
Unidade 4 177
A distribuição normal
Como você estudou anteriormente, quando se utiliza uma
variável aleatória contínua, pode-se atribuir probabilidade a
essa variável. Conforme a seção anterior, os processos definidos
a partir de contagens conduzem aos modelos que envolvem
variáveis aleatórias discretas, enquanto que os processos definidos
a partir de medidas conduzem aos modelos que envolvem
variáveis aleatórias contínuas.
Variável aleatória
Medidas
contínua
Figura 4.8 – Tipos de distribuições de probabilidade
Fonte: Elaboração do autor (2006).
178
Histograma
Unidade 4 179
16
10 do polígono.
8
0
,7
,5
,3
,1
,9
,7
,5
18
21
24
27
29
32
35
|—
|—
|—
|—
|—
|—
|—
,9
,7
,5
,3
,1
,9
,7
15
18
21
24
27
29
32
Tempo em minutos
180
X=Me=Mo x
Gráfico 4.4 – Curva de Gauss-Laplace
Fonte: Adaptado de Silva (1997, p. 70).
Unidade 4 181
34,13%
182
99,74%
95,44%
68,26%
34,13% 34,13%
13,59% 13,59%
2,15% 2,15%
71 74 77 =80 83 86 89
Unidade 4 183
184
f
P(a<x<b)
a b x
Gráfico 4.7 – Distribuição normal, com intervalo definido
Fonte: Adaptado de Silva (1997, p. 71).
Unidade 4 185
Em que:
= média
σ = desvio padrão
P( <x<x1)
x1 x
P(0<z<z1)
0 z1 z
Gráfico 4.8 e 4.9 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p. 71).
186
Onde:
= média
σ = desvio padrão
P(x1<x<x2)
x1 x2 x
P(z1<Z<z2)
z1 0 z2 z
Gráfico 4.10 e 4.11 – Padronização de uma distribuição normal
Fonte: Adaptado de Silva (1997, p.71).
Unidade 4 187
Área
0 z
Gráfico 4.12 – Distribuição normal padronizada
Fonte: Triola (1999).
média: = 21;
188
⇒Z=1
µ=21 x=28
Área
0 z=1
Gráfico 4.13 e 4.14 – Padronização de uma distribuição normal
Fonte: Elaboração do autor (2006).
Unidade 4 189
190
A média: = 24;
Área
x2=17,52 µ=24 x1=29,7
Área
z=-1,08 0 z=0,95
Unidade 4 191
Cruzando a
linha com a
Procurar 1,0 coluna.
Unidade 4 193
a média: = 24;
194
Área
µ=24 x1=29,7
Área
0 z=0,95
Unidade 4 195
Cruzando a
linha com a
Procurar 0,9 coluna.
0,3289
0,5-0,3289
0 z=0,95
Gráfico 4.20 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Fonte: Elaboração do autor (2006).
196
Além dos casos que você estudou nos exemplos, ainda há outros.
Um deles pode ser ilustrado a seguir:
0,3413 0,5
ou
34,13% ou
50%
X
Gráfico 4.21 – Determinar a área limitada abaixo pelo valor padronizado e sem limite acima
Fonte: Elaboração do autor (2006).
Unidade 4 197
Síntese
198
Atividades de autoavaliação
Unidade 4 199
Desquitado(a)
Casado(a) ou separado(a) Divorciado(a) Viúvo(a) Solteiro(a) Total
judicialmente
267.867 18.697 16.779 28.224 333.974 665.541
a) casada?
b) solteira?
c) divorciada?
200
Unidade 4 201
202
Saiba mais
Unidade 4 203
Amostragem e cálculo de
estimativa
Objetivos de aprendizagem
Conhecer as vantagens e a importância da
amostragem.
Calcular tamanho de amostra.
Seções de estudo
Seção 1 Introdução
206
Seção 1 – Introdução
A amostragem está intimamente ligada aos estudos de Estatística
descritiva e probabilidades. Além de estarem ligados, são
dependentes uns dos outros. Veja a figura a seguir:
Amostragem
População
População é o conjunto total de elementos com, pelo menos, uma
característica em comum, cujo comportamento interessa estudar.
Notação:
Unidade 5 207
Amostra
Amostra é o conjunto de elementos ou observações, recolhidos
a partir de um subconjunto da população, que se estuda com o
objetivo de tirar conclusões para a população de onde foi recolhida.
Notação:
208
Tamanho da amostra:
Em que:
Tamanho da amostra:
Em que:
N = tamanho da população;
n = tamanho da amostra.
Unidade 5 209
→ n0 = 625 estudantes.
→ n0 = 625 estudantes.
210
Onde: Onde:
n = tamanho da amostra; n = tamanho da amostra;
N = tamanho da população; N = tamanho da população;
e = erro amostral; e = erro amostral;
σ = desvio padrão; p = percentual de elementos
Z = limite do intervalo (dist. Normal). com a característica estudada;
q = percentual de elementos
sem a característica estudada;
Z = limite do intervalo (dist. Normal).
Unidade 5 211
212
Unidade 5 213
Figura 5.2 – Variável aleatória discreta e intervalo de produção; variável aleatória continua e
intervalo da média
Fonte: Elaboração do autor (2006).
Nível de confiança
O nível de confiança é a probabilidade de o intervalo conter o
parâmetro estimado, ou seja, pode-se entender que o valor ou
percentual da população que você está tentando estimar tem
a probabilidade de estar em um intervalo que seria o definido
pelo erro.
214
Intervalo de confiança
Intervalo de confiança é aquele que contém o parâmetro estudado
com determinada probabilidade (nível de confiança), ou seja,
citando o exemplo da pesquisa eleitoral, é o intervalo calculado
com o erro. Veja os valores no exemplo citado nesta seção: “... as
intenções de votos para o candidato A podem variar de 37% a
41%”. Esse é o intervalo de confiança.
Curva normal
Você poderia se perguntar, a partir do que foi apresentado, qual
relação se pode estabelecer entre o nível de confiança e intervalo
de confiança. Como o nível de confiança é a probabilidade de
a estimativa estar correta e essa probabilidade determina um
intervalo (o intervalo de confiança), é possível usar a curva
normal para identificar a ambos. Veja a figura a seguir:
Unidade 5 215
216
218
População Amostra
Percentual de eleitores que não votam em Percentual de eleitores que não votam em
Théo: calcule o percentual de fracasso sempre Théo: calcule o percentual de fracasso sempre
na forma decimal, ou seja, dividindo o na forma decimal, ou seja, dividindo o
percentual por 100. percentual por 100.
q = 1 – p = 1 – 0,33 = 0,67
No final, multiplique por 100 para encontrar No final, multiplique por 100 para
novamente o percentual: encontrar novamente o percentual:
q = 0,67. 100 = 67% (percentual de (percentual de fracasso
fracasso da população). da amostra).
Unidade 5 219
População Amostra
Percentual de eleitores que não votam Percentual de eleitores que não votam
em Théo: calcule o percentual de fracasso em Théo: calcule o percentual de fracasso
sempre na forma decimal, ou seja, sempre na forma decimal, ou seja,
dividindo o percentual por 100. dividindo o percentual por 100.
p = 0,33
q = 1 – p = 1 – 0,33 = 0,67
No final, multiplique por 100 para No final, multiplique por 100 para
encontrar novamente o percentual: encontrar novamente o percentual:
q = 0,67. 100 = 67%
(percentual de fracasso da população). (percentual de fracasso da amostra).
220
Em que:
e = erro da estimativa;
n = tamanho da amostra.
Em que:
NC = nível de confiança.
Unidade 5 221
222
Em que:
e = erro da estimativa;
Cálculo do erro
= 1,96.
Unidade 5 223
ou 29,603%
ou 40,397%
224
Cálculo do percentual:
Unidade 5 225
Em que:
226
Cálculo do erro
= 1,645 .
ou 58,38%
ou 61,61%
Unidade 5 227
228
Em que:
e = erro da estimativa;
n = tamanho da amostra.
Em que:
x = média da amostra;
NC = nível de confiança.
Unidade 5 229
Em que:
n = 35 (tamanho da amostra).
Cálculo do erro:
= 1,96.
Unidade 5 231
Calculando
232
Unidade 5 233
Em que:
Cálculo do erro:
= 1,645.
234
Unidade 5 235
236
(médias amostrais) = 49 = 56 = 51 = 52
Unidade 5 237
H: µ1 = µ2 = µ3
H: µ1 = µ2 = µ3
238
A hipótese H é verdadeira
As diferenças observadas entre as médias amostrais são devidas a
flutuações amostrais. Ou seja, neste caso, teremos que µ1 = µ2 =
µ3: todas as amostras provêm de populações com médias iguais.
A hipótese H é falsa
As diferenças observadas entre as médias amostrais são
demasiado grandes para serem devidas unicamente a flutuações
amostrais.
Unidade 5 239
Teste ANOVA
Para testar a hipótese, devemos trabalhar com o valor da
Estatística de teste F, que é outro valor que surge de outra
distribuição de probabilidade, que a semelhança da distribuição
normal tem uma tabela para calcular seu valor, no qual devemos
entrar com os graus de liberdades (número de dados da amostra
diminuído um) para obter o valor correspondendo a um certo
nível de confiança (por exemplo, NC = 95%, ou seja, um nível de
significância de 5%: α = 5%).
240
Unidade 5 241
242
Então, para nosso exemplo da compra das fábricas por parte do Sr.
Fernando Fernandes, vamos ver o que podemos concluir ao nível de
significância de 0.05, ou seja, a um nível de confiança NC = 95%.
Cálculo de SSE:
Cálculo de SSA:
Unidade 5 243
F1–a,2,12 = 3.89
244
Síntese
Unidade 5 245
Atividades de autoavaliação
Tamanho Tamanho
Erro
Tema do estudo da da amostra
tolerável população (preencher)
246
Com os dados dessa matéria, mostre os cálculos que foram feitos para
se chegar ao erro de 2,74 pontos percentuais, e encontre o intervalo da
estimativa.
Unidade 5 247
248
4) Uma amostragem com 250 alunos foi feita em escolas, e, entre outras
perguntas, questionou-se sobre o peso dos alunos da quinta-série. O
peso médio dos alunos entrevistados foi de 29,3 Kg e apresentou um
desvio padrão de 3,4 Kg. Usando um nível de confiança de 95%, calcule
uma estimativa para a totalidade (população) de alunos da quinta-série
(não esqueça de calcular o erro e o intervalo correspondentes).
Unidade 5 249
250
8 10 7
6 8 5
5 12 8
6 7 6
7 9 7
10 5
11
Soma 32 67 38
Unidade 5 251
Objetivos de aprendizagem
Compreender e calcular a correlação entre duas
variáveis.
Analisar a força de correlação entre duas variáveis.
Seções de estudo
Seção 1 Correlação linear simples
Bons estudos!
254
Diagrama de dispersão
O diagrama de dispersão ajuda a definir a correlação entre duas
variáveis quantitativas de modo gráfico. Em outras palavras,
a relação entre duas variáveis, X e Y, pode ser vista em um
diagrama, no qual são marcados os pontos correspondentes aos
pares ordenados gerados pela relação X → Y, e (x,y) são esses pares
ordenados. Dessa forma se constrói um diagrama de dispersão.
n. ∑ x. y − [(∑ x )(
. ∑ y )]
rxy =
[n ∑ x 2
][
− (∑ x ) . n ∑ y 2 − (∑ y )
2 2
]
Unidade 6 255
Em que:
n = número de observações;
Tipos de correlações
Então, segundo os resultados de r, as correlações podem assumir
diferentes tipos, os quais você pode acompanhar detalhadamente
a seguir:
256
Unidade 6 257
258
Unidade 6 259
160.61 = 9760
155.56 = 8680
152.55 = 8360
260
(160)2 = 25600
(155)2 = 24025
(152)2 = 23104
(61)2 = 3721
(56)2 = 3136
(55)2 = 3025
Unidade 6 261
Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
Σy2 = 50323
Σx.y ≠ Σx . Σy
Σx2 ≠ Σy2
262
Unidade 6 263
Sendo:
Em que:
264
Unidade 6 265
Σx = 1723
Σy = 703
Σx.y = 122327
Σx2 = 298537
266
Σx = 1723
Σy = 703
a = 0,72117
b = –53,95769
a = 0,72117
b = − 53,95769
= b + a.X
= 0,72117x – 53,95769
Fazer a previsão para um aluno que mede 175 cm. Você deve usar
175 como X = 175. Substituir o valor de X na equação de regressão.
= 72,24706
Unidade 6 267
268
Unidade 6 269
Exemplo 1:
Exemplo 2:
Exemplo 3:
270
Unidade 6 271
P = (1 / m) Spi
Em que:
Assim sendo:
NP = P x n
Em que:
NP = número médio;
272
Para o exemplo:
Em que:
NP = número médio;
LSC = 10,1615
LIC = −1,8281.
Unidade 6 273
LIC = 0
LSC = 10,1615
NP = 4,167
274
Unidade 6 275
276
número de amostras m = 6;
Unidade 6 277
Cálculo da média
X = Σn amostra 1 / n
Em que:
X = média aritmética;
n = tamanho da amostra.
X = 250 / 4 = 62,5
Em que:
r = amplitude
r = 70 – 55 = 15
278
X = 367,50 / 6 = 61,25
K = 95 / 6 = 15,83
Unidade 6 279
tamanho da amostra: n = 4.
LIC = X − A2 x K
LSC = X + A2 x K
280
Unidade 6 281
Síntese
282
Atividades de autoavaliação
Unidade 6 283
Saiba mais
284
288
Unidade 1
1) O censo é uma coleção de dados de uma população,
enquanto que a estimação usa dados de uma amostra para
avaliar um parâmetro (característica descritiva dos elementos
da população).
3. Nessa questão, você deve citar exemplos do seu dia a dia, por
exemplo:
Variável Exemplos
Qualitativa nominal Nacionalidade
Qualitativa ordinal Atendimento (ótimo, muito bom, ... , muito ruim.)
Quantitativa discreta Número de filhos
Quantitativa contínua Escore de teste psicológico
292
Unidade 2
1) Montagem da tabela:
2) Montagem da tabela:
3) Montagem da tabela:
293
4) Completando a tabela:
Respondendo as perguntas:
a) 21 famílias;
b) 29 famílias;
c) 15 famílias;
d) 7 famílias;
e) 11,1% das famílias;
f) 25% das famílias.
5) Completando a tabela:
294
a) 18 meses;
b) 25 meses;
c) 18 meses;
d) 27 meses;
e) 25% dos meses;
f) 13,89% dos meses.
295
Unidade 3
1) Em primeiro lugar, construa a tabela:
3)
a) Conjunto 1
Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posições:
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
12 13 13 15 15 16 17 19 21
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
b) Conjunto 2
Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posições:
14 14 15 15 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
297
14 14 15 15 Me 16 16 17 18
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
4)
a) Conjunto 1
Organizando os dados:
1 1 1 1 2 2 2 2 3
5 5 6 6 7 7 7 8 8
b) Conjunto 2
Organizando os dados:
2 2 2 3 3 3 3 5
5 5 5 6 6 6 8 8
298
c) Conjunto 3
Organizando os dados:
1 1 2 2 3 3 4 4
5 5 6 6 7 7 8 8
A série não tem moda, pois não tem nenhum dado que se repita mais
que os outros
Interpretação moda: é uma série amodal, ou seja, não tem valor(es)
mais frequente.
2 3 4 4 4 5 5 6 8 8 9 9
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª
Interpretação:
75% dos dados observados são menores ou iguais a 8, e 25% dos dados
observados são maiores ou iguais a 8.
Para o nono decil (note que D9 = P90)
Quarto passo: calcular a posição. Considerando N = 12:
299
Interpretação:
90% dos dados observados são menores ou iguais a 9, e 10% dos dados
observados são maiores ou iguais a 9.
Para o trigésimo quinto percentil
Sexto passo: calcular a posição. Considerando N = 12:
Interpretação:
35% dos dados observados são menores ou iguais a 4, e 65% dos dados
observados são maiores ou iguais a 4.
300
301
302
No de dias No de func.
xi.fi (xi – x̄) (xi – x̄)2 (xi – x̄)2. fi
(xi) (fi)
0 10 0 –2,39 5,71 57,1 5,71×10 = 57,1
1 16 16 –1,39 1,93 30,88
2 14 28 –0,39 0,15 2,1 1,93×16 = 30,88
3 8 24 0,61 0,37 2,96
4 5 20 1,61 2,59 12,95
5 4 20 2,61 6,81 27,24
6 4 24 3,61 13,03 52,12
7 3 21 4,61 21,25 63,75
Σ 64 153 249,1 Σ(xi – x̄)2. fi
Σfi Σxi.fi
304
9) Mais uma vez, vamos calcular passo a passo. Comparando com a anterior,
a diferença está em que aquela era para amostra, enquanto que essa é
para a população. Sugestão: use as colunas para facilitar os cálculos.
18 – 18,873 = –0,873
(–1,873)2 = 3,508
17 – 18,873 = –1,873
(–0,873)2 = 0,762
Idade dos estudantes da disciplina de métodos estatísticos
Idade (xi) N de
o
est. xi.fi (xi – μ) (xi – μ)2 (xi – μ)2. fi
(fi)
17 5 85 -1,873 3,508 17,54 3,508×5 = 17,54
18 20 360 -0,873 0,762 15,24
19 22 418 0,127 0,016 0,352 0,762×20 = 15,24
20 10 200 1,127 1,27 12,7
21 6 126 2,127 4,524 27,144
(Σfi) 63 1189 72,976 Σ(xi – x̄)2. fi
Σfi Σxi.fi
305
306
10) Quando você tiver que calcular o desvio padrão para uma tabela com
intervalos, usamos o mesmo processo, apenas substituindo o xi pelo
ponto médio:
116,5 – 122,5 = –9
(–9)2 = 81
113,5 – 122,5 = –6
(–6)2 = 36
Renda de família de um bairro de classe baixa de Florianópolis
No de
Renda (R$) famílias PMi PMi.fi (PMi – x̄) (PMi – x̄)2 (PMi – x̄)2. fi
(fi)
112 |---- 115 2 113,5 227 -9 81 162 81×2 = 162
115 |---- 118 6 116,5 699 -6 36 216
118 |---- 121 4 119,5 478 -3 9 36 36×6 = 216
121 |---- 124 9 122,5 1102,5 0 0 0
124 |---- 127 8 125,5 1004 3 9 72
127 |---- 130 7 128,5 899,5 6 36 252
Total (Σfi) 36 4410 738 Σ(PMi – x̄)2. fi
Σfi ΣPMi.fi
307
11)
11.1)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
308
Para a série B:
11.2)
a) A mais dispersa em termos absolutos é a série B (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
Para a série A:
Para a série B:
11.3)
a) Em termos absolutos, as duas séries apresentam a mesma dispersão
(desvios iguais).
b) Você tem que calcular o coeficiente de variação.
Para a série A:
309
Para a série B:
11.4)
a) A mais dispersa em termos absolutos é a série A (maior desvio padrão).
b) Você tem que calcular o coeficiente de variação.
Para a série A:
Para a série B:
310
12) Passo 1: abra uma nova planilha Excel e, na célula A1, escreva: gráfico
box-plot, digite todos os números dos dados na coluna A de uma nova
planilha do Excel, a partir da fila 2 e, no intervalo C3:C8, escreva os
textos indicados na figura seguinte:
311
O resultado será:
312
Unidade 4
1)
Passo 1: para começar, você deve identificar o evento e o espaço
amostral:
A: jovens sofriam com o autoritarismo dos pais
S: adolescentes
Passo 2: identificar o número de elementos do evento e do espaço
amostral:
n(A) = 675
n(S) = 1500
Passo 3: calcular usando a fórmula:
0,45 ou 45%
2)
Passo 1: Para começar, você deve identificar os eventos e o espaço
amostral:
A: casado(a)
B: solteiro(a)
C: divorciado(a)
S: total pesquisado
Passo 2: identificar o número de elementos dos eventos e do espaço
amostral:
n(A) = 267.867
n(B) = 333.974
n(C) = 16.779
n(S) = 665.541
Passo 3: calcular usando a fórmula:
0,4025 ou 40,25%
313
0,5018 ou 50,18%
0,0252 ou 2,52%
3)
a) Qual a frequência relativa para o número de reações positivas para cada
cobaia?
Passo 1: identificar o numerador e o denominador da fórmula, para
cada experimento.
Cobaia 1:
Número de reações positivas = 1215;
número total de tentativas = 4500.
Cobaia 2:
Número de reações positivas = 1050;
número total de tentativas = 3500.
Passo 2: usar a fórmula da freqüência relativa.
1215
FrA = 0,27 ou 27%
4500
b) Desafio: qual dos dois estímulos você considera mais eficaz? Por quê?
O estímulo por alimentação, pois a cobaia 2, em termos relativos,
apresentou melhor resposta. Embora o número de reações da cobaia
1 tenha sido maior comparando com o total (frequência relativa), a
reação é menor.
314
4)
a) Calcule Z (variável padronizada) para x = 116, x = 136, para x = 131 e
para x = 141 pontos;
Passo 1: identificar todos os elementos que compõe o problema:
a média: μ = 126;
o desvio padrão: σ(x) = 10;
os limites do intervalo: X = 116; X = 136; X = 131; X = 141.
Passo 2: calcular a variável padronizada Z:
Para X = 116:
Z = −1
Para X = 136:
Z=1
Para X = 131:
Z = 0,5
Para X = 141:
Z = 1,5
315
Z = 1 → Área = 0,3413
Passo 3: calcular a probabilidade.
A área dada na tabela é de 0 a Z (0,3413), mas o intervalo solicitado é de
136 para cima. Nesse caso, você deve subtrair de 0,5 (total de área de
um lado da curva) o valor encontrado (0,3413), então:
P(x > 136) = 0,5 – 0,3413 = 0,1587 ou 15,87%
316
317
Unidade 5
1)
a) Estudo socioeconômico com estudantes da Unisul.
Passo 1: identificar os elementos da fórmula:
n0 = tamanho aproximado da amostra;
E = erro amostral tolerável = 0,03;
N = tamanho da população = 5600.
Passo 2: usar a fórmula:
n0 = 625 crianças.
Um tamanho aproximado para a amostra seria de 625 crianças. Observe
que o pesquisador teve acesso à informação de que a população seria
de 9400 crianças, então você deve passar para o passo seguinte:
318
n0 = 400 adolescentes.
Um tamanho aproximado para a amostra seria de 400 adolescentes.
Observe que o pesquisador teve acesso à informação de que a
população seria de 400 adolescentes, então você deve passar para o
passo seguinte:
Passo 3: calcular o tamanho da amostra usando a população com a
seguinte fórmula:
319
n = 118.
2)
Passo 1: Como já foi indicado o percentual de eleitores que votam no
candidato, só falta calcular o percentual dos eleitores que não votam no
candidato ( ).
Você pode deixar na forma decimal, pois, para calcular o erro, é usado
desta forma.
Passo 2: Calcular e procurar o z na tabela (o z é igual ao encontrado no
exemplo 2, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:
320
Em que:
e = erro da estimativa;
z = 1,645 (calculado e encontrado no passo 2);
votam no candidato);
321
3)
Passo 1: como não foi indicado o percentual de professores da amostra
que tem graduação completa, você deve, em primeiro lugar, calcular
este percentual:
n = 300 (tamanho da amostra);
X = 240 (número de professores com graduação);
Cálculo do percentual:
= 1 – 0,8 = 0,2
Você pode deixar na forma decimal, pois, para calcular o erro, é usado
desta forma.
Passo 2: calcular e procurar o z na tabela.
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:
322
Em que:
e = erro da estimativa;
z = 1,96 (calculado e encontrado no passo 2);
no candidato);
= 1 – 0,8 = 0,2 (percentual da amostra dos eleitores que não votam no
candidato);
n = 300 (tamanho da amostra).
323
Cálculo do erro:
= 1,96.
4)
Passo 1: calcular e procurar o z na tabela (o z é igual ao encontrado no
exemplo 1, no final da seção 1).
Dividir o NC por dois. Para isto, sempre usar o valor do nível de
confiança na forma decimal, ou seja, dividir por 100:
324
Em que:
e = o que você quer calcular (erro da estimativa);
z = 1,96 (calculado e encontrado no passo 2);
S(x) = 3,4 (desvio padrão da amostra);
n = 250 (tamanho da amostra).
Cálculo do erro:
325
Em que:
e = o que você quer calcular (erro da estimativa);
z = 2,33 (calculado e encontrado no passo 2);
326
Cálculo do erro:
6)
Passo 1:
Cálculo dos graus de liberdade para definição do ponto crítico (PC):
GLn = 3 – 1 = 2 (graus de liberdade do numerador, 3 máquinas = K);
GLm = 18 – 3 = 15 (graus de liberdade do denominador, 18 = 5 peças na
máquina 1 + 7 peças da máquina 2 + 6 peças da máquina 3 = N).
Agora, procurando na tabela de F para 5% de nível de significância,
entrando na coluna da esquerda com GLm = 15 e na fila superior com
GLn=4, resulta: F (5%,2,15) = 3,68 = PC
327
328
Unidade 6
1)
a) Passo 1: como as colunas já estão calculadas, você pode começar
identificando os elementos da fórmula:
329
rxy = –0,73842
Passo 3: analisando o resultado, você pode classificar e interpretar
contextualizando-o na situação descrita.
Classificação: a correlação entre as notas de Matemática e Biologia
pode ser classificada como negativa forte.
Como interpretar?
O coeficiente de correlação resultou em um número negativo e
próximo de 1 (r = –0,73842), sendo assim, a correlação entre as notas de
Matemática e Biologia é negativa (significativa), ou seja, quanto maior a
nota em Matemática, menor será a nota em Biologia, e quanto menor a
nota em Matemática, maior será a nota em Biologia.
a = –0,70427
Passo 2: calcule a intersecção com o eixo y (b):
Intersecção do eixo y (b)
b = –11,671171.
Passo 3: construa a equação da reta de regressão:
Após calcular a e b, tem-se:
a = –0,70427
b = –11,671171
= b + a.X
= 11,671171 – 0,70427.X
331
332
CM
MY
CY
CMY