Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatistica Completa PDF
Estatistica Completa PDF
Estatística
É com satisfação que a Unisa Digital oferece a você, aluno(a), esta apostila de Estatística, parte in-
tegrante de um conjunto de materiais de pesquisa voltado ao aprendizado dinâmico e autônomo que a
educação a distância exige. O principal objetivo desta apostila é propiciar aos(às) alunos(as) uma apresen-
tação do conteúdo básico da disciplina.
A Unisa Digital oferece outras formas de solidificar seu aprendizado, por meio de recursos multidis-
ciplinares, como chats, fóruns, aulas web, material de apoio e e-mail.
Para enriquecer o seu aprendizado, você ainda pode contar com a Biblioteca Virtual: www.unisa.br,
a Biblioteca Central da Unisa, juntamente às bibliotecas setoriais, que fornecem acervo digital e impresso,
bem como acesso a redes de informação e documentação.
Nesse contexto, os recursos disponíveis e necessários para apoiá-lo(a) no seu estudo são o suple-
mento que a Unisa Digital oferece, tornando seu aprendizado eficiente e prazeroso, concorrendo para
uma formação completa, na qual o conteúdo aprendido influencia sua vida profissional e pessoal.
A Unisa Digital é assim para você: Universidade a qualquer hora e em qualquer lugar!
Unisa Digital
SUMÁRIO
INTRODUÇÃO................................................................................................................................................ 5
1 NOÇÕES BÁSICAS.................................................................................................................................. 7
1.1 Arredondamento de Dados..................................................................................................................................... 8
1.2 População e Amostra................................................................................................................................................. 9
1.3 Resumo do Capítulo.................................................................................................................................................11
1.4 Atividades Propostas...............................................................................................................................................12
2 ORGANIZAÇÃO DE DADOS........................................................................................................... 13
2.1 Tipos de Variável........................................................................................................................................................13
2.2 Distribuição de Frequências..................................................................................................................................16
2.3 Resumo do Capítulo.................................................................................................................................................21
2.4 Atividades Propostas...............................................................................................................................................22
3 GRÁFICOS ESTATÍSTICOS................................................................................................................ 25
3.1 Gráfico de Setores ou Disco ou Pizza ou Diagrama Circular......................................................................25
3.2 Gráfico de Colunas ou Barras................................................................................................................................26
3.3 Histograma..................................................................................................................................................................27
3.4 Polígono de Frequências........................................................................................................................................27
3.5 Resumo do Capítulo.................................................................................................................................................28
3.6 Atividades Propostas...............................................................................................................................................29
4 MEDIDAS.................................................................................................................................................... 31
4.1 Medidas de Posição..................................................................................................................................................31
4.2 Medidas de Dispersão.............................................................................................................................................35
4.3 Resumo do Capítulo.................................................................................................................................................39
4.4 Atividades Propostas...............................................................................................................................................39
5 PROBABILIDADES................................................................................................................................ 43
5.1 Fenômeno Determinístico.....................................................................................................................................43
5.2 Fenômeno Aleatório ou Probabilístico..............................................................................................................43
5.3 Espaço Amostral (S)..................................................................................................................................................44
5.4 Evento (E).....................................................................................................................................................................44
5.5 Probabilidade.............................................................................................................................................................44
5.6 Propriedades...............................................................................................................................................................44
5.7 Variável Aleatória Discreta......................................................................................................................................45
5.8 Função Discreta de Probabilidade......................................................................................................................45
5.9 Variável Aleatória Contínua...................................................................................................................................46
5.10 Função Contínua de Probabilidade..................................................................................................................46
5.11 Resumo do Capítulo..............................................................................................................................................46
5.12 Atividades Propostas.............................................................................................................................................47
7 ESTIMAÇÃO.............................................................................................................................................. 53
7.1 Estimação por Intervalo..........................................................................................................................................53
7.2 Resumo do Capítulo.................................................................................................................................................59
7.3 Atividades Propostas...............................................................................................................................................60
8 CORRELAÇÃO.......................................................................................................................................... 61
8.1 Correlação Linear Simples......................................................................................................................................61
8.2 Resumo do Capítulo.................................................................................................................................................66
8.3 Atividades Propostas...............................................................................................................................................66
Prezado(a) aluno(a), esta apostila reúne os principais tópicos de Estatística, de forma condensada
e objetiva, com a finalidade de orientá-lo(a), aluno(a) do Curso de Ensino a Distância (EaD), no desen-
volvimento do conteúdo desta disciplina.
Em sua elaboração, não tive a pretensão de demonstrar as diversas fórmulas matemáticas nela
existentes, mas de mostrar suas aplicações nos diversos assuntos abordados. É, portanto, um guia indis-
pensável para acompanhar as aulas web.
A disciplina de Estatística tem por objetivo fornecer-lhe subsídios que o(a) auxiliem nas demais
disciplinas do Curso de EaD, bem como desenvolver-lhe a capacidade de utilizar os diversos métodos
estatísticos e o raciocínio necessário para a interpretação e análise de pesquisas na área a que se destina.
5
Unisa | Educação a Distância | www.unisa.br
1 NOÇÕES BÁSICAS
Prezado(a) aluno(a), você conhece a origem 4. A pesquisa realizada pelas indústrias, en-
da palavra ‘estatística’? Conhece algumas aplica- tre os consumidores, para o lançamento
ções desta ciência? Vamos iniciar este texto abor- de um novo produto;
dando esses pontos. 5. As pesquisas eleitorais, fornecendo ele-
A palavra ‘estatística’, de origem latina, signi- mentos para que os candidatos direcio-
ficou por muito tempo “ciência dos negócios do nem suas campanhas;
Estado”. Os que governavam, sentindo necessida-
6. As pesquisas utilizadas pelas emissoras
de de informações, organizavam departamentos,
de TV, mostrando a preferência dos es-
que tinham a responsabilidade de fazer essas in-
pectadores, para organizar sua progra-
vestigações.
mação.
Dicionário Você deve saber que a realização de uma pes-
quisa envolve muitas etapas, tais como: a escolha
A palavra ‘estatística’ surge da expressão em latim
statisticum collegium ou palestra sobre os assun-
da amostra, a coleta e a organização dos dados, o
tos do Estado, de onde surgiu a palavra em língua resumo e a apresentação desses dados e, também,
italiana statista, que significa “homem de estado”, a interpretação dos resultados para a obtenção de
ou político, e a palavra alemã Statistik, designando
a análise de dados sobre o Estado. A palavra ad-
conclusões e tomada de decisões razoáveis. Todas
quiriu um significado de coleta e classificação de essas etapas são trabalhadas com métodos cientí-
dados, no início do século 19. ficos pela Estatística.
Fonte: http://pt.wikiversity.org
O tratamento estatístico de um conjunto de
dados pode envolver dois processos distintos, isto
é, a descrição dos dados e o estabelecimento de
As sociedades modernas acumulam grande conclusões sobre a população a partir dos dados
quantidade de dados numéricos relativos a even- obtidos por amostragem.
tos sociais, econômicos, científicos, esportivos etc.
Desse modo, notamos que o uso da pesquisa é
Atenção
bastante comum nas várias atividades humanas.
O tratamento estatístico pode envolver a
descrição dos dados e o estabelecimento
Exemplos: de conclusões a partir da amostragem.
7
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Saiba mais
A Estatística é uma área do conhecimento que utiliza teorias probabilísticas para explicação de eventos,
estudos e experimentos. Tem por objetivo obter, organizar e analisar dados, determinar as correlações
que apresentem, tirando delas suas consequências para descrição e explicação do que passou e pre-
visão e organização do futuro. Em suma, estatística é a ciência que estuda os dados. Dentro dela, exis-
tem duas subdivisões: a estatística descritiva (que estuda métodos e ferramentas de coleta de dados e
modelos matemáticos para descrevê-los e interpretá-los) e a estatística inferencial (sistemas e técnicas
utilizadas para tomar boas decisões baseadas nos dados).
A estatística é também uma ciência e prática de desenvolvimento de conhecimento humano através
do uso de dados empíricos. Baseia-se na teoria estatística, um ramo da matemática aplicada. Na teoria
estatística, a aleatoriedade e incerteza são modeladas pela teoria da probabilidade. Algumas práticas
estatísticas incluem, por exemplo, o planejamento, a sumarização e a interpretação de observações.
Porque o objetivo da estatística é a produção da “melhor” informação possível a partir dos dados dispo-
níveis, alguns autores sugerem que a estatística é um ramo da teoria da decisão.
Fonte: http://pt.wikiversity.org
Como na maioria das vezes, os dados dispo- Exemplos: aproximação de uma casa de-
níveis não são números inteiros, para efetuar os cál- cimal: 42,87 passa a 42,9;
culos estatísticos, é necessário efetuar o arredon- 25,08 passa a 25,1;
damento desses dados. A seguir, apresentamos os
53,99 passa a 54,0.
critérios utilizados para efetuar o arredondamento.
De acordo com o Instituto Brasileiro de Geo-
c. Quando o primeiro algarismo a ser aban-
grafia e Estatística (IBGE)1, o arredondamento é fei-
donado é 5, há duas soluções:
to da seguinte forma:
se ao 5 seguir, em qualquer casa, um
a. Quando o primeiro algarismo a ser aban- algarismo diferente de zero, aumen-
donado é 0, 1, 2, 3 ou 4, fica inalterado o ta-se uma unidade ao algarismo a
último algarismo a permanecer. permanecer.
Exemplos: aproximação de uma casa de-
Exemplo: aproximação de uma casa de-
cimal: 2,352 passa a 2,4;
cimal: 53,24 passa a 53,2.
25,6501 passa a 25,7;
b. Quando o primeiro algarismo a ser aban- 76,25002 passa a 76,3.
donado é 6, 7, 8 ou 9, aumenta-se em
uma unidade o algarismo a permanecer. se o 5 for o último algarismo ou se
ao 5 só se seguirem zeros, o último
1
Em conformidade com a Resolução nº 886/66 da Fundação IBGE, Adaptado de CRESPO, 1991.
8
Unisa | Educação a Distância | www.unisa.br
Estatística
2 4 3 5 6 4 7 2 0 0 3 5 8 1 1 0 0 5
1 9 8 6 4 3 5 2 4 7 8 9 7 7 6 5 4 2
2 3 0 1 2 1 1 6 7 8 9 1 0 3 4 5 6 7
2 2 8 8 1 9 0 0 6 0 7 2 1 0 5 6 4 3
243 564 720 035 811 005 198 643 524 789 776 542 230
121 167 891 034 567 228 819 006 072 105 643.
Observem que devemos descartar 811, 891 e 819, porque não pertencem à população, e 643, por-
que já foi selecionado.
Continuamos o sorteio, até completarmos os 80 elementos da amostra.
6 16 26 36 46 56 66 76 86 96 106 . . . 796
Esse tipo de amostragem é simples de ser realizado e aconselhável no caso de amostras muito
grandes.
10
Unisa | Educação a Distância | www.unisa.br
Estatística
Exemplo 2: na escola Sapequinha, quer fazer-se um estudo sobre o peso dos alunos de 7 anos de
idade. Existem 120 crianças na faixa de 7 anos de idade, distribuídas em cinco classes, do seguinte modo:
a primeira série A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem 35, a D, 30 e a E tem 20. Vamos
escolher uma amostra com, no mínimo, 12 crianças (10% de 120), selecionadas através de:
Para calcularmos quantas crianças de cada classe serão sorteadas, para uma amostra de 12 crian-
ças, fazemos:
A: 16,7% de 12 = 16,7/100 . 12 = 0,167 . 12 = 2,004 = 2
B: 12,5% de 12 = 0,125 . 12 = 1,5 = 2
C: 29,2% de 12 = 0,292 . 12 = 3,504 =3 (nesse caso, arredondamos para 3, ao invés de 4, porque o
total de crianças da amostra é 12)
D: 25% de 12 = 0,25 . 12 = 3
E: 16,7% de 12 = 0,167 . 12 = 2,004 = 2
Prezado(a) aluno(a), vimos neste capítulo que a palavra ‘estatística’, de origem latina, significou por
muito tempo “ciência dos negócios do Estado”. Estudamos também que a Estatística Descritiva utiliza
métodos numéricos e gráficos para mostrar os padrões de comportamento dos dados, para resumir
a informação contida nesses dados e para apresentar a informação de forma conveniente, e que a In-
ferência Estatística utiliza dados de amostras para obter estimativas sobre a população. Aprendemos
ainda sobre arredondamentos e amostra.
Vamos, agora, avaliar a sua aprendizagem.
11
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
a. 2,36.
b. 3,57.
c. 4,62.
d. 8,81.
e. 4,451.
f. 5,501.
g. 5,55.
h. 5,65.
12
Unisa | Educação a Distância | www.unisa.br
2 ORGANIZAÇÃO DE DADOS
Prezado(a) aluno(a), falaremos agora sobre a Cine: nº de vezes que vai ao cinema por
organização de dados. Vamos lá! semana;
Dado um conjunto de dados, vamos estudar Op Cine: opinião a respeito das salas de
como devemos “tratar” os valores, numéricos ou cinema na cidade: (B) regular a Boa; (M)
não, a fim de extrair informações a respeito de uma Muito boa;
ou mais características de interesse. TV: horas gastas assistindo à TV, por se-
Suponhamos, por exemplo, que um questio- mana;
nário foi aplicado a alunos do 1º ano de uma escola Op TV: opinião a respeito da qualidade
fornecendo as seguintes informações: da programação na TV: (R) ruim; (M) mé-
dia; (B) boa; (N) não sabe.
Id: identificação do aluno;
Turma: A ou B; O conjunto de informações, após a tabulação
Sexo: Feminino (F) ou Masculino (M); do questionário ou pesquisa de campo, é denomi-
Idade: em anos; nado tabela de dados brutos e contém os dados
Alt: altura em metros; da maneira que foram coletados inicialmente (Ta-
Peso: em quilogramas; bela 1).
13
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Exemplos: sexo, turma, estado civil, grau de Exemplos: número de filhos, salário, peso,
instrução, hábito de fumar etc. altura etc.
Entre as variáveis qualitativas, ainda existem Entre as variáveis quantitativas, ainda exis-
dois tipos: tem dois tipos:
Saiba mais
Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua); mas, se
for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos etc.), é qualitativa (ordinal). Outro
exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua), se trabalhamos
com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do
boxe (peso-pena, peso-leve, peso-pesado etc.).
Outro ponto importante é que nem sempre uma variável representada por números é quanti-
tativa. O número do telefone de uma pessoa, o número da casa, o número de sua identidade.
Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea,
por exemplo. Isso não significa que a variável sexo passou a ser quantitativa!
14
Unisa | Educação a Distância | www.unisa.br
Estatística
Op
Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine TV OpTV
Cine
1 A F 17 1,60 60,5 2 Não P 0 1 B 16 R
2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R
3 A M 18 1,85 72,8 2 Não P 5 2 M 15 R
4 A M 25 1,85 80,9 2 Não P 5 2 B 20 R
5 A F 19 1,58 55,0 1 Não M 2 2 B 5 R
6 A M 19 1,76 60,0 3 Não M 2 1 B 2 R
7 A F 20 1,60 58,0 1 Não P 3 1 B 7 R
8 A F 18 1,64 47,0 1 Sim I 2 2 M 10 R
9 A F 18 1,62 57,8 3 Não M 3 3 M 12 R
10 A F 17 1,64 58,0 2 Não M 2 2 M 10 R
11 A F 18 1,72 70,0 1 Sim I 10 2 B 8 N
12 A F 18 1,66 54,0 3 Não M 0 2 B 0 R
13 A F 21 1,70 58,0 2 Não M 6 1 M 30 R
14 A M 19 1,78 68,5 1 Sim I 5 1 M 2 N
15 A F 18 1,65 63,5 1 Não I 4 1 B 10 R
16 A F 19 1,63 47,4 3 Não P 0 1 B 18 R
17 A F 14 1,82 66,0 1 Não P 3 1 B 10 N
18 A M 18 1,80 85,2 2 Não P 3 4 B 10 R
19 A F 20 1,60 54,5 1 Não P 3 2 B 5 R
20 A F 18 1,68 52,5 3 Não M 7 2 B 14 M
21 A F 21 1,70 60,0 2 Não P 8 2 B 5 R
22 A F 18 1,65 58,5 1 Não M 0 3 B 5 R
23 A F 18 1,57 49,2 1 Sim I 5 4 B 10 R
24 A F 20 1,55 48,0 1 Sim I 0 1 M 28 R
25 A F 20 1,69 51,6 2 Não P 8 5 M 4 N
26 A F 19 1,54 57,0 2 Não I 6 2 B 5 R
27 B F 23 1,62 63,0 2 Não M 8 2 M 5 R
28 B F 18 1,62 52,0 1 Não P 1 1 M 10 R
29 B F 18 1,57 49,0 2 Não P 3 1 B 12 R
30 B F 25 1,65 59,0 4 Não M 1 2 M 2 R
15
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Op
Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine TV OpTV
Cine
31 B F 18 1,61 52,0 1 Não P 2 2 M 6 N
32 B M 17 1,71 73,0 1 Não P 1 1 B 20 R
33 B F 17 1,65 56,0 3 Não M 2 1 B 14 R
34 B F 17 1,67 58,0 1 Não M 4 2 B 10 R
35 B M 18 1,73 87,0 1 Não M 7 1 B 25 B
36 B F 18 1,60 47,0 1 Não P 5 1 M 14 R
37 B M 17 1,70 95,0 1 Não P 10 2 M 12 N
38 B M 21 1,85 84,0 1 Sim I 6 4 B 10 R
39 B F 18 1,70 60,0 1 Não P 5 2 B 12 R
40 B M 18 1,73 73,0 1 Não M 4 1 B 2 R
41 B F 17 1,70 55,0 1 Não I 5 4 B 10 B
42 B F 23 1,45 44,0 2 Não M 2 2 B 25 R
43 B M 24 1,76 75,0 2 Não I 7 0 M 14 N
44 B F 18 1,68 55,0 1 Não P 5 1 B 8 R
45 B F 18 1,55 49,0 1 Não M 0 1 M 10 R
46 B F 19 1,70 50,0 7 Não M 0 1 B 8 R
47 B F 19 1,55 54,5 2 Não M 4 3 B 3 R
48 B F 18 1,60 50,0 1 Não P 2 1 B 5 R
49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R
50 B M 18 1,83 86,0 1 Não P 7 0 M 20 B
16
Unisa | Educação a Distância | www.unisa.br
Estatística
Exemplos
Note que, para variáveis cujos valores possuem ordenação natural (qualitativas ordinais e quanti-
tativas em geral), incluímos na tabela de frequência uma coluna contendo as frequências acumuladas
(fac), quando o número de valores i for maior do que 2. A frequência acumulada até certo valor é obtida
pela soma das frequências de todos os valores da variável menores ou iguais ao valor considerado.
A variável Peso, classificada como quantita- ferramentas estatística utiliza esse procedimento.
tiva contínua, apresenta valores que podem ser Vamos lá! Você perceberá que é útil e simples!
qualquer número real num certo intervalo. Repare! para essa construção utilizaremos a
Pela Tabela 1, verificamos que os valores Tabela 4 da variável peso.
variam entre 44,0 kg e 95,0 kg e, como existe um O processo de elaboração da distribuição
grande número de valores diferentes, vamos cons- por variável contínua inicia-se com a apuração da
truir faixas ou classes de valores e contar o núme- chamada AMPLITUDE TOTAL, sendo sua fórmula de
ro de ocorrências em cada faixa. cálculo: AT = Xmax – Xmin.
Onde AT é a diferença entre o maior valor e o
Processo de Construção de Distribuições por menor da amostra organizada (ROL) crescente ou
Variável Contínua descrescente de valores.
17
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Assim:
AT = Xmax – Xmin
Este valor será utilizado a seguir !
AT = 95 – 44
AT = 51
Viu como é fácil! Agora vamos calcular o número de classes (ou seja linhas), pelo chamado critério
da raiz para a distribuição por variável contínua, cujo estudo é, como vimos, o peso:
A fórmula que utilizaremos será:
Onde K será o número de linhas que a distribuição irá possuir, sendo o resultado da raiz quadrada
do número de amostras (n). Como temos 50 amostras:
Já sabemos quantas linhas nossa distribuição irá possuir, agora vamos determinar o intervalo de
cada classe, pela fórmula:
18
Unisa | Educação a Distância | www.unisa.br
Estatística
Onde AT é o resultado da amplitude total, que no exemplo que estamos utilizando resultou em 51 e
K é o número de linhas da distribuição que calculamos no conteúdo anterior e o resultado foi 7.
Vamos ao cálculo dos intervalos então:
Vamos ver como ficou nossa distribuição por variável contínua para os pesos!
CL Peso
CL Peso
(k) li ls
Inicie
(k) pelo li ls Este símbolo do
Inicie pelo menor peso do 1 44,00 Ōņ 51,29Este símbolo do intervalo indica que
menor peso do ROL1 44,00 Ōņ 51,29 intervalo indica que
estão sendo incluídos
ROL 2 51,29 Ōņ 58,58 estão sendo incluídos
2 51,29 Ōņ 58,58 valores 44 kg e
3 58,58Ōņ 65,87 valores 44 kg e excluídos os que
3 58,58Ōņ 65,87 excluídos os quepossuírem 51,29 kg,
4 65,87Ōņ 73,16possuírem 51,29 kg,
4 65,87Ōņ 73,16 que deverão constar
5 73,16 Ōņ 80,45 que deverão constar
na classe seguinte!
5 73,16 Ōņ 80,45 na classe seguinte!
6 80,45 Ōņ 87,74
6 80,45 Ōņ 87,74
7 87,74Ōņ 95,03
7 87,74Ōņ 95,03 No limite superior
No limite superiordevemos incluir peso
devemos incluir pesos
até 94,02.
até 94,02.
CL Peso
CL Peso QL
(k) li Q L ls
(k) li ls
1 44,00 Ōņ 51,29 10
1 44,00 Ōņ 51,29 10
2 51,29 Ōņ 58,58 19
2 51,29 Ōņ 58,58 19
3 58,58 Ōņ 65,87 7
3 58,58 Ōņ 65,87 7
4 65,87 Ōņ 73,16 7
4 65,87 Ōņ 73,16 7
5 73,16 Ōņ 80,45 1
5 73,16 Ōņ 80,45 1
6 80,45 Ōņ 87,74 5
6 80,45 Ōņ 87,74 5
7 87,74 Ōņ 95,03 1
7 87,74 Ōņ 95,03 1
TOTAL 50
TOTAL 50
19
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Tabela de Frequência para a Variável Peso (extraída da Tabela 1)
Observe, pela fac %, que 72% dos alunos pesam em média (ponto médio) 62,23 kg.
Observe, pela
Analisando fac %,pode-se
a tabela, que 72%observar
dos alunos pesam
também em100
que média
– 88(ponto
= 12%médio) 62,23
têm peso kg. Analisando
médio maior a
tabela, pode-se observar também que 100 – 88 = 12% têm peso médio maior ou igual a 76,81 kg.
ou igual a 76,81 kg.
Na Tabela 5, temos 7 faixas (ou classes ou intervalos). Consideremos, por exemplo, a 1ª classe ou
Na Tabela
intervalo: 44,00 4, temos
├─ 51,29, 7 faixas (ou classes ou intervalos). Consideremos, por exemplo, a
onde temos:
1ª classe ou intervalo: 44,0 Ōņ 51,29, onde temos:
O símbolo ├─ indica que o intervalo é fechado à esquerda e aberto à direita (44,00 faz parte dessa
Amplitude
classe, mas 51,29 ou tamanho
não; 51,29 está na 2ªdo intervalo (h): h = ls – li; (h = 51,29 – 44,00 = 7,29)
classe).
O símbolo Ōņ indica que o intervalo é fechado à esquerda e aberto à direita (44,00
Na Tabela 1, a variável TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e uma tabela re-
faz parte dessa classe, mas 51,29 não; 51,29 está na 2ª classe).
presentando tais valores e respectivas frequências seria muito extensa e pouco prática. Por esse motivo,
trataremos essa variável como quantitativa contínua, criando, por exemplo, faixas de amplitude 6 para
representar Na
seusTabela
valores.
1, a variável TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e
uma tabela representando tais valores e respectivas frequências seria muito extensa e pouco
prática. Por esse motivo, trataremos essa variável como quantitativa contínua, criando, por
exemplo, faixas de amplitude 6 para representar seus valores.
20
Unisa | Educação a Distância | www.unisa.br
Estatística
Observe que, na última classe, o intervalo é fechado à esquerda e à direita, incluindo, portanto, o
valor 30 e não tendo, assim, que abrir mais uma classe por causa de um único valor. Outra sugestão seria
usar uma amplitude maior nessa última classe, por exemplo, 24 ├─ 36, que inclui o valor 30.
Saiba mais
Frequência Absoluta (ni ) - é o número de vezes que o valor de determinada variável é observado
Frequência Absoluta Acumulada (fac)- é a soma das frequências absolutas anteriores com a frequência abso-
luta deste valor.
Frequência Relativa (fi) - é o quociente entre a frequência absoluta do valor da variável e o número total de
observações.
Frequência Relativa Acumulada (fac %) - é a soma das frequências relativas anteriores com a frequência rela-
tiva desse valor.
n
fac% = ∑f i
i=1
Prezado(a) aluno(a), neste capítulo estudamos sobre variáveis e suas frequências. O conjunto de
informações, após a tabulação do questionário ou pesquisa de campo, é denominado de tabela de dados
brutos. Cada uma das características perguntadas aos alunos tais como, o peso, a idade, a altura etc., é
denominada de variável, e, como podemos observar, possuem naturezas diferentes quanto aos possíveis
valores que podem assumir, sendo classificadas como variáveis qualitativas (nominal e ordinal) ou variá-
veis quantitativas (continuas e discretas).
Vamos, agora, avaliar a sua aprendizagem.
21
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
1. Monte a tabela com as distribuições de frequência da variável Idade de acordo com os dados
da Tabela 1.
4. Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por
tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
a. Qual a população envolvida na pesquisa?
b. Supondo que, na cidade, haja 5.500 mulheres e 6.000 homens com 20 anos, determine
uma amostra com 1.200 pessoas.
5. Em uma fábrica, foram testadas 400 lâmpadas; a duração delas aparece na distribuição por
frequência da Tabela 7:
22
Unisa | Educação a Distância | www.unisa.br
Estatística
23
Unisa | Educação a Distância | www.unisa.br
3 GRÁFICOS ESTATÍSTICOS
Prezado(a) aluno(a), neste capítulo iremos es- Muitas vezes, a informação contida nas ta-
tudar sobre gráficos. A organização dos dados em belas pode ser mais facilmente visualizada através
tabelas de frequência proporciona um meio eficaz de gráficos. Vamos definir quatro tipos básicos de
de estudo do comportamento de características de gráficos: setores ou pizza, colunas ou barras, his-
interesse. tograma e polígono de frequências.
Atenção
A utilização de tabelas e gráficos são frequentes na Estatística. As tabelas servem para orga-
nizar e tabular os dados, já os gráficos transmitem as informações com clareza e transparên-
cia, contribuindo para uma leitura objetiva.
Adapta-se muito bem às variáveis qualitati- cada valor da variável. Se, ao contrário, formos tra-
vas, mas também pode ser usado para as variáveis çar o gráfico com o auxílio de compasso e transferi-
quantitativas discretas. dor, precisamos determinar a medida em graus de
Fazendo uso do computador para o traça- cada setor correspondente aos valores da variável,
do do gráfico, basta conhecer as porcentagens de lembrando que o disco todo mede 360°.
25
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Gráfico 1 – Setores.
Gráfico 2 – Colunas.
26
Unisa | Educação a Distância | www.unisa.br
Estatística
3.3 Histograma
Dicionário
Gráfico 3 – Histograma.
É também utilizado para variáveis quantitati- correspondente) em relação a cada intervalo, estes
vas contínuas. são ligados entre si por meio de segmentos de re-
Para construir o polígono de frequências, ad- tas, sendo que o primeiro e o último são ligados ao
mitem-se, como representantes de cada classe, os eixo das abscissas, na metade de classes hipotéti-
pontos médios de cada intervalo que as definem. cas, imediatamente anterior à primeira e posterior
Após obter os pontos (ponto médio, frequência à última.
27
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Saiba mais
Prezado(a) aluno(a), muitas vezes, a informação contida nas tabelas pode ser mais facilmente vi-
sualizada através de gráficos. Nesse sentido, definimos, neste capítulo, quatro tipos básicos de gráficos:
setores ou pizza, colunas ou barras, histograma e polígono de frequências. E, por fim, vimos que o histo-
grama é utilizado para variáveis quantitativas contínuas.
Vamos, agora, avaliar a sua aprendizagem.
28
Unisa | Educação a Distância | www.unisa.br
Estatística
1. Com relação às variáveis: Turma, Alt, Filhos, Fuma, Exerc, Cine, Op Cine, Op TV, da Tabela 1:
a. Classifique essas variáveis.
b. Faça a distribuição de frequência para cada uma delas.
c. A variável Exerc poderia ser tratada de forma diferente com relação à sua classificação?
Justifique sua resposta e, em caso afirmativo, construa a nova distribuição de frequência.
d. Construa os gráficos que melhor se adaptam a cada uma das variáveis apresentadas.
2. Quinze pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de me-
ses previstos de fisioterapia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de
complexidade da cirurgia realizada: alto (A), médio (M) ou baixo (B). Os dados são apresenta-
dos na Tabela 8:
Tabela 8 – Levantamento em clínica de ortopedia.
29
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
a. Construa o histograma.
b. Se a nota mínima para aprovação é 5, qual será a porcentagem de aprovação?
30
Unisa | Educação a Distância | www.unisa.br
4 MEDIDAS
Prezado(a) aluno(a), agora falaremos sobre ção, por exemplo, representando a tendência cen-
medidas. tral dos dados ou a maneira pela qual esses dados
Nosso interesse é caracterizar o conjunto de estão dispersos.
dados através de medidas que resumam a informa-
31
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Exemplo: calcular a mediana dos valores: Para calcularmos a mediana quando os da-
9, 12, 8, 6, 14, 11, 5. dos estão agrupados em classes, não levamos em
Em primeiro lugar, vamos montar o Rol, ou consideração se n é par ou ímpar e procedemos do
seja, organizar os dados em ordem crescente: seguinte modo:
onde:
Observe que n = 7 (ímpar)
Moda (mo)
b. o número de observações (n) é par: não É o valor da variável mais frequente da distri-
existe, portanto, um valor que ocupe o buição.
centro; convencionou-se que a mediana
será a média aritmética dos valores que Exemplo: calcular a moda para o seguinte
ocupam as posições de ordem conjunto de dados:
65, 87, 49, 58, 65, 65, 67, 83, 87, 79, 87.
32
Unisa | Educação a Distância | www.unisa.br
Estatística
Exemplos:
1. Calcule média, mediana e moda para a variável Idade (Tabela 11) (Ver Tabela 23):
n = 50 é par, portanto, a mediana será a média aritmética dos dois valores centrais
Pela fac, observamos que o valor da frequência acumulada até 18 é igual a 31 e, portanto, o 25º
elemento é igual ao 26º elemento e ambos correspondem ao valor da variável igual a 18
Para o cálculo de mo, olhamos a maior frequência (22), que corresponde à idade de 18 anos.
33
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
2. Calcule média, mediana e moda para a variável Peso (Tabela 12) (Ver Tabela 4):
Pela fac (30), a 2ª classe contém a mediana, isto é, o intervalo 50,0 ├─ 60,0.
Saiba mais
As medidas de posição podem ser utilizadas em conjunto para auxiliar a análise dos dados, mas existem situações
em que uma pode ser mais conveniente do que a outra. Por exemplo, quando existe um ou mais valores muito discre-
pantes, a média é muito influenciada por este valor e se torna inadequada para representar o conjunto de dados, sendo
melhor trabalhar com a mediana. Por outro lado, para conjuntos de dados muito numerosos, a ordenação é custosa e
a mediana se torna difícil de calcular.
34
Unisa | Educação a Distância | www.unisa.br
Estatística
Prezado(a) aluno(a), como visto, efetuar uma suficientes para fazer a média atingir um patamar
análise dos dados, utilizando-se somente as medi- comparável às melhores economias do mundo,
das de posição, pode levar-nos a conclusões equi- porém a discrepância entre os diversos valores
vocadas. Para nos auxiliar na tarefa da análise de deve ser muito grande. O que podemos estar es-
dados, utilizaremos também as medidas de disper- quecendo é a variabilidade dos valores da variável
são. e isso não é captado pela média, mas pelas medi-
Observe o exemplo a seguir. das de dispersão.
As medidas de dispersão ou de variabili-
Um bairro nobre da capital paulista inclui dade servem para quantificar a variabilidade dos
uma das maiores favelas de São Paulo. O que pode- valores da variável, isto é, a dispersão dos dados, ou
mos dizer da renda média do bairro? Certamente, a forma como os valores de cada conjunto se espa-
os altos rendimentos de alguns residentes serão lham ao redor das medidas de tendência central.
A: 10, 10, 11, 12, 12, 13, 14, 14, 14, 15 com = 12,5 e md = 12,5
B: 7, 7, 8, 9, 12, 13, 13, 16, 17, 23 com = 12,5 e md = 12,5
Observamos que essas séries não são homogêneas, apesar de ambas terem o mesmo valor para a
média e a mediana. É preciso, pois, calcular as constantes de dispersão, que medem os afastamentos dos
valores dessas séries em torno do valor central.
Entre as medidas de dispersão ou de variabilidade mais usadas, temos: amplitude total, variân-
cia, desvio padrão e coeficiente de variação.
Exemplos:
Para a série A: R = 15 – 10 = 5.
Para a série B: R = 23 – 7 = 16.
35
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
A utilização da amplitude total como medida de dispersão é muito limitada, pois só leva em consi-
deração dois valores de todo o conjunto de dados.
Para medir a dispersão dos valores de uma variável em torno da média, é interessante estudar o
comportamento dos desvios de cada valor em relação à média, isto é, . Na determinação de cada
desvio d i , estaremos medindo a dispersão entre cada x i e a média x . Porém, se somarmos todos os
n n
desvios, teremos ∑ di = ∑ ( x i − x ) = 0 . Para contornar o problema, resolveu-se considerar o quadrado
i =1 i =1
de cada desvio ( x i − x ) 2 . Assim, defini-se:
A seguir, estão outras fórmulas que podem ser usadas para facilitar o cálculo da variância popula-
cional e amostral.
1 N 2 1 n
σ2= ∑
N i =1
x i − µ 2 (dados não agrupados) S 2 = ∑ x i2 − ( x ) 2 (dados não agrupados)
n i =1
1 N 2 1
n
σ2= ∑ i i
N i =1
( n ⋅ x 2
) − µ 2
(dados agrupados) S = ∑ ( n i ⋅ x i2 ) − ( x )2 (dados agrupados)
n i =1
36
Unisa | Educação a Distância | www.unisa.br
Estatística
Exemplos:
Exemplos:
Para a série A:
Para a série B:
O coeficiente de variação é uma medida relativa da dispersão que serve para comparar o grau de
concentração em torno da média de conjuntos de dados distintos.
Exemplos:
Para a série A:
Para a série B:
Vemos, portanto, que há maior variação na série B do que na A, pois o CV, na série B, é bem maior
que na série A.
37
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Exemplos:
1. Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável Ida-
de (Tabela 13) (Ver Tabela 11):
R = 25 – 17 = 8 (amplitude total)
2. Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável Peso
(Tabela 14) (Ver Tabela 12):
38
Unisa | Educação a Distância | www.unisa.br
Estatística
Prezado(a) aluno(a), vimos neste capítulo que as medidas de posição ou medidas de tendência
central para um conjunto de dados qualquer (população ou amostra) são: a média, a mediana e a moda.
Também foram apresentadas as medidas de dispersão. Entre as medidas de dispersão ou de variabilida-
de mais usadas, temos: amplitude total, variância, desvio padrão e coeficiente de variação, que comple-
mentarão as informações necessárias para a análise dos dados.
Vamos, agora, avaliar a sua aprendizagem.
1. Vinte e cinco residências de certo bairro foram sorteadas e visitadas por um entrevistador,
que, entre outras questões, perguntou sobre o número de televisores.
Os dados foram os seguintes:
2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.
2. Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso avaliado
no fim de um mês.
1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2.
39
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
4. Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo tive-
ram o seu consumo observado durante 1000 quilômetros. A informação obtida é apresentada
na Tabela 15, em km/litro.
Tabela 15 – Consumo de combustível.
5. Se a média das alturas de um grupo de pessoas é 175 cm e o desvio padrão é 20 cm, uma pes-
soa com estatura de 150 cm está dentro da normalidade? Por quê?
6. Numa escola, duas turmas conseguiram os seguintes resultados:
Responda:
a. Qual a turma mais homogênea? Por quê?
b. Um aluno com média 40 é considerado normal na turma A? E na turma B? Por quê?
40
Unisa | Educação a Distância | www.unisa.br
Estatística
Tabela 16 – Motricidade.
Responda:
a. Qual é a média aritmética?
b. Qual é o desvio padrão?
c. Qual a zona considerada de normalidade?
d. Uma criança que obteve 28 pontos é considerada com motricidade normal? Por quê?
38 40 45 42 45 40 43 38
45 45 40 41 41 38 46 32
48 46 42 43 44 50 38 40
Nesse grupo de crianças, um menino com 35 kg seria considerado com peso normal? Por quê?
41
Unisa | Educação a Distância | www.unisa.br
5 PROBABILIDADES
Prezado(a) aluno(a), neste capítulo, não será conceitos que serão necessários para o estudo da
efetuado um estudo completo sobre a teoria das Estatística e aplicados posteriormente.
probabilidades, mas serão apresentados alguns
É aquele em que repetindo um experimen- podemos determinar, pelas leis da Física, que ele
to, nas mesmas condições, o resultado esperado é gastará 2 horas para percorrer o referido espaço e
sempre o mesmo. isso sempre ocorrerá, desde que sejam mantidas as
Exemplo: se um corpo percorre uma distân- mesmas condições.
cia de 120 km, com velocidade média de 60 km/h,
É aquele cujo resultado não pode ser previsto Veremos que modelos podem ser estabele-
com certeza, ainda que mantidas as mesmas con- cidos para quantificar as incertezas das diversas
dições de realização. ocorrências.
Exemplo: no lançamento de um dado, não
podemos dizer, com certeza, qual será o resultado.
Só podemos saber que é provável que ocorra o re-
sultado 1 ou 2 ou 3 ou 4 ou 5 ou 6.
Atenção
43
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
5.5 Probabilidade
É a relação entre o número de possíveis resul- No caso dos dois eventos anteriores,
tados de E e todos os possíveis resultados do expe-
rimento. Indicamos: P(E). 2 1
P(E) = = .
4 2
5.6 Propriedades
44
Unisa | Educação a Distância | www.unisa.br
Estatística
Saiba mais
Um pouco de História
Os primeiros estudos envolvendo probabilidades foram motivados pela análise de jogos de azar. Sabe-se que um
dos primeiros matemáticos que se ocupou com o cálculo das probabilidades foi Cardano (1501-1576). Data dessa época
a expressão que utilizamos até hoje para o cálculo da probabilidade de um evento (número de casos favoráveis dividido
pelo número de casos possíveis).
Com Fermat (1601-1665) e Pascal (1623-1662), a teoria das probabilidades começou a evoluir e ganhar mais
consistência, passando a ser utilizada em outros aspectos da vida social, como, por exemplo, auxiliando na descoberta
da vacina contra a varíola no século XVIII.
Atualmente, a teoria das probabilidades é muito utilizada em outros ramos da Matemática (como o Cálculo e a
Estatística), da Biologia (especialmente nos estudos da Genética), da Física (como na Física Nuclear), da Economia, da
Sociologia etc.
Uma quantidade X, associada a cada possível resultado do espaço amostral S, é denominada variá-
vel aleatória discreta se assume valores num conjunto enumerável de pontos do conjunto real, com
certa probabilidade de ocorrência.
Notação:
p ( x i ) = P ( X = x i ) = pi , i = 1, 2, 3, Uma função de probabilidade satisfaz:
0 ≤ pi ≤ 1 e ∑ pi = 1 .
ou, ainda,
45
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Uma quantidade X, associada a cada possível Exemplos: renda, salário, tempo de uso de
resultado do espaço amostral S, é denominada va- um equipamento, área atingida por certa praga
riável aleatória contínua se assume valores num agrícola.
intervalo do conjunto dos números reais, com cer-
ta probabilidade de ocorrência.
Prezado(a) aluno(a), neste capítulo, apresentamos alguns conceitos fundamentais sobre Probabili-
dade, entre eles a definição de Espaço Amostral (S), Evento (E), Probabilidade, Variável Aleatória Discreta,
Função Discreta de Probabilidade, Variável Aleatória Contínua e Função Contínua de Probabilidade.
O cálculo das probabilidades pertence ao campo da Matemática, entretanto a maioria dos fenôme-
nos de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos
fundamentais do cálculo das probabilidades é uma necessidade essencial para o estudo da Estatística
Indutiva ou Inferência.
Vamos, agora, avaliar a sua aprendizagem.
46
Unisa | Educação a Distância | www.unisa.br
Estatística
1. U
m número é escolhido ao acaso entre os 50 inteiros compreendidos entre 1 e 50. Qual a pro-
babilidade do número:
a. Ser múltiplo de 9?
b. Ser múltiplo de 3 e de 4?
c. Ser múltiplo de 3 ou de 4?
d. Ser um número primo?
2. Numa caixa estão guardadas peças nas cores e formatos conforme a tabela abaixo:
Ao sortear-se ao acaso uma das peças, qual a probabilidade de ocorrer uma peça:
a. Circular Amarela?
b. Retangular?
c. Não Triangular?
47
Unisa | Educação a Distância | www.unisa.br
6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS
Entre os principais modelos teóricos para tatura, QI, orientação política, desgaste dos pisos
variáveis aleatórias contínuas, estudaremos o etc., aproximam-se, na prática, muito bem desse
modelo normal, pois vários fenômenos, como es- modelo.
Dizemos que uma variável aleatória contínua X tem distribuição normal com parâmetros , respec-
tivamente a média e a variância da distribuição, –∞ < μ < +∞ e 0 < σ2 < +∞, se a sua função densidade
de probabilidade é dada por:
Atenção
Notação: X ~ N(μ, σ2) significa: X tem distribuição normal com parâmetros μ e σ2.
49
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Saiba mais
Modelo Normal
O modelo normal, ou Gaussiano, é certamente o mais importante dos modelos para variáveis aleatórias contínuas. Isto
se justifica pelo grande número de aplicações que a utilizam e pela sua capacidade de aproximar outros modelos.
Nesta distribuição, a média, mediana e moda são valores coincidentes.
O cálculo de probabilidades na distribuição normal é feito mediante o conhecimento da média e desvio padrão da
variável aleatória. Dada a importância desta distribuição, estas duas medidas são consideradas as mais importantes para
verificar tendência central e dispersão, respectivamente.
Gráfico 6 – Probabilidade.
As probabilidades para o modelo normal são calculadas com o auxílio de tabelas e, para evitarmos
a multiplicação desnecessária de tabelas para cada par de valores (μ, σ2), utiliza-se uma transformação
que conduz sempre ao cálculo de probabilidades com uma variável de parâmetros (0, 1), isto é, μ = 0
(média) e σ² = 1 (variância).
X−µ
Desse modo, se X ~ N(μ, σ2) , definimos uma nova variável Z = , para qual se demonstra que
σ
μ ( Z ) = 0 e σ2 ( Z ) = 1.
Logo Z ~ N(μ, σ2) e é denominada Normal padrão ou Normal reduzida.
50
Unisa | Educação a Distância | www.unisa.br
Estatística
f(Z)
-1 0 1 Z
a −µ b−µ
P ( a ≤ X ≤ b) = P ( ≤Z≤ ),
σ σ
Portanto, quaisquer que sejam os valores de μ e σ, utilizamos a normal padrão para obter proba-
bilidades com a distribuição normal.
Os valores P ( 0 ≤ Z ≤ z ), z ≥ 0 são tabelados.
Pela simetria da curva normal, podemos calcular valores de probabilidades em outros intervalos e,
também, temos que a probabilidade de estar à direita (ou à esquerda) de zero é 0,5. Como a probabilida-
de é sempre um número compreendido entre 0 e 1, a tabela contém apenas a parte decimal.
Dicionário
Simetria
Matemática: disposição de duas figuras que se correspondem ponto por ponto de tal sorte que os dois pontos corres-
pondentes de uma e da outra estejam a igual distância de um ponto, de uma reta ou de um plano dado.
Eixo de simetria, reta comum a todos os planos de simetria.
Note que temos um eixo central na curva normal.
Se pegarmos um ponto pertencente à curva normal à direita do eixo central, teremos um ponto correspondente à es-
querda deste eixo que estará à mesma distância do eixo central.
Prezado(a) aluno(a), neste capítulo, vimos como criar um modelo probabilístico e o que é uma fun-
ção densidade de probabilidade.
De modo geral, podemos dizer que as variáveis aleatórias, cujos valores resultam de mensurações
ou medições, são variáveis aleatórias contínuas.
A construção de modelos probabilísticos para variáveis aleatórias contínuas envolve a ideia da ge-
51
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
neralização do histograma, fazendo o número de classes e o número de valores tenderem para o infinito,
que significa construir intervalos de classes extremamente pequenos, ínfimos.
Observe que a forma do histograma sofre uma modificação, passando a apresentar uma curva sua-
ve, ou seja, uma linha contínua, como visto no Gráfico 5. Esta curva contínua é a representação gráfica de
uma função da variável aleatória X, chamada de função densidade de probabilidade.
Vamos, agora, avaliar a sua aprendizagem.
1. As alturas de 10.000 alunos têm distribuição aproximadamente normal, com média 170 cm e
desvio padrão 5 cm. Qual a probabilidade de termos:
a. Alunos com alturas entre 165 cm e 170 cm.
b. Entre 165 cm e 180 cm.
c. Entre 168 cm e 185 cm.
d. Menores que 160 cm.
e. Maiores que 180 cm.
f. Qual o número esperado de alunos com altura superior a 165 cm?
2. Suponha um consultor investigando o tempo que os trabalhadores de uma fábrica levam para
montar determinada peça.
Suponha que análises da linha de produção tenham calculado um tempo médio de 75 segun-
dos e desvio padrão de 6 segundos.
O que isso significa graficamente?
3. Suponha, agora, que o consultor queira saber qual a probabilidade de um trabalhador levar um
tempo entre 75 e 81 segundos para montar uma peça, ou seja, P(75≤X≤81).
52
Unisa | Educação a Distância | www.unisa.br
7 ESTIMAÇÃO
Prezado(a) aluno(a), neste capítulo iremos plo, com base nos dados amostrais, podemos de-
abordar aspectos relacionados à Inferência Estatís- cidir se uma determinada droga é eficiente para o
tica. tratamento de uma doença entre outros.
Até o presente momento, você aprendeu a
descrever uma amostra por meio de medidas de Atenção
tendência central e medidas de dispersão, que A estimação faz parte da Inferência Esta-
compõem a Estatística Descritiva. A partir de ago- tística, que tem por objetivo fazer gene-
ra, você irá aprender a utilizar a Inferência Estatís- ralizações sobre uma população com
tica para inferir indutivamente propriedades de base em dados de uma amostra.
uma população, com base nos resultados obtidos
com uma amostra.
Existem dois tipos de estimação: por ponto e
Dicionário por intervalo.
Na estimação por ponto, é proposto um úni-
Inferir: Tirar uma conclusão a partir de um fato, de
um princípio. Concluir, deduzir. co valor para substituir o parâmetro (dado da
população). Assim, o estimador por ponto da mé-
dia aritmética populacional μ é a média aritméti-
A Inferência Estatística nos permitirá tomar ca amostral x ; o estimador por ponto da variância
decisões sobre populações com base nas informa- populacional σ² é a variância amostral S².
ções obtidas em amostras das mesmas. Por exem-
A estimação por ponto não permite julgar dade incluem o verdadeiro valor do parâmetro da
qual a possível magnitude do erro que estamos co- população.
metendo ao substituir o parâmetro por um único Logo, a estimação por intervalo consiste na
valor. Daí surge a ideia de construir intervalos de fixação de dois valores tais que γ seja a probabilida-
confiança, que são baseados na distribuição amos- de de que o intervalo, por eles determinado, conte-
tral do estimador pontual, incorporando à estimati- nha o verdadeiro valor do parâmetro.
va pontual do parâmetro informações a respeito de γ é chamado de coeficiente de confiança ou
sua variabilidade. nível de confiabilidade.
Um intervalo de confiança é determinado 1 – γ é o nível de significância ou nível de in-
por dois valores, que são os seus limites, chamados certeza ou, ainda, grau de desconfiança.
“limites de confiança”, que com certa probabili-
53
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
IC (μ , γ ) = X − z γ . σX ; X + z γ . σX = X − z γ . σX ≤ µ ≤ X + z γ . σX , onde: X é a média amostral.
2 2 2 2
γ
z γ é obtido da tabela da normal padrão, localizando o valor de no corpo da tabela e obtendo o
2
2
A expressão IC (μ , γ) envolve a quantidade X , que é uma variável aleatória e, sendo assim, o inter-
valo obtido também é aleatório, com probabilidade γ de conter o verdadeiro valor da média populacio-
nal μ.
Assim, uma interpretação conveniente para o intervalo de confiança é: se obtivermos várias
amostras de mesmo tamanho e, para cada uma delas, calcularmos os correspondentes intervalos
de confiança com coeficiente de confiança γ, esperamos que a proporção de intervalos que conte-
nham o valor de μ seja igual a γ.
Exemplo:
Suponha que os comprimentos de jacarés adultos de certa raça sigam o modelo normal com mé-
dia μ desconhecida e variância igual a 0,01 m². Uma amostra de dez animais foi sorteada e forneceu mé-
dia 1,69 m. Desejamos uma estimativa para o parâmetro desconhecido μ, com coeficiente de confiança
de 95%.
Identificando os dados do problema, temos: σ² = 0,01; n = 10; X = 1,69; γ = 95%;
54
Unisa | Educação a Distância | www.unisa.br
Estatística
σ2
X ~ N (µ , )
n
IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ]
2 2
Concluindo, podemos dizer que, em 100 intervalos construídos, 95 contêm a verdadeira média e,
de modo geral, admitimos que o intervalo calculado é um dos que contém a verdadeira média μ. Por essa
razão, além de informar o intervalo obtido, devemos também fornecer o índice de confiança utilizado.
Observações:
A amplitude do intervalo de confiança é dada pela diferença entre o extremo superior e infe-
rior, isto é, X + z γ . σ X − (X − z γ . σ X ) = 2 z γ . σ X
2 2 2
Exemplo:
De uma população de 1.000 elementos com distribuição aproximadamente normal com σ² = 400,
tira-se uma amostra de 25 elementos, obtendo-se X =
= 150
150. Fazer um IC para μ, ao nível de 5%.
55
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
56
Unisa | Educação a Distância | www.unisa.br
Estatística
IC (p , γ ) = [ p̂ − z γ . σ p̂ ; p̂ + z γ . σ p̂ ] = p̂ − z γ . σ p̂ ≤ p ≤ p̂ + z γ . σ p̂ , onde:
2 2 2 2
p̂ é a proporção amostral.
γ
z γ é obtido da tabela da normal padrão, localizando o valor de no corpo da tabela e obtendo o
2
2
valor z γ nas margens correspondentes.
2
p̂ . q̂
σ p̂ = é o desvio padrão da proporção amostral, com q̂ = 1 − p̂ .
n
Exemplo:
Suponha que, em n = 400 provas, obtemos k = 80 sucessos. Vamos obter um intervalo de confiança
para p, com coeficiente de confiança γ = 90%.
n = 400; γ = 90%
57
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Para estimarmos a média de uma população normal com variância desconhecida, quando o tama-
nho (n) da amostra for grande, n > 30, substituímos σ² pela variância amostral S2 e usamos a distribuição
normal.
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com coeficiente de
confiança γ, como:
IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ] , onde:
2 2
X é a média amostral.
γ
z γ é obtido da tabela da normal padrão, localizando o valor de no corpo da tabela e obtendo o
2
2
valor z γ nas margens correspondentes.
2
S
σX = é o desvio padrão da média amostral, com
n
n
( ∑ x i )2
1 n 1 n 2 2
S = S2 e S2 = { ∑ x i2 − i =1
} ou S2 = {∑ x i − n X }
n − 1 i =1 n n − 1 i =1
Exemplo:
1. De uma população normal com parâmetros desconhecidos, tiramos uma amostra de tama-
nho 100, obtendo-se X = 112 e S = 11. Fazer um IC para μ ao nível de 10%.
58
Unisa | Educação a Distância | www.unisa.br
Estatística
IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ]
2 2
Saiba mais
Qual é a vantagem de uma amostra ser aleatória, frente a amostras não aleatórias, escolhidas por critérios subjetivos e
ao gosto do pesquisador?
Em primeiro lugar, uma amostra escolhida por critérios rigorosamente objetivos, tende a não introduzir vieses que ocor-
rem quando a seleção é obtida por critérios discutíveis. Um pesquisador de campo pode selecionar apenas domicílios
que possuem menos quantidade de pessoas para facilitar o seu trabalho e pode também evitar os domicílios de difícil
acesso.
Mas a principal vantagem de uma amostra probabilística (frente a uma amostra “subjetivista”) é que, através de seus
resultados, é possível realizar cálculos probabilísticos.
Uma boa amostra deve apresentar três virtudes: 1) deve ser aleatória 2) deve ser precisa e 3) deve ser representativa e
não geradora de vieses para as suas estimativas de parâmetros da população.
A precisão de uma amostra irá depender de seu tamanho. Geralmente, quanto maior o tamanho de uma amostra, maior
será a sua precisão. A representatividade da amostra dependerá não de seu tamanho, mas da maneira como os elemen-
tos são selecionados da população.
Por exemplo, se tivermos uma população constituída de 30% de mulheres e 70% de homens e estivermos interessados
em estimar a quantidade média de horas de estudo.
Se selecionarmos uma amostra com 50% de homens e 50% de mulheres, a quantidade média de horas de estudo desta
amostra não será um bom estimador da quantidade média de horas de estudo da população, se a quantidade de horas
de estudo for uma variável que depende do sexo da pessoa. Se as mulheres tenderem a estudar mais do que os homens,
esta amostra não representativa irá conduzir a um valor superestimado da quantidade média de horas de estudo. Já uma
amostra que tenha o mesmo percentual de homens e de mulheres que existe na população, será considerada represen-
tativa desta população e a média de horas estudo obtida desta amostra será uma estimativa não viesada da média de
horas de estudo da população.
Prezado(a) aluno(a), aprendemos que a estimação faz parte da Inferência Estatística, que tem por
objetivo fazer generalizações sobre uma população com base em dados de uma amostra. Existem dois
tipos de estimação: por ponto e por intervalo, sendo esta última mais precisa.
Vamos, agora, avaliar a sua aprendizagem.
59
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
1. A altura dos homens de uma cidade apresenta distribuição normal. Para estimar a altura mé-
2. Para determinar o faturamento mensal das 500 maiores empresas de uma região, coletou-se
uma amostra com o faturamento mensal de 60 dessas empresas. A média encontrada nessa
amostra foi de $ 3.542,00. Sabendo-se que o desvio padrão do faturamento das 500 empresas
é de $ 380,00, determine o intervalo que deverá conter a média populacional. Utilize 68,26%
como nível de confiança.
3. Uma amostra do teor de Zn em ppm no dedo médio de n = 100 aves de postura apresentou
média de X = 112
400 e variância S2 = 420.
Essa amostra foi obtida em um plantel em que não foi realizado nenhum tratamento especial
com fonte de Zn na ração.
Obtenha o intervalo de 95% de confiança para a média populacional μ.
Dado t0;025;_=99 = 1;984.
60
Unisa | Educação a Distância | www.unisa.br
8 CORRELAÇÃO
Prezado(a) aluno(a), neste capítulo, iremos as medidas de tendência central, dispersão, assi-
abordar a correlação. Você sabe o que significa a metria etc. Com duas ou mais variáveis, além des-
palavra ‘correlação’? Antes de ler o próximo pará- tas medidas individuais, também é de interesse
grafo, observe a formação da palavra correlação e conhecer se elas possuem algum relacionamento
pense a respeito. entre si, isto é, se valores altos (baixos) de uma das
Observou? variáveis implicam em valores altos (ou baixos) da
outra variável. Por exemplo, pode-se verificar se
existe associação entre a taxa de desemprego e a
Dicionário taxa de criminalidade em uma grande cidade, en-
tre verba investida em propaganda e retorno nas
Correlação: Podemos desmembrá-la em co + relação,
vendas, verificar a relação entre o peso e a idade
que nos leva a investigar, compreender a relação exis-
tente entre dois termos ou objetos. das pessoas, se o consumo das famílias pode estar
relacionado com sua renda, se as vendas de uma
empresa e os gastos promocionais podem relacio-
Portanto, correlação é o estudo da existência nar-se, bem como a demanda de um determinado
e do grau de relação entre variáveis, tendo por ob- produto e seu preço.
jetivo medir e avaliar o grau de relação existente A análise de correlação fornece um número
entre duas variáveis aleatórias. que resume o grau de relacionamento linear entre
Ao se estudar uma variável o interesse eram as duas variáveis.
Procura medir a relação entre as variáveis X e Y através da disposição dos pontos (X, Y) em torno de
uma reta.
onde:
61
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
n = número de observações e;
Quando todos os pontos pertencerem à reta, a correlação é chamada correlação linear perfeita
positiva e rXY = 1.
Quando todos os pontos pertencerem à reta, a correlação é chamada correlação linear perfeita
negativa e rxy = -1.
62
Unisa | Educação a Distância | www.unisa.br
Estatística
Correlação nula
A correlação será nula quando não houver relação entre as variáveis X e Y, ou seja, quando as
variações de X e Y ocorrerem independentemente, não existe correlação entre elas.
Exemplos:
Observação: Para maior facilidade, construiremos uma tabela na qual, a partir dos valores de X
e Y, determinaremos todas as somas necessárias (Tabela 18).
Tabela 17 – Dados de X e Y.
63
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
2. A Tabela 19 mostra os resultados de uma pesquisa com 10 famílias de uma determinada re-
gião.
Calcular o coeficiente de correlação linear entre Poupança e Número de filhos das dez famílias.
64
Unisa | Educação a Distância | www.unisa.br
Estatística
A correlação linear entre as variáveis X e Y é forte e negativa, isto é, famílias com poupança alta têm
menor número de filhos.
Saiba mais
Correlação não é o mesmo que causa e efeito. Duas variáveis podem estar altamente correlacionadas e, no entanto, não
haver relação de causa e efeito entre elas.
Se duas variáveis estiverem amarradas por uma relação de causa e efeito elas estarão, obrigatoriamente, correlacionadas.
O estudo de correlação pressupõe que as variáveis X e Y tenham uma distribuição normal.
A palavra simples que compõe o nome correlação linear simples, indica que estão envolvidas no cálculo somente duas
variáveis.
65
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Prezado(a) aluno(a), neste capítulo, estudamos a correlação e vimos que a correlação procura en-
tender como duas variáveis estão inter-relacionadas do ponto de vista estatístico. Uma das possibilida-
des de se efetuar este estudo é medir a relação entre as variáveis X e Y através da disposição dos pontos
(X, Y) em torno de uma reta.
Vimos também que a correlação será positiva quando valores crescentes de X estiverem associados
a valores crescentes de Y, ou valores decrescentes de X estiverem associados a valores decrescentes de
Y, ou seja, a correlação será positiva quando um atributo tender a aumentar, o outro também tenderá a
aumentar.
A correlação será negativa quando valores crescentes de X estiverem associados a valores decres-
centes de Y ou valores decrescentes de X estiverem associados a valores crescentes de Y, ou seja, quando
um atributo tender a aumentar, o outro tenderá a diminuir.
A correlação será nula quando não houver relação entre as variáveis X e Y, ou seja, quando as va-
riações de X e Y ocorrerem independentemente, não existirá correlação entre elas. Podemos dizer ainda
que, não há um padrão definido de tendência. Também ocorre quando ao aumentar um atributo não há
mudança significativa nos valores do outro atributo.
Para medir a correlação, iremos utilizar o Coeficiente de correlação de Pearson. Este é um índice que
varia de -1 a 1.
Vamos, agora, avaliar a sua aprendizagem.
4. Uma clínica de emagrecimento recebe pacientes adultos com peso seguindo uma distribui-
ção normal de média 130 kg e desvio padrão 20 kg. Para efeito de determinar o tratamento
mais adequado, os 25% pacientes de menor peso são classificados de “magros”, enquanto os
25% de maior peso de “obesos”. Determine os valores que delimitam cada uma dessas classi-
ficações.
5. Por analogia a produtos similares, o tempo de reação de um novo medicamento pode ser
considerado como tendo distribuição normal com desvio padrão igual a 2 minutos (a média
é desconhecida). Vinte pacientes foram sorteados, receberam o medicamento e tiveram seu
tempo de reação anotado. Os dados foram os seguintes (em minutos): 2,9; 3,4; 3,5; 4,1; 4,6; 4,7;
4,5; 3,8; 5,3; 4,9; 4,8; 5,7; 5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de confiança
para o tempo médio de reação. Use γ = 96%.
6. Uma amostra aleatória de 625 donas de casa revela que 70% delas preferem a marca X de
detergente. Construir um intervalo de confiança para p = proporção das donas de casa que
preferem X com coeficiente de confiança γ = 90%.
7. Um fabricante afirma que seus cigarros contêm não mais que 30 mg de nicotina. Uma amostra
de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg. Construa um intervalo de
confiança para a média populacional μ com coeficiente de confiança γ = 95%.
8. Deseja-se fazer uma pesquisa para saber a aceitação de um novo produto no mercado. Qual é
o número de pessoas que deve ser entrevistado com 7% de erro e 95% de segurança?
9. Deseja-se fazer uma pesquisa junto a uma empresa para saber o interesse dos funcionários
em realizar cursos no exterior. Existem 3 mil funcionários, sendo 1,8 mil com mais de dez anos
de empresa e 1,2 mil com menos. Qual deve ser o tamanho da amostra probabilística estra-
tificada sabendo-se que, em cursos semelhantes, 5% dos funcionários acima de dez anos e
10% dos com menos de dez anos de empresa participaram. Considerar 2% de erro e 95,5% de
segurança.
67
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
11. A Tabela 21 mostra o volume de vendas (em 1000 unidades) e os gastos promocionais (em
100000 reais). Calcular a correlação entre as duas variáveis.
Tabela 21 – Volume de vendas e gastos promocionais.
12. Querendo se estimar a média de uma população X com distribuição normal, levantou-se uma
amostra de 100 observações, obtendo-se X = 30 e S = 4. Ao nível de 90%, determinar o limite
de confiança para a verdadeira média da população.
13. Um pesquisador deseja estabelecer o peso médio dos jovens entre 14 e 20 anos. Apesar de
desconhecer a média e o desvio padrão populacional, sabe por literatura da área que a dis-
tribuição dos pesos é aproximadamente normal. Retira-se uma amostra casual simples de 60
jovens, obtendo peso médio de 67 kg e desvio padrão de 9 kg.
a. Ao nível de 5% de significância, estabelecer um IC para o peso médio populacional.
b. Qual o tamanho da amostra que o pesquisador deveria tomar para ter uma probabilidade
de 95% de certeza de cometer um erro de 1,5 kg?
68
Unisa | Educação a Distância | www.unisa.br
Estatística
69
Unisa | Educação a Distância | www.unisa.br
RESPOSTAS COMENTADAS DAS
ATIVIDADES PROPOSTAS
Capítulo 1
2.
a. 23,4; 48,9; 120,4; 234,8; 78,8; 130,0; 45,1; 12,4; 200,0
b. 46,73; 253,65; 28,26; 123,84; 299,95; 37,48
c. 27; 68; 128; 50; 68; 39
d. 40; 270; 300; 60; 260; 300; 450; 260; 3000
71
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
Capítulo 2
Observe, através da fac, que 90% dos alunos têm idades até 21 anos.
2.
a. População: 1.000 alunos matriculados.
b. Amostragem aleatória simples; Amostra: 150 alunos sorteados.
Obs.: Arredondamos para baixo o valor do último item para a soma dar 200, pois se utilizásse-
mos o critério de arredondamento visto, teríamos 201 elementos na amostra.
4.
a. População: pessoas de 20 anos
b. Observe que temos 11.500 pessoas na população em estudo. As 5.500 mulheres representam
47,8% da população com 20 anos e os 6.000 homens representam 52,2% da população com
20 anos. Dessa forma, calculando a quantidade de homens e mulheres de acordo as propor-
ções acima descritas e arredondando os dados conforme os critérios estabelecidos, temos: M:
574; H: 626.
72
Unisa | Educação a Distância | www.unisa.br
Estatística
5.
a. PM: 350; 450; 550; 650; 750; 850; 950; 1050; 1150
fac: 14; 60; 118; 194; 262; 324; 372; 394; 400
fi: 0,04; 0,11; 0,14; 0,19; 0,17; 0,16; 0,12; 0,05; 0,02
fi . 100%: 4; 11; 14; 19; 17; 16; 12; 5; 2
Capítulo 3
1.
a. Qualitativa nominal; Quantitativa contínua; Quantitativa discreta; Qualitativa nominal.
b. Quantitativa discreta; Quantitativa discreta; Qualitativa ordinal; Qualitativa ordinal.
c. Sim, como quantitativa contínua, pois existe um número grande de valores diferentes. Su-
gestão: iniciar em 0, com amplitude de classe igual a 2.
d. Setores; Histograma e Polígono de frequência; Colunas; Setores; Colunas ou Histograma e
Polígono de frequências; Colunas; Setores ou Colunas; Setores ou Colunas.
2.
a. Fisioterapia: quantitativa discreta;
Sequelas: qualitativa nominal;
Cirurgia: qualitativa ordinal.
b. Fisioterapia: gráfico de colunas;
Sequelas: gráfico de setores;
Cirurgia: gráfico de colunas;
c. Gráfico de colunas.
O número de meses de Fisioterapia diminuiu para os pacientes sem sequelas.
4. b. 34%
Capítulo 4
2.
a. Média: 1,88; Mediana:1,8; Moda: 1,5.
c. Média: 1,93; Mediana:1,8; Moda:1,6 e 1,8. As diferenças não foram grandes. A solução (a)
é mais exata.
d. O de (c), pois, sem o computador, é praticamente impossível organizar 500 dados brutos.
73
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
3. Média: 86,20 bat/min; Variância: 16,36 (bat/min)2; Desvio padrão: 4,04 bat/min.
6.
a. B, pois o desvio padrão é menor.
b. É considerada normal em A, pois a zona de normalidade está entre 35 e 55. Em B, não, pois
a zona de normalidade está entre 41,5 e 48,5.
7. a. Média: 21,9; b. Desvio Padrão:6,34; c. Zona de normalidade: 15,56 a 28,24; d. Sim, pois 28
está dentro da zona de normalidade.
8. Não, pois está fora da zona de normalidade.
Capítulo 5
c) Observe a diferença entre este item e o anterior. Ambos se diferenciam pela partícula OU.
Ser múltiplo de 3 ou de 4 significa que “servem” todos os múltiplos de 3 OU todos os múltiplos
de 4. Observe que nesta situação, não há a necessidade de serem múltiplos simultaneamente.
Atendendo a uma das condições (ser múltiplo de 3 ou de 4 ) será suficiente.
Então temos:
Múltiplos de 3 entre 1 e 50: (3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48)
74
Unisa | Educação a Distância | www.unisa.br
Estatística
Múltiplos de 4 entre 1 e 50: (4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48)
Números de casos possíveis de E = 25 (Observe para não contar os valores em negrito duas
vezes)
Logo: P(E) =
d) Números primos (números que possuem apenas dois divisores, 1 e ele mesmo) entre 1 e 50:
(2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47)
Logo: P(E) =
Então temos
a) P(E) =
b) P(E) =
c) P(E) =
Capítulo 6
1. Resolução:
Variável X: altura, com X ~N ( 170, 25 ); μ = 170 cm e σ² = 25.
a −µ b−µ
P ( a ≤ X ≤ b) = P ( ≤Z≤ )
σ σ
75
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
160 − 170
d. P ( X < 160 ) = P ( Z < ) = P ( Z < - 2 ) = P ( Z > 2 ) (pela simetria da Normal)
5
P ( Z > 2 ) = 0,5 – P ( 0 < Z < 2 ) = 0,5 – 0,4772 = 0,0228 ∴ P ( X < 160 ) =2,28%
180 − 170
e. P ( X > 180 ) = P ( Z > ) = P ( Z > 2 ) = 0,5 – P ( 0 < Z < 2 ) = 0,5 – 0,4772 = 0,0228
5
∴ P ( X > 180 ) = 2,28%
165 − 170
f. P ( X > 165 ) = P ( Z > ) = P ( Z > - 1 ) = P ( Z < 1 ) (pela simetria da Normal)
5
P ( Z < 1 ) = 0,5 + P ( 0 < Z < 1 ) = 0,5 + 0,3413 = 0,8413 ∴ P ( X > 165 ) = 84,13%.
Como são 10.000 alunos, teremos: 10000 . 0,8413 = 8413 alunos é o número esperado de
alunos com altura superior a 165 cm.
Na Escala de Z, 2σ significa dois desvios padrões a partir da média (0+ 2σ= 2σ); na Escala de X,
esse deslocamento é análogo (75+2*6=87).
Outra forma de relacionar esses valores é através da fórmula de transformação apresentada
anteriormente:
3. Como proceder?
76
Unisa | Educação a Distância | www.unisa.br
Estatística
Capítulo 7
Capítulo 7
?6 6 FP
J
1 – γ = 2% = 0,02 J (localizamos este valor no corpo da tabela da
normal padrão e encontramos o valor de ] J )
6
V;
Q
IC (μ , γ ) = [ ; ] J V ; ; ] J V ; @
78
Unisa | Educação a Distância | www.unisa.br
Estatística
3) O intervalo de confiança para μ. é dado por:
3. O intervalo de confiança para μ é dado por:
Capítulo 8
Capítulo 8
1. a. 0,5000; b. 0,3413; c. 0,8185; d. 0,1574; e. 0,0013; f. 0,0228.
1) a) 0,5000; b) 0,3413; c) 0,8185; d) 0,1574; e) 0,0013; f) 0,0228.
2. a. 0,9938; b. 0,8413; c. 0,0668; d. 0,6826; e. 19,6.
2)3. a. 0,3289;b) b.
a) 0,9938; 0,5286.c) 0,0668; d) 0,6826; e) 19,6.
0,8413;
6. [ 0,677; 0,732 ].
4) Magros: 116,6 kg; Obesos: 143,4 kg.
7. IC (μ, 95%) = [ 30,26 ; 32,74 ].
9. 377; 515.
6) [ 0,677; 0,732 ].
10. a. 0,9835; b. -0,7586; c. -0,736; d. 0,947.
11. 0,9817.
79
Unisa | Educação a Distância | www.unisa.br
REFERÊNCIAS
BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 4. ed. São Paulo: Atual, 1987.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Edusp, 2004.
MORETTIN, L. G. Estatística básica: inferência. São Paulo: Pearson Makron Books, 2000. v. 2.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2. ed. São Paulo: Atlas, 1985.
81
Unisa | Educação a Distância | www.unisa.br