Você está na página 1de 75

Regina Maria Sigolo Bernardinelli

Estatística

Revisada por Sandra R. L. Forster (setembro/2012)


APRESENTAÇÃO

É com satisfação que a Unisa Digital oferece a você, aluno(a), esta apostila de Estatística, parte in-
tegrante de um conjunto de materiais de pesquisa voltado ao aprendizado dinâmico e autônomo que a
educação a distância exige. O principal objetivo desta apostila é propiciar aos(às) alunos(as) uma apresen-
tação do conteúdo básico da disciplina.
A Unisa Digital oferece outras formas de solidificar seu aprendizado, por meio de recursos multidis-
ciplinares, como chats, fóruns, aulas web, material de apoio e e-mail.
Para enriquecer o seu aprendizado, você ainda pode contar com a Biblioteca Virtual: www.unisa.br,
a Biblioteca Central da Unisa, juntamente às bibliotecas setoriais, que fornecem acervo digital e impresso,
bem como acesso a redes de informação e documentação.
Nesse contexto, os recursos disponíveis e necessários para apoiá-lo(a) no seu estudo são o suple-
mento que a Unisa Digital oferece, tornando seu aprendizado eficiente e prazeroso, concorrendo para
uma formação completa, na qual o conteúdo aprendido influencia sua vida profissional e pessoal.
A Unisa Digital é assim para você: Universidade a qualquer hora e em qualquer lugar!

Unisa Digital
SUMÁRIO

INTRODUÇÃO................................................................................................................................................ 5
1 NOÇÕES BÁSICAS.................................................................................................................................. 7
1.1 Arredondamento de Dados..................................................................................................................................... 8
1.2 População e Amostra................................................................................................................................................. 9
1.3 Resumo do Capítulo.................................................................................................................................................11
1.4 Atividades Propostas...............................................................................................................................................12

2 ORGANIZAÇÃO DE DADOS........................................................................................................... 13
2.1 Tipos de Variável........................................................................................................................................................13
2.2 Distribuição de Frequências..................................................................................................................................16
2.3 Resumo do Capítulo.................................................................................................................................................21
2.4 Atividades Propostas...............................................................................................................................................22

3 GRÁFICOS ESTATÍSTICOS................................................................................................................ 25
3.1 Gráfico de Setores ou Disco ou Pizza ou Diagrama Circular......................................................................25
3.2 Gráfico de Colunas ou Barras................................................................................................................................26
3.3 Histograma..................................................................................................................................................................27
3.4 Polígono de Frequências........................................................................................................................................27
3.5 Resumo do Capítulo.................................................................................................................................................28
3.6 Atividades Propostas...............................................................................................................................................29

4 MEDIDAS.................................................................................................................................................... 31
4.1 Medidas de Posição..................................................................................................................................................31
4.2 Medidas de Dispersão.............................................................................................................................................35
4.3 Resumo do Capítulo.................................................................................................................................................39
4.4 Atividades Propostas...............................................................................................................................................39

5 PROBABILIDADES................................................................................................................................ 43
5.1 Fenômeno Determinístico.....................................................................................................................................43
5.2 Fenômeno Aleatório ou Probabilístico..............................................................................................................43
5.3 Espaço Amostral (S)..................................................................................................................................................44
5.4 Evento (E).....................................................................................................................................................................44
5.5 Probabilidade.............................................................................................................................................................44
5.6 Propriedades...............................................................................................................................................................44
5.7 Variável Aleatória Discreta......................................................................................................................................45
5.8 Função Discreta de Probabilidade......................................................................................................................45
5.9 Variável Aleatória Contínua...................................................................................................................................46
5.10 Função Contínua de Probabilidade..................................................................................................................46
5.11 Resumo do Capítulo..............................................................................................................................................46
5.12 Atividades Propostas.............................................................................................................................................47

6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS.................................................................................... 49


6.1 Modelo Normal ou Distribuição Normal..........................................................................................................49
6.2 Resumo do Capítulo.................................................................................................................................................51
6.3 Atividades Propostas...............................................................................................................................................52

7 ESTIMAÇÃO.............................................................................................................................................. 53
7.1 Estimação por Intervalo..........................................................................................................................................53
7.2 Resumo do Capítulo.................................................................................................................................................59
7.3 Atividades Propostas...............................................................................................................................................60

8 CORRELAÇÃO.......................................................................................................................................... 61
8.1 Correlação Linear Simples......................................................................................................................................61
8.2 Resumo do Capítulo.................................................................................................................................................66
8.3 Atividades Propostas...............................................................................................................................................66

RESPOSTAS COMENTADAS DAS ATIVIDADES PROPOSTAS...................................... 71


REFERÊNCIAS.............................................................................................................................................. 81
INTRODUÇÃO

Prezado(a) aluno(a), esta apostila reúne os principais tópicos de Estatística, de forma condensada
e objetiva, com a finalidade de orientá-lo(a), aluno(a) do Curso de Ensino a Distância (EaD), no desen-
volvimento do conteúdo desta disciplina.
Em sua elaboração, não tive a pretensão de demonstrar as diversas fórmulas matemáticas nela
existentes, mas de mostrar suas aplicações nos diversos assuntos abordados. É, portanto, um guia indis-
pensável para acompanhar as aulas web.
A disciplina de Estatística tem por objetivo fornecer-lhe subsídios que o(a) auxiliem nas demais
disciplinas do Curso de EaD, bem como desenvolver-lhe a capacidade de utilizar os diversos métodos
estatísticos e o raciocínio necessário para a interpretação e análise de pesquisas na área a que se destina.

Profa. Regina Maria Sigolo Bernardinelli

5
Unisa | Educação a Distância | www.unisa.br
1 NOÇÕES BÁSICAS
Prezado(a) aluno(a), você conhece a origem 4. A pesquisa realizada pelas indústrias, en-
da palavra ‘estatística’? Conhece algumas aplica- tre os consumidores, para o lançamento
ções desta ciência? Vamos iniciar este texto abor- de um novo produto;
dando esses pontos. 5. As pesquisas eleitorais, fornecendo ele-
A palavra ‘estatística’, de origem latina, signi- mentos para que os candidatos direcio-
ficou por muito tempo “ciência dos negócios do nem suas campanhas;
Estado”. Os que governavam, sentindo necessida-
6. As pesquisas utilizadas pelas emissoras
de de informações, organizavam departamentos,
de TV, mostrando a preferência dos es-
que tinham a responsabilidade de fazer essas in-
pectadores, para organizar sua progra-
vestigações.
mação.

Dicionário Você deve saber que a realização de uma pes-
quisa envolve muitas etapas, tais como: a escolha
A palavra ‘estatística’ surge da expressão em latim
statisticum collegium ou palestra sobre os assun-
da amostra, a coleta e a organização dos dados, o
tos do Estado, de onde surgiu a palavra em língua resumo e a apresentação desses dados e, também,
italiana statista, que significa “homem de estado”, a interpretação dos resultados para a obtenção de
ou político, e a palavra alemã Statistik, designando
a análise de dados sobre o Estado. A palavra ad-
conclusões e tomada de decisões razoáveis. Todas
quiriu um significado de coleta e classificação de essas etapas são trabalhadas com métodos cientí-
dados, no início do século 19. ficos pela Estatística.
Fonte: http://pt.wikiversity.org
O tratamento estatístico de um conjunto de
dados pode envolver dois processos distintos, isto
é, a descrição dos dados e o estabelecimento de
As sociedades modernas acumulam grande conclusões sobre a população a partir dos dados
quantidade de dados numéricos relativos a even- obtidos por amostragem.
tos sociais, econômicos, científicos, esportivos etc.
Desse modo, notamos que o uso da pesquisa é
Atenção
bastante comum nas várias atividades humanas.
O tratamento estatístico pode envolver a
descrição dos dados e o estabelecimento
Exemplos: de conclusões a partir da amostragem.

1. O índice de analfabetismo no Brasil;


Para tanto, temos:
2. A mortalidade infantil no Nordeste bra-
sileiro; ƒƒ Estatística descritiva: utiliza métodos
3. A porcentagem de crianças vacinadas na numéricos e gráficos para mostrar os
última campanha de vacinação; padrões de comportamento dos dados,

7
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

para resumir a informação contida nes- ƒƒ Inferência estatística: utiliza dados de


ses dados e para apresentar a informação amostras para obter estimativas sobre a
de forma conveniente; população.

Saiba mais

A Estatística é uma área do conhecimento que utiliza teorias probabilísticas para explicação de eventos,
estudos e experimentos. Tem por objetivo obter, organizar e analisar dados, determinar as correlações
que apresentem, tirando delas suas consequências para descrição e explicação do que passou e pre-
visão e organização do futuro. Em suma, estatística é a ciência que estuda os dados. Dentro dela, exis-
tem duas subdivisões: a estatística descritiva (que estuda métodos e ferramentas de coleta de dados e
modelos matemáticos para descrevê-los e interpretá-los) e a estatística inferencial (sistemas e técnicas
utilizadas para tomar boas decisões baseadas nos dados).
A estatística é também uma ciência e prática de desenvolvimento de conhecimento humano através
do uso de dados empíricos. Baseia-se na teoria estatística, um ramo da matemática aplicada. Na teoria
estatística, a aleatoriedade e incerteza são modeladas pela teoria da probabilidade. Algumas práticas
estatísticas incluem, por exemplo, o planejamento, a sumarização e a interpretação de observações.
Porque o objetivo da estatística é a produção da “melhor” informação possível a partir dos dados dispo-
níveis, alguns autores sugerem que a estatística é um ramo da teoria da decisão.
Fonte: http://pt.wikiversity.org

1.1 Arredondamento de Dados

Como na maioria das vezes, os dados dispo- Exemplos: aproximação de uma casa de-
níveis não são números inteiros, para efetuar os cál- cimal: 42,87 passa a 42,9;
culos estatísticos, é necessário efetuar o arredon- 25,08 passa a 25,1;
damento desses dados. A seguir, apresentamos os
53,99 passa a 54,0.
critérios utilizados para efetuar o arredondamento.
De acordo com o Instituto Brasileiro de Geo-
c. Quando o primeiro algarismo a ser aban-
grafia e Estatística (IBGE)1, o arredondamento é fei-
donado é 5, há duas soluções:
to da seguinte forma:
ƒƒ se ao 5 seguir, em qualquer casa, um
a. Quando o primeiro algarismo a ser aban- algarismo diferente de zero, aumen-
donado é 0, 1, 2, 3 ou 4, fica inalterado o ta-se uma unidade ao algarismo a
último algarismo a permanecer. permanecer.
Exemplos: aproximação de uma casa de-
Exemplo: aproximação de uma casa de-
cimal: 2,352 passa a 2,4;
cimal: 53,24 passa a 53,2.
25,6501 passa a 25,7;
b. Quando o primeiro algarismo a ser aban- 76,25002 passa a 76,3.
donado é 6, 7, 8 ou 9, aumenta-se em
uma unidade o algarismo a permanecer. ƒƒ se o 5 for o último algarismo ou se
ao 5 só se seguirem zeros, o último

1
Em conformidade com a Resolução nº 886/66 da Fundação IBGE, Adaptado de CRESPO, 1991.

8
Unisa | Educação a Distância | www.unisa.br
Estatística

algarismo a ser conservado só será Prezado(a) aluno(a), para iniciar o estudo da


aumentado de uma unidade se for Estatística, é necessário que você conheça, com-
ímpar. preenda e se aproprie do significado de alguns ter-
Exemplos: aproximação de uma casa de- mos que serão utilizados.
cimal: 24,75 passa a 24,8; Analise cuidadosamente cada termo defini-
24,65 passa a 24,6; do a seguir.

24,75000 passa a 24,8;


24,6500 passa a 24,6.

1.2 População e Amostra

População e Propaganda de uma determinada uni-


versidade:
É o conjunto de todos os elementos envolvi- População: todos os alunos do curso de Pu-
dos no fenômeno a ser estudado. blicidade e Propaganda;
Amostra: uma classe do primeiro ano do
Amostra curso de Publicidade e Propaganda.

É o conjunto de elementos retirados da po- Quando são obtidos dados de toda uma po-
pulação para a realização do estudo. É, portanto, pulação, dizemos que foi feito um recenseamento e
um subconjunto da população. a este conjunto de dados damos o nome de censo.
Quando os dados são obtidos de parte da po-
Exemplos: pulação, dizemos, então, que foi feita uma amostra-
1. Queremos obter informações sobre a gem.
audiência de certo programa de TV, na
Grande São Paulo: A Escolha da Amostra
População: é o conjunto de todos os domi-
cílios da Grande São Paulo que possuem TV; Os métodos de escolha da amostra devem
Amostra: é o conjunto dos domicílios que garantir a representatividade do grupo. É neces-
serão visitados. sário escolher, no mínimo, 10% do número total
dos elementos da população e garantir, por meio
de um critério de seleção, que nenhum elemento
2. Estudar a procedência dos candidatos a
tenha maior chance de ser escolhido do que outro.
uma determinada universidade:
Desse modo, podemos recorrer a diferentes formas
População: conjunto de todos os candida- de amostragem: aleatória simples, sistemática e
tos à referida universidade; estratificada proporcional.
Amostra: conjunto dos candidatos que se-
rão entrevistados. Atenção
Os métodos de escolha da amostra devem
3. Queremos fazer um estudo sobre a ida- garantir a representatividade do grupo.
de dos alunos do curso de Publicidade
9
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Vejamos o procedimento através de dois tem a mesma probabilidade de ser sor-


exemplos: teado. Esse processo não é muito prático
para grandes populações, quando pode-
mos então trabalhar com uma 1
Exemplo 1: suponhamos uma pesquisa so-
bre o nível de escolaridade de um grupo de oito- numeração de 0 a 9, sorteando 10
centas pessoas. Vamos escolher uma amostra com, os números por meio de blocos
no mínimo, oitenta pessoas (10% de 800), selecio- de três algarismos e tomando o cuidado
nadas através de: de repor na urna todo algarismo dela

retirado. Como temos dez algarismos,


a. Amostragem aleatória simples: em
cada um deles tem de probabilidade de
primeiro lugar, elaboramos uma lista
com os oitocentos nomes dos elemen- aparecer em determinada posição. Sem-
tos da população numerados de 1 a 800, pre que um bloco de algarismos indicar
para serem submetidos a um sorteio. um elemento já selecionado, ou um ele-
Bolas ou cartões, também numerados mento que não exista na população, será
de 1 a 800, são colocados em uma urna e descartado.
bem misturados. Em cada etapa do sor-
teio, todo número ainda não escolhido

Suponhamos que os seguintes algarismos foram obtidos no sorteio:

2 4 3 5 6 4 7 2 0 0 3 5 8 1 1 0 0 5
1 9 8 6 4 3 5 2 4 7 8 9 7 7 6 5 4 2
2 3 0 1 2 1 1 6 7 8 9 1 0 3 4 5 6 7
2 2 8 8 1 9 0 0 6 0 7 2 1 0 5 6 4 3

Agrupando-os em blocos de três, teremos os números:

243 564 720 035 811 005 198 643 524 789 776 542 230
121 167 891 034 567 228 819 006 072 105 643.

Observem que devemos descartar 811, 891 e 819, porque não pertencem à população, e 643, por-
que já foi selecionado.
Continuamos o sorteio, até completarmos os 80 elementos da amostra.

b. Amostragem sistemática: sorteamos um número de 1 a 10, ao acaso. Supondo que tenha


sido obtido o número 6, ele será o primeiro elemento da amostra e os demais serão determi-
nados em intervalos de dez unidades. Nossa amostra, então, será:

6 16 26 36 46 56 66 76 86 96 106 . . . 796

Esse tipo de amostragem é simples de ser realizado e aconselhável no caso de amostras muito
grandes.
10
Unisa | Educação a Distância | www.unisa.br
Estatística

Exemplo 2: na escola Sapequinha, quer fazer-se um estudo sobre o peso dos alunos de 7 anos de
idade. Existem 120 crianças na faixa de 7 anos de idade, distribuídas em cinco classes, do seguinte modo:
a primeira série A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem 35, a D, 30 e a E tem 20. Vamos
escolher uma amostra com, no mínimo, 12 crianças (10% de 120), selecionadas através de:

c. Amostragem estratificada proporcional: sorteamos os nomes das crianças em quantidades


proporcionais ao número de crianças com 7 anos de cada classe, que constituem os estratos
da amostra. Vamos, agora, determinar a porcentagem de crianças com 7 anos, em cada classe,
em relação à população (120 crianças):

De modo análogo, determinamos as porcentagens para as classes C, D e E, obtendo:

C: c = 29,2% D: d = 25% E: e = 16,7%

Para calcularmos quantas crianças de cada classe serão sorteadas, para uma amostra de 12 crian-
ças, fazemos:
A: 16,7% de 12 = 16,7/100 . 12 = 0,167 . 12 = 2,004 = 2
B: 12,5% de 12 = 0,125 . 12 = 1,5 = 2
C: 29,2% de 12 = 0,292 . 12 = 3,504 =3 (nesse caso, arredondamos para 3, ao invés de 4, porque o
total de crianças da amostra é 12)
D: 25% de 12 = 0,25 . 12 = 3
E: 16,7% de 12 = 0,167 . 12 = 2,004 = 2

Desse modo, obtivemos a quantidade de elementos de cada estrato e o total da amostra.

1.3 Resumo do Capítulo

Prezado(a) aluno(a), vimos neste capítulo que a palavra ‘estatística’, de origem latina, significou por
muito tempo “ciência dos negócios do Estado”. Estudamos também que a Estatística Descritiva utiliza
métodos numéricos e gráficos para mostrar os padrões de comportamento dos dados, para resumir
a informação contida nesses dados e para apresentar a informação de forma conveniente, e que a In-
ferência Estatística utiliza dados de amostras para obter estimativas sobre a população. Aprendemos
ainda sobre arredondamentos e amostra.
Vamos, agora, avaliar a sua aprendizagem.

11
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

1.4 Atividades Propostas

1. Faça o arredondamento dos seguintes números para uma casa decimal:

a. 2,36.
b. 3,57.
c. 4,62.
d. 8,81.
e. 4,451.
f. 5,501.
g. 5,55.
h. 5,65.

2. Arredonde cada um dos numerais abaixo, conforme a precisão pedida.

a. para o décimo mais próximo:


23,40 234,7832 45,09
48,85002 78,85 12,35
120,4500 129,98 199,97
b. para o centésimo mais próximo:
46,727 28,255 299,951
253,65 123,842 37,485
c. para a unidade mais próxima:
26,6 128,5 68,2
67,5 49,98 39,49
d. para a dezena mais próxima:
42,3 59 446,4
265,31 265,0 265
295 302,7 2995,000

12
Unisa | Educação a Distância | www.unisa.br
2 ORGANIZAÇÃO DE DADOS
Prezado(a) aluno(a), falaremos agora sobre a ƒƒ Cine: nº de vezes que vai ao cinema por
organização de dados. Vamos lá! semana;
Dado um conjunto de dados, vamos estudar ƒƒ Op Cine: opinião a respeito das salas de
como devemos “tratar” os valores, numéricos ou cinema na cidade: (B) regular a Boa; (M)
não, a fim de extrair informações a respeito de uma Muito boa;
ou mais características de interesse. ƒƒ TV: horas gastas assistindo à TV, por se-
Suponhamos, por exemplo, que um questio- mana;
nário foi aplicado a alunos do 1º ano de uma escola ƒƒ Op TV: opinião a respeito da qualidade
fornecendo as seguintes informações: da programação na TV: (R) ruim; (M) mé-
dia; (B) boa; (N) não sabe.
ƒƒ Id: identificação do aluno;
ƒƒ Turma: A ou B; O conjunto de informações, após a tabulação
ƒƒ Sexo: Feminino (F) ou Masculino (M); do questionário ou pesquisa de campo, é denomi-
ƒƒ Idade: em anos; nado tabela de dados brutos e contém os dados
ƒƒ Alt: altura em metros; da maneira que foram coletados inicialmente (Ta-
ƒƒ Peso: em quilogramas; bela 1).

ƒƒ Filhos: nº de filhos na família; Cada uma das características perguntadas


aos alunos, como o peso, a idade, a altura etc., é
ƒƒ Fuma: hábito de fumar: Sim (S) ou Não
denominada variável e, como podemos observar,
(N);
tem naturezas diferentes quanto aos possíveis va-
ƒƒ Toler: tolerância ao cigarro: (I) Indiferen- lores que podem assumir.
te; (P) incomoda Pouco; (M) incomoda
Muito;
ƒƒ Exerc.: horas de atividade física, por se-
mana;

2.1 Tipos de Variável

Existem dois tipos de variável: qualitativas Variáveis qualitativas


(variáveis não numéricas) e quantitativas (variá-
veis numéricas). Seus valores representam uma qualidade (ou
atributo) do indivíduo pesquisado.

13
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Exemplos: sexo, turma, estado civil, grau de Exemplos: número de filhos, salário, peso,
instrução, hábito de fumar etc. altura etc.
Entre as variáveis qualitativas, ainda existem Entre as variáveis quantitativas, ainda exis-
dois tipos: tem dois tipos:

a. Variável qualitativa nominal: não exis- a. Variáveis quantitativas discretas: seus


te ordenação em seus possíveis resulta- possíveis valores formam um conjunto
dos. Exemplos: sexo, turma, hábito de finito ou enumerável de números que
fumar; resultam frequentemente de uma con-
b. Variável qualitativa ordinal: existe cer- tagem. Exemplos: número de filhos, ida-
ta ordem em seus possíveis resultados. de (em anos), cine (número de vezes que
Exemplos: tamanho (P, M, G), classe social vai ao cinema por semana);
(baixa, média, alta), grau de instrução (1º b. Variáveis quantitativas contínuas:
grau, 2º grau, grau superior), estado civil. seus possíveis valores formam um inter-
valo de números reais que resultam, nor-
malmente, de uma mensuração. Exem-
Variáveis quantitativas plos: peso, altura, salário.

Seus valores são numéricos e resultantes de
uma contagem ou mensuração. Atenção

A Estatística permite que dados quali-


tativos sejam apresentados de maneira
quantitativa.

Saiba mais

Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua); mas, se
for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos etc.), é qualitativa (ordinal). Outro
exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua), se trabalhamos
com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do
boxe (peso-pena, peso-leve, peso-pesado etc.).
Outro ponto importante é que nem sempre uma variável representada por números é quanti-
tativa. O número do telefone de uma pessoa, o número da casa, o número de sua identidade.
Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea,
por exemplo. Isso não significa que a variável sexo passou a ser quantitativa!

Exemplo dos ursos marrons:


Num levantamento de dados de uma amostra da população de ursos marrons coletados nos
EUA, teremos como qualitativas as variáveis sexo (nominal) e mês da observação (ordinal); são
quantitativas contínuas: idade, comprimento da cabeça, largura da cabeça, perímetro do pes-
coço, perímetro do tórax, altura e peso.

14
Unisa | Educação a Distância | www.unisa.br
Estatística

Figura 1 – Classificação de uma variável.


ESQUEMA

Tabela 1 – Informações de questionário estudantil – Dados brutos.

Op
Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine TV OpTV
Cine
1 A F 17 1,60 60,5 2 Não P 0 1 B 16 R
2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R
3 A M 18 1,85 72,8 2 Não P 5 2 M 15 R
4 A M 25 1,85 80,9 2 Não P 5 2 B 20 R
5 A F 19 1,58 55,0 1 Não M 2 2 B 5 R
6 A M 19 1,76 60,0 3 Não M 2 1 B 2 R
7 A F 20 1,60 58,0 1 Não P 3 1 B 7 R
8 A F 18 1,64 47,0 1 Sim I 2 2 M 10 R
9 A F 18 1,62 57,8 3 Não M 3 3 M 12 R
10 A F 17 1,64 58,0 2 Não M 2 2 M 10 R
11 A F 18 1,72 70,0 1 Sim I 10 2 B 8 N
12 A F 18 1,66 54,0 3 Não M 0 2 B 0 R
13 A F 21 1,70 58,0 2 Não M 6 1 M 30 R
14 A M 19 1,78 68,5 1 Sim I 5 1 M 2 N
15 A F 18 1,65 63,5 1 Não I 4 1 B 10 R
16 A F 19 1,63 47,4 3 Não P 0 1 B 18 R
17 A F 14 1,82 66,0 1 Não P 3 1 B 10 N
18 A M 18 1,80 85,2 2 Não P 3 4 B 10 R
19 A F 20 1,60 54,5 1 Não P 3 2 B 5 R
20 A F 18 1,68 52,5 3 Não M 7 2 B 14 M
21 A F 21 1,70 60,0 2 Não P 8 2 B 5 R
22 A F 18 1,65 58,5 1 Não M 0 3 B 5 R
23 A F 18 1,57 49,2 1 Sim I 5 4 B 10 R
24 A F 20 1,55 48,0 1 Sim I 0 1 M 28 R
25 A F 20 1,69 51,6 2 Não P 8 5 M 4 N
26 A F 19 1,54 57,0 2 Não I 6 2 B 5 R
27 B F 23 1,62 63,0 2 Não M 8 2 M 5 R
28 B F 18 1,62 52,0 1 Não P 1 1 M 10 R
29 B F 18 1,57 49,0 2 Não P 3 1 B 12 R
30 B F 25 1,65 59,0 4 Não M 1 2 M 2 R

15
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Op
Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine TV OpTV
Cine
31 B F 18 1,61 52,0 1 Não P 2 2 M 6 N
32 B M 17 1,71 73,0 1 Não P 1 1 B 20 R
33 B F 17 1,65 56,0 3 Não M 2 1 B 14 R
34 B F 17 1,67 58,0 1 Não M 4 2 B 10 R
35 B M 18 1,73 87,0 1 Não M 7 1 B 25 B
36 B F 18 1,60 47,0 1 Não P 5 1 M 14 R
37 B M 17 1,70 95,0 1 Não P 10 2 M 12 N
38 B M 21 1,85 84,0 1 Sim I 6 4 B 10 R
39 B F 18 1,70 60,0 1 Não P 5 2 B 12 R
40 B M 18 1,73 73,0 1 Não M 4 1 B 2 R
41 B F 17 1,70 55,0 1 Não I 5 4 B 10 B
42 B F 23 1,45 44,0 2 Não M 2 2 B 25 R
43 B M 24 1,76 75,0 2 Não I 7 0 M 14 N
44 B F 18 1,68 55,0 1 Não P 5 1 B 8 R
45 B F 18 1,55 49,0 1 Não M 0 1 M 10 R
46 B F 19 1,70 50,0 7 Não M 0 1 B 8 R
47 B F 19 1,55 54,5 2 Não M 4 3 B 3 R
48 B F 18 1,60 50,0 1 Não P 2 1 B 5 R
49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R
50 B M 18 1,83 86,0 1 Não P 7 0 M 20 B

2.2 Distribuição de Frequências

A partir da tabela de dados brutos (Tabela Notação:


1), vamos construir uma nova com as informações
resumidas, para cada variável, denominada tabela
de frequência, que conterá os valores da variável
e suas respectivas contagens, as quais são denomi-
nadas frequências absolutas ou, simplesmente,
frequências. Para efeito de comparação com outros gru-
No caso de variáveis qualitativas ou quantita- pos ou conjuntos de dados, é conveniente traba-
tivas discretas, a tabela de frequência consiste em lharmos com a frequência relativa, definida por
listar os valores possíveis da variável, numéricos ou
não, e fazer a contagem na tabela de dados brutos
do número de suas ocorrências.

16
Unisa | Educação a Distância | www.unisa.br
Estatística

Exemplos

ƒƒ Tabela de Frequência para a Variável Sexo (extraída da Tabela 1)


Tabela 2 – Variável Sexo.

Sexo: variável qualitativa nominal.

Note que, para variáveis cujos valores possuem ordenação natural (qualitativas ordinais e quanti-
tativas em geral), incluímos na tabela de frequência uma coluna contendo as frequências acumuladas
(fac), quando o número de valores i for maior do que 2. A frequência acumulada até certo valor é obtida
pela soma das frequências de todos os valores da variável menores ou iguais ao valor considerado.

ƒƒ Tabela de Frequência para a Variável Toler (extraída da Tabela 1)


Tabela 3 – Variável Toler.

Toler: variável qualitativa ordinal.

A variável Peso, classificada como quantita- ferramentas estatística utiliza esse procedimento.
tiva contínua, apresenta valores que podem ser Vamos lá! Você perceberá que é útil e simples!
qualquer número real num certo intervalo. Repare! para essa construção utilizaremos a
Pela Tabela 1, verificamos que os valores Tabela 4 da variável peso.
variam entre 44,0 kg e 95,0 kg e, como existe um O processo de elaboração da distribuição
grande número de valores diferentes, vamos cons- por variável contínua inicia-se com a apuração da
truir faixas ou classes de valores e contar o núme- chamada AMPLITUDE TOTAL, sendo sua fórmula de
ro de ocorrências em cada faixa. cálculo: AT = Xmax – Xmin.
Onde AT é a diferença entre o maior valor e o
Processo de Construção de Distribuições por menor da amostra organizada (ROL) crescente ou
Variável Contínua descrescente de valores.

Agora, prezado(a) estudante, vamos apren-


der o passo a passo para a construção de distribui-
ções por variável contínua. Esse conhecimento é
importante, porque grande parte do trabalho com

17
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

ROL DOS PESOS - ORDEM CRESCENTE 1

44,0 51,6 55,0 60,0 72,8


47,0 52,0 56,0 60,0 73,0
47,0 52,0 57,0 60,0 73,0
47,4 52,5 57,8 60,5 75,0
48,0 54,0 58,0 63,0 80,9
49,0 54,5 58,0 63,5 84,0
49,0 54,5 58,0 66,0 85,2
49,2 55,0 58,0 68,5 86,0
50,0 55,0 58,5 70,0 87,0
50,0 55,0 59,0 71,0 95,0

Assim:
AT = Xmax – Xmin
Este valor será utilizado a seguir !
AT = 95 – 44
AT = 51

Viu como é fácil! Agora vamos calcular o número de classes (ou seja linhas), pelo chamado critério
da raiz para a distribuição por variável contínua, cujo estudo é, como vimos, o peso:
A fórmula que utilizaremos será:

Onde K será o número de linhas que a distribuição irá possuir, sendo o resultado da raiz quadrada
do número de amostras (n). Como temos 50 amostras:

Por arredondamento 7 linhas. Ah,


também utilizaremos este resultado
a seguir!

Já sabemos quantas linhas nossa distribuição irá possuir, agora vamos determinar o intervalo de
cada classe, pela fórmula:

Aqui você utilizará os resultados de


AT (51) e K (7) calculados anterior-
mente!

18
Unisa | Educação a Distância | www.unisa.br
Estatística

Onde AT é o resultado da amplitude total, que no exemplo que estamos utilizando resultou em 51 e
K é o número de linhas da distribuição que calculamos no conteúdo anterior e o resultado foi 7.
Vamos ao cálculo dos intervalos então:



Vamos ver como ficou nossa distribuição por variável contínua para os pesos!

Para a variável Para a variável Peso, como o cálculo dos


e o intervalos
deresultou 7em 7,29 e o núme
ParaPeso, como oPeso,
a variável cálculo dosointervalos
como resultou
cálculo dos em 7,29
intervalos número
resultou em 7,29 eclasses
o número(linhas),
de
usaremos faixas de amplitudeclasses
10 e7iniciaremos
(linhas), usaremos faixas
com 40,0 kg. de amplitude 10 e iniciaremos com 40,0 kg.
classes 7 (linhas), usaremos faixas de amplitude 10 e iniciaremos com 40,0 kg.

CL Peso
CL Peso
 (k) li ls
 Inicie
(k) pelo li ls Este símbolo do
Inicie pelo menor peso do 1 44,00 Ōņ 51,29Este símbolo do intervalo indica que
menor peso do ROL1 44,00 Ōņ 51,29 intervalo indica que
estão sendo incluídos
ROL 2 51,29 Ōņ 58,58 estão sendo incluídos
2 51,29 Ōņ 58,58 valores 44 kg e
3 58,58Ōņ 65,87 valores 44 kg e excluídos os que
3 58,58Ōņ 65,87 excluídos os quepossuírem 51,29 kg,
4 65,87Ōņ 73,16possuírem 51,29 kg,
4 65,87Ōņ 73,16 que deverão constar
5 73,16 Ōņ 80,45 que deverão constar
na classe seguinte!
5 73,16 Ōņ 80,45 na classe seguinte!
6 80,45 Ōņ 87,74
6 80,45 Ōņ 87,74
7 87,74Ōņ 95,03
7 87,74Ōņ 95,03 No limite superior
No limite superiordevemos incluir peso
devemos incluir pesos
até 94,02.
até 94,02.

CL Peso
CL Peso QL
(k) li Q L ls
(k) li ls
1 44,00 Ōņ 51,29 10
1 44,00 Ōņ 51,29 10
2 51,29 Ōņ 58,58 19
2 51,29 Ōņ 58,58 19
3 58,58 Ōņ 65,87 7
3 58,58 Ōņ 65,87 7
4 65,87 Ōņ 73,16 7
4 65,87 Ōņ 73,16 7
5 73,16 Ōņ 80,45 1
5 73,16 Ōņ 80,45 1
6 80,45 Ōņ 87,74 5
6 80,45 Ōņ 87,74 5
7 87,74 Ōņ 95,03 1
7 87,74 Ōņ 95,03 1
TOTAL 50
TOTAL 50

19
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli
ƒ Tabela de Frequência para a Variável Peso (extraída da Tabela 1)

ƒƒ Tabela de Frequência para a Variável Peso (extraída da Tabela 1)


Tabela 4 – Variável Peso.
Tabela 4 – Variável Peso.
CL Peso QL
QL fac IL I L ˜   fac (%) Ponto médio
(k) li ls Q
1 44,00Ōņ 51,29 10 10 0,20 20 20 47,65
2 51,29Ōņ 58,58 19 29 0,38 38 58 54,94
3 58,58Ōņ 65,87 7 36 0,14 14 72 62,23
4 65,87Ōņ 73,16 7 43 0,14 14 86 69,52
5 73,16Ōņ 80,45 1 44 0,02 2 88 76,81
6 80,45Ōņ 87,74 5 49 0,10 10 98 84,10
7 87,74 Ōņ 95,03 1 50 0,02 2 100 91,39
Peso: variável quantitativa contínua.

Observe, pela fac %, que 72% dos alunos pesam em média (ponto médio) 62,23 kg.
Observe, pela
Analisando fac %,pode-se
a tabela, que 72%observar
dos alunos pesam
também em100
que média
– 88(ponto
= 12%médio) 62,23
têm peso kg. Analisando
médio maior a
tabela, pode-se observar também que 100 – 88 = 12% têm peso médio maior ou igual a 76,81 kg.
ou igual a 76,81 kg.
Na Tabela 5, temos 7 faixas (ou classes ou intervalos). Consideremos, por exemplo, a 1ª classe ou
Na Tabela
intervalo: 44,00 4, temos
├─ 51,29, 7 faixas (ou classes ou intervalos). Consideremos, por exemplo, a
onde temos:
1ª classe ou intervalo: 44,0 Ōņ 51,29, onde temos:

Limite inferior (li): 44,00


Limite inferior (li): 44,0
Limite superior (ls): 51,29

Amplitude ou tamanho do intervalo (h): h = ls – li; (h = 51,29 – 44,00 = 7,29)


Limite superior (ls): 51,29

O símbolo ├─ indica que o intervalo é fechado à esquerda e aberto à direita (44,00 faz parte dessa
Amplitude
classe, mas 51,29 ou tamanho
não; 51,29 está na 2ªdo intervalo (h): h = ls – li; (h = 51,29 – 44,00 = 7,29)
classe).
O símbolo Ōņ indica que o intervalo é fechado à esquerda e aberto à direita (44,00
Na Tabela 1, a variável TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e uma tabela re-
faz parte dessa classe, mas 51,29 não; 51,29 está na 2ª classe).
presentando tais valores e respectivas frequências seria muito extensa e pouco prática. Por esse motivo,
trataremos essa variável como quantitativa contínua, criando, por exemplo, faixas de amplitude 6 para
representar Na
seusTabela
valores.
1, a variável TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e
uma tabela representando tais valores e respectivas frequências seria muito extensa e pouco
prática. Por esse motivo, trataremos essa variável como quantitativa contínua, criando, por
exemplo, faixas de amplitude 6 para representar seus valores.

20
Unisa | Educação a Distância | www.unisa.br
Estatística

ƒƒ Tabela de Frequência para a Variável TV (extraída da Tabela 1)


Tabela 5 – Variável TV.

TV: variável quantitativa discreta, que foi “tratada” como contínua.

Observe que, na última classe, o intervalo é fechado à esquerda e à direita, incluindo, portanto, o
valor 30 e não tendo, assim, que abrir mais uma classe por causa de um único valor. Outra sugestão seria
usar uma amplitude maior nessa última classe, por exemplo, 24 ├─ 36, que inclui o valor 30.

Saiba mais

Frequência Absoluta (ni ) - é o número de vezes que o valor de determinada variável é observado

Frequência Absoluta Acumulada (fac)- é a soma das frequências absolutas anteriores com a frequência abso-
luta deste valor.

Frequência Relativa (fi) - é o quociente entre a frequência absoluta do valor da variável e o número total de
observações.

Frequência Relativa Acumulada (fac %) - é a soma das frequências relativas anteriores com a frequência rela-
tiva desse valor.

n
fac% = ∑f i

i=1

2.3 Resumo do Capítulo

Prezado(a) aluno(a), neste capítulo estudamos sobre variáveis e suas frequências. O conjunto de
informações, após a tabulação do questionário ou pesquisa de campo, é denominado de tabela de dados
brutos. Cada uma das características perguntadas aos alunos tais como, o peso, a idade, a altura etc., é
denominada de variável, e, como podemos observar, possuem naturezas diferentes quanto aos possíveis
valores que podem assumir, sendo classificadas como variáveis qualitativas (nominal e ordinal) ou variá-
veis quantitativas (continuas e discretas).
Vamos, agora, avaliar a sua aprendizagem.

21
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

2.4 Atividades Propostas

1. Monte a tabela com as distribuições de frequência da variável Idade de acordo com os dados
da Tabela 1.

2. Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se


150 estudantes, entre os 1.000 matriculados. Responda:
a. Qual é a população envolvida na pesquisa?
b. Que tipo de amostragem foi utilizado e qual é a amostra considerada?

3. A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolares da


cidade de Morro Grande é apresentada na Tabela 6.
Tabela 6 – Incidência de cárie em escolares.

Baseando-se nesses dados, estratifique uma amostra com 200 elementos.

4. Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por
tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
a. Qual a população envolvida na pesquisa?
b. Supondo que, na cidade, haja 5.500 mulheres e 6.000 homens com 20 anos, determine
uma amostra com 1.200 pessoas.

5. Em uma fábrica, foram testadas 400 lâmpadas; a duração delas aparece na distribuição por
frequência da Tabela 7:

22
Unisa | Educação a Distância | www.unisa.br
Estatística

Tabela 7 – Duração de lâmpadas.

a. Complete a tabela dada com as demais colunas que você conhece.


b. Qual a amplitude de cada classe?
c. Qual o limite inferior da 3ª classe?
d. Qual o limite superior da 8ª classe?
e. Qual o ponto médio da 5ª classe?
f. Qual a frequência relativa da 6ª classe?
g. Qual a porcentagem de lâmpadas com durabilidade máxima de 500 horas?
h. Qual a porcentagem de lâmpadas com durabilidade de 900 horas ou mais?

23
Unisa | Educação a Distância | www.unisa.br
3 GRÁFICOS ESTATÍSTICOS
Prezado(a) aluno(a), neste capítulo iremos es- Muitas vezes, a informação contida nas ta-
tudar sobre gráficos. A organização dos dados em belas pode ser mais facilmente visualizada através
tabelas de frequência proporciona um meio eficaz de gráficos. Vamos definir quatro tipos básicos de
de estudo do comportamento de características de gráficos: setores ou pizza, colunas ou barras, his-
interesse. tograma e polígono de frequências.

Atenção

A utilização de tabelas e gráficos são frequentes na Estatística. As tabelas servem para orga-
nizar e tabular os dados, já os gráficos transmitem as informações com clareza e transparên-
cia, contribuindo para uma leitura objetiva.

3.1 Gráfico de Setores ou Disco ou Pizza ou Diagrama Circular

Adapta-se muito bem às variáveis qualitati- cada valor da variável. Se, ao contrário, formos tra-
vas, mas também pode ser usado para as variáveis çar o gráfico com o auxílio de compasso e transferi-
quantitativas discretas. dor, precisamos determinar a medida em graus de
Fazendo uso do computador para o traça- cada setor correspondente aos valores da variável,
do do gráfico, basta conhecer as porcentagens de lembrando que o disco todo mede 360°.

Exemplo: gráfico de setores para a variável Toler (Tabela 3):


I: 20% P:42% M: 38%

Procedemos de maneira análoga para os valores de P e M.

25
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Gráfico 1 – Setores.

3.2 Gráfico de Colunas ou Barras

Adapta-se melhor às variáveis discretas ou Utiliza o plano cartesiano com os valores da


qualitativas ordinais. variável no eixo das abscissas e as frequências ou
porcentagens no eixo das ordenadas.

Exemplo: gráfico de colunas para a variável Idade (Tabela 4):

Gráfico 2 – Colunas.

26
Unisa | Educação a Distância | www.unisa.br
Estatística

3.3 Histograma

É utilizado para variáveis quantitativas contí- Observação: A área de um histograma é


nuas. proporcional à soma das frequências absolutas. No
Consiste em retângulos contíguos ou adja- caso de trabalharmos com as frequências relativas,
centes, nos quais a base, colocada no eixo das abs- a área será igual à constante de proporcionalidade.
cissas, corresponde aos intervalos das classes e a
altura, colocada no eixo das ordenadas, é dada pela
frequência absoluta ou relativa das classes.

Dicionário

Um histograma é uma representação gráfica da distribuição de frequências de uma massa de


medições, normalmente um gráfico de barras verticais.
O histograma é um gráfico composto por retângulos justapostos em que a base de cada um
deles corresponde ao intervalo de classe e a sua altura à respectiva frequência. A construção
de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da
distribuição de dados.

Exemplo: histograma para a variável Peso (Tabela 5):

Gráfico 3 – Histograma.

3.4 Polígono de Frequências

É também utilizado para variáveis quantitati- correspondente) em relação a cada intervalo, estes
vas contínuas. são ligados entre si por meio de segmentos de re-
Para construir o polígono de frequências, ad- tas, sendo que o primeiro e o último são ligados ao
mitem-se, como representantes de cada classe, os eixo das abscissas, na metade de classes hipotéti-
pontos médios de cada intervalo que as definem. cas, imediatamente anterior à primeira e posterior
Após obter os pontos (ponto médio, frequência à última.

27
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Exemplo: polígono de frequências para a variável Peso (Tabela 5):

Gráfico 4 – Polígono de frequências.

Saiba mais

Você poderá obter esses gráficos, utilizando o Excel.


Abaixo segue o link onde você poderá obter informações, caso ainda não as saiba, de quais gráficos são possíveis cons-
truir com o Excel e como construí-los.
Porém é importante você observar que essa é apenas uma dica.
O fato de poder utilizar o Excel para a construção de gráficos não o exime do dever de saber construir esses gráficos
manualmente, ou seja, sem o auxílio desta ferramenta, pois certamente você precisará desenvolver essas atividades nas
avaliações presenciais.
Confira as dicas em:
http://office.microsoft.com/pt-br/excel-help/tipos-de-graficos-disponiveis-HA001233737.aspx.

3.5 Resumo do Capítulo

Prezado(a) aluno(a), muitas vezes, a informação contida nas tabelas pode ser mais facilmente vi-
sualizada através de gráficos. Nesse sentido, definimos, neste capítulo, quatro tipos básicos de gráficos:
setores ou pizza, colunas ou barras, histograma e polígono de frequências. E, por fim, vimos que o histo-
grama é utilizado para variáveis quantitativas contínuas.
Vamos, agora, avaliar a sua aprendizagem.

28
Unisa | Educação a Distância | www.unisa.br
Estatística

3.6 Atividades Propostas

1. Com relação às variáveis: Turma, Alt, Filhos, Fuma, Exerc, Cine, Op Cine, Op TV, da Tabela 1:
a. Classifique essas variáveis.
b. Faça a distribuição de frequência para cada uma delas.
c. A variável Exerc poderia ser tratada de forma diferente com relação à sua classificação?
Justifique sua resposta e, em caso afirmativo, construa a nova distribuição de frequência.
d. Construa os gráficos que melhor se adaptam a cada uma das variáveis apresentadas.

2. Quinze pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de me-
ses previstos de fisioterapia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de
complexidade da cirurgia realizada: alto (A), médio (M) ou baixo (B). Os dados são apresenta-
dos na Tabela 8:
Tabela 8 – Levantamento em clínica de ortopedia.

a. Classifique cada uma das variáveis.


b. Para cada variável, construa a tabela de frequência e faça uma representação gráfica.
c. Para o grupo de pacientes que não ficaram com sequelas, faça um gráfico de barras para
a variável Fisioterapia. Você acha que essa variável se comporta de modo diferente nesse
grupo?

3. Os dados da Tabela 9 referem-se ao salário (em salários-mínimos) de 20 funcionários admi-


nistrativos em uma indústria.
Tabela 9 – Salários de funcionários administrativos (em salários-mínimos).

a. Construa uma tabela de frequência agrupando os dados em intervalos de amplitude 2, a


partir de 1.
b. Construa o histograma.

29
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

4. Um grupo de estudantes do ensino médio foi submetido a um teste de Matemática resultan-


do em:
Tabela 10 – Teste de Matemática.

a. Construa o histograma.
b. Se a nota mínima para aprovação é 5, qual será a porcentagem de aprovação?

30
Unisa | Educação a Distância | www.unisa.br
4 MEDIDAS
Prezado(a) aluno(a), agora falaremos sobre ção, por exemplo, representando a tendência cen-
medidas. tral dos dados ou a maneira pela qual esses dados
Nosso interesse é caracterizar o conjunto de estão dispersos.
dados através de medidas que resumam a informa-

4.1 Medidas de Posição

Se estivermos numa parada de ônibus e nos


pedirem alguma informação sobre a demora em
passar um determinado ônibus, ninguém imagina
que poderíamos dar como resposta uma tabela de
frequências que coletamos no último mês. Quem
perguntou deseja uma resposta breve e rápida,
que sintetize a informação que dispomos, e não Exemplo: calcular a média aritmética dos va-
uma completa descrição dos dados. É para isso que lores: 9, 12, 8, 6, 14, 11, 5.
servem as medidas de posição.

Atenção Para calcularmos a média quando os dados


estão agrupados em classes, representamos todos
As medidas de posição ou medidas de
os valores de cada classe pelo ponto médio da clas-
tendência central para um conjunto de
dados qualquer (população ou amostra) se (visto no capítulo 2).
são: a média, a mediana e a moda.
Mediana (md)
Medidas de Posição para um Conjunto de Dados
É o valor da variável que ocupa a posição cen-
tral dos dados ordenados.
Seja uma variável X, com observações repre-
sentadas por Para o cálculo da mediana, temos duas consi-
derações a fazer:

Média aritmética ou, simplesmente, média ( )


a. o número de observações (n) é ímpar:
a mediana será o valor da variável que
É a soma dos valores da variável dividida pelo ocupa a posição de ordem .
número total de observações.

31
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Exemplo: calcular a mediana dos valores: Para calcularmos a mediana quando os da-
9, 12, 8, 6, 14, 11, 5. dos estão agrupados em classes, não levamos em
Em primeiro lugar, vamos montar o Rol, ou consideração se n é par ou ímpar e procedemos do
seja, organizar os dados em ordem crescente: seguinte modo:

5, 6, 8, 9, 11, 12, 14 1º) Calcula-se ;


2º) Pela frequência acumulada, identifica-se a
classe que contém a mediana;
Dicionário 3º) Aplica-se a fórmula:
Rol: a sequência de dados obtida após a ordena-
ção dos dados (crescente ou decrescente).

onde:
Observe que n = 7 (ímpar)

limd = limite inferior da classe md


Logo, a mediana será dada pelo elemento
que divide o Rol em duas partes iguais. n = nº total de elementos da amostra
fac = frequência acumulada da classe ante-
rior à classe md
h = amplitude da classe md
nimd = frequência da classe md

Moda (mo)

b. o número de observações (n) é par: não É o valor da variável mais frequente da distri-
existe, portanto, um valor que ocupe o buição.
centro; convencionou-se que a mediana
será a média aritmética dos valores que Exemplo: calcular a moda para o seguinte
ocupam as posições de ordem conjunto de dados:

65, 87, 49, 58, 65, 65, 67, 83, 87, 79, 87.

Exemplo: calcular a mediana dos valores já Observe que, mo = 65 (aparece 3 vezes) e mo


ordenados: 6, 8, 9, 11, 12, 14. = 87 (aparece 3 vezes).
n = 6 (par)
Temos então duas modas, portanto a distri-
buição é bimodal. Quando a distribuição não apre-
A mediana será dada pela média aritmética
sentar moda, será chamada amodal; se tiver uma
entre o 3º e 4º elementos da sequência:
só moda, recebe o nome de unimodal e, se apre-
sentar várias modas, será multimodal.
Para calcularmos a moda quando os dados
estão agrupados em classes, usaremos o seguinte
processo:

32
Unisa | Educação a Distância | www.unisa.br
Estatística

1º) Identifica-se a classe modal (a que possuir onde:


maior frequência); limo = limite inferior da classe modal
2º) Aplica-se a fórmula: = diferença entre a frequência da classe
modal e a imediatamente anterior
= diferença entre a frequência da classe
modal e a imediatamente posterior
h = amplitude da classe modal

Exemplos:
1. Calcule média, mediana e moda para a variável Idade (Tabela 11) (Ver Tabela 23):

Tabela 11 – Variável Idade.

n = 50 é par, portanto, a mediana será a média aritmética dos dois valores centrais

Pela fac, observamos que o valor da frequência acumulada até 18 é igual a 31 e, portanto, o 25º
elemento é igual ao 26º elemento e ambos correspondem ao valor da variável igual a 18

Para o cálculo de mo, olhamos a maior frequência (22), que corresponde à idade de 18 anos.

33
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

2. Calcule média, mediana e moda para a variável Peso (Tabela 12) (Ver Tabela 4):

Tabela 12 – Variável Peso.

Pela fac (30), a 2ª classe contém a mediana, isto é, o intervalo 50,0 ├─ 60,0.

Saiba mais
As medidas de posição podem ser utilizadas em conjunto para auxiliar a análise dos dados, mas existem situações
em que uma pode ser mais conveniente do que a outra. Por exemplo, quando existe um ou mais valores muito discre-
pantes, a média é muito influenciada por este valor e se torna inadequada para representar o conjunto de dados, sendo
melhor trabalhar com a mediana. Por outro lado, para conjuntos de dados muito numerosos, a ordenação é custosa e
a mediana se torna difícil de calcular.

34
Unisa | Educação a Distância | www.unisa.br
Estatística

4.2 Medidas de Dispersão

Prezado(a) aluno(a), como visto, efetuar uma suficientes para fazer a média atingir um patamar
análise dos dados, utilizando-se somente as medi- comparável às melhores economias do mundo,
das de posição, pode levar-nos a conclusões equi- porém a discrepância entre os diversos valores
vocadas. Para nos auxiliar na tarefa da análise de deve ser muito grande. O que podemos estar es-
dados, utilizaremos também as medidas de disper- quecendo é a variabilidade dos valores da variável
são. e isso não é captado pela média, mas pelas medi-
Observe o exemplo a seguir. das de dispersão.
As medidas de dispersão ou de variabili-
Um bairro nobre da capital paulista inclui dade servem para quantificar a variabilidade dos
uma das maiores favelas de São Paulo. O que pode- valores da variável, isto é, a dispersão dos dados, ou
mos dizer da renda média do bairro? Certamente, a forma como os valores de cada conjunto se espa-
os altos rendimentos de alguns residentes serão lham ao redor das medidas de tendência central.

Medidas de Dispersão para um Conjunto de Dados

Sejam os valores assumidos por uma variável X.

Consideremos, por exemplo, as séries:

A: 10, 10, 11, 12, 12, 13, 14, 14, 14, 15 com = 12,5 e md = 12,5
B: 7, 7, 8, 9, 12, 13, 13, 16, 17, 23 com = 12,5 e md = 12,5

Observamos que essas séries não são homogêneas, apesar de ambas terem o mesmo valor para a
média e a mediana. É preciso, pois, calcular as constantes de dispersão, que medem os afastamentos dos
valores dessas séries em torno do valor central.

Entre as medidas de dispersão ou de variabilidade mais usadas, temos: amplitude total, variân-
cia, desvio padrão e coeficiente de variação.

Amplitude total (R)

É a diferença entre o maior e o menor valor de um conjunto de dados.

Exemplos:
Para a série A: R = 15 – 10 = 5.
Para a série B: R = 23 – 7 = 16.
35
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

A utilização da amplitude total como medida de dispersão é muito limitada, pois só leva em consi-
deração dois valores de todo o conjunto de dados.

Variância (σ2 (população) ou S2 (amostral))


Para medir a dispersão dos valores de uma variável em torno da média, é interessante estudar o

comportamento dos desvios de cada valor em relação à média, isto é, . Na determinação de cada

desvio d i , estaremos medindo a dispersão entre cada x i e a média x . Porém, se somarmos todos os
n n
desvios, teremos ∑ di = ∑ ( x i − x ) = 0 . Para contornar o problema, resolveu-se considerar o quadrado
i =1 i =1
de cada desvio ( x i − x ) 2 . Assim, defini-se:

Variância é a média aritmética dos quadrados dos desvios.

A seguir, estão outras fórmulas que podem ser usadas para facilitar o cálculo da variância popula-
cional e amostral.

1 N 2 1 n
σ2= ∑
N i =1
x i − µ 2 (dados não agrupados) S 2 = ∑ x i2 − ( x ) 2 (dados não agrupados)
n i =1
1 N 2 1
n
σ2= ∑ i i
N i =1
( n ⋅ x 2
) − µ 2
(dados agrupados) S = ∑ ( n i ⋅ x i2 ) − ( x )2 (dados agrupados)
n i =1

36
Unisa | Educação a Distância | www.unisa.br
Estatística

Exemplos:

Desvio padrão (σ (população) ou S (amostral))



O desvio padrão é a raiz quadrada da variância.
É assim definido para que a unidade original da variável, se houver, seja mantida, pois, pela fórmula
do cálculo da variância, a unidade é elevada ao quadrado.

σ= σ 2 (desvio padrão populacional)

S= S 2 (desvio padrão amostral)

Exemplos:

Para a série A:
Para a série B:

Observação: O desvio padrão define, em torno da média populacional ou amostral, um intervalo


[μ – σ, μ + σ ] ou [ x − S , x + S ] de amplitude 2σ ou 2S, respectivamente, chamado zona de normalidade.

Coeficiente de variação (CV)

O coeficiente de variação é uma medida relativa da dispersão que serve para comparar o grau de
concentração em torno da média de conjuntos de dados distintos.

Exemplos:

Para a série A:

Para a série B:

Vemos, portanto, que há maior variação na série B do que na A, pois o CV, na série B, é bem maior
que na série A.
37
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Exemplos:

1. Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável Ida-
de (Tabela 13) (Ver Tabela 11):

Tabela 13 – Variável Idade.

R = 25 – 17 = 8 (amplitude total)

2. Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável Peso
(Tabela 14) (Ver Tabela 12):

Tabela 14 – Variável Peso.

38
Unisa | Educação a Distância | www.unisa.br
Estatística

4.3 Resumo do Capítulo

Prezado(a) aluno(a), vimos neste capítulo que as medidas de posição ou medidas de tendência
central para um conjunto de dados qualquer (população ou amostra) são: a média, a mediana e a moda.
Também foram apresentadas as medidas de dispersão. Entre as medidas de dispersão ou de variabilida-
de mais usadas, temos: amplitude total, variância, desvio padrão e coeficiente de variação, que comple-
mentarão as informações necessárias para a análise dos dados.
Vamos, agora, avaliar a sua aprendizagem.

4.4 Atividades Propostas

1. Vinte e cinco residências de certo bairro foram sorteadas e visitadas por um entrevistador,
que, entre outras questões, perguntou sobre o número de televisores.
Os dados foram os seguintes:

2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.

Organize os dados numa tabela de frequência e determine todas as medidas de posição e de


dispersão.

2. Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso avaliado
no fim de um mês.

Os dados referentes ao ganho de peso (em quilogramas) foram os seguintes:

1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2.

39
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

a. Utilizando os dados brutos, determine as medidas de posição e de dispersão desse con-


junto.
b. Organize uma tabela de frequência com faixas de amplitude 0,2 a partir de 1,5.
c. Calcule, a partir da tabela de frequência e com o ponto médio como representante de cada
faixa, as medidas de posição e de dispersão. Comente as diferenças encontradas com o
item (a).
d. Se ao invés de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente: o de
(a) ou o de (c)? Justifique.

3. As pulsações de 10 estudantes no início de uma prova de Estatística foram as seguintes (em


batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule as medidas de posição e
de dispersão desse conjunto de dados.

4. Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo tive-
ram o seu consumo observado durante 1000 quilômetros. A informação obtida é apresentada
na Tabela 15, em km/litro.
Tabela 15 – Consumo de combustível.

Determine as medidas de posição e de dispersão do consumo.

5. Se a média das alturas de um grupo de pessoas é 175 cm e o desvio padrão é 20 cm, uma pes-
soa com estatura de 150 cm está dentro da normalidade? Por quê?
6. Numa escola, duas turmas conseguiram os seguintes resultados:

Responda:
a. Qual a turma mais homogênea? Por quê?
b. Um aluno com média 40 é considerado normal na turma A? E na turma B? Por quê?

40
Unisa | Educação a Distância | www.unisa.br
Estatística

7. Na aplicação de um teste de motricidade, foram obtidos os resultados que compõem a Tabela


16.

Tabela 16 – Motricidade.

Responda:
a. Qual é a média aritmética?
b. Qual é o desvio padrão?
c. Qual a zona considerada de normalidade?
d. Uma criança que obteve 28 pontos é considerada com motricidade normal? Por quê?

8. Na pesagem de 20 crianças de quinta série, obtiveram-se os seguintes resultados, em kg:

38 40 45 42 45 40 43 38
45 45 40 41 41 38 46 32
48 46 42 43 44 50 38 40

Nesse grupo de crianças, um menino com 35 kg seria considerado com peso normal? Por quê?

41
Unisa | Educação a Distância | www.unisa.br
5 PROBABILIDADES
Prezado(a) aluno(a), neste capítulo, não será conceitos que serão necessários para o estudo da
efetuado um estudo completo sobre a teoria das Estatística e aplicados posteriormente.
probabilidades, mas serão apresentados alguns

5.1 Fenômeno Determinístico

É aquele em que repetindo um experimen- podemos determinar, pelas leis da Física, que ele
to, nas mesmas condições, o resultado esperado é gastará 2 horas para percorrer o referido espaço e
sempre o mesmo. isso sempre ocorrerá, desde que sejam mantidas as
Exemplo: se um corpo percorre uma distân- mesmas condições.
cia de 120 km, com velocidade média de 60 km/h,

5.2 Fenômeno Aleatório ou Probabilístico

É aquele cujo resultado não pode ser previsto Veremos que modelos podem ser estabele-
com certeza, ainda que mantidas as mesmas con- cidos para quantificar as incertezas das diversas
dições de realização. ocorrências.
Exemplo: no lançamento de um dado, não
podemos dizer, com certeza, qual será o resultado.
Só podemos saber que é provável que ocorra o re-
sultado 1 ou 2 ou 3 ou 4 ou 5 ou 6.

Atenção

A maioria dos fenômenos tratada pela Es-


tatística é de natureza aleatória ou proba-
bilística. Observe que durante a escolha
da amostra, temos um fenômeno proba-
bilístico.

43
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

5.3 Espaço Amostral (S)

É o conjunto de todos os resultados possíveis de certo fenômeno aleatório.

5.4 Evento (E)

É um subconjunto do espaço amostral. Exemplo: um experimento consiste em re-


tirar uma lâmpada de um lote e medir seu tempo
Exemplo: lançamos uma moeda duas vezes. de vida antes de se queimar. Um espaço amostral
Se C indica cara e R, coroa, temos: conveniente é: S = {t: t ≥ 0}, isto é, o conjunto de to-
dos os números reais não negativos. Seja o evento
S = {(C, C); (C, R); (R, C); (R, R)} (espaço amos-
“o tempo de vida da lâmpada é inferior a 20 horas”,
tral)
temos: E = {t: 0 ≤ t < 20}. Este é um exemplo de es-
Seja o evento “obtenção de faces iguais”, te- paço amostral contínuo, enquanto os outros ante-
mos: E = {(C, C); (R, R)} (evento) riores são discretos.
Seja o evento “obtenção de cara no 1º lança-
mento”, temos: E = {(C, C); (C, R)} (evento)

5.5 Probabilidade

É a relação entre o número de possíveis resul- No caso dos dois eventos anteriores,
tados de E e todos os possíveis resultados do expe-
rimento. Indicamos: P(E). 2 1
P(E) = = .
4 2

5.6 Propriedades

Sendo o modelo probabilístico um modelo para qualquer evento E;


teórico para as frequências relativas, podemos ve- ƒƒ Considerando o espaço todo S e o con-
rificar algumas das propriedades a seguir: junto vazio como eventos, temos:
P(S) = 1 (evento certo) e
ƒƒ Como toda frequência relativa é um nú- P(Ø) = 0 (evento impossível)
mero entre 0 e 1, temos que: 0 ≤ P(E) ≤ 1,

44
Unisa | Educação a Distância | www.unisa.br
Estatística

Saiba mais

Um pouco de História

Os primeiros estudos envolvendo probabilidades foram motivados pela análise de jogos de azar. Sabe-se que um
dos primeiros matemáticos que se ocupou com o cálculo das probabilidades foi Cardano (1501-1576). Data dessa época
a expressão que utilizamos até hoje para o cálculo da probabilidade de um evento (número de casos favoráveis dividido
pelo número de casos possíveis).
Com Fermat (1601-1665) e Pascal (1623-1662), a teoria das probabilidades começou a evoluir e ganhar mais
consistência, passando a ser utilizada em outros aspectos da vida social, como, por exemplo, auxiliando na descoberta
da vacina contra a varíola no século XVIII.
Atualmente, a teoria das probabilidades é muito utilizada em outros ramos da Matemática (como o Cálculo e a
Estatística), da Biologia (especialmente nos estudos da Genética), da Física (como na Física Nuclear), da Economia, da
Sociologia etc.

5.7 Variável Aleatória Discreta

Uma quantidade X, associada a cada possível resultado do espaço amostral S, é denominada variá-
vel aleatória discreta se assume valores num conjunto enumerável de pontos do conjunto real, com
certa probabilidade de ocorrência.

5.8 Função Discreta de Probabilidade

A função que atribui a cada valor


x1 , x 2 , x 3 , , x n da variável aleatória X sua pro-
babilidade de ocorrência p1 , p 2 , p3 , , p n , res-
pectivamente, é denominada função discreta de
probabilidade ou, simplesmente, função de proba-
bilidade.

Notação:
p ( x i ) = P ( X = x i ) = pi , i = 1, 2, 3,  Uma função de probabilidade satisfaz:
0 ≤ pi ≤ 1 e ∑ pi = 1 .
ou, ainda,

45
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

5.9 Variável Aleatória Contínua

Uma quantidade X, associada a cada possível Exemplos: renda, salário, tempo de uso de
resultado do espaço amostral S, é denominada va- um equipamento, área atingida por certa praga
riável aleatória contínua se assume valores num agrícola.
intervalo do conjunto dos números reais, com cer-
ta probabilidade de ocorrência.

5.10 Função Contínua de Probabilidade

Função contínua de probabilidade ou fun-


a. f (X) ≥ 0, para todo X ∈ ( −∞, + ∞ ) ;
ção densidade de probabilidade para uma va-
riável aleatória contínua X é toda função f (X) que b. a área definida por f (X) é igual a 1.
satisfaz a duas condições:

5.11 Resumo do Capítulo

Prezado(a) aluno(a), neste capítulo, apresentamos alguns conceitos fundamentais sobre Probabili-
dade, entre eles a definição de Espaço Amostral (S), Evento (E), Probabilidade, Variável Aleatória Discreta,
Função Discreta de Probabilidade, Variável Aleatória Contínua e Função Contínua de Probabilidade.
O cálculo das probabilidades pertence ao campo da Matemática, entretanto a maioria dos fenôme-
nos de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos
fundamentais do cálculo das probabilidades é uma necessidade essencial para o estudo da Estatística
Indutiva ou Inferência.
Vamos, agora, avaliar a sua aprendizagem.

46
Unisa | Educação a Distância | www.unisa.br
Estatística

5.12 Atividades Propostas

1. U
m número é escolhido ao acaso entre os 50 inteiros compreendidos entre 1 e 50. Qual a pro-
babilidade do número:
a. Ser múltiplo de 9?
b. Ser múltiplo de 3 e de 4?
c. Ser múltiplo de 3 ou de 4?
d. Ser um número primo?

2. Numa caixa estão guardadas peças nas cores e formatos conforme a tabela abaixo:


Ao sortear-se ao acaso uma das peças, qual a probabilidade de ocorrer uma peça:

a. Circular Amarela?
b. Retangular?
c. Não Triangular?

47
Unisa | Educação a Distância | www.unisa.br
6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS
Entre os principais modelos teóricos para tatura, QI, orientação política, desgaste dos pisos
variáveis aleatórias contínuas, estudaremos o etc., aproximam-se, na prática, muito bem desse
modelo normal, pois vários fenômenos, como es- modelo.

6.1 Modelo Normal ou Distribuição Normal

Dizemos que uma variável aleatória contínua X tem distribuição normal com parâmetros , respec-
tivamente a média e a variância da distribuição, –∞ < μ < +∞ e 0 < σ2 < +∞, se a sua função densidade
de probabilidade é dada por:

, para –∞ < X < +∞

Atenção

A função densidade de probabilidade é dada por:

, para –∞ < X < +∞

Notação: X ~ N(μ, σ2) significa: X tem distribuição normal com parâmetros μ e σ2.

Gráfico 5 – Curva normal.

49
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Observando-se o gráfico, temos:

a. f (X) é simétrica em relação a μ, isto é, f (μ + X ) = f (μ – X ), para todo X, –∞ < X < +∞;


b. ff((X)
X ) → 00 quando
quando
f ( X )X→→0±∞;
± ∞quando X → ±∞
c. o valor máximo de f ( X ) se dá para X = μ, isto é, a curva normal é unimodal e média (μ), me-
diana (Md) e moda (Mo) coincidem;
d. E (X) = μ (valor esperado ou média);
e. Var (X) = σ2 (variância);

Saiba mais

Modelo Normal

O modelo normal, ou Gaussiano, é certamente o mais importante dos modelos para variáveis aleatórias contínuas. Isto
se justifica pelo grande número de aplicações que a utilizam e pela sua capacidade de aproximar outros modelos.
Nesta distribuição, a média, mediana e moda são valores coincidentes.
O cálculo de probabilidades na distribuição normal é feito mediante o conhecimento da média e desvio padrão da
variável aleatória. Dada a importância desta distribuição, estas duas medidas são consideradas as mais importantes para
verificar tendência central e dispersão, respectivamente.

Como calcular P (a ≤ X ≤ b)?

Gráfico 6 – Probabilidade.

As probabilidades para o modelo normal são calculadas com o auxílio de tabelas e, para evitarmos
a multiplicação desnecessária de tabelas para cada par de valores (μ, σ2), utiliza-se uma transformação
que conduz sempre ao cálculo de probabilidades com uma variável de parâmetros (0, 1), isto é, μ = 0
(média) e σ² = 1 (variância).
X−µ
Desse modo, se X ~ N(μ, σ2) , definimos uma nova variável Z = , para qual se demonstra que
σ
μ ( Z ) = 0 e σ2 ( Z ) = 1.
Logo Z ~ N(μ, σ2) e é denominada Normal padrão ou Normal reduzida.

50
Unisa | Educação a Distância | www.unisa.br
Estatística

Gráfico 7 – Normal padrão ou normal reduzida.

f(Z)

-1 0 1 Z

Agora, para calcularmos P ( a ≤ X ≤ b), fazemos a seguinte transformação:

a −µ b−µ
P ( a ≤ X ≤ b) = P ( ≤Z≤ ),
σ σ

onde X ~ N(μ, σ²).

Portanto, quaisquer que sejam os valores de μ e σ, utilizamos a normal padrão para obter proba-
bilidades com a distribuição normal.
Os valores P ( 0 ≤ Z ≤ z ), z ≥ 0 são tabelados.
Pela simetria da curva normal, podemos calcular valores de probabilidades em outros intervalos e,
também, temos que a probabilidade de estar à direita (ou à esquerda) de zero é 0,5. Como a probabilida-
de é sempre um número compreendido entre 0 e 1, a tabela contém apenas a parte decimal.

Dicionário

Simetria
Matemática: disposição de duas figuras que se correspondem ponto por ponto de tal sorte que os dois pontos corres-
pondentes de uma e da outra estejam a igual distância de um ponto, de uma reta ou de um plano dado.
Eixo de simetria, reta comum a todos os planos de simetria.
Note que temos um eixo central na curva normal.
Se pegarmos um ponto pertencente à curva normal à direita do eixo central, teremos um ponto correspondente à es-
querda deste eixo que estará à mesma distância do eixo central.

6.2 Resumo do Capítulo

Prezado(a) aluno(a), neste capítulo, vimos como criar um modelo probabilístico e o que é uma fun-
ção densidade de probabilidade.
De modo geral, podemos dizer que as variáveis aleatórias, cujos valores resultam de mensurações
ou medições, são variáveis aleatórias contínuas.
A construção de modelos probabilísticos para variáveis aleatórias contínuas envolve a ideia da ge-

51
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

neralização do histograma, fazendo o número de classes e o número de valores tenderem para o infinito,
que significa construir intervalos de classes extremamente pequenos, ínfimos.
Observe que a forma do histograma sofre uma modificação, passando a apresentar uma curva sua-
ve, ou seja, uma linha contínua, como visto no Gráfico 5. Esta curva contínua é a representação gráfica de
uma função da variável aleatória X, chamada de função densidade de probabilidade.
Vamos, agora, avaliar a sua aprendizagem.

6.3 Atividades Propostas

1. As alturas de 10.000 alunos têm distribuição aproximadamente normal, com média 170 cm e
desvio padrão 5 cm. Qual a probabilidade de termos:
a. Alunos com alturas entre 165 cm e 170 cm.
b. Entre 165 cm e 180 cm.
c. Entre 168 cm e 185 cm.
d. Menores que 160 cm.
e. Maiores que 180 cm.
f. Qual o número esperado de alunos com altura superior a 165 cm?

2. Suponha um consultor investigando o tempo que os trabalhadores de uma fábrica levam para
montar determinada peça.
Suponha que análises da linha de produção tenham calculado um tempo médio de 75 segun-
dos e desvio padrão de 6 segundos.
O que isso significa graficamente?

Ainda na Escala de X, o tempo central é a média de 75 segundos.


Na Escala de Z, a média é 0 e os intervalos têm como base o desvio padrão. Mas, assim como X,
a variável Z é contínua.
Pergunta: Como 87, na Escala de X, pode ser relacionado a 2σ, na Escala de Z?

3. Suponha, agora, que o consultor queira saber qual a probabilidade de um trabalhador levar um
tempo entre 75 e 81 segundos para montar uma peça, ou seja, P(75≤X≤81).
52
Unisa | Educação a Distância | www.unisa.br
7 ESTIMAÇÃO
Prezado(a) aluno(a), neste capítulo iremos plo, com base nos dados amostrais, podemos de-
abordar aspectos relacionados à Inferência Estatís- cidir se uma determinada droga é eficiente para o
tica. tratamento de uma doença entre outros.
Até o presente momento, você aprendeu a
descrever uma amostra por meio de medidas de Atenção
tendência central e medidas de dispersão, que A estimação faz parte da Inferência Esta-
compõem a Estatística Descritiva. A partir de ago- tística, que tem por objetivo fazer gene-
ra, você irá aprender a utilizar a Inferência Estatís- ralizações sobre uma população com
tica para inferir indutivamente propriedades de base em dados de uma amostra.
uma população, com base nos resultados obtidos
com uma amostra.
Existem dois tipos de estimação: por ponto e
Dicionário por intervalo.
Na estimação por ponto, é proposto um úni-
Inferir: Tirar uma conclusão a partir de um fato, de
um princípio. Concluir, deduzir. co valor para substituir o parâmetro (dado da
população). Assim, o estimador por ponto da mé-
dia aritmética populacional μ é a média aritméti-
A Inferência Estatística nos permitirá tomar ca amostral x ; o estimador por ponto da variância
decisões sobre populações com base nas informa- populacional σ² é a variância amostral S².
ções obtidas em amostras das mesmas. Por exem-

7.1 Estimação por Intervalo

A estimação por ponto não permite julgar dade incluem o verdadeiro valor do parâmetro da
qual a possível magnitude do erro que estamos co- população.
metendo ao substituir o parâmetro por um único Logo, a estimação por intervalo consiste na
valor. Daí surge a ideia de construir intervalos de fixação de dois valores tais que γ seja a probabilida-
confiança, que são baseados na distribuição amos- de de que o intervalo, por eles determinado, conte-
tral do estimador pontual, incorporando à estimati- nha o verdadeiro valor do parâmetro.
va pontual do parâmetro informações a respeito de γ é chamado de coeficiente de confiança ou
sua variabilidade. nível de confiabilidade.
Um intervalo de confiança é determinado 1 – γ é o nível de significância ou nível de in-
por dois valores, que são os seus limites, chamados certeza ou, ainda, grau de desconfiança.
“limites de confiança”, que com certa probabili-

53
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Portanto, a partir de informação de amostra, devemos calcular os limites de um intervalo, que, em


γ % dos casos, inclua o valor do parâmetro a estimar e, em (1 – γ)% dos casos, não inclua o valor do parâ-
metro.

Intervalo de Confiança (IC) para a Média Populacional (Variância Conhecida)

Consideremos, inicialmente, o intervalo de confiança para a média μ (desconhecida) de certa po-


pulação normal, com variância2conhecida σ². Supondo uma amostra X de tamanho n, com valores X1, X2,
σ
..., Xn, temos que X ~ N ( µ , ) , onde X é a média amostral.
n
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com coeficiente de
confiança γ, como:

 
IC (μ , γ ) = X − z γ . σX ; X + z γ . σX  = X − z γ . σX ≤ µ ≤ X + z γ . σX , onde: X é a média amostral.
 2 2  2 2

γ
z γ é obtido da tabela da normal padrão, localizando o valor de no corpo da tabela e obtendo o
2
2

valor z γ nas margens correspondentes.


2
σ
σX = é o desvio padrão da média amostral.
n

Os “limites de confiança” citados anteriormente são os números obtidos por


X − z γ . σX e X + z γ . σX .
2 2

A expressão IC (μ , γ) envolve a quantidade X , que é uma variável aleatória e, sendo assim, o inter-
valo obtido também é aleatório, com probabilidade γ de conter o verdadeiro valor da média populacio-
nal μ.
Assim, uma interpretação conveniente para o intervalo de confiança é: se obtivermos várias
amostras de mesmo tamanho e, para cada uma delas, calcularmos os correspondentes intervalos
de confiança com coeficiente de confiança γ, esperamos que a proporção de intervalos que conte-
nham o valor de μ seja igual a γ.

Exemplo:
Suponha que os comprimentos de jacarés adultos de certa raça sigam o modelo normal com mé-
dia μ desconhecida e variância igual a 0,01 m². Uma amostra de dez animais foi sorteada e forneceu mé-
dia 1,69 m. Desejamos uma estimativa para o parâmetro desconhecido μ, com coeficiente de confiança
de 95%.
Identificando os dados do problema, temos: σ² = 0,01; n = 10; X = 1,69; γ = 95%;

54
Unisa | Educação a Distância | www.unisa.br
Estatística

σ2
X ~ N (µ , )
n

IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ]
2 2

IC (μ , 95% ) = [ 1,63 ; 1,75 ]

Concluindo, podemos dizer que, em 100 intervalos construídos, 95 contêm a verdadeira média e,
de modo geral, admitimos que o intervalo calculado é um dos que contém a verdadeira média μ. Por essa
razão, além de informar o intervalo obtido, devemos também fornecer o índice de confiança utilizado.

Observações:

ƒƒ A amplitude do intervalo de confiança é dada pela diferença entre o extremo superior e infe-
rior, isto é, X + z γ . σ X − (X − z γ . σ X ) = 2 z γ . σ X
2 2 2

ƒƒ A semiamplitude, ou seja, z γ . σ X nos fornece o erro envolvido na estimação;


2

ƒƒ Se a população for finita e de tamanho N conhecido e se a amostra de tamanho n dela retirada


for sem reposição, então: σ = σ . N − n
X
n N −1

Exemplo:
De uma população de 1.000 elementos com distribuição aproximadamente normal com σ² = 400,
tira-se uma amostra de 25 elementos, obtendo-se X =
= 150
150. Fazer um IC para μ, ao nível de 5%.

Identificando os dados do problema, temos: N = 1000; σ² = 400; n = 25; X ==150


150; 1 – γ = 5%.

55
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Esquema para Melhor Compreensão

56
Unisa | Educação a Distância | www.unisa.br
Estatística

Figura 2 – Intervalo de Confiança – Média Populacional.

Intervalo de Confiança para a Proporção



Quando o tamanho da amostra ( n ) for grande, temos: , onde p̂ é a proporção amos-
tral e q = 1 – p. Consideramos uma amostra grande quando n > 30.
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para p, com coeficiente de
confiança γ, como:

IC (p , γ ) = [ p̂ − z γ . σ p̂ ; p̂ + z γ . σ p̂ ] = p̂ − z γ . σ p̂ ≤ p ≤ p̂ + z γ . σ p̂ , onde:
2 2 2 2

p̂ é a proporção amostral.
γ
z γ é obtido da tabela da normal padrão, localizando o valor de no corpo da tabela e obtendo o
2
2
valor z γ nas margens correspondentes.
2

p̂ . q̂
σ p̂ = é o desvio padrão da proporção amostral, com q̂ = 1 − p̂ .
n

Exemplo:
Suponha que, em n = 400 provas, obtemos k = 80 sucessos. Vamos obter um intervalo de confiança
para p, com coeficiente de confiança γ = 90%.

Identificando os dados do problema, temos:

n = 400; γ = 90%

57
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

IC (p , 90%) = [0,2 – 1,64 . 0,02 ; 0,2 + 1,64 . 0,02]

IC (p , 90%) = [ 0,167 ; 0,233 ]

Observação: Para a proporção, o erro envolvido na estimação é dado por: z γ . σ p̂


2

Intervalo de Confiança (IC) para a Média Populacional (Variância Desconhecida)

Para estimarmos a média de uma população normal com variância desconhecida, quando o tama-
nho (n) da amostra for grande, n > 30, substituímos σ² pela variância amostral S2 e usamos a distribuição
normal.
Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com coeficiente de
confiança γ, como:

IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ] , onde:
2 2

X é a média amostral.
γ
z γ é obtido da tabela da normal padrão, localizando o valor de no corpo da tabela e obtendo o
2
2
valor z γ nas margens correspondentes.
2
S
σX = é o desvio padrão da média amostral, com
n
n
( ∑ x i )2
1 n 1 n 2 2
S = S2 e S2 = { ∑ x i2 − i =1
} ou S2 = {∑ x i − n X }
n − 1 i =1 n n − 1 i =1

Exemplo:
1. De uma população normal com parâmetros desconhecidos, tiramos uma amostra de tama-
nho 100, obtendo-se X = 112 e S = 11. Fazer um IC para μ ao nível de 10%.

Identificando os dados do problema, temos: n = 100; X = 112 ; S = 11; 1 – γ = 10% = 0,10

58
Unisa | Educação a Distância | www.unisa.br
Estatística

IC (μ , γ ) = [ X − z γ . σ X ; X + z γ . σ X ]
2 2

IC (μ , 90%) = [112 – 1,64 . 1,1 ; 112 + 1,64 . 1,1]


IC (μ , 90%) = [110,20 ; 113,80]

Saiba mais

Qual é a vantagem de uma amostra ser aleatória, frente a amostras não aleatórias, escolhidas por critérios subjetivos e
ao gosto do pesquisador?
Em primeiro lugar, uma amostra escolhida por critérios rigorosamente objetivos, tende a não introduzir vieses que ocor-
rem quando a seleção é obtida por critérios discutíveis. Um pesquisador de campo pode selecionar apenas domicílios
que possuem menos quantidade de pessoas para facilitar o seu trabalho e pode também evitar os domicílios de difícil
acesso.
Mas a principal vantagem de uma amostra probabilística (frente a uma amostra “subjetivista”) é que, através de seus
resultados, é possível realizar cálculos probabilísticos.
Uma boa amostra deve apresentar três virtudes: 1) deve ser aleatória 2) deve ser precisa e 3) deve ser representativa e
não geradora de vieses para as suas estimativas de parâmetros da população.
A precisão de uma amostra irá depender de seu tamanho. Geralmente, quanto maior o tamanho de uma amostra, maior
será a sua precisão. A representatividade da amostra dependerá não de seu tamanho, mas da maneira como os elemen-
tos são selecionados da população.
Por exemplo, se tivermos uma população constituída de 30% de mulheres e 70% de homens e estivermos interessados
em estimar a quantidade média de horas de estudo.
Se selecionarmos uma amostra com 50% de homens e 50% de mulheres, a quantidade média de horas de estudo desta
amostra não será um bom estimador da quantidade média de horas de estudo da população, se a quantidade de horas
de estudo for uma variável que depende do sexo da pessoa. Se as mulheres tenderem a estudar mais do que os homens,
esta amostra não representativa irá conduzir a um valor superestimado da quantidade média de horas de estudo. Já uma
amostra que tenha o mesmo percentual de homens e de mulheres que existe na população, será considerada represen-
tativa desta população e a média de horas estudo obtida desta amostra será uma estimativa não viesada da média de
horas de estudo da população.

7.2 Resumo do Capítulo

Prezado(a) aluno(a), aprendemos que a estimação faz parte da Inferência Estatística, que tem por
objetivo fazer generalizações sobre uma população com base em dados de uma amostra. Existem dois
tipos de estimação: por ponto e por intervalo, sendo esta última mais precisa.
Vamos, agora, avaliar a sua aprendizagem.

59
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

7.3 Atividades Propostas

1. A altura dos homens de uma cidade apresenta distribuição normal. Para estimar a altura mé-

dia dessa população, levantou-se uma amostra de 150 indivíduos obtendo-se

. Ao nível de 2%, determinar um IC para a

altura média dos homens da cidade.

2. Para determinar o faturamento mensal das 500 maiores empresas de uma região, coletou-se
uma amostra com o faturamento mensal de 60 dessas empresas. A média encontrada nessa
amostra foi de $ 3.542,00. Sabendo-se que o desvio padrão do faturamento das 500 empresas
é de $ 380,00, determine o intervalo que deverá conter a média populacional. Utilize 68,26%
como nível de confiança.

3. Uma amostra do teor de Zn em ppm no dedo médio de n = 100 aves de postura apresentou
média de X = 112
400 e variância S2 = 420.
Essa amostra foi obtida em um plantel em que não foi realizado nenhum tratamento especial
com fonte de Zn na ração.
Obtenha o intervalo de 95% de confiança para a média populacional μ.
Dado t0;025;_=99 = 1;984.

60
Unisa | Educação a Distância | www.unisa.br
8 CORRELAÇÃO
Prezado(a) aluno(a), neste capítulo, iremos as medidas de tendência central, dispersão, assi-
abordar a correlação. Você sabe o que significa a metria etc. Com duas ou mais variáveis, além des-
palavra ‘correlação’? Antes de ler o próximo pará- tas medidas individuais, também é de interesse
grafo, observe a formação da palavra correlação e conhecer se elas possuem algum relacionamento
pense a respeito. entre si, isto é, se valores altos (baixos) de uma das
Observou? variáveis implicam em valores altos (ou baixos) da
outra variável. Por exemplo, pode-se verificar se
existe associação entre a taxa de desemprego e a
Dicionário taxa de criminalidade em uma grande cidade, en-
tre verba investida em propaganda e retorno nas
Correlação: Podemos desmembrá-la em co + relação,
vendas, verificar a relação entre o peso e a idade
que nos leva a investigar, compreender a relação exis-
tente entre dois termos ou objetos. das pessoas, se o consumo das famílias pode estar
relacionado com sua renda, se as vendas de uma
empresa e os gastos promocionais podem relacio-
Portanto, correlação é o estudo da existência nar-se, bem como a demanda de um determinado
e do grau de relação entre variáveis, tendo por ob- produto e seu preço.
jetivo medir e avaliar o grau de relação existente A análise de correlação fornece um número
entre duas variáveis aleatórias. que resume o grau de relacionamento linear entre
Ao se estudar uma variável o interesse eram as duas variáveis.

8.1 Correlação Linear Simples

Procura medir a relação entre as variáveis X e Y através da disposição dos pontos (X, Y) em torno de
uma reta.

Coeficiente de correlação de Pearson

É o instrumento de medida da correlação linear.

onde:

61
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

n = número de observações e;

Correlação Linear Positiva



A correlação será positiva quando valores crescentes de X estiverem associados a valores cres-
centes de Y ou valores decrescentes de X estiverem associados a valores decrescentes de Y.

Gráfico 8 – Correlação linear positiva (0 < rXY < 1)

Quando todos os pontos pertencerem à reta, a correlação é chamada correlação linear perfeita
positiva e rXY = 1.

Correlação Linear Negativa



A correlação será negativa quando valores crescentes de X estiverem associados a valores de-
crescentes de Y ou valores decrescentes de X estiverem associados a valores crescentes de Y.

Gráfico 9 – Correlação linear negativa (-1 < rxy < 0)

Quando todos os pontos pertencerem à reta, a correlação é chamada correlação linear perfeita
negativa e rxy = -1.

62
Unisa | Educação a Distância | www.unisa.br
Estatística

Correlação nula

A correlação será nula quando não houver relação entre as variáveis X e Y, ou seja, quando as
variações de X e Y ocorrerem independentemente, não existe correlação entre elas.

Gráfico 10 – Correlação nula (rxy = 0)


Atenção

A correlação será tanto mais forte quan-


to mais próximo estiver o resultado de +
1 ou de – 1 e será tanto mais fraca quan-
to mais próximo o resultado estiver de
zero.

Exemplos:

1. Calcular o coeficiente de correlação linear entre as variáveis X e Y, usando os dados da Tabela


17.

Observação: Para maior facilidade, construiremos uma tabela na qual, a partir dos valores de X
e Y, determinaremos todas as somas necessárias (Tabela 18).

Tabela 17 – Dados de X e Y.

Tabela 18 – Somas conforme valores de X e Y.

63
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

A correlação linear entre as variáveis X e Y é positiva, porém baixa.

2. A Tabela 19 mostra os resultados de uma pesquisa com 10 famílias de uma determinada re-
gião.

Tabela 19 – Informações de famílias da região.

Calcular o coeficiente de correlação linear entre Poupança e Número de filhos das dez famílias.

64
Unisa | Educação a Distância | www.unisa.br
Estatística

Tabela 20 – Correção linear entre Poupança e Número de filhos.

A correlação linear entre as variáveis X e Y é forte e negativa, isto é, famílias com poupança alta têm
menor número de filhos.

Saiba mais

Correlação não é o mesmo que causa e efeito. Duas variáveis podem estar altamente correlacionadas e, no entanto, não
haver relação de causa e efeito entre elas.
Se duas variáveis estiverem amarradas por uma relação de causa e efeito elas estarão, obrigatoriamente, correlacionadas.
O estudo de correlação pressupõe que as variáveis X e Y tenham uma distribuição normal.
A palavra simples que compõe o nome correlação linear simples, indica que estão envolvidas no cálculo somente duas
variáveis.

65
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

8.2 Resumo do Capítulo

Prezado(a) aluno(a), neste capítulo, estudamos a correlação e vimos que a correlação procura en-
tender como duas variáveis estão inter-relacionadas do ponto de vista estatístico. Uma das possibilida-
des de se efetuar este estudo é medir a relação entre as variáveis X e Y através da disposição dos pontos
(X, Y) em torno de uma reta.
Vimos também que a correlação será positiva quando valores crescentes de X estiverem associados
a valores crescentes de Y, ou valores decrescentes de X estiverem associados a valores decrescentes de
Y, ou seja, a correlação será positiva quando um atributo tender a aumentar, o outro também tenderá a
aumentar.
A correlação será negativa quando valores crescentes de X estiverem associados a valores decres-
centes de Y ou valores decrescentes de X estiverem associados a valores crescentes de Y, ou seja, quando
um atributo tender a aumentar, o outro tenderá a diminuir.
A correlação será nula quando não houver relação entre as variáveis X e Y, ou seja, quando as va-
riações de X e Y ocorrerem independentemente, não existirá correlação entre elas. Podemos dizer ainda
que, não há um padrão definido de tendência. Também ocorre quando ao aumentar um atributo não há
mudança significativa nos valores do outro atributo.
Para medir a correlação, iremos utilizar o Coeficiente de correlação de Pearson. Este é um índice que
varia de -1 a 1.
Vamos, agora, avaliar a sua aprendizagem.

8.3 Atividades Propostas

1. Seja X ~ N (4 , 1), determine:


a. P (X ≤ 4).
b. P (4 < X < 5).
c. P (2 ≤ X < 5).
d. P (5 ≤ X ≤ 7).
e. P (X ≤ 1).
f. P (0 ≤ X ≤ 2).

2. Para X ~ N (90 , 100), obtenha:


a. P (X ≤ 115).
b. P (X ≥ 80).
c. P (X ≤ 75).
d. P (-10 ≤ X – 90 ≤ 10).
e. O valor de a tal que P (90 – a ≤ X ≤ 90 + a) = γ, γ = 0,95.
66
Unisa | Educação a Distância | www.unisa.br
Estatística

3. Para X ~ N (-5 , 10), calcule:


a. P (-5 < X ≤ -2).
b. P (X + 5 < -2) + P (X + 5 > 2).

4. Uma clínica de emagrecimento recebe pacientes adultos com peso seguindo uma distribui-
ção normal de média 130 kg e desvio padrão 20 kg. Para efeito de determinar o tratamento
mais adequado, os 25% pacientes de menor peso são classificados de “magros”, enquanto os
25% de maior peso de “obesos”. Determine os valores que delimitam cada uma dessas classi-
ficações.

5. Por analogia a produtos similares, o tempo de reação de um novo medicamento pode ser
considerado como tendo distribuição normal com desvio padrão igual a 2 minutos (a média
é desconhecida). Vinte pacientes foram sorteados, receberam o medicamento e tiveram seu
tempo de reação anotado. Os dados foram os seguintes (em minutos): 2,9; 3,4; 3,5; 4,1; 4,6; 4,7;
4,5; 3,8; 5,3; 4,9; 4,8; 5,7; 5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de confiança
para o tempo médio de reação. Use γ = 96%.

6. Uma amostra aleatória de 625 donas de casa revela que 70% delas preferem a marca X de
detergente. Construir um intervalo de confiança para p = proporção das donas de casa que
preferem X com coeficiente de confiança γ = 90%.

7. Um fabricante afirma que seus cigarros contêm não mais que 30 mg de nicotina. Uma amostra
de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg. Construa um intervalo de
confiança para a média populacional μ com coeficiente de confiança γ = 95%.

8. Deseja-se fazer uma pesquisa para saber a aceitação de um novo produto no mercado. Qual é
o número de pessoas que deve ser entrevistado com 7% de erro e 95% de segurança?

9. Deseja-se fazer uma pesquisa junto a uma empresa para saber o interesse dos funcionários
em realizar cursos no exterior. Existem 3 mil funcionários, sendo 1,8 mil com mais de dez anos
de empresa e 1,2 mil com menos. Qual deve ser o tamanho da amostra probabilística estra-
tificada sabendo-se que, em cursos semelhantes, 5% dos funcionários acima de dez anos e
10% dos com menos de dez anos de empresa participaram. Considerar 2% de erro e 95,5% de
segurança.

10. Com relação à Tabela 19, calcule:


a. O coeficiente de correlação linear entre Renda familiar e Poupança.
b. O coeficiente de correlação linear entre Renda familiar e Número de filhos.
c. O coeficiente de correlação linear entre Média dos anos de estudo e Número de filhos.
d. O coeficiente de correlação linear entre Renda familiar e Média dos anos de estudo.

67
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

11. A Tabela 21 mostra o volume de vendas (em 1000 unidades) e os gastos promocionais (em
100000 reais). Calcular a correlação entre as duas variáveis.
Tabela 21 – Volume de vendas e gastos promocionais.

12. Querendo se estimar a média de uma população X com distribuição normal, levantou-se uma
amostra de 100 observações, obtendo-se X = 30 e S = 4. Ao nível de 90%, determinar o limite
de confiança para a verdadeira média da população.

13. Um pesquisador deseja estabelecer o peso médio dos jovens entre 14 e 20 anos. Apesar de
desconhecer a média e o desvio padrão populacional, sabe por literatura da área que a dis-
tribuição dos pesos é aproximadamente normal. Retira-se uma amostra casual simples de 60
jovens, obtendo peso médio de 67 kg e desvio padrão de 9 kg.
a. Ao nível de 5% de significância, estabelecer um IC para o peso médio populacional.
b. Qual o tamanho da amostra que o pesquisador deveria tomar para ter uma probabilidade
de 95% de certeza de cometer um erro de 1,5 kg?

68
Unisa | Educação a Distância | www.unisa.br
Estatística

Tabela 22 – Normal padrão.

69
Unisa | Educação a Distância | www.unisa.br
RESPOSTAS COMENTADAS DAS
ATIVIDADES PROPOSTAS

Capítulo 1

1. Seguindo as regras de arredondamento, é importante sabermos em quantas casas decimais o


número será arredondado. Seguem as respostas:
2,36 = 2,4
3,57 = 3,6
4,62 = 4,6
8,81 = 8,8
4,451 = 4,5
5,501 = 5,6
5,55 = 5,6
5,650 = 5,6

2.
a. 23,4; 48,9; 120,4; 234,8; 78,8; 130,0; 45,1; 12,4; 200,0
b. 46,73; 253,65; 28,26; 123,84; 299,95; 37,48
c. 27; 68; 128; 50; 68; 39
d. 40; 270; 300; 60; 260; 300; 450; 260; 3000

71
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

Capítulo 2

1. Tabela de Frequência para a Variável Idade (extraída da Tabela 1)

Tabela 23 – Variável idade.

Idade: variável quantitativa discreta.

Observe, através da fac, que 90% dos alunos têm idades até 21 anos.

2.
a. População: 1.000 alunos matriculados.
b. Amostragem aleatória simples; Amostra: 150 alunos sorteados.

3. Considerando que 200 elementos representam 13% da população temos que:


A: 65; B: 32; C: 57; D: 46;

Obs.: Arredondamos para baixo o valor do último item para a soma dar 200, pois se utilizásse-
mos o critério de arredondamento visto, teríamos 201 elementos na amostra.

4.
a. População: pessoas de 20 anos
b. Observe que temos 11.500 pessoas na população em estudo. As 5.500 mulheres representam
47,8% da população com 20 anos e os 6.000 homens representam 52,2% da população com
20 anos. Dessa forma, calculando a quantidade de homens e mulheres de acordo as propor-
ções acima descritas e arredondando os dados conforme os critérios estabelecidos, temos: M:
574; H: 626.

72
Unisa | Educação a Distância | www.unisa.br
Estatística

5.
a. PM: 350; 450; 550; 650; 750; 850; 950; 1050; 1150
fac: 14; 60; 118; 194; 262; 324; 372; 394; 400
fi: 0,04; 0,11; 0,14; 0,19; 0,17; 0,16; 0,12; 0,05; 0,02
fi . 100%: 4; 11; 14; 19; 17; 16; 12; 5; 2

b. 100 horas; c. li = 500; d. ls = 1100; e. PM = 750; f. fi = 0,16; g. 15%; h. 19%

Capítulo 3

1.
a. Qualitativa nominal; Quantitativa contínua; Quantitativa discreta; Qualitativa nominal.
b. Quantitativa discreta; Quantitativa discreta; Qualitativa ordinal; Qualitativa ordinal.
c. Sim, como quantitativa contínua, pois existe um número grande de valores diferentes. Su-
gestão: iniciar em 0, com amplitude de classe igual a 2.
d. Setores; Histograma e Polígono de frequência; Colunas; Setores; Colunas ou Histograma e
Polígono de frequências; Colunas; Setores ou Colunas; Setores ou Colunas.

2.
a. Fisioterapia: quantitativa discreta;
Sequelas: qualitativa nominal;
Cirurgia: qualitativa ordinal.
b. Fisioterapia: gráfico de colunas;
Sequelas: gráfico de setores;
Cirurgia: gráfico de colunas;
c. Gráfico de colunas.
O número de meses de Fisioterapia diminuiu para os pacientes sem sequelas.

4. b. 34%

Capítulo 4

1. Média: 1,56; Mediana: 2; Moda:1 e 2.

2.
a. Média: 1,88; Mediana:1,8; Moda: 1,5.
c. Média: 1,93; Mediana:1,8; Moda:1,6 e 1,8. As diferenças não foram grandes. A solução (a)
é mais exata.
d. O de (c), pois, sem o computador, é praticamente impossível organizar 500 dados brutos.

73
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

3. Média: 86,20 bat/min; Variância: 16,36 (bat/min)2; Desvio padrão: 4,04 bat/min.

4. Média: 9,85; Variância: 1,88; Desvio padrão: 1,37.

5. Não, porque a zona de normalidade está entre 155 cm e 195 cm.

6.
a. B, pois o desvio padrão é menor.
b. É considerada normal em A, pois a zona de normalidade está entre 35 e 55. Em B, não, pois
a zona de normalidade está entre 41,5 e 48,5.

7. a. Média: 21,9; b. Desvio Padrão:6,34; c. Zona de normalidade: 15,56 a 28,24; d. Sim, pois 28
está dentro da zona de normalidade.
8. Não, pois está fora da zona de normalidade.

Capítulo 5

1. a. Números de casos possíveis de E = 5


Múltiplos de 9 entre 1 e 50: (9,18,27,36,45)
Números de resultados possíveis na experiência: 50
Logo: P(E) =

b. Múltiplos de 3 e de 4 (simultaneamente, ao mesmo tempo), implica ser múltiplo de 12, pois


12 é o m.m.c. (menor múltiplo comum) entre 3 e 4.

Números de casos possíveis de E = 4


Múltiplos de 12 entre 1 e 50: (12, 24, 36, 48)
Logo: P(E) =

c) Observe a diferença entre este item e o anterior. Ambos se diferenciam pela partícula OU.

Ser múltiplo de 3 ou de 4 significa que “servem” todos os múltiplos de 3 OU todos os múltiplos
de 4. Observe que nesta situação, não há a necessidade de serem múltiplos simultaneamente.
Atendendo a uma das condições (ser múltiplo de 3 ou de 4 ) será suficiente.

Então temos:

Múltiplos de 3 entre 1 e 50: (3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48)

74
Unisa | Educação a Distância | www.unisa.br
Estatística

Múltiplos de 4 entre 1 e 50: (4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48)

Números de casos possíveis de E = 25 (Observe para não contar os valores em negrito duas
vezes)

Logo: P(E) =

d) Números primos (números que possuem apenas dois divisores, 1 e ele mesmo) entre 1 e 50:
(2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47)

Números de casos possíveis de E = 15

Logo: P(E) =

2. Observe que inicialmente temos na caixa, um total de 200 peças

Então temos

a) P(E) =

b) P(E) =

c) P(E) =

Capítulo 6
1. Resolução:
Variável X: altura, com X ~N ( 170, 25 ); μ = 170 cm e σ² = 25.
a −µ b−µ
P ( a ≤ X ≤ b) = P ( ≤Z≤ )
σ σ

165 − 170 170 − 170


a. P ( 165 < X < 170 ) = P ( <Z< ) = P ( -1< Z < 0 ) (na tabela não exis-
5 5
tem valores negativos; pela simetria da curva normal, a área representada por P ( -1 < Z
< 0 ) é igual à área representada por P ( 0 < Z < 1 ) = 0,3413 (Tabela da Normal Reduzida)
∴ P ( 165 < X < 170 ) = 34,13%.

165 − 170 180 − 170


b. P ( 165 < X < 180 ) = P ( <Z< ) = P ( -1 < Z < 2 ) = P ( -1 < Z < 0 ) +
5 5
P (0 < Z < 2 ) = P (0 < Z < 1 ) + P ( 0 < Z < 2 ) (Tabela da Normal Reduzida) = 0,3413 + 0,4772
= 0,8185 ∴ P ( 165 < X < 180 ) = 81,85%.

75
Unisa | Educação a Distância | www.unisa.br
Regina Maria Sigolo Bernardinelli

168 − 170 185 − 170


c. P ( 168 < X < 185 ) = P ( <Z< ) = P ( - 0,4 < Z < 3 ) = P (- 0,4 < Z < 0 )
5 5
+ P ( 0 < Z < 3 ) = P ( 0 < Z < 0,4 ) + P ( 0 < Z < 3 ) (Tabela da Normal Reduzida) = 0,1554 +
0,4987 = 0,6541 ∴ P ( 168 < X < 185 ) = 65,41%

160 − 170
d. P ( X < 160 ) = P ( Z < ) = P ( Z < - 2 ) = P ( Z > 2 ) (pela simetria da Normal)
5
P ( Z > 2 ) = 0,5 – P ( 0 < Z < 2 ) = 0,5 – 0,4772 = 0,0228 ∴ P ( X < 160 ) =2,28%

180 − 170
e. P ( X > 180 ) = P ( Z > ) = P ( Z > 2 ) = 0,5 – P ( 0 < Z < 2 ) = 0,5 – 0,4772 = 0,0228
5
∴ P ( X > 180 ) = 2,28%

165 − 170
f. P ( X > 165 ) = P ( Z > ) = P ( Z > - 1 ) = P ( Z < 1 ) (pela simetria da Normal)
5
P ( Z < 1 ) = 0,5 + P ( 0 < Z < 1 ) = 0,5 + 0,3413 = 0,8413 ∴ P ( X > 165 ) = 84,13%.

Como são 10.000 alunos, teremos: 10000 . 0,8413 = 8413 alunos é o número esperado de
alunos com altura superior a 165 cm.

2. Conseguiram responder? A seguir temos duas explicações.

Na Escala de Z, 2σ significa dois desvios padrões a partir da média (0+ 2σ= 2σ); na Escala de X,
esse deslocamento é análogo (75+2*6=87).
Outra forma de relacionar esses valores é através da fórmula de transformação apresentada
anteriormente:

3. Como proceder?

Transformar as variáveis X em variáveis normais padronizadas Z:


Logo, temos a probabilidade P(0≤Z≤1), que é ilustrada a seguir e cujo valor é determinado
consultando a tabela a seguir:

76
Unisa | Educação a Distância | www.unisa.br
Estatística

Consultando a tabela, encontramos o valor da área indicada, que significa a


probabilidade P(75≤X≤81)=P(0≤Z≤1)=0,3413
Consultando a tabela,
Esse resultado encontramos
nos informa que háo probabilidade
valor da área de
indicada,
0,3413 que significa
de um a probabilidade
trabalhador levar um
P(75≤X≤81)=P(0≤Z≤1)=0,3413
tempo entre 75 e 81 segundos para montar uma peça.
Esse resultado nos informa que há probabilidade de 0,3413 de um trabalhador levar um tempo
Outra interpretação é que 34,13% dos trabalhadores levarão um tempo dentro do
entre 75 e 81 segundos para montar uma peça.
intervalo
Outra de 75 eé81
interpretação quesegundos.
34,13% dos trabalhadores levarão um tempo dentro do intervalo de
75 e 81 segundos.

Capítulo 7
Capítulo 7

1. Vamos, inicialmente, determinar a média e a variância amostrais. Temos: n = 150


1) Vamos, inicialmente, determinar a média e a variância amostrais. Temos: n = 150
Q 
¦ [L ¦ [L 
L  L 
;  FP
Q  
Q 
¦ [ L  ¦ [ L 
 Q      
6 ^¦ [ L  L 
` ^ ¦ [ L  L  ` ^  ` 
 Q  L  Q    L     

?6 6   FP
J
1 – γ = 2% = 0,02 Ÿ J  Ÿ  (localizamos este valor no corpo da tabela da

normal padrão e encontramos o valor de ] J  )


6 
V; 
Q 

IC (μ , γ ) = [ ;  ] J  V ;  ;  ] J  V ; @
 

IC (μ , 98%) = [172 – 2,32 . 0,33 ; 172 + 2,32 . 0,33]


IC (μ , 98%) = [171,23 cm ; 172,77 cm] = [1,71 m ; 1,73 m] 77
Unisa | Educação a Distância | www.unisa.br
Logo, podemos afirmar com uma certeza de 98% que, apesar de os parâmetros
IC (μ , γ ) = [ ;  ] J  V ;  ;  ] J  V ; @
 
Regina MariaICSigolo ) = [ ;  ] J  V;  ;  ] J  V; @
(μ , γBernardinelli
IC (μ , 98%) = [172 – 2,32 . 0,33 ;172 + 2,32 . 0,33]
IC (μ , 98%) = [171,23
[172 – 2,32
cm .; 0,33 ; 172
172,77 cm]+ =2,32 . 0,33]
[1,71 m ; 1,73 m]
IC (μ , 98%)
Logo, = [171,23
podemos cm ; 172,77
afirmar com cm]
uma= [1,71 m ; 1,73
certeza m] que, apesar de os parâmetros
de 98%
Logo, podemos
populacionais afirmar
serem com uma certeza
desconhecidos, a alturademédia
98% dos
que, homens
apesar de os cidade
dessa parâmetros
está
populacionais entre
compreendida serem1,71m
desconhecidos,
e 1,73 m. a altura média dos homens dessa cidade está
compreendida entre 1,71m e 1,73 m.
2) Seguindo o roteiro sugerido:
2. Seguindo o roteiro sugerido:
2) Seguindo o roteiro sugerido:
Já calculada, média da amostra = $ 3542
Já calculada, média da amostra = $ 3542
Cálculo do erro-padrão (desvio padrão) da distribuição das médias.
Cálculo do erro-padrão (desvio padrão) da distribuição das médias.
Erro-padrão = 46,06
Erro-padrão = 46,06

Nível de Confiança = 68,26%


Nível de Confiança = 68,26%
A distribuição do exemplo irá se comportar como uma normal. É possível dizer isso devido
A distribuição
ao do exemplo
Teorema Central irá que
do Limite se comportar
estabelececomo
n > 30uma
paranormal. É possível
isso. Portanto, dizer
será isso devido
determinado o
ao Teorema
valor Central
de z para do Limite que estabelece n > 30 para isso. Portanto, será determinado o
esse intervalo.
valor de z para esse intervalo.
O valor de z para esse intervalo será determinado utilizando na tabela como valor de área

O valor(=0,6826÷2).
0,3413 de z para esse intervalo será determinado utilizando na tabela como valor de área
0,3413 (=0,6826÷2).
Isso dará z = 1.

IC = 3542 – 1 x 46,06 < μ < 3542 + 1 x 46,06

IC = (3495,94 < μ < 3588,06)

O intervalo de confiança aumentará as chances de acerto dos valores de estimativas


populacionais. São como coeficientes de segurança para as estimativas.

3) O intervalo de confiança para μ. é dado por:

78
Unisa | Educação a Distância | www.unisa.br
Estatística
3) O intervalo de confiança para μ. é dado por:
3. O intervalo de confiança para μ é dado por:

Capítulo 8
Capítulo 8
1. a. 0,5000; b. 0,3413; c. 0,8185; d. 0,1574; e. 0,0013; f. 0,0228.
1) a) 0,5000; b) 0,3413; c) 0,8185; d) 0,1574; e) 0,0013; f) 0,0228.
2. a. 0,9938; b. 0,8413; c. 0,0668; d. 0,6826; e. 19,6.

2)3. a. 0,3289;b) b.
a) 0,9938; 0,5286.c) 0,0668; d) 0,6826; e) 19,6.
0,8413;

4. Magros: 116,6 kg; Obesos: 143,4 kg.


3) a) 0,3289; b) 0,5286.
5. Média: 4,745; [ 3,828; 5,662 ].

6. [ 0,677; 0,732 ].
4) Magros: 116,6 kg; Obesos: 143,4 kg.
7. IC (μ, 95%) = [ 30,26 ; 32,74 ].

5)8. 196. 4,745; [ 3,828; 5,662 ].


Média:

9. 377; 515.
6) [ 0,677; 0,732 ].
10. a. 0,9835; b. -0,7586; c. -0,736; d. 0,947.

 11. 0,9817.

12. IC (μ, 90%) = [29,34; 30,66].

13. a. IC (μ, 95%) = [64,723; 69,278]; b. n = 139.

79
Unisa | Educação a Distância | www.unisa.br
REFERÊNCIAS

BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 4. ed. São Paulo: Atual, 1987.

CARVALHO, L. R. Apostila de bioestatística. Botucatu: UNESP, 2000.

MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Edusp, 2004.

MORETTIN, L. G. Estatística básica: inferência. São Paulo: Pearson Makron Books, 2000. v. 2.

NAZARETH, H. R. S. Curso básico de estatística. 4. ed. São Paulo: Ática, 1991.

TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2. ed. São Paulo: Atlas, 1985.

81
Unisa | Educação a Distância | www.unisa.br

Você também pode gostar