Você está na página 1de 70

CURSO SUPERIOR DE TECNOLOGIA:

BANCO DE DADOS
REDES DE COMPUTADORES
SISTEMAS BIOMÉDICOS

3º Semestre

ESTATÍSTICA

FATEC - FACULDADE DE TECNOLOGIA DE BAURU (www.fatecbauru.edu.br)


Rua Manoel Bento Cruz, 3-30 – Centro – Bauru/SP – CEP 17015-171 – Fone: (14)3223-2083
Fatec Bauru 2

Sumário
Sumário .................................................................................................................... 2
Apresentação ............................................................................................................. 4
O que é Estatística? .................................................................................................4
Introdução à Estatística .............................................................................................. 5
Conceito de Dados ...................................................................................................5
Conceito de Variável.................................................................................................5
Conceito de População e Amostra ................................................................................7
Exercícios ..............................................................................................................8
Distribuição de Frequências ........................................................................................ 10
Introdução ........................................................................................................... 10
Outros tipos de frequência ....................................................................................... 13
Exercícios ............................................................................................................ 14
Representação gráfica de uma Distribuição de Frequências ............................................. 16
Exercícios ............................................................................................................ 19
Medidas de Tendência Central ..................................................................................... 21
Introdução ........................................................................................................... 21
Média Aritmética ................................................................................................... 21
Moda .................................................................................................................. 23
Mediana.............................................................................................................. 24
Separatrizes ......................................................................................................... 27
Quartis ............................................................................................................... 27
Percentis ............................................................................................................. 29
Exercícios ............................................................................................................ 30
Comparando Média e Mediana ................................................................................. 32
Medidas de Dispersão ................................................................................................. 33
Introdução ........................................................................................................... 33
Amplitude total ..................................................................................................... 33
Variância ............................................................................................................ 33
Desvio Padrão ...................................................................................................... 34
Coeficiente de Variação ........................................................................................... 36
Exercícios ............................................................................................................ 37
Exercícios Complementares ...................................................................................... 39
Noções de Probabilidade ............................................................................................. 43
Introdução ........................................................................................................... 43
Conceito de Probabilidade ....................................................................................... 44
Exercícios ............................................................................................................ 46
Teorema da Soma de Probabilidades .......................................................................... 48
Teorema da Multiplicação de Probabilidades ................................................................ 50
Exercícios ............................................................................................................ 51
Distribuições de Probabilidade .................................................................................. 54
Distribuição Normal ................................................................................................... 56
Introdução ........................................................................................................... 56
Exercícios ............................................................................................................ 59
Teste de Hipóteses .................................................................................................... 60

Estatística (versão 2022a) MODESTO, Marco Antonio


3 Fatec Bauru

Introdução ........................................................................................................... 60
Hipótese Estatística ............................................................................................... 60
Tipos de Hipóteses................................................................................................. 60
Teste de Hipótese .................................................................................................. 61
Exercícios ............................................................................................................ 64
Exercícios Complementares ...................................................................................... 66
Formulário para Avaliações ......................................................................................... 68
Referências Bibliográficas ........................................................................................... 70

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 4

Apresentação

O que é Estatística?
Desde a antiguidade os governos mais esclarecidos faziam levantamento de dados
com a finalidade de administrar melhor o Estado. O Estado tinha interesse em registrar seu
patrimônio e também registrar o número de habitantes, de nascimentos, de óbitos etc. Os
recenseamentos antigos, como os mencionados na Bíblia, não passavam de anotações
militares, referentes à baixa de soldados, armas e cavalos com o objetivo de organizar o
exército para novas conquistas e administrar as terras conquistadas.

Na Idade Média colhiam-se informações, geralmente com finalidades tributárias. A


partir do século XVI surgem as primeiras análises sistemáticas de fatos sociais, como
batizados, casamentos etc., originando as primeiras tabulas e tabelas. Nos estudos
demográficos realizados no início do século XVII são dados os primeiros passos para tornar
a Estatística uma disciplina autônoma. E, a partir do século XVIII o estudo de tais fatos vai
ganhando, aos poucos, feição científica.

O termo Estatística surge da expressão em latim statisticum collegium (palestra


sobre os assuntos do Estado), de onde surgiu a palavra statista, que significa “homem de
estado”, ou político, e a palavra alemã Statistik, designando a análise de dados sobre o
Estado. A palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na
Universidade de Jena e adotada pelo acadêmico alemão Gottfried Achenwall.

Uma definição mais usual nos dias de hoje seria “um método científico que permite
a análise, em bases probabilísticas, de dados coligados e condensados”. De forma geral,
trata-se de um ramo da Matemática Aplicada, uma metodologia, uma técnica científica,
adotada para se trabalhar com dados, ou seja, com elementos de pesquisa. Esta
metodologia consiste em uma série de etapas, iniciando pela coleta dos dados que, após
coletadas, passarão por uma organização e apresentação. Daí, uma fase complementar, na
qual se dará a análise dos dados organizados e descritos, para se chegar a uma conclusão,
que deverá desencadear uma tomada de decisão.

A Estatística está dividida em duas partes: Estatística Descritiva (ou Dedutiva)


encarregada dos primeiros passos do processo estatístico: a coleta, a organização e a
descrição (ou apresentação) dos dados e a Estatística Indutiva responsável pelas etapas
finais do processo estatístico: a análise e a tomada de decisões. É a parte mais profunda,
mais elaborada, enfim, mais complexa da Estatística.

Estatística (versão 2022a) MODESTO, Marco Antonio


5 Fatec Bauru

Introdução à Estatística

Vamos iniciar este curso, nem poderia ser de outra forma, alicerçando os pilares da
Estatística, transmitindo alguns conceitos, algumas noções básicas, elementares e, muitas
delas, essenciais ao desenrolar dos demais tópicos do programa do curso. Passemos aos
conceitos iniciais.

Conceito de Dados
Os dados são fatos e números coletados, analisados e sintetizados para
representação e interpretação. Juntos são denominados conjunto de dados para o estudo.
Os dados podem ser: qualitativos (quando os valores são expressos por uma qualidade ou
atributo, por exemplo: sexo, estado civil, marcas de carro etc.) ou quantitativos (quando os
valores são expressos por números, por exemplo: idades, notas de avaliação, medidas etc.).

A coleta destes dados pode ser feita de forma direta (quando é feita sobre elementos
informativos de registros obrigatórios como: nascimentos, casamentos, notas fiscais etc.) ou
de forma indireta (quando é feita através de dados já colhidos por uma coleta direta, como
uma pesquisa sobre a duração de vida do ser humano, que pode ser feita com os dados
obtidos pelos cartórios).

A coleta direta pode ser classifica quanto ao fator tempo em: contínua (quanto feita
continuamente, como a de nascimentos, óbitos), periódica (quando feita em intervalos
constantes de tempo, como os censos, balanço de uma empresa) e ocasional (quando feita
esporadicamente, sem época pré-estabelecida, a fim de atender uma conjuntura ou
emergência, como no caso de epidemias).

Conceito de Variável
Variável é a característica de interesse que é medida em cada elemento da amostra
ou da população. Como o nome diz, seus valores variam de elemento para elemento. É o
objeto da pesquisa. É aquilo que estamos investigando. Portanto o objeto da pesquisa, do
estudo estatístico, será pois, a variável.

As variáveis podem ter valores numéricos ou não numéricos.

As variáveis podem ser quantitativas (discretas ou contínuas) e qualitativas


(nominais ou ordinais).

Veja o esquema a seguir:

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 6

1. Variável Quantitativa: é aquela característica que pode ser medida em uma


escala quantitativa (número), ou seja, apresenta valores numéricos (quantidades) que fazem
sentido.

1.1 Variável Discreta: apresentam características mensuráveis que não


podem assumir qualquer valor, dentro de um intervalo de resultados possíveis, só
podem assumir valores inteiros. Geralmente são o resultado de contagens. Exemplo:
número de filhos de um casal, número de cigarros fumados em um dia, número de
livros existentes na Biblioteca da Fatec Bauru.

1.2. Variável Contínua: apresentam características mensuráveis que


assumem valores quaisquer num intervalo de observação, ou numa escala contínua
(na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser
medidas através de algum instrumento. Exemplo: peso (balança), altura (régua),
tempo (relógio), pressão arterial, idade.

2. Variável Qualitativa (ou categóricas): é aquela característica que não possuem


valores quantitativos, mas, ao contrário, são definidas por várias categorias ou atributos,
ou seja, representam uma classificação dos indivíduos.

2.1. Variável Nominal: apresentam características de tal forma que não


possamos verificar uma ordem ou uma hierarquia entre as categorias. Exemplo:
religião, raça, sexo, cor dos olhos.

2.2. Variável Ordinal: apresentam características de tal forma que se possa


verificar uma ordenação/hierarquia entre as categorias. Exemplo: grau de
escolaridade, cargos ocupados numa organização, meses do ano.

Porém na prática, as distinções são menos rígidas do que a descrição acima


apresentada. Há situações em que uma variável originalmente quantitativa pode ser
coletada de forma qualitativa. Exemplo: a variável idade, medida em anos completos, é
quantitativa contínua, mas se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos
etc.) é qualitativa ordinal. Outro exemplo é o peso dos lutadores de boxe, uma variável
Estatística (versão 2022a) MODESTO, Marco Antonio
7 Fatec Bauru

quantitativa contínua se trabalhamos com o valor obtido na balança, mas qualitativa


ordinal se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado etc.).

Outro ponto importante é que nem sempre uma variável representada por números é
quantitativa. O número do telefone de uma pessoa, o número da casa, o número do seu
CPF. Às vezes o sexo do indivíduo é registrado numa planilha de dados como 1 (homem) e
2(mulher), por exemplo. Isto não significa que a variável sexo passou a ser quantitativa.

Conceito de População e Amostra


Vimos que o objetivo da Estatística é estudar os fenômenos coletivos. Os fenômenos
coletivos estão associados à população. População, também chamada de conjunto universo
é aquele conjunto do qual desejamos extrair a informação (os dados), e cujos elementos
têm, pelo menos, uma característica comum, a qual está inserida no contexto daquilo que
desejamos analisar, ou seja, é o conjunto de todos os elementos envolvidos no fenômeno a
ser estudado.

Já amostra é um conjunto dos elementos


da população escolhidos para a realização do
estudo. Por exemplo: queremos obter informações
sobre a audiência de certo programa de televisão na
cidade de São Paulo. A população é o conjunto de
todos os domicílios de São Paulo que possuem
televisão; a amostra é o conjunto dos domicílios que
serão visitados.

A palavra censo (ou recenseamento) é utilizada para descrever a coleta de dados de


uma população completa, ou seja, o censo é o tipo de estudo estatístico que abrange todos
os elementos da população. Já a palavra pesquisa (ou levantamento) descreve a coleta de
dados a partir de uma amostra retirada de uma população.

Quanto ao tamanho da amostra é importante mencionar que quanto maior o


tamanho da amostra, mais precisas são as informações sobre a população. É necessário
escolher, no mínimo, 10% do número total dos elementos da população.

Chamamos de amostragem o conjunto de técnicas utilizadas para a seleção de uma


amostra. Essa técnica pode ser subdividida em dois grupos: amostragem não aleatória e
amostragem aleatória.

Uma amostragem não aleatória pode ser intencional (quando o pesquisador


selecionar intencionalmente os componentes da amostra) e voluntária (quando o
componente da população se oferece voluntariamente para participar da amostra
independente do julgamento do pesquisador). Já uma amostragem aleatória pode ser
simples (sorteia-se para o estudo pelo menos 10% dos elementos da população) e

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 8

estratificada proporcional (recomenda quando existe uma divisão natural da população em


grupos com número de elementos diversos).

Exercícios
[1] Assinale a alternativa que apresenta o conceito de variável quantitativa discreta:

(a) É aquela que expressa uma medida como um valor real, por exemplo, peso e altura

(b) É aquela que separa os indivíduos em casses como uma determinada ordem, por
exemplo, nível de escolaridade: fundamental, médio e superior

(c) É aquela que expressa o valor de uma contagem, por exemplo, quantidade de televisores
numa casa, quantidade de habitantes de uma cidade

(d) É aquela que separa os indivíduos em classes, porém não é possível estabelecer uma
ordem, por exemplo: sexo (masculino e feminino) e esporte praticado (futebol, basquete,
vôlei, ...)

[2] Considere as seguintes variáveis:

I. Tamanho de um objeto (pequeno, médio ou grande)

II. Volume de água em um reservatório

III. Número de clientes numa fila

IV. Número da seção eleitoral onde você vota

V. Comprimento de um inseto

VI. Classe Social

Com relação à classificação dos dados requeridos como variáveis de pesquisa, é correto
afirmar que:

(a) as variáveis I, IV e VI são qualitativas

(b) as variáveis III e V são quantitativas contínuas

(c) as variáveis II e III são quantitativas discretas

(d) a variável IV é qualitativa ordinal

[3] Indique em cada um dos casos abaixo, se a variável é quantitativa Discreta (D),
quantitativa Contínua (C), qualitativa Nominal (N) ou qualitativa Ordinal (O):

(a) [ ___ ] Meses do ano para observação do consumo de energia elétrica numa empresa

Estatística (versão 2022a) MODESTO, Marco Antonio


9 Fatec Bauru

(b) [ ___ ] As temperaturas registradas num certo dia em uma cidade do Paraná

(c) [ ___ ] Número de pacientes atendidos mensalmente numa Instituição Hospitalar

(d) [ ___ ] Nacionalidade das pessoas que passam diariamente no Aeroporto de Guarulhos

(e) [ ___ ] Diâmetro interno de uma tubulação de gás

(f) [ ___ ] Avaliação (ótimo, bom, regular, ruim) do desempenho do Presidente da República

(g) [ ___ ] Cor dos cabelos dos alunos matriculados nos cursos da Fatec Bauru

(h) [ ___ ] Número de coroas obtidas no lançamento de uma moeda duzentas vezes

(i) [ ___ ] Estágio da doença (inicial, intermediário, terminal) de um paciente

(j) [ ___ ] Número de ações negociadas num dia na B3 : Bolsa de Valores de São Paulo

[4] Uma população encontra-se dividida em três estratos, com tamanhos 40, 100 e 60.
Sabendo-se que nove elementos foram retirados do terceiro estrato em uma amostragem
estratificada, determine o número total de elementos dessa amostra.

[5] Num levantamento feito numa Instituição de Ensino sobre os alunos regularmente
matriculados nos quatro primeiros semestres de um determinado curso estão apresentados
na Tabela abaixo. Obtenha uma amostra proporcional estratificada de 125 alunos para
responder a uma pesquisa:

“Muitas decisões são tomadas com base em informações numéricas, no entanto,


os números não “falam por si mesmos”. Precisam ser organizados, discutidos e
interpretados”

“A Estatística tem por objetivo fornecer métodos e técnicas para lidarmos,


racionalmente, com situações sujeitas a incertezas”

“É fácil mentir com a Estatística, difícil é dizer a verdade sem ela”

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 10

Distribuição de Frequências

Introdução
Para atingir os objetivos da Estatística Descritiva, os dados observados são muitas
vezes sintetizados e apresentados em formas de Tabelas, as quais irão fornecer rápidas e
seguras informações a respeito das variáveis em estudo. Uma das tabelas mais utilizadas
na Estatística é a Distribuição de Frequências.

Numa Distribuição de Frequências a variável estudada é única, contudo, esta


mesma variável pode estar subdivida em classes. Vejamos os tipos de Distribuições de
Frequências que temos:

1. Distribuição de Frequência sem intervalo de classes: utilizada quando a


variável em questão apresenta um número relativamente pequeno de valores.

Exemplo 1: um dado é lançado quarenta vezes e os resultados registrados foram os


seguintes:

65264362516351363435
54162522351562645213
Então, temos:

2. Distribuição de Frequência com intervalo de classes: utilizada quando a


variável em questão apresenta um número muito grande de valores.

Exemplo 2: certo grupo de biólogos está realizando uma pesquisa sobre o


desenvolvimento de determinada espécie de peixe em um rio local. Nessa pesquisa foi
medido o comprimento, em milímetros, de 80 peixes. No quadro abaixo, estão os dados
obtidos por esses biólogos.

Estatística (versão 2022a) MODESTO, Marco Antonio


11 Fatec Bauru

Observe que os valores das medidas não estão ordenados, isto é, não estão
colocados em ordem crescente ou decrescente e por isso são chamados dados brutos.

A ordenação dos dados brutos chama-se rol. Portanto, vamos organizar esses dados
em ordem crescente a fim de facilitar a comparação entre eles:

Para elaborar a Distribuição de Frequências com os dados desta tabela precisamos


enunciar alguns conceitos:

1. Amplitude total: chama-se Amplitude Total (AT) dos dados a diferença entre o
maior e o menor valor da variável. A amplitude total mostra o campo de variação dos
valores observados da variável em estudo.

2. Classe ou Intervalos de classe: para sintetizar os dados coletados de uma


variável agrupamos esse conjunto de dados em subconjuntos, chamados de classe ou
intervalos de classe. O número de classes (k) a ser utilizado numa distribuição de
frequência depende da experiência do pesquisador e do interesse da variável em estudo,
portanto, não há uma regra definida obrigatória para esta escolha.

Alguns estatísticos recomendam regras para o cálculo do número adequado de


classes. Entre estas regras, destacamos:

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 12

►Fórmula de Struges: número elementos amostra

k = 1 + 3,322 . log n

Iremos adotar a fórmula de Struges para determinar o número de classes,


considerando sempre o inteiro acima do valor calculado, no caso em que o valor de k não
tenha dado um número inteiro.

3. Intervalo de classes (h): é a extensão de cada classe. Para determinar a


amplitude do intervalo de cada classe usamos a seguinte fórmula:

AT
h=
k

Representamos por o intervalo de cada classe. Por exemplo: 120 135 é


intervalo de classe que compreende todos os valores entre 120 (inclusive) e 135 (exclusive).

Em seguida, montamos os intervalos de classes, dispondo numa tabela, colocando

na próxima coluna a frequência absoluta1 (f i ) :

Este arranjo ou organização dos dados brutos em classes, juntamente com as suas
respectivas frequências, ou seja, com o número de elementos do conjunto que está inserido
em cada classe, configura-se na chamada Distribuição de Frequências com intervalo de
classes.

1 Frequência absoluta ou simplesmente frequência (fi ) informa apenas a quantidade de


vezes que o valor de uma variável numa pesquisa ocorre, sendo normalmente um dado preliminar de
uma investigação.
Estatística (versão 2022a) MODESTO, Marco Antonio
13 Fatec Bauru

Outros tipos de frequência


Já falamos sobre a frequência absoluta. Podemos completar a Tabela de

Distribuição de frequências, com a frequência acumulada (Fi ) , a qual fornece a soma das
frequências absolutas até determinado dado. A frequência acumulada é utilizada em
variáveis cujos valores apresentam uma ordenação natural, ou seja, as variáveis
qualitativas ordinais e as quantitativas em geral.

É possível também obter a razão que a frequência absoluta representa em relação

ao número total de observações. Essa razão é denominada de frequência relativa (fri ) e


seus valores são expressos em geral na forma de porcentagem.

A frequência relativa é calculada por meio da razão entre a frequência absoluta (f i )

fi
e o número total de observações (n) , isto é: fri = .
n

Temos ainda a frequência acumulada relativa (Fri ) que corresponde à proporção

Fi
da frequência acumulada em relação ao total da absoluta, isto é: Fri = .
n
Com estas novas definições, podemos completar nossa Distribuição de frequências.

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 14

Exercícios

[1] Numa sala com 100 alunos, foi feita uma pesquisa para determinar a altura destes
alunos. Para tanto, perguntou-se a cada um deles, um a um, qual a sua estatura. Os
resultados obtidos nessa pesquisa (dados brutos) estão abaixo. Elabore uma Distribuição
de frequência (completa):

[2] Uma empresa de RH fez uma entrevista para a seleção de candidatos a algumas vagas
de emprego. Ao todo foram entrevistados 280 candidatos, dos quais 20 foram separados
aleatoriamente e indicados na tabela a seguir:

(a) Podemos verificar que a população é composta de _______ candidatos e a amostra desses
candidatos é composta de _______ pessoas.

(b) Escolha a variável “idade” e elabore uma tabela de Distribuição de frequências.

Estatística (versão 2022a) MODESTO, Marco Antonio


15 Fatec Bauru

[3] Complete a Distribuição de frequências a seguir que apresenta os salários de sessenta


funcionários de uma empresa:

(a) quantos funcionários recebem R$ 1.400,00 ou mais?

(b) que porcentagem dos funcionários recebe menos de R$ 2.600,00?

(c) quantos funcionários recebem salário igual ou superior a R$ 1.000,00 e menor do que
R$ 2.600,00?

[4] As notas obtidas por 40 alunos de uma turma em certa disciplina estão registradas a
seguir:

Construa uma tabela de distribuição de frequência, agrupando a variável “nota” em seis

classes, sendo a primeira classe. Determine o número de alunos que obtiveram


nota inferior a 79; a porcentagem dos alunos que obtiveram nota superior ou igual a 59.

[5] A tabela abaixo mostra o consumo de energia elétrica em kWh de 60 usuários:

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 16

(a) monte a Distribuição de frequências considerando h = 20 kWh e o limite inferior da


primeira classe igual à zero;

(b) quantos usuários consumiram menos de 80 kWh?

(c) qual a porcentagem de usuários que consumiram de 40 a 60 kWh exclusive?

Representação gráfica de uma Distribuição de


Frequências
Em muitos casos, analisar dados é uma tarefa árdua e cansativa e em algumas
situações se faz necessário uma representação que facilite este processo. Podemos, assim,
recorrer aos gráficos, permitindo para quem analisa uma informação direta e objetiva do
fenômeno estudado. Um primeiro tipo de gráfico que estudaremos é o gráfico de hastes ou
bastões, destinado para representar dados não agrupados em classes, podendo ser
construído utilizando-se indistintamente as frequências absolutas ou as frequências
relativas. Exemplo: seja a seguinte Distribuição de Frequências:

Estatística (versão 2022a) MODESTO, Marco Antonio


17 Fatec Bauru

Se tivermos uma Distribuição de Frequências com intervalos de classes podemos


fazer a representação gráfica através de um Histograma.

Num histograma, as classes são representadas por retângulos (um para cada classe)
dispostos vertical e contiguamente (sem espaço entre eles) e cujas bases serão
determinadas pelos limites destas classes (limites inferior e superior) e as alturas
determinadas pelas frequências de cada classe.

A área total do histograma deve ser 1 ou 100%.

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 18

Se conectarmos todos os pontos médios na parte superior dos retângulos que


compõem o Histograma, obteremos um gráfico de linhas denominado de Polígono de
frequências. A fim de não deixar o gráfico suspenso, conectamos o mesmo ao eixo
horizontal em ambos os lados.

NOTA: a partir do Polígono de frequências podemos representar contornos mais


suaves (polígono de frequência polido), utilizando-se curvas para chegarmos a uma das
representações de grande utilidade para a Estatística. Utilizando estas curvas, poderemos
entender com mais facilidade algumas relações e algumas propriedades presentes no
estudo das Medidas de Posição e das Medidas de Dispersão (nosso próximo assunto). As
curvas de frequências podem assumir certas formas características:

1. Curva em forma de sino (forte


concentração dos valores em torno do centro da
distribuição). Alguns fenômenos que oferecem
distribuições em forma de sino: a estatura de
pessoas, o peso de adultos, os preços de um
produto, a inteligência medida em testes de QI;

2. Curva em forma de Jota:


apresentam ponto de ordenada máxima em
uma das extremidades. São curvas comuns
aos fenômenos econômicos e financeiros;
rendas pessoais etc.;

3. Curva em forma de U: são características


por apresentarem ordenadas máximas em ambas as
extremidades. Como exemplo de uma distribuição
que dá origem a este tipo de curva podemos citar a
mortalidade por idade.

Estatística (versão 2022a) MODESTO, Marco Antonio


19 Fatec Bauru

Exercícios

[1] O tempo de duração em horas de 100 (cem) lâmpadas de determinada marca, foram
registrados na tabela abaixo:

Monte uma Distribuição de Frequências agrupando os dados em classes; obtenha


todos os tipos de frequências e monte sua representação gráfica (Histograma e Polígono de
frequências).

[2] A Tabela abaixo mostra o resultado de um teste aplicado a 90 alunos para medir o
Quociente de Inteligência (QI). A partir dela, construa o Histograma e o Polígono de
frequências:

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 20

[3] A partir da Distribuição de Frequência abaixo, referente notas de uma turma de 700
alunos, elabore uma representação gráfica:

[4] Com base nas Distribuições de Frequências abaixo, construa o Histograma e o Polígono
de frequências:

(a) (b)

Estatística (versão 2022a) MODESTO, Marco Antonio


21 Fatec Bauru

Medidas de Tendência Central

Introdução
Dentro das análises estatísticas, há três grupos de medidas utilizados: as medidas de
tendência central, que quantificam a tendência dos dados concentrarem-se em torno de
uma posição central (os dados tendem a se agrupar em torno de valores centrais); as
medidas de dispersão, que avaliam o espalhamento dos dados e as medidas de assimetria e
curtose, que medem a simetria e o achatamento de alguns gráficos, em particular o
Histograma. Como a intenção da Estatística Descritiva é resumir os dados em uma única
informação numérica, aproveita-se a tendência de agrupamento dos dados e determinam-se
algumas medidas, cujos valores numéricos, possam expressar o centro de localização da
distribuição das observações. Tais medidas são denominadas de medidas de tendência
central. Dentre elas destacam-se: a média aritmética, a mediana e a moda. Claramente, a
média aritmética é mais usada. Outras medidas de posição são as separatrizes que são: a
mediana, os quartis e os percentis.

Média Aritmética
Existem dois tipos de médias: a média populacional (representa pela letra grega ) e
a média amostral (representada por X ). Vejamos como esse conceito se aplica em cada
caso:

➔ Para dados não agrupados, a média aritmética ( X ), ou média, de um conjunto de n

números reais: x1 , x 2 , x 3 , ..., x n , é definida como o número:

x1 + x 2 + x 3 + ... + x n
X=
n
Ou seja, é obtida tomando-se a soma de todas as observações e dividindo pelo
número de observações na amostra.

Exemplo (1): um teste aplicado a dez (10) pessoas resultou nos seguintes valores:
94, 85, 78, 70, 69, 85, 93, 78, 66 e 62. Qual é a média deste teste?

94 + 85 + 78 + 70 + 69 + 85 + 93 + 78 + 66 + 62
A média é: X = = =
10 10

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 22

NOTA (1): podemos calcular, também, o desvio em relação à média d i = x i - x . Assim,


no exemplo anterior teremos (veja ao lado):

Para qualquer conjunto de dados, o seguinte resultado é verdadeiro:

“A soma dos desvios com relação à média é zero”, ou seja, d


i=1
i = 0.

➔ Para dados agrupados numa Distribuição de Frequência sem intervalos de classe,


n

 (f .x ) i i

a média será calculada pela fórmula: X= i= 1


n .
 fi
i= 1

Vejamos um exemplo:

 (f .x ) i i
X= i= 1
n
= =
fi= 1
i

Estatística (versão 2022a) MODESTO, Marco Antonio


23 Fatec Bauru

➔ Para dados agrupados numa Distribuição de Frequência com intervalos de classe,


adotamos o seguinte:

 (f .x ) i i
X= i= 1
n
= ==
fi= 1
i

Moda
Denomina-se moda (Mo) de um conjunto de dados, o valor que ocorre com maior
frequência (f i ) , ou seja, o valor que mais se repete.

Em dados não agrupados, então, procuramos o valor que mais se repete.

Exemplo: 3, 4, 5, 6, 6, 6, 6, 7, 7, 8, 9

O valor modal da série é 6, ou seja Mo = 6

Exemplo: 1, 2, 3 4, 5, 6, 7, 8, 9

Todos os valores aparecem com a mesma frequência, a série é Amodal

Exemplo: 1, 2, 2, 2, 3, 4, 5, 6, 6, 6, 7, 8, 9

A série tem duas modas, os valores 2 e 6, ou seja, Mo = 2 e Mo = 6. Temos aí uma


série Bimodal

Se tivermos uma Distribuição de Frequências sem intervalo de classes, a

identificação da moda é feita pela simples observação do elemento (x i ) que apresenta

maior frequência absoluta (f i ) , ou seja, Mo = x i .

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 24

Se tivermos uma Distribuição de Frequências com intervalo de classes, temos


diversas fórmulas para o cálculo da moda. A que vamos utilizar aqui será a Fórmula de
Czuber. Identifica-se a classe modal, ou seja, aquela que possui maior frequência absoluta

1
(f i ) e aplica-se a seguinte fórmula: Mo = li + .h
1 +  2

onde: l i é o limite inferior da classe modal


1 = Fi − Fi, ant

 2 = Fi − Fi, post

h é a amplitude do intervalo da classe modal

Exemplo:

Classe Modal

2
Mo = 158 + .4 = 159 ,6
2+3

Mediana
A mediana (Md) de um conjunto de dados, organizados em ordem de magnitude, é o
valor que está no centro do conjunto (se o número de dados for ímpar), ou é a média dos
dois dados que estão no centro do conjunto (se o número de dados for par).

Ou seja, a mediana é o valor que divide o conjunto de dados em dois grupos, ou duas
partes exatamente iguais, isto é, em dois subconjuntos de mesmo número de elementos,
onde 50% dos dados são menores ou iguais a mediana ou 50% dos dados são maiores ou
iguais a mediana.

Exemplo: 2, 5, 6, 9, 10, 13, 15, 16, 18 → Md = 10 (quatro valores para cada lado).

9 + 10
Exemplo: 2, 5, 6, 9, 10, 15, 16, 18 → Md = = 9,5
2

Estatística (versão 2022a) MODESTO, Marco Antonio


25 Fatec Bauru

No caso de Distribuição de Frequências sem intervalo de classes, deve-se


primeiramente determinar a frequência acumulada. Calcula-se, então, o valor que divide a

distribuição em duas partes iguais, e aplica-se a fórmula


f i
.
2

No exemplo da Distribuição de Frequências acima, temos:


f i
=
60
= 30 (30ª posição)
2 2

A menor frequência acumulada (Fi ) que supera esse valor é 49, que corresponde ao
valor 3 da variável (x i ) ; logo Md = 3.

Se tivermos um caso em que


f i
= Fi , a mediana será dada por:
2

x i + x i +1
Md =
2

f i
=
36
= 18 = F3
2 2

18ª posição

2+3
Então: Md = = 2,5
2

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 26

Se tivermos uma Distribuição de Frequências com intervalos de classe, seguimos os

seguintes passos: determinamos as frequências acumuladas, calculamos f i


, marcamos a
2

classe correspondente à frequência acumulada (Fi ) imediatamente superior a  f i


(classe
2
mediana) e aplicamos a fórmula:

 fi 
 − Fant  . h
 2 
Md = l i +  , onde:
fi

l i é o limite inferior da classe mediana


Fant é a frequência acumulada da classe anterior a classe mediana

h é a amplitude do intervalo da classe mediana


f i é a frequência do intervalo da casse mediana

Vejamos na Distribuição de Frequências abaixo:

CLASSE MEDIANA: 3ª Classe

f i
=
40
= 20 (20ª posição)
2 2

Logo a classe mediana é a 3ª classe, ou seja: .

l i = 158 Fant = 13 h= 4 f i = f 3 =11

Sendo, assim: Md = 158 +


20 − 13. 4 = 160 ,5
11

No caso de
f i
= Fi acontecer, a mediana será o limite superior da classe
2
correspondente.
Estatística (versão 2022a) MODESTO, Marco Antonio
27 Fatec Bauru

NOTA (1): Média e Mediana sempre existem. Moda pode não existir. Exemplo:
quando todas as observações são iguais;

NOTA (2): Os três índices (média, moda e mediana) são geralmente diferentes;

NOTA (3): A média é afetada pelos valores fora do padrão das observações (outliers)
mais que a Moda e a Mediana (em amostras pequenas). Moda e Mediana são mais
resistentes aos outliers;

Separatrizes
As separatrizes são valores que dividem uma distribuição em um certo número de
partes iguais. Já vimos a Mediana (Md) que divide a distribuição em duas partes
exatamente iguais. Veremos agora os quartis, percentis e decis. O objetivo das separatrizes
é proporcionar uma melhor ideia da dispersão do conjunto, principalmente da simetria ou
assimetria da distribuição.

Quartis
Denominam-se quartis os valores de uma série que a dividem em quatro partes
iguais. Portanto, há três quartis. São mais aplicados em Distribuição de Frequências com
intervalos de classes.

1° quartil (Q1): 25% dos dados são < que o Q1 e os 75% restantes são maiores

2° quartil (Q2): coincide com a mediana, 50% para cada lado, ou seja, Q2 = Md

3° quartil (Q3): 75% dos dados são < que o Q3 e os 25% restantes são maiores

k .  fi
Para o caso de dados agrupados, basta aplicarmos a fórmula , sendo k o
4
número do quartil (primeiro quartil k =1; segundo quartil k = 2 e terceiro quartil k = 3).
Então:

1. f i 
 − Fant  . h
 4 
Q1 = l i + 
fi

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 28

 2. f i   3. f i 
 − Fant  . h  − Fant  . h
4 4
Q 2 = li +   Q 3 = li +  
fi fi

Exemplo:

► Primeiro Quartil:

1. fi 1 . 40 40
= = = 10 , logo o 1° quartil está na 2ª classe, ou seja: , de onde
4 4 4

tiramos: l i = 154 Fant = 4 h=4 fi = f 2 = 9

10 − 4. 4 = 156 ,7


Aplicando na fórmula: Q1 = 154 + (25% das alturas até esse valor)
9

► Segundo Quartil (coincide com a Mediana):

2. f i 2 . 40 80
= = = 20 , logo o 2° quartil está na 3ª classe, ou seja: , de onde
4 4 4

tiramos: l i = 158 Fant = 13 h=4 f i = f 3 = 11

20 − 13. 4 = 160 ,5


Aplicando na fórmula: Q 2 = Md = 158 +
11

► Terceiro Quartil:

3. f i 3 . 40 120
= = = 30 , logo o 3° quartil está na 4ª classe, ou seja: , de
4 4 4

onde tiramos: l i = 162 Fant = 24 h=4 fi = f 4 = 8

Estatística (versão 2022a) MODESTO, Marco Antonio


29 Fatec Bauru

30 − 24. 4 = 165


Aplicando na fórmula: Q 3 = 162 + (75% das alturas até esse valor)
8

Percentis
Denominamos Percentis os noventa e nove valores que separam uma série em 100

(cem) partes iguais. Indica-se da seguinte forma: P1 , P2 , P3 , P4 ,..., P99 .

Note-se que: P25 = Q1 P50 = Q2 = Md P75 = Q 3

k .  fi
Calcula-se da mesma forma que os Quartis, só que aplicando , sendo k o
100

número de ordem do percentil (1°, 2°, 3°, ..., 25°, ..., 50°, ..., 99°).

 k. f i 
 − Fant  . h
100
Fórmula ➔ Pk = l i +  
fi

Exemplo:

65 . f i 65 . 40
Para o septuagésimo quinto (65°) percentil (k = 65): = = 26
100 100

Logo o 65° percentil se localiza na 4ª classe, ou seja: , de onde tiramos:

l i = 162 Fant = 24 h=4 fi = f4 = 8

26 − 24. 4 = 163


Aplicando na fórmula: P65 = 162 + (65% apresentam altura até 163 cm;
8
35% apresentam altura acima de 163 cm).

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 30

NOTA: Os Percentis múltiplos de 10% são chamados de Decis. Assim, por exemplo, o

segundo Decil ( D 2 ) é o 20° percentil. Esses Percentis dividem o conjunto de dados em 10

partes iguais, cada uma delas representando 10% das observações.

Exercícios
[1] Calcule a média aritmética, a mediana e a moda dos seguintes conjuntos de dados:
(a) x i : 9, 6, 7, 4, 7, 9, 8, 4, 5, 5, 6, 4, 5, 4, 6, 5, 7, 4, 2, 8, 7, 5, 8, 5, 7, 6, 4

(b) x i : 2, 5, 8, 10, 12, 15, 8, 5, 12

(c) x i : 1, 2, 8, 10, 12, 16, 21, 30

[2] Calcule a média aritmética, a moda e a mediana das seguintes distribuições de


frequências:

Estatística (versão 2022a) MODESTO, Marco Antonio


31 Fatec Bauru

[3] Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro


abaixo. Calcule o aluguel médio para estas residências. Calcule a mediana e a moda do

aluguel para estas residências. Em seguida, calcule os quartis Q1 , Q 2 e Q3 , os percentis

de ordem 20, 40 e 85, ou seja, P20 , P40 e P85 .

[4] Dado o Histograma, calcule X ; Mo ; Md ; Q1 ; Q 3 ; D1 :

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 32

Comparando Média e Mediana


Sejam os seguintes conjuntos de dados amostrais:

X1: 34, 36, 38, 40, 42, 44, 46

X2: 35, 37, 39, 40 41, 43, 45

Para os conjuntos de dados acima, vamos calcular o valor das medidas de posição:
Média e Mediana:

x1 =
X1: 34, 36, 38, 40, 42, 44, 46

Md1 =

x2 =
X2: 35, 37, 39, 40 41, 43, 45

Md 2 =

Observe que cada conjunto de escores tem a mesma média e a mesma mediana.

Mas analisando a figura abaixo notamos que os dados em X1 estão mais espalhados
com relação à média do que aqueles de X2:

Vamos ver agora uma forma de medir o quanto os escores estão espalhados.

Tais medidas são denominadas de Medidas de Dispersão.

Estatística (versão 2022a) MODESTO, Marco Antonio


33 Fatec Bauru

Medidas de Dispersão

Introdução
As medidas de dispersão (ou variabilidade) indicam se os valores estão relativamente

próximos uns dos outros, ou separados. Podemos dizer que dispersão é o grau com o qual

os valores numéricos de uma Distribuição tendem a se distanciar em torno de um valor

médio. O valor zero indica ausência de dispersão; a dispersão aumenta à proporção que

aumenta o valor da medida (amplitude, desvio padrão e variância).

Amplitude total
É a medida mais simples de dispersão. A amplitude total (AT) é a diferença entre o
maior valor e o menor valor observado, ou seja:

AT = X max - X min
Exemplo:

40, 45, 48, 52, 54, 62, 70 AT = 70 − 40 = 30

A Amplitude é uma medida pobre da dispersão, pois ela depende apenas de dois
itens dos dados e não diz nada sobre como o restante dos dados estão espalhados.

Variância
É uma medida de dispersão também baseada na diferença entre o valor de cada
observação e a média dos dados. Esta diferença é chamada desvio em torno da média. A
2
Variância (S ) mede, portanto, o afastamento em torno da média, de cada um dos dados.
Quanto maior este afastamento maior é a variância e, então, maior a dispersão dos dados.
Os conjuntos de dados com menor variância são mais homogêneos e preferidos pela
Estatística.

(x1 − x ) 2 + (x 2 − x ) 2 + (x 3 − x ) 2 + ... + (x n − x ) 2
S =
2

n -1

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 34

Calcule a variância amostral para os conjuntos abaixo:

X1: 34, 36, 38, 40, 42, 44, 46

S1 =
2

X2: 35, 37, 39, 40 41, 43, 45

S2 =
2

Como a variância amostral para o conjunto X1 é maior que a variância amostral para
o conjunto X2, concluímos que os dados do conjunto X1 estão mais largamente espalhados
com relação aos dados do conjunto X2.

Desvio Padrão
No cálculo da variância, elevamos o quadrado os desvios com relação à média, ou
seja, a variância é um número em unidade quadrada em relação à média; logo o desvio
padrão de dados amostrais será a raiz quadrada positiva da variância:

(x i − x ) 2
S= S = 2

n -1

Calcule o desvio padrão para os conjuntos abaixo:

X1: 34, 36, 38, 40, 42, 44, 46

S1 =

X2: 35, 37, 39, 40 41, 43, 45

S2 =

Novamente, o fato de o desvio padrão do conjunto X2 ser menor que o desvio padrão
do conjunto X1, indica que estes dados estão mais densamente agrupados em torno da
média do que aqueles de X1.

Estatística (versão 2022a) MODESTO, Marco Antonio


35 Fatec Bauru

Em geral, um desvio padrão relativamente pequeno indica que as medidas tendem a


se agrupar perto da média, e um desvio padrão relativamente grande mostra que as
medidas tendem a se espalhar largamente, para longe da média.

Propriedade (1): somando-se (ou subtraindo-se) uma constante a (de) todos os


valores de uma variável, o desvio padrão não se altera.

Propriedade (2): multiplicando-se todos os valores de uma variável por uma


constante (diferente de zero), o desvio padrão fica multiplicado por essa constante.

NOTA: para dados agrupados sem intervalos de classe, devemos levar em conta as
frequências, ou seja:

 (f i . x i )   (f i . x i ) 
2 2

S= − 
n  n 

Exemplo:

 (f . x ) −   (f
2
. xi ) 
2 2
 =  
s= S = −  = =
2 i i i

n  n   
 

Já para dados agrupados com intervalos de classe, devemos também levar em conta

as frequências e x i é o ponto médio do intervalo de classe.

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 36

Por exemplo:

 (f . x ) −   (f
2
. xi ) 
2 2
 
s = S2 =
i i i
 = −   = =
 
n  n   

Coeficiente de Variação
Trata-se de uma média relativa à dispersão, útil para a comparação e observação
em termos relativos do grau de concentração em torno da média de séries distintas, ou seja,
s
é a porcentagem do Desvio Padrão em relação a sua média: CV = .100 .
x
Classificação da distribuição quanto à dispersão:

. Dispersão baixa: CV  15%

. Dispersão média: 15% < CV < 30%

. Dispersão alta: CV  30%

No caso das Distribuições de Frequências anteriores, temos:

s = 1,32874 s 1,32874
(a) CV = .100 → CV = .100 = 65,46 %
x = 2,03 x 2,03

s = 5,56776 s 5,56776
(b) CV = .100 → CV = .100 = 3,46%
x = 161 x 161

Quanto maior o CV maior será a dispersão; quanto menor o CV menor será a


dispersão.

Estatística (versão 2022a) MODESTO, Marco Antonio


37 Fatec Bauru

Outro exemplo: numa empresa o salário médio dos funcionários do sexo masculino
é de R$ 3.500,00 com seu desvio padrão de R$ 1.100,00 e os funcionários do sexo feminino
é em média de R$ 3.000,00 com um desvio padrão de R$ 1.200,00. Calcule o CV em cada
caso.

CVM = CVF =

Interpretação: logo, podemos concluir que o salário das mulheres apresenta maior
dispersão relativa que a dos homens.

Exercícios

[1] Uma amostra de dez lâmpadas foi escolhida e foram medidas as suas vidas úteis. As
lâmpadas duraram 968, 895, 769, 845, 922, 916, 970, 778, 852 e 935 horas. Calcule a
média, desvio padrão e o coeficiente de variação das vidas úteis das lâmpadas amostradas.

[2] Um grupo de 85 moças (grupo 1) tem estatura média de 160,6 cm e desvio padrão de
5,97 cm. Um outro grupo de 125 moças (grupo 2) tem uma estatura média de 161,9 cm e
desvio padrão igual a 6,01 cm. Qual é o CV de cada um dos grupos? Qual o grupo mais
homogêneo?

[3] Determine a variância, o desvio padrão e o coeficiente de variação das seguintes


distribuições:

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 38

[4] Para aferir uma máquina empacotadora de um determinado cereal, foram amostrados
124 pacotes e suas massas registradas, conforme tabela abaixo. Determine o desvio padrão,
a variância e o coeficiente de variação dos pacotes amostrados.

[5] Para os valores tabelados abaixo, determine x , s, s 2 , CV :

[6] Uma pesquisa sobre a idade, em anos, dos frequentadores de um determinado Hotel,
durante uma semana, revelou os valores abaixo. Determine todas as medidas de dispersão
para esses dados:

Estatística (versão 2022a) MODESTO, Marco Antonio


39 Fatec Bauru

Exercícios Complementares

[1] Um dado não viciado foi lançado 50 vezes e os resultados obtidos foram:

Construa uma Distribuição de Frequência (completa) para os dados acima, faça uma
representação gráfica e determine: média, moda e a mediana desta distribuição.

[2] Complete a Distribuição de Frequência abaixo, destacando x i , Fi , fr i e Fri . Em seguida,


responda:

(a) qual a porcentagem de pessoas que estudam menos de 15 horas?

(b) qual a porcentagem de pessoas que estudam 20 ou mais horas?

[3] Uma fábrica, para avaliar a qualidade do descanso de seus funcionários, aplicou um
questionário para verificar o tempo médio de horas de sono noturno. Os valores obtidos
estão indicados a seguir:

Calcule a média e moda do tempo de sono dos funcionários desta fábrica.

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 40

[4] Construa o Histograma e o polígono de frequência para a Distribuição abaixo:

[5] O preço em dólares de um determinado medicamento foi pesquisado em seis


Distribuidoras e foram obtidos os seguintes valores:

Em relação a esses valores, calcule: a média aritmética, a variância e o desvio padrão.

[6] Considere a Distribuição de Frequência abaixo, determine as medidas de posição


(média, moda e mediana) e a medidas de dispersão (desvio padrão e variância):

[7] No quadro está representado o consumo diário de kWh de três equipamentos


hospitalares, idênticos, em um período de cinco dias:

Calcule o coeficiente de variação para os três equipamentos e interprete os


resultados obtidos.

Estatística (versão 2022a) MODESTO, Marco Antonio


41 Fatec Bauru

[8] Na Distribuição de frequências abaixo está representada a temperatura média diária de


uma cidade do RS durante os meses de um determinado ano:

(a) quantos dias tiveram temperatura média inferior a 15,5°C?

(b) calcule as medidas de posição e as medidas de dispersão para esta distribuição de


frequências.

[9] Dado o rol do número de erros de impressão da primeira página de um jornal durante
50 dias, obteve-se os seguintes resultados:

5 5 5 6 6 6 7 7 7 7

7 8 8 8 8 8 8 8 9 9

10 10 10 10 10 11 11 11 11 12

12 12 12 12 12 12 12 12 12 14

14 14 14 14 14 14 15 16 19 22

Complete a tabela de Distribuição de Frequência abaixo:

Em seguida calcule: Q1, Q2, Q3, P24, P45 e P85

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 42

[10] A partir do Histograma abaixo, calcule: x, Mo, Md, Q3 , P20 , D8 , s, s 2 , CV .

Estatística (versão 2022a) MODESTO, Marco Antonio


43 Fatec Bauru

Noções de Probabilidade

Introdução
Estudos envolvendo probabilidade também fazem parte da Estatística. Antes de
começarmos nosso estudo sobre Probabilidade, vejamos algumas definições importantes.

Experimento aleatório: todo experimento cujo resultado depende exclusivamente


do acaso é chamado de experimento aleatório. Exemplo: lançamento de uma moeda,
lançamento de um dado, apostar 6 números num jogo da Loteria e acertar a quina, retirar
1 bola verde de uma urna na qual se encontram 3 bolas verdes e 2 azuis etc.

Espaço Amostral: o conjunto de todos os resultados possíveis de um experimento


aleatório é chamado de espaço amostral desse experimento. Vejamos alguns exemplos:

Exemplo (1): no lançamento de uma moeda o espaço amostral é o conjunto:

E = {cara, coroa} n(E) = 2

Exemplo (2): no lançamento de dado, anotando a face voltada para cima, temos o
seguinte espaço amostral:

E = {1, 2, 3, 4, 5, 6} n(E) = 6

Exemplo (3): no lançamento simultâneo de uma moeda e um dado, temos o


seguinte espaço amostral:

E = {(C, 1), (K, 1), (C, 2), (K, 2), (C, 3), (K, 3), (C, 4), (K, 4), (C, 5), (K, 5), (C, 6), (K, 6)}

n(E) = 2.6 = 12

Exemplo (4): no lançamento de uma moeda, três vezes consecutivas. Os possíveis


resultados para este experimento aleatório podem ser demonstrados através de uma árvore
de possibilidades. Vejamos:

n(E) = 2.2.2 = 8

C: CARA K: COROA

E = {(C, C, C), (C, C, K), (C, K, C), (C, K, K), (K, C, C), (K, C, K), (K, K, C), (K, K, K)}

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 44

Evento: qualquer subconjunto de um espaço amostral é chamado de evento desse


espaço amostral. Exemplo: lançam-se dois dados, anotando o número das faces voltadas
para cima (neste caso, a determinação do espaço amostral pode ser feita por uma tabela de
dupla entrada - produto cartesiano):

Daí, podemos enumerar alguns eventos:

. Obter faces iguais:

A = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} n(A) = 6

. Obter faces cuja soma seja igual a 10:

B = {(4, 6), (5, 5), (6, 4)} n(B) = 3

. Obter faces cuja soma seja menor que 2:

C =  (evento impossível) n(C) = 0

OBS (1): neste último caso, o conjunto C (conjunto vazio) representa um evento que nunca
pode ocorrer e, por isso, é denominado evento impossível.

OBS (2): o espaço amostral também pode ser representado pela letra grega ômega: .

Conceito de Probabilidade
Sejam E um espaço amostral equiprovável (com resultados que têm a mesma
chance de ocorrer) e A um evento deste espaço amostral. A probabilidade de ocorrer algum
elemento do evento A é indicada por P(A) e definida por:

Estatística (versão 2022a) MODESTO, Marco Antonio


45 Fatec Bauru

n(A)
P(A) =
n(E)

NOTA (1): como n(A)  n(E), então 0  P(A)  1.

NOTA (2): sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de
que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), então para
um mesmo evento sempre existe a relação: p + q = 1 → q = 1 – p (neste caso, q é
chamado de evento complementar de p).

1
Por exemplo, se a probabilidade de se realizar um evento é p = , logo, a
5
1 4
probabilidade de que ele não ocorra é dada por: q = 1 – p ➔ q = 1 - =
5 5

Vejamos mais alguns exemplos do cálculo de probabilidade associada a um


determinado evento:

EX(1): Probabilidade de jogando um dado ideal, obter um número maior que 4:

E = {1, 2, 3, 4, 5, 6} n(E) = 6
A = {5, 6} n(A) = 2
n(A) 2 1
Logo: P(A) = = = = 0,3333 (33,33%)
n(E) 6 3

EX(2): Probabilidade de retirar uma bola vermelha de uma urna contendo três bolas
brancas, duas vermelhas e cinco azuis:

E = {B, B, B, V, V, A, A, A, A, A} n(E) = 10

A = {V, V} n(A) = 2

n(A) 2 1
Logo: P(A) = = = = 0,20 (20,00%)
n(E) 10 5

EX(3): Probabilidade de extrair, ao acaso, uma bola com número par, de uma urna que
contém 15 bolas numeradas de 1 a 15:

E = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15} n(E) = 15

A = {2, 4, 6, 8, 10, 12, 14} n(A) = 7

n(A) 7
Logo: P(A) = = = 0,4667 (46,67%)
n(E) 15

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 46

NOTA (3): Há situações em que a probabilidade P(A) de um evento A de um


determinado experimento aleatório é calculada com base na frequência relativa da
ocorrência desse determinado evento, ou seja, a probabilidade é obtida como a porcentagem
de ocorrência desse evento A depois de repetir o experimento um número muito grande de
vezes. Por exemplo, sabemos que a probabilidade de obter cara no lançamento de uma
moeda é 0,50 (50%). Entretanto, esse resultado não significa que, lançando uma moeda
cinquenta vezes seguidas, sempre ocorrerão vinte e cinco caras e vinte e cinco coroas. Nesse
caso é preciso considerar um grande número de lançamentos para se estimar a
probabilidade da ocorrência de cada face da moeda. E quanto maior o número de repetições
do experimento, melhor será a estimativa da probabilidade, que tende a se aproximar da
probabilidade prevista (calculada).

Exercícios
[1] Numa caixa há fichas numeradas de 11 a 20. Defina:
(a) o espaço amostral do experimento “retirar uma ficha ao acaso desta caixa”;
(b) o evento “ocorrência de número ímpar”;
(c) o evento “ocorrência de número primo”;
(d) o evento “ocorrência de número maior que 14”

Estatística (versão 2022a) MODESTO, Marco Antonio


47 Fatec Bauru

[2] Em uma urna são colocadas três bolas idênticas numeradas: ,e. São

sorteadas duas dessas bolas com reposição, ou seja, sorteia-se uma bola, que é reposta na
urna e, em seguida, sorteia-se outra bola. Determine:
(a) o espaço amostral desse experimento;
(b) o evento A: ocorrência de dois números pares;
(c) o evento B: ocorrência da 1ª bola sorteada ter um número maior do que o número da 2ª
bola sorteada;
(d) o evento C: ocorrência do produto dos números sorteados nas bolas ser menor que 20.

[3] Considere a seguinte D.F. das idades de funcionários de um setor de uma empresa.
Escolhendo-se ao acaso um funcionário desse setor, qual a probabilidade dele possuir:

(a) idade entre 24 inclusive e 28 anos?

(b) idade inferior a 32 anos?

[4] Um casal planeja ter três filhos. Determine a probabilidade de:


(a) nascerem três homens;
(b) nascerem dois homens e uma mulher;
(c) nascerem pelo menos duas mulheres.

[5] Uma sala contém 10 homens e 20 mulheres, sendo que a metade dos homens e três
quartos das mulheres têm olhos castanhos. Uma pessoa é escolhida ao acaso. Determine a
probabilidade dessa pessoa escolhida:
(a) ser homem;
(b) ser homem com olhos castanhos;
(c) ser mulher com olhos castanhos;
(d) não ter olhos castanhos;

[6] Em um experimento, uma moeda é lançada 800 vezes, obtendo-se 520 caras e 280
coroas. Construa uma tabela de frequências para representar os resultados obtidos neste
experimento. O que é possível suspeitar acerca da honestidade da moeda?

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 48

Teorema da Soma de Probabilidades


Para melhor entender o Teorema da Soma (ou teorema do “ou”) vamos dividi-lo em
duas regras:

Regra 1: soma de probabilidade de eventos mutuamente exclusivos

Regra 2: soma de probabilidade de eventos não mutuamente exclusivos

• EVENTOS MUTUAMENTE EXCLUSIVOS: se dois eventos não podem ocorrer ao


mesmo tempo, dizemos que são mutuamente exclusivos. A ocorrência de um desses
eventos exclui (impede) a ocorrência do outro. Exemplo: se você joga um dado, só pode
ocorrer uma das faces. Então, se ocorreu a face “seis”, ficou excluída a possibilidade de ter
ocorrido qualquer outra face.

REGRA DA SOMA PARA EVENTOS MUTUAMENTE EXCLUSIVOS

SE A E B SÃO EVENTOS MUTUAMENTE EXCLUSIVOS, A


PROBABILIDADE DE OCORRER A OU B É IGUAL À SOMA DAS
PROBABILIDADES DE OCORRER CADA UM DELES

P(A  B) = P(A) + P(B)

Exemplo: ao lançarmos um dado, qual é a probabilidade de ocorrer o n° 2 ou 5?

1
A: sair n° 2 P(A) =
6

1
B: sair n° 5 P(B) =
6

1 1 2 1
Logo: P(A  B) = P(A) + P(B) = + = = = 0,333 (33,33%)
6 6 6 3

• EVENTOS NÃO MUTUAMENTE EXCLUSIVOS: se dois eventos A e B são não


mutuamente exclusivos se eles têm pelo menos um resultado em comum.

Exemplo: quando você joga um dado, pensemos nos eventos: ocorrer “número
ímpar” ou ocorrer “número maior do que quatro”. Esses dois eventos têm um resultado em
comum: o número cinco, que tanto pertence ao evento “número ímpar” como ao evento
“número maior do que quatro”.

Estatística (versão 2022a) MODESTO, Marco Antonio


49 Fatec Bauru

REGRA DA SOMA PARA EVENTOS NÃO MUTUAMENTE EXCLUSIVOS

SE A E B SÃO DOIS EVENTOS NÃO MUTUAMENTE


EXCLUSIVOS, A PROBABILIDADE DE OCORRER A OU B É
DADA PELA PROBABILIDADE DE A, MAIS A PROBABILIDADE
DE B, MENOS A PROBABILIDADE DE A E B

P(A  B) = P(A) + P(B) – P(A  B)

Exemplo: ao lançarmos um dado, qual é a probabilidade de ocorrer “número ímpar”


ou ocorrer “número maior do que quatro”?

3
A: ocorrer n° ímpar A = {1, 3, 5} P(A) =
6

2
B: ocorrer n° maior do que quatro B = {5, 6} P(B) =
6

1
A  B = {5} P(A  B) =
6

3 2 1 4 2
Logo: P(A  B) = P(A) + P(B) - P(A  B) = + − = = = 0,6667 (66,67%)
6 6 6 6 3

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 50

Teorema da Multiplicação de Probabilidades


Para melhor entender o Teorema da Multiplicação (ou teorema do “e”) vamos dividi-lo
em duas regras:

Regra 1: multiplicação de probabilidade de eventos independentes

Regra 2: multiplicação de probabilidade de eventos dependentes

• EVENTOS INDEPENDENTES: dois eventos A e B, são independentes se a ocorrência


de um deles EVENTOS não tem efeito sobre a ocorrência do outro. Exemplo: quando se
lançam dois dados distintos, o resultado em um dos dados não tem qualquer efeito sobre o
resultado que ocorre no outro dado.

REGRA DA MULTIPLICAÇÃO PARA EVENTOS INDEPENDENTES

SE A E B SÃO DOIS EVENTOS INDEPENDENTES, A


PROBABILIDADE DE OCORRER A E B É DADA PELA
PROBABILIDADE DE OCORRER A, MULTIPLICADA PELA
PROBABILIDADE DE OCORRER B

P(A  B) = P(A) . P(B)

Exemplo: ao lançarmos dois dados, um vermelho e um amarelo, qual é a


probabilidade de ocorrer a face 3 no dado amarelo e a face 5 no dado vermelho?

1
A: ocorrer face 3, dado amarelo P(A) =
6

1
B: ocorrer face 5, dado vermelho P(B) =
6

1 1 1
Logo: P(A  B) = P(A) . P(B) = . = = 0,0278 (2,78%)
6 6 36

• EVENTOS DEPENDENTES: dados dois eventos A e B, se a ocorrência do evento A


modifica a probabilidade de ocorrência do evento B, dizemos que esses dois eventos são
dependentes. Em outras palavras isso é chamado de probabilidade condicional de B dado
A, visto que é a probabilidade de ocorrer o evento B sob a condição de o evento A ter
ocorrido. Indicamos por P(B/A).

Toda vez que calculamos a probabilidade condicional de B dado A, devemos lembrar


que o espaço amostral fica reduzido (a condição de o evento A ter ocorrido diminui o espaço
amostral para a ocorrência do evento B).

Estatística (versão 2022a) MODESTO, Marco Antonio


51 Fatec Bauru

REGRA DA MULTIPLICAÇÃO PARA EVENTOS DEPENDENTES

SE A E B SÃO DOIS EVENTOS DEPENDENTES, A


PROBABILIDADE DE OCORRER A E B É DADA PELA
PROBABILIDADE DE OCORRER A, MULTIPLICADA PELA
PROBABILIDADE DE OCORRER B DADO QUE A OCORREU
(CONDICIONAL)

P(A  B) = P(A) . P(B/A)

Exemplo: Dentro de uma caixa há cinco bolas, três são azuis e duas brancas.
Retiram-se duas bolas ao acaso dessa caixa, sem reposição, uma em seguida da outra.

Qual é a probabilidade de que as duas bolas retiradas sejam brancas?

2
A : 1ª bola retirada é branca P(A) =
5

1
B : 2ª bola retirada é branca P(B/A) =
4

2 1 2 1
Logo: P(A  B) = P(A) . P(B/A) = . = = = 0,10 (10,00%)
5 4 20 10

Exercícios
[1] Dados os algarismos 1, 2, 3, 4, 5, 6 e 7, construímos todos os números que podem ser
representados usando dois deles, sem repetir. Escolhendo ao acaso aleatoriamente um dos
números formados, qual a probabilidade de o número sorteado ser par? E ser múltiplo de
5?

[2] Num grupo de 80 pessoas, 16 gostam de música, esporte e leitura; 24 gostam de música
e esporte; 30 gostam de música e leitura; 22 gostam de esporte e leitura; 6 gostam somente
de música; 9 gostam somente de esporte; e 5 gostam somente de leitura. Qual é a
probabilidade de, ao apontar ao acaso uma dessas pessoas, ela gostar de música? Qual é a
probabilidade de, ao apontar ao acaso uma dessas pessoas, ela não gostar de nenhuma
dessas atividades?

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 52

[3] Num grupo de 100 pessoas da zona rural, 25 estão afetadas por uma parasitose
intestinal A e 11 por uma parasitose intestinal B, não se verificando nenhum caso de
incidência conjunta de A e B. Duas pessoas desse grupo são escolhidas, aleatoriamente,
uma após a outra. Determine a probabilidade de que, dessa dupla, a primeira pessoa esteja
afetada por A e a segunda por B.

[4] Seja o seguinte espaço amostral E = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. Qual é a probabilidade


de, ao se tornar um número ao acaso, o número ser:

(a) ímpar menor do que 4 ou ímpar maior do que 8?

(b) ímpar ou múltiplo de 3?

[5] No lançamento de um dado e uma moeda, honestos, qual a probabilidade de ocorrer


coroa ou o número 5?

[6] No lançamento simultâneo de dois dados perfeitos distinguíveis, qual é a probabilidade


de se obter soma par ou soma múltiplo de 3?

[7] Com os algarismos 5, 6, 7, 8, 9 são formados números de quatro algarismos distintos.


Um destes números é escolhido ao acaso. Qual a probabilidade de ele ser par? E de ser
ímpar?

[8] Um lote contém seis lâmpadas, sendo três boas e três defeituosas. Um funcionário vai
retirar ao acaso, três lâmpadas deste lote, sem reposição. Qual a probabilidade de todas
serem boas? Qual a probabilidade de duas serem boas e uma defeituosa? Qual a
probabilidade de pelo menos uma delas ser defeituosa? (Para resolver exercícios como esse,
devemos nos lembrar dos tipos de agrupamentos existentes2).

2 De um modo geral, dados um conjunto com n elementos quaisquer, agrupados de p a p,


temos os seguintes tipos de agrupamentos:

. Arranjos: agrupamentos onde a ordem dos elementos é importante na composição desses

n!
agrupamentos. Temos a seguinte fórmula: A n,p = , onde 0 ≤ p ≤ n.
(n - p)!

. Combinações: agrupamentos onde a ordem dos elementos não é importante na

n!
composição desses agrupamentos. Temos a seguinte fórmula: C n,p = , onde 0 ≤ p ≤ n.
p! . (n - p)!
Estatística (versão 2022a) MODESTO, Marco Antonio
53 Fatec Bauru

[9] Um grupo hospitalar é constituído de 6 médicos e 4 enfermeiras. Três pessoas são


selecionadas ao acaso, sem reposição para se formar uma comissão. Qual a probabilidade
de que ao menos duas pessoas desta comissão sejam homens?

[10] O seguinte grupo de pessoas está numa sala: 5 rapazes com mais de 21 anos, 4
rapazes com menos de 21 anos, 6 moças com mais de 21 anos e 3 moças com menos de 21
anos. Uma pessoa é escolhida ao acaso dentre as 18. Os seguintes eventos são definidos:

A: a pessoa tem mais de 21 anos

B: a pessoa tem menos de 21 anos

C: a pessoa é um rapaz

D: a pessoa é uma moça

Calcule:

(a) P(B  D)

(b) P(A  C)

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 54

Distribuições de Probabilidade
Seja a variável aleatória X, que pode assumir os valores correspondentes ao conjunto
X = {x 1 , x 2 , x 3 ,..., x n } .

A relação x i → f(x i ) define uma correspondência entre todos os valores que a variável

aleatória pode assumir (x i ) e suas respectivas probabilidades de ocorrências f(x i ) . Esta


relação é a função de probabilidades da variável aleatória X.

Exemplo: suponha que o número máximo de leitos que uma UTI comporte seja 4.
Definindo a variável aleatória X como “número de óbitos na UTI”, os valores que a variável
aleatória pode assumir, num certo período de tempo, são X = {0, 1, 2, 3, 4}, onde X = 0
significa nenhum óbito (quatro pacientes vivos); X = 1 (um) óbito (três pacientes vivos), e
assim por diante. Supondo que um paciente nesta UTI tenha ¾ de chances de sobrevida e
¼ de chance ir a óbito. Vamos associar as probabilidades a cada um destes possíveis
resultados, ou seja:

x = 0 ➔ f(0) =

x = 1 ➔ f(1) =

x = 2 ➔ f(2) =

x = 3 ➔ f(3) =

x = 4 ➔ f(4) =

Estatística (versão 2022a) MODESTO, Marco Antonio


55 Fatec Bauru

É possível construir a função de probabilidade do número de óbitos, tomando quatro


leitos (n = 4), da seguinte forma:

x 0 1 2 3 4

f(x)

Graficamente, teremos:

Note que a soma  f(x


i =1
i ) =1 é o resultado esperado, uma vez que estão sendo

consideradas todas as possibilidades de ocorrências para a variável aleatória X.

Note, também, que a soma das áreas sob a curva que representa a função de
probabilidade é igual a 1 ou 100%.

Fica assim estabelecida uma correspondência entre a área sob a função e a


probabilidade de ocorrência da variável aleatória X.

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 56

Distribuição Normal

Introdução
Já vimos que uma variável é o conjunto de resultados possíveis de um fenômeno. A
variável pode ser qualitativa, quando seus valores são expressos por atributos (sexo, cor) ou
pode ser quantitativa, quando seus valores são expressos em números.

A variável quantitativa pode ser contínua, quando assume qualquer valor entre dois
limites (peso, altura, medições), ou pode ser discreta, quando só pode assumir valores
pertencentes a um conjunto enumerável (número de filhos, contagem em geral).

Entre as distribuições teóricas de variável contínua, a mais empregada é a


distribuição normal, curva normal ou curva de Gauss.

A Curva de Gauss aparece no estudo de muitas variáveis estatísticas: altura, peso,


comprimento dos pés, número de filhos, número de horas que se vê TV, salários, tempo de
reação a um medicamento etc. O aspecto gráfico da curva normal é o seguinte:

Ponto de inflexão

Onde x é a média e s é o desvio padrão.


Algumas características:

. a curva tem a forma de um sino;

. a curva é simétrica em relação a x;

. o ponto máximo da curva corresponde a x;

Para caracterizar a distribuição normal, basta a média e o desvio padrão. Por esta
razão, quando se quer informar que uma variável aleatória se distribui normalmente,

costuma-se escrever N( x, s) .

Estatística (versão 2022a) MODESTO, Marco Antonio


57 Fatec Bauru

Quando temos em mão uma variável aleatória com distribuição normal, nosso
principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em
um determinado intervalo. Essa probabilidade é representada pela área sob a curva dentro
desse intervalo. A área total sob a curva é 1 ou 100%. O cálculo desse valor é difícil, sendo
então esse já tabelado (veja tabela na página seguinte).

Para calcular probabilidades associadas à distribuição normal, costuma-se


converter a variável original do problema (X) em unidades – escores - reduzidas ou
padronizadas, z. Esta transformação é efetuada por meio da seguinte relação:

x-x
z=
s
Exemplo: seja um teste de inteligência aplicado a um grupo de 198 adolescentes.
Obteve-se uma distribuição normal com média 50 e desvio padrão 6. Pergunta-se qual a
proporção de alunos com notas superiores a 60? Qual o número de alunos com notas entre
35 e 45?

Resolução(1): transformando a nota 60 em desvios reduzidos, tem-se:

x - x 60 − 50
z= = = 1,67
s 6

(consultando na tabela, verifica-se):

Probabilidade de a nota ser superior a 60 é


dada por: 0,5 – 0,4525 = 0,0475 ou 4,75%.

Resolução(2): calculando os desvios reduzidos, tem-se:

x - x 45 − 50
z1 = = = −0,83
s 6
x - x 35 − 50
z2 = = = −2,50
s 6

(consultando na tabela):

P(45 < x < 50) → z1 = -0,83 ➔ 0,2967

P(35 < x < 50) → z2 = -2,50 ➔ 0,4938

Probabilidade (área) entre 35 e 45 ➔ 0,4938 – 0,2967 = 0,1971

(0,1971 x 198 = 39 alunos)

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 58

ÁREA SUBTENDIDA PELA CURVA NORMAL REDUZIDA DE 0 A Z

Estatística (versão 2022a) MODESTO, Marco Antonio


59 Fatec Bauru

Exercícios

[1] Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio
padrão 25. Determine a probabilidade de um indivíduo submetido ao teste ter nota entre 75
e 125. E entre 115 e 125.
r.: 68,26% 11,56%

[2] Suponha que o tempo de resposta na execução de um algoritmo é uma variável aleatória
com distribuição normal de média 23 segundos e desvio padrão de 4 segundos. Calcule a
probabilidade para que o tempo de resposta fique entre 20 e 30 segundos.
r.: 73,33%

[3] Determinar os valores de z simétricos em relação a origem, que entre si abrangem 95%
da área total. Idem para os 99% da área total. r.: 1,96 2,575

[4] Seja um teste de inteligência aplicado a um grupo de 1000 alunos de uma escola
superior. Obteve-se uma distribuição normal, com média de 32 e desvio padrão de 4. Qual
o número de alunos com notas superiores a 38? E inferiores a 35? Qual o número de
alunos com notas compreendidas entre 27 e 31?
r.: 67 773 296

[5] Foi realizado um exame cuja média foi 78 com desvio padrão de 10. Determine os
escores reduzidos de dois estudantes cujas notas foram 93 e 62 respectivamente e
interprete o valor do score z. Determine a nota de dois estudantes cujos escores reduzidos
foram, respectivamente, -0,60 e 1,20.
r.: 1,50 e -1,60 (direita e esquerda) 72 e 90

[6] A durabilidade de um certo componente eletrônico é normalmente distribuída com


média de 500 dias e desvio padrão de 50 dias. Qual a probabilidade de um componente
qualquer durar entre 425 e 575 dias? E mais de 575 dias? Qual o número de dias
necessários para se repor, no máximo, 10% dos componentes?
r.: 86,64% 6,68% 436 dias

[7] O tempo para que um Sistema Computacional execute determinada tarefa é uma
variável aleatória com distribuição normal, com média 320 segundos e desvio padrão de 7
segundos. Qual a probabilidade de que a tarefa seja executada entre 310 e 330 segundos?
r.: 84,72%

[8] Um processo industrial produz peças com diâmetro médio de 2,00” e desvio padrão de
0,018”. Peças cujo diâmetro médio se afastam da média por mais de 0,03” são consideradas
defeituosas. Admitida a normalidade, num lote de 1000 peças, quantas peças defeituosas
teremos? r.: 95

[9] O tempo de atendimento de um cliente em um Banco é uma variável normalmente


distribuída, com média de 15 minutos e desvio padrão de 3 minutos. Qual a probabilidade
de um cliente ser atendido entre 15 e 18 minutos? Ser atendido entre 12 e 18 minutos?
r.: 34,13% 68,26%

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 60

Teste de Hipóteses

Introdução
Na prática, somos chamados a tomar decisões acerca de populações, baseadas nas
informações das amostras. Este tipo de situação é um exemplo de inferência estatística e,
ao contrário do que possa parecer, é relativamente frequente no dia a dia de empresas.
Tome-se, como exemplo, a decisão de substituir um equipamento por outro, similar ou
mais avançado tecnologicamente. Esta tomada de decisão requer estudos sobre
desempenho, custo e confiabilidade, entre outros fatores. Neste caso, o procedimento usual
é a comparação dos dados referentes ao novo equipamento com os dados referentes ao
equipamento a ser substituído. Somente após esta comparação é que se toma a decisão de
efetuar, ou não, a troca. O que temos aqui é uma típica aplicação da Teoria da Decisão
Estatística (TDE), já que, por mais detalhados que sejam os estudos, sempre haverá uma
margem de incerteza quanto à correção da decisão tomada.

Hipótese Estatística
Hipótese estatística é uma afirmação a respeito da distribuição de uma ou mais
variáveis. A partir de amostras faremos suposições sobre os parâmetros de uma população.
São exemplos de hipóteses estatísticas: a média populacional da altura dos brasileiros é
170 cm; a proporção de brasileiros com a doença Y é 35%. Na situação tomada como
exemplo no início deste capítulo, poderíamos formular duas hipóteses. A primeira poderia
ser: “A substituição do equipamento não acarretará nenhum ganho de produtividade”. A
segunda hipótese poderia ser: “A substituição do equipamento acarretará um ganho
expressivo de produtividade”. A prova ou o teste de uma hipótese estatística é uma regra
que, obtidos os valores amostrais, conduz a uma decisão de aceitar ou rejeitar a hipótese
considerada.

Tipos de Hipóteses
Na TDE são formuladas duas hipóteses, chamadas hipótese nula (H0) e hipótese
alternativa (H1). Ambas dizem respeito, essencialmente, a um parâmetro (valor
populacional) e ao seu respectivo estimador (valor amostral).

Estatística (versão 2022a) MODESTO, Marco Antonio


61 Fatec Bauru

• Hipótese Nula (H0): é a hipótese a ser testada;

• Hipótese Alternativa (H1): é qualquer hipótese diferente da hipótese nula.

A hipótese nula afirma que não há diferença entre o parâmetro (população) e o


estimador (amostra). A hipótese alternativa deve sempre contradizer a hipótese nula.

Teste de Hipótese
Um teste de hipótese estatística é uma regra geral tal que, quando os valores de uma
amostra são obtidos, leva à decisão de aceitar ou rejeitar a hipótese considerada. Supondo

que a média () de uma população seja o parâmetro a ser testado, as hipóteses nula (H0) e

alternativa (H1), geralmente são enunciadas assim:

H o :  =  o
1. Teste bicaudal ou bilateral: 
 H1 :    o

H o :  =  o
2. Teste unicaudal ou unilateral à direita: 
 H1 :    o

H o :  =  o
3. Teste unicaudal ou unilateral à esquerda: 
 H1 :    o

Ao se tomar uma decisão a partir da verificação das hipóteses estatísticas, há sempre


uma probabilidade de se cometer um erro, representado pela aceitação errônea de uma
hipótese.

Na TDE esta probabilidade é chamada nível de significância ().

Em um teste de hipótese podem ocorrer dois tipos de erros. Um erro de decisão é


cometido quando se aceitar como verdadeira uma hipótese comprovadamente falsa, ou
ainda quando se aceita como falsa uma hipótese verdadeira.

• Erro do tipo 1: rejeitar a hipótese H0 quando ela é verdadeira;

• Erro do tipo 2: aceitar a hipótese H0 quando ela é falsa.

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 62

Dentro da teoria de Teste de Hipótese, destacamos também as regiões de aceitação e


rejeição. A região de aceitação (RA) é a região na qual se aceita a hipótese nula (H 0). E a
região de rejeição (RR), também chamada de região crítica (RC) é a região de rejeição da
hipótese nula (H0), sendo complementar à região de aceitação.

Calculando a estatística amostral pela seguinte fórmula:

 x é a média da amostra
x − o 
z=   o é a média da população
s , onde: 
 s é o desvio padrão da população
n n é o número de elementos da amostra

Finalmente, tiramos as conclusões:

• Se o valor observado (Vcalc ) pertencer à região de aceitação (RA), a decisão é a de


não rejeitar H0;

• Se o valor observado (Vcalc ) pertencer à região de rejeição (RR), a decisão é a de


rejeitar H0.

Os valores críticos de z relativos aos níveis de significância () usados com maior
frequência são dados abaixo:

Estatística (versão 2022a) MODESTO, Marco Antonio


63 Fatec Bauru

Vejamos um exemplo para aplicarmos o que foi visto acima: um fabricante de


material eletrônico desenvolve um condutor sobre a qual ele afirma que tem resistência de
15 ohms e desvio padrão de 0,8 ohms. Teste a hipótese de que  o = 15 ohms contra a

hipótese de que  o ≠ 15 ohms, se uma amostra de 50 condutores foi testada e apresentou

uma média de resistência de 14,8 ohms. Use um nível de 5%.

Resolução:

Obtendo as informações dadas no enunciado da questão:

o = 15 x = 14,8 s = 0,8 n = 50  = 0,05

Definindo a hipóteses a serem testadas e o tipo de teste a ser aplicado:

H o :  o = 15
 (Teste bilateral com nível de significância de 0,05)
 H1 :  o  15

Da tabela para testes bilaterais, temos:

x − o 14,8 − 15
Cálculo do z = = = − 1,77 (valor que se localiza na região de
s 0,8
n 50
aceitação).

Logo, aceitamos H0 e rejeitamos H1, ou seja, a um nível de significância de 0,05


concluímos que  o = 15 ohms.

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 64

Exercícios

[1] A vida média de uma amostra de 100 lâmpadas fluorescentes fabricadas por
determinada empresa é de 1570 horas, com desvio padrão de 120 horas. Se  o é a vida
média de todas as lâmpadas fabricadas pela empresa, teste a hipótese  o = 1600 horas
contra a hipótese alternativa  o ≠ 1600 horas, utilizando um nível de significância de 0,05.

[2] No exercício anterior, utilizando o mesmo nível de significância, teste a hipótese nula
o = 1600 horas contra a hipótese alternativa o < 1600 horas.

[3] Em certo Banco de Dados, o tempo para a realização das buscas é aproximadamente
normal, com média de 53 s e desvio padrão de 14 s. Depois de realizadas algumas
modificações no sistema, observou-se que, em 30 consultas, o tempo médio caiu para 45 s.
Num nível de significância de 1%, há evidência de melhoria?

[4] Aplicou-se um teste de QI a um grupo de 2970 pessoas da mesma idade. Obteve-se os


seguintes resultados: média igual a 104 e desvio padrão: 17,03. Deseja-se, a partir desses
dados, comprovar a hipótese de que a média da população onde foi extraída a amostra
acima seja igual a 100, ou seja, admitir que estas 2970 crianças não são mais inteligentes
que a média; já que no teste em estudo o QI médio é igual a 100. Adote erro igual a 5%.

[5] A associação dos proprietários de instituições hospitalares está muito preocupada com o
tempo perdido com acidentes de trabalho, cuja média nos últimos tempos, tem sido da
ordem de 60 horas/homem por ano. Tentou-se um programa de prevenção de acidentes,
após o qual foi tomada uma amostra de 9 Hospitais e medido o número de horas/homens
perdidas por acidente, que foi de 50 horas e desvio padrão de 20 horas/homem. Você diria,
no nível de 5%, que há evidência de melhoria?

[6] Uma fábrica de cigarros anuncia que o índice de nicotina dos cigarros da marca Y
apresenta-se abaixo de 26mg por cigarro. Um laboratório realiza 10 análises do índice
obtendo: 26, 24, 23, 22, 28, 25, 27, 26, 28, 24. Sabe-se que o índice de nicotina dos
cigarros da marca Y se distribui normalmente com variância de 5,36 mg 2. Pode-se aceitar a
afirmação do fabricante, ao nível de 5%?

Estatística (versão 2022a) MODESTO, Marco Antonio


65 Fatec Bauru

[7] Um fabricante de lajotas cerâmicas introduz um novo material em sua fabricação e


acredita que aumentará a resistência média, que é de 206 kg. A resistência da lajota tem
distribuição normal com desvio padrão de 12 kg. Retira-se um lote de 30 lajotas, obtendo

x = 210 kg. Ao nível de 10%, pode o fabricante aceitar que a resistência média de suas
lajotas tenha aumentado?

[8] Uma fábrica de equipamentos hospitalares anuncia que seus equipamentos consomem,
em média, 11 kWh por 100 horas de uso mensal, com desvio padrão de 0,8 kWh. Uma
revista médica decide testar essa afirmação e analisa 35 equipamentos dessa marca,
obtendo 11,4 kWh por 100 horas de uso mensal, como consumo médio. Admitindo que o
consumo tenha distribuição normal, ao nível de 10% o que a revista concluirá sobre o
anúncio do fabricante?

[9] A fim de acelerar o tempo que um analgésico leva para surtir efeito, um químico analista
acrescentou certo ingrediente à fórmula original, que acusava um tempo médio de 43
minutos para fazer efeito. Em 49 observações com a nova fórmula, obteve-se um tempo
médio de 41 minutos, com desvio padrão de 10 minutos. Num nível de 5% de significância,
a nova fórmula é melhor, pior ou igual à anterior?

[10] O tempo para transmitir 10MB em determinada rede de computadores varia segundo
um modelo normal, com média 7,4 s e variância 1,3 s2. Depois de algumas mudanças na
rede acredita-se numa redução no tempo de transmissão de dados, além de uma possível
alteração na variabilidade. Foram realizados 10 ensaios independentes com arquivo de
10MB e anotados os tempos de transmissão, em segundos: 6,8 ; 7,1 ; 5,9 ; 7,5 ; 6,3 ; 6,9 ;
7,2 ; 7,6 ; 6,6 e 6,3. Existe evidência suficiente de que o tempo médio de transmissão foi
reduzido? Use nível de significância de 10%.

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 66

Exercícios Complementares

[1] Dois dados são lançados conjuntamente. Determine:


(a) o espaço amostral deste experimento aleatório;
(b) a probabilidade de que a soma das faces seja igual ou maior que 10;

[2] Um número inteiro é escolhido aleatoriamente dentre os números E = {1, 2, 3, ..., 48, 49,
50}. Determine a probabilidade de:
(a) o número ser divisível por 5;
(b) o número terminar em 3;
(c) o número ser divisível por 4 e por 6;

[3] Um lote é formado por dez peças boas, quatro com defeitos leves e duas com defeitos
graves. Uma peça é escolhida ao acaso deste lote. Calcule a probabilidade de que:
(a) ela não tenha defeitos graves;
(b) ela não tenha defeitos;
(c) ela seja boa ou tenha defeitos graves;

[4] Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio
padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota:
(a) maior que 120;
(b) maior que 80;
(c) entre 85 e 115;
(d) maior que 100;

[5] A vida média útil de um determinado componente eletrônico é de 850 dias e desvio
padrão de 40 dias. Sabendo que a vida útil é normalmente distribuída, calcule a
probabilidade de esse componente durar:
(a) entre 700 e 1000 dias;
(b) mais de 800 dias;
(c) menos de 750 dias;

Estatística (versão 2022a) MODESTO, Marco Antonio


67 Fatec Bauru

[6] O valor médio gasto, por mês, com manutenções na rede é de R$ 2.000,00 com desvio
padrão de R$ 500,00. Qual a probabilidade de um mês apresentar valores gastos:
(a) entre R$ 1.000,00 e R$ 1.500,00?
(b) acima de R$ 2.500,00?
(c) abaixo de R$ 1.750,00?

[7] Retirada uma amostra de dezesseis parafusos obteve-se as seguintes medidas para seus
diâmetros:
10 10 11 12 12 13 14 15
15 10 11 12 12 13 14 14
Testar, num nível de significância de 0,05: (a) H0 :  o = 12,5 contra  o ≠ 12,5;

(b) H0 :  o = 12,5 contra  o > 12,5;

(c) H0 :  o = 12,5 contra  o < 12,5;

[8] Um determinado vegetal tem estatura normal com variância de 2 cm2 e média de 50 cm.
Com o intuito de melhorar geneticamente o crescimento desse vegetal aplicou-se um novo
insumo agrícola. Para comprovar a eficiência desse insumo, foram coletadas vinte
amostras, cujos resultados são em cm:
48 50 52 49 49 54 52 47 52 49
53 52 50 49 49 54 46 56 49 58
Pode-se afirmar ao nível de 0,05 que este insumo surtiu efeito no crescimento desse
vegetal?

[9] Um fabricante de pneus alega que seus pneus têm duração média de rodagem igual a
26.000km e desvio padrão de 2.500 km. Uma revista pretendendo verificar esta afirmação
faz um teste de rodagem com 45 pneus deste fabricante e obtém uma média de rodagem
igual a 24.600 km. O que a revista conclui sobre o que o fabricante anuncia, a um nível de
significância de 0,01?

[10] A tensão de ruptura dos cabos produzidos por um fabricante apresenta a média de
1800 kg e o desvio padrão 100 kg. Mediante nova técnica no processo de fabricação,
proclamou-se que a tensão de ruptura pode ter aumentado. Para testar essa declaração,
ensaiou-se uma amostra de 50 cabos, tendo-se determinado a tensão média de ruptura de
1850 kg. Pode-se dizer que a tensão de ruptura aumentou se usarmos o nível de
significância de 0,01?

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 68

Formulário para Avaliações


►Fórmula de Struges para determinar quantidade de classes:

k = 1 + 3,322. log n

►Fórmula para determinar a amplitude (h) de cada classe:

AT
h=
k

►Fórmula para cálculo da média para dados não agrupados:

x1 + x 2 + x 3 + ... + x n
X=
n

►Fórmula para cálculo da média para dados agrupados em Distribuição de Frequência:

 (f .x ) i i
X= i= 1
n

fi= 1
i

►Fórmula de Czuber para cálculo da Moda para Distribuição de Frequência com classes:

1
Mo = li + .h
1 +  2

►Fórmula para cálculo da Mediana para Distribuição de Frequência com classes:

 fi 
 − Fant  . h
 2 
Md = l i + 
fi

►Fórmula para cálculo dos Quartis (k = 1, 2 ou 3):

 k . f i 
 − Fant  . h
 4 
Q k = li + 
fi

►Fórmula para cálculo dos Percentis (k = 1, 2, 3, ..., 97, 98, 99):

 k . f i 
 − Fant  . h
 100 
Pk = l i + 
fi

Estatística (versão 2022a) MODESTO, Marco Antonio


69 Fatec Bauru

►Fórmula para cálculo da Variância para dados não agrupados:

(x1 − x ) 2 + (x 2 − x ) 2 + (x 3 − x ) 2 + ... + (x n − x ) 2
S2 =
n -1

►Fórmula para cálculo do Desvio Padrão para dados não agrupados:

(x i − x ) 2
S = S2 =
n -1

►Fórmula para cálculo do Desvio Padrão para dados agrupados em Distribuição de


Frequência:

 (f i . x i )   (f i . x i ) 
2 2

S = S2 = − 
n  n 

►Fórmula para cálculo do Coeficiente de Variação:

s
CV = .100
x

►Fórmula para cálculo da Probabilidade associada a um evento:

n(A)
P(A) =
n(E)

►Fórmula para cálculo da Probabilidade de ocorrência de um evento A e evento B:

P(A  B) = P(A) . P(B)

► Fórmula para cálculo da Probabilidade de ocorrência de um evento A ou evento B:

P(A  B) = P(A) + P(B) − P(A  B)

►Fórmula para cálculo da unidade padronizada z (distribuição normal):

x-x
z=
s

►Fórmula para cálculo da unidade padronizada z para Testes de Hipóteses:

x − o
z=
s
n

Estatística (versão 2022a) MODESTO, Marco Antonio


Fatec Bauru 70

Referências Bibliográficas

BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2007.

CARVALHO, Sérgio; CAMPOS, Weber. Estatística básica simplificada. Rio de Janeiro:


Elsevier, 2008.

GONZALEZ, Norton. Estatística básica. Ciência Moderna, 2009.

LAURENTI, Ruy ... [et al.]. Estatísticas de saúde. 2. ed. ver. e atual. São Paulo: EPU, 2005.

PAGANO, Marcello. Princípios de Bioestatística. São Paulo: Cengage Learning, 2008.

RIBEIRO, Osni Moura. Estatística fácil. Saraiva, 2009.

TRIOLA, M. F. Introdução à Estatística. 10. Ed. Rio de Janeiro: LTC, 2008.

Estatística (versão 2022a) MODESTO, Marco Antonio

Você também pode gostar