Escolar Documentos
Profissional Documentos
Cultura Documentos
PROBABILIDADE E ESTATÍSTICA
APLICADA
PROBABILIDADE E ESTATÍSTICA
APLICADA
Fábio Luís Fonseca
Jefferson Tadeu de Godoi Pereira
2021
O ENSINO DINÂMICO NA UNIVERSIDADE
SÃO FRANCISCO - USF
1
100%
EAD
100% da carga horária ofertada na modalidade à distância, com
atividades desenvolvidas no Ambiente Virtual de Aprendizagem, a
partir do modelo pedagógico e organização didática apresentada na
Sala Virtual.
2
50% da carga horária ofertada na modalidade à distância e 50% da mo-
dalidade presencial, com atividades desenvolvidas tanto em Ambiente
Virtual de Aprendizagem quanto presencialmente. Para garantir o diá-
50% EAD logo entre esses espaços de aprendizagem temos a “Trilha de Aprendi-
50% Presencial zagem Dinâmica”.
3
100%
Presencial
100% da carga horária ofertada na modalidade presencial, com ativida-
des desenvolvidas em sala de aula ou em modernos laboratórios.
Este componente curricular tem 50% de sua carga horária ofertada na modalidade à distância e 50% da modalidade
presencial e, portanto, será desenvolvido segundo a “Trilha de Aprendizagem Dinâmica”, com atividades relacionadas
aos movimentos do CONECTAR (C), DESENVOLVER (D) e PRATICAR (P), que chamamos de CICLO CDP. Suas te-
máticas serão desenvolvidas durante este semestre e estão organizadas em semanas letivas e, para cada uma delas,
você percorrerá um “Ciclo CDP”. A seguir apresentamos detalhadamente os movimentos deste ciclo de aprendizagem.
Conectar
Para iniciar seus estudos, em cada semana letiva, você re-
aliza a atividade do CONECTAR, através da leitura do texto
da unidade de aprendizagem da respectiva semana letiva e
participa de atividade organizada e mediada pelo seu pro-
fessor. Tudo acontece dentro da Sala Virtual, antecedendo o
encontro com seu professor.
Desenvolver
O encontro síncrono com o professor e seus colegas de turma acon-
tece na sequência, no movimento do DESENVOLVER. O professor
aprofundará as discussões, com atividades teóricas e/ou práticas.
Por meio da utilização de metodologias dinâmicas (ativas), é valori-
zado seu protagonismo e autonomia e são desenvolvidas as compe-
tências necessárias para atuar no mercado e na sociedade.
Praticar
Para encerrar o ciclo de aprendizagem da semana letiva, você realiza as
atividades da Prática de Competências no movimento PRATICAR, que
também acontece na Sala Virtual, seguindo o prazo estipulado pelo pro-
fessor. Você será desafiado a buscar soluções inovadoras para proble-
mas reais, integrando teoria e prática. A partir do feedback do professor,
você poderá acompanhar seu desempenho.
SAIBA MAIS
BONS ESTUDOS!
UNIDADE 2
AMOSTRAGEM E PARÂMETROS
DA AMOSTRA NA ESTATÍSTICA
DESCRITIVA
` Interpretar os resultados obtidos dos parâmetros de posição central como também sobre o
resultado do desvio padrão.
` Ilustrar os resultados de média, moda e mediana. Explicar o conceito de grupo de dados ho-
mogêneos e heterogêneos por meio do resultado do desvio padrão. Comparar dois ou mais
grupos de dados amostrais por meio de valores relativos.
O processo para se obter uma amostra é conhecido como amostragem e pode ser
classificada como:
` Amostragem casual ou simples.
` Amostragem sistemática.
De forma geral, uma variável quantitativa discreta é aquela que é representada apenas
por valores inteiros (Figura 2), enquanto as variáveis quantitativas contínuas são repre-
sentadas por qualquer valor real dentro de um intervalo (Figura 01).
11
U2 Amostragem e parâmetros da amostra na estatística descritiva
Fonte: 123RF.
Fonte: 123RF.
1.1. AMOSTRAGEM CASUAL OU SIMPLES
Este tipo de amostragem é equivalente a um sorteio lotérico, ou seja, cada elemento
da população tem a mesma chance de compor a amostra. Na prática, a amostragem
simples pode ser realizada numerando a população de 1 a n e, em seguida, sorteando,
por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais
corresponderão aos elementos pertencentes à amostra.
Como exemplo, pense em uma pesquisa sobre a estatura de uma população de 90 alu-
nos de um curso de engenharia, com tamanho de amostra desejado de 9 estudantes.
Para realizar o sorteio, pode-se enumerar os alunos de 1 a 90 e retirar, um a um, nove
números. Outra maneira de se extrair essa amostra é pela tabela de números aleatórios.
Para gerar uma tabela de números aleatórios utilizando o Excel, basta seguir as etapas
a seguir.
02. Arrastar a função inserida na célula A1 para quantas linhas e colunas desejar, como
indicado na Figura 03 (b).
Figura 03. Imagens ilustrativas para gerar planilha de números aleátorios
Fonte: elaborada pelos autores no Excel.
Para que todas as células da tabela tenham o mesmo número de algarismos, selecione
a tabela inteira, clique com o botão direito do mouse e siga as etapas (Formatar Células
>>> Número >>> Personalizado) para chegar na configuração indicada na Figura 04.
Figura 04. Imagem ilustrativa da configuração para determinar o
número de algarismos/dígitos desejados
No campo “Tipo”, digite 000, indicando que todas as células tenham três algarismos.
Após, clique em OK. Desta forma, obtemos uma tabela de números aleatórios, confor-
me a Figura 05.
Figura 05. Modelo de tabela de números aleatórios
a. Com os dados da população numerados de 1 a n, defina quantos algarismos são neces-
sários formar a quantidade n.
b. Defina uma linha e uma coluna que serão utilizadas como ponto de partida para o sor-
teio dos elementos da amostra.
c. Defina uma direção de leitura da tabela – pode ser vertical, horizontal ou diagonal.
d. Defina um sentido de leitura da tabela – sendo a direção vertical, pode ser de cima para
baixo ou de baixo para cima. Sendo a direção horizontal, pode ser da esquerda para a
direita ou da direta para a esquerda.
e. Realize a leitura dos elementos da tabela conforme as definições apresentadas nos itens
de “a” até “d”.
Exemplo: como temos uma população formada por 90 elementos, a leitura será feita a
partir da 2ª linha, 1ª coluna, direção horizontal (esquerda para direita), sentido vertical (de
cima para baixo). Observe a representação na Figura 06.
Figura 06. Representação do sorteio dos elementos a partir da tabela
de números aleatórios
Observações:
` Caso uma única linha/coluna não seja suficiente para se obter a amostra desejada, deve-
-se continuar o sorteio dos elementos na linha/coluna imediatamente subsequente.
` Caso ocorra o sorteio de um número que não pertença ao intervalo formado pela popula-
ção, este deve ser descartado, selecionando assim o próximo elemento na sequência in-
dicada pela tabela. O mesmo vale para o sorteio de um número que já compõe a amostra.
No exemplo abaixo, adota-se uma população formada por alunos dos cursos de enge-
nhria de uma determinada instituição de ensino. Pode-se perceber que ela pode ser
dividida em dois subgrupos, aqui chamados de estratos, a partir do gênero dos indivídu-
os, masculino ou feminino. Portanto, existe a possibilidade de se criar os dois estratos
(quanto ao gênero).
Após o cálculo do número amostral por estrato (categoria), prossiga com a escolha dos
homens e mulheres que vão compor a amostra por meio de sorteio ou utilização de uma
tabela de números aleatórios (conforme o modelo indicado na Figura 5).
Para coletar uma amostra dos produtos de uma linha de produção, é comum ser utiliza-
da a amostragem sistemática.
Suponha que em um lote de 800 peças produzidas deseja-se obter uma amostra de
40 unidades para ser analisada. Com isso, realiza-se o cálculo: 800/40 = 20. Como as
peças estão dispostas em fila, sorteia-se qual peça será a primeira. Admitindo que no
EXEMPLO
sorteio a primeira peça escolhida é a de quinta posição, temos que a segunda peça a
ser analisada é a 25ª (5 + 20 = 25) e, assim, sucessivamente até completar 20 peças.
Neste caso, a amostra seria composta pelas peças de posição: 5, 25, 45, 65, 85, 105,
125, ... , 765 e 785.
1 1 2 N . n0
n0 = n=
E02 N + n0
Em que:
n → tamanho da amostra
N → tamanho da população
Um experimento está sendo realizado a partir de uma população formada por 20.000
indivíduos. Adotando um erro tolerável de 5%, calcule o tamanho da amostra.
N = 20000 E0 = 0, 05
Realiza-se a primeira aproximação da amostra, por meio da seguinte fórmula:
1 1
n0
= = = 400
E0 0, 052
2
EXEMPLO
Como o tamanho da amostra se caracteriza como uma variável que admite apenas
valores inteiros, devemos adotar o arredondamento para o próximo número inteiro.
Isso garante a eficiência do erro, ou seja, melhoramos o erro amostral tolerável.
2. PARÂMETROS DE POSIÇÃO
As medidas de tendência central são usadas para indicar um valor que tende a melhor
representar um conjunto de dados. Geralmente, localizam-se em torno do meio (centro)
de uma distribuição, onde a maior parte dos dados tende a se concentrar.
3
∑
n
x
i =1 i
x=
n
Em que:n
∑ i =1xi a média aritmética.
x =representa
n
∑ i =1xi os valores da variável analisada.
n
x=
n n a quantidade de valores analisados.
Pode-se pensar na média como um valor que representa uma distribuição amostral de
valores.
n 7
65 + 63 + 57 + 48 + 64 + 60 + 61 418
=x = ≅ 59, 7
7 7
Observação: para o arredondamento de valores relacionados ao cálculo da média de
uma amostra, será utilizada a regra de arredondamento apresentada na Unidade 1.
Além disso, o valor da média deverá ser apresentado com uma casa decimal a mais do
que os dados utilizados para o cálculo. No exemplo anterior, os dados foram represen-
tados por números inteiros, portanto, a média apresenta um algarismo após a vírgula.
Logo, podemos concluir que, em média, a cada 10 minutos são envazados 59,7 recipientes.
2.2. MEDIANA
Outra medida de posição é conhecida como mediana, aqui indicada por . Ela é definida
como o número que se encontra no centro de um conjunto de dados (valores), estando
este conjunto de valores disposto segundo uma ordem (crescente ou decrescente).
Em seguida, é preciso indicar o valor que ocupa a posição central. Observe que este
valor dividirá o conjunto destas temperaturas de forma que apresentará o mesmo núme-
ro de elementos à direita e à esquerda. Neste caso, o elemento mediano (temperatura
mediana) é o que ocupará a 5ª posição na ordem crescente, ou seja, Md= 10 °C .
Dado um conjunto com uma quantidade par de valores (ou amostras), a mediana será o
valor médio compreendido entre dois valores centrais da sequência ordenada.
A mediana será dada pela média aritmética entre 10 e 12, ou seja, pelos elementos que
ocupam a 4ª e a 5ª posições, respectivamente.
10 + 12
Md
= = 11
2
Logo, o número mediano de atendimentos nos dois primeiros quadrimestres será igual a 11.
Por outro lado, a mediana não é influenciada pelos valores extremos, isto é, considera ape-
nas o valor do centro (ou valores do centro) do conjunto de dados.
24 25 26 27 28 30 50
Mediana média
Podemos observar que a média é igual a 30 minutos, enquanto a mediana é de 27. Ou seja, a
média é influenciada por um valor extremo (50 min.), enquanto que a mediana apenas separa
o conjunto ao meio (50%).
2.3. MODA
Moda (Mo) é o valor que ocorre com maior frequência em uma sequência de valores ou
em um conjunto de dados amostrais.
Exemplo 1:
2, 8, 6, 5, 4, 6, 1, 0, 6, 7, 9, 3
Resolução:
Observe que a moda é igual a 6 ( = 6), já que é a nota que ocorre com maior frequ-
EXEMPLO
ência (3 vezes).
Exemplo 2:
Salários (em R$) de alguns funcionários de uma indústria química. Encontre a moda:
1500, 600, 1460, 1200, 1500, 670, 900, 1200, 1750, 1500.
Resolução:
Mo =1500
Amodal:
Quando não existe valor que apareça mais vezes em relação aos outros, ou seja, não apre-
senta um valor que possua maior frequência. Por exemplo: 3, 5, 8, 10, 12, 13. Observe que,
neste caso, cada valor só aparece, “ocorre”, uma única vez.
Bimodal:
Quando a sequência ou o conjunto tem dois valores modais, ou seja, dois valores que apre-
sentam a mesma frequência e esta frequência é a maior do conjunto. Por exemplo, em:
2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9.
Exercício comentado 1.
A amostra de dados representada a seguir indica o quantitativo de pacientes atendidos em
um posto de serviço médico de uma empresa fabricante de componentes elétricos.
Resolução:
14 + 21 + 9 + 11 + 8 + 19 + 25 + 22 + 21 + 15
x = 16,5
10
Para de determinar a mediana , coloque os dados em ordem crescente (rol).
8 9 11 14 15 19 21 21 22 25
A partir dos dados ordenados, identifica-se os elementos centrais. Como se tem um par,
identifca-se dois elementos centrais:
8 9 11 14 15 19 21 21 22 25
15 + 19
Md
= = 17
2
Assim, a mediana desta amostra é igual a 17.
O elemento que mais se repete no conjunto, ou seja, aquele que apresenta a maior frequên-
cia, é 21. Portanto, a moda é igual a 21.
Exercício comentado 2.
Resolução:
24 25 26 27 50
Md = 26
Calcula-se a média:
24 + 25 + 26 + 27 + 50
=x = 30, 4
5
Observa-se que a amostra de dados não possui repetição nos elementos. Sendo assim, esta
amostra caracteriza-se como amodal.
Pode-se afirmar que a mediana representa melhor esse conjunto de dados, pois, ao obser-
varmos os dados, percebemos uma maior tendência de concentação dos valores em torno
dela, quando comparada com a média.
Exercício comentado 3.
11 5 6 6 10 7 7
Resolução:
11 + 5 + 6 + 6 + 10 + 7 + 7
=x = 7, 4
7
Mo = 6 e Mo = 7 bimodal
Rol: 5 6 6 7 7 10 11 Md = 7
Md
50% 50%
Observa-se que a mediana divide o conjunto de dados em duas partes iguais (50%).
3. PARÂMETROS DE DISPERSÃO
Nos tópicos anteriores foram abordadas as medidas de tendência central (média, moda
e mediana). Estas medidas apresentam características sobre a amostra analisada e
têm por finalidade fornecer parâmetros sobre a população. Limitar-se apenas ao cálculo
e análise das medidas de tendência central, principalmente a média, pode incorrer em
erros, dependendo do que se pretende analisar.
Um aluno A tem média igual a 5, nota oriunda de duas avaliações, sendo que em uma
ele tirou 0 e na outra tirou 10. Um outro aluno, B, tem a mesma média, porém, com as
EXEMPLO
dispersão dos dados para uma melhor interpretação e avaliação dos dados obtidos.
Em outras palavras, o parâmetro que representa os dados amostrais é a média, mas,
ela não pode ser analisada de forma isolada para se aferir o grau de homogeneidade,
ou seja, para mensurar a variabilidade do conjunto de dados.
3.1. AMPLITUDE
Para calcular a amplitude total de conjunto de dados, fazemos a subtração entre o va-
lor máximo e o valor mínimo, ou seja, a amplitude é a diferença entre o maior e o menor
valor do conjunto de dados.
4 AT
= xmáx − xmín
Em que:
AT – representa a amplitude.
Exemplo:
55 38 49 63 47 39 62 37
EXEMPLO
Resolução:
Podemos observar que o maior valor do conjunto é 63 e o menor valor é igual a 37.
Logo, a amplitude total será:
AT = 63 − 37 = 26
3.2. VARIÂNCIA
A variância tem o objetivo de analisar o grau de variabilidade em determinadas situa-
ções. Através dela podemos perceber desempenhos iguais, muito próximos ou muito
distantes. A média aritmética pode ser usada para avaliar situações de forma geral, já
a variância determina de forma mais específica as possíveis variações, no intuito de
não comprometer os resultados da análise. Vamos analisar a eficiência da variância por
meio de um exemplo.
A: 6 – 6 – 6 – 6 – 6 – 6
B: 7 – 6 – 5 – 2 – 8 – 9
C: 4 – 5 – 5 – 6 – 8 – 7
D: 1 – 9 – 6 – 3 – 7 – 4
Primeiramente, ele irá calcular as médias de cada linha de produção, que são apresen-
tadas abaixo:
x A = 6 mm xB ≅ 6, 2 mm xC ≅ 5,8 mm xD = 5 mm
A variância amostral deve ser calculada pela soma dos quadrados das diferenças
entre cada valor observado e o valor médio, dividido pelo total de valores observados.
A diferença serve para mostrar quanto um valor observado se distancia do valor médio.
∑ (x − x)
n 2
5 2 i
s = i =1
n −1
Em que:
s 2 - variância amostral.
xi - valores da variável observada.
x - média dos valores observados.
n - quantidade de dados amostrais.
Linha A x =6
s2
{=
( 6 – 6 ) ² + ( 6 – 6 ) ² + ( 6 – 6 ) ² + ( 6 – 6 ) ² + ( 6 – 6 ) ² + ( 6 – 6 ) ²}
0
5
Linha B x = 6, 2
s2 =
{( 7 – 6, 2 ) ² + ( 6 – 6, 2 ) ² + ( 5 – 6, 2 ) ² + ( 2 – 6, 2 ) ² + (8 – 6, 2 ) ² + ( 9 – 6, 2 ) ²}
5
=s2
{0, 64 + 0, 04 + 1, 44 + 17, 64 + 3, 24 + 7,84
=
} 30,84
≅ 6,17
5 5
Linha C x = 5,8
s2 =
{( 4 – 5,8) ² + ( 5 – 5,8) ² + ( 5 – 5,8) ² + ( 6 – 5,8) ² + (8 – 5,8) ² + ( 7 – 5,8) ²}
5
=s2
{3, 24 + 0, 64 + 0, 64 + 0, 04 + 4,84 + 1,=
44} 10,84
≅ 2,17
5 5
Linha D x= 5
s2 =
{(1 – 5) ² + ( 9 – 5) ² + ( 6 – 5) ² + ( 3 – 5) ² + ( 7 – 5) ² + ( 4 – 5) ²}
5
s2 =
{16 +16 +1+ 4 + 4 +1} =
42
= 8,4
5 5
Atenção: a unidade de medida a ser utilizada para a variância não é a mesma usada
nos dados originais ( u ) , devendo-se sempre adotar a u 2 . Ou seja, no exemplo ante-
rior, os dados originais foram expressos em milímetros mm , assim, a variância deverá
ser expressa em mm 2 .
Para obter o resultado do desvio padrão, basta calcular a raiz quadrada variância. Logo,
a fórmula do desvio padrão amostral é dada por:
∑ (x − x)
n 2
i
s= i =1
n −1
( )
2
∑
n
x
i =1 i
∑ i =1 i n
2 n
x −
s=
n −1
s
Linha A:= 0 0
= assim temos 6 ± 0
B: s
Linha= 6,17 ≅ 2, 48 assim temos 6,2 ± 2,48
C: s
Linha= 2,17 ≅ 1, 47 assim temos 5,8 ± 1,47
D: s
Linha = 8, 4 ≅ 2,9 assim temos 5 ± 2,9
A propriedade da média diz que: a soma de todas as diferenças entre a média e os va-
n
lores amostrais deve resultar necessariamente em zero, ou seja, ∑(x − x ) =
1
0. n
Segue um exemplo:
x xi x − xi
5 2 3
5 8 -3
5 1 4
5 9 -4
Total 0
As três primeiras subtrações (desvios) podem assumir qualquer valor, contudo, o quarto
desvio tem que ser tal que somado com os três anteriores comprove a propriedade da
média, ou seja, resulte em zero. Percebe-se então que dentre quatro elementos, três têm
liberdade e apenas um fica restrito a ser o valor preciso para ter-se a veracidade da pro-
priedade. Por consequência, se há quatro elementos, temos grau de liberdade igual a três.
4. PARÂMETROS RELATIVOS
Neste tópico será abordado o estudo do coeficiente de variação que apresenta como
resultado um valor relativo, ou seja, em porcentagem. Portanto, é possível realizar algu-
mas comparações como também analisar o quanto o parâmetro da média é consistente.
Imagine que se houver duas linhas de produção, em que na linha A fabrica-se quero-
sene em litros e na linha B fabrica-se a lata, em quilogramas, para armazenamento do
querosene. Suponha que um engenheiro queira realizar uma comparação entre as duas
linhas para verificar qual apresenta menor variabilidade, isto apenas será possível por
meio de valores relativos, uma vez que o número amostrado nas duas linhas apresenta
unidades de medida diferentes.
Em que:
x s
Estaturas 175 cm 5 cm
Massas 68 kg 2 kg
Logo, nesse grupo de indivíduos os valores de massas (em kg) apresentam maior grau
de dispersão do que os valores de estaturas (em cm).
Atenção: há de se ressaltar que para efeitos acadêmicos será usado os 25% como
parâmetro de homogeneidade, porém, para controle de qualidade os coeficientes de
variação deverão ser os menores possíveis.
1,1 1,4 2,0 1,0 1,2 1,3 1,6 1,1 1,3 2,0
xi xi2
1,1 1,21
1,4 1,96
2,0 4,00
1,0 1,00
1,2 1,44
EXEMPLO
1,3 1,69
1,6 2,56
1,1 1,21
1,3 1,69
2,0 4,00
∑ xi =
14 ∑ xi2 =
20,76
( )
2
∑ i =1xi
n
(14 )2
∑
n 2
x −
i =1 i
n 20, 76 −
10 20, 76 −19, 6 1,16
=s = = = ≅ 0,36
n −1 10 − 1 9 9
0,36
=Cv = .100 25, 71%
1, 4
Exemplo 2:
2,0 1,9 1,2 1,6 1,3 1,1 1,9 1,2 1,4 1,9
∑ xi = ∑ xi2 =
15,5 25,13
(15,5 )2
25,13 −
10
=s = 0,35
9
0,35
=Cv = .100 22,58%
1,55
Comparando o coeficiente de variação da linha de produção sobre envasamento de água
(em litros) com o ensacamento de açúcar (em quilograma), pode-se concluir que os dados
referentes ao ensacamento são mais homogêneos que os envasamentos de água.
Exercício prático 1.
Um frigorífico de bovinos possui quatro câmaras frias (geladeiras) para armazenar seus pro-
dutos. O gerente resolveu aferir as temperaturas, mas não coletou a mesma quantidade de
dados entre as geladeiras. Agora, o gerente quer averiguar as amplitudes das temperaturas
de cada geladeira (A, B, C e D), expressas em °F, com o objetivo de mensuar a dispersão
dos dados coletados. Portanto, calcule a amplitude dos dados anotados para cada geladeira.
a) Geladeira A: 1, 3, 5, 9.
Exercício prático 2.
Exercício prático 3.
Exercício 4.
Exercício 5.
Para facilitar um projeto de ampliação da rede de esgoto de certa região de uma cidade, as
autoridades tomaram uma amostra de 15 elementos dos 270 quarteirões que compõem a
região. O número de casas por quarteirão é apresentado no esquema abaixo.
3 10 13 15 16 16 18 22 18 23 18 7 16 9 8
Determine:
a) A média.
b) A variância amostral.
d) O coeficiente de variação.
Exercício 6.