Você está na página 1de 26

FÁBIO LUÍS FONSECA

JEFFERSON TADEU DE GODOI PEREIRA

PROBABILIDADE E ESTATÍSTICA
APLICADA
PROBABILIDADE E ESTATÍSTICA
APLICADA
Fábio Luís Fonseca
Jefferson Tadeu de Godoi Pereira

2021
O ENSINO DINÂMICO NA UNIVERSIDADE
SÃO FRANCISCO - USF

A USF, em seus 45 anos de história, sempre propôs modelos pedagógicos inovadores


e agora apresenta o “Ensino Dinâmico”, que oferece uma experiência significativa de
aprendizagem, reunindo o melhor dos universos do ensino à distância e presencial, com
uma matriz curricular que flexibiliza o tempo e o espaço escolar, respeita seu ritmo de
aprendizagem e permite o acompanhamento do seu aprendizado.

O “Ensino Dinâmico” apresenta diferentes espaços de aprendizagem, todos acessados


através do USF Connect. A matriz curricular dos cursos é constituída por Componentes
Curriculares (disciplinas) com cargas horárias distribuídas no ensino à distância e/ou pre-
sencial, conforme descrito abaixo:

1
100%
EAD
100% da carga horária ofertada na modalidade à distância, com
atividades desenvolvidas no Ambiente Virtual de Aprendizagem, a
partir do modelo pedagógico e organização didática apresentada na
Sala Virtual.

2
50% da carga horária ofertada na modalidade à distância e 50% da mo-
dalidade presencial, com atividades desenvolvidas tanto em Ambiente
Virtual de Aprendizagem quanto presencialmente. Para garantir o diá-
50% EAD logo entre esses espaços de aprendizagem temos a “Trilha de Aprendi-
50% Presencial zagem Dinâmica”.

3
100%
Presencial
100% da carga horária ofertada na modalidade presencial, com ativida-
des desenvolvidas em sala de aula ou em modernos laboratórios.

Importante lembrar que, durante a pandemia da COVID-19, as atividades presenciais po-


dem acontecer em ambiente remoto, no mesmo horário das aulas presenciais seguindo a
metodologia de aulas supervisionadas remotas da USF, ou presencialmente, em horários
previamente informados pelo professor, seguindo as normas sanitárias vigentes.
CICLO CDP

Este componente curricular tem 50% de sua carga horária ofertada na modalidade à distância e 50% da modalidade
presencial e, portanto, será desenvolvido segundo a “Trilha de Aprendizagem Dinâmica”, com atividades relacionadas
aos movimentos do CONECTAR (C), DESENVOLVER (D) e PRATICAR (P), que chamamos de CICLO CDP. Suas te-
máticas serão desenvolvidas durante este semestre e estão organizadas em semanas letivas e, para cada uma delas,
você percorrerá um “Ciclo CDP”. A seguir apresentamos detalhadamente os movimentos deste ciclo de aprendizagem.

Conectar
Para iniciar seus estudos, em cada semana letiva, você re-
aliza a atividade do CONECTAR, através da leitura do texto
da unidade de aprendizagem da respectiva semana letiva e
participa de atividade organizada e mediada pelo seu pro-
fessor. Tudo acontece dentro da Sala Virtual, antecedendo o
encontro com seu professor.

Desenvolver
O encontro síncrono com o professor e seus colegas de turma acon-
tece na sequência, no movimento do DESENVOLVER. O professor
aprofundará as discussões, com atividades teóricas e/ou práticas.
Por meio da utilização de metodologias dinâmicas (ativas), é valori-
zado seu protagonismo e autonomia e são desenvolvidas as compe-
tências necessárias para atuar no mercado e na sociedade.

Praticar
Para encerrar o ciclo de aprendizagem da semana letiva, você realiza as
atividades da Prática de Competências no movimento PRATICAR, que
também acontece na Sala Virtual, seguindo o prazo estipulado pelo pro-
fessor. Você será desafiado a buscar soluções inovadoras para proble-
mas reais, integrando teoria e prática. A partir do feedback do professor,
você poderá acompanhar seu desempenho.
SAIBA MAIS

Visite os links para saber mais sobre:


O Ensino Dinâmico na USF: https://www.youtube.com/watch?v=W-B7HTU1_y8.

Como ter acesso ilimitado aos recursos tecnológicos de aprendizagem: https://www.


youtube.com/watch?v=-7SuzbS4CYA.

Quais são as Ferramentas do USF Connect: https://www.youtube.com/watch?-


v=1kI4MaZ9QIQ.

Como funciona a Metodologia de Aulas Remotas da USF: https://www.youtube.com/


watch?v=0eGZNh4N0eM.

Quais são as normas que regem a “Prática de Competências”: https://www.usf.edu.br/


galeria/getImage/410/1720366361479788.pdf.

O Plano de Contingência para enfrentamento da COVID-19: https://www3.usf.edu.br/


galeria/getImage/252/2717033432743751.pdf.

Dinâmico é quando o ensino se adapta a sua história! E só uma Universidade com


muita história pode oferecer o ensino dinâmico que você precisa.

BONS ESTUDOS!
UNIDADE 2

AMOSTRAGEM E PARÂMETROS
DA AMOSTRA NA ESTATÍSTICA
DESCRITIVA

`  Compreender os diferentes tipos de amostragem e parâmetros de posição e dispersão.


COMPETÊNCIAS

`  Interpretar os resultados obtidos dos parâmetros de posição central como também sobre o
resultado do desvio padrão.

`  Ilustrar os resultados de média, moda e mediana. Explicar o conceito de grupo de dados ho-
mogêneos e heterogêneos por meio do resultado do desvio padrão. Comparar dois ou mais
grupos de dados amostrais por meio de valores relativos.

1. TIPOS DE AMOSTRAGEM E CÁLCULO DO TAMANHO DA


AMOSTRA
Na unidade anterior foram definidos os termos população e amostra. Também foi sa-
lientado que a amostra é um subconjunto finito de uma população e que, na maioria das
vezes, por impossibilidade, inviabilidade econômica ou temporal, limitamos as observa-
ções a uma parte da população, que definimos como amostra.

A importância da amostra no estudo da Estatística é muito relevante, pois, a partir da


análise das informações contidas neste subgrupo, pode-se inferir sobre as característi-
cas do grupo (população).

O processo para se obter uma amostra é conhecido como amostragem e pode ser
classificada como:
`  Amostragem casual ou simples.

`  Amostragem proporcional ou estratificada.

`  Amostragem sistemática.

Denomina-se como variável o conjunto de resultados possíveis de um fenômeno alea-


tório. As variáveis podem ser qualitativas, quando representam um conjunto de catego-
rias ou modalidades, ou quantitativas, quando representam um conjunto de números.
As variáveis quantitativas ainda podem ser contínuas ou discretas.

De forma geral, uma variável quantitativa discreta é aquela que é representada apenas
por valores inteiros (Figura 2), enquanto as variáveis quantitativas contínuas são repre-
sentadas por qualquer valor real dentro de um intervalo (Figura 01).

11
U2 Amostragem e parâmetros da amostra na estatística descritiva

Figura 01. Estudos de padrões de tempo Figura 02. Quantidade de componentes


gasto no transporte de uma área metropo- com falhas dentro de mil horas (variável
litana (variável quantitativa contínua) quantitativa discreta)

Fonte: 123RF.

Fonte: 123RF.
1.1. AMOSTRAGEM CASUAL OU SIMPLES
Este tipo de amostragem é equivalente a um sorteio lotérico, ou seja, cada elemento
da população tem a mesma chance de compor a amostra. Na prática, a amostragem
simples pode ser realizada numerando a população de 1 a n e, em seguida, sorteando,
por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais
corresponderão aos elementos pertencentes à amostra.

Como exemplo, pense em uma pesquisa sobre a estatura de uma população de 90 alu-
nos de um curso de engenharia, com tamanho de amostra desejado de 9 estudantes.
Para realizar o sorteio, pode-se enumerar os alunos de 1 a 90 e retirar, um a um, nove
números. Outra maneira de se extrair essa amostra é pela tabela de números aleatórios.

Para gerar uma tabela de números aleatórios utilizando o Excel, basta seguir as etapas
a seguir.

01. Inserir o comando =ALEATÓRIOENTRE(1;999) na célula A1, conforme a figura 03 (a).


Observe que, neste caso, os números aleatórios pertencem ao intervalo de 1 a 999.

02. Arrastar a função inserida na célula A1 para quantas linhas e colunas desejar, como
indicado na Figura 03 (b).
Figura 03. Imagens ilustrativas para gerar planilha de números aleátorios
Fonte: elaborada pelos autores no Excel.

12 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

Para que todas as células da tabela tenham o mesmo número de algarismos, selecione
a tabela inteira, clique com o botão direito do mouse e siga as etapas (Formatar Células
>>> Número >>> Personalizado) para chegar na configuração indicada na Figura 04.
Figura 04. Imagem ilustrativa da configuração para determinar o
número de algarismos/dígitos desejados

Fonte: elaborada pelos autores com o auxílio do Excel.

No campo “Tipo”, digite 000, indicando que todas as células tenham três algarismos.
Após, clique em OK. Desta forma, obtemos uma tabela de números aleatórios, confor-
me a Figura 05.
Figura 05. Modelo de tabela de números aleatórios

Fonte: elaborada pelos autores com o auxílio do Excel.

Probabilidade e Estatística Aplicada 13


U2 Amostragem e parâmetros da amostra na estatística descritiva

Utilizando a tabela de números aleatórios


Uma das maneiras de se utilizar a tabela de números aleatórios é descrita abaixo:

a.  Com os dados da população numerados de 1 a n, defina quantos algarismos são neces-
sários formar a quantidade n.

Exemplo: em uma população formada por 90 elementos, precisamos de dois algarismos


para formar o n (90 elementos).

b.  Defina uma linha e uma coluna que serão utilizadas como ponto de partida para o sor-
teio dos elementos da amostra.

Exemplo: iniciar o sorteio com a 2ª linha e a 1ª coluna.

c.  Defina uma direção de leitura da tabela – pode ser vertical, horizontal ou diagonal.

Exemplo: fazer a leitura na direção horizontal.

d.  Defina um sentido de leitura da tabela – sendo a direção vertical, pode ser de cima para
baixo ou de baixo para cima. Sendo a direção horizontal, pode ser da esquerda para a
direita ou da direta para a esquerda.

Exemplo: fazer a leitura da esquerda para a direita.

e.  Realize a leitura dos elementos da tabela conforme as definições apresentadas nos itens
de “a” até “d”.

Exemplo: como temos uma população formada por 90 elementos, a leitura será feita a
partir da 2ª linha, 1ª coluna, direção horizontal (esquerda para direita), sentido vertical (de
cima para baixo). Observe a representação na Figura 06.
Figura 06. Representação do sorteio dos elementos a partir da tabela
de números aleatórios

Fonte: elaborada pelos autores no Excel.

Observa-se que o 1° elemento sorteado é 25; o 2º elemento é 70; o 3° é 67 e assim sucessi-


vamente. Repita o processo até se obter o quantitativo que se deseja para a amostra – neste
caso, 9 elementos. Dessa forma, a amostra será composta pelos elementos cujas posições
são indicadas abaixo.
25 70 67 52 88 14 22 55 75

14 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

Observações:

`  Caso uma única linha/coluna não seja suficiente para se obter a amostra desejada, deve-
-se continuar o sorteio dos elementos na linha/coluna imediatamente subsequente.

`  Caso ocorra o sorteio de um número que não pertença ao intervalo formado pela popula-
ção, este deve ser descartado, selecionando assim o próximo elemento na sequência in-
dicada pela tabela. O mesmo vale para o sorteio de um número que já compõe a amostra.

1.2. AMOSTRAGEM ESTRATIFICADA OU PROPORCIONAL


Em alguns momentos, a organização das amostras necessita ser subdividida em cate-
gorias que sejam proporcionais às categorias da população.

No exemplo abaixo, adota-se uma população formada por alunos dos cursos de enge-
nhria de uma determinada instituição de ensino. Pode-se perceber que ela pode ser
dividida em dois subgrupos, aqui chamados de estratos, a partir do gênero dos indivídu-
os, masculino ou feminino. Portanto, existe a possibilidade de se criar os dois estratos
(quanto ao gênero).

Suponha que a quantidade total de alunos no curso de engenharia é 100, ou seja, a


população é de 100 alunos, em que 55 são homens e 45 são mulheres. Com o objetivo
de coletar 20% desses alunos para compor uma amostra para estudo sobre massa
corporal de cada gênero, deve-se obter 20% de cada estrato, para que seja mantida a
proporção em relação à população, conforme a tabela 1.
Tabela 01. Cálculo da quantidade de amostras para cada estrato

Sexo População 20% Nº de elementos na amostra


M 55 11 11
F 45 9 9
Total 100 20 20
Fonte: elaborada pelos autores.

Após o cálculo do número amostral por estrato (categoria), prossiga com a escolha dos
homens e mulheres que vão compor a amostra por meio de sorteio ou utilização de uma
tabela de números aleatórios (conforme o modelo indicado na Figura 5).

1.3. AMOSTRAGEM SISTEMÁTICA


Outro tipo de amostragem é conhecido como amostragem sistemática, que tem como
característica principal a população apresentada de forma ordenada. Exemplos:
`  Prontuário escolar ordenado por matrícula.

`  Controle de qualidade de uma linha de produção seriada.

`  Número das casas em uma rua.

`  Lista de pacientes de um hospital feita por ordem alfabética.

Probabilidade e Estatística Aplicada 15


U2 Amostragem e parâmetros da amostra na estatística descritiva

Para coletar uma amostra dos produtos de uma linha de produção, é comum ser utiliza-
da a amostragem sistemática.

Suponha que em um lote de 800 peças produzidas deseja-se obter uma amostra de
40 unidades para ser analisada. Com isso, realiza-se o cálculo: 800/40 = 20. Como as
peças estão dispostas em fila, sorteia-se qual peça será a primeira. Admitindo que no
EXEMPLO

sorteio a primeira peça escolhida é a de quinta posição, temos que a segunda peça a
ser analisada é a 25ª (5 + 20 = 25) e, assim, sucessivamente até completar 20 peças.

Neste caso, a amostra seria composta pelas peças de posição: 5, 25, 45, 65, 85, 105,
125, ... , 765 e 785.

1.4. CÁLCULO DO TAMANHO DA AMOSTRA


Na grande maioria dos estudos estatísticos, o trabalho com a população é inviabilizado,
conforme citado anteriormente, principalmente por questões econômicas e temporais.
Diante dessa dificuldade, o trabalho com amostras se coloca como uma solução para
este problema.

Quando se decide conduzir um estudo estatístico a partir de uma amostra, o primeiro


passo a ser realizado é o dimensionamento deste subconjunto. Para isso, deve-se con-
siderar algumas questões:
`  Ao utilizar uma amostra, inevitavelmente, está se adotando um erro em relação à situação
populacional. Esse tipo de erro é chamado de erro amostral.

`  No ato do dimensionamento da amostra, o pesquisador pode definir o quanto de erro


pode ser tolerado para a condução do experimento. Este tipo de erro é chamado de erro
amostral tolerável.

Para o cálculo do tamanho da amostra utilizaremos as seguinte fórmulas:

1 1 2 N . n0
n0 = n=
E02 N + n0

Em que:
n → tamanho da amostra

E0 → erro amostral tolerável

n0 → primeira aproximação dotamanho da amostra

N → tamanho da população

16 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

Um experimento está sendo realizado a partir de uma população formada por 20.000
indivíduos. Adotando um erro tolerável de 5%, calcule o tamanho da amostra.

Resolução: Pode-se destacar os seguintes valores:

N = 20000 E0 = 0, 05
Realiza-se a primeira aproximação da amostra, por meio da seguinte fórmula:

1 1
n0
= = = 400
E0 0, 052
2
EXEMPLO

Em seguida, calcula-se o tamanho da amostra por meio da fórmula:

Como o tamanho da amostra se caracteriza como uma variável que admite apenas
valores inteiros, devemos adotar o arredondamento para o próximo número inteiro.
Isso garante a eficiência do erro, ou seja, melhoramos o erro amostral tolerável.

=n 392,1568 ≅ 393 indivíduos


Com o desenvolvimento deste experimento, a partir de uma amostra composta por
392 indivíduos, o pesquisador deve considerar que todos os parâmetros calculados
podem apresentar uma margem de erro de 5% (erro tolerável).

2. PARÂMETROS DE POSIÇÃO
As medidas de tendência central são usadas para indicar um valor que tende a melhor
representar um conjunto de dados. Geralmente, localizam-se em torno do meio (centro)
de uma distribuição, onde a maior parte dos dados tende a se concentrar.

Para se observar as tendências características de cada distribuição, isoladamente, ou


em confronto com outras, necessita-se introduzir conceitos que se expressem por meio
de números, que nos permitam traduzir essas tendências. Tais conceitos são denomi-
nados elementos típicos da distribuição e são conhecidos como:

01. Medidas de posição.


02. Medidas de variabilidade ou dispersão.

As medidas de posição mais importantes são as medidas de tendência central, que


recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se
a grupar em torno dos valores centrais. São estas:
`  A média aritmética.
`  A mediana.
`  A moda.

Probabilidade e Estatística Aplicada 17


U2 Amostragem e parâmetros da amostra na estatística descritiva

2.1. MÉDIA ARITMÉTICA


A média aritmética simples é o quociente da divisão da soma dos valores de todos os
elementos pelo número que representa a quantidade de valores utilizados.

3

n
x
i =1 i
x=
n
Em que:n
∑ i =1xi a média aritmética.
x =representa
n
∑ i =1xi os valores da variável analisada.
n

x=
n n a quantidade de valores analisados.
Pode-se pensar na média como um valor que representa uma distribuição amostral de
valores.

Em uma indústria, ao verificar as medidas de envazamento de água, em recipientes de


1 litro, em períodos de 10 minutos, foram coletados os dados a seguir, que apresentam
a quantidade de recipientes envazados por período.

65; 63; 57; 48; 64; 60; 61

A partir destes dados, podemos calcular a média aritmética:


7
∑ ∑
n
i x
i 1 i
x
=x =i 1 =
=
EXEMPLO

n 7

65 + 63 + 57 + 48 + 64 + 60 + 61 418
=x = ≅ 59, 7
7 7
Observação: para o arredondamento de valores relacionados ao cálculo da média de
uma amostra, será utilizada a regra de arredondamento apresentada na Unidade 1.
Além disso, o valor da média deverá ser apresentado com uma casa decimal a mais do
que os dados utilizados para o cálculo. No exemplo anterior, os dados foram represen-
tados por números inteiros, portanto, a média apresenta um algarismo após a vírgula.

Logo, podemos concluir que, em média, a cada 10 minutos são envazados 59,7 recipientes.

2.2. MEDIANA
Outra medida de posição é conhecida como mediana, aqui indicada por . Ela é definida
como o número que se encontra no centro de um conjunto de dados (valores), estando
este conjunto de valores disposto segundo uma ordem (crescente ou decrescente).

Considere o seguinte conjunto de valores que representam as temperaturas em °C em


nove instantes diferentes.

18 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

5, 13, 10, 2 ,18, 15, 6, 16, 9

De acordo com a definição de mediana, deve-se primeiramente ordenar os dados. Este


processo é conhecido como rol.

2, 5, 6, 9, 10, 13, 15, 16,18

Em seguida, é preciso indicar o valor que ocupa a posição central. Observe que este
valor dividirá o conjunto destas temperaturas de forma que apresentará o mesmo núme-
ro de elementos à direita e à esquerda. Neste caso, o elemento mediano (temperatura
mediana) é o que ocupará a 5ª posição na ordem crescente, ou seja, Md= 10 °C .

Dado um conjunto com uma quantidade par de valores (ou amostras), a mediana será o
valor médio compreendido entre dois valores centrais da sequência ordenada.

O conjunto de dados abaixo representa o número de atendimentos mensais nos dois


primeiros quadrimestres do ano de um serviço ao cliente sobre a durabilidade do novo
modelo de bateria para celulares.

2, 6, 7, 10, 12, 13, 18, 21

A mediana será dada pela média aritmética entre 10 e 12, ou seja, pelos elementos que
ocupam a 4ª e a 5ª posições, respectivamente.

10 + 12
Md
= = 11
2
Logo, o número mediano de atendimentos nos dois primeiros quadrimestres será igual a 11.

Comparação entre a média e mediana

A escolha da média ou da mediana, como medida de tendência central de um conjunto,


depende de diversos fatores. Podemos observar que a média é sensível a cada valor do
conjunto, inclusive os valores extremos.

Por outro lado, a mediana não é influenciada pelos valores extremos, isto é, considera ape-
nas o valor do centro (ou valores do centro) do conjunto de dados.

Considere o conjunto de dados sobre o tempo de atendimento em minutos que varia de 24


a 50.

24 25 26 27 28 30 50

Mediana média

Podemos observar que a média é igual a 30 minutos, enquanto a mediana é de 27. Ou seja, a
média é influenciada por um valor extremo (50 min.), enquanto que a mediana apenas separa
o conjunto ao meio (50%).

Probabilidade e Estatística Aplicada 19


U2 Amostragem e parâmetros da amostra na estatística descritiva

2.3. MODA
Moda (Mo) é o valor que ocorre com maior frequência em uma sequência de valores ou
em um conjunto de dados amostrais.

Considere uma fábrica envasando refrigerantes. Nesta situação, verifica-se a quantida-


de do líquido (em litros) depositada em cada recipiente. O controle de qualidade iden-
tificou que a maioria das garrafas foram envasadas com 1,2 litros. Por se caracterizar
como a medida com maior frequência (maior número de ocorrências), este valor será
denominado como moda, ou seja, Mo = 1, 2 .

Exemplo 1:

Notas de alguns alunos em uma avaliação de matemática. Encontre a moda:

2, 8, 6, 5, 4, 6, 1, 0, 6, 7, 9, 3

Resolução:

Observe que a moda é igual a 6 ( = 6), já que é a nota que ocorre com maior frequ-
EXEMPLO

ência (3 vezes).

Exemplo 2:

Salários (em R$) de alguns funcionários de uma indústria química. Encontre a moda:

1500, 600, 1460, 1200, 1500, 670, 900, 1200, 1750, 1500.

Resolução:

Mo =1500

Ao abordar o conceito de moda, se faz necessário destacar dois casos:

Amodal:
Quando não existe valor que apareça mais vezes em relação aos outros, ou seja, não apre-
senta um valor que possua maior frequência. Por exemplo: 3, 5, 8, 10, 12, 13. Observe que,
neste caso, cada valor só aparece, “ocorre”, uma única vez.

Bimodal:
Quando a sequência ou o conjunto tem dois valores modais, ou seja, dois valores que apre-
sentam a mesma frequência e esta frequência é a maior do conjunto. Por exemplo, em:

2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9.

4 e 7 apresentam a maior frequência (3 ocorrências cada). Logo, o conjunto é bimodal e as


modas são representadas por: Mo = 4 e Mo = 7.

20 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

Exercício comentado 1.
A amostra de dados representada a seguir indica o quantitativo de pacientes atendidos em
um posto de serviço médico de uma empresa fabricante de componentes elétricos.

14, 21, 9, 11, 8, 19, 25, 22, 21, 15

Determine a média, a mediana e a moda.

Resolução:

14 + 21 + 9 + 11 + 8 + 19 + 25 + 22 + 21 + 15
x = 16,5
10
Para de determinar a mediana , coloque os dados em ordem crescente (rol).

8 9 11 14 15 19 21 21 22 25

A partir dos dados ordenados, identifica-se os elementos centrais. Como se tem um par,
identifca-se dois elementos centrais:

8 9 11 14 15 19 21 21 22 25

Em seguida, calcula-se a média aritmética entre eles:

15 + 19
Md
= = 17
2
Assim, a mediana desta amostra é igual a 17.

O elemento que mais se repete no conjunto, ou seja, aquele que apresenta a maior frequên-
cia, é 21. Portanto, a moda é igual a 21.

Exercício comentado 2.

Em uma pequena empresa de máquinas especiais, há apenas 5 funcionários, com os respec-


tivos salários por hora: $ 50, $ 24, $ 26, $ 25, $ 27. Qual das medidas de tendência central
representa melhor os salários desta empresa?

Resolução:

Ordenando-se os dados (crescente), temos:

24 25 26 27 50

Identifica-se o termo central:

Md = 26

Probabilidade e Estatística Aplicada 21


U2 Amostragem e parâmetros da amostra na estatística descritiva

Calcula-se a média:

24 + 25 + 26 + 27 + 50
=x = 30, 4
5
Observa-se que a amostra de dados não possui repetição nos elementos. Sendo assim, esta
amostra caracteriza-se como amodal.

Pode-se afirmar que a mediana representa melhor esse conjunto de dados, pois, ao obser-
varmos os dados, percebemos uma maior tendência de concentação dos valores em torno
dela, quando comparada com a média.

Exercício comentado 3.

Considere os tempos de reação aos estímulos fornecidos por um programa de computador


instalado em um caixa eletrônico de banco (em segundos):

11 5 6 6 10 7 7

Determine a média, a moda e a mediana.

Resolução:

11 + 5 + 6 + 6 + 10 + 7 + 7
=x = 7, 4
7
Mo = 6 e Mo = 7  bimodal

Rol: 5 6 6 7 7 10 11 Md = 7

Md

50% 50%

Observa-se que a mediana divide o conjunto de dados em duas partes iguais (50%).

3. PARÂMETROS DE DISPERSÃO
Nos tópicos anteriores foram abordadas as medidas de tendência central (média, moda
e mediana). Estas medidas apresentam características sobre a amostra analisada e
têm por finalidade fornecer parâmetros sobre a população. Limitar-se apenas ao cálculo
e análise das medidas de tendência central, principalmente a média, pode incorrer em
erros, dependendo do que se pretende analisar.

Um aluno A tem média igual a 5, nota oriunda de duas avaliações, sendo que em uma
ele tirou 0 e na outra tirou 10. Um outro aluno, B, tem a mesma média, porém, com as
EXEMPLO

notas das duas avaliações iguais a 4 e 6.


Assim, percebe-se que ter a média como um único parâmetro de análise é muito
arriscado para uma tomada de decisão. Sendo assim, se faz necessário o estudo da

22 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

dispersão dos dados para uma melhor interpretação e avaliação dos dados obtidos.
Em outras palavras, o parâmetro que representa os dados amostrais é a média, mas,
ela não pode ser analisada de forma isolada para se aferir o grau de homogeneidade,
ou seja, para mensurar a variabilidade do conjunto de dados.

3.1. AMPLITUDE
Para calcular a amplitude total de conjunto de dados, fazemos a subtração entre o va-
lor máximo e o valor mínimo, ou seja, a amplitude é a diferença entre o maior e o menor
valor do conjunto de dados.

4 AT
= xmáx − xmín
Em que:

AT – representa a amplitude.

xmáx – maior valor do conjunto.


xmín – menor valor do conjunto.

Exemplo:

Considere os dados apresentados a seguir:

55 38 49 63 47 39 62 37
EXEMPLO

Resolução:

Podemos observar que o maior valor do conjunto é 63 e o menor valor é igual a 37.
Logo, a amplitude total será:

AT = 63 − 37 = 26

3.2. VARIÂNCIA
A variância tem o objetivo de analisar o grau de variabilidade em determinadas situa-
ções. Através dela podemos perceber desempenhos iguais, muito próximos ou muito
distantes. A média aritmética pode ser usada para avaliar situações de forma geral, já
a variância determina de forma mais específica as possíveis variações, no intuito de
não comprometer os resultados da análise. Vamos analisar a eficiência da variância por
meio de um exemplo.

Um profissional do controle de qualidade deseja comparar o desempenho de suas qua-


tro diferentes linhas de produção (A, B, C e D). Dessa forma, foram verificadas seis
medidas (em mm) de peças utilizadas em motores de automóveis.

Probabilidade e Estatística Aplicada 23


U2 Amostragem e parâmetros da amostra na estatística descritiva

A: 6 – 6 – 6 – 6 – 6 – 6
B: 7 – 6 – 5 – 2 – 8 – 9
C: 4 – 5 – 5 – 6 – 8 – 7
D: 1 – 9 – 6 – 3 – 7 – 4

Primeiramente, ele irá calcular as médias de cada linha de produção, que são apresen-
tadas abaixo:

x A = 6 mm xB ≅ 6, 2 mm xC ≅ 5,8 mm xD = 5 mm

A variância amostral deve ser calculada pela soma dos quadrados das diferenças
entre cada valor observado e o valor médio, dividido pelo total de valores observados.
A diferença serve para mostrar quanto um valor observado se distancia do valor médio.

∑ (x − x)
n 2
5 2 i
s = i =1
n −1
Em que:

s 2 - variância amostral.
xi - valores da variável observada.
x - média dos valores observados.
n - quantidade de dados amostrais.

Linha A  x =6

s2
{=
( 6 – 6 ) ² + ( 6 – 6 ) ² + ( 6 – 6 ) ² + ( 6 – 6 ) ² + ( 6 – 6 ) ² + ( 6 – 6 ) ²}
0
5
Linha B  x = 6, 2

s2 =
{( 7 – 6, 2 ) ² + ( 6 – 6, 2 ) ² + ( 5 – 6, 2 ) ² + ( 2 – 6, 2 ) ² + (8 – 6, 2 ) ² + ( 9 – 6, 2 ) ²}
5

=s2
{0, 64 + 0, 04 + 1, 44 + 17, 64 + 3, 24 + 7,84
=
} 30,84
≅ 6,17
5 5

24 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

Linha C  x = 5,8

s2 =
{( 4 – 5,8) ² + ( 5 – 5,8) ² + ( 5 – 5,8) ² + ( 6 – 5,8) ² + (8 – 5,8) ² + ( 7 – 5,8) ²}
5

=s2
{3, 24 + 0, 64 + 0, 64 + 0, 04 + 4,84 + 1,=
44} 10,84
≅ 2,17
5 5
Linha D  x= 5

s2 =
{(1 – 5) ² + ( 9 – 5) ² + ( 6 – 5) ² + ( 3 – 5) ² + ( 7 – 5) ² + ( 4 – 5) ²}
5

s2 =
{16 +16 +1+ 4 + 4 +1} =
42
= 8,4
5 5

Observação: o arredondamento deve ser realizado apenas no final da resolução, não


utilize arredondamentos nos valores parciais (intermediários).

Atenção: a unidade de medida a ser utilizada para a variância não é a mesma usada
nos dados originais ( u ) , devendo-se sempre adotar a u 2 . Ou seja, no exemplo ante-
rior, os dados originais foram expressos em milímetros mm , assim, a variância deverá
ser expressa em mm 2 .

A partir da variância calculada, pode-se chegar à medida de dispersão denominada


desvio padrão ( s ) . Por meio deste parâmetro, pode-se mensurar o quanto os dados
de uma amostra (ou população) encontram-se dispersos. Quanto maior for o valor de
desvio padrão, maior será a dispersão dos dados.

Para obter o resultado do desvio padrão, basta calcular a raiz quadrada variância. Logo,
a fórmula do desvio padrão amostral é dada por:

∑ (x − x)
n 2
i
s= i =1
n −1

Que pode ser expressa também como:


( ) 
2


n
 x
i =1 i
∑ i =1 i  n
2 n
x − 
 
s=  
n −1

Probabilidade e Estatística Aplicada 25


U2 Amostragem e parâmetros da amostra na estatística descritiva

Assim, teremos os seguintes valores para o desvio-padrão amostral de cada linha de


produção do exemplo anterior:

Observação: para o arredondamento dos valores de desvio-padrão será utilizado sem-


pre um algarismo a mais (após a vírgula) do critério adotado para a média.

s
Linha A:= 0 0
= assim temos 6 ± 0

B: s
Linha= 6,17 ≅ 2, 48 assim temos 6,2 ± 2,48

C: s
Linha= 2,17 ≅ 1, 47 assim temos 5,8 ± 1,47

D: s
Linha = 8, 4 ≅ 2,9 assim temos 5 ± 2,9

Análise dos resultados:


Linha A: o desvio-padrão apresentou valor nulo. Isso indica que a linha de produção
apresentou grande precisão, visto que não há dispersão.

Linhas B e D: essas duas tiveram valores altos de dispersão como resulta-


dos, isso se deve à grande variabilidade encontrada nas medidas observa-
das nas linhas, indicando assim uma falta de precisão nos processos adotados.
Linha C: obteve um valor do desvio-padrão inferior às linhas B e D, indicando menor va-
riabilidade que essas e expressando certa precisão nos processos de produção adotados.

Destaca-se a justificativa para a utilização do denominador n − 1 na fórmula do desvio-


-padrão amostral, em vez do denominador N utilizado no desvio-padrão populacional
(que será abordado em unidades posteriores). O denominador n – 1 tem relação com o
grau de liberdade e pode ser explicado pela propriedade da média aritmética.

A propriedade da média diz que: a soma de todas as diferenças entre a média e os va-
n
lores amostrais deve resultar necessariamente em zero, ou seja, ∑(x − x ) =
1
0. n

Segue um exemplo:

x xi x − xi
5 2 3
5 8 -3
5 1 4
5 9 -4
Total 0

As três primeiras subtrações (desvios) podem assumir qualquer valor, contudo, o quarto
desvio tem que ser tal que somado com os três anteriores comprove a propriedade da
média, ou seja, resulte em zero. Percebe-se então que dentre quatro elementos, três têm

26 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

liberdade e apenas um fica restrito a ser o valor preciso para ter-se a veracidade da pro-
priedade. Por consequência, se há quatro elementos, temos grau de liberdade igual a três.

4. PARÂMETROS RELATIVOS
Neste tópico será abordado o estudo do coeficiente de variação que apresenta como
resultado um valor relativo, ou seja, em porcentagem. Portanto, é possível realizar algu-
mas comparações como também analisar o quanto o parâmetro da média é consistente.

Imagine que se houver duas linhas de produção, em que na linha A fabrica-se quero-
sene em litros e na linha B fabrica-se a lata, em quilogramas, para armazenamento do
querosene. Suponha que um engenheiro queira realizar uma comparação entre as duas
linhas para verificar qual apresenta menor variabilidade, isto apenas será possível por
meio de valores relativos, uma vez que o número amostrado nas duas linhas apresenta
unidades de medida diferentes.

4.1. COEFICIENTE DE VARIAÇÃO


O coeficiente de variação, também conhecido como coeficiente de variação de Pear-
son, possibilita a comparação da variabilidade de diferentes conjuntos de dados, tanto
ao comparar dois conjuntos de amostras a fim de verificar qual deles é mais homogê-
neo, já que seu resultado é expresso em porcentagem, quanto a indicação de quão
grande ou quão pequena é a dispersão dos dados.

O coeficiente de variação é obtido pela fórmula:

Em que:

Cv → representa o coeficiente de variação.


s → representa o desvio-padrão.
x → representa a média dos dados.
Observação: fórmula do coeficiente de variação pode ser utilizada tanto para um estu-
do amostral como para um estudo populacional.

Exemplo: vamos comparar os resultados de média e desvio-padrão de duas medidas


diferentes (estaturas e massas):

x s

Estaturas 175 cm 5 cm
Massas 68 kg 2 kg

Probabilidade e Estatística Aplicada 27


U2 Amostragem e parâmetros da amostra na estatística descritiva

Para a estatura: Para a massa:

Logo, nesse grupo de indivíduos os valores de massas (em kg) apresentam maior grau
de dispersão do que os valores de estaturas (em cm).

Conclusão: a distribuição amostral é homogênea se o coeficiente de Pearson for menor


ou igual a 25%. Será heterogêneo se o coeficiente resultar em um valor superior a 25%.

Atenção: há de se ressaltar que para efeitos acadêmicos será usado os 25% como
parâmetro de homogeneidade, porém, para controle de qualidade os coeficientes de
variação deverão ser os menores possíveis.

Exemplo 1: verificar qual dos experimentos abaixo apresenta maior variabilidade.

Amostra da produção de envasamento de água em litros.

1,1 1,4 2,0 1,0 1,2 1,3 1,6 1,1 1,3 2,0

xi xi2
1,1 1,21
1,4 1,96
2,0 4,00
1,0 1,00
1,2 1,44
EXEMPLO

1,3 1,69
1,6 2,56
1,1 1,21
1,3 1,69
2,0 4,00

∑ xi =
14 ∑ xi2 =
20,76

1,1 + 1, 4 + 2, 0 + 1, 0 + 1, 2 + 1,3 + 1, 6 + 1,1 + 1,3 + 2, 0


x = 1, 4
10


( )

2

 ∑ i =1xi 
n

 (14 )2 

n 2
x − 
i =1 i
n 20, 76 −  
   10  20, 76 −19, 6 1,16
=s  =   =  = ≅ 0,36
n −1 10 − 1 9 9

28 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

0,36
=Cv = .100 25, 71%
1, 4

Exemplo 2:

Amostra da produção de ensacamento de açúcar em quilograma.

2,0 1,9 1,2 1,6 1,3 1,1 1,9 1,2 1,4 1,9

2, 0 + 1,9 + 1, 2 + 1, 6 + 1,3 + 1,1 + 1,9 + 1, 2 + 1, 4 + 1,9


x = 1,55
10
xi xi2
2,0 4
1,9 3,61
1,2 1,44
1,6 2,56
1,3 1,69
1,1 1,21
1,9 3,61
1,2 1,44
1,4 1,96
1,9 3,61

∑ xi = ∑ xi2 =
15,5 25,13

 (15,5 )2 
25,13 −  
 10 
=s =   0,35
9

0,35
=Cv = .100 22,58%
1,55
Comparando o coeficiente de variação da linha de produção sobre envasamento de água
(em litros) com o ensacamento de açúcar (em quilograma), pode-se concluir que os dados
referentes ao ensacamento são mais homogêneos que os envasamentos de água.

Probabilidade e Estatística Aplicada 29


U2 Amostragem e parâmetros da amostra na estatística descritiva

Exercício prático 1.

Um frigorífico de bovinos possui quatro câmaras frias (geladeiras) para armazenar seus pro-
dutos. O gerente resolveu aferir as temperaturas, mas não coletou a mesma quantidade de
dados entre as geladeiras. Agora, o gerente quer averiguar as amplitudes das temperaturas
de cada geladeira (A, B, C e D), expressas em °F, com o objetivo de mensuar a dispersão
dos dados coletados. Portanto, calcule a amplitude dos dados anotados para cada geladeira.

a) Geladeira A: 1, 3, 5, 9.

b) Geladeira B: 20, 14, 15, 19, 21, 22, 20.

c) Geladeira C: 17,9 ; 22,5 ; 13,3 ; 16,8 ; 15,4 ; 14,2.

d) Geladeira D: -10 , -6 , 2, 3, 7, 9, 10.

Exercício prático 2.

Calcule as médias das temperaturas do exercicio 1.

Exercício prático 3.

Calcule o desvio-padrão amostral e o coeficiente de variação dos conjuntos de dados do


exercício 1. Utilize os valores do desvio-padrão e coeficiente de variação para realizar uma
análise das médias com os dados amostrais.

Exercício 4.

Foram coletadas as medidas de estaturas de 1.017 indivíduos, obtendo média de x =162,2


cm e s = 8,01 cm. A massa média desses indivíduos é de 52 kg, com um desvio-padrão de
2,3 kg. Esses indvíduos apresentam maior variabilidade em estatura ou massa?

Exercício 5.

Para facilitar um projeto de ampliação da rede de esgoto de certa região de uma cidade, as
autoridades tomaram uma amostra de 15 elementos dos 270 quarteirões que compõem a
região. O número de casas por quarteirão é apresentado no esquema abaixo.

3 10 13 15 16 16 18 22 18 23 18 7 16 9 8
Determine:

a) A média.

b) A variância amostral.

c) O desvio padrão amostral.

d) O coeficiente de variação.

30 Probabilidade e Estatística Aplicada


Amostragem e parâmetros da amostra na estatística descritiva U2

Exercício 6.

Uma construtora está conduzindo um estudo em torno da usabilidade de um de seus empre-


endimentos. Estima-se que, aproximadamente, 15.000 pessoas circulem por esta constru-
ção. Diante disso, adotando um erro tolerável de 5%, quantos indivíduos devem ser utilizados
para a composição da amostra?

Probabilidade e Estatística Aplicada 31

Você também pode gostar