Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA E PROBABILIDADE
Prof. Me. Eng. José Ribamar Moraes
2
Unidades 1 e 2
01 INTRODUÇÃO
05 MEDIDAS DE POSIÇÃO
02 ESTATÍSTICA DESCRITIVA E
INFERENCIAL 06 MEDIDAS DE DISPERSÃO
01 INTRODUÇÃO
4
INTRODUÇÃO
• Estatística: É a ciência que cuida da coleta, descrição e
interpretação de dados.
Diagrama de Afinidade
Fluxograma
Diagrama de Relações
Gráfico de Controle
Diagrama em Árvore
Diagrama de Ishikawa
Diagrama em Matriz
Folha de Verificação
• Metrologia mecânica:
ESTATÍSTICA DESCRITIVA
É o ramo da estatística que visa sumarizar e descrever
qualquer conjunto de dados. Em outras palavras, é aquela
estatística que está preocupada em sintetizar os dados de
maneira direta, preocupando-se menos com variações e
intervalos de confiança dos dados. Exemplos de estatísticas
descritivas são a média, o desvio padrão e a mediana.
11
ESTATÍSTICA INFERENCIAL
A estatística inferencial é usada para fazer inferências sobre
uma população com base em uma amostra de dados. Esta usa
uma amostra aleatória dos dados coletados de uma
população para descrever e fazer inferências sobre a
população. Ela utiliza técnicas estatísticas para testar hipóteses
e estimar parâmetros.
ESTATÍSTICA DESCRITIVA E INFERENCIAL
DIFERENCIAÇÃO 12
• Deste modo, podemos afirmar que a principal diferença entre a estatística descritiva e inferencial é que a
estatística descritiva lida com a descrição e o resumo dos dados, enquanto a estatística inferencial lida com a
generalização dos resultados da amostra para a população em geral.
03 AMOSTRAGEM
AMOSTRAGEM
DEFINIÇÃO 14
Antes de iniciar o planejamento da coleta de dados, é essencial que consigamos identificar alguns objetos de
estudo da estatística, tais como população e amostra.
• População: É o conjunto de todos os elementos que possuem determinada característica em comum.
• Amostra: É qualquer subconjunto de uma população. Geralmente, amostras são finitas e utilizadas quando
a população é muito numerosa ou infinita, o que dificulta ou até impossibilita a observação de todos os seus
elementos.
• População e amostra:
• Variável: É uma condição ou característica dos elementos de uma população. Idade, peso, altura, sexo, cor
dos olhos e raça são exemplos de variáveis.
• Quando uma variável retorna valores numéricos, denomina-se como variável quantitativa. Já aquela que
retorna valores não numéricos, denomina-se variável qualitativa. Essa diferença é fácil de ser assimilada,
pois a palavra quantitativa lembra “quantidade”, ou seja, números, enquanto a palavra qualitativa lembra
“qualidade”, isto é, atributos. As variáveis quantitativas e as qualitativas podem ser subdivididas em dois
subgrupos:
• Variáveis Qualitativas:
○ Ordinais → Quando existe uma ordem nos seus valores.
○ Nominais → Quando uma ordem não pode ser estabelecida entre seus valores.
• Variáveis Quantitativas:
○ Discretas → Quando resultam de um conjunto finito (ou enumerável) de valores possíveis.
○ Contínuas → quando resultam de um número infinito de valores possíveis que podem ser associados a
pontos em uma escala contínua, de modo que não haja lacunas ou interrupções.
QUALITATIVAS QUANTITATIVAS
04 MÉTODOS TABULARES
MÉTODOS TABULARES
DEFINIÇÕES 19
• Frequência (frequência absoluta): Contagem direta dos valores dispostos em uma distribuição de frequência.
• Distribuição de frequência: É um método de se agrupar dados em classes de modo a fornecer a quantidade
(e/ou a porcentagem) de dados em cada classe. Uma das maneiras mais utilizadas para organizar dados são
as tabelas de distribuição de frequências.
• Notação de uma classe: Valores compreendidos em um intervalo de uma distribuição de frequência.
○ Exemplo: 20 |– 30 indica que estão sendo considerados os valores maiores ou iguais a 20 e menores que 30.
• Proporção (frequência relativa): Divisão da frequência absoluta pela soma de todas as frequências.
• Porcentagens: É calculada multiplicando uma proporção por 100%.
• Ponto médio das classes: São os valores obtidos somando-se os valores extremos e dividindo-se por 2.
• Exemplo 4 – Preencha a tabela de distribuição de frequências do exemplo 3 acrescida da coluna de ponto médio:
05 MEDIDAS DE POSIÇÃO
26
MEDIDAS DE POSIÇÃO
Existem outras maneiras de resumir conjuntos de dados,
que vão além de uma tabela ou um gráfico. Ferramentas
para esse fim são denominadas medidas de posição, as
quais buscam sintetizar um conjunto com um único valor.
São exemplos de medidas de posição: a média aritmética, a
mediana e a moda.
MEDIDAS DE POSIÇÃO
MÉDIA ARITMÉTICA 27
• Média Aritmética: A média aritmética (ou simplesmente média) corresponde a divisão da soma de todos os
valores de um conjunto de dados pela quantidade de valores desse conjunto. Se um conjunto tiver n
valores, {x1, x2, x3, ..., xn }, sua média será simbolizada por:
• Exemplo 7 – Calcular a média aritmética ponderada que apresenta as notas de um aluno nas 4 avaliações
de uma disciplina.
• Exemplo 8 – Considere que em um concurso os candidatos devam realizar três testes: conhecimentos gerais (CG),
conhecimentos específicos (CE) e aptidão física (AF), sendo que cada etapa possui um peso diferente. Na tabela a seguir
estão os resultados obtidos por dois candidatos. Se para ser aprovado é necessário obter nota final igual a 8 ou superior,
qual dos candidatos foi aprovado?
• Resolução:
Portanto, o candidato aprovado é Lucas. Prof. Me. Eng. José Ribamar Moraes
MEDIDAS DE POSIÇÃO
MEDIANA 30
• Mediana: A mediana (ou valor mediano) de um conjunto de dados corresponde ao valor central de um rol. Para calculá-la,
temos de considerar dois casos:
• 1º caso: quantidade ímpar de valores no conjunto
• Exemplo 9 – Calcule a mediana do rol a seguir:
• Resolução:
Como n = 7 (ímpar), a mediana (simbolizada por Md) corresponde ao valor que ocupa a posição i = (n + 1)/2 = (7+ 1)/2 = 4,
ou seja, Md = 860.
• Mediana: A mediana (ou valor mediano) de um conjunto de dados corresponde ao valor central de um rol. Para calculá-la,
temos de considerar dois casos:
• 2º caso: quantidade par de valores no conjunto
• Exemplo 10 – Calcule a mediana do rol a seguir:
• Resolução:
Observe que agora não temos um único valor no centro do rol, mas dois deles. Um dos valores está localizado na posição i =
n/2 = 6/2 = 3 e o outro na posição i = n/2 + 1 = 6/2 + 1 = 3 + 1 = 4.
Para representar a mediana nesse caso, utilizamos a média aritmética dos dois valores centrais, ou seja, Md = (z3 + z4 )/2 =
(80 + 92)/2 → Md = 86.
• Exemplo 11 – Calcule a mediana dos valores amostrados das variáveis X e Y apresentados a seguir:
• Resolução:
06 MEDIDAS DE DISPERSÃO
34
MEDIDAS DE DISPERSÃO
As medidas de posição descrevem características dos valores
numéricos de um conjunto de observações em torno de um “ponto
de equilíbrio” dos dados. Nenhuma delas informa sobre o grau de
variação ou dispersão dos valores observados em relação a média.
As medidas de dispersão quantificam a variação dos dados em
relação a média e qual o seu grau de representatividade.
MEDIDAS DE DISPERSÃO
AMPLITUDE 35
• Amplitude (R): A amplitude representa a diferença entre o maior e o menor valor do conjunto de dados. Ela ignora como
os dados estão distribuídos, sendo calculado conforme a seguir:
R = Xi (máximo) – Xi (mínimo)
• Resolução:
R = 77 – 60 = 17
• Média (Xbarra):
x f i i
X
f i
• Variância (S²): Medida de dispersão estatística que indica "o quão longe" em geral os valores se encontram do valor
esperado (média).
• Desvio Padrão (S): Indica uma medida de dispersão dos dados em torno da média amostral.
• Exemplo 13 – Determine a média e o desvio padrão da amostra para as tabelas de dados agrupados em classes de
frequência conforme a seguir:
a) b)
• Exemplo 14 – Em uma amostra de 30 medições do diâmetro externo de uma engrenagem, obteve-se a seguinte
distribuição de valores, em cm:
Classes Frequências
12 |– 17 5
17 |– 22 4
22 |– 27 6
27 |– 32 7
32 |– 37 5
37 |– 42 3
Determine:
a) A média amostral.
b) O desvio padrão amostral.
07 MÉTODOS GRÁFICOS
MÉTODOS GRÁFICOS
G R Á F I C O S PA R A VA R I Á V E I S 40
• Histograma: É uma representação gráfica (gráfico de barras verticais ou barras horizontais) da distribuição de
frequências de um conjunto de dados quantitativos contínuos. Em suma, é um gráfico de frequência que tem
por objetivo ilustrar como uma determinada amostra ou população de dados está distribuída.
• Exemplo 15 – O histograma a seguir diz respeito aos resultados obtidos por uma turma de alunos de um curso preparatório específico
para professor de educação básica. Para continuar no mercado, é necessário que esse curso aprove pelo menos 70% de seus alunos,
que, por sua vez, são professores especializando-se. Sabendo que os aprovados são apenas aqueles que obtiveram resultado ótimo ou
excelente, pode-se afirmar que esse curso continuará no mercado?
c) Não, pois o percentual de professores aprovados foi, aproximadamente, 50%. Total de professores = 13
e) Sim, pois o percentual de professores aprovados foi, aproximadamente, 90%. Aprovados = (6 + 1)/13 = 7/13 = 53,84%
Prof. Me. Eng. José Ribamar Moraes
MÉTODOS GRÁFICOS
HISTOGRAMA 44
○ Passo 3: Montar uma tabela contendo: número de classes (k), amplitude do intervalo (h), frequência simples (fi),
frequência percentual (fi%) e ponto médio (xi).
○ Passo 4: Montar o histograma.
• Exemplo 16 – Montar o histograma acerca do rol disponível a seguir de dados de faixas etárias não agrupados.
Resolução:
○ Passo 1: Determinar do número de classes (k) → n = 40 (k = 6)
○ Passo 2: Determinar a amplitude do intervalo* (h) → h = (62 – 41) / 6 → h = 3,5 (arredondando → h = 4)
○ Passo 3: Montar uma tabela contendo: número de classes (k), amplitude do intervalo (h), frequência simples (fi), frequência percentual
(fi%) e ponto médio (xi).
• Exemplo 16:
Resolução:
○ Passo 4: Montar o histograma
O polígono de frequências é
constituído por segmentos de
retas que unem os pontos cujas
coordenadas são o ponto médio e
a frequência de cada classe. Para
fechá-lo toma-se uma classe
anterior a primeira e uma posterior
a última, uma vez que ambas
possuem frequência zero.
• Exemplo 17 – Um engenheiro mecânico de uma montadora selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo
Brasil e anotou o número de unidades adquiridas por estes revendedores no mês de abril/2022, conforme demonstra a seguir. Montar o
histograma correspondente a referida demanda.
Resolução:
○ Passo 1: Determinar do número de classes (k) → n = 40 (k = 6)
○ Passo 2: Determinar a amplitude do intervalo* (h) → h = (39 – 6) / 6 → h = 5,5 (arredondando → h = 6)
○ Passo 3: Montar uma tabela contendo: número de classes (k), amplitude do intervalo (h), frequência simples (fi), frequência percentual (fi%) e
ponto médio (xi).
• Exemplo 17:
Resolução:
○ Passo 4: Montar o histograma
• Exemplo 18 – Montar uma tabela de frequência e seu respectivo histograma para o peso dos homens da turma de Estatística e Probabilidade
conforme disposto a seguir.
Resolução:
○ Passo 1: Determinar do número de classes (k) → n = 40 (k = 6)
○ Passo 2: Determinar a amplitude do intervalo* (h) → h = (90 – 58) / 6 → h = 5,33 (arredondando → h = 6)
○ Passo 3: Montar uma tabela contendo: número de classes (k), amplitude do intervalo (h), frequência simples (fi), frequência percentual (fi%) e
ponto médio (xi).
• Exemplo 18:
Resolução:
○ Passo 4: Montar o histograma
X
x f i i
f i
• Exemplo 19 – Um engenheiro mecânico que atua numa empresa de manutenção de motores de aviões, observou nos registros da empresa,
que o tempo de mão-de-obra gastos na revisão completa de um motor apresentava-se conforme elucida o quadro a seguir. Para planejar o
orçamento e a data de entrega de 5 motores, ele deseja saber o número médio de horas de mão de obra necessário para a revisão de cada
motor. Calcule o número médio de horas de mão de obra dos dados agrupados e desenhe o histograma correspondente.
Tabela de Frequência da
manutenção de motores
Tempo de mão Número de
Classes
de obra (horas) motores
1 0 |------ 4 1
2 4 |------ 8 5
3 8 |------ 12 10
4 12 |------ 16 12
5 16 |------ 20 4
Total 32
Resolução:
• Exemplo 20 – Uma empresa fez um levantamento da venda de seu produto em vários supermercados da região de São
Luís/MA obtendo em determinado mês o seguinte quadro:
Número de Nº de
Classes unidades supermercados
consumidas (f i)
1 0 |------ 1000 10
2 1000 |------ 2000 50
3 2000 |------ 3000 200
4 3000 |------ 4000 320
5 4000 |------ 5000 150
6 5000 |------ 6000 30
Determine o consumo médio do produto por supermercado pesquisado e elabore o histograma correspondente.
• O gráfico de controle, também conhecido como gráfico de Shewhart, criado e disseminado por Walter Shewhart,
é um gráfico que diz se o nosso processo está estável ou não. A partir do acompanhamento periódico de um
indicador, sabemos se ele está sob a influência de causas especiais, o que nos ajuda a aprender mais sobre o que
está acontecendo.
Tabela de fatores:
• Exemplo 21:
• Exemplo 22:
• Exemplo 23:
Esta carta é utilizada para reportar a fração defeituosa de um produto, de uma característica de qualidade ou de um
grupo de características de qualidade.
• Exemplo 24:
• Exemplo 24:
0.3
0.24335
0.2
0.1104
0.1
0.0
1 3 5 7 9 11 13 15 17 19 21 23 25
Prof. Me. Eng. José Ribamar Moraes
MÉTODOS GRÁFICOS
GRÁFICO DE CONTROLE 72
• Exemplo: Ao analisar chapas de aço de mesmo tamanho, devemos contar o número de defeitos por chapa e usar
o gráfico de controle para o número total de defeitos por unidade.
• Exemplo 25:
Apresenta-se o número de defeitos observado em 26 amostras sucessivas de 100 placas de circuito impresso
(observe que a unidade de inspeção é 100 placas): 21, 24, 16, 12, 15, 5, 28, 20, 31, 25, 20, 24, 16, 19, 10, 17, 13, 22,
18, 39, 30, 24, 16, 19, 17, 15 (totalizando 516 defeitos). Determine o valor central e os limites de controle e plote o
gráfico do número de defeitos (tipo c).
Gráfico C Para refugo
40
33.21
30
20
19.85
10
6.48
0
Também chamado de gráfico de Pareto, é um gráfico criado por Juran que ordena a frequência de um determinado
indicador do mais frequente para o menos frequente. Esse indicador normalmente representa falhas ou defeitos que
aparecem em um processo. O gráfico de Pareto nos ajuda a priorizar quais serão atacados primeiro.
O Diagrama de Pareto está intrinsecamente relacionado com a Lei de Pareto, também conhecida como princípio 80-
20 ou lei 20/80. De acordo com esta lei, 80% das consequências decorrem de 20% das causas. Esta lei foi proposta
por Joseph M. Juran, famoso consultor de negócios, que deu esse nome como homenagem ao economista
italiano Vilfredo Pareto.
• 20% esforço → 80% resultados
• Em qualquer estoque que contenha mais de um item, alguns serão mais importantes para a organização do que
outros. Em planejamento de estoque, um método muito utilizado para tal fim denomina-se curva ABC ou 80-20 ou
Diagrama de Pareto.
• Curva ABC ou 80-20: É um método de classificação de informações para que se separem os itens de maior
importância, que são, normalmente, em menor número.
• Exemplo 26:
Uma empresa fabrica e entrega seus produtos para várias lojas de varejo e deseja reduzir o número de devoluções.
Para isto, a empresa levantou o número de ocorrências geradoras de devolução da entrega no último semestre,
conforme demonstra o quadro a seguir. Plote e analise o Diagrama de Pareto.
80%
78%
110
70%
66%
90
60%
53%
70 50%
65
60
40%
50
45
30%
28%
30
30
20 20%
15
10
10%
atraso na entrega atraso transport. produto danificado faturam. incorreto separação errada pedido errado preço errado outros
-10 0%
• Exemplo 27:
Uma indústria de calculadoras eletrônicas, preocupada com vários defeitos que um de seus produtos vem
apresentando, fez um levantamento e constatou os seguintes problemas: A (defeito na cobertura plástica); B
(defeito no teclado); C (defeito na fonte de energia); D (soldas soltas); E (defeito na placa da unidade de
processamento); outros. Plote e analise o diagrama de Pareto correspondente acerca dos problemas levantados
pela indústria no seu processo.
• Correlação Linear: Corresponde ao padrão que indica o grau de correspondência entre duas variáveis. Mostra a
“intensidade” com a qual dois conjuntos de dados estão relacionados mutuamente.
• Regressão Linear: É o processo de traduzir o comportamento conjunto de duas variáveis na forma de uma “lei”
matemática denominada equação de regresso. Os conceitos de “correlação”, “dispersão” e “regressão” são
indissociáveis.
○ Método dos mínimos quadrados: Estabelece a melhor reta que se ajusta a todos os pontos experimentais do diagrama de
dispersão, denominada reta interpoladora.
1. Quanto mais próximo de +1 → mais forte é a correlação positiva entre as variáveis (inclinação positiva).
2. Quanto mais próximo de –1 → mais forte é a correlação negativa entre as variáveis (inclinação negativa).
3. Um coeficiente de correlação com valor próximo de zero → significa uma baixa correlação entre as variáveis
consideradas.
SEM CORRELAÇÃO
• Exemplo 28:
Um pesquisador indagou a 7 pessoas (todas com 40 anos de idade) que aguardavam o trem em uma plataforma de metrô as
seguintes questões: qual a sua escolaridade, ou seja, quantos anos você estudou? quantos livros você já leu? As respostas
encontram-se sumarizadas na tabela a seguir, onde x representa o número de anos que a pessoa estudou e y representa o
número de livros que a pessoa leu. Determine a equação de regressão linear e calcule o valor do coeficiente de correlação linear
(r). Analise o gráfico de dispersão.
x 3 5 7 9 10 14 16
y 1 2 3 5 7 10 13
• Exemplo 29:
Determine a equação de regressão linear e calcule o valor do coeficiente de correlação linear (r) para o conjunto de dados
indicados a seguir:
x 2 4 7 10 13
y 2,5 3,8 8,1 9,6 14,3
• Exemplo 30:
Um estudante de Engenharia Mecânica realizou experimentos nos quais variava a força resultante F (em N: “Newton” – unidade
de força) que atuava em um bloco e verificava a aceleração a (em m/s²) adquirida pelo mesmo, conforme apresentado no quadro
a seguir. Pedem-se:
a) Determine a equação de regressão linear.
b) Determine o valor do coeficiente de correlação linear (r).
x y
2 1,5
4 3,1
6 3,8
8 5,8
10 6,3
12 8,5
14 10,2
• Exemplo 31 – Uma indústria do ramo metalmecânico gostaria de realizar a previsão de demanda para uma família de
produtos presentes em sua ferramentaria. Para isso, a mesma dispunha de dados de 8 semanas conforme verificado no
quadro a seguir. Identifique o comportamento da demanda pelo método de regressão linear e encontre as previsões para os
períodos 9 e 10.
• Exemplo 32 – Um produto industrial apresentou vendas dos últimos seis meses conforme dados do quadro a seguir.
Pede-se:
a) Determine a equação de regressão linear.
b) Determine a previsão para julho, agosto e setembro.
c) Calcule e analise o resultado do coeficiente de correlação linear (r).
DÚVIDAS?
ESTATÍSTICA E PROBABILIDADE
Prof. Me. Eng. José Ribamar Moraes