Escolar Documentos
Profissional Documentos
Cultura Documentos
Disciplina F104850 - Metodos Estatisticos PDF
Disciplina F104850 - Metodos Estatisticos PDF
A ESTATÍSTICA NA ENGENHARIA
1. Introdução
Logo após a Revolução Industrial, métodos estatísticos foram incorporados nos processos industriais
para garantir a qualidade dos produtos. Amostras de itens produzidos eram avaliadas sistematicamente
para inferir se o processo estava sob controle. Mais recentemente, a avaliação da qualidade passou a ser
feita ao longo de todo processo produtivo como forma de corrigir eventuais falhas no sistema assim que
elas aparecessem. Isso levou a um aumento da qualidade do produto final e redução de custos, pois se
reduziram drasticamente as perdas por defeitos. Além do acompanhamento estatístico da qualidade, as
indústrias costumam fazer experimentos estatisticamente planejados para encontrar a combinação dos
níveis dos fatores do processo que levem a melhor qualidade possível. Na outra ponta, as empresas
levantam dados de amostras de consumidores para realizar pesquisas de marketing direcionadas ou para
adequar os produtos aos clientes. O planejamento dessas amostras e a análise dos dados necessitam de
técnicas estatísticas. Muitas vezes, a relação entre estatística e engenharia é ainda mais estreita. Os
próprios métodos de engenharia costumam incorporar intrinsecamente procedimentos probabilísticos ou
estatísticos. Assim, para que um aluno possa entender certos métodos de engenharia, é necessário que
tenha conhecimentos de probabilidade e estatística.
A estatística é a área da Matemática que fornece métodos para a coleta, organização, descrição, análise
e interpretação de dados para a futura utilização dos mesmos na tomada de decisões.
A partir de agora daremos uma ênfase especial aos dados que são expressos por variáveis quantitativas.
À medida que os dados vão sendo coletados, eles vão sendo organizados em uma sequência. Tal
sequência é chamada de dados brutos. A partir da organização em ordem crescente desses dados brutos
podemos criar o rol.
Podemos ainda organizar os dados em uma tabela, chamada de tabela de frequência em que é exibido
o valor do dado e o número de vezes que esse dado aparece (frequência)
Cada barra tem o tamanho proporcional à quantidade de vezes que o dado aparece na distribuição.
Ex:
Cada setor circular tem o tamanho proporcional à quantidade de vezes que o dado aparece na
distribuição.
Ex:
2.3. Gráfico de linhas
É usado normalmente para acompanhar a evolução de um mesmo dado ao longo de vários períodos
diferentes.
Ex:
O Box Plot fornece informação sobre as seguintes características do conjunto de dados: locação,
dispersão, assimetria e outliers (medidas discrepantes).
Ex:
2.5. Histograma
Histograma é uma representação gráfica (um gráfico de barras verticais ou barras horizontais) da
distribuição de frequências de um conjunto de dados quantitativos contínuos. O histograma pode
ser um gráfico por valores absolutos ou frequência relativa.
Ex:
Uma vez criado o rol, ou mesmo antes dele, efetuamos a contagem dos elementos e podemos expressar
o resultado em uma tabela conhecida por tabela de frequências. A tabela a seguir, por exemplo, é uma
representação do rol 15,15,15,16,16,16,16,16,17,17,17,17,17,18,18,19,19,20,20,20
xi fi fr fr% f ia f ra f ra %
15
16
17
18
19
20
TOTAL
Frequência absoluta simples: é a quantidade de vezes que determinado dado aparece na distribuição.
Frequência absoluta acumulada: é a soma das frequências absolutas simples dos dados de valor igual
ou menor a determinado dado.
4.1. Média ( x )
a) A Média aritmética simples, ou simplesmente média, é a medida de tendência central mais conhecida e
utilizada para resumir a informação contida em um conjunto de dados. A média de um conjunto de
dados é obtida somando todos os dados e dividindo o resultado pelo número deles.
x i
x 1 x 2 ... x n
x i1
n n
Exercício
01) Calcule a média das alturas (em cm) de um grupo de 5 jogadores de futebol mostrado na distribuição
165,172,175,181,193 .
02) Um grupo de 10 pessoas possui média de idade igual a 21 anos. Uma pessoa de 43 anos se junta a esse
grupo, qual será a nova média das idades?
x f i i
x 1.f1 x 2 .f2 ... x n .fn
x i1
n
f1 f2 ... fn
f
i1
i
Exercício
03) A tabela a seguir apresenta a idade de um grupo de 20 alunos de certa turma de uma escola. Qual a
média das idades desse grupo de alunos?
Idade (em anos) Número de alunos
15 2
16 8
17 7
18 3
04) A tabela abaixo descreve a pontuação obtida por um candidato em cada uma das cinco disciplinas que
compunham a prova de um determinado concurso público. A nota final do candidato deverá ser
calculada como a média aritmética dos pontos obtidos em cada uma das disciplinas da prova,
ponderados pelos respectivos pesos indicados na mesma tabela. Nestas condições, qual a nota final do
candidato?
Disciplina Nota Peso
Português 8,0 3
Matemática 7,0 2
Direito Constitucional 8,0 2
Direito Administrativo 6,0 2
Contabilidade 9,0 3
4.2. Moda
Exs: a) 12,12,13,13,13,13,14,15,15,15,16,16
b) 12,13,13,14,14,14,15,15,16,16,16,17
c) 12,12,13,13,14,14,15,15,16,16
OBS: (Importantíssimo!)
Se vários valores aparecerem a maior quantidade de vezes, todos eles serão as modas (distribuição
bimodal, trimodal, polimodal).
Se TODOS os valores aparecerem a mesma quantidade de vezes, a distribuição não terá moda (amodal).
Para dados agrupados por frequência, a moda é o dado que possuir a maior frequência absoluta simples
( f i ).
Exercício
05) Qual a moda entre os 50 funcionários de uma empresa, cujos salários são expressos na tabela a seguir?
Número de
Salário (em Reais)
funcionários
600,00 14
900,00 10
1200,00 7
1800,00 9
4500,00 10
4.3. Mediana
É o valor que ocupa a posição central de uma distribuição. Caso a distribuição tenha uma quantidade
de dados:
n 1
ÍMPAR, teremos um único dado central na posição .
2
n
PAR, teremos dois dados centrais nas posições e a seguinte a ela. A mediana será calculada pela
2
média desses dois valores.
Exs: a) 12,13,14,14,15,15,16,17,17
b) 14,14,15,15,15,16,16,17
c) 13,13,14,14,15,15,15,16
d) 15,10,14,12,11,15,12,14,10,13,12
Para dados agrupados por frequência, a mediana será o dado que possuir frequência ACUMULADA
igual ou imediatamente superior à posição do termo central.
Exercícios
06) Encontre a mediana para cada um dos conjuntos de dados expressos pelas tabelas a seguir.
07) Suponha que a etapa final de uma gincana escolar consista em um desafio de conhecimentos. Cada
equipe escolheria 10 alunos para realizar uma prova objetiva, e a pontuação de cada equipe seria dada
pela mediana das notas obtidas pelos alunos. As provas valiam, no máximo, 10 pontos cada. Ao final,
a vencedora foi a equipe Ômega, com 7,8 pontos, seguida pela equipe Delta, com 7,6 pontos. Um dos
alunos da equipe Gama, a qual ficou na terceira e última colocação, não pode comparecer, tendo
recebido nota zero na prova. As notas obtidas pelos 10 alunos da equipe Gama foram 10; 6,5; 8; 10; 7;
6,5; 7; 8; 6; 0. Se o aluno da equipe Gama que faltou tivesse comparecido, essa equipe:
A mediana divide um conjunto de dados ordenados em dois subconjuntos com o mesmo número de
dados:
O que antecede a mediana (dados iguais ou menores do que a mediana).
O que sucede a mediana (dados iguais ou maiores do que a mediana).
Os quartis dividem um conjunto de dados em quatro partes iguais. Os quartis são, portanto, três: o
primeiro quartil, o segundo quartil (que é a mediana) e o terceiro quartil.
Exs: a) (1,2,3,4,5,5,7,9,10)
b) (1,2,2,5,5,7,8,10,11,11)
5. Medidas de dispersão
A questão da variabilidade é inerente aos fenômenos físicos, naturais e econômicos. Por exemplo, na
mesma cidade a temperatura varia ao longo do dia e, no mesmo dia, registram-se temperaturas muito
diferentes em diferentes lugares do mundo. Para descrever um conjunto de dados, você deve apresentar,
além da medida de tendência central, uma medida de variabilidade ou dispersão.
Dispersão é uma medida do quanto os valores dos dados encontram-se afastados (dispersos) em torno
da média. Quanto mais afastados os dados estiverem da média, maior a dispersão.
A amplitude é fácil de calcular e de interpretar, mas não mede bem a variabilidade dos dados por uma
razão simples: para calculá-la, usam-se apenas os dois valores extremos. Isso significa que:
Dois conjuntos de dados com variabilidades muito diferentes podem ter a mesma amplitude.
Um valor discrepante faz a amplitude aumentar muito.
Considere uma prova que foi aplicada para 10 alunos, os resultados estão listados a seguir:
2, 3, 3, 4, 4, 5, 6, 6, 7,10
Vamos calcular a média das notas:
Observe que apesar da média das notas ter sido igual a 5, apenas um aluno obteve exatamente a nota
igual a 5, os demais alunos tiraram notas maiores ou menores que 5. Ou seja, os outros valores possuem
um desvio (positivo ou negativo) em relação à média.
Chamamos de desvio de cada dado ( d i ), à diferença xi x , onde xi é o dado e x é a média. Assim,
no exemplo anterior, podemos criar uma nova distribuição de desvios médios:
xi 2 3 3 4 4 5 6 6 7 10
di
OBS: (Importante!)
5.2.Desvio médio
d1 d 2 ... d n
Dm
n
5.3.Variância ( 2 )
Variância é a soma dos quadrados dos desvios de cada observação em relação à média, dividida por n
d d2 ... d n
2 2 2
2
1
n
OBS: A variância da amostra é a soma dos quadrados dos desvios de cada observação em relação à média, dividida
por (n 1) .
(x i x )2
s2 i1
n 1
Exercício
5.4.Desvio padrão ( )
2 ou s s 2
Exercício
09) Marco e Paulo foram classificados em um concurso. Para classificação no concurso o candidato deveria
obter média aritmética na pontuação igual ou superior a 14. Em caso de empate na média, o desempate
seria em favor da pontuação mais regular. No quadro a seguir são apresentados os pontos obtidos nas
provas de Matemática, Português e Conhecimentos Gerais, a média, a mediana e o desvio padrão dos
dois candidatos.
O candidato com pontuação mais regular, portanto mais bem classificado no concurso
5.5.Desvio médio, variância e desvio padrão para dados agrupados por frequência.
d1 . f1 d 2 . f 2 ... d n . f n
Dm
f1 f 2 ... f n
d . f1 d 2 . f 2 ... d n . f n
2 2 2
1
2
f1 f 2 ... f n
Exercício
Número de di
Idade
alunos
15 3
16 6
17 8
18 5
19 2
20 1
Em algumas situações é mais interessante agrupar os dados em intervalos do que expressar o seu valor
exato. Nessas situações dizemos que os dados estão agrupados por classes.
Cada classe possui um limite inferior e um limite superior. A diferença entre esses limites é chamada
de amplitude da classe.
A média aritmética entre os limites inferior e superior é chamada de ponto médio ( xi ) da classe.
A distribuição também possui um limite inferior e um limite superior. A diferença entre esses limites é
chamada de amplitude da distribuição.
Para calcular a média em dados agrupados por classes, usamos o ponto médio das classes:
n
A classe que possuir o elemento na posição , sendo n o número de dados da distribuição é chamada
2
de CLASSE MEDIANA.
Exercício
11) Foi realizado um levantamento nos 200 hotéis de uma cidade, no qual foram anotados os valores, em
reais, das diárias para um quarto padrão de casal e a quantidade de hotéis para cada valor da diária. Os
valores das diárias foram: A=R$200,00; B=R$300,00; C=R$400,00 e D=R$600,00. No gráfico, as
áreas representam as quantidades de hotéis pesquisados, em porcentagem, para cada valor da diária.
O valor mediano da diária, em reais, para o quarto padrão de casal nessa cidade, é
a) 300,00.
b) 345,00.
c) 350,00.
d) 375,00.
e) 400,00.
12) As notas de um professor que participou de um processo seletivo, em que a banca avaliadora era
composta por cinco membros, são apresentadas no gráfico. Sabe-se que cada membro da banca atribui
duas notas ao professor, uma relativa aos conhecimentos específicos da área de atuação e outra, aos
conhecimentos pedagógicos, e que a média final do professor foi dada pela média aritmética de todas
as notas atribuídas pela banca avaliadora.
Utilizando um novo critério, essa banca avaliadora resolveu descartar a maior e a menor notas atribuídas
ao professor. A nova média, em relação à média anterior, é