Você está na página 1de 12

DISCIPLINA: F104850 - MÉTODOS ESTATÍSTICOS

DOCENTE: ALLISSON NASCIMENTO

A ESTATÍSTICA NA ENGENHARIA
1. Introdução

Logo após a Revolução Industrial, métodos estatísticos foram incorporados nos processos industriais
para garantir a qualidade dos produtos. Amostras de itens produzidos eram avaliadas sistematicamente
para inferir se o processo estava sob controle. Mais recentemente, a avaliação da qualidade passou a ser
feita ao longo de todo processo produtivo como forma de corrigir eventuais falhas no sistema assim que
elas aparecessem. Isso levou a um aumento da qualidade do produto final e redução de custos, pois se
reduziram drasticamente as perdas por defeitos. Além do acompanhamento estatístico da qualidade, as
indústrias costumam fazer experimentos estatisticamente planejados para encontrar a combinação dos
níveis dos fatores do processo que levem a melhor qualidade possível. Na outra ponta, as empresas
levantam dados de amostras de consumidores para realizar pesquisas de marketing direcionadas ou para
adequar os produtos aos clientes. O planejamento dessas amostras e a análise dos dados necessitam de
técnicas estatísticas. Muitas vezes, a relação entre estatística e engenharia é ainda mais estreita. Os
próprios métodos de engenharia costumam incorporar intrinsecamente procedimentos probabilísticos ou
estatísticos. Assim, para que um aluno possa entender certos métodos de engenharia, é necessário que
tenha conhecimentos de probabilidade e estatística.

 A estatística é a área da Matemática que fornece métodos para a coleta, organização, descrição, análise
e interpretação de dados para a futura utilização dos mesmos na tomada de decisões.

 Existem dois tipos básicos de dados:

 Quantitativos: expressam uma quantidade.

Exs: idade, salário, estatura, inflação.

 Qualitativos: expressam uma qualidade.

Exs: cor dos olhos, preferência por uma marca.

A partir de agora daremos uma ênfase especial aos dados que são expressos por variáveis quantitativas.

 À medida que os dados vão sendo coletados, eles vão sendo organizados em uma sequência. Tal
sequência é chamada de dados brutos. A partir da organização em ordem crescente desses dados brutos
podemos criar o rol.

Ex: Dados brutos: 17,20,16,18,15,16,16,19,17,17,16,17,19,20,15,18,16,15,20,17


Rol:

 Podemos ainda organizar os dados em uma tabela, chamada de tabela de frequência em que é exibido
o valor do dado e o número de vezes que esse dado aparece (frequência)

Idade (anos) Número de pessoas


2. Tipos de gráficos

2.1. Gráfico de barras

 Cada barra tem o tamanho proporcional à quantidade de vezes que o dado aparece na distribuição.

Ex:

2.2. Gráficos de setores (pizza)

 Cada setor circular tem o tamanho proporcional à quantidade de vezes que o dado aparece na
distribuição.

Ex:
2.3. Gráfico de linhas

 É usado normalmente para acompanhar a evolução de um mesmo dado ao longo de vários períodos
diferentes.

Ex:

2.4. Gráfico Boxplot

 O Box Plot fornece informação sobre as seguintes características do conjunto de dados: locação,
dispersão, assimetria e outliers (medidas discrepantes).

Ex:
2.5. Histograma

 Histograma é uma representação gráfica (um gráfico de barras verticais ou barras horizontais) da
distribuição de frequências de um conjunto de dados quantitativos contínuos. O histograma pode
ser um gráfico por valores absolutos ou frequência relativa.

Ex:

3. Tipos de tabela de frequências

 Uma vez criado o rol, ou mesmo antes dele, efetuamos a contagem dos elementos e podemos expressar
o resultado em uma tabela conhecida por tabela de frequências. A tabela a seguir, por exemplo, é uma
representação do rol 15,15,15,16,16,16,16,16,17,17,17,17,17,18,18,19,19,20,20,20 

xi fi fr fr% f ia f ra f ra %
15
16
17
18
19
20
TOTAL
 Frequência absoluta simples: é a quantidade de vezes que determinado dado aparece na distribuição.

 Frequência relativa simples:


fi
fr  → f r %  f r .100
TOTAL

 Frequência absoluta acumulada: é a soma das frequências absolutas simples dos dados de valor igual
ou menor a determinado dado.

 Frequência relativa acumulada:


f ia
f ra  → f ra %  f ra .100
TOTAL

4. Medidas de tendência central

4.1. Média ( x )

a) A Média aritmética simples, ou simplesmente média, é a medida de tendência central mais conhecida e
utilizada para resumir a informação contida em um conjunto de dados. A média de um conjunto de
dados é obtida somando todos os dados e dividindo o resultado pelo número deles.

x i
x 1  x 2  ...  x n
x i1

n n

Exercício

01) Calcule a média das alturas (em cm) de um grupo de 5 jogadores de futebol mostrado na distribuição
165,172,175,181,193 .

02) Um grupo de 10 pessoas possui média de idade igual a 21 anos. Uma pessoa de 43 anos se junta a esse
grupo, qual será a nova média das idades?

b) A Média aritmética ponderada de dados discretos agrupados em uma tabela de distribuição de


frequências é dada pela soma dos produtos dos valores da variável pelas respectivas frequências,
dividida pela soma das frequências.

x f i i
x 1.f1  x 2 .f2  ...  x n .fn
x i1

n
f1  f2  ...  fn
f
i1
i
Exercício

03) A tabela a seguir apresenta a idade de um grupo de 20 alunos de certa turma de uma escola. Qual a
média das idades desse grupo de alunos?
Idade (em anos) Número de alunos
15 2
16 8
17 7
18 3

04) A tabela abaixo descreve a pontuação obtida por um candidato em cada uma das cinco disciplinas que
compunham a prova de um determinado concurso público. A nota final do candidato deverá ser
calculada como a média aritmética dos pontos obtidos em cada uma das disciplinas da prova,
ponderados pelos respectivos pesos indicados na mesma tabela. Nestas condições, qual a nota final do
candidato?
Disciplina Nota Peso
Português 8,0 3
Matemática 7,0 2
Direito Constitucional 8,0 2
Direito Administrativo 6,0 2
Contabilidade 9,0 3

4.2. Moda

 É o dado que possui a maior frequência absoluta simples de uma distribuição.

Exs: a) 12,12,13,13,13,13,14,15,15,15,16,16 
b) 12,13,13,14,14,14,15,15,16,16,16,17 
c) 12,12,13,13,14,14,15,15,16,16

OBS: (Importantíssimo!)

 Se vários valores aparecerem a maior quantidade de vezes, todos eles serão as modas (distribuição
bimodal, trimodal, polimodal).

 Se TODOS os valores aparecerem a mesma quantidade de vezes, a distribuição não terá moda (amodal).

 Para dados agrupados por frequência, a moda é o dado que possuir a maior frequência absoluta simples
( f i ).

Exercício

05) Qual a moda entre os 50 funcionários de uma empresa, cujos salários são expressos na tabela a seguir?

Número de
Salário (em Reais)
funcionários
600,00 14
900,00 10
1200,00 7
1800,00 9
4500,00 10
4.3. Mediana

 É o valor que ocupa a posição central de uma distribuição. Caso a distribuição tenha uma quantidade
de dados:
n 1
 ÍMPAR, teremos um único dado central na posição .
2
n
 PAR, teremos dois dados centrais nas posições e a seguinte a ela. A mediana será calculada pela
2
média desses dois valores.

Exs: a)  12,13,14,14,15,15,16,17,17 
b)  14,14,15,15,15,16,16,17 
c)  13,13,14,14,15,15,15,16 
d)  15,10,14,12,11,15,12,14,10,13,12 

 Para dados agrupados por frequência, a mediana será o dado que possuir frequência ACUMULADA
igual ou imediatamente superior à posição do termo central.

Exercícios

06) Encontre a mediana para cada um dos conjuntos de dados expressos pelas tabelas a seguir.

Idade (anos) Nº de alunos


17 6
18 10
19 5
20 4

Salário (R$) Nº de funcionários


600,00 9
1000,00 21
1500,00 10
2400,00 32
4000,00 8

07) Suponha que a etapa final de uma gincana escolar consista em um desafio de conhecimentos. Cada
equipe escolheria 10 alunos para realizar uma prova objetiva, e a pontuação de cada equipe seria dada
pela mediana das notas obtidas pelos alunos. As provas valiam, no máximo, 10 pontos cada. Ao final,
a vencedora foi a equipe Ômega, com 7,8 pontos, seguida pela equipe Delta, com 7,6 pontos. Um dos
alunos da equipe Gama, a qual ficou na terceira e última colocação, não pode comparecer, tendo
recebido nota zero na prova. As notas obtidas pelos 10 alunos da equipe Gama foram 10; 6,5; 8; 10; 7;
6,5; 7; 8; 6; 0. Se o aluno da equipe Gama que faltou tivesse comparecido, essa equipe:

a) Teria a pontuação igual a 6,5 se ele obtivesse nota 0.


b) Seria a vencedora se ele obtivesse nota 10.
c) Seria a segunda colocada se ele obtivesse nota 8.
d) Permaneceria na terceira posição, independentemente da nota obtida pelo aluno.
e) Empataria com a equipe Ômega na primeira colocação se o aluno obtivesse nota 9.
4.4. Quartil

A mediana divide um conjunto de dados ordenados em dois subconjuntos com o mesmo número de
dados:
 O que antecede a mediana (dados iguais ou menores do que a mediana).
 O que sucede a mediana (dados iguais ou maiores do que a mediana).

Os quartis dividem um conjunto de dados em quatro partes iguais. Os quartis são, portanto, três: o
primeiro quartil, o segundo quartil (que é a mediana) e o terceiro quartil.

Como obter os quartis?


1º Passo: Organize os dados em ordem crescente, em seguida encontre a mediana (segundo quartil);
marque esse valor.
2º Passo: Encontre o primeiro quartil, da seguinte forma: tome o conjunto de dados à esquerda da
mediana; o primeiro quartil é a mediana do novo conjunto de dados.
3º Passo: Encontre o terceiro quartil, da seguinte forma: tome o conjunto de dados à direita da mediana;
o terceiro quartil é a mediana do novo conjunto de dados.

Exs: a) (1,2,3,4,5,5,7,9,10)

b) (1,2,2,5,5,7,8,10,11,11)

5. Medidas de dispersão

A questão da variabilidade é inerente aos fenômenos físicos, naturais e econômicos. Por exemplo, na
mesma cidade a temperatura varia ao longo do dia e, no mesmo dia, registram-se temperaturas muito
diferentes em diferentes lugares do mundo. Para descrever um conjunto de dados, você deve apresentar,
além da medida de tendência central, uma medida de variabilidade ou dispersão.

 Dispersão é uma medida do quanto os valores dos dados encontram-se afastados (dispersos) em torno
da média. Quanto mais afastados os dados estiverem da média, maior a dispersão.

5.1. Mínimo, máximo e amplitude

 Mínimo de um conjunto de dados é o número de menor valor.


 Máximo de um conjunto de dados é o número de maior valor.
 Amplitude de um conjunto de dados é a diferença entre o valor máximo e o valor mínimo do conjunto.

A amplitude é fácil de calcular e de interpretar, mas não mede bem a variabilidade dos dados por uma
razão simples: para calculá-la, usam-se apenas os dois valores extremos. Isso significa que:

 Dois conjuntos de dados com variabilidades muito diferentes podem ter a mesma amplitude.
 Um valor discrepante faz a amplitude aumentar muito.

 Considere uma prova que foi aplicada para 10 alunos, os resultados estão listados a seguir:

 2, 3, 3, 4, 4, 5, 6, 6, 7,10 
 Vamos calcular a média das notas:

 Observe que apesar da média das notas ter sido igual a 5, apenas um aluno obteve exatamente a nota
igual a 5, os demais alunos tiraram notas maiores ou menores que 5. Ou seja, os outros valores possuem
um desvio (positivo ou negativo) em relação à média.
 Chamamos de desvio de cada dado ( d i ), à diferença xi  x , onde xi é o dado e x é a média. Assim,
no exemplo anterior, podemos criar uma nova distribuição de desvios médios:

xi 2 3 3 4 4 5 6 6 7 10
di

OBS: (Importante!)

 A soma dos desvios médios de todos os dados é igual a zero.

5.2.Desvio médio

d1  d 2  ...  d n
Dm 
n

 Assim, o desvio médio da distribuição anterior é calculado por:

5.3.Variância (  2 )
Variância é a soma dos quadrados dos desvios de cada observação em relação à média, dividida por n

 d    d2   ...   d n 
2 2 2

 2
 1
n

OBS: A variância da amostra é a soma dos quadrados dos desvios de cada observação em relação à média, dividida
por (n  1) .

 (x i  x )2
s2  i1

n 1

Exercício

08) Da distribuição  2, 3, 3, 4, 4, 5, 6, 6, 7,10  , calcule a variância.

5.4.Desvio padrão (  )

   2 ou s  s 2
Exercício

09) Marco e Paulo foram classificados em um concurso. Para classificação no concurso o candidato deveria
obter média aritmética na pontuação igual ou superior a 14. Em caso de empate na média, o desempate
seria em favor da pontuação mais regular. No quadro a seguir são apresentados os pontos obtidos nas
provas de Matemática, Português e Conhecimentos Gerais, a média, a mediana e o desvio padrão dos
dois candidatos.

O candidato com pontuação mais regular, portanto mais bem classificado no concurso

a) Marco, pois a média e a mediana são iguais.


b) Marco, pois obteve menor desvio padrão.
c) Paulo, pois obteve a maior pontuação da tabela, 19 em Português.
d) Paulo, pois obteve maior mediana.
e) Paulo, pois obteve maior desvio padrão.

5.5.Desvio médio, variância e desvio padrão para dados agrupados por frequência.

d1 . f1  d 2 . f 2  ...  d n . f n
Dm 
f1  f 2  ...  f n

d  . f1   d 2  . f 2  ...   d n  . f n
2 2 2

  1
2

f1  f 2  ...  f n
Exercício

10) A tabela a seguir mostra as idades, em anos, de um grupo de 25 alunos.

Número de di
Idade
alunos
15 3
16 6
17 8
18 5
19 2
20 1

Encontre o desvio médio, variância e desvio padrão dessa distribuição.


6. Dados agrupados por classe

 Em algumas situações é mais interessante agrupar os dados em intervalos do que expressar o seu valor
exato. Nessas situações dizemos que os dados estão agrupados por classes.

Ex: A tabela abaixo mostra o salário, em reais, de um grupo de 200 pessoas.

 Cada classe possui um limite inferior e um limite superior. A diferença entre esses limites é chamada
de amplitude da classe.

 A média aritmética entre os limites inferior e superior é chamada de ponto médio ( xi ) da classe.

 A distribuição também possui um limite inferior e um limite superior. A diferença entre esses limites é
chamada de amplitude da distribuição.

 Para calcular a média em dados agrupados por classes, usamos o ponto médio das classes:

 A classe que possui a média é chamada de CLASSE MÉDIA.

 A classe que possui a maior frequência simples é chamada de CLASSE MODAL.

n
 A classe que possuir o elemento na posição , sendo n o número de dados da distribuição é chamada
2
de CLASSE MEDIANA.

Exercício

11) Foi realizado um levantamento nos 200 hotéis de uma cidade, no qual foram anotados os valores, em
reais, das diárias para um quarto padrão de casal e a quantidade de hotéis para cada valor da diária. Os
valores das diárias foram: A=R$200,00; B=R$300,00; C=R$400,00 e D=R$600,00. No gráfico, as
áreas representam as quantidades de hotéis pesquisados, em porcentagem, para cada valor da diária.

O valor mediano da diária, em reais, para o quarto padrão de casal nessa cidade, é

a) 300,00.
b) 345,00.
c) 350,00.
d) 375,00.
e) 400,00.
12) As notas de um professor que participou de um processo seletivo, em que a banca avaliadora era
composta por cinco membros, são apresentadas no gráfico. Sabe-se que cada membro da banca atribui
duas notas ao professor, uma relativa aos conhecimentos específicos da área de atuação e outra, aos
conhecimentos pedagógicos, e que a média final do professor foi dada pela média aritmética de todas
as notas atribuídas pela banca avaliadora.

Utilizando um novo critério, essa banca avaliadora resolveu descartar a maior e a menor notas atribuídas
ao professor. A nova média, em relação à média anterior, é

a) 0,25 ponto maior.


b) 1,00 ponto maior.
c) 1,00 ponto menor.
d) 1,25 ponto maior.
e) 2,00 pontos menor.

Você também pode gostar