Você está na página 1de 3

Nome: Nathan dos Santos Bárbara Turma: 30E

DES / UFLA GES 104 – ESTATÍSTICA APLICADA À ENGENHARIA II-2022


TRABALHO Prof. MÁRIO VIVANCO

1. Qual é a população em estudo?


Resposta: Tanques de armazenamento de GLP da Refinaria de Paulínia
(REPLAN/PETROBRAS).
2. Qual é a amostra em estudo?
Resposta: 114 tanques de armazenamento de GLP condenados da Refinaria de
Paulínia (REPLAN/PETROBRAS).
3. Qual é a variável estudada?
Resposta: Profundidade máxima de corrosão por pites (em mm) em 114 tanques de
GLP.
4. Qual é o tipo da variável estudada?
Resposta: Variável quantitativa contínua.
5. Organize e apresente os dados em uma Tabela de Distribuição de Frequências.
Resposta:
Profundidade máxima de corrosão por Nº de
pites (em mm) em 114 tanques de GLP tanques

2,5 - 3,0 4

3,0 - 3,5 10

3,5 - 4,0 31

4,0 - 4,5 39

4,5 - 5,0 24

5,0 - 5,5 6
Comandos do R utilizados:
x=read.table("pites.txt",h=T)
x
corr=x$corrosao
corr
hist(corr, breaks = "Sturges",freq = TRUE, right = FALSE, plot = FALSE)
6. Interprete a Tabela de Distribuição de Frequências.
Pergunta: Qual o nº de tanques com profundidade máxima de corrosão por pites
menor que 4,0 mm?
Resposta: 45 tanques
7. Construa e apresente o HISTOGRAMA. Responda:

Comandos do R utilizados:
x=read.table("pites.txt",h=T)
x
corr=x$corrosao
corr
hist(corr, breaks = "Sturges",freq = TRUE, right = FALSE, plot = TRUE, col=3)
a) Em que posição do histograma os dados estão mais concentrados?
Resposta: Os dados estão concentrados mais ao centro do histograma.
b) Segundo a sua resposta dada em (a), como se distribuem os dados?
Resposta: Os dados estão distribuídos de forma SIMÉTRICA.
8. Mencione e calcule a medida de POSIÇÃO mais apropriada para os dados.
Resposta: Como os dados estão distribuídos mais ao centro do histograma, ao
compará-los com as curvas de distribuição de frequência, percebemos que se trata de
uma curva simétrica. Assim, o cálculo da medida de posição mais apropriada para
nossos dados pode ser feito tanto através da MÉDIA quanto através da MEDIANA.
- Utilizando a MEDIANA: md = 4,08
Comandos do R utilizados:
x=read.table("pites.txt",h=T)
x
corr=x$corrosao
corr
median(corr) #mediana da variavel corr
9. Temos outro conjunto de dados:
Y: peso em quilogramas de 3 carregamentos de areia. Y={1000, 2000, 3000}
Que conjunto de dados é mais variável “X” ou “Y”? Justifique: Por quê?
Resposta:
● Para o cálculo do coeficiente de variabilidade do conjunto “X” foram utilizados os
seguintes comandos do R:
x=read.table("pites.txt",h=T)
x
corr=x$corrosao
corr
var(corr) #variancia de corr
sd(corr) #desvio padrao de corr
cv=sd(corr)/mean(corr)*100
● Para o cálculo do coeficiente de variabilidade do conjunto “Y” fora utilizadas as
seguintes fórmulas:
𝑛 2

2 𝑖=1
(
∑ 𝑋𝑖−𝑋 ) 2 𝑆
𝑆 = 𝑛−1
𝑆= 𝑆 𝐶𝑉 = × 100
𝑋
2
Sendo: 𝑆 (variância); 𝑆 (desvio padrão); 𝐶𝑉 (coeficiente de variabilidade)
● Como resultado obteve-se:
CV do conjunto “X” ≃ 13%
CV do conjunto “Y” = 50%
● Conclui-se, portanto, que o conjunto “Y” é mais variável, pois apresenta um maior
coeficiente de variabilidade.
10. Usando a notação adequada, escreva a fórmula (expressão algébrica) para
calcular a MÉDIA e a VARIÂNCIA POPULACIONAL.
Resposta:
Média: Variância populacional:
𝑛 𝑛 2
∑ 𝑋𝑖
𝑖=1
(
∑ 𝑋𝑖−𝑋
𝑖=1
)
𝑋= 𝑛
𝑆= 𝑛

Você também pode gostar