Escolar Documentos
Profissional Documentos
Cultura Documentos
5.4 Medidas de Forma: assimetria e curtose, medidas de associação entre variáveis quantitativas e qualitativas (coeficiente de
correlação linear de Pearson e coeficiente de contingência de Pearson)
5.5, medidas descritivas (posição, Gráficos, diagramas, tabelas dispersão, assimetria e curtose).
6 Noções de Probabilidade.
8 Noções de Estimação.
9 Testes de hipóteses.
11 Noções de amostragem
. 11.1 Amostragem
probabilística: técnicas de amostragem – amostragem aleatória simples, estratificada, sistemática e por conglomerados.
2 Box plot
(observação, nessa explicação os dados não tem
outliers, por isso o mínimo e o máximo são os valores
mínimos e máximos dos dados)
Um boxplot fornece um resumo gráfico da distribuição de uma amostra. O boxplot mostra a forma,
a tendência central e a variabilidade dos dados. É uma maneira padronizada de exibir a
distribuição de dados com base em um resumo de cinco números: mínimo, primeiro quartil (Q1),
mediana, terceiro quartil (Q3) e máximo. Mas o que significa cada um desses?
• Mínimo: é o menor valor.
• Primeiro quartil (Q1 ou Percentil 25): 25% dos dados são menores que ou iguais a este valor.
• Segundo quartil (Q2 ou Percentil 50): corresponde ao valor central de um conjunto de valores
ordenado, sendo uma medida de tendência central. 50% dos dados são menores que ou iguais a
este valor.
• Terceiro quartil (Q3 ou Percentil 75): 75% dos dados são menores que ou iguais a este valor.
• Máximo: é o maior valor.
Exemplo 1: para os seguintes dados: 7, 9, 16, 36, 39, 45, 45, 46, 48, 51
Mínimo= 7
Q1 = 14,25
Q2 (mediana) = 42
Q3 = 46,50
Máximo= 51
O boxplot, dessa forma, pode informar sobre seus valores discrepantes e quais são seus valores.
Ele também pode dizer se seus dados são simétricos, com que precisão seus dados estão
agrupados e se e como seus dados estão distorcidos.
Anatomia do boxplot
Usar um boxplots é a forma ideal para ter um resumo visual dos dados. Desta forma, os
pesquisadores podem identificar rapidamente os valores médios, a dispersão do conjunto de
dados e os sinais de assimetria.
Posição
Em relação à posição do valor central dos dados, observa-se a linha central do retângulo (a
mediana ou segundo quartil). Serve para identificar onde se localiza a medida de tendência
central da distribuição.
Dispersão
A dispersão dos dados pode ser representada pelo intervalo interquartil (IIQ) que é a diferença
entre o terceiro quartil e o primeiro quartil (tamanho da caixa), ou ainda pela amplitude que é
calculada da seguinte maneira: valor máximo – valor mínimo. Embora a amplitude seja de fácil
entendimento, o intervalo interquartílico é uma estatística mais robusta para medir variabilidade
uma vez que não sofre influência de outliers.
Intervalo interquartílico (Q3 - Q1 ou IIQ)
É definida como a diferença entre Q3 e Q1. No gráfico é representado pela dimensão da caixa.
Estende-se do Q1 a Q3 (percentis 25º a 75º). Representa o intervalo dos 50% dos dados em
torno da mediana.
Simetria
Um conjunto de dados que tem uma distribuição simétrica, terá a linha da mediana no centro do
retângulo. Quando a linha da mediana está próxima ao primeiro quartil, os dados são
assimétricos positivos e quando a posição da linha da mediana é próxima ao terceiro quartil, os
dados são assimétricos negativos. Vale ressaltar que a mediana é a medida de tendência central
mais indicada quando os dados possuem distribuição assimétrica, uma vez que a média
aritmética é influenciada pelos valores extremos.
Outliers
Já os outliers indicam possíveis valores discrepantes, sendo demonstrados nos gráficos como
pontos ou estrelas, como representado na figura 1 nas bolinhas vermelhas. No boxplot, as
observações são consideradas outliers quando estão abaixo ou acima do limite de detecção de
outliers.
O limite de detecção de outliers é construído utilizando o intervalo interquartil, dado pela distância
entre o primeiro e o terceiro quartil. Sendo assim, os limites inferior e superior de detecção de
outlier são dados por:
Limite Inferior = Q1 – 1,5 * IIQ
Limite Superior = Q3 + 1,5 * IIQ
Exemplo 2: para os seguintes dados: 201, 210, 211, 222, 263, 264, 1033
Mínimo esperado = 129 (Limite Inferior=210 – (1,5*54) = 210-81=129)
Q1 = 210
Q2 (mediana) = 222
Q3 = 264
IIQ= 54
Máximo esperado = 345 (Limite Superior = 264 + (1,5*54) = 264+81=345)
Nesse exemplo encontramos um outlier (o número 1033), que está acima do valor esperado.
Caso a presença de outliers, o mínimo vira o limite inferior e o máximo vira o limite superior.
Caso, não haja presença de outliers, o mínimo e o máximo se mantém. Como no exemplo 2 tem
outliers, então o máximo agora não é mais máximo e sim o limite superior. Já no exemplo 1 não
possuímos outliers, então não precisamos calcular limite superior e limite inferior.
O primeiro quartil (Q1) está na Juventude; o segundo quartil (Q2) está na Meia idade; o terceiro quartil (Q3)
está na Maturidade.
Questão 24
Questão 24
Resolução
Questão 28: Medidas separatrizes.
Questão 28: Medidas separatrizes. Resolução
Primeiro organizamos o Rol:
4,5; 4,8; 6,8; 7,1; 8,1; 8,6; 8,8
Md = 7,1
Q1 = 4,8
Q3 = 8,6
IIQ = Q3 - Q1
IIQ = 8,6 - 4,8
IIQ = 3,8
O gabarito é a Alternativa E.
O Box-plot é uma forma de fornecer uma análise visual sobre a posição, dispersão, simetria, caudas e valores
discrepantes de um conjunto de dados por meio dos quartis.
O primeiro passo para fazer um box-plot, é ter os dados ordenados, como dado no enunciado:
Segundo passo, calcula-se a mediana do conjunto de dados, que será o 2º quartil Q2. É o valor que divide o
conjunto de dados ao meio, como tem-se n = 18, uma quantidade par de valores, a mediana é a média dos dois
valores centrais, isto é, Q2 = (90 + 90)/2 = 90.
Terceiro passo, a mediana do conjunto de dados que ficou a esquerda de Q2 será o 1º quartil Q1, e a mediana do
conjunto de dados que ficou a direita de Q2, será o 3º quartil Q3. Neste caso, Q1 = (85 + 85)/2 = 85, e Q3 =
(100 + 100)/2 = 100. Ainda, tem-se que os valores mínimo e máximo do conjunto de dados são: min =
60, e máx = 100.
Por fim, o gráfico, que pode ser na horizontal ou vertical, com os valores igualmente espaçados do mínimo ao
máximo. Neste caso, fazemos um box-plot vertical, e para cada um dos valores encontrados, Q1 = 85, Q2 = 90 e
Q3 = 100 marca-se um traço horizontal. E então fecha esse retângulo formado pelos traços de Q1 e Q3, como
mostrado abaixo:
Neste caso, como o máximo é igual a Q3, não tem-se a cauda para cima. E o valor mínimo = 60, representando
por um ponto, é considerado um outlier pois está distante dos outros valores, e a calda para baixo vai até o
menor valor depois do outlier.
Questão 72
Questão 72 resolução
A fórmula para calcular 1 º quartil é:
Li = 10
k = 1/ 4 (1º quartil)
Σfi = 200 (somatório das frequências absolutas)
F ant = 30 (Frequência acumulada do intervalo anterior)
f intervalo = 50 (Frequência absoluta do intervalo em que está o 1º quartil )
h = 20 (amplitude do intervalo do 1º quartil)
Como nível de consumo está em 10 kWh e o número de domicílio em mil. Fazendo as devidas adequações:
Desvio interquartílico = 40 - 30 = 10
LI = 30 - 1,5*10 = 15
LS = 40 + 1,5*10 = 55
Como a idade mínima dos gerentes selecionados é 35 e a idade máxima dos gerentes selecionados é 64. Temos
pelo menos um valor atípico, 64 (64 > 55).
Desvio interquartílico = 36 - 30 = 6
LI = 30 - 1,5*6 = 21
LS = 36 + 1,5*6 = 45
Como a idade mínima dos gerentes não selecionados é 29 e a idade máxima dos gerentes não selecionados
é 43. Não temos valores atípicos, todos os valores estão entre o limite inferior e o limite superior.
Portanto, o grupo dos selecionados apresenta pelo menos um valor atípico (64), enquanto o grupo dos não
selecionados não apresenta valores atípicos.
Questão 86 separatriz (a questão deu um monte de informação, mas
não era pra usar nenhuma)
Questão 86 resolução
ALTERNATIVA B.
Um quartil é um dos três valores (Q1, Q2 e Q3) que divide o conjunto ordenado de dados em quatro partes
iguais, e assim cada parte representa 1/4 da amostra. Assim:
O número de funcionários que recebe acima do terceiro quartil equivale a 25% do total. Logo: 25% de 600
funcionários = 150 funcionários.
Questão 89 separatriz
Questão 89 resolução
Questão 101
Questão 101 resolução
As medidas separatrizes, no caso de quartil, são três, que separam os valores em porções de 25% cada uma delas.
É imprescindível a ordenação dos dados, antes de se calcular as medidas separatrizes. Assim, no caso, um aluno
que tire nota coincidente com o primeiro quartil, tem 25% das notas piores do que a sua; e 75% das notas
melhores do que a sua, de forma que está entre os 25% piores no exame, bem como entre os 75% melhores do
exame.
Questão 109
Questão 109: resolução
Q1 = (5+7)/2 = 6
Q3 = (10+12)/2 = 11
Q3 - Q1 = 11 - 6
Q3 - Q1 = 5
GABARITO: B
Q1=49
Q2=54
Q3=63
GABARITO: C
Essa questão envolve o uso de medidas separatrizes, mais especificamente os quartis. O aluno precisa analisar
os valores das frequências informados na “tabela” e verificar qual o terceiro quartil dos salários.
Portanto, temos: