Você está na página 1de 92

5 Estatística.

5.1 Medidas de tendência central.

5.2 Medidas separatrizes.

5.3 Medidas de dispersão.

5.4 Medidas de Forma: assimetria e curtose, medidas de associação entre variáveis quantitativas e qualitativas (coeficiente de
correlação linear de Pearson e coeficiente de contingência de Pearson)

5.5, medidas descritivas (posição, Gráficos, diagramas, tabelas dispersão, assimetria e curtose).

6 Noções de Probabilidade.

6.1 Probabilidade condicional e independência.


6.2 Variáveis aleatórias discretas e contínuas.

7 Noções de Inferência Estatística.

7.1 População e amostra.

7.2 Seleção de amostra.

7.3 Estatística e parâmetro.

7.4 Distribuições amostrais.

8 Noções de Estimação.

8.1 Estimação pontual.

8.2 Estimação intervalar.

9 Testes de hipóteses.

9.1 Teste sobre a média de uma população.

9.2 Teste para comparação de duas populações considerando amostras independentes.

9.3 Teste para comparação de duas populações considerando amostras dependentes


(pareadas).

9.4 Testes de homogeneidade.

9.5 Teste de independência.

9.6 Teste para o coeficiente de correlação.

10 Noções sobre Regressão.

10.1 Diagrama de dispersão.

10.2 Ajuste da reta de regressão pelo método dos mínimos quadrados.

10.3 Regressão linear simples.

10.4 Intervalos de confiança e intervalo de predição.

11 Noções de amostragem

. 11.1 Amostragem
probabilística: técnicas de amostragem – amostragem aleatória simples, estratificada, sistemática e por conglomerados.

11.2 Amostragem não probabilística.

12. Entidades Discretas e Contínuas; Algoritmos; Operações Lógicas, Aritméticas,


Trigonométricas e Estatísticas
1. Medidas separatrizes.
2. Box plot
3. Ramos e folhas
aqui

2 Box plot
(observação, nessa explicação os dados não tem
outliers, por isso o mínimo e o máximo são os valores
mínimos e máximos dos dados)

O site o box plot chamou de digrama de caixa


Observação: nesse estudo, no exemplo 2, o mínimo e
o máximo são calculados considerando os outliers.

Um boxplot fornece um resumo gráfico da distribuição de uma amostra. O boxplot mostra a forma,
a tendência central e a variabilidade dos dados. É uma maneira padronizada de exibir a
distribuição de dados com base em um resumo de cinco números: mínimo, primeiro quartil (Q1),
mediana, terceiro quartil (Q3) e máximo. Mas o que significa cada um desses?
• Mínimo: é o menor valor.
• Primeiro quartil (Q1 ou Percentil 25): 25% dos dados são menores que ou iguais a este valor.
• Segundo quartil (Q2 ou Percentil 50): corresponde ao valor central de um conjunto de valores
ordenado, sendo uma medida de tendência central. 50% dos dados são menores que ou iguais a
este valor.
• Terceiro quartil (Q3 ou Percentil 75): 75% dos dados são menores que ou iguais a este valor.
• Máximo: é o maior valor.

Exemplo 1: para os seguintes dados: 7, 9, 16, 36, 39, 45, 45, 46, 48, 51
Mínimo= 7
Q1 = 14,25
Q2 (mediana) = 42
Q3 = 46,50
Máximo= 51
O boxplot, dessa forma, pode informar sobre seus valores discrepantes e quais são seus valores.
Ele também pode dizer se seus dados são simétricos, com que precisão seus dados estão
agrupados e se e como seus dados estão distorcidos.

Anatomia do boxplot
Usar um boxplots é a forma ideal para ter um resumo visual dos dados. Desta forma, os
pesquisadores podem identificar rapidamente os valores médios, a dispersão do conjunto de
dados e os sinais de assimetria.

Posição
Em relação à posição do valor central dos dados, observa-se a linha central do retângulo (a
mediana ou segundo quartil). Serve para identificar onde se localiza a medida de tendência
central da distribuição.

Dispersão
A dispersão dos dados pode ser representada pelo intervalo interquartil (IIQ) que é a diferença
entre o terceiro quartil e o primeiro quartil (tamanho da caixa), ou ainda pela amplitude que é
calculada da seguinte maneira: valor máximo – valor mínimo. Embora a amplitude seja de fácil
entendimento, o intervalo interquartílico é uma estatística mais robusta para medir variabilidade
uma vez que não sofre influência de outliers.
Intervalo interquartílico (Q3 - Q1 ou IIQ)
É definida como a diferença entre Q3 e Q1. No gráfico é representado pela dimensão da caixa.
Estende-se do Q1 a Q3 (percentis 25º a 75º). Representa o intervalo dos 50% dos dados em
torno da mediana.

Intervalo interquartílico (Q3 - Q1 ou IIQ)


É definida como a diferença entre Q3 e Q1. No gráfico é representado pela dimensão da caixa.
Estende-se do Q1 a Q3 (percentis 25º a 75º). Representa o intervalo dos 50% dos dados em
torno da mediana.

Simetria
Um conjunto de dados que tem uma distribuição simétrica, terá a linha da mediana no centro do
retângulo. Quando a linha da mediana está próxima ao primeiro quartil, os dados são
assimétricos positivos e quando a posição da linha da mediana é próxima ao terceiro quartil, os
dados são assimétricos negativos. Vale ressaltar que a mediana é a medida de tendência central
mais indicada quando os dados possuem distribuição assimétrica, uma vez que a média
aritmética é influenciada pelos valores extremos.
Outliers
Já os outliers indicam possíveis valores discrepantes, sendo demonstrados nos gráficos como
pontos ou estrelas, como representado na figura 1 nas bolinhas vermelhas. No boxplot, as
observações são consideradas outliers quando estão abaixo ou acima do limite de detecção de
outliers.
O limite de detecção de outliers é construído utilizando o intervalo interquartil, dado pela distância
entre o primeiro e o terceiro quartil. Sendo assim, os limites inferior e superior de detecção de
outlier são dados por:
Limite Inferior = Q1 – 1,5 * IIQ
Limite Superior = Q3 + 1,5 * IIQ
Exemplo 2: para os seguintes dados: 201, 210, 211, 222, 263, 264, 1033
Mínimo esperado = 129 (Limite Inferior=210 – (1,5*54) = 210-81=129)
Q1 = 210
Q2 (mediana) = 222
Q3 = 264
IIQ= 54
Máximo esperado = 345 (Limite Superior = 264 + (1,5*54) = 264+81=345)
Nesse exemplo encontramos um outlier (o número 1033), que está acima do valor esperado.
Caso a presença de outliers, o mínimo vira o limite inferior e o máximo vira o limite superior.
Caso, não haja presença de outliers, o mínimo e o máximo se mantém. Como no exemplo 2 tem
outliers, então o máximo agora não é mais máximo e sim o limite superior. Já no exemplo 1 não
possuímos outliers, então não precisamos calcular limite superior e limite inferior.

Como comparar Boxplots


Etapa 1: comparar as medianas dos boxplots
Compare as respectivas medianas de cada boxplot. Se a linha mediana de um gráfico de caixa
estiver fora da caixa de um gráfico de caixa de comparação, é provável que haja uma diferença
entre os dois grupos.

Etapa 2: compare os intervalos interquartis e as linhas fora da caixa do boxplot


Compare os intervalos interquartis (ou seja, os comprimentos das caixas) para examinar como os
dados estão dispersos entre cada amostra. Quanto maior a caixa, mais dispersos os dados.
Quanto menor, menos dispersos os dados.
Nessa imagem, temos a distribuição de horas dormidas por dia da semana. Podemos observar que na
mediana, temos uma tendência decrescente de segunda a quinta, com um súbito aumento na sexta, e em
seguida um decréscimo até domingo. Percebemos que a mediana mais baixa é na quinta feira. Quanto
aos intervalos interquartis e linhas fora da caixa, observamos distribuições em sua maioria assimétricas
(tanto positivas quanto negativas), com um grande grau de dispersão. O dia que possui menor dispersão é
a quarta feira – nesse dia o número de horas dormidas varia de 4 a 7. O dia com maior dispersão é
sábado – nesse dia o número de horas dormidas varia de 5,5 a 11,5.
3 Ramos e folhas (o site chamou de caule e folhas
mas o nome usual é ramos e folhas)
Resolução de provas de concurso
Questão 11:
Questão 11: resolução
GABARITO: ALTERNATIVA D.

A partir de uma frequência acumulada, observa-se que:

O primeiro quartil (Q1) está na Juventude; o segundo quartil (Q2) está na Meia idade; o terceiro quartil (Q3)
está na Maturidade.
Questão 24
Questão 24
Resolução
Questão 28: Medidas separatrizes.
Questão 28: Medidas separatrizes. Resolução
Primeiro organizamos o Rol:
4,5; 4,8; 6,8; 7,1; 8,1; 8,6; 8,8

Md = 7,1
Q1 = 4,8
Q3 = 8,6

IIQ = Q3 - Q1
IIQ = 8,6 - 4,8
IIQ = 3,8

Lsup = Q3 + (1,5 x IIQ)


Lsup = 8,6 + (1,5 x 3,8)
Lsup = 8,6 + 5,7
Lsup = 14,3

Linf = Q1 - (1,5 x IIQ)


Linf = 4,8 - 5,7
Linf = - 0,9
Logo, os limites inferior e superior são, respectivamente, -0,9 e 14,3.
Questão 37
Questão 37 Resolução
LETRA E CORRETA (8,5, e o valores 1 e 35 são os únicos outliers dos dados).
Mediana é o valor que divide a amostra ao meio.
Outlier é um valor atípico da amostra.
Mediana = 8,5
Outliers = 1 e 35
Questão 39: Separatriz
Questão 39: Resolução
Questão 5 lista 2
Questão resolução
Questão 4 lista 3
Resolução
Questão 42
Resolução Questão 42
Questão 59 box plot
Questão 59 resolução

O gabarito é a Alternativa E.

O Box-plot é uma forma de fornecer uma análise visual sobre a posição, dispersão, simetria, caudas e valores
discrepantes de um conjunto de dados por meio dos quartis.

O primeiro passo para fazer um box-plot, é ter os dados ordenados, como dado no enunciado:

60 80 80 85 85 85 85 90 90 90 90 90 100 100 100 100 100 100

Segundo passo, calcula-se a mediana do conjunto de dados, que será o 2º quartil Q2. É o valor que divide o
conjunto de dados ao meio, como tem-se n = 18, uma quantidade par de valores, a mediana é a média dos dois
valores centrais, isto é, Q2 = (90 + 90)/2 = 90.

Terceiro passo, a mediana do conjunto de dados que ficou a esquerda de Q2 será o 1º quartil Q1, e a mediana do
conjunto de dados que ficou a direita de Q2, será o 3º quartil Q3. Neste caso, Q1 = (85 + 85)/2 = 85, e Q3 =
(100 + 100)/2 = 100. Ainda, tem-se que os valores mínimo e máximo do conjunto de dados são: min =
60, e máx = 100.

Por fim, o gráfico, que pode ser na horizontal ou vertical, com os valores igualmente espaçados do mínimo ao
máximo. Neste caso, fazemos um box-plot vertical, e para cada um dos valores encontrados, Q1 = 85, Q2 = 90 e
Q3 = 100 marca-se um traço horizontal. E então fecha esse retângulo formado pelos traços de Q1 e Q3, como
mostrado abaixo:

Neste caso, como o máximo é igual a Q3, não tem-se a cauda para cima. E o valor mínimo = 60, representando
por um ponto, é considerado um outlier pois está distante dos outros valores, e a calda para baixo vai até o
menor valor depois do outlier.
Questão 72
Questão 72 resolução
A fórmula para calcular 1 º quartil é:

Li = 10
k = 1/ 4 (1º quartil)
Σfi = 200 (somatório das frequências absolutas)
F ant = 30 (Frequência acumulada do intervalo anterior)
f intervalo = 50 (Frequência absoluta do intervalo em que está o 1º quartil )
h = 20 (amplitude do intervalo do 1º quartil)

Como nível de consumo está em 10 kWh e o número de domicílio em mil. Fazendo as devidas adequações:

Portanto, o 1º quartil é 1,8 que corresponde a 180 em termos percentuais.


Questão 84 medidas de separatriz
Questão 84 resolução
Solução em texto
rápida
completa
Alternativa D: o grupo dos selecionados apresenta pelo menos um valor atípico, enquanto o grupo dos não
selecionados não apresenta valores atípicos.

No grupo dos selecionados, temos que:

Desvio interquartílico = 40 - 30 = 10

LI = 30 - 1,5*10 = 15

LS = 40 + 1,5*10 = 55

Como a idade mínima dos gerentes selecionados é 35 e a idade máxima dos gerentes selecionados é 64. Temos
pelo menos um valor atípico, 64 (64 > 55).

No grupo dos não selecionados, temos que:

Desvio interquartílico = 36 - 30 = 6

LI = 30 - 1,5*6 = 21

LS = 36 + 1,5*6 = 45

Como a idade mínima dos gerentes não selecionados é 29 e a idade máxima dos gerentes não selecionados
é 43. Não temos valores atípicos, todos os valores estão entre o limite inferior e o limite superior.

Portanto, o grupo dos selecionados apresenta pelo menos um valor atípico (64), enquanto o grupo dos não
selecionados não apresenta valores atípicos.
Questão 86 separatriz (a questão deu um monte de informação, mas
não era pra usar nenhuma)
Questão 86 resolução

ALTERNATIVA B.

Um quartil é um dos três valores (Q1, Q2 e Q3) que divide o conjunto ordenado de dados em quatro partes
iguais, e assim cada parte representa 1/4 da amostra. Assim:

O número de funcionários que recebe acima do terceiro quartil equivale a 25% do total. Logo: 25% de 600
funcionários = 150 funcionários.
Questão 89 separatriz
Questão 89 resolução
Questão 101
Questão 101 resolução
As medidas separatrizes, no caso de quartil, são três, que separam os valores em porções de 25% cada uma delas.
É imprescindível a ordenação dos dados, antes de se calcular as medidas separatrizes. Assim, no caso, um aluno
que tire nota coincidente com o primeiro quartil, tem 25% das notas piores do que a sua; e 75% das notas
melhores do que a sua, de forma que está entre os 25% piores no exame, bem como entre os 75% melhores do
exame.
Questão 109
Questão 109: resolução

Dados -> 5, 7, 8, 10, 12, 15

Q1 = (5+7)/2 = 6

Q3 = (10+12)/2 = 11

Q3 - Q1 = 11 - 6
Q3 - Q1 = 5

Questão 113 média e desvio padrão


Questão 117
Resolução
Questão 125
Questão 125 resolução

GABARITO: B

O box-plot nos fornece os quartis da seguinte maneira:

Q1=49
Q2=54
Q3=63

Entre dois quartis seguidos teremos 25% das observações.


Logo, a chance de valores entre 49 e 54 é de 0,25.
Questão 129
Questão 129

GABARITO: C

Essa questão envolve o uso de medidas separatrizes, mais especificamente os quartis. O aluno precisa analisar
os valores das frequências informados na “tabela” e verificar qual o terceiro quartil dos salários.

Para resolver esse problema, precisamos utilizar a fórmula de cálculo do quartil.

A posição do quartil pode ser encontrada por meio da expressão:

3n/4 = (3.200)/4 = 150° (classe: 800 |---- 1200)

Os dados para aplicação na fórmula do percentil são:

l = 800 (limite inferior da classe)


∑ f = 140 (frequência acumulada antes da classe)
h = 1200 – 800 = 400 (amplitude da classe)
F = 40 (frequência da classe)

Portanto, temos:

Logo, o terceiro quartil dos salários vale R$900,00.


Questão 137
Questão 137 Resolução

Você também pode gostar