Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística - 24-05-24
Estatística - 24-05-24
As
perguntas estão perguntando sobre medidas de localização para esses dados e
qual medida seria mais apropriada.
1. Medidas de localização: Para este tipo de dados, que é quantitativo e
discreto, você poderia calcular as seguintes medidas de localização:
o Média: Este é o valor médio dos dados. É calculado somando
todos os valores e dividindo pelo número de valores.
o Mediana: Este é o valor do meio dos dados quando estão
ordenados do menor para o maior. Se houver um número par de
valores, a mediana é a média dos dois valores do meio.
o Moda: Este é o valor que aparece com mais frequência nos dados.
2. Medida mais apropriada: A medida de localização mais apropriada
depende do contexto e da natureza dos dados. Neste caso, como
estamos lidando com o número de leitores para diferentes jornais,
a moda pode ser a medida mais apropriada porque diria qual jornal é
lido pela maioria das pessoas.
A moda é o público.
a) O tipo de variável em questão é uma variável quantitativa contínua. Isto
porque os salários podem assumir qualquer valor dentro de um determinado
intervalo e não estão restritos a valores discretos.
b)
Moda
Observando a tabela, podemos ver que o número de faltas que ocorre com mais frequência
é 0, com 211 alunos. Portanto, a moda do número de faltas é 0.
Mediana
A mediana é o valor do meio quando os números são organizados em ordem crescente.
Como temos 300 alunos, a mediana será a média das 150ª e 151ª observações.
Se somarmos o número de alunos até chegarmos a um total de 150, veremos que a 150ª
e a 151ª observação caem na categoria de 0 falta. Portanto, a mediana do número de
faltas é 0.
Q3
O terceiro quartil, também conhecido como Q3, é o valor abaixo do qual 75% das
observações caem. É encontrado ordenando os dados e selecionando o valor na posição
que está 75% do caminho através dos dados.
Como temos 300 alunos, o terceiro quartil será a 225ª observação. Se somarmos o
número de alunos até chegarmos a um total de 225, veremos que a 225ª observação cai
na categoria de 1 falta. Portanto, o terceiro quartil do número de faltas é 1.
Amplitude Interquartílica
Q1
O primeiro quartil, também conhecido como Q1, é o valor abaixo do qual 25% das
observações caem. É encontrado ordenando os dados e selecionando o valor na posição
que está 25% do caminho através dos dados.
Como temos 300 alunos, o primeiro quartil será a 75ª observação. Se somarmos o
número de alunos até chegarmos a um total de 75, veremos que a 75ª observação cai na
categoria de 0 falta. Portanto, o primeiro quartil do número de faltas é 0.
Desvio padrão
O desvio padrão é uma medida de quão dispersos os números estão da média. É
calculado tirando a raiz quadrada da variância, que é a média das diferenças quadradas
da média.
Primeiro, precisamos calcular a média (já calculamos como 0.73). Em seguida, para
cada número de faltas, subtraímos a média e elevamos ao quadrado. Multiplicamos cada
resultado pelo número correspondente de alunos e somamos todos esses produtos.
Dividimos essa soma pelo número total de alunos para obter a variância. Finalmente,
tiramos a raiz quadrada da variância para obter o desvio padrão.
1. Média (Número médio de dias de internamento): A média é calculada
somando todos os dias de internamento e dividindo pelo número total de
pacientes. No entanto, como os dias de internamento são dados em intervalos,
usaremos o ponto médio de cada intervalo para representar os dias de
internamento para esse grupo. Para os grupos “Menos de 5” e “Mais de 45”,
precisamos assumir um valor específico para representar esses grupos.
Agora, somamos todos esses produtos. Finalmente, dividimos essa soma pelo número
total de pacientes (150) para encontrar a média: Média = 15.14 dias.
O segundo quartil, também conhecido como mediana, e o terceiro quartil (75º percentil)
são medidas de posição que nos permitem entender melhor a distribuição dos dados.
1. Segundo Quartil (Q2): O segundo quartil, ou mediana, é o valor que divide os
dados ordenados em duas partes iguais. Metade dos dados é menor que a
mediana e a outra metade é maior. Como temos 150 pacientes, a mediana será a
média das 75ª e 76ª observações.
2. Terceiro Quartil (Q3 ou 75º Percentil): O terceiro quartil é o valor abaixo do
qual 75% das observações caem. É encontrado ordenando os dados e
selecionando o valor na posição que está 75% do caminho através dos dados.
Como temos 150 pacientes, o terceiro quartil será a 113ª observação.
Se somarmos o número de pacientes até chegarmos a um total de 75, veremos que a 75ª
e a 76ª observação caem na categoria de “5-10”. Portanto, o segundo quartil (mediana) é
“5-10”.
AIC ???
Aqui estão os passos gerais para calcular a variância e o desvio padrão de dados agrupados:
Meˊdia=5150065≈792.31Meˊdia=6551500≈792.31
Para calcular a moda com base neste conjunto de dados (que se refere ao valor que
aparece com mais frequência), identifica-se qual faixa de renda tem a maior frequência
de habitantes. De acordo com a tabela fornecida na imagem:
Portanto, a moda é a faixa de renda com a maior frequência, que é ‘600–800’, com ‘26’
como seu número correspondente de habitantes.
A 33ª observação cai no intervalo 600-800, pois o acumulado até esse intervalo
é 34, que inclui a 33ª observação.
Onde:
Substituindo os valores:
Mediana=600+(652−826)⋅200Mediana=600+(26265−8)⋅200
Mediana=600+(32.5−826)⋅200Mediana=600+(2632.5−8)⋅200
Mediana=600+(24.526)⋅200Mediana=600+(2624.5)⋅200
Mediana=600+(0.9423)⋅200Mediana=600+(0.9423)⋅200
Mediana=600+188.46≈788.46Mediana=600+188.46≈788.46
𝑄1=𝑁+14=65+14=16.5Q1=4N+1=465+1=16.5
Para uma estimativa mais precisa do primeiro quartil dentro do intervalo 600-
800, usamos a fórmula do quartil para dados agrupados:
𝑄1=𝐿+(𝑁4−𝐹𝑓)⋅𝑤Q1=L+(f4N−F)⋅w
Onde:
𝐿L é o limite inferior do intervalo do primeiro quartil (600)
𝑁N é o número total de observações (65)
𝐹F é a frequência acumulada antes do intervalo do primeiro quartil (8)
𝑓f é a frequência do intervalo do primeiro quartil (26)
𝑤w é a amplitude do intervalo do primeiro quartil (800 - 600 = 200)
Substituindo os valores:
𝑄1=600+(654−826)⋅200Q1=600+(26465−8)⋅200
𝑄1=600+(16.25−826)⋅200Q1=600+(2616.25−8)⋅200
𝑄1=600+(8.2526)⋅200Q1=600+(268.25)⋅200
𝑄1=600+(0.3173)⋅200Q1=600+(0.3173)⋅200
𝑄1=600+63.46≈663.46Q1=600+63.46≈663.46
𝑄3=3(𝑁+1)4=3(65+1)4=3×664=49.5Q3=43(N+1)=43(65+1)=43×66
=49.5
Para uma estimativa mais precisa do terceiro quartil dentro do intervalo 800-
1000, usamos a fórmula do quartil para dados agrupados:
𝑄3=𝐿+(3𝑁4−𝐹𝑓)⋅𝑤Q3=L+(f43N−F)⋅w
Onde:
Substituindo os valores:
𝑄3=800+(3×654−3424)⋅200Q3=800+(2443×65−34)⋅200
𝑄3=800+(48.75−3424)⋅200Q3=800+(2448.75−34)⋅200
𝑄3=800+(14.7524)⋅200Q3=800+(2414.75)⋅200
𝑄3=800+(0.6146)⋅200Q3=800+(0.6146)⋅200
𝑄3=800+122.92≈922.92Q3=800+122.92≈922.92
AIQ=𝑄3−𝑄1=922.92−663.46=259.46AIQ=Q3−Q1=922.92−663.46=259
.46
Total:
∑𝑓𝑖=65∑fi=65
∑𝑓𝑖⋅𝑥𝑖=51500∑fi⋅xi=51500
1. Calcular a média (𝑥ˉxˉ):
𝑥ˉ=∑𝑓𝑖⋅𝑥𝑖∑𝑓𝑖=5150065≈792.31xˉ=∑fi∑fi⋅xi=6551500≈792.31
2. Calcular 𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2fi⋅(xi−xˉ)2 para cada intervalo:
Nº de Habitantes Ponto Médio 𝑥𝑖−𝑥ˉxi (𝑥𝑖−𝑥ˉ)2(xi 𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2fi⋅(xi
Rendimentos (𝑓𝑖fi) (𝑥𝑖xi) −xˉ −xˉ)2 −xˉ)2
400-600 8 500 -292.31 85448.74 683589.92
600-800 26 700 -92.31 8521.34 221554.84
800-1000 24 900 107.69 11594.24 278261.76
1000-1200 7 1100 307.69 94670.64 662694.48
Total:
∑𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2=1844101∑fi⋅(xi−xˉ)2=1844101
3. Calcular a variância:
𝜎2=∑𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2∑𝑓𝑖−1=184410165−1=184410164≈28814.08σ2=∑fi
−1∑fi⋅(xi−xˉ)2=65−11844101=641844101≈28814.08
4. Calcular o desvio padrão:
𝜎=𝜎2=28814.08≈169.73σ=σ2=28814.08≈169.73
Dados:
23.06+24+5.67≈52.7323.06+24+5.67≈52.73
Percentagem de habitantes dentro do intervalo:
Percentagem=(52.7365)×100≈81.12%Percentagem=(6552.73
)×100≈81.12%