Fazer download em docx, pdf ou txt
Fazer download em docx, pdf ou txt
Você está na página 1de 15

A tabela na imagem mostra o número de leitores para diferentes jornais.

As
perguntas estão perguntando sobre medidas de localização para esses dados e
qual medida seria mais apropriada.
1. Medidas de localização: Para este tipo de dados, que é quantitativo e
discreto, você poderia calcular as seguintes medidas de localização:
o Média: Este é o valor médio dos dados. É calculado somando
todos os valores e dividindo pelo número de valores.
o Mediana: Este é o valor do meio dos dados quando estão
ordenados do menor para o maior. Se houver um número par de
valores, a mediana é a média dos dois valores do meio.
o Moda: Este é o valor que aparece com mais frequência nos dados.
2. Medida mais apropriada: A medida de localização mais apropriada
depende do contexto e da natureza dos dados. Neste caso, como
estamos lidando com o número de leitores para diferentes jornais,
a moda pode ser a medida mais apropriada porque diria qual jornal é
lido pela maioria das pessoas.
A moda é o público.
a) O tipo de variável em questão é uma variável quantitativa contínua. Isto
porque os salários podem assumir qualquer valor dentro de um determinado
intervalo e não estão restritos a valores discretos.

b)

i) O salário modal é o salário que ocorre com mais frequência entre os


trabalhadores. Neste caso, o salário modal é 575€, pois é o salário que
aparece mais vezes (para os trabalhadores A e F).

ii) O salário mediano é o valor do meio quando os salários são organizados


em ordem crescente. Se houver um número par de salários, a mediana é a
média dos dois números do meio. Organizando os salários em ordem
crescente (270€, 345€, 575€, 575€, 685€, 750€, 1200€), o salário mediano
é 575€.

iii) Salario médio é igual à soma a dividir pelo número de trabalhadores:


(575+1200+750+685+345+575+270)/7=628.57€

iv) A amplitude interquartil é uma medida de dispersão estatística e é


calculada como a diferença entre o quartil superior (Q3) e o quartil inferior
(Q1). Representa os 50% do meio dos dados. Neste caso, Q1 é a mediana
dos salários inferiores à mediana, que é 345€, e Q3 é a mediana dos salários
superiores à mediana, que é 750€. Portanto, a amplitude interquartil é 750€ -
345€ = 405€.

v) O desvio padrão é uma medida da quantidade de variação ou dispersão


no conjunto de salários. É a raiz quadrada da variância, que é a média das
diferenças quadradas da média. Para calcular o desvio padrão, primeiro
calculamos a média dos salários, que é 4400€ / 7 = 628.57€. Em seguida,
subtraímos a média de cada salário, elevamos o resultado ao quadrado,
somamos todos esses quadrados, dividimos pelo número de salários e,
finalmente, tiramos a raiz quadrada do resultado.
Média
A média é calculada somando todas as faltas e dividindo pelo número total de alunos.
Para isso, multiplicamos o número de faltas pelo número de alunos para cada linha,
somamos esses produtos e dividimos pelo total de alunos (300).
Agora adicionamos esses produtos juntos:
(0*211 +40*1+4*2+12*3+30*4+2*5+1*6=220)
Em seguida, somamos o número total de alunos: (211 +40+4+12+30+2+1=300)
Finalmente, dividimos a soma dos produtos pelo número total de alunos para encontrar
a média: Média = (220 ÷300 ≈0.73)
Portanto, com base neste conjunto de dados, há uma média de aproximadamente (0.73)
faltas por aluno.

Moda
Observando a tabela, podemos ver que o número de faltas que ocorre com mais frequência
é 0, com 211 alunos. Portanto, a moda do número de faltas é 0.

Mediana
A mediana é o valor do meio quando os números são organizados em ordem crescente.
Como temos 300 alunos, a mediana será a média das 150ª e 151ª observações.
Se somarmos o número de alunos até chegarmos a um total de 150, veremos que a 150ª
e a 151ª observação caem na categoria de 0 falta. Portanto, a mediana do número de
faltas é 0.

Q3
O terceiro quartil, também conhecido como Q3, é o valor abaixo do qual 75% das
observações caem. É encontrado ordenando os dados e selecionando o valor na posição
que está 75% do caminho através dos dados.
Como temos 300 alunos, o terceiro quartil será a 225ª observação. Se somarmos o
número de alunos até chegarmos a um total de 225, veremos que a 225ª observação cai
na categoria de 1 falta. Portanto, o terceiro quartil do número de faltas é 1.
Amplitude Interquartílica

Q1
O primeiro quartil, também conhecido como Q1, é o valor abaixo do qual 25% das
observações caem. É encontrado ordenando os dados e selecionando o valor na posição
que está 25% do caminho através dos dados.
Como temos 300 alunos, o primeiro quartil será a 75ª observação. Se somarmos o
número de alunos até chegarmos a um total de 75, veremos que a 75ª observação cai na
categoria de 0 falta. Portanto, o primeiro quartil do número de faltas é 0.

AIC = Q3-Q1 = 1-0 = 1

Desvio padrão
O desvio padrão é uma medida de quão dispersos os números estão da média. É
calculado tirando a raiz quadrada da variância, que é a média das diferenças quadradas
da média.
Primeiro, precisamos calcular a média (já calculamos como 0.73). Em seguida, para
cada número de faltas, subtraímos a média e elevamos ao quadrado. Multiplicamos cada
resultado pelo número correspondente de alunos e somamos todos esses produtos.
Dividimos essa soma pelo número total de alunos para obter a variância. Finalmente,
tiramos a raiz quadrada da variância para obter o desvio padrão.
1. Média (Número médio de dias de internamento): A média é calculada
somando todos os dias de internamento e dividindo pelo número total de
pacientes. No entanto, como os dias de internamento são dados em intervalos,
usaremos o ponto médio de cada intervalo para representar os dias de
internamento para esse grupo. Para os grupos “Menos de 5” e “Mais de 45”,
precisamos assumir um valor específico para representar esses grupos.

Aqui estão os cálculos:

 Para “Menos de 5 dias”, vamos assumir 4 dias como o valor representativo.


 Para “5-10 dias”, o ponto médio é 7.5 dias.
 Para “10-20 dias”, o ponto médio é 15 dias.
 Para “20-30 dias”, o ponto médio é 25 dias
 Para “30-45 dias”, o ponto médio é 37.5 dias.
 Para “Mais de 45 dias”, vamos assumir 46 dias como o valor representativo.

Agora, somamos todos esses produtos. Finalmente, dividimos essa soma pelo número
total de pacientes (150) para encontrar a média: Média = 15.14 dias.

2. Moda: A moda é o intervalo de dias de internamento que ocorre com mais


frequência. Neste caso, olhamos para a tabela e vemos qual intervalo de dias de
internamento tem o maior número de pacientes. O intervalo “Menos de 5 dias”
tem o maior número de pacientes (48), portanto, a moda é “Menos de 5 dias”.

O segundo quartil, também conhecido como mediana, e o terceiro quartil (75º percentil)
são medidas de posição que nos permitem entender melhor a distribuição dos dados.
1. Segundo Quartil (Q2): O segundo quartil, ou mediana, é o valor que divide os
dados ordenados em duas partes iguais. Metade dos dados é menor que a
mediana e a outra metade é maior. Como temos 150 pacientes, a mediana será a
média das 75ª e 76ª observações.
2. Terceiro Quartil (Q3 ou 75º Percentil): O terceiro quartil é o valor abaixo do
qual 75% das observações caem. É encontrado ordenando os dados e
selecionando o valor na posição que está 75% do caminho através dos dados.
Como temos 150 pacientes, o terceiro quartil será a 113ª observação.
Se somarmos o número de pacientes até chegarmos a um total de 75, veremos que a 75ª
e a 76ª observação caem na categoria de “5-10”. Portanto, o segundo quartil (mediana) é
“5-10”.

Da mesma forma, se somarmos o número de pacientes até chegarmos a um total de 113,


veremos que a 113ª observação cai na categoria de “5-10 dias”. Portanto, o terceiro
quartil (75º percentil) é “5-10 dias”.
A interpretação dessas medidas é a seguinte:

 Segundo Quartil (Mediana): Metade dos pacientes tem um período de


internamento de “Menos de 5 dias”. Isso indica que a maioria dos pacientes tem
um período de internamento relativamente curto.
 Terceiro Quartil (75º Percentil): 75% dos pacientes têm um período de
internamento de “5-10 dias” ou menos. Isso indica que a grande maioria dos
pacientes tem um período de internamento de no máximo 10 dias.

AIC ???

Variância e Desvio Padrão


Para calcular a variância e o desvio padrão de dados agrupados, precisamos das frequências e dos
pontos médios de cada intervalo. No entanto, a tabela fornecida não nos dá essas informações
diretamente.

Aqui estão os passos gerais para calcular a variância e o desvio padrão de dados agrupados:

1. Calcule o ponto médio de cada intervalo.


2. Multiplique o ponto médio de cada intervalo pela sua frequência correspondente.
3. Some todos esses produtos para obter a soma total.
4. Divida a soma total pelo número total de observações para obter a média.
5. Subtraia a média de cada ponto médio e eleve o resultado ao quadrado para obter o
quadrado da diferença.
6. Multiplique o quadrado da diferença pela frequência correspondente.
7. Some todos esses produtos para obter a soma total dos quadrados das diferenças.
8. Divida a soma total dos quadrados das diferenças pelo número total de observações para
obter a variância.
9. A raiz quadrada da variância é o desvio padrão.
No entanto, sem os pontos médios exatos de cada intervalo e assumindo que a distribuição dentro de
cada intervalo é uniforme, só podemos estimar a variância e o desvio padrão. Para um cálculo mais
preciso, precisaríamos de informações mais detalhadas sobre a distribuição dos pacientes dentro de
cada intervalo.

Para determinar a média dos rendimentos, utilizamos a fórmula da média


ponderada, uma vez que temos intervalos de rendimentos e o número de
habitantes em cada intervalo.

Primeiro, encontramos o ponto médio de cada intervalo de rendimentos:

 Intervalo 400-600: ponto médio = (400 + 600) / 2 = 500


 Intervalo 600-800: ponto médio = (600 + 800) / 2 = 700
 Intervalo 800-1000: ponto médio = (800 + 1000) / 2 = 900
 Intervalo 1000-1200: ponto médio = (1000 + 1200) / 2 = 1100

Agora, multiplicamos cada ponto médio pelo número de habitantes


correspondente para encontrar a soma ponderada:
 500 * 8 = 4000
 700 * 26 = 18200
 900 * 24 = 21600
 1100 * 7 = 7700

Somamos esses produtos:

4000 + 18200 + 21600 + 7700 = 51500

Finalmente, dividimos essa soma pelo número total de habitantes para


encontrar a média:

Meˊdia=5150065≈792.31Meˊdia=6551500≈792.31
Para calcular a moda com base neste conjunto de dados (que se refere ao valor que
aparece com mais frequência), identifica-se qual faixa de renda tem a maior frequência
de habitantes. De acordo com a tabela fornecida na imagem:

 A faixa de 400-600 tem uma frequência de 8 habitantes.


 A faixa de 600-800 tem uma frequência de 26 habitantes.
 A faixa de 800-1000 tem uma frequência de 24 habitantes.
 A faixa de 1000-1200 tem uma frequência de 7 habitantes.

Portanto, a moda é a faixa de renda com a maior frequência, que é ‘600–800’, com ‘26’
como seu número correspondente de habitantes.

A mediana é o valor que separa a metade superior da metade inferior dos


dados. Dado que temos 65 habitantes, a posição da mediana é a 33ª
observação (já que 65+12=33265+1=33).

Agora, somamos o número de habitantes em cada intervalo até alcançarmos a


posição da mediana:

 Intervalo 400-600: 8 habitantes (cumulativo: 8)


 Intervalo 600-800: 26 habitantes (cumulativo: 34)
 Intervalo 800-1000: 24 habitantes (cumulativo: 58)
 Intervalo 1000-1200: 7 habitantes (cumulativo: 65)

A 33ª observação cai no intervalo 600-800, pois o acumulado até esse intervalo
é 34, que inclui a 33ª observação.

Para uma estimativa mais precisa da mediana dentro do intervalo 600-800,


usamos a fórmula da mediana para dados agrupados:
Mediana=𝐿+(𝑁2−𝐹𝑓)⋅𝑤Mediana=L+(f2N−F)⋅w

Onde:

 𝐿L é o limite inferior do intervalo da mediana (600)


 𝑁N é o número total de observações (65)
 𝐹F é a frequência acumulada antes do intervalo da mediana (8)
 𝑓f é a frequência do intervalo da mediana (26)
 𝑤w é a amplitude do intervalo da mediana (800 - 600 = 200)

Substituindo os valores:

Mediana=600+(652−826)⋅200Mediana=600+(26265−8)⋅200
Mediana=600+(32.5−826)⋅200Mediana=600+(2632.5−8)⋅200
Mediana=600+(24.526)⋅200Mediana=600+(2624.5)⋅200
Mediana=600+(0.9423)⋅200Mediana=600+(0.9423)⋅200
Mediana=600+188.46≈788.46Mediana=600+188.46≈788.46

Portanto, a mediana dos rendimentos é aproximadamente 788.46.

Para calcular o primeiro quartil (Q1) dos rendimentos, que corresponde ao


ponto abaixo do qual se encontra 25% dos dados, seguimos os passos
semelhantes aos da mediana. Primeiro, identificamos a posição do primeiro
quartil:

𝑄1=𝑁+14=65+14=16.5Q1=4N+1=465+1=16.5

A posição do primeiro quartil é a 16.5ª observação. Agora, somamos o número


de habitantes até encontrarmos o intervalo que contém essa posição:

 Intervalo 400-600: 8 habitantes (cumulativo: 8)


 Intervalo 600-800: 26 habitantes (cumulativo: 34)

A 16.5ª observação cai no intervalo 600-800, pois o acumulado até esse


intervalo é 34, que inclui a 16.5ª observação.

Para uma estimativa mais precisa do primeiro quartil dentro do intervalo 600-
800, usamos a fórmula do quartil para dados agrupados:

𝑄1=𝐿+(𝑁4−𝐹𝑓)⋅𝑤Q1=L+(f4N−F)⋅w

Onde:
 𝐿L é o limite inferior do intervalo do primeiro quartil (600)
 𝑁N é o número total de observações (65)
 𝐹F é a frequência acumulada antes do intervalo do primeiro quartil (8)
 𝑓f é a frequência do intervalo do primeiro quartil (26)
 𝑤w é a amplitude do intervalo do primeiro quartil (800 - 600 = 200)

Substituindo os valores:

𝑄1=600+(654−826)⋅200Q1=600+(26465−8)⋅200
𝑄1=600+(16.25−826)⋅200Q1=600+(2616.25−8)⋅200
𝑄1=600+(8.2526)⋅200Q1=600+(268.25)⋅200
𝑄1=600+(0.3173)⋅200Q1=600+(0.3173)⋅200
𝑄1=600+63.46≈663.46Q1=600+63.46≈663.46

Portanto, o primeiro quartil dos rendimentos é aproximadamente 663.46.

Para calcular a amplitude interquartil (AIQ), que é a diferença entre o terceiro


quartil (Q3) e o primeiro quartil (Q1), precisamos determinar ambos os valores.
Já calculamos Q1 anteriormente, que é aproximadamente 663.46. Agora, vamos
calcular Q3.

A posição do terceiro quartil é:

𝑄3=3(𝑁+1)4=3(65+1)4=3×664=49.5Q3=43(N+1)=43(65+1)=43×66
=49.5

A posição do terceiro quartil é a 49.5ª observação. Agora, somamos o número


de habitantes até encontrarmos o intervalo que contém essa posição:

 Intervalo 400-600: 8 habitantes (cumulativo: 8)


 Intervalo 600-800: 26 habitantes (cumulativo: 34)
 Intervalo 800-1000: 24 habitantes (cumulativo: 58)

A 49.5ª observação cai no intervalo 800-1000, pois o acumulado até esse


intervalo é 58, que inclui a 49.5ª observação.

Para uma estimativa mais precisa do terceiro quartil dentro do intervalo 800-
1000, usamos a fórmula do quartil para dados agrupados:

𝑄3=𝐿+(3𝑁4−𝐹𝑓)⋅𝑤Q3=L+(f43N−F)⋅w
Onde:

 𝐿L é o limite inferior do intervalo do terceiro quartil (800)


 𝑁N é o número total de observações (65)
 𝐹F é a frequência acumulada antes do intervalo do terceiro quartil (34)
 𝑓f é a frequência do intervalo do terceiro quartil (24)
 𝑤w é a amplitude do intervalo do terceiro quartil (1000 - 800 = 200)

Substituindo os valores:

𝑄3=800+(3×654−3424)⋅200Q3=800+(2443×65−34)⋅200
𝑄3=800+(48.75−3424)⋅200Q3=800+(2448.75−34)⋅200
𝑄3=800+(14.7524)⋅200Q3=800+(2414.75)⋅200
𝑄3=800+(0.6146)⋅200Q3=800+(0.6146)⋅200
𝑄3=800+122.92≈922.92Q3=800+122.92≈922.92

Portanto, o terceiro quartil dos rendimentos é aproximadamente 922.92.

Agora, calculamos a amplitude interquartil (AIQ):

AIQ=𝑄3−𝑄1=922.92−663.46=259.46AIQ=Q3−Q1=922.92−663.46=259
.46

Portanto, a amplitude interquartil dos rendimentos é aproximadamente 259.46.

Para calcular o desvio padrão para dados agrupados, precisamos seguir os


seguintes passos:

1. Calcular o ponto médio (𝑥𝑖xi) de cada intervalo.


2. Multiplicar cada ponto médio pelo número de habitantes ( 𝑓𝑖fi) no
respectivo intervalo para obter 𝑓𝑖⋅𝑥𝑖fi⋅xi.
3. Calcular a média (𝑥ˉxˉ).
4. Calcular 𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2fi⋅(xi−xˉ)2 para cada intervalo.
5. Somar todos os 𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2fi⋅(xi−xˉ)2.
6. Dividir a soma obtida pelo número total de habitantes menos um (n-1)
para obter a variância.
7. Tirar a raiz quadrada da variância para obter o desvio padrão.

Aqui está a tabela original com os pontos médios adicionados:


Rendimentos Nº de Habitantes (𝑓𝑖fi) Ponto Médio (𝑥𝑖xi) 𝑓𝑖⋅𝑥𝑖fi⋅x
400-600 8 500 4000
600-800 26 700 18200
800-1000 24 900 21600
1000-1200 7 1100 7700

Total:

∑𝑓𝑖=65∑fi=65
∑𝑓𝑖⋅𝑥𝑖=51500∑fi⋅xi=51500
1. Calcular a média (𝑥ˉxˉ):
𝑥ˉ=∑𝑓𝑖⋅𝑥𝑖∑𝑓𝑖=5150065≈792.31xˉ=∑fi∑fi⋅xi=6551500≈792.31
2. Calcular 𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2fi⋅(xi−xˉ)2 para cada intervalo:
Nº de Habitantes Ponto Médio 𝑥𝑖−𝑥ˉxi (𝑥𝑖−𝑥ˉ)2(xi 𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2fi⋅(xi
Rendimentos (𝑓𝑖fi) (𝑥𝑖xi) −xˉ −xˉ)2 −xˉ)2
400-600 8 500 -292.31 85448.74 683589.92
600-800 26 700 -92.31 8521.34 221554.84
800-1000 24 900 107.69 11594.24 278261.76
1000-1200 7 1100 307.69 94670.64 662694.48

Total:

∑𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2=1844101∑fi⋅(xi−xˉ)2=1844101
3. Calcular a variância:
𝜎2=∑𝑓𝑖⋅(𝑥𝑖−𝑥ˉ)2∑𝑓𝑖−1=184410165−1=184410164≈28814.08σ2=∑fi
−1∑fi⋅(xi−xˉ)2=65−11844101=641844101≈28814.08
4. Calcular o desvio padrão:
𝜎=𝜎2=28814.08≈169.73σ=σ2=28814.08≈169.73

Portanto, o desvio padrão dos rendimentos é aproximadamente 169.73.

Para determinar a percentagem de habitantes que recebem um vencimento no


intervalo [𝑋ˉ−𝑆,𝑋ˉ+𝑆][Xˉ−S,Xˉ+S], precisamos primeiro calcular os limites
desse intervalo.

Dados:

 Média (𝑋ˉXˉ) = 792.31


 Desvio padrão (S) = 169.73

Os limites do intervalo são:


𝑋ˉ−𝑆=792.31−169.73=622.58Xˉ−S=792.31−169.73=622.58
𝑋ˉ+𝑆=792.31+169.73=962.04Xˉ+S=792.31+169.73=962.04

Agora, precisamos determinar quantos habitantes têm vencimentos dentro


desse intervalo.

Observando os intervalos de vencimentos na tabela:

1. Intervalo 400-600: Este intervalo está completamente fora do intervalo


[622.58,962.04][622.58,962.04], então não conta.
2. Intervalo 600-800: Parte deste intervalo está dentro do intervalo
[622.58,962.04][622.58,962.04]. Precisamos determinar a proporção
dos habitantes neste intervalo.
 A faixa de 622.58622.58 a 800800 está dentro do intervalo.
Como 800−622.58=177.42800−622.58=177.42 e o intervalo
600-800 tem amplitude 200200, a proporção é
177.42200≈0.8871200177.42≈0.8871.
 Número de habitantes no intervalo 600-800: 26
 Habitantes na parte do intervalo:
26×0.8871≈23.0626×0.8871≈23.06
3. Intervalo 800-1000: Este intervalo está completamente dentro do
intervalo [622.58,962.04][622.58,962.04], então todos os habitantes
neste intervalo contam.
 Número de habitantes no intervalo 800-1000: 24
4. Intervalo 1000-1200: Parte deste intervalo está dentro do intervalo
[622.58,962.04][622.58,962.04]. Precisamos determinar a proporção
dos habitantes neste intervalo.
 A faixa de 800800 a 962.04962.04 está dentro do intervalo.
Como 962.04−800=162.04962.04−800=162.04 e o intervalo
800-1000 tem amplitude 200200, a proporção é
162.04200≈0.8102200162.04≈0.8102.
 Número de habitantes no intervalo 1000-1200: 7
 Habitantes na parte do intervalo:
7×0.8102≈5.677×0.8102≈5.67

Total de habitantes dentro do intervalo [622.58,962.04][622.58,962.04]:

23.06+24+5.67≈52.7323.06+24+5.67≈52.73
Percentagem de habitantes dentro do intervalo:

Percentagem=(52.7365)×100≈81.12%Percentagem=(6552.73
)×100≈81.12%

Portanto, aproximadamente 81.12% dos habitantes recebem um vencimento no


intervalo [𝑋ˉ−𝑆,𝑋ˉ+𝑆][Xˉ−S,Xˉ+S].

Você também pode gostar