Você está na página 1de 8

PERGUNTA 4

Todos os dados previamente calculados na pergunta 3, vão ser apresentados ao


longo de todas as alíneas.

Alínea A)

Tendo em conta a variável aleatória X́ que corresponde ao número médio de


SMS enviados por uma amostra aleatória, seja uma população de média μ e desvio
padrão σ , da qual se toma amostras de n elementos. 

Cada uma das amostras representativas da população apresenta um numero


medio de SMS enviados x́. Se o tamanho da amostra for suficientemente grande, a
distribuição amostral segue praticamente uma distribuição normal com média μ e

σ σ
desvio padrão σ x́ = . Isto é representado como X́ N (μ , ). Assim, tem–se
√n √n

X́−μ
=Z N (0,1)
σ .
√n
Como Z N (0,1), podemos calcular um intervalo de confiança dentro do qual pode
conter uma determinada percentagem de observações. Assim, seja X uma V.A. com

média (desconhecida) e variância, σ 2, (conhecida). Então, como n ≥ 30, podemos construir

um intervalo de confiança a 100∗( 1−α ) %=90 % para μ. Assim, tem-se que α =0.1.

α
Desta forma, fazemos P (−λ ≤ Z ≤ λ )=( 1−α ) ⇒ λ=Φ (1− ). Consequentemente, tem-se
−1
2

α
que λ=norminv (1− ). Substituindo α por 0.1 concluímos que λ=1.6449.
2

Resolvendo agora em ordem a μ temos que,

P (−λ ≤ Z ≤ λ )=0.90 ⟺ P (−1.6449 ≤ Z ≤1.6449 )=0.90 ⟺

X́ −μ

(
⟺ P −1.6449 ≤
σ
√n )
≤ 1.6449 =0,90

Resolvendo em ordem a μ
σ σ
(
P X́−1.6449
√n
≤ μ ≤ X́ +1.6449
√n )
=0.90

Logo,

σ σ
[
IC 90 % ( μ )= X́ −1.6449
√n
; X́ +1.6449
√n ]
No final da construção do intervalo de confiança a 90% para o número médio
de SMS enviados por cada uma das populações, podemos afirmar com 90% de
confiança que o número médio de SMS enviados por cada uma das populações se
encontra neste intervalo.

Amostra 1

Assim, para a Amostra 1, relativamente à variável “Mensagens”, sabe-se que


σ 1 =36.725 e n1 =93. Concretizando, x́ 1=25.28,
36.725 36.725
IC 90 % ( μ 1 )=[25.28−1.6449 ; 25.28+ 1.6449 ]
√ 93 √ 93
36.725 36.725
[
⇔ IC 90 % ( μ1 )= 25.28−1.6449
√ 93
; 25.28+1.6449
√ 93

]
⇔ IC 90 % ( μ1 )= [ 19.016 ; 31.544 ]

Amostra 2
Para a Amostra 2, relativamente à variável “Mensagens”, sabe-se que σ 2=5.6734e
n2 =62. Concretizando, x́ 2=3.90328
5.6734 5.6734
IC 90 % ( μ 2 )=[3.9032−1.6449 ; 3.9032+1.6449 ]
√ 62 √ 62
5.6734 5.6734
[
⇔ IC 90 % ( μ2 )= 3.9032−1.6449
√62
; 3.9032+1.6449
√ 62

]
⇔ IC 90 % ( μ2 )= [ 2.7180 ; 5.0884 ]

Alínea B)
Sabendo que na alínea anterior já foi dada a definição de intervalo de confiança,
podemos observar que um intervalo de confiança a 90% é definido da seguinte forma:

σ σ
[
IC 90 % ( μ )= X́ −1.6449
√n
; X́ +1.6449
√n ]
Na alínea atual, o objetivo é sabendo que X́ ,σ , n se mantêm constantes, diminuir a
amplitude do intervalo para metade alterando unicamente o valor do limite de
confiança. Sendo assim um intervalo de confiança para os dados da população 1,
sendo H o valor do limite de confiança e S=norminv((100-(100-H)/2)/100) é dado por:

36.725 36.725
IC H % ( μ1 ) =[25.28−S ; 25.28+ S ]
√ 93 √93
36.725 36.725
Logo: (25.28+ S )-(25.28−S ¿ = (31.544-19.016)/2
√ 93 √ 93
36.725
Ou seja:2S* =6.264 Ou Seja: S=6.264/¿*2)
√ 93
S= norminv((100-(100-H)/2)/100), Logo ((100-(100-H)/2)/100) = normcdf(S)

Com isto é possível determinar H, neste caso H=200normcdf(S)-100

Concluindo, S=0.8224 e H=58,917%

CALCULOS PARA OCTAVE: H=200*normcdf((6.264*sqrt(93))/(36.725*2))-100

Transportando para a população 2:

5.6734 5.6734
IC H 1 % ( μ2 )=[3.9032−S 1 ; 3.9032+ S 1 ]
√ 62 √62
5.6734
Logo: (3.9032+S 1 ¿−¿)=(5.0884-2.7180)/2
√ 62
5.6734 5.6734
Ou seja: 2S1* =1.1852 Ou seja: S1=1.1852/( ∗2 ¿
√ 62 √ 62
S1= norminv((100-(100-H1)/2)/100, logo ((100-(100-H1)/2)/100) = normcdf(S1)

Com isto é possível determinar H, neste caso H=200normcdf(S1)-100

Concluindo, S1=0.8225 e H1=58.918%


CALCULOS PARA OCTAVE: 200*normcdf((1.1852*sqrt(62))/(5.6734*2))-100

Como seria de esperar, o valor limite do grau de confiança diminuiu bastante de modo
a que a amplitude diminua para metade, sendo igual em ambas as populações como o
esperado.

Alínea C)

Seja X uma V.A. que segue uma distribuição binomial de parâmetros n e p.


X p ( 1− p )
Então, quando n → ∞ a V.A. Pode definir-se por ^ P=
n
N p, ( n ). O corolário da

proporção amostral permite-nos então estabelecer a proporção numa amostra através


de uma normal. Nesta alínea, é nos proposto a realização de um teste de hipótese, no
qual vamos testar se a proporção de dias em que a utilização do telemóvel é superior a
k minutos é diferente para as duas amostras, sendo k a média todos os valores
recolhidos referentes ao tempo diário de utilização do telemóvel.

Sendo assim, H 0 :P 1−P2=0 , sendo H 1 : P1 −P2 ≠ 0

Sendo a k 1 = 228,88 minutos, σ 1 =110,76, k 2=105,83e σ 2=40,363.


45 27
^p1= , enquanto que ^p2=
93 62
Fazendo o teste de hipóteses:

1º: H 0 :P 1−P2=0 VS P1−P2 ≠0

p1 ( 1− p1 ) p2 ( 1− p2 )
(
2º W =P1−P2 N p 1− p2 ,
93
+
62 )
3º Sob H 0 :W N ¿ ) , p1 ≈ ^p1 , p 2 ≈ ^p2

: W N (0,6.64 x 10−3 )
Nota: no script do Octave, utilizamos uma variável para a variância para que os erros de
arredondamentos sejam mínimos.

Tal como neste caso:


 Rejeito H 0, se ^p1− ^p2 ϵ ¿−∞ ,r 1 ¿ ∪ ¿

 Não rejeito H 0, se ^p1− ^p2 ϵ ¿ r 1 ,r 2 ¿

Determinar r 1: r 1=norminv ( 0.005,0 , √ ( 6.65∗10−3 ) )=−0.21006

r 2 :r 2=norminv (1−0.005,0 , √ (6.65∗10−3))=0.21006

Assim,

 Rejeito H 0, se ^p1− ^p2 ϵ ¿−∞ ,−0.21006 ¿ ∪ ¿

 Não rejeito H 0, se ^p1− ^p2 ϵ ¿−0.21006 , 0.21006¿

45 27
^p1− ^p2= − =0.048387
93 62
Como 0.048387 não pertence à região de rejeição, então, rejeito H 0, logo, com uma
significância de 1%, uma confiança de 99% podemos afirmar que as proporções da
amostra 1 e 2 são diferentes.

Alínea D)

Alínea E)
É RAZOÁVEL ASSUMIR QUE O NÚMERO DE MENSAGENS ENVIADAS PELA POPULAÇÃO
SEGUE UMA DISTRIBUIÇÃO DE POISSON? Alfa = 0.05
Vamos agora testar a hipótese do número de mensagens enviadas por cada
uma das populações seguir uma distribuição de Poisson, com significância de 5%.

H 0 : A população segue a distribuição de Poisson


H 1 : A população não segue a distribuição de Poisson

População 1

Para efectuar o teste de ajuste, note-se que existem um parâmetro a estimar, λ


, e que o numero de observações a estimar, n, é 93 (dimensão da amostra 1) pelo que
o número de graus de liberdade a considerar na distribuição de χ 2 será de
(k −ν−1)=93−1−1=91.
Desta forma, iremos proceder à estratificação dos dados. Assim, usando a
fórmula de Sturges apresentada anteriormente 7.1,tem-se que o número de classes a
considerar é de:
k=log(91)/log(2)+1
k=ceil(k)
k= 8
Assim, concluímos que os dados devem ser estratificados em 8 classes. Para
calcular os limites das classes iremos dividir o valor máximo observado por 8, sendo
que assim não obteremos classes equiparáveis. De salientar também que estes limites
terão que ser números inteiros visto que estamos a tratar uma variável discreta,
número de mensagens enviadas pela população.

maior1=0
for i=1:93
if AA(i,6)>maior1
maior1=AA(i,6)
end
end
maior_1=maior1
maior_1=201
limite1=round(maior_1/8)
limite1=25
limite2=round(limite1*2)
limite2=50
limite3=round(limite1*3)
limite3=75
limite4=round(limite1*4)
limite4=100
limite5=round(limite1*5)
limite5=125
limite6=round(limite1*6)
limite6=150
limite7=round(limite1*7)
limite7=275
limite8=maior_1
limit8=201

Agora iremos determinar a frequência absoluta para cada uma das classes:
Exemplo 1ª Classe:

f1=0

for i=1:93

if (0<=AA(i,6))&(AA(i,6)<limite1)

f1=f1+1

end

end

freq1=f1

freq1=60

Desta forma obtivemos a seguinte tabela:

Nº de mensagens Frequência pi np i
enviadas por dia Observada, ni
[0,25[ 60 0,6452
[25,50[ 17 0,1828
[50,75[ 9 0,0968
[75,100[ 3 0,0323
[100,125[ 1 0,0108
[125,150[ 1 0,0108
[150,175[ 1 0,0108
[175,201[ 1 0,0108
O calculo de pi foi efetuado a partir do seguinte código: (acho que não é assim)

fi=[freq1;freq2;freq3;freq4;freq5;freq6;freq7;freq8]
pi=fi./93

O cálculo de np i foi efetuado a partir do seguinte código:


npi=93.*pi

Você também pode gostar