Escolar Documentos
Profissional Documentos
Cultura Documentos
PARTE II – VERSÃO 3
REFERÊNCIA E – ESTATÍSTICA
Nota Prévia:
A prova de conhecimentos é constituída por duas partes autónomas: Parte I – Prova de conhecimentos transversais ao
desempenho de funções na Administração Pública; Parte II – Prova de conhecimentos técnicos específicos para cada uma
das áreas de atuação.
Cada candidato(a) faz uma única prova de conhecimentos transversais (Parte I) e tantas provas específicas quantas as
referências a que se candidatou e a que foi admitido(a).
Material:
O material desta prova é constituído por este caderno de questões e pela folha de respostas para leitura ótica.
Não se esqueça de que só deve escrever na folha de respostas com esferográfica de tinta preta.
Não utilize qualquer outro material na sua folha de respostas, nomeadamente lápis ou corretor branco.
Sobre a sua área de trabalho devem estar, apenas, o caderno de questões e a folha de respostas.
A CORREÇÃO DA PROVA É EFETUADA SOB ANONIMATO. NUNCA ASSINE OU RUBRIQUE A FOLHA DE RESPOSTAS.
Forma de Identificação:
Na folha de respostas, na parte superior, identifique com um X a parte (II) da prova que está a realizar, a respetiva
referência (A, B, C, D ou E) e a respetiva versão (1, 2, 3 ou 4). Na parte inferior, sob o título Espaço reservado ao(à)
candidato(a), escreva o CÓDIGO DE PROVA e o seu NOME COMPLETO, de modo legível.
O seu CÓDIGO DE PROVA corresponde ao número de candidatura, depois de retirado o ano e o mês.
– Exemplo: Código de candidatura: 201907/1988; código de prova: 1988.
* A duração da prova pode ser alargada até ao limite de 90 minutos para os candidatos portadores de deficiência que
solicitarem, comprovadamente, condições especiais para a sua realização.
Forma de Resposta:
A parte da prova que vai realizar é composta por 25 questões de escolha múltipla.
Cada questão tem quatro opções de resposta (a, b, c e d).
Deve assinalar a opção que considere mais correta e/ou completa, de entre todas as
opções identificadas.
Sugestão:
1) Leia atentamente cada questão e as respetivas quatro opções de resposta.
2) Registe, inicialmente, no enunciado, a sua intenção de resposta e só a assinale na folha de respostas quando estiver
certo(a) da opção correta.
3) Certifique-se de que não se enganou quanto à questão ou alínea que pretende assinalar como correta.
4) Desenhe corretamente o X com caneta esferográfica preta, dentro da área do quadrado correspondente à opção de
resposta que escolhe, de forma a evitar a anulação das respostas, durante o processo de correção.
5) Certifique-se de que, para cada questão, preencheu com X apenas uma única resposta.
O preenchimento incorreto da folha de respostas (exemplos: assinalar com X mais do que uma opção de resposta;
desenhar o X para além das margens da área do quadrado de resposta; rasurar respostas) gera a anulação da resposta.
Não faça rasuras ou correções na folha de respostas. Em caso de engano deve utilizar uma nova folha de respostas.
Dispõe apenas de 2 (duas) folhas de respostas.
Duração da Prova:
A prova tem a duração de 60 minutos. No termo da duração da prova deve pousar de imediato a caneta, virar a folha de
respostas ao contrário e aguardar pela recolha da prova.
Não são permitidas saídas da sala durante o tempo de realização da prova, salvo em casos devidamente autorizados.
Em caso de desistência da prova, deve assinar a desistência na folha de respostas e na folha de presenças e aguardar na
sala até ao termo da realização da prova.
BOM TRABALHO!
4. Na análise de regressão linear, o coeficiente de determinação é uma medida da dimensão do efeito da(s)
variável(eis) independente(s) sobre a variável dependente. Neste âmbito:
a) o coeficiente de determinação assume valores no intervalo [-1, 1], tal como o coeficiente de correlação
de Pearson.
b) dizer que o coeficiente de determinação é 0,4 significa que 60% da variabilidade da variável dependente
é explicada pelas variáveis independentes.
c) o coeficiente de determinação quantifica a proporção da variabilidade total da variável dependente
explicada pelas variáveis independentes.
d) num modelo de regressão linear univariado, quando o coeficiente de determinação é igual a -1, o ajuste
linear é perfeito, e o declive da reta é negativo.
II
5. Seja s(x) uma função segmentada definida no intervalo [0, 3] e que representa o lucro obtido na venda de
um produto sazonal. No 1.o mês de vendas, o lucro é representado por s1(x), e nos 2.o e 3.o meses é descrito
por s2(x).
Indique qual das funções segmentadas s(x) poderá representar uma spline cúbica.
𝟑𝟑 𝟐𝟐
a) 𝒔𝒔(𝒙𝒙) = �𝟐𝟐𝒙𝒙 − 𝟔𝟔𝟔𝟔 + 𝟓𝟓𝟓𝟓 𝟎𝟎 ≤ 𝒙𝒙 ≤ 𝟏𝟏
𝟐𝟐 − 𝒙𝒙 𝟏𝟏 ≤ 𝒙𝒙 ≤ 𝟑𝟑
𝟑𝟑 𝟑𝟑 𝟐𝟐 𝟐𝟐
𝒔𝒔(𝒙𝒙)==�𝟑𝟑𝒙𝒙
b) 𝒔𝒔(𝒙𝒙) 𝟑𝟑𝒙𝒙 −−𝒙𝒙𝒙𝒙 ++𝒙𝒙𝒙𝒙−−𝟐𝟐𝟐𝟐
� 𝟑𝟑 𝟑𝟑
𝟎𝟎𝟎𝟎≤≤𝒙𝒙𝒙𝒙≤≤𝟏𝟏𝟏𝟏
𝟐𝟐𝒙𝒙
𝟐𝟐𝒙𝒙 ++𝟐𝟐𝟐𝟐
𝟐𝟐𝟐𝟐−−𝟑𝟑𝟑𝟑 𝟏𝟏𝟏𝟏≤≤𝒙𝒙𝒙𝒙≤≤𝟑𝟑𝟑𝟑
𝟑𝟑 𝟑𝟑 𝟐𝟐 𝟐𝟐
𝒔𝒔(𝒙𝒙)==�𝟑𝟑𝒙𝒙
c) 𝒔𝒔(𝒙𝒙) 𝟑𝟑𝒙𝒙 −−𝒙𝒙𝒙𝒙 ++𝒙𝒙𝒙𝒙−−𝟐𝟐𝟐𝟐
� 𝟒𝟒 𝟒𝟒
𝟎𝟎𝟎𝟎≤≤𝒙𝒙𝒙𝒙≤≤𝟏𝟏𝟏𝟏
𝟐𝟐𝒙𝒙
𝟐𝟐𝒙𝒙 ++𝟐𝟐𝟐𝟐
𝟐𝟐𝟐𝟐−−𝟑𝟑𝟑𝟑 𝟏𝟏𝟏𝟏≤≤𝒙𝒙𝒙𝒙≤≤𝟑𝟑𝟑𝟑
d) 𝒔𝒔(𝒙𝒙) 𝟐𝟐𝒙𝒙𝟑𝟑𝟑𝟑−−𝟔𝟔𝟔𝟔
𝒔𝒔(𝒙𝒙)==��𝟐𝟐𝒙𝒙 𝟔𝟔𝟔𝟔𝟐𝟐𝟐𝟐++𝟓𝟓𝟓𝟓
𝟓𝟓𝟓𝟓 𝟎𝟎𝟎𝟎≤≤𝒙𝒙𝒙𝒙≤≤𝟏𝟏𝟏𝟏
𝟐𝟐𝟐𝟐−−𝟐𝟐𝟐𝟐
𝟐𝟐𝟐𝟐 𝟏𝟏𝟏𝟏≤≤𝒙𝒙𝒙𝒙≤≤𝟑𝟑𝟑𝟑
III
Probabilidades e Estatística
6.
Indique o teste não paramétrico adequado para determinar se existe relação de dependência entre duas
variáveis qualitativas dicotómicas e independentes, sabendo que n=15.
a) Teste do χ (qui-quadrado).
2
b) Teste Binomial.
c) Teste de McNemar.
d) Teste Exato de Fisher.
7. Pretende-se avaliar a eficácia de uma terapêutica breve (antes e depois), aplicada a um grupo de 50 pacien-
tes. As amostras são emparelhadas e a variável dependente é medida numa escala ordinal. Sabe-se ainda
que a amostra apresenta uma distribuição platicúrtica. Indique o teste adequado.
a) Teste de Friedman.
b) Teste de Wilcoxon.
c) Teste t-Student.
d) Teste de Kruskal-Wallis.
8. Atendendo à seguinte série de valores das idades de um grupo de 10 inquiridos, e com base na sua análise,
indique a afirmação correta:
9. Pretende-se comparar os valores médios de mais de duas populações independentes, a partir de amostras
aleatórias, recorrendo a testes paramétricos. Para este efeito, indique quais dos seguintes pressupostos
devem verificar-se, em simultâneo:
10. Indique a medida estatística mais adequada para determinar a dispersão de uma variável qualitativa
nominal.
a) Intervalo de variação.
b) As variáveis qualitativas nominais não apresentam medidas de dispersão.
c) Amplitude interquartílica.
d) Coeficiente de variação.
IV
x|
0,1 0,15 0,2 0,25 0,3 0,4
y|
0,9950 0,9888 0,9800 0,9689 0,9553 0,9211
O valor de f ’(0,2), calculado pelo método de derivação numérica da diferença finita progressiva de primeira
ordem e passo h=0,1, é:
a) −0,015/0,1=−0,15
b) −0,0199/0,1=−0,199
c) −0,0247/0,1=−0,241
d) 0,9800
12. Considera-se inapropriada a aplicação de uma Análise Fatorial Exploratória (AFE) em todas as situações,
exceto quando:
13. Na análise de regressão linear multivariada, a elevada correlação entre as variáveis independentes determina
o problema da:
a) Homocedasticidade.
b) Homogeneidade da variância dos resíduos.
c) Autocorrelação dos resíduos.
d) Multicolinearidade.
14. Qual dos seguintes métodos de estatística multivariada NÃO classifica as variáveis como dependentes ou
independentes?
a) Regressão linear.
b) Análise discriminante.
c) Análise Fatorial Exploratória (AFE).
d) Análise de Variância (ANOVA).
15. Foi realizada uma Análise de Componentes Principais (ACP), tendo-se obtido os seguintes valores próprios
(eigenvalues): 2,731; 2,218; 0,442; 0,341; 0,183 e 0,085. Quantas componentes deverão ser consideradas
com base nestes valores?
a) 1.
b) 2.
c) 4.
d) 6.
VI
Estatística Computacional
16. Com base na análise dos outputs abaixo apresentados, referentes a uma Análise de Componentes Principais,
indique o número total de fatores a reter e as regras utilizadas para fundamentar essa escolha.
Sig. ,000
a) O número total de fatores a reter é 3, com base na análise do valor próprio (eigenvalue) e do scree plot.
b) O número total de fatores a reter é 4, com base na análise do KMO e do scree plot.
c) O número total de fatores a reter é 4, com base na análise do KMO e do valor próprio (eigenvalue).
d) O número total de fatores a reter é 4, com base na análise do valor próprio (eigenvalue) e do scree plot.
17. A análise descritiva da variável «idade» de uma amostra com 237 participantes encontra-se resumida
no quadro seguinte e no histograma de frequências absolutas, onde se pode analisar a sua distribuição.
Caracterize a assimetria desta variável.
Estatísticas Descritivas
Média 20,52
Mediana 19,00
Moda 18
Desvio padrão 4,174
Frequência
Mínimo 17
Máximo 43
1º Quartil 18,00
3º Quartil 21,00
Idade (anos)
18. Com o objetivo de determinar se existem diferenças entre o número de vezes que as estudantes do género
feminino saem à noite e o número de vezes que os estudantes do género masculino saem à noite, realizou-se
um inquérito em várias universidades, cujos outputs são a seguir apresentados. A variável «Quantas vezes
sai à noite?» tem 5 categorias, sendo que o valor 1 corresponde a «Não sai» e o valor 5 a «Sai todos os
dias». Com base na análise destes outputs, indique a afirmação correta.
Ranks
Test Statisticsa
Quantas vezes
sai à noite?
Mann-Whitney U 38707,000
Wilcoxon W 127960,000
Z -2,566
Asymp. Sig. (2-tailed) ,01
Exact Sig. (2-tailed) ,01
Exact Sig. (1-tailed) ,005
Point Probability ,000
a) A escolha do teste paramétrico é a adequada, atendendo a que as variáveis são qualitativas. Conclui-se
que existem diferenças significativas entre os dois géneros.
b) A escolha do teste não paramétrico é a adequada, atendendo a que as variáveis são qualitativas. Conclui-se
que existem diferenças significativas entre os dois géneros.
c) A escolha do teste não paramétrico não se adequa às variáveis em análise.
d) A escolha do teste não paramétrico é a adequada, atendendo a que as variáveis são qualitativas. Conclui-se
que não existem diferenças significativas entre os dois géneros.
19. Um estudo com vista a recolher informações sobre o bem-estar físico dos funcionários de um determinado
ministério revelou a relação existente entre o peso e a altura dos participantes. Com base na análise dos
outputs apresentados para o modelo de regressão univariado, indique a afirmação correta.
Model Summary
ANOVAa
Mean
Model Sum of Squares df F Sig.
Square
Regression 9495,546 1 9495,546 1243,669 ,000b
1 Residual 17637,083 231 76,351
Total 27132,629 232
a. Dependent Variable: Peso (kg)
b. Predictors: (Constant), Altura (cm)
Coefficientsa
Unstandardized Standardized
Model Coefficients Coefficients
B Std. Error Beta t Sig.
(Constant) -57,525 10,722 -5,365 ,000
1
Altura (cm) ,716 ,064 ,592 11,152 ,000
a. Dependent Variable: Peso (kg)
a) Peso = f(altura) não pode ser estimado porque o coeficiente de determinação é de 0,350.
b) Peso = f(altura) não pode ser estimado porque o coeficiente de correlação múltiplo é de 0,350.
c) Sabendo a altura de um qualquer funcionário, é possível prever o seu peso recorrendo à seguinte
equação: peso = -57,525 + 0,716*(altura).
d) Peso = f(altura) não pode ser estimado porque o coeficiente de determinação é de 0,592.
VII
20. Sabendo que se obteve (1,5; 2,5) como intervalo de confiança a 99% para o valor médio de uma deter-
minada população, pode-se afirmar que:
21. Considere a seguinte informação relativa ao período que decorre entre a receção de amostras de água e
a respetiva análise para controlo de qualidade, efetuada por uma empresa privada do concelho de Lisboa
(unidade de medida: dias).
Statistics
Período entre a receção e a análise feita à água
N Valid 50
Missing 0
Mean 7,70
Std Deviation 3,808
Skewness ,590
Std Error of Skewness ,337
Kurtosis -,262
Std Error of Kurtosis ,662
Percentiles 25 5,00
50 7,00
75 10,00
a) Para 50% das amostras de água, o período que decorre entre a receção e a respetiva análise vai até 7 dias.
b) Para 75% das amostras de água, o período que decorre entre a receção e a respetiva análise é superior a
10 dias.
c) O número de dias que decorre entre a receção e a análise das amostras de água é, em média, de 7 dias.
d) Para 25% das amostras de água, o período que decorre entre a receção e a respetiva análise é de 5 dias.
22. Seja X uma variável aleatória que representa o nível de colesterol em doentes diabéticos, onde se desconhece
o seu valor médio (μ) e variância (σ2). Considerando uma amostra aleatória de dimensão n retirada dessa
população, é a variável aleatória que representa o nível médio de colesterol em doentes diabéticos.
Indique a opção correta:
a) =
b) =
c) é o estimador do valor médio do nível de colesterol na população de doentes diabéticos.
d) A média amostral é a variável aleatória que representa o nível médio de colesterol dos doentes
diabéticos na amostra.
23. Afirmar que o nível de significância associado ao teste H0: μ=0 vs. H1: μ≠0 é de 5% significa que:
24. Foi estudada a associação entre as variáveis Género (Masculino, Feminino) e Exercício de Profissão de Risco
(Sim, Não).
a) O coeficiente adequado para a associação entre as variáveis Género e Exercício de Profissão de Risco é
o coeficiente de correlação de Spearman.
b) A covariância é a medida adequada para quantificar a associação entre as variáveis Género e Exercício
de Profissão de Risco.
c) A associação entre as duas variáveis é dada pelo coeficiente Ф =-0,494 e é estatisticamente significativa.
d) A associação entre as duas variáveis é dada pelo coeficiente Ф =-0,494 e não é estatisticamente
significativa.
25. Numa instituição de ensino superior, foi desenvolvido um estudo sobre obesidade. Numa população citadina,
foram analisados 100 indivíduos, tendo sido registado o seu Género (Feminino/Masculino) e a sua situação
relativamente ao Excesso de Peso (Sim/Não). Considere um nível de significância de 5%.
Selecione a opção correta com base nas tabelas seguintes que considerar adequadas ao problema.
Test Statisticsb
excesso de
peso - género
a
Z -3,098
Asymp. Sig. (2-tailed) ,002
a. Based on positive ranks.
b. Wilcoxon Signed RanksTest
Fim da Prova