Você está na página 1de 8

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/308764420

Lista de Exercícios de Estatística e Probabilidade para Graduação em


Engenharia Elétrica - Embrião para futuro livreto de exercícios resolvidos

Research · September 2016


DOI: 10.13140/RG.2.2.17177.01129

CITATIONS READS

0 2,087

1 author:

José Fausto de Morais


Universidade Federal de Uberlândia (UFU)
73 PUBLICATIONS 452 CITATIONS

SEE PROFILE

All content following this page was uploaded by José Fausto de Morais on 30 September 2016.

The user has requested enhancement of the downloaded file.


Lista – Estatística Probabilidade 2/2016
Prof. Dr. José Fausto de Morais / Faculdade de Matemática
Universidade Federal de Uberlândia

ESTATÍSTICA
(01). A descrição de dados é uma parte importante de qualquer projeto de pesquisa e não deve ser ignorado, pois o processo
permite que se obtenha familiaridade com os dados; que se identifiquem dados com valores aberrantes e que se verifiquem as
suposições adotadas em testes de significância. Considerando-se o que foi discutido em aula, (a). quais são os quatro tipos mais
comuns de dados numéricos? Dê um exemplo de cada um deles. (b). Considerando o sujeito “usina hidrelétrica norte-
americana” (existem mais de 2000 nos USA contra 158 no Brasil), dê dois exemplos de constructo, um exemplo de variável que
produz um dado contínuo, um exemplo de variável que atinge, no máximo, o nível intervalar e de uma variável que atinge, no
máximo, o nível ordinal. (c). Repetir o quesito “b” para o sujeito “Engenheiro registrado” (existem 800 mil registrados no Brasil),
para o sujeito “Curso de graduação em engenharia” (existem mais de 3000 no Brasil), para o sujeito “Televisão” (a vida útil é de
mais ou menos 7 anos), para o sujeito de pesquisa “Lâmpada fluorescente” (a vida útil é de aproximadamente 70 mil horas) e
para o sujeito “Motor elétrico”.

(02). Atenção aos detalhes é uma habilidade desejada para todo cientista, em particular para engenheiros. Com o propósito de
estudar a possível correlação entre a Área de Formação (Humanidades, Ciências, Ciências Sociais) e o Nível Detalhismo (NDet)
dos alunos da UFU, um pesquisador selecionou, ao acaso, uma amostra com 301 dos 22 453 alunos da UFU e coletou a Idade,
Sexo, Renda, Nível de Escolaridade do pai, Área e Escore AQ10 dos alunos amostrados. O referido escore varia de 0 a 10 e foi
utilizada para medir o “NDet” do aluno. (a) De um exemplo de parâmetro e de estatística que o pesquisador pode considerar no
estudo. (b) Qual seria a população comum e uma população estatística para o estudo? (c) Por que a amostra pode ser utilizada
para se fazer inferências sobre a população? (d) Dentre as variáveis mencionadas qual delas são constructos? Quais delas
oferecem dados contínuos, discretos, ordinal, nominal? (e) Qual o máximo nível de mensuração que Idade, Sexo, Renda, Nível
de Escolaridade e Escore AQ10 podem atingir? (f) Se a variável Renda assumir os valores 1=menos de 3 mil; 2=de 3 a 6 mil;
3=acima de 6 mil, então qual foi o nível de mensuração que ela atingiu? (g) Com base no sujeito de pesquisa elabore um
problema de juízo e um de engenharia? Qual foi o problema de pesquisa e o objetivo considerado pelo pesquisador?
Qual hipótese de pesquisa você adotaria? Que tipo de pesquisa você recomendaria para trabalhar o problema de pesquisa?
Qual o nível de evidência o tipo que você escolheu atingiria pela classificação dada em aula? O estudo pode ser classificado
como ecológico? Justifique.

(03). Considerando o estudo referido na questão 02, (a) os dados gerados pela variável Idade (expressa em anos) produziram
que tipo de série? Qual gráfico você recomenda para representar a série? (b) Se o histograma da variável produziu uma única
moda e apresentou marcada assimetria positiva, qual das três principais medidas de posição você usaria para resumir a série?
Qual das medidas de dispersão seria menos suscetível a outliers? (c) Se ordenarmos a série de idades qual deve ser a posição da
mediana? E do primeiro quartil? E do terceiro quartil? (d) Para que uma das idades possa ser considerada um “valor aberrante”
do tipo “muito alto” ela deve superar qual valor?

(04). Calcule, se possível, a Moda, a Mediana, a Média Aritmética, a Média Geométrica, os Quartis, a Amplitude Total, o Desvio
médio, a Variância, o Desvio Padrão (amostral), o Desvio Padrão (Populacional), o CV da variável X e o escore padrão da moda
da variável X, se
(a) X={1, 5, 2, 1, 3, 43} onde X indica salário, expresso em milhares de reais, de 5 membros da comunidade UFU;
(c) X={O,O,A,A,AB, B} onde X indica o tipo sanguíneo pelo sistema ABO dos sujeitos referidos em (a);
(d) X={1, 4, 2, 1, 3, 5} onde X indica o nível de escolaridade (1=EF, 2=EM, 3=ES, 4=M, 5=D) dos referidos em (a);
(e) X={36, 37, 35, 36, 35,36} onde X indica a temperatura, medida em graus centígrados, dos sujeitos referidos em (a).

(05). Considerando a questão 04 e tendo em vista a dispersão relativa em torno da média, qual das médias (salarial ou
temperatura) representa melhor o conjunto de valores assumidos pela variável X? Considerando um ponto de corte de 50% e
tendo em vista a dispersão relativa, podemos dizer que o salário médio é representativo dos valores de X? Justifique suas
respostas.

(06). Repetir a questão 04 se X = {1, 3, 4, 5, 5, 6, 6, 8, 15} onde X indica a renda aproximada, em milhares de reais, de 9
consumidores. Adicionalmente, construa o Box Plot de X.

(07). Se X indica o Consumo de Eletricidade, em milhões de MW-h/ano, de 15 países membros da ONU (veja a tabela),

(a) Calcule a Moda, a Mediana, a Média Aritmética, a Média Geométrica, os Quartis, a Amplitude Total, o Desvio médio, a
Variância, o Desvio Padrão (amostral), o Desvio Padrão (Populacional), o CV da variável X, o escore padrão da moda da variável
X e construa o Box Plot para X. (b). Construa a DFC de X considerando 5 classes de tamanhos iguais sendo que a primeira classe
deverá iniciar do valor mínimo de X. (c) Com base na DFC construída no quesito “b” construa o Histograma das frequências
simples, o Polígono de Frequências e a Ogiva de Galton. (c) Com base nos gráficos construídos, qual medida é mais
recomendada para descrever X, a média ou a mediana? Justifique sua resposta.

(08). Um pesquisador pretende verificar se a Estimulação Elétrica Nervosa Transcutânea (TENS) alivia a dor de adultos
portadores de dor lombar crônica (PDLC) quando comparada com Cuidados Primários (CP). Ele seleciona (ao acaso) 121
pacientes para receber a TENS e 120 para receber a CP. Após seis semanas de acompanhamento o pesquisador identificou alívio
da dor em 96 pacientes do grupo TENS e em 79 do grupo PC. Qual foi a hipótese de pesquisa assumida pelo pesquisador? Quais
foram o objetivo e o problema de pesquisa? Informe uma variável que atinge, no máximo, o nível de mensuração intervalar.
Informe dois constructos ligados ao sujeito de pesquisa do estudo. O estudo se enquadra melhor em qual categoria: caso-
controle, estudo transversal, coorte ou ECR? Justifique sua resposta. Calcule e interprete o valor do Risco Relativo (RR) para o
desfecho "redução importante no número de crises". Em qual tipo de estudo epidemiológico, apresentado em sala de aula,
somente faz sentido calcular o OR?

(09). Os dados a seguir indicam o Tempo de Resposta (TR), em milissegundos (ms), de 16 monitores.
3 0,5 1 0,5 (a). Com base nos dados brutos determine o TR médio, modal e mediano.
3 1 2 0,5 Calcule o CV, o escore padrão do maior TR obtido e a média geométrica do
1 10 1 0,5 TR. Construa o Stem & Leaf, o Box-Plot e informe o nível de mensuração
3 1 2 5 máximo que o TR pode atingir. (b). Construa a DFC para o TR considerando
5 classes de mesma amplitude e inicie a primeira classe com o TR mínimo observado na amostra. Com base na tabela de
distribuição construída esboce o polígono de frequências, a ogiva de Galton e calcule o valor aproximado da média, da moda, da
mediana e do desvio padrão. Qual das três medidas de posição básicas (média, moda, mediana) é a mais indicada para
representar o TR? Justifique sua resposta. (c). Se os 16 monitores custaram, em média, 735 reais com desvio padrão de 371
reais, considerando a dispersão relativa, qual das medidas melhor representa o grupo de monitores, o custo médio ou o TR
médio? Justifique sua resposta.

(10). Com base na tabela a seguir calcule o alfa de Cronbach para a escala formada pelas questões Q1, Q2, ..., Q5 de uma escala
de desempenho. Cada questão assume um valor de 0 a 10 e trata de uma dimensão do desempenho dos respondentes (RESP).
RESP Q1 Q2 Q3 Q4 Q5
A 9 9 8 7 8
B 8 7 7 7 6
C 8 5 5 9 1
D 7 5 7 6 5
E 9 3 8 9 5
F 5 8 7 7 6

(11). A tabela a seguir exibe a avaliação das condições de 10 sistemas elétricos, de forma independente, por dois engenheiros (A
e B). Na tabela (+) indica que o sistema está funcionando adequadamente e (-) indica o contrário. Calcule e interprete o valor do
Engenheiro 1 2 3 4 5 6 7 8 9 10 Kappa para as avaliações dos engenheiros. Usando a classificação
A + + + + - - - + + - de Landis & Koch o que podemos dizer da concordância dos
B + + - + - + - + - + diagnósticos?

(12). A tabela exibe as Doses Letais (DL’s), em mg/kg, identificadas em 15 cobaias.


(a) Calcule a moda, a mediana, a média aritmética e geométrica, o CV e o escore
padrão da moda. (b) Considerando 5 classes do mesmo tamanho com a primeira
classe começando pelo valor mínimo observados para as DL’s, construa o
Histograma, o Polígono de Frequências, a Ogiva de Galton e o Box plot para a variável DL. (c) Com base nos resultados
anteriores, qual das medidas de locação é a mais apropriada para representar o conjunto de dados? Você diria que a média
aritmética é representativa para um ponto de corte de 20%? Se as cobaias tem massa corporal média de 12 kg com desvio
padrão de 4 kg. Qual das medidas é mais representativa, a média do DL ou da Massa? Justifique suas respostas.

(13). Um pesquisador quer checar se a Estimulação Elétrica Transcraniana (EET) reduz o número de ataques, em adultos com
epilepsia refratária (ER), quando comparado com uma Dieta Cetogênica (DC). O pesquisador seleciona, ao acaso, 200 adultos
com ER para receber a EET, e 200 adultos com ER para receber a DC. Os pacientes são acompanhados durante seis meses. Antes
da avaliação do desfecho 10 indivíduos do grupo DC e 5 do grupo EET abandonam o estudo. Considerando os 385
remanescentes, identificou-se uma “importante redução no número de ataques” em 49 pacientes do grupo EET e em 60 do
grupo DC. (a) Qual foi a hipótese de pesquisa assumida pelo pesquisador? (b) Identifique uma variável e um constructo para o
sujeito de pesquisa. A variável deve alcançar o nível de mensuração máximo intervalar. (c) Calcule o RR e o OR para o desfecho
“importante redução no número de ataques” (d) Se os pacientes do grupo DC que não apresentaram uma importante redução
no número de ataques foram examinados por dois especialistas (A e B) e ambos julgaram 7 em estado nutricional grave e 4 em
estado não grave, calcule o Kappa se o especialista A considerou 13 paciente em estado grave.

CORRELAÇÃO REGRESSÃO

(14) Considere as variáveis: Desperdício Diário de Alimentos (DALIM), Consumo Mínimo Diário de Água Potável (CMAG), Posição
do país em rank de inteligência populacional (RANkIMP), GOV1RP, SE1A e SM1A de 44 países selecionados ao acaso dentre os
193 países membros da ONU. A variável DALIM foi medida em milhares de toneladas, CMAG em milhões de metros cúbicos, o
menor valor da variável RANIMP indica o país, da amostra, com o melhor desempenho nos testes inteligência populacional. Na
dicotomia GOV1RP o 1 indica "República Presidencialista", na SE1A o 1 indica "País com Economia aceitável" e na SM1A o 1
indica "país com Saúde Mental aceitável". (a) Com base nas matrizes de dispersão e de correlações exibidas na seqüência,
identifique, interprete o valor e avalie a significância estatística da correlação entre DALIM e CMAG e entre CMAG e RANPISA.
Na matriz de correlações os dados acima da diagonal de "uns" foram calculados pelo método de Pearson e aos que estão abaixo
foram calculados pelo método de Spearman.
DALIM CMAG RANKIMP
1 0,918 -0,059
DALIM 0,001 0,697
44 44 44
0,994 1 0,041
CMAG 0,001 0,794
44 44 44
0,054 0,101 1
RANKIM 0,721 0,516
P
44 44 44

(b) A tabela a seguir exibe os resultados de uma RLM da variável DALIM sobre as variáveis CMAG e SE1A.
B t P-Value Interprete o valor e avalie a significância estatística do r-square, do coeficiente
(Constante) 5,30 0,75 0,459 da variável CMAG e do coeficiente da variável SE1A. Qual é o DALIM esperado
CMAG 36,18 14,90 0,002 dos Estados Unidos se este país tem um CMAG de 1,54 milhões de metros
SE1A -3,59 -0,45 0,651 cúbicos e tem saúde econômica aceitável.
R-Square=0,844 (P=0,001)

(15). Um pesquisador afirma que não mais de 30% das peças fabricadas por uma indústria apresentam o defeito M, que as peças
sem o tal defeito apresentam, em média, um tempo de vida (TV) maior quando comparado com as peças com o efeito e que
existe uma correlação entre o sexo do avaliador da peça e a presença do defeito. Para verificar as hipóteses levantadas pelo
pesquisador coletamos uma amostra aleatória com 12 peças, avaliamos a presença do defeito, o TV, a Idade e o sexo do
avaliador das peças. (veja tabela abaixo) (c). Calcule e interprete o valor obtido para a correlação entre o TV e Idade e entre
PEÇA 1 2 3 4 5 6 7 8 9 10 11 12 TV e a presença de defeito. Informe as
Idade (anos) 35 35 37 37 28 28 31 30 30 32 32 33 condições de uso da primeira
TV(anos) 11 10,5 10 9,5 8,5 9 7,5 8,5 7,5 8,5 9 9 correlação avaliada; (b). Ajuste aos
DefeitoM + + + - + - - - - - - - dados uma reta e uma curva exponen
Sexo1F 1 1 0 0 0 1 0 0 0 0 1 1 cial considerando o TV como variável
resposta e Idade como variável independente. Calcular o coeficiente de determinação de cada ajuste, interpretar o seu valor,
identificar o melhor ajuste e, com base nele, obter a melhor previsão do TV para uma peça avaliada por um indivíduo de 31
anos. No caso do ajuste linear interprete o valor do coeficiente angular obtido.

(16). Em um estudo sobre a Eletroterapia no processo de reparação óssea, 14 cobaias foram estudadas. A tabela a seguir exibe
o Tempo de Exposição (TE) até visível desconforto, a uma dada corrente elétrica, em minuto, e a idade, em semanas, das
cobaias. O sinal ++ indica que os dois pesquisadores identificaram um leve desconforto na cobaia, + - indica que o primeiro
identificou desconforto leve e o segundo identificou desconforto severo, - + indica que o primeiro identificou desconforto
severo e o segundo desconforto leve, e - - indica que ambos identificaram desconforto severo. O sinal "m" indica cobaia do sexo
masculino e "f" indica cobaia do sexo feminino:
COBAIA 1 2 3 4 5 6 7 8 9 10 11 12 13 14
TE 2,1++ 0,5-- 1,0-+ 0,8-+ 1,0-- 2,0+- 1,0+- 1,8++ 0,8++ 2,0++ 1,1-+ 2,1-+ 5,0-+ 6,0-+
m m f f m f f m f f m m m f
Idade 47 31 30 34 48 29 30 28 30 35 51 40 30 27
(a). Esboçar o diagrama de dispersão da TE e Idade. Calcule e interprete o valor do coeficiente de correlação Linear de Pearson
entre as variáveis. Informe as três condições que os dados devem obedecer para o coeficiente calculado ter consistência
estatística. Que condições foram violadas? (b). Calcule e interprete o valor do coeficiente de correlação ordinal de Spearman
entre as variáveis e o coeficiente de correlação bisserial de pontos entre a TE e o sexo da cobaia. No calculo do coeficiente de
Spearman adote a ordenação natural. (c). Obter a equação de regressão linear simples da variável TE sobre a Idade. Interprete o
valor do coeficiente de determinação e da declividade da função ajustada. Informe o intervalo de regressão e estime a TE de
uma cobaia com 50 semanas. (d). Ajuste os dados a uma regressão exponencial e uma regressão potência da variável TE sobre
Idade. Interprete o valor do coeficiente de determinação de cada um dos modelos ajustados. Estime o TE para uma cobaia de 50
semanas para cada um dos ajustes.

PROBABILIDADE.

(17). Dê exemplos de experimentos aleatórios que poderiam ser realizados em sua área. Exiba, para cada experimento, o espaço
amostra e exemplos de evento elementar, evento impossível, evento certo, união de eventos, interseção de eventos, eventos
complementares, eventos mutuamente exclusivos e eventos independentes.

(18). Construa o espaço amostral dos seguintes experimentos (a) Lançamento de uma moeda e registro do resultado obtido; (b)
Lançamento de um dado e registro da face resultante (c) Lançamento de dois dados e registro da face resultante (d) Seleção
casual de uma lâmpada de um estoque e avaliação de sua duração (e) Contabilizar o número de partículas de poeira que chegam
a uma janela das 11 as 12 horas (f) Selecionar ao acaso três peças de um estoque e avaliar se ela está adequada para a venda.

(20). Considerando experimento "b" da questão 18 enumere os elementos dos eventos: A ={sair face par}, B={sair face menor
que 3}, C={sair face maior que 10}, A , AB, AB, (AUB) , A  B e S-A,
c c c c

(21). Considerando a definição clássica de probabilidade calcule (a) a probabilidade de cada um dos eventos referidos no
exercício 20 e a probabilidade do evento A ocorrer se B ocorreu. (b) a probabilidade se selecionarmos, ao acaso, uma figura de
um baralho com 52 cartas (c) a probabilidade de selecionarmos, ao acaso, um conjunto com seis dos 50 primeiros números
naturais (d) a probabilidade de, em um grupo com 50 pessoas, no mínimo, duas delas fazerem aniversário no mesmo dia se o
grupo tem 50 pessoas e nenhuma delas faz aniversário em ano bissexto.

(22). Em uma residência a probabilidade do aparelho de TV e do aparelho de Som estarem operacionais daqui a 30 anos é de 4/5
e 3/5 respectivamente. Supondo que a operacionalidade de um não depende da operacionalidade do outro, qual é a
probabilidade de daqui a 30 anos (a) tanto a TV como o Som estejam operacionais? (b) Somente a TV estar operacional? (d) Pelo
menos um dos aparelhos estar operacional? (e) A probabilidade do Som estar operacional assumindo que a TV estará
operacional?

(23). Dois amigos marcam um almoço entre 12 e 13 horas. Dada a impossibilidade de se prever exatamente a que horas
chegaram, eles concordam que o primeiro que chegar espera o outro por 15 minutos e, caso este não chegue, ele faz os
pedidos. Estime a probabilidade dos amigos fazerem o pedido juntos.

(24). Em uma amostra com 500 residências familiares de uma cidade identificamos residências com Sérios Problemas nas
Instalações Elétricas (SPIE), 25 residências onde o chefe de família tinha Nível Superior (NS), 15 residências com Alto Consumo
de Eletricidade (ACE), 3 residências com SPIE e NS, 5 com SPIE e ACE, 6 com NS e ACE e 2 com SPIE, NS e ACE. (a) Quanto por
cento das residências apresentam SPIE? Apresentam SPIE e NS? Apresentam SPIE ou NS? Apresentam pelo menos uma das 3
características referidas? Apresentam a característica SPIE dado NS? (b) As características SPIE e NS podem ser consideradas
eventos independentes? Mutuamente exclusivos? Justifique.

(25). Em uma pesquisa de opinião, em uma comunidade, envolvendo o consumo de três marcas de um dado produto (A, B e C) x
pessoas consomem a marca A, 30 a B, 25 a C, 10 A e B, 8 B e C, 5 A e C, 2 A, B e C. Se x é o número de anagramas da palavra
PROVA e 10 pessoas não consomem qualquer das marcas referidos qual a probabilidade de uma pessoa, selecionada ao acaso,
na comunidade (a) consumir somente a marca A? (b) consumir a marca A dado que ele não consome C e nem consome B? (c)
consumir, no mínimo, duas das marcas referidas se sabemos que ele não consome a marca A.

(26). O gráfico a seguir exibe um sistema onde um sinal elétrico é emitido do ponto E, corre pela malha e pode chegar ao ponto
S, desde que as portas Pa, Pb e Pc permitam a passagem do sinal. Assumindo que as portas operem de forma independente e
que tenham a mesma probabilidade “r” de permitir a passagem do sinal (a) calcule a probabilidade do sinal chegar a “S” (b) Se
sabemos que o sinal chegou a “S”, qual a probabilidade da porta A ter dado passagem?

Pa Pb
E S

Pc

(27). Estima-se que 20% dos componentes eletrônicos que uma empresa comercializa tem origem na fábrica A, 30% na B e 50%
na C. Se a proporção de componentes defeituosos que cada fábrica produz é de 2%, 3% e 5%, e um componente é selecionada
ao acaso na empresa, qual a probabilidade do componente (a) ser defeituoso? (b) ser defeituoso se sabemos que ele veio da
fábrica A? (c) ter vindo da fábrica A se sabemos que ele é defeituoso?
(28). A qualidade de 220 dispositivos foi avaliada com base em um teste padrão (TP) e em um novo teste (NT), mais barato e
rápido que o TP. Após a avaliação, 25 dispositivos foram considerados defeituosos e 80 foram considerados adequados por
ambos os testes. Se 155 dispositivos foram considerados adequados pelo NT, estime a prevalência de dispositivos defeituosos; a
sensibilidade, a especificidade e os valores preditivos do NT.

(29). Um estudo envolvendo risco de acidentes elétricos em domicílios mostrou que, em um dado país, 20% das residências
apresentam Sérios Problemas de Segurança Elétrica (SPSE). Um teste rápido para avaliar a segurança das residências indicou que
85% das residências SPSE se apresentaram positivas para SPSE, enquanto que 70% das residências não SPSE se apresentaram
negativas para SPSE. Considerando a definição dada para Sensibilidade, Especificidade e Valores Preditivos de um teste
diagnóstico calcule (a) a Sensibilidade e a Especificidade do teste. (b) Os valores preditivos do teste.

(30). O lactato é um subproduto do metabolismo da glicose e seu aumento no sangue tem sido associado ao agravamento das
condições clínicas de pacientes em terapia intensiva. Alterações no nível de lactato, no momento da admissão de pacientes, têm
sido usadas para estabelecer o risco de óbito do paciente. A tabela a seguir exibe, em uma amostra com 1391 pacientes
atendidos em um pronto socorro, o numero de pacientes que morreram ou sobreviveram de acordo com o nível de lactato (em
mmol/l) observado no momento que o paciente deu entrada.
Lactato (mmol/l) Mortos Sobreviventes (a) Calcule a sensibilidade e a especificidade para cada nível de lactato
>0 126 1265 (b) Com base nas medidas calculadas no quesito anterior, construa a
>1 114 996 curva ROC, calcule a AUROC e identifique o melhor ponto de corte
>1.5 81 591 para um teste baseado no nível de lactato no momento de chegada
ao pronto socorro.
>2 58 329
(d) Calcule e interprete o valor do LR+ e do LR-
>3 37 131
(e) Como você interpretaria o valor da AUROC?
>5 19 27
(f) Qual é o critério diagnóstico sugerido pelos resultados?
>25 0 0

(31). A tabela a seguir exibe, em uma amostra com 1200 residências, o número de residências que já apresentou Pane Elétrica
Grave (PEG) de acordo um Escore de Descuido com o Uso dos Equipamentos Elétricos (EDUEE). O EDUEE varia de 0 a 10. Quanto
maior o valor, maior o risco de pane elétrica grave. a) Calcule a sensibilidade e a especificidade para cada nível EDUEE
EDUEE PEG Não PEG (b) Com base nas medidas calculadas no quesito anterior, construa a
>0 150 1050 curva ROC.
>1 100 900 (d) Calcule e interprete o valor da AUROC
>2 80 500 (e) Identifique o melhor ponto de corte para um teste baseado no
nível de EDUEE.
>3 50 300
(d) Calcule e interprete o valor do LR+ e do LR-
>4 10 29
(f) Qual é o critério diagnóstico sugerido pelos resultados?
>5 0 0

(32). Considere a variável aleatória X contabiliza o número de caras no lançamento de duas moedas equilibradas.
(a) Determine o domínio, a função probabilidade e a função repartição para a variável X (b) Calcule o valor esperado, a variância
e o desvio padrão de X

(33). Em um jogo de dados você ganha 1 real, por ponto obtido, se sair face 4 ou 6; ganha 2 reais, por ponto obtido, se sair face
2 ou 3 e paga 5 reais, por ponto obtido, se sair 1 ou 5. Se X é a variável aleatória que descreve seus ganhos no jogo (a)
Determine o domínio, a função probabilidade e a função repartição de X (b) Calcule o valor esperado, a variância e o desvio
padrão de X (c) Podemos dizer que o jogo é "honesto"? Justifique sua resposta.

(34). Em uma amostra com 500 carros de uma mesma marca e idade identificamos 90 carros com o problema A, 25 com a B, 15
com a C, 3 com A e B, 5 com A e C, 6 com B e C, e 2 com A, B e C. (a) Se selecionarmos ao acaso um dos 500 carros, qual a
probabilidade dele apresentar o problema A se sabemos que ele tem o problema B ou C? (b) Se X é a variável aleatória que
descreve o número de carros na amostra que não apresenta o problema A e nem o problema B, calcule P(X=40) se, na
população de onde extraímos a amostra, 94% dos carros apresentam o problema A ou o B.
17
(35). Em uma amostra com 0,3 mg de Urânio 235 existem, aproximadamente, 7,6 x 10 átomos. A probabilidade do núcleo de
-18
cada átomo da amostra se desintegrar e emitir uma partícula alfa em um segundo é de 4,0 x 10 . Seja N a variável aleatória
que descreve o "número de emissões em um segundo" e X a variável aleatória que descreve o "tempo entre emissões".
(a) Calcule P(N=2) e P(X>2) (b) Determine E(X), DP(X) e o primeiro quartil de X.

(36). Em uma empresa quebram, em média, 3 máquinas por mês. Qual a probabilidade de quebrarem, exatamente, sete
máquinas (a) no próximo mês (b) no próximo semestre (c) na próxima semana.
(37). Suponha que 3% das peças produzidas por uma empresa apresentam problemas. Calcule a probabilidade de, exatamente,
5 peças, em uma amostra com 100 peças, apresentarem problema (a) usando a distribuição binomial (b) usando a distribuição
de Poisson.

(38). Se X é uma variável contínua com f.d.p dada por f(x) = 1/4 se x  [1, 5] e f(x) = 0 se x [1, 5], calcule E(X), V(X) e determine
F(x).

(39). Para que valores de k a função f, definida por: f(x) = kx se x  [0, 1] e f(x) = 0 se x  [1, 5], é uma fdp? Qual é o valor de
P(1/3 <x< 2)

(40). Um componente eletrônico tem duração (em horas) definido pela variável aleatória X. Se E(X) = 1000 (a) construa a fdp de
X (b) calcule a probabilidade de um componente apresentar falha após 1500 h (c) calcule a probabilidade de um componente
apresentar falha entre 1500 e 2000 horas de operação (d) determine k tal que F(k) = 0,25

(41). Se no sistema a seguir os componentes c1, c2 e c3 operam de forma independente e cada um deles tem confiabilidade "r"

C1
1

C2 C3
1 1
(a). Qual é a confiabilidade do sistema? (b). Qual confiabilidade do sistema se os componentes encontram-se dentro do seu
período de vida útil e o tempo médio entre falhas de cada componente é de 1000 horas. (c) Qual a confiabilidade do sistema se
cada componente tem tempo médio entre falhas de 1000 horas com desvio padrão de 300 horas e eles se encontram fora do
seu período de vida útil?

(42). Se no sistema do exercício 40 os componentes têm, respectivamente, confiabilidades r1, r2 e r3 qual é a confiabilidade do
sistema se C1 está fora de seu período de vida útil e apresenta tempo médio entre falhas de 1000 horas com desvio padrão de
300 horas; C2 está dentro do seu período de vida útil e apresenta tempo médio entre falhas de 1000 horas; e r3 = 0,75.

(43). Resolva as questões: (a) Ao examinarmos a farmacocinética de um medicamento usado no tratamento da diarréia neonatal
de leitões concluímos que ele leva, em média 3,6 horas (com desvio padrão de 0,4 horas) para ser completamente absorvido
pelo organismo de um leitão. Supondo que o tempo de absorção, X, tem distribuição Normal. Qual é o menor tempo dentre os
5% maiores tempos de absorção? Qual a probabilidade de um leitão levar menos de 0,65h para eliminar o medicamento? (b).
Em uma amostra com 100 leitões, dos quais 34 são fêmeas, identificamos uma concentração média de uma dada substância no
sangue dos leitões de 4,25 g/L com desvio padrão de 7,5 g/L. Construir e interpretar o IC(95,44%) para a concentração média da
substância no rebanho de leitões que deu origem a amostra e o IC(95%) para a proporção de leitoas no referido rebanho.

(44) Considere as características: A=país com saúde econômica aceitável, B= país com saúde mental aceitável e C = país é uma
república presidencialista. Se em uma amostra com 44 países, identificamos 35 países com a característica A; 23 com a B; 24
com a C; 19 com A e B; 19 com A e C; 14 com B e C, e 11 com A, B e C. (a). Estime, pontualmente, a probabilidade de um país
membro da ONU, selecionado ao acaso, não apresentar nenhuma das três características referidas se sabemos que ele não
apresenta a característica C? (b). Supondo que a variável Consumo de Água (CMAG) dos países tenha distribuição
aproximadamente normal com média de 0,53 e desvio padrão de 1,32 milhões de metros cúbicos, qual deve ser o maior CMAG
dentre as 15% menores? Qual é a probabilidade de um dos países apresentar CMAG inferior a 1 milhão de metros cúbicos? (c)
Com base em um IC95% (com fator de correção) para a prevalência de repúblicas presidencialistas afiliadas à ONU teste a
hipótese de que tal prevalência é de 51%. (d) Se, na amostra de países, o Desperdício de Alimentos (DALIM) médio é de 21,7
com desvio padrão de 52,1 mil toneladas, com um IC de 95%, teste a hipótese de que o DALIM médio dos países listados é de
aproximadamente 20 mil toneladas. (e). A tabela a seguir exibe informações sobre o Risco Relativo e o Odds Ratio quando
consideramos SE1A como variável de agrupamento e SM1A como variável de desfecho. SE1A é a dicotomia onde 1 indica saúde
econômica aceitável, SM1A é uma dicotomia onde 1 indica saúde mental aceitável. A tabela também exibe o Kappa com o seu
correspondente erro padrão. Interprete o valor do RR (e de seu IC95%) para o desfecho “país com saúde mental aceitável”.
Com 95% de confiança podemos dizer que as variáveis SE1A e SMA1A estão
associadas? Com base no IC de 95,44% para o Kappa populacional podemos
dizer que os diagnósticos baseados nas variáveis SE1A e SM1A são
concordantes? Justifique suas respostas. (f). Assumindo que as variáveis
SE1A e SM1A são testes diagnósticos para a saúde dos países calcule a
sensibilidade e o valor preditivo positivo da SE1A se SM1A for considerado o
"padrão ouro", o código 0 de SM1A indicar "pais doente" e o código 0 de
Kappa =0,066 com erro padrão de 0,125 SE1A indicasse "país positivo para doença"?
View publication stats

Você também pode gostar