IDF.NORMAL: 1) probabilidade igual a um nº dado de x exceder μ+ zσ X N (μ+ σ) , então Z= ~ N(0,1), logo
σ P ( X > μ+σ )=P( Z> z) Código: IDF.NORMAL (1-prob, µ, σ ) 2) determinar z de modo a que o intervalo [μ−zσ , μ+ zσ ] contenha x% de probabilidade X−μ X N ( μ+ σ) , então Z= ~ N(0,1), pretende-se z≥ 0 tal que P ( μ−zσ < μ+ zσ )=P(−z< Z < z) σ Código: IDF.NORMAL (prob + (1-prob)/2,0,1) 3) determinar os percentis, ou seja, Z tal que P ( Z ≤ z ) em que X N ( μ+σ ) Código: IDF.NORMAL (prob,1,0) 4) determinar os quartis, ou seja X tal que P ( X ≤ x ) emque X N (μ+σ ) CDF.NORMAL: 1) calcular o valor de uma probabilidade acumulada Código: CDF.NORMAL (x, μ , σ ¿ NOTA: quando se fala em percentis, valores em %, colocar os valores com casa decimais no SPSS TESTES DE HIPÓTESES – se p for menor que a significância (0.05) então, rejeita-se a hipótese nula; se p for maior que a significância aceita-se a hipótese nula * Teste t de student para variáveis aleatórias independentes - Variáveis quantitativas e variáveis independentes - Comparar as médias H 0 :μ 1=μ 2 e H 1: μ 1 ≠ μ 2 OU μ 1≠μ 2 – o primeiro é bilateral e o segundo é unilateral - Existem 2 testes t de student para amostras independentes A) Teste t de student para amostras independentes assumindo-se a homogeneidade das variáveis B) Teste t de student para amostras independentes não se assumindo a homogeneidade das variáveis 1º passo: testar a normalidade e teste de levene para a homogeneidade das variâncias SÓ SE ACEITA A NORMALIDADE SE AMBOS OS GRUPOS TIVEREM P>0.05; Basta um não ter para se rejeitar a normalidade NO SPSS: analyse + descritive + explore + variável principal em dependente list e variável dos grupos em factor list (para separar os 2 grupos) Em plots assinalar «normality plots ...» e assinalar, em spread vs level with levene test, untransformed Se p>α , então assume-se a normalidade Primeira linha para o teste de Levene (Based on Mean): se p>α então assume-se a homogeneidade das variâncias 2º passo: efetuar o teste Analyse + compare means + independt – sample T teste; variável principal em independent + grupos em group variables; define groups e atribuir os mesmos códigos numéricos Se as variâncias forem iguais: «equal variances assumed» Se as variâncias forem diferentes: «equal variances not assumed» Se p>α não se rejeita a hipótese nula; se p<α rejeita-se a hipótese nula Resposta modelo: O teste mais adequado é o teste t de student para amostras independentes assumindo-se/não se assumindo, a homogeneidade das variáveis (Teste de Levene, p=?) pois pode assumir-se que (variável) é normalmente distribuída (Teste de Shapiro-Wilk, p=? para o grupo x1 e p=? para o grupo x2). A partir das amostras disponíveis obtiveram-se as médias X1 (DP=?) e X2 (DP=?) dos grupos 1 e 2 significativamente. Estas amostras evidenciam/não evidenciam uma diferença estatisticamente significativa entre as médias 1 e 2 dos grupos 1 e 2 (T(X)=?, P=?). SE O TESTE FOR UNILATERAL: DIVIDIR p POR 2 * Teste de Mann-Withney - Variáveis quantitativas ordinais e para amostras independentes – caso seja rejeitada a normalidade em pelo menos um dos grupos utiliza-se este teste não paramétrico H 0 : F 1=F 2 e H 1: F 1 ≠ F 2OU F 1≠F 2 No SPPS: analyse + nonparametric test + legacy + 2 independent T samples; variável principal em independente + variável dos grupos em group variable; define grouping; em exact selecionar exact (dá p bilateral e unilateral) Resposta Modelo: Com as amostras disponíveis obtiveram-se as medianas X (AIQ=?) e X (AIP=?) para (variável) e grupos respetivamente. As amostras evidenciam que se encontrou/não se encontrou uma diferença estatisticamente significativa entre as duas variáveis nos grupos 1 e 2 (U=?, p=?) * Teste t de student para amostras emparelhadas - Variáveis quantitativas e amostra emparelhada; 1º passo: testar a normalidade - Criar uma amostra das diferenças entre o antes e o depois: Transform + compute NO SPSS: variable + ANTES – DEPOIS ; Analyse + descritive + explore + nova variável das diferenças em dependente list; em plots assinalar normality plots 2º passo: efetuar o teste Analyse + compare means + paired samples T-test; em variable 1 colocar «antes» e em variable 2 colocar «depois» Atenção à ordem do antes e do depois: deve aparecer de acordo com o que está na H1 (PE, se u1>u2 significar que o antes é maior que o após então, deve ser colocado antes e depois nessa ordem) Resposta Modelo: O teste mais adequado é o teste t de student para amostras emparelhadas pois verificou-se que se pode assumir normalmente distribuída a distribuída a diferença dos valores (variável) (Teste de Shapiro-Wilk, p=?) Através das amostras disponíveis verificou-se uma diminuição/aumento/não existem diferenças estatisticamente significativas da média da (variável) do grupo 1, sendo esse valor igual a X (DP=?), enquanto que a média da variável do grupo 2 foi de X (DP=?). Estas amostras evidenciaram uma diminuição/aumento/não existem diferenças estatisticamente significativas da variável no grupo 1 e 2 respetivamente (t(df)=x, p=?) * Teste de Wilcoxon - Variáveis qualitativas; amostras emparelhadas; não requer a normalidade mas sim que a diferença dos 2 seja simétrica (ou seja, o valor absoluto do skeness deve ser menor que o sobro do erro padrão) H 0 : F 1=F 2 e H 1: F 1 ≠ F 2OU F 1≠F 2 NO SPSS: analyse + nonparametrical test + legacy + related samples (variable 1: antes e variable 2: depois); em exact assinalar exact Resposta Modelo: Com as amostras disponíveis obtiveram-se as medianas X (AIQ=?) e X (AIP=?) para (variável) e grupos respetivamente. Estas amostras evidenciaram que (variável) foram maiores/menor/existem ou não diferenças estatisticamente significativas que (variável) (Z=?, p=?). * Teste do qui-quadrado - Variáveis categóricas (nominais ou ordinais) ou quantitativas discretas com poucos valores; Exemplo 1: será que a variável X é uniformemente distribuída 1 H 0 : p 1=p 2=p 3= e H 1: probabilidade de pelo menosuma é diferente 3 NO SPSS: analyse + nonparametric test + legacy + chi-square + variável em test variable Resposta Modelo: Com a amostra disponível verificou-se que a distribuição da variável é/não é uniformemente distribuída ( 2 χ ( df )=? , p=? ¿ Exemplo 2: verificar se uma distribuição de probabilidade se pode ajustar a uma variável H 0 : p 1=0.3 e p 2=0.6 e p 3=0.1/ H 1: p 1≠ 0.3 ou p 2≠ 0.6 ou p 3 ≠ 0.1 NO SPSS: analyse + nonparametrical test + dialogs + chi-square + variável em teste em test variable; em expected values, selecionar values e colocar os códigos numéricos por ordem NOTA: NÃO ESQUECER – SE O VALOR DE PROVA FOR MAIOR QUE 0.05 (SIGNIFICÂNCIA) ENTÃO NÃO SE REJEITA A HIPÓTESE NULA; SE O VALOR DE PROVA FOR MENOR QUE 0.05 ENTÃO REJEITA-SE A HIPÓTESE NULA. ADEQUAR A REPOSTA. NÃO ESQUECER DE ELR BEM O ENUNCIADO PARA VER SE É DIFERENTE, MAIOR OU IGUAL E ADPTAR O VALOR DE PROVA CONSOANTE O TESTE SEJA BILATERAL OU UNILATERAL Métodos de amostragem * Amostragem aleatória simples: lista de todos os elementos da população; pré-seleção através do computador (sobretudo para grandes amostras); indivíduos selecionados com reposição – independência; todos os indivíduos têm a mesma probabilidade de participar no estudo; cada uma das sequências vai ter a mesma distribuição de probabilidades na população * Amostragem aleatória sistemática: unidades estatísticas ordenadas com algum critério; Exemplo: obter uma amostra aleatória dos indivíduos com x doença que estão registados no hospital Y através do processo hospitalar; os indivíduos são escolhidos por exemplo 1 em cada 10 ou 1 em cada 5 * Amostragem aleatória estratificada: a população vai ser dividida inicialmente por estratos (sexo, €); em cada estrato vai ser obtida uma amostra através da amostragem simples na mesma proporção que o estrato vale na população * Amostragem aleatória agrupada: exemplo – estudar a população estudantil do 3º ciclo do ensino básico no distrito de CB onde existem 20 escolas; supondo que os grupos de alunos são homogéneos nas suas características, então para se obter uma amostra escolhemos aleatoriamente 2 escolas das 20 *Amostragem aleatória multietápica: aplica-se a agrupada mais do que uma vez; por exemplo dentro das 20, escolher duas escolas e dentro dessas 2 escolas escolher 2 turmas de alunos NOTA1: NO TESTE, QUANDO USAR O IDF E O CDF FAZER AS COISAS SEMPRE 2 VEZES NOTA2: SE PEDIR UM INTERVALO DE CONFIANÇA A 95% PARA A DIFERENÇA DAS MÉDIAS UTILIZAR O QUE APARECE LOGO NO OUTPUT QUANDO FAZEMOS O TESTE T DE STUDENT PARA AMOSTRAS INDEPENDENTES NOTA3: NOS TESTES T D STUDENT FAZER A PARTE DESCRITIVA COM MÉDIA E DESVIO PADRÃO; PARA OS OUTROS USAR MEDIANA E AMPLITUDE INTERQUARTIL