Você está na página 1de 2

Levy Marques Nunes

Teste para 2 amostras independentes


In [ ]: import pandas as pd

from scipy import stats

In [ ]: # notas = pd.read_clipboard()

In [ ]: # notas.to_csv("notas.csv")

In [ ]: notas = pd.read_csv("notas.csv", index_col=0)

In [ ]: notas.head()

Out[ ]: Sujeito Genero Escola Posicao_Sala Nota_Biol Nota_Fis Nota_Hist

0 1 M Privada Fundos 8.1 4.6 2.9

1 2 F Privada Fundos 5.3 4.9 6.4

2 3 M Publica Fundos 2.9 3.7 3.1

3 4 M Publica Fundos 3.7 3.8 4.9

4 5 F Publica Fundos 4.4 4.2 4.9

In [ ]: notas_homem = notas[notas["Genero"] == "M"][["Nota_Biol", "Nota_Fis", "Nota_Hist"]]


notas_mulher = notas[notas["Genero"] == "F"][["Nota_Biol", "Nota_Fis", "Nota_Hist"]


notas_fundo = notas[notas['Posicao_Sala'] == 'Fundos'][["Nota_Biol", "Nota_Fis", "N


notas_frente = notas[notas['Posicao_Sala'] == 'Frente'][["Nota_Biol", "Nota_Fis", "

notas_publica = notas[notas["Escola"] == 'Publica'][["Nota_Biol", "Nota_Fis", "Nota


notas_privada = notas[notas["Escola"] == 'Privada'][["Nota_Biol", "Nota_Fis", "Nota

In [ ]: # mann whiteney u test para verificar se as notas são iguais

# Biologia

genero_biol = stats.mannwhitneyu(notas_homem["Nota_Biol"], notas_mulher["Nota_Biol"


posicao_biol = stats.mannwhitneyu(notas_fundo["Nota_Biol"], notas_frente["Nota_Biol
escola_biol = stats.mannwhitneyu(notas_publica["Nota_Biol"], notas_privada["Nota_Bi

# Física

genero_fis = stats.mannwhitneyu(notas_homem["Nota_Fis"], notas_mulher["Nota_Fis"])


posicao_biol = stats.mannwhitneyu(notas_fundo["Nota_Fis"], notas_frente["Nota_Fis"
escola_biol = stats.mannwhitneyu(notas_publica["Nota_Fis"], notas_privada["Nota_Fis

# História

genero_hist = stats.mannwhitneyu(notas_homem["Nota_Hist"], notas_mulher["Nota_Hist"


posicao_biol = stats.mannwhitneyu(notas_fundo["Nota_Hist"], notas_frente["Nota_Hist
escola_biol = stats.mannwhitneyu(notas_publica["Nota_Hist"], notas_privada["Nota_Hi
In [ ]: # montar tabela

genero = pd.Series([genero_biol, genero_fis, genero_hist], index=["Biologia", "Físi


posicao = pd.Series([posicao_biol, posicao_biol, posicao_biol], index=["Biologia",
escola = pd.Series([escola_biol, escola_biol, escola_biol], index=["Biologia", "Fís

pd.DataFrame([escola, posicao, genero])

Out[ ]: Biologia Física História

Rede 0.734201 0.734201 0.734201

Posição 0.316477 0.316477 0.316477

Genero 0.651017 0.199013 0.242188

Você também pode gostar