Você está na página 1de 5

Análise de Dados

import pandas as pd

tabela = pd.read_excel("Estudo de Mercado (Respostas).xlsx")

1. Analise Público-Alvo
1. Tabela 1 (Idade)
idade = tabela["Qual é a sua idade?"].value_counts()
idade["24-26"] = 0

Total de Elementos:

total_elementos = idade.sum()
total_elementos

74

tabela1 = pd.DataFrame(idade)

Frequência Relativa (%)

tabela1['Freq. Relativa %'] =


round(tabela1['count']*100/total_elementos, 1)

tabela1.sort_index(inplace=True)

tabela1

count Freq. Relativa %


Qual é a sua idade?
15-17 5 6.8
18-20 57 77.0
21-23 4 5.4
24-26 0 0.0
27+ 8 10.8

Tabela de Frequências Final:

tabela_geral = pd.DataFrame({"Freq. Abs (Ni)" : tabela1['count'],


"Freq. Rel.(%)": tabela1['Freq. Relativa %']})

tabela_geral
Freq. Abs (Ni) Freq. Rel.(%)
Qual é a sua idade?
15-17 5 6.8
18-20 57 77.0
21-23 4 5.4
24-26 0 0.0
27+ 8 10.8

Moda

moda_idade = tabela_geral['Freq. Abs (Ni)'].max()


print("A moda de idades é a faixa etária 18-20, com", moda_idade,
"registos.")

A moda de idades é a faixa etária 18-20, com 57 registos.

1. Tabela 2
genero = tabela["Género"].value_counts()

t = pd.DataFrame(genero)
t['fi'] = round(t['count']*100/total_elementos, 1)
t_final = pd.DataFrame({"ni" : t['count'], "fi" : t['fi']})
t_final

ni fi
Género
Feminino 39 52.7
Masculino 34 45.9
Não Binário 1 1.4

1. Tabela 3
grau_ensino = tabela["Qual o grau de ensino que
frequenta?"].value_counts()

t2 = pd.DataFrame(grau_ensino)
t2['fi'] = round(t2['count']*100/total_elementos, 1)
t_final2 = pd.DataFrame({"ni" : t2['count'], "fi" : t2['fi']})
t_final2

ni fi
Qual o grau de ensino que frequenta?
Licenciatura 56 75.7
Secundário 14 18.9
Mestrado 2 2.7
Nenhum 2 2.7
2. Análise Desempenho Académico
1. Análise Nível Desempenho

Média:

Media = tabela["Numa escala de 0 a 10 como classificaria o seu


desempenho académico? (Se tiver uma média de 0 a 20 pode dividi-la por
2)"].mean()
Media

7.135135135135135

Mediana

Mediana = tabela["Numa escala de 0 a 10 como classificaria o seu


desempenho académico? (Se tiver uma média de 0 a 20 pode dividi-la por
2)"].median()
Mediana

7.0

Tabela nível de Desempenho

desempenho = tabela["Numa escala de 0 a 10 como classificaria o seu


desempenho académico? (Se tiver uma média de 0 a 20 pode dividi-la por
2)"].value_counts()
desempenho["1"] = 0
desempenho["2"] = 0
desempenho["3"] = 0
desempenho["10"] = 0
tabela1 = pd.DataFrame(desempenho)
tabela2 = pd.DataFrame({"Freq. Abs." : tabela1['count']})

tabela2.reset_index(inplace=True)
tabela2.index += 1
tabela2.drop(columns=['Numa escala de 0 a 10 como classificaria o seu
desempenho académico? (Se tiver uma média de 0 a 20 pode dividi-la por
2)'], inplace=True)

Variancia, Desvio Padrão, Coeficiente Variação

tabela2['(xi-Media)^2'] = (tabela2.index - Media)**2


Variancia = tabela2['(xi-Media)^2'].sum()/(total_elementos - 1)
Desvio_Padrao = Variancia**(1/2)
print("Variancia","=", Variancia)
print("Desvio Padrão","=", Variancia**(1/2))
print("CV","=", Desvio_Padrao/Media * 100)
tabela2
Variancia = 1.4963927274182736
Desvio Padrão = 1.2232713220779245
CV = 17.14433292306182

Freq. Abs. (xi-Media)^2


1 30 37.639883
2 26 26.369613
3 6 17.099343
4 6 9.829072
5 4 4.558802
6 2 1.288532
7 0 0.018262
8 0 0.747991
9 0 3.477721
10 0 8.207451

Minimo, Máximo, Quartis e Amplitudes

Resto = tabela["Numa escala de 0 a 10 como classificaria o seu


desempenho académico? (Se tiver uma média de 0 a 20 pode dividi-la por
2)"].describe()
print("Mínimo : 4 ; Máximo : 9")
print("Quartis : 25%, 50% (Mediana), 75% ;")
print("Média = mean ;")

pd.DataFrame(Resto)

Mínimo : 4 ; Máximo : 9
Quartis : 25%, 50% (Mediana), 75% ;
Média = mean ;

Numa escala de 0 a 10 como classificaria o seu desempenho


académico? (Se tiver uma média de 0 a 20 pode dividi-la por 2)
count 74.000000

mean 7.135135

std 1.101982

min 4.000000

25% 7.000000

50% 7.000000

75% 8.000000

max 9.000000
A = Resto['max']-Resto['min']
print("Amplitude Total = Máximo -
Mínimo","=",Resto['max'],"-",Resto['min'],"=",A)
A

Amplitude Total = Máximo - Mínimo = 9.0 - 4.0 = 5.0

5.0

AI = Resto['75%']-Resto['25%']
print("Amplitude Interquartil = 3ºQ -
1ºQ","=",Resto['75%'],"-",Resto['25%'],"=",AI)
AI

Amplitude Interquartil = 3ºQ - 1ºQ = 8.0 - 7.0 = 1.0

1.0

2.Análise da relação entre vício e desempenho

vicio_desempenho = tabela["Como considera que esses vícios afetam o


seu desempenho académico?"].value_counts()

t = pd.DataFrame(vicio_desempenho)
t['fi'] = round(t['count']*100/total_elementos, 1)
t_final = pd.DataFrame({"ni" : t['count'], "fi" : t['fi']})
t_final

ni fi
Como considera que esses vícios afetam o seu de...
Não alteram 31 41.9
Pioram 29 39.2
Melhoram 14 18.9

Você também pode gostar