Você está na página 1de 23

ANÁLISE ESTATÍSTICA DESCRITIVA E APLICAÇÃO DE TESTES DE

HIPÓTESES EM GASTOS NAS UNIVERSIDADES PÚBLICAS


ESTADUAIS DO BRASIL
Antonio Leal Sobrinho, UECE, leal.sobrinho@uece.br

RESUMO
O conhecimento dos gastos nos governos é de suma importância para a aplicação
de mudanças nas ações que regem as decisões sobre o correto uso dos recursos
públicos.
Este artigo apresenta análises estatísticas descritivas de gastos nas universidades
estaduais do Brasil, no ano de 2021. Os dados coletados são de 39 universidades,
de 20 estados e Distrito Federal, de todas as 5 regiões do país. Os estados do Acre,
Rondônia e Sergipe não fazem parte do estudo por não possuírem universidades
estaduais, Amazonas, Espírito Santo, e Pará não compuseram o levantamento,
tendo em vista que os dados não foram encontrados nos respectivos Portais da
Transparência. A pesquisa revela números das medidas de tendência central,
dispersão e assimetria dos valores de gastos, bem como aplicação de testes de
hipóteses por Análise de Variância - ANOVA, que constituem forma de inferência
estatística, permitindo avaliar afirmações sobre médias de valores entre diferentes
grupos.
O maior valor de gastos foi da Universidade Estadual de São Paulo (USP), no total
de R$ 891.127.185,15. O menor valor foi de R$ 1.497.741,39 da Fundação
Universidade Aberta do DF.
A maior média de gastos encontrada para o grupo de universidades por região foi de
R$ 335.808.868.05 para a região Sudeste e menor média foi de R$ 54.965.135,73
para a região Norte.
Por meio do teste de hipótese ANOVA, não foi constatada diferença estatística, ao
nível de significância de 0,05, entre as médias de gastos das universidades por
regiões.

Palavras-chave: universidades, gastos, hipóteses, estatística, frequências,


1. INTRODUÇÃO
Desenvolvimento econômico e sociedades evoluídas e mais justas,
constroem-se por meio da educação. Em agosto de 2020 o secretário-geral da ONU,
António Guterres, declarou que “a educação é a chave para o desenvolvimento
pessoal e o futuro das sociedades. [...] É o alicerce das sociedades informadas e
tolerantes e o principal impulsionador do desenvolvimento sustentável” (Guterres,
2020).
A educação é um importante instrumento para o desenvolvimento de um
país. Magalhães (2007) afirma que a sociedade e os governantes têm reconhecido o
quanto à educação fortalece a economia de uma nação.
Como agente propulsor nesse processo de desenvolvimento, as
universidades desempenham papel preponderante, na produção de conhecimento,
pesquisa e extensão, elas são instituições criadas para atender às necessidades do
país. As universidades estaduais, objeto desse estudo, são mantidas pelos seus
respectivos estados, contando com cursos de graduação gratuitos.
As despesas com educação superior tem sido tem comum em recentes
debates por conta do contingenciamento feito sobre o orçamento de 2019, nesse
sentido o presente artigo tem como objetivo realizar uma análise estatística
descritiva com relação a gastos nas universidades estaduais, no ano de 2021,
conhecidas a partir das metodologias empregadas as medidas de tendência central
(média, moda e mediana) e as medidas de dispersão. A identificação dessas
medidas de tendência central permitem que outros valores sejam comparados a ele,
mostrando a dispersão ou o agrupamento da amostra. As medidas de dispersão são
as baseadas em percentis, ou na média (que é frequentemente conhecida como
desvio padrão).
A análise descritiva é a fase inicial deste processo de estudo dos dados
coletados. Utilizamos métodos de estatística descritiva para organizar, resumir e
descrever os aspectos importantes de um conjunto de características observadas ou
comparar tais características entre dois ou mais conjuntos.
A descrição dos dados também tem como objetivo identificar anomalias,
até mesmo resultante do registro incorreto de valores, e dados dispersos, aqueles
que não seguem a tendência geral do restante do conjunto.
A análise da distribuição dos dados determina se os dados têm uma
tendência central forte ou fraca com base na sua dispersão. Quando a distribuição
dos dados é simétrica e a média = mediana = moda, diz-se que os dados têm uma
distribuição normal. Todas essas medidas serão apuradas, nessa pesquisa, por
meio do uso de bibliotecas da linguagem de programação R, no ambiente RStudio.
O presente artigo apresenta ainda, aplicação de testes de hipóteses
ANOVA, usados para determinar se há uma diferença significativa entre as médias
de grupos em alguma determinada característica.
No caso em estudo, as hipóteses levantadas comparam as médias de
gastos entre o grupo de universidades por regiões, para identificar se há diferença
estatística. Outra análise é o da variância, e correlação de Pearson, indicando de os
gastos tem influência, ou não, no indicador de qualidade dos cursos das
universidades, representada pela variável ICG, que é um indicador do Ministério da
Educação - MEC que avalia as formações oferecidas pelas instituições de ensino
superior no Brasil.
Segundo o Instituto Nacional de Estudos e Pesquisas Educacionais
Anísio Teixeira - INEP, dados do censo do ensino superior em 2021, mostraram que
haviam 43.085 cursos de graduação e 17 cursos sequenciais ofertados em 2.574
Instituições de Ensino Superior - IES, no Brasil. Havia ainda 2.574 Instituições de
Educação Superior no Brasil, das quais 76,9% eram faculdades. Em relação às
matrículas, haviam 8.986.554 alunos no ensino superior em 2021.
A maioria de instituições de educação superior no país são privadas. Em
2021, estas instituições representavam 87,8%, contra 12,2% públicas. De todos os
alunos matriculados em graduação em 2021, 76,9% estavam inscritos em
instituições privadas. Das 22,6 milhões de vagas em cursos de graduação
oferecidas em 2021, 21.859.441 vagas foram ofertadas pela rede privada. Dos
ingressantes em cursos de graduação, 3.452.756 eram de instituições privadas
contra 492.141 em instituições públicas.
Atualmente, existem em torno de 45 universidades estaduais no Brasil,
apesar do crescimento dos números, e do discurso de que os governos gastam
demais no setor, o Brasil ainda é um país com pouca presença no Ensino Superior
público, quando se faz a comparação com a maior parte das nações desenvolvidas.
A discussão sobre gastos por alunos nas universidades públicas se evidencia, em
face da distância entre o gasto por aluno da educação básica e o da educação
superior., o gasto por aluno da educação superior era 4,8 vezes o gasto por aluno da
educação básica, em 2011, segundo INEP.
O custo por aluno do Ensino Superior, no Brasil, é menor do que o de vários
países desenvolvidos, como os Estados Unidos, embora estatísticas apontem que
supere o de alguns outros, como Espanha e Portugal, por exemplo.. Os gastos com
educação superior no Brasil também são significativos na comparação com outros
tipos de despesa. No entanto, é preciso cuidado nessas comparações porque há
diferenças de rede, estrutura, gasto com pesquisa e perfil de alunos atendidos.
Essa pesquisa, tem como recorte temporal o ano de 2021, e subdivide-se
em cinco partes, além desta introdução. Na Metodologia são apresentados os dados
e as métodos de apuração das medidas por meio da linguagem R e seus pacotes.
Na seção Referencial Teórico são apresentados importantes conceitos e
características sobre o assunto abordado do ponto de vista da análise feita por
outros autores em outras publicações. A seguir, na seção Resultados são mostrados
códigos da linguagem R implementados e resultados obtidos para as medidas de
média, mediana, moda, amplitude, variância, desvio padrão, montagem de gráficos
e testes de hipóteses. Por fim, a última seção, Considerações Finais, traz uma
síntese de toda a pesquisa e avaliação das contribuições do estudo para o tema,
melhorias e direcionamentos futuros.

2. REFERENCIAL TEÓRICO
De acordo com o que estabelece a Constituição Federal de 1988,
educação é um direito social cujos meios de acesso devem ser proporcionados pela
União, Estados, Distrito Federal e Municípios. Trata-se de direito de todos e dever
do Estado para o desenvolvimento da pessoa, preparo para o exercício da cidadania
e qualificação para o trabalho, e será ministrada com base em alguns princípios,
dentre os quais a garantia de padrão de qualidade (Constituição Federal, 1988).
As pesquisas sobre gastos na educação não são numerosas no Brasil. A
disponibilidade ainda não muita vasta de dados talvez explique, em parte, a
existência de poucos estudos do tipo. Em geral, abrangem universidades federais e
pretendem, na maioria dos casos, verificar se os gastos com educação estão
associados ao aproveitamento no processo ensino-aprendizagem, estimando
possíveis relações entre as médias de gastos e medidas que representem
resultados em avaliações, como o Índice de Desenvolvimento da Educação Básica
(Ideb), o desempenho médio municipal dos alunos no Sistema de Avaliação da
Educação Básica (Saeb) ou o desempenho na Prova Brasil (GALVÃO, 2016, p. 34-
40).
O Manual de Contabilidade Aplicada do Setor Público (MCASP) (BRASIL,
2017) classifica o gasto público como todo dispêndio da União nas esferas
municipal, estadual e federal com materiais de consumo, contratação e pagamento
de serviços necessários para atendimento ao público ou à manutenção dos bens
públicos. O gasto público, para ser realizado de forma satisfatória, tem de seguir os
critérios da eficiência, da eficácia e da efetividade. Por isso, alguns estudos buscam
entender mais a seu respeito, bem como seus antecedentes e/ou determinantes
para verificar os fins a que se propõe (AMARAL; MENEZES-FILHO,
2008; MONTEIRO, 2015; SANTOS et al., 2021).
No Brasil, o gasto público em Educação é composto por despesas
correntes (o sistema educacional requer uso de mão de obra de professores e de
auxiliares) e despesas de capital (em geral, pode ser associada ao investimento em
infra estrutura e bens de natureza duradoura) (INEP, 2021). Vale salientar que a
despesa corrente consome uma grande parcela do investimento em Educação,
correspondente a 97%, quando analisadas às etapas do Ensino Fundamental à
Educação Superior (INEP, 2021).
Em ZOGHBI et. al (2009), os resultados mostraram que os estados com
melhor desempenho educacional não necessariamente são os mais eficientes em
termos de gastos na esfera educacional. Segundos os autores ocorrem um círculo
vicioso, em que os estados que mais precisam usar os recursos educacionais com a
finalidade de promover o seu crescimento, são os que acabam mais fazendo uso
errado dos mesmos, ficando num estagio inferior de desenvolvimento.
NASCIMENTO e VERHINE (2017), avaliam o financiamento público em
educação superior no Brasil, comparando com as médias de países-membros do
OCDE e levantando a discussão se esses gastos são suficientes para o país atingir
os desafios que enfrenta o setor.
A alocação de recursos em educação superior é tema de estudo, com
exposição sobre a teoria das finanças públicas e demais aspectos característicos da
administração pública que possibilitam conceituar o gasto público. Percorrendo-se
ainda, uma análise sobre planejamento e execução orçamentários na Universidade
de Brasília - UnB (SANTOS)
CARVALHO (2016), analisa como se dá o financiamento público na
educação superior, nos vinte e seis estados e Distrito Federal no Brasil. O artigo
mapeia se existe vinculação específica de recursos nas constituições estaduais e
como evoluíram os gastos reais relativos à manutenção e ao desenvolvimento da
educação superior estadual, no período entre 2006 a 2012.

3. METODOLOGIA
A pesquisa é de natureza descritiva, o conjunto de dados abrange valores
de gastos por universidade, obtidos nos Portais da Transparência dos respectivos
estados. O ano considerado foi 2021, tendo em vista que para o ano de 2022, os
dados ainda não estavam consolidados, nem tampouco disponibilizados.
As variáveis utilizadas na pesquisa foram:
DESCRICAO = variável que indica os nomes da universidades avaliadas
na pesquisa;
SIGLA: abreviatura dos nomes das universidades
UF: unidade da federação dentro da organização político-administrativa
do País, em que está instalada a universidade;
REGIAO: indica a região administrativa ou agrupamento das unidades da
federação,
ICG = indicador de qualidade de cursos das universidades;
GASTOS: valor de gastos realizados pelas instituições objeto do estudo.
Para melhor compressão dos dados, os mesmos são apresentados na
tabela 1.

Tabela 1: Variáveis da pesquisa


DESCRICAO SIGLA UF REGIAO IGC GASTOS (R$)
Universidade Virtual do Estado
UNIVESP SP SUDESTE 3 74.858.237,42
de São Paulo
Universidade Regional do Cariri URCA CE NORDESTE 3 119.834.232,22
Universidade Estadual Vale do
UVA CE NORDESTE 3 89.426.818,67
Acaraú
Universidade Estadual Paulista
UNESP SP SUDESTE 5 155.978.880,43
Júlio de Mesquita Filho
Universidade Estadual do
UESB BA NORDESTE 4 286.284.917,91
Sudoeste da Bahia
Universidade Estadual do Rio
UERGS RS SUL 4 100.404.903,27
Grande do Sul
Universidade Estadual do Piauí UESPI PI NORDESTE 3 203.775.454,08
Universidade Estadual do Paraná UNESPAR PR SUL 4 203.221.834,35
Universidade Estadual do Oeste
UNIOESTE PR SUL 4 99.476.251,89
do Paraná
Universidade Estadual do Norte
UENF RJ SUDESTE 5 148.672.225,56
Fluminense Darcy Ribeiro
Universidade Estadual do Norte
UENP PR SUL 4 330.049.916,17
do Paraná
Universidade Estadual do
UEMA MA NORDESTE 3 311.836.995,71
Maranhão
Universidade Estadual do
UNICENTRO PR SUL 4 225.722.611,13
Centro-Oeste
Universidade Estadual do Ceará UECE CE NORDESTE 4 281.086.316,49
Universidade Estadual de Santa
UESC BA NORDESTE 4 210.367.456,01
Cruz
Universidade Estadual de
UERR RR NORTE 3 103.569.402,88
Roraima
Universidade Estadual de Ponta
UEPG PR SUL 4 334.068.731,73
Grossa
Universidade Estadual de
UNIMONTES MG SUDESTE 3 350.100.548,40
Montes Claros
Universidade Estadual de Mato CENTRO-
UEMS MS 3 240.597.804,36
Grosso do Sul OESTE
Universidade Estadual de
UEM PR SUL 4 585.702.920,81
Maringá
Universidade Estadual de
UEL PR SUL 4 629.888.207,66
Londrina
CENTRO-
Universidade Estadual de Goiás UEG GO 3 272.326.680,26
OESTE
Universidade Estadual de Feira
UEFS BA NORDESTE 4 260.014.234,45
de Santana
Universidade Estadual de
UNCISAL AL NORDESTE 3 244.797.184,02
Ciências da Saúde de Alagoas
Universidade Estadual de
UNICAMP SP SUDESTE 5 306.768.230,47
Campinas
Universidade Estadual de
UNEAL AL NORDESTE 3 49.097.260,40
Alagoas
Universidade Estadual da Regiao
UEMASUL MA NORDESTE 2 44.248.345,57
Toacatina do Maranhao
Universidade Estadual da Paraíba UEPB PB NORDESTE 3 241.213.229,02
Universidade do Tocantins UNITINS TO NORTE 3 51.528.922,54
Universidade do Estado do Rio
UERN RN NORDESTE 3 193.438.620,95
Grande do Norte
Universidade do Estado do Rio
UERJ RJ SUDESTE 4 456.173.631,98
de Janeiro
Universidade do Estado do
UEAP AP NORTE 3 9.797.081,77
Amapa
Universidade do Estado de Santa
UDESC SC SUL 4 427.612.711,95
Catarina
Universidade do Estado de
UEMG MG SUDESTE 3 302.792.004,97
Minas Gerais
Universidade do Estado de Mato CENTRO-
UNEMAT MT 3 420.452.583,98
Grosso OESTE
Universidade do Estado da Bahia UNEB BA NORDESTE 4 521.647.269,50
Universidade de São Paulo USP SP SUDESTE 5 891.127.185,15
Universidade de Pernambuco UPE PE NORDESTE 3 660.849.270,26
Fundação Universidade Aberta CENTRO-
FUNAB DF 3 1.497.741,39
do DF OESTE
Fonte: Elaborado pelo autor

3.1 Medidas de Tendência Central


As medidas de tendência central são utilizadas na estatística para
caracterizar um conjunto de valores. tentam descrever um conjunto de dados
identificando o valor central ou “típico” desse conjunto de dados. As medidas de
tendência central mostradas aqui são duas: média e mediana.

3.2 Medidas de Dispersão


São usadas para determinar o grau de variabilidade dos elementos
numéricos com relação à sua média. As apresentadas na presente pesquisa são:
Amplitude: aplicada em casos de comparação primária. Ela equivale a
diferença entre o maior número e o menor número de um conjunto, ou seja,
encontrar a amplitude basta subtrair o menor valor do maior valor.
Variância: indica o quão distante está cada valor dos números do valor
central. Dito isso, quanto menor a variância, mais próximos os valores da média;
quanto maior a variância, mais distantes os valores estão da média.
Desvio Padrão: tal medida refere-se a raiz quadrada positiva da
variância.

3.3 Teste ANOVA


Análise de variância, ou ANOVA, é a técnica estatística que permite
avaliar afirmações sobre as médias de populações. É um teste generalizado que
permite a comparação de mais de dois grupos ao mesmo tempo para determinar se
existe uma relação entre eles. Ajuda a descobrir se a diferença nos valores médios é
estatisticamente significativa.
Para aplicação da análise de variância, são necessárias algumas
suposições, sendo elas:
 As observações são independentes, ou seja, cada elemento amostral
deve ser independente;
 Os grupos comparados apresentam a mesma variância;
 Os erros são independentes e provenientes de uma distribuição
normal com média igual a zero e variância constante.

3.4 Linguagem de Programação R


É uma linguagem de programação derivada da linguagem S (1976) e
desenvolvida por Bell Laboratories (atualmente Lucen Technologies) pelo estatístico
John McKinley Chambers e colaboradores, tendo sido implementada na década de
90 pelos estatísticos Ross Ihaka e Robert Gentleman, e liberada oficialmente como
linguagem R, em 1995. Sua primeira versão estável foi em 2000 e tem sido
constantemente atualizada.
O R é uma linguagem interpretada e procedural para estatística e
mineração de dados, além de um poderoso ambiente para produção de gráficos.
Possui milhares de funções estatísticas. É um projeto open source (código aberto),
extremamente bem sucedido e muito popular, tanto no meio acadêmico como
também corporativo.
Possui paradigma Orientado a Objetos (OO), sendo uma linguagem
capaz de lidar com variedade de tipos e grande volume de dados.

3.5 Estatística Descritiva


A estatística descritiva trabalha com procedimentos e técnicas que
permitem colher, organizar e descrever os dados (SANTOS, 2007; FREUND, 2009).
É uma forma geral de se ver a variação de valores/dados que foram sintetizados. É
um dos fundamentos mais básicos de análise, visa sumarizar e descrever qualquer
conjunto de dados. Tem como principal preocupação a síntese dos dados de forma
direta. Oferece a compreensão em tempo real dos acontecimentos.
A análise descritiva possui um papel extremamente necessário dentro do
processo de investigação. Ela oferece uma base de conhecimento sólido que pode
servir como um suporte para análises posteriores, contribuindo para o alcance de
diagnósticos mais confiáveis e para seguir nas etapas de analises mais complexas.
As etapas da análise estatística descritiva são:
 Identificação do problema ou dúvida que possa ser alvo de uma
investigação;
 Recolhimento dos dados;
 Crítica dos dados;
 Apresentação dos dados;
 Análise e interpretação.
Quando interpretadas de forma correta, as informações e os dados
coletados e analisados podem sim se transformar em insights poderosos para a
criação de estratégias e soluções dentro do plano de negócios nas mais diversas
áreas.
Para a apuração das medidas, visualização dos dados e realização do
testes de hipóteses nessa pesquisa, foi utilizada a linguagem R, por meio de
bibliotecas dos pacotes disponíveis como: dplyr, RVAidMemoire, psych, car,
tidyverse, DescTools, lawstat, readxl base e stats.
As medidas de tendência central e de dispersão, foram obtidos por meio
da função summarise. A seguir é mostrado código R para extrair alguns valores de
estatísticas básicas por região para a variável GASTOS:
Figura 1: Código R da função summarise

Fonte: Elaborado pelo autor

Para a aplicação dos testes ANOVA, inicialmente foi realizado o teste de


normalidade da distribuição, por meio do teste Shapiro, do pacote RVAidMemoire,
com significância de 0.05. Segue abaixo código R para extração de resultados de
teste de normalidade:
Figura 2: Código R teste shapiro-wilk

Fonte: Elaborado pelo autor

O passo seguinte foi a verificação da homogeneidade das variâncias, por


meio da função leveneTest, do pacote car. Segue o código R:
Figura 3: Código R da função levene

Fonte: Elaborado pelo autor

Para o teste ANOVA, a função aov foi usada. Para o primeiro teste, a
hipótese nula, ou H0, é que (estatisticamente), a média de gastos do grupo de
universidades por regiões é igual. A hipótese alternativa, ou H1, é de que as médias
são diferentes. Para o segundo teste, a hipótese nula é de que os gastos por
universidade (variável independente) têm influência no ICG (variável dependente).
O nível de confiança usado nos testes também é de 95% com significância de 0,05,
ou seja, caso o p-valor resultante seja maior que 0,05, aceita-se a hipótese nula (H0)
e rejeita-se a hipótese alternativa(H1). Caso o p-valor seja menor que 0,05 rejeita-se
a hipótese nula e aceita-se a hipótese alternativa.
Após o teste de hipótese foi aplicado o teste post hoc (Honestly
Significant Difference), ou diferença honestamente significativa, por meio da função
TukeyHSD() do pacote stats.
Aplicamos o teste de correção de Pearson pra mensurar o quanto as
variáveis GASTOS e IGC estariam relacionadas, ou seja, se o fato de uma delas
aumentar ou diminuir faz com que a outra também aumente ou diminua.

4. RESULTADOS
Inicialmente, são mostradas as estatísticas básicas da variável GASTOS
por região:
Figura 4: Código R estatísticas básicas

Fonte: Elaborado pelo autor


Figura 5: Resultado estatísticas básicas

Fonte: Elaborado pelo autor

Considerando que para aplicação do teste ANOVA, precisa-se comprovar


que os dados seguem uma distribuição normal, foi aplicado o teste shapiro-wilk na
variável gastos (por região). Os resultados são apresentados abaixo:

Figura 6: Código R shapiro-wilki

Fonte: Elaborado pelo autor

Figura 7: Resultado teste shapiro-wilki

Fonte: Elaborado pelo autor


Os resultados apontaram normalidade da distribuição de gastos, com p-
value acima de 0.05 para todas as regiões, com exceção do Nordeste, que
apresentou p-value de 0.0461. Dessa forma, com significância de 0.01, todas as
regiões apresentam normalidade na distribuição.
Outro pressuposto para a realização do teste ANOVA é que os dados
sejam homogêneos. Para isso, foi realizado o teste de levene. O resultado mostrado
na figura 9, com Pr (>F) de 0.5947 indicou a homogeneidade dos dados com
significância de 0.05.

Figura 8: Código R e resultado teste levene

Fonte: Elaborado pelo autor

Para implementação do teste de análise de variância, foi implementado o


código R a seguir, por meio da função aov.
Figura 9: Código R e resultado ANOVA

Fonte: Elaborado pelo autor

A função aov nos retorna alguns elementos:


 Em Call temos a fórmula que o R usou para executar a ANOVA
 Em Terms temos algumas estatísticas importantes, sendo a primeira
coluna referente as análises dentro dos grupos e a segunda coluna referente a
análises entre dos grupos:
 Sum of Squares : soma dos quadrados
 Df: graus de liberdade
 Residual standard error: Erro padrão dos resíduos. Calculado a partir
da raiz quadrada da divisão entre a soma dos quadrados dos resíduos e seus graus
de liberdade.
Aplicando a função summary conseguimos mais informações, mostradas
na figura abaixo:

Figura 10: Código R e resultado função summary

Fonte: Elaborado pelo autor

Temos agora informação de:


• Mean sq: quadrados médios.
• F value: estatística F.
• Pr(>F): valor-p para a estatística F.
A partir da estatística F e seu valor-p acima de 0.05, temos embasamento
estatístico para afirmar, com grande confiança, que as médias de gastos por região
não diferem entre as universidades analisadas. Então a proposta nula (H0) é aceita.
Após teste ANOVA, foi realizado o teste pos hoc (TukeyHSD), do pacote
stats, que promove a comparação de médias par-a-par. Abaixo o código R com os
resultados:
Figura 11: Código R teste TukeyHSD

Fonte: Elaborado pelo autor

A função retorna uma tabela onde as linhas são referentes à comparação


par-a-par entre os grupos, abaixo explicadas:
 diff: diferença entre as médias dos grupos.
 lwr: limite inferior do intervalo de confiança da diferença entre as
médias.
 upr: limite superior do intervalo de confiança da diferença entre as
médias.
 p adj: O valor-p do teste. Um valor menor que 0.05 nos dá uma
confiança estatística para afirmar que há uma diferença entre média
entre os grupos.
No nosso exemplo temos que as médias de gastos não diferem entre as
regiões, ou seja, a hipótese alternativa (H1) que as médias são diferentes, é
rejeitada. A seguir os resultados:

Figura 12: Resultado teste TukeyHSD

Fonte: Elaborado pelo autor

O gráfico de barras, mostrado na figura 14, ilustra a distribuição de gastos


por região:
Figura 13: Gráfico de barras de gastos por região

Fonte: Elaborado pelo autor

O boxplot mostra a distribuição do dados, exibindo-a através de quartis.


Os 3 segmentos que formam o “box” equivalem ao 1º quartil, 2º quartil (ou mediana)
e 3º quartil. Ele também pode informar os valores discrepantes (outliers) dos
dados. As linhas verticais mostram os limites mínimos e máximos dos valores da
amostra.
Figura 14: Boxplot de gastos por universidade

Fonte: Elaborado pelo autor

Figura 15: Boxplot de gastos por região

Fonte: Elaborado pelo autor

O barplot representa as médias dos grupos e seu respectivo intervalo de


confiança. Abaixo o código R implementado e seus resultados.
Figura 16: Código R do Barplot (gastos por região)

Fonte: Elaborado pelo autor


Figura 17: Resultado Barplot (gastos por região)

Fonte: Elaborado pelo autor

O eixo x indica as regiões. O eixo y as médias de gastos nas


universidades por regiões. As linhas horizontais acima das barras indicam os valores
mínimos e máximos do intervalo de confiança da média de gastos..
Com relação às variáveis GASTOS e IGC, abaixo são é mostrado resumo
dos dados:
Figura 18: Código R e resumo de dados das variáveis GASTOS e IGC

Fonte: Elaborado pelo autor

As figuras 19 e 20, mostram o código R e o gráfico de dispersão


considerando as variáveis GASTOS e IGC:

Figura 19: Código R para gráfico de dispersão GASTOS x IGC

Fonte: Elaborado pelo autor


Figura 20: Gráfico de dispersão GASTOS x IGC

Fonte: Elaborado pelo autor

O coeficiente de correlação de Pearson tem o objetivo de indicar como


duas variáveis associadas estão entre si.
Figura 21: Código R e resultado do coeficiente de pearson

Fonte: Elaborado pelo autor

Figura 22: Código R e resultado do teste de correlação de pearson

Fonte: Elaborado pelo autor

Correlação positiva de 0.333, moderada. Com 95% de certeza, podemos


afirmar que o intervalo varia entre 0.0201 e 0.587.
Com resultado de 0.333 apresentado, não podemos afirmar que há
correlação entre as variáveis GASTOS e ICG, ou seja, os gastos por universidade
não influenciariam, estatisticamente, nos indicadores de qualidade dos cursos.
Foi estimado um modelo de regressão linear para as variáveis GASTOS e
ICG. na Figura a seguir, são mostrados o código R e os resultados gerados:
Figura 23: Código R e resultados da estimação do modelo de regressão

Fonte: Elaborado pelo autor

O coeficiente de determinação (R²) varia entre 0 e 1, por vezes sendo


expresso em termos percentuais. No caso das variáveis ICG e GASTOS, expressa
a quantidade da variância dos dados que é explicada pelo modelo linear. Assim, o
R², de 0.111 (pouco explicativo) não se ajusta à amostra.
Observa-se que o R2 ajustado de 0.087 expressa a baixa proporção da
variação da variável resposta (IGC) que é explicada pela variação da variável
GASTOS.
Para estimação de modelos de regressão linear, deverão ser seguidos
alguns pressupostos, como dispersão linear dos dados e, com relação aos
resíduos, não exista autocorrelação, ou correlações independentes.

5. CONSIDERAÇÕES FINAIS
Este estudo analisou gastos nas universidades públicas estaduais do
Brasil. Para atingir o objetivo utilizou-se estatística descritiva, com o intuito de
caracterizar os dados da pesquisa. Foram também realizados testes de hipóteses,
utilizando bibliotecas da linguagem R.
A maior média de gastos encontrada para o grupo de universidades por
região foi de R$ 335.808.868.05 para a região Sudeste e menor média foi de R$
54.965.135,73 para a região Norte.
Por meio do teste de hipótese ANOVA, não foi constatada diferença
estatística, ao nível de significância de 0.05, entre as médias de gastos das
universidades por regiões, portanto a hipótese de que as médias de gastos nas
universidades por região são iguais, deve ser aceita.
Mesmo considerando que existe consenso de que a educação deva ser
financiada, principalmente pelos governos, permanece aceso um debate sobre até
onde pode e deve estender-se essa oferta pública de educação. Encontramos
defensores como Dias Sobrinho (2013) que afirma que “a educação é um bem
público, imprescindível e insubstituível”, e, sendo bem público precisa ser de
qualidade, e, para isso é necessário investir. Por outro lado, oponentes ao
oferecimento do serviço educacional público, questionam as ações governamentais
de investimento, pois para eles, o financiamento em educação, principalmente a do
ensino superior, é por demais dispendioso para a administração pública.
Contudo, cabe considerar que as justificativas levantadas de que a
educação superior é dispendiosa e de que o investimento precisa ser direcionado
para o ensino básico não se sustenta, pois, como apontado por Corbucci (2007):
“a desproporção do gasto com a educação pública, no Brasil, entre os níveis
de ensino, se explica mais pelo fato de o dispêndio com a educação básica
ser insuficiente, do que pelo gasto com a educação superior ser excessivo”.
(Corbucci, 2007, p. 23).
As estratégias de apoio para as universidades com relação aos gastos
devem ser diferenciadas, levando em conta as diferentes estruturas e perfis dos
discentes, docentes e todos os demais envolvidos, assim como orientando-se por
melhores práticas de racionalização de gastos.
As limitações deste estudo consistem na impossibilidade da
generalização dos resultados, visto que foram analisados apenas as universidades
públicas estaduais no ensino superior brasileiro. Recomenda-se que para trabalhos
futuros seja ampliada a amostra da pesquisa, assim, incluindo as universidades
federais para fins de comparabilidade dos resultados. Outra recomendação consiste
na segregação da amostra entre universidades públicas e conjunto de universidades
privadas, a fim de comparar seus gastos.
Vislumbra-se com a pesquisa, uma oportunidade para que os Estados
possam investir em conhecimento na área, capacitando os gestores públicos,
tomadores de decisão, auxiliares e assessorias, no tocante ao zelo e
responsabilidade de gastos nas universidades estaduais.
REFERÊNCIAS

AGRESTI, Alan; FINLAY, Barbara. Métodos estatísticos para as Ciências Sociais.


4. ed. Porto Alegre: Penso, 2012.

AMARAL, Fernando. Fundamentos de Programação em R. Portuguese Edition.

AMARAL, Luis Felipe Leite Estanislau do. MENEZES-FILHO, Naercio Aquino. A


relação entre Gastos Educacionais e Desempenho Escolar. Disponível em:
https://www.researchgate.net/publication/23970136_A_Relacao_entre_Gastos_Educ
acionais_e_Desempenho_Escolar. Acesso em dez/2022.

BRASIL. Censo da Educação Superior. Ministério da Educação – MEC. (2021).


Brasília.

BRASIL. (1988). Constituição da República Federativa do Brasil de 1988

CARVALHO, Cristina Helena Almeida de. Financiamento da educação superior


estadual no Brasil: mapeamento da vinculação de recursos e da evolução dos
gastos. Disponível em
https://convibra.org/congresso/res/uploads/pdf/artigo_23130_2020182658.pdf.
Acesso em dez/2022

CASTRO, Carlos Renato de Melo. PIANTO, Maria Eduarda Tannuri. Educação


superior pública no Brasil: custos, benefícios e efeitos distributivos. Artigo
publicado em abr/2018. Disponível em:
https://www.scielo.br/j/neco/a/Pp4J4h8ZZFz5QLGF3RZgHqr/?format=pdf&lang=pt.
Acesso em nov/2022

CORBUCCI, Paulo Roberto. Dimensões estratégicas e limites do papel da


educação para o desenvolvimento brasileiro. Disponível em:
https://www.scielo.br/j/rbedu/a/9HcKCdKn3ksxpJGwJfKxnKy/?lang=pt
DANCEY, Christine P.; REIDY, John. Estatística sem Matemática para Psicologia.
5. ed. Porto Alegre: Penso, 2013

Estatísticas descritivas no R. Disponível em:


https://www.youtube.com/watch?v=jZvQ4N0nuDY&t=711s. Acesso em nov/2022

GALVÃO, P. G., & Beckman, M. V. R.. A Educação Inclusiva no Contexto da


Política Nacional da Educação Especial. 2016

GUTERRES, Antonio. A Qualificação é a chave (entrevista por Álvaro Mendonça;


Fátima Azevedo; Rui Nunes). Economia Pura. Tendência e Mercados, n. 21. p.18-
22. 2000.

INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO


TEIXEIRA – INEP. Indicadores educacionais 2021. Brasília, DF, Acesso em:
dez/2022.

LEVIN, Jack; FOX, James Alan; FORDE, David R. Estatística para Ciências
Humanas. 11. ed. São Paulo: Pearson, 2012.

MAGALHÃES, Maria et al. Apuração do custo por aluno do ensino de graduação


da Universidade Federal de Viçosa. 2007.

MONTEIRO, Joana. Gasto Público em Educação e Desempenho Escolar.


Disponível: https://www.scielo.br/j/rbe/a/GFsVGL8wvqsRQBB3wKVMB3h/?lang=pt.
Acesso em dez/2022

NASCIMENTO, Paulo A. Meyer; VERHINE, Robert Evan. Considerações sobre


Investimento Público em Educação Superior no Brasil. Disponível em:
https://repositorio.ipea.gov.br/bitstream/11058/7648/1/Radar_n49_considera%C3%A
7%C3%B5es.pdf. Acesso em nov/2022

SANTOS, Deise da Silva. SANTOS, Janete dos. GARCIA, Rosineide Pereira


Mubarack. A Educação Superior e Seu Custo – É Preciso Gastar Mais ou
Melhor?. PDF Disponível em: https://repositorio.ufba.br/bitstream/ri/31173/1/A-
EDUCA%C3%87%C3%83O-SUPERIOR-E-SEU-CUSTO-%C3%89-PRECISO-
GASTAR-MAIS-OU-MELHOR.pdf

SANTOS, Maria Shirlene Lima dos. Alocação de Recursos em Educação


Superior: Uma Análise à Luz de Distintas Molduras Conceituais com Foco na
Experiência da UnB. Disponível em
https://convibra.org/congresso/res/uploads/pdf/artigo_23130_2020182658.pdf.
Acesso em nov/2022

SOBRINHO, José Dias. Educação Superior: bem público, equidade e


democratização. Artigo disponível em:
https://www.scielo.br/j/aval/a/8vyyv53ksSMWX7jhYsHLsXv/?format=pdf&lang=pt

Teste-t para duas amostras independentes no R. Disponível em:


https://www.youtube.com/watch?v=62YSVhzDjo8. Acesso em nov/2022

ZOGHBI, et. al. Mensurando o Desempenho e a Eficiência dos Gastos


Estaduais em Educação Fundamental e Média. Disponível em:
https://www.scielo.br/j/ee/a/b6y4FqVBZFfv5CqXnStHKnw/?format=pdf&lang=pt.
Acesso em dez/2022.

Você também pode gostar