Você está na página 1de 12

Análise de Dados (2 ºfrequência)

Variáveis quantitativas nominais


-Não apresentam uma ordem entre si, nem medem quantidades.
-No caso de só haver duas categorias considera-se que existe uma variável dicotômica (sexo
feminino ou masculino por exemplo)
Exemplo: Religião; Votação Partidária

⤷ Análise Univariada
-Para as variáveis nominais todas as análises se baseiam no nº de casos de cada categoria
(em separado) e na sua distribuição de frequências absolutas, isto é, na tabela ou gráfico
que mostra o número de casos em cada categoria.

⤸ ⤹
1. Frequências Absolutas 2. Frequências Relativas ou Proporção (fi)
-Nº de casos de cada categoria - Corresponde ao nº de casos em cada
-A soma de todas as frequências absolutas categoria face ao total.
corresponde ao total da amostra -A soma das frequências relativas é 1.


1. Tabela de Frequências
-Uma tabela com a distribuição de frequências absolutas mostra o número de casos em cada
categoria e o número total de casos observados.

2. Percentagem (%)
-Corresponde ao valor da frequência absoluta multiplicado por 100.

% = ( Fi / N ) X 100 ou % = fi X 100

-A soma das percentagens das várias categorias de uma variável é 100.


Permilagem (%.)

-Corresponde à proporção, mas multiplicada por 1000. Usa-se quando os valores


percentuais são muito baixos.
Exemplo: taxas de natalidade, de mortalidade infantil…

Vantagens das Proporções e das Percentagens

-Facilitam a leitura, porque se reduz o efetivo total a 1 ou a 100. Se dissermos que uma
categoria representa 15%, ou 60%, dos casos tem-se imediatamente a perceção da sua
importância relativa.

-Permitem a comparação da variável em grupos com dimensões diferentes. Por exemplo,


não faz sentido comparar o número absoluto de votos num partido em Lisboa e na ilha do
Corvo, o que faz sentido é comparar a sua importância relativa a partir das percentagens.

Desvantagens das Proporções e das Percentagens

-As percentagens devem ser utilizadas com alguma precaução quando o número de casos é
pequeno. Nestas situações podem induzir uma falsa leitura - por exemplo, se estivermos a
trabalhar sobre 20 pessoas, uma diferença de 10% corresponde apenas a 2 casos.

Gráficos
⤸ ⤹
Gráfico de barras Gráfico sectorial (“pie”)
-Neste gráfico a altura das barras é -O ângulo do setor do gráfico é
proporcional à importância relativa proporcional ao número de casos
de cada uma das categorias. total.

-Se, no gráfico, forem colocados valores é -Este tipo de gráfico é usado para
preferível que sejam colocadas as percentagens variáveis nominais com pouco
e não os valores absolutos. categorias.
Taxas
-Uma taxa representa a importância de uma situação face ao seu valor potencial.

Exemplo 1:

A taxa, na maioria das situações compara a importância de uma dada situação com o
conjunto de todas as situações possíveis.

Tx = ( nº de casos na situação A / nº total de casos ) x 100

Exemplo: Taxa de insucesso escolar:


Dados: alunos inscritos=150, reprovados=30

Tx= (30/150) x 100 = 20%

Interpretação: Em cada 100 alunos inscritos, 20 reprovaram à disciplina. É também possível


afirmar que a taxa de insucesso escolar é de 20%.

Exemplo 2:

Uma taxa pode também ser utilizada noutro sentido – para comparar a situação encontrada
com a “capacidade potencial”. Neste caso, o valor de uma taxa pode ser superior a 100.
Quando isso acontece significa que se está numa situação de esforço.

Tx = (n.º de casos na situação A / capacidade prevista) x 100

Exemplo: Taxa de utilização de um serviço de saúde


Dados: Capacidade =1500, utentes =1950

Tx = (1950/1500) x 100 = 130%

Interpretação: O serviço de saúde está a ser sobre utilizado em 30%

Rácio
-O rácio é um indicador estatístico que resulta da razão entre dois valores de uma mesma
variável (ou de variáveis diferentes). Dá uma ideia da importância relativa de duas categorias
entre si.

Rácio = nº de casos na situação A / nº de casos na situação B


-A sua leitura indica quantas pessoas se encontram na situação A para cada uma das que
está na situação B.
-Para facilitar a leitura é usual multiplicar por 10, 100 (ou qualquer outro valor).

Exemplo:

R (Norte/ Centro) = 368/232 = 1,59


1,59x 10= 15,9
Deste modo, por cada 10 inquiridos da região
Centro existem cerca de 16 da região Norte.

⤷ Análise Bivariada
-Na análise bivariada o objetivo é perceber a relação entre duas variáveis. Este tipo de
abordagem passa por fazer análises comparativas (através de valores como as percentagens
ou os gráficos) e/ou medir o grau de associação entre as variáveis.

Tabelas de contingência (tabelas de dupla entrada)

-Estas tabelas mostram a relação entre duas variáveis. Uma das variáveis define as linhas e a
outra as colunas.
-Para além das frequências absolutas é habitual colocar as percentagens

-Se o objetivo é fazer comparações entre grupos é necessário utilizar números relativos
como as percentagens, porque os grupos geralmente não têm a mesma dimensão e, por
isso, é necessário utilizar uma base de comparação uniforme que é a percentagem.

- Neste caso é possível calcular percentagens em linha que indicam a importância relativa de
cada um dos tipos de localidades de residência nas cinco regiões de Portugal continental.
-Ou, pode calcular-se as percentagens em coluna, que indicam a importância relativa de
cada uma das regiões nos inquiridos das áreas rurais, das cidades pequenas, e das cidades
grandes.
Percentagens

⤺ ↓ ⤹
Percentagem em linha Percentagem em coluna Percentagem sobre
-Neste caso divide-se cada uma -Neste caso divide-se cada uma o grande total
das células pelo total da sua das células pelo total da sua coluna -As percentagens
linha (total marginal). (total marginal) podem ser calculadas
relativamente ao
total dos inquiridos.

1. Percentagem em linha

No Norte 61,4% dos inquiridos vivem em aldeias ou áreas rurais

( 226 / 368 ) x 100 = 61,4%

Na AM Lisboa 12,8% dos inquiridos vivem em aldeias ou áreas rurais


( 38 / 296 ) x 100 = 12,8%

2. Percentagem em coluna

Dos inquiridos que residem em aldeias e áreas rurais 45,2% são no Norte

( 226 / 500 ) x 100 = 45,2%


3. Percentagem sobre o grande total

Do total dos inquiridos, 4% reside numa área rural ou aldeia do Alentejo.

(40 / 1000 ) x 100 = 4%

-Mas, a percentagem relativamente ao total não costuma ter interesse para as análises
comparativas.

Gráficos
↙ ↘
Gráficos de barras agrupados Gráficos de barras empilhadas

-Este gráfico expressa as % calculadas em -O gráfico deve ter as % calculadas em


relação a cada uma das regiões ( a soma relação à variável que está no eixo
das 3 situações em cada região deve ser 100%) horizontal e não a percentagem
v relativamente ao total.

-Só desta forma é possível comparar a


importância relativa das aldeias, das
pequenas cidades e das grandes cidades
nas várias regiões.
Medidas de Associação

- Na estatística bivariada analisa-se a relação entre duas variáveis. Esta abordagem permite
analisar não apenas a estrutura da relação entre as variáveis, mas também a intensidade
da associação entre as duas variáveis.

A relação entre duas variáveis nominais (ou uma nominal e outra ordinal que seja tratada
como nominal) pode ser analisada a partir de:

↙ ↓ ↘
Tabelas de contingência Gráficos de barras agrupadas V de Cramer
-Com percentagens em linha ou empilhadas -uma medida de
ou coluna. -Com percentagens em função de associação para
uma das variáveis analisar a intensidade
da relação

Quando pelo menos uma das variáveis é nominal, fala-se em associação (se as duas
variáveis são nominais utiliza-se o V de Cramer, se uma é nominal e a outra quantitativa
usa-se o Eta) se as duas variáveis são ordinais ou quantitativas fala-se de correlação
(utiliza-se o coeficiente de correlação de Pearson se ambas são quantitativas e o de
Spearman se pelo menos uma é ordinal).

V de Cramer

-É uma medida de associação para variáveis qualitativas nominais que permite medir a
intensidade da relação entre duas variáveis.
O V de Cramer pode ter valores entre 0 e 1.

-Quanto mais próximo de 0 menor a associação e quanto mais perto de 1 maior o grau de
associação entre as variáveis.

Variáveis qualitativas ordinais


-Não medem quantidades
-Apresentam uma ordem entre si
Exemplo: Grau de satisfação, tamanho de roupa…

-Como as categorias/valores apresentam uma ordem entre si, é possível calcular o número
de casos, ou a percentagem, até uma dada categoria: ou seja, as frequências e percentagens
acumuladas.

Análise Univariada

- Em alguns casos, as variáveis ordinais podem ser tratadas como quantitativas, geralmente
isso é feito quando estão em escalas de Likert e são considerados pelo menos 5 pontos da
escala efetivamente utilizados. O que não altera o estatuto original da variável.

Frequências e Percentagens absolutas acumuladas


-A frequência acumulada corresponde ao número de casos acumulados até cada categoria.
-Na última categoria da variável, a frequência acumulada corresponde ao total da
amostra/população e, no caso das percentagens, a 100%

- A percentagem acumulada é calculada a partir da frequência acumulada em cada categoria


a dividir pelo total, ou a partir da soma das percentagens até cada uma das categorias.

Exemplo: % de pessoas que têm o


x ensino secundário

1) ( (1686+747)/3000)x100
ou
2) 56,2%+81,1%
Medidas de ordem
↙ ↓ ↘
Quatis Mediana Quartis, Decis, Percentis
-Calcula até que valor -Indica até que valor se acumula -4 partes iguais (25%): Quartis
ou categoria se acumula metade dos casos. -10 partes iguais: Decis
metade/ um quarto da -Corresponde ao valor que faz a -100 partes iguais: Percentis
distribuição separação entre a metade dos
-Utiliza-se esta medida valores mais baixos e dos valores -Quando a medida de ordem
quando existem muitos mais altos. fica entre dois valores:
valores. 1- Considera-se indeterminada
2-Calcula-se o ponto entre dois
po limites (SPSS)

Cuidados a ter ao utilizar as medidas de ordem:

1) Quando a variável tem poucas categorias de resposta, a utilização dos Q1, Q2 e Q3


pode induzir em erro, por estarem mais ou menos próximas dos limites (P25/P50 ou
P75).

Exemplo:
Diferença entre o grupo A e B
2 pontos percentuais nas percentagens acumuladas mas os Q1, Q2 e Q3 apontam para
diferenças.

Diferença entre o grupo A e C


20 pontos percentuais, mas os Q1, Q2 e Q3 apontam para situações iguais.

Nesta situação, as médias (embora não tenham uma interpretação concreta) dariam melhor
ideia das diferenças de posição, mais ou menos favoráveis, dos diferentes grupos.
Gráfico de barras

-O gráfico de barras, com percentagens simples é, em geral, a melhor forma de representar a


distribuição de uma variável ordinal.
-Embora as percentagens acumuladas façam sentido neste tipo de variáveis, um gráfico com
percentagem acumuladas pode induzir em erro.

Análise Bivariada

- Habitualmente as análises comparativas de uma variável ordinal baseiam-se nas


percentagens simples (isto é, não acumuladas).

-Estas percentagens podem aparecer em quadros (tabelas de contingência) ou em gráficos.

Medidas de associação e correlação

-No caso das variáveis ordinais podemos utilizar diversas medidas de associação ou
correlação, dependendo da combinação de tipos de variáveis.
-Além da intensidade, o coeficiente de correlação de Spearman e o Tau-b de Kendall
também indicam o sentido da relação entre as variáveis.

Duas variáveis ordinais


↙ ↘
coeficiente de correlação Tau-b de Kendall
de Spearman
-é utilizado para duas variáveis ordinais (ou -é utilizado quando existem muitos
quando uma variável é ordinal e a outra empates, como acontece quando se
quantitativa) e não existem grandes analisa escalas de Likert.
empates
Coeficiente de correlação de Spearman Tau-b

-Estes coeficientes variam entre -1 e +1. Quanto mais o seu valor absoluto se aproxima de 1,
mais forte é a relação, quanto mais próximo de 0 mais fraca é a relação entre as variáveis.

-Ao contrário do que acontece com as medidas de associação (V de Cramer e Eta), as


medidas de correlação podem ter valores positivos ou negativos.

-Se o coeficiente for positivo isso significa que a relação é directa (isto é: quando uma
variável aumenta a outra também);

-Se o coeficiente for negativo, isso significa que a relação é inversa (ou seja: quando uma
variavel aumenta a outra diminui).

Exemplo 1 : Nível de Ensino e Classe Social

-Com base no Eurobarómetro 65.3, podemos calcular a correlação de Spearman entre o


nível de ensino (Básico, Secundário e Superior) e o autoposicionamento dos inquiridos em
termos de classe social (“classe trabalhadora da sociedade”, “classe média-baixa da
sociedade”, “classe média da sociedade”, “classe média-alta da sociedade”, “classe alta da
sociedade”).

-Neste caso, o valor da correlação de Spearman é de +0.493 e o Tau-b de Kendall é de


+0.493.
-Isto significa que a correlação é positiva – quanto maior é o nível de ensino, melhor o
autoposicionamento em termos de classe social – e, dado que está muito próximo do I0.5I, a
relação entre o ensino e a classe social é forte (no contexto das ciências sociais os valores
elevados são bastante raros).

Exemplo 2: Optimismo em relação à União Europeia e Satisfação com a Democracia em


Portugal

-A variável “Optimismo em relação à União Europeia” é medida numa escala de Likert


decrescente (isto é quanto maior o valor menor o optimismo: 1 significa “Muito optmista”, 2
”Optimista”, 3 “Pessimista” e 4 “Muito pessimista”. No entanto, a variável “Satisfação com a
Democracia em Portugal” é medida numa escala crescente (em que 1 significa “Nada
satisfeito, 2 ”Não muito satisfeito”, 3 “Satisfeito” e 4 ”Muito satisfeito”).

-Encontra-se assim uma correlação inversa, ou negativa, que neste caso decorre de termos
uma escala crescente e outra decrescente (quando os valores do “Optimismo em relação à
UE" diminuem - isso significa que o otimismo das pessoas é maior). Embora quando os
valores de uma variável aumentem os da outra diminuem, neste caso isso significa que o
otimismo em relação a EU é maior quando os níveis de satisfação com a democracia em
Portugal também o são.

-O valor absoluto da correlação indica que a relação entre estas variáveis é moderada.
Apesar de serem indicadores diferentes, os valores apontados pela correlação de Spearman
e pelo Tau-b de Kendal são muito aproximados

Você também pode gostar