Você está na página 1de 58

See

discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/263426057

O livro que explica a estatstica que precisa em


13 aulas IBM-SPSS & Excel
Book June 2014
DOI: 10.13140/2.1.3914.7201

CITATIONS

READS

2,614

1 author:
Margarida Pocinho
Escola Superior de Tecnologia da Sade de Coimbra
47 PUBLICATIONS 18 CITATIONS
SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Telepsychology (Telepsicologia) View project

Available from: Margarida Pocinho


Retrieved on: 24 November 2016

O livro que explica a estatistica que precisa


em 13 aulas
IBM-SPSS & Excel
Teoria e prtica

MARGARIDA POCINHO
ESCOLA SUPERIOR DE TECNOLOGIA DA SADE DE COIMBRA
INSTITUTO SUPERIOR MIGUEL TORGA
June 27, 2014

Estatstica e SPSS

AULA 1.

INTRODUO .................................................................................................................. 2

ALGUMAS CURIOSIDADES ............................................................................................................................. 2


AULA 2.

MEDIDAS DE TENDNCIA CENTRAL OU DE POSIO:....................................................... 8

AULA 3.

POPULAO E AMOSTRA ................................................................................................ 9

NOES GERAIS ......................................................................................................................................... 9


AULA 4.

USAR O SPSS PARA ORGANIZAR E MOSTRAR OS DADOS: .............................................. 13

AULA 5.

TRANSFORMAO DOS DADOS ..................................................................................... 17

AULA 6.

REPRESENTAES GRFICAS PARA DIFERENTES TIPOS DE VARIVEIS ........................... 23

AULA 7.

ANLISE DESCRITIVA: MDIA, MO E MD EM SPSS ......................................................... 26

AULA 8.

ESTATSTICA PARAMTRICA E NO PARAMTRICA ....................................................... 30

AULA 9.

ESTATSTICA BIVARIADA ................................................................................................ 35

Hiptese: ......................................................................................................................................... 40
AULA 10.

TESTES DE HIPTESES: ................................................................................................... 43

AULA 11.

TESTES PARAMTRICOS: ................................................................................................ 48

AULA 12.

*ESTATSTICA NO PARAMTRICA ................................................................................ 53

AULA 13.

DO SPSS AO EXCEL E DO EXCEL AO SPSS ........................................................................ 56

Estatstica e SPSS

Aula 1.

Introduo

A Estatstica uma cincia que recolhe, ordena, analisa e interpreta os dados de um grupo
de indivduos (sejam eles uma amostra ou uma populao -censo), prescindindo das
palavras e recursos literrios, sendo ento feita atravs de uma linguagem numrica
expressiva e cheia de fora e impacto (teoria das probabilidades), da qual faz referncia das
generalizaes, com a finalidade de inferir para a populao ou prever a evoluo de
determinado fenmeno.
Esta uma parte essencial para o dia-a-dia de qualquer individuo, na medida em que
imprescindvel para o treino profissional e formao, atividades de investigao pessoal e
para interpretao de literatura cientfica, funcionando assim como uma evidncia
cientfica que ir permitir a prtica clnica e que ajudar na perceo do impacto e
importncia daquilo que se diz e faz.
Mediante isto, este manual tem por fim fornecer conhecimentos estatsticos (sem ter
muitos conhecimentos matemticos) e ajudar a interpretar os resultados que podem ser
obtidos quer atravs do clculo manual, quer atravs de programas de computador. Assim,
pretende demonstrar os principais contedos e conceitos de Estatstica, dando especial
importncia e enfatizando com maior rigor os apreendidos em contexto prtico, usando
como principal ferramenta o programa SPSS e pontualmente tambm o uso do programa
Microsoft Office Excel.

Algumas curiosidades
Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com
o nico fim de acumular nmeros, mas com a esperana de utilizar os dados do passado
para a resoluo de problemas do presente assim como para a previso de acontecimentos
futuros. No entanto, o sucesso quanto a este objetivo s foi possvel em data muito recente:
s no final do sculo XIX e, sobretudo, no princpio do sculo XX que, com a aplicao
de probabilidades aos problemas sobre a interpretao dos dados recolhidos, foi possvel
resolver alguns deles.
A Estatstica conquistou, hoje, o seu lugar entre as cincias. O poder do seu mtodo ,
sobretudo, afirmado nas ltimas dcadas e aplica-se, agora, nos domnios mais variados.
At aqui, s um pequeno nmero de pessoas se preocupou com estudos estatsticos, quer
pela natureza das suas investigaes, quer por causa da sua utilidade para as diferentes
profisses. O valor e a importncia do mtodo estatstico residem no esforo para melhor
compreender o nosso mundo, to maravilhosamente complexo, tanto no ponto de vista
fsico como social, levam-nos a sonhar que ele se torne objecto de um conhecimento como
as outras cincias. A vida corrente leva-nos a decises para passar do conhecido ao
desconhecido, da experincia previso.
Para algumas pessoas, a Estatstica no seno um quadro de colunas mais ou menos
longas de nmeros que dizem respeito populao, indstria ou ao comrcio, como se v
2

Estatstica e SPSS
frequentemente em revistas; para outras, ela d grficos mostrando a variao no tempo de
um facto econmico ou social, a produo ou os nmeros relativos aos negcios de uma
empresa, assim como se encontra nos escritrios de empresas privadas.
To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer
uma definio que os contenha a todos. Apesar disso, apresentamos a seguir uma definio
que, embora necessariamente incompleta como qualquer outra, tem a vantagem de
introduzir o aluno na matria.
A Estatstica tem como finalidade elaborar de uma sntese numrica que evidencie o que de
mais generalizado e significativo exista num conjunto numeroso de observaes. O grande
nmero de observaes de que se parte reflete uma diversidade tal que se torna
ininteligvel a sua interpretao. Para que, a partir dessa diversidade se possa comear a
entender logo, torna-se necessrio reduzir sucessivamente as observaes, ganhando-se em
generalidade o que se vai perdendo em individualidade.
A sntese implica, assim, que nos desprendamos do que particular e individual para nos
atermos ao que existe de mais geral no conjunto das observaes; medida que a sntese
progride, vai-se perdendo o contacto com as particularidades imediatas.
Deste modo, a Estatstica no se ocupa do que excecional, mas apenas do que geral:
no se interessa pelo indivduo, mas por grupos de indivduos; no se ocupa, em suma, de
uma s medio, mas de um conjunto de medies. Acrescente-se, ainda, que a sntese
numrica. Quer isto dizer que se prescinde inteiramente das palavras e dos recursos
literrios de mais ou menos efeito que elas possibilitam. Alcana-se a sntese pelo recurso
exclusivo dos nmeros.
Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos.
A Estatstica intrinsecamente uma disciplina no literria, manipula exclusivamente
nmeros e alcana a sntese ordenando-os e cooperando com eles.
Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a
ligao que sempre existiu entre ambos. O primeiro levantamento estatstico remonta a
3050 a.C., no Egipto, tendo como objetivo informar o estado sobre recursos humanos e
econmicos. No sc. XVII d.C., a disciplina de Estatstica era j lecionada nas
universidades alems, continuando com a finalidade de descrever as populaes e as
riquezas do Estado. Ainda no sc. XVII, d-se a expanso dos seus campos de investigao
a reas como a Sade pblica; a Indstria; o Comrcio e os Estudos Demogrficos.
Os mtodos de inferncia estatstica surgem com Jonh Graunt (1620-1674), um modesto
comerciante, que tira concluses vlidas sobre uma populao desconhecida por ele.
Fermat (1601-1665) e Pascal (1623-1662) permitem que o estudo do acaso tome uma
expresso matemtica, introduzindo o Clculo das Probabilidades. Esta expresso
matemtica e o aparecimento do mtodo dos mnimos quadrados, vm credibilizar a
Estatstica conferindo-lhe a fundamentao matemtica em que ela, hoje, assenta.
No sc. XVIII Lambert Quetelet (1796-1874) introduziu a Estatstica nas anlises da
Meteorologia; da Antropometria; das Cincias Sociais; da Economia e da Biologia.
Aos contributos anteriores Francis Galton (1822-1911), acrescenta as noes de regresso
e correlao; Karl Pearson (1857-1936) apresenta a mais bela e acabada teoria de
Estatstica, ficando tambm conhecido pelos seus coeficientes (r; c); Fisher com os seus

Estatstica e SPSS
trabalhos sobre inferncia Estatstica tambm deu um grande contributo ao
desenvolvimento da Estatstica.
Em 1943, d-se uma grande reviravolta, uma vez que o tratamento de dados deixa de ser
feito manualmente e passa, numa primeira fase, a ser apoiado por calculadoras potentes
para mais tarde ser computadorizado.
O Mtodo Estatstico, segundo a teoria de Cramer, pressupe as seguintes fases:
Recolha de dados estatsticos: obteno da amostra a partir da populao, devendo depurar
e retificar os dados estatsticos, que no seu conjunto so denominados srie estatstica.
Descrio: conjunto de operaes, numricas ou grficas, efetuadas sobre os dados
estatsticos determinando a sua distribuio; procede-se sua ordenao, codificao e
representao por meio de quadros e tabelas.
Anlise: consiste em tirar concluses sobre a distribuio da populao, determinar o seu
grau de confiana e ainda formular hipteses, tentando verific-las, quanto ao fenmeno
em estudo.
Predio: uma previso do comportamento do fenmeno em estudo, tendo em conta a
definio da distribuio estatstica.
Em termos gerais, parece-nos que uma boa definio do que a estatstica, j que resume
os conceitos dos vrios autores, :
Cincia que trata do planeamento, colheita, organizao, sintetizao, apresentao e
anlise de dados, bem como, a obteno de concluses vlidas e tomada de decises em
diversos campos do saber (engenharias, sade, biologia, farmcia, biofsica, ciencias
sociais, geografia, etc.).
Com efeito, o papel da Estatstica na pesquisa cientfica apoiar o investigador na
formulao das hipteses estatsticas e fixao das regras de deciso, no fornecimento de
tcnicas para um eficiente plano de investigao, na colheita, tabulao e anlise dos dados
(estatstica descritiva) e em fornecer testes de hipteses a serem realizados de tal modo que
a incerteza da inferncia possa ser expressa em um nvel probabilstico pr-fixado
(inferncia estatstica) cujo valor mximo de erro mais consensual de 5%.
Como vimos, historicamente foram muitas as definies estabelecidas para Estatstica. Da
mesma forma, so muitas as definies para Bioestatstica. Preferimos adotar a seguinte:
Conjunto de tcnicas que permite recolher, apurar e apresentar dados para que sejam
analisados, proporcionando inferncias indutivas sobre as cincias da vida.
A m utilizao de dados mdicos ou de outras cincias, com interpretaes errneas ou
mal-intencionadas, tem produzido um grande ceticismo em relao estatstica. Podemos
encontrar muitos professores, clnicos ou mesmo profissionais de cincias bsicas, que
acham que bom senso" suficiente para tratar desses dados, que qualquer coisa que exija
prova estatstica no pode ter valor prtico ou que procuraro um matemtico se tiverem
algum problema estatstico em seu trabalho.
importante compreender, no entanto, que cada vez que se toma a mdia de duas leituras
de exame, por exemplo, ou o nmero mdio de dias de internamento no hospital de
pacientes com determinada doena, se est a usar um mtodo estatstico. Do mesmo modo,
usamos mtodos estatsticos para concluir que a presso arterial do paciente est normal ou
que um tratamento cirrgico melhor que outro. Deste modo, a Estatstica nas cincias da

Estatstica e SPSS
sade constitui-se realmente nos princpios da Medicina Quantitativa. Muito das cincias
da sade depende, direta ou indiretamente, de contagem ou mensurao. Isto bvio em
pesquisa e verdadeiro tambm no diagnstico. Quando um profissional superior de sade,
leva em considerao na avaliao de um tumor a sua idade e histria familiar, est a
utilizar dados quantitativos, ou seja, a incidncia de tumores por idade e por famlia.
Convencionou-se chamar de Bioestatstica o conjunto de conceitos e mtodos cientficos
usados no tratamento da variabilidade nas cincias da sade em especial as cincias
mdicas e biolgicas. A Bioestatstica fornece mtodos para se tomar decises timas na
presena de incerteza, estabelecendo faixas de confiana para a eficcia dos tratamentos e
verificando a influncia de fatores de risco no aparecimento de doenas. Dentro da rea
biolgica, compreende-se por Biometria a cincia que estuda as medidas de seres vivos.
A nfase crescente do papel dos mtodos quantitativos na prtica da medicina torna
imperativo que o estudante de medicina assim como o profissional de sade tenham algum
conhecimento de estatstica.
O estudante aprende na escola o melhor mtodo de diagnostico e teraputica; depois de
formado depender necessariamente de trabalhos apresentados em reunies, jornais e
revistas cientficas, para aprender novos mtodos de terapia, assim como os progressos em
diagnstico e tcnicas teraputicas, psicoteraputicas, tecnolgicas.
Pode verificar que em quase todas as licenciaturas, mestrados ou doutoramentos encontra
unidades curriculares, mdulos e/ ou seminrios de estatstica, pois um profissional dever
:
Estar apto a avaliar por si prprio os resultados de outros pesquisadores, dever
decidir quando uma nova tcnica ou mtodo pode substituir os antigos.
Estar apto a dar famlia do paciente, ou ao prprio, bem como aos seus colegas de
trabalho, segurana quanto ao diagnstico, o que pode depender de sua capacidade de
avaliar adequadamente os resultados de exames laboratoriais e outros, como tambm de
seu conhecimento sobre a relao entre a idade, sexo e outras condies do paciente e uma
determinada doena. Os novos conhecimentos viro atravs do trabalho de pesquisa
realizado por ele prprio ou por outros.
Ser capaz de selecionar, da massa de informaes, aquelas que forem vlidas e que
resistirem a testes cientficos rgidos.
Desenvolver um ceticismo sadio em relao a tudo que l. Uma noo bsica o
reconhecimento de que os indivduos diferem no apenas uns dos outros, mas tambm em
relao a si prprios, de dia para dia ou mesmo de hora para hora. Uma certa quantidade de
variao normal, mas a questo que desafia o profissional de sade determinar quando
uma variao especfica se torna patolgica (referente doena).
Para isso, deve aprender como medir a variao em indivduos normais e definir qual o
limite de variao normal. Deve aprender que h algum erro aleatrio presente em cada
medida ou contagem feita. altamente improvvel que duas contagens sucessivas de
glbulos, feitas na mesma amostra de sangue, sejam idnticas. Quando, porm, uma
diferena se torna maior que o erro de mensurao? Para exercer as suas funes do
melhor modo possvel, o profissional de sade deve saber responder a questes como essa.
Para cada medida ou determinao fornecida pelo laboratrio, o profissional de sade deve

Estatstica e SPSS
conhecer a variao que parte do prprio mtodo, para saber quando uma dada variao
representa uma mudana real no paciente. Sempre que novos mtodos de terapia so
introduzidos, necessrio saber se so realmente superiores, isto , mais eficientes que os
velhos mtodos. Ser necessrio fazer-se a avaliao crtica do estudo experimental,
verificando principalmente se as medidas foram realizadas de modo a produzir resultados
fidedignos, se o fator em prova foi o nico fator de diferena entre o grupo experimental e
o grupo controle, se a diferena entre os resultados obtidos nos dois grupos foi maior que
aquela que poderia ser atribuda ao acaso. Apenas depois da avaliao, atravs de tcnicas
estatsticas adequadas, da fidedignidade dos resultados, comparabilidade dos grupos
experincia e controle e, significncia da diferena encontrada que podemos tirar as
concluses relativas ao novo mtodo.
O nmero de falhas encontradas em publicaes mdicas enfatiza a necessidade de uma
avaliao crtica da literatura. Para ajudar o estudante a desenvolver tal atitude so
necessrios certos conceitos estatsticos bsicos e uma certa familiaridade com a
terminologia mais usada. Os Mtodos estatsticos so essenciais no estudo de situaes em
que as variveis de interesse esto sujeitas, inerentemente, a flutuaes aleatrias. Este o
caso da rea da sade principalmente na Medicina. Mesmo tomando-se um grupo de
pacientes homogneos, observa-se grande variabilidade, por exemplo, no tempo de
sobrevida aps um tratamento adequado. Dosagens de caractersticas hematolgicas
flutuam no s entre indivduos, como tambm no mesmo indivduo em ocasies
diferentes. Na realidade, h variaes entre diferentes pacientes para qualquer varivel de
interesse clnico. Portanto, para se estudar problemas clnicos, necessria uma
metodologia capaz de tratar a variabilidade de forma adequada.
Deve-se notar, entretanto, que ao tratar um paciente, o profissional de sade se vale da
experincia de eventos anteriores, vivenciada pessoalmente ou transmitida por outros
atravs de livros e artigos. Assim, a Estatstica pode ser vista como ferramenta de
organizao e validao do conhecimento na rea da sade.
inegvel, hoje, que a cincia busca a verdade descrevendo o universo e estabelecendo
princpios gerais para explicar os fenmenos do universo. Para tanto deve valer-se do
pensamento cientfico, que se estabelece ao nvel de uma linguagem terica de conceitos e
hipteses. As hipteses precisam ser comprovadas, quando se faz necessria a utilizao de
instrumentos operacionais que explicitaro os procedimentos usados para observao e
mensurao do fenmeno. So as hipteses estatsticas.
A passagem da hiptese terica para a hiptese estatstica poderia ser assim exemplificada:
Determinado investigador estudar a veracidade da hiptese: "Os indivduos gordos
comem mais que os indivduos magros". Esta hiptese encerra alguns conceitos, como:
gordo, magro e comer mais. Qualquer que seja o entendimento destes conceitos tericos,
para se operacionalizar a comprovao desta hiptese o investigador dever estabelecer a
maneira de medir gordo, magro e comer mais. Ou seja, como observar e medir gordo,
magro e comer mais? Uma traduo operacional destes conceitos pode ser de que gordo
o indivduo que apresente peso acima da faixa de normalidade no ndice de massa corporal
(IMC), e magro o indivduo que apresente peso abaixo dessa faixa. Comer mais seria

Estatstica e SPSS
traduzido como consumir mais calorias do que o definido como necessrio pela tabela de
ingesto diria de calorias de acordo com o perfil de atividades do indivduo.
Desta forma, a hiptese cientfica poderia ser enunciada como uma hiptese estatstica da
seguinte forma: "Os indivduos que apresentam ndice de Massa Corporal IMC normal so
mais produtivos, do que os indivduos que apresentam IMC abaixo do normal". Se esta
hiptese se referir a poucos indivduos basta verificar se verdade para estes indivduos e a
questo estar resolvida. No entanto, para a cincia no ter muita utilidade tal observao,
uma vez que nada garante que esse acontecimento no surgiu por acaso ou que s acontece
naquele grupo apenas.
Em cincia buscam-se hipteses mais gerais, referentes a parmetros populacionais. Para
tanto, sero projetados e implementados planos de recolha e anlise de dados que
permitiro testar a hiptese dando-lhe validade cientfica. Esquematicamente:
Observa-se determinado fenmeno e elabora-se uma hiptese cientfica que procura
estabelecer a relao entre variveis;
A partir da hiptese cientfica e dentro dos conhecimentos atuais elabora-se uma
hiptese estatstica que permita explorar, descrever ou explicar o fenmeno observado;
Tendo a hiptese estatstica, atravs de uma inferncia (dedutiva) deduzem-se as
consequncias lgicas quanto ao que deve ser esperado empiricamente com relao
populao;
So estabelecidas as margens de erro e os nveis de confiana que permitiro uma
deciso para aceitao ou rejeio da hiptese;
A hiptese estatstica ser verificada atravs de tcnicas estatsticas adequadas
definidas previamente;
A veracidade cientfica da hiptese induz-se (inferncia indutiva), a partir dos
resultados e com base na teoria das probabilidades.
A inferncia indutiva ter tanto mais significado quanto mais rigoroso for o delineamento
da colheita de dados e quanto mais apropriada for a anlise estatstica destes dados. As
falhas nestas fases podem implicar em que os valores encontrados no reflitam
adequadamente os parmetros correspondentes. A inferncia da hiptese estatstica para a
hiptese cientfica ser tanto melhor quanto mais adequada tenha sido a formulao dos
conceitos tericos. Uma m formulao dos conceitos tericos no permitir aceitar como
verdade a concluso matemtica retirada dos teste. Pelo contrario uma formulao
adequada dos conceitos tericos permite tirar concluses indutivas que se transformam
num princpio, ainda que provisrio. Estas sero ajustadas aos novos conhecimentos,
somando experincias que a regulem, e permitindo o contnuo ajuste do modelo
realidade.
Ao verificar a provvel (probabilidades) verdade de uma hiptese, a Estatstica estabelece
o nvel de erro ao aceitar ou rejeitar uma hiptese. por isso um dos mais poderosos
instrumentos na busca da verdade cientfica, e o principal instrumento para generalizar
concluses da parte para o todo.

Estatstica e SPSS

Aula 2.

Medidas de tendncia central ou de posio:

Sob esta designao agrupam-se os parmetros que, ou nos indicam algo de


associvel ao ncleo ou centro da distribuio, ou nos permitem compartiment-la. So
estes: mdia, moda e mediana.
Mdia aritemtica: ponto de equilbrio dos dados, isto , tendo um conjunto de n
valores x1, x2,, xn de uma varivel X, o quociente entre a soma desses valores e o n
deles.

Mediana (Md): o
valor que ocupa a posio central de uma
srie, logo necessrio
encontrar a posio mdia entre os
dados, isto , de uma srie de n observaes x1, x2,, xn de uma varivel X, o valor que
ocupa a posio central quando as observaes esto ordenadas por ordem crescente ou
decrescente, ou seja, op valor dessa varivel tal que a frequncia dos valores que lhe so
inferiores a mesma que a frequncia dos valores que lhe so superiores. Usada quando na
amostra h valores excntricos em relao a outros valores.

Quando N mpar:

Quando
N par:

Moda (ou valor modal- Mo): de uma srie


de n
valores x1, x2, , xn de uma varivel X, o valor
onde
a frequncia atinge o mximo relativo, isto , se
uma
varivel discreta, a(s) moda(s) (so) o(s) valor(es) da varivel estatstica que se
observa(m) com maior frequncia.
NOTAS:

Distribuio simtrica ou no enviesada: Mo= mdia= Md

Distribuio enviesada esquerda: Mo> Md> Mdia

Distribuio enviesada direita: Mo< Md< Mdia

Medidas de disperso:
As medidas de tendncia central no fornecem por si s, uma informao exaustiva
da distribuio em causa, at muito pelo contrrio, pois a capacidade que se lhe atribui de
representar os elementos de uma distribuio depende do modo como estes se concentram
ou dispersam em torno dela, sendo ento aqui necessrio o auxlio das medidas de
disperso para permitir assim uma melhor caraterizao da distribuio, pois tal como o
nome indica, so elas que iro exprimir o grau de disperso ou variabilidade dos dados.
So elas:
Amplitude total;
8

Estatstica e SPSS

Amplitude interquartis;
Desvio mdio;
Desvio padro;
Varincia;
Coeficiente de disperso ou de variao.

Aula 3.

Populao e Amostra

Noes gerais

Populao: conjunto de pessoas, objetos ou acontecimentos que se esto a analisar


em que cada elemento seu se denomina de Unidade estatstica.
Populao-alvo: elemento com qualquer caraterstica em comum que esto a ser
sujeitos a uma anlise estatstica, por terem interesse para o estudo.

Existente/ Real
Natureza:

Populao

Hipottica

Finita
N de elementos:
Infinita

Estatstica e SPSS
Amostra: subconjunto da populao, no tendenciosa, que se supe ser
representativo de todas as caratersticas da mesma, sobre o qual ser feito o estudo, com o
objetivo de serem tiradas concluses vlidas sobre a populao, permitindo desta forma a
generalizao.
Amostragem: procedimento pelo qual um grupo de pessoas ou um subconjunto de
uma populao escolhido com vista a obter informaes relacionadas com um fenmeno,
para que toda a populao em interesse esteja representada.
Plano de amostragem: serve para descrever a estratgia a utilizar para selecionar a
amostra.
Modalidade: toda a manifestao possvel de uma varivel, isto , as vrias
hipteses de resposta.

Variveis:

Propriedades em relao qual os indivduos de uma amostra variam,


tendo por isso interesse estatstico.
Varivel estatstica: aspetos (caratersticas) que se tm em conta, ao ser efetuada
uma anlise estatstica.

Classificao das variveis:


Independentes: identifica-se com a dimenso ou a caraterstica que o investigador
manipula deliberadamente para conhecer o seu impacto numa outra varivel (a varivel
dependente);
Dependentes: caraterstica que aparece ou muda quando o investigador aplica,
suprime ou modifica a varivel independente;
Moderadoras: fatores que so mediados, manipulados ou selecionados pelo
investigador para verificar se afetam a relao entre a varivel independente e um
fenmeno observado;
Controle: fatores que so controlados pelo investigador para inibir ou neutralizar
qualquer efeito que possam ter no fenmeno observado;
Parasitas: qualquer fator que, teoricamente, afeta o fenmeno observado, mas no
pode ser visto, medido ou manipulado.

10

Estatstica e SPSS

Quantitativas

Ordinais

Nominais

Natureza das variveis:

Qualitativas: a natureza da varivel varia de elemento para elemento;


Ordinais:

Nominais:

Quando existe uma


ordenao possvel.

Quando o seu significado s se entende em


funo do nome e o nmero ou cdigo que se
lhe atribua no nos d nenhuma informao.
(dicotmicas ou politmicas)

Quantitativas: a intensidade da varivel varia de elemento para elemento;


Discretas:
Continuas:

Assumem valores isolados, normalmente


inteiros.

possvel qualquer
operao aritmtica, podendo
assumir qualquer valor real

Tipos de estatstica:
Estatstica descritiva: Recolhe, organiza e
analisa os dados de uma amostra, sem retirar
qualquer concluso sobre um grupo maior.
Estatstica indutiva: Recolhe, organiza,
analisa e estabelece relaes entre os dados para
fazer inferncias sobre a populao e,
consequentemente, chegar a leis e teorias (dando a
descritiva um apoio a esta tarefa).

11

Estatstica e SPSS
Parmetro: toda a funo definida a partir dos dados numricos de uma populao.
Ex: resultado de uma mdia
Dado estatstico: toda a funo definida a partir dos dados numricos duma amostra.
Ex: resultado de uma mdia um dado estatstico.

Pode-se assim concluir que o parmetro est para a populao, assim como o
dado estatstico est para a amostra!

12

Estatstica e SPSS

Aula 4.

Usar o SPSS para organizar e mostrar os dados:

1)
Iniciar programa SPSS for Windows. Aparecer o ecr de abertura do SPSS.
2) Pressionar em Type in data para proceder abertura de uma nova janela (caso se
pretenda abrir uma j existente deve pressionar-se open file e selecionar o ficheiro
pretendido). Passar de imediato ao editor de dados, que funciona de forma semelhante a
uma folha de clculo.

No SPSS o ficheiro de dados corresponde a uma matriz na qual as colunas


correspondem s variveis e as linhas aos indivduos. Cada clula corresponde a uma
observao da varivel correspondente.
O editor de dados composto por duas folhas: uma que se designa por Data View
(onde se procede introduo dos dados) e outra que se designa por Variable View (na
qual se estrutura o ficheiro de dados, explicitando os nomes das variveis e as suas
caratersticas.

13

Estatstica e SPSS

Name: define-se nesta coluna o nome da varivel.

Type: Numeric.

Width: nmero de dgitos (8).

Decimals: Nmero de casas decimais apenas considerada uma casa decimal para a
varivel nvel de ferro.

Label: Descrio da varivel, que surgir sempre que, estando no Data View, passar
com o rato no topo das variveis, bem como nos grficos e tabelas solicitados.

Values: De enorme importncia aquando da presena de variveis qualitativas, pois


nesta coluna que so definidos os cdigos e a designao das respetivas categorias de
cada varivel.

14

Estatstica e SPSS

A varivel dieta equilibrada pode assumir


dois valores ou categorias (1=Sim e
2=No).
A varivel intensidade dos treinos pode
assumir trs
valores
ou categorias,
nomeadamente: 1=Baixa, 2=Moderada e
3=Elevada).

Missing: Possibilita a codificao e


tratamento de valores omissos na base de
dados. Neste ficheiro no h valores omissos,
pelo que no se altera esta coluna.

Columns: Permite definir a dimenso


da coluna de cada varivel.

Align: Permite definir o alinhamento dos dados.

Measure: Permite a identificao da escala de medio das variveis. O SPSS


considera apenas trs escalas de medio das variveis: nominal, ordinal e mtrica (scale).
Esta escala agrega as duas escalas para variveis quantitativas, a de intervalo e a de razo.
3)
Depois de criado o ficheiro so introduzidos os dados disponveis, obtendo-se a base
de dados seguinte.
4)
Representao sob a forma de tabela de frequncias e representaes grficas.
AnalyzeDescriptive Statistics Frequencies

Selecionar a varivel;

Marcar Display frequency tables;

Em Charts escolher Bar charts e Continue.

15

Estatstica e SPSS

5)

Visualizao dos dados do output gerado


intensidade dos treinos
Frequency
Percent
Valid Percent

Valid

baixa
moderada
elevada
Total

5
2
3
10

50,0
20,0
30,0
100,0

50,0
20,0
30,0
100,0

nvel de ferro (mg)


Frequency
Percent
Valid Percent
Valid 7,8
9,9
10,5
11,0
14,3
14,5
15,4
15,9
20,8
27,0
Total

1
1
1
1
1
1
1
1
1
1
10

10,0
10,0
10,0
10,0
10,0
10,0
10,0
10,0
10,0
10,0
100,0

10,0
10,0
10,0
10,0
10,0
10,0
10,0
10,0
10,0
10,0
100,0

Cumulative
Percent
50,0
70,0
100,0

Cumulative
Percent
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
100,0

Sendo a varivel nvel de ferro quantitativa contnua e assumindo tantos valores


diferentes, a respetiva tabela de frequncias, tal como apresentada, revela ser pouco
funcional, no facilitando uma leitura rpida da informao. Para ultrapassar esta questo
dever-se- proceder categorizao da varivel, ou seja, transformao da varivel em
varivel qualitativa organizada em classes.

Vamos considerar, a ttulo de exemplo, que se constroem duas classes a partir dos
dados de que dispomos. A primeira classe congrega os indivduos com valores do nvel de
ferro menores ou iguais a 14,7 mg (valor correspondente ao valor da mdia do nvel de
ferro). A segunda integra indivduos com valores do nvel de ferro superiores a 14,7 mg.
Esta operao realiza-se do seguinte modo no SPSS.

16

Estatstica e SPSS

Aula 5.

Transformao dos dados

6)
Para proceder transformao de variveis: TransformRecode Into diferente
Variables
Neste menu importa identificar a varivel
que se pretende classificar (nivelferro),
atribuir nova varivel um nome
(classes_ferro), atribuir um label (nvel de
ferro-classes) e depois pressionar o boto
Old and New Values.

nesta janela que se d indicao ao SPSS


do critrio a seguir para a constituio das
classes. Neste exemplo, atribumos 1
classe o cdigo numrico 1, associando-o aos
indivduos com valores de nvel de ferro
menores ou iguais a 14,7 mg. O
procedimento o mesmo para definir a 2
classe. Por fim pressionamos o boto
Continue.
acrescentada base de dados
original
uma
nova
varivel
(classes_nferro). Esta varivel no est
ainda configurada. Para tal necessrio
recorrer folha variable view.Pode agora
considerar-se o nmero de casas decimais
igual a zero, preencher a coluna values
com os respetivos cdigos e por fim
designar corretamente a escala de medida da varivel (ordinal).

17

Estatstica e SPSS

O resultado da formatao efetuada o seguinte


7)
Por fim pode representar-se a distribuio
de frequncias da nova varivel atravs de uma
tabela de
frequncias, conforme surge
seguidamente
8)
(cujo procedimento
anteriormente):
nvel de ferro (classes)
Frequency
Percent
Valid Percent
Valid

[0 ;14,7]
[14,8 ;30]
Total

6
4
10

60,0
40,0
100,0

60,0
40,0
100,0

foi

descrito

umulative
Percent
60,0
100,0

9)
As representaes grficas executam-se de acordo com os procedimentos descritos
de seguida:

1.
2.

Grfico circular
Graphs Legacy DialogsPieSummaries for groups of casesDefine

3.

Destes procedimentos resulta a representao grfica seguinte:

18

Estatstica e SPSS

Histograma

Graph Legacy Dialogs Histogram inserir varivel nvel de ferro (mg) OK

Obtm-se ento o seguinte grfico:

19

Estatstica e SPSS

Transformao atravs do visual binning

Para criar uma nova varivel:


1)
Transform Visual Binning
2)
Selecionar varivel education level;
3)
Continue

Introduo do nome habilitaes nova varivel;

20

Estatstica e SPSS
4)

Criao das classes:

Se selecionar exclude e inserir os valores

9=

12=

15=

17=

High=
Se clicar em make labels aparece

9=
<9

12=
9-11

15=
12-14

17=
15-16

19=
17-18

High= 19+
No esquecer que se selecionar Included a transformao inclui o valor colocado

21

Estatstica e SPSS

5)

Varivel habilitaes criada e visvel em Data View

Em Variable View:

22

Estatstica e SPSS

Aula 6.

Representaes grficas para diferentes tipos de variveis

Na escolha da representao grfica a utilizar, fulcral ter em conta a natureza e


escala de medio da varivel e o objetivo da representao grfica (o que se pretende
evidenciar).
Representaes grficas para variveis qualitativas ou quantitativas Discretas
Grfico de Barras
Para representar a distribuio de frequncias, absolutas ou relativas, de uma varivel
qualitativa ou quantitativa discreta pode utilizar-se o grfico de barras. Este tem como
referncia dois eixos. No eixo das abcissas so representados os valores (ou categorias, no
caso de variveis qualitativas) da varivel. No eixo das ordenadas so representadas as
respetivas frequncias (absolutas ou relativas) de ocorrncia dos valores observados. A
largura das barras igual para todas as categorias ou valores e a altura proporcional
frequncia observada.
O espao existente entre as barras adjacentes evidencia a natureza qualitativa ou
quantitativa discreta da varivel.
Grficos Circulares
Esta representao grfica particularmente utilizada na representao da
distribuio de frequncias de variveis qualitativas. A sua funcionalidade diminui quando
os valores que uma varivel pode assumir so em nmero elevado.
Os grficos circulares esto divididos em reas proporcionais frequncia da
categoria que representam. O crculo representa a totalidade das observaes.
Habitualmente, estes grficos evidenciam as frequncias relativas (em percentagem)
e usam-se quando o nmero de categorias pequeno (no superior a 10).
Diagrama em escala integral
representao grfica das frequncias acumuladas (absolutas ou relativas) d-se o
nome de diagrama em escada ou digrama integral.
A altura de cada degrau corresponde frequncia registada (absolutas ou relativas)
para o valor considerado da varvel. As descontinuidades ocorrem nas abcissas dos pontos
onde surgem os saltos, pelo que a funo cumulativa contnua direita nesses pontos.

Representaes grficas para variveis quantitativas contnuas


As representaes grficas mais habituais para frequncias simples da distribuio de
uma varivel contnua so os histogramas, os polgonos de frequncias, o polgono
integral ou os grficos de linhas, estes ltimos mais utilizados nas representaes grficas
de sries temporais.

23

Estatstica e SPSS
Histograma
O histograma permite representar graficamente a distribuio de frequncias de uma
varivel contnua. No eixo horizontal representam-se as classes e no eixo vertical as
frequncias absolutas ou relativas. Utilizam-se barras com rea proporcional frequncia
da classe correspondente. As barras so contiguas para evidenciar a continuidade da
varivel, tendo uma fronteira comum.
Considerando classes com igual amplitude cada barra tem a mesma base igual a a e altura
igual respetiva frequncia (relativa ou absoluta). A rea total do grfico igual soma de
cada uma das barras. A rea de cada uma das barras e igual ao produto da largura pela sua
altura.
Refira-se que quando se trabalha com variveis continuas a amplitude das classes extremas
no est, muitas vezes, definida. Nestes casos, convenciona-se que estas classes tm a
amplitude das classes adjacentes
Polgono de frequncias
Os polgonos de Frequncias so grficos de linhas que so obtidos unindo
sucessivamente, por segmentos de reta, os pontos mdios dos topos dos retngulos do
histograma que representa as frequncias relativas. O polgono de frequncias uma das
representaes grficas que possibilita uma fcil e rpida comparao de duas ou mais
distribuies de frequncias de variveis continuas.
Para a construo de um polgono de frequncias acrescentam-se dois segmentos
terminais ao polgono de frequncias. Estes novos segmentos so obtidos unindo os
vrtices extremo, da linha poligonal j obtida, aos vrtices de duas classes adicionais, cada
uma com amplitude igual s restantes, frequncia nula, sendo uma adjacente primeira
classe e a segunda adjacente ultima. Deste modo, o nmero total de vrtices do polgono
de frequncias igual ao nmero de classes acrescido de duas unidades. A rea abaixo do
polgono de frequncias deste modo, igual rea correspondente soma das reas das
barras.
Um polgono de frequncias acumuladas ou polgono integral representado com
base nas frequncias relativas acumuladas. Neste caso, admite-se que a distribuio dos
elementos dentro das classes se faz de uma forma uniforme, o que origina no intervalo de
valores de uma mesma classe, uma representao linear.
A representao prtica do polgono integral feita unindo o conjunto dos pontos
cujas abcissas so os limites superiores das classes, e as ordenadas as correspondentes
frequncias relativas acumuladas. A este conjunto acrescenta-se um ponto esquerda cuja
abcissa o limite inferior da primeira classe e cuja ordenada zero. Finalmente, obtm-se
o polgino de frequncias acumuladas unindo estes pontos por segmentos de reta e
prolongando-a nas extremidades, por linhas horizontais.

24

Estatstica e SPSS

Construo de um Grfico de Barras no SPSS


Aquando na presena de variveis qualitativas ou quantitativas discretas:
-Baseada na varivel eco da base de dados fornecida no exerccio 3, pgina 48 do livro
Estatstica Aplicada s Cincias e Tecnologias da Sade

1)
2)
3)
4)

Analyze Descritive Statistics Frequencies


Selecionar a varivel pretendida e adicionar coluna Variable(s);
Desativar a seleo Display frequency tables;
Charts Bar Charts Continue OK

Obtm-se ento o grfico no Output, podendo depois tratar-se as caratersticas a gosto:

25

Estatstica e SPSS

Aula 7.

Anlise descritiva: mdia, Mo e Md em SPSS

1)
Caraterizar a amostra devidamente;
2)
Distribuio da amostra relativamente s habilitaes (ordinal), ao sexo (nominal) e
ao salrio atual (quantitativa).
3)
Analyze Frequencies;
4)
Selecionar a varivel que pretendemos estudar (salrio atual);
5)
Desselecciona-se a opo Display frequencie tables, visto a varivel escolhida ser
quantitativa ;

6)

Seleciona-se as medidas que pretendemos estudar.

Charts Histograma Continue.

26

Estatstica e SPSS

7)

Visualizao do Output gerado:

A curva tem uma distribuio ligeiramente assimtrica para a direita, uma assimetria
positiva, onde: mdia > mediana > moda
Nota: Quando se altera de varivel quantitativa para qualitativa, ou vice-versa,
necessrio fazer o reset dos dados para evitar um possvel vis nos resultados.

27

Estatstica e SPSS
No possvel fazerem-se descritivas, contudo, j se pode fazer a tabela das
frequncias, que na varivel anterior no era possvel!
A varivel sexo e a varivel habilitaes so ambas variveis qualitativas, logo

8)

Visualizao do Output gerado:

Para ver as descritivas das duas variveis quantitativas: variveis meses de


trabalho e experincia prvia?
1.
Analyze Descriptive Statistics descriptives

28

Estatstica e SPSS

2.
3.

(NOTA: este menu usa-se apenas para variveis quantitativas)


Selecionar as variveis de interesse.
Visualizao do Output obtido:

29

Estatstica e SPSS

Aula 8.

Estatstica Paramtrica e No Paramtrica

H 2 tipos de estatstica
1. Paramtrica *
2. No paramtrica

No Paramtrica: Considera se certos resultados so superiores ou inferiores a outros


resultados.

*Paramtrica: Calcula as diferenas numricas exatas entre os resultados.


No entanto, sempre que se pretende empregar a estatstica paramtrica existe uma lista de
requisitos que tm de ser verificados e respeitados, nomeadamente:
1.
Varivel direta tem de ser quantitativa (no caso das correlaes de varivel direta e
indireta);
2.
Ser simtrica (largura);
3.
Ser mesocrtica (com exceo do T de Student);
4.
Ter distribuio normal (s se puder aceitar a H0).
Nota: A demonstrao experimental em contexto de como verificar os pr-requisitos vai
ser feita em simultneo com a aula prtica que se encontra de seguida.

1)

Verificao do 2 pr- requisito - Ser simtrica:


Analyse Descriptive Statistics Explore
Aula prtica

Usar o SPSS Para verificao dos pr-requisitos da estatstica paramtrica e o


uso do R de Pearson:
1)
Abrir SPSS;
2)
FileOpenDataDocument(c) Program File x86Diet StudyOpen

30

Estatstica e SPSS
3)
Hiptese proposta: Verificar a existncia ou no de correlao entre a varivel tg0
e wgt0.

Como ambas as variveis so quantitativas, mas no so dados emparelhados (isto ,


no a mesma varivel medida duas vezes mas em tempos diferentes) e para se verificar
a existncia de uma correlao, exclui-se de imediato os testes T de Student para dados
Emparelhados, o W de Wilcoxon e o Anova para Medidas repetidas, sobrando ento duas
opes: o R de Pearson e o seu correspondente no paramtrico Rho de Spearman.

Observado isto, necessrio ento proceder-se ao teste dos pr-requisitos para


verificar se estamos perante estatstica paramtrica ou no paramtrica.
4)

Verificao de pr-requisitos no SPSS:


2) Analyse Descriptive Statistics Explore
3) Inserir na janela Depend List as variveis Quantitativas (caso existam
qualitativas deve-se coloc-las na janela Fator list).
4) Plots desseleccionar Stem-and-leaf, selecionar Histogram e Normality
Plots with tests

5) ContinuePaste.Obtm-se ento a Syntax:

31

Estatstica e SPSS

NOTA: Para se tirar apontamentos na Syntax, comea-se sempre com um * e terminamos com um ponto final.

1.
2.

Seleciona-se tudo e clica-se em Run Selection;


Obtm-se ento o seguinte Output:

3. Verificar se simtrica;

Para se verificar a simetria da distribuio, necessrio proceder-se diviso do coeficiente de simetria


(Skewness) pelo erro padro e o seu resultado deve estar compreendido entre -2 e 2.
Triglicerdeos:
-0.004/0.564=0.007
Peso:
0.113/0.564=0.201
-Concluso: Como os resultados esto compreendidos entre 2 e -2, a distribuio simtrica.

Simetria Graficamente: Histograma:

32

Estatstica e SPSS
1.

Boxplot ou Grfico de Bigodes:

Podemos observar que no h valores fora da caixa- outliers, permitindo-nos assim


concluir que a distribuio simtrica.

Verificar se Mesocrtica;

Para se verificar se uma varivel mesocrtica, necessrio proceder-se diviso do coeficiente de


achatamento (Kurtosis) pelo erro padro e o seu resultado deve estar compreendido entre -2 e 2.
Triglicerdeos:
-1.265/1.091=-1.159
Peso:
-1.318/1.091=-1.208
-Concluso: Como os resultados esto compreendidos entre 2 e -2, a distribuio mesocrtica.

33

Estatstica e SPSS

Ter distribuio normal:

Visualiza-se atravs do teste Shapiro-Wilk, pois a amostra tem menos de 50 casos e


s se recorre ao teste de Kolmogorov- Smimov se a amostra tivesse mais de 50 casos.
Se Sig for menor ou igual a 0.05 rejeita-se a homogeneidade, admitindo assim que
elas t~em diferenas, no tendo uma distribuio idntica e semelhante, ou seja, rejeita-se a
H0.

Concluso: como o Sig superior a 0.05, aceita-se a a H0 e diz-nos que a varivel tem
distribuio normal. Podendo-se usar ento o R de Pearson.

NOTA: Caso os resultados de um teste paramtrico no estejam de acordo com os prrequisitos (mnimo dados intervalares, distribuio simtrica, mesocrtica e normal), estes
no tm, interpretao significativa, optando, neste caso, a maior parte dos investigadores,
por testes de significncia no paramtricos, que podem ser usado mesmo quando os dados
so medidos num nvel ordinal ou at mesmo quando so nominais.

34

Estatstica e SPSS

Aula 9.

Estatstica Bivariada

Correlao:
medida a relao entre variveis, quando estas so quantitativas ou tambm as
ordens de variveis, como nas ordinais. Se ambas as variveis, dependente e independente,
forem quantitativas e cumprirem com os restantes requisitos da estatstica paramtrica,
vistos anteriormente, pode ento aqui utilizar-se o R de pearson, como foi verificado no
caso anterior, permitindo-nos assim verificar se h relao entre a ingesto de triglicerdeos
no incio do estudo e o aumento de peso num mesmo indivduo.
Para todos os dados estatsticos processados em SPSS, o Sig tem a seguinte
significncia:

Se sig <0.001 muito significativo (rejeito hiptese nula)

Se sig <0.01 muito significativo (rejeito a hiptese nula)

Se sig <0.05 significativo rejeito hiptese nula

Se sig 0.05 -0.1 tendencialmente significativo, mas aceita-se h0 (hiptese nula)

Se sig >0.05 no existe a relao entre as variveis, aceita-se h0.


Mediante isto, s existe correlao estatisticamente significativa entre as variveis em
causa se o valor de Sig for inferior a 0.05.
Na Estatstica Bivariada, aceita-se a hiptese nula, H0, quando as variveis so
independentes, no existindo relao entre as duas; rejeita-se Ho quando as variveis so
dependentes.
R de Pearson no SPSS:
1.
AnalyzeCorrelate Bivariate

35

Estatstica e SPSS

2.

Seleciona-se as variveis em interesse

3)Visualizao do Output:

Concluso: Como sig superior a 0.05, no existe relao entre as variveis.

Teste do Qui-Quadrado da Aderncia (x2):


Teste no paramtrico usado aquando da presena de apenas uma varivel, consistindo

na comparao dos dados obtidos experimentalmente, com os esperados de acordo com a


lei.

Uma varivel
Varivel qualitativa nominal
Procedimento:

1)

Analyze Non parametric testsLegacy DialogsChi-square

36

Estatstica e SPSS

Verifique se existe alguma distribuio homognea entre homens e mulheres a


trabalharem na sua rea de formao.

A varivel gender no surge com as outras variveis, devido ao facto de ser do tipo
string e no do tipo numrico, pelo que, se ter de proceder sua transformao para
que seja possvel a seguimento do processo.

37

Estatstica e SPSS
2)

Transform Recode into Different Variable

3)

Selecionar Old and New Values;

4)
nserir os nmeros 1e 2 para definirmos, respetivamente, o sexo feminino e o
masculino (1=female; 2=male). O SPSS faz distino entre maisculas e minsculas.

Varivel transformada, sendo necessrio dar os valores nova varivel.

38

Estatstica e SPSS

Pode ento retomar-se a execuo do teste.


5)
Volta-se a repetir o procedimento, mas desta vez j surge a varivel.

6)

Paste run

7)

Visualizao do Output:

39

Estatstica e SPSS

Como Sig: 0.054>0.05, logo aceita-se a hiptese nula, o que nos permite concluir que
no existem diferenas estatisticamente significativas entre a distribuio de homens e
mulheres a trabalharem no sector da nutrio, no se podendo desta forma dizer se esta
profisso significativamente mais feminina ou masculina.

Hiptese: Saber se h uma distribuio diferente em funo dos anos de


escolaridade (nvel de educao em anos).

Varivel quantitativa;
Distribuio simtrica:
1.
Analyze Descriptive Statisticsexplore;

2.

Selecionar varivel e clicar em plots

40

Estatstica e SPSS

3.

Visualizar Output gerado:

4.
Verificao dos pr-requisitos.
Copia-se a tabela no output e recorrendo ao Excel podemos colar a tabela e a dividir o
Skewness pelo seu erro padro e tambm a Kurtosis pelo seu erro padro, facilitando os
clculos.

Tests of Normality

41

Estatstica e SPSS
a

Kolmogorov-Smirnov
Statistic
Educational Level (years)

,210

df

Shapiro-Wilk

Sig.
474

,000

Statistic
,906

df

Sig.
474

,000

Concluso: Para testar esta hiptese estudou-se uma amostra cujo nmero de casos
superior a 50, devendo por isso analisar-se os dados referentes ao Kolomogorov- Smimov.
Como o valor de Sig inferior a 0.05, a varivel no apresenta distribuio normal, tendo
ento de se usar o equivalente no paramtrico.

42

Estatstica e SPSS

Aula 10. Testes de Hipteses:


Hiptese 1: Existem diferenas de anos de escolaridade em funo da categoria
profissional.
Neste caso verifica-se que existem mais de duas amostras de dados independentes
(3 categorias: Estagirio, Contratado e Chefia), remetendo assim para os testes H de
kruskal- Wallis e o Anova. Como remete para diferenas entre mdias, a categoria
profissional tem: estagirio/aprendiz contratados e chefias, como so independentes e no
paramtrico como se comprovou anteriormente, ter de ser o H de Kruskal-Wallis.
1.

Analyze Nonparametric tests Legacy Dialogs K independent samples

2.

Selecionar as variveis pretendidas;

Em Test Variable Level coloca-se sempre a varivel quanditativa (anos de escolaridade);


Em Grouping Variable Coloca-se sempre a varivel qualitativa (Categoria profissional).

43

Estatstica e SPSS
3.
Preenchimento dos espaos referentes ao mximo e ao mnimo da categoria
profissional (mn.1- porque existe no mnimo 1 categoria profissional e no mximo 3
porque no total existem 3 categorias profissionais);
4.
Visualizar o Output gerado:
Ranks
Employment Category
Educational Level (years)

Clerical
Custodial
Manager
Total

Test Statistics

Mean Rank
363

206,43

27

95,89

84

417,27

474

a,b

Educational Level
(years)
Chi-Square
df
Asymp. Sig.

209,516
2
,000

Concluso: Como Sig<0.05, rejeita-se a hiptese nula, concluindo-se ento que a hiptese
1 verifica-se, ou seja, h diferenas de anos de habilitaes literrias em funo da
categoria profissional ocupada, sendo isto comprovado pela anlise das tabelas anteriores,
pois verifica-se que os estagirios e as chefias tm maior grau de habilitaes literrias
quando comparados com os contratados.~
Hiptese 2: Quanto maior a escolaridade, maior a categoria profissional.
Neste exemplo pretende-se conhecer uma correlao, nomeadamente entre os anos de
escolaridade e a profisso, sendo que os testes de correlao conhecidos so o R de
Pearson e o RHO de Spearman. Como no pode ser o teste paramtrico, ter ento de ser o

RHO De Spearman.
1.

Menu Analyze Correlate Bivariate;

44

Estatstica e SPSS
2.
Selecionar ambas as variveis para a lista.
Mudar o visto para: Pearson
3.
Fazer paste e run
4.

5.

Visualizar o Output gerado:


Correlations
Educational
Level (years)

Spearman's rho

Educational Level (years)

Correlation Coefficient
Sig. (2-tailed)

1,000
.

N
Employment Category

Employment
Category

Correlation Coefficient

,484

,000
474

474

**

1,000

,484

Sig. (2-tailed)

,000 .

474

474

**. Correlation is significant at the 0.01 level (2-tailed).

Concluso: Como o valor de sig nulo e inferior a 0.05 significa que existe correlao,
pois rejeita-se a H0, tendo esta valor de 0.484 que segundo Bryman e Cramer
considerada uma correlao moderada (pois 0,4<0,4840,69) entre a escolaridade e a
categoria profissional ocupada. Para alm disso, como o coeficiente de correlao
positivo, podemos ainda dizer que quanto maior for o cargo exercido, maios ser o grau de
escolaridade do indivduo em causa, estabelecendo assim uma relao de
proporcionalidade direta.
A intensidade ou fora varia entre -1 e 1. Se a correlao for zero no existe correlao
entre as variveis.
Em modlo, segundo Bryman e Cramer, a correlao pode ser definida como:

0,2 Correlao muito fraca e sem significncia

0,2<r0,39 Correlao fraca

0,4<r0,69 Correlao moderada

0,7<r0,89 Correlao forte

0,9<r1 Correlao muito elevada


NOTA: A direo da evoluo nos indicada pelo sinal + ou -.
45

**

Estatstica e SPSS
Hiptese 3: Em termos proporcionais, as chefias tm habilitaes literrias mais
elevadas.
Neste ltimo caso, visto estar-se a falar de uma diferena de propores entre duas
variveis qualitativas ordinais, nomeadamente a varivel chefias e a varivel habilitaes
literrias, o teste utilizado dever ser o Teste do Qui-Quadrado da Independncia.
1.
Analize Descriptive Statistics Crosstabs

2.

Selecionar as variveis.

3.

Statistics: Colocar visto em Chi-square

46

Estatstica e SPSS
4.

Cells: Selecionar Observed e Column Continue

5.

Visualizar o Output gerado:

Concluso: Visto o valor do Sig ser nulo e inferior a 0.05, rejeita-se H0, admitindo-se
assim que existem diferenas entre as variveis, aceitando-se desta forma a hiptese
experimental, ou seja, as chefias tm habilitaes literrias mais elevadas.

A maioria so licenciados (46,4%), existindo tambm uma quantidade significativa


de indivduos com doutoramento (34,5%) na categoria de manager;

As categorias de contratado e de estagirio constitudo essencialmente por


pessoas com o 3 ciclo (48,1% e 50,1% respetivamente), existindo tambm uma diferena
significativa na quantidade de licenciados nestas categorias.
47

Estatstica e SPSS

Aula 11. Testes paramtricos:


Suponhamos que a nossa varivel anos de escolaridade tivesse distribuio normal.
Neste caso, trabalharamos com os testes paramtricos para testar todas as hipteses.

Teste ANOVA
1.
2.

No caso da hiptese 1 teramos de utilizar este teste.


Analyze Compare Means Oney-Way ANOVA
Selecionar as variveis pretendidas.

Varivel Quantitativa

Varivel Qualitativa

3.
para o caso de existirem diferenas significativas temos de proceder s comparaes
posteriori Post-Hoc.

~
4.
Selecionar Post Hoc Colocar visto no teste Tukey (Moderado) se pretender um
teste moderado, no LSD se liberal ou no Sheff se necessitar de um teste conservador.
48

Estatstica e SPSS
5.
Porque a anova exige homogeneidade da varincia ainda temos que selecionar:
Option
selecionar Homogeneity of variance test (para alm de outros que considerar
necessrios como o Descriptive) Continuepaste

6.

Visualizar o output gerado.

49

Estatstica e SPSS
Concluso: O valor do Sig inferior a 0,05, logo rejeita-se a HO. Como se rejeita a HO
dizemos que existem diferenas entre os anos de escolaridade em funo da categoria
profissional. O teste post-hoc revela que as diferenas so entre qualquer cruzamento das
variveis.

Teste T de Student para dados Independentes


Hiptese 5: Verificar se existem diferenas entre o nvel de escolaridade e o sexo.
1.
Analyze Compare Means Independent-Samples T Test

2.

Selecionar as variveis prentendidas.


Varivel Quantitativa

Varivel Qualitativa

3.
Selecionar Define Groups
4.
Inserir cdigo numrico da varivel que colocou neste campo: 1-feminino e 2Masculino
5.

Visualizar o output gerado.

50

Estatstica e SPSS

Concluso: O valor do Sig inferior a 0,05, logo rejeita-se a H0. Como se rejeita a H0
dizemos que existem diferenas entre os anos de escolaridade em funo da categoria
profissional. Os homens (14,43), em mdia, possuem mais escolaridade que as mulheres
(12,37), logo rejeita-se a hiptese experimental.

Teste T de Student para amostras Emparelhadas


Hiptese 6: Verificar se existem diferenas entre o salrio atual e o salrio anterior
(progresso na carreira).
1.
Analyze Compare Means Paired-Samples T Test

2.
Selecionar: Varivel 1-Salrio Inicial; Varivel 2- Salrio atual e passar para a
coluna Paired Variables

3.

Visualizar output gerado.


51

Estatstica e SPSS

Concluso: O valor do Sig nulo e inferior a 0,05, rejeita-se a H0. Como se rejeita a HO
dizemos que existem diferenas entre o salrio inicial e o atual de um trabalhador, havendo
portanto uma progresso.

52

Estatstica e SPSS

Aula 12. *Estatstica No Paramtrica


Quando os dados no respeitam as premissas bsicas que embaam os procedimentos
estatsticos, deve utilizar-se a estatstica no paramtrica, como por exemplo quando no
nos permitido assumir a normalidade e, noutros casos, quando os dados que dispomos
no nos permitem calcular a mdia (quando, por exemplo, os dados so ordinais).
No entanto, este um tipo de estatstica que apresenta menor sensibilidade a erros de
medida e rpidos para pequenas amostras, tambm menos poderoso do que a tcnica
paramtrica que lhe correspondente e so testes que no aproveitam toda a informao
disponvel sobre a distribuio de dados por usarem postos em vez do valor da observao
(o posto de uma observao a posio relativa s demais observaes, quando os dados
esto em ordem crescente, tendo desta forma apenas em conta se certos resultados so
superiores ou inferiores a outros resultados.
O teste de H de Kruskal-Wallis utilizado para comparar trs ou mais amostras
independentes e podemos assumir que elas so de populaes com o mesmo formato, no
necessariamente Normal, podendo ser usado com dados ordinais, intervalares ou
proporcionais
Se tanto a nossa varivel dependente quanto a independente forem nominais e se se
pretender conhecer a associao entre elas pode recorrer-se ao qui-quadrado da
independncia. No caso de ambas serem ordinais, utiliza-se o rho de spearman.

Teste W Wilcoxon
o equivalente no paramtrico do teste t de student para amostras emparelhadas,
sendo usado em particular aquando da presena de medies repetidas de uma amostra,
mas a populao original no tem necessariamente o formato de uma Normal, podendo ser
usado com dados ordinais, intervalares ou proporcionais

1.

No SPSS:
AnalizeNon Parametric Tests Legacy Dialogs2 Related Samples

53

Estatstica e SPSS
2.

Seleciona-se as variveis desejadas;

3.
4.

Em Test Type seleciona-se WilcoxonOK


Analisa-se o Output obtido.

Teste U de Mann-Whitney
o equivalente no paramtrico do teste t de student para amostras independentes,
podendo-se utilizar para testar a hiptese nula que afirma que as mdias populacionais so
as mesmas para os dois grupos, no exigindo que as populaes tenham a mesma
varincia, sendo ento usado em designs com duas situaes, no-relacionado, quando so
utilizados sujeitos diferentes em cada uma das situaes experimentais.
No SPSS:
1.
AnalizeNon Parametric TestesLegacy Dialogs2 Independent Samples

54

Estatstica e SPSS
Adiciona-se as variveis em causa;
Varivel Quantitativa
Varivel Qualitativa

2.
3.

Em Test Type seleciona-se Mann-Whitney U;


Selecionar Define Groups

4.
5.
6.

Inserir cdigo da varivel qualitativa: 1- e


Continue.
Visualizao do Output gerado.

2-

Exerccio: Ao longo do porteflio, algumas tarefas realizadas com a base de dados do SPSS
employee data com a varivel Education Level, ela nem sempre est bem classificada.
Porqu? __________________________________________________________________
__________________________________________________________________________

55

Estatstica e SPSS

Aula 13. Do SPSS ao EXCEL e do EXCEL ao SPSS


Do spss para o excel basta guardar como e escolhe o tipo de ficheiro excel e pronto ja
est
Tambm pode fazer atravs do copiar e colar.
Mas do EXCEL para o SPSS, a primeira etapa a organizao dos dados, na primeira
linha devem estar as variveis e na primeira coluna os casos. Os casos, na maioria das
vezes, estaro separados por linhas. Assim, cada linha representar um caso.
Como o SPSS um software que prefere dados numricos, o melhor ter os atributos
das suas variveis em nmeros (por exemplo substituir sim por 1 e no por 2).
MUITO SIMPLES.
Que quiser fazer grficos no EXCEL a partir de tabelas do SPSS, basta copiar do
output e colar no EXCEL, depois pedir e trabalhar os grficos desejados.

56