Você está na página 1de 151

ELEMENTOS DE ESTATÍSTICA APLICADA À EDUCAÇÃO E SAÚDE

Dr. Sebastião Marcos Ribeiro de Carvalho


DPE – FFC - Câmpus de Marília – UNESP
(MANUSCRITO NÃO FINALIZADO: INÍCIO 1998 a 20_05_2014)
smrc60@gmail.com

1
ELEMENTOS DE ESTATÍSTICA APLICADA À EDUCAÇÃO E SAÚDE
Dr. Sebastião Marcos Ribeiro de Carvalho – DPE – FFC - Câmpus de Marília - UNESP
(ATENÇÃO: MANUSCRITO NÃO FINALIZADO)

MÓDULO I – ESTATÍSTICA DESCRITIVA

1. Conceitos e definições usuais: pag. 1


2. Descrição de dados: pag.
3. Elementos típicos de uma distribuição de freqüências : pag.
4. Medidas de centralidade ou de posição: pag.
5. Medidas de variabilidade ou de dispersão: pag.
6. Medidas de assimetria e de curtose: pag.

1. Conceitos e definições usuais:

1.1 Estatística: é o conjunto de métodos utilizados para observar, coletar, organizar e


analisar dados provenientes dos fenômenos coletivos ou de massa (finalidade descritiva) e,
por fim, investigar a possibilidade de fazer inferências indutivas válidas a partir dos dados
observados e buscar métodos capazes de permitir esta inferência (finalidade indutiva)
(Berquó et al.,1 981).
1.2 Bioestatística: Denominamos bioestatística a estatística aplicada as ciências da
vida.
1.3 Quem utiliza a bioestatística ?
Entendemos que existem dois tipos de pessoas que utilizam a Bioestatística : o
Pesquisador e o Usuário da Pesquisa.
1.4 Para o Pesquisador: a bioestatística é uma ferramenta de grande auxilio para o
planejamento de sua pesquisa e para a tomada de decisões, após a análise e interpretasção
dos dados coletados na mesma.
1.5 Para o Usuário da Pesquisa: a bioestatística auxilia-o na leitura e interpretação
dos trabalhoas científicos em geral, necessários para o seu aprimoramento e atualização
profissional.

2
1.6 Protocolo de Pesquisa (Resolução 196/96 - CNS): Todo trabalho científico têm
início através de um protocolo de pesquisa. A pesquisa pode ser realizada tanto em animais
de laboratório como em seres humanos. Em ambos os casos existe legislação pertinente que
deve ser obedecida levando-se em conta a ética e a moral.
1.7 População: Definimos população como o conjunto de elementos que têm ao
menos uma característica em comum.
As populações podem ser finitas, como, por exemplo, os alunos matriculados em uma
determinada escola em um determinado ano, ou infinitas, como, por exemplo, os resultados
obtidos ao se jogar uma moeda sucessivamente. Existem populações que, embora finitas,
são consideradas infinitas para qualquer finalidade prática, como, por exemplo, o número
de cobais existentes no mundo em um determinado momento.
Exemplos: População de alunos de uma escola em um dado ano; as gestantes que dão
à luz em uma maternidade; os animais que foram atendidos na Clínica Médica Veterinária
durante um dado ano, etc.
1.8 Amostra: Uma amostra, por definição, entenderemos todo subconjunto não
vazio e com menor número de elementos que o conjunto definido como população.
1.9 Parâmetros e estimativas de parâmetros: Denominamos de parâmetros as
medidas estatísticas obtidas com base na população e de estimativas de parâmetros as
medidas obtidas com base na amostra.
1.10 Por que usar amostras ? Justifica-se o uso de amostras para realizarmos
investigações científicas tendo em vista o dispêndio de numerário, treinamento de pessoal e
de tempo para que se usasse a população e, em casos onde a unidade amostral é detruída
após aplicarmos o tratamento.
1.11 Dado, informação, conhecimento, variável:
Denominamos tecnicamente de dados às informações obtidas, seja com base nos
elementos que constituem a população ou que constituem a amostra.
O dado é a matéria prima para gerar a informação. O inter-relacionamento das
informações resulta no conhecimento, que é usado para orientar a direção das investigações
ou das ações.

3
Praticamente vamos entender variável como toda característica de uma população ou
amostra, sobre a qual se coleta dados. Como exemplo de variável, temos: o sexo, a idade, o
peso corporal, a saúde, a religião, grupo étnico, procedência, e outras.
1.12 Classificação das variáveis: As variáveis podem ser classificadas em
categóricas ou qualitativas (nominais e ordinais) e numéricas ou quantitativas (discretas e
contínuas).
1.13 Variável qualitativa nominal: As variáveis qualitativas nominais, são aquelas
que podem ser distribuídas em categorias mutuamente exclusivas, como o sexo- masculino
e feminino.
1.14 Variável qualitativa ordinal: As variáveis qualitativas ordinais são aquelas que
podem ser designadas em categorias mutuamente exclusivas, mas tais categorias
apresentam um ordenamento natural , como estágio de uma doença - ausente, incial,
moderado, grave.
1.15 Variáveis quantitativas discretas e contínuas: As variáveis quantitativas
podem ser entendidas como: discretas ou descontínuas quando são provenientes de
contagens , e contínuas quando obtidas a partir de mensurações.
Sendo quantitativa discreta, por exemplo, o número de pacientes presentes no
Ambulatório de um determinado Hospital num determinado dia, o número de RX tirados
nos pacientes em determinada data, número de hemáceas num determinado exame
patológico; e quantitativas contínuas, por exemplo, peso corporal, idade, pH da urina,
capacidade vital .
1.16 Níveis de mensuração: As variáveis necessitam para a sua compreensão do
nível de mensuração, ou seja a escala, em foi mensurada. São quatro os níveis de
mensuração:
i) Nominal: é o nível mais simples de mensuração; consiste na contagem ou
enumeraçào de uma variável em suas diversas categorias, as quais são mutuamente
exclusivas, havendo entre as categorias a relação de equivalência entre e dentre as
categorias.
A presença do número nessa escala é simplesmente para classificação. Não podemos
realizar operações aritméticas elementares com esses números.

4
Exemplo : sexo : masculino e feminino , ou: 0 e 1.
ii) Ordinal ou por postos: a variável é dividida em categorias ordenadas
naturalmente, havendo entre as categorias uma relação de equivalência e uma relação de
ordem dentre as categorias (maior que ou mais que).
Exemplo: Estágio de uma inflamação gengival : sem inflamação, inicial,
moderada e severa, ou 0, 1, 2 e 3, ou ainda, 0, +, ++ e +++.
Neste nível, os números são chamados escores, para os quais também não realizamos
operações aritméticas. Eles funcionam como classes, porém com um ordenamento natural.
iii) Intervalar: É a primeira escala quantitativa; atribui-se à variável um número real
(uma unidade constante e comum de mensuração). Existência de um ponto zero e de uma
unidade de mensuração arbitrários. Apresenta as relações de equivalência dentro do mesmo
valor da escala, a relação de ordem (maior do que ou mais que) entre dois valores quaisquer
e razão conhecida entre dois intervalos quaisquer .
Exemplo: Temperatura, altitude, data - todas as variáveis podem ser mensuradas de
modo que o ponto zero e as respectivas escalas sejam arbitrários.
iv) Razão ou proporcionalidade: É a escala que apresenta um zero verdadeiro (zero
significa ausência do que se está mensurando); possui as mesmas características da
intervalar, havendo uma proporção entre dois valores quaisquer . Apresenta as relações de
equivalência dentro de cada valor; a relação de ordem entre dois valores; razão conhecida
entre dois intervalos quaisquer e proporção conhecida (razão) entre dois valores quaisquer.
Exemplo: Peso corporal de recém-nascidos, glicemia, capacidade vital, idade.
Neste nível podemos realizxar todas as operações aritméticas com os números, os
quais exprimem uma medida.

2. Descrição de dados

Ao realizarmos um estudo estatístico completo de um fato, é necessário


desenvolvermos diversas fases do método estatístico, sendo as principais : definição do
problema, planejamento, coleta dos dados, apuração dos dados, apresentação dos dados,
análise e interpretação dos dados .

5
Os dados após coletados, apurados, organizados e resumidos (através de contagem e
grupamento), precisam ser apresentados para que possam descrever a população ou amostra
adequadamente, permitindo uma rápida análise do fenômeno em estudo. Podemos
descrever os dados através de: tabelas, gráficos e medidas.

2.1 Descrição tabular de dados:

A descrição tabular de dados é uma apresentação numérica dos dados. Dispomos os


dados em linhas e colunas ordenadamente, segundo algumas regras adotadas pelos
estatísticos. No Brasil as regras foram fixadas pelo Conselho Nacional de Estatística. Aos
conjuntos de dados coletados e sumarizados em tabelas, referentes a qualquer variável,
denomina-se em estatística de série estatística. Para diferenciar uma série estatística de
outra , leva-se em conta três características presentes na tabela que as representa: a época
(fator corporal ou cronológico) a que se refere o fenômeno analisado, o local (fator
espacial) onde o fenômeno acontece e o fenômeno ( espécie do fato ou fator especificativo)
que é descrito.
Classificamos as séries estatísticas em:
i) Série temporal (cronológica ou histórica): o elemento variável é a época, sendo
fixos o local e o fenômeno;
ii) Série geográfica (territorial ou espacial): o elemento variável é o local, sendo fixos
a época e o fenômeno;
iii) Série específica (categórica ): elemento variável é o fenômeno, sendo fixos o local
e a época;
iv) Série mista: combinação de duas ou mais séries de i) a iii) acima.
v) Seriação ou distribuição de freqüências: neste caso particular são fixos todos os
elementos: a época, o local e o fenômeno. A particularidade dessa série é que o fenômeno
ou fator especificativo apresenta-se através de gradações (dados grupados de acordo com
sua magnitude). Os dados são dispostos ordenadamente em linhas e colunas, de modo a
permitir a sua leitura tanto no sentido horizontal como no vertical.

6
A Tabela 1. é exemplo de uma série mista (temporal / categórica).

Tabela 1. Evolução do número de empregos nos estabelecimentos de saúde - Brasil , 1 980/92


EMPREGOS 1 980 % 1 986 % 1 988 1 990 1 992 1 % Total %
Médicos 146 091 17,87 194 608 18,93 nc nc 297 076 2 29,43 637 775 19,72
Odontólogos 16 696 2,04 26 926 2,62 nc nc 37 4533 3,71 81 075 2,51
Enfermeiros 15 158 1,85 27 088 2,63 nc nc 37 4463 3,71 79 692 2,46
Farmacêuticos 4 630 0,57 5 846 0,57 nc nc 6 2333 0,62 16 709 0,52
Nutricionistas 1 930 0, 24 3 189 0,31 nc nc 4 4403 0,44 9 559 0,29
Assist. sociais 4 385 0, 54 7 137 0,69 nc nc 9 2733 0,92 20 795 0,64
Outros nível sup 8 462 1, 03 18 069 1,76 nc nc 34 498 3,42 61 029 1,89
Técnicos/Aux. 380 277 46,51 414 059 49,27 nc nc 583 065 57,76 1 377 401 42,59
Função Adm. 240 037 29,36 331 197 32,21 nc nc 379 177 37,56 950 411 29,38
Total 817 666 100,00 1 028 119 100,00 - - 1 009 484 100,00 3 234 446 100,00
Fonte: dados, n.0 20, nov.96 - MS(adaptada)
1- Excluídos os empregos em clínicas de complementação diagn/terap.
2- Inclui médicos residentes
3- Estimado a partir do total de empregados “outros de nível superior”

2.1.1 Elementos das tabelas:

As tabelas são constituídas pelos seguintes elementos essenciais: título, corpo,


cabeçalho e coluna indicadora.
a) Título: explica o tipo de dado que a tabela contém, devendo ser colocado no alto
da tabela antes dos dados. Toda se houver mais de uma tabela devemos numerá-las em
ordem crescente com algarismos arábicos. Como exemplo temos o título da Tabela 1.:
Tabela 1. Evolução dos empregos nos estabelecimentos de saúde - Brasil,
1980/92.
A simples leitura do título indica que estão apresentados, na tabela, o número de
empregos de 1 980 a 1 992.
b) Corpo da Tabela: é o conjunto de linhas e colunas que contém os dados;
contendo em cada casa ou célula - cruzamento de uma linha e de uma coluna - a freqüência
com que a categoria (ou categorias) aparece. Como exemplo, observe o corpo da Tabela 1.,
o qual apresenta o número 37 4463 na casa ou célula formada pelo cruzamento da terceira
linha e oitava coluna, o qual representa o número de Enfermeiros empregados nos
estabeleciemntos de saúde do Brasil em 1 992.

7
146 091 17,87 194 608 18,93 nc nc 297 076 2 29,43 637 775 19,72
16 696 2, 04 26 926 2,62 nc nc 37 4533 3,71 81 075 2,51
15 158 1, 85 27 088 2,63 nc nc 37 4463 3,71 79 692 2,46
4 630 0, 57 5 846 0,57 nc nc 6 233 3 0,62 16 709 0,52
1 930 0, 24 3 189 0,31 nc nc 4 440 3 0,44 9 559 0,29
4 385 0, 54 7 137 0,69 nc nc 9 273 3 0,92 20 795 0,64
8 462 1, 03 18 069 1,76 nc nc 34 498 3,42 61 029 1,89
380 277 46,51 414 059 49,27 nc nc 583 065 57,76 1 377 401 42,59
240 037 29,36 331 197 32,21 nc nc 379 177 37,56 950 411 29,38

c) Cabeçalho: Especifica a informação (as categorias, as modalidades da variável)


apresentada em cada coluna. Observe o cabeçalho da Tabela 1. destacado a seguir:
EMPREGOS 1 980 % 1 986 % 1 988 1 990 1 992 1 % Total %

O cabeçalho acima deixa claro que na primeira coluna estão indicados os Empregos.
Nas segunda, quarta, sexta, sétima e oitava colunas são indicadas as freqüências, ou seja o
número de pessoas em cada emprego, e nas colunas terceira, quinta e nona estão indicadas
as porcentagens das pessoas em cada emprego em cada ano estudado, e na décima primeira
coluna estão indicadas as porcentagens de cada emprego em relação ao total de empregos.
Na sexta e na sétima coluna não são apresentadas as respectivas frequências por não
disporem dos dados.
d) Coluna indicadora: especifica o tipo de informação que cada linha contém.
Como exemplo, mostramos a seguir a coluna indicadora da Tabela 1. :
Medicina
Odontólogos
Enfermeiros
Farmacêuticos
Nutricionistas
Assist. sociais
Outros nível sup
Técnicos/Aux.
Função Adm.
Total

Examinando a coluna indicadora da Tabela 1., na qual é mostrado que da primeira a


nona linha temos dados a respeito de cada profissão ligada à área de saúde, e que a última
linha apresenta dados sobre todas as profissões, ou seja, apresenta o total.

8
As tabelas podem conter ainda os seguintes elementos complementares: fonte, notas e
chamadas:
e) Fonte: índica a entidade responsável pelo fornecimento dos dados. A fonte é dada
no rodapé da tabela, não se indicando a fonte nos casos em que a tabela é apresentada pelo
próprio pesquisador, ou pelo próprio grupo de pesquisadores, ou pela própria instituição
que obteve os dados. Não se indica também a fonte quando os dados são fictícios
(simulados).
Como exemplo, observando a Tabela 1., temos: Fonte: dados, n.0 20, nov.96
(adaptada) .
f) Notas: são esclarecimentos de ordem geral, colocadas no rodapé da tabela logo
após a fonte (se houver), que servem para esclarecer o conteúdo das tabelas ou para explicar
o método utilizado no levantamento dos dados. São numeradas em arábicos, podendo-se
usar símbolos gráficos, sendo bastante comum o asterisco.
Observando a Tabela 1., temos:
1- Excluídos os empregos em clínicas de complementação diagn/terap.
g) Chamadas: explicam ou conceituam determinados dados, servem para esclarecer
minúcias em relação a eles. São numeradas em algarismos arábicos; costuma-se usar
também símbolos gráficos ou letras.
Exemplificando, podemos observar na Tabela 1. :
2- Inclui médicos residentes
3- Estimado a partir do total de empregados “outros de nível superior”

2.1.2 Normas para a apresentação de tabelas:


a) Nenhuma casa da tabela deve ficar em branco, apresentando sempre um número ou
sinal, a saber:
- (hífen), quando o valor numérico é nulo;
. . . (reticência), quando não se dispõe de dado;
? (ponto de interrogação), quando há dúvidas quanto à exatidão do valor numérico;
§ (parágrafo), quando o dado retifica informado anteriormente publicada;

9
0; 0,0; 0,00 (zero), quando o valor numérico é muito pequeno para ser expressso pela
unidade utilizada. Se os valores são expressos em números decimais, acrescenta-se o
mesmo número de casas decimais ao valor zero;
x (letra x), quando o dado for omitido a fim de evitar individualização da informação.
b) Em publicações que compreendem muitas tabelas, estas devem ser numeradas em
ordem crescente, em arábico, conforme a ordem de aparecimento.
c) As tabelas devem ser fechadas no alto e embaixo por linhas horizontais, não sendo
fechadas à direita e à esquerda por linhas verticais. É facultativo o emprego de traços
verticais para a separação de colunas no corpo da tabela.
d) O cabeçalho deve ser delimitado por linhas horizontais.
e) Os totais e subtotais serão destacados.
f) Deverá ser mantida uniformidade quanto ao número de casas decimais. (ABNT
apud Berquó, 1981).
Devemos colocar nas linhas a variável (eis) independente (s) e nas colunas a
variável(eis) dependente (s).
Na Tabela 2. notamos um exemplo de seriação ou tabela de distribuição de
frequências:

Tabela 2. Pacientes com hipertensão segundo a idade em anos completos


IDADE Ponto médio da classe (xi) Número de pacientes (fi)

20 [  30 25 2
30 [  40 35 11
40 [  50 45 10
50 [  60 55 9
60 [  70 65 8

TOTAL 40
Fonte: Montenegro, M.R.G., Incidência e Extensão de Lesões de Arteriosclerose em Aortas e Artérias Coronárias. Estudo Baseado
em 250 casos, tese de livredocência; Faculdade de Medicina, USP, 1 962. (Berquó et al., 1 981 , pág. 74)

Um tipo de tabela bastante comum na área biológica e na área de saúde é a tabela de


dupla entrada. É utilizada quando necessitamos apresentar , em uma única tabela mais de
uma série, as quais aparecem conjugadas. Essa tabela é apropriada para apresentação das

10
distribuições a dois atributos, havendo duas ordens de classificações: uma horizontal (linha)
e outra vertical (coluna). Na Tabela 3. abaixo, apresentamos um exemplo.

Tabela 3. Distribuição de casos de Trombose Venosa e controles de acordo com uso de anticoncepcionais
TROMBOSE VENOSA
USO DE CONTRACEPTIVOS ORAIS CASOS CONTROLES

Sim 25 350
Não 5 570

TOTAL 30 920
Fonte: Rouquaryol (1994, p.180)

2.2 Descrição gráfica de dados

Gráficos são figuras que se destinam a dar uma idéia sobre o comportamento de uma
ou mais variáveis. É um método de apresentação de dados estatísticos, não necessitando de
explicações adicionais, devem trazer todas as informações necessárias para o entendimento
do que se propõe, sendo claros e simples, de forma a permitir uma perfeita compreensão
dos dados apresentados.
Todo gráfico deve apresentar título e escala, dispensando esclarecimentos adicionais
no texto. O título pode ser colocado abaixo do gráfico. As escalas devem crescer da
esquerda para a direita e de baixo para cima devem existir setas indicativas da direção dos
eixos. Indica-se as variáveis representadas na extremidade de cada eixo (Vieira, 1988).
Os gráficos serão construídos com base em um sistema de eixos cartesianos
ortogonais, iniciando-se a escala na origem do sistema, ou se for necessário fazer uma
interrupção no eixo, com indicação clara da posição do zero. Devemos observar que não é
obrigatório os zeros das escalas coincidirem.
Ao lado do eixo vertical deve ser escrita a legenda relativa ao mesmo. Em baixo do
eixo horizontal deve ser escrita a legenda relativa ao mesmo. As legendas explicativas, que
se fizerem necessárias, devem ser colocadas à direita do gráfico.
Nos gráficos em “colunas” ou em “barras” os retângulos representativos das mesmas
devem ter a mesma base de forma que as variações sejam representadas pelas ordenadas.

11
Antes de iniciar a construção de um gráfico verificar a escala de freqüência a ser
usada levando em conta os valores extremos da distribuição. Quando as freqüências
apresentarem valores extremos muito distanciados deve-se utilizar a escala logarítmica.
Logo abaixo do gráfico deve constar, por exemplo, Figura 1 e o título do mesmo.
Todo gráfico deve ser construído numa escala que não desfigure os fatos ou as
relações que se deseje destacar.
Os gráficos podem ser cartogramas ou diagramas:
i) Cartogramas : mapa geográfico ou topográfico em que as freqüências das
categorias de uma variável são projetadas nas áreas específicas do mapa, utilizando-se cores
ou traçados cujos significados constam em legendas anexadas as figuras .Em epidemiologia
, os mapas alfinetados são de grande emprego para apreciar o aparecimento e expansão de
certas moléstias.,
ii) Diagramas : gráficos em que a magnitude das freqüências é representada por certa
mensuração de uma determinada figura geométrica. Se a medida utilizada for o
comprimento tem-se o diagrama de ordenadas ;Se a medida utilizada for a área ou
superfície da figura, tem-se o diagrama de barras, histograma, setores circulares e
diagramas circulares ; quando se usa o volume da figura temos o estereograma. Na
representação de um diagrama deve ser levada em conta a natureza da variável: qualitativa
ou quantitativa (Berquó et al. 1981).

b.1) Descrição gráfica de variável qualitativa


Podemos descrever graficamente uma variável qualitativa através dos seguintes
gráficos: linear, de ordenadas, de barras, de colunas, de círculos, de setores circulares e
estereogramas.
Diagramas de círculos : às áreas dos diversos círculos devem ser proporcionais as
magnitudes das freqüências.,
Diagrama linear : no caso de variáveis qualitativas não se justapõe os retângulos nem
se unem as ordenadas dos diagramas; há , entretanto, um caso que foge `a regra geral , o das
séries históricas (referem-se às divisões do tempo : meses do ano, dias da semana, ano-
calendário), obtendo-se o que denominamos diagrama linear . Nesse caso unimos as

12
extremidades das ordenadas por segmentos de retas, obtendo-se uma interpretação dinâmica
do fenômeno (Berquó et al., 1 981) .

b.2) Descrição gráfica de variável quantitativa


Nas distribuições de freqüências a uma variável quantitativa precisamos fazer a
distinção se a variável é discreta ou contínua.
Nas distribuições discretas os diagramas mais usados são os de ordenadas e os de
barras. Nas distribuições contínuas os gráficos usados são o polígono de freqüências e o
histograma , sendo que o sistema de eixos utilizados é o sistema cartesiano ortogonal ,
colocando-se nas abcissas os valores das classes das variáveis em estudo e nas ordenadas,
os valores das freqüências.
No caso de uma distribuição contínua com classes de intervalos diferentes
precisamos fazer o ajuste das freqüências, pois, caso contrário, a magnitude da figura
geométrica não será proporcional à freqüência com que ocorre a variável. O ajuste é feito
calculando-se a densidade de cada classe, que é definida como o quociente entre a
frequência relativa proporcional de cada classe e a amplitude da respectiva classe.
Para representar variável quantitativa temos ainda o polígono de freqüências
acumuladas, no qual o interesse é o do conhecimento da freqüência total dos valores.
Ilustraremos a descrição gráfica de variável qualitativa, a partir da Tabela 4 a seguir.

Tabela 4. Diagnóstico de biópsias de mama, feitas entre 1963 e 1972, inclusive, no H.S.R.J.
Diagnóstico Frequência
Displasia 1010
Tumor benigno 344
Tumor maligno 329
Inflamatória 54
Outros 288
Total 2025
Fonte: Vieira (1988, p.34)

13
1200
1010
1000

800

Frequência 600

400 344 329


288

200
54
0
Displasia Tumor benigno Tumor maligno Inflamatória Outros
Diagnóstico

Figura 2 . Diagnóstico de biópsias de mama, feitas entre 1963 e 1972, inclusive,


no H.S.R.J.

Outros 288

Inflamatória 54

Tumor maligno 329

Tumor benigno 344

Displasia 1010

0 200 400 600 800 1000 1200

Figura 2a - Diagnóstico de biópsias de mama, feitas entre 1963 e


1972, no H.S.R.J.

Inflamatória Outros
3% 14%
Tumor maligno
16%

Tumor benigno Displasia


17% 50%

Figura 3 - Diagnóstico de biópsias de mama, feitas entre 1963 e 1972,


inclusive, no H.S.R.J.

14
1200

1000

800

600

400

200

0
Displasia Tum or benigno Tum or m aligno Inflam atória Outros
Figura 4 -
Diagnóstico de biópsias de mama, feitas entre 1963 e 1972, inclusive, no
H.S.R.J.

Usaremos para a descrição gráfica de variáveis quantitativas a Tabela 2.


Tabela 2. Pacientes com hipertensão segundo a idade em anos completos
Classes X (ponto médio das classes) f
20 [------- 30 25 2
30 [------- 40 35 11
40 [------- 50 45 10
50 [------- 60 55 9
60 [------- 70 65 8
Total 40
Fonte: Montenegro, M.R.G., Incidência e Extensão de Lesões de Arteriosclerose em Aortas e
Artérias Coronárias. Estudo Baseado em 250 casos, tese de livredocência; Faculdade de Medicina,
USP, 1 962. (Berquó et al., 1 981 , pág. 74)

Idade
Figura 5 - Histograma e Polígono de freqüências de pacientes com hipertensão segundo a
idade em anos completos

15
3. Elementos típicos de uma distribuição de freqüências
(item 3 capturado 20_05_2014 internet livre: http://www.bertolo.pro.br/psicologia/EstatisticaDescritiva/Estatistica
AplicadaPsicologia2.pdf)

Elementos típicos de uma distribuição de freqüências são medidas que nos ajudam a
determinar as tendências de concentração de dados em uma dado distribuição de valores.
A distribuição de freqüências permite-nos descrever, de modo geral, os grupos de
valores assumidos por uma variável. Dessa forma, podemos localizar a maior concentração
de valores de uma dada distribuição. Esta concentração se encontra onde? No início, no
meio, ou no final dos valores?
Quando confrontamos distribuições e queremos destacar as tendências de cada uma,
isoladamente, necessitamos de conceitos que expressem através de números estas
tendências. Esses conceitos são denominados elementos típicos da distribuição(ou
estatísticas) e são:
a. Medidas de Centralidade(posição, locação ou tendência central)
b. Medidas de Dispersão (variação, variabilidade)
c. Medidas de Assimetria
d. Medidas de Curtose

4. Medidas de centralidade ou de posição

Como o próprio nome indica, a medida de centralidade visa a determinar o centro da


distribuição. As medidas de tendência central estabelecem o valor em torno do qual os
dados se distribuem. Dentre as medidas de tendência central destacamos a média ou média
aritmética, a mediana e a moda.

i) Média : x (lê-se x- barra ou x- traço ; têm a mesma unidade que os dados)


Definimos a média para dados não-grupados como:
xi
x = --------- , onde : x = média;  = soma; xi = dados; n = n.º de dados
n

16
Exemplo 1: Obter o peso corporal médio de cinco recém-nascidos vivos na
Maternidade do HC, com os pesos corporais de 2 950 g, 2 750 g, 3 500 g, 3 150 g e 3 250 g.
2 950 + 2 750 + 3 500 + 3 150 + 3 250
x = --------------------------------------------------------- = 3 120 g
5
Portanto, na amostra estudada, os recém-nascidos vivos apresentavam peso corporal
médio igual a 3 120 g.
Para elementos repetidos ou agrupados, a expressão fica:
 xi fi
x = ---------------- , onde n =  fi , i = 1, 2, ... , p
n

ii) Mediana : Md (têm a mesma unidade que os dados)


Definimos mediana de um conjunto ordenado de dados, como sendo o valor que
divide o conjunto em duas partes com igual quantidade de dados, sendo que metade dos
dados são inferiores ou iguais a ela e a outra metade dos dados são superiores ou iguais a
ela.
Se o número de dados é ímpar, a mediana é o valor que ocupa a posição central dos
dados ordenados, ou seja, a posição dada por (n + 1) / 2.

Exemplo 2: Consideremos os dados do exemplo 1 da página 8, verificamos que n =


5 (ímpar). Ordenando-os crescentemente, obtemos: 2 750 g, 2 950 g, 3 150 g, 3 250 g ,
3 500 g , como n = 5, a Md ocupa a posição (n+1)/2,  Posição da Md é: (5+1)/2 = 3a.
posição no conjunto de dados  Md = 3 150 g
Portanto, metade dos recém-nascidos apresentaram peso corporal inferior ou igual a
3 150 g, e metade igual ou superior a 3 150 g.
Quando o número de dados é par, a mediana é o valor da média aritmética dos dois
valores que ocupam a posição central dos dados ordenados, ou seja :
x’ está na posição n/2 e x” está na posição (n+2)/2  Md = (x’ + x” ) / 2
Exemplo 3: Acrescentando o valor 3 000g ao conjunto de dados do exemplo 1,
obtemos: 2 750g, 2 950g, 3 150g, 3 250g, 3 500g , 3 000g , com n = 6 (par).
Ordenando os dados : 2 750g, 2 950g, 3 000g, 3 150g, 3 250g, 3 500g  temos:

17
Posição de x’: n / 2 = 6/2 = 3a posição : x’= 3000 g
Posição de x”: (n+2)/2 = (6+2)/2 = 4a posição : x “ = 3150 g , portantto
Md = (x’ + x”) / 2 = (3 000 + 3 150) / 2 = 3 075 g
Portanto, metade dos recém-nascidos da amostra apresentou peso corporal inferior ou
igual a 3 075 g, e metade igual ou superior a 3 075 g.

Observação:
A média é influenciada por valores extremos de um conjunto de observações, ao
passo que a mediana não é muito influenciada com a presença de alguns valores muito altos
ou muito baixos (dizemos então, que a mediana é mais robusta que a média).
Em vista da mediana não ser influenciada por valores extremos da distribuição de
valores utiliza-se a mediana como medida de centralidade em distribuições “assimétricas”.

iii) Separatrizes: São medidas que se baseiam na sua posição na distribuição de


valores, as quais denominamos quartil, decil e percentil.
Quartil: Divide a distribuição em 4 partes iguais em um conjunto ordenado de
valores.

 (Q1) Primeiro Quartil – valor cuja posição na série é tal que a quarta parte (25%)
dos dados é menor do que ele e as três quartas partes restantes (75%) são maiores
que ele.
 (Q2) Segundo Quartil – coincide com a mediana. (Q2=Md)
 (Q3) Terceiro Quartil – valor cuja posição na série é tal que três quartas partes
(75%) dos termos são menores que ele e uma quarta parte (25%) é maior.

Decil: Divide a distribuição em 10 partes iguais em um conjunto ordenado de valores.


 Decis ( P1, P2,...P9) são os 9 valores que separam uma série de dados em 10 partes
iguais.
 Observação: P5=Md

18
Percentil: Divide a distribuição em 100 partes iguais em um conjunto ordenado de
valores.
 Percentis ( P1, P2,...P99) são os 99 valores que separam uma série de dados em 100
partes iguais.
 Observação: P50=Md P25=Q1 P75=Q3

Graficamente:
Md

Medidas de variabilidade:
Intervalo interquartil = Q3 – Q1
Intervalo semi-quartil = (Q3 – Q1) / 2
Quartil médio = (Q1 + Q3) / 2
Amplitude de percentis 10-90 = P90 – P10
Exemplo 1: Para os dados a seguir { 5, 2, 6, 9, 10, 13, 15 }, calcular, mediana,
quartís 1, 2 e 3.
Solução:
 Ordenando:{ 2, 5, 6, 9, 10, 13, 15 }
 O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md =
9 = Q2.
 Dois grupos de valores: {2, 5, 6 } e {10, 13, 15 }
 Para o calculo do quartil 1 e 3 basta calcular as medianas dos dois grupos de
valores.
 Em { 2, 5, 6 } a mediana é = 5 , portanto Q1 = 5;
 Em {10, 13, 15 } a mediana é =13 , logo o Q3 = 13

19
Exemplo 2: Para a distribuição de valores { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 }, obter Md,
Q1 e Q3
 A série já está ordenada.
 Quartil 2 = Md = (5+6)/2 = 5,5
 Quartil 1 = mediana da série à esquerda de Md :
{ 1, 1, 2, 3, 5, 5 }  Q1 = (2+3)/2 = 2,5
 Quartil 3 = a mediana da série à direita de Md :
{6, 7, 9, 9, 10, 13 }  Q3 = (9+9)/2 = 9

iv) Moda: Mo (têm a mesma unidade que os dados)


Definimos moda de um conjunto de dados como sendo o valor que ocorre com a
maior frequência.
O conjunto de dados onde não ocorre nenhum valor que se repete maior número de
vezes é chamado amodal. Existem conjuntos de dados com duas ou mais modas, os quais
chamamos bimodal ou plurimodal, respectivamente.
Exemplo 4: No conjunto de valores 6, 7, 8, 4, 6, 8, 9 , temos Mo = 8

5. Medidas de variabilidade ou de dispersão

As medidas de centralidade dão o valor da abscissa do ponto em torno do qual os


dados se distribuem. Para descrevermos adequadamente uma amostra é importante saber
além da medida de centralidade, tambem a dispersão ou variabilidade dos dados em relação
ao valor central
Para descrevermos adequadamente uma distribuição de dados, além da medida de
tendencia central , há a necessidade de um índice que resuma a variabilidade ou dispersão
dos dados. Vários índices foram elaborados, dentre os quais destacamos a amplitude total, a
variância, o desvio padrão e o coeficiente de variação.

i) Amplitude total ou range: A (mesma unidade dos dados)


Definimos amplitude total A de uma amostra como sendo a diferença entre o maior e
o menor dado observado.

20
Exemplo 5: Considerando o peso corporal dos recém-nascidos do exemplo 1, temos
que a amplitude total é : A = 3 500 - 2 750 = 750 g

ii) Variância amostral: s2 (a unidade da variância é o quadrado da unidade dos


dados )
A variância mede a variabilidade ou dispersão dos dados em torno da média e, é dada
por:
 ( xi - x) 2
(1) s2 = ----------------- , o denominador n-1 , recebe o nome de graus de liberdade.
n - 1

Exemplo 6: Consideremos os dados 3, 5, 5, 7 (u). Para determinar a variância


amostral s2 , podemos construir uma tabela com os seus desvios da média amostral. A
média amostral é x = 20/4 = 5.
_______________________________
xi xi - x (xi - x) 2 Logo:
_______________________________
3 -2 4 s2 = 8 / (4 - 1) = 2,7 (u2)
5 0 0
5 0 0
7 2 4
______________________________
 x = 20 (xi-x)=0 (xi-x)2 = 8
______________________________
Para dados repetidos ou agrupados a expressão matemática é:
 (x i - x) 2 . fi
(2) s2 = ----------------------- , onde i = 1, 2, ... , n .
n - 1
Desenvolvendo algebricamente (1) e (2), obtemos as fórmulas de uso mis fácil para
quem dispõe de calculadora eletrônica:
 x2 - ( x)2 / n  x2. f - (x . f)2 / n
2 2
(3) s = -------------------- , ou (4) s = ----------------------------------
n - 1 n - 1

iii) Desvio-padrão (unidade é a mesma dos dados)


A variância apresenta a desvantagem de apresentar unidades de medida igual ao
quadrado da unidade de medida dos dados. Em muitas ocasiões precisamos de uma medida

21
de variabilidade ou dispersão que apresente as propriedades da variância, mas que tenha a
mesma unidade dos dados. Definimos então, o desvio padrão como a raiz quadrada com
sinal positivo, da variância, o qual representamos por s .
Matematicamente: s =  (s2 )
Exemplo 6 : Considerando os dados do exemplo 5, temos que s2 = 2,7 , portanto
s = (2,7)1/2 ou seja, s =  2,7 = 1,6

iv) Coeficiente de variação (medida de variabilidade relativa)


Para compararmos duas distribuições de dados quanto à variabilidade, definimos uma
medida de variabilidade relativa, a qual relaciona a grandeza do desvio padrão com a
grandeza da média, denominada coeficiente de variação de Pearson, medida admensional,
expressa em porcentagens :
s
CV = ------- . 100 % , que independe da natureza e magnitude da variável X.
x
Exemplo 7: Considerando os resultados dos exemplos 6 e 7, temos que:
1,6
CV = -------- x 100 %=32,00 %
5

6. Medidas de assimetria e de curtose


(adaptado de texto capturado 20_05_2014 na internet livre: 20_05_2014: www.pucrs.br/famat/campezat/.../Descritiva_
Coneitos_Basicos.doc)

6.1 Medidas de Assimetria


A assimetria de um conjunto de dados, agrupados ou não, pode ser avaliada
através da seguinte relação devida a Karl Pearson: As = 3( X - Md) / s
Se As for igual a zero, então a distribuição é dito simétrico. Se As > 0 então a
assimetria é positiva, significando que o gráfico da distribuição tem uma cauda alongada
à direita. Caso As < 0 a assimetria é negativa e a cauda do gráfico será alongada à
esquerda.
Se uma distribuição é simétrica então: X = Md = Mo.
Se a distribuição é assimétrica positiva então: X > Md > Mo.

22
Se a distribuição é assimétrica negativa então: X < Md < Mo.

O calculo da Assimetria (equação de Pearson) resultará em valores sempre entre


-1 e 1, de modo que:

1) Simétrica (assimetria zero): A média, a mediana e a moda coincidem. Média = Mediana=


Moda, -1,96 < sk < 1,96
2) Assimétrica para a direita ( positivamente assimétrica): A média e a mediana estão à direita
da moda. Média > Mediana > Moda, sendo sk ≥ 1,96.
3) Assimétrica para a esquerda ( negativamente assimétrica) : A média e a mediana estão à
esquerda da moda. Média < Mediana< Moda, sendo sk ≤ - 1,96.

 < Md < Mo  = Md = Mo Mo < Md < 


(3) Assimétrica negativa (1) Simétrica (2) Assimétrica positiva

6.2 Medidas de curtose

Entende-se por curtose o grau de achatamento de uma distribuição. Com referência


ao grau de achatamento, podemos ter:

23
(a) Leptocúrtica (b) Mesocúrtica (c) Laptocúrtica

Uma medida usada para avaliar o grau de achatamento de uma distribuição de


freqüências é dada pela equação:

1 n
n
 ( xi  x) 4
k  i 1 4 , onde s é o desvio - padrão.
s

Se k,coeficiente de curtose, for:

k = 0,263, diremos que a curva correspondente à distribuição de freqüência é Mesocúrtica

k > 0,263, diremos que a curva correspondente à distribuição de freqüência é Platicúrtica

k < 0,263, diremos que a curva correspondente à distribuição de freqüência é Leptocúrtica

24
ELEMENTOS DE ESTATÍSTICA APLICADA À EDUCAÇÃO E SAÚDE
Dr. Sebastião Marcos Ribeiro de Carvalho – DPE – FFC - Câmpus de Marília - UNESP
(ATENÇÃO: MANUSCRITO NÃO FINALIZADO)

MÓDULO II – PROBABILIDADE

7. Probabilidade: pag. 24

7. Probabilidade

7.1 Estudo de um fenômeno coletivo

Fenômeno : qualquer acontecimento natural


A sua descrição pode ser realizada através de um modelo matemático que permite
explicar da melhor forma possível esse acontecimento.
Tipos de fenômenos:
a) determinísticos: são aqueles que repetidos sob mesmas condições iniciais
conduzem sempre a um só resultado. As condições iniciais determinam o único resultado
possível.
b) aleatórios: são aqueles que repetidos sob mesmas condições iniciais podem
conduzir a mais de um resultado. As condições iniciais não determinam o resultado do
fenômeno, teoricamente as repetições ocorrem nas mesmas condições iniciais; na prática
isto dificilmente ocorre - mesmo quando procuramos manter as mesmas condições iniciais,
pequenas variações certamente ocorrerão . Isto provocará alterações no resultado final:
Se as alterações forem mínimas, poderão na prática ser desprezadas e podemos
considerar o resultado final único  fenômeno determinístico.
Se as alterações forem significativas; resultado final imprevisível  fenômeno
aleatório.
A teoria das probabilidades permite construir modelos matemáticos que explicam
um grande número de fenômenos coletivos e fornecem estratégias para a tomada de
decisões.

25
7.2 Experimento aleatório: é um conjunto de operações destinadas a descobrir,
conferir ou demonstrar um determinado fenômeo aleatório, possuindo as seguintes
características:
i) repetitividade: pode ser repetido quantas vezes desejarmos sob condições
essencialmente iguais;
ii) resultado: não pode ser conhecido a “priori”, mas pode ser descrito o conjunto de
todos os resultados possíveis;
iii) regularidade estatística: a frequência relativa de ocorrência de um particular
resultado se aproxima a um valor constante quando o número de realizações do
experimento é muito grande;diz respeito à possibilidade da ocorrência dos resultados do
fenômeno, cuja avaliação numérica dará origem às probabilidades.

7.3 Espaço amostral S : é o conjunto de todos os possíveis resultados do


experimento.
Ex: i) Lançamento de uma moeda: S = { c, k }
ii) Lançamento de um dado: S = {1,2,3,4,5,6}

7.4 Evento elementar ou resultado (A): é cada um dos resultados possíveis de um


experimento aleatório.
Ex: Lançamento de um dado: S = { 1, 2, 3, 4, 5, 6 }
A = o resultado é um número par: A = {2, 4, 6}
B = o resultado é par e primo: A = { 2 }
Observações:
i) evento vazio ou impossível Φ: carente de resultados elementares
ii) evento certo S: o próprio espaço amostral
iii) espaço amostral finito qualquer conjunto de resultados constitui um evento
iv) no nosso curso só consideraremos espaços amostrais finitos e com seus resultados
igualmente possíveis.

26
7.5 Definição de probabilidade

Seja S um espaço amostral finito e com todos os seus resultados igualmente prováveis
e seja ainda A um evento de S = { a1, a2, a3, ..., an }. A probabilidade do evento A, notada
por P(A) é definida por:
n.o de resultados de A n(A) NCF (n.o casos favoráveis)
P(A) = --------------------------------------- = ------- ou P(A) = ----------------------------------
n.o de resul. do espaço amostral S n(S) NCT (n.o casos totais)

com as seguintes propriedades:

i) P() = 0 ii) P(S) = 1 iii) 0  P(A)  1 iv)  P(A) = 1

7.6 Probabilidade frequencialista

Deve ser aplicada quando não se conhece a regularidade dos resultados.


Chamamos de frequência relativa ao quociente entre o número particular de valores
observados e o número total de valores observados.
Este processo baseia-se na evolução da frequência relativa do resultado ai , à medida
que o número de repetições do experimento cresce.
Matematicamente:
fi
p(ai) = lim fr , onde fr = ------- , com
n n

i) 0  p(ai )  1 e ii)  p(ai ) = 1

7.7 Função de probabilidade: é a maneira de associarmos a cada evento elementar


de S = { a1, a2, a3, ..., an } a sua possibilidade de ocorrência p(ai ), de modo que:

1. 0  p(ai )  1 e 2.  p(ai ) = 1

7.8 Variável aleatória: definimos variável aleatória como o resultado numérico de


um experimento aleatório.

27
7.9 Cálculo de Probabilidades

7.9.1 Probabilidade do evento complementar:


P(evento complementar) + P(evento) = 1
P(evento compl.) = 1 - P(evento), ou seja (P ~A) = 1 - P(A)
1
Ex. : Ao jogarmos um dado a probabilidade de sair face “1” é P(1) = ------
6

A probabilidade de não sair a face “1”é: P(~1) = 1 - P(1) = 1 - 1/6 = 5/6,

Ou seja, P(~1) = 0,8333 ou 83,33%

7.9.2 Probabilidade condicional

P(AB) NCF(AB)
P (A/B) = -------------- ou P(A/B) = -----------------
P(B) NCF(B)

P(A/B) é a probabilidade de ocorrer o evento A sob a condição de ter ocorrido o


evento B.
Ex:Qual a probabilidade de ter ocorrido a face “5”em um dado que foi jogado e
ocorreu face ímpar ?

NCF(5) 1
P(5/Ímpar) = --------------- = ------ = 0,3333 ou 33,33%
NCF(ímpar) 3

7.9.3 Eventos independentes: dois eventos são independentes quando a


probabilidade de ocorrer um deles não é modificada pela a ocorrência do outro.

P(A/B) = P(A)

28
Ex.: A probabilidade de ao lançarmos uma moeda e um dado de sair cara na moeda
tendo saido face 5 no dado são eventos independentes.

7.9. 4Teorema do produto:

i) A e B independentes : P(A.B) = P(A) . P(B)

Ex.: Um casal têm dois filhos. Qual a probabilidade de um dos filhos ser homem e o
outro mulher ?

P(A.B) = P(A) . P(B) = ½ . ½ = ¼ = 0,25 ou 25 %

ii) A e B não independentes: P(A.B) = P(A) . P(B/A)

Ex.: Uma urna contém duas bolas vermelhas e uma branca. Retiram-se duas bolas da
urna ao acaso, uma em seguida da outra e sem que a primeira tenha sido recolocada. Qual a
probabilidade de as duas serem vermelhas ?
Solução: P(primeira ser verm.) = 2/3 = 0,6667 ou 66,67 %
P(segunda ser verm./primeira foi verm.) = ½ = 0,50 ou 50%

P(prim.ser verm. e a segunda ser verm.) = P(p.s.v.).P(s.s.v./p.f.v.)=


= 0,6667 x 0,50 = 0,3333 ou 33,33%

7.9.5 Teorema da Soma: P(A ou B) = P(A) + P(B) - P(A e B)

Ex.: Obter a probabilidade de retirarmos uma carta ao acaso de um baralho e a a


mesma ser uma carta de copas ou um rei.
P(carta copas) = 13/52 P(rei) = 4/52 P(rei e copas) = 1/52
P(copas ou rei) = P(carta copas) + P(rei) - P(rei e copas)
P(copas ou rei) =13/52 + 4/52 - 1/52 =16/52 = 4/13 = 0,3077 ou 30,77%

29
7.10 Média, variância e desvio padrão de uma variável aleatória:
a)Média (Esperança ou valor esperado):  = E(x) =  x . p(x)
b) Variância: Var(x) = 2 =  (x - )2 . p(x) =  x2. p(x) - 2
c) Desvio padrão:  = [Var(x)]1/2 = (2) ½

7.11 Exemplos:
1. Distribuições de frequências relativas para um dado, para vários tamanhos de
amostra (uso da tábua de números aleatorios):
Tabela 1. Dist. de frequências relativas para um dado, para vários tamanhos de
amostra:
X = n.o de pontos f/n ; n = 10 f/n ; n = 50 f/n ; n=
1 0,10 0,22 1/6=0,167
2 0,00 0,12 1/6=0,167
3 0,10 0,14 1/6=0,167
4 0,20 0,14 1/6=0,167
5 0,30 0,14 1/6=0,167
6 0,30 0,24 1/6=0,167
1,00 1,00 1,00
Fonte: Wonnacott & Wonnacott (1985, p.40)
2. Suponhamos que p(menino) = p(menina) = 1/2. Faça o gráfico e a tabela da
distribuição de probabilidades da variável aleatória:
X = número de meninas em uma família com três filhos.

Solução:

Os possíveis valores de X são: 0, 1, 2, e 3 meninas, mas não são todos igualmente


prováveis, o que podemos verificar observando a árvore de probabilidades a seguir:

30
3.0
2.0 m m,m,m 1/8
1.0 m
h m,m,h 1/8
m
m m,h,m 1/8
h
h m,h,h  1/8

m h,m,m 1/8
m
h h,m,h  1/8
h
m h,h,m  1/8
h
h h,h,h  1/8

31
3. Considerando o exemplo 2, pede-se:
a) Qual a chance das meninas estarem em minoria? [p(X 1) = ?]
b)Qual a chance de não ter menina na família? [p(X < 1) = ?]
c) Qual a chance de ao menos uma menina?[p(X 1)=?]

Solução:
a) p(X 1) = p(X=0) + p(X=1) = 1/8 + 3/8 = 4/8 = ½ = 0,5 = 50 %
b) p(X<1) = p(X=0) =1/8 = 0,1250 = 12,5 %
c) p(X1)= p(X=1) + p(X=2) + p(X=3) = 3/8 + 3/8 + 1/8 =
= 0,3750 + 0,3750 + 0,1250 = 0,8750

4. A otite média é uma moléstia do ouvido que representa uma das causas mais
frequentes de consulta médica nos primeiros dois anos de vida da criança. Seja X a
v.aleatória que representa o número de otite média nos dois primeiros anos de vida da
criança. Supondo que o número de episódios de otite tenha a distribuição dada na Tabela 2.
abaixo (Curi, 1998, p.77):

x 0 1 2 3 4 5 6
p(x) 0,129 0,264 0,271 0,185 0,095 0,039 0,017

Obter: a) número esperado de episódios de otite nos dois primeiros anos;


b) a variância e o desvio padrão da variável aleatória número de episódios de otite
média.

Solução:
a) E(X) = 02.(0,129) + 12.(0,264) + 22.(0,271) +...+ 62.(0,017) – 2,042  Espera-se que
uma criança tenha dois episódios de otite média nos seus dois primeiros anos de vida.
b) Var(X)=02.(0,129) + 12.(0,264) + 22.(0,271)+...+62.(0,017) - 2,042 = 6,12 - 2,042 = 1,96
Var(X )= 1,96 (episódios de otite média)2   = (1,96)1/2 = 1,40 episódios de otite

32
7.12 Importância do desvio padrão:

O Teorema de Tchebyschev estabelece que para qualquer conjunto de dados, o


intervalo (x - k , x + k ) contém pelo menos a proporção (1 - 1/k2) das observações.
Portanto, podemos concluir que para qualquer distribuição de probabilidades, temos:
a) A probabilidade de X ter um valor contido no intervalo (x - 2 , x + 2 ) é maior
ou igual a 1 - 1/22 = 0,75.
b) A probabilidade de X ter um valor contido no intervalo (x - 3 , x + 3 ) é maior
ou igual a 1 - 1/32 = 0,89.

Para distribuições simétricas de probabilidades, em forma de sino (distribuição


normal), temos a seguinte lei empírica:
a) aproximadamente 68 % dos valores da variável aleatória situa-se no intervalo
compreendido pelos limites  -  e  +  ;
b) aproximadamente 95 % dos valores da variável aleatória situa-se no itervalo
compreendido pelos limites  - 2 e  + 2;
c) aproximadamente 99 % dos valores da variável aleatória situa-se no intervalo
compreendido pelos limites  - 3 e  + 3 .

Quanto maior for a simetria da variável aleatória X em relação à média, tanto mais
válida será a afirmativa.

8. Distribuições de Probabilidades:

8.1 Introdução:
As distribuições de probabilidades têm utilidade na teoria relativa a Inferência
Estatística, metodologia que permite fazer afirmações sobre características de uma
população, baseando-se em resultados de uma amostra retirada dessa população.

33
Quando usamos a Estatística na resolução de problemas biomédicos, verificamos que
muitos problemas apresentam as mesmas características, o que nos permite estabelecer um
modelo teórico para a determinação da solução destes problemas.

Os principais componentes de um modelo estatístico teórico são:


1. Os possíveis valores que a variável aleatória X pode assumir.
2. A função de probabilidade associada à variável aleatória X.
3. O valor esperado da variável aleatória X.
4. A variância e o desvio padrão da variável aleatória X.

8.2 Modelos teóricos discretos de probabilidades:


São modelos, para os quais a variável aleatória é discreta, ou seja, os valores que pode
assumir podem ser associados aos números naturais {0, 1, 2, 3, ...}.
Entendemos por distribuição discreta de probabilidades o conjunto de todos os
valores xi , que podem ser assumidos pela variável aleatória discreta X , associados às
respectivas probabilidades, onde  P(xi ) = 1 .
Exemplo : Constituem uma distribuição de probabilidades discreta os resultados que
podem ocorrer no jogo de um dado com as respectivas probabilidades
Variável aleatória binária: é aquela variável aleatória discreta que só assume um de
dois valores possíveis.
Exemplos:
i) Paciente chagásico ou não-chagásico.
ii) Amostra de sangue pode ser do tipo Rh+ ou RH-.
iii) Uma criança pode ter olhos claros ou não.
iv) Uma pessoa pode ser do sexo feminino ou do masculino.

8.2.1 Média, variância e desvio-padrão de uma variável aleatória


a) Média (esperança) de uma variável aleatória discreta: x = E(X) =  xi . P(X=xi)
b) Variância: Var(X) = x2 =  xi2 . P(X=xi) - x2
c) Desvio-padrão: x =  Var(X)

34
8.2.2 Modelo de Bernoulli

Se uma variável aleatória X só pode assumir os valores 0 (fracasso) e 1 (sucesso),


com P(X=0) = q e P(X=1) = p e p + q = 1, em um único experimento, então dizemos que a
variável aleatória X é um experimento de Bernoulli ou que a variável aleatória X admite
Distribuição de Bernoulli.

Descrição do modelo:
1. Os possíveis valores que a variável aleatória X pode assiumir são 0 e 1.

2. A função de probabilidade associada a variável aleatória X é P(X=0) = q e


P(X=1) = p.

3. O valor esperado da variável aleatória x é  (X) = p:


-----------------------------------
x: 0 1
-----------------------------------
P(X=x): q p
-----------------------------------
x.P(X=x): 0 p
-----------------------------------
 (X) = p
-----------------------------------

4. A variância da variável aleatória X é: 2 (X) = p.q e o desvio-padrão da variável


aleatória X é  (X) = ( p.q ) ½ .

De 3.: E(X) = p ; x2 = 0 ou 1;  x2 . P(X=x) = 0 + p, logo E(x2) = p


Como 2 (X) = E(x2) - [E(X)]2 = p - p2 = p(1 - p) ou seja: 2 (X) = p.q
Logo:  (X) = ( p.q ) ½

35
Exemplo:
Experimento: lançamento de uma moeda, a variável aleatória X anota o número de
caras obtidas. Determine, a variância e o desvio-padrão da variável aleatória X.

Solução:
Os possíveis resultados de X são 0 e 1, com probabilidades P(x=0)= 1/ 2 e P(X=1)
= 1 / 2, logo temos um experimento de Bernoulli
Portanto: 1. E(X) =  (X) = p = 0,5
2. 2 (X) = p.q = 0,5 . 0,5 = 0,25
3.  (X) = (p.q) ½ = (0,25) ½ = 0,5

7.2.3 A Distribuição Binomial:

Características:
i) Se no enunciado de um problema, podemos identificar um experimento B, unitário,
que admite somente dois resultados:
S  sucesso, com probabilidade p(S) = p
F  fracasso, com probabilidade p(F) = q,
ii) Se o experimento B for repetido n vezes independentemente (em cada repetição
p(S) = p, p(F)= q ),
iii) Se estamos interessados na ocorrência de x sucessos e (n-x) fracassos,
independentemente da ordem de ocorrência, então diremos que a v. aleatória X admite
distribuição binomial de probabilidades, definida por:
n
P(X=x) = . px . qn-x
x

Descrição: B ~ (n , p ), onde
n = n.o repetições
p = probabilidade de sucesso em cada repetição.

36
1. X = variável aleatória sucesso, com número de sucessos x = 0, 1, 2, 3, ..., n
n
2. P(X=x) = . px.q n - x , x = número de sucesso em n ensaios
X

3.  (x) = n.p
4. 2 (x) = n . p . q
5.  (x) = √ n . p .

Ex.1: Teste de 20 questões, com 5 alternativas, das quais apenas uma é correta. Se o
estudante responder as questões ao acaso:
i) qual é a probabilidade que consiga acertar exatamente 10 questões ?
ii) qual a esperança de acertos ?
iii) qual a variância dos acertos ?
iv) qual o desvio padrão dos acertos ?
Solução:
i) E: responder uma questão, com p(s) = 1/5 e p(f) = 4/5, sendo n = 20 repetições
independentes, com 10 sucessos.
20
Como p(X=x) = (1/5)10 . (4/5)20 - 10 = 0,0020 ou 0,2 %
10

ii) (x) = np = 20 x 0,2 = 4 questões


iii) 2(x) = npq = 20 x 1/5 x 4/5 = 3,2 (questões)2
iv) (x) = √ npq = √ 20 x 0,2 x 0,8 = 1,8 questões

Ex.2: A probabilidade de um menino ser daltônico é 8%. Qual é a probabilidade de


serem daltônicos todos os 5 meninos que se apresentaram, em determinado dia, para um
exame oftalmológico ?

Solução:
n = 5 ; p = 0,08 ; q = 1 - 0,08 = 0,92 ; x = 5

37
n 5
P(X=x) = x
. p .qn-x
 p(X=5) = . (0,08)5.(0,92)5-5 = 0,0000032 ou 0,00032 %
x 5

7.3 Modelos teóricos contínuos de probabilidades:

São modelos para os quais a v. aleatória é contínua, ou seja, as v. aleatórias assumem


infinitos valores em um dado intervalo.
Os processos definidos a partir de contagens conduzem aos modelos que envolvem
variáveis aleatórias discretas, enquanto os processos definidos a partir de medidas
conduzem a modelos que envolvem variáveis aleatórias contínuas.

7.3.1 Função Densidade de Probabilidade:

Para descrever a distribuição de probabilidades de uma variável aleatória contínua X,


consideremos a função definida a seguir, denominada função densidade de
probabilidade,com as seguintes características:
i) f(X)  0
ii) P( a  x  b ) = área sob a curva de densidade de probabilidade entre as duas
constantes a e b.
iii) A área da região compreendida sob o gráfico da função e o eixo Ox é igual a 1.

f(X)

Área=1
_____.__.__.__.___._____
A a x b B x
Observações:
a) P(X=x) = 0, isto é, com uma variável contínua, a probabilidade de X=x é sempre
igual a zero. Somente tem sentido calcular probabilidades em intervalos.
b) Como P(X = a) = P(X = b ), temos: P(a  x  b) = P (a < x  b ) = P (a  x < b)
= P (a < x < b)

38
7.3.2 Parâmetros de uma variável aleatória contínua:

a) Média (Esperança ou valor esperado):  = E(x) =  x .f(x).d(x)

b) Variância: Var(x) = 2 =  [x - x]2 . f(x) . d(x)

c) Desvio-padrão:  = [Var(x)]1/2 = (2) 1/2

7.3.2 A Distribuição Normal

7.3.2.1 Definição

A Distribuição Normal ou Gaussiana é a mais importante distribuição de v. aleatória


contínua e é básica para o desenvolvimento da inferência estatística.
As medidas biológicas, tais como o peso, altura, pressão sanguínea e outras, tendem a
ter distribuição populacional aproximadamente normal.
Ao estudarmos essas variáveis, com distribuições aproximadamente normal,
verificamos que muitos valores concentram-se nas proximidades da média e que à medida
que se afasta desse valor central começa a ocorrencia de valores, resultando uma
distribuição simétrica.

i. Definição da f.d.p. :

1 (X -  )2
f(X) = -------------- . e - ------------------ ,
para : -  < X < +  ;  > 0
 . ( 2  )1/2 2 ²

Notação: X ~ N( ; 2)


Parâmetros da distribuição normal: i) a média  e ii) a variância 2

39
ii. Características da Distribuição Normal:
a) a variável aleatória pode assumir qualquer valor real;
b) o gráfico da f.d.p. normal é uma curva em forma de sino, simétrica em torno da
média , como mostra a Figura 2.;
c) a área totasl sob a curva vale 1, porque essa área corresponde à probabilidade de a
variável aleatória assumir qualquer valor real;
d) como a curva é simétrica em torno da média, os valores maiores do que a média e
os valores menores do que a média ocorrem com igual probabilidade;
e) a configuração da curva é dada por dois parâmetros: a média  e oa variância 2.
Mudando a média, muda a posição da distribuição, como mostra a Figura 3. Mudando a
variância, muda a dispersão da distribuição, como mostra a Figura 4.(Vieira, 1998)

Figura 2 - Gráfico da distribuição normal ~ N ( ; 2)

Figura 3 - Distribuições normais de mesma média e com variâncias diferentes

40
Figura 4 Duas distribuições normais de mesma variância e com médias diferentes

6.3.3 Distribuição normal padronizada

Chamamos de distribuição normal padronizada de uma variável aleatória Z a uma


distribuição normal de média 0 e variância igual a 1, cuja notação é Z ~ N(0,1).

Figura 2 - Gráfico da distribuição normal ~ N (0;1)

A vantagem de conhecermos a distribuição normal padronizada é que as


probabilidades, dadas pelas áreas sob a curva f(Z), são tabeladas. Assim, a partir de uma
única tabela podemos calcular probabilidades para quaisquer variáveis aleatórias X através
da transformação Z = ( x - x ) / x , pois:
z = E(Z) = E[( x - x ) / x] = (1/z)E(x - x) = (1/z)[E(x) - E(x)] = (1/z)(x - x ) = 0
z2 = Var(X) = Var [( x - x ) / x] = (1/x2) [ Var(X) - Var(x) ] = (1/1/x2)( x2 - 0 ) = 1

41
7.3.4 Uso da Tabela Normal Padronizada

Dentre os tipos de tabelas normais existentes, dependendo da área que elas fornecem,
o modo de calcular as probalidades nestes elementos será utilizando a tabela que fornece a
área entre Z = 0 e Z1 > 0, conforme Figura 5(a),(b).

(a) (b)

(c)

Figura 6 - Área entre 0 e Z1 correspondente a P(0< z < Z1 )

Notas:
a) A área total sob a curva normal padronizada = 1
b) Área à direita de 0 (zero) = 0,5
c) Área à esquerda de 0 (zero) = 0,5
d) Área entre 0 e Z1 = P(0 < z < Z1 )

42
Ex.1: Considere uma população cuja PAM apresenta  = 110 mm Hg e  = 10 mm
Hg. Calcule as probabilidades (Curi, 1998 , p.95)
a) PAM entre 110 e 125
b) PAM entre 95 e 105
c) PAM entre 100 e 105
d) PAM > 122
e) PAM < 94
f) PAM no intervalo que inclui dois desvios ao redor da média
g) quais os dois valores da PAM no item f ?
h) qual é o valor da PAM a partir da qual se tem 10% das PAM mais altas?
Solução:
a) P(110<X<125) = P(0< z <1,5) = 0,4332 ou 43,32 %
b)P(95<X<110) = P(-1,5< z <0) = 0,4332 ou 43,32 %
c) P(100<X<105)=P(-1< z <-0,5) = 0,1498 ou 14,98%
d) P(X > 122) = P(z > 1,2) = 0,5-P(0 < z < 1,2) = 0,1151 ou 11,51%
e) P(X < 94) = P(z < - 1,6) = P(z > 1,6) = 0,0548 ou 5,48 %
f) P( - 2 < X <  + 2) = P( -2 < z < 2 ) = 0,9544 ou 95,44%
g) x1 =  - 2 = 90 e x2 =  + 2 = 130  P(90 < X < 130) = 0,9544 ou 95,44 %
h) Tabela : P(X > Xc ) = 0,10 = P( z > zc )  P(0 < z < zc) = 0,40  zc = 1,28 
zc = 1,28 = (Xc - 110)/10, logo:
X c = 122,8 mm Hg, portanto 10% das pressões são superiores a 122,8 mm Hg, ou seja: P(
X > 122,8 ) = 0,10.

43
ELEMENTOS DE ESTATÍSTICA APLICADA À EDUCAÇÃO E SAÚDE
Dr. Sebastião Marcos Ribeiro de Carvalho – DPE – FFC - Câmpus de Marília - UNESP
(ATENÇÃO: MANUSCRITO NÃO FINALIZADO)

MÓDULO III – MÉTODOS DE INFERÊNCIA

8 Métodos de inferência: pag. 43


9. Diferenças estatísticamente significativas e diferenças relevantes nas Ciências da
Saúde: pag. 52

8. Métodos de Inferência
8.1 O que é teste de hipóteses?

A inferência diz respeito como se pode assumir conclusões para o todo (população) ,
tendo examinado apenas uma parte (amostra). Na pesquisa científica a inferência é
realizada com auxílio de testes estatísticos.

Segundo VIEIRA (1 984), é importante que o pesquisador tenha em mente o que um


teste estatístico pode fazer por ele. O teste responde à pergunta: “O que causou a
diferença?”. No entanto é este o ponto que o pesquisador deve atingir: explicar a diferença.
É importante deixar bem claro que a conclusão de causa é baseada, não no teste estatístico,
mas no planejamento correto do experimento. Deve ficar claro que um teste estatístico não
indica a causa da diferença, o teste estatístico informa se a diferença é significante, ou seja,
se é pouco provável que a diferença tenha ocorrido por acaso.

A Estatística têm como um dos seus principais objetivos a tomada de decisões a


respeito da população, com base na observação de amostras, ou seja, a obtenção de
conclusões válidas para toda a população com base em amostras retiradas dessa população.

Para tomarmos decisões para toda a população, formulamos hipóteses relativas a


elas, as quais denominamos hipóteses científicas. Essas suposições que podem ser
verdadeiras ou não, em termos estatísticos são chamadas hipóteses estatísticas e consistem,

44
no geral, em considerações a respeito das distribuições de probabilidade das populações
(BANZATTO & KRONKA, 1 989).

Os processos que nos permitem decidir se aceitamos ou rejeitamos uma determinada


hipótese, ou se a amostra observada difere significativamente dos valores esperados, são
denominados de testes de hipóteses.

Exemplo 1: “Uma área de grande interesse na pesquisa médica é verificar a


influência familiar em fatores de risco cardiovascular em geral e níveis de lipídios, em
particular.Suponha que a média de nível de colesterol em crianças seja de 175 mg%/ml.
Separando um grupo de homens com algum episódio da doença cardíaca são anotados os
níveis de colesterol de seus filhos. A hipótese do pesquisador é que “pais com doença
cardíaca no passado devem ter filhos com colesterol mais elevados” “(CURI, 1 997).

8.2 O que são hipótese nula e hipótese alternativa? Como determinar qual é
qual?

Em termos estatísticos a hipótese científica é desdobrada em duas hipóteses


estatísticas: uma hipótese inicial que formulamos denominada de hipótese de nulidade e
denotada por H0 e uma outra denominada de hipótese alternativa e denotada por H1 ou Ha .

Ao formularmos uma hipótese estatística Ho , o nosso objetivo é rejeitá-la.


Admitindo essa hipótese Ho como verdadeira, se verificarmos que os resultados obtidos em
umas amostra diferem acentuadamente dos esperados para essa hipótese, com base na teoria
das probabilidades, podemos concluir que as diferenças observadas são significativas, e
rejeitamos a hipótese de nulidade em favor de uma outra denominada Ha .

Para determinarmos qual é a H0 , formulamos a hipótese de nulidade Ho , em geral,


como a negação da hipótese científica formulada pelo pesquisador, sendo que a hipótese
alternativa Ha , em geral coincide com a proposta pelo pesquisador ( CURI, 1 997).

45
Portanto, testar hipóteses consiste em decidir a respeito de duas situações possíveis:
ou H0 é verdadeira ou H1 é verdadeira. Para maior facilidade de interpretação e notação,
faremos referencia sempre a hipótese nula H0 .

A aceitação de H0 implica na rejeição de H1 e, caso contrário, a rejeição de H0


representa a aceitação de H1.
Exemplo 2. Levando-se em cnta o exemplo 1. da questão 1., em termos estatísticos a
hipótese científica é formulada como:
H0 : não existe diferença dos níveis de colesterol quando se compara filhos de pais
com antecedentes de doença cardíaca e as crianças em geral.
Ha : pais com doença cardáca no passado devem ter filhos com colesterol mais
elevado.
Ou seja:
H0 : o nível médio de colesterol de filhos de pais com antecedentes cardíacos é 175
mg%/ml.
Ha : o nível médio de colesterol de filhos de pais com antecedentes cardiacos é
maior que 175 mg%/ml.

8.3 O que são erro tipo I (erro ) e erro tipo II (erro )?

A tomada de decisões a respeito da população será sempre com base na observação


de amostras retiradas dessa população, portanto estaremos expostos a cometer erros. No
caso os erros são de dois tipos: rejeitar H0 quando H0 é verdadeira ou aceitar H0 quando na
realidade essa hipótese for falsa.
A probabilidade de rejeitar H0 quando H0 é verdadeira é a chamada
probabilidade de erro Tipo I, a qual indicamos por , e corresponde ao nível de
significância do teste.
A probabilidade de aceitar H0 quando falsa é a chamada de probabilidade de
erro Tipo II, a qual indicamos por .

46
Estado da Natureza
Decisão H0 é V H0 é F
Aceita-se H0 Decisão correta Erro tipo II = 
Rejeita-se H0 Erro tipo I =  Decisão correta

Esses dois tipos de erros, Tipo I e Tipo II, estão de tal forma associados que, se
diminuirmos a probabilidade de ocorrência de um deles automaticamente aumentamos a
probabilkidade de ocorrência do outro.
Na prática procede-se de maneira que o erro tipo I seja o mais importante de ser
evitado, as hipóteses são formuladas de modo tal que H0 seja a hipótese cuja rejeição injusta
constitua o erro de maior importância (CARVAJAL, 1 986).

Exemplo 3. Utilizando as hipóteses estatísticas do Exemplo 2, podemos enunciar os dois


erros como:
Erro tipo I: concluir que o nível médio de colesterol de filhos de pais com
antecedentes cardíacos difere da média de referência, 175 mg%/ml, quando na verdade isto
não ocorre.
Erro tipo II: concluir que o nível médio de colesterol de filhos de pais com
antecedentes cardíacos não difere da média de referência, 175 mg%/ml, quando na verdade
ele difere.
Devemos observar que cometer o erro do tipo I ou o erro do tipo II sempre implica
prejuízos monetários e não monetários.

8.4 O que significa poder de um teste?


O poder de um teste é definido como o complemento da probabilidade de erro tipo II
=  (aceitar a hipótese de nulidade quando na realidade H0 é falsa), ou seja, PODER = 1 -
. O poder de um teste corresponde à probabilidade de rejeitar H0 quando H0 for
falsa.

47
8.5 O que são testes monocaudais e testes bicaudais? Quais as implicações do
uso de um e de outro?
Os testes monocaudais de uma distribuição de probabilidades se referem a testes de
hipóteses para as quais a hipótese alternativa Ha define uma mudança da hipótese nula em
alguma direção.

Os testes bicaudais de uma distribuição de probabilidades é um teste onde a hipótese


alternativa define uma mudança da hipótese nula sem especificar nenhuma direção.
Testes para a média:
Seja uma distribuição de probabilidades Normal de média  e desvio-padrão .
Temos três alternativas para testarmos valores de  em relação a 0 (sob a H0 ).
Assim teremos os testes:
i) H0 :  = 0 contra  > 0
ii) H0 :  = 0 contra  < 0
Em ambos os casos i) e ii) acima, diremos que o teste é unicaudal, e
iii) H0 :  = 0 contra   0 , o qual é denominado teste bicaudal.

Exemplo 4 . Suponha que o nível médio de colesterol de 16 crianças seja 193 mg%/ml e
que se assume que a população originária da amostra apresenta nível de colesterol de 175
mg%/ml com desvio-padrão de 50 mg%/ml. Adotando o nível de significância de 5% ( =
0,05), testar as hipóteses:
i) a média da população neste grupo é superior à da população em geral (teste
unicaudal), e
ii) a média da população neste grupo é diferente à da população em geral (teste
bicaudal).

8.6 O que significa nível de significância de um teste de hipótese?

Ao valor  chamamos de nível de significância do teste e que consiste na


probabilidade máxima com que nos sujeitamos a correr o risco de cometer um erro do tipo I

48
(rejeitar uma hipótese H0 verdadeira, que deveria ser aceita) ao testarmos uma dada
hipótese H0. Na prática, é comum (embora não seja obrigatório) fixarmos o nível de
significância em 5% ou em 1%, isto é  = 0,05 ou  = 0,01. Se por exemplo, for escolhido
o nível de 5% ( = 0,05), isto indica que teremos 5 possibilidades em 100 de que
rejeitemos a hipótese H0 quando ela deveria ser aceita, ou seja, existe uma confiança de
95% de que tenhamos tomado uma decisão correta (BANZATTO & KRONKA, 1989).
8.7 O que significa grau de confiança de um teste?

Ao valor 1 - , expresso em porcentagem, denominamos de grau de confiança do


teste , isto é, este valor indica a confiança que temos de ter tomado uma decisão correta ao
rejeitar a hipótese H0 .

8.8 Como tomar decisões com auxilio da estatística?

Estabelecido o nível de significância, escolhemos o teste apropriado para a tomada


de decisão. Existe hoje grande variedade de testes à disposição dos interessados, todos têm
indicação precisa e todos têm vantagens e desvantagens. Então, a escolha do teste exige
conhecimento de estatística. Se houver necessidade o pesquisador deverá solicitar o auxílio
de um estatístico para esta escolha.
Escolhido o teste de hipótese para aplicar aos seus dados, o pesquisador deve, logo a
seguir, determinar qual a distribuição amostral da estatística da prova, por exemplo: z, t, 2
, F e outras, todas elas distribuições teóricas.
Realizado o teste, obtemos um valor numérico e, com base nesse valor, decide-se
se a hipótese de nulidade deve ser rejeitada ao nível de significância estabelecido. O
pesquisador deve, então, discutir esta informação (VIEIRA, 1997).
Segundo MATTAR (1 997) uma vez selecionada as hipóteses a serem testadas, o
próximo passo é a coleta de dados empíricos que , analisados, permitirão mantê-las ou
rejeitá-las. Para poder atingir ao objetivo de manutenção, revisão ou rejeição de
determinada hipótese, é necessário ter-se procedimentos bem definidos e objetivos para a
realização do teste, que compreendem:

49
1. Estabelecer a hipótese nula H0 e a hipótese alternativa H1, tendo em vista a hipótese
da pesquisa;
2. Selecionar o teste estatístico adequado;
3. Estabelecer um nível de significância;
4. Determinar ou assumir a distribuição amostral da prova estatística sob a hipótese
nula H0;
5. Com base em 1, 2, 3 e 4 definir a região de rejeição da hipótese nula H0;
6. Calcular o valor da prova estatística a partir dos dados da(s) amostra(s);
7. Tomar a decisão quanto a aceitação ou rejeição da hipótese nula H0 .
Devemos observar que a hipótese nula H0 é a hipótese de negação do fenômeno em
estudo. A hipótese nula é formulada com o objetivo único de ser rejeitada. A alternativa H1
é o oposto de H0 e corresponde a hipóteses do pesquisador.
A escolha adequada de um teste estatístico depende do tipo de variável em
estudo e da escala de mensuração utilizada, podendo ser um teste paramétrico ou um
não-paramétrico. Quando houver mais de um tipo de teste que possa ser aplicado à
situação, devemos escolher aquele que tiver o maior poder. Devemos também levar em
conta ainda, se o teste escolhido for não-paramétrico o tipo de dados a serem analisados -
nominais ou ordinais- pois, temos testes apropriados a cada tipo de variável. Se os dados
forem medidos na escala intervalar ou na escala de razão, devemos utilizar o teste
paramétrico adequado. Finalmente, devemos levar em conta quando se tratar apenas dados
de uma amostra, de duas amostras relacionadas e não-relacionadas ou de várias amostras
relacionadas ou não-relacionadas.
Segundo MATTAR (1997, p.203-adaptado), no Quadro 2, apresentamos o tipo
de teste adequado segundo os métodos estatísticos, os níveis de mensuração utilizados
para os dados e o número de amostras e o seu relacionamento.

50
Quadro 2 Métodos de inferência - testes estatísticos apropriados segundo os métodos estatísticos, as escalas (níveis) de
mensuração e o número de amostras e o seu relacionamento (Mattar, 1993)
Método Escala de Testes de Inferência
Mensuração Uma amostra Duas amostras Três ou mais amostras
Da variável Relacionadas Não relacionadas Relacionadas Não relacionadas
Diferença
de médias
Para- z Análise de
métrico Intervalar ou z tpareado t Variância de Análise de Variância
de Razão t Regressão medidas repetidas
t
Não Binomial McNemar 2 duas amostras Cochran Q 2 várias amostras ind.
para- Nominal 2
métricos Mediana Mediana – várias
amostras indep.
Mann-Whitney U Análise de
Ordinal Kolmogorov- Wilcoxon Variância de em Análise de variância
Smirnov Kolmogorov- duas direções de numa direção de
Smirnov Friedman Kruskal-Wallis

51
9. Diferenças estatísticamente significativas e diferenças relevantes nas Ciências
da Saúde

A significância estatística dos resultados diz respeito apenas no nível probabilistico


de acerto das conclusões, não sendo lícito retirar daí nenhuma importância científica do
achado (OLIVEIRA, 1 995).

O termo “significativo” tem o sentido geral de “expressivo” e o sentido particular que


lhe é dado em estat;istica: “de probabilidade de um evento ocorrer por chance”. Para tal,
fixa-se o valor de alfa (), em 0,05, na maioria das vezes. Em pesquisas, “significativo”
tende a ser usado apenas com a conotação específica, própria da estatística (PEREIRA, 1
995).
“Uma diferença estatísticamente significativa, mesmo com um alfa () muito
pequeno, não quer dizer que a diferença seja clinicamente importante. Por exemplo, um
valor  < 0,000 1, se emergir de um estudo bem delineado, transmite alto grau de confiança
de que uma diferença realmente existe. Porém, esse valor alfa () nada nos diz sobre a
magnitude de tal diferença ou de sua importância clínica. De fato, diferenças
absolutamente triviais podem ser altamente significativas do ponto de vista estatístico,
se um número suficientemente grande for estudado. Por outro lado, valores alfa () que
impressionam muito pouco podem resultar de estudos que mostram fortes efeitos
terapêuticos, se houver poucos pacientes no estudo” (FLETCHER, FLETCHER &
WAGNER, 1 996).
Decidir sobre o mínimo valor de alfa a ser tomado como significativo é tarefa
preliminar à própria coleta de dados e de escolha exclusivamente do pesquisador.
Ao examinarmos pequenas amostras, as diferenças reais e enormes entre os
tratamentos, podem não atingirem o nível de significância estatística escolhido. Ao
contrário, em grandes amostras, pequenas diferenças entre os tratamentos podem ser
estatísticamente significativas. Portanto o pesquisador deverá calcular o tamanho da
amostra adequado para a sua investigação científica para que possa detectar a

52
diferença entre os grupos em estudo, que tenham realmente importância prática e não
diferenças de qualquer magnitude (PEREIRA, 1 995).
Existe um entendimento equivocado no que diz respeito do nível de significância
obtido na pesquisa, interpretando a significância estatística como significância científica, isto
é, para a ciência particular para a qual se pesquisa. Já a significância para a ciência em
particular tem a ver é com o que representa de novidade no achado, o que representa
de acréscimo para o corpus teórico já conhecido. Enfim, a significância científica é
definida pela produtividade que um trabalho de pesquisa resultou para a ciência
(OLIVEIRA, 1 995).
Em síntese, na interpretação dos resultados de uma pesquisa, primeiro se verifica se as
diferenças estre os grupos são ou não estatísticamente significantes. Se elas não são
estatísticamente significantes, o tamanho das diferenças entre grupo experimental e grupo
controle é irrelevante, não devendo ser considerado. Se as diferenças são estatísticamente
significantes, avalia-se a magnitude das diferenças para saber se têm expressão clínica.

53
ELEMENTOS DE ESTATÍSTICA APLICADA À EDUCAÇÃO E SAÚDE
Dr. Sebastião Marcos Ribeiro de Carvalho – DPE – FFC - Câmpus de Marília - UNESP
(ATENÇÃO: MANUSCRITO NÃO FINALIZADO)

MÓDULO IV – AMOSTRAGEM

10. Amostragem: pag. 53

10. Amostragem

10.1 Introdução

O total de indivíduos sob investigação, com ao menos uma característica em comum,


é chamado de população. Devido a ser praticamente impossível realizarmos o estudo de
todos os elementos de uma população (problemas de custo, de tempo, de pessoal treinado
adequadamente, e outros) em uma determinada pesquisa, o mais comum é selecionarmos
uma parte da população para estudo, obtendo-se um conjunto de elementos denominado de
amostra. Para que a amostra seja representativa da população de onde proveio, cada
elemento da população deve ter igual chance de participar da amostra, evitando-se um viés
de seleção. Um outro erro muito comum é a amostra muito pequena ou selecionada de forma
tendenciosa.
A amostra será portanto a base para qualquer investigação científica que se queira
realizar. É preciso entretanto ter alguns conhecimentos básicos de estatística e bastante senso
crítico para realizarmos inferências para o todo, a partir de informações com base em parte
desse todo (transferência da informação obtida com base na amostra para toda a população).
Mesmo que a amostra seja tomada dentro da mais estrita técnica, ainda existe uma margem
de erro quando se faz a inferência ( PADOVANI, 1 995).
Antes de se iniciar a amostragem (processo de seleção de uma amostra), devem ser
discutidos os critérios segundo os quais os elementos da população serão selecionados para a
amostra. O método de amostragem fica estabelecida ao estabelecermos os critérios de
seleção.

54
10.2 Métodos básicos de amostragem

Segundo CURI (1 998) existem três métodos básicos de amostragem: naturalístico (I),
intencional (II) e aleatório(III):

I. Método naturalístico

O método naturalístico (cross-sectional-sampling), à seleção de um conjunto com n


indivíduos, a partir de uma grande população e, então, verifica a presença ou ausência de
características de interesse do pesquisador em cada indívíduos. Somente o tamanho da
amostra (n) é determinado para a coleta dos dados.priori.

II. Método intencional

O método intencional seleciona e estuda, no mínimo duas popuilações, escolhendo em


cada uma uma das populações uma amostra com um número pré-determinado de unidades
ni com a característica Ai (i = 1, 2, ... , p), com o interesse de verificar se as i populações
amostradas Ai diferem em relação a ocorrência ou não de uma variável B (B ocorre ou B
não-ocorre).

III. Método aleatório

O método aleatório é semelhante ao Método II, sendo que o mesmo considera uma
população de n indivíduos, a partir da qual seleciona duas amostras - a amostra A1 para
receber o tratamento controle (Grupo controle) e A2 para receber o tratamento experimental
(Grupo experimental), de tamanhos pré-determinados, respectivamente n1 e n2 = n - n1 ,
obtidas aleatoriamente, o que não ocorre no Método II. A resposta de interesse é avaliada,
visando a comparar os dois grupos.

55
A situação exposta pode ser ampliada: i) considerando-se mais de dois tratamentos
e/ou mais de duas classes de resposta; ii) considerando-se dois ou mais tratamentos (variável
qualitativa) e a resposta é uma variável quantitativa.

10.3 Principais técnicas de amostragem aleatória:

10.3.1 Amostragem casual simples


A amostragem é casual simples quando todos os elementos da população tem igual
probabilidade (equiprobabilidade) de serem selecionados para a amostra.
Essa técnica é inviável para grandes populações, porém facilmente aplicáveis as
populações pequenas. Para se obter uma amostra casual simples atribuímos um número a
cada elemento da população e depois sorteai-se os elementos que constituirão a amostra, ou
utiliza-se uma tábua de números aleatórios com o mesmo objetivo. A amostragem casual
simples pode ser com reposição ou sem reposição do elemento na população.

10.3.2 Amostragem sistemática


A amostragem é sistemática, se a seleção dos elementos que constituirão a amostra é
feita por um sistema imposto pelo pesquisador. Deve ser empregada preferencialmente à
casual simples, quando a população pode ser organizada segundo algum critério.

Exemplo: Obtenção de uma amostra dos prontuários médicos de um pronto-socorro,


para estudar a proporção de crianças internadas por ingerirem substâncias tóxicas. O
pesquisador poderá, por exemplo, selecionar uma amostra , fazendo um sorteio dos números
de zero a nove, supondo 4 o sorteado, e selecionar os prontuários que terminam em 4 até
completar a sua amostra.

10.3.3 Amostragem estratificada


Para utilizarmos a amostragem estratificada divide-se a população em grupos mais
homogêneos (estratos) e depois obtem-se uma amostra casual simples ou sistemática, dentro
de cada estrato. Seu uso torna-se obrigatório quando as populações são muito heterogêneas.

56
Exemplo: São comuns como estratos as classes de: sexo, idade, grupo étnico, estado
civil, ren0da entre outras.

10.3.4 Amostragem por conglomerados

O fato de a população ser muito dispersa, no espaço ou no tempo, acarreta enorme


dificuldade para o uso dos métodos de i) a iii) acima citados, portanto procede-se da seguinte
maneira: primeiro, faz-se a divisão do universo em conglomerados (grupos ou áreas são
considerados como miniaturas da população, com grande heterogeneidade dentro de cada
um) que não se superponham; em seguida seleciona-se aleatoriamente alguns
conglomerados para comporem a amostra. Não há interesse em comparar os conglomerados,
mas sim usá-los, somados, como amostra representativa de todo o universo.
Exemplo: i) Peso ao nascer em maternidades;
ii) Pesquisa sobre aleitamento materno (PEREIRA, 1 995).
Finalmente, deve-se ter em conta que a técnica de amostragem quando usada
corretamente ajuda a eliminar a tendenciosidade, ou seja, procura eliminar a parcialidade ou
vício que mostra-se presente quando determinado grupo de interesse é escolhido para
representar a população. Uma amostra viesada pode comprometer todas as inferências que
serão feitas a respeito do estudo concluído.

10.4 Considerações sobre o tamanho da amostra

Freqüentemente ocorre aos pesquisadores e aos usuários da pesquisa a seguinte


pergunta: qual o tamanho mínimo da amostra necessário para realizar determinada
investigação sem viés ?
Para respondermos adequadamente essa questão precisamos de algumas informações
adicionais tais como a precisão requerida para as estimativas, ou seja, o erro de amostragem
que pode ser tolerado, do qual depende do uso que se pretenda fazer dos resultados obtidos.
Quanto maior o tamanho da amostra, maior a precisão da estimativa - lei dos grandes
números, Jacques Bernoulli (1 6437 - 1 705), que implica:

57
i) pequenas amostras tendem a gerar conclusões pouco confiáveis, ocorrendo
modificações substanciais nos seus resultados, pelo simples acréscimo de poucas unidades;
ii) os resultados podem diferir substancialmente de outra amostra aleatória da mesma
população;
iii) grandes amostras, corretamente selecionadas, permitem conhecer cm mais
propriedade o que ocorre na população;
iv) manter o tamanho da amostra em um mínimo é conveniente
Se a amostra for selecionada corretamente, quanto maior a amostra , mais próxima por
questões práticas e financeiras, e até por implicações éticas estará a estimativa de
prevalência obtida através da amostra da verdadeira prevalência da comunidade. No entanto,
quanto menor a amostra, menor serão o tempo e os recursos necessários para a sua avaliação.
Além disso, pode ser mais fácil manter boa supervisão e controle de qualidade em uma
amostra menor, o que vai assegurar a acurácia e a repetitividade da informação colhida.
Portanto , num estudo de prevalência, o tamanho da amostra necessário é o menor possível
que seja capaz de dar uma estimativa de prevalência com o grau desejado de precisão
(PEREIRA, 1 995; VAUGHAN & MORROW, 1 997).

A Tabela 1. , mostra exemplos dos tamanhos mínimos de amostra requeridos para


identificar níveis de prevalência esperados com as respectivas margens de erro de
amostragem para a prevalência estimada.

Tabela 1. Tamanho mínimo de uma amostra para uma pesquisa de prevalência de acordo
com a taxa de prevalência esperada.

Margem de erro Taxa de prevalência amostra tolerada2


máxima esperada (%)1 1% 2,5% 5% 10% 20% 30% 40%
50%

0,5% 1.522 3.746 7.300 13.830 - - - -


1% 381 837 1.825 3.458 6.147 8.068 9.220 9.604
2% - 235 457 865 1.537 2.017 2.305 2.401
5% - - 73 139 246 323 369 .385
10% - - - 35 62 81 93 97
15% - - - - 28 36 41 43

58
Fonte: VAUGHAN & MORROW (1997, p.51)

1. Esta margem representa o intervalo de confiança de 95%. Por exemplo, se a prevalência


verdadeira for de 10% e tomarmos uma amostra de 139 pessoas poderemos ter 95%
de certeza de que a prevalência estimada através da amostra deverá estar entre 5% e 15%
(isto é 10  5%). Como regra geral, não aceite um erro superior a 5%.
2. Selecione a mais alta entre as prováveis taxas de prevalência. Caso se antecipe uma taxa
maior do que 50%, subtraia este valor de 100%.

Exemplo: Caso se suspeite que a prevalência da esquistossomose na população esteja em


torno de 20% a 40%, e se quisermos que o levantamento tenha uma boa chance de estimar a
prevalência com uma margem de erro de no máximo 5% acima ou abaixo do valor da
prevalência verdadeira, será necessário examinar uma amostra aleatória de pelo menos 369
pessoas. Suponha que o estudo foi completado, e a amostra mostrou uma prevalência de
32,5%, a verdadeira prevalência na população (da qual a amostra foi aleatoriamente
selecionada) vai estar entre 32,5% mais ou menos 5%, ou seja entre 27,5% e 37,5%
(VAGHAN & MORROW, 1997) .
De um modo geral, para o cálculo de tamanho de amostras se a populaçãofor
dicotômicas(ou possível de ser trabalhada como tal), para valores não mostrados na Tabela
2., use a o seguinte procedimento:
n é o tamanho mínimo de amostra necessário
pq p é a taxa máxima de prevalência esperada (%)
n = ------------- , onde: q = 100 - p
(E/1,96) 2 E é a margem de erro amostral tolerado (%)

Exemplo: Se p = 40 %; q = 60 % ; E = 5 % , fica :

( 40 x 60 )
n = --------------- = 368,8 ou 369 pessoas
(5 / 1,96 ) 2

59
Para uma discussão mais detalhada sobre o tamanho da amostra consultar
COCHRAN (1 965).

60
ELEMENTOS DE ESTATÍSTICA APLICADA À EDUCAÇÃO E SAÚDE
Dr. Sebastião Marcos Ribeiro de Carvalho – DPE – FFC - Câmpus de Marília - UNESP
(ATENÇÃO: MANUSCRITO NÃO FINALIZADO)

MÓDULO V – PRINCIPAIS TIPOS DE DELINEAMENTOS – ÁREA DE SAÚDE

11. Principais tipos de delineamentos utilizados em pesquisas na área de saúde: pag.60


12. Tamanho da amostra: pag. 65
13. O que é Medicina Baseada em Evidências ?: pag. 69

11. Principais tipos de delineamentos utilizados em pesquisas na área de saúde

Na investigação de um tema, três estratégias independentes de abordagem vêm sendo


utilizadas, de longa data, pelos profissionais da área de saúde: a) o estudo de caso, b) a
investigação experimental em laboratório e c) a pesquisa ao nível de população (PEREIRA,
1 995).

11.1 O estudo de caso


É o método de pesquisa que envolve uma análise completa e aprofundada da doença,
em um indivíduo, grupo, instituição ou outra unidade social.

11.2 A investigação experimental em laboratório


Investigação na qual as condições são determinadas pelo pesquisador, que comandará
as ações sobre as variáveis independentes, através de controle e casualização. No estudo
experimental, existe a necessidade de haver pelo menos dois grupos amostrais de indivíduos.
Um grupo, chamado grupo experimental, que será constituído de elementos apresentando
características bem definidas, aos quais se administra o tratamento ou condição. Outro
grupo, chamado grupo controle, que será constituído de elementos que apresentam

61
exatamente as mesmas características do grupo anterior, mas aos quais não se administra o
tratamento ou condição (BERQUÓ et al., 1 981).

11.3 Pesquisa ao nível de população

A epidemiologia , em sua determinação histórica e conceitual, tem como definidor do


seu objeto de conhecimento o coletivo de seres humanos (ROUQUAYROL, 1 994).

Classificar os principais delineamentos utilizados em epidemiologia é um tanto


complexo devido a diversidade de critérios passíveis de serem utilizados. Adotaremos a
classificação empregada por PEREIRA (1 995): i) Estudo descritivo, ii) Estudo analítico:
Estudo clínico randomizado, Estudo de coorte, Estudo de caso-controle e Estudo transversal,
e iii) Estudos ecológicos.

11.3.1 Estudo descritivo

É o delineamento que tem o propósito de informar a distribuição de freqüências, sem a


preocupação de testar hipóteses. Podem ser de incidência ou de prevalência, não há
formação de grupo-controle para a comparação de resultados. Podem ser formadas somente
de doentes e também pode ser constituída só de pessoas sadias, ou uma composição de
sadios e doentes.

Exemplos:
1) A prevalência da hepatite B entre os voluntários à doação de sangue.
2) Imunização dos pré-escolares de um determinado município frente à poliomielite.

11.3.2 Estudo analítico

É o delineamento que tem por objetivo analisar associação de eventos. São utilizados
após a primeira etapa realizada pelo estudo descritivo.

62
As pesquisas analíticas estão usualmente subordinadas a uma ou mais questões
científicas, traduzidas pelas hipóteses, que relacionam eventos: uma suposta causa e um
dado efeito, ou, como habitualmente é referido, entre a exposição e a doença. As hipoóteses
geralmente são formuladas, de modo a orientar o planejamento , a coleta e a análise dos
dados, mas nada impede que ela seja elaborada para ser testada em uma base de dados já
existente, orientando a forma de organizar os grupos e proceder a análise dos dados. Outras
vezes pode não haver uma hipótese explícita, mas sim a busca de fatores que contribuam
para o aparecimento das doenças (PEREIRA, 1 995).
Exemplos:
1) Investigação sobre a eficácia de uma vacina quando comparada com um placebo.
2) Exposição de um indivíduo obeso (fator de risco) e a ocorrência de diabetes
(doença).
A presença de um grupo-controle, formado simultaneamente com o grupo de estudo, e
que serve para a comparação dos resultados nos estudos analíticos é o aspecto que o
diferencia basicamente dos estudos descritivos.
O modo como os grupos de estudo e controle são formados dão origem aos diversos
tipos de estudos analíticos, a saber:

11.3.2.1 Estudo clínico randomizado (experimental)


Parte-se da causa em direção ao efeito, sendo os grupos de estudo e de controle
formados aleatoriamente (formar grupos com características semelhantes). A seguir procede-
se à intervenção (tratamento) , a qual pretende-se avaliar os resultados, no grupo de estudo,
servindo o grupo controle para a comparação dos resultados.
Exemplo: Investigação sobre o efeito de uma vacina e de um placebo.

11.3.2.2 Estudo de coorte


Estudo de seguimento, folow-up ou de coorte ( grupo de pessoas com alguma
característica em comum, tendo em vista um estudo especial ): para realizar-se uma
investigação etiológica no tempo, parte-se da causa em busca dos efeitos, produzindo-se
medidas de incidências (medidas diretas de risco). A coorte constitui-se de um grupo de

63
pessoas sadias quanto à doença sob investigação e que se caracteriza pela composição
homogênea por vários fatores que não a variável independente investigada. Difere do ensaio
clínico randomizado por não haver alocação aleatória da exposição, sendo os grupos
formados por observação de situações, na vida real, ou por alocação arbitrária de uma
intervenção (PEREIRA, 1 995).

O estudo de coorte ou longitudinal, pode ser:


i) prospectivo: estudo de coorte no qual o investigador acompanha, de corpo
presente, a pesquisa; é uma pesquisa em direção ao futuro: o(s) grupo(s) é(são) formados no
presente - às vezes a exposição já aconteceu, mas o efeito ainda não ocorreu ao iniciar-se a
investigação;
ii) retrospectivo (histórico): trata-se de uma investigação sobre eventos passados,
conservando-se o princípio de estudo de coorte, ou seja, da causa em direção ao efeito e com
grupo-controle; o efeito já ocorreu quando a pesquisa é realizada ( PEREIRA, 1 995).

11.3.2.3) Estudo de caso controle


Ao contrário do ensaio clínico randomizado e do estudo de coorte, o delineamento do
tipo estudo de caso-controle parte do efeito para chegar as causas. É portanto, uma
investigação feita de trás para frente; é uma pesquisa etiológica retrospectiva, a qual só pode
ser realizada após o efeito já ter ocorrido. Deve-se cuidar para interpretar-se adequadamente
os resultados encontrados, pois os dois grupos, de casos e controles, podem diferir em
algumas características, as quais confundem a interpretação.
Exemplo: Investigação ente uma possível associação entre tumor maligno no seio de
jovens, cujas mães haviam sido submetidas a mastectomia.

11.3.2.4 Estudo transversal


Estudo transversal ou seccional determina em determinado momento no tempo, a
situação da saúde de um grupo ou de uma comunidade, no qual a causa e o efeito são
observados num mesmo momento histórico.

64
Exemplo: Associação entre o hábito de fumar e a resistência física dos jogadores de
dois times de futebol em um determinado jogo de veteranos ( PEREIRA, 1 995)

11.4 Estudos ecológicos

Nos delineamentos descritivos e analíticos a unidade de observação é o indivíduo.


Nos estudos ecológicos (ou estatísticos, de grupos, de agregados, de conglomerados ou
comunitários) a unidade de observação passa ser o grupo de indivíduos. Tem origem na
utilização de áreas geográficas como unidades de análise e, por extensão, generalizou-se para
outras situações em que a unidade é formada por um grupo. Atualmente denomina-se
variável ecológica, aquela que descreve o que ocorre em grupos de indivíduos. Deve-se
tomar cuidado com parâmetros que possam tornar-se variáveis de confundimento,
dificultando a interpretação dos resultados (PEREIRA, 1995).

Exemplo: Investigação ecológica sobre malária.

65
12. CÁLCULO DO TAMANHO DA AMOSTRA
Sebastião Marcos Ribeiro de Carvalho e Aldemar de Araújo Castro
(ATENÇÃO: MANUSCRITO NÃO FINALIZADO)

12.1 INTRODUÇÃO

Qual é o tamanho da amostra que eu preciso ? Essa é uma pergunta feita freqüentemente
por todos os pesquisadores em todos os tipos de pesquisa científicas e em particular por
aqueles que pretendem realizar uma pesquisa na área de saúde.

Na área de saúde, é necessário realizar o cálculo do tamanho da amostra para não


estudarmos nem mais nem menos doentes que o necessário para para se obter uma conclusão
confiável da pesquisa em que estamos envolvidos, bem como por problemas éticos e
logísticos

O cálculo do tamanho da amostra, no nosso entender, está diretamente associada a


Pergunta da Pesquisa . Para cada tipo de pesquisa deve-se emitir uma Pergunta, a qual por
sua vez determinará o tipo de estudo adequado para a sua resposta. Para a implementação
adequada do estudo escolhido, devemos obter uma amostra que seja representativa da
população para a qual se pretende responder a essa pergunta
(www.evidencias.com/lv_4.html).

Tamanho da amostra a ser obtida deverá ser estimado levando-se em conta: a pergunta
da pesquisa, a variável primária definida, o tipo de resposta a ser observada, o tipo de análise
estatística que se pretende realizar, a diferença a ser detectada, o grau de confiança e o poder
do teste utilizado na análise estatística.

Para cada tipo de pergunta da pesquisa clínica associamos um tipo de estudo, sendo os
que ocorrem com maior freqüência na literatura : transversal (prevalência, relato de caso,
série de casos), caso-controle, coorte (incidência, prognóstico), acurácia (diagnóstico; avaliar
item da anamnese, avaliar item do exame físico) , ensaio clínico aleatorizado (intervenção:
tratamento, prevenção, reabilitação) .

Quanto ao tipo de variável primária definida e o tipo de resposta, devemos levar em


conta se as mesmas são categóricas, dicotômicas ou quantitativas

Para definirmos o tipo de análise é necessário estabelecer se a comparação é entre


proporções ( resposta categórica ou dicotômica) ou entre médias (resposta quantitativa). A
resposta mostrou que existe diferença? Existe associação (correlação)? Existe predição
(regressão)? Foi realizada análise de sobrevivência?

Grau de confiança (100 - )% e o poder do teste utilizado (1 - )% devem ser
estabelecidos a priori, com o que ficam definidos consequentemente o nível de significância

66
do teste utilizado , que é probabilidade de rejeitar a hipótese nula quando esta é verdadeira
e,  que é a probabilidade de aceitar a hipótese nula quando ela é falsa .

Quando é preciso grande número de doentes para responder adequadamente a pergunta


de uma pesquisa pode ser necessário que seja realizado o ajuste do tamanho da amostra, o
que poderá ser feito aumentando-se a taxa e o tempo de recrutamento da mesma ou reduzir i
rigor científico ou até mesmo abandonando-se a pesquisa.

Didaticamente, dependendo da pergunta da pesquisa, o cálculo do tamanho da amostra


será realizado levando-se em conta os seguintes parâmetros:
i) variável binomial ou categórica,
ii) variável contínua,
iii) o nível de significância do teste utilizado,
iv) o poder do teste a ser utilizado,
v) parâmetro simples e,
vi) diferença mínima a ser detectada no estudo.

12.2 CÁLCULO DO TAMANHO DA AMOSTRA

12.2.1 Situação para uma amostra

12.2.1.1 Tamanho da amostra (n) para se estimar uma proporção p

12.1.1.1 Cálculo de uma proporção

Objetivo: Calcular o tamanho amostral mínimo necessário para, com uma confiança
de 100(1 - )%, obter-se uma proporção estimada p, que não difira do valor verdadeiro mais
que a precisão absoluta d:
i) Se N (tamanho da população) é desconhecido:

Z2(/2) . p(1-p)
n = -------------------------- (1)
d2

Prática: Em uma UBS, deseja-se calcular a prevalência de reações postiivas para


tuberculose entre crianças menores de 5 anos inscritos nessa unidade. Quantas crianças serão
necessárias na amostra para que possa calcular-se a prevalência, com uma precisão de 5% do
valor real com uma confiança de 95%, sabendo-se que é pouco provável que a verdadeira
taxa exceda a 20% ? (Adaptado - EPIDAT, 1997).
Cálculos:
p = 20% (0,20)
IC 95%:  = 100 – 95 = 5% (0,05) /2 = 0,05/2 = 0,025
z(/2) = z(0,025) = 1,96

67
1,962 . 0,20(1-0,20)
d = 5% (0,05), então n = --------------------------------- = 245,8 , logo:
(0,05) 2
n = 246

Portanto, para que se possa obter uma estimativa razoavelmente acurada da


prevalência de tuberculose na unidade, o tamanho amostral necessário é de 246 crianças ou
mais.

ii) Se N (tamanho da população) é conhecido:


N.Z2(/2) . p(1-p)
n = -------------------------------------------- (2)
(N-1)d 2 + Z2(/2) . p(1-p)

12.1.1.2 Teste de hipótese


Objetivo: Calcular o tamanho amostral mínimo necessário para se submeter a um teste
de hipótese o suposto que a proporção de sujeitos de uma população com certa característica
seja igual a um determinado valor, sendo a proporção da hipótese nula p0 e o valor esperado
da proporção na população p.

[Z2(/2) . p0 (1-p0 ) + Z(1 - ) . p (1-p )] 2


n = ------------------------------------------------------- (3)
(p0 - p )2

Parâmetros utilizados nas equações (1), (2) e (3):

N é o tamanho da população
p é a proporção esperada na população
p0 é a proporção da hipótese nula
z(/2) é o valor tabelado da distribuição normal
100(1 - )% é o nível de confiança
z(1 - ) é o valor tabelado da distribuição normal
100(1 - )% é o poder do teste
d é a semi-amplitude (precisão absoluta) do IC 100(1 - )%

Prática: Segundo a literatura médica, a taxa de cura de determinado tipo de câncer em 5


anos (ou seja, a proporção de pacientes que não apresentaram recidiva de cãncer em 5 anos
de tratamento) é de 50%. Um pesquisador deseja testar a hipótese de que essa taxa de cura é
aplicável na sua região de trabalho. Que tamanho mínimo deverá ter a amostra, se esse
pesquisador tem interesse em rejeitar a hipótese nula somente se o valor real for inferior a

68
50%, com uma segurança de 90% de que detectará uma taxa de 40% ao nível de
significância de 5%? (Adaptado - EPIDAT, 1997).

Cálculos:
p0 = 40% (0,40)
p = 50% (0,50)
 = 5% (0,05) /2 = 0,05/2 = 0,025 z(/2) = z(0,025) = 1,96
(1 - ) = 90% (0,90) ) z(1 - ) = 1,28 e  = 10,0%(0,10)

[ 1,96 . 0,40(1 – 0,40) + 1,28 . 0,50(1 – 0,50)] 2


n = ------------------------------------------------------------------ = 62,5 , logo:
(0,40 – 0,50) 2

n = 63

Portanto, para que se possa testar a hipótese pretendida o tamanho amostral necessário
é de 63 pacientes ou mais.

69
13. O que é Medicina Baseada em Evidências ?
Sebastião Marcos Ribeiro de Carvalho
* Escrito em agosto de 2001 sem correções

No primeiro semestre do corrente ano letivo de 2001, assistíamos uma excelente


palestra do Dr. Álvaro Nagib Atallah, na Escola Paulista de Medicina, São Paulo, quando foi
solicitado ao palestrante que definisse a Medicina Baseada em Evidências (MBE) em uma
única frase. Com toda serenidade que lhe é peculiar, o Dr. Álvaro assim definiu: “Medicina
Baseada em Evidências é a arte de reduzir a incerteza na decisão médica”.

Nesse primeiro “escrito” sobre Medicina Baseada em Evidências, o nosso objetivo é


analisar as palavras evidência, arte e incerteza, que compõem o título do artigo e a definição
do Dr. Álvaro, acima citada, cumprindo, segundo Drummond (1998), a famosa máxima de
Voltaire: “Se quiseres discutir comigo, defina antes os termos”.

No Aurélio (s/d), na página 521, no verbete correspondente a evidência consta: “


Evidência, s. f. Qualidade de evidente; certeza manifesta.” Por sua vez , no verbete
correspondente a evidente, temos: Evidente, adj. 2 gên. Que não oferece dúvida; que se
compreende imediatamente e dispensa demonstração; claro, patente.

No mesmo Aurélio (s/d), página 117, para arte, obtemos: “ Arte, s. f. Conjunto de
preceitos para a perfeita execução de qualquer coisa; livro ou tratado que contém esses
preceitos; execução prática de uma idéia; saber ou perícia em usar os meios para atingir
um resultado...”, na página 663 para incerteza, temos: “ Incerteza, s. f. Falta de certeza;
hesitação; dúvida”.

Verficamos portanto, a identificação entre evidência e certeza. Segundo Drummond


(1998) “...a certeza em si, mesmo a científica, por resultar de experimentações e
observações, contém certo grau de subjetividade. Perguntaríamos então, qual o critério para
distinguir as falsas evidências das verdadeiras? Responde Drummond(1998), citando
Leibnitz: “Descartes alojou a verdade na hospedaria da evidência, mas se esqueceu de nos
dar o endereço dela” , Huisman & Vergez : “ Em nome da chamada evidência, isto é, das
tradições bem estabelecidas e dos pensamentos costumeiros, os pensadores oficiais,
instalados no seu conformismo, sempre criticaram os grandes criadores de idéias novas” e
conclui com Bachelard: “ Creio que, para forjar estas novas formas de pensamento,
deveríamos levar em conta o fato de que o espírito humano é dotado de uma inércia muito
grande, e , também, poderíamos dizer, de uma grande viscosidade: desloca-se sempre muito
preguiçosamente de uma posição de equilíbrio para outra... “.

No entanto, “ do ponto de vista jurídico, evidências são dados e informações que


comprovam achados e suportam opiniões. E aqui nos aproximamos mais do conceito de
evidência, utilizado em Medicina Baseada em Evidências (Drummond, 1998).

70
Com o desenvolvimento tecnológico e constante aperfeiçoamento dos computadores,
desenvolveram-se programas computacionais cada vez mais poderosos, proporcionando o
desenvolvimento da bioestatística e da informática médica (permitindo adequar métodos e
técnicas estatísticas para planejamento, coleta e análise de dados e informações
experimentais ou observacionais), as quais juntamente com a epidemiologia clínica (cujo
objetivo é desenvolver e aplicar métodos de observação clínica que levem a conclusões
válidas, evitando ser enganado por erro sistemático ou aleatório), constituem a sustentação
metodológica para a prática da MBE (Fletcher, Fletcher & Wagner, 1996).

O objetivo maior da medicina é a qualidade de vida do paciente. Portanto, no nosso


entender, o paradigma da MBE aglutina toda a experiência do especialista, base e matéria
prima para gerar a(s) evidência(s), associada a um método de pesquisa, que se baseia na
associação de métodos epidemiológicos à pesquisa clínica chamada Epidemiologia Clínica -
apoiada em dados e informações, cuja análise é feita dentro de padrões previamente
definidos, dando especial atenção ao desenho da pesquisa – e, completando-se esse conjunto
com métodos bem definidos para avaliação crítica e revisões sistemáticas da literatura
médica (Atallah & Castro, 1998).

Portanto, os fundamentos da MBE são basicamente a crítica ao conhecimento e


valorização do melhor disponível a ser oferecido ao paciente, segundo os preceitos
alicerçados em pesquisas consistentes, de preferência pesquisas clínicas, sendo essas
evidências graduadas pelo delineamento da pesquisa. Finalmente, o processo da MBE reduz
as taxas de incerteza e de condutas aleatórias na clínica, tornando a prática do médico mais
segura, reduzindo as taxas de erro e aumentando a qualidade do atendimento (Gomes, 2001).

Bibliografia:
ATALLAH, A. N. & CASTRO, A. A. Medicina Baseada em Evidências: o elo entre a boa
ciência e a boa prática clínica. In:
Atallah, A. N. & Castro, A. A., editores. Medicina Baseada em Evidências:
fundamentos da pesquisa clínica. São
Paulo: Lemos- Editorial, 1998.
DRUMMOND, J. P. O que é Medicina Baseada em Evidências? In: Medicina Baseada
em Evidências: Novo Paradigma
Assistencial e Pedagógico. São Paulo: Editora Atheneu, 1998
FLETCHER, R. H. , FLETCHER, S. W. & WAGNER, E. H. Epidemiologia clínica:
Elementos Essenciais. 3a. Ed. Porto
Alegre: Artes Médicas, 1996.
GOMES, M. C. Medicina Baseada em Evidências. In: Medicina Baseada em Evidências
– Princípios e Práticas. Rio de
Janeiro: Reichmann & Affonso Editores, 2001.
HOLANDA FERREIRA, A. B. – Pequeno dicionário brasileiro da língua portuguesa.
11a. ed., 10a. Impr. Rio de Janeiro: Civilização Brasileira-Nacional, s/d,
 e-mail: smrc60@gmail.com

71
ELEMENTOS DE ESTATÍSTICA APLICADA À EDUCAÇÃO E SAÚDE
Dr. Sebastião Marcos Ribeiro de Carvalho – DPE – FFC - Câmpus de Marília - UNESP
(ATENÇÃO: MANUSCRITO NÃO FINALIZADO)

MÓDULO VI – SUGESTÕES DE UTILIZAÇÃO DE TESTES ESTATÍSTICOS

14. Sugestões de utilização de testes estatísticos: pag. 72


( copiado internet livre 20_05_2014: www.ufpa.br/metodologiza/QuadroGeral_TestesEstatisticos.doc )

15. Glossário: pag. 84


( copiado internet livre 20_05_2014: www.ufpa.br/metodologiza/QuadroGeral_TestesEstatisticos.doc )

16. Glossário1 de Termos Estatísticos, Filosóficos E Da Metodologia Científica: pag.111


(copiado internet livre 20_05_2014: http://www.ufpa.br/metodologiza/glossario.htm#corrl%C3%A7 )

72
11. Sugestões de utilização de testes estatísticos: copiado de www.ufpa.br/metodologiza/QuadroGeral_TestesEstatisticos.doc
QUADRO GERAL: FÓRMULAS ESTATÍSTICAS, SUGESTÕES DE UTILIZAÇÃO E TIPOS DE ESCALAS COM QUE PODEM SER
EMPREGADAS.
TIPO DE
TESTE
UTILIZAÇÃO ESCALA E/OU FÓRMULA OBSERVAÇÃO
(TIP O)
VARIÁVEL
k 1  f  f 2
X  o
Plano do tipo CRD, p/ análise de Nominal; 2 e
Qui-quadrado tabelas de contingência (2 l x 2 c) e c/ Discreta i j f e
É conhecido também como teste de
(Não observações independentes (s/ (Categórica: gl=c-1 x l-1 aderência ("goodnes of fit") quando as fe são
paramétrico) emparelhamento entre os Ss das raça; sexo; Onde: fo = freqüência observada; teoricamente supostas iguais ou desiguais
amostras) estado civil) f = freqüência esperada
e
Plano do tipo CRD, p/ análise de
Qui-quadrado
tabelas de contingência (2 l x 2 c) e c/
c/ correção de Nominal;
observações independentes (s/ Usa-se quando …
Yates (Não Discreta
emparelhamento entre os Ss das
paramétrico)
amostras)
Qui-quadrado Plano do tipo CRD,, p/ análise de
p/ tendência tabelas grandes e c/ observações Nominal;
(Não independen-tes (s/ emparelhamento Discreta
paramétrico) entre os Ss das amostras)
Qui-quadrado
Plano do tipo CRD, p/ análise de
p/
tabelas grandes e c/ observações Nominal;
independência
independen-tes (s/ emparelhamento Discreta
(Não
entre os Ss das amostras)
paramétrico)
Plano do tipo CRD, c/ uma variável,
p
 A  B ! C  D !  A  C ! B  D !
p/ análise de tabelas de contingência
Probabilida- N ! A! B! C! D!
(2 l x 2 c) e c/ observações Nominal;
des exatas de
independentes (s/ emparelhamento Discreta; Onde: A = escores na casela A; A B
Fisher (Não
entre os Ss das amostras), visando Categórica B = escores na casela B; C D
paramétrico) C = escores na casela C; e
comprovar a independência de 2
amostras (independentes) de D = escores na casela D

73
tamanhos pequenos, definidas sob 2
critérios mutuamente excludentes
Plano do tipo CRD, p/ comparar 2 Ordinal; Onde: N = A+B+C+D; A = escores acima
grupos/amostras independentes (s/ Postos, Posição, 2
da mediana combinada da 1ª amostra;
Da mediana emparelhamento entre os Ss das "Rank"  N C = escores abaixo da mediana combinada
N  AD  BC  
(Não amostras) c/ dados que tenham uma (conceitos  2 da 2ª amostra; B = escores acima da
escolares; nível x   A  B C  D  A  C B  D 
2
paramétrico) distribuição livre, com objetivo de mediana combinada da 2ª amostra;
constatar e verificar se provêm de sócio- D = escores abaixo da mediana combinada
populações com medianas iguais econômico) da 2ª amostra
Plano do tipo CRD, p/ comparar
Extensão do medianas de k amostras
teste da independentes (mais de 3 grupos) do
mediana (Não mesmo tamanho (c/ emparelhamento
paramétrico) entre os Ss dos grupos ou c/ medidas
repetidas entre as amostras)
Ordenamento
das somas de
Compara mediana?!??! Dados brutos
Wilcoxon (Não
paramétrico)
Compara a média ou mediana de 2
Wilcoxon
grupos c/ medidas emparelhadas
 C (da diferença de mesmo sinal ) S
N = nº de pares de observações, menos
Plano do tipo RBD, c/ 2 grupos(?!) e e n  25, pode-se usar a estatística z aqueles em que houver empate entre os
N N  1 
T de Wilcoxon Nominal ou valores observados, ou seja, D = 0; C =
com emparelhamento entre os Ss dos
(Não ordinal; T classificação das diferenças.
grupos ou medidas repetidas entre as 4
paramétrico) Discreta?!? z O valor de T sempre será o menor valor
amostras N N  1 2 N  1  encontrado para a soma das classificações
24 das diferenças de mesmo sinal

P/ 1 amostra c/ 1 variável, quando se Uma variável; z  X 



, Onde: X 
 X i Há necessidade do conhecimento prévio da
; média e do desvio-padrão da população ( e
SX n
z (…) quer comparar a X com a  e Numérica; ). O desvio-padrão da população, contudo,
quando n>30 Contínua n = nº de observações; X i = um pode ser estimado a partir da amostra (S),
valor, dado, observação qualquer; como mostrado ao lado.
74
S
 = média da população; S X  ;
n

e S
X i
X 
2

n 1

Intervalo ou X1  X2  
razão; 1 z S
z
P/ 2 amostras independentes c/ 1
variável X  X  1 2
Onde: n1 = tamanho da 1ª amostra;
variável  n1  1 S12  n 2  1 S 22  1 
n2 = tamanho da 2ª amostra
numérica;    
1

S X
1 X 2   n1  n 2  2  n 
contínua    1 n2 
Onde n1 e n2 se referem ao nº de
observações em cada um dos grupos; C1 e
n1 n1  1  C2 refere-se à soma das classificações dos
"U" de Mann- Plano do tipo CRD, p/ comparar a Nominal ou n1 n 2   C1 ; valores de cada grupo, quando ordenados
2
n 2 n 2  1 
Whitney (Não diferença entre 2 grupos e testar a ordinal; do menor para o maior valor, independente
paramétrico) significância dessa diferença Discreta n1 n 2   C2 do grupo.
2 O valor de U sempre será o menor valor
encontrado, entre os dois à partir das
formulas ao lado
Plano do tipo CRD, compara 2
1 variável; n n  1  Onde: R1 = soma dos postos da 1ª amostra;
Mann-Whitney grupos/amostras de mesmo tamanho U  n1 n 2  1 1  R1
Ordinal ou 2 R2 = soma dos postos da 2ª amostra;
(Não ou tamanhos diferentes, podendo
intervalo ou n n  1  n1 = tamanho da 1ª amostra; n2 = tamanho
paramétrico) também ser usado p/ planos RBD c/ 1 U  n1 n 2  2 2  R2
razão 2 da 2ª amostra
variável e medidas emparelhadas
De
ordenamento

75
de postos
robusto de
Behrens-Fisher
(Não
paramétrico)
Para análise de um grupo, c/ 1 D = máximo |Dt(X)-Do(X)|
variável, destinado a medir o grau de Onde: k = nº de postos; É conhecido também como teste de
Kolmogorov- Pelo menos, a
concordância entre a distribuição n = tamanho da amostra; aderência ou "goodnes of fit" (pode tb
Smirnov (Não nível ordinal;
acumulada de valores/dados Dt(X) = distribuição acumulada "determinar" se uma dada amostra provêm
paramétrico) Discreta
observados na amostra com aqueles teórica; Do(X) = distribuição de uma população conhecida).
esperados teoricamente acumulada observada.
NA NB
X 2  4 D2
NA  NB
D  máximo S NA  X   S NB  X  1. Ordenamos as duas amostras.
S X   k e S X   k
2. Construímos as distribuições de
Pelo menos, a NA NA NB NB freqüências acumuladas nos intervalos de
nível ordinal; classe de cada amostra
P/ analisar se 2 amostras/grupos
Discretas ou Onde: NA = tamanho da 1ª 3. Calculamos as diferenças entre as
Kolmogorov- foram retirados da mesma população
Contínuas (não amostra; NB = tamanho da 2ª freqüências acumuladas de cada amostra em
Smirnov (Não ou de populações c/ a mesma amostra; k = nº de postos
há exigência cada um dos intervalos de classe (diferenças
paramétrico) distribuição cumulativa (distribuições
que provenham entre a primeira e a segunda amostra, A-B).
semelhantes)
de distribuição É muito sensível, detectando 4. Escolhemos a maior diferença [Dmax] que
normal) diferenças em relação à tendência será comparada com Dcrítico
central, dispersão e simetria. Se as Se Dmax ≥ Dcrítico rejeitamos a hipótese de
diferenças observadas entre elas igualdade das amostras.
forem grandes é provável que não se
devam ao acaso.
Wald-
Wolfowitz
"runs test"
(Não
paramétrico)
De reações

76
extremas de
Siegel-Tukey
(Não
paramétrico)
De Moses de
reações
extremas (Não
paramétrico)
De
randomização
(permutação) para 2 amostras independentes
(Não
paramétrico)
Risco relativo
Odds ratio
(razão de
chances)
Diferenças de
2 proporções
No mínimo, no
nível de t
X   
intervalo; SX
Numérica;
X
 Xi
"t" p/ uma Contínua (Peso Dados brutos.
Compara a média de 1 grupo (c/ n  n
amostra em Kg; altura S Há necessidade do conhecimento prévio da
(Paramétrico)
30) c/ a média da sua população
em m; tempo SX  média da população
n
de duração de
dado Onde: X = média da amostra;
comportamento  = média da população; e
em min.) n = tamanho da amostra

77
"t" para
Plano do tipo CRD, p/ avaliar a
medidas X1  X 2
diferença entre as médias de 2 grupos No mínimo, no t
independentes  X 2  2
não pareados ou independentes de nível de  X12 
(  X1 ) 2
  X 22  gl = (n1 + n2) - 2.
ou c/ grupos n1 n2 1 1
tamanhos iguais ou diferentes e c/ intervalo n1  n2   2
  
não pareados  n1 n2 
ns30
(Paramétrico)
"t" para
medidas Plano do tipo RBD, p/ avaliar a X1  X 2 d
no mínimo, no ou
repetidas ou c/ diferença entre as médias de 2 grupos
nível de 
 d  2


  d
2
gl = n-1
grupos pareados ou c/ medidas repetidas d 2
d 2

intervalo n n
pareados entre as amostras n(n  1) n( n  1)
(Paramétrico)
"t" com
no mínimo, no
correção de
Compara a média de 2 grupos nível de Dados brutos
Welch
intervalo
(Paramétrico)
Essa estatística tem uma distribuição igual a
do X2, com gl = k - 1 (desde que o nº de
casos em cada tratamento seja > 5).
No caso de haver mais de 25% das
Kruskall- Plano do tipo CRD, p/ comparar k C2 observações empatadas, é recomendável
 3 N  1  On usar a formula alternativa abaixo
12
H 
j
Wallis (ou médias de k amostras independentes
N N  1  j 1 n j
análise de (mais de 3 grupos) do mesmo
no mínimo, a  C 2j 
  3 N  1 
12
variância de tamanho ou de tamanhos desiguais (s/ de: N = nº total de observações; Cj 
= soma das classificações para o N N  1   n j 
nível ordinal
Kruskall- emparelhamento entre os Ss dos
T
Wallis) (Não grupos e s/ medidas repetidas entre as tratamento j; nj = nº de observações
paramétrico) amostras) no tratamento j 1 3
N N
Onde: T = t3 - t (e t é o nº de observações
empatadas para cada valor); N = nº total de
observações

 
Friedman (ou Plano do tipo RBD, p/ comparar k 2
 Para dados brutos, onde: N = número de
análise de médias ou medianas de 3 ou mais Ordinal X c2 
12
 C   3 N k  1 
blocos; k = número de tratamentos; Cj =
Nk k  1   j 1 j 
variância de grupos, quando existe soma das classificações para o tratamento j.
78
Friedman) emparelhamento entre os Ss dos Obs.: as observações de cada bloco
(Não grupos ou medidas repetidas entre as (unidades experimentais) são classificadas
paramétrico) amostras da menor para a maior, dentro de cada
bloco.
2
 nr 
2
 n 
r 
 X   X 
P/ planos CRD, p/ comparar as  1   1 
1 n n
ANOVA variâncias de 2 ou mais 1 variável, no r

r 1
ONEWAY grupos/amostras, c/ o fim de avaliar mínimo, no  2
   nr 
2 2 
  n 
 X     X   n 
 X   GlInter = r - 1 e glIntra = r (nr - 1)
(univariada) os possíveis efeitos de vários nível de   1     1    
 
n r

 X     
2 1
(Paramétrico) tratamentos (representados por essas intervalo  1 n   1 nr n 
amostras).    
   
r n r 1 
ANOVA (p/
no mínimo, no
medidas
Compara médias de 3 ou mais grupos nível de
repetidas)
intervalo
(Paramétrico)
Análise de
no mínimo, no
variância F de
Compara mais de 2 grupos nível de
Snedecor
intervalo
(Paramétrico)
Plano do tipo RBD, c/ 2 grupos, para
Análise de testar a diferença entre as médias ou
no mínimo, no
variância F de analisar as suas variâncias, c/
nível de
Snedecor emparelha-mento entre os Ss dos
intervalo
(Paramétrico) grupos ou medidas repetidas entre as
amostras
Análise de Plano do tipo CRD, c/ 2 grupos
no mínimo, no
variância F de independentes, para testar a diferença
nível de
Snedecor entre as médias ou analisar as suas
intervalo
(Paramétrico) variâncias
Análise de Plano do tipo misto (RBD/CRD), para no mínimo, no
variância F de testar a diferença entre as médias ou nível de
Snedecor analisar as suas variâncias, c/ medidas intervalo
79
(Paramétrico)repetidas entre algumas variáveis e
não em outras
Plano do tipo RBD, c/ mais de 2 ?!?!(ou ordinal) dicotomizados: são
Q de Cochran
grupos e com emparelhamento entre definidos somente com dois valores: os dados estão contidos em n linhas e k
(Não Nominal
os Ss dos grupos ou medidas 1 (sim = sucesso) e 0 (não = colunas?!??!
paramétrico)
repetidas entre as amostras insucesso)!??!?
Quando pa < pp
Quando existe apenas 1 variável em 2
 
pa  p p
p(valor) = 2 
níveis e um grupo/amostra retirado(a) ppqp
de população definida por 2   p r q n  r ; onde n = tamanho da
n
Nominal; r  N
estratos/categorias (aqui descritas(os)  
Categórica (e.g: Quando pa  pp
Binomial (Não como (+) sucesso e (-) insucesso
masculino vs amostra; r = nº de vezes em que o  
pa  p p
paramétrico) (uma proporção) teste estatístico
feminino; sadio evento ocorreu na amostra; p = p(valor) = 2 1   
baseado na distribuição binomial ou probabilidade do evento x; q = 1-p ppqp
vs doente)
na aproximação à curva normal, onde (probabilidade do evento y) N
se compara a proporção de uma
Onde: pa = proporção de evento amostral;
amostra com a do parâmetro.
pp = proporção de evento populacional;
N = tamanho da amostra
(duas proporções) teste estatístico
baseado na distribuição binomial ou
Binomial (Não
na aproximação à curva normal, onde
paramétrico)
se comparam as proporções de duas
amostras.
McNemar p/
Plano do tipo RBD, c/ 2 grupos e com
significância
emparelhamento entre os Ss dos
das mudanças Nominal
grupos ou medidas repetidas entre as
(Não
amostras
paramétrico)
"One-sample
runs" (Não P/ análise de um grupo Ordinal
paramétrico)
Do sinal (Não Plano do tipo RBD, c/ 2 grupos e com Ordinal
80
paramétrico) emparelhamento entre os Ss dos
grupos ou medidas repetidas entre as
amostras
P/ estabelecer apenas uma possível
 de Kendall
associação entre VI e VD usando-se 2 Intervalo
(Paramétrico)
amostras ou conjunto de dados
Índice de
P/ estabelecer apenas uma possível 
correlação de  xy ,  xy   ( X i  X ).(Yi  Y ) Tem alto poder/eficiência
associação entre 2 amostras ou Intervalo r
 x2 . y2
ONDE 
Pearson (r)  2 2   
 x . y   X i  X .  Yi  Y
 2 
 2 gl = n-2
conjunto de dados
(Paramétrico)
Índice de  6 d 2  Quando há
rs  1    ou  2 n3  n
 x    tx
correlação de P/ estabelecer apenas uma possível  ( n  n) 
3
 x  y d
2 2 2  12
t t
3
rs  , Onde:  e onde: t 
Spearman (rho associação entre 2 amostras ou Ordinal 2  x2 .  y2 
 y 2  n  n   t y
12
 6 d 2 
3

- rs) (Não conjunto de dados, c/ 7  n  30 rs  1    gl = n


 12

 n( n  1)  postos repetidos...
paramétrico) 2

Correlação de
Útil quando n  10, embora não Ordinal 
Kendall (Tau)
relacionado diretamente ao r

Correlação Dicotomia artificial, às vezes Nominal e


rbis
biserial ultrapassa 1,0 – apresenta erro- Intervalo
padrão alto.
Correlação Nominal e
Dicotomia natural – extensão do r de rpb
Ponto biserial Intervalo
Pearson
Correlação do Nominal (2
Dicotomias naturais – extensão do r r
Coeficiente phi variáveis)
de Pearson e di Chi-quadrado
Correlação Nominal (2
Dicotomias artificiais – apresentam rt
Tetracórica variáveis)
correlações maiores do que phi
Correlação Intervalo (2 

81
Coeficiente de variáveis)
razão (eta) Usado para a análise de relações não
unilineares – extensão de r e da
ANOVA
É uma medida da proporção relativa gl r 1  F  1 
2  ; onde gl(r-
da variação (ou variância) total dos gl r 1  F  1   nT
Fórmula simplificada apresentada por
desempenhos que pode ser explicada 1) corresponde aos graus de Geoffrey Keppel in Design and Analysis -
OMEGA2 pelo efeito da manipulação liberdade inter-grupais; F
Intervalo A Researcher's Handbook. Prentice-Hall,
(Paramétrico) experimental (VI); serve para avaliar corresponde ao valor do teste F Inc., Englewood Cliffs, New Jersey. 1973.
a possível significância científica de (anova); e nT corresponde ao p. 551
um resultado qualquer de pesquisa número total de observações em
manipulativa. todos os grupos
no mínimo, no  S 2  log S 2 P/ poder-se avaliar o Bartellet, transforma-
Bartellet
nível de B  r .log
r
 se-o em valor de  X2 = (2,3026) . r . B; e
(Paramétrico)
intervalo se o lê na tabela do X2, sendo gl = r - 1
é a diferença entre as médias dos
grupos experimentais (tratamento = G  GC
terapias), cada um per si, e o de ET  E Onde: GE é a
SC O uso do efeito de tamanho possui a
Efeito de controle (não tratamento ou placebo)
tamanho (Meta em relação à determinada medida de média do grupo experimental e GC vantagem de não ser dependente do
análise) mudança. Esta diferença é então é a média do grupo de controle; e tamanho da amostra para ser
dividida pelo desvio padrão do grupo SC é o desvio padrão do grupo de estatisticamente significativo
de controle em relação à mesma controle.
medida avaliativa.
Obs.: se os dados forem de intervalo ou de razão, mas não provierem de uma distribuição normal (paramétrica), então deve-se transformar os
dados em ordinais e trabalhar com eles nesse nível escalar.

82
Quadro sobre as Escalas de Mensuração: Características, Afirmações e Operações Estatísticas.
Afirmações Estatísticas
Tipo de Escala Características Possíveis Exemplos Descritivas Testes Estatísticos

eventos/objetos identificados na base Semelhanças e/ou Grupo étnico, religião, sexo, cor Moda; Chi quadrado; Phi
da equivalência/não-equivalência; diferenças dos olhos, preferência manual, Percentagem (); G2 (modelo Log
1. Nominal
categorias discretas (identidade rótulos psiquiátricos (%); IVQ linear)
apenas)
ordenação, hierarquização, postos - Maior do que (>); Notas escolares, classe Mediana; Provas não-
ponto zero arbitrário (os intervalos, menor do que (<); socioecônomica, posição ordinal percentis; paramétricas e,
2. Ordinal amiúde, não são iguais) identidade na família, “status” social, decis; quartis frequentemente,
hierarquia das forças armadas e paramétricas
eclesiástica
magnitude/distância igual entre Todas acima, mais Temperatura em graus Celsius ou Média; r (PM de Pearson);
escores (pontos na escala a intervalos o grau de distância Fahrenheit, medidas Desvio padrão teste t; Anova
3. Intervalar numericamente iguais) - ponto zero entre escores padronizadas de aptidão ou traços
arbitrário -; valores contínuos (“personificação “intrapessoais” convertidos em
proibida”) quocientes, tempo/calendário
Todas da escala intervalar mais Todas acima, além Temperatura em graus Kelvin, Igual a 3, mais Os mesmos de 3
comparações proporcionais (advindas de certas altura, peso, tempo de reação, coeficente de
4. Razão de medições com instrumentos com atribuições ECG, EEG, nível auditivo em Hz variação Mg,
unidades numéricas precisamente organicamente ou db Mh
calibradas) - ponto zero absoluto qualitativas
Nota: Adaptado de Stevens (1968), com modificações substanciais.

83
PROPRIEDADES DA DISTRIBUIÇÃO GAUSSIANA

ALGUNS PARÂMETROS ESTATÍSTICOS E SEUS


SÍMBOLOS REPRESENTATIVOS
Média 
Variância 2
Desvio Padrão 
Erro Padrão da Média x  Sx
Coeficiente de Momento de Assimetria sk  g1
Coeficiente de Momento de Curtose 1  g2

Com base nos trabalhos de Pascal (1623-1662), Fermat (1601-1665) e Bernoulli (1654-1705), Abrão de Moivre (1667-1754)

demonstrou que a curva matemática que se aproxima da curva normal é dada pela seguinte fórmula:

1
y e 1/ 2 ( X j   /  ) 2
 2

onde y = a altura (ordenada) da curva maior de qualquer valor de Xj na distribuição de frequência;  = 3,14159, e = 2,71828

(a base de logaritmos naturais);  e  representam a média e o desvio padrão da distribuição, respectivamente.

84
GLOSSÁRIO
ALEATORIZAÇÃO - Processo que assegura que uma amostra seja escolhida no meio de
uma população de modo que a probabilidade de seleção de cada membro é igual à
probabilidade de escolha de qualquer outro da mesma população; dai que cada um e
todos os membros da população tenha(m) probabilidade(s) igual(is) de ser(em)
incluído(s) numa amostra aleatória.
ALFA () - A probabilidade de ocorrência de um erro do tipo I ao se tomar uma decisão
sobre a insustentabilidade de uma hipótese nula. ( = 1 - ; quanto menor for , maior
será , e vice-versa)
AMOSTRA - Subgrupo de uma população; grupo específico do qual se tomam medidas.
AMOSTRA ALEATÓRIA, CAUSAL, RANDÔMICA - Amostra escolhida de tal maneira
que cada membro da população-mãe teve a mesma chance ou oportunidade de ser
escolhido. É a amostra escolhida sem a interferência do pesquisador, obtida por meio de
sorteio, ou de tabelas de números aleatórios, ou por procedimento computadorizado
(pseudo-randômico), constituindo, do ponto de vista matemático, amostra probabilística.
AMOSTRA ESTRATIFICADA - Processo de obtenção de uma amostra representativa de
todos os estratos (camadas) da população, para tal se impõe restrições e condições à
composição da amostra. Temos uma amostra estratificada quando dividimos a população
em categorias relacionadas ao resultado da experiência, e depois "pegamos" um número
proporcional de sujeitos de cada categoria, utilizando a forma aleatória (de cada camada
retiramos amostras aleatórias de tamanho proporcional a cada estrato). A estratificação
de uma amostra faz-se ao longo de tantas dimensões quantas forem necessárias.
Amostra retirada de camadas da população denominadas estratos não superpostos,
caracterizando-se, de um lado, pela maior homogeneidade da variável investigada dentre
cada estrato e, de outro, pela maior heterogeneidade entre as camadas, como, por
exemplo, nível sócio-econômico de população urbana: baixo, médio e elevado.
De importância fundamental na técnica da estratificação é o conhecimento prévio de que os
estratos são pertinentes ao resultado da experiência.
AMOSTRA NÃO-TENDENCIOSA - Processo de amostragem no qual não se faz nenhum
tipo de restrição à possível inclusão de algum membro de uma população numa dada
amostra (não-tendenciosa); um fato estatístico que caracteriza uma amostra não-
tendenciosa, é sua média ser igual ou bem próxima ao parâmetro da população que ela
representa (quanto mais próxima da média da população for a média da amostra, menos
tendenciosa será a amostra).
Amostra por conglomerados: amostra probabilística cujas unidades simples são obtidas de
modo randômico de unidades coletivas, pressupondo-se que estas últimas apresentem
homogeneidade entre si. Colmeias, cardumes, blocos residenciais são exemplos de
unidades coletivas de onde são retiradas amostras randômicas.
Amostra sistemática: amostra probabilística cuja primeira unidade é obtida ao acaso e as
demais, a partir da primeira, escolhidas a cada k intervalo sistemático, definido pela
razão entre o tamanho da população e o tamanho da amostra.

85
AMOSTRA TENDENCIOSA - Amostra cuja média não corresponde a média da população
em apreço; ou, de outro modo, que sofreu algum tipo de viés (restrição) durante seu
processo de formação.
Amostra: do ponto de vista da estatística, parte representativa da população.
Amostragem: procedimento de estudo de uma parte do universo ou população. Sinônimo:
sondagem.
Amostras independentes: dois ou mais subconjuntos randômicos da população retirados de
modo independente; podem ser de tamanhos iguais ou desiguais.
Amostras pareadas: subconjuntos randômicos da população em que a variável estudada é
mensurada antes e depois de um certo procedimento. Exemplo: medição do pulso radial
antes e após esforço físico controlado. As amostragens são, necessariamente, do mesmo
tamanho.
Análise de sobrevivência: análise estatística do tempo de ocorrência de determinado
evento, o qual, na área médica, pode ser o óbito, a recidiva de uma doença, a resposta
terapêutica a uma droga etc. As instituições securitárias utilizam esse modelo de análise.
O BioEstat apresenta os seguintes programas de análise de sobrevivência: atuarial,
Kaplan-Meier e “Log-Rank test”.
Análise multivariada: compreende testes estatísticos nos quais são consideradas de maneira
simultânea n variáveis de k amostras, destacando-se nesta versão do BioEstat os
programas: Componente Principal, Distância Multivariada (Euclidiana, Penrose e
Mahalanobis), teste de Hotelling e teste de Bartlett.
ANOVA: teste estatístico cujo modelo de distribuição de probabilidades é o da variância
para k amostras ou tratamentos independentes. As amostras podem ser do mesmo
tamanho ou desiguais, no caso de k tratamentos (um critério), e devem ser iguais quando
for o caso de k tratamentos e r blocos (dois critérios). Este teste é também conhecido
como teste F, em homenagem a R. A. Fisher, e destina-se a comparar diferenças entre
médias através das variâncias, cujos escores amostrais devem ser mensurados a nível
intervalar ou de razões.
BEHAVIORISMO - Escola psicológica que sustenta que os dados, do ponto de vista
metodológico, devem ser, a um tempo, públicos e verificáveis, e que os aspectos
observáveis do comportamento (humano e não-humano) devem ser usados para
desenvolver leis e para a elaboração de teorias. Por outro lado, do ponto de vista teórico,
enfatiza as relações entre o comportamento dos organismos e os estímulos ambientais, o
que enseja ser considerado mecanicista (tal termo, entrementes, se referia aos filósofos
pós-descartesianos). Seu fundador foi John B. Watson, o qual inspirou-se nas idéias de
Locke e fundamentou-se na filosofia determinista de James, no funcionalismo de John
Dewey, no método experimental de Yerkes e na teoria do condicionamento reflexo de
Ivan P. Pavlov (Watson criou o que ficou conhecido como behaviorismo metodológico -
escola que propugnou pelo estatuto de ciência para a psicologia).
BETA () - A probabilidade de ocorrência de um erro do tipo II ao se tomar uma decisão
sobre a sustentabilidade de uma hipótese nula. Tal risco é determinado pelo tamanho e
pela variabilidade (heterogeneidade) das amostras, pelo nível de significância adotado,

86
pelo uso de um teste estatístico bicaudal ou unicaudal, e pela verdadeira natureza da
distribuição de freqüências das diferenças médias. ( = 1 - ; quanto maior for ,
menor será , e vice-versa)
Bioestatística ou Biometria: estatística aplicada às ciências da saúde e biológicas.
Bonferroni: procedimento de comparação entre médias de vários tratamentos, no sentido de
verificar a significância estatística das diferenças entre essas medidas de tendência
central, determinando-se, a priori, o nível alfa de decisão. A comparação é efetuada após
a análise da variância e somente se o valor de F for significativo.
CRD ("Completely randomized design" ou Plano totalmente aleatorizado) - neste tipo de
plano, se formam aleatoriamente dois ou mais grupos (amostras) com indivíduos
retirados de uma mesma população (para maiores detalhes, veja Glossário de termos
estatísticos, filosóficos e da metodologia positivista).
CATEGORIAS - Análise quantitativa (Catania, A. C., 1992)
CEGUEIRA DUPLA - (Vide dupla cegueira)
CETICISMO - Princípio filosófico segundo o qual é impossível se conhecer a verdade das
coisas.
Coeficiente de assimetria: medida de forma de distribuição dos escores de variáveis
aleatórias contínuas, podendo ser simétrica, assimétrica positiva (curva cuja cauda está
desviada para a direita) e assimétrica negativa (curva cuja cauda está desviada para a
esquerda).
COEFICIENTE DE CORRELAÇÃO - Índice estatístico que denota a tendência de uma
dada variável variar (não em função da outra, mas) quando uma outra varia (aumenta ou
diminui); expressa uma relação monotônica entre duas variáveis quaisquer. Estatística
que mede o grau de relação interna entre duas ou mais varáveis sob investigação.
Coeficiente de curtose: medida da forma de distribuição de variáveis aleatórias contínuas,
podendo ser mesocúrtica (em forma de sino), leptocúrtica (afilada) ou platicúrtica
(achatada).
Coeficiente de determinação (r2): é o quadrado do coeficiente de correlação (r),
representando a quantidade da variação de uma variável dependente explicada pela
variável preditiva.
Coeficiente de regressão: é uma constante que determina o grau de inclinação da reta de
regressão, simbolizado pela letra b. Na regressão múltipla há tantos coeficientes de
regressão quanto o número de variáveis independentes testadas.
Coeficiente de variação: razão entre o desvio padrão e a média aritmética vezes 100 (%).
Coeficiente Phi (): coeficiente de correlação entre duas variáveis qualitativas e
dicotômicas, dispostas em tabela de contingência 2 x 2.
COMPORTAMENTO ESPÉCIE-ESPECÍFICO - Comportamento observado em todos ou
na maioria dos membros de uma espécie (de somente um dos sexo ou de ambos, e talvez
somente sob limitado tempo da vida do organismo). Diferentes usos podem incluir:

87
comportamento emitido antes de sua seleção pelas conseqüências; comportamento
respondente incondicionado; e, em "fairly consistent environments"; comportamento
operante estereotipado mantido pelos reforçadores primários espécie-específicos ou
reflexos condicionados que dependem de reflexos incondicionados espécie-específicos.
Veja também exemplos específicos: Atividade deslocada, Padrão fixo de ação,
"Releaser", Atividade no vácuo (Catania, A. C., 1992)
Concordância de Kendall (W): teste de associação entre k variáveis dispostas em vários
conjuntos de postos e mensuradas a nível ordinal.
Contingência C: teste de associação entre conjuntos de variáveis mensuradas a nível
nominal, dispostas em tabelas de contingência l (linhas) x c (colunas), isto é, com
quaisquer números de categorias.
CONTRAPESO - Técnica de controle experimental em planos intraindividuais, a qual tem
como objetivo distribuir uniformemente os efeitos de transferência da(s) influência(s) de
cada tratamento pelas várias condições do experimento.
CONTROLE - Refere-se a métodos e processos que eliminam ou tentam eliminar ou
minimizar a ocorrência de variáveis estranhas ao experimento ou não desejadas na
experiência (cf. variáveis geradoras de confusão). Controlada é a experiência em que o
experimentador pode concluir sem ambigüidades que a variável manipulada (VI) teve
(ou não teve) efeito sobre a variável dependente, ou seja, no caso da Psicologia, sobre o
comportamento.
A palavra controle em ciência tem duas acepções. Na primeira, controle se refere a fazer
algo ocorrer quando se quer que ocorra ou quando se está em condições de observá-lo
se ele vier a ocorrer (isso envolve seleção e manipulação de variáveis independentes).
A segunda acepção da palavra controle está relacionada mais diretamente às condições
em que a experimentação será realizada (envolve impedir que algo não diretamente
relacionado a manipulação da VI ocorra - basicamente, o problema se refere ao controle
de possíveis variáveis extras, estranhas, externas ou intervenientes).
Coorte: grupo bem definido de uma população, possuindo alguma característica em
comum e cujos indivíduos permanecem no conjunto durante determinado tempo,
registrando-se e avaliando-se as ocorrências havidas entre os elementos no período
considerado.
Correção de Williams: correção do teste G para obter melhor aproximação com o teste do
qui-quadrado.
Correção de Yates: correção de continuidade do teste do qui-quadrado, onde se subtrai 0.5
do numerador de cada termo, desde que o grau de liberdade seja igual à unidade (1).
CORRELAÇÃO - Estratégia de pesquisa que não permite conclusões a respeito de
possíveis causas acerca dos fatos que estão sendo observados. Através da estratégia
correlacional podemos, apenas, estabelecer o grau em que duas ou mais variáveis estão
interrelacionadas ou co-relacionadas (cf. índice de correlação).
Correlação de Kendall: teste de associação entre duas variáveis mensuradas a nível ordinal
(postos), calculando-se a correlação pelo coeficiente de Kendall t.

88
Correlação de Spearman: teste de associação entre duas variáveis mensuradas a nível
ordinal (postos), calculando-se a correlação pelo coeficiente de Spearman rs.
Correlação linear (Pearson): teste de associação linear entre duas variáveis mensuradas a
nível intervalar ou de razões, medindo-se o grau e a direção pelo Coeficiente de
correlação linear r.
Correlação Parcial: teste de associação de duas variáveis quantitativas – X e Y – as quais
são testadas juntamente com uma outra variável – Z –, a fim de se verificar se a
correlação existente entre as primeiras é alterada pela presença da terceira variável
introduzida.
Correlação: teste de associação entre variáveis, medindo-se a magnitude e o sentido ou
somente o grau dessa correlação, conforme o teste empregado. Não há qualquer
dependência de uma variável em relação à outra.
DADOS ESTATÍSTICOS (OU ESTATÍSTICAS DA AMOSTRA) - Escores baseados em
dados amostrais empregados para estimar os parâmetros da população-mãe (por
exemplo, média ou desvios-padrões).
Dados: escores obtidos de observações ou de experimentos, podendo ser de fontes
primárias ou secundárias e de amostras ou de populações.
DEFINIÇÃO - Enunciado a respeito do emprego de palavras na forma "A se, e apenas se,
B, C etc.". As definições são um meio taquigráfico de comunicação, de modo que se
preserva o significado inequívoco, ao mesmo tempo em que se reduz a verbosidade ao
mínimo.
DEFINIÇÕES 0PERACIONAIS - Definição na forma "condicional" que proclama as
condições específicas (quando e como) para a observação ou a mensuração de conceitos
mais ou menos abstratos, bem como o resultado que será observado ou medido depois
que as condições impostas forem satisfeitas.
DESCRIÇÃO - A mais simples das estratégias de pesquisa, a qual envolve o ato de
observar e registrar os comportamentos à medida que eles ocorrem.
DESVIO PADRÃO (DP) - (Apresenta propriedades da variância e tem a mesma unidade de
medida dos dados). É definido como a raiz quadrada da variância, com sinal positivo e
negativo ao mesmo tempo, pois envolve desvio em torno da média para um e para outro
lado da distribuição dos dados. O desvio padrão é representado por S.
( X )2
X 
2
(X  X)
S 
2
ou S n
n 1 n 1
Distribuição binomial: modelo de distribuição de probabilidades de variáveis aleatórias
discretas, consistindo de n provas idênticas e independentes, cada uma apresentando
apenas dois resultados: sucesso (p) e insucesso (q = 1 - p).
DISTRIBUIÇÃO DE FREQÜÊNCIA DE DIFERENÇAS MÉDIAS DE AMOSTRAS -
Distribuição de freqüências de diferenças médias ( X E  X C ) obtida de um número
supostamente infinito de diferenças médias entre amostras (diferenças entre médias de

89
amostras); o valor médio (ou seja, a média das diferenças entre as médias) de uma
distribuição de diferenças médias de amostras é zero.
DISTRIBUIÇÃO DE FREQÜÊNCIA DE MÉDIAS DE AMOSTRAS - Distribuição de
freqüências de um número infinito de médias de amostras aleatórias, geralmente
hipotéticas; seu valor médio é igual a média da população.
Distribuição de Poisson: modelo de distribuição de probabilidades de variáveis aleatórias
discretas, cujos eventos são raros e referentes ao tempo e ao espaço. A média é igual à
variância.
Distribuição exponencial: modelo de distribuição de probabilidades de variáveis aleatórias
contínuas, referente ao intervalo de tempo decorrido entre eventos raros e discretos.
Distribuição hipergeométrica: modelo de distribuição de probabilidades de variáveis
aleatórias discretas, com as mesmas características da distribuição binomial. O tamanho
da amostra, contudo, é relativamente grande em relação ao tamanho da população,
alterando-se em grau acentuado a probabilidade dos elementos do universo pela retirada
de cada unidade sem reposição.
DISTRIBUIÇÃO NORMAL (OU CURVA NORMAL OU CURVA DE GAUSS) - Modelo
de distribuição de probabilidades de variáveis aleatórias contínuas de largo emprego em
estatística, caracterizando-se por ser simétrica, em forma de sino, assintótica, cuja área
sob a curva é igual à unidade.
É a distribuição simétrica de dados em que a maioria dos valores se concentra na região
central da curva, isto é, perto da média, e as freqüências dos dados decresce rapidamente
de ambos os lados da área central. A forma geral da curva é descrita como em forma de
sino e, sendo simétrica, a média, a mediana e a moda terão todas o mesmo e único valor.
A curva normal tem como parâmetros  (mi) e  (sigma), onde  representa a média e 
o desvio-padrão da população. Apresenta também dois pontos de inflexão (lugares onde
a curva muda de direção) correspondentes, respectivamente, aos valores de x =  +  e x
=  - . O termo "curva normal" foi cunhado por Pearson em 1893.
DUPLA CEGUEIRA - Processo experimental no qual nem o sujeito, nem o
experimentador, tem conhecimento prévio da condição específica que está sendo
administrada (manipulada) na experiência.
ECOETOLOGIA - ("ekos" = casa, lugar, ambiente) disciplina que estudo o comportamento
dos organismos em seus ambientes naturais, sem levar em consideração os determinantes
internos (o mesmo que ecologia comportamental; vide tb. etologia).
EFEITO PRINCIPAL - Comparação de médias globais com dados geralmente decompostos
através dos níveis de uma terceira variável.
EFEITO SIMPLES - Quando há efeito de interação entre duas variáveis, a análise deve
focalizar as diferenças entre cada par de médias (por exemplo, A1 vs. A2) em cada nível
de alguma outra variável (B1 e B2, por exemplo).
EMPARELHAMENTO - Método de controle em planos de grupos separados em que se
tenta explicitamente tornar os grupos (amostras) equivalentes, antes da introdução das

90
condições experimentais ou da aplicação dos tratamentos, com respeito a uma ou mais
de uma medida ou característica.
EMPIRISMO - Escola filosófica que afirma serem as experiências fatuais, verificáveis,
sensoriais, o fundamento da observação e, por conseqüência, de todo o conhecimento.
EQUIPARAÇÃO - (Vide emparelhamento).
Erro amostral: viés observado nas amostras aleatórias, decorrente da natural variabilidade
dos elementos constituintes das populações, assinalando-se o fato de que nem todos as
unidades do universo participam da amostra. O erro amostral é minimizado pelo
aumento do tamanho amostral e medido pelo erro padrão.
ERRO DE AMOSTRAGEM - Erro não-sistemático ocorrido entre amostras retiradas de
uma mesma população, o qual se deve a representações errôneas nas amostras de
características relevantes da população.
ERRO DO TIPO G - Tipo de erro de amostragem (extrínseco ao planejamento
experimental) que se deve à ocorrência acidental de alguma particularidade ambiental
que influi no desempenho de toda uma amostra.
ERRO DO TIPO I (ou simplesmente Erro tipo I) - Erro de julgamento que resulta da
rejeição da hipótese nula (H0) quando ela é, de fato, verdadeira.
ERRO DO TIPO II (ou simplesmente Erro tipo II) - Erro de julgamento que resulta da
aceitação da hipótese nula (H0) quando ela é, de fato, falsa.
ERRO DO TIPO R - Tipo de erro de amostragem (intrínseco ao planejamento
experimental) que se deve à seleção de uma amostra que contém alguma particularidade
relativamente permanente que a diferencia da população-mãe.
ERRO DO TIPO S - Tipo de erro de amostragem que se deve à inclusão inadequada, numa
amostra, de indivíduos com características extremas e pouco representativas ou não
representativas da totalidade dos indivíduos da população.
ERRO PADRÃO DA DIFERENÇA ENTRE MÉDIAS - O erro-padrão da diferença entre
médias é igual à raiz quadrada da soma das variâncias estimadas das populações. O
tamanho do erro-padrão de uma distribuição de freqüências de diferenças entre médias
depende do tamanho das amostras e das estimativas das variâncias das populações. Ele é
calculado pela formula: EPX 1  X 2  12  22

ERRO PADRÃO DA MÉDIA (ou simplesmente Erro padrão) - É o desvio padrão da média
( S x ); é o "erro" inerente a qualquer cálculo de médias de amostras. Pode ser calculado


  X
2

S S2 X 2

pelas seguintes formulas: EP  ou , ou ainda, n . O erro


n1 n1 n  2n  1
2

padrão é uma estimativa da diferença entre a média da população e a média da amostra.


ESCALA DE RAZÃO - caracteriza-se por apresentar unidade constante e comum de
mensuração, atribuindo-se um número real a cada escore, havendo uma razão conhecida
entre dois intervalos quaisquer, um quociente conhecido entre dois valores quaisquer e

91
um verdadeiro ponto zero como origem. Escala de mensuração que possui todas as
propriedades das escalas nominal, ordinal e de intervalo, mais a propriedade adicional
de possuir um zero absoluto no ponto de origem (por exemplo, as mensurações físicas
corriqueiras de peso e comprimento).
ESCALA INTERVALAR - Escala de mensuração que proporciona enunciados do tipo
"maior do que" ou "menor do que", e especifica a quantidade de unidades "maiores do
que" ou "menores do que" (como exemplo, a escala de temperatura em graus
centígrados). A escala de intervalos tem as propriedades de ordenação e adição de
valores. A Escala intervalar é semelhante à escala de razão, havendo apenas uma razão
conhecida entre dois intervalos quaisquer, sendo a unidade de medição e o ponto zero
arbitrários. Alguns pesquisadores não fazem distinção entre esta escala e a de razão
ESCALA NOMINAL - Escala mais simples que existe; nela se usam números ou
quaisquer outros símbolos para distinguir características ou indivíduos, uns(umas) do(a)s
outro(a)s, dentre um conjunto ou classe de objetos, coisas etc., havendo relação de
equivalência entre e dentre as categorias. Exemplo: estado civil: solteiro, casado,
divorciado e viúvo.
ESCALA ORDINAL (ou por postos) - Escala na qual os números (valores) indicam tão
somente diferença(s) de magnitude, tamanho ou ordem (por exemplo, posição, ordem ou
lugar em que atletas velocistas ou fundistas atingem a linha de chegada).
Escala na qual as modalidades de uma variável são ordenadas em graus ou magnitudes
convencionadas, havendo uma relação matemática “maior do que” ou “menor do que”
dos elementos, objetos, coisas entre as diversas categorias e de equivalência das
unidades dentre cada modalidade. Exemplo: conceitos escolares: Excelente, Bom,
Regular e Insuficiente.
ESCOLA DE WÜRZBURG - Escola psicológica que enfatizou atos e processos e usou a
introspeção como método; precursora do Funcionalismo.

ESCOLA, ABORDAGEM, CORRENTE OU TENDÊNCIA PSICOLÓGICA - Estes


termos referem-se, geralmente, a um grupo de estudiosos que seguem ou compartilham
os mesmos princípios ou princípios metodológicos semelhantes.
Cada Escola ou corrente reúne um conjunto de psicólogos que, em decorrência de
pesquisas já realizadas, admitem certos métodos e concepções próprias acerca do
comportamento.
Escores padronizados: transformação dos escores brutos em escores z, onde a média é igual
a zero e o desvio padrão igual à unidade (1).
Especificidade: percentagem de indivíduos sem o evento (sem a afeção investigada, por
exemplo), cujo teste – tuberculínico, por exemplo – é negativo (–).
Estatística descritiva: parte da estatística cujo objetivo é a coleta, a organização, a
classificação dos dados amostrais ou das populações, as apresentações tabular e gráfica e
o cálculo de determinadas medidas: média, mediana, variância, desvio padrão,
coeficiente de variação, de assimetria, de curtose e outras.

92
Estatísticas (no plural): valores numéricos das amostras, constituindo nas amostras
probabilísticas estimativas não enviesadas dos parâmetros conforme é demonstrado pelo
Teorema do Limite Central.
Estimação de parâmetros: parte da inferência estatística, cujo procedimento indutivo
consiste em generalizar os valores numéricos amostrais para o universo investigado.
ESTRUTURALISMO - A primeira escola de psicologia; tentou reduzir a mente a
elementos básicos ou estruturais e desenvolveu a introspecção como método
experimental. Fundada por Wilhelm Wundt.
Estudo longitudinal: é aquele no qual se coleta informações sobre os indivíduos
selecionados ao longo de um intervalo de tempo especificado.
Estudo prospectivo: estudo longitudinal no qual os indivíduos são observados a partir de
um dado momento, prosseguindo-se ao longo do tempo previamente fixado.
Estudo retrospectivo: estudo longitudinal no qual as informações de interesse estão
contidas em registros anteriores, em arquivos de dados como, por exemplo, em
prontuários hospitalares.
Estudo transversal: dados coletados de um grupo de indivíduos em um momento definido,
avaliando-se sobretudo a prevalência de uma determinada afecção.
ETOLOGIA - ("ethos" = comportamento, hábitos, costumes) estudo do comportamento dos
organismos e seus determinantes internos e ambientais.
EXPERIÊNCIA (EXPERIMENTO, EXPERIMENTAÇÃO) - Conjunto de regras que
orientam o arranjo e a ocorrência de certos eventos numa forma lógica, de modo que os
dados dos sentidos possam ser usados para formular relações legítimas entre esses
eventos.
Enfoque analítico no qual há intervenção do pesquisador nas condições em que os
indivíduos são submetidos à pesquisa, com controle efetivo dos fatores causais e dos
respectivos efeitos.
EXPLICAÇÃO - Refere-se à aplicação de conceitos, leis e teorias em relação a um
resultado experimental qualquer ou em relação a um evento que ocorre naturalmente. A
explicação, em ciência, só é útil quando pode ser posta à prova; e só será testável
quando os fatos que poderiam falseá-la são conhecidos e podem ser descartados como
dispensáveis para a referida explicação.
Explicar, em ciência, envolve identificar a “causa” de um dado evento ou acontecimento
tido como efeito (via de regra, VI  VD).
FATO - Em sentido mais geral, descrição de uma observação que transmite uma espécie de
conhecimento empírico acerca do mundo. Os fatos devem ser a base na elaboração e
explicação da teoria científica.
FENOMENOLOGIA - Enquanto escola psicológica, procura compreender o mundo do
ponto de vista do indivíduo. Em oposição aos behavioristas, os fenomenólogos fazem
uso da experiência subjetiva, dos relatos introspectivos e dos processos mentais.
Enquanto escola filosófica, teve sua primeira formulação através de Edmund Husserl

93
(1900). Pretende levar ao conhecimento da verdade ou essência do fenômeno, através da
intencionalidade da consciência (haja vista que toda consciência é consciência de algo -
porém, a consciência da essência das realidades é uma tarefa infindável, necessariamente
incompleta, pois toda compreensão do fenômeno é apenas superficial e deve ser
"completada" por outras essências das vivências). Portanto, a fenomenologia seria o
conhecimento descritivo das essências da consciência pura, livre de preconceitos.
Fenótipo: característica de um indivíduo resultante do produto dos genes e expressada de
diversas maneiras. As pessoas do sistema sanguíneo ABO, por exemplo, são
classificadas em fenótipos dos grupos A, B, AB ou O.
FIDEDIGNIDADE DA MEDIDA DE RESPOSTA - Representa o grau em que uma dada
resposta reflete, sem variação com o passar do tempo, os efeitos de uma variável
independente (a medida de resposta, em uma dada experiência, é a mesma em dois
momentos distintos dessa experiência).
FOTOTAXIA - Rejeição de substâncias com dado veneno ("taste") após sua ingestão ter
sido seguida por distúrbio gastrointestinal ou náusea (e.g., como a produzida por raio-x).
Ela pode ser interpretada como comportamento operante (punição de ingestão de
substância com este veneno ("taste") ou como condicionamento respondente (onde
distúrbio gastrointestinal é o EI e o veneno ("taste") torna-se um EC). Em outros casos,
sua característica especial é o longo intervalo (algumas vezes horas) entre o "taste and its
aftermath". O procedimento não é efetivo sob tais lapsos, intervalos ("delays") se
estímulos como sons ou "fights" são substituídos por veneno ("taste"). Por esta razão,
aversão a veneno ("taste") é freqüentemente citada como um exemplo de preparação.
Taxis (plural. taxes). Movimento filogeneticamente determinado ou orientação "em
direção de" ou "para longe de" um estímulo (e.g., fototaxia negativa é movimento de
afastamento desde a luz). Cf. KINESIS.
FUNCIONALISMO - Escola psicológica que se ocupa dos propósitos dos eventos mentais
e do como e do por quê das operações mentais (função da mente no processo de
adaptação dos organismos as condições sempre flutuantes de seus ambientes). O
funcionalismo é o primeiro sistema psicológico genuinamente norte-americano.
Genótipo: conjunto de todos os genes que determinado indivíduo possui. No caso, por
exemplo, do sistema sanguíneo ABO, as pessoas do grupo A possuem o genótipo AA ou
AO; do grupo B, genótipo BB ou BO; do grupo AB, genótipo AB; e do grupo O,
genótipo OO.
GESTALT - Escola psicológica que enfatiza a experiência do organismo total. Os
psicólogos da Gestalt entendem que o todo é mais que a soma das partes (princípio
enunciado pelo filósofo chinês Mao Tsé no séc. II AC). A Gestalt se orienta por pontos
de vista fenomenológicos - o todo, o conjunto, a forma resulta da descoberta de relações
entre as partes que compõem este todo -. A Gestalt ficou conhecida como a psicologia da
boa forma ou da percepção.
“Goodness of fit”: teste estatístico de modelo de distribuição de probabilidades, no qual as
proporções observadas se ajustam às proporções esperadas, deduzidas matematicamente

94
ou estabelecidas de acordo com alguma teoria. É também denominado de teste de
aderência.
Graus de liberdade (gl): são parâmetros indexadores estatísticos correspondentes ao
número de observações independentes, como se observa nas distribuições t de Student, F
da ANOVA, Qui-quadrado e r da correlação linear de Pearson.
Conceito estatístico de difícil explicitação - contudo, pode ser simplificado pela formula
gl = n - 1 -. Graus de liberdade se refere a segurança que o pesquisador adquire em
função do tamanho relativo de sua(s) amostra(s).
Heterogeneidade das amostras: é um modelo probabilístico que indica se as amostras
investigadas não são oriundas da mesma população, sendo utilizado nos testes do qui-
quadrado, da correlação linear e da regressão linear.
Heterogeneidade das variâncias: é um modelo probabilístico que revela se as variâncias dos
subconjuntos testados são desiguais, não são oriundas da mesma população, sendo
empregado no teste F ou da ANOVA, no teste t de Student para duas amostras
independentes, e na regressão linear. Sinônimo: heteroscedasticidade.
HIPÓTESE EXPERIMENTAL, HIPÓTESE DE TRABALHO, HIPÓTESE
ALTERNATIVA OU H1- É a hipótese que contraria a de nulidade, no sentido de
afirmar que há diferença entre os grupos específicos objetos da pesquisa. A diferença
observada é considerada real, rejeitando-se, portanto, a hipótese de nulidade. A H1 é
uma reformulação explícita da pergunta (problema) geral da pesquisa, a qual esclarece a
relação entre as variáveis, independente e dependente (VI e VD), quais os sujeitos
experimentais, os processos e materiais a serem usados. A hipótese experimental prediz
que ocorrerá uma variação sistemática na VD (observações diferentes) em função de
variações na VI (tratamentos).
HIPÓTESE NULA OU DE NULIDADE (H0) - Enunciado que sustenta que quaisquer
diferenças entre duas observações, amostras, grupos etc., se devem ao acaso ou a fatores
aleatórios e não a uma variação sistemática da VI; hipótese que sustenta que não há uma
diferença "real" entre as médias das amostras usadas no experimento. É a hipótese que
se testa, considerando-se não haver diferenças entre os grupos específicos objetos do
estudo.
Homogeneidade das amostras: é um modelo probabilístico o qual indica se as amostras
investigadas são oriundas da mesma população, sendo utilizado nos testes do qui-
quadrado, da correlação linear e da regressão linear.
Homogeneidade das variâncias: é um modelo probabilístico quel revela se as variâncias
dos subconjuntos testados são iguais, oriundas, portanto, da mesma população, sendo
empregado no teste F ou ANOVA, no t teste de Student para duas amostras
independentes e na regressão linear. Sinônimo: homoscedasticidade.
Incidência: estudo epidemiológico de ocorrência de casos novos de determinada doença,
constatados ao longo de um período de tempo pré-fixado como, por exemplo, 6 meses,
um ano, e assim por diante. Os estudos relativos à incidência são denominados de
longitudinais.

95
ÍNDICE DE CORRELAÇÃO - O coeficiente de correlação não é uma medida da mudança
quantitativa de uma "variável" em relação a outra, é somente uma medida da intensidade
de associação (co-relação) entre duas variáveis. Sua formula para dados independentes é:

 xy ,  xy   ( X i  X ).(Yi  Y )
r ONDE  ; para dados correlatos ou
 x2 . y2 
   
 x . y   X i  X .  Yi  Y
2 2  2  2

 6 d 2   6 d 2 
repetidos é: rs  1    ou rs  1   
 ( n  n)   n( n  1) 
3 2

Inferência estatística: método indutivo de generalização dos valores numéricos amostrais


para a população de onde os dados foram retirados. As generalizações estatísticas,
diferentes das leis universais, admitem exceções, mas proporcionam conhecimentos de
relevância em termos científicos.
INTERAÇÃO - Ocorre interação entre variáveis independentes, quando o efeito de uma
delas é substancialmente diferente em cada nível da outra.
INTERAÇÃO DE ORDEM TRIPLA - Interação que ocorre em planos trifatoriais. Uma
interação de ordem tripla implica que uma ou mais interações bifatoriais provavelmente
serão significantes em um nível do terceiro fator (por exemplo, AB é significante em
C1), ao passo que uma ou mais interações bifatoriais que envolvem os mesmos termos,
não são significantes em um outro nível do mesmo terceiro fator (AB não é significante
em C2, por exemplo); uma interação de ordem tripla também poderá ocorrer se as
formas das interações bifatoriais se alterarem radicalmente nos níveis do terceiro fator.
Intercepto: é uma constante relativa ao valor de Y nas equações de regressão linear quando
o escore de X é igual a zero, sendo simbolizada pela letra a. Representa, portanto, o
valor da variável dependente quando o valor da variável preditiva é igual a zero.
Intervalos de confiança: área abrangida pela estimativa pontual e, mais ou menos, n erros
padrões, definidos em termos probabilísticos pela Regra Empírica e pelo Teorema do
Limite Central. Os intervalos de confiança mais usados são de 95% e 99%,
correspondentes, no caso da média aritmética de grandes amostras, a e , respectivamente.
INTROSPECÇÃO - Método usado pelos primeiros psicólogos estruturalistas, o qual exigia
sujeitos treinados a "olhar para dentro de sí mesmos", refletir sobre as mudanças
ocorridas em suas experiências conscientes e relatar fielmente essas mudanças a um
experimentador que relacionava sistematicamente, em relação ao conteúdo da mente, um
relato subjetivo a outro, buscando a formulação de leis do tipo R-R.
INVERSÃO - Técnica de controle em experimentos com sujeitos únicos; consiste em se
retornar, após a aplicação do tratamento experimental, às condições que vigiam durante a
fase de registro da linha de base inicial.
Kolmogorov-Smirnov: teste estatístico não-paramétrico, de aderência ou de independência,
para uma ou duas amostras, respectivamente. O teste de aderência é utilizado também
para testar a normalidade dos escores amostrais.
LEI - Enunciado de uma relação sistemática entre variáveis ou conceitos. Um exemplo de
ocorrência de um conceito está sempre ligado ao exemplo de ocorrência de um outro.

96
Levantamentos ou “surveys”: estudos caracterizados pela coleta de dados, descrevendo-se
os escores amostrais e calculando-se estatísticas que estimam os parâmetros da
população investigada. Nos levantamentos pode-se, ainda, estudar a relação de causa e
efeito de variáveis, mas sem o controle efetivo dos elementos causais.
LINGUAGEM DA OBSERVAÇÃO - Palavras usadas para descrever ou nomear eventos
observáveis diretamente. Essa linguagem consiste em termos que especificam e
identificam, ou indicam propriedades de objetos, ou descrevem relações entre eles; a
linguagem da observação é o ponto de partida para a comunicação científica.
LINHA DE BASE (COMPORTAMENTO DE BASE OU, SIMPLESMENTE, BASE) -
Refere-se, via de regra, ao comportamento firme, estável, apresentado por um organismo
antes da introdução do tratamento experimental em um plano de sujeito único (estratégia
de controle usada na abordagem de pesquisa conhecida como manipulativa funcional ou
AEC - cf. Behaviorismo e/ou Manipulação).
LINHA DE BASE MÚLTIPLAS - Processo de controle experimental usado em pesquisas
de sujeito único. Diferentes sujeitos podem receber o mesmo tratamento em diferentes
ocasiões ou o mesmo sujeito pode receber o mesmo tratamento para diferentes tipos de
respostas ao longo do tempo ou de ambientes diferentes.
MANIPULAÇÃO - Estratégia ou abordagem de pesquisa muito poderosa, que envolve a
manipulação (alteração) de uma ou mais variáveis independentes. A manipulação é
utilíssima para determinar relações causais. Essa abordagem pode ser dividida em:
Abordagem Manipulativa Propriamente Dita (AMPD) e Abordagem manipulativa
funcional (também conhecida como Análise Experimental do Comportamento - AEC, a
qual faz uso do plano de sujeito único). As principais diferenças entre elas são: uso de
grupos de sujeitos (AMPD) em contraste com o uso extensivos de planos de sujeito
único (AEC); uso de testes de hipóteses e de estatísticas na análise dos dados
experimentais (AMPD) em contraste com o uso de curvas acumuladas de respostas
(AEC); uso do método hipótetico-dedutivo na elaboração de teorias (AMPD) em
contraste com o uso do método indutivo (AEC).
MÉDIA (ou simplesmente Média aritmética)- Medida de tendência central de largo
emprego em estatística, usada para caracterizar ou descrever alguma particularidade
quantificável de uma dada amostra, subconjunto, ou mesmo, de uma população. Como
estatística, a média é definida como um índice aritmético, calculado pela somatória ou
soma de todos os valores ou escores (Xn) observados na amostra, dividido pelo total de
observações realizadas ou pelo número de indivíduos ou casos (N) que compõem a
 Xn
amostra ( X  ).
N
Média geométrica: medida de tendência central representada pela raiz n do produto dos
escores e indicada, sobretudo, quando os dados estão dispostos em progressão
geométrica.
Média harmônica: medida de tendência central para grandezas inversamente proporcionais
como, por exemplo, tempo e velocidade, tempo e produtividade etc.

97
Mediana: medida de tendência central que separa os escores em dois grupos: 50%
inferiores e 50% superiores à mediana.
Meta análise: permite a integração de várias pesquisas, no entanto, antes que tal análise
seja possível, pesquisas individuais devem, evidentemente, ser conduzidas.
Entrementes, SMITH et al. (1980) previnem que a comparação é bruta e não controlada
quando se trata de pesquisas na clínica – por exemplo, para avaliar a efetividade de
terapias -, visto que as pessoas que buscam ajuda psicológica não se alocam
aleatoriamente nos diferentes tipos de terapia. Um exemplo de meta análise é a medida
do efeito de tamanho, a qual pode ser obtida para cada tipo de terapia, geralmente através
da média das diferentes medidas de resposta utilizadas para avaliar a efetividade da
terapia. O efeito de tamanho é a diferença entre as médias dos grupos experimentais
(tratamento = terapias) e o de controle (não tratamento ou placebo) em relação à
determinada medida de mudança. Esta diferença é então dividida pelo desvio padrão do
grupo de controle em relação à mesma medida avaliativa. O uso do efeito de tamanho
possui a vantagem de não ser dependente do tamanho da amostra para ser
estatisticamente significativo, como acontece nos testes de significância.
Moda: é o valor mais freqüente de um conjunto de dados.
Modelo: forma simbólica de um princípio físico expresso por uma equação ou por uma
fórmula.
Newman-Keuls: procedimento de comparação entre médias de vários tratamentos, no
sentido de verificar a significância estatística das diferenças entre essas medidas de
tendência central. A comparação é efetuada após a análise da variância e somente se o
valor de F for significativo.
NÍVEL DE SIGNIFICÂNCIA - Ao realizarmos um teste estatístico sobre os dados de um
experimento, estaremos habilitados a dizer em que medida (nível) é provável que
qualquer diferença observada seja devida ao acaso. Se é muito improvável que a
diferença possa ser causada por acaso, - digamos, a probabilidade é de 1:1000, ou seja,
0,001 - então, se concluirá que a variável independente é a responsável pela diferença;
diz-se, então, que a diferença é significante. Se, por outro lado, a diferença entre os dois
grupos pode facilmente surgir por acaso, então não há razão alguma para atribuí-la ao
efeito da variável independente. Os resultados serão considerados não-significantes.
Até que ponto (nível) a explicação aleatória tem de ser improvável para que a rejeitemos
e possamos considerar os resultados significantes? Essa é essencialmente uma questão
arbitrária. Em geral, adota-se o valor alfa de 0,05 ou 0,01, admitindo-se, ao rejeitarmos
a hipótese nula, a possibilidade de ocorrência de 1 erro em 20 chances (0,05 = 5%) ou 1
em 100 (0,01 = 1%), respectivamente; a maioria dos psicólogos experimentais adota um
nível de significância () de 0,05, ou seja, precisará estar num nível de ocorrência
(aleatória) de 5:100 ou 1:20 (5 casos em cada 100 ou 1 caso em cada 20 observações,
respectivamente).
Observação censurada: observação na análise de sobrevivência que não cumpriu o
seguimento estabelecido, desconhecendo-se o motivo (abandono etc.).

98
OBSERVAÇÃO NATURALÍSTICA - Estratégia descritiva que requer observação e
mensuração do comportamento à medida que ele ocorre em seu estado natural ou
normal.
“Odds ratio” (razão de chances): teste estatístico simbolizado por OR para determinar o
risco relativo de dois grupos independentes, funcionando um deles como controle, sendo
utilizado em epidemiologia a fim de avaliar a ocorrência de pessoas expostas a
determinado evento em relação ao grupo de indivíduos não expostos.
OMEGA2 - É uma medida da proporção relativa da variação (variância) total dos
desempenhos que pode ser explicada pelo efeito da manipulação experimental (VI);
serve para avaliar a possível significância científica de um resultado qualquer de
pesquisa manipulativa.
Uma fórmula simplificada é a apresentada por Geoffrey Keppel (in Design and Analysis
- A Researcher's Handbook. Prentice-Hall, Inc., Englewood Cliffs, New Jersey. 1973.
gl r 1  F  1 
p.551):  2  ; onde gl(r-1) corresponde aos graus de liberdade inter-
gl r 1  F  1   nT
grupais; F corresponde ao valor do teste F (anova); e nT corresponde ao número total de
observações em todos os grupos.
P (valor): é a probabilidade obtida nos testes de hipótese (inferência estatística). Quando o
P (valor) é igual ou menor que o nível alfa previamente estabelecido, rejeita-se a
hipótese de nulidade.
PARADIGMA - O mesmo que modelo (no caso da ciência, modelo teórico usado para
explicar a classe de fenômenos estudados ...). Kuhn usa o termo paradigma para se
referir "à constelação total de crenças" compartilhada por certos cientistas ou uma dada
comunidade, ou ainda, a uma experiência exemplar - por exemplo, os pesos deixados
cair por Galileu Galilei da torre de Pisa, na Itália. Modelo teórico exemplar.
Em outros momentos Kuhn (1997: 13) usa o termo paradigmas, referindo-se às
realizações científicas universalmente reconhecidas que, durante algum tempo, fornecem
problemas e propiciam soluções modelares para uma comunidade de praticantes de uma
ciência.
PARÂMETROS DA POPULAÇÃO - Características (valores numéricos das populações
representando constantes de cada variável do universo investigado) inerentes a toda e
qualquer população, como sua média, variância etc. Geralmente esses parâmetros são
deduzidos à partir de amostras da população que se está interessado em conhecer seu
comportamento ou certas características. Os dados estatísticos das amostras são então
generalizados para a população de onde as amostras foram retiradas.
PARTICULARIDADES RECORTADAS (ABSTRATAS) - Particularidades ou objetos
reais (!?) que requerem condições especiais para a sua observação.
PARTICULARIDADES SALIENTES (NOTÁVEIS) - Particularidades ou objetos da
experiência sensorial que não precisam de outra definição além de uma lista dos seus
atributos.

99
PLACEBO - Condição de controle em que todas as particularidades são idênticas à
condição experimental, excetuando-se seu aspecto-chave ou crítico. Em medicina,
substância sem propriedades terapêuticas, usada no lugar de substâncias sabidamente
com princípios ativos, ou substância usada e acreditada como tendo ação farmacológica
importante.. Em psicossomática, efeito placebo se refere a um efeito meramente devido
à sugestão psicológica ou crença.
PLANO ALEATORIZADO SIMPLES - Experimento com dois ou mais níveis de uma
única variável; geralmente um dos níveis é a condição experimental, e o outro nível, é a
condição de controle (sem a presença da variável independente).
PLANO BIFATORIAL, INTRA-INDIVIDUAL (?) - Experimento em que se manipula duas
variáveis intraindividuais e no qual se apresenta a cada sujeito todos os níveis de cada
uma delas (plano intragrupal).
PLANO DE TRATAMENTO INTRA-INDIVIDUAL - Tipo de plano em que, a cada
sujeito, se administra todas as condições que fazem parte da pesquisa.
PLANO DE TRATAMENTO POR NÍVEIS - Experimento do tipo interindividual, com
duas variáveis independentes, no qual uma delas funciona como variável emparelhante
(via de regra, é uma variável "do sujeito" que serve para equiparar os grupos); do ponto
de vista da análise teórica, os efeitos da variável emparelhante anulam-se
reciprocamente, uma vez que ela está presente tanto na condição experimental, como na
condição de controle. Para que o emparellhamento tenha sentido, é necessário que haja
uma correlação significativa entre a variável dependente e a variável emparelhante.
PLANO DE TRATAMENTO POR SUJEITOS - Experimento do tipo intraindividual, com
apenas um variável, em que cada sujeito recebe todos os níveis dessa variável. Neste
plano, a influência das variáveis do sujeito como variáveis geradoras de confusão, são
desconsideradas no momento da análise dos resultados (se ocorreram erros devido as
variáveis dos sujeitos, elas ocorreram em todos os tratamentos, logo, seus efeitos se
igualam quanto ao resultado final, portanto, podem ser desconsiderados).
PLANO DE TRATAMENTO POR TRATAMENTO (PLANO FATORIAL) - Tipo de
plano interindividual, com duas variáveis, em que os efeitos de interação e os efeitos
principais ou os simples são investigados; a forma mais simples desse plano é o plano
fatorial 2 x 2.
PLANO INTERINDIVIDUAL - Tipo de plano em que, a cada sujeito, de cada grupo, só se
administra uma, e apenas uma, dentre as várias condições que fazem parte da pesquisa.
PLANO INTRA-INDIVIDUAL UM, INTERINDIVIDUAL DOIS - Plano misto com duas
variáveis interindividuais e uma intraindividual.
PLANO INTRA-INDIVIDUAL UM, INTERINDIVIDUAL UM - Plano misto com duas
variáveis independentes, sendo uma intraindividual e a outra, interindividual.
PLANO MISTO - Tipo de plano em que se administra, pelo menos, duas variáveis
independentes, sendo que uma delas, pelo menos, precisa ser uma variável do tipo
intraindividual, e outra, pelo menos, precisa ser do tipo interindividual.

100
PLANO TRIFATORIAL - Experimento do tipo interindividual, com três variáveis
independentes. Neste tipo de plano, as interações de ordem tripla e dupla são analisadas
antes de se proceder as análises dos efeitos principais ou dos efeitos simples.
Poder do teste: capacidade de um teste estatístico de rejeitar a hipótese de nulidade quando
de fato ela é falsa.
POPULAÇÃO (ou Universo) - Conjunto de coisas, objetos, animais, indivíduos etc. que
possuem, pelo menos, uma característica em comum. Em estatística, refere-se a uma
distribuição de freqüência de todos os membros de determinada classe ou circunscritos
em uma área e em determinado tempo. O tamanho da população é simbolizado pela
letra N.
POSIÇÃO SEMIATEÓRICA (OU, POSIÇÃO ATEÓRICA) - Posição atribuída a Skinner e
seus seguidores, segundo a qual, a formulação da teoria não deve ser buscada antes da
obtenção de uma boa base de dados empíricos. Esta posição está afinada com a
formulação de teorias em miniatura., as quais são fruto do método indutivo.
Precisão amostral: é a proximidade entre os valores das estatísticas obtidas de várias
amostras do mesmo tamanho e da mesma população.
Prevalência: estudo epidemiológico de ocorrência de casos de determinada doença
constatados em um determinado momento. Os estudos relativos à prevalência são
denominados de transversais.
PROBABILIDADE - A probabilidade de um evento é a possibilidade de que ele ocorra,
possibilidade essa expressa numa escala de 0 a 1; 0 representa a possibilidade nula de
que ocorra o evento (certeza de que ele não ocorrerá), e 1 significa a certeza de que o
evento ocorrerá. É uma escala de mensuração usada para descrever a probabilidade de
ocorrência de um valor específico (evento) de uma variável aleatória.
PSICOLOGISMO - Atitude pela qual todos os fenômenos são explicados através da
Psicologia ou de seus princípios.
QUADRADO LATINO - Processo que visa distribuir os efeitos de transferência nos planos
intraindividuais com mais de quatro tratamentos. As seqüências dos tratamentos são
escolhidas de tal modo que passam a representar todas as possíveis combinações de
tratamentos: cada tratamento ocupa uma localização diferente em cada seqüência, e
ocorre apenas uma única vez em cada posição ordinal nas quatro combinações de
seqüências.
RACIONALISMO - Escola filosófica que sustenta que todo efeito tem uma causa e que
todas as seqüências causais estão localizadas no âmbito mesmo da natureza, a qual só
pode ser analisada e compreendida pela razão.
RBD ("Randomized blocks designs" ou Plano de blocos aleatorizados) - neste tipo de
plano, faz-se com que os grupos (amostras) que receberão os tratamentos (VIs) sejam o
mais possível idênticos uns aos outros. Há duas maneiras de se conseguir tal
identidade: 1) fazendo com que cada grupo tenha, por assim dizer, indivíduos com as
mesmas características julgadas relevantes para a pesquisa a ser realizada; 2) fazendo

101
com que todos os indivíduos participem de todos os tratamentos (para maiores detalhes,
veja Glossário de termos estatísticos, filosóficos e da metodologia positivista).
Regra de Bayes: modelo de distribuição de probabilidade condicional onde se calcula a
probabilidade a posteriori do evento (A) dada a ocorrência do (B) - (AïB) -, em função
do conhecimento a priori da probabilidade de ocorrência do evento B, desde que o
evento A tenha ocorrido - Pr(BïA). Para dois eventos o BioEstat apresenta o chamado
crivo ou “screening test”, enquanto que para 3 ou mais, o programa dispõe do modelo
para a generalização da regra de Bayes.
Regressão linear: teste estatístico que determina o modelo estimador dos valores de Y a
partir dos escores de X.
Regressão múltipla linear: teste estatístico que determina o modelo estimador dos escores
da variável Y a partir dos valores de duas ou mais variáveis preditivas: X1, X2, …, Xn.
RELATIVISMO - Princípio segundo o qual tudo pode ser verdade, contudo, verdade
relativa.
Risco relativo: teste estatístico simbolizado por RR, representando o coeficiente de
incidência de determinado evento (doença, por exemplo) de pessoas expostas com a
incidência do mesmo evento em indivíduos não expostos.
SENSIBILIDADE DA MEDIDA DE RESPOSTA - Representa o grau em que uma dada
resposta reflete os efeitos de uma variável independente (a medida de resposta, em uma
dada experiência, é capaz de refletir todas as respostas de um dado sujeito, sob as mesma
condições experimentais, em todos os momentos dessa experiência).
Sensibilidade de um teste: percentagem de indivíduos com o evento (determinada afeção,
por exemplo) cujo teste – tuberculínico, por exemplo – é positivo (+).
Série categórica ou especificativa: é uma série estatística na qual o elemento variável é o
fenômeno estudado, mantendo-se fixos o tempo e o local de observação.
Série cronológica, temporal, evolutiva ou histórica: é uma série estatística na qual o tempo
varia, mantendo-se fixos o local e o fenômeno estudado.
Série geográfica: é uma série estatística na qual o local (fator geográfico) é variável,
mantendo-se fixos o tempo e o fenômeno observado.
SIGNIFICÂNCIA ESTATÍSTICA - A significância estatística está relacionada a
probabilidade de cometermos um erro do tipo I, ou seja, ao valor obtido de alfa (). Diz
respeito à diferença(s) entre médias de amostras que têm probabilidade(s) pequenas
(baixas, em relação a um certo nível de significância) de surgir por acaso.
SISTEMA - Um sistema é uma forma geral de organização e interpretação dos dados e teorias
de um objeto de investigação particular, com pressupostos (postulados), definições e
disposições metodológicas especiais.
Sondagem: procedimento de estudo de uma parte da população voltado, sobretudo, para
pesquisas de opinião e de mercado. Sinônimo: amostragem.

102
SUJEITO - Aquele que participa (homem ou outro animal qualquer) da experimentação na
condição de sujeito da mesma; ao sujeito são aplicados todas as condições
experimentais (planejamento intragrupal), ou uma das condições experimentais
(planejamento intergrupal).
Tabela de freqüências: representação tabular na qual os escores se apresentam em
correspondência com suas repetições, com frequências dispostas em valores absolutos
e/ou em percentuais, podendo haver agrupamento de dados em classes previamente
definidas.
Tabelas de contingência: tabelas nas quais se dispõem as frequências observadas de duas
ou mais amostras, cada uma com duas ou mais categorias, em tabelas de l linhas e c
colunas (2 x 2, 3 x 2, 2 x 3, 3 x 3 etc.).
TAXIA – (Taxis plural. taxes). Movimento filogeneticamente determinado ou orientação
"em direção de" ou "para longe de" um estímulo (e.g., movimento de afastamento desde
a luz é fototaxia negativa. Cf. KINESIS). Rejeição de substâncias com um dado veneno
("taste"), após sua ingestão ter sido seguida por distúrbio gastrointestinal ou náusea (e.g.,
como a produzida por raio-x). Ela pode ser interpretada como comportamento operante
(punição de ingestão de substância com este veneno ("taste") ou como condicionamento
respondente (onde distúrbio gastrointestinal é o EI e o veneno ("taste") torna-se um EC).
Em outros casos, sua característica especial é o longo intervalo (algumas vezes horas)
entre o "taste and its aftermath". O procedimento não é efetivo sob tais lapsos,
intervalos ("delays") se estímulos como sons ou "fights" são substituídos por veneno
("taste"). Por esta razão, aversão a veneno ("taste") é freqüentemente citada como um
exemplo de preparação (lembrar Seligmann – teoria da preparação).
TEORIA (cf. teorização) - Qualquer explicação mais ou menos consistente e integrada
acerca da realidade (diferente de teoria cientifica). Quando essa teoria tem uma base
empírica bem estabelecida, através de leis e postulados demonstrados, diz-se que é uma
teoria científica.
TEORIA CIENTÍFICA - Enunciado ou conjunto que relaciona entre sí, por meio de
conceitos abstratos, processos ou princípios, grande número de leis empíricas simples e
suas variáveis associadas, fornecendo uma descrição unificada de uma série limitada de
fenômenos, no intuito de lograr a explicação e a previsão. A teoria exerce duas funções
principais: (1) integra leis, as quais, de outro modo, permaneceriam isoladas,
contribuindo para a expansão do conhecimento científico; (2) propicia novas hipóteses
testáveis.
TEORIA DE ORDEM SUPERIOR - Integração de grande número de leis e variáveis
simples, através da utilização de conceitos abstratos, processos e princípios.
TEORIAS EM MINIATURA - Teorias em pequena escala; representam uma conciliação
entre uma teoria de ordem superior e a posição semiateórica. Essas teorias são
caracterizadas pela íntima fidelidade aos dados, pelo emprego mínimo de conceitos
abstratos e por uma tendência a restringir explicações a áreas relativamente circunscritas
de problemas.

103
TEORIZAÇÃO (OU TEORIA SEM LEIS) - Qualquer tentativa ou forma de explicar e
compreender os fenômenos, ou tipo particular de "visão" e interpretação da realidade.
TEORIZAÇÃO DEDUTIVA - Método de elaboração de teoria em que o movimento lógico
vai do nível geral de formulação da teoria para o nível particular da pesquisa em sí.
TEORIZAÇÃO INDUTIVA - Método de elaboração de teoria em que o movimento lógico
vai da experiência específica para um enunciado mais geral.
TESTE BICAUDAL OU BILATERAL - Modo de proceder na análise de um teste
estatístico qualquer, no qual a hipótese alternativa não especifica a direção da diferença a
ser detectada, assim representada: m1  m0, podendo m1 ser maior ou menor que m0;
quando se considera, na análise do resultado de um determinado teste estatístico, os dois
lados da distribuição de freqüências entre as médias, ou seja, quando se considera a
possibilidade de um dado resultado estar abaixo (ser negativo) ou acima (ser positivo) da
média da distribuição de freqüências médias.
Teste binomial (duas proporções): teste estatístico baseado na distribuição binomial ou na
aproximação à curva normal, onde se comparam as proporções de duas amostras.
Teste binomial (uma proporção): teste estatístico baseado na distribuição binomial ou na
aproximação à curva normal, onde se compara a proporção de uma amostra com a do
parâmetro.
Teste da Mediana: teste estatístico não-paramétrico de distribuição livre, para duas
amostras independentes, no sentido de constatar se provieram de uma população com a
mesma mediana. Os dados devem ser mensurados, pelo menos, em escala ordinal.
Teste de aderência: é aquele em que se observa o ajustamento ou concordância dos escores
observados aos valores teóricos esperados ou deduzidos matematicamente. Chama-se na
literatura inglesa de “goodness of fit”.
Teste de Cochran: teste estatístico de modelo livre de distribuição de probabilidades, onde
os dados estão contidos em n linhas e k colunas. Todos os escores – nominais ou
ordinais dicotomizados - são definidos somente com dois valores: 1 (sim = sucesso) e 0
(não = insucesso).
Teste de Friedman: teste estatístico de modelo livre de distribuição de probabilidades
abrangendo 3 ou mais amostras relacionadas, para comparação das respectivas médias,
cujos escores são mensurados em escala nominal ou ordinal (postos). As amostras
devem ser do mesmo tamanho.
TESTE DE HIPÓTESE - É uma afirmação a respeito da contribuição de uma variável
aleatória ao resultado observado em uma experimentação qualquer. A prova ou teste de
uma hipótese estatística é uma regra que, obtidos os valores amostrais, conduz a uma
decisão de aceitar ou rejeitar a hipótese considerada; um exemplo é o teste t, que é
aplicado para verificar se a diferença observada entre duas médias é significativa ou não.
Teste de Kruskal-Wallis: teste estatístico de modelo livre de distribuição de probabilidades,
para análise de médias de k amostras independentes, do mesmo tamanho ou desiguais,
cujos dados devem ser mensurados, no mínimo, a nível ordinal.

104
Teste de Mann-Whitney: teste estatístico não-paramétrico de distribuição livre, para duas
amostras independentes do mesmo tamanho ou desiguais e dados mensurados, no
mínimo, no nível de escala ordinal. É também conhecido como “Wilcoxon rank-sum
test”.
Teste de McNemar: teste estatístico para dados dispostos em tabela de contingência 2 x 2,
a fim de comparar proporções de dois grupos pareados, onde são observados os pares
concordantes e os discordantes em relação a dois tratamentos – A e B –, avaliando-se,
em termos probabilísticos, somente os pares discordantes em relação a esses mesmos
tratamento: (+ - ) e (- +).
Teste de Wilcoxon: teste não-paramétrico de distribuição livre, para duas amostras
pareadas, cujos dados devem ser mensurados, pelo menos, a nível ordinal. É também
conhecido como “Wilcoxon signed-rank test”.
Teste do qui-quadrado (amostras independentes): teste estatístico para n amostras
independentes, cujas proporções observadas nas diversas modalidades estão dispostas
em tabelas de contingência l x c, sendo os valores esperados deduzidos
matematicamente, e onde se procura determinar se as proporções observadas nas
diferentes categorias são independentes ou estão associadas. O qui-quadrado apresenta
uma família de distribuição de variáveis com (l – 1) x (c – 1) graus de liberdade.
Teste dos Sinais: teste estatístico não-paramétrico para duas amostras pareadas, onde se
leva em consideração apenas o sinal das diferenças entre cada par de escores (+ ou -),
independente, portanto, da magnitude das diferenças.
Teste Exato de Fisher: teste estatístico, para duas amostras independentes cujas proporções
estão dispostas em tabela de contingência 2 x 2, devendo ser escolhido quando os
valores observados são pequenos, inclusive com proporções cujos escores são iguais a
zero (0).
TESTE F - Tipo de teste estatístico paramétrico, usado para se comparar mais de duas
médias de amostras, em busca de diferenças significativas ou com baixas probabilidades
de terem ocorrido por mero acaso. O teste F é um índice entre a variabilidade ou
variância intergrupais (variabilidade devida às variáveis experimentais ou tratamentos) e
a variância ou variação intragrupais (variância devida a possíveis fatores aleatórios ou
erros de amostragem). Sua formula, para análise de variância simples é: F =
2
 nr 
2
 n X
 X  
r 1  1 
 
1 nr n
r1
    nr  2 
2 2
 n X  n 
n     r   X  X 
 X 2   1      1    1  
1 n  1 nr n 
   
   
r  nr  1 

105
Teste G (amostras independentes): teste estatístico para n amostras cujas proporções das
diversas modalidades estão dispostas em tabelas de contingência l x c, sendo os valores
esperados deduzidos matematicamente, procurando-se determinar se as proporções
observadas nas diferentes categorias são independentes ou estão associadas. Os graus de
liberdade neste teste são calculados como segue: (l – 1) x (c – 1).
Teste Kappa: teste estatístico não-paramétrico destinado a comparar as proporções da
mesma variável mensurada a nível nominal em duas ocasiões distintas. Testa-se a
reprodutibilidade dos resultados, no sentido da haver ou não concordância nas
proporções observadas nos diferentes períodos. Os dados são dispostos em tabela de
contingência 2 x 2.
TESTE MONOCAUDAL OU UNILATERAL (cf. teste bicaudal) - Tipo de teste estatístico
em que se avalia apenas uma das tendências de um resultado experimental
( X E  X C ou X E  X C ). A análise considera apenas um dos lados (ou cauda) da curva
de distribuição normal.
Teste não-paramétrico: é aquele em que não há pressuposto sobre modelo de distribuição
nem quanto aos parâmetros, não se aplicando ao mesmo o Teorema do Limite Central.
Teste paramétrico: é aquele com pressuposto de um modelo de distribuição – normal,
binomial etc. –, cujos parâmetros assumem um desses modelos, aplicando-se-lhe o
Teorema do Limite Central.
TESTE t - Tipo de teste estatístico paramétrico, usado para se comparar duas médias de
amostras (via de regra, grupo experimental e grupo de controle), em busca de diferença
significativa ou com baixa probabilidade de ter ocorrido por mero acaso. Sua fórmula
X1  X 2
para medidas independentes é: t ;
(  X1 )2  X 2  2
 X1   X 22 
2

n1 n2 1 1
  
n1  n2   2  n1 n2 
X1  X 2 d
para medidas correlatas ou repetidas é: ou

 d  2


  d
2

d 2
d 2
n n
n(n  1) n( n  1)

Teste unilateral: teste estatístico no qual a hipótese alternativa especifica a direção da


diferença a ser detectada, assim representado: m1 < m0 ou m1 > m0.
TESTES ESTATÍSTICOS - Um teste estatístico é simplesmente um instrumento para
calcular a probabilidade de que os resultados observados em uma experiência sejam
devidos à flutuações aleatórias entre os grupos.
Testes t (Student): testes paramétricos para uma amostra, duas amostras pareadas ou duas
amostras independentes, baseados no modelo de distribuição de Student e geralmente
efetuados para amostras de pequeno tamanho (n  30). O modelo de Student constitui
uma família de distribuição e está relacionado com os graus de liberdade.

106
Testes Z: testes paramétricos para uma amostra ou duas amostras independentes, baseados
no modelo de distribuição normal e geralmente efetuados para grandes amostras (n >
30). Nos estudos estatísticos a distribuição normal constitui, como sabemos, um dos
modelos mais importantes em termos probabilísticos.
TRANSFERÊNCIA (DE EFEITO DE TRATAMENTO) - Influência indesejável de um
tratamento sobre o resultado de um próximo tratamento, seguinte ao primeiro, quando se
usa um plano intragrupal (planejamento intraindividual).
Transformação de dados: mudança de escala dos dados de uma variável, podendo ser
efetuada pelos logaritmos, pela raiz quadrada, pela ordenação dos escores (rank), pelo
quadrado dos valores etc.
TRATAMENTO - Refere-se, via de regra, à aplicação ou apresentação da variável
independente ao(s) sujeito(s) experimental(is) no contexto de um experimento formal.
Unidade: indivíduo, elemento, item, membro ou unidade estatística onde se estuda uma ou
mais variáveis. A unidade estatística pode ser simples: pessoa, objeto, animal, planta,
protozoário etc., ou coletiva: cardume, blocos residenciais, turmas escolares, colméias,
colônias bacterianas e outras.
VALIDADE DA MEDIDA DE RESPOSTA - Representa o grau em que uma dada resposta
reflete efetivamente os efeitos de uma variável independente (a medida de resposta, em
uma dada experiência, reflete, realmente, o que se pretende que ela meça nessa
experiência).
Valor extremo: escore muito afastado da maioria dos valores amostrais, decorrente da
inclusão na amostra investigada de elemento estranho, de erro de observação, de falha
instrumental, de equívoco de registro ou de inclusão indevida do dado na planilha de
cálculos. Pode, entretanto, ser um valor verdadeiro, devendo-se examiná-lo
cuidadosamente antes de sua exclusão da análise dos dados. Na literatura inglesa
denomina-se “outlier”.
Valor preditivo de um teste negativo: probabilidade de que um indivíduo com teste
negativo (–) seja uma pessoa sem o evento objeto da investigação (determinada doença,
por exemplo).
Valor preditivo de um teste positivo: probabilidade de que um indivíduo com teste positivo
(+) apresente o evento objeto da investigação (determinada doença, por exemplo).
VARIÂNCIA - Pode ser definida como a soma ou somatória dos quadrados dos desvios em
torno da média, dividido pelo número de dados ou de observações (n) na amostra menos
1; os estatísticos chamam o valor "n - 1" de graus de liberdade. Eis a fórmula:

S 2

 ( X  X )2
. Desenvolvendo algebricamente a fórmula da variância, obtém-se:
n 1
( X ) 2
X2  n
S2  . Como ela mede a dispersão dos dados em torno da média, pode
n 1
ser entendida como a média quadrática dos desvios em torno da média (vide 1ª
equação); contudo, só assume valores positivos.

107
Variáveis independentes: são variáveis consideradas preditivas de uma outra variável
denominada dependente.
VARIÁVEIS SITUACIONAIS - Variáveis independentes que envolvem a manipulação de
algum aspecto do meio físico, da tarefa dada ao sujeito ou da situação social.
VARIÁVEL - Alguma particularidade do mundo, especificada, ao menos, por dois valores
escalares que se excluem mutuamente; qualquer característica, estímulo, atributo ou
particularidade do mundo que seja passível de ser manipulada(o) ou controlado(a),
mensurada(o) ou observado(a) numa dada experiência.
VARIÁVEL AMBIENTAL - Variável situacional que envolve os aspectos do ambiente
capazes de produzir mudanças no desempenho, ou comportamento, de um dado
organismo.
VARIÁVEL AMBIENTAL GERADORA DE CONFUSÃO - Variável situacional que
envolve os aspectos do ambiente capazes de produzir mudanças não-desejadas no
desempenho ou comportamento de um dado organismo, por causa de sua covariação
com a variável independente.
VARIÁVEL DE ARRANJO GERADORA DE CONFUSÃO - Refere-se às variáveis
relacionadas com a ordenação e o encadeamento lógico de eventos que podem
obscurecer a interpretação dos possíveis efeitos da variável independente sobre a
variável dependente.
VARIÁVEL DE INSTRUÇÃO GERADORA DE CONFUSÃO - Variável situacional que
envolve os aspectos das instruções que induzem a erro o sujeito experimental, ou
influenciam seu desempenho de modo diferente do modo produzido pela influência da
variável independente.
VARIÁVEL DE TAREFA - Variável situacional que envolve, explicitamente, e tão
somente, a variável a ser manipulada (VI).
VARIÁVEL DE TAREFA GERADORA DE CONFUSÃO - Variável situacional que
envolve qualquer particularidade da tarefa, incluindo sua construção e o método de
apresentação, exceto que não seja uma parte explícita da variável manipulada, porém que
influi no resultado da experiência.
VARIÁVEL DEPENDENTE OU VARIÁVEL DE RESPOSTA (VD = conseqüência) -
Medida de resposta ou de comportamento que reflete os efeitos da variável
independente.
Variável dependente da variável que foi manipulada, ou seja, da VI; é a variável
"causada" por uma ou mais variáveis independentes (ou de predição).
VARIÁVEL DO EXPERIMENTADOR GERADORA DE CONFUSÃO - Variável
situacional que envolve as dicas emitidas pelo experimentador e detectadas pelos
sujeitos, as quais, subseqüentemente, influem no desempenho destes, consciente ou
inconscientemente.

108
VARIÁVEL DO SUJEITO - Variável "independente" que reflete algum aspecto das
experiências anteriores do sujeito; as variáveis do sujeito não podem ser manipuladas
com facilidade e limitam-se habitualmente à estratégia correlacional (R-R).
VARIÁVEL DO SUJEITO GERADORA DE CONFUSÃO - Refere-se às muitas
diferenças individuais entre as pessoas (ou mesmo organismos), as quais podem
obscurecer os efeitos da variável independente sobre a variável dependente.
VARIÁVEL GERADORA DE CONFUSÃO OU VARIÁVEL ESTRANHA - Tais
variáveis estão relacionadas à todas as situações ou condições potencialmente capazes de
gerar confusão durante a fase de interpretação dos resultados experimentais, uma vez que
alguma coisa não foi, ou não pôde ser, controlada, ou alguma outra condição extra-
experimental variou concomitantemente à variação da VI que estava efetivamente sendo
manipulada.
VARIÁVEL INDEPENDENTE, VARIÁVEL DE TRATAMENTO OU VARIÁVEL
EXPERIMENTAL (VI = causa) - A variável que deve ser manipulada em uma
experiência e que deve produzir algum tipo de efeito sobre a variável dependente. Há
três tipos de variáveis independentes: situacional, (dependente) do sujeito, e
organísmica.
Variável: determinada característica dos indivíduos ou elementos objetos da investigação,
como são exemplos o sexo dos animais, o estado civil, a etnia, a estatura de recém-
nascidos etc.
Viés ou “Bias” ocasionais: são aqueles decorrentes de erros de cobertura – superposição,
inclusão ou exclusão de unidades –, da escolha não aleatória das amostras, de erros de
observação, de defeitos instrumentais e outros.
É a diferença entre o valor de uma estatística e a do parâmetro correspondente da
população.

109
PRINCIPAIS SÍMBOLOS USADOS EM TRABALHOS CIENTÍFICOS
NA REDAÇÃO CIENTÍFICA
i.e isto é
e.g. exemplo grato
cf. “comparar”; “confrontar”
vs versus; em contraste com; em contrapartida
sic desta maneira; assim parece
et al. e outros
SÍMBOLOS DE LETRAS GREGAS
(alfa) a probabilidade de um erro do tipo I
(beta) a probabilidade de um erro do tipo II
(mi) a média da população
a somatória de
 (sigma) o desvio padrão de uma população
o desvio padrão de uma
S
amostra
2 (sigma2) a variância de uma população
S2 a variância de uma amostra
X o erro padrão de uma população
SX o erro padrão de uma amostra
 2
qui quadrado
SÍMBOLOS MATEMÁTICOS E DE LETRAS ROMANAS
infinito
> maior do que
< menor do que
ayx o ponto no eixo Y onde há interceptação da linha de regressão
byx a inclinação da linha de regressão
gl graus de liberdade
F razão F; o resultado do cálculo da ANOVA
 freqüência (às vezes se usa como símbolo de “em função de”)
H0 hipótese nula (onde X 1 = X 2 = X 3 …)
H1 hipótese alternativa à hipótese nula
o número de condições de tratamento com blocos em grupos
k
independentes, os níveis de variável independente
diferente de
aproximadamente igual a
MQ média quadrada; termo da ANOVA para significar a variância
N o número total de todas as observações
nj o número de observações em uma amostra ou grupo
r o coeficiente produto-momento de Pearson
o coeficiente de determinação; a progressão de variância de Y que é
r2
atribuída à variância de X

110
a razão da diferença entre as médias, com base no cálculo do teste t de
t
Student
X qualquer resultado ou valor da variável X
M ou X a média da amostra
Y qualquer resultado; ou valor da variável Y
Z o resultado Z; o resultado padrão
(omega2) estimativa da magnitude do efeito da VI na população, a
2
partir do resultado amostral

111
G L O S S Á R I O 1 D E T E R M O S
E S T A T Í S T I C O S , F I L O S Ó F I C O S E D A
M E T O D O L O G I A C I E N T Í F I C A
Capturado em 20_05_2014 internet livre:
http://www.ufpa.br/metodologiza/glossario.htm#corrl%C3%A7

Para rapidamente ascender a um dado termo e seu significado, clique abaixo sobre a letra
que corresponde à inicial do termo que você pretende consultar. Por exemplo, se você
pretende consultar o conceito de "Fidedignidade da medida de resposta", clique abaixo
sobre a letra F, a qual corresponde à inicial da palavra Fidedignidade.

LETRAS INICIAIS DOS TERMOS DO GLOSSÁRIO

A B C D E F G H I L M N O P Q R S T V

Abdução – Diz-se da conclusão que é apenas plausível, possível.

ALEATORIZAÇÃO (o mesmo que randomização) - Técnica ou processo especial de


formação ou composição de grupo(s), amostra(s) ou conjunto(s) de elementos, sujeitos ou
participantes de pesquisa, visando assegurar que a probabilidade de escolha de cada qual
seja igual a probabilidade de seleção de qualquer outro na mesma população, de modo que
todos - e qualquer um dos componentes da população - tenham a mesma probabilidade de
participar da pesquisa, fazendo parte de um dos grupos da mesma. Se tal acontece dizemos
que temos amostras aleatórias, randômicas, casuais da população-mãe.

ALFA ( ) - A probabilidade de ocorrência de um erro do tipo I ao se tomar uma decisão


sobre a insustentabilidade de uma hipótese nula ( = 1 - ;
será , e vice-versa).

AMOSTRA - Subconjunto de uma população; grupo específico do qual se colhe


informações, se tomam medidas ou ao qual se aplica determinado tratamento, com o
objetivo de se fazer inferências em relação à população-mãe da qual a amostra foi retirada.
Do ponto de vista da estatística inferencial, parte representativa da população usada para
fins de coleta de dados que digam respeito à População e, ao mesmo tempo, para fins de
compreensão de alguma de suas características, propriedades ou atributos.

AMOSTRA ALEATÓRIA (casual, randômica) - Amostra escolhida de tal maneira que


cada membro da população-mãe tem a mesma chance ou possibilidade de ser escolhido
para compô-la. É a amostra escolhida sem o viés de eventuais preferências do pesquisador,
obtida por meio de sorteio, ou de tabelas de números aleatórios, ou por procedimento

112
computadorizado de escolha (neste caso, pseudo-randômica, haja vista o algoritmo usado
pela máquina), constituindo, do ponto de vista matemático, amostra probabilística.
AMOSTRA ESTRATIFICADA - Amostra retirada de camadas da população denominadas
estratos não superpostos, caracterizando-se, de um lado, pela maior homogeneidade da
variável investigada dentre cada estrato e, de outro, pela maior heterogeneidade entre as
camadas (por exemplo, nível sócio-econômico de população urbana: baixo, médio e alto).
De cada camada retiram-se amostras aleatórias de tamanho proporcional a cada estrato -
conhecidas suas proporções ou porcentagens -, tornando-a, assim, representativa de todos
os estratos de interesse do pesquisador, presentes em dada população. Temos uma amostra
estratificada quando dividimos a população em categorias supostamente relacionadas ao
interesse da pesquisa, e depois "pegamos" um número proporcional de sujeitos de cada
categoria, utilizando o processo de aleatorização (de cada camada retiramos amostras
aleatórias de tamanho proporcional ao de cada estrato da população). Se faz a estratificação
de uma amostra ao longo de tantas dimensões quantas forem necessárias - ao longo de
quantos forem os estratos definidos na(s) população(ões) utilizada(s) -; para tal se impõe
restrições e condições à composição dessa amostra. De importância fundamental nesta
técnica é o conhecimento prévio de que a estratificação (estabelecimento dos estratos) são
pertinentes ao resultado da pesquisa. Enfatize-se ainda que o uso de uma amostra
estratificada só é possível se conhecermos precisamente as proporções em que os estratos
estão presentes na população-mãe. Por exemplo: consideremos que em determinado
período letivo a população de alunos regularmente matriculados no curso de Psicologia da
UFPA seja constituída por 94% de alunas e 6% de alunos; suponhamos que, a um tempo,
pretendêssemos escolher uma amostra estratificada com 100 estudantes para realizar uma
pesquisa sobre preferências sexuais. Considerando o objetivo de tal pesquisa, é necessário
pesquisar as preferências tanto das alunas quanto dos alunos, obviamente, sem superestimar
as preferências femininas nem, eventualmente, subestimar as dos homens, muito menos
sem super-dimensionar a participação masculina, escolhendo 50 alunos e 50 alunas. Para
tal, comporíamos nossa amostra estratificada com 94 alunas e 6 alunos, todos escolhidos
aleatoriamente no seio da população de alunos regularmente matriculados (se quiséssemos
uma amostra com 200 estudantes, deveríamos ter 188 alunas e 12 alunos).

AMOSTRA NÃO-TENDENCIOSA - Amostra obtida através de processo de amostragem


no qual não se faz nenhum tipo de restrição à possível inclusão/escolha de algum membro
da população para compor a referida amostra (não-tendenciosa); um fato estatístico que
caracteriza uma amostra não-tendenciosa é sua média ser igual ou bem próxima ao
parâmetro (média) da população que ela representa (quanto mais próxima da média da
população for a média da amostra, menos tendenciosa será a amostra).

Amostra por conglomerados: amostra probabilística cujas unidades simples são obtidas
de modo randômico de unidades coletivas, pressupondo-se que estas últimas apresentem
homogeneidade entre si. Colméias, cardumes, blocos residenciais são exemplos de
unidades coletivas de onde são retiradas amostras randômicas.

Amostra representativa - aquela que guarda, contém em escala miniaturial (menor), as


mesma características, julgadas importantes para a compreensão do fato sob investigação,
presentes na população da qual dita amostra foi retirada. Qualquer erro de composição da

113
amostra (amostragem) a torna não-representativa da população e adultera irreversivelmente
o resultado da pesquisa.

Amostra sistemática: amostra probabilística cuja primeira unidade é obtida ao acaso e as


demais, a partir da primeira, escolhidas a cada k intervalo sistemático, definido pela razão
entre o tamanho da população e o tamanho da amostra.

AMOSTRA TENDENCIOSA - Amostra cuja média não corresponde a média da população


da qual a amostra foi retirada; ou, de outro modo, amostra que sofreu algum tipo de viés
(restrição) durante seu processo de formação.

Amostras independentes: dois ou mais subconjuntos randômicos (aleatórios) retirados de


modo independente da população-mãe ou de populações equivalentes; podem ser de
tamanhos iguais ou desiguais.

Amostragem: procedimento de escolha e separação, para fins de pesquisa, de uma parte


(amostra) do universo ou população que esteja implicitamente envolvido(a) com o
problema de pesquisa sob investigação. Processo de obtenção de uma ou mais amostras
(grupos) a partir de uma dada população ou de populações equivalentes. Em alguns casos
se usa sondagem como sinônimo de amostragem.

Amostragem estratificada: Processo de obtenção de uma amostra representativa de todos


os estratos da população, para tal se impõe restrições e condições à composição da amostra.
Temos uma amostra estratificada quando dividimos a população em categorias relacionadas
ao resultado da pesquisa, e depois selecionamos um número proporcional de sujeitos de cada
categoria, utilizando o procedimento de aleatorização. A estratificação de uma amostra é feita
ao longo de tantas dimensões quantas forem necessárias. De importância fundamental na
técnica da estratificação é o conhecimento prévio de que os estratos são pertinentes ao bom
resultado da experiência e, portanto, devem ser considerados (amostrados).

Amostras independentes: dois ou mais subconjuntos randômicos retirados de modo


independente da população (podem ser de tamanhos iguais ou desiguais).

"Amostras" pareadas: a variável investigada é mensurada antes e depois de um certo


procedimento, usando-se um mesmo subconjunto randômico da população. Exemplos:
levantamento do desempenho dos alunos ao entrarem no curso de Psicologia e ao estarem
próximo à formatura (ENADE); medição do pulso radial antes e após esforço físico
controlado. A quantidade de dados relativos à cada procedimento de mensuração é,
necessariamente, a mesma.

Análise de sobrevivência: análise estatística do tempo de ocorrência de determinado


evento, o qual, na área médica, pode ser o óbito, a recidiva ou remissão espontânea de uma
doença, a resposta terapêutica a uma droga etc. As instituições securitárias utilizam esse
modelo de análise para estabelecer o valor das apólices e dos contratos de seguros. Por
exemplo: análise atuarial, Kaplan-Meier ou “Log-Rank test”.

114
Análise multivariada: compreende testes estatísticos nos quais são consideradas de
maneira simultânea n variáveis de k amostras, destacando-se: Componentes Principais;
Distância Multivariada: Euclidiana, Penrose e Mahalanobis; teste de Hotelling; e teste de
Bartlett.

ANOVA: teste estatístico cujo modelo de distribuição de probabilidades é o da variância


para k amostras ou tratamentos independentes. As amostras podem ser do mesmo tamanho
ou desiguais, no caso de k tratamentos (um critério), e devem ser iguais quando for o caso
de k tratamentos e r blocos (dois critérios). Este teste é também conhecido como teste F,
em homenagem a R. A. Fisher, e destina-se a comparar diferenças entre médias através das
variâncias, cujos escores amostrais devem ser mensurados a nível intervalar ou de razão.

Apodítico - Diz-se do que é demonstrável ou do que é evidente, valendo, portanto, de


modo necessário; por extensão: irrefutável, evidente.

Apofântica - Teoria das proposições.

Apofântico - Segundo Aristóteles, diz-se de enunciados verbais susceptíveis de serem


falsos ou verdadeiros, isto é, dos juízos de atribuição de um predicado a um sujeito.

Apofáse - Proposição negativa; negação.

BEHAVIORISMO - Escola psicológica que sustenta que os dados, do ponto de vista


metodológico, devem ser, a um tempo, públicos e verificáveis, e que os aspectos
observáveis do comportamento animal (humano e não-humano) devem ser usados para
desenvolver leis e para a elaboração de teorias. Por outro lado, do ponto de vista teórico,
enfatiza as relações entre o comportamento dos organismos e os estímulos ambientais, o
que enseja ser considerado mecanicista (tal termo, entrementes, se referia aos filósofos
pós-cartesianos). Seu fundador foi John B. Watson, o qual inspirou-se nas idéias de Locke
e fundamentou-se na filosofia determinista de James, no funcionalismo de John Dewey, no
método experimental de Yerkes e na teoria do condicionamento reflexo de Ivan P. Pavlov
(Watson criou o que ficou conhecido, aqui no Brasil, como behaviorismo metodológico -
escola que propugnou pelo estatuto de ciência para a Psicologia).

- A probabilidade de ocorrência de um erro do tipo II ao se tomar uma decisão


sobre a sustentabilidade de uma hipótese nula. Tal risco é determinado pelo tamanho e pela
variabilidade (heterogeneidade) das amostras, pelo nível de significância adotado, pelo uso
de um teste estatístico bicaudal ou unicaudal, e pela verdadeira natureza da distribuição de
frequências das diferenças médias ( = 1 - ; quanto maior for -
versa).

Bioestatística ou Biometria: estatística aplicada às ciências biológicas e da saúde.

Bonferroni: procedimento de comparação entre estatísticas médias de vários tratamentos,


no sentido de verificar a significância estatística das diferenças entre essas medidas de

115
tendência central, determinando-se, a priori, o nível alfa de decisão. A comparação é
efetuada após a análise da variância e somente se o valor de F for significativo.
Este teste visa garantir maior controle do erro do tipo I, sendo indicado quando a
quantidade de grupos é pequena, haja vista que exige correção do nível de significância
pretendido devido às múltiplas comparações usando-se os mesmos grupos. Para tal, se
divide o valor de alfa escolhido pelo número total de grupos usados (por ex., cinco grupos
fazem o nível de significância diminuir para 0,01 se estivermos usando um alfa inicial igual
a 0,05 – com a correção de Bonferroni devo usar n, ou seja, se pretendia usar alfa = 0,05,
agora devo usar alfa = 0,01 para encontrar um p significativo).

CAUSAÇÃO - Em sentido estrito, a concepção causal supõe que algum evento, a variável
independente (VI), é a responsável pela ocorrência de algo - na ausência da VI esse algo
não deveria ocorrer. Então, se algo ocorre na ausência da VI, essa variável não é a possível
explicação para esse algo que ocorreu na sua ausência. Contudo, se esse algo, na presença
da VI, algumas vezes ocorre, outras não ocorre, é provável que outra variável, interveniente,
esteja se imiscuindo na situação investigada e, sem controle, ora produza, ora não produza o
efeito suposto ter sido produzido pela VI.
Entrementes, se o efeito observado em algo é irregular, é variável (ora tende a aumentar, ora
a diminuir, ora parece não haver nenhum efeito), alternativamente podemos supor que não
há uma relação de causa e efeito entre eles, mas apenas uma correlação (a tendência para
uma das variáveis aumentar quando a outra aumenta, diminuir quando a outra diminui, ou
aumentar quando a outra diminui, ou vice-versa - vide abaixo coeficiente de correlação, cf.
correlação).
Uma estratégia semelhante visando avaliar possíveis relações causais é conhecida como
quase-experimental (também usada em pesquisas ditas experimentos naturais). Por
exemplo, contrastar os resultados obtidos de amostras retiradas de sub-populações (cegos e
não-cegos; pessoas com diferentes idades; homens versus mulheres; canhotos versus
destros; fumantes versus não-fumantes; alunos de diferentes séries escolares etc.) não é
uma boa estratégia de pesquisa para avaliar o provável efeito dessas variáveis do sujeito
(tipo S) sobre o desempenho desses indivíduos dessas sub-populações, haja vista que o
surpreendente não é encontrarmos diferenças significativas entre eles (a rigor, essas sub-
populações já são diferentes antes da execução da pesquisa), o surpreendente é não
encontrarmos diferenças significativas, ou seja, a hipótese nula ser sustentável. No geral,
tais variáveis do tipo S estão correlacionadas com variáveis outras de desempenho desses
indivíduos, o que exige maior rigor na fase de interpretação do provável efeito causal.
A causação é melhor investigada através da estratégia de pesquisa manipulativa - quando
uma VI é intencionalmente manipulada (variada) e seu provável efeito cuidadosamente
observado e quantificado (ao contrário da quase-experimental, em que as supostas VI's são
meramente arranjadas, arrumadas, segregadas).
CEGUEIRA DUPLA - (Vide dupla cegueira)

CETICISMO - Princípio filosófico segundo o qual é impossível se conhecer a verdade das


coisas.

116
Ciência (concepções de) - A primeira concepção de ciência (empirismo) foi mantida
sem maiores questionamentos até princípio do século XX. Após, surgiram variações tanto
na linha empírico-racional quanto na linha idealista-racional.
O empirismo lógico, cujo critério de cientificidade é o verificacionismo (só
merece o título de conhecimento científico aquilo que pode ser comprovado,
verificado empiricamente – vale dizer, experimentado).
A concepção racionalista crítica de Karl G. Popper, o qual propõe a
falseabilidade como novo critério de cientificidade (conhecimento científico é
aquele que pode ser falseado, tornado sem efeito ou valor através de um sistema
de suposições – hipóteses – e refutações – testagem dessas hipóteses).
Concepção de paradigma, proposta por Thomas Kuhn (conhecimento
científico é aquilo que tem caráter modelar, servindo para satisfazer as
necessidade de ocasião – o que traz como corolário a ideia de avanços
científicos através de revoluções paradigmáticas: certo modelo, a um tempo, já
não consegue satisfazer as necessidades explicativas e de entendimento de dada
área do conhecimento, surge então um novo modelo, teoria ou visão, opondo-se
ao antigo e o suplantando em termos de explicação para o momento).
A concepção anarquista metodológica, proposta por Feyerabend (o cientista,
no afã de explicar os fenômenos, adota ou emprega o que melhor lhe parece
servir para responder ao problema de pesquisa, sendo qualquer método, a priori,
castrador e limitador da liberdade criadora de pesquisar e explicar os
fenômenos).
A concepção de comunicação consensual, proposta por Habermas (científico
ou ciência é aquilo que um grupo de cientistas acorda ser tal).
A concepção marxista, cujo critério de verdade é o materialismo histórico-
dialético.
Mais recentemente, a fenomenologia (com sua crítica à suposição de o
fenômeno ser passível de apreensão e estudo, como postulavam os primeiros
positivistas; por outro lado, enfatiza tão somente a possibilidade de o
pesquisador averiguar o[s] significado[s] que permanece[m] para além das
meras aparências do fenômeno).
A concepção baconiana[1] de Ciência indutiva foi questionada pelos neopositivistas
lógicos pertencentes ao grupo de Viena, os quais, baseados na semiologia, propuseram
outro critério de validação científica, visando garantir o sentido verossímil e lógico das
proposições científicas: o verificacionismo. Caberia portanto ao positivismo lógico, tendo
por base a logicidade empírica dos argumentos, a função de selecionar aqueles discursos
que poderiam ser chamados de científicos.
Karl G. Popper ataca o positivismo lógico, contrapõe-lhe a noção de falseabilidade
(efetivada através de um sistema de suposições – hipóteses – e refutações –
experimentações), o conhecimento científico deixa de ser absoluto e passa a ser "verdade"
relativa, provisória, histórica. A premissa básica é: o que não puder ser falseável[2] não
merece o título de cientifico. Uma teoria só será considerada científica na medida em que
possibilitar serem seus fatos testados empiricamente.
Dado que Popper supõe existir, por parte do pesquisador, facilitação, e não rigor na
experimentação das hipóteses, pontua que a atitude verdadeiramente científica deve se

117
caracterizar pela busca de contraprovas ("contra-exemplos"), de evidências que possam
anular as hipóteses até então aceitas. A atitude auto-defensiva, que procura escamotear
refutações, é característica das pseudo-ciências (Popper, 19 ).
Thomas Kuhn propõe uma concepção que se baseia na adoção de modelos científicos ou
modelos de Ciência por dada comunidade de cientistas. A tais modelos deu o nome de
paradigma (esse conceito não foi definido rigorosamente por Kuhn, antes, recebeu várias
definições: …). Tal movimento se assemelha a uma "revolução científica", uma mudança
paradigmática, quando um novo modelo (paradigma) de ciência passa a ser aceito mais
amplamente e fortemente, vindo, finalmente, a ser estabelecido como o modelo vigente, via
ruptura teórica com o antigo modelo. As rupturas aconteceriam pelo surgimento de
anomalias internas irresolúveis dentro do antigo modelo (e a partir dele mesmo enquanto
sistema teórico), gerando assim a necessidade de atualizar o(s) conhecimento(s)
existente(s). Para Kuhn, o progresso científico se dá de ruptura em ruptura, e só através
delas é possível o conhecimento cientifico ser atualizado e avançar.
Feyerabend, por seu turno, recomendará o anarquismo epistemológico, concepção que
busca contornar o processo de erosão das regulamentações metodológicas clássicas, haja
vista que, para ele, regras são inúteis e castradoras quando está em jogo um processo
criativo (Oliva, 1990, p. 134).
Feyerabend propõe que o cientista adote abordagens várias para a construção das teorias,
e não se prenda a nenhuma, recorrendo mesmo ao princípio da proliferação, segundo o qual,
ao final, sempre haverá a contrastação entre as várias explicações (nenhuma teoria, a priori,
pode ser suposta mais verdadeira ou mais exata). A ciência passa, destarte, a ser a forma de
conhecer supostamente múltipla (não mais há apenas um método, antes, vários
considerados igualmente científicos), o que dá início, a partir desta perspectiva, à
concepção hoje denominada pós-moderna[3].
Já Habermas procura uma solução para a questão da cientificidade através da Teoria
Consensual da Razão, cujo princípio básico é a argumentação cogente.
Sua concepção pressupõe a conveniência da interpretação e comunicação presentes no
código linguístico usado pelos cientistas: o consenso advém, aprioristicamente, da
racionalidade dos cientistas cederem à cogência dos argumentos através da assimilação
psicológica dos mesmos. Do código linguístico é retirado o aspecto semântico,
permanecendo o sintático.
Marx, em “O Capital”, consagra o princípio da contradição como critério de
cientificidade. Tal é o materialismo histórico-dialético, pelo qual se deve conceber a
própria história humana como a condição primeira de existência, a qual permite os estilos
de vida das pessoas e a produção dos seus próprios meios de subsistência, ao mesmo tempo
em que garante a reprodução ("conservação") desses meios. Ao vincular existência humana
à história, analisando-a em seu movimento, Marx pontuou que uma sociedade se compõe
por grupos em oposição e muitas vezes em conflito de interesses, mas interligados (daí a
contradição): a burguesia e o proletariado.
A concepção crítica iniciada por Edmund Husserl, a fenomenologia, como todo sistema
filosófico que aspira ser também um método científico, enfatiza o conhecimento advindo da
experiência concreta, real como primeiro requisito necessário para deixar de ser pura

118
metafísica (Dartigués, 1992). Neste afã, para diferenciar-se do empirismo positivista,
propõe a rejeição ao dado apartado, desvinculado de quem propõe, capta esse dado, e a
valorização, na outra ponta, do cientista (e sua intuição) como agente do conhecimento e
produtor dos dados. Ao fazer isso, introduz a categoria intersubjetividade, posto que agora
a pesquisa será da vivência do fenômeno[4], não mais do fenômeno em si[5]. Além do
mais, concebe o conhecer como um ato intencional que se “dirige” sempre para alguma
coisa (consciência não é uma estrutura, é estado sempre em atualização; consciência é
sempre consciência de alguma coisa), ato que joga, produz efeitos para além da mera
descrição/experimentação do fenômeno. Tal concepção se opõe àquela que advoga ser o
método das ciências naturais a única referência válida para a pesquisa científica e, como
corolário, para a produção do conhecimento científico.
A partir das formulações e dos objetivos husserlianos, Martin Heidegger ampliou a
concepção de cientificidade pelo acréscimo da categoria de ser-no-mundo, e Schleimacher,
pela proposição da categoria de distanciamento de pertença, e Ricoeur, através da dialética
entre o explicar e o compreender através do texto.

[1] Por volta do ano de 1620, em seu livro "Novum Organun", Francis Bacon referiu-se ao
método científico como aquele que deveria integrar a observação e a experimentação, de
modo a demarcar a fronteira entre o conhecimento empírico e o metafísico (ao pesquisador
cabia a tarefa de seguir rigorosamente certos procedimentos); identifica aquele como o
conhecimento científico (observação-indução e descrição rigorosa dos fatos, baseado na
lógica que opõe observação à mera especulação, cabendo-lhe ainda a prerrogativa de
transformar a natureza). A ciência baconiana deveria limitar-se a descrever, evitando
suposições que não pudessem ser verificadas, ater-se ao estritamente observável, restando
ao cientista uma ação meramente de constatação, descrição e formulação.
[2] Tornado nulo, sem efeito - diferente de “sem valor” … -, via de regra através da
formulação e testagem de uma hipótese nula (H0), aquela que nega qualquer relação entre
uma dada VI (causa ou condicionante) e uma dada VD (efeito ou condicionado). Na
prática, é possível a previsão da ocorrência de certos eventos mesmo sem ser possível
identificar precisamente a(s) sua(s) causa(s). Contudo, conhecendo-se a causa é possível o
controle dos eventos – controlar e prever eventos é uma das metas da ciência de inspiração
positivista.
[3] Alguns filósofos pós-modernos teriam levado ao extremo certas concepções: a
realidade, incluindo a natureza, as emoções e até a ação da gravidade seriam meramente
construções sociais (Fernandez, 2002, citado em Flores, 2002).
[4] Experienciação ou experimentação: eis a questão!!!
[5] Notar que, a partir do momento em que vivo o fenômeno, já não mais o experiencio,
senão vivo (experimento) um novo fenômeno, posto que o fenômeno, a rigor, não se repete,
é sempre único (é a coisa em si: o que vivencio daquilo que me é dado vivenciar daquilo
que vivencio).

Coeficiente de assimetria: medida da forma de distribuição dos escores (valores) de


variáveis aleatórias contínuas, podendo ser simétrica, assimétrica positiva (curva cuja cauda
está desviada para a direita) e assimétrica negativa (curva cuja cauda está desviada para a
esquerda).
119
COEFICIENTE DE CORRELAÇÃO (cf. correlação) - Índice estatístico que denota a
tendência de uma dada variável variar (não em função da outra, mas) quando uma outra
varia (aumenta ou diminui); expressa uma relação monotônica entre duas variáveis
quaisquer (contudo, é necessário que essas variáveis tenham sido obtidas usando-se uma
das três escalas a seguir: ordinal, intervalar ou de razão). O mesmo que índice de
correlação.
Estatística que mede o grau de relação ou associação interna entre duas ou mais varáveis
sob investigação. Entrementes, sob certas condições, a partir de uma correlação
comprovada, podemos suspeitar de que pode haver mais do que mera correlação entre as
variáveis; para tal suspeição, é necessário que duas condições ocorram simultaneamente, a
saber:
- uma dada variável ou condição não ocorre se a outra igualmente não ocorre;
- uma delas sempre precede a outra.
Coeficiente de curtose: medida da forma de distribuição de variáveis aleatórias contínuas,
podendo ser mesocúrtica (em forma de sino), leptocúrtica (afilada) ou platicúrtica
(achatada).

Coeficiente de determinação (r2): é o quadrado do coeficiente de correlação (r),


representando a quantidade da variação de uma variável explicada pela variável preditiva.

Coeficiente de regressão: é uma constante que determina o grau de inclinação da reta de


regressão, simbolizado pela letra b. Na regressão múltipla há tantos coeficientes de
regressão quanto o número de variáveis independentes testadas.

Coeficiente de variação: razão entre o desvio padrão e a média aritmética multiplicada por
100 (%)

Coeficiente Phi : coeficiente de correlação entre duas variáveis qualitativas e


dicotômicas, dispostas em tabela de contingência 2 x 2.

COMPORTAMENTO ESPÉCIE-ESPECÍFICO - Comportamento observado em todos ou


na maioria dos membros (de um dos sexos ou de ambos, e talvez somente sob limitado
período de vida do organismo) de uma espécie. Diferentes usos podem incluir:
comportamento emitido antes de sua seleção pelas consequências; comportamento
respondente incondicionado; e, em ambientes bastante consistentes, comportamento
operante estereotipado mantido pelos reforçadores primários espécie-específicos ou
reflexos condicionados que dependem de reflexos incondicionados espécie-específicos.
Ver também exemplos específicos: Atividade deslocada, Padrão fixo de ação, Atividade no
vácuo, "Releaser" (Catania, A. C., 1992).

Concordância de Kendall (W): teste de associação entre k variáveis dispostas em vários


conjuntos de postos e mensuradas a nível ordinal.

Contingência C: teste de associação entre conjuntos de variáveis mensuradas a nível


nominal, dispostas em tabelas de contingência L x C (linhas x colunas), isto é, com
quaisquer números de categorias.

120
CONTRAPESO - Técnica de controle experimental em planos intra-individuais, a qual tem
como objetivo distribuir uniformemente os efeitos de transferência da(s) influência(s) de
cada tratamento pelas várias condições do experimento.

CONTROLE - Refere-se a métodos e processos que eliminam ou tentam eliminar ou


minimizar a ocorrência de variáveis estranhas ou não desejadas na experiência, experimento
(cf. variáveis geradoras de confusão). Controlada é a experimentação em que o
experimentador pode concluir sem ambiguidades que a variável manipulada (VI) teve (ou
não) efeito sobre a variável dependente (no caso da Psicologia, sobre o comportamento),
considerando para tal certo nível de significância, o qual expressa a confiança do
pesquisador de que o(s) efeito(s) observado(s) se deve(m) a(s) VI(s).
A palavra controle em ciência tem duas acepções. Na primeira, controle se refere a fazer
algo ocorrer quando se quer que ocorra ou quando se está em condições de observá-lo se
ele vier a ocorrer (isso envolve seleção e manipulação de variáveis independentes). A
segunda acepção da palavra controle está relacionada mais diretamente às condições em que
a experimentação será realizada (envolve impedir que algo não diretamente relacionado à
manipulação da VI ocorra - basicamente, o problema se refere ao controle de possíveis
variáveis extras, estranhas, externas ou intervenientes).

Coorte: grupo bem definido de uma população, possuindo alguma característica em


comum e cujos indivíduos permanecem no conjunto durante determinado tempo,
registrando-se e avaliando-se as ocorrências havidas entre os elementos no período
considerado.

Correção de Williams: correção do teste G para obter melhor aproximação com o teste do
qui-quadrado.

Correção de Yates: correção de continuidade do teste qui-quadrado (X2), subtraindo-se 0,5

do numerador de cada termo antes de elevá-lo ao quadrado (|fo - fe| - 0,5)2, desde que o grau

de liberdade seja igual à unidade (1), ou quando o valor observado ou esperado em qualquer

casela for menor do que cinco (5) .

CORRELAÇÃO - Teste estatístico de associação entre duas ou mais variáveis, medindo-se


a magnitude e o sentido ou somente o grau dessa associação, conforme o teste empregado.
Não há qualquer dependência de uma variável em relação à outra.
Estratégia de pesquisa que não permite conclusões a respeito de possíveis causas acerca dos
fatos que estão sendo observados/investigados. Através da estratégia correlacional
podemos, apenas, estabelecer o grau em que duas ou mais variáveis estão interrelacionadas
(cf. índice de correlação), ou seja, associadas entre si, revelando a tendência de co-variação
de cada qual em relação a outra, não em função da outra.
Correlação de Kendall: teste de associação entre duas variáveis mensuradas a nível
ordinal (postos), calculando-se a correlação pelo coeficiente t de Kendall.

121
Correlação de Spearman: teste de associação entre duas variáveis mensuradas a nível
ordinal (postos), calculando-se a correlação pelo coeficiente rs de Spearman.

Correlação linear (Pearson): teste de associação linear entre duas variáveis mensuradas a
nível intervalar ou de razão, medindo-se o grau e a direção pelo Coeficiente r de correlação
linear.

Correlação Parcial: teste de associação de duas variáveis quantitativas – X e Y – as quais


são testadas juntamente com uma outra variável – Z –, a fim de se verificar se a correlação
existente entre as primeiras é alterada pela presença da terceira variável introduzida.

CRD ("Completely randomized design" ou Plano/Desenho totalmente aleatorizado) - neste


tipo de plano, se forma aleatoriamente dois ou mais grupos (amostras) com indivíduos
retirados de uma mesma população ou de populações equivalentes.. O modelo matemático
a ele subjacente é o seguinte: Xi j = j + E i j , onde Xi j é o escore obtido pelo
indivíduo i no tratamento j. Tal escore (dado) é suposto ser igual a média da população
mais o efeito específico ( Tj ) do tratamento ( j ) que
lhe foi aplicado, mais o efeito de um componente aleatório idiossincrásico (próprio de cada
indivíduo), chamado efeito devido ao erro inerente ( E i j ). O modelo, ainda, pressupõe
que E i j independa de Tj. Por conseguinte, E i j = X i j - j ).

Dados: escores obtidos de observações ou de pesquisas, podendo ser de fontes primárias


ou secundárias e de amostras ou de populações.
Em informática, as análises de dados, ou seja, dados brutos processados, geram
informações, as quais podem ser usadas em diferentes contextos e para diferentes
finalidades.

DADOS ESTATÍSTICOS (OU ESTATÍSTICAS DA AMOSTRA) - Escores baseados em


dados amostrais (cf. amostra), empregados para estimar os parâmetros da população-mãe
(por exemplo, média ou desvio-padrão - cf. a seguir).

DEFINIÇÃO - Enunciado que implica o emprego de palavras na forma "A se, e apenas se,
B, C etc.". As definições são um meio taquigráfico de comunicação, de modo que se
preserva o significado inequívoco, ao mesmo tempo em que se reduz a verbosidade ao
mínimo.

DEFINIÇÕES OPERACIONAIS - Definição na forma "condicional", a qual proclama as


condições específicas (quando e/ou quanto, como e onde) para a observação e mensuração
de conceitos mais ou menos abstratos, ou seja, o resultado esperado que será observado e
medido depois que as condições impostas forem satisfeitas.
Resumindo: a definição operacional deve especificar na forma condicional o que se
entende pelo conceito que se está definindo operacionalmente, as condições em que será
observado tal conceito, ou ainda, as condições específicas que serão utilizadas para produzir
e, concomitantemente, observar o conceito, mais o modo, a maneira pela qual será
quantificado ou mensurado.

122
Notar que o como pressupõe 'o quê' será usado (equipamentos, materiais etc.), e o quando,
'em que circunstâncias' serão usados para a observação e a mensuração do conceito que foi
operacionalmente definido.
DESCRIÇÃO - A mais simples das estratégias de pesquisa, a qual envolve o ato de
observar e registrar os comportamentos à medida que eles ocorrem; às vezes, como
ocorrem (forma), onde, quando e por quanto tempo.

Desvio Padrão (DP) - (Apresenta propriedades da variância e tem a mesma unidade de


medida). É definido como a raiz quadrada da variância, com sinal positivo e negativo ao
mesmo tempo, pois envolve desvio em torno da média para um e para outro lado da
distribuição dos dados (para + ou para -). O desvio padrão é representado por DP ou S.

ou .

Distribuição binomial: modelo de distribuição de probabilidades de variáveis aleatórias


discretas, consistindo de n provas idênticas e independentes, cada uma apresentando apenas
dois resultados: sucesso (p) e insucesso (q = 1-p).

DISTRIBUIÇÃO DE FREQUÊNCIA DAS DIFERENÇAS MÉDIAS ENTRE


AMOSTRAS - Distribuição de frequências de diferenças médias ( ) obtida de um
número supostamente infinito de diferenças médias entre amostras aleatórias, geralmente
hipotéticas (diferenças entre médias de amostras); o valor médio (ou seja, a média das
diferenças entre as médias) de uma distribuição de diferenças médias de amostras é zero,
valor este considerado igual a média da população para dada característica.

DISTRIBUIÇÃO DE FREQUÊNCIA DE MÉDIAS DE AMOSTRAS - Distribuição de


frequências de um número infinito de médias de amostras aleatórias, geralmente
hipotéticas; seu valor médio é igual a média da população.

Distribuição de Poisson: modelo de distribuição de probabilidades de variáveis aleatórias


discretas, cujos eventos são raros e referentes ao tempo e ao espaço. A média é igual à
variância.

Distribuição exponencial: modelo de distribuição de probabilidades de variáveis


aleatórias contínuas, referente ao intervalo de tempo decorrido entre eventos raros e
discretos.

Distribuição hipergeométrica: modelo de distribuição de probabilidades de variáveis


aleatórias discretas, com as mesmas características da distribuição binomial. O tamanho da
amostra, contudo, é relativamente grande em relação ao tamanho da população, alterando-se
em grau acentuado a probabilidade dos elementos da população pela retirada de cada
unidade sem reposição.

123
Distribuição normal (ou curva normal ou Curva de Gauss) - É a distribuição simétrica de
dados em que a maioria dos valores se concentra na região central da curva, isto é, perto da
média, e as frequências dos dados decrescem rapidamente de ambos os lados da área
central. A forma geral da curva é descrita como em forma de sino e, sendo simétrica, a
média, a mediana e a moda terão todas o mesmo e único valor. A curva normal tem como
parâmetros m (mi) e s (sigma), onde m representa a média e s o desvio-padrão da
população. Apresenta também dois pontos de inflexão (lugares onde a curva muda de
direção) correspondentes, respectivamente, aos valores de x = m + s e x = m - s. O termo
"curva normal" foi cunhado por Pearson em 1893.
Modelo de distribuição de probabilidades de variáveis aleatórias contínuas de largo
emprego em estatística, caracterizando-se por ser simétrica, em forma de sino, assintótica,
cuja área sob a curva é igual à unidade, abarcando 100% da população envolvida com o
fenômeno sob investigação.

Figura Curva Normal - Uma distribuição de amostragem de diferenças


médias entre médias de amostras YE e YC com uma média igual a zero (0) e
um desvio-padrão igual a mais ou menos um (

DUPLA CEGUEIRA - Processo de controle experimental no qual nem o sujeito, nem o


experimentador, tem conhecimento prévio da condição ou condições específicas que estão
sendo administradas (manipuladas) na experiência.

124
ECOETOLOGIA - ("ekos" = casa, lugar, ambiente) disciplina que enfatiza o estudo do
comportamento dos organismos em seus ambientes naturais, sem levar em consideração os
determinantes internos (o mesmo que ecologia comportamental; vide tb. etologia).

EFEITO DE INTERAÇÃO - VIDE "INTERAÇÃO".

EFEITO PRINCIPAL - Comparação de médias globais com dados geralmente decompostos


através dos níveis de uma terceira variável.

EFEITO SIMPLES - Quando há efeito de interação entre duas variáveis, a análise deve
focalizar as diferenças entre cada par de médias (por exemplo, A1 vs. A2) em cada nível de
alguma outra variável (B1 e B2, por exemplo). Chamamos à comparação entre as médias,
num dos níveis de outra variável, de teste de efeitos simples.

EMPARELHAMENTO (= equiparação) - Técnica de controle em planos de grupos


separados em que se tenta, explicitamente, antes da aplicação dos tratamentos ou da
introdução das condições experimentais, fazer com que os grupos (amostras) se tornem
equivalentes com respeito a uma, ou mais de uma, medida ou característica.

EMPIRISMO - Escola filosófica que afirma serem as experiências factuais (aquelas


passíveis de verificação e capazes de impressionar nossos sentidos) o fundamento da
observação e, por conseguinte, de todo o conhecimento.
Epistemologia: ramo da Filosofia, segundo Gregory Bateson (1971), aplicado ao estudo de
como chegamos a conhecer algo.
Segundo alguns, o mesmo que Filosofia da ciência. Penso que devemos distingui-las pela
amplitude do enfoque usado: a Epistemologia têm, necessariamente, um enfoque mais
restrito à cada ciência em particular às quais se aplica, estudando cada uma per si -
analisando criticamente suas bases e proposições; a Filosofia da ciência, ao contrário, tem
um enfoque mais abrangente, genérico, exatamente à área de conhecimento que é conhecida
como Ciência - às ciências enquanto domínio linguístico especializado.
Desde o princípio do século, com o Neopositivismo do Círculo de Viena, a Epistemologia
tem ganho espaço de sua oponente histórica, a Gnoseologia, até assimilar-se à denominação
de Teoria do Conhecimento; chegou-se a considerar que todos os temas, idéias e problemas
que diziam respeito ao conhecimento, tanto o conhecimento filosófico quanto o científico,
pertenciam à Epistemologia. Entrementes, não é possível continuar considerando a
Epistemologia desta forma global, pelo contrário, é necessário estabelecer qual é seu campo
real (idéias, temas e problemas). Esta necessidade tem mostrado as carências atuais da
Epistemologia, que corre o risco de converter-se em uma mera "rapsódia"[1] de
procedimentos metodológicos e de discussões sobre seu alcance e efetividade, ou seja,
tratar de temas exclusivamente científicos.
Destarte, tem surgido a necessidade de retomar a reflexão filosófica que tinha o nome de
Gnoseologia, nome que tradicionalmente se concedeu ao tipo de reflexão que não recaía
diretamente sobre os procedimentos científicos, senão sobre as condições necessárias para
alcançar os princípios de cientificidade das ciências. Tal reflexão tem tratado e trata, por
conseguinte, de constituir-se em uma reflexão objetiva sobre as ciências, a qual, ao dar

125
conta de seus estatuto e identidade, salve o problema epistemológico de sua unidade,
estacionado ("embarrancado") há trinta anos no problema de sua fundamentação.

[1] Fantasia musical que utiliza melodias tradicionais ou populares; trecho de uma
composição poética (dicionário Aurélio).

EQUIPARAÇÃO - (Vide acima emparelhamento).

Erro amostral: viés observado nas amostras aleatórias, decorrente da natural variabilidade
dos elementos constituintes das populações; assinalando-se ser isso devido ao fato de nem
todas as unidades que compõem o universo populacional participarem das amostras. O erro
amostral é minimizado pelo aumento relativo do tamanho da amostra e representado
("medido") pelo erro padrão.

ERRO DE AMOSTRAGEM - Erro não-sistemático ocorrido entre amostras retiradas de


uma mesma população, o qual se deve à ausência (representações inadequadas) nas
amostras de características relevantes da população ou, concomitantemente, excessiva
concentração (ocorrência) na(s) amostra(s) de membros da população com característica
idiossincrásica.

ERRO DO TIPO G - Tipo de erro de amostragem (extrínseco ao planejamento


experimental) que se deve à ocorrência acidental de alguma particularidade ambiental que
influi no desempenho de todo um Grupo, mas não influi na(s) outra(s) amostra(s).

ERRO DO TIPO I (ou simplesmente Erro tipo I) - Erro de julgamento que resulta da
rejeição da hipótese nula (H0) quando ela é, de fato, sustentável ("verdadeira").

ERRO DO TIPO II (ou simplesmente Erro tipo II) - Erro de julgamento que resulta da
aceitação da hipótese nula (H0) quando ela é, de fato, insustentável ("falsa").

126
ERRO DO TIPO R - Tipo de erro de amostragem (intrínseco ao planejamento
experimental) que se deve à seleção de uma amostra que contém alguma particularidade de
Resposta (comportamento) relativamente permanente que a diferencia da população-mãe.

ERRO DO TIPO S - Tipo de erro de amostragem que se deve à inclusão inadequada, numa
amostra, de indivíduos com características extremas (idiossincrásicas) e pouco
representativas ou não representativas da totalidade dos indivíduos da população.

Erro padrão: é o desvio padrão da média ( ), calculado pelo quociente entre o desvio
padrão e a raiz quadrada do número de observações da amostra. O erro padrão serve como
estimativa da diferença entre a média da população e a média da amostra.

ERRO PADRÃO DA DIFERENÇA ENTRE MÉDIAS - O erro-padrão da diferença entre


médias é igual à raiz quadrada da soma das variâncias estimadas das populações. O
tamanho do erro-padrão de uma distribuição de frequências de diferenças entre médias
depende do tamanho das amostras e das estimativas das variâncias da(s) população(ões).

Ele é calculado pela fórmula: .

ERRO PADRÃO DA MÉDIA (ou simplesmente Erro padrão) - É o "erro" inerente a


qualquer cálculo de médias de amostras. Pode ser calculado pelas seguintes fórmulas:

ou .

ESCALA DE RAZÃO - Escala de mensuração que possui todas as propriedades das escalas
nominal, ordinal e de intervalo, mais a propriedade adicional de possuir um zero absoluto
no ponto de origem. Caracteriza-se por apresentar unidade constante e comum de
mensuração, atribuindo-se um número real a cada escore, havendo um quociente ou razão
conhecida entre dois intervalos/valores quaisquer e um ponto zero verdadeiro (absoluto)
como origem. Exemplo: peso em gramas; ou as mensurações físicas corriqueiras de
comprimento.

ESCALA INTERVALAR - Escala de mensuração que proporciona enunciados do tipo


"maior do que" ou "menor do que", e especifica a quantidade de unidades "maiores do que"
ou "menores do que" (como exemplo, a escala de temperatura em graus centígrados). A
escala de intervalos tem as propriedades de ordenação e adição de valores. É semelhante à
escala de razão, havendo apenas uma única razão conhecida entre dois intervalos (valores)
quaisquer, sendo a unidade de medição e o ponto zero arbitrários. Alguns pesquisadores
não fazem distinção entre esta escala e a de razão.

ESCALA NOMINAL - Escala mais simples que existe; nela se usam números ou
quaisquer outros símbolos para distinguir características ou indivíduos, uns(umas) do(a)s
outro(a)s, dentre um conjunto ou classe de objetos, coisas etc.. Escala na qual as diversas
categorias ou modalidades de uma variável são contadas, havendo relação de equivalência
entre e dentre as categorias. Exemplo: estado civil: solteiro, casado, divorciado e viúvo.

127
ESCALA ORDINAL - Escala na qual os números (valores) indicam tão somente
diferença(s) de magnitude, tamanho ou ordem (por exemplo, posição, ordem ou lugar em
que atletas velocistas ou fundistas atingem a linha de chegada).
Escala na qual as modalidades de uma variável são ordenadas em graus ou magnitudes
convencionadas (arbitrariamente), havendo uma relação matemática “maior do que” ou
“menor do que” entre os elementos, objetos, coisas das diversas categorias e de
equivalência das unidades dentre cada modalidade. Exemplo: conceitos escolares:
Excelente, Bom, Regular e Insuficiente.

ESCOLA, ABORDAGEM, CORRENTE OU TENDÊNCIA PSICOLÓGICA - Estes


termos referem-se, geralmente, a um grupo de estudiosos que seguem ou compartilham os
mesmos princípios ou princípios metodológicos semelhantes.
Cada Escola ou corrente reúne um conjunto de psicólogos que, em decorrência de pesquisas
já realizadas, admitem certos métodos e concepções próprias acerca do comportamento.

ESCOLA DE WÜRZBURG - Escola psicológica que enfatizou atos e processos e usou a


introspecção como método; precursora do Funcionalismo.

Escores padronizados: transformação dos escores brutos em escores z, onde a média é


igual a zero e o desvio padrão igual à unidade (1).

Especificidade: percentagem de indivíduos sem o evento (sem a afecção investigada, por


exemplo, cujo teste – e.g.: tuberculínico – é negativo [-]).

Estatística descritiva: parte da estatística cujo objetivo é a coleta, a organização, a


classificação dos dados amostrais ou das populações, as apresentações tabular e gráfica e o
cálculo de determinadas medidas (estatísticas ou parâmetros): média, mediana, variância,
desvio padrão, coeficiente de variação, de assimetria, de curtose e outras.

Estatísticas (no plural): valores numéricos das amostras, constituindo nas amostras
probabilísticas estimativas não enviesadas dos parâmetros da população conforme é
demonstrado pelo Teorema do Limite Central.
Estimação de parâmetros: parte da inferência estatística, cujo procedimento indutivo
consiste em generalizar os valores numéricos amostrais para o universo investigado.
Estratos (vide tb amostra estratificada e amostragem estratificada): são subgrupos dentro
de uma população maior, caracterizados por possuírem certa característica ou
particularidade distintiva, a qual pode ser usada para orientar a escolha de indivíduos que,
obrigatoriamente, devem compor as amostras, haja vista tal característica, supostamente, ter
influência sobre a VD; por outro lado, para resguardar que determinado estrato esteja
devidamente representado na amostra, os indivíduos que a comporão devem estar presentes
na mesma proporção em que são encontrados na população da qual foram selecionados.
Para tal se usa a regra de três, levando em conta o tamanho da amostra que pretendemos
formar (n), a frequência relativa (em porcentagem) de membros pertencentes a determinado
estrato na população-mãe (N%), a qual será usada para o cálculo da frequência absoluta de
indivíduos daquele estrato que comporão a amostra. Exemplos de estratos: o subgrupo de

128
pessoas que têm entre 30 e 40 anos; o subgrupo de pessoas que cursaram o ensino
superior; o subgrupo de pessoas que têm renda familiar acima de 15 S.M. etc.

ESTRUTURALISMO - A primeira escola de Psicologia; seus seguidores tentavam reduzir


a mente a elementos básicos ou estruturais e utilizavam a introspecção como método
supostamente experimental. Fundada por Wilhelm Wundt.
O termo refere-se também à tendência metodológica inicialmente formulada no campo da
linguística por F. de Saussurre (2ª metade do sec. XX), segundo a qual os elementos que
compõem determinada estrutura mantém relações funcionais necessárias entre si, o que lhes
garante a identidade enquanto estrutura.

Estudo longitudinal: é aquele no qual se coleta informações, sobre os indivíduos


selecionados, durante um longo intervalo de tempo especificado.

Estudo prospectivo: estudo longitudinal no qual os indivíduos são observados a partir de


um dado momento, prosseguindo-se ao longo do tempo previamente fixado.

Estudo retrospectivo: estudo longitudinal no qual as informações de interesse estão


contidas em registros anteriores, em arquivos de dados como, por exemplo, em prontuários
hospitalares.

Estudo transversal: dados coletados de um grupo de indivíduos em um momento


definido, avaliando-se, por exemplo, sobretudo a prevalência de uma determinada
característica ou comportamento. Em psicologia do desenvolvimento formam-se vários
grupos de diferentes idades ou fases de desenvolvimento e se os observa em um intervalo
geralmente curto, de modo a se ter dados de aspectos do desenvolvimento relativos a várias
idades.

- Estimativa da dimensão do efeito da VI sobre a VD; em outras palavras, medida


do grau de erro da hipótese nula após a realização de um teste F.

ETOLOGIA - ("ethos" = comportamento, hábitos, costumes) estudo do comportamento dos


organismos e seus determinantes internos e ambientais.

Existencialismo - valoriza a pessoa, mediante sua "abertura para o" e "imersão no" mundo,
enquanto ente que existe temporal e responsavelmente apenas enquanto se individualiza
assumindo sua imanência; neste sentido, as filosofias da existência (porquanto diversos são
os pontos de vista a este respeito) consideram o Homem finito, portanto, sem qualquer
possibilidade de transcendência, limitado nas suas opções e capacidades, quase obrigado a
pelejar diuturnamente a fim de realizar sua própria existência frente as contingências que
lhe são impostas.
Ao tratar da valorização da Pessoa em uma perspectiva exclusivamente terrena, em certo
sentido, Existencialismo e Humanismo se confundem, cabendo, pois, pois, à Filosofia a
análise da existência humana.
EXPERIÊNCIA (EXPERIMENTO, EXPERIMENTAÇÃO) - Conjunto de regras que
orientam o arranjo e a ocorrência de certos eventos, dentro de um planejamento lógico e
ordenado, visando simular certas condições naturais, de modo que os dados empíricos (dos

129
sentidos) possam ser usados para formular relações legítimas (leis e teorias) entre esses
eventos.
O Experimento é um trabalho analítico no qual há intervenção do pesquisador sobre as
condições às quais os indivíduos são submetidos à pesquisa, com controle efetivo dos
supostos fatores causais e observação e registros cuidadosos dos respectivos efeitos.

EXPLICAÇÃO - Refere-se à aplicação de conceitos, leis e teorias em relação a um


resultado experimental qualquer ou em relação a um evento que ocorre naturalmente. A
explicação, em ciência, só é útil quando pode ser posta à prova; e só será testável quando
os fatos que poderiam falseá-la são conhecidos e podem ser descartados como dispensáveis
ou impertinentes para a referida explicação.
Explicar, em ciência, envolve identificar a "causa" de um dado evento ou
acontecimento tido como efeito daquela (via de regra, VI => VD).

FATO - Em sentido mais geral, descrição de uma observação que transmite uma espécie de
conhecimento empírico (cf. empirismo) acerca do mundo. Os fatos devem servir de base na
elaboração e explicação da teoria científica de base positivista.
Em sentido mais restrito, um fato é meramente a descrição e experienciação por duas ou
mais pessoas de uma parte, observável e passível de repetição, do fenômeno.

FENOMENOLOGIA - Enquanto escola psicológica, procura compreender o mundo do


ponto de vista dos indivíduos. Em oposição aos behavioristas, os fenomenólogos fazem
uso da experiência subjetiva, dos relatos introspectivos e dos processos mentais. Contudo,
considerando o uso extensivo do plano de sujeito único e as elucubrações dos behavioristas
radicais, estes tendem a se aproximar daqueles.
Enquanto escola filosófica, teve sua primeira formulação através de Edmund Husserl
(1900). Pretende levar ao conhecimento da verdade ou essência do fenômeno, através da
intencionalidade da consciência (haja vista que toda consciência é consciência de algo -
porém, a consciência da essência das realidades é uma tarefa infindável, necessariamente
incompleta, pois toda compreensão do fenômeno é apenas superficial e deve ser
"completada" por outras essências das vivências). Portanto, a fenomenologia seria o
conhecimento descritivo das essências da consciência pura, livre de preconceitos.
Essência, no sentido filosófico, significa o sentido último que um indivíduo abstrai de algo,
de alguma coisa, de um ente; não se tratando de um caráter ou propriedade desse ente.
"O movimento fenomenológico originou-se, curiosamente, em oposição ao romantismo, o
qual tem sido a grande força propulsora dos movimentos humanísticos através dos tempos.
Assim, expressar sentimentos é em sua condição bruta um ato fenomenal, e não
fenomenológico.
Alguns entendem que a fenomenologia é um meio por excelência para reflexão sobre
sentimentos ou para a revelação de uma vida autêntica. Outros, ao contrário, vêem nela
uma ferramenta ética e poderosa para mediar as relações complexas entre ciência,
tecnologia e ecologia. ... cotidiano que requer um mundo que serve de habitação e sustento
para um corpo que se faz sujeito na relação com outros corpos sujeitos. Desta relação vem
o desafio de dominar o mundo (por isso a ciência e a tecnologia) mas sem aniquilá-lo (por
isso a ecologia), e de conviver com o outro sem explorá-lo, mas também sem se deixar

130
explorar (por isso a ética). Essas preocupações dão ao pesquisador fenomenológico uma
posição privilegiada para lidar com a positividade sem ser positivista e de recorrer aos
recursos da intuição sem ser necessariamente um romântico; o que requer ainda um forte
senso de observação empírica e uma desconfiança permanente de suas crenças e teses. No
entanto, descrever os meus sentimentos ou os sentimentos observados em outros
(experiência consciente) pode ser a base empírica para uma análise lógica e
sistemática da evidência contida nestas verbalizações (consciência da experiência). Isso
sim é fenomenologia" (excertos da apresentação do livro Psicologia e Fenomenologia -
Reflexos e perspectivas, 2003, organizado por Maria Alves de Toledo Bruns e Adriano
Furtado Holanda).

Fenótipo: característica de um indivíduo resultante do produto dos genes e expressada de


diversas maneiras. As pessoas do sistema sanguíneo ABO, por exemplo, são classificadas
em fenótipos dos grupos A, B, AB ou O.

FIDEDIGNIDADE DA MEDIDA DE RESPOSTA - Representa o grau em que uma dada


resposta reflete, sem variação com o simples passar do tempo, os efeitos de uma variável
independente (a medida de uma dada resposta, em uma dada experiência, será a mesma em
dois momentos distintos dessa experiência se essa medida de resposta tiver regularidade, ou
seja, for fidedigna).

FUNCIONALISMO - Escola psicológica que se ocupa dos propósitos dos eventos mentais
e do como e do por quê das operações mentais (função da mente no processo de adaptação
dos organismos às condições sempre variáveis de seus ambientes). O funcionalismo é o
primeiro sistema psicológico genuinamente norte-americano.

GESTALT - Escola psicológica que enfatiza a experiência do organismo total. Os


gestaltistas entendem que o todo é mais que a soma das partes (princípio enunciado pelo
filósofo chinês Mao Tsé no séc. II AC). A Gestalt se orienta por pontos de vista
fenomenológicos - o todo, o conjunto, a forma resulta da descoberta de relações entre as
partes que compõem este todo -. A Gestalt ficou conhecida como a psicologia da boa forma
ou da percepção.

GRAU DE ERRO DA HIPÓTESE NULA (H0) OU VALOR ETA (h) - Indica o grau de
efeito da(s) VI(s) sobre determinado resultado experimental, quando calculamos através do
teste F a probabilidade da H0 ser sustentável. O valor eta é um índice entre os valores da
VD e o número de dados relativos aquela medida dependente. Quanto maior o valor de eta,
maior nossa certeza preditiva a respeito dos resultados dos participantes por conta do efeito
da(s) VI(s); em outras palavras, quanto maior o valor de eta, maior o grau de certeza a
respeito da insustentabilidade da hipótese nula.

A fórmula de eta é:

131
GRAUS DE LIBERDADE - Conceito estatístico de difícil explicitação. Graus de
liberdade se refere a segurança inferencial que o pesquisador adquire em função do
tamanho relativo de sua(s) amostra(s); estatisticamente falando, se refere a quantidade de
observações independentes (n) menos a quantidade ou número de fatores (aspectos,
parâmetros) da população que estão sendo estimados, avaliados ou medidos (gl = n - k; via
de regra, n - 1).

HIPÓTESE EXPERIMENTAL, HIPÓTESE DE TRABALHO OU H1- Reformulação


explícita da pergunta (problema) geral da pesquisa, a qual esclarece a relação entre as
variáveis, independente e dependente (VI e VD), quais os sujeitos experimentais, os
processos e materiais a serem usados. A hipótese experimental prediz que ocorrerá uma
variação sistemática na VD (diferentes observações, valores, dados) em função de variações
na VI (tratamentos). Exemplos de enunciação de hipóteses experimentais: Ᾱ1 - Ᾱ2 ≠ 0; Ḡ1
= Ḡ2 = Ḡ3

HIPÓTESE NULA, HIPÓTESE ALTERNATIVA OU H0 - Enunciado que sustenta que


quaisquer diferenças entre duas observações, amostras, grupos etc., se devem ao acaso ou a
fatores aleatórios e não a uma variação sistemática da VI; hipótese que sustenta que não
haverá uma diferença "real" entre as médias das amostras usadas no experimento.
Exemplos de enunciação de hipóteses nulas: Ḡ1 = Ḡ2; Ᾱ1 - Ᾱ2 = 0

ÍNDICE DE CORRELAÇÃO (cf. coeficiente de correlação) - O coeficiente de correlação


não é uma medida da mudança quantitativa de uma "variável" em relação a outra, é somente
uma medida da intensidade de associação (co-relação) entre duas variáveis. Sua fórmula
para dados independentes (cf. plano do tipo CRD) é:

; para dados correlatos ou repetidos

(cf. plano do tipo RBD) é: ou .

INTERAÇÃO - Ocorre interação entre variáveis independentes quando o efeito de uma


delas, isoladamente, é substancialmente diferente quando em presença de cada nível da
outra. Em outras palavras, ocorre interação entre VIs quando o efeito de uma delas se altera
em presença, na mesma situação, de uma outra VI. Atenção: o fato de estar(em)
presente(s) na mesma situação outra(s) potencial(ais) VI(s), não significa que haverá
necessariamente interação entre elas. A possibilidade de interação entre variáveis deve ser
investigada através de planos fatoriais, nos quais mais de uma VI são usadas, ou mesmo
níveis diferentes de VI´s , como no caso do plano de tratamento por níveis.

INTERAÇÃO DE ORDEM TRIPLA - Interação que ocorre em planos trifatoriais. Uma


interação de ordem tripla implica que uma ou mais interações bifatoriais provavelmente

132
serão significativas em um nível do terceiro fator (por exemplo, AB é significativa em C1),
ao passo que uma ou mais interações bifatoriais que envolvem os mesmos termos, não são
significativas em um outro nível do mesmo terceiro fator (AB não é significativa em C2, por
exemplo); uma interação de ordem tripla também poderá ocorrer se as formas das
interações bifatoriais se alterarem radicalmente nos níveis do terceiro fator.

INTROSPECÇÃO - Método usado pelos primeiros psicólogos estruturalistas, o qual exigia


sujeitos treinados a "olhar para dentro de sí mesmos", refletir sobre as mudanças ocorridas
em suas experiências conscientes e relatar fielmente essas mudanças a um experimentador
que relacionava sistematicamente, em relação ao conteúdo da mente, um relato subjetivo a
outro, buscando a formulação de leis do tipo R-R.

INVERSÃO - Técnica de controle em experimentos com sujeitos únicos; consiste em se


retornar, após a aplicação do tratamento experimental, às condições que vigoravam durante
a fase de registro da linha de base inicial.

LEI - Enunciado de uma relação sistemática entre variáveis ou conceitos. Um exemplo de


ocorrência de um conceito deverá estar sempre ligado à ocorrência de um outro (ex.: se
ocorre A então B ).
Contudo, devemos lembrar que as leis científicas, via de regra, são probabilísticas.
Segundo Michael Sherwood (in: The logic of explanation in Psychoanalysis. Academic
Press, New York, 1969), as generalizações em ciência podem se conformar a seis
diferentes tipos. São eles, por ordem de maior para menor grau de generalidade:
1. Se A ocorre => (então) B também ocorre sempre;
2. Se A ocorre => B ocorre em x % dos casos (o que corresponde à primeira
generalização, dentro de uma perspectiva probabilística);
3. Se A ocorre nas ocasiões T1 ... Tn , => B ocorre;
4. Se A ocorre nas ocasiões T1 ... Tn , sob as condições C1 ... Ck , => B ocorre;
5. Se A ocorre nas ocasiões T1 ... Tn , sob as condições C1 ... Ck , para os indivíduos P1 ...
Pj , => B ocorre;
6. Se A ocorre nas ocasiões T1 ... Tn , sob as condições C1 ... Ck , para os indivíduos P1 ...
Pj , => B ocorre em x % dos casos (o que corresponde a quinta generalização, dentro de
uma perspectiva probabilística).

LINGUAGEM DA OBSERVAÇÃO - Palavras usadas para descrever ou nomear eventos


observáveis diretamente no dia-a-dia. Essa linguagem consiste em termos que especificam
e identificam, ou indicam propriedades de objetos, ou descrevem relações entre eles; a
linguagem da observação é o ponto de partida para a comunicação científica.

LINHA DE BASE (COMPORTAMENTO DE BASE OU, SIMPLESMENTE, BASE) -


Refere-se, via de regra, ao comportamento firme, estável, apresentado por um organismo
antes da introdução do tratamento experimental em um plano de sujeito único. Estratégia
de controle usada na abordagem de pesquisa conhecida como manipulativa funcional ou
AEC - cf. Behaviorismo e/ou Manipulação.

133
LINHAS DE BASE MÚLTIPLAS - Processo de controle experimental usado em pesquisas
de sujeito único. Diferentes sujeitos podem receber o mesmo tratamento em diferentes
ocasiões ou o mesmo sujeito pode receber o mesmo tratamento para diferentes tipos de
respostas ou de ambientes diferentes ao longo do tempo.
Livre arbítrio - conceito filosófico amplamente incorporado ao discurso vulgar corrente,
principalmente no mundo ocidental. É definido como a faculdade-propriedade de qualquer
pessoa poder decidir escolher entre o bem e o mal. O conceito de livre arbítrio se distingue
do de liberdade na medida em que esta pressupõe, além de ausência de coação externa,
ausência de coação interna, enquanto que aquele pressupõe apenas ausência de coação
externa ao indivíduo.
Vale lembrar a frase de Pablo Neruda: "Somos livres para fazermos nossas escolhas, mas
somos escravos de suas consequências".

MAGNITUDE DO EFEITO (DA VI) - Indica o efeito da VI em relação aos valores


observados da VD.
Como saber se um dado efeito experimental, obtido através do teste t, é devido ao poder
efetivo da VI ou tão somente ao fato do n ser bem grande? Ou seja, como medir o efeito da
VI? Como medir seu provável poder? Isso pode ser feito calculando o
índice de correlação de ponto bisseriado (rpb), através da seguinte
fórmula:
Como todo índice de correlação, o valor de rpb varia de 0 a 1.
Convencionalmente, valores acima de 0,50 indicam altas magnitudes de efeito da VI;
valores entre 0,31 e 0,50 são considerados moderados; e valores até 0,30 são considerados
pequenos.

MANIPULAÇÃO - Estratégia ou abordagem de pesquisa muito poderosa, que envolve a


manipulação (alteração) de uma ou mais variáveis independentes. A manipulação é
utilíssima para se investigar relações causais. Essa abordagem pode ser dividida em:
Abordagem Manipulativa Propriamente Dita (AMPD) e Abordagem manipulativa funcional
(também conhecida como Análise Experimental do Comportamento - AEC, a qual faz uso
do plano de sujeito único). As principais diferenças entre elas são: uso de grupos de
sujeitos (AMPD) em contraste com o uso extensivos de planos de sujeito único (AEC); uso
de testes de hipóteses e da estatística inferencial na análise dos dados experimentais
(AMPD) em contraste com o uso de gráficos representando curvas acumuladas de respostas
e da estatística descritiva (AEC); uso do método hipótetico-dedutivo na elaboração de
teorias (AMPD) em contraste com o uso do método indutivo (AEC); uso de explicações
causais (AMPD) em contraste com explanações funcionais (AEC).

MÉDIA - Medida de tendência central usada para caracterizar ou descrever alguma


particularidade quantificável de uma dada amostra, subconjunto, ou mesmo de uma
população. Como estatística, a média é definida como um índice aritmético, calculado pela
somatória ou soma de todos os valores ou escores individuais (Xi) observados na amostra,

134
dividido pelo total de observações realizadas ou pelo número de indivíduos ou casos (N)

que compõem a amostra: .

NÍVEL DE SIGNIFICÂNCIA - Ao realizarmos um teste estatístico sobre os dados de um


experimento, estaremos habilitados a dizer em que medida (nível) é provável que qualquer
diferença observada seja devida ao acaso. Se é pouco provável (que a diferença possa ser
causada por acaso, - digamos, a probabilidade é de 1:1000, ou seja, 0,001 - então, se
concluirá que a variável independente é a responsável pela diferença; diz-se, então, que a
diferença é estatisticamente significativa. Se, por outro lado, a diferença entre os dois
grupos pode facilmente surgir por acaso, então não há razão alguma para atribuí-la ao efeito
da variável independente. Os resultados serão considerados não-significativos,
estatisticamente falando.
Até que ponto (nível) a explicação aleatória tem de ser improvável - melhor, pouco
provável - para que a rejeitemos e possamos considerar os resultados significativos? Essa é
essencialmente uma questão arbitrária; a maioria dos psicólogos experimentais adota um
nível de significância ( ) de 0,05, ou seja, precisará estar num nível de ocorrência
(aleatória) de, no máximo, 5:100 ou 1:20 (5 casos em cada 100 ou 1 caso em cada 20
observações, respectivamente, o que resulta, em ambos os casos, uma probabilidade de
0,05).

OBSERVAÇÃO(ÕES) INDEPENDENTE(S) (mesmo que medidas ou dados


independentes) - termo estatístico utilizado para designar o(s) registro(s)/dado(s) obtido(s)
de forma a evitar:
- a obtenção/contagem repetida indevidamente de alguns dados mas não de todos;
- a obtenção/contagem dos dados em momentos distintos, de modo que isso possa
influenciar o resultado final, quando não se pretende avaliar a influência da passagem do
tempo sobre os dados;
- que um ou mais observadores registrem indevidamente o mesmo dado ou evento várias
vezes num mesmo momento;
- que dois ou mais observadores registrem de modo idêntico o mesmo evento, quando um
deles pôde influenciar o registro do outro;
- a pseudoreplicação dos dados.

OBSERVAÇÃO NATURALÍSTICA - Estratégia descritiva que requer observação e


mensuração do comportamento à medida que ele ocorre em seu estado natural ou normal.

OMEGA2 - É uma medida da proporção relativa da variação (variância) total de


desempenhos que pode ser explicada pelo efeito da manipulação experimental (VI); serve
para avaliar a possível significância científica de um resultado qualquer de pesquisa
manipulativa.
Uma fórmula simplificada é a apresentada por Geoffrey Keppel (in Design and Analysis - A
Researcher's Handbook. Prentice-Hall, Inc., Englewood Cliffs, New Jersey. 1973. p. 551):

135
; onde gl(r-1) corresponde aos graus de liberdade inter-grupais; F
corresponde ao valor do teste F (ANOVA); e nT corresponde ao número total de
observações em todos os grupos.

PARADIGMA - O mesmo que modelo (no caso da ciência, modelo teórico usado para
explicar os fenômenos estudados ...). Kuhn usa o termo para se referir "à constelação total
de crenças" compartilhada por certos cientistas ou uma dada comunidade, ou ainda, a uma
experiência exemplar, como no caso dos pesos deixados cair por Galileu Galilei da torre de
Pisa, na Itália. Em certo sentido, o termo se refere às realizações científicas universalmente
reconhecidas que, durante algum tempo, fornecem problemas de pesquisa e soluções
modelares para uma comunidade de praticantes de uma dada ciência (Kuhn, 1997:13).
Modelo teórico exemplar.
PARÂMETROS DA POPULAÇÃO - Características inerentes a toda e qualquer
população, como sua média, variância etc. Geralmente esses parâmetros são deduzidos à
partir de amostras retiradas da população da qual se está interessado em conhecer seu
comportamento ou certas características. Os dados estatísticos das amostras são então
generalizados para a população de onde as amostras foram retiradas.

PARTICULARIDADES RECORTADAS (ABSTRATAS) - Particularidades ou objetos


reais que requerem condições especiais para a sua observação.

PARTICULARIDADES SALIENTES (NOTÁVEIS) - Particularidades ou objetos da


experiência sensorial que não precisam de outra definição além de uma lista dos seus
atributos.

PLACEBO - Condição de controle em que todas as particularidades são idênticas à


condição experimental, excetuando-se seu aspecto-chave ou crítico. Em medicina,
substância sem propriedades terapêuticas, usada no lugar de substâncias sabidamente com
princípios ativos, ou substância usada e acreditada como tendo ação farmacológica
importante. Em psicossomática, efeito placebo se refere a um efeito meramente devido à
sugestão psicológica ou crença.

PLANO ALEATORIZADO SIMPLES - Experimento com dois ou mais níveis de uma


única variável; geralmente um dos níveis é a condição experimental, e o outro nível, é a
condição de controle (sem a presença da variável independente).

PLANO BIFATORIAL, INTRA-INDIVIDUAL (?) - Experimento em que se manipula duas


variáveis intra-individuais (cf. abaixo Plano intra-individual) e no qual se apresenta a cada
sujeito todos os níveis de cada uma delas (plano intragrupal = plano intra-individual).

PLANO COM UM ÚNICO SUJEITO (OU PLANO DE SUJEITO ÚNICO) - Tipo de plano
extensivamente utilizado pela escola behaviorista (cf. Behaviorismo), no qual se utiliza um
único sujeito para todas as condições de tratamento ou da experimentação. Neste tipo de
plano se supõe que o indivíduo utilizado represente satisfatoriamente todos os demais

136
indivíduos de sua espécie quando submetidos às mesmas condições experimentais (neste
caso, os dados obtidos com apenas um único sujeito podem ser generalizados para os
demais da mesma espécie).

PLANO DE TRATAMENTO POR NÍVEIS - Experimento do tipo interindividual (cf.


abaixo Plano interindividual), com duas variáveis independentes, no qual uma delas
funciona como variável emparelhante (via de regra, é uma variável "do sujeito" que serve
para equiparar os grupos); do ponto de vista da análise teórica, os efeitos da variável
emparelhante anulam-se reciprocamente, uma vez que ela está presente tanto na condição
experimental, como na condição de controle. Para que o emparellhamento tenha sentido, é
necessário que haja uma correlação significativa entre a variável dependente e a variável
emparelhante.

PLANO DE TRATAMENTO POR SUJEITOS - Experimento do tipo intra-individual (cf.


abaixo Plano intra-individual), com apenas um variável, em que cada sujeito recebe todos
os níveis dessa variável. Neste plano, a influência das variáveis do sujeito como variáveis
geradoras de confusão, são desconsideradas no momento da análise dos resultados (se
ocorrerem erros devido as variáveis dos sujeitos, é suposto que eles ocorreram em todos os
tratamentos, logo, seus efeitos se igualam quanto ao resultado final - portanto, tais erros
podem ser desconsiderados na análise final dos resultados).

PLANO DE TRATAMENTO POR TRATAMENTO (PLANO FATORIAL) - Tipo de


plano interindividual (cf. abaixo Plano interindividual), com pelo menos duas variáveis,
em que os efeitos de interação e os efeitos principais ou os simples são investigados; a
forma mais simples desse plano é o plano fatorial 2 x 2.

PLANO (DE TRATAMENTO) INTERINDIVIDUAL - Tipo de plano em que, a cada


sujeito, de cada grupo (ou amostra), só se administra uma, e apenas uma, dentre as várias
condições que fazem parte da pesquisa.

PLANO (DE TRATAMENTO) INTRA-INDIVIDUAL - Tipo de plano em que, a cada


sujeito, se administra todas as condições que fazem parte da pesquisa.

PLANO INTRA-INDIVIDUAL UM, INTERINDIVIDUAL DOIS - Plano misto com duas


variáveis interindividuais e uma intraindividual.

PLANO INTRA-INDIVIDUAL UM, INTERINDIVIDUAL UM - Plano misto com duas


variáveis independentes, sendo uma intraindividual e a outra, interindividual.

PLANO MISTO - Tipo de plano em que se administra, pelo menos, duas variáveis
independentes, sendo que uma delas, pelo menos, precisa ser uma variável do tipo intra-
individual, e pelo menos uma outra precisa ser do tipo interindividual.

PLANO TRIFATORIAL - Experimento do tipo interindividual, com três variáveis


independentes. Neste tipo de plano, as interações de ordem tripla e dupla são analisadas
antes de se proceder as análises dos efeitos principais ou dos efeitos simples (vide acima
PLANO DE TRATAMENTO POR TRATAMENTO).

137
POPULAÇÃO (ou Universo) - Conjunto de coisas, objetos, animais, indivíduos etc. que
possuem, pelo menos, uma característica em comum, podendo ou não estarem circunscritos
em uma área e a determinado tempo. Em estatística, refere-se a uma distribuição de
frequências de todos os membros de determinada classe de evento. O tamanho da
população é simbolizado pela letra "N".

POSIÇÃO ATEÓRICA (ou, menos rigidamente, POSIÇÃO SEMIATEÓRICA) - Posição


atribuída a Skinner e seus seguidores, segundo a qual, a formulação da teoria não deve ser
buscada antes da obtenção de uma boa base de dados empíricos. Esta posição está afinada
com a formulação de teorias em miniatura., favorecidas pelo método indutivo.

Positivismo - o método positivista propugna pela primazia da matéria, do empírico (daquilo


que pode ser diretamente observado, manipulado, cheirado, sentido, mensurado etc.) sobre
outras questões que, eventualmente, possam ser de interesse científico; desconsidera
questões valorativas, bem como questões teleológicas do foco principal de interesse do
cientista, e supõe os fenômenos naturais ordenados e determinados por fatores que podem
ser claramente identificados no âmbito mesmo da própria natureza. É proposto como sendo
o método científico mais adequado para se observar e analisar as partes constituintes da
realidade, de forma a enunciarem-se leis universais que relacionem esses fatos entre si
(fatos científicos).
Em sua obra Discurso sobre o espírito positivo, August Comte (1798-1857) pontuou o que
supunha distinguir o positivismo das demais filosofias: consideração apenas dos fatos
concretos (realidade); busca do conhecimento para aperfeiçoamento individual e social
(utilidade do conhecimento); abandono de toda e qualquer dúvida que não possa ser
definida claramente (busca da certeza dos fatos, expressos em leis gerais); ênfase no
conhecimento objetivo (em oposição ao conhecimento vago, impreciso, incerto) e ordenado
(organizado e sistematizado em corpora teóricos - teorias); e afirmação da relatividade do
conhecimento, por conseguinte, busca de seu aperfeiçoamento constante e,
consequentemente, ampliação do conhecimento humano.
"Tudo é relativo, e isto é a única coisa absoluta" (máxima positivista).
O positivismo pode assim ser caracterizado:
a realidade, seja de caráter físico ou social, pode ser reduzida a partes
individuais; o desafio para os positivistas é identificar as partes constituintes individuais da
realidade e explicar a forma como estas se relacionam entre si e se se relacionam;
a lógica subjacente à forma como as partes constituintes individuais da
realidade se relacionam pode ser descrita se descoberta sua ordem causal, ou seja, o que
causa e como causa o quê - para alcançar isto os cientistas precisam utilizar um método
apropriado;
o método científico que deriva do positivismo lógico é o adequado para o
desenvolvimento de um conhecimento que visa identificar e promover as leis universais
sobre o mundo; como princípio essencial deste método está a necessidade de observação
sistemática;
a observação é fundamental na medida em que há uma realidade objetiva que
pode ser observada, explicada e prevista com o auxílio da linguagem matemática, através de
procedimentos aplicados de forma sistemática;

138
todo conhecimento que não tenha por base a observação direta, empírica, não
é reconhecido como válido.
A observação deve conduzir à experimentação, e esta pode conduzir à descoberta de
regularidades (ordem e uniformidades nos fenômenos), a partir do que, então, é possível
propor leis científicas.
Observar significa ir além da aparência[1] dos fatos, buscando ajuntar dados sem
fazer aprioristicamente especulações sobre eles. Para tal é necessário distinguir
logicamente entre evidências factuais e opiniões sobre esses fatos. Observar, portanto, é
aplicar sistemática e atentamente os sentidos (ou instrumentos) a um dado objeto de
pesquisa, para dele extrair evidências que levem a certezas probabilísticas acerca desse
objeto.
Um passo seguinte neste método consiste em experimentar, em situações controladas
de observação, se o fato se materializa (repete) quando manipuladas certas condições
antecedentes[2] a sua ocorrência.
Progressos na ciência só ocorrem se for possível provar que a ocorrência do fato
observado se deve a ocorrência ou ausência do fato sistematicamente manipulado, quando
for, ao mesmo tempo, impossível atribuir, lógica e empiricamente, a sua ocorrência a
possíveis outros fatos não manipulados, mas eventualmente presentes. Se for provada uma
relação de tal tipo, esta será tida como lei. A lei descreve uma relação causal entre fatos ou
eventos.
As leis assim obtidas fornecem as bases para a construção de teorias, as quais
expressam, de forma mais orgânica, sistemática e geral, as relações funcionais entre os fatos
experimentados, não meramente co-relações entre eles.
A teoria é mais ampla que a lei, pois esta apenas declara a existência de um padrão
estável em eventos e coisas; enquanto aquela (a teoria) indica o mecanismo responsável
por esse padrão. As leis expressam enunciados de uma classe isolada de fatos; as teorias
caracterizam-se pela possibilidade de explicar em um sistema cada vez mais amplo e
coerente as uniformidades e regularidades descritas e corroboradas em leis, e propiciar a
investigação dessas uniformidades e regularidades, relacionando-as de forma que possam
ser continuamente testadas e sempre que necessário corrigidas convenientemente. A partir

139
da reformulação e aplicação da teoria, espera-se que passe a explicar cada vez mais classes
de uniformidades e regularidades.
Skinner e Bacon propõem o método indutivo como o mais apropriado para servir de
guia para a construção das teorias cientificas. Tal método leva à construção da teoria a
partir de observações (dados) particulares sistematicamente coligidas, obtidas no contexto
de experiências controladas e empiricamente conduzidas pelo cientista. Desse modo, as
teorias seriam generalizações dessas observações. Contudo, só se pode alcançar o nível de
generalização se a experiência for realizada em um contexto de rígido controle dos passos e
eventos presentes no momento da experiência ou imediatamente anteriores a ela.
O positivismo, enquanto escola filosófica, deu grande suporte ao empirismo, e este
contribuiu decisivamente com aquele, formando-se assim a base teórica do método
positivista. No caso da ciência psicológica, John Locke (1632-1704) inaugurou o
movimento conhecido como "Empirismo inglês", o qual serviu como base filosófica para o
nascimento da Psicologia experimental. Segundo Locke, a mente funciona por associações de
ideias simples - ideias simples se associam e formam ideias complexas -. Todas as ideias
provêm da experiência; a mente seria como que uma folha em branco.
John B. Watson, inspirado nas ideias de Locke e fundando-se na filosofia determinista
de James, no funcionalismo de John Dewey, no método experimental de Yerkes e na teoria
do condicionamento reflexo de Ivan P. Pavlov, criou o behaviorismo como escola
psicológica, a qual propôs o estatuto de ciência para a Psicologia, advogando um método que
tinha como principal ponto a ênfase sobre o comportamento observável dos organismos
(humanos e não-humanos). Este método permitiu o desenvolvimento em ampla escala das
pesquisas científicas no âmbito da psicologia, vale dizer, no âmbito das questões que
envolvem o comportamento. Hoje, diz-se que o Behaviorismo é mecanicista, porque
advoga que as ações e reações dos animais são causadas por estímulos específicos
provindos de seus ambientes imediatos (físico-químico, telúrico, social, cultural) – o que
põe em relevo as relações dos organismos com os estímulos ambientais, haja vista o fato de
nenhum comportamento ocorrer no vazio, fora de um ambiente qualquer. Tal termo,
entrementes, era usado quando se fazia referência aos filósofos pós-cartesianos.

140
A não causalidade do comportamento o pressupõe uma entidade com existência
própria, sem condicionantes externos ou internos. O comportamento não pode ser
concomitantemente causado e não-causado. Ao longo do tempo a disputa tem sido uma
tentativa de estabelecer que fatores o explicam: causado por fatores internos – mentalistas
– ou por fatores externos – ambientais. Enfim, ou é causado por ambos os tipos de fatores,
ou por um ou pelo outro. O senso comum tende a realçar os fatores ditos "internos"; o
behaviorismo realça os fatores ditos "externos", sem, necessariamente, supor uma relação
mecânica entre eles, antes, funcional: os estímulos apenas informam ao organismo
(contextualizam) a probabilidade de certos eventos ocorrem em presença de certos
comportamentos (em outras palavras: indicam a probabilidade de certos comportamentos,
se emitidos, serem punidos ou reforçados e em que medida o serão).
Portanto, pesquisa, em Psicologia, é uma forma de tentar encontrar respostas a
questões que envolvam o comportamento dos organismos enquanto um fenômeno que pode
e deve ser compreendido como sendo causado, determinado. Não podemos pensar a
pesquisa sobre o comportamento como algo fora do alcance da ciência. Pensar em ciência é
pensar em pesquisas; a pesquisa mesmo deve ser vista como a forma superior de se fazer
ciência, embora não necessariamente nem exclusivamente. A ciência pode e deve ser usada
para ajudar na compreensão dessa parte, tanto intrigante quanto desconhecida de nós
mesmos: nosso comportamento. Nosso comportamento não ocorre no vazio, no nada;
nosso comportamento ocorre em ambientes específicos e, em grande parte, deles depende.
Nosso comportamento é o resultado da relação entre nossos corpos (veículos desse
comportamento) e os ambientes imediatos onde nos encontramos. Focando nas relações
entre ambiente e comportamento podemos visualizar modos de experimentar e fazer
pesquisas.

[1] Karl Max já dizia: se a aparência fosse igual a essência, não haveria necessidade da
Ciência …
[2] A Psicologia comportamentalista deu um passo à frente neste modelo causal ao propor
que certos eventos, ocorridos após a emissão de certos comportamentos, têm a função de
aumentar a probabilidade de comportamentos semelhantes ocorrerem no futuro.

Pós-modernismo - movimento estabelecido à partir de novas concepções na arquitetura e


computação. Iniciou-se em 1950, quando historiadores convencionaram o fim do

141
modernismo, caracterizando-o por uma série de ressignificações. É um movimento que
desfaz, relativiza “princípios, regras, valores, práticas, realidades. É um ecletismo, isto é,
mistura várias tendências e estilos sob o mesmo nome. Não tem unidade, é aberto, plural e
muda de aspecto se passarmos da tecnociência para as artes plásticas, da sociedade para a
filosofia” (Santos, 1988, p. 18).
Ainda de acordo com Santos, dois eixos filosóficos são presentes no movimento pós-
moderno: 1) "desconsidera" certos princípios e concepções do pensamento ocidental, como
razão; 2) aborda temas antes considerados “marginais" em filosofia, como desejo, loucura,
linguagem.
A flexibilidade (cf. Feyerabend no tópico "Concepções de Ciência") como critério pós-
moderno de ciência tem como consequência negativa a quase impossibilidade de um elo
entre os diversos discursos (teorizações e teorias), pois há contrastação, quase nunca
integração, dos vários resultados das pesquisas realizadas a partir de cada método,
resultando na fragmentação e fragilidade das soluções (elas mesmas provisórias) que se
originam a partir das várias abordagens.
A integração pode ser intentada através da interdisciplinaridade − para a qual ainda não
há um paradigma testado e efetivo, sendo até o momento apenas uma boa intenção −, pelo
uso de diferentes metodologias em pesquisas que permitam, por conta dos problemas sob
investigação, tal integração, a qual cabe a diferentes pesquisadores com diferentes
formações metodológicas ou a pesquisador com formação abrangente, o que foge ao que
temos hoje como modelo formativo/educativo.

Precisão amostral: é a proximidade entre os valores das estatísticas obtidas de várias


amostras de mesmo tamanho e da mesma população.

Prevalência: pesquisa epidemiológica de ocorrência de casos de determinada afecção


constatados em um determinado momento. As pesquisas relativas à prevalência são do tipo
transversal.

Probabilidade - A probabilidade de um evento é a possibilidade de que ele ocorra,


possibilidade essa expressa numa escala de 0 a 1; zero (0) representa a possibilidade nula
de que ocorra o evento (certeza de que ele não ocorrerá), e 1 significa a certeza de que o
evento ocorrerá. É uma escala de mensuração usada para descrever a probabilidade de
ocorrência de um valor específico (evento) de uma variável aleatória.

PSICOLOGISMO - Atitude pela qual todos os fenômenos são explicados através da


Psicologia ou de seus princípios.

QUADRADO LATINO - Processo que visa distribuir os efeitos de transferência nos planos
intra-individuais com mais de quatro tratamentos. As sequências dos tratamentos são
escolhidas de tal modo que passam a representar todas as possíveis combinações de
tratamentos: cada tratamento ocupa uma localização diferente em cada sequência, e ocorre
apenas uma única vez em cada posição ordinal nas quatro combinações de sequências.

142
RACIONALISMO - Escola filosófica que sustenta que todo efeito tem uma causa e que
todas as sequências causais estão localizadas no âmbito mesmo da natureza, a qual só pode
ser analisada e compreendida pela razão.

RBD ("Randomized blocks designs" ou Plano de blocos aleatorizados) - neste tipo de


plano, faz-se com que os grupos (amostras) que receberão os tratamentos (VIs) sejam o
mais possível idênticos uns aos outros. Há duas maneiras de se conseguir tal identidade:
1) fazendo com que cada grupo tenha, por assim dizer, indivíduos com as mesmas
características julgadas relevantes para a pesquisa a ser realizada - consegue-se isso,
emparelhando os grupos em relação aquelas características dos sujeitos (os exemplos
clássicos são: quadrado latino e quadrado greco-latino) -; 2) fazendo com que todos os
indivíduos participem de todos os tratamentos (neste caso, seria aplicado aleatoriamente a
cada indivíduo um tratamento por vez, ou, de modo diverso, se destinaria/aplicaria
aleatoriamente um tratamento após o outro a todos os indivíduos). Entrementes, este
segundo tipo de plano só pode ser usado quando se tem certeza de que o efeito ou
influência do tratamento antecedente não se "transfere" para o tratamento subsequente; tal
é o caso quando a pesquisa usa como variável dependente uma medida de resposta que
envolve aprendizagem. Havendo suspeita de que tal pode acontecer, podemos lançar mão
da técnica de contrapesar (contrabalancear) os possíveis efeitos de transferência dos
tratamentos. Por exemplo, subdividindo o grupo (sub-grupos A e B) e aplicando ao sub-
grupo A, consecutivamente, os dois tratamentos e, após, aplicando à segunda metade (sub-
grupo B), primeiro o tratamento que foi aplicado por último à primeira metade (sub-grupo
A), e em seguida o tratamento que foi aplicado por primeiro. O modelo matemático a ele
subjacente é o seguinte: Xij = j i + Eij , onde Xi j é o escore obtido pelo indivíduo i
no tratamento j.
indivíduo foi retirado, mais o efeito específico ( Tj ) do tratamento ( j ) que lhe foi aplicado,
mais o efeito sistemático próprio do bloco i, mais o efeito residual de um componente não-
sistemático, chamado efeito devido ao erro de medição ( E i j ). O modelo, ainda, pressupõe
que E i j independa de Tj e de i. Por conseguinte, E i j = X i j - j+ i ).

RELATIVISMO - Princípio segundo o qual tudo pode ser verdade, contudo, verdade
relativa.

SENSIBILIDADE DA MEDIDA DE RESPOSTA - Representa o grau em que uma dada


resposta reflete os efeitos de uma variável independente (a medida de resposta, em uma
dada experiência, é capaz de refletir todas as respostas de uma dado sujeito, sob as mesma
condições experimentais, em todos os momentos dessa experiência).

SIGNIFICÂNCIA ESTATÍSTICA - Está relacionada a probabilidade de cometermos um


erro do tipo I, ou seja, ao valor p obtido a partir da aplicação de um teste estatístico (teste de
hipótese). Diz respeito à diferença(s) entre médias de amostras que têm probabilidade(s)
pequenas (baixas, em relação a um certo nível de de significância alfa [ ) de surgir por
acaso.

143
SISTEMA - Um sistema é uma forma geral de organização e interpretação dos dados e
teorias de um objeto de investigação particular, com pressupostos (postulados), definições e
disposições metodológicas especiais.

SUJEITO - Aquele que participa (homem ou outro animal qualquer) da experimentação na


condição de sujeito da mesma; ao sujeito são aplicadas todas as condições experimentais
(planejamento intragrupal), ou uma das condições experimentais (planejamento
intergrupal).

Teleologia - Estudo dos fins últimos: diz-se que algo é teleológico quando enfatiza ou está
relacionado a finalidade intrínseca das relações entre os eventos; ou ainda, quando se
pretende explicar a ocorrência dos fenômenos apelando-se para seus fins próprios ou
intrínsecos (não confundir com Teologia = estudo do Divino ou das Verdades reveladas).
Para mais detalhes sobre a crença do ordenamento teleológico do mundo, cf. o livro A
demolição do homem - Crítica à falsa religião do progresso, de Konrad Lorenz, Ed.
Brasiliense, 1986.

TEORIA (cf. teorização) - Qualquer explicação mais ou menos consistente e integrada


acerca da realidade (diferente de teoria cientifica). Quando essa teoria tem uma base
empírica bem estabelecida, através de leis e postulados demonstrados, diz-se que é uma
teoria científica.

TEORIA CIENTÍFICA - Enunciado ou conjunto que relaciona entre sí, por meio de
conceitos abstratos, processos ou princípios, grande número de leis empíricas simples e
suas variáveis associadas, fornecendo uma descrição unificada de uma série limitada de
fenômenos, no intuito de lograr a explicação e a previsão. A teoria exerce duas funções
principais: (1) integra leis, as quais, de outro modo, permaneceriam isoladas, contribuindo
para a expansão do conhecimento científico; (2) propicia novas hipóteses testáveis.

TEORIA DE ORDEM SUPERIOR - Integração de grande número de leis e variáveis


simples, através da utilização de conceitos abstratos, processos e princípios.

TEORIAS EM MINIATURA - Teorias em pequena escala; representam uma conciliação


entre uma teoria de ordem superior e a posição semiateórica. Essas teorias são
caracterizadas pela íntima fidelidade aos dados, pelo emprego mínimo de conceitos
abstratos e por uma tendência a restringir explicações à áreas relativamente circunscritas de
problemas.

TEORIZAÇÃO (OU TEORIA SEM LEIS) - Qualquer tentativa ou forma de explicar e


compreender os fenômenos, ou ainda, tipo particular de "visão" e interpretação da
realidade.

TEORIZAÇÃO DEDUTIVA - Método de elaboração de teoria em que o movimento lógico


vai do nível geral de formulação da teoria para o nível particular da pesquisa em sí.

144
TEORIZAÇÃO INDUTIVA - Método de elaboração de teoria em que o movimento lógico
vai da experiência específica para um enunciado mais geral.

TESTE BICAUDAL OU BILATERAL - Modo de proceder na análise de um teste


estatístico paramétrico qualquer; quando se considera, na análise do seu resultado, os dois
lados da distribuição de frequências entre as médias, ou seja, quando se considera a
possibilidade de um dado resultado estar abaixo (ser negativo) ou acima (ser positivo) da
média da distribuição de frequências médias.

145
146
Teste de Hipótese - É uma afirmação a respeito da contribuição de uma variável aleatória
ao resultado observado em uma experimentação qualquer. A prova ou teste de uma
hipótese estatística é uma regra que, obtidos os valores amostrais, conduz a uma decisão de
aceitar ou rejeitar a hipótese considerada; um exemplo é o teste t, que é aplicado para
verificar se as diferenças observada entre as amostras é significativa (ou não, por exemplo:
a diferença observada entre duas médias de amostras tem chance maior do que 0,05 de ter
ocorrido por puro acaso, logo, não é uma diferença estatisticamente significativa).
TESTE F - Tipo de teste estatístico paramétrico, usado para se comparar mais de duas
médias de amostras, em busca de diferenças significativas ou com baixas probabilidades de
terem ocorrido por mero acaso. O teste F é um índice entre a variabilidade ou variância
intergrupais (variabilidade devida às variáveis experimentais ou tratamentos) e a variância
ou variação intragrupais (variância devida a possíveis fatores aleatórios ou erros de
amostragem). Sua fórmula, para análise de variância simples é:

F=

TESTE MONOCAUDAL OU UNILATERAL (cf. acima teste bicaudal) - Tipo de teste


estatístico em que se avalia apenas uma das tendências de um dado resultado experimental
[ ]. A análise considera apenas um dos lados (ou cauda) da curva de
distribuição normal.
TESTE t - Tipo de teste estatístico paramétrico, usado para se comparar duas médias de
amostras (via de regra, grupo experimental e grupo de controle), em busca de diferença
significativa ou com baixa probabilidade de ter ocorrido por mero acaso.

Sua fórmula para medidas independentes (cf. plano do tipo CRD) é:

147
para medidas correlatas ou repetidas (cf. plano do tipo RBD) é:

Testes Estatísticos - Um teste estatístico é simplesmente um instrumento para calcular a


probabilidade de que os resultados observados em uma experiência sejam devidos à
flutuações aleatórias entre os grupos.

Testes Estatísticos Paramétricos - diz-se daqueles testes que têm como suposição básica
inerente às suas concepções (e por conseguinte, às suas corretas utilizações, evitando-se
erros analíticos) a distribuição normal (mesmo que curva normal) de frequências de
ocorrência dos indivíduos ou coisas que fazem parte da população com a qual o teste será
utilizado. Propriedade relevante de um teste estatístico é seu Poder (condição que lhe
permite indicar a aceitação de uma H0 plenamente sustentável - para uma representação
gráfica vide erro do tipo I e tipo II).
TRANSFERÊNCIA (DE EFEITO DE TRATAMENTO) - Influência indesejável de um
tratamento sobre o resultado de um próximo tratamento, seguinte ao primeiro, quando se
usa um plano intragrupal (planejamento intraindividual).

TRATAMENTO - Refere-se, via de regra, à aplicação ou apresentação da variável


independente ao(s) sujeito(s) experimental(is) no contexto de um experimento formal.

VALIDADE DA MEDIDA DE RESPOSTA - Representa o grau em que uma dada resposta


reflete efetivamente os efeitos de uma variável independente (a medida de resposta, em uma
dada experiência, reflete, realmente, o que se pretende que ela meça nessa experiência).

Variância (= variação) - Pode ser definida como a soma ou somatória dos quadrados dos
desvios em torno da média, dividido pelo número de dados ou de observações (n) na
amostra menos 1; os estatísticos chamam o valor "n - 1" de graus de liberdade. Eis a

fórmula: . Desenvolvendo algebricamente a fórmula da variância,

obtém-se: . Como ela mede a dispersão dos dados em torno da


média, pode ser entendida como a média quadrática dos desvios em torno da média (vide
1ª equação); contudo, só pode assumir valores positivos.

VARIÁVEL - Alguma particularidade do mundo, especificada, ao menos, por dois valores


escalares que se excluem mutuamente; qualquer característica, estímulo, atributo ou
particularidade do mundo que seja passível de ser manipulada(o) ou controlado(a),
mensurada(o) ou observado(a) numa dada experiência.

148
VARIÁVEL AMBIENTAL - Variável situacional que envolve os aspectos do ambiente
capazes de produzir mudanças no desempenho ou comportamento de um dado organismo.

VARIÁVEL AMBIENTAL GERADORA DE CONFUSÃO - Variável situacional que


envolve os aspectos do ambiente capazes de produzir mudanças não-desejadas no
desempenho ou comportamento de um dado organismo, por causa de sua covariação com a
variável independente.

VARIÁVEL DE TAREFA - Variável situacional que envolve, explicitamente, e tão


somente, a variável a ser manipulada (VI).

VARIÁVEL DE TAREFA GERADORA DE CONFUSÃO - Variável situacional


relacionada a qualquer particularidade da tarefa - incluindo sua construção e o método de
apresentação - que influa no resultado da experiência, desde que tal particularidade não seja
uma parte explícita da variável manipulada intencionalmente.

VARIÁVEL DE ARRANJO GERADORA DE CONFUSÃO - Refere-se às variáveis


relacionadas com a ordenação e o encadeamento lógico de eventos que podem obscurecer a
interpretação dos possíveis efeitos da variável independente sobre a variável dependente.

VARIÁVEL DEPENDENTE OU VARIÁVEL DE RESPOSTA (VD = consequência) -


Medida de resposta ou de comportamento que reflete os efeitos da variável independente.

VARIÁVEL DE INSTRUÇÃO GERADORA DE CONFUSÃO - Variável situacional que


envolve os aspectos das instruções que induzem a erro o sujeito experimental, ou
influenciam seu desempenho de modo diferente do modo produzido pela influência da
variável independente.

VARIÁVEL DO EXPERIMENTADOR GERADORA DE CONFUSÃO - Variável


situacional que envolve as dicas emitidas pelo experimentador e detectadas pelos sujeitos,
as quais, subsequentemente, influem no desempenho destes, consciente ou
inconscientemente.

VARIÁVEL DO SUJEITO - Variável "independente" que reflete algum aspecto das


experiências anteriores do sujeito; as variáveis do sujeito não podem ser manipuladas com
facilidade e limitam-se habitualmente à estratégia correlacional (R-R).

VARIÁVEL DO SUJEITO GERADORA DE CONFUSÃO - Refere-se às muitas


diferenças individuais entre as pessoas (ou mesmo organismos), as quais podem obscurecer
os efeitos da variável independente sobre a variável dependente.

VARIÁVEL GERADORA DE CONFUSÃO OU VARIÁVEL ESTRANHA - Tais


variáveis estão relacionadas à todas as situações ou condições potencialmente capazes de
gerar confusão durante a fase de interpretação dos resultados experimentais, uma vez que
alguma coisa não foi, ou não pôde ser, controlada, ou alguma outra condição extra-
experimental variou concomitantemente à variação da VI que estava efetivamente sendo
manipulada.

149
Em tese, uma dada VE pode interagir com a VI efetivamente manipulada e produzir efeitos
distintos em relação a cada nível desta última.

VARIÁVEL INDEPENDENTE, VARIÁVEL DE TRATAMENTO OU VARIÁVEL


EXPERIMENTAL (VI = causa) - A variável que deve ser manipulada em uma experiência
e que deve produzir algum tipo de efeito sobre a variável dependente. Há três tipos de
variáveis independentes: 1) situacional, 2) ["dependente"] do sujeito, e 3) organísmica.

VARIÁVEIS SITUACIONAIS - Variáveis independentes que envolvem a manipulação de


algum aspecto do meio físico, da tarefa dada ao sujeito ou da situação social.

VIÉS: tendência proposital ou não na escolha dos membros ou na composição de


determinada amostra; em outras circunstâncias, podemos dizer que o viés se constitui em
erro sistemático que influi de maneira indesejável no resultado de alguma pesquisa. Nos
textos de língua inglesa é comum encontrarmos o termo "bias" (por ex.: Bias can come in
many forms ...), o qual tem o mesmo significado que a palavra "viés".
Um viés cognitivo resulta da tendência em reproduzir erros sistemáticos em certas
circunstâncias, baseados sobre fatores cognitivos antes que em evidências empíricas.
Segundo BUTTERFIELD (1931: v), é comum historiadores escreverem em apoio a este ou
a aquele grupo religioso, elogiarem certas revoluções desde que tenham sido bem
sucedidas, escreverem a história como ramificação do presente, senão como sua
glorificação - eles, simplesmente, se convencem de que tal é porque assim lhes parece,
apenas colecionando/coletando supostas evidências não comprovadas (e, em muitos casos,
não comprováveis).

150
Referências citadas:

1. BERQUÓ, E.S. , SOUZA, J.M.P. & GOTLIEB, S.L.D. Bioestatística. 2a. ed. rev.
. São Paulo: E.P.U. , 1981, 349 P.
2. COCHRAN, W.S. Técnicas de Amostragem. Rio de Janeiro: Ed. Fundo de
Cultura/USAID. 1965. 555 p.
3. CURI, P.R. Metodologia e Análise da Pesquisa em Ciências Biológicas.
Botucatu::Gráfica e Editora Tipomic, 1997.261 p.
4. MATTAR, F.N. Pesquisa de Marketing: Edição compacta. São Paulo: Atlas.
1996. 271 p.
6. PADOVANI, C.R. Estatística na Metodologia da Investigação Científica.
Botucatu: UNESP, Inst. de Biociências, Depto. de Bioestatística. 1995. 22 p.
7. PEREIRA, M.G. Epidemiologia Teoria e Prática. Rio de Janeiro: Guanabara
Koogan. 1995.583p
8. ROUQUARYOL, M.Z. Epidemiologia & Saúde. 4a. ed. Rio de Janeiro MEDSI.
1993. 527 p.
9. VAUGHAN, J.P. & MORROW, R.H. Epidemiologia para os Municípios :
manual para gerenciamento dos distritos sanitários. 2a. ed. São Paulo: Ed. HUCITEC.
1997. 180 P.
10. VIEIRA. S. Introdução á Bioestatística. 3a. ed. rev. ampli. Rio de Janeiro:
Campus. 1986. 195 p.
11. WONNACOTT, R.J. & WONNACOTT T.H. Fundamentos de Estatística. Rio
de Janeiro: Livros Técnicos e Científicos Editora S.A. 1985. 355 p.

151