Você está na página 1de 25

Tipos de dados

e
blocagem de experimentos

Prof. Antonio Gomes de Mattos Neto - 2022


Dados qualitativos ou quantitativos?

Algumas infecções virais contraídas durante a gravidez – especialmente cedo no primeiro trimestre –
podem causar má formação do feto.

Dentre essas infecções, a mais perigosa é a rubéola.

A tabela abaixo sumariza a história de 578 gravidezes afetadas por rubéola tanto cedo (no primeiro
trimestre) ou tarde (nos segundo ou terceiro trimestres).

Quando a infecção ocorreu

Cedo Tarde

Nº de recém-nascidos normais 59 27

Nº de recém-nascidos com má formação 143 349

% de recém-nascidos com má formação 29.2 7.2

Fonte: Fishbein, M. Birth Defects. Filadélfia: Lippincott, 1962, p.177.

Prof. Antonio Gomes de Mattos Neto - 2022


Perguntas sobre dados

1. Cite o primeiro nome de sua avó materna.

2. Qual seu sexo: M □ ou F□

3. Indique o quanto você gostou das olimpíadas do Japão (de 2020, realizada em 2021):
□ 0. Não assisti. □ 1. Não gostei. □ 2. Mais ou menos. □ 3. Muito. □ 4. Adorei.

4. A que horas você foi e a que horas você voltou da festa de aniversário (a última)?

5. Em que quilômetro da Rodovia Dutra estão São José dos Campos, Taubaté e Guaratinguetá?

6. Quantos litros de refrigerantes você bebeu no ano passado? Lembre que um copo tipo “americano” tem
aproximadamente 0.2 litros (200 ml) e uma latinha 0.35 litros (350 ml). Faça a conta por semana e lembre
que um ano tem aproximadamente 52 semanas.

7. Qual o tamanho (em cm) de sua mão esquerda? Abra a mão e meça da ponta do polegar até a ponta do
seu dedo mindinho. Arredondar para o “0.5 cm” mais próximo.
Prof. Antonio Gomes de Mattos Neto - 2022
Perguntas sobre dados

1. NOME DAS PESSOAS


Há várias categorias (níveis, classes, grupos) para os nomes das pessoas. Cada nome é uma categoria. Não
há uma ordem entre esses níveis, como podemos ter entre dor fraca, média ou forte, gostei pouco, mais ou
menos e muito, defeito leve, médio ou grave). Para estudar os nomes e suas frequências, você precisa
acordar com seus colegas pesquisadores um dicionário de nomes, que varia com o tempo, pois nomes
surgem e desaparecem.

2. SEXO
Somos mamíferos (Reino: Animalia; Filo: Chordata; Subfilo: Vertebrata; Classe: Mammalia; Ordem: Primata
Subordem: Antropoidea; Família: Hominidea; Gênero: Homo; Espécie: Homo sapiens; Subespécie: Homo
sapiens sapiens) e apresentamos dimorfismo sexual, assim como outras espécies animais. No caso dos
humanos, os machos da espécie são ligeiramente maiores e mais fortes que as fêmeas, mas há espécies em
que acontece o contrário, ou onde o dimorfismo sexual é acentuado e muitas outras onde é inexistente.

3. GOSTO
Apesar de haver uma ordem, não sabemos medir a distância (não há uma escala quantitativa para a
distância) entre cada nível do gosto (e outras variáveis ordinais). Apenas sabemos que um é maior ou menor
que outro, em alguma ordem.
Prof. Antonio Gomes de Mattos Neto - 2022
Perguntas sobre dados

4. HORAS
Conseguimos medir o intervalo, mas não a razão entre as horas. Por exemplo, foi às 18 horas e voltou às 21
horas, ou foi às 20 horas e voltou às 23 horas.

5. COORDENADAS ESPACIAIS
São José dos Campos fica no Km 145, Taubaté no Km 105 e Guaratinguetá no Km 60. Essas são marcas ou
localizações em uma mapa. Especificamente, em uma rodovia. Se alguém está em Taubaté e outra pessoas
em Guaratinguetá, podemos medir o intervalo de distância entre as duas pessoas.

6. LITROS
Aqui não só intervalos são possíveis de serem medidos, mas também a razão entre as quantidades bebidas.
Há um zero natural para essa escala, ou zero, “bebeu zero litros”. Se alguém bebeu 10 litros e outra pessoa
100 litros, podermos dizer que a segunda pessoas bebeu 10 vezes mais refrigerantes que a primeira.

7. TAMANHO (COMPRIMENTO)
O mesmo se aplica aqui. Além de intervalos, podemos medir a razão entre os tamanhos de duas mãos.3

Prof. Antonio Gomes de Mattos Neto - 2022


Tipos de dados

Qualitativos
Nominais (categorias onde uma ordenação não faz sentido)
Ordinais (categorias que podem ter uma ordem, mas não há como medir distâncias
entre elas; ordenação subjetiva)

Quantitativos
Intervalos (não há um zero natural, ou um menor valor possível, apenas diferenças
fazem sentido; razões não fazem sentido)
Razões (faz sentido falar 2 vezes maior, 10% maior, comparar um tamanho com
outro através da sua razão)

Prof. Antonio Gomes de Mattos Neto - 2022


RESPOSTAS
Nome da avó → Qualitativo, nominal
Sexo M ou F → Qualitativo, nominal
Quanto gostou das olimpíadas → Qualitativo, ordinal
Hora que foi e voltou do aniversário → Quantitativo, intervalo
Posição na Fernão Dias → Quantitativo, intervalo
Litros de refrigerante → Quantitativo, razão
Tamanho das mãos → Quantitativo, razão

Prof. Antonio Gomes de Mattos Neto - 2022


Um forma comum de classificação dos tipos de dados
(quantitativos discretos?)

Qualitativo Quantitativo

Nominal Ordinal Discreto Contínuo

Profissão Escolaridade Altura


Nº filhos
Sexo Estágio da Peso
Nº acessos
Religião doença Salário
Nº casos
Cores Classe social Concentração
Nº cesarianas
Doenças Preferência Temperatura

Prof. Antonio Gomes de Mattos Neto - 2022


Dados quantitativos ou qualitativos

Dados quantitativos são coisas que a gente consegue medir e dados qualitativos são coisas que a gente consegue
contar.

Dados Quantitativos: Coisas que a gente mede


(Variáveis)
Peso, distância, tempo
Tamanho, área, volume, temperatura
Etc., etc., ...

Dados Qualitativos: Coisas que a gente conta


(Atributos)
(Dados Categóricos) Nº ou percentual de um determinado tipo de item em uma
população ou amostra (defeitos, sexo, características, etc.)

Nº ou percentual de um determinado tipo de item depois que


fazemos uma ordenação e agrupamento deles

Exemplo: Defeitos leves = 1, médios = 5 e graves = 10


Prof. Antonio Gomes de Mattos Neto - 2022
De volta ao exemplo anterior: Dados quantitativos ou qualitativos?

Algumas infecções virais contraídas durante a gravidez – especialmente cedo no primeiro trimestre – podem
causar má formação do feto.

Dentre essas infecções, a mais perigosa é a rubéola.

A tabela abaixo sumariza a história de 578 gravidezes afetadas por rubéola tanto cedo (no primeiro trimestre)
ou tarde (nos segundo ou terceiro trimestres).

Quando a infecção ocorreu

Cedo Tarde

Nº de recém-nascidos normais 59 27

Nº de recém-nascidos com má formação 143 349

% de recém-nascidos com má formação 29.2 7.2

Prof. Antonio Gomes de Mattos Neto - 2022


De volta ao exemplo anterior: Dados quantitativos ou qualitativos?

Apesar de você só ver números na tabela do slide anterior, esses dados não são quantitativos.

O que vemos nesta tabela é um sumário dos dados qualitativos, ou seja, uma contagem das frequências dos
resultados qualitativos! São duas variáveis qualitativas nominais binárias: INFECÇÃO (cedo ou tarde), MÁ
FORMAÇÃO (sim ou não).

Originalmente esses dados são oriundos de registros como abaixo:

Paciente Nº Nome Infecção Recém-nascido

1 ML Cedo Má formação

2 JG Tarde Normal

3 DF Cedo Normal

... ... ... ...

578 CW Cedo Má formação

Prof. Antonio Gomes de Mattos Neto - 2022


Fatores e níveis de fatores

FATORES Variáveis quantitativas ou qualitativas às quais podemos atribuir diversos níveis para o
estudo de observação ou experimento.

EXEMPLO Estudo do efeito do hábito de fumar na performance de atletas.


Quatro grupos de seis indivíduos foram submetidos a uma seção de exercícios.

Depois de 3 minutos de descanso, foram medidos os batimentos cardíacos.

Neste estudo temos 1 único fator (fumar), dividido em 4 níveis:

não fumar
fumar casualmente
fumar regularmente
fumar intensamente

Prof. Antonio Gomes de Mattos Neto - 2022


1 fator e 4 níveis

FUMANTES Não Casuais Regulares Intensos

69 55 66 91

52 60 81 72

71 78 70 81

58 58 77 67

59 62 57 95

65 66 79 84

MÉDIAS 62.3 63.2 71.7 81.7

FUMANTE Fator qualitativo (atributo, dado categórico).


NÍVEIS Quatro níveis (medidos com respeito a frequência de cigarros).

Prof. Antonio Gomes de Mattos Neto - 2022


Vários fatores, níveis diversos para cada um deles

O senso comum nos diz que efeitos danosos do cigarro podem variar conforme o SEXO ou a IDADE, e dessa
forma facilmente identificamos (ou definimos) outros fatores que podem ser considerados no estudo:

FUMANTE (4 níveis), SEXO (2 níveis), IDADE (3 níveis)

FUMANTES Não Casuais Regulares Intensos

M F M F M F M F

18-34 ... ... ... ... ... ... ... ...

Idade 35-64 ... ... ... ... ... ... ... ...

65+ ... ... ... ... ... ... ... ...

Prof. Antonio Gomes de Mattos Neto - 2022


Ronald Aylmer Fisher

Ronald Aylmer Fisher (17/02/1890 – 29/07/1962) foi


um matemático e estatístio inglês.

Considerado um gênio que – praticamente sozinho –


fundou as bases da estatística moderna. Entre suas
contribuições:

Princípio da Máxima Verossimilhança


Análise de Variância (ANOVA)
Planejamento de Experimentos

Trabalhou na Rothamsted Experimental Station de


1919 a 1933, onde desenvolveu sua abordagem para
planejamento de experimentos.
Fisher em 1913

Fonte: https://en.wikipedia.org/wiki/Ronald_Fisher (acesso em 15/09/2020)

Prof. Antonio Gomes de Mattos Neto - 2022


Blocos e blocagem randomizada

A A B

Tratamento A A B A
blocagem
randomizada B A B

A B A

Tratamento B B B A

B A B

Prof. Antonio Gomes de Mattos Neto - 2022


Blocos e blocagem

PROBLEMA Frequentemente não conseguimos conduzir um experimento ou um estudo observacional


mantendo condições homogêneas para as observações.

Isto que afeta a homogeneidade são variáveis que poderiam ser designadas de fatores.

Mas não as conhecemos ou não temos um real interesse nelas, a menos do interesse de
que não interfiram nas nossas conclusões.

SOLUÇÃO Para resolver isto, o estatístico aplicado recorre ao uso de blocos ou blocagem do estudo
ou experimento.

FATORES
USO DE BLOCOS OU
DESCONHECIDOS QUE
BLOCAGEM NO
PODEM AFETAR OS
PANEJAMENTO DO
RESULTADOS DO
EXPERIMENTO
EXPERIMENTO

Prof. Antonio Gomes de Mattos Neto - 2022


Blocos e blocagem

EXEMPLO Por exemplo, considere um experimento de controle de roedores realizado por um


período de 10 semanas.

Para este experimento definiu-se 1 único fator, o sabor do veneno, e foram testados
quatro diferentes sabores (4 níveis):

puro
baunilha
bife grelhado
pão

800 iscas de cada sabor (totalizando 3200 iscas) foram colocadas próximas a locais de
coleta de lixo, por duas semanas, após o que os seus percentuais de aceitação pelos
roedores foram registrados.

Nas próximas duas semanas este mesmo protocolo foi seguido, e assim sucessivamente,
por um total de 5 períodos de 2 semanas.
Prof. Antonio Gomes de Mattos Neto - 2022
Blocos e blocagem

SABOR DA ISCA (4 níveis), BLOCOS (5 grupos homogêneos de observações)

OBSERVAÇÕES Nº Puro Baunilha Bife Grelhado Pão

1 13.8 11.7 14.0 12.6

2 12.9 16.7 15.5 13.8

3 25.9 29.6 27.8 25.0

4 18.0 23.1 23.0 16.9

5 15.2 20.2 19.0 13.7

BLOCOS A homogeneidade das observações é uma homogeneidade interna a cada bloco de observações. Veja que o
bloco como um todo pode estar sofrendo efeito de fatores desconhecidos, mas todos SABORES sofrem do
mesmo efeito.

Prof. Antonio Gomes de Mattos Neto - 2022


Blocos e blocagem

BLOCOS Claramente, cada conjunto de observações criou um ambiente único de experimentação,


homogêneo.

FATORES As iscas foram colocadas em diferentes localidades.


DESCONHECIDOS As condições climáticas não eram as mesmas.
A disponibilidade de fontes de alimentos para os roedores possivelmente variaram a cada período e
cada localidade, e assim por diante.

BLOCOS 1, 2 e 3 Por estas razões, ou por outras razões desconhecidas e não controladas, os percentuais do BLOCO 3
são substancialmente superiores aquelas dos BLOCOS 1 e 2.

BLOCAGEM Mas o experimentalista não está interessado nas condições que afetam o bloco como um todo, e
sim exclusivamente nos sabores preferidos pelos roedores.

Este fato que as condições experimentais não eram idênticas foi previsto e cada conjunto de
observações tratadas como um “bloco observacional”. Este tipo de planejamento para o estudo é
chamado de “blocagem”.

Prof. Antonio Gomes de Mattos Neto - 2022


Blocos e blocagem

BLOCOS COMPLETOS No exemplo dado dos roedores e suas preferências quanto aos sabores das iscas de
venenos, vimos que todos níveis do SABOR estavam presentes em cada BLOCO do
experimento realizado.

Este caso é chamado de “experimento de blocos completos”, que são mais fáceis de
analisar.

BLOCOS INCOMPLETOS Às vezes acontece, devido às condições existentes no estudo, um ou mais subconjuntos de
observações não estar disponível para alguns dos blocos.

Este caso é de mais difícil tratamento.

É chamado de “experimento de blocos incompletos”.

Fonte: Larsen, R. J. e Marx, M. L. An introduction to mathematical statistics and its applications. 5th Edition, Boston: Prentice Hall, 2012.

Prof. Antonio Gomes de Mattos Neto - 2022


Dados dependentes e independentes

DEPENDENTES Quando duas ou mais variáveis compartilham de influências comuns (são afetadas de forma
comum entre si ou por outras variáveis conhecidas ou desconhecidas, que não aquelas
controladas pelo experimento), dizemos que são variáveis (ou dados, observações)
dependentes.

INDEPENDENTES Caso contrário, dizemos que são variáveis (ou dados, observações) independentes.

Batimentos cardíacos e colégio onde fez o primário → Independentes

Batimentos cardíacos e hábitos de fumar → Dependentes

Prof. Antonio Gomes de Mattos Neto - 2022


Dados com unidades similares ou dissimilares

SIMILARES Duas observações são ditas similares se suas unidades de medida são similares.

Exemplos de medidas similares são típicas quando comparamos diferentes níveis para um
determinado fator.

DISSIMILARES Dissimilares caso suas unidades sejam diferentes.

Dados dissimilares são tipicamente analisados quanto procuramos quantificar suas formas
de relacionamento (análise de regressão).

Porém, análises de regressão não necessariamente se limitam a dados dissimilares.

Veja, por exemplo, a origem da Análise de Regressão!

Prof. Antonio Gomes de Mattos Neto - 2022


Dados, variáveis, fatores, variáveis aleatórias

DADOS São os dados coletados com base em estudos observacionais ou experimentos planejados

VARIÁVEIS São símbolos que representam os dados antes deles assumirem seus valores observados
(antes de se transformarem em um resultado).

FATORES Designação típica da estatística para variáveis de interesse que, hipoteticamente, afetam
uma população. Podem ser qualitativos ou quantitativos, aos quais atribuímos níveis.

VARIÁVEIS São variáveis que devem assumir valores numéricos quando observadas, valores aos quais
ALEATÓRIAS podemos associar probabilidades.

Prof. Antonio Gomes de Mattos Neto - 2022


Fim!

Prof. Antonio Gomes de Mattos Neto - 2022

Você também pode gostar