Você está na página 1de 41

Classificação de variáveis.

Apresentação de dados:
1
tabelas e gráficos
Colecta de dados
2  A estatística ajuda a solucionar problemas que envolvem
decisões que estão baseadas em dados que tenham sido
colectados.
 O processo envolve:
 Definição do tipo de dados que pretende estudar para resolver
o problema em causa;
 Colecção dos dados a partir de fontes apropriadas;
 Organização dos dados por meio do desenvolvimento de
tabelas;
 Visualização dos dados por meio do desenvolvimento de
gráficos; e
 Análise dos dados de modo a tirar conclusões e apresentar os
respectivos resultados.
Classificação das variáveis
3
Para saber sobre os dados é preciso saber sobre
variáveis.
Variável é toda a característica que, observada
em uma unidade de estudo pode variar de um
indivíduo para outro. Exemplos: a idade de uma
pessoa, o sexo, hábitos de uma pessoa quanto
ao fumo, estatura de jogadores de basquete,
etc.
As variáveis podem ser quantitativas e
qualitativas, tendo cada uma destas divisões, a
sua subdivisão.
Ex: Cor do
Nominais cabelo, Tipo de
4 sangue, gênero, reli
gião
Qualitativas
(Categóricas) Ordinais Ex:
escolaridade, classe
social, Gravidade de
uma doença
Variáveis
Ex: Nº de
filhos, quantidade
Discretas de moedas no
bolso, números de
Quantitativas pessoas numa sala.
(Numéricas)
Ex: Peso, tempo
de
espera, quantida
Contínuas de de chuva.
Exemplos:
5
Pergunta Possíveis respostas (dados) Tipo de variável
Você tem um perfil no SIM ou NÃO Nominal (ou qualitativa)
Facebook? categórica
Quantas mensagens de 3, 4, 5, etc. Numérica (ou
texto você enviou nos quantitativa) discreta
últimos 3 dias?
Quanto tempo foi X segundos Numérica contínua
necessário para que
você baixasse a
actualização para o
aplicativo mais recente
do seu celular?
Como você avalia o Muito insatisfeito, Qualitativa ordinal
nosso produto? relativamente insatisfeito,
neutro, relativamente
satisfeito, Muito satisfeito
Apuração (Organização)
6
Os dados colectados na pesquisa são
registados em cadernos, fichas ou mesmo em
computador. Para obter os dados de interesse
apenas para a sua pesquisa deverá então fazer
a apuração.
7 Organização de dados categóricos

 Exemplo: para estudar a razão de sexos dos recém-


nascidos em uma maternidade e seus pesos ao
nascer, um pesquisador obteve uma amostra
sistemática de 1000 fichas de recém-nascidos e
escreveu numa folha de papel:
 Masculino
 Feminino
8
Depois examinou todas as fichas e fez, então
um traço na linha que indicava cada
sexo, cada quadrado cortado pela
diagonal, representa 5 recém-nascidos. O total
é dado pelo número de traços em cada linha.

Masculino 509

Feminino 491
9 Organização dos dados numéricos
 Quando a variável é quantitativa, é preciso anotar, na
apuração, cada valor observado. Exemplo: Para apurar
dados de peso ao nascer, um pesquisador anotou o o
número da ficha e o peso ao nascer, numa folha de
papel. O número da ficha anotado ao lado do peso ao
nascer facilita a posterior verificação da apuração.
Nº da ficha Peso ao nascer
10525 3,250
10526 2,010
. .
. .
. .
10624 2,208
10 Estrutura da tabela

A tabela deve ser delimitada por traços


horizontais mas não deve ser delimitada por
traços verticais.
O cabeçalho deve ser separado do corpo da
tabela por um traço horizontal.
Ilustração da estrutura de uma tabela
11
12 Apresentação de dados qualitativos
em tabelas
Tabela resumida
Tabela de contingência (Tabela de dupla entrada)
Tabela resumida
13
 A tabela de resumida serve para apresentar as
frequências (contagens) de cada categoria, para uma
variável qualitativa.

Tabela 2.4
Opinião de adeptos sobre determinado técnico de futebol

Respostas Frequência Frequência


Absoluta Relativa
Bom 1300 1300/2500 = 0,52
Regular 450 450/2500 = 0,18
Ruim 125 125/2500 = 0,05
Não sabe 625 625/2500 = 0,25
Total 2500 1,00
Tabelas de contingência
14  Quando os elementos da população são classificados
de acordo com duas variáveis qualitativas os dados
devem ser apresentados em tabelas de dupla
entrada, chamadas tabelas de contingência.

Tabela
Sexo e Presença de depressão

Depressão
Sexo Sim Não Total
Masculino 36 214 250
Feminino 62 188 250
Total 98 402 500
15 Organização de dados numéricos

Tabela de frequência simples


Tabela de grupamento por classe
 Dados numéricos são apresentados na ordem em que são colectados.
Geralmente são obtidos dados relativos a diversas variáveis em cada
16 paciente. Os pacientes são identificados nas pesquisas por números.
Tabela
Idade em anos completos, tempo de diálise em meses, altura em metros, peso em
quilogramas, pressão sistólica e diastólica em mmHg de mulheres submetidas
à diálise renal…
Número da Idade Tempo de Altura Peso Pressão Pressão
paciente diálise sistólica diastólica
1 45 14 1.6 62 140 85
2 62 54 1.65 52.5 100 70
3 38 52 1.55 67.8 140 100
4 26 34 1.59 48.2 165 105
5 35 18 1.58 46 170 105
6 44 71 1.48 40.4 150 100
7 53 39 1.69 67.7 155 95
8 44 79 1.59 55.5 160 105
9 58 23 1.62 63 175 110
10 55 64 1.51 50.3 155 105
11 24 16 1.79 77 160 95
12 70 46 1.51 44 150 95
13 56 48 1.58 64 175 110
Os dados numéricos podem também ser
17 apresentados em tabelas de frequência
 Se os dados são discretos siga os seguintes passos:
1. Escreva os dados em ordem crescente.
2. Conte quantas vezes cada valor se repete.
3. Organize a tabela como já foi feito com os dados
qualitativos, colocando no lugar das categorias, os valores
numéricos, em ordem natural. No exemplo que se segue, a
respectiva tabela de frequências é apresentada no slide a seguir.

 Tabela
 Número de faltas dadas por 30 empregados de uma clínica no
semestre
1 3 1 1 0 1 0 1 1 0
2 2 0 0 0 1 2 1 2 0
0 1 6 4 3 3 1 2 4 0
Tabela de frequências
18
 Tabela
Distribuição do Número de faltas dadas por 30
empregados de uma clínica no semestre

Número de faltas Frequência Percentual


0 9 30.0
1 10 33.3
2 5 16.7
3 3 10.0
4 2 6.70
5 0 0.00
6 1 3.30
Total 30 100.0
 Dados contínuos, como do exemplo apresentado
abaixo, também podem ser apresentados em tabelas
19
de distribuição de frequências.
Tabela
Peso ao nascer de nascidos vivos, em quilogramas

2.522 3.200 1.900 4.100 4.600 3.400


2.720 3.720 3.600 2.400 1.720 3.400
3.125 2.800 3.200 2.700 2.700 1.570
2.250 2.900 3.300 2.450 4.200 3.800
3.220 2.950 2.900 3.400 2.100 2.700
3.000 2.480 2.500 2.400 4.450 2.900
3.725 3.800 3.600 3.120 2.900 3.700
2.890 2.500 2.500 3.400 2.920 2.120
3.110 3.550 2.300 3.200 2.720 3.150
3.520 3.000 2.950 2.700 2.900 2.400
3.100 4.100 3.000 3.150 2.000 3.450
3.200 3.200 3.750 2.800 2.720 3.120
2.780 3.450 3.150 2.700 2.480 2.120
3.155 3.100 3.200 3.300 3.900 2.450
2.150 3.150 2.500 3.200 2.500 2.700
3.300 3.800 2.900 3.200 2.480 -
3.250 2.900 3.200 2.800 2.450 -
 Para construir uma tabela de frequências com dados contínuos deve-
seguir os passos seguintes:
20
 Achar o valor máximo e o valor mínimo do conjunto dos dados.
 Calcular a diferença entre o valor máximo e o valor mínimo. (Valor máximo
- Valor Mínimo)
 Escolher o número de classes (Deve ser entre 5 a 20 classes). Tome-se, no
entanto, que existem fórmulas para determinar o número de classes uma
delas é , ou a fórmula , onde k é o número de
classes e n o número de dados. Deve-se considerar que o número de
classes dependem da conveniência do pesquisador. No exemplo
dado, foi determinado pela segunda fórmula o número de 7 classes.
 Determinar o intervalo de classes, dividindo a amplitude dos dados pelos
número de classes.
 Organizar as classes de maneiras que a primeira contenha o menor valor
observado.
21 Tabela de frequência: Intervalos de
classe
 No exemplo da tabela anterior, o menor valor é 1,570 kg e o maior é 4,600
kg. Portanto, a amplitude é:
 K (número de classes) é 7.
 O intervalo de classes será
 Recomenda-se arredondar por excesso o valor, portanto, arrendondamos
0,433 a 0,500.
 Constrói-se a primeira classe que será 1,5 kg a 2,0 kg (1,5 kg é o menor
valor e 2,0 é o resultado da sua soma com a amplitude da classe); a
segunda classe partirá de 2,0 kg (o último valor da classe anterior) a 2,5 kg
(o resultado da soma de 2,0 com 0,5).
 Deve-se tomar em consideração que o primeiro valor de cada classe faz
parte da classe mas o último não.
22 Tabela de frequência: Intervalos de
classe
 Deste modo tem-se:
Classe Frequência
1,5├2,0 3
2,0├2,5 16
2,5├3,0 31
3,0├3,5 34
3,5├4,0 11
4,0├4,5 4
4,5├5,0 1
23 Gráficos
24 Visualização de dados categóricos

A escolha do gráfico para visualizar os dados


para uma única variável categórica dependem
do que a pessoa busca: enfatizar o modo
como as categorias se comparam (gráfico de
barras), ou o modo como as categorias formam
parte de um todo (gráfico circular, ou de
pizza, ou de sectores), ou se os dados estão
concentrados em algumas poucas entre as
categorias (diagrama de Pareto).
25 Gráfico circular (de pizza, ou de
sectores)
Este gráfico visualiza uma variável categórica
através de partes de um círculo que
representam o detalhamento de cada uma das
categorias.
O tamanho de cada uma das partes varia de
acordo com a percentagem em cada uma das
categorias.
26 Estado Civil
Solteiros, 22.60
%

Solteiros
Divorciados
Divorciados, 8. Viúvos
Casados, 61.20 90%
Casados
%
Viúvos, 7.30%

Figura 1. Gráfico em circular para o Estado Civil


27 Gráfico de barras

 Um gráfico de barras visualiza uma variável categórica


como uma série de barras, com cada uma das barras
representando a identificação de cada uma das
categorias.
 O comprimento de cada uma das barras representa a
frequêmncia ou a percentagem de valores que se
posicionam em uma determinada categoria, e cada
uma das barras é separada por um espaço.
28 70%
60%

Percentagem
50%
40%
30%
20%
10%
0%
Sim Em parte Não Sem resposta
Resposta

Figura 2: Gráfico de barras para resposta quanto ao


efeito da cirurgia na melhoria da aparência
29

Sem resposta
Resposta

Não

Em parte

Sim

0% 10% 20% 30% 40% 50% 60% 70%

ntage
Perce

m
30 Gráfico de barras paralelas

Os gráficos de barras podem mostrar o efeito


de uma variável sobre a outra. Por exemplo, o
uso de cinto de segurança por sexo, como
mostra a figura a seguir.
O gráfico de barras paralelas
Serve, portanto, para visualizar os dados para
duas variáveis categóricas.
60.0% 56.3%
31 Masculino Feminino
50.0%
39.2%
40.0%

30.0%

20.0% 16.3% 15.8% 17.5%

8.7% 10.6% 10.5%


10.0% 7.0% 8.0%

0.0%
Nunca Raramente Algumas vezes Na maioria das Sempre
vezes

Figura: Gráfico em barras para uso do cinto de segurança, por


sexo (com percentagens)
32 Diagrama de Pareto
 Baseado no princípio 80 por 20, o gráfico de Parreto
possibilita a visualização de uma quantidaede pequena
de categoria de uma determinada variável categórica
que representa a maioria dos dados em comparação
com muitas outras categorias que representam uma
quantidade relativamente pequena, ou trivial, de
dados.
 Em um diagrama de Pareto, os resultados
correspondentes a cada uma das categorias são
inseridos em um gráfico sob a forma de barras
verticais, em ordem descendente de acordo com suas
respectivas frequências, e são combinados com uma
linha de percentagens acumuladas no mesmo gráfico.
33
100.00% 100.00%

90.00% 90.00%

80.00% 80.00%

70.00% 70.00%

60.00% 60.00%

50.00% 50.00%

40.00% 40.00%

30.00% 30.00%
Percentagem
20.00% 20.00%
Percentangem acumulada
10.00% 10.00%

0.00% 0.00%
34 Visualização de dados numéricos
35 Histograma
O histograma visualiza os dados sob a forma de
um gráfico de barras verticais, no qual cada
uma das barras representa um intervalo de
classe, a partir de uma distribuição de
frequências ou de uma distribuição de
percentagens.
36 Dados frequências para peso ao nascer de
nascidos vivos, em quilogramas

Classe Frequência
1,5├2,0 3
2,0├2,5 16
2,5├3,0 31
3,0├3,5 34
3,5├4,0 11
4,0├4,5 4
4,5├5,0 1
37

40
35
Frequência
30 1.5-2.0
25 2.0-2.5
2.5-3.0
20
3.0-3.5
15
3.5-4.0
10
4.0-4,5
5
4.5-5.0
0
Peso ao Nascer de Nascidos vivos
38 Polígono de frequências
 São gráficos usados para dados agrupados em classes.
As frequências são indicadas por uma sucessão de
pontos colocados sobre os valores do ponto médio de
cada intervalo de classe ou dos dados.
39 Dados frequências para peso ao nascer de
nascidos vivos, em quilogramas

Classe Frequência
1,5├2,0 3
2,0├2,5 16
2,5├3,0 31
3,0├3,5 34
3,5├4,0 11
4,0├4,5 4
4,5├5,0 1
40
Série 1
40
35
30
25
20
15
10
5
0
1.75 2.25 2.75 3.25 3.75 4.25 4.75

Figura: Polígono de frequências para peso ao nascer de


nascidos vivos, em quilogramas
41

Obrigado

Você também pode gostar