Você está na página 1de 11

1

Universidade Save
Faculdade de Ciências Naturais e Exactas
Curso de Matemática, 20 ano- EAD 2021
Disciplina de Bioestatística
O Docente: Prof. Dr. Alberto Marcos Halar

1. Introdução
Nas nossas aulas introdutórias tivemos muitas noções básicas sobre a bioestatística. De forma muito
genérica vimos, entre outros, o método estatístico e suas fases principais. Facto importante é que este
conhecimento permitiu nos avançar com pequenas pesquisas.
Agora vamos, de forma detalhada olhar para os elementos básicos da estatística, a começar por
variáveis e gráficos.

CAP.I- VARIÁVEIS E GRÁFICOS


Este capítulo insere-se inequivocamente numa das fases do método estatístico (reveja as fases).
Para facilitarmos a compreensão do estudante vamos inserir os elementos segundo as partes em que
a estatística se deixa dividir.

1.1. Estatística descritiva


Estatística descritiva também designada por estatística dedutiva tem por finalidade descrever certas
propriedades relativas a um conjunto de dados1. Esta parte da estatística trata da recolha, ordenação,
classificação e análise de um conjunto de dados obtidos em observações.
Depois de efectuadas observações ficamos na posse de um conjunto caótico de dados, o que dificulta
a obtenção de conclusões. É perante esta «desordem» de dados que a Estatística descritiva revela a
importância e interesse das suas técnicas, ao permitir classificar esses dados e deles fornecer
características sumárias.

1
Dado estatístico é o resultado da observação de um carácter qualitativo ou quantitativo.
Ex. O Alfredo tem olhos castanhos; o Alfredo mede 1,86cm de altura.
.

Ano académico 2021


2

Para simplificar a complexidade de dados constroem-se tabelas e gráficos e calcula-se parâmetros


estatísticos que ajudam a compreender e descrever a situação em estudo.
Os métodos descritivos enquanto meios que permitem ordenar a «desordem» e sintetizar a
diversidade das informações contidas nos dados, podem explicar quer a população quer a amostra.

1.2. Estatística Indutiva ou Inferencial


Esta componente da estatística procura inferir propriedades do universo estatístico a partir de
propriedades verificadas na amostra. Ela generaliza para uma população, estabelecendo previsões a
partir dos resultados na Estatística descritiva e apoia-se no cálculo das probabilidades que permitem
quantificar o erro, compreendendo que a inferência é tanto mais provável quanto menor for o erro
que acompanha.
A estatística indutiva só se pode utilizar no estudo da amostra.

1.2.1. Caracteres ou variáveis estatísticas


Comecemos por definir o conceito de unidade estatística
Seja dada a população de um estudo estatístico, constituída por alunos de uma escola. Cada aluno
seria uma unidade estatística, ou seja, cada elemento que participa da composição da população.
Note que cada aluno tem uma série de características ou caracteres, como por exemplo, a cor dos
olhos, a altura, o número de irmãos, a profissão dos pais, sexo, a distância de casa a escola, a última
nota da cadeira de bioestatística, etc.

Os caracteres ou 2variáveis estatísticas podem ser qualitativos (nominais e ordinais) ou quantitativos


(discretos e contínuos).

Caracteres qualitativos são aqueles que não são susceptíveis de serem medidas, devendo se
relacionar apenas com uma qualidade. Os caracteres qualitativos apresentam-se em modalidades (cf.
Tabela 1).

Tabela 1: Caracteres qualitativos e respectivas modalidades.


Caracteres qualitativos Modalidades
A profissão dos pais Professor, médico, pedreiro, ….
A cor dos olhos Azul, verde, castanho, …
O curso preferido Jornalismo, direito, …

2
Podemos dizer variáveis assim como caracteres. Por uma questão de lógica poderemos, nesta sessão usar o termo
caracter, sem o prejuízo do termo variável.

Ano académico 2021


3

Caracteres quantitativos – são aqueles que se podem medir. Os caracteres quantitativos apresentam-
se com diferentes intensidades ou valores.(cf. Tabela 2)
As variáveis estatísticas quantitativas subdividem-se em duas categorias básicas: Discretas e
contínuas.
a) caracteres Discretos – são os que só podem tomar um número finito ou uma infinidade
numerável de valores.
Pode- se tomar como exemplo de caracteres descretos o número de irmãos de um aluno da
turma.
Em análise a esta questão, nota-se que os respectivos dados em termos geométricos,
correspondem a pontos isolados.
___. ________. ________. ________. _.....
0 1 2 3

b) Caracteres Contínuos – são os que podem tomar qualquer valor pertencente a um


determinado intervalo.
__._____________. ___
1,70 1,90

Toma-se a título de exemplo de caracteres contínuos o peso dos recém-nascidos durante um


determinado mês, numa certa maternidade. No exemplo em alusão nota-se os dados estatísticos, em
termos geométricos, podem ser representados numa recta real por qualquer ponto de um intervalo.

Tabela 2: Caracteres quantitavos e os respectivos valores.


Caracteres quantitativos Valores/categorias
O custo da renda de casa 2.500Mt, 7.000Mt, …
O peso de um limão 10g, 15g, 50g, ….
Altura de uma pessoa 136cm, 179cm, …

A organização resumo dos caracteres estatísticos vem exibida pela figura 1, abaixo.

Ano académico 2021


4

Variáveis

Quantitativas
Qualitativas
ou
Categóricas

Nominais Ordinais Contínuas Discretas

Ex. estado civil Ex. nível de instrução Ex. alturas Ex. n° de irmaos

2. DISTRIBUICÃO DE FREQUÊNCIAS
Segundo as fases do método estatístico, uma das fases ocupa-se pela organização e apresentação de
dados através de tabelas e/ou gráficos. É nesta sequência que veremos a tabela de distribuição de
frequências para todo o tipo de dados.

2.1 Tabela de Frequências para dados simples


Suponhamos que numa turma da 10ª classe se pretenda fazer um estudo estatístico sobre as idades
dos alunos, em anos. Neste caso registamos, por exemplo:
16, 13, 15, 16, 14, 13, 14, 15, 15, 14, 15, 17, 14, 15, 15, 15, 14, 16, 15, 14, 14, 15, 17. (Cf. Tabela 3)
Note que a variável estatística idade (em anos), é discreta e toma os valores 13, 14, 15, 16 e 17.

Tabela 3: Tabela de distribuição de frequências.


Idade3 (xi) Frequência absoluta4 simples (fi )
13 2
14 7
15 9
16 3
17 2
Total 23

3
A idade representa a variável estatística em estudo, cujos valores são dados.
4
A frequência absoluta simples representa o número de vezes em que cada valor se repete.

Ano académico 2021


5

Como se pode ver na tabela 3, 7 alunos da turma têm 14 anos. Equivale a afirmar que a frequência
absoluta simples do valor 14 é 7. 3 alunos têm 16 anos, ou seja, a frequência absoluta simples
correspondente ao valor 16 anos é 3. Por outras, a idade 16 anos regista-se 3 vezes.
A frequência absoluta pode-se representar por (fi). A partir desta frequência absoluta (fi), pode-se
calcular outras frequências:

Frequência relativa simples de um valor X da variável (fri).


O valor desta frequência será dado pelo quociente entre a frequência absoluta simples do valor X da
variável (fi) e o número total de observações (n). Matematicamente:

fi fi
fri  k

 fi
n
i 1

A frequência relativa pode-ser expressa também sob forma de percentagem, bastando multiplicar a
fi
fri  * 100 %
expressão acima por 100%, ou seja, n (i=1,2,3,…..,k). Neste caso a frequência
relativa em causa chama-se percentual.
O número total de observações (n) pode ser dado pelo somatório de todas as frequências absolutas
k

 fi  f 1  f 2  ...  fk
simples correspondentes aos valores em análise, ou seja, n= i 1

Outro tipo de frequência corresponde a frequência acumulada (faci) ou (Fi) do valor X, que é o
somatório das frequências absolutas simples de todos valores anteriores a X com frequência absoluta
de X.
Pela via do somatório pode-se obter a frequência relativa acumulada (facri) ou (Fri ) do valor X,
através do somatório das frequências relativas de todos os valores anteriores a X com frequência
relactiva de X. A tabela 4 ilustra a construção de todos os casos apresentados acima.

Ano académico 2021


6

Tabela 4: Tabela de distribuição de frequências absolutas e relactivas.


Xi fi fri Fi Fri
13 2 2/23=0.09 ou 9% 2 0.09 ou 9%
14 7 7/23=0.30 ou 30% 9 0.39 ou 39%
15 9 9/23=0.39 ou 39% 18 0.78 ou 78%
16 3 3/23=0.13 ou 13% 21 0.91 ou 91%
17 2 2/23=0.09 ou 9% 23 1 ou 100%
n=23

Nesta tabela, encontra-se respostas para as seguintes questões:


1. Qual é o número de alunos com idade inferior ou igual a 14 anos?
- Há 9 alunos com 14 anos ou menos;
2. Qual é a percentagem de alunos com 15 anos?
- Há 39% de alunos com 15 anos;
3. Quantos alunos tem 17 anos?
- Há 2 alunos com 17 anos;
4. Qual é a percentagem de alunos com idade inferior a 16 anos?
-78% dos alunos têm menos de 16 anos;
5. Qual é a percentagem de alunos com mais de 15 anos?
22% (13%+9%) dos alunos da turma têm mais de 15 anos;
6. Qual é o número total dos alunos da turma?
- o número total dos alunos da turma é 23.

2.2.Tabela de Frequências para dados agrupados ou tabulados em classes


Se no lugar da variável idade dos alunos, se estudasse a variável altura destes e se tivesse:
1,62 1,71 1,50 1,62 1,69 1,59 1,48 1,52 1,64 1,57 1,49 1,66
1,73 1,53 1,61 1,63 1,56 1,55 1,57 1,64 1,60 1,51 1,68
________________________________________________________________________________
Nota-se a priori que os valores actuais preenchem todos os pontos do intervalo, ou seja, a variável
descrita por estes é contínua. O estudo das variáveis contínuas assenta-se na construção de classes.
Não existe uma fórmula universalmente aceite para determinar o número de classes a considerar.
A tabela de Truman L Kelley que estabelece o número de classes (k) em função do número total de
observações (n) pode constituir uma ajuda. (cf. Tabela 5).

Ano académico 2021


7

Tabela 5: Construção de classes pelo método de Truman L Kelley.


n 5 10 25 50 100 200 500 1000
k 2 4 6 8 10 12 15 15

No caso das alturas pode-se considerar 6 classes, pois n = 23.


Todas as classes devem ter a mesma amplitude e para isso calcula-se:
1º Amplitude total = limite superior (Ls)- limite inferior (Li)=1,73-1,48=0,25.

Ls  Li 0,25
  0,042
2º Amplitude de classe= k 6

Fazendo uma observação sobre este valor pode se notar que ele oferece alguma dificuldade para o
cálculo. Neste caso pode se considerar 0,05 como amplitude de cada classe e 1,45 como limite
inferior da primeira classe.

Obs; Se considerássemos a amplitude de 0,04 e 1,48 (menor valor observado) como limite inferior
da primeira classe verificava-se que o valor 1,73 não se incluía em qualquer classe.
Deste modo, a definição da amplitude das classes e do limite inferior da primeira classe devem ser
estabelecidos para que cada valor da variável estatística pertença exactamente a uma classe.
Uma outra maneira de determinar o número de classes é a regra sugerida por Sturgos.
K=1+3,3logn.
A tabela 6 abaixo mostra, de forma clara, a distribuição de frequências para dados distribuídos em
classes.

Tabela 6: Tabela de distribuição de frequências para dados agrupados em classes.


Alturas(em m) fi fri Fi Fri
[1,45; 1,50[ 2 2/23=0.09 ou 9% 23 1 ou 100%
[1,50; 1,55[ 4 4/23=0.17 ou 17% 21 0.91 ou 91%
[1,55; 1,60[ 5 5/23=0.22 ou 22% 17 0.74 ou 74%
[1,60; 1,65[ 7 7/23=0.30 ou 30% 12 0.52 ou 52%
[1,65; 1,70[ 3 3/23=0.13 ou 13% 5 0.22 ou 22%
[1,70; 1,75[ 2 2/23=0.09 ou 9% 2 0.09 ou 9%
n= 23

Nesta tabela podem ser encontradas respostas para as seguintes questões:

Ano académico 2021


8

1 Qual é o número de alunos com alturas maiores ou iguais a 1,65m?


- Há 5 alunos com altura de 1,65m ou mais.
2. Qual é a percentagem dos alunos maiores ou iguais a 1,55m?
- 74% dos alunos têm alturas iguais a 1,55 ou mais;
3. Quantos alunos têm alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m?
-há 4 alunos com alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m;
4. Qual é a percentagem dos alunos que têm uma altura de 1,60m ou compreendida entre 1,60m e
1,65m?
- 30% dos alunos têm altura de 1,60m ou compreendida entre 1,60m e 1,65m.

3. GRÁFICOS DE DISTRIBUIÇÃO DE FREQUÊNCIAS


Nas fases do método estatístico frisou-se duas formas de apresentação de dados estatísticos: Através
de tabelas (secção anterior) e através de gráficos.
Os gráficos constituem, por tanto, uma outra forma de apresentar dados. Comparativamente as
tabelas, os gráficos são mais atractivos e facilitam a apreensão da mensagem.
Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas
situações. Neste estudo referir-nos emos à: gráficos de barras, histograma, polígono de frequências,
ogivas de Galton e gráfico circular.

3.1 Gráficos de Barras


Os gráficos de barras utilizam-se essencialmente para dados simples (não agrupados). Estes gráficos
são empregues muita das vezes para estabelecer comparações.
No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma.
A partir dos dados da tabela de frequências das idades dos alunos da 10ª classe, vamos construir o
gráfico de barras.e

fi Idade dos alunos da 10a classe


9
8
7
6
5
4
3
2
1
0 Idade(Xi)
13 14 15 16 17

Figura 1: Gráfico de barras.


Ano académico 2021
9

3.2. Histograma ou diagrama em colunas


Os histogramas usam se para dados agrupados em classes. A sua construção é semelhante `a do
gráfico de barras. Não há qualquer espaço entre as barras. No eixo das abcissas (horizontal)
representa-se as classes e no eixo das ordenadas (vertical) as frequências.
Distribuição das alturas dos alunos da 10ª classe

1
1,45

1,50

1,55

1,60

1,65

1,70

1,75

Altura

3.3. Polígono de Frequências


Consta de uma poligonal, cujos vértices são obtidos pela intersecção de cada ponto médio da classe e
sua respectiva frequência absoluta simples correspondente (no histograma).
Distribuição das alturas dos alunos da 10ª classe.

3
2

1
1,45

1,50

1,55

1,60

1,65

1,70

1,75

Altura

Ano académico 2021


10

3.4. Polígono de Frequências acumuladas


(Ogiva de Galton)

Distribuição das alturas dos alunos da 10ª classe

25

20

15
10

5
1,45

1,50

1,55

1,60

1,65

1,70

1,75

Altura

3.5.Gráficos Circulares
(sectograma)
Um gráfico circular é representado por um círculo que está dividido em sectores cujas
amplitudes são proporcionais `a frequência correspondente.
O gráfico circular costuma-se utilizar quando o número de categorias para a variável é pequeno
(normalmente menor ou igual a seis (6)) e, é especialmente adequado para estabelecer
comparações entre diferentes valores do atributo em estudo.
A amplitude de cada sector é determinada pela frequência relativa.

Na tabela seguinte foram observadas 54 pessoas relativamente a cor dos olhos.


Cor dos olhos Efectivos
Azuis 10
Verdes 5
Cinzentos 19
Castanhos 20

Ano académico 2021


11

Vamos fazer uma tabela que nos permite calcular a percentagem e o ângulo correspondente a cada
classificação.
Cor dos olhos Efectivos (fi) Percentagem Ângulos (amplitude em graus)
Azul 10 10/54=0,185… ou 18,5% 0,185 x 360o=66,66…= 67º
Verde 5 5/54=0,093 …ou 9,30% 0,093 x 360o = 33,33= 33º
Cinzenta 19 19/54=0,352… ou 35,2% 0,352 x 360o=126,66..= 127º
Castanha 20 20/54=0,370 …ou 37,0% 0,370x =1360o 33,33= 133º
N = 54 Total=360º

Cor dos olhos de 54 pessoas

Azul
19%
castanha
Azul
37% Verde
Verde
9%
Cinzenta
castanha

Cinzenta
35%

Bibliografia:
FONSECA, Jairo S e MARTINS, Gilberto A. Curso de estatística. 5. ed. São Paulo, Atlas, 1994.

HEALEY,Joseph. Statistics,a tool for social research, Califórnia, Wadswort, Plablishing Company Belmont,
1990.

SPIGEL, Murray. Estatística. São Paulo, Schaum Mcgraw – Hill, 1998.

V.E. GMRMAN, Problemas em Probabilidades e Estatística, Editora Mir, 1984.

MARIA AUGUSTO FERREIRA NEVES & JOSÉ ANTÓNIO FERNANDES, Métodos Quantitativos, Porto
Editora Lda.

WILSON PERREIRA & OSWALDO K. TANAKA


PUC-Campinas, Estatística, Conceitos Básicos 2ª Ed. São Paulo, Editora MCGraw-Hill Lda, 1990, 1984.

Ano académico 2021

Você também pode gostar