Você está na página 1de 54

 BIOESTATÍSTICA

 Aula 1_2023.2

Prof. Antonio Carlos Leal de Castro


A IMPORTÂNCIA DA ESTATÍSTICA
O desenvolvimento da estatística teve origem nas aplicações,
pois nenhuma disciplina tem interagido tanto com as demais
disciplinas em suas atividades do que ela, dado que é por sua
natureza a ciência do significado.
Daí, sua importância como instrumento auxiliar na pesquisa
científica.

Uso de Instrumento
da Pesquisa
Dados Científica
Diversos
Estatísti
ca
Principais aspectos

Crescimento e desenvolvimento da
estatística Moderna
3 Fatores

Necessidade dos governos de coletar dados


dos cidadãos

Desenvolvimento da teoria da
probabilidade

Advento da informática
IMPORTÂNCIA DA ESTATÍSTICA

A Estatística revolucionou a ciência através do fornecimento de


modelos úteis que sofisticaram o processo de pesquisa na
direção de melhores parâmetros de investigação, permitindo
orientar a tomada de decisões nas políticas socioeconômicas

Os métodos estatísticos foram desenvolvidos como uma mistura


de ciência, tecnologia e lógica para a solução e investigação de
problemas em várias áreas do conhecimento humano.

Com a velocidade da informação, a estatística passou a ser uma


ferramenta essencial na produção e disseminação do
conhecimento. O grau de importância atribuído à estatística é
tão grande que praticamente todos os governos possuem
organismos oficiais destinados à realização de estudos
estatísticos.
A partir do século XX começou a ser aplicada nas grandes
organizações, quando os japoneses começaram a falar em
qualidade total, surgindo a estatística moderna, considerada
uma disciplina.
A partir daí, a estatística evoluiu de forma significativa,
passando a ser utilizada nos diferentes setores da sociedade
como forma de obtenção de informações a partir do
levantamento de dados com base em métodos de amostragem
complexos
Os avanços no campo da Tecnologia da Informação,
envolvendo todas as atividades e soluções providas por
recursos de computação (hardwares e softwares), a partir da
metade do século XX
O aumento significativo da capacidade de produzir, armazenar e
transmitir informações, associados ao crescimento acentuado da
demanda por informações num mundo globalizado, vêm
exigindo da estatística avanços paralelos no desenvolvimento de
metodologias e novos indicadores cada vez mais complexos.
Estatística: é um conjunto de técnicas desenvolvidas com
a finalidade de auxiliar a responder, de forma objetiva e
segura, as situações que envolvem uma grande
quantidade de informações. Pode ser usada para
analisar situações complexas ou não.

Permite, de forma sistemática, organizar, descrever,


analisar e interpretar dados oriundos de estudo ou
experimentos realizados em qualquer área do
conhecimento. Podemos dividir a estatística em três
partes:
a) Estatística Descritiva
b) Probabilidade
c) Inferência Estatística.
Ramos da Estatística

Estatística descritiva - trata da


organização, do resumo e da
apresentação/descrição dos dados.

Estatística inferencial - trata de tirar


conclusões sobre uma população a partir de
uma amostra. A ferramenta básica no estudo
da estatística inferencial é a probabilidade.
Porque a estatística é importante?
Os métodos estatísticos são usados hoje em quase todos
os campos de investigação científica, já que eles nos
capacitam a responder a um vasto número de questões,
tais como :

 Como os cientistas avaliam a validade de novas teorias?

 Como os pesquisadores médicos testam a eficiência de


novas drogas?
 Como os oceanógrafos prevêem eventos que podem
causar amplas flutuações na composição das populações
de animais no mar?
 Como os pesquisadores na educação testam a eficiência
de um novo método de ensino?
Por que Utilizar a Estatística
 A Estatística é uma área da matemática muito
utilizada hoje em dia, entretanto o uso
inadequado e fanático desta ferramenta, torna
muito difícil a compreensão dos resultados e
levam-na ao descrédito;
 A Estatística nada mais é que uma ferramenta
que poderá auxiliar na interpretação dos
resultados e poderá confirmar a hipótese a ser
testada ou simplesmente recusá-la.
CLASSIFICAÇÃO DE UMA VARIÁVEL
Tipos de Variáveis
Cada uma das características observadas ou mensuradas
em um fenômeno é denominada de variável. Para o
fenômeno “sexo” são dois os resultados possíveis: sexo
masculino e sexo feminino;

Para a variável “número de filhos” há um número de


resultados possíveis expressos através dos números
naturais: 0, 1, 2, 3, ..., n;

Para a variável “estatura” temos uma situação diferente,


pois os resultados podem tomar um número infinito de
valores numéricos dentro de um determinado intervalo.
As variáveis podem ser:

Variáveis Quantitativas - Referem-se às quantidades e


podem ser medidas em uma escala numérica. Exemplos:
idade das pessoas, peso, comprimento, densidade,
biomassa. Elas subdividem-se em dois grupos:

Variáveis Quantitativas Discretas: são aquelas que


assumem apenas determinados valores tais como 0, 1, 2, 3,
4, 5, 6. Normalmente refere-se a contagens. Seus valores
são expressos geralmente através de números inteiros não
negativos.
Por exemplo: número de folhas de mangue, número de
espécies de peixes, quantidade de indivíduos em período
reprodutivo.
Variáveis Quantitativas Contínuas: Resulta normalmente de
uma mensuração, e a escala numérica de seus possíveis
valores corresponde ao conjunto dos números reais, ou seja,
podem assumir, teoricamente, qualquer valor entre dois
limites.
Exemplos dessas variáveis são: Peso, comprimento, largura,
profundidade de um rio, densidade, biomassa, velocidade de
corrente, etc.

Variáveis Qualitativas - Referem-se a dados não numéricos.


Eles são expressos por meio de categorias, atributos,
características ou alguma outra qualidade.
Exemplos dessas variáveis são: O sexo das pessoas, a cor, o
grau de instrução. Elas subdividem-se também em dois
grupos:
Variáveis Qualitativas Ordinais: São
aquelas que definem um ordenamento ou
uma hierarquia. Exemplos são: O grau de
instrução, a classificação de um estudante no
curso de Estatística, as posições das 100
espécies mais abundantes, etc.

Variáveis Qualitativas Nominais: Estas por sua


vez, não definem qualquer ordenamento ou
hierarquia. São exemplos destas: A cor, o sexo, o
local de nascimento, presença-ausência, etc.
ESTATÍSTICA
DESCRITIVA_COMPONENTES
Diagrama de uma estatística descritiva, com seus diversos níveis de
categorias.
 POPULAÇÃO:

é o conjunto total de elementos portadores


de, pelo menos, uma característica
comum.
 AMOSTRA:

é uma parcela representativa da população


que é examinada com o propósito de
tirarmos conclusões sobre a essa
população.
 PARÂMETROS:

São valores singulares que existem na população e que

servem para caracterizá-la. Para definirmos um

parâmetro devemos examinar toda a população.

 Ex: Os alunos de oceanografia do Brasil têm em média 1,70

metros de estatura.
 ESTIMATIVA:

é um valor aproximado do parâmetro e é

calculado com o uso da amostra.


 ATRIBUTO:

quando os dados estatísticos apresentam um


caráter qualitativo, o levantamento e os
estudos necessários ao tratamento desses
dados são designados genericamente de
estatística de atributo.
ESCALAS DE MEDIDAS

 NOMINAL

 ORDINAL

 INTERVALAR

 RAZÃO
VARIÁVEL CONTÍNUA:
Resulta normalmente de uma mensuração, e a
escala numérica de seus possíveis valores
corresponde ao conjunto dos números reais,
ou seja, podem assumir, teoricamente,
qualquer valor entre dois limites.

 Ex.: Quando você vai medir a temperatura de seu


corpo com um termômetro de mercúrio o que ocorre
é o seguinte: o filete de mercúrio, ao dilatar-se,
passará por todas as temperaturas intermediárias
até chegar a temperatura atual do seu corpo.
ESCALA NOMINAL
O nível nominal de mensuração envolve simplesmente o ato de nomear,
rotular ou classificar um objeto ou característica por meio de nomes,
números ou símbolos.

• Não há hierarquia;
• Todas têm a mesma importância;
• Devem ser mutuamente exclusivas

Sexo (1) Masculino (2) Feminino


Raça (1) Caucasóide (2) Negróide (3) Asiático
Partidos (1) PMDB (2) PSDB (3) PT (4) PL (5) Outros
ESCALA ORDINAL
O nível de mensuração também envolve o ato de nomear, rotular, ou
classificar um objeto, pessoa ou característica por meio de nomes,
números ou símbolos.

• Há hierarquia ou ordem;
• Sempre haverá uma relação < ou > entre os pares de categorias
• categorias devem ser mutuamente exclusivas

Renda familiar (1) Baixa (2) Média (3) Alta


Rendimento escolar (1) Insuficiente (2) Suficiente (3) Bom (4) Ótimo
Nível educacional (1) Fundamental (2) Médio (3) Superior
ESCALA INTERVALAR

 Neste caso já temos uma escala numérica, quantitativa

 Dados dois intervalos de igual amplitude ao longo da


escala, eles sempre conterão o mesmo número de
unidades

 O zero desta escala não significa que o fenômeno


estudado não exista; o ponto zero não é físico, é sempre
arbitrário.

 Escala de temperatura Celcius 0 = ponto de fusão da


água
 A Escala Intervalar

mede atributos de modo que os intervalos representem quantidades


regulares de atributo.
Tal escala é uma função linear dos atributos.
Além da relação biunívoca entre atributos e códigos numéricos da
escala e do sentido de orientação da medida, tem-se a definição
de unidade de mensuração.
A escala intervalar tem um zero, mas ele é um ponto arbitrário
para a origem das unidades de medida e não tem
correspondência com a situação zero de atributo.
A Escala Intervalar

 O exemplo típico de escala intervalar é o da medida de temperatura. Não


há um zero de temperatura que corresponda a uma ausência de
temperatura e diferentes escalas intervalares mostrarão que há
proporcionalidade entre intervalos, mas não entre valores de temperatura.

 Para melhor detalhar esse exemplo, percebamos que dizer que 10oC é o
dobro de 5oC não é verdade pois se a escala de temperatura for
Fahrenheit, os mesmos valores serão dados respectivamente por 50oF e
41oF (observe que 50 não é o dobro de 41!).

O que pode ser dito é que a mudança de 5 para 10 graus Celsius equivale à
passagem de 10 para 15 graus Celsius, assim como a passagem de 41
para 50 graus Fahrenheit equivale à passagem de 50 para 59 graus
Fahrenheit.
ESCALA RAZÃO

 É uma escala numérica, quantitativa.

 Dados dois intervalos de igual amplitude ao longo da


escala, eles sempre conterão o mesmo número de
unidades.

 O zero desta escala é verdadeiro, real, significando


ausência da característica medida.

 Peso (g, kg); Altura (cm, m); Pressão (mmHg)


Acuracidade X Precisão
 Accuracy is the nearness of a measurement to the true value of the variable
being measured. Precision is not a synonymous term but refers to the
closeness to each other of repeated measurements of the same quantity.

Accuracy and precision of measurements. A 3-kilogram animal is weighed 10 times. The


10 measurements shown in sample (a) are relatively accurate and precise; those in
sample (b) are relatively accurate but not precise; those of sample (c) are relatively
precise but not accurate; and those of sample (d) are relatively inaccurate and imprecise.
Acurácia - o grau de proximidade de uma estimativa com seu parâmetro (ou valor
verdadeiro), enquanto precisão expressa o grau de consistência da grandeza medida com
sua média.
Acurácia reflete a proximidade de uma grandeza estatística ao valor do parâmetro para o
qual ela foi estimada e precisão está diretamente ligada com a dispersão da distribuição
das observações.

como exatidão de um
valor obtido com
relação a um valor
tomado como
referência

entende-se como precisão a proximidade


entre os valores obtidos pela repetição do
processo de medição
Acuracidade e Precisão
DISTRIBUIÇÃO DE FREQUÊNCIA
ALGUNS CONCEITOS IMPORTANTES:
Dados Brutos: são os valores numéricos obtidos após a coleta
dos dados.

Rol: é o arranjo dos dados brutos em ordem de frequência


crescente ou decrescente.

Amplitude total ou “range” (A ou R): é a diferença entre o


maior e o menor valor observados.

Frequência (FI): é o número de vezes que o elemento aparece


na amostra, ou o número de elementos pertencentes a uma
mesma classe.

Número de classes (K): não há uma fórmula exata para o


cálculo do número de classes, mas as duas maneiras mais
usuais são:
Amplitude das classes (h): é a amplitude total (R) dividida pelo
número de classes: Assim como no caso do número de
classes (k), a amplitude das classes (h) deve ser aproximada
para o maior inteiro.

Limites das classes: são os extremos de cada classe e existem


diversas maneiras de representá-los:
Exemplos:
15 ├─ 20: compreende todos os valores entre 15 e 20, excluindo o 20
15 ├─┤ 20: compreende todos os valores entre 15 e 20.
15 ── 20: limite aparente, limite real 14,5 ── 19,5.
15 ─┤ 20: compreende os valores entre 15 e 20, excluindo o 15.

Pontos médios das classes (xi ): é a média aritmética entre o


limite superior e o limite inferior da classe. Estes pontos
estão representando cada um dos dados pertencentes à
classe.
Assim: se a classe for 12 ├─ 20, teremos: 16 como ponto médio
da classe.
DISTRIBUIÇÃO DE FREQUÊNCIA

É um tipo de tabela que condensa uma coleção de dados conforme


as freqüências (repetições de seus valores).

Tabela primitiva ou dados brutos: É uma tabela ou relação de


elementos que não foram numericamente organizados. É difícil
formarmos uma idéia exata do comportamento do grupo como um todo, a
partir de dados não ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60,
51

ROL: É a tabela obtida após a ordenação dos dados (crescente ou


decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60,
60
Distribuição de freqüência SEM INTERVALOS DE CLASSE: É a simples
condensação dos dados conforme as repetições de seu valores. Para um
ROL de tamanho razoável esta distribuição de freqüência é inconveniente,
já que exige muito espaço. Veja exemplo abaixo:

Dados Freqüência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
Distribuição de freqüência COM INTERVALOS DE CLASSE:Quando o
tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos
valores em vários intervalos de classe.

Classes Freqüências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA (com intervalos


de classe) 

CLASSE: são os intervalos de variação da variável e é simbolizada por i e o


número total de classes simbolizada por k. Ex: na tabela anterior k = 5 e
49 |------- 53 é a 3ª classe, onde i = 3.
LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o
limite inferior de classe ( li ) e o maior número, limite superior de classe ( Li
).

Ex: em 49 |------- 53,... l3 = 49 e L3 = 53. O símbolo |------- representa um


intervalo fechado à esquerda e aberto à direita. O dado 53 do ROL não
pertence a classe 3 e sim a classe 4 representada por 53 |------- 57.

AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença


entre o limite superior e inferior da classe e é simbolizada por hi = Li - li.

Ex: na tabela anterior hi = 53 - 49 = 4.

Obs: Na distribuição de freqüência c/ classe o hi será igual em todas as


classes.

AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o limite superior


da última classe e o limite inferior da primeira classe. AT = L(max) - l(min).

Ex: na tabela anterior AT = 61 - 41= 20.


AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor
máximo e o valor mínimo da amostra (ROL).

Onde AA = Xmax - Xmin. Em nosso exemplo AA = 60 - 41 = 19.

Obs: AT sempre será maior que AA.

PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em


duas partes iguais

Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=( l3 + L3


)/2.

Método prático para construção de uma Distribuição de Freqüências c/


Classe 

1º - Organize os dados brutos em um ROL.

2º - Calcule a amplitude amostral AA.

No nosso exemplo: AA = 60 - 41 = 19
3º - Calcule o número de classes através da "Regra de Sturges":
I
n
nº de classes
3 |-----| 5 3
6 |-----| 11 4
12 |-----| 22 5
23 |-----| 46 6
47 |-----| 90 7
91 |-----| 181 8
182 |-----| 362 9

Obs: Qualquer regra para determinação do nº de classes da tabela não nos


levam a uma decisão final; esta vai depender, na realidade de um
julgamento pessoal, que deve estar ligado à natureza dos dados.

No nosso exemplo: n = 20 dados, então ,a princípio, a regra sugere a


adoção de 5 classes.

4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe


h > AA / i.

No nosso exemplo: AA/i = 19/5 = 3,8.

Obs: Como h > AA/i um valor ligeiramente superior para haver folga na última
classe. Utilizaremos então h = 4
5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para não aparecer
classes com freqüência = 0 (zero).

No nosso exemplo: o menor nº da amostra = 41 + h = 45, logo a primeira


classe será representada por ...... 41 |------- 45. As classes seguintes
respeitarão o mesmo procedimento.

O primeiro elemento das classes seguintes sempre serão formadas pelo


último elemento da classe anterior.
REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO

Histograma, Polígono de freqüência e Polígono de freqüência


acumulada

 Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de


eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das
abscissas) colocamos os valores da variável e na linha vertical (eixo das
ordenadas), as freqüências.

Histograma: é formado por um conjunto de retângulos justapostos, cujas


bases se localizam sobre o eixo horizontal, de tal modo que seus pontos
médios coincidam com os pontos médios dos intervalos de classe. A área
de um histograma é proporcional à soma das freqüências simples ou
absolutas.

Freqüências simples ou absoluta: são os valores que realmente


representam o número de dados de cada classe. A soma das freqüências
simples é igual ao número total dos dados da distribuição.
Distribuição de Frequências
Histograma
É a representação gráfica de uma distribuição de frequência por meio
de retângulos justapostos, contendo as classes de valores na abscissa
e as frequências, absolutas ou relativas, nas ordenadas, centradas nos
pontos médios.
Distribuição de Frequências
Polígono de frequências
É a representação gráfica de uma distribuição de
frequência, contendo os pontos médios de cada classe na
abscissa e as frequências, absolutas ou relativas, nas
ordenadas.
Frequências relativas: são os valores das razões entre as freqüência
absolutas de cada classe e a freqüência total da distribuição. A soma das
freqüências relativas é igual a 1 (100 %).

Polígono de frequência: é um gráfico em linha, sendo as freqüências


marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos
pontos médios dos intervalos de classe. Para realmente obtermos um
polígono (linha fechada), devemos completar a figura, ligando os extremos
da linha obtida aos pontos médios da classe anterior à primeira e da
posterior à última, da distribuição.

Polígono de frequência acumulada: é traçado marcando-se as freqüências


acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos
pontos correspondentes aos limites superiores dos intervalos de classe.

Frequência simples acumulada de uma classe: é o total das freqüências de


todos os valores inferiores ao limite superior do intervalo de uma
determinada classe.
Frequência relativa acumulada de um classe: é a frequência acumulada da
classe, dividida pela frequência total da distribuição.

...CLASSE.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri.....


50 |-------- 54 4 52 0,100 4 0,100
54 |-------- 58 9 56 0,225 13 0,325
58 |-------- 62 11 60 0,275 24 0,600
62 |-------- 66 8 64 0,200 32 0,800
66 |-------- 70 5 68 0,125 37 0,925
70 |-------- 74 3 72 0,075 40 1,000
Total 40 1,000

fi = frequência simples; xi = ponto médio de classe; fri = frequência


simples acumulada;

Fi = frequência relativa e Fri = frequência relativa acumulada.

Obs: uma distribuição de frequência sem intervalos de classe é representada


graficamente por um diagrama onde cada valor da variável é representado
por um segmento de reta vertical e de comprimento proporcional à
respectiva freqüência.

Você também pode gostar