Você está na página 1de 10

Introdução à estatística aplicada à saúde

Paulo Henrique Coelho Maranhã, Rafael Monteiro

Descrição

Conceito de estatística e sua aplicação. Análise exploratória, medidas


de posição e medidas de dispersão.

Propósito

Compreender as principais ferramentas de análise exploratória de dados


e as medidas de posição e dispersão.

Preparação

Antes de iniciar o conteúdo deste tema, tenha em mãos uma


calculadora científica ou use a calculadora de seu
smartphone/computador.

Objetivos
Módulo 1

Fases do método estatístico


Identificar as fases do método estatístico e as ferramentas de análise
exploratória de dados.

Módulo 2

Aplicação das medições de


posição
Aplicar as medições de posição ou tendência central.

Módulo 3

Aplicação das medições de


dispersão
Aplicar as medições de dispersão.

meeting_room
Introdução
A estatística é definida como um conjunto de métodos e técnicas
de tratamento de dados para a tomada de decisão. É um meio de
pensar nas soluções de problemas práticos e não apenas em um
amontoado de números e fórmulas. É uma ferramenta que, se
usada adequadamente, pode prestar valiosa ajuda no processo
de desenvolvimento de conhecimentos, podendo ser aplicada a
praticamente todas as áreas do conhecimento.

Veremos, neste conteúdo, que a Estatística é um segmento da


Matemática Aplicada, dividida em cinco etapas, que ficam a
cargo da coleta, organização, descrição, análise e interpretação
de dados. Para dar embasamento ao tomador de decisão na
utilização dos dados, as três primeiras etapas - coleta,
organização e a descrição dos dados - ficam a cargo da
Estatística Descritiva. Já a análise e a interpretação desses
dados ficam a cargo da Estatística Indutiva ou Inferencial.

Além disso, vamos explorar a estatística descritiva entendendo


as principais ferramentas para apresentar e sintetizar um
conjunto de dados, as medidas de posição (valor máximo,
mínimo, média, mediana e moda) e a análise da dispersão dos
dados.
1 - Fases do método estatístico
Ao final deste módulo, você será capaz de identificar as fases do
método estatístico e as ferramentas de análise exploratória de dados.

Etapas da Estatística
A estatística tem um papel fundamental na geração de conhecimento.
Por meio do seu uso, governos, empresas, pesquisadores,
universidades, escolas e organizações de diversas naturezas atuam na
formulação de soluções dos problemas da sociedade contemporânea.

Com o advento da tecnologia, novos problemas são criados e não


podemos utilizar soluções antigas para esses problemas.

Vejamos as etapas da Estatística:

add_chart Coleta de dados


A primeira etapa no processo de um estudo
estatístico, após o planejamento dos objetivos que
serão pesquisados e a devida determinação das
características mensuráveis do que se quer
pesquisar, é darmos início à coleta dos dados
numéricos necessários à sua descrição.
add_chart Organização dos dados
Obtidos os dados, eles devem ser cuidadosamente
criticados, em busca de possíveis falhas e
imperfeições.

add_chart Apuração dos dados


Nada mais é do que a soma e o processamento dos
dados obtidos e a disposição mediante critérios de
classificação.

add_chart Exposição e apresentação dos


dados
Os dados devem ser apresentados de forma
adequada (tabelas ou gráficos), tornando mais fácil
a interpretação do que está sendo objeto de
tratamento estatístico.

add_chart Análise dos resultados


O objetivo da Estatística é tirar conclusões sobre o
todo (população) a partir de informações
fornecidas por parte representativa do todo
(amostra).

Análise exploratória de
dados
Iniciaremos agora o estudo de uma ferramenta importante da estatística
e conheceremos os dados com os quais vamos trabalhar. Veremos
desde os conceitos básicos — tais como classificação de variáveis —
até as principais ferramentas para apresentar e sintetizar os dados,
como distribuição de frequência e representações gráficas.

video_library
Ferramentas de análise
exploratória de dados

A análise exploratória de dados é a parte da estatística responsável pelo


primeiro contato com as informações. Essa técnica nos dá um
indicativo de como os dados estão distribuídos. Além disso, é útil na
detecção de erros, de valores extremos (outliers), na verificação de
suposições relacionadas à inferência estatística, na seleção preliminar
de modelos estatísticos, entre outras utilidades. Aqui veremos os
principais conceitos e ferramentas para a exploração correta dos dados.

Classificação das variáveis


Variáveis são características de interesse em um estudo qualquer. Elas
podem ser classificadas em:

Quantitativas Qualitativas
Quando assumem Quando seus possíveis
valores numéricos.
close valores não são
numéricos.

A seguir veremos de forma resumida como as variáveis são


classificadas:

Fluxograma de classificação das variáveis.

Conceitos básicos
Veremos, neste momento, uma série de conceitos que serão
importantes, são eles:

População

Conjunto de indivíduos ou objetos com pelo menos uma


característica em comum.

Amostra

É uma parte da população.

Dados brutos

Quando o conjunto de dados não tem uma ordem aparente


chamamos de dados brutos.

Rol

Quando o conjunto de dados tem um ordenamento, seja


crescente ou decrescente, dizemos que esses dados estão em
rol.

Amplitude total

É a diferença entre o maior e o menor valor observado no


conjunto de dados.

Distribuições de frequência
A distribuição de frequência é uma das formas mais simples e úteis de
resumir um conjunto de dados.

Resumindo
Nada mais é do que a apresentação dos dados em classes às suas
respectivas frequências absolutas.

As classes são divisões dos valores da variável em estudo.

Exemplo 1
A distribuição de frequência a seguir representa as notas na disciplina
de estatística em uma turma de 40 alunos.
Classe (Notas) Fi fi %

0⊢2 1 2,5

2⊢4 5 12,5

4⊢6 12 30,0

6⊢8 15 37,5

8⊢10 7 17,5

Soma 40 100

Tabela: Distribuição de frequência referente a notas de 40 alunos.


Paulo Henrique Coelho Maranhã e Rafael Monteiro.

Exemplo 2
A próxima distribuição de frequência refere-se à quantidade de famílias
que receberam auxílio escolar por número de filhos.

Classe (Nº de filhos) Fi

1 52

2 38

3 18

4 12

Soma 120

Tabela: distribuição de frequência referente à famílias que receberam auxílio por número de
filhos.
Paulo Henrique Coelho Maranhã e Rafael Monteiro.

Elementos da distribuição de
frequência
Frequência simples
A frequência simples, representada por fi indica a ocorrência de vezes
que um elemento aparece em uma observação estatística. Por exemplo,
um profissional de saúde coletou a idade dos 25 infectados por uma
doença e organizou da seguinte forma:

20 25 45
20 25 45

20 25 45

20 30 45

20 30 45

Tabela: Frequência simples.


Paulo Henrique Coelho Maranhã e Rafael Monteiro.

Idade (xi) frequência (fi)

20 5

25 3

30 2

45 5

50 4

Tabela: Métodos de avaliação e consumo de alimentos.


Paulo Henrique Coelho Maranhã e Rafael Monteiro.

A partir a coleta de dados, o profissional da saúde pode realizar a


tabulação, em que cada elemento é ordenado na coluna Idade, chamada
de xi, e cada ocorrência deste elemento será inserido na coluna
frequência simples (fi).

Após a conclusão da tabela, precisamos realizar o somatório da coluna


fi. Para isso, utilizamos o símbolo ∑ (sigma) que representa uma auto
soma dos elementos. Assim, podemos dizer que o somatório da
frequência simples (∑fi) será 25.

Limites de classe
Há várias formas de expressar os limites de classe em uma distribuição
de frequência. O limite à esquerda é chamado de limite inferior (Li) e o
limite à direita é chamado de limite superior (Ls) da classe. Vejamos
alguns exemplos:

looks_one
Li |---| Ls: indica uma classe que é fechada à esquerda e à direita, em que
os limites inferior e superior estão incluídos na classe.

looks_two
Li |--- Ls: indica uma classe que é fechada à esquerda e aberta à direita,
ou seja, o limite inferior está incluído na classe, mas o limite superior
não.

looks_3
Li ---| Ls: indica uma classe que é fechada à direita e aberta à esquerda,
ou seja, o limite superior está incluído na classe, mas o limite inferior
não.

Dentre os limites de classes apresentados, o mais utilizado é o da letra


B, isto é, fechada à esquerda e aberta à direita.

Amplitude de classe (AC)


É a diferença entre o limite superior e o limite inferior da classe.

Ponto médio da classe (Xi)

É a média aritmética entre o limite inferior e o limite superior da classe:


2 |---4. Logo o ponto médio dessa classe será:

2 + 4
Xi = = 3
2

OBS: No cálculo do ponto médio da classe (Xi), os limites superior e

inferior são considerados, independentemente da classe ser fechada ou


aberta nos limites Li ou Ls.

Frequência Relativa (F I% )
A frequência relativa apresenta seus elementos em forma de
porcentagem. Para isso, temos uma fórmula:

fi
fr = x100
i
n

Neste caso, temos a divisão de cada um dos elementos da série pelo


total de elementos. Esse resultado apresenta a participação percentual
do elemento. Assim, teremos a tabela de distribuição de frequência com
a inclusão da coluna frequência relativa (fri). Para entendermos vamos
voltar ao exemplo dado anteriormente do profissional de saúde que
coletou a idade dos 25 infectados por uma doença.

A seguir vemos os dados organizados em uma tabela com os valores de


frequência absoluta (fi) e frequência relativa (fri%):
Frequência relativa
Idade frequência (fi)
(fri) %

20 5 20

25 3 12

30 2 8

45 5 20

50 4 16

60 6 24

∑fi = 25 ∑fri = 100%

Tabela: Frequência absoluta x Frequência relativa.


Paulo Henrique Coelho Maranhã e Rafael Monteiro.

Mas como conseguimos chegar nos valores da frequência relativa?

Para chegar ao valor da frequência relativa, devemos primeiro somar as


frequências absolutas, no exemplo o somatório é 25, esse é o nosso “n”
na fórmula. Em seguida, devemos aplicar a fórmula para cada valor de
frequência absoluta encontrada, ficando:

f1 5
fr = = = 0, 20 × 100 = 20%
1
n 25

f2 3
fr = = = 0, 12 × 100 = 12%
2
n 25
f1 2
fr = = = 0, 08 × 100 = 8%
3
n 25

f1 5
fr = = = 0, 20 × 100 = 20%
4
n 25

f1 4
f r5 = = = 0, 16 × 100 = 16%
n 25
f1 6
fr = = = 0, 24 × 100 = 24%
6
n 25

O resultado do somatório da coluna fri será um valor igual ou próximo


de 100%.

Frequência Acumulada (F AC )
É a soma da frequência simples deste elemento com a frequência
simples dos elementos que o antecedem. Ele é utilizado para apresentar
o valor acumulado das frequências.

A frequência simples acumulada é representada por Fi (F maiúsculo).

Já a frequência relativa acumulada é representada por Fri (F também


maiúsculo).

Assim, teremos:
Fi = frequência simples acumulada;
Fi=f1+f2+f3+…+fi

Você também pode gostar