Você está na página 1de 59

Curso de Especialização Tecnológica

Técnico/a Especialista em Exercício Físico

Estatística – Aula 1

2022

Prof. Doutora Eliana Carraça


p4890@ulusofona.pt
Conteúdos programáticos
- Objeto da estatística; conceitos básicos

- Medidas de localização central e medidas de dispersão

- Organização e apresentação de dados

- Frequência absoluta e frequência relativa

- Gráfico de barras, histograma e polígono de frequências

- Tabela de frequências acumuladas

- Tipos de gráficos

- Distribuições bidimensionais
Teste (70%)
• 36 questões de escolha múltipla
• 1 questão de desenvolvimento

Avaliação Trabalho de grupo (30%)


• Análise descritiva e inferencial (correlações/
regressões) de uma base de dados no JASP/PSPP
• Entrega de documento word com respostas
fundamentadas
Estatística
Aula 1
Introdução ao pensamento científico
O método científico e a relação com a estatística
Aplicações e funcionalidades da (bio)estatística
População, amostra e indivíduo
Tipos de variáveis

Tabelas de frequências absolutas e relativas


Tabelas de frequências simples e acumuladas
Tabelas de frequências com classes
Representações gráficas associadas
A estatística no exercício físico?

It’s supposed to be STATISTICS, not


SADTISTICS…
A estatística tem por objetivo recolher, organizar, analisar e
interpretar as informações de um problema em estudo para,
assim, auxiliar na tomada de decisão.
https://www.youtube.com/watch?v=C1CJTzjEyDA&t=471s

It’s supposed to be STATISTICS, not


SADTISTICS…
Onde se utiliza a estatística com maior frequência?
- Investigação científica
- Leitura e interpretação de fenómenos (e.g. sondagens,
combate ao viés humano)
- Síntese de informação (e.g. bases de dados,
representações gráficas)
- ...

Ciência

Biologia Matemática Química Física ...


Literacia científica?
Literacia científica? Essencial!
Literacia científica? Essencial!
Muitas vezes acabamos por criar “confusões” e incorretas
interpretações...

Imagens retiradas do programa “Isto é gozar com quem trabalha”


Onde se utiliza a estatística com maior frequência?
- Investigação científica
- Leitura e interpretação de fenómenos (e.g. sondagens,
combate ao viés humano)
- Síntese de informação (e.g. bases de dados,
representações gráficas)
- ...

Que percentagem de informação do mundo que nos


rodeia, conseguimos captar a cada momento?
Que percentagem de informação do mundo que nos
rodeia, conseguimos captar a cada momento?

Por maior que seja o nosso esforço em manter a


nossa atenção/concentração em algo, a
quantidade de informação que conscientemente
analisamos é muito baixa!
Vejamos exemplos deste problema:
Adicionalmente, o Ser Humano tem muitos viés de pensamento...

O caso do formador da Força Aérea O caso da profundidade do rio

Distribuição normal da resposta Diferença entre valor médio e absoluto


Muitas vezes acabamos por criar “confusões” e incorretas
interpretações...
As mesas são iguais?

Ilusão de Mesas Idênticas


Um caso conhecido e muitas vezes utilizado para justificar algo...

Quem não conhece alguém que sempre fumou e nunca teve


cancro do pulmão?

E pelo contrário, quem não conhece alguém que nunca fumou e


teve cancro do pulmão?
Um caso conhecido e muitas vezes utilizado para justificar algo...

Cancro P. Sem cancro P.

Fuma 99 1

Não fuma 1 99

Tabela de dupla entrada - fumar x cancro pulmão


Onde se utiliza a estatística com maior frequência?
- Investigação científica
- Leitura e interpretação de fenómenos (e.g. sondagens,
combate ao viés humano)
- Síntese de informação (e.g. bases de dados;
representações gráficas)
- ...
Exemplo...

Como se encontra o perfil de colesterol HDL dos nossos


utentes? Quantos estão na zona “boa”? E na zona “má”?
Que percentagem de utentes necessita de intervenção para
melhorar este perfil?
HDL
90
80
70
60
Valor de HDL

50
HDL
40
Valor de ref.
30
Média
20
10
0
Vamos tentar aprimorar as nossas capacidades de descrever e
analisar informação, socorrendo-nos da ESTATÍSTICA!
Bibliografia

Maroco, J. & Bispo, R. (2005). Estatística aplicada às Ciências


Sociais e Humanas (2ª Ed.). Climepsi, Lisboa.

Pestana, M. & Gageiro, J. (2014). Análise de dados para ciências


sociais.A complementariedade do SPSS (6ª Ed.). Sílabo, Lisboa.

Singpurwalla, D. (2013). A handbook of statistics (1st Ed.). Open


source at bookboon.com
Terminologia e conceitos estatísticos
A estatística parte da observação de conjuntos a que se dá o nome de
população ou universo estatístico.

A cada um dos elementos dessa população chama-se indivíduo ou


unidade estatística.

A amostra consiste na parte da


população que estamos a estudar e de
População População
onde retiramos a informação. A sua
dimensão é o número de elementos
da amostra.
Amostra
Terminologia e conceitos estatísticos
A característica de uma população, pessoa ou objeto de interesse que se
pretende estudar, chama-se variável estatística.

Esta variável, no caso do Ser Humano, pode assumir várias possibilidades,


de acordo com o objeto de estudo.

Se considerarmos a altura, peso, número de filhos, sexo, estado conjugal e


cor de olhos, verificamos que as primeiras três contém informação
numérica, e são exemplos de variáveis quantitativas (ou numéricas), e as
restantes três não contém informação numérica, sendo variáveis
qualitativas (ou categóricas)
Terminologia e conceitos estatísticos
As variáveis quantitativas podem ser classificadas como:

- Contínuas (ex: peso, altura, IMC…)

- Discretas [ou descontínuas], que só assumem valores inteiros (ex:


frequência semanal, número de filhos…)

As variáveis qualitativas podem ser classificadas como:

- Nominais [sem ordem específica] (ex: género, profissão…)

- Ordinais [em sequência] (ex: faixas etárias, meses do ano…)


Terminologia e conceitos estatísticos
Etapas de um estudo estatístico:

1. Identificação do problema e variáveis de estudo

2. Recolha de dados

3. Síntese dos dados (estatística descritiva)

4. Análise de dados (inferência estatística)

5. Interpretação dos resultados

6. Conclusões
Terminologia e conceitos estatísticos
Etapas de um estudo estatístico:
Que modalidade desportiva
gostaria de praticar aqui no Da
O Ginásio Da Vinci abriu uma nova modalidade Vinci?
desportiva há poucos anos. Como teriam Futebol
Voleibol
procedido para descobrir qual, tendo em conta Andebol
as fases enunciadas? Basquetebol

Modalidade Nº Respostas Percentagem


1.Definir o problema/objetivo e variável(eis)
Futebol 200 18.8%
2.Recolher dados de uma amostra do Da Vinci Voleibol 390 36.7%

3.Contabilizar e sintetizar os dados em Andebol 224 21.0%

tabelas/gráficos Basquetebol 250 23.5%

4.Analisar e interpretar os dados


5.Retirar conclusões Que modalidade foi escolhida?
Terminologia e conceitos estatísticos
Exercício 1

De entre os 2000 atletas de um clube selecionaram-se 70 e


inquiriram-se sobre a modalidade que praticavam.

Considerando estes dados, indique:


a) a população;
R: 2000 atletas de um clube
b) a amostra;
R: 70 atletas desse clube
c) a unidade estatística
R: um atleta
Terminologia e conceitos estatísticos
Exercício 2

A SportTV realizou um inquérito a 5000 sócios e respetivas


famílias no sentido de perceber quais as suas preferências em
relação a modalidades desportivas ainda não incluídas na
transmissão.

Considerando estes dados, indique:


a) a população;
R: sócios da SportTV e respetivas famílias
b) a amostra;
R: 5000 sócios da SportTV e respetivas famílias
c) a unidade estatística
R: um sócio da SportTV e respetivas famílias
Terminologia e conceitos estatísticos
Exercício 3

Classifique cada uma das variáveis a seguir:

i. Volume semanal de treino, em minutos.


R: Quantitativa contínua
ii. Habilitações literárias
R: Qualitativa ordinal
iii. Cor do cabelo do professor de Musculação
R: Qualitativa nominal
iv. Número de vezes que pôs gasolina no último mês
R: Quantitativa discreta
Terminologia e conceitos estatísticos
Exercício 4

Classifique cada uma das variáveis a seguir:

i. Número de chocolates na caixa de After Eights


R: Quantitativa discreta
ii. Etnia da professora de Metodologia das Atividades de Grupo
R: Qualitativa nominal
iii. A lista de videoclips preferidos do(a) namorado(a)
R: Qualitativa ordinal
iv. Número de escadas que subiu no dia anterior
R: Quantitativa discreta
Terminologia e conceitos estatísticos
Exercício 5

Pretende-se abrir uma nova modalidade Zen num Clube de Fitness.


Em que ordem deverão estar os seguintes procedimentos?
a. Decidir qual a modalidade a implementar
b. Fazer um inquérito aos frequentadores do clube acerca da
modalidade que gostariam de ver introduzida.
c. Organizar as respostas ao inquérito numa tabela/gráfico
d. Decidir qual o objetivo do estudo e qual a população/amostra.

D-B -C -A
Organização e Representação de Dados

Estudo
estatístico

Análise preliminar dos


dados

Tabela de
frequências
(distribuição de frequências)
Organização e Representação de Dados
Variáveis discretas:
- Contagem dos valores que se repetem no conjunto de dados
Tabela de
frequências Variáveis contínuas:
- Construção de classes e contagem de valores em cada classe

Permitem:
- Analisar a existência de observações muito diferentes da maioria (possíveis
outliers)
- Simetria/assimetria da distribuição de frequências em relação a um certo valor
ou a uma dada classe
- Localização de valores mais frequentes ou típicos
- Identificação de grupos de unidades estatísticas (clusters)
- Deteção de dados de natureza cronológica (e.g., eventos sazonais,
movimentos oscilatórios)
- Existência de associação linear/não linear entre variáveis
Organização e Representação de Dados
Realizou-se uma competição no ginásio A durante a
Tabela de pandemia. Procurou saber-se quem realizou mais treinos
frequências durante o mês de Março de 2020. As respostas foram as
seguintes:

12 treinos 14 treinos 13 treinos 16 treinos 14 treinos 12 treinos


15 treinos 14 treinos 12 treinos 15 treinos 16 treinos 13 treinos
13 treinos 16 treinos 16 treinos 12 treinos 13 treinos 14 treinos
13 treinos 12 treinos 14 treinos 16 treinos 16 treinos 12 treinos
14 treinos 13 treinos 15 treinos 13 treinos 13 treinos 15 treinos

Para sintetizar os dados, cria-se uma tabela, na qual a primeira variável é a


variável estatística (xi), neste caso, treinos/mês.
Organização e Representação de Dados

Tabela de Frequência absoluta simples (fi): Número de


frequências vezes que o evento (xi) ocorreu num estudo.

Treinos/mês (xi) Nº utentes (fi)


x1 12 6
Contabilizar repetição de x2 13 8
cada valor da variável (fi)
x3 14 6
Somar as frequências x4 15 4
absolutas = N, dimensão x5 16 6
amostral
N total =
6+8+6+4+6=30
Organização e Representação de Dados

Frequência relativa simples (fr): Quociente entre


Tabela de
frequência absoluta e o total de dados N, em décimas
frequências
ou percentagem.

Treinos/mês Nº utentes (fi) fri ou fri (%)


(xi)
x1 12 6 6/30 = 0.20 ou 6/30 x100 = 20%
x2 13 8 8/30 = 0.27 ou 8/30 x100 = 27%
x3 14 6 6/30 = 0.20 ou 6/30 x100 = 20%
x4 15 4 4/30 = 0.13 ou 4/30 x100 = 13%
x5 16 6 6/30 = 0.20 ou 6/30 x100 = 20%
N total = 30 Soma = 1 ou 100%
Organização e Representação de Dados

Frequência absoluta acumulada (Fi): Número


Tabela de que se obtém adicionando a cada frequência absoluta
frequências os valores das frequências anteriores.

Treinos/mês fi fri (%) Fi


x1 12 6 20% 6
x2 13 8 27% 14
x3 14 6 20% 20
x4 15 4 13% 24
x5 16 6 20% 30
Organização e Representação de Dados

Tabela de Frequência relativa acumulada (Fr): Adição em


frequências cadeia do valor de frequência relativa anterior.

Grup Treinos/m fi fri (%) Fi Fri (%)


o ês
1 12 6 20% 6 20%
2 13 8 27% 14 47%
3 14 6 20% 20 67%
4 15 4 13% 24 80%
5 16 6 20% 30 100%
Organização e Representação de Dados

Tabela de Distribuição de frequências com dados agrupados em


frequências classes. Usa-se quando há muitos dados (mais que 25) e com
valores dispersos (variados).

Classificações da avaliação de professores


11.5 6.5 7.5 12.5 9.0
10.1 13.5 7.9 10.3 9.0 Vamos elaborar
o quadro de
14.7 13.1 10.5 10.7 8.8 distribuição de
10.0 10.9 13.2 9.7 11.8 frequências?
15.2 8.0 9.8 11.1 9.1
12.9 12.1 13.9 10.8 14.1
Organização e Representação de Dados

Tabela de Distribuição de frequências com dados agrupados


frequências em classes

Classes fi fri (%) Fi Fri (%)


[6.5; 8.5[ 4 4/30x100=13% 4 13%
[8.5; 10.5[ 9 9/30x100=30% 13 43%
[10.5; 12.5[ 8 8/30x100=27% 21 70%
[12.5; 14.5[ 7 7/30x100=23% 28 93%
Classificações da avaliação de
professores [14.5; 16.5[ 2 2/30x100=7% 30 100%
11.5 6.5 7.5 12.5 9.0
10.1 13.5 7.9 10.3 9.0
14.7 13.1 10.5 10.7 8.8
10.0 10.9 13.2 9.7 11.8
15.2 8.0 9.8 11.1 9.1
12.9 12.1 13.9 10.8 14.1
Organização e Representação de Dados

Tabela de Distribuição de frequências com dados


frequências agrupados em classes

Classes fi fri (%) Fi Fri (%)


Amplitude da classe [6.5; 8.5[ 4 4/30x100=13% 4 13%
>>> 8.5-6.5 = 2 [8.5; 10.5[ 9 9/30x100=30% 13 43%
Ponto Médio da classe [10.5; 12.5[ 8 8/30x100=27% 21 70%
>>> (6.5+8.5)/2 = 7.5 [12.5; 14.5[ 7 7/30x100=23% 28 93%
[14.5; 16.5[ 2 2/30x100=7% 30 100%
Organização e Representação de Dados

Tabela de Distribuição de frequências com dados agrupados


frequências

Considerações para a construção de intervalos:


- O número de classes deverá ser entre 4 e 12
- Todas as classes deverão ter frequência
- As amplitudes das classes deverão, sempre que possível, ser iguais
- Os pontos médios das classes deverão ser de simples cálculo
- Não deverão ser utilizadas, sempre que possível, classes fechadas
- Cada valor de uma variável apenas poderá pertencer a uma classe
Organização e Representação de Dados

Tabela de Distribuição de frequências com dados agrupados


frequências em classes

Então como Regra de Sturges


calculamos o
número de 2K > N
classes, para
uma amostra K = número de classes
de 30 pessoas? N = número total de observações

21 = 2; 22 = 4; 23 = 8; 24 = 16; 25 = 32 > 30

K= 5 classes
Organização e Representação de Dados

Tabela de Distribuição de frequências com dados agrupados


frequências em classes

E como
calculamos a
Amplitude da Classe h
amplitude de Limite superior – Limite Inferior
cada classe? Quantidade de Classes K
Classificações da avaliação de
professores 15.2 – 6.5
11.5 6.5 7.5 12.5 9.0 5
10.1 13.5 7.9 10.3 9.0
14.7 13.1 10.5 10.7 8.8 H = 1.74 arredondando 2
10.0 10.9 13.2 9.7 11.8
15.2 8.0 9.8 11.1 9.1
Atenção: nunca arredondar a amplitude de classe por defeito, pois
12.9 12.1 13.9 10.8 14.1 poderá não permitir inserir todos os dados na tabela.
Aplicações da distribuição de frequências
Representações gráficas
Gráfico circular: Usado com variáveis qualitativas
(categóricas) ou quantitativas discretas; utiliza-se para mostrar
frequências absolutas ou relativas (%).

Classificação do IMC (%) dos


utentes do ginásio Very Fit

10 10
Magreza
25 Normoponderal
Excesso de Peso
55 Obesidade
Representações gráficas
Classificação de IMC (%) dos
utentes do ginásio Very Fit

10 10
Magreza
25 Normoponderal
Excesso de Peso
55 Obesidade

Cuidados a ter:
- Soma das partes deverá ser igual a 100%
- Secções chamadas “outras” não devem ser maiores do que as secções
descritas (i.e., falta de detalhe)
Representações gráficas
Gráfico barras: Usado com variáveis qualitativas
(categóricas) ou quantitativas discretas; utiliza-se para
mostrar frequências absolutas ou relativas (%).
Representações gráficas

Cuidados a ter:
- Confirmar espaçamento das unidades no eixo dos Y
- Ter cuidado na escolha da escala do gráfico
Representações gráficas
Histograma: Representação de eleição para
variáveis numéricas (contínuas); imagem de todos
os grupos ordenados.
Representações gráficas
Nas ordenadas
marcam-se as
frequências Histograma: Altura dos utentes da sala de exercício
60

50

40
Número utentes

30
Total

20

10

0
< -1,5 1,50 a 1,55 1,55 a 1,60 1,60 a 1,65 1,65 a 1,70 1,70 a 1,75 1,75 a 1,80 1,80 a 1,85 1,85 a 1,90 > 1,9

Na realização de um histograma, marcam-se no eixo das abcissas as várias classes da variável


Representações gráficas
Polígono de frequências: Gráfico onde se une os pontos médios
da base superior dos retângulos correspondentes às classes.

O histograma e polígono de frequências indicam:


- Distribuição dos dados (simétrico, enviesado, etc.)
- Quantidade de variabilidade nos dados
- Onde se encontra (aproximadamente) o centro dos dados
Exercícios de aplicação
1. Observou-se o número de horas de treino de utentes numa semana, tendo-se
registado os seguintes valores:

Número de horas de treino


3 5 4 2 3 3 4 4
2 2 4 3 3 3 5 4
2 4 3 3 3 5 2 3

a) Identifique a variável estatística


b) Construa a tabela de frequências
c) Construa o gráfico circular
Exercícios de aplicação
2. A tabela seguinte define a distribuição de frequências absolutas do número de
horas de sono de 30 utentes.
a) Que significado atribui à Nº horas de sono fi
frequência absoluta 7?
[6; 6.5[ 4
b) Relativamente à classe [7; 7.5[, [6.5; 7[ 7
indique o limite inferior, superior [7; 7.5[ 8
e a amplitude.
[7.5; 8[ 6
c) Quantas pessoas dormiram [8; 8.5[ 3
menos de 8 horas? [8.5; 9[ 2

d) Que percentagem de pessoas


dormiram mais de 7 horas e
menos do que 8 horas?
Exercícios de aplicação
3.As idades de 21 utentes da sala de exercício são:

Idades dos Utentes


31 23 40 25 36 37 43

44 50 28 35 37 44 49
52 26 17 21 27 41 48

a) Construa a tabela de frequências considerando as seguintes classes: [17,23[;


[23,29[; [29,35[; [35,41[; [41,47[ 𝑒 [47,53[ .
b) Construa o histograma com polígono de frequências
Exercícios de aplicação
4. O grupo de sócios inscrito no programa de controlo do peso do Ginásio Bfit fez
uma prova de brisk walking/jogging na passadeira tendo a sua velocidade média sido
registada. Construa uma tabela de frequências e utilize a regra de Sturges para o
cálculo de classes a utilizar.

8.2 7.7 6.0 8.7 6.7 9.4 8.6 8.1 8.2 8.1
7.5 5.2 9.4 6.7 8.4 6.6 7.9 8.8 7.7 8.6
7.9 8.3 6.8 8.7 7.8 8.2 7.6 7.2 9.1 7.0
Exercícios de aplicação
5. Observe a tabela relativa aos pesos, em quilogramas, de 50 halteres da sala de
exercício de um ginásio.
Classes fi fr Fr (%)
a) Qual é a percentagem de halteres
com um peso inferior a 15 kg? [3; 6[ 5 10% 10%
[6; 9[ 5 10% 20%
b) A quantos halteres corresponde essa [9; 12[ 10 20% 40%
percentagem?
[12; 15[ 15 30% 70%
c) Construa o respetivo polígono de [15; 18[ 10 20% 90%
frequências. [18; 21[ 5 10% 100%
Total 50 100%
Exercícios de aplicação
6. Complete o seguinte quadro de distribuição de frequências:

x fi fri (%) Fi Fri (%)


1 10
2 50%
3 18 72.5%
4 70
5 8.75%
6
Resolução de problemas aplicados
7. No local onde trabalha foi-lhe pedido que analisasse a distribuição do colesterol
HDL, de forma a compreender a sua relação com a estratificação de doença
cardiovascular (ACSM, 2014). Pediram-lhe que identificasse os utentes por níveis de
HDL, apresentando o grupo mais representativo. Explique, passo a passo, como
procederia para resolver este problema.

Você também pode gostar