Você está na página 1de 58

Universidade Federal de Sergipe

Centro de Cincias Exatas e Tecnologia


Departamento de Engenharia Eltrica
Curso de Engenharia Eltrica

Anlise Estatstica aplicada ao


Desenvolvimento de um website de vendas de
bicicletas personalizadas

Autor: Bruno Barretto Anunciao


Tutora Universitria: Profa . Dra . Ameie Litman
Orientador Industrial: Engo . Dr. Benjamin Chouvion
Orientadora Pedaggica: Profa . MSc. Rassa Bezerra Rocha
So CristvoSE
Outubro / 2016

Esclarecimentos

O presente relatrio foi originalmente escrito ao nal do estgio supervisionado realizado na Capsule tudes Avances, atravs do programa de estgio da Aix-Marseille

Universit - Polytech'Marseille, na cidade de Marselha/Frana, no ano de 2013. O autor


participou, nos anos de 2012 e 2013, do programa de intercmbio BRAFITEC (Brasil
France Ingnieur Technologie), uma cooperao bilateral entre o Brasil e a Frana, mediada pela Coordenao de Aperfeioamento de Pessoal de Nvel Superior (CAPES).
Este documento uma traduo para a lngua portuguesa do referido relatrio, com o
objetivo de atender s exigncias do Departamento de Engenharia Eltrica da Universidade Federal de Sergipe, sendo pr-requisito para a validao de Estgio Supervisionado
em Engenharia Eltrica I. O relatrio original intitula-se Statistical Analysis for the de-

velopment of a customized bicycle selling website .

Bruno B. Anunciao

Universidade Federal de Sergipe


Centro de Cincias Exatas e Tecnologia
Departamento de Engenharia Eltrica
Curso de Engenharia Eltrica

Bruno Barretto Anunciao

Anlise Estatstica aplicada ao Desenvolvimento de


um website de vendas de bicicletas personalizadas

So CristvoSE

ii

BRUNO BARRETTO ANUNCIAO

ANLISE ESTATSTICA APLICADA AO DESENVOLVIMENTO DE UM WEBSITE


DE VENDAS DE BICICLETAS PERSONALIZADAS

Relatrio de Estgio apresentado Aix-Marseille


Universit - Polytech'Marseille e Universidade
Federal de Sergipe, como requisito parcial para
obteno do ttulo de Engenheiro Eletricista.
rea de Concentrao: Anlise Numrica.

Tutora Universitria: Prof . Dr . Ameie Litman

Orientador Industrial: Eng . Dr. Benjamin Chouvion

Orientadora Pedaggica: Prof . MSc. Rassa Bezerra Rocha

So CristvoSE
2016

iii

BRUNO BARRETTO ANUNCIAO

ANLISE ESTATSTICA APLICADA AO DESENVOLVIMENTO DE UM WEBSITE


DE VENDAS DE BICICLETAS PERSONALIZADAS

Relatrio de Estgio apresentado Aix-Marseille


Universit - Polytech'Marseille e Universidade
Federal de Sergipe, como requisito parcial para
obteno do ttulo de Engenheiro Eletricista.
rea de Concentrao: Anlise Numrica.

Aprovado em OUTUBRO de 2016.

BANCA EXAMINADORA

Prof . MSc. Rassa Bezerra Rocha (Orientadora)


Departamento de Engenharia Eltrica
Universidade Federal de Sergipe

Prof . Mateus Ventura Souza


Departamento de Engenharia Eltrica
Universidade Federal de Sergipe

So CristvoSE
2016

iv

 Je vous souhaite des rves n'en plus nir et

l'envie furieuse d'en raliser quelques-uns.


(Jacques Brel)

Agradecimentos

Agradeo aos meus pais, Antonio e Ana Lcia, meus irmos, Felipe e Caio, meus
familiares pelo carinho e que, como meus amigos, me apoiaram integralmente durante
toda minha jornada em Marseille. Agredeo tambm a Rafaela pelo amor e suas palavras
que muito me incentivaram na reformulao deste trabalho.
Je souhaite remercier a le Societ Capsule tudes Avances de m'avoir accept en

tant que stagiaire et m'inclure dans le projet FRAMED

En particulier, M. Benjamin

Chouvion qui, comme tuteur industriel, a eu beaucoup de patience avec mes dicults
rencontres avec la langue franaise. En outre, il a mnag aucun eort pour m'aider lors
de l'elaboration du projet, le partage de ses connaissances mathmatiques et les conseils
donns au cours des mois de travail. Je tiens galment remercier M. Damien Leblond
pour les moments de conversation et ses conseils.
Je souhaite remercier le Dpartement de Microlectronique et des Tlcommunications
de l'Universit Polytech Marseille pour m'accepter comme tudiant d'echange. Surtout,
M. Pierre Sabouroux qui tait toujours prt m'aider dans les matires acadmiques et
en ce qui concerne le stage. Aussi, je veux remercier Mme. Litman qui, comme tuteur
universiaire, a lucid mes doutes lorsque ncessaire.

Agradeo tambm Prof . MSc. Rassa Bezerra Rocha por ter aceitado ser minha
orientadora pedaggica neste trabalho.
Finalmente, registro meus agradecimentos Coordenao de Aperfeioamento de Pessoal de Nvel Superior (CAPES) pelo auxlio nanceiro, o qual viabilizou meus estudos
durante um ano no Departamento de Microeletrnica e Telecomunicaes da Universidade
Politech Marseille, atravs do programa Brasil France Ingnieurs Technologie (BRAFITEC).

vi

Resumo

Este relatrio tcnico uma compilao de um trabalho realizado na empresa CAPSULE tudes Avances, onde foi desenvolvida de uma ferramenta da estimativa de dados,
para auxiliar no dimensionamento de bicicletas de alta performance da marca FRAMED

lanada em 2011 pela prpria empresa. Este documento contm as motivaes para criao desta ferramenta de estimativa de dados, a explanao do contexto matemtico
utilizado no desenvolvimento do projeto, alguns conceitos sobre bicicletas e a descrio
detalhada do mtodo linear de regresso utilizado na criao da ferramenta.
O trabalho baseado em clculos matemticos que tm como objetivo projetar bicicletas atravs de mtodos estatsticos e vend-las online, projetando as melhores bicicletas
para cada cliente, dependendo das suas necessidades, preferncias e caractersticas fsicas.
Ciclistas devem responder a um formulrio online, no qual eles so perguntados algumas medidas do corpo e suas preferncias como ciclistas. Estes dados passam por uma
anlise estatstica e o software sugere uma bicicleta de alta performance personalizada.
Um mnimo de perguntas obrigatrias foi denido e, em sequncia, todo o resto dos dados
pode ser calculado por um sistema linear, construdo atravs de regresso linear.
Aps serem feitas as anlises estatsticas e calculados os dados do dimensionamento
das bicicletas, tais dados so interpretados por um cdigo em PHP e os seus designs so
visualizados online em uma imagem de formato SVG.

Palavras-chave:

Estimativa de dados, Regresso linear, Bicicletas personalizadas, An-

lise estatstica, Projeto Framed.

vii

Abstract

This technical report is the compilation of a project accomplished in the company


CAPSULE tudes Avances, in developing a tool for data estimation, to help in the design

, launched by the company

of custom high performance bicycles of the brand FRAMED

in 2011. This document has the motivations for the creation of that data estimation tool,
mathematical background, used on the development, some theory about bicycles and the
detailed description of the linear regression method used on the creation of this tool.
This project is based on a calculation tool that aims to design bicycles with statistical
methods and sell them on-line, designing the best bike for each customer, depending on
his/her needs, preferences and physical characteristics.
Riders should answer an on-line form, in which they are asked to take measurements
of their body and say their cycling preferences.

This data pass through a statistical

treatment and the software suggests a custom high performance bicycle. A minimum of
obligatory questions were dened and, thereafter, all the rest of data can be calculated
through a linear system, built by linear regressions.
After the statistical treatment and calculating all design dimension, the data are interpreted by a PHP code and the design can be visualized in the browser as a SVG image.

Keywords:

Data estimation, Linear regression, Customized bicycles, Statistical treat-

ment, Framed Project.

Sumrio

Agradecimentos

Resumo

vi

Abstract

vii

Glossrio

Lista de Figuras

xii

Lista de Tabelas

xiii

1 Introduo

1.1

Contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2

Sobre a Capsule-EA

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3

Plano de Trabalho

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Reviso da Literatura
2.1

2.2

Estimadores No Enviesados . . . . . . . . . . . . . . . . . . . . . . . . . .

2.1.1

. . . .

. . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.2.1

Coeciente de Correlao . . . . . . . . . . . . . . . . . . . . . . . .

11

2.2.2

Coeciente de Determinao:

. . . . . . . . . . . . . . . . . . .

13

2.2.3

Erro Mdio Absoluto: MAE . . . . . . . . . . . . . . . . . . . . . .

14

2.2.4

Raiz do Erro Mdio Quadrtico: RMSE

. . . . . . . . . . . . . . .

15

2.2.5

Erro Percentual Absoluto Mdio: MAPA . . . . . . . . . . . . . . .

15

Caractersticas Fundamentais em Estimativa de Parmetros

Modelo de Regresso Linear

viii

R2

2.2.6
2.3

2.4

Mdia Absoluta Normalizada de Erros Grosseiros: MANGE

. . . .

16

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

2.3.1

Road . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

2.3.2

Cross-country (XC) . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

2.3.3

All Mountain

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

Propores do Corpo Humano . . . . . . . . . . . . . . . . . . . . . . . . .

20

Anatomia de Bicicleta

3 Descrio do Algoritmo

22

3.1

Busca da Melhor Sequncia de Equaes

3.2

Busca do Melhor Modelo de Regresso dada uma Sequncia


3.2.1

. . . . . . . . . . . . . . . . . . .

23

. . . . . . . .

25

Etapas do Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . .

26

4 Aplicaes e Resultados

29

4.1

Medidas do Copo Humano . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

4.2

Dimenses da Bicicleta . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

5 Concluses e Trabalhos Futuros

37

Referncias Bibliogrcas

40

A Concepo Online

41

B Denies das Medidas de Bicicletas

43

SUMRIO

Glossrio

Esperana

MAE

Mean Absolute Error

MAPA

Mean Absolute Percent Error

MSE

Mean Squared Error

MANGE

Mean Absolute Normalized Gross Errors

erro estimado

b()

vis do estimador

()

parmetros desconhecidos (vetor)

estimao de parmetros desconhecidos (vetor)

valores observados de

valores estimados de

coeciente de correlao

R2

coeciente de determinao

RMSE

Root Mean Squared Error

SS

sum of squares

SSE

sum of squares error

SSR

regression sum of squares

SST

total sum of squares

SSXX

soma dos quadrados da varivel X

SSY Y

soma dos quadrados da varivel Y

SSXY

soma dos produtos-cruzados de X e Y

SVG

Scalable Vector Graphics

xi

SUMRIO

w(n)

sequncia de rudo conhecida

x(n)

dados observados

xi

valores de X observados (ou medidos)

mdia de

XC

Cross-country

yi

valores de Y observados (ou medidos)

mdia de

yi

valores estimados de Y

WGN

White Gaussian Noise

xi

yi

xii

LISTA DE FIGURAS

Lista de Figuras

1.1

Marca do projeto FRAMED

. . . . . . . . . . . . . . . . . . . . . . . . .

1.2

Modelo de regresso linear do sistema Previso . . . . . . . . . . . . . . . .

2.1

O processo de modelagem (ANG, 2006) . . . . . . . . . . . . . . . . . . . .

2.2

Efeito da combinao de estimadores no enviesados e enviesados (KEY,


2009) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.3

Observao da correlao entre variveis atravs do espalhamento (scatter

plot ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

2.4

Representao das trs modalidades de bicicletas utilizadas no projeto . . .

18

2.5

Nomenclaturas das partes de um quadro de bicicleta

19

2.6

Diferentes modelos antropomtricas do corpo humano baseados em propores

. . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

3.1

Fluxograma do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

4.1

Dimenses do corpo humano utilizadas no estudo: (a) altura do usurio,


(b) comprimento total do corpo, (c) altura entre pernas, (d) comprimento
do brao ao tronco, (e) comprimento antebrao parede, (f ) largura dos
ombros, (g) comprimento dos ps, (h) altura dos joelhos, (i) exibilidade. .

33

A.1

Formulrio preliminar de dimenses

. . . . . . . . . . . . . . . . . . . . .

41

A.2

Desenho de uma bicicleta em formato SVG . . . . . . . . . . . . . . . . . .

42

B.1

Denies das medidas de bicicletas . . . . . . . . . . . . . . . . . . . . . .

43

xiii

LISTA DE TABELAS

Lista de Tabelas

2.1

Valores convencionais de r

. . . . . . . . . . . . . . . . . . . . . . . . . . .

4.1

Base de dados de teste da funo Previso

. . . . . . . . . . . . . . . . . .

30

4.2

Resultados dos erros de regresso da base de dados teste. . . . . . . . . . .

31

4.3

Deteco de outliers para cada varivel. . . . . . . . . . . . . . . . . . . . .

32

4.4

Estimativa de erro das dimenses morfolgicas: comparao entre funes


intuitivas e as obtidas pelo algoritmo otimizado. . . . . . . . . . . . . . . .

4.5

34

Erros absolutos das estimativas das dimenses de bicicletas: resultados dos


estilos XC, All Mountain e Road.

4.6

13

. . . . . . . . . . . . . . . . . . . . . . .

35

Erro relativos das estimativas das dimenses de bicicletas: resultados dos


estilos XC, All Mountain e Road.

. . . . . . . . . . . . . . . . . . . . . . .

36

CAPTULO 1.

INTRODUO

Captulo 1
Introduo
1.1

Contexto

Atualmente, nos grande centros, a mobilidade urbana tornou-se um problema em que


as pessoas perdem muito tempo no trnsito, para deslocamentos de pequenas distncias
e na procura por estacionamentos. Adicionalmente, a conscincia ecolgica leva pessoas
a utilizarem bicicletas para deslocar-se. O uso de bicicletas contribui com a reduo de
consumo de energia, no polui e tambm garante que o ciclista pratique exerccios fsicos,
o faz aumentar a qualidade de vida do indivduo. Apesar de tudo isto, para que a bicicleta
torne-se o meio de transporte principal, ou durante o lazer, preciso que ela seja bem
projetada, confortvel e atenda s necessidades e preferncias do ciclista.
Tradicionalmente, elas so construdas em tamanhos padro, porm estes no podem
atender a qualquer consumidor; pensando nisto e nos amantes do ciclismo (prossionais

(Figura

ou amadores), o projeto FRAMED

1.1) foi criado para modelar bicicletas 

considerando mais de 70 parmetros  para desenvolver geometrias de quadros de bicicletas e testar alguns comportamentos fsicos como conforto, manuseio, transmisso de
fora, acelerao, aerodinmica e peso (CHOUVION, 2013).
Para fazer quadros sob medida, o primeiro passo foi mensurar as dimenses do corpo
de diversos ciclistas, para modelar matematicamente o corpo humano e os quadros de
bicicletas. Basicamente, so utilizados mtodos estatsticos complexos para pr-estimar
caractersticas dos ciclistas e das bicicletas (BARRETTO; CHOUVION, 2013). Os mtodos estatsticos ajudam a projetar bicicletas de alta performance personalizadas, fazendo
com que os ciclistas sintam maior conforto, tornando o ciclismo no s prazeroso durante

CAPTULO 1.

INTRODUO

Figura 1.1: Marca do projeto FRAMED

os momentos de lazer, como tambm durante o deslocamento para o trabalho, escapando


do trfego congestionado, alm da segurana durante as prticas esportivas.

1.2

Sobre a Capsule-EA

Capsule tudes Avances uma jovem e inovadora empresa criada em Janeiro de 2010

pela Sr . Clmence Carpentier e pelo Sr. Julien Bouchez. A empresa oferece servios em
diferentes reas da engenharia, voltados para inovao.

Atravs de slidas parcerias, a

Capsule-EA rene um conjunto de habilidades como projetos, eletrnica, projetos mecnicos, matemticas, anlise de dados e conhecimentos esportivos. A companhia d suporte
a seus clientes durante o desenvolvimento de seus projetos: desde de a denio das etapas
do projeto at o lanamento do produto no mercado.
A empresa tornou-se expert na rea de artigos esportivos e, particularmente, em design
de biciletas. De fato, Capsule colabora com os lderes da indstria de quadros e pedais.
Desde 2011, eles desenvolvem uma ferramenta de clculo, permitindo o dimensionamento e projeto preciso de bicicletas para satisfazer os objetivos tais como peso, aerodinmica, rigidez, conforto e preo. A inovao que a Capsule espera atingir na realizao
do projeto a adaptao bem adequada dos parmetros, a m de responder exatamente
s expectativas dos seus clientes. A Capsule combina suas experincias com uma cultura
de otimizao para promover valor aos seus produtos, garantindo conabilidade devido s
aplicaes de testes cientcos usados no quotidiano da empresa no ambiente industrial.
Aps alguns anos projetando quadros e prottipos para os fabricantes de bicicletas
de ponta, o time Capsule decidiu compartilhar seus conhecimentos e experincias com o

CAPTULO 1.

INTRODUO

grande pblico; ampliando o escritrio de engenharia e criando um novo laboratrio, a


companhia decidiu lanar no mercado uma nova marca de bicicletas personalizadas como
sua atividade principal chamada FRAMED

- Solid Metrics for Serious Riders.

Esse

conceito d a todos os amantes do ciclismo, a possibilidade de possuirem uma bicicleta


com quadro de titnio de alta qualidade que projetada e montada artesanalmente,
perfeitamente adequada s suas anatomias, prticas, preferncias de terrenos e estilos.

1.3

Plano de Trabalho

O projeto Anlise Estatstica aplicada ao Desenvolvimento de um website de vendas

de bicicletas personalizadas foi realizado durante o intercmbio do autor, entre Maro e


Agosto de 2013, tratando-se do desenvolvimento de um algortmo que pudesse ser capaz
de estabelecer uma estratgia inteligente, para escolher limitados parmetros de entrada
fornecidos por um usurio, para garantir preciso e validade das sadas do sistema.

algoritmo teve que otimizar os parmetros de projeto para sintonizar os resultados dos
clculos que foram feitos anteriormente. A maior diculdade do problema era a existncia
de um grande nmero de parmetros de entrada e a otimizo do aspecto multicritrio;
para isso, foi essencial o uso de mtodos estatsticos para estimar tais parmetros, a partir
de um conjunto de dados simples, que pudesse ser fcil de responder em um formulrio

online. O objetivo era criar uma caixa preta que, a partir de uma base de dados e variveis
de valores conhecidos, fosse capaz de fornecer sadas conforme a Figura 1.2.

Base de
Dados
Variveis
Conhecidas

Previso

Modelo de
regresso linear
para cada varivel

Figura 1.2: Modelo de regresso linear do sistema Previso

Essa caixa preta uma ferramenta matemtica que pode ser utilizada para medidas ou
valores de qualquer natureza de variveis, estocados em uma base de dados. As medidas
simples so denidas como variveis conhecidas. A sada da funo fornece o modelo de
regresso, ou estimativa do modelo, para cada uma das variveis no conhecidas.
Para este projeto, foi necessrio modelar as medidas do corpo humano importantes

CAPTULO 1.

INTRODUO

para o dimensionamento de bicicletas e as dimenses de bicicletas, conforme est descrito


no Captulo 4.

Para isto, o cdigo desenvolvido interporla a base de dados utilizando

regresso linear; a regresso foi feita em duas etapas: incialmente foi construdo o modelo
da morfologia do corpo humano; depois o modelo das dimenses de bicicletas  utilizando
o modelo da morfologia do corpo como parmetros conhecidos.
A regresso linear foi utilizada porque era relativamente simples codic-la dentro do
tempo disponvel. Outros mtodos possveis so sugeridos ao nal desse relatrio.

CAPTULO 2.

REVISO DA LITERATURA

Captulo 2
Reviso da Literatura
A modelagem uma forma de representao do mundo real, frequentemente feita
em termos matemticos, do que pode ser traduzido em esquemas de forma a facilitar a
explicao de um comportamento ou um evento. O nvel de complexidade dos modelos
depende do nvel de preciso e necessidade do estudo feito.

A modelagem matemtica

lida com o processo de criao de um modelo que deve ser ento aplicado na soluo de
problemas matemticos (DOOSTI; ASTIANI, 2010). Este processo pode ser representado
no uxograma ilustrado na Figura 2.1.

Figura 2.1: O processo de modelagem (ANG, 2006)

O processo de modelagem matemtica a arte de investigar diferentes situaes em


qualquer rea do conhecimento da vida real, representadas em termos matemticos, explicando e interpretando o caso analisado.

Ele prope conexes entre variveis de um

problema, para estimar dados que no foram observados durante o experimento e/ou no
puderam ser conhecidos. As observaes experimentais, quando inseriras em um contexto

CAPTULO 2.

REVISO DA LITERATURA

cientco, devem, como objetivo fundamental, explicar a relao entre diferentes variveis
que formam parte de um problema. O ato de observar e estocar dados experimentais no
compe um processo cientco. Para ser considerado um processo cientco, necessrio estabelecer relaes, propor explicaes, criar e testar teorias (SCHWAAB; PINTO,
2007).
Para desenvolver um modelo de regresso, seus coecientes deve ser denidos, por
exemplo:

y = a1 xn + a2 xn1 + a3 xn2 + ... + an1 x + an


Na Equao 2.1, todos os

an C,

tais como

que a equao demonstre a relao entre y e x.

n N,

(2.1)

permitem que a lei exista e

Adicionalmente, necessrio medir a

correlao entre as variveis e a qualidade da lei proposta.

Para isto, existem alguns

mtodos estatsticos que sero apresentados nas sees seguintes.

2.1

Estimadores No Enviesados

Estimadores de parmetros desconhecidos tm o objetivo de produzirem valores prximos aos valores verdadeiros, com o menor erro possvel. Matematicamente, um estimador
no enviesado (imparcial, justo, no viciado, no tendencioso ou unbiased ) se

= ,
E()

tal que

a<<b

(2.2)

em que:

E()

a esperana do valor de

(a, b)

indicam o intervalo de possveis valores de

o valor medido, ou conhecido;


o valor estimado de

;
;
.

Um estimador no enviesado no signica, necessariamente, que um bom estimador.


Ele simplesmente garante que, na mdia, ele atingir o valor verdadeiro. Por outro lado,
estimadores viesados (tendenciosos), so caracterizados por um erro sistemtico, o qual

CAPTULO 2.

REVISO DA LITERATURA

presumidamente no deveria estar presente. Um vis persistente resultar sempre em uma


estimativa pobre (KEY, 2009).
Exemplo de estimadores no enviesados para um nvel CC (corrente contnua  em
ingls: DC Bias) em Rudo Gaussiano Branco (White Gaussian Noise ):
Considerando

n = 0, 1, ..., N 1

x(n) = A + w(n)

w(n)

em que A um parmetro a ser estimado e


pode assumir qualquer valor no intervalo
mdia do valor de

x(n)

um sinal WGN. O parmetro

< A < .

Um estimador razovel para a

N 1
1 X
A =
x(n)
N n=0

(2.3)

ou a mdia da amostra. Devido a propriedade linear do operador esperana

= E[ 1
E(A)
N
=

1
N
1
N

N
1
X

x(n)]

n=0
N
1
X

E(x(n))

n=0
N
1
X

n=0

= A

A. O estimador da mdia de amostra portanto,

Sendo

= g(x),

em que

no enviesado.

x = [x(0) x(1) ... x(N 1)]T

=
E()

Z
g(x)p(x; )dx =

possvel que a Equao (2.4), guarde alguns valores de


no prximo exemplo.
Modicando o estimador da mdia de amostra (2.3):

A =

1
2N

PN 1
n=0

x(n)

(2.4)

e no outros, como ilustrado

CAPTULO 2.

REVISO DA LITERATURA

Ento,

= 1A
E(A)
2

em que

=A

se

A=0

6= A

se

A 6= 0

um estimador enviesado.

Alguma vezes, mltiplas estimativas do mesmo parmetro podem estar disponveis,


ou seja,

{1 , 2 , ..., n }.

Um procedimento razovel combinar estas estimativas em uma

melhor, calculando sua mdia:

1X
=
i
n i=1

(2.5)

Assumindo que os estimadores so no enviesados, que possuem a mesma varincia e


no so correlacionados com os outros, ento pode-se calcular a mdia das estimativas;
assim a varincia diminui. Em resumo, se
enviesados, em que

= b(),
= E()

 
,

. Mas se os estimadores forem

ento

X
= 1
E()
i
n i=1
A Figura 2.2 mostra que se o estimador enviesado,
dadeiro valor como denido anteriormente por
Vis do estimador

(2.6)

no

vai convergir para o ver-

b().

= b().
= E()

Estes dois exemplos simples mostram a importncia da escolha de um bom modelo


de estimativas, que pode reduzir os vis durante a estimativa de parmetros, para que o
resultado seja mais consistente. A busca por um estimador tem que ter como objetivo
estimar valores prximos dos valores medidos.

2.1.1 Caractersticas Fundamentais em Estimativa de Parmetros


Os processos de estimativas de parmetros consistem no uso de um modelo como
referncia e variam os parmetros at as previses se tornarem to prximas quanto
possvel dos dados experimentais, respeitando as incertezas das medidas (SCHWAAB;
PINTO, 2007).

CAPTULO 2.

REVISO DA LITERATURA

^
p()

^
p()

n incrementos
^

(a) Estimador no enviesado


^
p()

^
p()

n incrementos

^
E()

^
E()

(b) Estimador enviesado

Figura 2.2: Efeito da combinao de estimadores no enviesados e enviesados (KEY, 2009)

Existem algumas observaes que devem ser feitas durante o processo de estimao
de parmetros, para que seja possvel haver resultados mais conveis em um estudo de
modelo de regresso:

(a) Modelo de referncia: o incio para o pesquisador, onde ele deve fazer as anlises
das observaes experimentais. Os dados devem ajustar-se ao modelo e explicaes
devem ser feitas a partir dele;

(b) Os parmetros do modelo so variados, durante o processo de estimao de dados,


para que seja possvel observar como se comportam as variveis conhecidas. Durante
a estimativa de parmetros, vrias simulaes das condies do experimento podem
ser feitas com diferentes bases de dados;

(c) Como o modelo deve ser to prximo quanto possvel dos dados experimentais, a
qualidade da estimativa deve ser mensurada, ou seja, o quo prximos so os dados
estimados dos dados observados. Alguns modelos podem ser testados, mas o melhor
deve no somente prever dados prximos aos dados medidos, como tambm o mais
prximo possvel;

(d) Erros durante as medies (incertezas) devem ser respeitados e muito importante
saber que estes erros inuenciam durante o processo de estimativa de parmetros. Tais

CAPTULO 2.

10

REVISO DA LITERATURA

erros daro o grau de incerteza do modelo, como tambm das sadas (estimativas) do
sistema.

Estimando os parmetros

de um vetor com n -dimenses, a partir de um dado sis-

tema, com p observaes destes parmetros e estocados em um vetor observao com

p -dimenses, produz-se um vetor erro com n -dimenses. Os erros so referidos a:

erro =

Os modelos de estimao de parmetros, no que concerne aos erros, o objetivo

encontrar o erro mais prximo possvel de zero. Na prxima seo ser descrito o modelo
de regresso linear, o modelo usado no projeto deste relatrio.

2.2

Modelo de Regresso Linear

Muitas vezes, a posio de dados experimentais em um diagrama de disperso sugere


a existncia de uma relao fundamental entre as variveis, com isto, pode-se propor
que haja uma maneira de determinar a funo que expressa tal relao  a chamada
regresso. Se dados experimentais apresentam uma relao entre x e y, a variao dessa
relao pode ser apresentada em uma curva de regresso e ajuste. Uma parte da variao,
no entanto, no possui explicaes e isso atribudo ao acaso.

Em outras palavras,

assumido que exista uma funo matemtica que justique grande parte da disperso de
uma varivel em funo de outra. Os dados experimentais utuam em torno da curva que
representa a funo, devido existncia de uma variao adicional aleatria, chamada
variao residual.
Obviamente, tudo mais simples se a curva de regresso linear for conhecida.

problema ca ento reduzido estimao de parmetros. Este caso ocorre quando existem
razes tericas que permitem saber, antecipadamente, a qual modelo o comportamento
das variveis se adapta. Um exemplo pode ser a relao

voltagem vs. corrente em um

diodo, em diferentes regies de operao: regio de polarizao direta, polarizao reversa


e regio de ruptura (breakdown ).

Cada uma possui diferentes comportamentos e, para

cara regio, existe um modelo diferente.


No caso de uma curva desconhecida, ela inferida a partir dos parmetros observados.
necessrio, no somente estimar os parmetros, bem como seu modelo de regresso.
Neste relatrio apresentado apenas o modelo de regresso linear, uma vez que foi o
modelo utilizado no projeto.

CAPTULO 2.

11

REVISO DA LITERATURA

Regresso linear uma tcnica estatstica que correlaciona a variao de uma (ou
mais) varivel(eis) independente(s) com uma varivel dependente. Por exemplo, a relao
entre o nmero de carros em uma cidade ao poder econmico da sociedade daquela cidade
e o nmero de adultos da mesma cidade.
Antes de ajustar o modelo linear aos dados observados, importante determinar
quando existe, ou no, uma relao entre a variao dos dados no caso analisado. Ainda
utilizando o exemplo citado anteriormente, quo fortemente o nmero de carros est relacionado ao poder econmico, ou ao nmero de adultos? Mas se o pesquisador decidir
estudar outras variveis, como nmero de pes produzidos por dia, como eles estariam
relacionados ao nmero de carros? Para isto, alguns coecientes so usados para medir a
fora e a direo da relao entre as variveis (o grau com que uma varivel tende a variar
quando a outra varia) e a signicncia (ndice da conabilidade de um resultado).
Um modelo de regresso linear pode ser descrito como na Equao (2.1), porm com
todos os expoentes iguais a 1", como na Equao (2.7); sendo um modelo de multipla
regresso linear em que

xn

so variveis independentes e os coecientes

an

so os pesos

que determinam a relao entre as respectivas variveis independentes e dependentes

y = a1 x1 + a2 x2 + a3 x3 + ... + an1 xn1 + an xn + a0

y.

(2.7)

2.2.1 Coeciente de Correlao


A correlao quantica o quo duas variveis, so (ou no) relacionadas. A intensidade
da correlao expressa atravs do coeciente de correlao, que representado pela
letra

r.

Por conveno, os valores podem variar no intervalo

[1, +1].

Uma maneira de

observar a correlao entre as variveis fazendo a anlise visual da disposio dos pontos
no grco, para detectar a relao entre dois conjuntos de dados. Este procedimento
chamado de espalhamento, tambm conhecido como scatter plot, representado na Figura
2.3.
H diferentes tipos de coecientes de correlao, por exemplo, o coeciente de correlao Spearman, ou o coeciente de correlao de Pearson. O primeiro uma medida no
paramtrica de uma dependncia estatstica entre duas variveis. O segundo uma medida de dependncia linear. Eles diferem entre si pelo fato de o coeciente de Spearman
no precisar assumir que as variveis so linearmente relacionadas, enquanto que para

CAPTULO 2.

REVISO DA LITERATURA

(a) Correlao Positiva

(b) Correlao Negativa

(c) Sem correlao

(d) Sem correlao

12

Figura 2.3: Observao da correlao entre variveis atravs do espalhamento (scatter

plot )

calcular o coeciente de Pearson so necessrias trs diferentes somas de quadrados (SS)


(sum of squares ): a soma dos quadrados da varivel X, a soma dos quadrados da varivel
Y e a soma dos produtos-cruzados de XY.
A soma dos quadrados (SS) da varivel X :

SSXX =

(xi x)2

(2.8)

A soma dos quadrados (SS) da varivel Y :

SSY Y =

(yi y)2

(2.9)

E a soma dos produtos-cruzados de XY :

SSXY =
Em que
e

y so

xi

yi

X
(xi x)(yi y)

(2.10)

so os valores observados (ou medidos) de X e Y, respectivamente, e

suas mdias.

CAPTULO 2.

REVISO DA LITERATURA

13

Calculadas as SS, o coeciente de correlao (r ) :

SSXY
r=p
(SSXX )(SSY Y )

(2.11)

O coeciente de correlao separado e trs classicaes, que apontam se as variveis


so franca, moderada ou fortemente correlacionadas, conforme apresentado na Tabela 2.1.

Tabela 2.1: Valores convencionais de r


0 < |r| < 0.3
correlao fraca

0.3 < |r| < 0.7


|r| > 0.7

correlao moderada
correlao forte

2.2.2 Coeciente de Determinao: R2


O coeciente de determinao mede a proporo da variao da varivel de resposta
que explica o modelo; ele o quadrado do valor do coeciente de correlao, logo varia
entre

0 R2 1.

Analogamente a
quando

R2 = 1,

O coeciente arma se um dado valor ajusta-se bem ou no ao modelo.

r,

quando

R2 = 0,

a expresso matemtica no possui valor explicativo;

o modelo explica 100% varivel de resposta.

Seja a Equao (2.12) um modelo que satisfaa s premissas de um modelo linear


clssico e quer-se vericar se x explica y. Seja ento:

Estimativa de

y = x. + 

(2.12)

y = x.

(2.13)

 = y y

(2.14)

y:

Estimativa de erro:

A mdia dos dados observados:

1X
y=
yi
n i=1

(2.15)

CAPTULO 2.

14

REVISO DA LITERATURA

Soma total dos quadrados (SST):

SST =

n
X

(yi y)2

(2.16)

i=1

Soma dos quadrados explicada (SSR):

SSR =

n
X

(
yi y)2

(2.17)

(yi yi )2

(2.18)

i=1

Soma dos quadrados dos resduos (SSE):

SSE =

n
X
i=1

em que

o nmero de observaes.

Dene-se, ento, o

R2

como:

R2 =

SSR
SST

(2.19)

2.2.3 Erro Mdio Absoluto: MAE


O MAE (mean absolute error ) calcula a mdia da magnitude dos erros em um conjunto
de previses, sem considerar as suas direes.

O MAE mede a preciso de variveis

contnuas. Expresso em palavras, o MAE a mdia sobre a amostra de vericao dos


valores absolutos das diferenas das previses e correspondentes observaes. O MAE
um classicador linear, o que signica que a todas as diferenas individuais so atribudas
pesos igualmente na mdia. Este classicador calculado atravs das mdias dos erros
absolutos e mais apropriado quando o custo dos erros de previso proporcional ao
tamanho absoluto do erro de previso.

N
N
1 X
1 X

M AE =
|t t | =
|et |
N t=1
N t=1
Em que

(2.20)

t e t so os valores observados de e seus valores estimados, respectivamente.

CAPTULO 2.

15

REVISO DA LITERATURA

2.2.4 Raiz do Erro Mdio Quadrtico: RMSE


A RMSE (root mean squared erro ) uma regra de classicao quadrtica que mede
a mdia da magnitude do erro.

Em palavras, a diferena entre a previso e seu valor

observado correspondente so elevadas ao quadrado e ento calculada a mdia sobre


a amostra.

Finalmente calculada a raz quadrada da mdia.

Uma vez que os erros

so quadrados antes de calculadas as mdias, a RMSE d um peso relativamente elevado a grandes erros.

Isto signica que a RMSE mais til quando grandes erros so

particularmente indesejados.

v
u
N
u1 X
t
|t t |2
RM SE =
N t=1

(2.21)

Uma vez que a diviso por N e a raiz quadrada normaliza o erro quadrado total,
segue-se que o erro mdio quadrado (MSE: mean squared error ) e a RMSE vo aumentar
(juntamente com o erro quadrado total) como a varincia associada com a distribuio de
frequncia dos aumentos das magnitudes dos erros (WILLMOTT; MATSUURA, 2005).
O MAE e a RMSE podem ser utilizados juntos para diagnosticar a variao dos erros
em um conjuntos de previses. A RMSE ser sempre maior ou igual ao MAE; a maior
diferena entre estes parmetros que quanto maior for a diferena entre eles, maior ser
a varincia nos erros individuais da amostra. Se RMSE for igual ao MAE, ento todos os
erros possuem a mesma magnitude.
Ambos, MAE e RMSE, podem variar de

[0, [.

Eles so indicadores de orientao

negativa: menores valores indicam melhores resultados.

2.2.5 Erro Percentual Absoluto Mdio: MAPA


Os MAPA (mean absolute percent error ) possuem a vantagem de serem escalados de
forma independente, ento eles so frequentemente utilizados para comparar performance
de previses entre diferentes sries de dados. A mtrica mais comumente utilizada :

N
1 X t t
M AP A =
|
|
N t=1
t

(2.22)

Medidas baseadas em erros percentuais tm a desvantagem de serem innitas ou indenidas se existirem valores nulos na srie, como frequente em dados intermitentes. Alm

CAPTULO 2.

REVISO DA LITERATURA

16

disso, erros percentuais podem haver uma distribuio extrema em vieses, quando valores
reais so prximos a zero. Com demanda de dados intermitente, impossvel utilizar o
MAPA devido s ocorrncias de de zeros peridicos (HYNDMAN, 2006).

2.2.6 Mdia Absoluta Normalizada de Erros Grosseiros: MANGE


A MANGE (mean absolute normalized gross error ) quantica o desvio absoluto mdio
dos resduos (erros), indicando a discrepncia absoluta mdia entre estimativas horrias e
observaes, sendo calculado para todos os pares. Erro grosseiro uma medida robusta do
desempenho geral do modelo e fornece uma base til para comparao entre simulaes de
modelo atravs de diferentes conjuntos de modelos ou eventos. A no ser que calculado
para localizaes especcas ou intervalos de tempo, as estimativas de erros grosseiros
no fornecem informaes diretas sobre erros sub-regionais ou sobre ocorrncia de notria
discrepncia no interior de pores de um ciclo.

N
1 X |t t |
100%
M AN GE =
N t=1
t

2.3

(2.23)

Anatomia de Bicicleta

A bicicleta original era nada mais que duas rodas de madeira conectadas a um pedal
de madeira. Atravs do tempo, engenheiros e ciclistas, com destacadas necessidades, foram capazes de criar bicicletas mais sosticadas, com mecanismos de direo, sistemas
de trao, freios e pneus inveis. Estas inovaes permitiram que as bicicletas se tornassem veculos rpidos, que podem se mover em lugares onde frequentemente carros no
conseguem e ainda exigem pouco esforo do ciclista.
Apesar de as bicicletas serem, essencialmente, mquinas simples, muitas pesquisas e
desenvolvimento esto presentes nas suas estruturas de design e seus acessrios, os quais
melhorias contriburam para o aumento de performance, conforto e segurana aos ciclistas
(LINHARES, 2006). Para alcanar um grande nmero de usurios, os produtores vendem
bicicletas voltadas a diferentes estilos e preferncias dos usurios. Existem alguns tipos
de bicicletas no mercado, dentre os quais foram escolhidos trs estilos principais para o

: road, cross-country e all mountain.

Projeto FRAMED

CAPTULO 2.

17

REVISO DA LITERATURA

2.3.1 Road
Originalmente indicadas para corridas, so bicicletas desenhadas para pedalar em uma
superfcie pavimentada, aonde os pneus no perdem o contato com o solo; elas tambm
so muito populares em pedaladas casuais e exerccios em terrenos suaves. Elas so leves
no peso  tipicamente menos de 11 kg , geralmente circulam em pneus de alta presso
estreitos e possuem guido drop.

Embora a maioria das bicicletas tipo road possuam

um sistema de engrenagens, com uma tendncia de adicionar mais engrenagens, uma


recente tendncia tem sido bicicletas com engrenagem xa. Sua simplicidade atraente,
sem engrenagens para trocar e sem freios na roda da frente.

De fato, estas mquinas

so, essencialmente, bicicletas tipo track racing, feitas para serem utilizadas no asfalto,
adicionando freios dianteiros. Mais prtica a single-speed que utiliza pelo menos uma
roda livre, embora sem engrenagens multi-velocidades e possui frios em ambas as rodas
dianteira e traseira.

A maioria das bicicletas nesta categoria pode ser utilizada de um

modo ou de outro: elas possuem dois freios e roda traseira reversvel, com uma roda livre
em um lado e uma roda dentada xa na outra (PLAS; BAIRD, 2010).

2.3.2 Cross-country (XC)


So bicicletas destinadas ao ciclismo em superfcies pavimentadas em que os pneus
no perdem o contato com o solo, pequenas pedras e trilhas com grau moderado, trilhas
difceis, pequenos obstculos, bem como terrenos suaves; incluindo reas onde pode haver
perda momentnea do contato entre os pneus e o solo. As biciletas cross-country possuem
suspenso dianteira e no so projetadas para saltos e acrobacias (SPECIALIZED, 2007).

2.3.3 All Mountain


Primeiramente desenvolvias, como sugere o nome, para subir ou descer montanhas.
Elas tambm provaram ser teis para andar em condies que causam menos exausto
dos ciclistas.

Elas possuem pneus largos, guides planos e muitas engrenagens.

Alm

disso, a maioria das mountain bikes possuem suspenso tanto na roda dianteira, como
na traseira. (PLAS; BAIRD, 2010). All mountain so mais robustas que cross-country
e possuem componentes mais resistentes que as bicicletas do modelo XC, enquanto que
promovem o peso total adequado para subir e descer em tipos de terrenos variveis. a

CAPTULO 2.

18

REVISO DA LITERATURA

forma mais comum de pedalar em montanhas.


A Figura 2.4 representa os trs modalidades de bicicletas usadas neste estudo.

(a) Modalidade Road

(b) Modalidade Cross-country

(c) Modalidade All Mountain


Figura 2.4: Representao das trs modalidades de bicicletas utilizadas no projeto

Como disseram Van der Plas e Baird,


projeto de bicicleta, assim como qualquer outra forma de projeto de engenharia, um ato de equilbrio. Primeiramente o
projetista deve identicar qual a forma de utilizao e tipo
de usurio para os quais a mquina destinada.

Ento, o

objetivo mais importante deve ser denido: deveriam todas


as bicicletas acima serem rpidas, leves, confortveis, durveis, compactas, dobrvel, bonitas, baratas ou o-qu-vocquer? Ento outro critrio deve ser ponderado e comparado:
para que seja um produto durvel, preciso que haja mais
massa?

Quo pesadas as bicicletas, os compradores aceita-

ro? Se para manter o preo da bicicleta baixo, ela deve se


tornar menos confortvel, como iro se sentir os compradores
e como pouco conforto ser tolervel?

Quanto mais pesado

ser OK no quesito durabilidade, ou quanto menos confortvel para manter o preo baixo? (PLAS; BAIRD, 2010, p. 75)

Todas estas so perguntas que todos os fabricantes deve fazer a si prprios para saber

CAPTULO 2.

REVISO DA LITERATURA

a forma de melhor agradarem seus clientes.

19

Por isso, cada parte da bicicleta deve ser

levada em considerao e o equilbrio deve ser avaliado. Em linhas gerais, bicicletas so


compostas pelo quadro (o principal componente de uma bicicleta), rodas, freios, sistema
de engrenagens, sistema de transmisso, sistema de direo, selim e espigo do selim,
suspenses e acessrios.

Como o quadro a parte mais importante da bicicleta, esse

merece uma ateno especial. Ele pode ser subdividido como mostra a Figura 2.5.

Figura 2.5: Nomenclaturas das partes de um quadro de bicicleta

As medidas de bicicleta que denem a geometria do quadro usado como variveis de


anlise no algoritmo so:
(a) Recuo do selim livre: a distncia horizontal da ponta dianteira da sela at o centro do
eixo dos pedais (bottom bracket ), quando o ciclista no est sobre a bicicleta. Valores
negativos signicam que a sela est avanada em relao ao eixo dos pedais;

(b) Recuo do selim esttico: a distncia horizontal da ponta dianteira da sela at o centro
do eixo dos pedais, quando o ciclista est sobre a bicicleta. O ajuste errado da posio
do selim, pode gerar problemas fsicos: o selim muito baixo pode causar problemas
nos joelhos e coxas. Inexo dos joelhos aumentam e os quadrceps cam sujeitos a
uma carga maior. Se o selim posicionado muito alto, ele pode pode causar problemas
na musculatura das ndegas e na musculatura posterior da coxa (jarrete);

(c) Guido: Distncia horizontal do nariz do selim ao centro da braadeira do guido;

(d) Pedal ao selim: a distncia do centro do eixo dos pedais ao centro horizontal do perl
do selim;

CAPTULO 2.

REVISO DA LITERATURA

20

(e) Pedal ao recuo do selim esttico: distncia entre o pedal e o recuo do selim, quando
o ciclista est sobre a bicicleta;

(f ) Manopla livre: distncia vertical entre a ponta dianteira do selim e o centro da manopla grip quando o ciclista no est sobre a bicicleta;

(g) Manopla esttica: distncia vertical entre a ponta dianteira do selim e o centro da
manopla grip quando o ciclista est sobre a bicicleta.

As outras dimenses da bicicleta e os parmetros tais como conforto, aerodinmica,


analise de deformao, rigidez, so calculados em outros blocos do software do Projeto
FRAMED

que no zeram parte do plano de estgio. No Apndice

B so apresentadas

as dimenses de bicicletas de forma esquemtica.

2.4

Propores do Corpo Humano

Os estudos das propores do corpo humano atraem a humanidade h muito tempo


na histria.

O modelo utilizado no Antigo Egito foi baseado na medida da distncia

entre o solo e o tornozelo como unidade.

O povo egpcio encontrou propores que se

relacionavam com esta unidade. Alguns sculos depois, ainda no Egito, um novo modelo
foi proposto; o comprimento do dedo do mdio foi utilizado. Neste caso, a altura do corpo
era igual a 19 unidades. Algum tempo depois, na Grcia Antiga, Polyclitus, um escultor
ativo entre os anos 460 a.C. e 410 a.C., introduziu como modelo da largura do palmo,
com base dos dedos.
Na Grcia Antiga, as dimenses do corpo humano foram utilizadas como referncia
em grandes construes. Leonardo da Vinci, durante a Renascena (viveu entre 1452 e
1519 d. C.), fez o desenho da gura humana. Ele utilizou as linhas horizontais tangentes
ao topo da cabea e a sola do p e linhas verticais nas pontas dos dedos que formaram o
Homem Vitruviano, baseados nos papeis do arquiteto romano Vitrvius, por volta do ano
15 d.C., que escreveu um tratado sobre seus estudos das propores do corpo humano. Ao
matemtico belga, Quelet, so dados os crditos de criar e disseminar o termo antropometria, aps sua publicao intitulada deAntropometri, de 1870. Do nal do sculo XIX
ao incio do sculo XX, estes estudos tornaram-se utilizados no domnio cientco, quando
eram usados esqueletos de fsseis e pesquisas mdicas, para tentar encontrar diferenas

CAPTULO 2.

21

REVISO DA LITERATURA

fsicas entre indivduos e grupos tnicos, para utilizar esta informao em arquitetura,
urbanismo, design industrial, comunicao visual e projetos de engenharia, objetivando o
melhor ajuste dos produtos do mercado aos seus respectivos usurios em geral (PEQUINI,
2005).
Muitos estudos diferentes sobre distribuio de massa e propores relativas foram
feitos. Apesar das diferenas individuais, existem caractersticas que so comuns a todos os
seres humanos considerados normais: os membros inferiores so mais longos e mais pesados
que os membros superiores, brao maior que o antebrao e outras relaes.

Modelos

modicados da distribuio de massa do corpo humano e da localizao do centro de


massa dos segmentos foram feitos por vrios outros investigadores. lamentvel que, at
os dias atuais, no exista um modelo unicado e universalmente aceito das subdivises em
segmentos do corpo humano. A maioria dos modelos computacionais foram desenvolvidos
com um propsito particular, tais como testes de biodinmica, avaliao de fora ou
fatores humanos de evoluo.
O domnio da antropometria mostra que propores do corpo so utilizados em projetos de ergonomia, porm estes so sempre baseados em uma dimenso, tais como o
tamanho da cabea, centro de massa ou altura total, como mostrado na Figura

2.6.

H = total height

foot width

feet length

Figura 2.6: Diferentes modelos antropomtricas do corpo humano baseados em propores

CAPTULO 3.

22

DESCRIO DO ALGORITMO

Captulo 3
Descrio do Algoritmo
Uma funo de regresso linear genrica foi implementada utilizando Matlab

que

pode estimar um sistema de equaes a partir de uma base de dados, esperando que
haja a mxima reduo de erros. O objetivo da funo desenvolvida obter o modelo de
regresso de vrias variveis. Esse modelo cria um sistema funes/equaes de previses
utilizando uma base de dados importada para o cdigo. A ordem das funes de regresso
dentro do modelo de regresso importante, pois ela inuencia as variveis disponveis
a cada iterao da funo de regresso. O sistema criado tambm estima intervalos de
erros e detecta discrepncias (outliers ) para cada funo de regresso.
As caractersticas gerais desta funo pode ser descritas como segue:

a) As funes de estimativas so criadas a partir das informaes contidas na base de


dados;

b) Para uma dada base de dados, alguns dos dados so impostos como variveis conhecidas
e para as outras variveis, o programa busca o melhor modelo de regresso linear
possvel;

c) O programa estuda independentemente todas as combinaes possveis de entradas e


sadas (denidas pelas variveis) do sistema. Ele desenvolve suas funes de regresso
para todas estas combinaes;

d) As funes de regresso so classicadas em ordem de preciso e o programa escolhe


qual a melhor sequncia de equaes, em termos de reduzir os erros de estimativa;

e) Ento, para a sequncia escolhida, o programa testa dentre as variveis disponveis,

CAPTULO 3.

23

DESCRIO DO ALGORITMO

quais delas geram a melhor funo de regresso.

Na primeira iterao, o programa

somente utiliza as variveis impostas como conhecidas, como possveis entradas. Na


segunda iterao, o programa testa as variveis impostas e a varivel avaliada na
iterao anterior, como possveis entradas e assim por diante.

Para ilustrar a metodologia, seja considerado um exemplo simples. Se o conjunto de


dados possuir trs variveis, supondo-as

i, a, b,

e a varivel

for a varivel imposta como

conhecida, o programa trabalha com a rotina descrita a seguir.

3.1

Busca da Melhor Sequncia de Equaes

Para encontrar a melhor sequncia de equaes, o programa investiga tanto a possibilidade em que

seja a primeira varivel e

a primeira varivel e

a,

a segunda (sequncia `a,

a segunda (sequncia `b,

a').

b'),

como

sendo

O programa cria, por sua vez, as

2
funes de regresso seguintes e estoca os seus coecientes de determinao R .

Sequncia `a, b'


Estas funes so calculadas por vez, como segue:

a = F (i)
b = F (i, a)

denida como funo que cria uma simples, ou vrias, funes de regresso com

todas as combinaes possveis dos seus argumentos. Por exemplo, se

denida

como a funo que cria uma funo de regresso linear simples entre suas entradas
(x1 ,

x2 , . . . , xn )

e sua sada

tal como:

y = G(x1 , x2 , . . . , xn ) = 1 x1 + 2 x2 + + n xn + cst

em que os

so os coecientes da regresso e

ser descrita como:

cst

um termo constante,

pode

CAPTULO 3.

24

DESCRIO DO ALGORITMO

a = F (i) = G(i)
b = F (i, a)

2
R

= 0, 7

(um argumento de entrada),

ento decomposta nos trs clculos a seguir:

b = G(i)

2
R

= 0, 7,

b = G(a)

2
R

= 0, 6,

b = G(i, a)

Os valores de

2
R

R2

= 0, 65.

so calculados para as possveis sadas das funes de regresso,

ou seja, para cada combinao possvel, calculado seu respectivo coeciente de

2
determinao (R ), o que possibilita calcular qual sequncia de variveis possui
maior interesse ao sistema de regresso.

Sequncia `b, a'


Da mesma forma, para a outra possvel sequncia, as trs funes so calculadas
por vez:

b = F (i) = G(i)
a = F (i, b)

2
R

= 0, 7

decomposto em:

a = G(i)

2
R

= 0, 7,

a = G(b)

2
R

= 0, 6,

a = G(i, b)

2
R

= 0, 85.

2
Em cada teste, o mximo R de cada combinao estocado (o
prximo for de

1).

No exemplo, para a Sequncia (`a,

possibilidades em que

b = F (i, a),

b'),

R2

encontrou-se que para as

a que possui o melhor resultado o modelo

ento foi estocado o seu valor correspondente de

R2 ,

no vetor

R2

(0, 7; 0, 7). Ao ter sido feita a mesma anlise para a Sequncia (`b,
para as possibilidades em que

a = G(i, b),

melhor quo mais

a = F (i, b),

estocando ento o vetor

R2

b = G(i),

da sequncia (`a,

a'),

b'):

encontrou-se que

a que possui o melhor resultado o modelo

da sequncia (`b,

a'): (0, 7; 0, 85).

O software

ento opta pela segunda opo, pois os coecientes de correlao correspondentes so


maiores.

CAPTULO 3.

25

DESCRIO DO ALGORITMO

importante lembrar que, assim como a correlao no implica em causalidade, tampouco, um alto ndice

R2

implicar em causalidade. Os tamanhos relativos das somas dos

termos quadrados indicam quo boa a regresso, em termos de ajuste de dados. Se a


regresso for perfeita, todos os resduos so zero, SEE (soma dos quadrados dos resduos)
zero. Se a regresso falhar em sua totalidade, a soma dos quadrados dos resduos igual
a soma total dos quadrados.

3.2

Busca do Melhor Modelo de Regresso dada uma


Sequncia

Uma vez que a melhor sequncia foi encontrada, os dados sero reinterpolados, testando apenas como entradas, as variveis que esto disponveis, utilizando o mtodo de
avaliao estatstica Mdia Absoluta Normalizada de Erros Grosseiros (MANGE, apresentado no subitem 2.2.6. Este coeciente quantica o desvio mdio absoluto dos resduos
e indica a discrepncia absoluta mdia entre os pares estimados e observados.
Utilizando o mesmo exemplo anterior, em que foi encontrado que a melhor sequncia
`b,a', o algoritmo ir ento calcular por vez:

b = F (i) = G(i)
a = F (i, b)

MANGE

= 0, 2

(uma entrada disponvel),

duas entradas disponveis

a = G(i)

MANGE

= 0, 2,

a = G(b)

MANGE

= 0, 4,

a = G(i, b)

MANGE

= 0, 1.

O coeciente MANGE melhor quanto mais prximo de


erros).

(ele um estimador de

A melhor ordem para os coecientes MANGE no necessariamente a mesma

2
2
melhor ordem que os coecientes R . Os coecientes de MANGE e R foram utilizados
em diferentes situaes porque, como dito na subseo 2.2.2,

R2

mede a proporo da

variao da varivel de resposta que explicada pelo modelo. Ele busca por uma regresso
em que os dados se ajustam ao modelo. E, como dito na subseo 2.2.6, MANGE fornece

CAPTULO 3.

26

DESCRIO DO ALGORITMO

uma base til para comparao entre simulaes de modelo atravs de diferentes conjuntos
de simulaes de modelos ou eventos.
A partir dos clculos de MANGE, so ento escolhidas as melhores funes de regresso, as quais fazem estimativas de `a' e `b', em termos de

b = G(i)

a = G(i, b).

Este sistema de equaes, dada a sequncia previamente escolhida, so mais exatos que
qualquer outra possibilidade de sequncia e equaes.
A sada, o sistema de equaes, automaticamente estocada pelo programa feito
em Matlab

em um arquivo externo para que seja posteriormente lido por um outro

software. O programa exporta tambm, para um arquivo texto, as estimativas de erros


(absolutos e percentuais) das funes de regresso e os valores discrepantes (outliers)
detectados, utilizados para criar tais funes que contribuem no surgimento dos maiores
erros. Assim, possvel remover da base de dados medidas que podem ter sido tomadas
de maneira errada, ou aquelas que parecem ser muito imprecisas (que no se ajustam bem
aos modelos de regresso).

3.2.1 Etapas do Algoritmo


A m de dar uma melhor ideia de como funciona o algoritmo, nesta seo apresentado
o passo-a-passo do cdigo:

Funo Previso  Passos:


1) Escolher na base de dados, a lista de variveis conhecidas;

2) Importar o arquivo base de dados:


a) .ods; ou
b) .csv (dados separados por ponto e vrgula).

3) Separar os nomes das variveis dos dados;

4) Buscar a melhor sequncia de equaes que ser posteriormente utilizada na regresso linear:
a) D rtulos para as variveis reais, que possam ser facilmente visualizadas por
letras: de a a z, ento de , A a Z;

CAPTULO 3.

27

DESCRIO DO ALGORITMO

b) Permutar as variveis desconhecidas para obter todas as combinaes possveis;


c) Agrupar as combinaes de variveis desconhecidas e conhecidas.

Em um

primeiro grupo s existe uma entrada (todas as variveis conhecidas) e uma desconhecida. Prximo passo: a sada do lao anterior, serve como entrada juntamente
com as variveis conhecidas, at o lao em que haja apenas uma varivel de sada
com todas as outras como possveis entradas;
d) Como muitas combinaes so repetidas, os grupos do item anterior so
optimizados para reduzir a combinaes nicas. O nmero de testes obedecem lei

N 2
N 1
N (1 + C1N 1 + C2N 1 + ... + Ci1
+ Ci1
+ 1);

em que N o nmero de variveis

e i o grupo de anlise atual;


e) Todas as combinaes possveis so interpoladas e classicadas com o coeciente

R2 .

Monta-se uma matriz com os coecientes

R2

(mesmo com as combinaes

repetidas). Um vetor para cada sequncia testada;


f ) Para a melhor sequncia, escolhido o vetor de sequncias com o maior valor
normalizado.

5) Estudo de Regresso Linear: nessa parte, o nmero de entradas aumenta a cada


lao. As sadas so testadas utilizando somente as variveis disponveis a cada lao.
Obviamente, no primeiro lao, apenas as variveis conhecidas esto disponveis. As
melhores regresses que sero escolhidas so as que possurem o menor MANGE;

6) Escrever um arquivo .txt com as equaes do modelo de regresso, dada a melhor


sequncia de equaes;

7) Calcular as estimativas de erros para cada varivel interpolada;

8) Detectar os dois valores que mais contribuem com os erros (outliers ).

CAPTULO 3.

DESCRIO DO ALGORITMO

28

Para melhor compreenso do passo-a-passo do algoritmo, a Figura 3.1 apresenta o


uxograma do sistema.

Figura 3.1: Fluxograma do sistema

CAPTULO 4.

29

APLICAES E RESULTADOS

Captulo 4
Aplicaes e Resultados
Para testar a funo Previso, foi arbitrado o Sistema de equaes 4.1, em que considerada a varivel  a  como conhecida. Os valores das variveis

b, c, d, e foram calculados

e, com os resultados, montou-se a base de dados apresentada na Tabela

b = 2a +

c = a - 3

4.1.

1.5

(4.1)

d = b + c

e = c + 13
O teste consistiu em utilizar a base de dados da Tabela

4.1 e vericar se a funo

Previso consegue gerar o sistema conhecido (Sistema 4.1). Para haver mais consistncia
de anlise, foi inserido aos parmetros das equaes um valor aleatrio, o qual pode variar
o respectivo parmetro em um intervalo de 2%, como mostrado no Sistema

(4.2). Para

cada parmetro, seu valor randmico diferente.

b = 2(a (a, 2)) + (1.5 (1.5, 2))

c = (a (a, 2)) (3 (3, 2))

(4.2)

d = (b (b, 2)) + (c (c, 2))

e = (c (c, 2)) (13, 2)


A funo

, foi criada em Matlab em que declarada com duas entradas (x, rangeV al):

o valor do parmetro, e o percentual o intervalo do erro, o qual o parmetro pode variar


(no caso proposto, utilizou-se 2%).

CAPTULO 4.

30

APLICAES E RESULTADOS

Tabela 4.1: Base de dados de teste da funo Previso


Id

val1

3.462

-1.969

1.548

11.264

val2

7.495

0.039

7.581

12.877

val3

11.42

1.965

13.324

15.019

val4

15.458

4.084

19.472

16.921

val5

19.209

5.832

25.213

18.636

val6

11

23.594

7.887

31.038

20.697

val7

13

27.292

9.823

37.359

22.549

val8

15

31.018

12.117

42.741

25.431

val9

17

35.037

13.981

49.222

27.200

val10

19

39.663

15.951

56.259

28.952

val11

21

43.156

18.267

60.993

31.193

val12

23

47.245

20.232

67.041

32.738

val13

25

51.144

22.404

73.230

35.776

val14

27

56.034

23.552

79.234

36.343

val15

29

58.726

26.145

85.121

39.019

val16

31

63.612

27.388

91.217

40.325

val17

33

67.617

29.926

96.307

43.513

val18

35

72.691

32.554

105.392

45.369

val19

37

74.671

34.375

109.884

47.207

val20

39

80.475

36.455

118.074

49.888

Buscando pela regresso linear de uma dada base de dados (Tabela 4.1), trs arquivos
retornam na sada do programa.

Frmulas:

= 2.0109*a + 1.234
= 1.5047*b + -3.8598
(4.3)
= 0.50057*b + -3.6985
= -0.1753*a + 0.030054*b + 1.118*c + 13.2443

CAPTULO 4.

31

APLICAES E RESULTADOS

em que a sequncia b, d, c, e a melhor sequncia de maneira a reduzir os erros de


estimativas.

Quando so desenvolvidos os Sistemas

4.1 e

4.3, vem:

b = 2a + 1.5

c = 1a + - 3

(4.4)

d = 3a -1.5

e =a + 10

= 2.0109*a + 1.234
= 3.026*a -2.002
(4.5)
= 1.006*a + -3.08
=1.10011*a + 9.816

Comparando as diferenas entre os coecientes dos Sistemas desenvolvidos

(4.4) e

(4.5), possvel ver que seus valores so prximos.

Erros:

apresenta o erro absoluto comparando os dados estimados com os dados

medidos. Apresenta tambm um intervalo percentual de erro admitido pelo modelo


(Tabela 4.2).

Tabela 4.2: Resultados dos erros de regresso da base de dados teste.

id

Erro Absoluto

Erro Relativo(%)

2.04

1.22

2.96

1.37

1.49

3.41

1.08

0.818

Deteco de valores discrepantes (outliers ):

O arquivo com outliers apresenta, para cada varivel, quais so as duas amostras que
mais inuencia na ocorrncia de erros. Os outliers detectados so apresentados na Tabela
4.3.

CAPTULO 4.

32

APLICAES E RESULTADOS

Tabela 4.3: Deteco de outliers para cada varivel.


nom

Id Erro Max

Id Erro Max-1

val19

val13

val17

val14

val14

val14

val12

val15

Aps o teste, o software desenvolvido pde ser aplicado nos casos de estudo Morpho
(modelando as dimenses do corpo humano) e Fitting (modelado as dimenses de bicicletas, como ser descrito a seguir.

4.1

Medidas do Copo Humano

O critrio usado para criar a base de dados das dimenses do corpo humano foi o
tradicional mtodo antropomtrico de medidas.

Um total de 10 dimenses dos corpos

de homens e mulheres, de p e sentados, foram escolhidas e mais dois parmetros.

As

12 variveis relacionadas sicamente ao ciclista utilizadas no caso estudado so: idade,


gnero, massa do usurio, altura do usurio, comprimento total do corpo, altura entre
pernas, comprimento do brao ao tronco, comprimento antebrao parede, a largura dos
ombros, comprimento dos ps, altura dos joelhos e exibilidade. Estas esto representadas
na Figura 4.1.
Como descrito na subseo 2.4, no foi encontrado um modelo matemtico que pudesse
bem representar as propores do corpo humano em frmulas/equaes satisfatoriamente.
Porm, havia a necessidade de se trabalhar com um modelo que pudesse descrever as
dimenses do corpo em funes de outras. Por essa razo, inicialmente foi proposto um
modelo intuitivo, em que certas dimenses do corpo, so descritas como mostrado no
Sistema

4.6.

CAPTULO 4.

33

APLICAES E RESULTADOS

(a)

(f)

(b)

(d)

(c)

(g)

(h)

(e)

(i)

Figura 4.1: Dimenses do corpo humano utilizadas no estudo: (a) altura do usurio, (b)
comprimento total do corpo, (c) altura entre pernas, (d) comprimento do brao ao tronco,
(e) comprimento antebrao parede, (f ) largura dos ombros, (g) comprimento dos ps,
(h) altura dos joelhos, (i) exibilidade.

comprimento do corpo = f(idade, gnero, altura do usurio)

altura dos joelhos = f(idade, massa, comprimento do brao)

comprimento do brao = f(gnero, altura do usurio, largura

dos ombros)

altura entre as pernas = f(altura total)

largura dos ombros = f(gnero, massa do usurio, comprimento do corpo

comprimento do antebrao = f(gnero, comprimento do brao)

comprimento dos ps = f(gnero, altura dos joelhos, comprimento do corpo)

(4.6)

O modelo intuitivo, porm, no garante qualidade dos resultados, uma vez que no

CAPTULO 4.

34

APLICAES E RESULTADOS

possvel identicar se o modelo descrito no Sistema

4.6 representa a base de dados

elmente. Decidiu-se, portanto, modelar os principais parmetros do corpo humano necessrio para projetar bicicletas  os 12 parmetros mencionados.

, o

Aplicando a funo Previso apresentada no Captulo 3 ao Projeto FRAMED

primeiro passo foi decidir quais as variveis de entrada seriam impostas como conhecidas.
Como o usurio deve responder a um formulrio online, foi preciso escolher as variveis
mais fceis para que o usurio possa preencher o formulrio com seus dados, sem ter
dvidas dos valores.

As mais bvias, para as quais nenhuma medio em particular

necessria so: o gnero do ciclista, sua idade, sua altura e sua massa.
Essas quatro variveis so consideradas como possveis entradas para todos as funes
de regresso.

Gerado o modelo a partir do algoritmo da funo Previso, detalhado

nos captulos anteriores, os resultados de estimativa de erro foram comparados com os


resultados do modelo intuitivo. Na Tabela

4.4, so apresentadas as estimativas de erros

dos dois modelos, levando em considerao as variveis morfolgicas, uma vez que no foi
criado outro modelo intuitivo para as variveis das dimenses de bicicletas.

Tabela 4.4: Estimativa de erro das dimenses morfolgicas: comparao entre funes
intuitivas e as obtidas pelo algoritmo otimizado.
-

Erro Absoluto (mm)

Erro Relativo (%)

Varivel

Intuitivo

Otimizado

Intuitivo

Otimizado

comprimento do corpo

73

69

0.9

0.76

altura dos joelhos

48

51

1.8

1.8

comprimento do brao

92

65

3.1

2.1

altura entre pernas

140

110

2.5

2.0

largura dos ombros

106

60

3.8

3.1

comprimento do antebrao

55

38

2.9

2.0

comprimento dos ps

60

50

3.8

2.5

Acredita-se que a grande diculdade em modelar o corpo humano, est em encontrar


padres da populao de amostragem. Diante dos dados disponveis, foi possvel perceber
um aumento da preciso, quando comparados os modelos intuitivo e o otimizado. O erro
diminuiu em quase todas as variveis do sistema com o modelo otimizado. O algoritmo
tambm desempenha um bom papel nos estudos das dimenses de bicicletas e encontra
erros relativamente pequenos.
Assim, a funo Previso foi utilizada, inicialmente, para estimar as medidas morfolgicas dos ciclistas e ento, as principais dimenses das bicicletas, considerando todas as
dimenses morfolgicas como variveis conhecidas.

CAPTULO 4.

4.2

35

APLICAES E RESULTADOS

Dimenses da Bicicleta

Como mencionado na subseo

cross-country

2.3, trs estilos de bicicletas foram modelados: road,

e all mountain. Foram criadas ento, trs bases de dados diferentes, uma

para cada estilo de bicicleta. Estas bases de dados foram importadas para a funo Previso, utilizando os valores morfolgicos dos ciclistas e valores das dimenses de bicicletas
de cada estilo de bicicleta, na respectiva base de dados.
Como j existe um sistema de equaes, gerado a partir da regresso das variveis
morfolgicas, estas so impostas como variveis conhecidas na regresso das variveis
referentes s dimenses da bicicleta. Foi feita uma regresso para cada modalidade de bicicleta, gerando assim trs sistemas de equaes distintos, utilizando a mesma metodologia
apresentada nos captulos anteriores. Ainda na subseo

2.3, apresentado o conjunto

de variveis utilizado para o dimensionamento de um quadro de bicicleta, utilizado no


algoritmo proposto. Ver Figura

2.5.

As Tabelas 4.5 e 4.6, mostram os erros absolutos e relativos para os trs estilos de
bicicletas de interesse, considerando as 07 variveis geomtricas do quadro de bicicleta.

Tabela 4.5: Erros absolutos das estimativas das dimenses de bicicletas: resultados dos
estilos XC, All Mountain e Road.
-

Erro Absoluto (mm)

Varivel

XC

All Mountain

Road

guido

0.00307

62

25

recuo do selim livre

0.00474

1.19

0.0014

recuo do selim esttico

0.00264

24.6

0.0014

pedal ao recuo do selim esttico

0.00192

5.68e-14

0.0541

pedal ao selim

0.0136

0.00691

0.000505

manopla livre

0.000655

12.4

1.35

manopla esttica

0.00181

0.00876

1.35

Uma das vantagens deste mtodo que o modelo torna-se mais exato toda vez que um
novo usurio registra suas medidas morfolgicas, pois o sistema aumenta o tamanho da
base de dados de entrada e ento, as regresses tornam-se mais precisas, principalmente
em torno do tipo fsico mais frequentemente existente no banco de dados, em termos de
medidas do corpo.

CAPTULO 4.

36

APLICAES E RESULTADOS

Tabela 4.6: Erro relativos das estimativas das dimenses de bicicletas: resultados dos
estilos XC, All Mountain e Road.
-

Erro Relativo (%)

Varivel

XC

All Mountain

Road

guido

0.00252

0.816

0.236

recuo do selim livre

0.012

0.0574

0.000676

recuo do selim esttico

0.00306

1.05

0.000676

pedal ao recuo do selim esttico

0.00276

1.52e-14

0.00397

pedal ao selim

0.00624

0.00441

0.000372

manopla livre

-0.0112

0.0313

-0.578

manopla esttica

-0.0425

-0.00949

-0.578

CAPTULO 5.

CONCLUSES E TRABALHOS FUTUROS

37

Captulo 5
Concluses e Trabalhos Futuros
Regresses so utilizadas para estimar relaes desconhecidas entre variveis, quando
desejado calcular suas variaes em relao s outras. Durante esse processo, o estimador
sempre apresenta erros. um grande desao encontrar um bom modelo, em que os vis
sejam os menores possveis e que seja possvel detectar valores discrepantes (outliers ).
A suposio de que as relaes entre variveis so lineares acontecem, pois esta a
relao no trivial mais simples que se pode imaginar, ento mais fcil trabalhar com
ela.

Alm disso, a relao , pelo menos, aproximadamente linear dentro da faixa de

valores que se tem interesse em trabalhar e, se eles no o so, possvel transformar as


variveis, de modo a lineariz-las.
O algoritmo Previso foi desenvolvido para solucionar problemas de regresso linear.
A aplicao deste mtodo s dimenses morfolgicas e de bicicletas mostrou que ele uma
ferramenta poderosa para estimar, precisamente, diferentes tipos de variveis. Tcnicas
de regresso so teis em muitos domnios e, neste trabalho, foram aplicadas com xito ao

. O estado atual do algoritmo possui, no entanto, algumas limitaes

Projeto FRAMED

e estas podem tornar-se as bases de futuros possveis trabalhos:

Consumo de Tempo.

O tempo de processamento do algoritmo aumenta exponencial-

mente com o aumento do nmero de variveis (devido ao teste de todas as combinaes possveis). O algoritmo pode ser otimizado em outra linguagem, para aumentar
a velocidade de processamento.

Espao Dimensional vs. Nmero de Amostras.

Interpolar dados em um espao mul-

tidimensional requer um nmero mnimo de amostras. A lei que permite regresso

CAPTULO 5.

38

CONCLUSES E TRABALHOS FUTUROS

linear diz que o nmero de amostras deve ser maior que o nmero de entradas
mais um

(i + 1).

(i)

Se isso no verdade, os clculos so impossveis ou no conveis.

Ento o tamanho do banco de dados, denido pelo nmero de amostras, deve ser to
grande quanto possvel, para respeitar essa lei. Alm disso, quanto mais amostras
for possvel ter, melhor a preciso dos dados de sada.

Regresso Linear.

O programa atual considera somente a regresso linear. Alm dos

consideraes j feitas a respeito das facilidades de se trabalhar com modelos lineares, este tipo de regresso foi tambm escolhida pelo tamanho da base de dados de
propriedade da Capsule - EA. Assim que o banco de dados com caractersticas dos
ciclistas crescer consideravelmente, deve-se tentar outros modelos, a m de limitar
erros de estimativa. Sugestes de modelos:

Regresso linear por partes.

A sugesto dividir o espao amostral em al-

guns subdomnios e criar funes de regresso para cada um deles. Supondo


que exista um conjunto de funes de regresso para crianas (idade
e outro para adultos (idade

16),

< 16)

ou um grupo para mulheres e outro para

homens. Anal, o valo mdio da base de dados ser interpretado como valor
timo. Por exemplo, se 70% dos ciclistas registrados no Projeto FRAMED

so homens, em torno dos 40 anos, ento o modelo torna-se mais preciso para
outros homens que tenham em torno dos 40 anos que venham a ser registrados.
Ao separar a base de dados em subgrupos, o sistema pode encontrar valores
timos diferentes, para cada subgrupo;

e 3

ordem polinomial de regresso. Ao invs de um sistema linear (1

or-

dem), uma funo polinomial de ordem maior pode ser utilizada. Por exemplo,

y = G(x1 , x2 )

sendo descrita como:

y = 1 x21 + 2 x22 + 3 x1 x2 + 4 x1 + 5 x2 + cst

(5.1)

com a mesma notao utilizada anteriormente.

Classicao de dados.

Uma vez que o projeto alcance clientes ao redor do mundo,

importante estocar dados em considerando diferenas scio-tnicas dos usurios em

CAPTULO 5.

39

CONCLUSES E TRABALHOS FUTUROS

bases de dados separadas, para evitar interpretaes equivocadas, quando comparando, por exemplo, a altura de holandeses, com as de japoneses.

Medida exibilidade.

Como mostrado na Figura

bilidade possui limitaes no zero.

f lexibilidade = 0,

4.1.(i), a medida morfolgica exi-

Frequentemente os ciclistas alcanam o valor

porm o nmero poderia ser negativo. Como o zero atribudo

ao ciclista que alcana o cho, assim, esta varivel nunca alcana valores negativos.
Isto no permite um modelamento coerente dessa varivel.

Sugere-se ento que

a medida desta varivel seja tomada de forma que o ciclista possa atingir valores
menores que zero.

Referncias Bibliogrcas

ANG, K. C. Mathematical modeling, technology and H3 mathematics. The mathematical


educator. The Mathemntics Educator, 2006.
BARRETTO, B.; CHOUVION, B. Morpho - FRAMED Technical Note. [S.l.], 2013.
CHOUVION, B. Design - FRAMED Technical Note. [S.l.], 2013.
DOOSTI, A.; ASTIANI, A. M. Mathematical modeling: a new approach for mathematics
teaching in dierent levels. II ENREDE, 2010.
HYNDMAN, R. J. Another look at forecast-accurancy metric for intermittent demand.

Foresight, 2006.
KEY, S. M. Fundamentals of Statistical Signal Processing: Estimation Theory. [S.l.]:
Princete Hall, 2009.
LINHARES, R. Conforto da bicicleta de estrada em competies de longa distncia: uma

abordagem ergonmica. Tese (Doutorado)  PUC-RIO, 2006.


PEQUINI, S. M. Ergonomia aplicada ao design de produtos: um estudo de caso sobre

o design de bicicletas. Tese (Doutorado)  Faculdade de Arquitetura e Urbanismo da


Universidade de So Paulo, So Paulo, 2005.
PLAS, R. V. D.; BAIRD, S. Bicycle Technology: Understanding the Modern Bicycle

and Its Components. 2. ed. [S.l.]: Cycle Publishing/Van Der Plas Publications, 2010.
(Cycling Resources Series).
SCHWAAB, M.; PINTO, J. C. Anlise de dados experimentais I  Fundamentos de
estatstica e estimao de parmetros. E-papers, 2007.
SPECIALIZED. Owner's Manual. 9th. ed. [S.l.], 2007.
WILLMOTT, C. J.; MATSUURA, K. Advantages of the mean absolute error (MEA)
over the root mean square error (RMSE) in assessing average model performance.

Climate Research - Clim Res, 2005.

40

APNDICE A.

41

CONCEPO ONLINE

Apndice A
Concepo Online
Aps o modelamento das bicicletas, foi escrito um cdigo que permite desenhar as
bicicletas com suas dimenses.

Utilizando um formulrio com diferentes perguntas, no

qual o usurio deve responder com respostas obrigatrias, o programa exibe uma imagem
preliminar com as dimenses do produto, adequadas quele usurio. H ainda a possibilidade de algum valor ser alterado, caso o cdigo estime errado algum dado, ou o usurio
queira uma dimenso especca para sua bicicleta.
A partir dos dados gerados, o sistema os interpreta e escreve um arquivo em formato

SVG. Um exemplo preliminar do formulrio mencionado exibido na Figura

A.1.

Figura A.1: Formulrio preliminar de dimenses

vender bicicletas customizada online, aps

Como o objetivo do projeto FRAMED

calcular os parmetros das bicicletas e seus modelamentos, o cdigo foi traduzido para a

APNDICE A.

linguagem

42

CONCEPO ONLINE

PHP. O projeto de bicicletas feito em um dataserver e exibido no navegador

de internet, atravs de uma imagem SVG dinmica, com as principais dimenses e os


desenhos das sees dos tubos. Foram inseridos os tubos e suas sees e as rodas, como
mostrado na Figura

A.2.

575.4926465 cm reach

628.29631 cm stack

Figura A.2: Desenho de uma bicicleta em formato SVG

APNDICE B.

DEFINIES DAS MEDIDAS DE BICICLETAS

Apndice B
Denies das Medidas de Bicicletas

Figura B.1: Denies das medidas de bicicletas

43

Você também pode gostar