Escolar Documentos
Profissional Documentos
Cultura Documentos
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Support Vector Clustering na formulao da
segmentao dos consumidores cariocas
sobre o servio de TV Mvel.
Pedro H. M. Albuquerque
Departamento de Administrao
Universidade de Braslia.
03 de Agosto de 2012
1 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Agenda
1 Introduo ao SVC.
2 Aplicao.
3 Concluso.
2 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O SVC (Support Vector Clustering) uma metodologia
derivada do SVM (Support Vector Machine) a qual
oriunda do campo de estudo: Aprendizado Estatstico.
O SVC depende dos seguintes componentes :
1 Uma amostra x
i
R
d
com i = 1, . . . , n para um
conjunto de d variveis. Essa amostra denominada
Espao de Dados.
2 Um Espao de Caracterstica H, de dimenso
superior a d, nesse espao, um ponto amostral x
)
a imagem de x
.
3 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O SVC (Support Vector Clustering) uma metodologia
derivada do SVM (Support Vector Machine) a qual
oriunda do campo de estudo: Aprendizado Estatstico.
O SVC depende dos seguintes componentes :
1 Uma amostra x
i
R
d
com i = 1, . . . , n para um
conjunto de d variveis. Essa amostra denominada
Espao de Dados.
2 Um Espao de Caracterstica H, de dimenso
superior a d, nesse espao, um ponto amostral x
)
a imagem de x
.
3 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O SVC (Support Vector Clustering) uma metodologia
derivada do SVM (Support Vector Machine) a qual
oriunda do campo de estudo: Aprendizado Estatstico.
O SVC depende dos seguintes componentes :
1 Uma amostra x
i
R
d
com i = 1, . . . , n para um
conjunto de d variveis. Essa amostra denominada
Espao de Dados.
2 Um Espao de Caracterstica H, de dimenso
superior a d, nesse espao, um ponto amostral x
)
a imagem de x
.
3 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Dentre as aplicaes utilizando SVC, pode-se citar:
1 Reconhecimento de escrita. [Chiang and Hao, 2003].
2 Segmentao de clientes e demonstrao da
superioridade do SVC sobre o K-MEANS e SOFM
(Self-organizing feature map) para os dados
estudados. [Huang et al., 2007].
3 Deteco de invaso de redes computacionais.
[Xu and Zhang, 2005].
4 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Dentre as aplicaes utilizando SVC, pode-se citar:
1 Reconhecimento de escrita. [Chiang and Hao, 2003].
2 Segmentao de clientes e demonstrao da
superioridade do SVC sobre o K-MEANS e SOFM
(Self-organizing feature map) para os dados
estudados. [Huang et al., 2007].
3 Deteco de invaso de redes computacionais.
[Xu and Zhang, 2005].
4 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Dentre as aplicaes utilizando SVC, pode-se citar:
1 Reconhecimento de escrita. [Chiang and Hao, 2003].
2 Segmentao de clientes e demonstrao da
superioridade do SVC sobre o K-MEANS e SOFM
(Self-organizing feature map) para os dados
estudados. [Huang et al., 2007].
3 Deteco de invaso de redes computacionais.
[Xu and Zhang, 2005].
4 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O objetivo do SVC encontrar a menor hiperesfera que
contm os dados em um determinado espao de
caractersticas. Em outras palavras:
Argmin
a
,R
R
2
sujeito a x
i
a
2
R
2
para i = 1, . . . , n.
(1)
5 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
O problema 1 pode ser reescrito na forma:
Argmin
a
,R
R
2
+ C
n
i=1
i
sujeito a x
i
a
2
R
2
+
i
para
i
0 e i = 1, . . . , n.
(2)
onde C um termo de penalizao que controla o trade-off
entre o volume da hiperesfera e a presena de outliers.
Nessa formulao, permite-se que alguns pontos quem
fora da hiperesfera.
9 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Motivado pela facilidade de implementao computacional
o problema 2 pode ser escrito na sua forma Dual,
[Wolfe, 1961]:
Argmin
i=1
i
< x
i
, x
i
>
n
i=1
n
j=1
j
< x
i
, x
j
>
sujeito a
i=1
i
= 1
para 0
i
C e i = 1, . . . , n.
(3)
onde < x
i
, x
j
> representa o produto interno entre os
vetores x
i
e x
j
.
11 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Mas o ideal que os conglomerados sejam formados
segundo alguma geometria arbitrria, nesse caso, faz-se o
mapeamento do vetor de dados x
i
do Espao de Dados
para o Espao de Caractersticas cuja imagem dada por
(x
i
).
Essa no-linearidade da hiperesfera dada pela escolha
de um Kernel que admita uma estrutura no-linear. Em
outras palavras, para n = d = 2 temos x
1
= (x
11
, x
12
) e
x
2
= (x
21
, x
22
):
12 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Mas o ideal que os conglomerados sejam formados
segundo alguma geometria arbitrria, nesse caso, faz-se o
mapeamento do vetor de dados x
i
do Espao de Dados
para o Espao de Caractersticas cuja imagem dada por
(x
i
).
Essa no-linearidade da hiperesfera dada pela escolha
de um Kernel que admita uma estrutura no-linear. Em
outras palavras, para n = d = 2 temos x
1
= (x
11
, x
12
) e
x
2
= (x
21
, x
22
):
12 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x
1
= (x
11
, x
12
) e x
2
= (x
21
, x
22
) tem-se:
Linear: < x
1
..
(x
1
)
, x
2
..
(x
2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x
1
, x
2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,
2x
11
x
12
)
. .
(x
1
)
, (x
2
21
, x
2
22
,
2x
21
x
22
)
. .
(x
2
)
>
Gaussiano: < (x
1
), (x
2
) >=
K
_
(x
1
), (x
2
)
_
= exp
_
x
1
x
2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x
1
= (x
11
, x
12
) e x
2
= (x
21
, x
22
) tem-se:
Linear: < x
1
..
(x
1
)
, x
2
..
(x
2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x
1
, x
2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,
2x
11
x
12
)
. .
(x
1
)
, (x
2
21
, x
2
22
,
2x
21
x
22
)
. .
(x
2
)
>
Gaussiano: < (x
1
), (x
2
) >=
K
_
(x
1
), (x
2
)
_
= exp
_
x
1
x
2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x
1
= (x
11
, x
12
) e x
2
= (x
21
, x
22
) tem-se:
Linear: < x
1
..
(x
1
)
, x
2
..
(x
2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x
1
, x
2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,
2x
11
x
12
)
. .
(x
1
)
, (x
2
21
, x
2
22
,
2x
21
x
22
)
. .
(x
2
)
>
Gaussiano: < (x
1
), (x
2
) >=
K
_
(x
1
), (x
2
)
_
= exp
_
x
1
x
2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x
1
= (x
11
, x
12
) e x
2
= (x
21
, x
22
) tem-se:
Linear: < x
1
..
(x
1
)
, x
2
..
(x
2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x
1
, x
2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,
2x
11
x
12
)
. .
(x
1
)
, (x
2
21
, x
2
22
,
2x
21
x
22
)
. .
(x
2
)
>
Gaussiano: < (x
1
), (x
2
) >=
K
_
(x
1
), (x
2
)
_
= exp
_
x
1
x
2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x
1
= (x
11
, x
12
) e x
2
= (x
21
, x
22
) tem-se:
Linear: < x
1
..
(x
1
)
, x
2
..
(x
2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x
1
, x
2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,
2x
11
x
12
)
. .
(x
1
)
, (x
2
21
, x
2
22
,
2x
21
x
22
)
. .
(x
2
)
>
Gaussiano: < (x
1
), (x
2
) >=
K
_
(x
1
), (x
2
)
_
= exp
_
x
1
x
2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x
1
= (x
11
, x
12
) e x
2
= (x
21
, x
22
) tem-se:
Linear: < x
1
..
(x
1
)
, x
2
..
(x
2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x
1
, x
2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,
2x
11
x
12
)
. .
(x
1
)
, (x
2
21
, x
2
22
,
2x
21
x
22
)
. .
(x
2
)
>
Gaussiano: < (x
1
), (x
2
) >=
K
_
(x
1
), (x
2
)
_
= exp
_
x
1
x
2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x
1
= (x
11
, x
12
) e x
2
= (x
21
, x
22
) tem-se:
Linear: < x
1
..
(x
1
)
, x
2
..
(x
2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x
1
, x
2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,
2x
11
x
12
)
. .
(x
1
)
, (x
2
21
, x
2
22
,
2x
21
x
22
)
. .
(x
2
)
>
Gaussiano: < (x
1
), (x
2
) >=
K
_
(x
1
), (x
2
)
_
= exp
_
x
1
x
2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Como x
1
= (x
11
, x
12
) e x
2
= (x
21
, x
22
) tem-se:
Linear: < x
1
..
(x
1
)
, x
2
..
(x
2
)
>= x
11
x
21
+ x
12
x
22
Polinomial: < x
1
, x
2
>
2
= (x
11
x
21
+ x
12
x
22
)
2
=
x
2
11
x
2
21
+ x
2
11
x
2
21
+ 2x
11
x
21
x
12
x
22
=
< (x
2
11
, x
2
12
,
2x
11
x
12
)
. .
(x
1
)
, (x
2
21
, x
2
22
,
2x
21
x
22
)
. .
(x
2
)
>
Gaussiano: < (x
1
), (x
2
) >=
K
_
(x
1
), (x
2
)
_
= exp
_
x
1
x
2
_
onde o bandwidth que controla o grau de
no-linearidade do Espao de Caractersticas.
13 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j
2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j
2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j
2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j
2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
No caso do Kernel gaussiano, o espao de caractersticas
innito, assuma por simplicidade x R e > 0:
e
x
i
x
j
2
= e
(x
i
x
j
)
2
= e
x
2
i
+2x
i
x
j
x
2
j
=
e
x
2
i
x
2
j
_
1 +
2x
i
x
j
1!
+
(2x
i
x
j
)
2
2!
+
(2x
i
x
j
)
3
3!
+ . . .
_
=
e
x
2
i
x
2
j
_
1 +
_
2
1!
x
i
_
2
1!
x
j
+
_
(2)
2
2!
x
2
i
_
(2)
2
2!
x
2
j
+
+
_
(2)
3
3!
x
3
i
_
(2)
3
3!
x
3
j
+ . . .
_
=< (x
i
), (x
j
) >
onde (x) = e
x
2
_
1,
_
2
1!
x,
_
(2)
2
2!
x
2
,
_
(2)
3
3!
x
3
, . . .
_
14 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Ao solucionar o problema de programao matemtica 3
substituindo o produto interno do Espao de Dados
< x
i
, x
j
> por um produto interno de um Espao de
Caracterstica, < (x
i
), (x
j
) > de dimenso superior ao
conjunto de dados possvel mapear conglomerados de
geometria arbitrria.
Mtodos como a anlise de conglomerados hierrquica
tendem a gerar conglomerados frequentemente limitados a
hiperelipsides ([Jain and Dubes, 1988]), enquanto o SVC
permite a formulao de clusters com geometria arbitrria.
15 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
Ao solucionar o problema de programao matemtica 3
substituindo o produto interno do Espao de Dados
< x
i
, x
j
> por um produto interno de um Espao de
Caracterstica, < (x
i
), (x
j
) > de dimenso superior ao
conjunto de dados possvel mapear conglomerados de
geometria arbitrria.
Mtodos como a anlise de conglomerados hierrquica
tendem a gerar conglomerados frequentemente limitados a
hiperelipsides ([Jain and Dubes, 1988]), enquanto o SVC
permite a formulao de clusters com geometria arbitrria.
15 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
As solues nesse novo espao seguem uma forma
no-paramtrica para a estimao de densidades do
conjunto de dados originais.
Assim, os conglomerados so gerados pelos conjuntos de
dados onde h maior massa de probabilidade e os vales
entre essas massas representariam a separao entre os
conglomerados.
18 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Introduo ao SVC.
As solues nesse novo espao seguem uma forma
no-paramtrica para a estimao de densidades do
conjunto de dados originais.
Assim, os conglomerados so gerados pelos conjuntos de
dados onde h maior massa de probabilidade e os vales
entre essas massas representariam a separao entre os
conglomerados.
18 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
A utilizao do SVC como mecanismo de segmentao da
clientela foi utilizado para o conjunto de dados de uma
pesquisa realizada no Rio de Janeiro entre os dias 08 e
20 de maio de 2008, para um total de 1000
entrevistados.
O objetivo inicial da pesquisa era a identicao do
potencial de consumo da tecnologia de TV mvel na
cidade do Rio de Janeiro, de modo a identicar, controlar e
analisar o conjunto de variveis sobre a pr-disposio dos
potenciais compradores de aparelhos celulares compatveis
com esta tecnologia.
20 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
A utilizao do SVC como mecanismo de segmentao da
clientela foi utilizado para o conjunto de dados de uma
pesquisa realizada no Rio de Janeiro entre os dias 08 e
20 de maio de 2008, para um total de 1000
entrevistados.
O objetivo inicial da pesquisa era a identicao do
potencial de consumo da tecnologia de TV mvel na
cidade do Rio de Janeiro, de modo a identicar, controlar e
analisar o conjunto de variveis sobre a pr-disposio dos
potenciais compradores de aparelhos celulares compatveis
com esta tecnologia.
20 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Com base nessas informaes, procedeu-se com a anlise
SVC para a elaborao de grupos homogneos
internamente com o intuito de segmentar a clientela,
tratando assim, a heterogeneidade presente no perl
desses consumidores entrevistados.
Para os parmetros do SVC xou-se C = 1 uma vez que
no seria interessante a obteno de pontos do tipo
Bounded Support Vector, mas somente observaes que
estivessem contidas na hiperesfera do espao de
caracterstica ou fossem pontos de suporte vetorial, ou
seja, Support Vectors [Ben-Hur et al., 2002].
21 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Com base nessas informaes, procedeu-se com a anlise
SVC para a elaborao de grupos homogneos
internamente com o intuito de segmentar a clientela,
tratando assim, a heterogeneidade presente no perl
desses consumidores entrevistados.
Para os parmetros do SVC xou-se C = 1 uma vez que
no seria interessante a obteno de pontos do tipo
Bounded Support Vector, mas somente observaes que
estivessem contidas na hiperesfera do espao de
caracterstica ou fossem pontos de suporte vetorial, ou
seja, Support Vectors [Ben-Hur et al., 2002].
21 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Usualmente, utiliza-se como valor para C = 1, j para o
valor de , uma proposta comum percorrer diversos
valores de q a partir de:
=
1
max
i,j
_
_
_
_
x
i
x
j
_
_
_
_
2
(4)
onde
0.00116 apresentado na
equao 4, produzindo assim 20 grupos de
conglomerados com tamanhos que compreendiam desde
apenas 1 conglomerado.
23 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
De maneira a tornar tratvel o problema de segmentao
escolheu-se um valor factvel para o nmeros de clusters,
nesse caso, com = 0.0208 apresentam-se 5
conglomerados, sendo portanto, uma quantia manejvel
de grupos de clientes para a elaborao de polticas de
marketing gerencial.
24 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Uma forma de avaliar a qualidade do mtodo SVC sobre os
algoritmos de anlise de conglomerados tradicionais,
medir a soma total dos quadrados das observaes para
cada um dos agrupamentos como denido em 5:
STQ =
S
s=1
N
(s)
i=1
_
_
_
_
x
(s)
i
x
(s)
_
_
_
_
2
(5)
onde s = 1, . . . , 5 representam os possveis conglomerados
e N
(s)
representa o nmero de observaes no cluster s, x
(s)
i
e x
(s)
representam respectivamente a i-sima observao
do cluster s e a mdia das observaes no s-simo
aglomerado.
25 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Aplicao.
Table: Razo da soma total de quadrados entre os diversos
mtodos de anlise conglomerados.
N/D SVC W. S. Co. A. Mc. M. Ce.
SVC 1 0.93 1.00 0.97 0.98 0.96 0.99 1.00
W. - 1 1.06 1.03 1.05 1.03 1.06 1.07
S. - - 1 0.97 0.98 0.96 0.99 1.00
Co. - - - 1 1.01 0.99 1.02 1.03
A. - - - - 1 0.97 1.00 1.01
Mc. - - - - - 1 1.03 1.03
M. - - - - - - 1 1.00
Ce. - - - - - - - 1
26 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Concluso.
Na aplicao realizada, o SVC mostrou-se competitivo em
relao aos mtodos clssicos de anlise de
conglomerados hierrquicos.
H muito ainda em se desenvolver tanto teoricamente como
empiricamente.
H poucas propostas para determinao dos parmetros de
suavizao (bandwidth ) e o parmetro de penalizao.
Os recentes textos comprovam a superioridade do mtodo
Support Vector Clustering sobre os demais mtodos de
anlise de conglomerados apesar das diculdades
computacionais para a sua implementao.
27 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Concluso.
Na aplicao realizada, o SVC mostrou-se competitivo em
relao aos mtodos clssicos de anlise de
conglomerados hierrquicos.
H muito ainda em se desenvolver tanto teoricamente como
empiricamente.
H poucas propostas para determinao dos parmetros de
suavizao (bandwidth ) e o parmetro de penalizao.
Os recentes textos comprovam a superioridade do mtodo
Support Vector Clustering sobre os demais mtodos de
anlise de conglomerados apesar das diculdades
computacionais para a sua implementao.
27 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Concluso.
Na aplicao realizada, o SVC mostrou-se competitivo em
relao aos mtodos clssicos de anlise de
conglomerados hierrquicos.
H muito ainda em se desenvolver tanto teoricamente como
empiricamente.
H poucas propostas para determinao dos parmetros de
suavizao (bandwidth ) e o parmetro de penalizao.
Os recentes textos comprovam a superioridade do mtodo
Support Vector Clustering sobre os demais mtodos de
anlise de conglomerados apesar das diculdades
computacionais para a sua implementao.
27 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Concluso.
Na aplicao realizada, o SVC mostrou-se competitivo em
relao aos mtodos clssicos de anlise de
conglomerados hierrquicos.
H muito ainda em se desenvolver tanto teoricamente como
empiricamente.
H poucas propostas para determinao dos parmetros de
suavizao (bandwidth ) e o parmetro de penalizao.
Os recentes textos comprovam a superioridade do mtodo
Support Vector Clustering sobre os demais mtodos de
anlise de conglomerados apesar das diculdades
computacionais para a sua implementao.
27 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Agradecimentos.
Essa apresentao foi nanciada pelo Decanato de
Pesquisa e Ps-graduao da Universidade de Braslia.
http://www.unb.br/administracao/decanatos/dpp/
28 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Bibliograa I
Ben-Hur, A., Horn, D., Siegelmann, H. T., and Vapnik, V.
(2002).
Support vector clustering.
J. Mach. Learn. Res., 2:125137.
Chiang, J.-H. and Hao, P.-Y. (2003).
A new kernel-based fuzzy clustering approach: support
vector clustering with cell growing.
Fuzzy Systems, IEEE Transactions on, 11(4):518 527.
Huang, J.-J., Tzeng, G.-H., and Ong, C.-S. (2007).
Marketing segmentation using support vector clustering.
Expert Systems with Applications, 32(2):313 317.
29 / 30
Support
Vector
Clustering na
formulao
da
segmentao
dos consumi-
dores
cariocas
sobre o
servio de TV
Mvel.
Pedro H. M.
Albuquerque
Introduo
ao SVC.
Aplicao.
Concluso.
Bibliograa II
Jain, A. K. and Dubes, R. C. (1988).
Algorithms for clustering data.
Prentice-Hall, Inc., Upper Saddle River, NJ, USA.
Wolfe, P. (1961).
A Duality Theorem for Nonlinear Programming.
Quarterly of Applied Mathematics, 19:239244.
Xu, B. and Zhang, A. (2005).
Application of support vector clustering algorithm to
network intrusion detection.
In Neural Networks and Brain, 2005. ICNN B 05.
International Conference on, volume 2, pages 1036
1040.
30 / 30