Você está na página 1de 3

Medidos de 4vo/ioo do c/usteritoo

A qualldade da clusLerlzao pode ser avallada baseada nas segulnLes meLrlcas medlda k
palrwlse l1 (pl1) clusLer l1 (cl1) e relao do Lamanho do clusLer (CoLa eL al 2007 Puang eL al
2006 LapldoL 2002 Song eL al 2007)
A medlda k conslLe na medlda geomeLrlca enLre a medla da pureza do clusLer (AC) e a
medla de pureza de enLldade (AL) a qual deLermlna o equlllbrlo enLre as duas meLrlcas AC avalla
a pureza do clusLer gerado com o respecLlvo clusLer manual gerado ou se[a se o clusLer gerado
lnclul somenLe reglsLros perLencenLes ao clusLer referenclado AL avalla o nlvel de dlvlso de uma
enLldade em vrlos clusLers lsLo e o quo fragmenLado o clusLer gerado esL odem ser deflnldos
como
=


n
]
2
n

R
]=1
q
=1

=


n
]
2
n
]
q
=1
R
]=1

K = V
Cnde n e o numero de reglsLros no con[unLo de dados de LesLe 8 e o numero de refnclas de
clusLers gerados manualmenLe q e o numero de clusLers gerados alLomaLlcamenLe n
]
e o numero
de elemenLos do clusLer l perLencenLe ao clusLer j e n

e o numero de elemenLos do clusLer l
alrwlse l1 (pl1) e deflnldo como a medla harmnlca do poltwlse pteclsloo(pp) e poltwlse tecoll (pr)
onde poltwlse pteclsloo e medldo pela frao do poltwlse tecoll assoclado com a mesma enLldade
locallzada no mesmo clusLer Lles so deflnldos como
JJ =
_ _ (n
]
, )
R
]=1
q
=1
_ (n

,)
q
=1

JJ =
_ _ (n
]
, )
R
]=1
q
=1
_ (n

,)
R
]=1

J =
JJ JJ
JJ JJ

Sendo que C(nr) e a comblnao de r elemenLos de um con[unLo de n elemenLos ou se[a
(n, J) =
n!
!x (n-)!
n r
uo mesmo modo clostet l1 (cl1) e a medla harmnlca do clostet pteclsloo (cp) com clostet
tecoll (cr) onde que o prlmelro e uma frao dos clusLer LoLalemLe correLos para o numero de
clusLer recuperados e clostet tecoll e a frao dos clusLer verdadelramenLe recuperados So
deflnldos como
IJ =

q

IJ =


I =
IJ IJ
IJ IJ

Cnde e numero LoLal de clusLers correLos
A relao do Lamanho do clusLer (8CS) e deflnlda como o numero de cluesLers recuperados
dlvldldo pelo numero real de clusLers como segue
=
q



co/eto dos descries dos impressoros
A base de dados usada para a valldao da funo fol a usada por erelra (2009) para
valldao do seu Lrabalho onde a coleLa fol felLa da segulnLe forma parLlr de consulLas ao
ooqles ltoJoct seotcb fol usada descrles de lmpressoras obLldas nas pglnas de fabrlcanLes das
mesmas LsLa base e composLa por 2169 cadelas de caracLeres (descrles) dlsLlnLas LsLo
agrupadas manualmenLe em 138 grupos os quals represenLam marca e modelos especlflcos desLas
ara LesLar os resulLados obLldas por pesqulsas no ooqles ltoJoct seotcb fol coleLado
manualmenLe descrles de lmpressoras dlsLlnLas de dlversos sltes de fabrlcanLes Lals como P
Lpson Canon eLc em segulda fol usado esLas descrles como dados de enLrada no ooqles
ltoJoct seotcb e coleLado os LlLulos de cada documenLo do con[unLo da resposLa uepols aLraves de
selees manuals para cada query fol dlsLlnguldo os resulLados que verdadelramenLe
corresponderlam lmpressora procurada C resulLado e composLo por 2169 descrles de
lmpressoras as quals foram usadas para o experlmenLo Lssas sLrlngs esLo dlsLrlbuldas em 138
clusLers conLendo uma medla de137 sLrlngs por clusLer onde o malor con[unLo Lem 27 sLrlngs e o
menor Lem apenas 2












8efernclas
CoLa 8 C Conalves M A and Laender A P l (2007) A heurlsLlc hlerarchlcal clusLerlng meLhod
for auLhor name dlsamblguaLlon ln dlglLal llbrarles ln ltoceeJloqs of tbe 22
oJ
8tozllloo 5yposlo
oo uotoboses pages 2034 !oo essoa 8razll
Puang ! LrLekln S and Clles C L (2006) LfflclenL name dlsamblgulLlona for largescale
daLabases ln ltoceeJloqs of tbe 10
tb
otopeoo coofeteoce oo ltloclples ooJ ltotlce of koowleJqe
ulscovety lo uotoboses pages 336344 8erlln Cermany Sprlnge
LapldoL l (2002) SelforganlzaLlonmaps wlLh 8lC speaker clusLerlng lulA research reporL 0260
lulA 8esearch lnsLlLuLe MarLlgny SwlLzerland
Song ? Puang ! Counclll l C Ll ! anf Clles C L (2007) LfflclenL Loplcbased unsupervlsed
name dlsamblguaLlon ln ltoceeJloq of tbe 7
tb
AcM/lc5 Iolot coofeteoce oo ulqltol llbtotles
pages 342331 vancouver Canada

Você também pode gostar