Você está na página 1de 36

CAPTULO 12

Normalizao avanada II:


formas normais mais altas
12.1 INTROU!"O
No #a$%t&lo ant'rior( dis#&timos as id)ias d' normalizao
avanada at) ' in#l&siv' a forma normal d' *o+#',Codd -.&' )
at) ond' o #on#'ito d' d'$'nd/n#ia f&n#ional $od' nos l'var0.
A1ora( #on#l&%mos nossa dis#&sso '2aminando a .&arta ' a
.&inta formas normais -34N ' 54N0. Como v'r'mos( a d'finio
da .&arta forma normal faz &so d' &ma nova 's$)#i' d'
d'$'nd/n#ia( #6amada d'$'nd/n#ia m&ltivalorada -78 9 m&lti:
val&'d d'$'nd'n#+0; as 78s so &ma 1'n'ralizao d' 4s. a
m'sma man'ira( a d'finio da .&inta forma normal faz &so
ainda d' o&tra 's$)#i' d' d'$'nd/n#ia( #6amada d'$'nd/n#ia d'
<&no -= 9<oin d'$'nd'n#+0; as =s so &ma 1'n'ralizao d'
78s( assim #omo as 78s so &ma 1'n'ralizao d' 4s. A
>'o 12.2 dis#&t' 78s ' 34N( a >'o 12.? dis#&t' =s ' 54N
-' '2$li#a $or .&' a >4N )( 'm &m #'rto s'ntido 's$'#ial( a
forma normal final0. O@s'rv' .&' nossa dis#&sso so@r' 78s
so d'li@'radam'nt' m'nos formais ' #om$l'tas .&' nossas
d's#riA's d' 4s no Ca$%t&lo 1B; d'i2amos o tratam'nto
formal $ara os tra@al6os d' $'s.&isa -#ons&lt' CR'f'r/n#ias '
@i@lio1rafiaD0.
A >'o 12.3 'nto r'$assa todo o $ro#'dim'nto d'
normalizao ' faz al1&ns #om'ntErios adi#ionais so@r' 'l'. A
>'o 12.5 '2amina ra$idam'nt' a noo d' d'snormalizao. A
>'o 12.F d's#r'v' o&tro im$ortant' $rin#%$io d' $ro<'to(
#6amado $rin#%$io orto1onal. 4inalm'nt'( a >'o 12.G '2amina
al1&mas ori'ntaA's $oss%v'is $ara $'s.&isa f&t&ra no #am$o
d' normalizao( ' a >'o 12.H a$r's'nta &m r's&mo.
12.2 IPINJNCIA> 7ULTI8ALORAA> I KUARTA 4OR7A NOR7AL
8am&s s&$or .&' t'mos &ma variEv'l d' r'lao LCPT -L d'
C6i'rEr.&i#aD0 #ont'ndo informaA's so@r' #&rsos( $rof'ssor's
' t'2tos( na .&al os atri@&tos #orr's$ond'nt's a $rof'ssor's
' t'2tos t/m valor d' r'lao -v'<a na 4i1&ra 12.1 &ma
amostra d' valor's d' LCPT0. Como $od'mos v'r( #ada t&$la d'
LCPT #onsist' 'm &m nom' d' #&rso( al)m d' &ma r'lao
#ont'ndo nom's d' $rof'ssor's( &ma r'lao #ont'ndo nom's d'
t'2tos -d&as d'ssas t&$las so mostradas na fi1&ra0. O
si1nifi#ado $r't'ndido d' &ma tal t&$la ) .&' o #&rso
's$'#ifi#ado $od' s'r ministrado $or .&al.&'r dos $rof'ssor's
's$'#ifi#ados ' &tiliza todos os t'2tos 's$'#ifi#ados #omo
r'f'r/n#ias. >&$omos .&'( $ara &m dado #&rso( $od' '2istir
.&al: .&'r nMm'ro d' $rof'ssor's #orr's$ond'nt's ' .&al.&'r
nMm'ro d' t'2tos #orr's$ond'nt's. Al)m disso( tam@)m s&$omos
9 talv'z d' forma no m&ito r'alistaN 9 .&' $rof'ssor's '
t'2tos so @astant' ind'$'nd'nt's &ns dos o&tros; isto )( no
im$orta .&'m r'alm'nt' ministra .&al.&'r of'rta $arti#&lar d'
&m dado #&rso( so &sados os m'smos t'2tos. 4inalm'nt'(
tam@)m s&$omos .&' &m dado $rof'ssor o& &m dado t'2to $od'
'star asso#iado #om .&al.&'r nMm'ro d' #&rsos.
??O
LCPT CUR>O PRO4I>>ORI> TIPTO>
4IQURA 12.1 Amostra d' valor's $ara a variEv'l d' r'lao
LCPT
A1ora vamos s&$or .&' -#omo na >'o 11.F do #a$%t&lo
ant'rior0 .&'r'mos 'liminar os atri@&tos #om valor d'
r'lao. Uma das man'iras d' faz/:lo 9 $or)m( no a man'ira
d's#rita na r's$osta ao I2'r#%#io 11.? -&m $onto ao .&al
r'tornar'mos no final d'sta s'o0 9 ) sim$l'sm'nt'
s&@stit&ir a variEv'l d' r'lao LCPT $or &ma variEv'l d'
r'lao CPT #om tr/s atri@&tos 's#alar's CUR>O( PRO4I>>OR '
TIPTO( #omo indi#amos na 4i1&ra 12.2. Como $od'mos o@s'rvar a
$artir da fi1&ra( #ada t&$la d' LCPT dE ori1'm a m R n t&$las
'm CPT( ond' m ' n so as #ardinalidad's das r'laA's
PRO4I>>ORI> ' TIPTO> n'ssa t&$la d' LCPT. O@s'rv' .&' a
variEv'l d' r'lao r's&ltant' CPT ) Ctoda #6av'D -'m
#ontrast'( a Mni#a #6av' #andidata $ara LCPT 'ra a$'nas
SCUR>OT0.
4IQURA 12.2 8alor da variEv'l d' r'lao CPT #orr's$ond'nt'
ao valor d'
LCPT na 4i1&ra 12.1
O si1nifi#ado da variEv'l d' r'lao CPT ) mais o& m'nos o
s'1&int': &ma t&$la SCUR>U:#( PRO4I>>OR:$(TIPTO:tT $'rt'n#' U
variEv'l d' r'lao s' ' som'nt' s' o #&rso # $od' s'r
ministrado $'lo $rof'ssor $ ' &sa o t'2to t #omo r'f'r/n#ia.
O@s'rv' .&' $ara &m dado #&rso( a$ar'#'m todas as $oss%v'is
#om@inaA's d' $rof'ssor ' t'2to; isto )( CPT satisfaz U
r'strio -d' variEv'l d' r'lao0:
s' as t&$las -#($l(tl0( -#($2(t20 a$ar'#'m am@as
'nto as t&$las -#($l(t20( -#($2(tl0 tam@)m a$ar'#'m am@as
-'m$r'1ando mais &ma v'z nossa a@r'viao &s&al $ara t&$las0.
'v' s'r a$ar'nt' .&' a variEv'l d' r'lao CPT 'nvolv' &ma
@oa dos' d' r'd&ndVn#ia( l'vando #omo d' #ost&m' a #'rtas
anomalias d' at&alizao. Por '2'm$lo( $ara a#r's#'ntar a
informao d' .&' o #&rso d' f%si#a $od' s'r ministrado $or
&m novo $rof'ssor( ) n'#'ssErio ins'rir d&as novas t&$las(
&ma $ara #ada &m dos dois t'2tos. Pod'mos 'vitar tais
$ro@l'masW *'m( ) fE#il v'r .&':
?3B
4%si#a
7at'mEti#
a
PRO4I>>OR
Prof.
Qr''n
Prof.
*roXn
PRO4I>>OR
Prof.
Qr''n
TIPT
O
7'#Vni#a @Esi#a Prin#%$ios
d' Y$ti#a
TIPTO
7'#Vni#a @Esi#a
AnElis' v'torial
Tri 1onom'tri a
CPT
CUR>
O
PRO4I>>OR TIPTO
4%si#a
Prof
.
Qr'
'n
7'#Vni#a @Esi#a
4%si
#a
Pro
f.
Qr''n
Prin#%$ios d'
Y$ti#a
4%si
#a
Pro
f.
*roXn 7'#Vni#a @Esi#a
4%si#a
Prof
.
*ro
Xn
Prin#%$ios d'
Y$ti#a
7at'mEt
i#a
Prof
.
Qr'
'n
7'#Vni#a @Esi#a
7at'mEt
i#a
Prof
.
Qr'
'n
AnElis'
v'torial
7at'mEt
i#a
Prof
.
Qr'
'n
Tri1onom'tria
1. Os $ro@l'mas 'm .&'sto so #a&sados $'lo fato d' .&'
$rof'ssor's ' t'2tos so #om$l'tam'nt' in d'$'nd'nt'
&m do o&tro.
2. A sit&ao s'ria m&ito m'l6or s' CPT foss' d'#om$osta 'm
s&as d&as $ro<'A's 9 vamos #6amE:las CP ' CT 9 so@r'
SCUR>O(PRO4I>>ORT ' SCUR>O(TIPTOT( r's$'#tivam'nt' -v'r
4i1&ra 12.?0. Para adi#ionar a informao d' .&' o #&rso d'
f%si#a $od' s'r ministrado $or &m novo $rof'ssor( sZ
$r'#isamos a1ora ins'rir &ma Mni#a t&$la na variEv'l d'
r'lao CP. -O@s'rv' tam@)m .&' a variEv'l d' r'lao CPT
$od' s'r r'#&$'rada &nindo:s' CP ' CT novam'nt'; assim( a
d'#om$osio ) s'm $'rdas.0 Portanto( $ar'#' razoEv'l s&1'rir
.&' d'v' 6av'r &m modo d' Cnormalizar maisD &ma variEv'l d'
r'lao #omo CPT.
Nota: n'ss' $onto( vo#/ $od'ria ar1&m'ntar .&' a r'd&ndVn#ia
'm CPT 'ra d'sn'#'ssEria ' 'nto .&' as anomalias d'
at&alizao #orr's$ond'nt's tam@)m 'ram d'sn'#'ssErias. 7ais
's$'#ifi#am'nt'( vo#/ $od'ria s&1'rir .&' CPT no $r'#isa
in#l&ir todas as #om@inaA's $oss%v'is d' $rof'ssor,t'2to
$ara &m dado #&rso; $or '2'm$lo( d&as t&$las @astam $ara
mostrar .&' o #&rso d' f%si#a t'm dois $rof'ssor's ' dois
t'2tos. O $ro@l'ma )( .&ais so as d&as t&$lasW K&al.&'r
's#ol6a 's$'#%fi#a l'va a &ma variEv'l d' r'lao .&' t'm &ma
int'r$r'tao no m&ito Z@via ' a &m #om$ortam'nto d'
at&alizao m&ito 'stran6o -'2$'rim'nt' 'n&n#iar o $r'di#ado
$ara 'ssa variEv'l d' r'laoN 9 isto )( t'nt' 'n&n#iar os
#rit)rios $ara d'#idir s' &ma d't'rminada at&alizao ) o&
no &ma o$'rao a#'itEv'l so@r' 'ssa variEv'l d' r'lao0.
Ii
4IQURA 12.? 8alor's $ara as variEv'is d' r'laA's CP ' CT
#orr's$ond'nt's
ao valor d' CPT na 4i1&ra 12.2
Portanto( informalm'nt'( ) Z@vio .&' o $ro<'to d' CPT ) r&im(
' .&' a d'#om$osio 'm CP ' CT ) m'l6or. Cont&do( o $ro@l'ma
) .&' 'ss's fatos no so formalm'nt' Z@vios. Im $arti#&lar(
o@s'rv' .&' CPT no satisfaz a n'n6&ma d'$'nd/n#ia f&n#ional
-al)m das triviais( #omo CUR>O 9R CUR>O0; d'
fato( CPT 'stE 'm 4N*C $ois( #omo <E o@s'rvamos( 'la ) toda
#6av' 9 .&al.&'r variEv'l d' r'lao Ctoda #6av'D d'v' 'star
n'#'ssariam'nt' 'm 4N*C. -O@s'rv' .&' as d&as $ro<'A's CP '
CT tam@)m so toda
#6av'( ' $ortanto 'sto 'm 4N*C.0 'ssa forma( as id)ias do
#a$%t&lo ant'rior no so d' n'n6&ma a<&da $ara o $ro@l'ma 'm
.&'sto.
A '2ist/n#ia d' variEv'is d' r'laA's 4N*C C$ro@l'maD #omo
CPT foi r'#on6'#ida d'sd' #'do( ' o modo d' lidar #om 'las
tam@)m foi lo1o 'nt'ndido( $'lo m'nos int&itivam'nt'. Por)m(
som'nt' 'm 1OGG 'ssas id)ias int&itivas foram r'&nidas 'm &ma
sZlida @as' t'Zri#a $'la introd&o $or 4a1in da noo d'
d'$'nd/n#ias m&ltivaloradas( as 78s [12.1?1. As d'$'nd/n#ias
m&ltivaloradas so &ma 1'n'ralizao das d'$'nd/n#ias
f&n#ionais( no s'ntido d' .&' toda 4 ) &ma 78( mas o
inv'rso no ) v'rdad'iro -isto )( '2ist'm 78s .&' no so
4s0. No #aso da variEv'l d' r'lao CPT( 6E d&as 78s
vElidas:
CUR>O 9R::\ PRO4I>>OR
CUR>O 9R9R TIPTO
O@s'rv' as s'tas d&$las; a 78 A 9R::: * ) lida #omo C* )
m&ltid'$'nd'nt' d' AD o&( d' modo
'.&ival'nt'( CA m&ltid't'rmina *D. 8amos nos #on#'ntrar na
$rim'ira 78 CUR>O 9R9] PRO:
CPT
CUR>
O
PRO4I>>OR TIPTO
4%si#a
Prof
.
Qr'
'n
7'#Vni#a @Esi#a
4%si
#a
Pro
f.
Qr'
'n
Prin#%$ios d'
Y$ti#a
4%si
#a
Pro
f.
*ro
Xn
7'#Vni#a @Esi#a
4%si
#a
Pro
f.
*ro
Xn
Prin#%$ios d'
Y$ti#a
7at'mEt
i#a
Prof
.
Qr'
'n
7'#Vni#a @Esi#a
7at'mEt
i#a
Prof
.
Qr'
'n
AnElis' v'torial
7at'mEt
i#a
Prof
.
Qr'
'n
Tri1onom'tria
Im o&tras $alavras( as Mni#as d'$'nd/n#ias no triviais -4s
o& 78s0 'm R so da forma ^ 9R P -isto )( &ma d'$'nd/n#ia
f&n#ional d' &ma s&$'r#6av' ^ $ara al1&m o&tro atri@&to P0.
' modo '.&ival'nt': R 'stE 'm 34N s' 'stE 'm 4N*C ' todas as
78s 'm R so d' fato C4s saindo d' #6av'sD. Portanto(
o@s'rv' 'm $arti#&lar .&' 34N im$li#a 4N*C.
A variEv'l d' r'lao CPT no 'stE 'm 34N $ois 'nvolv' &ma
78 .&' no ) d' modo n'n6&m &ma 4( m&ito m'nos C4 saindo
d' &ma #6av'D. Por)m( as d&as $ro<'A's CP ' CT 'sto am@as
'm 34N. Assim( 34N ) &m a$'rf'ioam'nto so@r' 4N*C $or
'liminar o&tra forma d' d'$'nd/n#ia ind's'<Ev'l. Al)m disso(
4a1in mostra na r'f'r/n#ia [12.1?_ .&' a 34N ) s'm$r'
al#anEv'l 9 isto )( .&al.&'r variEv'l d' r'lao $od' s'r
d'#om$osta s'm $'rdas 'm &ma #ol'o '.&ival'nt' d' variEv'is
d' r'laA's 34N 9 'm@ora nossa dis#&sso do '2'm$lo >=T na
>'o 11.5 mostr' .&'( 'm #'rtos #asos( $od'ria no s'r
d's'<Ev'l l'var a d'#om$osio to lon1' -o& m'smo to lon1'
.&anto 4N*C0.
Nota: o@s'rvamos .&' o tra@al6o d' Rissan'n so@r' $ro<'A's
ind'$'nd'nt's [11.F_( 'm@ora 's#rito 'm t'rmos d' 4s( tam@)m
) a$li#Ev'l a 78s. L'm@r':s' d' .&' &ma variEv'l d' r'lao
RSA(*(CT .&' satisfaz Us 4sA 9R * ' * 9] C ) mais @'m
d'#om$osta 'm s&as $ro<'A's so@r' SA(*T ' S*(CT .&' nas
$ro<'A's so@r' SA(*T ' SA(CT. O m'smo val' s' s&@stit&irmos
as 4s $'las 78sA 9]:::R * ' * 9]:::] C.
Con#l&%mos 'sta s'o r'tornando( #omo $rom't'mos( U .&'sto
d' 'liminar atri@&tos #om valor d' r'lao -$ara a@r'viar(
A8Rs0 9 'm $arti#&lar( ao $ro#'dim'nto $ara '2'#&tar 'ssa
'liminao d's#rito na r's$osta ao I2'r#%#io 11.? do #a$%t&lo
ant'rior( O $onto im$ortant' ): na $rEti#a( sZ $r'#isamos
$ara al#anar a 34N r'#on6'#'r .&'( s' #om'armos #om &ma
variEv'l d' r'lao 'nvolv'ndo d&as o& mais A8Rs
ind'$'nd'nt's( a $rim'ira #oisa a faz'r s'rE s'$arar 'ssas
A8Rs. Issa r'1ra no a$'nas t'm s'ntido int&itivo mas )
'2atam'nt' a.&ilo .&' fiz'mos 'm nossa r's$osta ao I2'r#%#io
11.?N Por '2'm$lo( no #aso da variEv'l d' r'lao LCPT( a
$rim'ira #oisa a faz'r ) s&@stit&ir a variEv'l d' r'lao
ori1inal $or s&as d&as $ro<'A's LCP SCUR>O(PRO4I>>ORI>T '
LCT SCUR>O(TIPTO>T -ond'( PRO4I>>ORI> ' TIPTO> ainda so
A8Rs0. As A8Rs n'ssas d&as $ro<'A's $od'm 'nto s'r
'liminadas -' as $ro<'A's r'd&zidas a 4N*C0 da man'ira
&s&al( ' a variEv'l d' r'lao 4N*C C$ro@l'maD CPT
sim$l'sm'nt' no s&r1irE mais. Por)m( a t'oria das 78s ' a
34N nos do &ma @as' formal $ara a.&ilo .&' d' o&tra forma
s'ria &ma sim$l's r'1ra $rEti#a.
12.? IPINJNCIA> I =UN!"O I KUINTA 4OR7A NOR7AL
At) a.&i n'st' #a$%t&lo ' 'm todo o #a$%t&lo ant'rior
ass&mimos ta#itam'nt' .&' a Mni#a o$'rao dis$on%v'l o&
n'#'ssEria no $ro#'sso d' normalizao avanada ) a
s&@stit&io d' &ma variEv'l d' r'lao d' &m modo s'm $'rdas
$or '2atam'nt' d&as d' s&as $ro<'A's. Issa 6i$Zt's' nos
l'vo& #om s&#'sso at) U 34N. Portanto( talv'z s'<a &ma
s&r$r'sa d's#o@rir .&' '2ist'm variEv'is d' r'laA's .&' no
$od'm s'r d'#om$ostas s'm $'rdas 'm d&as $ro<'A's( mas $od'm
s'r d'#om$ostas s'm $'rdas 'm tr/s -o& mais0. Para inv'ntar
&m t'rmo f'io mas #onv'ni'nt'( d's#r'v'r'mos &ma d't'rminada
variEv'l d' r'lao #omo Cn:d'#om$on%v'lD -$ara al1&m n ] 20
9 .&'r'ndo diz'r .&' a variEv'l d' r'lao 'm .&'sto $od'
s'r d'#om$osta s'm $'rdas 'm n $ro<'A's mas no 'm m $ara
.&al.&'r m `n. Uma variEv'l d' r'lao .&' $od' s'r
d'#om$osta s'm $'rdas 'm d&as $ro<'A's s'rE #6amada C2:
d'#om$on%v'lD. Nota: o f'nam'no da Cn:d'#om$oni@ilidad'D $ara
n ] 2 foi o@s'rvado $'la $rim'ira v'z $or A6o( *''ri ' Uliman
[12.1_. O #aso $arti#&lar n b ? tam@)m foi 'st&dado $or
Ni#olas [12.25_.
Consid'r' a variEv'l d' r'lao 4P= do @an#o d' dados d'
forn'#'dor's( $'as ' $ro<'tos -mas i1nor' o atri@&to KI $or
sim$li#idad'0; &ma amostra d' valor's 'stE il&strada na $art'
s&$'rior da 4i1&ra 12.3. O@s'rv' .&' a variEv'l d' r'lao
4P= ) toda #6av' ' no 'nvolv' 4s o& 78s no triviais;
$ortanto( 'la 'stE 'm 34N. O@s'rv' ainda .&' a 4i1&ra 12.3
tam@)m mostra:
a. As tr/s $ro<'A's @inErias 4P( P= ' =4 #orr's$ond'nt's ao
valor d' r'lao 4P= mostrado na $art' s&$'rior da fi1&ra.
@. O 'f'ito da <&no das $ro<'A's 4P ' P= -so@r' Pc0.
#. O 'f'ito da <&no d'ss' r's&ltado ' da $ro<'o d' =4
-so@r' =c ' 4c0.
?3?
4P=
4P P= =4
L1. <&no so@r' Pc ._ dd=
< <d. <&no so@r'
=c( 4c
4i P1 =2
4i P2 =i
42 P1 =i
's$Mria9i. .?2 4P=
4i P1 =i ori1inal
4IQURA 12.3 A r'lao 4P= ) a <&no d' s&as tr/s $ro<'A's
@inErias(
mas no d' d&as .&ais.&'r
O@s'rv' .&' o r's&ltado da $rim'ira <&no ) $rod&zir &m
#Z$ia da r'lao 4P= ori1inal mais &ma t&$la adi#ional
-'s$Mria0( ' o 'f'ito da s'1&nda <&no ) 'nto o d' 'liminar
'ssa t&$la 's$Mria. Nota: o r's&ltado l%.&ido ) o m'smo
.&al.&'r .&' s'<a o $ar d' $ro<'A's .&' 's#ol6amos $ara a
$rim'ira <&no( 'm@ora o r's&ltado int'rm'diErio s'<a
dif'r'nt' 'm #ada #aso. I2'r#%#io: v'rifi.&' 'ssa afirmao.
O '2'm$lo da 4i1&ra 12.3 ) nat&ralm'nt' '2$r'sso 'm t'rmos d'
r'laA's( ' no d' variEv'is d' r'laA's. Por)m( a ?:
d'#om$oni@ilidad' da variEv'l d' r'lao 4P= $od'ria s'r &ma
$ro$ri'dad' mais f&ndam'ntal ' ind'$'nd'nt' do t'm$o 9 isto
)( &ma $ro$ri'dad' satisf'ita $or todos os valor's vElidos da
variEv'l d' r'lao 9 s' 'ssa variEv'l d' r'lao satisfiz'r
a &ma #'rta r'strio d' int'1ridad' ind'$'nd'nt' do t'm$o.
Para 'nt'nd'r .&al d'v' s'r 'ssa r'strio( o@s'rv' $rim'iro
.&' a d'#larao C4P= ) i1&al U <&no d' s&as tr/s $ro<'A's
4P( P= ' =4D ) $r'#isam'nt' '.&ival'nt' U s'1&int'
d'#larao:
s' o $ar -fl(<l0 a$ar'#' 'm 4P
' o $ar -$l(<l0 a$ar'#' 'm P=
' o $ar -<l(fl0 a$ar'#' 'm =4
'nto a tri$la -fl($l(<l0 a$ar'#' 'm 4P=
$or.&' a tri$la -fl($l(<l0 'vid'nt'm'nt' a$ar'#' na <&no d'
4P( P= ' =4. -A r'#%$ro#a d'ssa d'#larao( .&' s' -fl($l(<l0
a$ar'#' 'm 4P= 'nto -fl($l0 a$ar'#' na $ro<'o 4P -'t#.0( )
'vid'nt'm'nt' v'rdad'ira $ara toda r'lao 4P= d' 1ra& ?.0
Como -f1($l0 a$ar'#' 'm 4P s' ' som'nt' s' -fl($l(<20 a$ar'#'
'm 4P= $ara al1&m <2( ' do m'smo modo $ara -$l(<l0 ' -<l(fl0(
$od'mos r''s#r'v'r a d'#larao ant'rior #omo &ma r'strio
so@r' 4P=:
s' -fl(<l(<20( -f2($l(<l0( -fl($2(<l0 a$ar'#'m 'm 4P=
'nto -fl($l(<l0 tam@)m a$ar'#' 'm 4P=
I s' 'ssa d'#larao ) v'rdad'ira $ara todo o t'm$o 9 isto )(
$ara todos os valor's vElidos $oss%v'is da variEv'l d'
r'lao 4P= 9 'nto t'mos &ma r'strio ind'$'nd'nt' do t'm$o
so@r' a variEv'l d' r'lao -'m@ora 'la s'<a &m tanto
'stran6a0. Not' a nat&r'za #%#li#a d'ssa r'strio -Cs' [1
'stE li1ado a $1 '
?33 $1 'stE li1ado a <i ' <i 'stE li1ado d' novo a fi( 'nto
fi ' $1 ' <i d'v'm #o'2istir todos na m'sma t&:
$iaD0. Uma variEv'l d' r'lao s'rE n:d'#om$on%v'l $ara al1&m
n ] 2 s' ' som'nt' s' satisfiz'r a al1&ma r'strio #%#li#a
-n:modos0 d'ss' ti$o.
8amos s&$or 'nto .&' a variEv'l d' r'lao 4P= d' fato
satisfaz a 'ssa r'strio ind'$'nd'nt' do t'm$o -a amostra d'
valor's da 4i1&ra 12.3 ) #onsist'nt' #om 'ssa 6i$Zt's'0. Para
a@r'viar( vamos #on#ordar 'm #6amar 'ssa r'strio d'
R'strio ? -? si1nifi#ando ?:d'#om$on%v'l0. O .&'
si1nifi#a a R'strio ? 'm t'rmos r'aisW 8amos t'ntar tornE:
la &m $o&#o mais #on#r'ta( a$r's'ntando &m '2'm$lo. A
r'strio diz .&'( na $art' do m&ndo r'al .&' a variEv'l 4P=
s&$ostam'nt' r'$r's'nta( ) &m fato .&' s' -$or '2'm$lo0:
a. >mit6 forn'#' t'naz's.
@. T'naz's so &sadas no $ro<'to 7an6attan.
#. >mit6 forn'#' $ara o $ro<'to 7an6attan.
Into
d. >mit6 forn'#' t'naz's $ara o $ro<'to 7an6attan.
O@s'rv' .&'( #omo diss'mos no Ca$%t&lo 1 ->'o 1.?0( a.( @.
' #. <&ntas normalm'nt' no im$li#am d.; na v'rdad'( 'ss'
'2'm$lo foi &sado no Ca$%t&lo 1 #omo &ma il&strao da
Carmadil6a d' #on'2oD. Por)m( no #aso 'm .&'sto( 'stamos
diz'ndo .&' no 6E n'n6&ma armadil6a 9 $or.&' '2ist' &ma
r'strio adi#ional do m&ndo r'al 'm 'f'ito( o& s'<a( a
R'strio ?( .&' torna a inf'r/n#ia d' d. a $artir d' a.( @.
' #. vElida n'ss' #aso $arti#&lar.
8oltando ao tZ$i#o $rin#i$al da dis#&sso: #omo r'strio ?
) satisf'ita s' ' som'nt' s' a variEv'l d' r'lao 'm .&'sto
) i1&al U <&no d' #'rtas $ro<'A's $rZ$rias( #6amamos 'ssa
r'strio d' d'$'nd/n#ia d' <&no -=0. Uma = ) &ma
r'strio so@r' a variEv'l d' r'lao 'm .&'sto( da m'sma
forma .&' &ma 78 o& &ma 4 ) &ma r'strio so@r' a variEv'l
d' r'lao. A.&i 'stE a d'finio:
e '$'nd/n#ia d' <&no: s'<a R &ma variEv'l d' r'lao '
s'<am A( *( ...( f s&@#on<&ntos dos atri@&tos d' R. Into(
diz'mos .&' R satisfaz U =:
R S A( *( . . .( f 0
-l'ia:s' Cast'ris#o A( *( ...( fD0 s' ' som'nt' s' todo valor
vElido $oss%v'l d' R ) i1&al U <&no d' s&as $ro<'A's so@r'
A( *( ...( f.
Por '2'm$lo( s' #on#ordarmos 'm &sar 4P $ara indi#ar o
s&@#on<&nto S4c(PcT do #on<&nto d' atri@&tos d' 4P=( ' d'
modo s'm'l6ant' $ara P= ' =4( 'nto a variEv'l d' r'lao 4P=
satisfaz U = R
S4P(P=(=4T.
8imos 'nto .&' a variEv'l d' r'lao 4P=( #om s&a = R
S4P(P=(=4T $od' s'r ?:d'#om$osta. A .&'sto )( 'la d'v' s'rW
I a r's$osta ) C$rovav'lm'nt' simD. A variEv'l d' r'lao 4P=
-#om s&a =0 sofr' d' &ma s)ri' d' $ro@l'mas so@r' o$'raA's
d' at&alizao( $ro@l'mas .&' so r'movidos .&ando 'la ) ?:
d'#om$osta. Al1&ns '2'm$los d'ss's $ro@l'mas so mostrados na
4i1&ra 12.5. A #onsid'rao do .&' a#ont'#' a$Zs a ?:
d'#om$osio fi#a #omo '2'r#%#io.
O t'or'ma d' 4a1in -dis#&tido na >'o 12.20 .&' diz .&'
RSA(*(CT $od' s'r d'#om$osta s'm $'rdas 'm s&as $ro<'A's
so@r' SA(*T ' SA(CT s' ' som'nt' s' as 78s A 9]:::] * ' A 9
R:::] C vElidas 'm
$od' a1ora s'r 'n&n#iada #omo:
e RSA(*(CT satisfaz U = R SA*(ACT s' ' som'nt' s' satisfaz
Us 78s A 9]:::R * 1 C.
Como 'ss' t'or'ma $od' s'r #onsid'rado &ma d'finio d'
d'$'nd/n#ia m&ltivalorada( t'mos .&' &ma 78 ) a$'nas &m #aso
's$'#ial d' &ma = o& -d' modo '.&ival'nt'0 .&' =s so &ma
1'n'ralizao d' 78s.
4ormalm'nt'( t'mos:
A 9R9R * C R S A*( AC 1
?35
4IQURA 12.5 I2'm$los d' $ro@l'mas d' at&alizao 'm 4P=
Nota: ) im'diato da d'finio .&' as d'$'nd/n#ias d' <&no
so a forma mais 1'ral $oss%v'l d' d'$'nd/n#ia -&sando:s'( )
#laro( o t'rmo Cd'$'nd/n#iaD 'm &m s'ntido m&ito 's$'#ial0.
O& s'<a( no '2ist' &ma forma ainda mais alta d' d'$'nd/n#ia
tal .&' as =s s'<am a$'nas &m #aso 's$'#ial d'ssa forma mais
alta 9 d'sd' .&' limit'mos nossa at'no a d'$'nd/n#ias .&'
lidam #om &ma variEv'l d' r'lao s'ndo d'#om$osta atrav)s d'
$ro<'o ' r'#om$osta atrav)s d' <&no. -Por)m( s'
$'rmitirmos o&tros o$'rador's d' d'#om$osio ' r'#om$osio(
$od'ro 'ntrar 'm #'na o&tros ti$os d' d'$'nd/n#ia.
is#&timos 'ssa $ossi@ilidad' m&ito ra$idam'nt' na >'o
12.G.0
8oltando ao nosso '2'm$lo( $od'mos v'r .&' o $ro@l'ma #om a
variEv'l d' r'lao 4P= ) .&' 'la 'nvolv' &ma = .&' no )
&ma 78 '( $ortanto( tam@)m no ) &ma 4. -I2'r#%#io: $or.&'
'2atam'nt' isso ) &m $ro@l'maW0 Tam@)m vimos .&' ) $oss%v'l(
' $rovav'lm'nt' d's'<Ev'l( d'#om$or tal variEv'l d' r'lao
'm #om$on'nt's m'nor's 9 o& s'<a( nas $ro<'A's 's$'#ifi#adas
$'la d'$'nd/n#ia d' <&no. Iss' $ro#'sso d' d'#om$osio
$od' s'r r'$'tido at) .&' todas as variEv'is d' r'laA's
r's&ltant's 'st'<am na .&inta forma normal( .&' d'finimos
a1ora:
K&inta forma normal: &ma variEv'l d' r'lao R 'stE 'm >4N 9
tam@)m #6amada forma normal d' $ro<'o:<&no -4N,P=0 9 s' '
som'nt' s' toda d'$'nd/n#ia d' <&no no trivialR .&' val'
$ara R ) im$li#ada $'las #6av's #andidatas d' R.
Nota: '2$li#ar'mos a s'1&ir o si1nifi#ado d' &ma = s'r
Cim$li#ada $or #6av's #andidatasD.
A variEv'l d' r'lao 4P= no 'stE 'm 54N; 'la satisfaz a &ma
#'rta d'$'nd/n#ia d' <&no( o& s'<a( a R'strio ?( .&'
#'rtam'nt' no ) im$li#ada $or s&a Mni#a #6av' #andidata
-s'ndo 'ssa #6av' a #om@inao d' todos os s'&s atri@&tos0.
Para 'n&n#iar isso d' modo dif'r'nt'( a variEv'l d' r'lao
4P= no 'stE 'm >4N $or.&' -a0 $od' s'r ?:d'#om$osta ' -@0
'ssa ?:d'#om$oni@ilidad' no ) im$li#ada $'lo fato d' a
#om@inao S4c(Pc(=cT s'r &ma #6av' #andidata. Im #ontrast'(
a$Zs a ?:d'#om$osio( as tr/s $ro<'A's 4P( P= ' =4 'sto(
#ada &ma( 'm 54N( $ois 'las no 'nvolv'm n'n6&ma = -no
trivial0.
Im@ora ainda no s'<a Z@vio 9 $or.&' ainda no '2$li#amos o
.&' si1nifi#a $ara &ma = s'r im$li#ada $or #6av's #andidatas
9 ) &m fato .&' .&al.&'r variEv'l d' r'lao 'm 54N tam@)m
'stE a&tomati#am'nt' 'm 34N $or.&' -#omo vimos0 &ma 78 ) &m
#aso 's$'#ial d' &ma =. Na v'rdad'( 4a1in mostra na
r'f'r/n#ia [12.13_ .&' .&al.&'r 78 im$li#ada $or &ma #6av'
#andidata d'v' d' fato s'r &ma 4 na .&al 'ssa #6av'
#andidata ) o d't'rminant'. 4a1in mostra tam@)m na m'sma
r'f'r/n#ia [12.13_ .&' .&al.&'r variEv'l d' r'lao dada $od'
s'r d'#om$osta s'm $'rdas 'm &ma #ol'o '.&ival'nt' d'
variEv'is d' r'laA's >4N; o& s'<a( s'm$r' ) $oss%v'l
al#anar a 54N.
A1ora '2$li#amos o .&' si1nifi#a $ara &ma = s'r im$li#ada
$or #6av's #andidatas. Prim'iro( #onsid'r' &m '2'm$lo
sim$l's. 8amos s&$or mais &ma v'z -#omo no Ca$%t&lo 11( >'o
11.50 .&' a variEv'l
RA = R SA(*(...(fT ) trivial s' ' som'nt' s' &ma das
$ro<'A's A( *( ...( f ) a $ro<'o d' id'ntidad' d'R -isto
)( a $ro<'o so@r' ?3F todos os atri@&tos d' R0.
4P= L 4c 9 P < :
4P=
e >' -42(P1(=10 for ins'rida( -41(P1(=10 tam@)m t'rE d' s'r i
ns'ri da
e O inv'rso no ) v'rdad'iro
e Pod'mos 'liminar -42(P1(=10 s'm 'f'itos #olat'rais
e >' -41(P1(=10 for 'liminada( o&tra t&$la tam@)m t'rE d' s'r
'liminada -.&alW0
4 P =
i 1 2
4
i
P
2
=
1
4
c
P
c
=
c
4
i
4
i
4
2
4
i
P
1
P
2
P
1
P
1
=
2
=
i
=
i
=
i
d' r'lao d' forn'#'dor's 4 t'm d&as #6av's #andidatas( S4cT
' S4NO7IT. Into( 'ssa variEv'l d' r'lao satisfaz a vErias
d'$'nd/n#ias d' <&no 9 $or '2'm$lo( 'la satisfaz U =:
R S S 4c( 4NO7I( >TATU> T( S 4c( CIAI
O& s'<a( a variEv'l d' r'lao 4 ) i1&al U <&no d' s&as
$ro<'A's so@r' S4c(4NO7I(>TATU>T ' S4c(CIAIT( ' 'nto $od'
s'r d'#om$osta s'm $'rdas 'm s&as $ro<'A's. -I #laro .&'
'ss' fato no si1nifi#a .&' 'la d'va s'r d'#om$osta( mas
a$'nas .&' 'la $od'ria s'r.0 Issa = ) im$li#ada $'lo fato d'
.&' S4cT ) &ma #6av' #andidata -na v'rdad'( 'la ) im$li#ada
$'lo t'or'ma d' L'at6 [11.3_0. a m'sma forma( a variEv'l d'
r'lao 4 tam@)m satisfaz U =:
R S S 4c( INO7I T( S 4c( >TATU> T( S 4NO7I( CIAI
Issa = ) im$li#ada $'lo fato d' S4cT ' S4NO7IT s'r'm am@as
#6av's #andidatas.
Como s&1'r'm os '2'm$los ant'rior's( &ma dada = R
SA(*(...(fT ) im$li#ada $or #6av's #andidatas s' ' som'nt' s'
#ada A( *( ...( f ) d' fato &ma s&$'r#6av' $ara a variEv'l d'
r'lao 'm .&'sto. Assim( dada &ma variEv'l d' r'lao R(
$od'mos sa@'r s' R 'stE 'm >4N( d'sd' .&' #on6'amos todas as
#6av's #andidatas ' todas as =s 'm R. Por)m( a d's#o@'rta d'
todas as =s $od'ria s'r 'la $rZ$ria &ma o$'rao no
trivial. Isto )( 'm@ora s'<a r'lativam'nt' fE#il id'ntifi#ar
4s ' 78s -$or.&' t/m &ma int'r$r'tao @astant' dir'ta no
m&ndo r'al0( no s' $od' diz'r o m'smo das =s 9 isto )( d'
=s .&' no so 78s o& 4s 9 $or.&' o si1nifi#ado int&itivo
d' =s $od' no s'r 'vid'nt'. Por isso( o $ro#'sso d'
d't'rminar .&ando &ma dada variEv'l d' r'lao 'stE 'm 34N '
no 'm >4N( ' assim $rovav'lm'nt' $od'ria s'r d'#om$osta #om
vanta1'm( ainda no 'stE #laro. A '2$'ri/n#ia s&1'r' .&' tais
variEv'is d' r'laA's so #asos $atolZ1i#os ' $rovav'lm'nt'
raros na $rEti#a.
Con#l&indo( o@s'rvamos .&' d'#orr' da d'finio .&' a >4N ) a
Mltima forma normal #om r's$'ito U $ro<'o ' U <&no -o .&'
<&stifi#a s'& nom' alt'rnativo( forma normal d' $ro<'o:
<&no0. Isto )( &ma variEv'l d' r'lao 'm 54N t'm a
1arantia d' s'r livr' d' anomalias .&' $ossam s'r 'liminadas
&sando:s' $ro<'A's. R Into( s' &ma variEv'l d' r'lao 'stE
'm 54N( as Mni#as d'$'nd/n#ias d' <&no so a.&'las
im$li#adas $or #6av's #andidatas '( $ortanto( as Mni#as
d'#om$osiA's vElidas so a.&'las @as'adas 'm #6av's
#andidatas. -Cada $ro<'o 'm &ma tal d'#om$osio #onsistirE
'm &ma o& mais d'ssas #6av's #andidatas( al)m d' z'ro o& mais
atri@&tos adi#ionais.0 Por '2'm$lo( a variEv'l d' r'lao d'
forn'#'dor's 4 'stE 'm >4N. Ila ainda $od' s'r d'#om$osta d'
vErios modos s'm $'rdas( #omo vimos ant's( mas #ada $ro<'o
'm tal d'#om$osio in#l&irE ainda &ma das #6av's #andidatas
ori1inais '( d'ss' modo( no $ar'#' 6av'r vanta1'm $arti#&lar
n'ssa r'd&o adi#ional.
12.3 O PROCII7INTO I NOR7ALIfA!"O I7 RI>U7O
At) a.&i n'st' #a$%t&lo -' 'm todo o #a$%t&lo ant'rior0
tratamos da t)#ni#a d' d'#om$osio s'm $'rdas #omo a&2%lio
ao $ro<'to d' @an#os d' dados. A id)ia @Esi#a ) a s'1&int':
dada &ma variEv'l d' r'lao R 'm 14N ' al1&m #on<&nto d'
4s( 78s ' =s .&' s' a$li#am aR( r'd&zimos sist'mati#am'nt'
R a &ma #ol'o d' variEv'is d' r'laA's Cm'nor'sD .&' so
tam@)m( d' al1&ma forma( mais d's'<Ev'is .&' R. Cada $asso do
$ro#'sso d' r'd&o #onsist' 'm tomar $ro<'A's das variEv'is
d' r'laA's .&' r's&ltam do $asso $r'#'d'nt'. As r'striA's
dadas so 'm$r'1adas 'm #ada $asso $ara 1&iar a 's#ol6a d'
.&ais $ro<'A's tomar 'm s'1&ida. O $ro#'sso 1'ral $od' s'r
'n&n#iado d' modo informal #omo &m #on<&nto d' r'1ras( assim:
1. Tom' $ro<'A's da variEv'l d' r'lao 14N ori1inal $ara
'liminar .&ais.&'r d'$'nd/n#ias f&n#ionais .&' no s'<am
irr'd&t%v'is. Iss' $asso $rod&zirE &ma #ol'o d' variEv'is
d' r'laA's 24N.
R Nat&ralm'nt'( 'ssa o@s'rvao no si1nifi#a .&' 'la 'st'<a
livr' d' todas as anomalias $oss%v'is; .&'r diz'r a$'nas
-r'$'timos0
.&' 'la 'stE livr' d' anomalias .&' $od'm s'r r'movidas $'lo
&so d' $ro<'A's. ?3G
2. Tom' $ro<'A's d'ssas variEv'is d' r'laA's 24N $ara
'liminar .&ais.&'r d'$'nd/n#ias f&n#ionais transitivas. Iss'
$asso $rod&zirE &ma #ol'o d' variEv'is d' r'laA's ?4N.
?. Tom' $ro<'A's d'ssas variEv'is d' r'laA's ?4N $ara
'liminar .&ais.&'r d'$'nd/n#ias f&n#ionais r'stant's 'm .&' o
d't'rminant' no s'<a &ma #6av' #andidata. Iss' $asso
$rod&zirE &ma #ol'o d' variEv'is d' r'laA's 4N*C. Nota: as
r'1ras d' 1 a ? $od'm s'r r's&midas 'm &ma Mni#a ori'ntao:
CTom' $ro<'A's da variEv'l d' r'lao ori1inal at) 'liminar
todas as 4s 'm .&' o d't'rminant' no s'<a &ma #6av'
#andidataD.
3. Tom' $ro<'A's d'ssas variEv'is d' r'laA's 4N*C $ara
'liminar .&ais.&'r 78s .&' no s'<am tam@)m 4s. Iss' $asso
$rod&zirE &ma #ol'o d' variEv'is d' r'laA's 34N. Nota: na
$rEti#a( ) &s&al 'liminar 9 Cs'$arando A8Rs ind'$'nd'nt'sD(
#omo '2$li#amos 'm nossa dis#&sso do '2'm$lo d' CPT na >'o
12.2 9 tais 78s ant's d' a$li#ar as r'1ras d' 1 a ?
ant'rior's.
5. Tom' $ro<'A's d'ssas variEv'is d' r'laA's 34N $ara
'liminar .&ais.&'r =s .&' no s'<am im$li#adas $or #6av's
#andidatas 9 'm@ora talv'z d'vamos a#r's#'ntar Cs' vo#/
#ons'1&ir 'n#ontrE:lasD. Iss' $asso $rod&zirE &ma #ol'o d'
variEv'is d' r'laA's 'm >4N.
8Erios $ontos s&r1'm do r's&mo $r'#'d'nt'.
1. Im $rim'iro l&1ar( o $ro#'sso d' tomar $ro<'A's a #ada
$asso d'v'( ) #laro( s'r f'ito s'm $'rdas ' d' $r'f'r/n#ia d'
&m modo .&' tam@)m $r's'rv' as d'$'nd/n#ias.
2. Not' .&' -#omo foi $rim'iro o@s'rvado $or 4a1in na
r'f'r/n#ia [12.13_0( '2ist' &m $aral'lismo m&ito atra'nt'
'ntr' as d'finiA's d' 4N*C( 34N ' 54N( o& s'<a:
e Uma variEv'l d' r'lao R 'stE 'm 4N*C s' ' som'nt' s' toda
4 satisf'ita $or R ) im$li#ada $'las #6av's #andidatas d' R.
e Uma variEv'l d' r'lao R 'stE 'm 34N s' ' som'nt' s' toda
78 satisf'ita $or R ) im$li#ada $'las #6av's #andidatas d'
R.
e Uma variEv'l d' r'lao R 'stE 'm >4N s' ' som'nt' s' toda
= satisf'ita $or R ) im$li#ada $'las #6av's #andidatas d' R.
As anomalias d' at&alizao dis#&tidas no Ca$%t&lo 11 ' 'm
s'A's ant'rior's d'st' #a$%t&lo so $r'#isam'nt' anomalias
#a&sadas $or 4s o& 78s o& =s .&' no so im$li#adas $or
#6av's #andidatas.
?. Os o@<'tivos 1'rais do $ro#'sso d' normalizao so os
s'1&int's:
e Iliminar #'rtas 's$)#i's d' r'd&ndVn#ias.
e Ivitar #'rtas anomalias d' at&alizao.
e Prod&zir &m $ro<'to .&' s'<a &ma C@oaD r'$r's'ntao do
m&ndo r'al 9 isto )( .&' s'<a int&itiva: m'nt' fE#il d'
'nt'nd'r ' &ma @oa @as' $ara #r's#im'nto f&t&ro.
e >im$lifi#ar a im$osio d' #'rtas r'striA's d'
int'1ridad'.
8amos '2aminar &m $o&#o mais o Mltimo it'm da lista. A id)ia
1'ral ) .&' -#omo m'n#ionamos nos Ca$%t&los H( 1B ' 'm o&tras
$art's d'st' livro0 al1&mas r'striA's d' int'1ridad)
im$li#am o&tras. Como '2'm$lo trivial( a r'strio d' .&'
salErios d'v'm s'r maior's .&' g1B.BBB #'rtam'nt' im$li#a a
r'strio .&' 'l's d'v'm s'r maior's .&' z'ro. Ora( s' a
r'strio A im$li#a a r'strio *( 'nto a im$osio d' A
im$orE * a&tomati#am'nt' -n'm m'smo s'rE n'#'ssErio 'n&n#iar
* d' forma '2$l%#ita( '2#'to talv'z #omo #om'ntErio0. I a
normalizao at) >4N nos dE &m modo sim$l's d' im$or #'rtas
r'striA's im$ortant's ' d' o#orr/n#ia fr'.h'nt' 9
@asi#am'nt' t&do o .&' t'mos a faz'r ) im$or a &ni#idad' d'
#6av's #andidatas( ' 'nto todas as =s -' todas as 78s '
todas as 4s0 s'ro im$ostas a&tomati#am'nt' 9 $or.&'( )
#laro( todas 'ssas =s -' 78s ' 4s0 s'ro im$li#adas $'las
#6av's #andidatas.
?3H
3. 7ais &ma v'z 'nfatizamos .&' as ori'ntaA's $ara
normalizao so a$'nas ori'ntaA's ' o#asionalm'nt' $od'riam
'2istir @oas razA's $ara no normalizar Cat) o fimD. O
'2'm$lo #lEssi#o d' &m #aso 'm .&' a normalizao #om$l'ta
$od'ria no s'r &ma @oa id)ia ) forn'#ido $'la variEv'l d'
r'lao d' nom' ' 'nd'r'o NINR -#ons&lt' o I2'r#%#io 11.G
no Ca$%t&lo 110 9 'm@ora( $ara s'r fran#o( 'ss' '2'm$lo no
s'<a m&ito #onvin#'nt'... Como r'1ra $rEti#a( no normalizar
at) o fim 'm 1'ral ) mE id)ia.
5. R'$'timos tam@)m o d'tal6' visto no Ca$%t&lo 11( d' .&' as
noA's d' d'$'nd/n#ia ' normalizao avanada so s'mVnti#as
$or nat&r'za 9 'm o&tras $alavras( 'las 'sto r'la#ionadas
#om o .&' os dados si1nifi#am. Im #ontrast'( a El1'@ra
r'la#ional ' o #El#&lo r'la#ional( ' ainda lin1&a1'ns #omo
>KL .&' s' @as'iam n'ss's formalismos( t/m r'lao a$'nas #om
valor's d' dados r'ais; 'las no '2i1'm n'm $od'm '2i1ir
.&al.&'r n%v'l $arti#&lar d' normalizao al)m do $rim'iro.
As ori'ntaA's d' normalizao avanada d'v'm s'r
#onsid'radas $rin#i$alm'nt' #omo &ma dis#i$lina $ara a<&dar o
$ro<'tista d' @an#os d' dados -' $ortanto o &s&Erio0 9 &ma
dis#i$lina $'la .&al o $ro<'tista $od' #a$t&rar &ma $art'(
'm@ora m&ito $'.&'na( da s'mVnti#a do m&ndo r'al d' &m modo
sim$l's ' dir'to.
F. Contin&ando a $artir do $onto ant'rior: as id)ias d'
normalizao so Mt'is no $ro<'to d' @an#os d' dados mas 'las
no so &m $ana#)ia. A.&i 'sto al1&mas das razA's $ara isso
-'ssa lista foi 'la@orada na r'f'r/n#ia [12.O_:
e i v'rdad' .&' a normalizao $od' a<&dar a im$or #'rtas
r'striA's d' int'1ridad' d' modo m&ito sim$l's( mas -#omo
vimos no Ca$%t&lo H0 =s( 78s ' 4s no so os Mni#os ti$os
d' r'strio .&' $od'm s&r1ir na $rEti#a.
e A d'#om$osio $od' no s'r Mni#a -na v'rdad'( 'm 1'ral
'2istiro m&itas man'iras d' r'd&zir &ma dada #ol'o d'
variEv'is d' r'laA's U 54N0 ' '2ist'm $o&#os #rit)rios
o@<'tivos $ara 's#ol6'r 'ntr' d'#om$osiA's alt'rnativas.
e A 4N*C ' os o@<'tivos d' $r's'rvao d' d'$'nd/n#ias
o#asionalm'nt' $od'm 'star 'm #onflito( #omo '2$li#amos na
>'o 11.5 -Co $ro@l'ma IAPD0.
e O $ro#'dim'nto d' normalizao 'limina r'd&ndVn#ias tomando
$ro<'A's( mas n'm todas as r'd&ndVn#ias $od'm s'r 'liminadas
d'ssa man'ira -Co $ro@l'ma CPTD 9 #ons&lt' a anotao U
r'f'r/n#ia [12.1?_0.
Tam@)m d'v'mos m'n#ionar .&'( d' .&al.&'r modo( as
m'todolo1ias $ara &m @om $ro<'to to$:doXn t'nd'm a 1'rar
$ro<'tos #om$l'tam'nt' normalizados -#ons&lt' o Ca$%t&lo 1?0.
12.5 U7A O*>IR8A!"O >O*RI I>NOR7ALIfA!"O
At) a1ora n'st' #a$%t&lo -' 'm todo o #a$%t&lo ant'rior0(
#onsid'ramos #omo #'rto .&' a normalizao #om$l'ta at) a >4N
) d's'<Ev'l. Por)m( na $rEti#a( s' afirma #om fr'.h/n#ia .&'
a Cd'snormalizaoD ) n'#'ssEria $ara s' al#anar &m @om
d's'm$'n6o. O ar1&m'nto ) s'm'l6ant' a 'st':
1. Normalizao #om$l'ta si1nifi#a m&itas variEv'is d'
r'laA's lo1i#am'nt' isoladas -' s&$omos a.&i .&' as
variEv'is d' r'laA's 'm .&'sto so 's$'#ifi#am'nt'
variEv'is d' r'laA's @Esi#as0.
2. 7&itas variEv'is d' r'laA's lo1i#am'nt' isoladas
si1nifi#a m&itos ar.&ivos armaz'nados fisi#am'nt' isolados.
?. 7&itos ar.&ivos armaz'nados fisi#am'nt' isolados si1nifi#a
m&itas o$'raA's d' I,>.
No s'ntido '2ato( ) #laro .&' 'ss' ar1&m'nto no ) vElido
$or.&' -#omo d'#laramos 'm o&tro l&1ar n'st' livro0 o mod'lo
r'la#ional no 'sti$&la 'm n'n6&ma $art' .&' as variEv'is d'
r'laA's @Esi#as d'v'm o@'d'#'r a &m ma$'am'nto d' &m $ara &m
$ara ar.&ivos armaz'nados. A d'snormalizao( s' n'#'ssEria(
d'v' s'r f'ita no n%v'l dos ar.&ivos armaz'nados( no no
n%v'l d' variEv'is d' r'laA's @Esi#as. Por)m( o ar1&m'nto )
vElido( at) #'rto $onto( $ara $rod&tos d' >KL d' 6o<'(
<&stam'nt' $or #a&sa do
1ra& inad'.&ado d' s'$arao 'ntr' 'ss's dois n%v'is .&'
'n#ontramos na.&'l's $rod&tos. Assim( n'sta s'o( vamos
'2aminar mais d' $'rto a noo d' Cd'snormalizaoD. Nota: a
dis#&sso a s'1&ir ) fort'm'nt' @as'ada no mat'rial da
r'f'r/n#ia [12.F_.
O .&' ) d'snormalizaoW
Para r'v'r ra$idam'nt'( normalizar &ma variEv'l d' r'lao R
si1nifi#a s&@stit&ir R $or &m #on<&nto d' $ro<'A's Ri( ...(
Rn -di1amos0 tais .&'( $ara todos os valor's r $oss%v'is da
variEv'l d' r'lao R( s' os valor's #orr's$ond'nt's ri( ...(
rn d' $ro<'A's Ri( ...( Rn for'm novam'nt' r'&nidos $or
<&no( 'nto o r's&ltado d'ssa <&no t'rE a 1arantia d' s'r
i1&al a R. O o@<'tivo 1lo@al ) r'd&zir a r'd&ndVn#ia( $'la
#'rt'za d' .&' #ada &ma das $ro<'A's Ri( ...( Rn 'stE no
n%v'l mais alto $oss%v'l d' normalizao -isto )( >4N0.
A1ora $od'mos d'finir d'snormalizao #omo a s'1&ir. >'<a Ri(
...( Rn &m #on<&nto d' variEv'is d' r'laA's. Into(
d'snormalizar 'ssas variEv'is d' r'laA's si1nifi#a
s&@stit&%:las $or s&a <&no R -di1amos0 tal .&'( $ara todos
os valor's $oss%v'is ri( ...( rn d' Ri( ...( Rn( $ro<'tar o
valor #orr's$ond'nt' r d' R so@r' os atri@&tos d' Ri of'r'#'
a 1arantia d' 1'rar ri novam'nt' -i b 1( ...( n0. O o@<'tivo
1lo@al ) a&m'ntar a r'd&ndVn#ia( ass'1&rando .&' R 'stE 'm &m
n%v'l mais @ai2o d' normalizao .&' as variEv'is d' r'laA's
Ri( ...( Rn. 7ais 's$'#ifi#am'nt'( o o@<'tivo ) r'd&zir o
nMm'ro d' <&nA's .&' $r'#isam s'r r'alizadas 'm t'm$o d'
'2'#&o faz'ndo:s' -na r'alidad'0 al1&mas d'ssas <&nA's
ant'#i$adam'nt'( #omo $art' do $ro<'to do @an#o d' dados.
Como '2'm$lo( $od'mos #onsid'rar a d'snormalizao d' $'as '
r'm'ssas $ara $rod&zir &ma variEv'l d' r'lao P>K #omo
indi#a a 4i1&ra 12.F.R O@s'rv' .&' a variEv'l d' r'lao P>K
'stE 'm 14N( mas no 'm 24N.
Al1&ns $ro@l'mas
O #on#'ito d' d'snormalizao sofr' d' vErios $ro@l'mas @'m
#on6'#idos. Um d'l's ) .&'( &ma v'z .&' #om'amos a
d'snormalizar( no 'stE #laro ond' d'v'mos $arar... Com a
normalizao( '2ist'm razA's lZ1i#as #laras $ara #ontin&ar
at) al#anar a forma normal mais alta $oss%v'l; 'nto(
$od'mos #on#l&ir .&' d'v'mos $ross'1&ir #om a d'snormalizao
at) al#anarmos a forma normal mais @ai2a $oss%v'lW
>'1&ram'nt' no; ainda no 6E n'n6&m #rit)rio lZ1i#o $ara
d'#idir '2atam'nt' ond' $arar. Im o&tras $alavras( ao
's#ol6'rmos d'snormalizar( 'stamos d'sistindo d' &ma $osio
.&' $'lo m'nos t'm al1&ns #on#'itos #i'nt%fi#os sZlidos '
lZ1i#os a a$oiE:la( s&@stit&indo:a $or o&tra #&<a nat&r'za )
$&ram'nt' $ra1mEti#a ' s&@<'tiva.
P>K Pc PNO7I COR PI>O CIAI 4c KI
P1 Por#a 8'rm'l6o 12(B Londr's 41 ?BB
P1 Por#a 8'rm'l6o 12(B Londr's 42 ?BB
P2 Pino 8'rd' 1G(B Paris 4i 2BB
PF T&@o 8'rm'l6o 1O(B Londr's 4i 1BB
4IQURA 12.F 'snormalizao d' $'as ' r'm'ssas
O s'1&ndo $onto Z@vio ) .&' '2ist'm $ro@l'mas d' r'd&ndVn#ia
' at&alizao( $r'#isam'nt' $or.&' 'stamos lidando mais &ma
v'z #om variEv'is d' r'laA's .&' no 'sto #om$l'tam'nt'
normalizadas. =E dis#&timos @astant' 'ssas .&'stA's. Por)m( o
.&' ) m'nos Z@vio ) .&' tam@)m $od'm '2istir $ro LE &m
$ro@l'ma #om a d'snormalizao d' forn'#'dor's ' r'm'ssas(
#onsid'rando nossa amostra d' dados 6a@it&al( $or.&' o
forn'#'dor 45 s' $'rd' na <&no. Por 'ssas razA's( al1&mas
$'ssoas $od'riam ar1&m'ntar .&' d'v'mos &sar <&nA's
C'2t'rnasD ?5B no $ro#'sso d' d'snormalizao. Cont&do( a
<&no C'2t'rnaD t'm s'&s $rZ$rios $ro@l'mas( #omo v'r'mos no
Ca$%t&lo 1H.
@i'mas d' @&s#a; o& s'<a( a d'snormalizao $od' na r'alidad'
tornar #'rtas #ons&ltas mais dif%#'is d' '2$r'ssar. Por
'2'm$lo( #onsid'r' a #ons&lta CPara #ada #or d' $'a( o@t'r o
$'so m)dioD. ado nosso $ro<'to normalizado 6a@it&al( &ma
form&lao satisfatZria ):
>U77ARIfI P PIR P S COR T AO A8O - PI>O 0 A> A8jT
Por)m( dado o $ro<'to d'snormalizado da 4i1&ra 12.F( a
form&lao ) &m $o&#o mais #om$li#ada -$ara no m'n#ionar o
fato d' .&' 'la s' @as'ia na 6i$Zt's' 9 'm 1'ral( no vElidaN
9 d' .&' toda $'a t'm $'lo m'nos &ma r'm'ssa0:
>U77ARIfI P>K S Pc( COR( PI>O T PIR P>K S COR
AO A8O - PI>O 0 A> A8jT
-O@s'rv' .&' 'ssa Mltima form&lao $rovav'lm'nt' tam@)m t'rE
d's'm$'n6o $ior.0 Im o&tras $alavras( a $'r#'$o #om&m d'
.&' a d'snormalizao ) C@oa $ara @&s#a( mas r&im $ara
at&alizaoD ) in#orr'ta( 'm 1'ral( tanto $or razA's d'
fa#ilidad' d' &so .&anto d' d's'm$'n6o.
LE ainda &m t'r#'iro ' im$ortant' $ro@l'ma -' isso s' a$li#a
U d'snormalizao C$ro$riam'nt' ditaD 9 isto )( a
d'snormalizao .&' ) f'ito som'nt' no n%v'l f%si#o 9 '
tam@)m ao ti$o d' d'snormalizao .&' Us v'z's t'm d' s'r
f'ita nos $rod&tos d' >KL d' 6o<'0: .&ando diz'mos .&' a
d'snormalizao ) C@oa $ara o d's'm$'n6oD na r'alidad'
.&'r'mos diz'r .&' 'la ) @oa $ara o d's'm$'n6o d' a$li#aA's
's$'#%fi#as. K&al.&'r $ro<'to f%si#o d't'rminado )(
n'#'ssariam'nt'( @om $ara al1&mas a$li#aA's mas r&im $ara
o&tras -) #laro( 'm t'rmos d' d's'm$'n6o0. Por '2'm$lo(
s&$omos .&' #ada variEv'l d' r'lao @Esi#a s'<a ma$'ada $ara
&m Mni#o ar.&ivo fisi#am'nt' armaz'nado ' tam@)m .&' #ada
ar.&ivo armaz'nado #onsista 'm &ma #ol'o fisi#am'nt'
#ont%1&a d' r'1istros armaz'nados( &m $ara #ada t&$la na
variEv'l d' r'lao #orr's$ond'nt'. Into:
e 8amos s&$or .&' r'$r's'ntamos a <&no d' forn'#'dor's(
r'm'ssas ' $'as #omo &ma Mni#a variEv'l d' r'lao @Esi#a '(
#ons'.h'nt'm'nt'( &m Mni#o ar.&ivo armaz'nado. Into( a
#ons&lta CO@t'r d'tal6's d' forn'#'dor $ara forn'#'dor's .&'
forn'#'m $'as v'rm'l6asD $rovav'lm'nt' f&n#ionarE @'m n'ssa
'str&t&ra f%si#a.
e Por)m( a #ons&lta CO@t'r d'tal6's d' forn'#'dor $ara
forn'#'dor's d' Londr'sD t'rE d's'm$'n6o $ior so@r' 'ssa
'str&t&ra f%si#a do .&' t'ria s' tiv)ss'mos mantido as tr/s
variEv'is d' r'laA's @Esi#as ' fiz)ss'mos o ma$'am'nto d'las
$ara tr/s ar.&ivos armaz'nados fisi#am'nt' isolados. A razo
) .&'( n'ss' Mltimo $ro<'to( todos os r'1istros armaz'nados
d' forn'#'dor's 'staro fisi#am'nt' #ont%1&os 'n.&anto no
anti1o $ro<'to 'l's 'staro 's$al6ados $or &ma Er'a mais
am$la '( assim( '2i1iro mais II>.
O@s'rvaA's anElo1as s' a$li#am a .&al.&'r o&tra #ons&lta .&'
t'n6a a#'sso a$'nas a forn'#'dor's( o& a$'nas a $'as( o&
a$'nas a r'm'ssas( 'm v'z d' '2'#&tar al1&m ti$o d' <&no.
12.F PRO=ITO ORTOQONAL -U7A IQRI>>"O0
N'sta s'o( vamos '2aminar ra$idam'nt' o&tro $rin#%$io d'
$ro<'to d' @an#os d' dados( &m .&' no faz $art' da
normalizao avanada 'm si( mas .&' l'm@ra a normalizao 'm
s'& as$'#to #i'nt%fi#o. Il' ) #6amado O Prin#%$io d' Pro<'to
Orto1onal. Consid'r' a 4i1&ra 12.G( .&' mostra &m $ro<'to
o@viam'nt' r&im( mas $oss%v'l( $ara forn'#'dor's; a variEv'l
d' r'lao 4A n'ss' $ro<'to #orr's$ond' a forn'#'dor's .&'
'sto lo#alizados 'm Paris( a variEv'l d' r'lao 4*
#orr's$ond' a forn'#'dor's .&' no 'sto lo#alizados 'm Paris
o& t/m stat&s maior .&' ?B -isto )( 'm t'rmos informais(
'ss's so os $r'di#ados das variEv'is d' r'laA's0. Como a
fi1&ra indi#a( o $ro<'to l'va a #'rtas r'd&ndVn#ias; $ara
s'rmos 's$'#%fi#os( a t&$la $ara o forn'#'dor 4? a$ar'#' d&as
v'z's( &ma 'm #ada variEv'l d' r'lao.
?51
,R forn'#'dor's 'm Paris R,
4IQURA 12.G Um $ro<'to r&im( mas $oss%v'l( $ara forn'#'dor's
A $ro$Zsito( o@s'rv' .&' a t&$la d'v' a$ar'#'r 'm am@os os
l&1ar's. 8amos s&$or .&'( ao #ontrErio( 'la a$ar'#'ss' 'm 4*
-di1amos0( mas no 'm 4A. A a$li#ao da Li$Zt's' d' 7&ndo
4'#6ado a 4A nos informaria .&' o forn'#'dor 4? no 'stE
lo#alizado 'm Paris. Por)m( 4* nos informa .&' o forn'#'dor
P? 'stE lo#alizado 'm Paris. Im o&tras $alavras( t'r%amos &ma
#ontradio 'm nossas mos ' o @an#o d' dados s'ria
in#onsist'nt'.
I #laro .&' $ro@l'ma #om o $ro<'to da 4i1&ra 12.G ) Z@vio:
trata:s' '2atam'nt' do fato d' s'r $oss%v'l U m'sma t&$la
$'rt'n#'r a d&as variEv'is d' r'laA's distintas. Im o&tras
$alavras( as d&as variEv'is d' r'laA's t/m si1nifi#ados
s&$'r$ostos( no s'ntido d' .&' ) $oss%v'l a m'sma t&$la
satisfaz'r aos $r'di#ados d' am@as as variEv'is d' r'laA's.
Assim( &ma r'1ra Z@via ):
O Prin#%$io d' Pro<'to Orto1onal -v'rso ini#ial0: d'ntro d'
&m d't'rminado @an#o d' dados( d&as variEv'is d' r'laA's
@Esi#as .&ais.&'r no d'v'm t'r si1nifi#ados s&$'r$ostos.
>&r1'm $ontos im$ortant's:
1. 8imos no Ca$%t&lo O .&'( do $onto d' vista do &s&Erio(
todas as variEv'is d' r'laA's so variEv'is d' r'laA's
@Esi#as -'2#'to as visA's( .&' so d'finidas #omo m'ras
a@r'viaA's0. Im o&tras $alavras( o $rin#%$io s' a$li#a ao
$ro<'to d' todos os @an#os d' dados C'2$r'ssEv'isD( no
a$'nas ao @an#o d' dados Cr'alD 9 novam'nt'( O Prin#%$io da
R'latividad' d' *an#os d' dados 'm ao. -I #laro .&' s'
a$li#am o@s'rvaA's anElo1as tam@)m aos $rin#%$ios d'
normalizao.0
2. O@s'rv' .&' d&as variEv'is d' r'laA's no $od'm t'r
si1nifi#ados s&$'r$ostos( a m'nos .&' s'<am do m'smo ti$o
-isto )( a m'nos .&' 'las t'n6am o m'smo #a@'al6o0.
?. A ad'so ao $rin#%$io d' $ro<'to orto1onal im$li#a .&'
-$or '2'm$lo0 ao ins'rirmos &ma t&$la( $od'mos #onsid'rar a
o$'rao #omo a ins'ro d' &ma t&$la no @an#o d' dados( '
no 'm al1&ma variEv'l d' r'lao 's$'#%fi#a 9 $or.&' 6av'rE
no mE2imo &ma variEv'l d' r'lao #&<o $r'di#ado s'rE
satisf'ito $'la nova t&$la.
I v'rdad' .&'( .&ando ins'rimos &ma t&$la( 'm 1'ral
's$'#ifi#amos o nom' da variEv'l d' r'lao R na .&al 'ssa
t&$la $od' s'r ins'rida. Por)m( 'ss' fato no invalida o
#om'ntErio ant'rior. O fato ) .&' 'ss' nom' R ) na r'alidad'
a$'nas &ma a@r'viao $ara o $r'di#ado #orr's $ond'nt'(
di1amos PR; na v'rdad'( 'stamos diz'ndo CIN>IRT a t&$la t 9
'( a $ro$Zsito( t d'v' satisfaz'r ao $r'di#ado PRD. Al)m
disso( ) #laro( R $od' s'r &ma viso( talv'z d'finida $or
m'io d' &ma '2$r'sso da forma A UNION * 9 '( #omo vimos no
Ca$%t&lo O( ) m&ito int'r'ssant' .&' o sist'ma sai@a s' a
nova t&$la 'ntrarE 'm A( * o& am@as.
' fato( o@s'rvaA's anElo1as U ant'rior s' a$li#am a todas
as o$'raA's( no a$'nas a o$'raA's IN>IRT; 'm todos os
#asos( os nom's d' variEv'is d' r'laA's so na r'alidad'
a$'nas a@r'viaA's $ara $r'di#ados d' variEv'is d' r'laA's.
'v'mos 'nfatizar .&' so os $r'di#ados( ' no os nom's( .&'
r'$r'?52 s'ntam a s'mVnti#a dos dados.
4A
dddddddddd dddddddddddd dddddddddddd r
'
dddlbid
&
ddddddddddd ddddddddddddd ddddddddddddd n
4* d

lIn
#
a
,R forn'#'dor's no d' Paris o&
#om stat&s ?B R,
4
c
b
4NO
7I
>TAT
U>
CIAI
4
2
4
?
=on
's
*la
k'
1B
?B
Paris
Paris
4
c
4NO
7I
>TAT
U>
CIAI
4
i
4
?
4
3
4
>mi
t6
*la
k'
Cla
rk
Ada
ms
2B
?B
2B
?B
Londr's
Paris
Londr's
At'nas
5
Ainda no #on#l&%mos #om o $rin#%$io d' $ro<'to orto1onal 9
'2ist' &m r'finam'nto im$ortant' .&' $r'#isa s'r 'st&dado.
Consid'r' a 4i1&ra 12.H( .&' mostra o&tro $ro<'to o@viam'nt'
r&im( mas $oss%v'l $ara forn'#'dor's. A.&i( as d&as variEv'is
d' r'laA's $ro$riam'nt' ditas no t/m n'n6&m si1nifi#ado
s&$'r$osto mas s&as $ro<'A's so@r' S4c(4NA7IT #'rtam'nt' sim
-d' fato( os si1nifi#ados d'ssas d&as $ro<'A's so
id/nti#os0. Como &ma #ons'.h/n#ia( &ma t'ntativa d' ins'rir(
di1amos( a t&$la -4F(Lo$'z0 'm &ma viso d'finida #omo a
&nio d'ssas d&as $ro<'A's farE a t&$la -4F(Lo$'z(t0 s'r
ins'rida 'm 4P ' a t&$la -4F(Lo$'z(#0 s'r ins'rida 'm 4l
-ond' t ' # so os valor's $adro a$li#Ev'is0. I #laro .&'
$r'#isamos 'st'nd'r o $rin#%$io d' $ro<'to orto1onal a
$ro@l'mas #omo o da 4i1&ra 12.H:
4IQURA 12.H O&tro $ro<'to r&im( 'm@ora $oss%v'l( $ara
forn'#'dor's
e O Prin#%$io d' Pro<'to Orto1onal -v'rso final0: s'<am A '
* d&as variEv'is d' r'laA's @Esi#as .&ais.&'r no @an#o d'
dados. Into( no d'v'm '2istir d'#om$osiA's s'm $'rdas d' A
' * 'm Ai( ...(Am ' *i( ...( *n -r's$'#tivam'nt'0( tais .&'
al1&ma $ro<'o Ai no #on<&nto Ai(...(Am ' al1&ma $ro<'o *<
no #on<&nto *i(...( *n t'n6am si1nifi#ados s&$'r$ostos.
>&r1'm $ontos im$ortant's:
1. A '2$r'sso Cd'#om$osio s'm $'rdasD si1nifi#a a.&i
'2atam'nt' o .&' s'm$r' si1nifi#a 9 o& s'<a( a d'#om$osio
'm &m #on<&nto d' $ro<'A's tal .&':
e A variEv'l d' r'lao @Esi#a $ossa s'r r'#onstr&%da $'la
<&no das $ro<'A's( r'&nindo:as novam'nt'.
e N'n6&ma d'ssas $ro<'A's s'<a r'd&ndant' n'ss' $ro#'sso d'
r'#onstr&o.
2. Issa v'rso do Prin#%$io in#l&i a v'rso ori1inal( $or.&'
&ma d'#om$osio s'm $'rdas .&' s'm$r' '2ist' $ara a variEv'l
d' r'lao R ) a $ro<'o id'ntidad' d' R -isto )( a $ro<'o
so@r' todos os atri@&tos0.
Com'ntErios
1. 8amos s&$or .&' #om'amos #om a variEv'l d' r'lao &s&al
d' forn'#'dor's 4 mas d'#idimos $ara fins d' $ro<'to
d'sm'm@rar 'ssa variEv'l d' r'lao 'm &m #on<&nto d'
r'striA's. Into( o $rin#%$io d' $ro<'to orto1onal nos
informa .&' as r'striA's n'ssa diviso d'v'm s'r todas
dis<&ntas( no s'ntido d' .&' n'n6&ma t&$la d' forn'#'dor
$od'rE $'rt'n#'r a mais d' &ma d'las. 8amos nos r'f'rir a
'ssa diviso #omo &ma d'#om$osio orto1onal. Nota: o t'rmo
orto1onalidad' d'riva do fato d' .&' o si1nifi#ado 'f'tivo do
$rin#%$io d' $ro<'to ) .&' variEv'is d' r'laA's @Esi#as
d'v'm s'r m&t&am'nt' ind'$'nd'nt's -s'm si1nifi#ados
s&$'r$ostos0. O $rin#%$io ) o do @om s'nso( ) #laro( mas @om
s'nso formalizado -#omo os $rin#%$ios d' normalizao0.
2. O o@<'tivo 1lo@al d' $ro<'to orto1onal ) r'd&zir a
r'd&ndVn#ia ' assim 'vitar anomalias d' at&alizao -mais &ma
v'z( #omo a normalizao0. ' fato( 'l' #om$l'm'nta a
normalizao( no s'ntido d' .&' 9 'm t'rmos informais 9 a
normalizao r'd&z a r'd&ndVn#ia d'ntro d' variEv'is d'
r'laA's 'n.&anto a orto1onalidad' r'd&z a r'd&ndVn#ia 'ntr'
variEv'is d' r'laA's.
?5?
4
P
4c
4NO
7I
>TAT
U>
4
l
4c
4NO
7I
CIA
I
4
i
>rni
t6
2B
4
i
>nii
t6
Londr's
42
=on
's
1B 42
=on
's
Paris
4?
*la
k'
?B 4?
*la
k'
Paris
43
Cla
rk
2B 43
Cla
rk
Londr
's
45
Ada
ms
?B 45
Ada
ms
At'na
s
?. A orto1onalidad' $od'ria s'r @om s'nso( mas fr'.h'nt'm'nt'
'la ) d's#onsid'rada na $rEti#a -na v'rdad'( tal
d's#onsid'rao ) Us v'z's at) r'#om'ndEv'l0. Pro<'tos #omo o
s'1&int'( d' &m @an#o d' dados finan#'iro( so todos m&ito
#om&ns:
ATI8IAI> 1OOG S INTRAAc( I>CRI!"O( 8ALOR( NO8Od>ALO
ATI8IAI> 1OOH S INTRAAc( I>CRI!"O( 8ALOR( NO8Od>ALO
ATI8IAI> 1OOO S INTRAAc( I>CRI!"O( 8ALOR( NO8Od>ALO
ATI8IAI> 2BBB S INTRAAc( I>CRI!"O( 8ALOR( NO8Od>ALO
ATI8IAI> 2BB1 S INTRAAc( I>CRI!"O( 8ALOR( NO8Od>ALO
' fato( a #odifi#ao do si1nifi#ado 'm nom's 9 d' variEv'is
d' r'laA's o& d' .&al.&'r o&tra #oisa
9 viola O Prin#%$io da Informao( .&' d'#lara -) @om
l'm@rar0 .&' todas as informaA's no @an#o
d' dados d'v'm s'r mod'ladas '2$li#itam'nt' 'm t'rmos d'
valor's ' no d' o&tro modo.
3. >' A ' * so variEv'is d' r'laA's @Esi#as do m'smo ti$o(
a ad'so ao $rin#%$io d' $ro<'to orto1onal
im$li#a .&':
A UNION * ) s'm$r' &ma &nio d' dis<&ntos
A INTIR>ICT * ) s'm$r' vazia
A 7INU> H ) s'm$r' i1&al aA
12.G OUTRA> 4OR7A> NOR7AI>
8oltando U normalizao 'm si( l'm@ramos a o@s'rvao f'ita
na introd&o ao Ca$%t&lo 11 d' .&' '2ist'm o&tras formas
normais al)m da.&'las .&' dis#&timos n'st's dois #a$%t&los
at) a1ora. O fato ) .&' a t'oria da normalizao ' os tZ$i#os
r'la#ionados 9 a1ora &s&alm'nt' #on6'#idos #omo t'oria da
d'$'nd/n#ia 9 #r's#'ram at) #onstit&ir &m #am$o $rZ$rio
@astant' #onsid'rEv'l( #om &ma lit'rat&ra m&ito '2t'nsa. A
$'s.&isa na Er'a ) #ont%n&a ' d' fato $rod&tiva. IstE al)m do
's#o$o d'st' #a$%t&lo dis#&tir 'ssa $'s.&isa 'm $rof&ndidad';
&ma @oa viso 1'ral da Er'a -#omo 'la 'ra 'm m'ados da d)#ada
d' 1OHB0 $od' s'r 'n#ontrada na r'f'r/n#ia [12.1G_. A.&i
m'n#ionamos a$'nas al1&mas .&'stA's 's$'#%fi#as.
1. 4orma normal d' #6av' ' dom%nio: a forma normal d' #6av' '
dom%nio -4N,^0 foi $ro$osta $or 4a1in na r'f'r/n#ia [12.15_.
4N,^ 9 dif'r'nt' das formas normais .&' t'mos dis#&tindo 9
no ) d'finida 'm t'rmos d' 4s( 78s o& =s. Im v'z disso(
diz'mos .&' &ma variEv'l d' r'lao R 'stE 'm 4N,^ s' '
som'nt' s' toda r'strio so@r' R ) &ma #ons'.h/n#ia lZ1i#a
das r'striA's d' dom%nios ' das r'striA's d' #6av's .&' s'
a$li#am a R:
a Uma r'strio d' dom%nio 9 #omo o t'rmo ) &sado a.&i 9 )
&ma r'strio $'la .&al valor's d' &m d't'rminado atri@&to
so tomados 'm al1&m dom%nio $r's#rito. -Na t'rminolo1ia do
Ca$%t&lo H( 'ssa r'strio ) na v'rdad' &ma r'strio d'
atri@&to( no &ma r'strio d' dom%nio.0
a Uma r'strio d' #6av' ) &ma r'strio $'la .&al &m #'rto
atri@&to o& &ma #om@inao d' atri@&tos #onstit&i &ma #6av'
#andidata.
A im$osio d' r'striA's so@r' &ma variEv'l d' r'lao 4N,^
) 'nto #on#'it&alm'nt' sim$l's( $ois ) s&fi#i'nt' im$or
a$'nas as r'striA's d' Cdom%niosD ' #6av's ' todas as o&tras
r'striA's s'ro im$ostas a&tomati#am'nt'. O@s'rv' .&' a
'2$r'sso Ctodas as o&tras r'striA'sD si1nifi#a mais .&'
a$'nas 4s( 78s ' =s 9 na v'rdad'( si1nifi#a o $r'di#ado da
variEv'l d' r'lao int'ira.
4a1in mostra na r'f'r/n#ia [12.15_ .&' .&al.&'r variEv'l d'
r'lao 4NN^ 'stE n'#'ssariam'nt' 'm 54N -' $ortanto 'm 34N
't#.0( ' d' fato tam@)m 'm -?(?04N -v'r a s'1&ir0. Por)m( a
4N,^ n'm s'm$r' $od' s'r al#anada( n'm a $'r1&nta
CI2atam'nt' .&ando 'la $od' s'r al#anadaWD $od' s'r
r's$ondida.
2. 4orma normal d' Cr'strio:&nioD: #onsid'r' mais &ma v'z
a variEv'l d' r'lao d' forn'#'dor's 4. A t'oria da
normalizao d's#rita nos informa .&' a variEv'l d' r'lao 4
'stE m &ma forma nor:
mal C@oaD; d' fato( 'la 'stE 'm 54N '( d'ss' modo( t'mos a
1arantia d' .&' 'la 'stE livr' d' anomalias .&' $od'm s'r
'liminadas $'lo &so d' $ro<'A's. Por)m( $or .&' mant'r todos
os forn'#'dor's 'm &ma Mni#a variEv'l d' r'laoW O .&' diz'r
d' &m $ro<'to 'm .&' os forn'#'dor's d' Londr's so mantidos
'm &ma variEv'l d' r'lao -di1amos( L40( os forn'#'dor's d'
Paris 'm o&tra -$or '2'm$lo( P40 ' assim $or diant'W Im
o&tras $alavras( o .&' diz'r da $ossi@ilidad' d' d'#om$or a
variEv'l d' r'lao d' forn'#'dor's ori1inal $or m'io da
r'strio 'm l&1ar da $ro<'oW A 'str&t&ra r's&ltant' s'ria
&m @om $ro<'to o& &m ma& $ro<'toW -Na v'rdad'( .&as'
#'rtam'nt' s'ria &m ma& $ro<'to 9 #ons&lt' o I2'r#%#io G.H no
Ca$%t&lo G 9 mas o im$ortant' ) .&' a t'oria #lEssi#a da
normalizao no t'm a@sol&tam'nt' nada a diz'r 'm r's$osta a
'ssas $'r1&ntas.0
'ss' modo( o&tra ori'ntao $ara a $'s.&isa so@r'
normalizao #onsist' 'm '2aminar as im$li#aA's da
d'#om$osio d' variEv'is d' r'laA's $or al1&ma o$'rao
dif'r'nt' da $ro<'o. No '2'm$lo( o o$'rador d' d'#om$osio
)( #omo m'n#ionamos( a r'strio -dis<&nta0; o o$'rador d'
r'#om$osio #orr's$ond'nt' ) a &nio -dis<&nta0. Assim(
$od'ria s'r viEv'l 'la@orar &ma t'oria d' normalizao $or
Cr'strio&nioD( anElo1a mas novam'nt' orto1onal U t'oria d'
normalizao $or $ro<'o:<&no .&' 'stiv'mos dis#&tindo.R
At) o .&' 'st' a&tor t'm #on6'#im'nto( n'n6&ma t'oria d'ss'
ti$o foi 'la@orada 'm d'tal6's( mas al1&mas id)ias ini#iais
$od'm s'r 'n#ontradas 'm &m arti1o 's#rito $or >mit6 [12.?11(
no .&al ) d'finida &ma nova forma normal #6amada C-?(?04ND. A
-?(?04N im$li#a a 4N*C; $or)m( &ma variEv'l d' r'lao
-?(?04N no $r'#isa 'star 'm 34N( n'm &ma variEv'l d' r'lao
34N $r'#isa 'star 'm -?(?04N; d' modo .&' -#omo s&1'rimos
ant's0( a r'd&o a -?(?04N ) orto1onal U r'd&o a 34N -'
54N0. O&tras id)ias so@r' 'ss' tZ$i#o a$ar'#'m nas
r'f'r/n#ias [12.13_ ' [12.22_.
12.H RI>U7O
N'st' #a$%t&lo( #on#l&%mos nossa dis#&sso -ini#iada no
Ca$%t&lo 110 da normalizao avanada. is#&timos
d'$'nd/n#ias m&ltivaloradas -78s0( .&' so &ma 1'n'ralizao
d' d'$'nd/n#ias f&n#ionais( ' tam@)m as d'$'nd/n#ias d'
<&no -=s0( .&' so &ma 1'n'ralizao d' d'$'nd/n#ias
m&ltivaloradas. Im t'rmos informais:
e Uma variEv'l d' r'lao RSA(*(CT satisfaz Us 78s A 9R:9R *
1 C s' ' som'nt' s' o #on<&nto d' valor's d' * asso#iados a
&m dado $ar -A(C0 d'$'nd' a$'nas do valor d' A( ' d' modo
s'm'l6ant' $ara o #on<&nto d' valor's d' C asso#iados a &m
dado $ar -A(*0. Tal variEv'l d' r'lao $od' s'r d'#om$osta
s'm $'rdas 'm s&as $ro<'A's so@r' SA(*T ' SA(CT; na v'rdad'(
as 78s so &ma #ondio n'#'ssEria ' s&fi#i'nt' $ara 'ssa
d'#om$osio s'r vElida -t'or'ma d' 4a1in0.
e Uma variEv'l d' r'lao RSA(*(. ..(fT satisfaz a = R
SA(*(. ..fT s' ' som'nt' s' 'la ) i1&al U <&no d' s&as
$ro<'A's so@r' A( *( ...( f. Issa variEv'l d' r'lao $od'
-o@viam'nt'0 s'r d'#om$osta s'm $'rdas n'ssas $ro<'A's.
Uma variEv'l d' r'lao 'stE 'm 34N s' as Mni#as 78s a .&'
'la satisfaz so d' fato 4s saindo d' s&$'r#6av's. Uma
variEv'l d' r'lao 'stE 'm >4N 9 tam@)m #6amada forma normal
d' $ro<'o:<&no( 4N,P= 9 s' ' som'nt' s' as Mni#as =s a
.&' 'la satisfaz so na v'rdad' 4s saindo d' s&$'r: #6av's
-si1nifi#ando .&'( s' a = ) R SA(*(...(fT( 'nto #ada A( *(
...( f ) &ma s&$'r#6av'0. A >4N -.&' s'm$r' $od' s'r
al#anada0 ) a Mltima forma normal #om r's$'ito U $ro<'o '
U <&no.
Tam@)m r's&mimos o $ro#'dim'nto d' normalizao a$r's'ntado:o
#omo &ma s'.h/n#ia informal d' 'ta$as ' of'r'#'ndo al1&ns
#om'ntErios r'l'vant's. Im s'1&ida( d's#r'v'mos o Prin#%$io
d' Pro<'to Orto1onal: 'm t'rmos informais( d&as variEv'is d'
r'laA's no d'v'm t'r $ro<'A's #om si1nifi#ados
s&$'r$ostos. Por fim m'n#ionamos ra$idam'nt' al1&mas formas
normais adi#ionais.
Con#l&indo( talv'z d'v/ss'mos o@s'rvar .&' a $'s.&isa so@r'
'ssas .&'stA's ) &ma atividad' m&ito int'r'ssant'. A razo )
.&' o #am$o d' Cnormalizao avanadaD o& da t'oria da
d'$'nd/n#ia( #omo
R Na v'rdad'( 4a1in [12.13_ #6amo& ori1inalm'nt' >4N d' forma
normal d' $ro<'o:<&no( '2atam'nt' $or.&' 'ra a forma
normal #om r'lao aos o$'rador's d' $ro<'o ' <&no. ?55
a1ora ) #6amada mais &s&alm'nt'( r'$r's'nta a Mni#a $art' d'
#i/n#ia 'm &ma Er'a 9 o $ro<'to d' @an#os d' dados 9 .&'
lam'ntav'lm'nt' ainda ) d'masiado art%sti#o -isto )( ainda )
s&@<'tivo d'mais ' #ar'#' d' $rin#%$ios sZlidos '
ori'ntaA's0. Portanto( .&al.&'r s&#'sso $ost'rior na
$'s.&isa so@r' a t'oria da d'$'nd/n#ia s'rE m&ito @'m:vinda.
IPIRCCIO>
12.1 As variEv'is d' r'laA's CPT ' 4P= dis#&tidas no t'2to
do #a$%t&lo 9 v'<a as 4i1&ras 12.2 ' 12.3( a fim d' o@t'r
al1&mas amostras d' valor's 9 satisfaziam a &ma #'rta 78 '
&ma #'rta =( r's$'#tivam'nt'( .&' no 'ra im$li#ada $'las
#6av's #andidatas da variEv'l d' r'lao 'm #ada #aso.
I2$r'ss' 'ssa 78 ' 'ssa = na sinta2' do Ca$%t&lo H.
12.2 >'<a C &m #'rto #l&@'( ' s'<a a variEv'l d' r'lao
RSA(*T tal .&' a t&$la -a(@0 $'rt'n#' aR s' ' som'nt' s' a '
@ $'rt'n#'m am@os a C. A .&' 4s( 78s ' =s R satisfazW Im
.&' forma normal 'la 'stEW
12.? Um @an#o d' dados d'v' #ont'r informaA's r'lativas a
r'$r's'ntant's d' v'ndas( Er'as d' v'ndas ' $rod&tos. Cada
r'$r's'ntant' ) r's$onsEv'l $'las v'ndas 'm &ma o& mais
Er'as; #ada Er'a t'm &m o& mais r'$r's'ntant's r's$onsEv'is.
' modo s'm'l6ant'( #ada r'$r's'ntant' ) r's$onsEv'l $'las
v'ndas d' &m o& mais $rod&tos( ' #ada $rod&to t'm &m o& mais
r'$r's'ntant's r's$onsEv'is. Cada $rod&to ) v'ndido 'm todas
as Er'as; $or)m( dois r'$r's'ntant's n&n#a v'nd'm o m'smo
$rod&to na m'sma Er'a. Todo r'$r's'ntant' v'nd' o m'smo
#on<&nto d' $rod&tos 'm toda Er'a $'la .&al 'ss'
r'$r's'ntant' ) r's$onsEv'l. Pro<'t' &m #on<&nto ad'.&ado d'
variEv'is d' r'laA's $ara 'ss's dados.
12.3 Na r's$osta ao I2'r#%#io 11.? no Ca$%t&lo 11( d'mos &m
al1oritmo $ara a d'#om$osio s'm $'rdas d' &ma variEv'l d'
r'lao ar@itrEria R 'm &m #on<&nto d' variEv'is d' r'laA's
4N*C. R'vis' 'ss' al1oritmo d' modo .&' 'l' forn'a variEv'is
d' r'laA's 34N.
12.5 -8'rso modifi#ada do I2'r#%#io 12.?.0 Um @an#o d' dados
d'v' #ont'r informaA's r'lativas a r'$r's'ntant's d' v'ndas(
Er'as d' v'ndas ' $rod&tos. Cada r'$r's'ntant' ) r's$onsEv'l
$'las v'ndas 'm &ma o& mais Er'as; #ada Er'a t'm &m o& mais
r'$r's'ntant's r's$onsEv'is. ' modo s'm'l6ant'( #ada
r'$r's'ntant' ) r's$onsEv'l $'las v'ndas d' &m o& mais
$rod&tos( ' #ada $rod&to t'm &m o& mais r'$r's'ntant's
r's$onsEv'is. 4inalm'nt'( #ada $rod&to ) v'ndido 'm &ma o&
mais Er'as( ' #ada Er'a t'm &m o& mais $rod&tos v'ndidos
n'la. Ainda mais( s' o r'$r's'ntant' R) r's$onsEv'l $'la Er'a
A( ' o $rod&to P) v'ndido na Er'a A( ' o r'$r's'ntant' R )
r's$onsEv'l $'lo $rod&to P( 'nto R v'nd' P 'm A. Pro<'t' &m
#on<&nto ad'.&ado d' variEv'is d' r'laA's $ara 'ss's dados.
RI4IRJNCIA> I *I*LIOQRA4IA
12.1 A. 8. A6o( C. *''ri '=. . Uliman. CT6' T6'or+ of =oins
in R'lational ata@as'sD AC7 TO> 3( NMm'ro ? -s't'm@ro d'
1OGO0. P&@li#ada $'la $rim'ira v'z 'm Pro#. lOt6 IIII >+m$.
on 4o&ndations of Com$&t'r >#i'n#' -o&t&@ro d' 1OGG0.
O arti1o .&' $rim'iro o@s'rvo& .&' $odiam '2istir variEv'is
d' r'laA's .&' no 'ram i1&ais U <&no d' d&as .&ais.&'r d'
s&as $ro<'A's( mas 'ram i1&ais U <&no d' tr/s o& mais. O
o@<'tivo $rin#i$al do arti1o 'ra o d' a$r's'ntar &m
al1oritmo( a1ora 'm 1'ral #6amado #6as'( a fim d' d't'rminar
s' &ma dada = ) o& no &ma #ons'.h/n#ia lZ1i#a d' &m
d't'rminado #on<&nto d' 4s -&m '2'm$lo do $ro@l'ma d'
im$li#ao 9 v'r a r'f'r/n#ia [12.1G_0. Iss' $ro@l'ma )
'.&ival'nt' ao d' d't'rminar s' &ma d't'rminada d'#om$osio
) s'm $'rdas( dado &m #'rto #on<&nto d' 4s. O arti1o dis#&t'
tam@)m a .&'sto d' 'st'nd'r o al1oritmo $ara lidar #om o
#aso 'm .&' as d'$'nd/n#ias dadas no so 4s( mas sim 78s.
12.2 Catri'l *''ri( Ronald 4a1in ' =o6n L. LoXard. CA
Com$l't' A2iomatization for 4&n#tional and 7&lti:8al&'d
'$'nd'n#i'sD( Pro#. 1OGG AC7 >IQ7O Int. Conf. on 7ana1'm'nt
of ata( Toronto( CanadE -a1osto d' 1OGG0.
Ist'nd' o tra@al6o d' Armstron1 [1B.1_ $ara in#l&ir 78s
tanto .&anto 4s. Im $arti#&lar( of'r'#' o s'1&int' #on<&nto
d' r'1ras d' inf'r/n#ia #orr'tas ' #om$l'tas $ara 78s:
1. Com$l'm'ntao: s'( A( *( C in#l&'m <&ntos todos os
atri@&tos da variEv'l d' r'lao ' A ) &m s&$'r#on<&nto d' *
n C( 'nto A 9R9R * s' ' som'nt' s' A 9R::R C.
2. R'fl'2ividad': s' * ) &m s&@#on<&nto d' A( 'nto A 9:::]
*.
?5F
?. A&m'nto: >' A 9R::R * ' C ) &m s&@#on<&nto d' ( 'nto A
9R::R *C.
3. Transitividad': >' A 9]::] * ' * 9]:::R C( 'nto A 9R9R C
: *.
As s'1&int's r'1ras d' inf'r/n#ia adi#ionais -' mt'is0 $od'm
s'r d'rivadas das .&' foram dadas ant'riorm'nt'.
5. Ps'&dotransitividad': s' A 9R9R * ' *C 99R ( 'nto AC 9
R:::R : *.
F. Unio: s'A:R:R*'A9R9C'ntoA:::R9*C.
G. '#om$osio:s'A9\*C'ntoA:::R9R*#nC(A::R::R*9C'A:::R9RC9
*.
O arti1o #ontin&a 'nto dando mais d&as r'1ras $'las .&ais
#'rtas 4s $od'm s'r inf'ridas a $artir d' #'rtas #om@inaA's
d' 4s ' 78s:
H. R'$li#ao: s' A 9R *( 'nto A 9R9R *.
O. Coal's#/n#ia: s' A 9R9:R * ' C 9R ( ' s' ) &m
s&@#on<&nto d' * ' * n C ) vazio( 'nto A 9R .
As r'1ras d' Armstron1 -#ons&lt' o Ca$%t&lo 1B0 <&ntam'nt'
#om as r'1ras d' 1 a 3 ' H ' O ant'rior's formam &m #on<&nto
#orr'to ' #om$l'to d' r'1ras d' inf'r/n#ia $ara 4s ' $ara
78s #onsid'radas 'm #on<&nto.
O arti1o tam@)m d'riva mais &ma r'1ra Mtil .&' r'la#iona 4s
' 78s:
1B. >'A:\9R*'A*:\C('ntoA9RC:*.
12.? 8olk'rt *rosda ' Qottfri'd 8oss'n. CU$dat' and R'tri'val
T6ro&16 a Univ'rsal >#6'ma Int'rfa#'D( AC7 TO> 1?( NMm'ro 3
-d'z'm@ro d' 1OHH0.
T'ntativas ant'rior's d' forn'#'r &ma int'rfa#' d' Cr'lao
&niv'rsalD -v'r a r'f'r/n#ia [12.1O10 tratam a$'nas d'
o$'raA's d' @&s#a. Iss' arti1o d's'nvolv' &ma a@orda1'm $ara
tratar tam@)m #om o$'raA's d' at&alizao.
12.3 C. Ro@'rt Carlson ' Ro@'rt 5. ^a$lan. CA Q'n'raliz'd
A##'ss Pat6 7od'l and Its A$$li#ation to a R'lational ata
*as' >+st'mD( Pro#. 1OGF AC7 >IQ7O Int. Conf. on 7ana1'm'nt
of ata( jas6in1ton( .C. -<&n6o d' 1OGF0.
8'<a a anotao U r'f'r/n#ia [12.1O1.
12.5 C. =. at': Cjill t6' R'al 4o&rt6 Normal 4orm Pl'as'
>tand U$WD( 'm C. =. at' ' L&16 arX'n( R'lationaN ata@as'
jritin1s 1OHO:1OO1. R'adin1( 7ass.: Addison:j'sl'+ -1OO20.
Parafras'ando o r's&mo: C6E vErias noA's distintas no m&ndo
do $ro<'to d' @an#os d' dados r'#lamando o t%t&lo d' .&arta
forma normal -34N0. O o@<'tivo d'ss' arti1o ) t'ntar
's#lar'#'r os r'1istrosD. Talv'z d'vamos a#r's#'ntar .&' -)
#laro0 a noo r'f'r'n#iada #omo 34N no t'2to d'st' #a$%t&lo
) a Mni#a 34N v'rdad'ira ... No a#'it' s&@stit&tosN
12.F C. =. at': CT6' Normal Is>o ... Int'r'stin1D -'m d&as
$art's0( *Po 1B( NMm'ros 11 ' 12 -nov'm@ro ' d'z'm@ro d'
1OOG0.
A dis#&sso so@r' d'snormalizao na >'o 12.5 foi tirada
d'ss' arti1o. 8al' a $'na m'n#ionar os s'1&int's d'tal6's
adi#ionais:
e 7'smo 'm @an#os d' dados som'nt' d' l'it&ra( ainda )
n'#'ssErio 'n&n#iar as r'striA's d' int'1ridad'( $ois 'las
d'fin'm o si1nifi#ado dos dados ' -#omo o@s'rvamos na >'o
12.30 no d'snormalizar forn'#' &m m'io sim$l's $ara 'n&n#iar
#'rtas r'striA's im$ortant's. Al)m disso( s' o @an#o d'
dados no ) som'nt' d' l'it&ra( 'nto a no d'snormalizao
tam@)m forn'#' &m m'io sim$l's $ara im$or 'ssas r'striA's.
e 'snormalizao im$li#a a&m'nto da r'd&ndVn#ia 9 mas -ao
#ontrErio da o$inio $o$&lar0 o a&m'nto da r'd&ndVn#ia no
im$li#a n'#'ssariam'nt' d'snormalizaoN 7&itos a&tor's
#a%ram n'ssa armadil6a( ' al1&ns #ontin&am a #air.
e Como r'1ra 1'ral( a d'snormalizao -no n%v'l lZ1i#o( val'
diz'r0 d'v' s'r t'ntada #omo tEti#a d' d's'm$'n6o Csom'nt' s'
t&do mais fal6arD [3. 1F_.
12.G C. =. at': CT6' 4inal Normal 4ormND -'m d&as $art's0
*Po 11( NMm'ros 1 ' 2 -<an'iro ' f'v'r'iro d'
1OOH0.
Um t&torial so@r' =s ' >4N. ?5G
II
t&%da $or $ro<'A's s&#'ssivam'nt' Cm'nor'sD -d' 1ra& mais
@ai2o0( at) s' al#anar al1&ma C@oaD 'str&t&ra. Por)m( 'ssa
6i$Zt's' ini#ial ) r'alista o& <&stifi#Ev'lW A r'f'r/n#ia
[12.1O_ s&1'r' .&' no( $or razA's $rEti#as ' t'Zri#as. A
r'f'r/n#ia [12.?2_ ) &ma r's$osta U r'f'r/n#ia [12.1O_( ' a
r'f'r/n#ia [12.2B_ ) &ma r's$osta a 'ssa r's$osta.
A s'1&nda manif'stao( ' a mais si1nifi#ativa
$ra1mati#am'nt'( do #on#'ito d' variEv'l d' r'lao &niv'rsal
) #omo &ma int'rfa#' do &s&Erio. A id)ia @Esi#a a.&i ) m&ito
dir'ta( ' d' fato -d' &m $onto d' vista int&itivo0 @astant'
atra'nt': os &s&Erios d'v'm s'r #a$az's d' 'n&n#iar s&as
soli#itaA's ao @an#o d' dados( no 'm t'rmos d' variEv'is d'
r'laA's ' <&nA's 'ntr' 'ssas variEv'is d' r'laA's( mas sim
'm t'rmos d' atri@&tos isolados. Por '2'm$lo:
>TATU> jLIRI COR b COR - p8'rm'l6on
-CO@t'r o stat&s $ara forn'#'dor's .&' forn'#'m al1&ma $'a
v'rm'l6aD.0 A.&i a id)ia s' ramifi#a 'm d&as int'r$r'taA's
mais o& m'nos distintas:
1. Uma $ossi@ilidad' ) .&' o sist'ma d'v' d' al1&m modo
d't'rminar $or si m'smo .&ais #amin6os d' a#'sso lZ1i#os
s'1&ir -'m $arti#&lar( .&' <&nA's '2'#&tar0 $ara r's$ond'r U
#ons&lta. Issa ) a a@orda1'm s&1'rida na r'f'r/n#ia [12.3_
-.&' $ar'#' t'r sido o $rim'iro arti1o a dis#&tir a
$ossi@ilidad' d' &ma int'rfa#' d' Cr'lao &niv'rsalD( 'm@ora
no t'n6a &sado o t'rmo0. Issa a@orda1'm ) d'$'nd'nt' d' modo
#r%ti#o da nom'ao a$ro$riada d' atri@&tos. Assim( $or
'2'm$lo( os dois atri@&tos d' nMm'ros d' forn'#'dor's -nas
variEv'is d' r'laA's 4 ' 4P( r's$'#tivam'nt'0 d'v'm t'r o
m'smo nom'; inv'rsam'nt'( os atri@&tos #idad' d' forn'#'dor '
#idad' d' $'a -nas variEv'is d' r'laA's 4 ' P(
r's$'#tivam'nt'0 no d'v'm r'#'@'r o m'smo nom'. >' &ma
d'ssas d&as r'1ras for violada( 6av'rE #'rtas #ons&ltas .&' o
sist'ma s'rE in#a$az d' tratar ad'.&adam'nt'.
2. A o&tra a@orda1'm( m'nos am@i#iosa( #onsist' sim$l'sm'nt'
'm #onsid'rar todas as #ons&ltas #omo s'ndo form&ladas 'm
t'rmos d' &m #on<&nto d' <&nA's $r'd'finido 9 na v'rdad'(
&ma viso $r'd'finida #onsistindo na <&no d' todas as
variEv'is d' r'laA's no @an#o d' dados.
Im@ora no '2ista n'n6&ma dMvida d' .&' .&al.&'r das d&as
a@orda1'ns sim$lifi#aria 'norm'm'nt' a '2$r'sso d' m&itas
#ons&ltas .&' s&r1'm na $rEti#a 9 '( d' fato( &ma $art' d'ssa
a@orda1'm ) 'ss'n#ial ao s&$ort' d' .&al.&'r front:'nd da
lin1&a1'm nat&ral 9 tam@)m fi#a #laro .&' o sist'ma d'v'
admitir a $ossi@ilidad' d' 's$'#ifi#ar #amin6os d' a#'sso
-lZ1i#os0 d' forma '2$l%#ita 'm 1'ral. Para v'r #omo isso
d'v' s'r f'ito( #onsid'r' a #ons&lta:
>TATU> jLIRI COR COR - p8'rm'l6o
Issa #ons&lta si1nifi#a CO@t'r stat&s d' forn'#'dor's .&'
forn'#'m &ma $'a .&' no ) v'rm'l6aD o& CO@t'r stat&s d'
forn'#'dor's .&' no forn'#'m &ma $'a v'rm'l6aDW >'<a #omo
for( t'm d' 6av'r al1&m modo d' form&lar a o&tra #ons&lta.
-P'nsando @'m( o $rim'iro '2'm$lo tam@)m ) s&s#'t%v'l d' &ma
int'r$r'tao alt'rnativa: CO@t'r stat&s d' forn'#'dor's .&'
sZ forn'#'m $'as v'rm'l6asD.0 I a.&i 'stE &m t'r#'iro
'2'm$lo: CO@t'r $ar's d' forn'#'dor's .&' so #o:
lo#alizadosD. A.&i mais &ma v'z fi#a #laro .&' &ma <&no
'2$l%#ita s'rE n'#'ssEria -$or.&' o $ro@l'ma 'nvolv' &ma
<&no da variEv'l d' r'lao 4 #om 'la m'sma( 'm t'rmos
informais0.
12.2B jilliam ^'nt: CT6' Univ'rsal R'lation R'visit'dD( AC7
TO> H( NMm'ro 3 -d'z'm@ro d' 1OH?0.
12.2 1 L'nr+ I. ^ort6 'taN.: C>+st'm,U: A ata@as' >+st'm
*as'd on t6' Univ'rsal R'lation Ass&m$tionD( AC7 TO> O(
NMm'ro ? -s't'm@ro d' 1OH30.
's#r'v' a t'oria( L( 7L ' a im$l'm'ntao d' &m sist'ma
d' Cr'lao &niv'rsalD '2$'rim'ntal 'la@orado na Univ'rsidad'
d' >tanford.
12.22 avid 7ai'r ' ='ffr'+ . Uliman: C4ra1m'nts of
R'lationsD( Pro#. 1OH? >IQ7O Int. Conf. on 7ana1'm'nt of
ata( >an =os'( Calif. -maio d' 1OH?0.
12.2? avid 7ai'r( ='ffr'+ . Uliman ' 7os6' l. 8ardi: COn
t6' 4o&ndations of t6' Univ'rsal R'lation 7od'lD( AC7 TO> O(
NMm'ro 2 -<&n6o d' 1OH30. Uma v'rso ant'rior d'ss' arti1o(
so@ o t%t&lo CT6' R'v'n1' of t6' =D( a$ar'#'& 'm Pro#. 2 AC7
>IQACT:>IQ7O >+m$osi&m on Prin#i$l's of ata@as' >+st'ms(
Atlanta( Qa. -maro d' 1OH?0.
?FB
12.23 avid 7ai'r ' ='tfr'+ . Uliman: C7a2imal O@<'#ts and
t6' >'manti#s of Univ'rsal R'lation ata@as'sD( AC7 TO> H(
NMm'ro 1 -maro d' 1OH?0.
:Os o@<'tos mE2imos r'$r's'ntam &ma a@orda1'm $ara o $ro@l'ma
da am@i1hidad' .&' s&r1' 'm sist'mas d' Cr'lao &niv'rsalD
.&ando a 'str&t&ra s&@<a#'nt' no ) a#%#li#a -#ons&lt' a
r'f'r/n#ia [12.1F=0. Um o@<'to mE2imo #orr's$ond' a &m
s&@#on<&nto $r'd'finido da totalidad' d' atri@&tos $ara os
.&ais a 'str&t&ra s&@<a#'nt' ) a#%#li#a. Iss's o@<'tos so
'nto &sados $ara ori'ntar a int'r$r'tao d' #ons&ltas .&'
d' o&tra forma s'riam am@%1&as.
12.25 =. 7. Ni#olas. C7&t&al '$'nd'n#i's and >om' R's&lts on
Und'#om$osa@l' R'lationsD( Pro#. 3t6 Int. Conf. on 8'r+ Lar1'
ata *as's( *'rlim( R'$M@li#a 4'd'ral da Al'man6a -s't'm@ro
d' 1OGH0.
Introd&z o #on#'ito d' Cd'$'nd/n#ia mMt&aD. Uma d'$'nd/n#ia
mMt&a ) na v'rdad' &m #aso $arti#&lar da d'$'nd/n#ia d'
<&no 1'ral 9 isto )( &ma = .&' no ) &ma 78 o& &ma 4 9
.&' 'nvolv' '2atam'nt' tr/s $ro<'A's -#omo o '2'm$lo d' =
dado na >'o 12.?0. Il' no t'm n'n6&ma r'lao #om o
#on#'ito d' d'$'nd/n#ia mMt&a dis#&tido no Ca$%t&lo 11.
12.2F >+lvia I. Os@om: CToXards a Univ'rsal R'lation
Int'rfa#'D( Pro#. >t6 Int. Conf. on 8'r+ Lar1' ata *as's(
Rio d' =an'iro( *rasil -o&t&@ro d' 1OGO0.
As $ro$ostas d'ss' arti1o $r'ss&$A'm .&'( s' 6E d&as o& mais
s'.h/n#ias d' <&nA's 'm &m sist'ma d' Cr'lao &niv'rsalD
.&' irE 1'rar &ma r's$osta #andidata a &ma dada #ons&lta(
'nto a r's$osta d's'<ada ) a &nio d' todas 'ssas
#andidatas. >o dados al1oritmos $ara 1'rar todas 'ssas
s'.h/n#ias d' <&nA's.
12.2G . >tott Park'r ' Cla&d' 'lo@'l: CAl1orit6mi#
A$$li#ations for a N'X R's&lt on 7&lti:8al&'d '$'nd'n#i'sD(
Pro#. 5t6 Int. Conf. on 8'r+ Lar1' ata *as's( Rio d'
=an'iro( *rasil -o&t&@ro d' 1OGO0.
A$li#a os r's&ltados da r'f'r/n#ia [12.121 a vErios
$ro@l'mas( tais #omo o $ro@l'ma d' t'star &ma d'#om$osio
s'm $'rdas.
12.2H l. >a1iv( C. 'lo@'l( . >. Park'r ' R. 4a1in: CAn
I.&ival'n#' @'tX''n R'lational ata@as' '$'nd'n#i's and a
>&@#lass of Pro$ositional Lo1i#D(=AC7 2H( NMm'ro ? -<&n6o d'
1OH10.
Com@ina as r'f'r/n#ias [1B.H1 ' [12.2O1.
12.2O l. >a1iv ' R. 4a1in: CAn I.&ival'n#' @'tX''n R'lational
ata@as' '$'nd'n#i's and a >&@#lass of Pro$ositional Lo1i#D(
I*7 R's'ar#6 R'$ort R=25BB -maro d' 1OGO0.
Ist'nd' os r's&ltados da r'f'r/n#ia [1B.H_ $ara in#l&ir 78s(
@'m #omo 4s.
12.?B I. >#ior': CA Com$l't' A2iomatization of 4&ll =oin
'$'nd'n#i'sD(=AC7 2O( NMm'ro 2 -a@ril d' 1OH20. Ist'nd' o
tra@al6o da r'f'r/n#ia [12.2_ $ara in#l&ir =s( @'m #omo 4s
' 78s.
12.? 1 =. 7. >mit6: CA Normal 4orm for A@stra#t >+nta2D(
Pro#. 3t6 Int. Conf. on 8'r+ Lar1' ata *as's( *'rlim(
R'$M@li#a 4'd'ral da Al'man6a -s't'm@ro d' 1OGH0.
O arti1o .&' introd&zi& a -?(?04N.
12.?2 ='ffr'+ . Ullman: COn ^'ntns pCons'.&'n#'s of Ass&min1
a Univ'rsal R'lationD( AC7 TO> H( NMm'ro 3 -d'z'm@ro d'
1OH?0.
12.?? ='ffr'+ . Ullman: CT6' U. R. >trik's *a#kD( Pro#. lst
AC7 >IQACT:>IQ7O >+m$osi&m on Prin#i$i's of ata@as'
>+st'ms( Los An1'l's( Calif. -maro d' 1OH20.
RI>PO>TA> A IPIRCCIO> >ILICIONAO>
12.1 Prim'iro( a.&i 'stE a 78 $ara a variEv'l d' r'lao
CPT:
CON>TRAINT CPT78
j 1 TL
CPT RINA7I CUR>O A> C( PRO4I>>OR A> P( TIPTO A> T
A> Ti(
- IPTIN Ti
A - CPT jLIRI CUR>O b C 0 S P T A> A
A> T2(
- IPTIN T2
?F1
A - CPT jLIRI CUR>O b - AN TIPTO b T 0 S P T A> *
A> T?(
- T? jLIRI A * 0 A> T3
I>I7PTl - T3 0 ;
i #laro .&' tam@)m '2ist' &ma form&lao m&ito mais sim$l's:
CON>TRAINT CPT 78 CPT b CPT S CUR>O( PRO4I>>OR T =OIN
CPT S CUR>O( TIPTO
I a.&i 'stE a = $ara a variEv'l d' r'lao 4P=:
CON>TRAINT 4P== 4P= b 4P= S 4c( Pc T =OIN
4P= S Pc( =c T =OIN
4P= S =c( 4c T
12.2 Prim'iro( o@s'rv' .&' R #ont)m todo valor d' A $oss%v'l
'm $ar #om todo valor d' * $oss%v'l( ' ainda .&' o #on<&nto
d' todos os valor's d' A( di1amos >( ) i1&al ao #on<&nto d'
todos os valor's d' *. O #or$o d' R ) $ortanto i1&al ao
$rod&to #art'siano do #on<&nto > #om 'l' m'smo; d' modo
'.&ival'nt'( R ) i1&al ao $rod&to #art'siano d' s&as
$ro<'A's RSAT ' RS*T. Assim( R satisfaz Us s'1&int's 78s
-.&' no so triviais( o@s'rv'( $ois #'rtam'nt' no so
satisf'itas $or todas as variEv'is d' r'laA's @inErias0:
ST9R:RAI*
' modo '.&ival'nt'( R satisfaz U = R SA(*T -l'm@r' .&' a
<&no d'1'n'ra a $rod&to #art'siano .&ando no 6E atri@&tos
#om&ns0. >'1&':s' .&' R no 'stE 'm 34N( ' $od' s'r
d'#om$osta s'm $'rdas 'm s&as $ro<'A's so@r' A ' * -) #laro
.&' 'ssas $ro<'A's t/m #or$os id/nti#os0. Por)m( R 'stE 'm
4N*C -'la ) toda #6av'0 ' no satisfaz a n'n6&ma 4s no
trivial.
Nota: R tam@)m satisfaz Us 78s:
A9]::R*ST
'
* 9R::R A S T
Por)m( 'ssas 78s so triviais( $ois so satisf'itas $or toda
variEv'l d' r'lao @inEria #om atri@&tos A ' *.
12.? Prim'iro( introd&zimos tr/s variEv'is d' r'laA's
RIP S RIPc( . . . T
^Il S RIPc T
qRIA S qRIAc( ...
^Il S qRIAc T
PROUTO S PROc(
^Il S PROc T
#om a int'r$r'tao Z@via. >'1&ndo( $od'mos r'$r's'ntar o
$ro#'sso d' r'la#ionam'nto 'ntr' r'$r#s'lilalit's d' v'ndas '
Er'as d' v'ndas $or &ma variEv'l d' r'lao:
RA S RIPc( qRIAc T
^Il S RIPc( qRIAc T
' o r'la#ionam'nto 'ntr' r'$r's'ntant's d' v'ndas ' $rod&tos
$or &ma variEv'l d' r'lao:
RP S RIPc( PROc T
^Il S RIPc( PROc T
-am@os os r'la#ionam'ntos so d' m&itos $ara m&itos0.
Im s'1&ida( $od'mos diz'r .&' todo $rod&to ) v'ndido 'm toda
Er'a. Into( s' introd&zirmos &ma variEv'l d' r'lao:
AP S qRIAc( PROc T
^Il S qRIAc( PROc T
?F2 $ara r'$r's'ntar o r'la#ionam'nto 'ntr' Er'as ' $rod&tos(
t'r'mos a r'strio -vamos #6amE:la C0 .&':
AP b qRIA S qRIAc T TI7I> PROUTO S PROc
Not' .&' a r'strio C im$li#a .&' a variEv'l d' r'lao AP
no 'stE 'm 34N -v'<a o I2'r#%#io 12.20. Na v'rdad'( a
variEv'l d' r'lao AP no nos of'r'#' .&al.&'r informao
.&' no $ossa s'r o@tida a $artir das o&tras variEv'is d'
r'laA's; $ara s'rmos $r'#isos( t'mos:
AP S qRIAc T b qRIA S qRIAc
'
AP S PROc 0 b PROUTO S PROc
A$'sar disso( vamos s&$or $or 'n.&anto .&' a variEv'l d'
r'lao AP 'stE in#l&%da 'm nosso $ro<'to.
ois r'$r's'ntant's n&n#a v'nd'm o m'smo $rod&to na m'sma
Er'a. Im o&tras $alavras( dada &ma #om@inao SARIAc(PROcT(
'2ist' '2atam'nt' &m r'$r's'ntant' d' v'ndas r's$onsEv'l
-RIPc0( d' modo .&' $od'mos introd&zir &ma variEv'l d'
r'lao:
APR S qRIAc( PROc( RIPc 1
^Il S qRIAc( PROc T
na .&al -$ara tornar a 4 '2$l%#ita0:
S qRIAc( PROc T 9R RIPc
-) #laro .&' a 's$'#ifi#ao da #om@inao SqRIAc(PROcT #omo
&ma #6av' #andidata ) s&fi#i'nt' $ara '2$r'ssar 'ssa 40.
Por)m( a1ora as variEv'is d' r'laA's RA( RP ' AP so todas
r'd&ndant's( $ois so todas $ro<'A's d' APR; $ortanto( 'las
$od'm s'r todas d's#artadas. Im l&1ar da r'strio C(
$r'#isamos a1ora da r'strio Cl:
APR S qRIAc( PROc T b qRIA S qRIAc T TI7I> PROUTO S PROc
Issa r'strio d'v' s'r 'n&n#iada s'$aradam'nt' ' d' forma
'2$l%#ita -'la no ) Cim$li#ada $or #6av's #andidatasD0.
Al)m disso( #omo todo r'$r's'ntant' v'nd' todos os $rod&tos
d'ss' r'$r's'ntant' 'm todas as Er'as d'ss' r'$r's'ntant'(
t'mos a r'strio adi#ional C2 so@r' a variEv'l d' r'lao
APR:
RIPc 9R::R qRIAc 1 PROc
-&ma 78 no trivial; a variEv'l d' r'lao APR no 'stE 'm
34N0. ' novo( a r'strio d'v' s'r 'n&n#iada '2$li#itam'nt'
' 'm s'$arado. Assim( o $ro<'to final #onsist' nas variEv'is
d' r'laA's RIP( ARIA( PROUTO ' APR( <&ntam'nt' #om as
r'striA's '2$l%#itas Cl ' C2. e
Iss' '2'r#%#io il&stra m&ito #laram'nt' o fato d' .&'( 'm
1'ral( a dis#i$lina d' normalizao ) ad'.&ada $ara
r'$r's'ntar al1&ns as$'#tos s'mVnti#os d' &m dado $ro@l'ma
-@asi#am'nt'( d'$'nd/n#ias im$li#adas $or #6av's #andidatas(
ond' $or Cd'$'nd/n#iasD 'nt'nd'mos 4s( 78s o& =s0( mas
'ssa d'#larao '2$l%#ita d' d'$'nd/n#ias adi#ionais tam@)m
$od'ria s'r n'#'ssEria $ara o&tros as$'#tos( ' al1&ns
as$'#tos no $od'm s'r d' modo al1&m r'$r's'ntados 'm t'rmos
d'ssas d'$'nd/n#ias. Il' tam@)m il&stra o d'tal6' -mais &ma
v'z0 d' .&' n'm s'm$r' ) d's'<Ev'l normalizar Cat) o fimD -a
variEv'l d' r'lao APR 'stE 'm 4N*C( mas no 'm 34N0.
12.3 A r'viso ) dir'ta 9 ) n'#'ssErio a$'nas s&@stit&ir as
r'f'r/n#ias a 4s ' 4N*C $or r'f'r/n#ias anElo1as a 78s '
34N; $ortanto:
O. Ini#ializ' $ara #ont'r a$'nas R.
1. Para #ada variEv'l d' r'lao T'm .&' no s'<a 34N(
'2'#&t' os Passos 2 ' ?.
2. >'<a P 9R::] l &ma 78 $ara T .&' viola as '2i1/n#ias d'
34N.
?. >&@stit&a T 'm $or d&as d' s&as $ro<'A's( o& s'<a( a
$ro<'o so@r' P ' l ' a $ro<'o so@r' todos os atri@&tos(
#om '2#'o da.&'l's d' l.
12.5 Ist' ) &m '2'm$lo d' Cr'strio #%#li#aD. O $ro<'to a
s'1&ir ) ad'.&ado:
RIP S RIPc( . . . T
^Il S RIPc T
qRIA S qRIAc( ...
^Il S qRIAc T ?F?
PROUTO S PROc(
^Il S PROc T
RA S RIPc( qRIAc T
^Il S RIPc( qRIAc T
AP S qRIAc( PROc T
^Il S qRIAc( PROc T
PR S PROc( RIPc T
^Il S PROc( RIPc T
Al)m disso( o &s&Erio $r'#isa s'r informado d' .&' a <&no
d' RA( AP ' PR no 'nvolv' .&al.&'r Carmadil6a d' #on'2oD:
- RA =OIN AP =OIN PR 0 S RIPc( qRIAc T b RA AN
- RA =OIN AP =OIN PR 0 S qRIAc( PROc T b AP AN
- RA =OIN AP =OIN PR 0 S PROc( RIPc T b PR
?F3
1?