Escolar Documentos
Profissional Documentos
Cultura Documentos
(Mayo 2017).
Valdivia A. Juan, Estudiante, Universidad de La Serena.
Abstracto Como con la mayora de los rboles, los algoritmos de bsqueda (por
ejemplo, interseccin, contencin, bsqueda de vecinos ms cercanos)
R-Tree son arboles utilizados para mtodos de acceso en la son bastante simples. La idea clave es usar los cuadros delimitadores
indexacin de informacin multidimensional como polgonos, para decir si desea o no buscar dentro de un sub-rbol. De esta manera,
rectngulos o coordenadas geogrficas. Fue Antonin Guttman en la mayora de los nodos del rbol nunca se leen durante una bsqueda.
1984 quien Propuso un significativo uso del R-Tree en respuesta al Al igual que los B-Tree, esto hace que los R-Tree sean adecuados para
manejo eficiente de la recuperacin rpida de datos espaciales. Un grandes conjuntos de datos y base de datos donde los nodos pueden ser
uso comn es la bsqueda de sitios de inters (calles, lagos, paginados a la memoria cuando sea necesario, y el rbol completo no
comercios, sitios tursticos como museos o puntos tursticos) a una puede mantenerse en memoria principal.
distancia dada, usados en aplicaciones de mapas o geolocalizacin,
as por medio de una consulta referencial dada se pueda dar una La dificultad clave del R-Tree es construir un rbol eficiente que por
bsqueda ms acelerada como respuesta a el inters del usuario. un lado este equilibrado (por lo menos los nodos hojas estn a la misma
altura) por otro lado los rectngulos no cubren demasiado espacio
Facio y no se superponen demasiado (de modo que, durante la
bsqueda, menos sub-arboles necesitan ser procesados). Por ejemplo,
I. INTRODUCCIN. la idea original para insertar elementos para obtener un rbol eficiente
Este documento es una expresa recopilacin de informacin, sobre la es insertar siempre en el sub-rbol que requiere menos ampliacin de
investigacin de la estructura de datos de rbol R-Tree. Una estructura su cuadro delimitador. Una vez que la pagina est llena, los datos se
basada en B+-Tree, en funcin del manejo de datos espaciales o dividen en dos conjuntos que deben cubrir el rea mnima cada uno. La
multidimensionales. mayora de las investigaciones y mejoras para R-Tree tienen como
objetivo mejorar la forma en que el rbol de construye y se pueden
agrupar en dos objetivos: construir un rbol eficiente desde cero
(conocido como carga masiva) y realizar cambios en un rbol existente
II. NOCIONES DEL R-TREE. (insercin y supresin).
El R-Tree es una estructura de datos de grupos objetos cercanos, Los R-Tree no garantizan un buen desempeo en el peor de los casos,
representados por un rectngulo delimitador mnimo en el siguiente pero generalmente se desempea bien con datos del mundo real. I bien
nivel superior del rbol; el R en R-Tree es referente a rectngulo. es de mayor inters terico, la variante R-Tree Prioritario (de carga
Dado que los objetos estn dentro de dicho rectngulo delimitador, una masiva) del R-Tree es ptima en el caso ms desfavorable, pero debido
consulta que no intersecte el rectngulo delimitador tampoco puede a la complejidad creciente, no ha recibido mucha atencin en
insertar ninguno de los objetos contenidos. En el nivel hoja, cada aplicaciones prcticas hasta el momento.
rectngulo describe un solo objeto; en niveles ms altos la agregacin
de nmeros crecientes de objetos. Esto tambin puede verse como una Cuando los datos estn organizados en un R-Tree, los k vecinos ms
aproximacin cada vez ms aproximada del conjunto de datos. cercanos (para cualquier Lp-Norm) de todos los puntos pueden ser
computados eficientemente usando una unin espacial. Esto es
Al igual que en B-Tree, el R-Tree es tambin un rbol de bsqueda beneficioso para muchos algoritmos basados en los k vecinos ms
equilibrado (mostrando todos los nodos hoja estn a la misma altura), cercanos, por ejemplo, el Factor de Valor Extremo Local. Deli-Clu,
organiza los datos en pgina y est diseado para almacenamiento en Density-LinkClustering es un algoritmo de anlisis de clster que
disco (al ser usada con base de datos). Cada pgina puede contener un utiliza la estructura de R-Tree para un tipo similar de unin espacial
nmero mximo de entradas, a menudo denotado como M. Tambin para calcular eficientemente una agrupacin OPTICS.
garantiza un relleno mnimo (excepto el nodo raz), denotado como m,
sin embargo, se ha experimentado el mejor rendimiento con un relleno
mnimo de 30-40% del nmero mximo de entradas (los B-Tree
garantizan el 50% de relleno de pginas y los B*-Tree hasta un 66%).
La razn de esto es el equilibrio ms complejo que se requiere para los
datos lineales almacenados en B-Tree.
III. ALGORITMOS Y MTODOS. rectngulos delimitadores contenidos en el rectngulo de bsqueda y
sus objetos (si los hay) se colocan en el conjunto de resultados di de
A. Diseo de los datos. encuentran dentro del rectngulo de bsqueda.
2) Desborde de nodo.
Dado que la redistribucin de todos los objetos de un nodo en dos
nodos tiene un nmero exponencial de opciones, se necesita emplear
una heurstica para encontrar la mejor divisin. En el R-Tree clsico,
Guttman propuso dos tales heursticas, llamados Quadratic Split y
Linear Split. En la divisin cuadrtica, el algoritmo busca el par de
rectngulos que es la peor combinacin que tiene en el mismo nodo, y
los coloca como objetos iniciales en los dos nuevos grupos. A
continuacin, busca la entrada que tiene la preferencia ms fuerte para
uno de los grupos (en trminos de aumento de rea) y asigna el objeto
a este grupo hasta que se asignen todos los objetos (que satisfacen el
relleno mnimo).
Ilustracin 5 La divisin cuadrtica de Guttman. Las pginas de este
Hay otras estrategias de divisin, como Greene's Split, la heurstica
rbol se superponen mucho.
de divisin de los R*-Tree (que de nuevo intenta minimizar la
superposicin, pero tambin prefiere las pginas cuadrticas) o el
algoritmo de divisin lineal propuesto por Ang y Tan (Que sin embargo
puede producir rectngulos muy irregulares, que son menos eficaces
para muchas preguntas del rango real y de la ventana). Adems de tener
una heurstica de divisin ms avanzada, el R*-Tree tambin trata de
evitar la divisin de un nodo mediante la reinsercin de algunos de los
miembros del nodo, que es similar a la forma en que un rbol B
equilibra los nodos que desbordan. Esto demostr tambin reducir la
superposicin y as aumentar el rendimiento de los rboles.
D. Supresin.
La eliminacin de una entrada de una pgina puede requerir la
actualizacin de los rectngulos delimitadores de las pginas
principales. Sin embargo, cuando una pgina est llena, no ser
equilibrada con sus vecinos. En su lugar, la pgina se disolver y todos
sus hijos (que pueden ser subrboles, no slo objetos de hoja) sern
reinsertados. Si durante este proceso el nodo raz tiene un solo
elemento, la altura del rbol puede disminuir.
Ilustracin 14 R-Tree con divisin lineal Ang-Tan. Mientras que las rebanadas
no se extienden tan lejos como con Guttman, el problema del rebanado afecta
casi cada pgina de la hoja. Las pginas de hoja se superponen poco, pero las
pginas de directorio lo hacen.
B. B+-Tree.
Un R+-Tree es un mtodo para buscar datos usando una ubicacin, a
menudo (x, y) coordenadas, ya menudo para ubicaciones en la
superficie de la tierra. La bsqueda en un nmero es un problema
resuelto; buscar en dos o ms, y pidiendo lugares que estn cerca en
ambas direcciones X e Y, requiere algoritmos ms hbiles.