Você está na página 1de 24

Universidad Central de Venezuela

DatawareHose y El Comercio Electrnico


Enero| 2007|

Presentado por:
Jorge Lynch
Ivn Lazo

DatawareHose y El Comercio Electrnico

| Enero | 2007 |

Introduccin
Cliente-Servidor
Clickstream
Tipos de identificacin
El origen del visitante
La sesin
Al visitante
Tablas Dimensiones del Clickstream
Tablas de Hechos del Clickstream
Integracin del Data Mart con el resto del Data Warehouse
Conclusiones
Universidad Central de Venezuela

DatawareHose y El Comercio Electrnico


Introduccin
Cliente Servidor
El visitante hace clic en el
hipertexto que contiene un URL
para tener acceso a un sito
Web.

Registro del visitante actual

El servidor devuelve el artculo


solicitado
El navegador publica una
segunda peticin al servidor y
este responde devolviendo la
imagen especificada.
El browser encuentra
instruccin de recuperar otra
imagen de Banner-ad.com. El
servidor busca en la pc del
visitante si existe algn cookie
de Banner-ad.com y lo analiza.
Luego enva la respuesta.

Universidad Central de Venezuela

Solicita identificacin del usuario


colocado previamente por el
profiler que se utiliza para
identificar al visitante y sirve
como llave a la informacin
personal contenida en la base
de datos.

03/24

DatawareHose y El Comercio Electrnico


Introduccin

Clickstream
Def.: es cada acontecimiento de pgina registrado por cada uno de los Webs servers
de compaa.
Def.: es una evolucin de una coleccin de data sources
El Clickstream contiene un nmero de nuevas dimensiones tales como pgina, sesin
y referencia que son desconocidos en nuestros Data Mart convencionales.

EL CLICKSTREAM NO ES SOLO OTRA FUENTE DE DATOS

Universidad Central de Venezuela

04/24

DatawareHose y El Comercio Electrnico


Introduccin
Identificar el origen del visitante
Que nuestro sitio Web sea la pgina de inicio del usuario
Que el visitante sea dirigido a nuestra pagina desde un buscador.
Acceso desde otra pgina.

Identificacin de la sesin
Usar la sesin de ID.
Utilizando la IP o direccin.
Utilizar los cookies de nivel de sesin
Utilizar Secure sockets layer.
Utilizar una cookie persistente en el ordenador.

Universidad Central de Venezuela

05/24

DatawareHose y El Comercio Electrnico


Introduccin
Identificacin del visitante
Los invitados desean ser annimos.
No podemos estar seguros qu miembro de familia visita nuestro sitio

Servidores Proxy
Los servidores proxy se utilizan para depositar contenido solicitado con
frecuencia en una localizacin entre su fuente prevista y un visitante del
extremo. Estos servidores pueden tener tres problemas:
Puede entregar el contenido anticuado.
Puede devolver resultados no confiables, ya que puede interpretar
peticiones.
No puede identificar quien realiz la peticin a menos que un cookie este
presente.

Universidad Central de Venezuela

06/24

DatawareHose y El Comercio Electrnico

| Enero | 2007 |

Introduccin
Cliente-Servidor
Clickstream
Tipos de identificacin
El origen del visitante
La sesin
Al visitante
Tablas Dimensiones del Clickstream
Tablas de Hechos del Clickstream
Integracin del Data Mart con el resto del Data Warehouse
Conclusiones
Universidad Central de Venezuela

DatawareHose y El Comercio Electrnico


Tablas dimensiones de clickstream
Dimensin Pgina
ATRIBUTO

EJEMPLO

PAGE KEY

Valor entre 1 y N

PAGE SOURCE

Esttica, dinmica, No identificada,


Corrupta, No aplica.

PAGE FUNCTION

Portal, bsqueda, Descripcin de


producto, Informacin Corporativa

PAGE TEMPLATE

Densa, Esparcida

ITEM TYPE

Producto SKU, Nmero Libro ISBM

GRAPHICS TYPE

GIF, JPG, Tamao

ANIMATION TYPE

GIF, JPG, Tamao

SOUND TYPE

GIF, JPG, Tamao

PAGE FILE NAME

Nombre del archivo

Universidad Central de Venezuela

08/24

DatawareHose y El Comercio Electrnico


Tablas dimensiones de clickstream
Dimensin Evento
ATRIBUTO

EJEMPLO

EVENT KEY

Valor entre 1 y N

EVENT TYPE

Apertura de Pgina, Refresh, Click en un link, Captura de datos, No Identificable, No aplica.

EVENT CONTET

Aplicaciones dependientes

Dimensin Sesin
ATRIBUTO

EJEMPLO

SESION KEY

Valor entre 1 y N

SESION TYPE

Clasificada, No Clasificada, Corrupta, No aplica

LOCAL CONTENT

Pgina derivadas del contexto, bsqueda para respuestas de


informacin de los productos

SESION CONTEXT

Trayectorias derivadas del contexto

ACTION SEQUENCE

Sumario de las etiquetas de todas las acciones durante la sesin

SUCCESS STATUS

Si la sesin es culminada se archiva

CUSTOMER STATUS

Valores altos, por defectos

Universidad Central de Venezuela

09/24

DatawareHose y El Comercio Electrnico


Tablas dimensiones de clickstream
Dimensin Referencia
ATRIBUTO

EJEMPLO

REFERRAL KEY

Valor entre 1 y N

REFERRAL TYPE

Fuera del site, Remoto, Bsqueda, corrupta, no aplica.

REFERRING URL

www.organizacion.site.com/link

REFERRING SITE

www.organizacion.site.com

REFERRING DOMAIN

site.com

SEACH TYPE

simple Maching, complejo

SPECIFICATION

Uso actual

TARGET

Donde se encontr el match ( ttulos, cuerpo del texto)

Universidad Central de Venezuela

10/24

DatawareHose y El Comercio Electrnico


Tablas de Hechos clickstream
Tablas de hecho para sesiones completas

Universidad Central de Venezuela

11/24

DatawareHose y El Comercio Electrnico


Tablas de Hechos clickstream
Tablas de hecho para sesiones completas
Granularidad: Una fila por sesin, de 100 millones de eventos a 5
millones de registros.
Hechos: segundos de la sesin, paginas visitadas, ordenes hechas,
cantidad de unidades ordenadas, cantidad ordenadas en dinero
Dimensiones Fecha y Hora juegan 2 roles (Dimensiones Role-playing)
Los segundos de la sesin: duracin en segundos de la sesin, algunas
veces es imposible de obtener, necesidad de usar un valor nominal.
Tres aos de data en la tabla de hechos 300GB

Universidad Central de Venezuela

12/24

DatawareHose y El Comercio Electrnico


Tablas de Hechos clickstream
Tablas de hecho para eventos individuales en una pgina

Universidad Central de Venezuela

13/24

DatawareHose y El Comercio Electrnico


Tablas de Hechos clickstream
Tablas de hecho para eventos individuales en una pgina
Granularidad: Una fila por cada evento que acontece en una pagina
Paginas HTML estticas menos eventos que paginas dinmicas basadas
en XML
Dimensiones Fecha y Hora juegan 2 roles (Dimensiones Role-playing)
Dimensin Pgina: se refiere a la pagina donde esta ocurriendo el
evento. Esta es la principal diferencia entre esta tabla y la anterior
Dimensin degenerada SesionID: agrupa a nivel de sesin
Dimensin Causal: acompaa a la dimensin producto
Dimensin Sesin: Tipo de sesin, resultado de la sesin
Hecho Page seconds: cantidad de segundos antes del prximo evento

Universidad Central de Venezuela

14/24

DatawareHose y El Comercio Electrnico


Tablas de Hechos clickstream
Comparacin entre tablas de hechos de sesin completa y eventos

Universidad Central de Venezuela

15/24

DatawareHose y El Comercio Electrnico


Tablas de Hechos clickstream

Tablas de hecho agregadas


Las 2 tablas anteriores son muy grandes y lentas para ciertas consultas
Ejemplo: Nmero total de visitas y ganancias por grupos demogrficos, a
nivel de meses.
Para construir la tabla agregada: agrupamos por mes, demografa,
pgina entrada y resultado de la sesin. Contamos el nmero de sesiones y
sumamos los otros hechos.
La tabla de mes es un subconjunto conformado de la tabla de da natural.
La tabla demogrfica es un subconjunto conformado de la tabla de
cliente.

Universidad Central de Venezuela

16/24

DatawareHose y El Comercio Electrnico


Tablas de Hechos clickstream
Tablas de hecho agregadas

Universidad Central de Venezuela

17/24

DatawareHose y El Comercio Electrnico


Integracin del Data Mart con el resto del almacn
Matriz de Bus

Universidad Central de Venezuela

18/24

DatawareHose y El Comercio Electrnico


Integracin del Data Mart con el resto del almacn
Tabla de Hecho: Rentabilidad

Universidad Central de Venezuela

19/24

DatawareHose y El Comercio Electrnico


Integracin del Data Mart con el resto del almacn
Tabla de Hecho: Rentabilidad
Mtricas de la tabla de hecho Rentabilidad
Quantity Sold: cantidad vendida
Gross Revenue: valor del artculo en la lista de ventas o catalogo
Net Revenue: total de dinero pagado por el cliente por la cantidad
del mismo artculo adquiridos.
Manufacturing Cost: costo por hacer un artculo (si la compaa los
hace) o precio de compra del artculo (si la compaa lo compra)
Storage Cost: precio de almacenamiento
Gross Profit: Gross Revenue - Manufacturig Cost Storage Cost.
Ganancia por venta del artculo

Universidad Central de Venezuela

20/24

DatawareHose y El Comercio Electrnico


Integracin del Data Mart con el resto del almacn
Tabla de Hecho: Rentabilidad
Algunas preguntas que los tomadores de decisiones pueden
responder usando esta tabla de hechos:
Qu tan provechosos son cada uno de los medios (ventas a travs
de la Web, Tele ventas o ventas en las tiendas) y por qu?
Qu tan productivo es segmentar a los clientes y por qu?
Quines son los clientes que ms compran en cada uno de los
medios y por qu?
Qu promociones funcionan en la Web pero no funcionan en los
otros medios y por qu?"

Universidad Central de Venezuela

21/24

DatawareHose y El Comercio Electrnico


Conclusiones
El clickstream es cada acontecimiento de pgina registrado por cada uno de
los Webs servers de compaa.
El clickstream contiene un nmero nuevo de dimensionestal como pgina, la
sesin, y referenciaseso es desconocido en data marts convencionales.
El clickstream es el nuevo desarrollo ms emocionante en el data
warehousing, al mismo tiempo puede ser muy difcil.
Los desafos de identificacin: - Origen del invitado de Web
- Sesin completa
- Invitado de Web
El servidor de Proxy intercepta las peticiones de pgina del invitado
El diseo de la dimensin de pgina. Permite al diseador de Pgina Web
adjudicar cdigos y atributos a cada pgina.
El diseo de la dimensin de sesin permite
diferentes.

buscar sesiones de tipos

las tablas de hecho pueden resumir tilmente el comportamiento de invitado,


como datos demogrficos que guardan correlacin con sesiones productivas.

Universidad Central de Venezuela

22/24

DatawareHose y El Comercio Electrnico

PREGUNTAS?

Universidad Central de Venezuela

23/24

| Venezuela | Universidad Central de Venezuela |

Você também pode gostar