Bienvenidos a Nuestro Mundo - A Proyectos Beta!

En nuestra vida, desde que nacemos todo lo probamos, ensayamos y testeamos; así también erramos, caemos pero por sobre todo aprendemos. Es decir, todo lo que hacemos forma parte de una nueva experiencia, de un PROYECTO. El que siempre exista la posibilidad de mejorarlo es lo que lo convierte en BETA. En este blog queremos compartir contenidos de tipo informático con artículos de programación, software libre y propietario, redes, base de datos, noticias, experiencias, etc... y también de humor. Es un sitio de todos y para todos. Participá! Sos importante ...

Implementación en java sobre índice inverso


En una entrada anterior había presentado el paper sobre las alternativas de indexación de páginas web que hicimos con Leandro Luque para un trabajo de la Facultad.
Hicimos implementaciones en java sobre el modelo de índice invertido usando árboles AVL y tablas hash.

Imagen de una tabla sobre indexación de un árbol avl usando índice invertido
La tabla muestra las entradas con sus respectivos tiempos en milisegundos. La estructura utilizada es un árbol AVL cuando se está indexando los documentos HTML.

Imagen de un gráfico sobre indexación de un árbol avl usando índice invertido

Imagen de una tabla sobre indexación de una tabla hash usando índice invertido
La tabla muestra las entradas con sus respectivos tiempos en milisegundos. La estructura utilizada es una tabla Hash cuando se está indexando los documentos HTML.

Imagen de un gráfico sobre indexación de una tabla hash usando índice invertido

Imagen de una tabla de comparación sobre indexación usando índice invertido
Tabla de comparación de las dos estructuras citadas anteriormente. Se puede apreciar que cuando existen más entradas, el modelo de índice invertido con las tablas hash es mucho mejor que usando árboles AVL.

Imagen de un gráfico de comparación sobre indexación usando índice invertido
Se puede apreciar que al principio cuando más entradas haya, la tabla hash es mejor que los árboles AVL en cuanto a la indexación se refiere.


Imagen de una tabla sobre búsqueda de un árbol avl usando índice invertido
La tabla muestra las entradas con sus respectivos tiempos en nanosegundos . La estructura utilizada es un árbol AVL cuando se está buscando una palabra en los documentos HTML.

Imagen de un gráfico sobre búsqueda de un árbol avl usando índice invertido

Imagen de una tabla sobre búsqueda de una tabla hash usando índice invertido

Imagen de un gráfico sobre búsqueda de una tabla hash usando índice invertido
La tabla muestra las entradas con sus respectivos tiempos en nanosegundos . La estructura utilizada es una tabla Hash cuando se está buscando una palabra en los documentos HTML.

Imagen de una tabla de comparación sobre búsqueda usando índice invertido

Imagen de un gráfico de comparación sobre búsqueda usando índice invertido
Tabla de comparación de las dos estructuras citadas anteriormente. Se puede apreciar que cuando hay búsquedas siempre es mejor las tablas Hash que los árboles AVL.

Imagen de una tabla de comparación sobre indexación y búsqueda usando índice invertido
Las siguientes entradas con sus tiempos respectivos en la indexación como en la búsqueda.

Conclusión: en el modelo de índice invertido con una buena estructura de datos como las tablas hash se puede lograr muy buenos tiempos tanto en la indexación como en la búsqueda.

En la parte donde cito para descargar en los diferentes sitios coloco el código fuente de la implementación en java como también los diferentes gráficos y los cálculos de los resultados en una plantilla de calculo.

Descargar en Megaupload: Implementación de las Alternativas para Indexación de Páginas Web
Descargar en File Send: Implementación de las Alternativas para Indexación de Páginas Web
Descargar en File Savr: Implementación de las Alternativas para Indexación de Páginas Web

2 comentarios:

Manuel dijo...

que interesante, despues los bajare para estudiarlos

fires dijo...

@Manuel dale..y si tienes dudas avisame nomas..
saludos, josé

Publicar un comentario

Expresate y se crítico en tu vida. XD

Recibir Artículos Por Correo

Categorías

acertijos (1) adsense (1) adwords (1) AJAX (1) algoritmos (8) android (32) apple (5) autocad (1) base de datos (16) bash (1) becas (1) benchmark (1) blogger (2) blogs (27) bsd (1) buscadores (22) c# (1) CAD (1) camaras digitales (1) casting (1) CentOS (9) certificados (1) ciencia (1) CLEI (5) cloud computing (3) codigo fuente (9) Compiladores (4) Concursos (14) conferencias (24) congresos (6) consolas (7) criptografia (1) css (6) curso online (10) cursos (14) debian (50) Diseño (11) edicion video (7) emuladores (3) encuestas (2) entrevistas (9) ERTIC (1) etico (1) eventos (87) extjs (2) facebook (18) flash (2) flicker (1) FLISOL (13) geek (6) geoserver (2) GIMP (8) gis (29) Google (48) hacking (1) Hardware (30) haskell (3) HTML 5 (20) humor (261) imagenes (238) Ingenieria (14) internet (1) iphone (3) Java (42) Javascript (14) JQuery (3) juegos (36) libros (5) Linux (248) MAC (1) manga (2) Manuales (10) mapquest (1) MapServer (5) matematica (2) Microsoft (26) Microsoft Windows (27) Moviles (16) musicas (7) mysql (3) navegadores (41) newsletters (1) nokia (2) Noticias cientificas (7) Noticias Informaticas (39) Noticias varias (14) nube (1) openlayers (13) openstreetmap (10) opiniones (1) oracle (9) Paraguay (102) photoshop (1) Php (12) podcast (1) postgres (7) Programacion (135) prolog (1) proyectos (10) python (3) radio (6) Recursos (112) redes (10) Redes Sociales (62) resumenes (1) Revistas (57) ruby (2) seguridad (23) seminarios (6) sencha (2) SEO (3) Series (1) Silverlight (1) Sistema Operativo (27) smartphone (1) Software Libre (198) sun (2) tablet (19) tecnologia (24) tecnoPyensis (6) Testing (5) Trabajo (6) trucos (22) Twitter (29) Ubuntu (152) varios (113) videos (173) virtualizacion (14) visual basic net (2) web (86) wikipedia (1) Windows 7 (23) windows 8 (1) Windows XP (2) wordpress (5) xml (1)

Entradas Aleatorias

Seguidores

Últimos Comentarios

Archivos del Blog