Recuperación de Información - 2016
Cronograma (Tentativo)
Semana | Tema | |
1 (07/03) | Introducción y problemática de la RI | |
2 (14/03) | Análisis de Textos | |
3 (21/03) | Semana Santa (no hay clases) | |
4 (28/03) | Modelos Clásicos de RI | |
5 (04/04) | Evaluación de la Recuperación | |
6 (11/04) | Estructuras de Datos para RI | |
7 (18/04) | Modelos de Lenguaje para RI | |
8 (25/04) | Indexación y Recuperación | |
9 (02/05) | Retroalimentación/Expansión de la Consulta | |
10 (09/05) | Arquitectura de la Web+Algoritmos de Análisis de Enlaces | |
11 (16/05) | Exámenes Adicionales (no hay clases) | |
12 (23/05) | Máquinas de Búsqueda para la Web | |
13 (30/05) | Seminario de Intro a Text Mining (sobre streams). | |
14 (06/06) | Exámen parcial | |
15 (13/06) |
Presentación de Artículos (papers) Elegidos:
|
|
16 (20/06) | Presentación del Proyecto Final y Recuperatorio |
Trabajos Prácticos
Intro. a la RI |
Paper: Ha, L., Stewart, D., Hanna P. & Smith, F. (2006). Zipf and Type-Token rules for the English, Spanish, Irish and Latin languages. Web Journal of Formal, Computational and Cognitive Linguistics, 1(8), 1-12. [link] |
Modelos de Recuperación y Evaluación |
Estructuras de Datos |
Paper: Graham Bennett, Falk Scholer & Alexandra Uitdenbogerd. A Comparative Study of Probabilistic and Language Models for Information Retrieval. [link] Interesante paper para ver diversos modelos comparados y los parámetros usados en cada caso. |
Recuperación de Información en la Web |
Proyecto Final |
Datos de Prueba
Colección T1-GR |
Colección T1-QM |
Resumen CISI (Ejercicio 1 TP Modelos) |
Dump 10k Posting Lists |
Words-en.txt |
Wiki-Large. Esta colección es un snapshot de Wikipedia seeccionado como material del libro "Search Engines...". http://www.search-engines-book.com/ |
Recursos
- Wiki con apuntes sobre indexación y recuperación usando Terrier [link]
- Transparencias sobre "Caracterización de la web" [link]
- Transparencias sobre "Motores de búsqueda" [link]
Bibliografía
Sugerida
- "Introduction to Information Retrieval" - C. Manning, P. Raghavan, H. Schutze. Cambridge University Press, 2008. Versión en línea
- "Modern Information Retrieval. The concepts and technology behind search" - R. Baeza-Yates, B. Ribeiro Neto. 2nd Ed. Addison-Wesley, 2011. Sitio web
- "Search Engines: Information Retrieval in Practice" - B. Croft; D. Meltzer, T. Strohman. Pearson Education, 2009. Sitio web
- "Introducción a la Recuperación de Información. Conceptos, modelos y algoritmos básicos" - Gabriel H. Tolosa y Fernando R.A. Bordignon. Laboratorio de Redes de Datos. UNLu, 2004 Descargar
Complementaria
- "Information Retrieval. Algorithms and Heuristics" - D. A. Grossman, O. Frieder. 2nd Edition. Springer, 2004.Vista previa
- "Managing Gigabytes: Compressing and Indexing Documents and Images" - I.H. Witten, A. Moffat, T.C. Bell. 2nd ed., Morgan Kaufmann, 1999. Sitio web
- "Information Retrieval. Data Structures & Algorithms" - W. B. Frakes, R. Baeza-Yates. Prentice-Hall, 1992.Sitio web
- "Mining the Web. Discovering Knowledge from Hypertext Data". Soumen Chakrabarti. Morgan-Kaufmann Publishers, 2003. Sitio web
Artículos (papers)
Este listado (no exhaustivo) contiene algunos de los artículos que se pueden seleccionar para la exposición (semana 15). La mayoría ha sido publicados en las mejores reuniones científicas y journals de la disciplina.