Taller Libre I - 2015
Cronograma (Tentativo)
Semana | Tema | |
1 (17/08) | Introducción y problemática de la RI | |
2 (24/08) | Análisis de Textos | |
3 (31/08) | Modelos Clásicos de RI | |
4 (07/09) | Evaluación de la Recuperación | |
5 (14/09) | Estructuras de Datos para RI | |
6 (21/09) | Exámenes Adicionales (no hay clases) | |
7 (28/09) | Modelos de Lenguaje para RI | |
8 (05/10) | Indexación y Recuperación | |
9 (12/10) | Retroalimentación/Expansión de la Consulta | |
10 (19/10) | Recuperación de Información en la Web | |
11 (26/10) | Máquinas de Búsqueda para la Web | |
12 (02/11) | Introducción a clasificación y clustering | |
13 (09/11) | Presentación de Artículos (papers) | |
14 (16/11) | Exámen parcial | |
15 (23/11) | Seminario de Recuperación de Información Distribuida | |
16 (30/11) | Presentación del Proyecto Final y Recuperatorio |
Trabajos Prácticos
Intro. a la RI |
Análisis de Texto |
Modelos de Recuperación y Evaluación |
Estructuras de Datos |
Modelos de Lenguaje |
Recuperación de Información en la Web |
Proyecto Final |
Datos de Prueba
Colección T1-GR |
Colección T1-QM |
Resumen CISI |
Dump 10k Posting Lists |
Recursos
-
Wiki con apuntes sobre indexación y recuperación usando Terrier [link]
-
Transparencias sobre "Caracterización de la web" [link]
- Transparencias sobre "Motores de búsqueda" [link]
Bibliografía
Sugerida
- "Introduction to Information Retrieval" - C. Manning, P. Raghavan, H. Schutze. Cambridge University Press, 2008. Versión en línea
- "Modern Information Retrieval. The concepts and technology behind search" - R. Baeza-Yates, B. Ribeiro Neto. 2nd Ed. Addison-Wesley, 2011. Sitio web
- "Search Engines: Information Retrieval in Practice" - B. Croft; D. Meltzer, T. Strohman. Pearson Education, 2009. Sitio web
- "Introducción a la Recuperación de Información. Conceptos, modelos y algoritmos básicos" - Gabriel H. Tolosa y Fernando R.A. Bordignon. Laboratorio de Redes de Datos. UNLu, 2004 Descargar
Complementaria
- "Information Retrieval. Algorithms and Heuristics" - D. A. Grossman, O. Frieder. 2nd Edition. Springer, 2004.Vista previa
- "Managing Gigabytes: Compressing and Indexing Documents and Images" - I.H. Witten, A. Moffat, T.C. Bell. 2nd ed., Morgan Kaufmann, 1999. Sitio web
- "Information Retrieval. Data Structures & Algorithms" - W. B. Frakes, R. Baeza-Yates. Prentice-Hall, 1992.Sitio web
- "Mining the Web. Discovering Knowledge from Hypertext Data". Soumen Chakrabarti. Morgan-Kaufmann Publishers, 2003. Sitio web
Papers
Fast Document-at-a-time Query Processing using Two-tier Indexes
Interactions between Health Searchers and Search Engines
A Novel TF-IDF Weighting Scheme for Effective Ranking
Dual-Sorted Inverted Lists in Practice
Efficient Query Construction for Large Scale Data
How Query Cost Affects Search Behavior
Entity Query Feature Expansion using Knowledge Base Links
Task-Aware Query Recommendation
Impact of Response Latency on User Behavior in Web Search
On the Measurement of Test Collection Reliability
Time-Critical Search
Context-Aware Web Search Abandonment Prediction
Collaborative Personalized Twitter Search with Topic-Language Models
SkipBlock: Self-Indexing for Block-Based Inverted List
Inverted Indexes for Phrases and Strings
Automatic Boolean Query Suggestion for Professional Search
Addressing People's Information Needs Directly in a Web Search Result Page
A Boosting Approach to Improving Pseudo-Relevance Feedback
Query Forwarding in Geographically Distributed Search Engines
Measuring Personalization of Web Search
Nota:
Todos los estudiantes deberán seleccionar SOLO tres de los artículos (papers) presentados en algunos temas. Con dos de éstos deben realizar un resumen de no mas de una hoja (y enviarlo por correo electrónico). Con el restante, deberán presentar una exposición detallada basada en el análisis del mismo. Cuando hayan seleccionado el paper de la exposición deben comunicarlo por correo electrónico al docente. La presentación de los artículos será la semana del 09/11.