Taller Libre I - 2015

Cronograma (Tentativo)

Semana Tema
1 (17/08) Introducción y problemática de la RI
2 (24/08) Análisis de Textos
3 (31/08) Modelos Clásicos de RI
4 (07/09) Evaluación de la Recuperación
5 (14/09) Estructuras de Datos para RI
6 (21/09) Exámenes Adicionales (no hay clases)
7 (28/09) Modelos de Lenguaje para RI
8 (05/10) Indexación y Recuperación
9 (12/10) Retroalimentación/Expansión de la Consulta
10 (19/10) Recuperación de Información en la Web
11 (26/10) Máquinas de Búsqueda para la Web
12 (02/11) Introducción a clasificación y clustering
13 (09/11) Presentación de Artículos (papers)
14 (16/11) Exámen parcial
15 (23/11) Seminario de Recuperación de Información Distribuida
16 (30/11) Presentación del Proyecto Final y Recuperatorio

 

Trabajos Prácticos

Intro. a la RI
Análisis de Texto
Modelos de Recuperación y Evaluación
Estructuras de Datos
Modelos de Lenguaje
Recuperación de Información en la Web
Proyecto Final

Datos de Prueba

Colección T1-GR
Colección T1-QM
Resumen CISI
Dump 10k Posting Lists

Recursos

  • Wiki con apuntes sobre indexación y recuperación usando Terrier [link]

  • Transparencias sobre "Caracterización de la web" [link]

  • Transparencias sobre "Motores de búsqueda" [link]

Bibliografía

Sugerida

  • "Introduction to Information Retrieval" - C. Manning, P. Raghavan, H. Schutze. Cambridge University Press, 2008. Versión en línea
  • "Modern Information Retrieval. The concepts and technology behind search" - R. Baeza-Yates, B. Ribeiro Neto. 2nd Ed. Addison-Wesley, 2011. Sitio web
  • "Search Engines: Information Retrieval in Practice" - B. Croft; D. Meltzer, T. Strohman. Pearson Education, 2009. Sitio web
  • "Introducción a la Recuperación de Información. Conceptos, modelos y algoritmos básicos" - Gabriel H. Tolosa y Fernando R.A. Bordignon. Laboratorio de Redes de Datos. UNLu, 2004 Descargar

Complementaria

  • "Information Retrieval. Algorithms and Heuristics" - D. A. Grossman, O. Frieder. 2nd Edition. Springer, 2004.Vista previa
  • "Managing Gigabytes: Compressing and Indexing Documents and Images" - I.H. Witten, A. Moffat, T.C. Bell. 2nd ed., Morgan Kaufmann, 1999. Sitio web
  • "Information Retrieval. Data Structures & Algorithms" - W. B. Frakes, R. Baeza-Yates. Prentice-Hall, 1992.Sitio web
  • "Mining the Web. Discovering Knowledge from Hypertext Data". Soumen Chakrabarti. Morgan-Kaufmann Publishers, 2003. Sitio web

Papers

Fast Document-at-a-time Query Processing using Two-tier Indexes
Interactions between Health Searchers and Search Engines
A Novel TF-IDF Weighting Scheme for Effective Ranking
Dual-Sorted Inverted Lists in Practice
Efficient Query Construction for Large Scale Data
How Query Cost Affects Search Behavior
Entity Query Feature Expansion using Knowledge Base Links
Task-Aware Query Recommendation
Impact of Response Latency on User Behavior in Web Search
On the Measurement of Test Collection Reliability
Time-Critical Search
Context-Aware Web Search Abandonment Prediction
Collaborative Personalized Twitter Search with Topic-Language Models
SkipBlock: Self-Indexing for Block-Based Inverted List
Inverted Indexes for Phrases and Strings
Automatic Boolean Query Suggestion for Professional Search
Addressing People's Information Needs Directly in a Web Search Result Page
A Boosting Approach to Improving Pseudo-Relevance Feedback
Query Forwarding in Geographically Distributed Search Engines
Measuring Personalization of Web Search


Nota:

Todos los estudiantes deberán seleccionar SOLO tres de los artículos (papers) presentados en algunos temas. Con dos de éstos deben realizar un resumen de no mas de una hoja (y enviarlo por correo electrónico). Con el restante, deberán presentar una exposición detallada basada en el análisis del mismo. Cuando hayan seleccionado el paper de la exposición deben comunicarlo por correo electrónico al docente. La presentación de los artículos será la semana del 09/11.