Taller Libre I - 2016

Temas

Título Bibliografía de Referencia

Introducción a la Recuperación de Información

[MIR] Cap.1

Análisis de Textos y Representación de Documentos  

[MIR] Cap.6

Modelos Clásicos de RI
Modelos de Lenguaje para RI

[MIR] Cap.3
[IIR] Cap.1, 6, 12

Estructuras de Datos (Indexación y Recuperación)

[SE] Cap.5 
[IIR] Cap.2, 4, 5

 

Evaluación de la Recuperación

[MIR] Cap.4

Tratamiento de Consultas y Documentos

[MIR] Cap.7
[IIR] Cap.6, 9

Introducción a la Recuperación de Información Paralela y Distribuida

[MIR] Cap.10

Recuperación de Información en la Web

[MIR] Cap.11
[IIR] Cap.19, 20, 21

Clases de Chequeo y Evaluaciones

Fecha Actividad
17/08/2016 Presentación (teoría)
07/09/2016 Consulta (Teoría/Práctica)
28/09/2016 Consulta (Teoría/Práctica)
19/10/2016 Consulta (Teoría/Práctica)
09/11/2016 Presentación de artículos
30/11/2016 Examen Parcial

Trabajos Prácticos

Intro. a la RI 31/08/2016

Análisis de Texto

Paper: Ha, L., Stewart, D., Hanna P. & Smith, F. (2006). Zipf and Type-Token rules for the English, Spanish, Irish and Latin languages. Web Journal of Formal, Computational and Cognitive Linguistics, 1(8), 1-12. [link]

14/09/2016
Modelos de Recuperación y Evaluación 05/10/2016
Estructuras de Datos 09/11/2016

Modelos de Lenguaje

Paper: Graham Bennett, Falk Scholer & Alexandra Uitdenbogerd. A Comparative Study of Probabilistic and Language Models for Information Retrieval. [link] Interesante paper para ver diversos modelos comparados y los parámetros usados en cada caso.

16/11/2016
Recuperación de Información en la Web 30/11/2016
Proyecto Final Antes del examen final

Datos de Prueba

Colección T1-GR
Colección T1-QM
Resumen CISI (Ejercicio 1 TP Modelos) 
Dump 10k Posting Lists
Words-en.txt

Wiki-Large. Esta colección es un snapshot de Wikipedia seeccionado como material del libro "Search Engines...". http://www.search-engines-book.com/

Recursos

  • Wiki con apuntes sobre indexación y recuperación usando Terrier [link]

  • Transparencias sobre "Caracterización de la web" [link]

  • Transparencias sobre "Motores de búsqueda" [link]

Bibliografía (sugerida)

  • [IIR] "Introduction to Information Retrieval" - C. Manning, P. Raghavan, H. Schutze. Cambridge University Press, 2008. Versión en línea
  • [MIR] "Modern Information Retrieval. The concepts and technology behind search" - R. Baeza-Yates, B. Ribeiro Neto. 2nd Ed. Addison-Wesley, 2011. Sitio web
  • [SE]"Search Engines: Information Retrieval in Practice" - B. Croft; D. Meltzer, T. Strohman. Pearson Education, 2009. Sitio web
  • [IRI] "Introducción a la Recuperación de Información. Conceptos, modelos y algoritmos básicos" - Gabriel H. Tolosa y Fernando R.A. Bordignon. Laboratorio de Redes de Datos. UNLu, 2004 Descargar

Papers

Fast Document-at-a-time Query Processing using Two-tier Indexes
Interactions between Health Searchers and Search Engines
A Novel TF-IDF Weighting Scheme for Effective Ranking
Dual-Sorted Inverted Lists in Practice
Efficient Query Construction for Large Scale Data
How Query Cost Affects Search Behavior
Entity Query Feature Expansion using Knowledge Base Links
Task-Aware Query Recommendation
Impact of Response Latency on User Behavior in Web Search
On the Measurement of Test Collection Reliability
Time-Critical Search
Context-Aware Web Search Abandonment Prediction
Collaborative Personalized Twitter Search with Topic-Language Models
SkipBlock: Self-Indexing for Block-Based Inverted List
Inverted Indexes for Phrases and Strings
Automatic Boolean Query Suggestion for Professional Search
Addressing People's Information Needs Directly in a Web Search Result Page
A Boosting Approach to Improving Pseudo-Relevance Feedback
Query Forwarding in Geographically Distributed Search Engines
Measuring Personalization of Web Search