Taller Libre I - 2016
Temas
Título | Bibliografía de Referencia | |
Introducción a la Recuperación de Información |
[MIR] Cap.1 | |
Análisis de Textos y Representación de Documentos |
[MIR] Cap.6 | |
Modelos Clásicos de RI |
[MIR] Cap.3 [IIR] Cap.1, 6, 12 |
|
Estructuras de Datos (Indexación y Recuperación) |
[SE] Cap.5 [IIR] Cap.2, 4, 5 |
|
Evaluación de la Recuperación |
[MIR] Cap.4 | |
Tratamiento de Consultas y Documentos |
[MIR] Cap.7 [IIR] Cap.6, 9 |
|
Introducción a la Recuperación de Información Paralela y Distribuida |
[MIR] Cap.10 | |
Recuperación de Información en la Web |
[MIR] Cap.11 [IIR] Cap.19, 20, 21 |
Clases de Chequeo y Evaluaciones
Fecha | Actividad | |
17/08/2016 | Presentación (teoría) | |
07/09/2016 | Consulta (Teoría/Práctica) | |
28/09/2016 | Consulta (Teoría/Práctica) | |
19/10/2016 | Consulta (Teoría/Práctica) | |
09/11/2016 | Presentación de artículos | |
30/11/2016 | Examen Parcial |
Trabajos Prácticos
Intro. a la RI | 31/08/2016 |
Paper: Ha, L., Stewart, D., Hanna P. & Smith, F. (2006). Zipf and Type-Token rules for the English, Spanish, Irish and Latin languages. Web Journal of Formal, Computational and Cognitive Linguistics, 1(8), 1-12. [link] |
14/09/2016 |
Modelos de Recuperación y Evaluación | 05/10/2016 |
Estructuras de Datos | 09/11/2016 |
Paper: Graham Bennett, Falk Scholer & Alexandra Uitdenbogerd. A Comparative Study of Probabilistic and Language Models for Information Retrieval. [link] Interesante paper para ver diversos modelos comparados y los parámetros usados en cada caso. |
16/11/2016 |
Recuperación de Información en la Web | 30/11/2016 |
Proyecto Final | Antes del examen final |
Datos de Prueba
Colección T1-GR |
Colección T1-QM |
Resumen CISI (Ejercicio 1 TP Modelos) |
Dump 10k Posting Lists |
Words-en.txt |
Wiki-Large. Esta colección es un snapshot de Wikipedia seeccionado como material del libro "Search Engines...". http://www.search-engines-book.com/ |
Recursos
-
Wiki con apuntes sobre indexación y recuperación usando Terrier [link]
-
Transparencias sobre "Caracterización de la web" [link]
-
Transparencias sobre "Motores de búsqueda" [link]
Bibliografía (sugerida)
- [IIR] "Introduction to Information Retrieval" - C. Manning, P. Raghavan, H. Schutze. Cambridge University Press, 2008. Versión en línea
- [MIR] "Modern Information Retrieval. The concepts and technology behind search" - R. Baeza-Yates, B. Ribeiro Neto. 2nd Ed. Addison-Wesley, 2011. Sitio web
- [SE]"Search Engines: Information Retrieval in Practice" - B. Croft; D. Meltzer, T. Strohman. Pearson Education, 2009. Sitio web
- [IRI] "Introducción a la Recuperación de Información. Conceptos, modelos y algoritmos básicos" - Gabriel H. Tolosa y Fernando R.A. Bordignon. Laboratorio de Redes de Datos. UNLu, 2004 Descargar
Papers
Fast Document-at-a-time Query Processing using Two-tier Indexes
Interactions between Health Searchers and Search Engines
A Novel TF-IDF Weighting Scheme for Effective Ranking
Dual-Sorted Inverted Lists in Practice
Efficient Query Construction for Large Scale Data
How Query Cost Affects Search Behavior
Entity Query Feature Expansion using Knowledge Base Links
Task-Aware Query Recommendation
Impact of Response Latency on User Behavior in Web Search
On the Measurement of Test Collection Reliability
Time-Critical Search
Context-Aware Web Search Abandonment Prediction
Collaborative Personalized Twitter Search with Topic-Language Models
SkipBlock: Self-Indexing for Block-Based Inverted List
Inverted Indexes for Phrases and Strings
Automatic Boolean Query Suggestion for Professional Search
Addressing People's Information Needs Directly in a Web Search Result Page
A Boosting Approach to Improving Pseudo-Relevance Feedback
Query Forwarding in Geographically Distributed Search Engines
Measuring Personalization of Web Search