WFM: Advances in Database Research 3
News
- Die Termine wurden veröffentlicht.
- Dieses Seminar kann als Seminar aus Informatik (Master Informatik, Pflichtmodul P2 "Software Vertiefung") angerechnet werden.
Allgemeines
Seminartermine
Zeitlich ist diese Lehrveranstaltung flexibel, d.h. (1) die Vorträge werden voraussichtlich geblockt und (2) die finale Terminisierung wird in der Vorbesprechung festgelegt.
Ablauf und Bewertung
Das Seminar besteht aus Vorträgen und Diskussionen zu den Vorträgen.
Vortrag: Die Studierenden wählen ein aktuelles Forschungspapier (aus einer vorgegebenen Liste) aus, das sie vorbereiten und im Rahmen des Seminar vortragen. Dabei soll der Vortrag sehr detailliert und didaktisch gut aufbereitet sein. Die Studierenen sollen nicht nur die Erklärungen im Forschungspapier rezitieren, sondern sich das erforderliche Hintergrundwissen aneignen und ein eigenes Verständnis aufbauen. Die Studierenden sollten in der Lage sein, auf Detailfragen zu antworten und eigenständig Beispiele zu erstellen und zu lösen.
Diskussion: Die Studierenden hören Vorträge von Studienkollegen und jungen Forschern und setzen sich mit den Inhalten in Diskussionen auseinander.
Bewertet werden die Qualität des Vortrages, die Teilnahme an den Diskussionen, sowie die Qualität der Diskussionsbeiträge.
Forschungspapiere
Hier eine Vorschau von Forschungspapieren. Die Auswahl kann bis zu Beginn des Seminars noch ergänzt werden.
Die Forschungspapiere sind in thematische Gruppen geordnet.
Distributed Concurrency Control
- Tianzheng Wang, Hideaki Kimura: Mostly-Optimistic Concurrency Control for Highly Contended Dynamic Workloads on a Thousand Cores. PVLDB 10(2): 49-60 (2016)
- Yingjun Wu, Joy Arulraj, Jiexi Lin, Ran Xian, Andrew Pavlo: An Empirical Evaluation of In-Memory Multi-Version Concurrency Control. PVLDB 10(7): 781-792 (2017)
- Chao Wang, Kezhao Huang, Xuehai Qian: Comprehensive Framework of RDMA-enabled Concurrency Control Protocols. arXiv:2002.12664.
Modern Hardware
- Erfan Zamanian, Carsten Binnig, Tim Harris, and Tim Kraska: The End of a Myth: Distributed Transactions Can Scale. PVLDB 10(6): 685-696 (2017)
- Claude Barthels, Ingo Müller, Timo Schneider, Gustavo Alonso, and Torsten Hoefler: Distributed Join Algorithms on Thousands of Cores. PVLDB 10(5): 517-528 (2017)
- Viktor Leis, Peter Boncz, Alfons Kemper, and Thomas Neumann: Morsel-driven parallelism: a NUMA-aware query evaluation framework for the many-core age. SIGMOD Conference 2014: 743-754.
Advanced Data Structures
- Harald Lang, Alexander Beischl, Viktor Leis, Peter Boncz, Thomas Neumann, and Alfons Kemper: Tree-Encoded Bitmaps. SIGMOD Conference 2020: 937-953.
- Robert Binna, Eva Zangerle, Martin Pichl, Günther Specht and Viktor Leis: HOT: A Height Optimized Trie Index for Main-Memory Database Systems. SIGMOD Conference 2018: 521-534.
- Viktor Leis, Alfons Kemper, and Thomas Neumann: The Adaptive Radix Tree: ARTful Indexing for Main-Memory Databases. ICDE Conference 2013: 38-49.
Scalable Similarity Queries
- Sudarshan S. Chawathe, Hector Garcia-Molina: Meaningful Change Detection in Structured Data. SIGMOD Conference 1997: 26-37
- Minghe Yu, Jin Wang, Guoliang Li, Yong Zhang, Dong Deng, Jianhua Feng: A Unified Framework for String Similarity Search with Edit-distance Constraint. VLDB Journal 26(2): 249-274 (2017)
- Dong Deng, Yufei Tao, Guoliang Li: Overlap Set Similarity Joins with Theoretical Guarantees. SIGMOD Conference 2018: 905-920
Parallel Systems
- R. Vernica, M. J. Carey, and C. Li: Efficient Parallel Set-Similarity Joins Using MapReduce. SIGMOD Conference 2010
- V. Borkar, M. J. Carey, R. Grover, N. Onose, and R. Vernica: Hyracks: A Flexible and Extensible Foundation for Data-Intensive Computing. ICDE 2011
- V. Borkar, Y. Bu, E. Carman, N. Onose, T. Westmann, M. Carey, P. Pirzadeh, and V. Tsotras: Algebricks: A Data Model-Agnostic Compiler Backend for Big Data Languages. SoCC 2015
Zeitplan
Ort: Hörsaal II, Lise Meitner
Datum | Uhrzeit | Vortragender | Titel |
---|---|---|---|
09.12.2020 | 15:00-16:30 | Christian Edelmayer | An Empirical Evaluation of In-Memory Multi-Version Concurrency Control |
09.12.2020 | 16:45-18:15 | Sebastian Landl | Mostly-Optimistic Concurrency Control for Highly Contended Dynamic Workloads on a Thousand Cores |
16.12.2020 | 15:00-16:30 | Andreas Vorderleitner | Tree-Encoded Bitmaps |
16.12.2020 | 16:45-18:15 | - | - |
13.01.2021 | 15:00-16:30 | Thomas Hütter | JED: JSON Edit Distance |
13.01.2021 | 16:45-18:15 | Daniel Kocher | Scaling Density-based Clustering to Large Collections of Sets |