WFM: Advances in Database Research 2
News
- Die Vorbesprechung findet am 8. Oktober 9:00 (Seminarraum T05) statt. Die weitere Terminisierung wird im Zuge der Vorbesprechung festgelegt.
- Dieses Seminar kann als Seminar aus Informatik (Master Informatik, Pflichtmodul P2 "Software Vertiefung") angerechnet werden.
Allgemeines
Seminartermine
Zeitlich ist diese Lehrveranstaltung flexibel, d.h. (1) die Vorträge werden voraussichtlich geblockt und (2) die finale Terminisierung wird in der Vorbesprechung festgelegt.
Ablauf und Bewertung
Das Seminar besteht aus Vorträgen und Diskussionen zu den Vorträgen.
Vortrag: Die Studierenden wählen ein aktuelles Forschungspapier (aus einer vorgegebenen Liste) aus, das sie vorbereiten und im Rahmen des Seminar vortragen. Dabei soll der Vortrag sehr detailliert und didaktisch gut aufbereitet sein. Die Studierenen sollen nicht nur die Erklärungen im Forschungspapier rezitieren, sondern sich das erforderliche Hintergrundwissen aneignen und ein eigenes Verständnis aufbauen. Die Studierenden sollten in der Lage sein, auf Detailfragen zu antworten und eigenständig Beispiele zu erstellen und zu lösen.
Diskussion: Die Studierenden hören Vorträge von Studienkollegen und jungen Forschern und setzen sich mit den Inhalten in Diskussionen auseinander.
Bewertet werden die Qualität des Vortrages, die Teilnahme an den Diskussionen, sowie die Qualität der Diskussionsbeiträge.
Forschungspapiere
Die Forschungspapiere sind in thematische Gruppen geordnet.
Distributed Concurrency Control
- Tianzheng Wang, Hideaki Kimura: Mostly-Optimistic Concurrency Control for Highly Contended Dynamic Workloads on a Thousand Cores. PVLDB 10(2): 49-60 (2016)
- Rachael Harding, Dana Van Aken, Andrew Pavlo, Michael Stonebraker: An Evaluation of Distributed Concurrency Control. PVLDB 10(5): 553-564 (2017)
- Yingjun Wu, Joy Arulraj, Jiexi Lin, Ran Xian, Andrew Pavlo: An Empirical Evaluation of In-Memory Multi-Version Concurrency Control. PVLDB 10(7): 781-792 (2017)
Clustering & Machine Learning in Database Systems
- Hwanjun Song and Jae-Gil Lee: RP-DBSCAN: A Superfast Parallel DBSCAN Algorithm Based on Random Partitioning. ACM SIGMOD: 1173-1187 (2018)
- Tim Kraska, Alex Beutel, Ed H. Chi, Jeffrey Dean, and Neoklis Polyzotis: The Case for Learned Index Structures. ACM SIGMOD: 489-503 (2018)
Modern Hardware
- Erfan Zamanian, Carsten Binnig, Tim Harris, and Tim Kraska: The End of a Myth: Distributed Transactions Can Scale. PVLDB 10(6): 685-696 (2017)
- Claude Barthels, Ingo Müller, Timo Schneider, Gustavo Alonso, and Torsten Hoefler: Distributed Join Algorithms on Thousands of Cores. PVLDB 10(5): 517-528 (2017)
- Tobias Ziegler, Sumukha Tumkur Vani, Carsten Binnig, Rodrigo Fonseca, and Tim Kraska: Designing Distributed Tree-based Index Structures for Fast RDMA-capable Networks. ACM SIGMOD: 741-758 (2019)
Scalable Similarity Queries
- Tatsuya Akutsu, Daiji Fukagawa, Atsuhiro Takasu, Takeyuki Tamura: Exact algorithms for computing the tree edit distance between unordered trees. Theor. Comput. Sci. 412(4-5): 352-364 (2011)
- Sudarshan S. Chawathe, Hector Garcia-Molina: Meaningful Change Detection in Structured Data. SIGMOD Conference 1997: 26-37
- Minghe Yu, Jin Wang, Guoliang Li, Yong Zhang, Dong Deng, Jianhua Feng: A Unified Framework for String Similarity Search with Edit-distance Constraint. VLDB Journal 26(2): 249-274 (2017)
Processing JSON
- Pierre Bourhis, Juan L Reutter, Fernando Suarez, Domagoj Vrgoc: JSON: data model, query languages and schema specification. ACM PODS: 123-135 (2017)
- Mohamed-Amine Baazizi, Houssem Ben Lahmar, Dario Colazzo, Giorgio Ghelli, Carlo Sartiani: Schema inference for massive JSON datasets. Extending Database Technology (EDBT). (2017)
Zeitplan
Datum | Uhrzeit | Vortragender | Titel |
---|---|---|---|
18.11.2019 | 15:00-17:30 | Gfrerer | JSON: data model, query languages and schema specification |
18.11.2019 | 15:00-17:30 | Hütter | Exact algorithms for computing the tree edit distance between unordered trees |
25.11.2019 | 16:00-17:30 | Edelmayer | An Evaluation of Distributed Concurrency Control |
09.12.2019 | 15:00-17:30 | Nening | The Case for Learned Index Structures |
09.12.2019 | 15:00-17:30 | Kocher | Designing Distributed Tree-based Index Structures for Fast RDMA-capable Networks |