Diplomarbeiten, Praktikum mit Bakkalaureatsarbeit, Wahlfachpraktikum, Informatikpraktikum

Allgemeines

Im Anschluß ist eine Auswahl von möglichen Praktikumsthemen bzw. Themen für Diplomarbeiten angegeben. Details dazu sowie konkrete Themen zu den angeführten Gebieten in der Sprechstunde. Eigene Ideen, die inhaltlich in diesen Bereich passen, sind möglich.
Die Praktika sind nicht an den Vorlesungsbetrieb gebunden und können daher jederzeit auch während des Semesters bzw. in den Ferien begonnen und durchgeführt werden. Generell können manche Praktika auch von Gruppen von 2 oder 3 Studenten gemeinsam absolviert werden.
Die meisten Themen eignen sich bei unterschiedlicher Schwerpunktlegung auch als Themen fuer Diplomarbeiten. Details sowie weitere Themen in der Sprechstunde.

Themengebiete: Music Retrieval/MIR, Text Mining/IR, eScience, Data Management, Data Mining / Machine Learning, Digital Preservation, Data Curation.

Music-Retrieval: Suchen und Finden von Musikstücken

Mit der ständig wachsenden Zahl von Musikdateien im Internet und in Datenbanken ergibt sich vermehrt das Problem, aus der großen Anzahl von vorhandenen Musikstücken bestimmte zu finden, ohne sich dabei jedes vorhandene Musikstück einzeln anhören zu müssen. Im Rahmen unserer Arbeit im Bereich Musiksuche, Analyse und mobile Interfaces (siehe http://www.ifs.tuwien.ac.at/mir) sind eine Reihe von Praktika und Diplomarbeiten zu vergeben, insbesonder zu Themen wie:
  • Feature Extraction aus MP3 Dateien: zusätzliche Features für Rhytmus, Klangbild, etc.
  • Tangible Interfaces zur Interaktion mit Musik unter Verwendung von z.B. Picoboard, Arduino, Lego WeDo oder ähnliche Ansätze sowie existierende tangible interfaces wie Sifteo Cubes, dem Tangible Sequencer, BlockJam, Beatbugs, oder AudioCubes
  • eLearning für Instrumente
  • Entwicklungen basierend auf SCRATCH zur Interaktion mit Musik
  • Arbeiten mit großen Benchmark-Sammlungen wie der Million Song Database
  • Evaluierung mit teils vorgegebenen, teils eigenen Musiksammlungen
  • Advanced User Interfaces für Audio-Player, Interaktivität, 3D-Interfaces, siehe MIR Homepage
  • Anpassung für mobile Devices wie PDAs, Mobiltelefone (MobileJava, Symbian,iPhone, Google Android, ...),...
  • Klassifikation von Musik in Genre-Kategorien
  • Music-Summarization
  • Analyse von Lyrics, Artis Biographies, Genre Beschreibungen
  • Musik und Emotionen
  • Audio-Installationen, Musik und Kunst, 3D-Welten, Spiele
  • Noise models in music analysis
  • Benchmarking in music retrieval
  • ...

Information Retrieval, Text Mining

Praktika und Diplomarbeiten im Bereich von Text Mining und Knowledge Management. Die Themenbereiche umfassen unter anderem:
  • Evaluierung von IR Systemen
  • Feature Extraction, Phrasen-Erkennung, Part-of-speech Tagging
  • Information Mining, Content Analysis, Textklassifikation, Clustering
  • Genre-Analyse, Stil- und Strukturanalyse von Information
  • Information Retrieval, Suche
  • Web-Mining
  • Visualisierung und Interaktion
  • Spezifische Anwendungsgebiete wie z.B. Patentanalyse
  • Multimodale Informationsanalyse
  • Large-volume data processing auf GPU-Clustern/Parallelisierung (CUDA)
  • Repeatability / verifyability of IR Experiments

eScience

  • Workflows in eScience: Modellierung, Documentation, Execution
  • Benchmarks
  • Big Data, Data Citation, Validation of Scientific Experiments
  • Evaluation, Datarepositories, closed chain from data to publication
  • Authenticity, Evidence
  • Large-volume data processing on GPU-Clustern/Parallelisierung (CUDA)

Machine Learning and Data Analysis

Zur Datenanalyse, für das Verstehen von Zusammenhängen in großen Datenmengen usw. werden immer häufiger neben statistischen Verfahren Neuronale Netze eingesetzt. In diesem Bereich gibt es Themen zu
  • Weiterentwicklung von Lernverfahren
  • Evaluierung von Verfahren an realen Problemstellungen (Text, Musik, Sensordaten, ...)
  • Interpretation von Neuronalen Netzen
  • Arbeiten im Bereich der Self-Organizing Map (SOM)
  • Cluster Analyse
  • Klassifikation
  • Parameteroptimierung
  • Density Estimation
  • Machine Learning for BigData settings (Root, Mahout, ...)

Digital Preservation

Digital Preservation umfasst alle Schritte um sicherzustellen, dass digitale Objekte (Dokumente, generische Files, Programme, etc.) auch in Zukunft geöffnet und mit minimalem Informationsverlust dargestellt werden können. In diesem Bereich gibt es Arbeiten zu den Themen:
  • Data Curation für Data-intensive Science: Data Citation, Research Infrastructures
  • Open-source basierte Digital Preservation Lösungen für Klein- und Mittelbertiebe (KMUs)
  • traceable, repeatable, auditable research processes
  • Web-Archivierung, large-scale Harvesting des Internet mittels Crawler, Preservation von Web-Daten
  • Emulation von alten Rechnerarchitekturen, Mobiltelefonen, Spezialhardware
  • Migration: Konvertierung von Dateien in neuere Formate, Evaluierung des Informationsverlustes
  • Technology Watch: Monitoring von Fileformat-Verbreitungen
  • Decision Support: Requirements-Analyse fuer Preservation-Solutions
  • Self-Aware Objects: Selbst-überwachung der Files auf ihren preservation-status
  • Tools zur Metadaten-Extraktion (Analyse, Vergleich, Weiterentwicklung), z.B. JHOVE v. Harvard, etc.
  • Security-Aspekte von Digitalen Objekten: Analyse von Sicherheitsrisiken bei Aufnahme digitaler Objekte in Archivsysteme (dynamische Objekte, selbst-modifizierende Inhalte, dynamische fonts, ...)
  • Architekturen fuer Digital Preservation, Anbindung an existierende Systeme, wie z.B. Fedora, DSPace, ...
  • Content Management Systems and Digital preservation
  • Systems for Data Archiving and Curation
  • Audit and Certification of Repositories
  • "Preservation and Forgetting"
  • Design eines Systems bei dem NACHWEISLICH alle Instanzen einer Information identifiziert und gelöscht werden können