Seit nunmehr 25 Jahren entwickelt Terence Parr, Professor an der University of San Francisco, einen Parsergenerator namens ANTLR (kurz für: ANother Tool for Language Recognition, siehe antlr.org). Das in Java geschriebene Tool erlaubt es, eigene Grammatiken in einer sehr eingängigen Syntax zu beschreiben und daraus Lexer und Parser zu generieren. Wer schon einmal Lexer und Parser zu Fuß implementiert hat, weiß diese Leistung zu würdigen. Die Geschwindigkeit, mit der auf diese Weise Sprachverarbeitung in eigene Anwendungen integriert werden kann, macht das Werkzeug auch für den Alltagseinsatz interessant. Dieser Artikel wird nach einer kurzen Einführung in die wichtigsten Begrifflichkeiten zuerst auf die Implementierung einer einfachen Ausdrucksgrammatik eingehen und schrittweise zeigen, wie diese schlussendlich interpretiert und kompiliert werden kann. Anschließend wird das erarbeitete Wissen genutzt, um ein praxisnahes Problem zu lösen. Es wird ein WPF HtmlTextBlock Control entwickelt, das HTML Text in einem WPF TextBlock rendert.
Florian Fordermeier
Experte bei der Art of Quality GmbH