Digital Humanities Institute Beirut 2017 – ein Rückblick

CC BY-NC-SA 4.0, designed by Mario Hawat (Twitter: @kyraneth)

Das Digital Humanities Institute 2017 brachte an der American University of Beirut Wissenschaftler, Professoren, Bibliothekare und ITler zusammen, um über verschiedenste Themenbereiche und aus den unterschiedlichen Blickwinkeln jedes Einzelnen zu diskutieren, Ideen auszutauschen und neue Pläne für die Zukunft zu schmieden.

Ein großer Dank geht an das Center for Arts and Humanities der AUB und das AMICAL Consortium. Den Organisatoren Fatmeh Charafeddine (Jafet Library), Rayane Fayed (IT), Mario Hawat (English major), Najla Jarkas (English) und David Wrisley (English) gebührt besonderer Dank für die großartige Vorbereitung und harte Arbeit!

 

Die Keynotes des DHIB sind beide auf Youtube verfügbar:

In den ersten beiden Tagen besuchten wir das OCR-Panel an der Jafet Library, geleitet von Nina Ghannam und Vera Al Ashkar, in dem viel Interessantes über die Schwierigkeiten bei der Vorbereitung von arabischen Texten für die OCR zu lernen war. Neben der freien Alternative GIMP, die wir im Hands-On selbst zur Bereinigung von Buchscans verwenden konnten, zeigte Vera auch den lizenzpflichtigen Konkurrenten Adobe Photoshop, mit dem die Bearbeitung insbesondere schwieriger Fälle (Bücher mit Wasserschäden etwa) und größerer Mengen von Seiten auf einmal erheblich einfacher von der Hand geht.

Vera Al Askar erklärt die Bildaufbereitung mit GIMP

Am zweiten Tag ging es dann um die eigentliche OCR-Erkennung – zum einen mit der professionellen Software Sakhr, die von der Jafet Library verwendet wird, zum anderen mit der OpenSource-Alternative Viet-OCR, das mit Googles Tesseract arbeitet. Die Resultate zeigten, dass die Mühe bei der Aufbereitung sich tatsächlich lohnt: Die aufbereiteten Texte wiesen durchweg erheblich höhere Genauigkeit bei der Erkennung auf als die unbearbeiteten Originalscans.

Nina Ghannam demonstriert die Vorbereitung von OCR bei Sakhr

Am Nachmittag gewährte man uns auch einen Einblick in das Digitisation Lab, in dem neben Büchern auch Zeitschriften und Mikrofilme digitalisiert und auch neue Mikrofilme erzeugt werden.

vrnl: Nina Ghannam, Vera Al Ashkar und Felix Wiedemann im Digitisation Lab

Die Lightning Talk-Session des DHIB lud alle Teilnehmer zu kurzen Impulsvorträgen ein, um Projekte oder Infrastrukturen vorstellen und Kooperationen aufbauen zu können. Die Zeit dafür ging schnell herum, ohne weiteres hätte diese Runde noch wesentlich länger Redner gefunden.

Lightning Talk Session

Der letzte Workshoptag schloss mit kleineren Sessions, bei der wir das Hands-On zu Voyant Tools besuchten – einem Werkzeug zum Distant Reading und der Analyse von Texten, dass web-basiert funktioniert und seit dem letzten Jahr auch auf Arabisch verfügbar ist.

Najla Jarkas erklärt die Nutzung von Voyant Tools

Der Abschluss des Workshops fand dank schönem Wetter unter freiem Himmel statt und ließ auch den Teilnehmern viel Zeit zum Reden – David Wrisley stellte dabei insbesondere die Fragen „Wie erklären Sie Ihren Kollegen daheim, was Sie hier gemacht haben?“ und „Was ist der nächste Schritt?“

Natürlich ist dies nur ein persönlicher Bericht und lediglich ein kleiner Teil all dessen, was auf dem DHIB großartig funktioniert: Es gab fantastische Panels zu Game Design, Drupal, Python, Omeka, Plaintext Editing, TEI, Pädagogik und Mapping – mit dem einzigen Wermutstropfen, nicht jedes einzelne besucht haben zu können.

Auffallend ist auch die Affinität der Digital Humanitites zu Twitter, dem Social Network der Wahl zur Vernetzung untereinander. Unter #DHIB2017 finden sich die Tweets zum Workshop. Das vollständige Programm ist in unserem ursprünglichen Beitrag zum DHIB zu finden.