Suche
  • Fachinformationsdienst für
  • Niederlandistik, Niederlande-, Belgien- und Luxemburgforschung
Suche Menü

Verslag workshop “Digitale neerlandistiek” op 29 februari 2024

Academisch werken vereist niet alleen theoretische kennis over het onderwerp in kwestie, maar door de steeds toenemende digitalisering van het wetenschappelijk werkproces ondertussen veelal ook bijzondere vaardigheden om deze digitalisering tegemoet te treden. Onderzoekers komen op verschillende manieren in aanraking met digitale tools en methodes: sommigen vooral receptief, sommigen doordat zij speciaal voor hun probleemstellingen of onderzoeksvragen nieuwe digitale vaardigheden aanleren en die vervolgens voor hun doelstellingen gebruiken. Dat is vaak een flinke uitdaging, maar biedt ook de kans om nieuwe inzichten te verwerven die zonder digitale methodes niet of slechts moeilijk verkrijgbaar zouden zijn.

Neerlandici die digitaal werken (of willen werken) hebben in het kader van hun onderzoeksactiviteiten dikwijls al een behoorlijke set aan vaardigheden opgebouwd en ervaringen opgedaan waar anderen van kunnen profiteren. In dit verband zou een wederzijdse uitwisseling en gemeenschappelijke reflectie over digitale methodes binnen de neerlandistiek een meerwaarde voor de community en de afzonderlijke onderzoekers kunnen opleveren en het netwerken op dit gebied kunnen bevorderen.

Reden genoeg om hier werk van te maken in de vorm van een workshop “Digitale neerlandistiek” met een focus op peer-to-peer learning en networking. Het concept van de workshop is voortgekomen uit een eerdere workshop met de titel Historische Beneluxforschung & Digital History waar de FID Benelux in zijn hoedanigheid als vakinformatiedienst als medeorganisator bij was betrokken. De achterliggende vragen van deze workshop waren: Op welke manier beïnvloedt de digitalisering actuele onderzoeksvragen en projecten? Verandert de digitalisering de kijk op onderzoeksobjecten? En: Welke methoden en bronnen brengt de digitalisering met zich mee?

Bij het ontwikkelen van een concept dat inhoudelijk en qua vorm past bij de neerlandistiek werd de FID Benelux vanaf eind 2022 ondersteund door Kiran van Bentum van het Institut für Deutsche und Niederländische Philologie van de FU Berlijn. Daarnaast is het workshop-project inhoudelijk begeleid door de wetenschappelijke adviescommissie van de FID. De adviescommissie opperde o.a. dat de digitalisering van het (universitaire) onderwijs een geschikt thema zou kunnen zijn voor zowel taal- als literatuurwetenschappers.

Na de eerste conceptuele stappen is er een “call for reactions & papers“ in de vorm van een online-enquête ontwikkeld met als centrale vragen: Bestaat er animo voor het thema “digitale neerlandistiek”? Is er behoefte aan meer informatie en uitwisseling over dit onderwerp? Wie zou er een project (op het gebied van de digitalisering van het onderwijs) willen presenteren? De enquête is in augustus en september 2023 rondgestuurd. Het programma van de workshop Digitale neerlandistiek is gebaseerd op de resultaten van deze enquête. Er zijn minder presentatievoorstellen dan oorspronkelijk gedacht binnen gekomen die verband hadden met de digitalisering van het onderwijs, maar wel een interessante reeks presentaties die een mooie indruk geeft van het actuele spectrum van de digitale neerlandistiek.

Om zoveel mogelijk belangstellenden de kans te geven de workshop bij te wonen, werd er voor een drie uur durende online-workshop gekozen. Deze workshop vond plaats op donderdagmiddag 29 februari 2024 met in totaal 20 deelnemers. De sprekers gaven in de volgende vijf presentaties een inkijk in hun onderzoek en werkmethodes en stonden aansluitend open voor vragen en discussie:

Martin Konvička presenteerde zijn onderzoeksproject Het is zinloos want internet. Sociale media als bron voor taalwetenschappelijk onderzoek. Hiervoor bestudeerde hij elliptische zinsconstructies zoals bijvoorbeeld “Verder doe ik pannenkoeken want lekker” waarin de voegwoorden “want” en gedeeltelijk ook “omdat” de functie van connectoren vervullen. Konvička deed dit niet alleen voor het Nederlands maar via een taalvergelijkende aanpak ook voor het Duits en het Engels. De constructie bestaat daarnaast ook in een aantal andere Europese talen. Als databron gebruikte hij Twitter/X. Het programma voor de data-analyse is in samenwerking met Kristin Stöcker ontwikkeld en in de programmeertaal Python geschreven onder gebruikmaking van twarc voor de verzameling en archivering van de data via de Twitter API en SpaCy als tool voor de verwerking van natuurlijke taal. Het project is op het platform GitHub gedocumenteerd.

Het onderzoek leverde een aantal ethisch-juridische vragen op waaronder: Mag je tweets in juridisch opzicht zomaar als bronnen gebruiken? Hoe garandeer je de anonimiteit van de twitteraars? Weten twitteraars dat hun tweets voor data-analytische doeleinden gebruikt kunnen worden? Naast deze vragen bestaat er ondertussen ook een praktisch probleem op technisch niveau, want de Twitter API is sinds de overname van Twitter door Elon Musk niet meer vrij toegankelijk zodat de door Konvička en Stöcker gebruikte methodes niet meer functioneren. In de discussie suggereerde een deelnemer dat een reeds bestaand chat corpus van tieners misschien uitkomst zou kunnen bieden als het gaat om de analyse van social media taal.

Bekijk hier de slides van de presentatie van Martin Konvička.

Als tweede spreker stelde Max Kindler-Mathot zijn project Digitaal netwerkonderzoek naar (populair-)wetenschappelijke teksten met Python, spaCy, NetworkX, pyvis en Gephi aan de hand van L. Jensen “Against English” voor. Hierbij heeft hij zich laten inspireren door DraCor, het Drama Corpora Project, en de actor-netwerktheorie. Onderzoeksobject was het boek van Lotte Jensen e.a.: Against English. Pleidooi voor het Nederlands (Amsterdam: Wereldbibliotheek, 2019). Net als de eerste spreker heeft ook Kindler-Mathot met Python als programmeertaal gewerkt. Een centrale methode die hij in verband met zijn netwerkonderzoek heeft gebruikt, is de Named Entity Recognition (NER). Voor dit doeleinde werden de in het boek opgenomen teksten omgevormd tot txt-bestanden zodat de benodigde entiteiten vervolgens met behulp van de SpaCy-NER tagger konden worden geëxtraheerd. SpaCy NER bleek echter als tool voor de taal Nederlands nog aan fouten onderhevig te zijn. Om het netwerk te analyseren en in kaart te brengen is de Python-bibliotheek NetworkX ingezet, als tools voor de netwerkvisualisatie zijn pyvis en Gephi gebruikt. Kindler-Mathot heeft txtvis, het Python script dat hij i.v.m. het project heeft ontwikkeld eveneens op Github gezet.

Tijdens de aansluitende discussie adviseerde Kindler-Mathot, die niet alleen actief is op het gebied van de neerlandistiek maar ook een diploma in bedrijfsinformatica heeft behaald, iedereen die het veld van de digitale geesteswetenschappen voor het eerst wil betreden om gewoon met een grote portie nieuwsgierigheid en volgens het principe “trial and error” aan de slag te gaan.

Bekijk hier de slides van de presentatie van Max Kindler-Mathot.

Bekijk hier de hand-out bij de presentatie.

Spreker nummer drie, Kiran van Bentum, presenteerde over Kwalitatief onderzoek van historische bronnen met het programma MAXQDA. In dit nog lopende project onderzoekt hij het concept van de taalgrens in de periode van 1830 t/m 1940 in een zevental historische Nederlandstalige tijdschriften met behulp van het kwalitatief data- en tekstanalyse-programma MAXQDA. Een van de centrale onderzoeksvragen luidt: Op welke manier werd het concept “taalgrens” gebruikt om taalgemeenschappen (naties) te vormen?

In zijn presentatie liet hij aan de hand van concrete voorbeelden in MAXQDA zien, hoe het programma werkt en welke voordelen het biedt als het erom gaat een vrij groot tekstcorpus samen te stellen en op een centrale plek te bewerken. Tot de nadelen vanuit neerlandistisch perspectief behoort volgens hem dat het programma in de eerste plaats voor analyses op het gebied van de sociologie en verwante disciplines is ontwikkeld en dat het daarom een discipline-specifieke logica heeft. Ook is er geen Nederlandse versie voor bijvoorbeeld de spellingscontrole of voor stopwoorden en werkt de automatische tekstherkenning minder goed bij oudere bronnen.

Bekijk hier de slides van de presentatie van Kiran van Bentum.

De vierde presentatie Drie keer zeven wijze mannen. Hybride editie van de drie oudste versies van de „Historia septem sapientum Romae“ in het Nederlands werd gegeven door Rita Schlusemann. Haar project maakt deel uit van het grootscheepse internationale editieproject Seven Sages of Rome dat het in minstens 30 talen overgeleverde premoderne verhaal van de zeven wijze mannen ook vanuit een transculturele en een gendertheoretische invalshoek benadert. Het multimediale project wordt ontwikkeld in samenwerking met het Zentrum für Philologie und Digitalität „Kallimachos“ (ZPD) van de Universiteit Würzburg.

Schlusemann demonstreerde o.a. hoe de Oxygen-gebaseerde open source publicatieomgeving ediarum werkt en hoe verschillende edities van een tekst hier op een comfortabele manier gecombineerd kunnen worden. Vervolgens kregen de workshop-deelnemers een eerste glimp te zien van de geplande online editie waar nog een audioversie aan toegevoegd zal worden zoals we dit bijv. van de app Vogala kennen. Hierbij werd niet alleen duidelijk hoe deze vorm van digitale toegankelijkheid de basis kan vormen voor beter vergelijkend onderzoek van historische bronnen en verdere analyses van de teksten maar ook hoe historische bronnen op die manier voor een breder publiek kunnen worden ontsloten. Een van de grootste technische uitdagingen bij dit soort projecten is volgens Schlusemann om de website met alle bijbehorende functies en data op lange termijn beschikbaar te houden.

In de afsluitende presentatie, Achter de schermen van Wikipedia. Kansen en uitdagingen van een open netwerk voor kennis, gaf Ziko van Dijk een inzicht in de werkwijze van Wikipedia en een aantal aan Wikipedia gekoppelde zusterprojecten − waaronder Wikidata, Wikimedia Commons (voor afbeeldingen) en Wikivoyage − die gezamenlijk het Wikiversum vormen. Hij liet de onderliggende macro-, meso- en microstructuren van de in Wikipedia opgeslagen gegevens zien en ook de onderlinge verbanden tussen de verschillende zusterprojecten en Wikipedia.

Wikidata als centrale knowledge base voor gestructureerde data-objecten biedt o.a. de mogelijkheid om metadata en labels in vele talen te hanteren. Linked Data maakt het mogelijk om gegevensuitwisseling te faciliteren tussen de afzonderlijke projecten binnen de Wikimedia Foundation en biedt ook de kans om gegevens uit bijvoorbeeld Wikipedia en Wikidata te combineren met gegevens uit externe bronnen, waardoor nieuwe inzichten kunnen ontstaan.

Bekijk hier de slides van de presentatie van Ziko van Dijk.

De klemtoon van deze workshop lag op het methodisch werken met digitale middelen en minder op de presentatie van wetenschappelijke resultaten, hoewel beide aspecten uiteraard met elkaar verweven zijn. De bedoeling was niet alleen om de hoeveelheid aan digitale methodes in de neerlandistiek te laten zien, maar vooral ook om de gezamenlijke reflectie over de methodes te stimuleren en te weten te komen, waarom de sprekers precies voor een bepaalde methode hadden gekozen en voor welke uitdagingen ze kwamen of komen te staan. Na de presentaties zijn de deelnemers daarover met elkaar in gesprek gegaan.

Probleempunten die zijn genoemd zijn o.a. juridische onduidelijkheden bijvoorbeeld m.b.t. data-rechten, het hergebruik van data en research data management, daarnaast ook duurzame digitaliseringsmethodes en de omgang met kunstmatige intelligentie. Het leek velen bovendien een (te) grote uitdaging om te leren programmeren, maar er werd ook opgemerkt dat kleine scripts door ChatGPT of andere op kunstmatige intelligentie gebaseerde chatbots kunnen worden gegenereerd. Vooral van de kant van degenen die lesgeven kwam het argument dat ze hun rol meer zien op het gebied van het overbrengen van critical media literacy en minder bij het doorgeven van digitale vaardigheden.

Ook vonden de deelnemers het belangrijk om een overzicht te creëren van de grote hoeveelheid bestaande informatie over digitale tools en methodes en die op een centrale plek te bundelen − bijvoorbeeld in de vorm van een handboek of iets soortgelijks dat oriëntatie kan bieden om een gerichte keuze te maken en eventueel aan te kunnen sluiten bij reeds bestaande initiatieven of projecten.

De mogelijkheid om met elkaar te kunnen netwerken rondom digitale kwesties werd zeer gewaardeerd, evenals het formaat van de hier besproken workshop: korte presentaties in de vorm van elevator pitches.

Concrete plannen die zijn voortgekomen uit deze eerste workshop zijn het opzetten van een mailinglijst voor digitaal geïnteresseerden, de oprichting van een werkgroep omtrent digitale vraagstukken in (onderzoeks-)projecten en een vervolgworkshop in het najaar van 2024. Op middellange termijn is bovendien meer internationalisering denkbaar om de uitwisseling uit te kunnen breiden naar belangstellenden buiten de Duitstalige landen.

Teilen

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.