Woordenboek Arabisch
Omhoog

 

© 2003 PCM Uitgevers N.V. All rights reserved.  
NRC Handelsblad


November 1, 2003


Elke hond blaft voor zijn eigen deur ; 

 WOORDENBOEK MODERN STANDAARD ARABISCH MIKT OP NEDERLANDERS EN ARABIEREN

door: DIRK VAN DELFT

Beide delen van het deze week verschenen woordenboek Modern Standaard Arabisch komen voort uit een database. Ze bieden een rijkdom aan contexten die niet eerder is vertoond.

HOE VERTAAL je scharrelkip in het Arabisch? ''Dat viel niet mee", zegt Jan Hoogland, arabist aan de universiteit van Nijmegen. ''Het Arabisch kent geen samenstellingen en bovendien is dat begrip er onbekend. Dus moet je naar een omschrijving, als het even kan kort en bondig. We hebben er lang op zitten puzzelen. Uiteindelijk hebben we gekozen voor 'landelijke kip' en tussen haken erachter: 'kip die enige mate van bewegingsvrijheid geniet' - maar dan in het Arabisch."

Woensdag is in het Trippenhuis van de Koninklijke Nederlandse Akademie van Wetenschappen het Woordenboek Nederlands-Arabisch en Woordenboek Arabisch-Nederlands gepresenteerd. Het deel Nederlands-Arabisch omvat 37.000 ingangen, het deel Arabisch-Nederlands heeft er (door het ontbreken van samenstellingen) 24.000 - in totaal 2300 pagina's, uitgegeven door Bulaaq. Opdrachtgever was de Commissie Lexicografische Vertaalvoorzieningen van de Nederlandse Taalunie, in 1993 in het leven geroepen om woordenboekprojecten te steunen die uitgevers vanwege kleine oplages financieel te riskant vinden. Onder leiding van Hoogland is aan het Arabisch woordenboek zes jaar gewerkt, drie jaar langer dan gepland. Native speakers uit diverse delen van de Arabische wereld hebben eraan meegewerkt. ''Een reddingsboei voor iedereen die op zoek is naar het kloppende hart van het Arabisch", oordeelde Abdelkader Benali na een week lezen.

Het Modern Standaard Arabisch is de officiele taal van de Arabische wereld en van de islam. Van Marokko tot Irak bedienen overheden, kranten, tv-stations, literatoren en briefschrijvers zich van het Standaard Arabisch, voor zo'n 125 miljoen wereldburgers is het de eerste taal. Maar gesproken wordt er binnen de familie en op straat een dialect, waarbij het Egyptisch Arabisch hemelsbreed verschilt van het Marokkaans Arabisch. Het Arabisch schrift, dat van rechts naar links loopt en geen hoofdletters kent, telt 29 medeklinkers waarvan er vele alleen door puntjes van elkaar zijn te onderscheiden. Klinkers ontbreken, met uitzondering van officiele teksten en de Koran.

LEUVEN

Een goed woordenboek Modern Standaard Arabisch ontbrak in Nederland. Hoogland: ''Twee jaar geleden kwam een team uit Leuven met het leerwoordenboek Arabisch, maar dat is veel bescheidener dan het onze. Prima om mee te beginnen, maar een tweedejaars student of een vertaler grijpt al snel mis. Daarnaast heb je de woordenboeken van Amien en Al Manhal. Het eerste is van een belabberde kwaliteit, het tweede iets beter. Het zijn woordenlijsten zonder grammaticale informatie en context. Er worden enorme bokken geschoten. Een dijkgraaf is bij Amien een machine om dijken te maken, en kamermuziek vertaalt hij als een kamer waarin wordt gemusiceerd. Al Manhal omschrijft poespas als een gestoofd gerecht. Hoogste tijd voor iets beters."

Het Nijmeegse woordenboek bevat niet alleen veel meer trefwoorden dan dat uit Leuven, ook de 'microstructuur' is rijker. Ieder trefwoord waarbij dat relevant is gaat vergezeld van voorbeelden van contexten waarbinnen het wordt gebruikt, van vaste combinaties van woorden (zoals 'misdrijf plegen') en van uitdrukkingen. Ook bieden beide delen zowel in de brontaal als de doeltaal grammaticale informatie. Hoogland: ''Ons woordenboek richt zich op Nederlanders en Arabieren. Pak je bijvoorbeeld de Van Dale Engels-Nederlands, dan vindt een Engelsman bij house wel 'huis', maar dat het het huis is, en het meervoud huizen met een 'z', staat er niet bij. In ons Arabisch woordenboek geven we dat soort informatie naar twee kanten."

Hoogland, groot kenner van het Marokkaans Arabisch, is al twaalf jaar met het project bezig. Nadat hij in 1992 een haalbaarheidsstudie had uitgevoerd, kwam de Taalunie in 1997 met 500.000 euro over de brug om het Arabisch woordenboek daadwerkelijk te maken. Ook voorzag de Commissie Lexicografische Vertaalvoorzieningen Nijmegen van twee essentiele hulpstukken: het Referentiebestand Nederlands, 45.000 woorden groot, en het computerprogramma OMBI, speciaal ontwikkeld voor tweetalige woordenboeken. Hoogland: ''Het referentiebestand is al bijna een half woordenboek. De woorden zijn uitgesplitst naar betekenissen en voorzien van contexten en idioom. We hebben het ingedikt tot 37.000 ingangen door infrequente woorden en doorzichtige samenstellingen eruit te mikken. De betekenissen zijn vervolgens voorzien van Arabische vertalingen. In een kwart van de gevallen moesten we ons heil zoeken in omschrijvingen: 'kinderboerderij', 'hutspot' of 'verjaardagskalender' kennen ze niet in het Arabisch."

OVERSPEL

Andersom speelt dat ook. Zo kreeg een specifiek Arabisch woord als vertaling: 'het beschuldigen van een vrouw van overspel, waarbij men een vloek over zich afroept als het niet waar is'. En het Arabische spreekwoord 'elke hond blaft voor zijn eigen deur' kreeg het Nederlandse pendant 'voor eigen parochie preken'.

Zijn de lexicale eenheden van het Nederlands en het Arabisch eenmaal aan elkaar gekoppeld, dan keert OMBI de zaak 'met een druk op de knop' om, resulterend in een proto-Arabisch-Nederlands woordenboek. Hoogland: ''Zonder die koppeling op betekenisniveau lukt dat niet. Zo betekent het Arabische saat 'uur', 'klok' of 'horloge'. Op ingangsniveau de zaak omkeren leidt al snel tot onzin. Ook biedt OMBI de mogelijkheid om bepaalde omkeringen uit te sluiten. Zo bevat het Nederlandse referentiebestand ook schuttingtaal, waar Standaard Arabisch op een enkele uitzondering na formeel is. In het Nederlands-Arabische deel is het geen punt om 'hoer' met het Arabische woord voor 'prostituee' te vertalen, maar andersom zou het te gek voor woorden zijn om van het Arabische 'prostituee' het Nederlandse 'hoer' te maken. Plak je nu aan het Nederlandse 'hoer' in OMBI het labeltje 'vulgair', dan weet het programma dat hij niet mag omkeren."

Bij het illustreren van betekenissen aan de hand van contexten, zegswijzen en collocaties (vaste combinaties van woorden) waarbinnen ze gebruikt worden, is gezocht naar levendige taal. Zo staan op pagina 526 van het deel Nederlands-Arabisch: 'de kaartjes alstublieft', 'een broodje kaas', 'nieuwe kabels trekken', 'een dreigende kabinetscrisis' en 'dat hebben de kaboutertjes gedaan zeker'. Om Arabische contexten te kunnen opsporen, heeft Hoogland eerst een groot corpus moeten aanleggen. ''Toen we in 1997 met het project begonnen had het internet nauwelijks Arabische tekst te bieden. In heb scans gemaakt van tijdschriftartikelen en van tientallen Arabische romans uit de Nijmeegse bibliotheek, uitgezocht op lettertype en drukkwaliteit, en daar optical character recognition op losgelaten. Dat viel niet mee, in het Arabisch schrift zitten de letters aan elkaar vast. Eer het programma een bepaald lettertype had leren herkennen, was je al snel een dag verder. Kranten vielen sowieso af. Wel heb ik op cdrom een jaargang Al Hayat aangeschaft, een Arabische krant die in Londen verschijnt - toen de enige met een digitaal archief. Aldus beschikte ik aan het begin van het project over een corpus van acht miljoen woorden."

Zodra Hoogland een flink corpus aan Arabische tekst bij elkaar had geharkt, laadde hij het in een concordantieprogramma. ''Dat zocht naar woorden - 's nachts, computers waren nog niet zo snel - en bewaarde bijvoorbeeld zeventig tekens voor en na de vindplaats. Waarna 'met de hand' bepaald werd of je iets met die context kon. Of je liet het programma uitzoeken welk werkwoord er met het Arabische woord voor 'misdrijf' combineerde. Inmiddels kun je in Google Arabisch intikken. Omdat het Arabisch geen klinkers schrijft, krijg je veel treffers die er naast zitten. Vergelijk de Nederlandse zin 'w zn d brn' - dan kun je nog veel kanten op. Onlangs heb ik een testje gedaan met de combinatie 'menselijke anatomie'. In ons corpus kwam die niet voor, maar op het internet had ik zo tien, twintig vindplaatsen te pakken. Dat had voor het woordenboek uitgemaakt: 'menselijke anatomie' met de status 'voorbeeld' hoort wel in het deel Arabisch-Nederlands. Het is de overigens eerste keer dat een Arabisch woordenboek op zo'n empirische manier is gemaakt."

SPOOKWOORDEN

Het samenstellen van de laatste paar duizend Arabische ingangen bleek nog een hele opgaaf. Hoogland: ''Aan woorden geen gebrek, maar je wilt geen obscure termen of dingen die met historische zaken te maken hebben. Buitenlandse woordenboekenmakers Arabisch hebben het gepresteerd spookwoorden te creeren in gevallen dat een woord geen directe vertaling naar het Arabisch had. Die vind je verder nergens. Teksten lezen hielp niet, in een artikel van 8000 woorden zaten er drie die we nog niet hadden, dat schoot niet op. Het mooiste zou natuurlijk zijn als je een frequentielijst had, zoals die voor het Engels en het Nederlands bestaan, maar die lijst gaat in het Arabisch niet verder dan nummer 6000 of zoiets. We zijn toen in specifieke domeinen gaan zoeken: de islam, de sport, flora, fauna en geografische namen in de Arabische wereld. In het Nederlands gaf dat veel omschrijvingen."

Met de digitale versie van zijn woordenboek gaat Hoogland uiterst omzichtig om: de uitgever is als de dood voor piraten die een cdrom in handen krijgen. Niettemin nodigt Hoogland op de website van het woordenboek gebruikers uit om commentaren en aanvullingen te leveren, en wil hij een database aanleggen waarin die overzichtelijk bijeen staan. De eerste reacties van buitenlandse arabisten en woordenboekspecialisten laten zien dat de Nijmeegse aanpak in de smaak valt. Hoogland, die tijdens de presentatie in Amsterdam een stropdas droeg met daarop in het Arabisch 'het is volbracht', ziet tevreden terug op vele jaren titanenarbeid. Lachend: ''De studie van het Arabisch in Nederland is niet meer wat hij geweest is."

Woordenboek Nederlands-Arabisch en Woordenboek Arabisch-Nederlands. Uitgeverij Bulaaq. ISBN 90 5460 0802. Prijs: 130 euro. Zie ook
www.let.kun.nl/wba