|
© 2003 PCM Uitgevers N.V.
All rights reserved.
NRC
Handelsblad
November 1, 2003
Elke hond blaft voor zijn eigen deur ;
WOORDENBOEK MODERN
STANDAARD ARABISCH MIKT OP NEDERLANDERS EN ARABIEREN
door: DIRK VAN DELFT
Beide delen van het deze week verschenen woordenboek Modern Standaard Arabisch
komen voort uit een database. Ze bieden een rijkdom aan contexten die niet
eerder is vertoond.
HOE VERTAAL je scharrelkip in het Arabisch? ''Dat viel niet mee", zegt Jan
Hoogland, arabist aan de universiteit van Nijmegen. ''Het Arabisch kent geen
samenstellingen en bovendien is dat begrip er onbekend. Dus moet je naar een
omschrijving, als het even kan kort en bondig. We hebben er lang op zitten
puzzelen. Uiteindelijk hebben we gekozen voor 'landelijke kip' en tussen haken
erachter: 'kip die enige mate van bewegingsvrijheid geniet' - maar dan in het
Arabisch."
Woensdag is in het Trippenhuis van de Koninklijke Nederlandse Akademie van
Wetenschappen het Woordenboek Nederlands-Arabisch en Woordenboek
Arabisch-Nederlands gepresenteerd. Het deel Nederlands-Arabisch omvat 37.000
ingangen, het deel Arabisch-Nederlands heeft er (door het ontbreken van
samenstellingen) 24.000 - in totaal 2300 pagina's, uitgegeven door Bulaaq.
Opdrachtgever was de Commissie Lexicografische Vertaalvoorzieningen van de
Nederlandse Taalunie, in 1993 in het leven geroepen om woordenboekprojecten te
steunen die uitgevers vanwege kleine oplages financieel te riskant vinden. Onder
leiding van Hoogland is aan het Arabisch woordenboek zes jaar gewerkt, drie jaar
langer dan gepland. Native speakers uit diverse delen van de Arabische wereld
hebben eraan meegewerkt. ''Een reddingsboei voor iedereen die op zoek is naar
het kloppende hart van het Arabisch", oordeelde Abdelkader Benali na een week
lezen.
Het Modern Standaard Arabisch is de officiele taal van de Arabische wereld en
van de islam. Van Marokko tot Irak bedienen overheden, kranten, tv-stations,
literatoren en briefschrijvers zich van het Standaard Arabisch, voor zo'n 125
miljoen wereldburgers is het de eerste taal. Maar gesproken wordt er binnen de
familie en op straat een dialect, waarbij het Egyptisch Arabisch hemelsbreed
verschilt van het Marokkaans Arabisch. Het Arabisch schrift, dat van rechts naar
links loopt en geen hoofdletters kent, telt 29 medeklinkers waarvan er vele
alleen door puntjes van elkaar zijn te onderscheiden. Klinkers ontbreken, met
uitzondering van officiele teksten en de Koran.
LEUVEN
Een goed woordenboek Modern Standaard Arabisch ontbrak in Nederland. Hoogland:
''Twee jaar geleden kwam een team uit Leuven met het leerwoordenboek Arabisch,
maar dat is veel bescheidener dan het onze. Prima om mee te beginnen, maar een
tweedejaars student of een vertaler grijpt al snel mis. Daarnaast heb je de
woordenboeken van Amien en Al Manhal. Het eerste is van een belabberde
kwaliteit, het tweede iets beter. Het zijn woordenlijsten zonder grammaticale
informatie en context. Er worden enorme bokken geschoten. Een dijkgraaf is bij
Amien een machine om dijken te maken, en kamermuziek vertaalt hij als een kamer
waarin wordt gemusiceerd. Al Manhal omschrijft poespas als een gestoofd gerecht.
Hoogste tijd voor iets beters."
Het Nijmeegse woordenboek bevat niet alleen veel meer trefwoorden dan dat uit
Leuven, ook de 'microstructuur' is rijker. Ieder trefwoord waarbij dat relevant
is gaat vergezeld van voorbeelden van contexten waarbinnen het wordt gebruikt,
van vaste combinaties van woorden (zoals 'misdrijf plegen') en van
uitdrukkingen. Ook bieden beide delen zowel in de brontaal als de doeltaal
grammaticale informatie. Hoogland: ''Ons woordenboek richt zich op Nederlanders
en Arabieren. Pak je bijvoorbeeld de Van Dale Engels-Nederlands, dan vindt een
Engelsman bij house wel 'huis', maar dat het het huis is, en het meervoud huizen
met een 'z', staat er niet bij. In ons Arabisch woordenboek geven we dat soort
informatie naar twee kanten."
Hoogland, groot kenner van het Marokkaans Arabisch, is al twaalf jaar met het
project bezig. Nadat hij in 1992 een haalbaarheidsstudie had uitgevoerd, kwam de
Taalunie in 1997 met 500.000 euro over de brug om het Arabisch woordenboek
daadwerkelijk te maken. Ook voorzag de Commissie Lexicografische
Vertaalvoorzieningen Nijmegen van twee essentiele hulpstukken: het
Referentiebestand Nederlands, 45.000 woorden groot, en het computerprogramma
OMBI, speciaal ontwikkeld voor tweetalige woordenboeken. Hoogland: ''Het
referentiebestand is al bijna een half woordenboek. De woorden zijn uitgesplitst
naar betekenissen en voorzien van contexten en idioom. We hebben het ingedikt
tot 37.000 ingangen door infrequente woorden en doorzichtige samenstellingen
eruit te mikken. De betekenissen zijn vervolgens voorzien van Arabische
vertalingen. In een kwart van de gevallen moesten we ons heil zoeken in
omschrijvingen: 'kinderboerderij', 'hutspot' of 'verjaardagskalender' kennen ze
niet in het Arabisch."
OVERSPEL
Andersom speelt dat ook. Zo kreeg een specifiek Arabisch woord als vertaling:
'het beschuldigen van een vrouw van overspel, waarbij men een vloek over zich
afroept als het niet waar is'. En het Arabische spreekwoord 'elke hond blaft
voor zijn eigen deur' kreeg het Nederlandse pendant 'voor eigen parochie
preken'.
Zijn de lexicale eenheden van het Nederlands en het Arabisch eenmaal aan elkaar
gekoppeld, dan keert OMBI de zaak 'met een druk op de knop' om, resulterend in
een proto-Arabisch-Nederlands woordenboek. Hoogland: ''Zonder die koppeling op
betekenisniveau lukt dat niet. Zo betekent het Arabische saat 'uur', 'klok' of
'horloge'. Op ingangsniveau de zaak omkeren leidt al snel tot onzin. Ook biedt
OMBI de mogelijkheid om bepaalde omkeringen uit te sluiten. Zo bevat het
Nederlandse referentiebestand ook schuttingtaal, waar Standaard Arabisch op een
enkele uitzondering na formeel is. In het Nederlands-Arabische deel is het geen
punt om 'hoer' met het Arabische woord voor 'prostituee' te vertalen, maar
andersom zou het te gek voor woorden zijn om van het Arabische 'prostituee' het
Nederlandse 'hoer' te maken. Plak je nu aan het Nederlandse 'hoer' in OMBI het
labeltje 'vulgair', dan weet het programma dat hij niet mag omkeren."
Bij het illustreren van betekenissen aan de hand van contexten, zegswijzen en
collocaties (vaste combinaties van woorden) waarbinnen ze gebruikt worden, is
gezocht naar levendige taal. Zo staan op pagina 526 van het deel
Nederlands-Arabisch: 'de kaartjes alstublieft', 'een broodje kaas', 'nieuwe
kabels trekken', 'een dreigende kabinetscrisis' en 'dat hebben de kaboutertjes
gedaan zeker'. Om Arabische contexten te kunnen opsporen, heeft Hoogland eerst
een groot corpus moeten aanleggen. ''Toen we in 1997 met het project begonnen
had het internet nauwelijks Arabische tekst te bieden. In heb scans gemaakt van
tijdschriftartikelen en van tientallen Arabische romans uit de Nijmeegse
bibliotheek, uitgezocht op lettertype en drukkwaliteit, en daar optical
character recognition op losgelaten. Dat viel niet mee, in het Arabisch schrift
zitten de letters aan elkaar vast. Eer het programma een bepaald lettertype had
leren herkennen, was je al snel een dag verder. Kranten vielen sowieso af. Wel
heb ik op cdrom een jaargang Al Hayat aangeschaft, een Arabische krant die in
Londen verschijnt - toen de enige met een digitaal archief. Aldus beschikte ik
aan het begin van het project over een corpus van acht miljoen woorden."
Zodra Hoogland een flink corpus aan Arabische tekst bij elkaar had geharkt,
laadde hij het in een concordantieprogramma. ''Dat zocht naar woorden - 's
nachts, computers waren nog niet zo snel - en bewaarde bijvoorbeeld zeventig
tekens voor en na de vindplaats. Waarna 'met de hand' bepaald werd of je iets
met die context kon. Of je liet het programma uitzoeken welk werkwoord er met
het Arabische woord voor 'misdrijf' combineerde. Inmiddels kun je in Google
Arabisch intikken. Omdat het Arabisch geen klinkers schrijft, krijg je veel
treffers die er naast zitten. Vergelijk de Nederlandse zin 'w zn d brn' - dan
kun je nog veel kanten op. Onlangs heb ik een testje gedaan met de combinatie
'menselijke anatomie'. In ons corpus kwam die niet voor, maar op het internet
had ik zo tien, twintig vindplaatsen te pakken. Dat had voor het woordenboek
uitgemaakt: 'menselijke anatomie' met de status 'voorbeeld' hoort wel in het
deel Arabisch-Nederlands. Het is de overigens eerste keer dat een Arabisch
woordenboek op zo'n empirische manier is gemaakt."
SPOOKWOORDEN
Het samenstellen van de laatste paar duizend Arabische ingangen bleek nog een
hele opgaaf. Hoogland: ''Aan woorden geen gebrek, maar je wilt geen obscure
termen of dingen die met historische zaken te maken hebben. Buitenlandse
woordenboekenmakers Arabisch hebben het gepresteerd spookwoorden te creeren in
gevallen dat een woord geen directe vertaling naar het Arabisch had. Die vind je
verder nergens. Teksten lezen hielp niet, in een artikel van 8000 woorden zaten
er drie die we nog niet hadden, dat schoot niet op. Het mooiste zou natuurlijk
zijn als je een frequentielijst had, zoals die voor het Engels en het Nederlands
bestaan, maar die lijst gaat in het Arabisch niet verder dan nummer 6000 of
zoiets. We zijn toen in specifieke domeinen gaan zoeken: de islam, de sport,
flora, fauna en geografische namen in de Arabische wereld. In het Nederlands gaf
dat veel omschrijvingen."
Met de digitale versie van zijn woordenboek gaat Hoogland uiterst omzichtig om:
de uitgever is als de dood voor piraten die een cdrom in handen krijgen.
Niettemin nodigt Hoogland op de website van het woordenboek gebruikers uit om
commentaren en aanvullingen te leveren, en wil hij een database aanleggen waarin
die overzichtelijk bijeen staan. De eerste reacties van buitenlandse arabisten
en woordenboekspecialisten laten zien dat de Nijmeegse aanpak in de smaak valt.
Hoogland, die tijdens de presentatie in Amsterdam een stropdas droeg met daarop
in het Arabisch 'het is volbracht', ziet tevreden terug op vele jaren
titanenarbeid. Lachend: ''De studie van het Arabisch in Nederland is niet meer
wat hij geweest is."
Woordenboek Nederlands-Arabisch en Woordenboek Arabisch-Nederlands. Uitgeverij
Bulaaq. ISBN 90 5460 0802. Prijs: 130 euro. Zie ook
www.let.kun.nl/wba
|