Hoofdstuk 7. Bestandsfilters

1. dialoogvenster Bestandsfilters
2. Filteropties
3. dialoogvenster Filter bewerken
3.1. Type bronbestand, patroon voor bestandsnaam
3.2. Coderen van bron- en doelbestanden
3.3. Doelbestandsnaam

OmegaT omvat zeer aanpasbare filters die u in staat stellen verschillende aspecten in te stellen. Bestandsfilters zijn gedeelten van code die in staat zijn om:

De meeste gebruikers zullen tevreden zijn met de standaard ingestelde opties. Als u dat niet bent opent u het hoofd dialoogvenster door in het hoofdmenu Opties → Bestandsfilters... te selecteren. U kunt ook project-specifieke bestandsfilters inschakelen, die alleen zullen worden gebruikt voor het huidige project, door de optie Bestandsfilters... in Project → Eigenschappen te selecteren.

Waarschuwing! Als u de segmentatie-opties wijzigt als een project geopend is moet u het project herladen vóórdat de wijzigingen effect hebben.

1. dialoogvenster Bestandsfilters

Dit dialoogvenster toont de beschikbare bestandsfilters. Als u OmegaT niet wilt gebruiken om bestanden van een bepaald type te vertalen, kunt u het betreffende filter uitschakelen door het keuzevak naast de naam niet te selecteren. OmegaT zal dan de betreffende bestanden weglaten bij het laden van projecten en zal ze ongewijzigd kopiëren bij het maken van de doeldocumenten. Als u het filter opnieuw wilt gebruiken, selecteer dan het keuzevak. Klik op Standaardinstellingen om de bestandsfilters terug te zetten naar de standaard instellingen. Selecteer het filter uit de lijst en klik op Bewerken om aan te geven welke bestanden in welke coderingen het filter moet verwerken.

2. Filteropties

Vijf filters (Tekstbestanden, XHTML-bestanden, HTML- en XHTML-bestanden, OpenDocument/OpenOffice.org-bestanden en Microsoft Open XML-bestanden) hebben één of meer specifieke opties. Selecteer, om de opties aan te passen, het filter uit de lijst en klik op Opties. De beschikbare opties zijn:

Tekstbestanden

  • Alineasegmentatie bij regeleinden, lege regels of nooit: als regels voor zinsegmentatie actief zijn, zal de tekst verder gesegmenteerd worden op grond van de hier geselecteerde optie.

PO-bestanden

  • Sta blanco vertalingen in het bronbestand toe: Indien ingeschakeld zal, wanneer een PO-segment (wat een gehele alinea kan zijn) niet is vertaald, de vertaling leeg zijn in het doelbestand. Technisch gezien zal msgstr leeg zijn. Het staat standaard aan, omdat dit het standaard gedrag is voor PO-bestanden. Indien de optie is uitgeschakeld, zal de brontekst worden gekopieerd naar het doelsegment.

XHTML-bestanden

  • Vertaal de volgende attributen: De geselecteerde attributen zullen als segmenten in het venster Bewerken verschijnen.

  • Start een nieuwe alinea bij: De <br> HTML-tag zal een alinea voor segmentatiedoeleinden maken.

  • Tekst die overeenkomt met reguliere uitdrukking overslaan: De tekst die overeenkomt met de reguliere uitdrukking zal worden overgeslagen.

  • Vertaal het attribuut 'content' van metatags niet: ... : de 'sleutel-waarden'-paren van het attribuut, gescheiden door komma's, zullen niet vertaald worden

Microsoft Office Open XML-bestanden

U kunt selecteren welke elementen vertaald moeten worden. Zij zullen als afzonderlijke segmenten in de vertaling verschijnen.

  • Word: Niet-zichtbare tekst met instructies, Notities, Voetnoten, Eindnoten, Voetteksten

  • Excel: Notities, Werkbladnamen

  • Powerpoint: Dianotities, Diamodellen, Dia-lay-outs

  • Globaal: Diagrammen, Tekeningen, Wordart

  • Andere opties:

    • Hoeveelheid tags: Indien geselecteerd zullen tags, zonder vertaalbare tekst er tussen, worden samengevoegd tot enkele tags.

    • Spaties voor alle tags behouden: Indien geselecteerd zal "witruimte" (d.i. spaties en newlines) worden behouden, zelfs als dat niet technisch is ingesteld in het document.

HTML- en XHTML-bestanden

  • Codering-declaratie aan HTML- en XHTML-bestanden toevoegen of herschrijven

    Altijd (standaard), Alleen als (X)HTML-bestand een kop heeft, Alleen als (X)HTML-bestand een codering-declaratie heeft, Nooit

  • Vertaal de volgende attributen: De geselecteerde attributen zullen als segmenten in het venster Bewerken verschijnen.

  • Start een nieuwe alinea bij: De <br> HTML-tag zal een alinea voor segmentatiedoeleinden maken.

  • Tekst die overeenkomt met reguliere uitdrukking overslaan: De tekst die overeenkomt met de reguliere uitdrukking zal worden overgeslagen.

  • Vertaal het attribuut 'content' van metatags niet: ... : de 'sleutel-waarden'-paren van het attribuut, gescheiden door komma's, zullen niet vertaald worden

Tekstbestanden

  • Alineasegmentatie bij regeleinden, lege regels of nooit: als regels voor zinsegmentatie actief zijn, zal de tekst verder gesegmenteerd worden op grond van de hier geselecteerde optie.

OpenDocument/OpenOffice.org bestanden

  • U kunt selecteren welke van de volgende elementen vertaald moeten worden.

    Indexitems, Bladwijzers, Verwijzingen naar bladwijzers, Notities, Opmerkingen, Notities in presentaties, Koppelingen (URL), Werkbladnamen

3. dialoogvenster Filter bewerken

Het dialoogvenster stelt u in staat om de patronen van de bronbestandsnaam te bewerken van de bestanden die het filter zal verwerken, de bestandsnamen van vertaalde bestanden aan te passen en te selecteren welke coderingen het zal gebruiken bij het laden van het bestand en zijn vertaalde tegenhanger. Pas de velden direct aan of klik op Bewerken om een patroon voor het bestandsfilter aan te passen. Klik op Toevoegen om een nieuw patroon voor een bestandsfilter toe te voegen. Hetzelfde dialoogvenster wordt gebruikt om een patroon toe te voegen of een bepaald patroon te bewerken. Het dialoogvenster is handig omdat het een speciale bewerker voor het patroon van de doelbestandsnaam heeft waarmee u de namen van de te maken bestanden aan kunt passen.

3.1. Type bronbestand, patroon voor bestandsnaam

Als OmegaT een bestand tegenkomt in zijn bronmap, probeert dat het filter te selecteren gebaseerd op de extensie van het bestand. Meer precies: OmegaT probeert of van elk filter het patroon van de bestandsnaam overeenkomt met de bestandsnaam. Het *.xhtml-patroon zal bijvoorbeeld overeenkomen met elk bestand met de extensie .xhtml. Als het juiste filter is gevonden wordt dat voor verdere verwerking toegepast op het betreffende bestand. Standaard zal bijvoorbeeld het XHTML-filter worden gebruikt bij het verwerken van bestanden met de extensie .xhtml. U kunt bestandsnaam-patronen toevoegen of wijzigen voor bestanden die door elk filter worden afgehandeld. Patronen voor bronbestandsnamen gebruiken jokertekens die overeenkomen met die in Zoeken. Het teken '*' komt overeen met nul of meer tekens. Het teken '?' komt overeen met exact één teken. Alle andere tekens vertegenwoordigen zichzelf. Als u bijvoorbeeld wilt dat het tekstfilter readme-bestanden (readme, read.me en readme.txt) afhandelt, zou u het patroon read* moeten gebruiken.

3.2. Coderen van bron- en doelbestanden

Slechts een beperkt aantal bestandsformaten specificeren een voorgeschreven codering. Bestandsformaten die hun codering niet specificeren zullen de codering gebruiken die u instelt voor de extensie die overeenkomt met hun naam. Standaard zullen bijvoorbeeld .txt-bestanden worden geladen met behulp van de standaard codering van uw besturingssysteem. U kunt de broncodering voor elk verschillend bronbestandsnaam-patroon wijzigen. Zulke bestanden kunnen ook in elke codering worden weggeschreven. Als standaard heeft het vertaalde bestand dezelfde codering als de codering van het bronbestand. Velden voor bron- en doelcodering gebruiken combinatievakken waarin alle ondersteunde coderingen zijn opgenomen. <auto> laat de keuze van de codering aan OmegaT over. Zo werkt het:

  • OmegaT identificeert de codering van het bronbestand door de declaratie van de codering te gebruiken, indien aanwezig (HTML-bestanden, op XML gebaseerde bestanden).

  • OmegaT is geïnstrueerd om een voorgeschreven codering te gebruiken voor bepaalde bestandsformaten ( Java-properties etc)

  • OmegaT gebruikt de standaard codering van het besturingssysteem voor tekstbestanden.

3.3. Doelbestandsnaam

Soms wilt u misschien de bestanden die u vertaalde automatisch hernoemen, bijvoorbeeld door een taalcode achter de bestandsnaam te zetten. Doelbestandsnaam-patronen gebruiken een speciale syntaxis, dus als u dit veld zou willen bewerken, moet u op Bewerken... klikken en het dialoogvenster Patroon bewerken gebruiken. Klik op Standaardinstellingen als u terug wilt keren naar de standaard configuratie van het filter. U kunt de naam ook direct aanpassen in het veld voor het patroon van het doelbestand of het dialoogvenster Bestandsfilters. Het dialoogvenster Patroon bewerken biedt de volgende opties:

  • Standaard is ${filename} - volledige bestandsnaam van het bronbestand met extensie: in dit geval is de naam van het vertaalde bestand hetzelfde als dat van het bronbestand.

  • ${nameOnly} - laat u alleen de naam van het bronbestand invoegen zonder de extensie.

  • ${targetLocale} - locale-code voor doel (in de vorm "xx_YY").

  • ${targetLanguage} - de doeltaal en landcode samen (in de vorm "XX-YY").

  • ${targetLanguageCode} - alleen de doeltaal ("XX").

  • ${targetCoutryCode} - alleen de doel-landcode ("YY").