Suchen und Ersetzen in Word

Die Suchen-und-Ersetzen-Funktion von Word ist für TextarbeiterInnen ein äußerst vielseitiges Werkzeug, dessen Möglichkeiten über das reine Suchen und Ersetzen von Wörtern weit hinausgehen – die versierte Benutzerin kann auch Textformatierungen suchen und ersetzen oder Platzhalterzeichen nutzen, um Ausdrücke gezielt zu ändern oder zu löschen. Das kann nützlich sein, wenn man in einem Word-Dokument Hervorhebungen suchen oder HTML-Tags löschen möchte.

Die Vielseitigkeit der Suchen-und-Ersetzen-Funktion

Anhand von vier Praxisbeispielen soll im Folgenden die Mächtigkeit der Suchen-und-Ersetzen-Funktion illustriert werden.

Formatierten Text suchen

Ein Beispiel: Ein Kunde schickt mir einen überarbeiteten Ausgangstext, in dem er die Änderungen nicht mit der word-eigenen Nachverfolgungsfunktion, sondern mit der Hervorhebungsfunktion kenntlich gemacht hat. Wie finde ich hier zuverlässig und schnell alle Änderungen im Text (ohne einen umständlichen Textvergleich anzustellen)?

Mit der Suchfunktion von Word kann ich nicht nur nach Wörtern, sondern auch nach Formatierungen suchen. Für die entsprechende Sucheinstellung muss ich die Suchfunktion gegebenenfalls „erweitern“:

Über die Schaltfläche „Format“ kann ich „Hervorheben“ wählen. Das Feld „Suchen nach:“ muss ich dagegen auf jeden Fall leer lassen:

Mit der Schaltfläche „Weitersuchen“ kann ich nun im Text von einer Hervorhebung zur nächsten springen.

Formatierungen nachträglich ändern

Ein Beispiel: Ich bekomme einen Übersetzungstext einer Kollegin im bilingualen Workbench-Format als Word-Dokument zum Korrekturlesen. Da die Ausgangssegmente dieselbe Farbe wie die Zielsegmente haben und ich das unübersichtlich finde, möchte ich die Schriftfarbe des Ausgangstextes ändern (sozusagen in grau „abblenden“). Wie kann ich Formatierungen mit der Suchen-und-Ersetzen-Funktion in Word ändern?

Die Ersetzen-Funktion von Word kann auch auf Formatierungen angewandt werden. In unserem Beispiel suche ich nach Text, der ausgeblendet und nicht tiefgestellt ist und eine „automatische“ Schriftfarbenzuweisung hat. Textteile mit dieser Zeichenformatierung sollen mit der Schriftfarbe „50% grau“ (von Word als „Hintergrund 1“ bezeichnet) neu formatiert werden:

Wenn ich hier alle Vorkommen im Dokument ersetzen lasse, erhalte ich folgendes Ergebnis:

PS: Formatierter Text kann natürlich auch gelöscht werden. Dazu muss ich lediglich das Feld „Ersetzen durch:“ unformatiert leer lassen – eine eventuell vorhandene Formatierung lässt sich mit der Schaltfläche „Keine Formatierung“ löschen:

Textelemente regelbasiert löschen

Ein Beispiel: Ein Kunde schickt mir einen Text und bittet mich um ein Angebot für die Übersetzung. Der Text steht vorläufig nur als Auszug eines HTML-Dokuments zur Verfügung, den der Kunde in ein Word-Dokument kopiert hat. Wie kann ich möglichst schnell alle HTML-Tags aus dem Text entfernen, um die Wörter und Zeichen- bzw. Zeilenzahl realistisch einschätzen zu können?

Ein mit HTML-Tags durchsetzter Text sieht beispielsweise so aus:

<h3>Datenaufbereitung</h3>

Vor dem Alignment wurden die Dokumente aufbereitet. Dabei wurden beispielsweise überflüssige Leerschritte und Abschnittswechsel gelöscht. Durch diese und weitere Korrekturen wurden die dem Alignment unterzogenen Dokumente verändert, so dass der Inhalt des DGT-TM nicht mehr unbedingt mit den Originaldokumenten übereinstimmt.<br>

Das <u>Alignment</u> erfolgte nach den Segmentierungsregeln der Generaldirektion Übersetzung der Europäischen Kommission. Als Zusatzinformation der einzelnen TUs wurde bei der Extraktion nur die EUR-Lex-Dokumentennummer beibehalten, aus der sich weitere Informationen wie z.B. Jahr und Dokumenttyp ablesen lassen (Näheres unter „<a href=“#dokumentennummern“>Die Dokumentennummern der EUR-Lex-Datenbank</a>“).Die beiden Textkorpora sind einander recht ähnlich, da beide auf dem <b>Acquis communautaire</b> basieren, sie sind jedoch nicht identisch. Ausführliche Informationen enthält die Veröffentlichung <a href=“http://langtech.jrc.it/Documents/2012_LREC_DGT-TM_Final.pdf“ target=“_blank“>DGT-TM: A freely Available Translation Memory in 22 Languages</a>.

In diesem Text sollen also alle HTML-Tags, d.h. alle Ausdrücke in spitzen Klammern, gelöscht werden (das Dokument enthält keine sonstigen „echten“ Textelemente in spitzen Klammern). Für diese Aufgabe benötigen wir den „Mustervergleich“ von Word, der über „Platzhalter verwenden“ aktiviert wird:

In das Feld „Suchen nach:“ muss ich hier die öffnende und die schließende spitze Klammer eingeben („<“ und „>“). Da diese Zeichen aber von Word als Platzhalterzeichen für „Wortanfang“ und „Wortende“ interpretiert würden, muss ich jeweils einen umgekehrten Schrägstrich („\“) voranstellen, um diese Platzhalterfunktion zu deaktivieren. Zwischen dem öffnenden und dem schließenden Spitze-Klammer-Zeichen können beliebige Zeichen (in beliebiger Anzahl) stehen – hierfür reicht die Angabe eines einzigen Platzhalters, nämlich des Sternchens („*“).Die gesamte Zeichenfolge, nach der gesucht werden soll, lautet also \<*\>. Wenn das „Ersetzen durch:“-Feld leer bleibt, kann ich nun alle HTML-Tags mit einem Klick auf die Schaltfläche „Alle ersetzen“ entfernen.

Text regelbasiert ersetzen

Ein Beispiel: Beim Korrekturlesen eines Textes fällt mir auf, dass offensichtlich nicht alle Motorleistungsangaben (in kW) durch ein geschütztes Leerzeichen mit dem vorangestellten Zahlenwert verbunden sind (z.B. 47 kW) – oft wird nur ein normales Leerzeichen verwendet. Wie kann ich alle diese Zahlen-kW-Kombinationen mit einem geschützten Leerzeichen versehen? (Warum mich das Fehlen von geschützten Leerzeichen stört, steht in einem gesonderten Blog-Artikel.)

Auch in diesem Fall benötigen wir wieder die Mustervergleichsfunktion von Word. Diesmal suche ich nach einem Leerzeichen, gefolgt von „kW“, also nach „ kW“. Da aber im Dokument auch Ausdrücke wie „Angaben in kW“ vorkommen, bei denen der Leerschritt vor „kW“ nicht geschützt werden soll, muss ich die Suchregel noch genauer spezifizieren: ich suche nur nach „ kW“, wenn es nach einer Zahl auftritt. In allen diesen Instanzen möchte ich dann das normale Leerzeichen durch ein geschütztes ersetzen. Die entsprechende Suchen-und-Ersetzen-Funktion sieht so aus:

Im Feld „Suchen nach:“ gebe ich an, dass ich nach einer Ziffer, also einem Zeichen von 0 bis 9 suchen möchte: [0-9]. Beim Ersetzen werde ich die gefundene Ziffer wieder benötigen, denn ich will sie ja nicht löschen, sondern möchte sie unverändert wieder einsetzen. Deshalb setze ich „[0-9]“ in runde Klammern: ([0-9]). Der gesamte Suchausdruck lautet somit „([0-9]) kW“.

Im Feld „Ersetzen durch:“ gebe ich zunächst an, dass der erste Suchausdruck (also die gefundene Ziffer) wiederverwendet werden soll: \1. Darauf folgt ein geschütztes Leerzeichen (^s) und danach kW.

Weitere Informationen zum Mustervergleich

Die aufgeführten Beispiele sollen andeuten, welche Möglichkeiten die Suchen-und-Ersetzen-Funktion von Word – vor allem mit dem eingebauten Mustervergleich – bietet. Eine sehr lesenswerte Einführung bietet der Artikel Regelgerechtes Ersetzen in Ausgabe 3/2012 der Fachzeitschrift „technische kommunikation“ (www.tekom.de), auf die ich durch einen uepo-Artikel aufmerksam wurde.
Eine Anregung zu diesem Artikel verdanke ich auch Pablo Muñoz Sánchez und seinem Video Cómo eliminar etiquetas en Word (in seinem Blog Algo más que traducir).
Und als „Nachschlagewerk“ steht natürlich stets die Word-Hilfe bereit.

Nachtrag vom 25.05.2012:

Ein weiteres Beispiel für die Mustervergleichssuche in Word enthält der Artikel Widerborstige Anführungszeichen in Word.

Hinterlassen Sie einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.