Tag wipe - Example

The example below shows the process of removing tags with level 2. TagWipe does the following transformations in the text:

  • replaces non breaking Hyphen with normal "-"
  • replaces Soft Hyphen with nothing
  • transforms the text attribute CAPS to capitals
  • moves footnote references before the punctuation marks “.!;?
  • removes brackets in footnote references

Paragraph (segment) sample and its representation in Winword

When the original document (without being tagwiped) is opened in the CAT tools below, it shows:

  • OmegaT: 55 tags
  • Studio: 39 tags

After tagwiping it with level 2, it shows 0 tags in both CAT tools with no visual differences in the original or the translation when opened in Winword.

Segment as text

Peuvent bénéficier des aides les petites et moyennes entreprises, individuelles ou associées, produisant des abeilles, ainsi que les apiculteurs professionnels dont la rentabilité peut être démontrée par une évaluation des perspectives et qui possèdent les qualifications et compétences professionnelles suffisantes au moment de la demande, c'est-à-dire minimum deux ans d'expérience en tant que propriétaire, co-propriétaire ou auxiliaire de la société apicole, tel que précisé dans la base juridique.

Segment as a snapshot image of what it looks like in Winword

Segment as a snapshot image of how this text is displayed in OmegaT

Segment in XML (docx format) before cleaning with TagWipe

<w:p w:rsidR="00061BCC" w:rsidRDefault="0008680D" w:rsidP="0008680D"><w:pPr><w:pStyle w:val="ListNumber"/><w:spacing w:before="0" w:after="240"/><w:rPr><w:rStyle w:val="hps"/><w:lang w:bidi="th-TH"/></w:rPr></w:pPr>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:lang w:bidi="th-TH"/></w:rPr><w:t xml:space="preserve">Peuvent bénéficier des aides les </w:t></w:r>

          <w:r w:rsidR="00884B29"><w:rPr><w:lang w:bidi="th-TH"/></w:rPr><w:t>petites et moyennes entreprises</w:t></w:r>

          <w:r w:rsidR="003119D8"><w:rPr><w:lang w:bidi="th-TH"/></w:rPr><w:t xml:space="preserve">, </w:t></w:r>

          <w:r w:rsidR="003119D8" w:rsidRPr="00061BCC"><w:t>individuel</w:t></w:r>

          <w:r w:rsidR="003119D8"><w:t>l</w:t></w:r>

          <w:r w:rsidR="003119D8" w:rsidRPr="00061BCC"><w:t>es ou associé</w:t></w:r>

          <w:r w:rsidR="003119D8"><w:t>e</w:t></w:r>

          <w:r w:rsidR="003119D8" w:rsidRPr="00061BCC"><w:t>s</w:t></w:r>

          <w:r w:rsidR="003119D8"><w:t>,</w:t></w:r>

          <w:r w:rsidR="003119D8" w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>produisant des</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>abeilles</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve">, </w:t></w:r>

          <w:r w:rsidR="003119D8"><w:t>ainsi que</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"> les apiculteurs </w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>professionnels</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>dont la rentabilité</w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>peut être</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>démontré</w:t></w:r>

          <w:r w:rsidR="003119D8"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>e</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>par une évaluation</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>des perspectives</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>et</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>qui</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>possèdent les qualifications</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>et</w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>compétences professionnelles</w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t xml:space="preserve">suffisantes au moment </w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t xml:space="preserve">de la </w:t></w:r>

          <w:r w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>demande</w:t></w:r>

          <w:r w:rsidR="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t xml:space="preserve">, c'est-à-dire </w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:t>m</w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>inimum</w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>deux ans d'expérience</w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:t xml:space="preserve"></w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>en tant que propriétaire</w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:t xml:space="preserve">, </w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>co-</w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:t xml:space="preserve">propriétaire </w:t></w:r>

          <w:r w:rsidR="00061BCC"><w:t xml:space="preserve">ou </w:t></w:r>

          <w:r w:rsidR="003119D8"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t xml:space="preserve">auxiliaire </w:t></w:r>

          <w:r w:rsidR="00061BCC" w:rsidRPr="00061BCC"><w:t xml:space="preserve">de la société </w:t></w:r>

          <w:r w:rsidR="003119D8"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t>apicole</w:t></w:r>

          <w:r w:rsidR="00061BCC"><w:rPr><w:rStyle w:val="hps"/></w:rPr><w:t xml:space="preserve">, tel que précisé dans la base juridique. </w:t></w:r>

</w:p>

Segment after cleaning with TagWipe (level=2)

Segment as a snapshot image of what it looks like in Winword

Segment as a snapshot image of how this text is displayed in OmegaT

Segment in XML (docx format) before cleaning with TagWipe

<w:p><w:pPr><w:pStyle w:val="ListNumber"/><w:spacing w:before="0" w:after="240"/></w:pPr>

<w:r><w:t xml:space="preserve">Peuvent bénéficier des aides les petites et moyennes entreprises, individuelles ou associées, produisant des abeilles, ainsi que les apiculteurs professionnels dont la rentabilité peut être démontrée par une évaluation des perspectives et qui possèdent les qualifications et compétences professionnelles suffisantes au moment de la demande, c'est-à-dire minimum deux ans d'expérience en tant que propriétaire, co-propriétaire ou auxiliaire de la société apicole, tel que précisé dans la base juridique. </w:t></w:r>

</w:p>

Every line beginning with <w:r> represent a Tag inside a CAT, (number of tags = count od “” -1). .

Add new comment