Logiciels > myPREP


myPREP est un aligneur de textes, c’est-à-dire un outil qui permet d’aligner automatique deux à deux les documents dans un corpus multilingue. Le résultat de l’alignement est une mémoire de traduction au format TMX. L’alignement se fait au niveau phrase.

myPREP permet aussi la production de corpus d’entraînement pour la traduction statistique (format Moses). Ces corpus sont divisés en plusieurs parties permettant l’entraînement, le réglage et l’évaluation.

myPREP permet aussi l’alignement de corpus comparables. Le résultat de l’alignement est un ensemble de pair de phrases associés à un score, le nombre de termes alignés, la longueur des phrases. Ces paramètres permettent de filtrer les alignements.

myPREP nécessite des corpus de documents segmentés au format texte UTF-8. Le convertisseur et le segmenteur de myCAT sont inclus dans l’installation de myPREP.

myPREP peut être installé aussi bien sous Windows que sous GNU/Linux (testé sous Ubuntu 12.04 LTS); les liens correspondants sont proposés ci-dessous. Quant aux sources, elles sont identiques pour les deux versions.

 

myPREP est disponible aussi bien pour Windows (testé sur Windows 7 et Windows 2008 Server) que pour GNU/Linux (testé sur Ubuntu 12.04 LTS)

Les logiciels appartenant à Olanto sont distribués sous la licence GNU Affero General Public License Version 3, ou AGPL V3.

Suite TAO Olanto

Disponible pour Windows et GNU/Linux