Logiciels > myCAT > Documentation


Installation de myCAT

  • myCAT pour Windows
    La procédure permettant d'effectuer une installation classique de myCAT sur un serveur dédié équipé de Windows est décrite ici (en anglais).
  • myCAT pour GNU/Linux
    La procédure permettant d'effectuer une installation classique de myCAT sur un serveur dédié équipé de Ubuntu 12.04 LTS est décrite ici (en anglais).

 



Ajouter des Cartes d'alignement

La version de base de myCAT est livrée avec les cartes d'alignement suivantes:

  • anglais-arabe
  • anglais-espagnol
  • anglais-français
  • anglais-portugais
  • anglais-russe

Il est possible d'ajouter les paires de langues suivantes :

Il suffit de télécharger ces fichiers et de les décompresser dans le dossier C:\MYCAT\map (pour la version Windows). Ensuite il faut ajouter à votre corpus quelques paires de documents contenant la nouvelle langue et d'exécuter le fichier C:\MYCAT\run\UPDATE and RESTART.bat (pour la version Windows).

Les autres langues sont également acceptées par myCAT (voir le manuel d'installation (en anglais) en haut de cette page) mais elles seront alignées selon un algorithme géométrique simple.
 



Règles de nommage des documents

Le corpus de documents bi-textes qui sera exploité par myCAT doit être conforme aux spécifications suivantes (en anglais).

Cette distribution de myCAT contient un très petit corpus de 48 documents qui permet de tester l'application dans les six langues suivantes: anglais, français, espagnol, russe, arabe et chinois. Ces documents sont organisés en trois collections: ONU (UNO), OMPI (WIPO) et OMC (WTO). Ce sont tous des documents publics qui ont été téléchargés depuis le site respectif de ces organisations.
 



Spécifications du serveur

Le serveur qui hébergera myCAT doit répondre aux spécifications suivantes (en anglais).

myCAT doit être déployé sur un serveur dédié, qui peut être soit une machine physique ou une machine virtuelle. Veuillez noter que ce serveur doit être en 64 bits.
 

CPU:

One CPU (Quadricore), 64-bit

RAM:

6 to 8 Gb

Espace disque:

Tout dépends de la taille de votre corpus. myCAT a besoin d'environs 10 Gb pour toutes les applications (voir ci-dessous) mais un espace libre additionnel sur le dique doit être supérieur ou égal à quatre fois la taille de votre corpus. En effet, nous effectuons une conversion au format TXT de tout le corpus (1/10 de la taille initiale du corpus) et nus construisons des cartes d'alignement pour chaque paire de document (ceci occupe environs quatre fois la taille de corpus). Par exemple, si la taille inttiale de votre corpus est50 Gb, il faut prévoir un espace disque comme suit:

  • Applications: 10 Gb
  • Corpus: 50 Gb
  • Conversion de corpus et construction de cartes: 200 Gb
    TOTAL: 260 Gb

Ainsi, il est recommandé de prévoir un espace dique additionnel puisque le corpus évolue au fil de temps, donc il faut prévoir approximativement de 25% à 50% d'espace supplémentaire (tout dépends de la vitesse d'évolution de votre corpus).

Système d'exploitation:
  • Windows Server 2008 ou Windows 7, version 64-bit
  • ou GNU/Linux Ubuntu 12.04 LTS, version 64-bit
Applications:

Les applications à installer sont les suivantes:

  • Java JRE 6 or 7
  • Apache Tomcat 6.0 (pour publier l'application en ligne)
  • OpenOffice 3 (pour les conversions)
  • myCAT (Classes java distribuées dans un fichier .war dans la Tomcat)

myCAT est disponible aussi bien pour Windows (testé sur Windows 7 et Windows 2008 Server) que pour GNU/Linux (testé sur Ubuntu 12.04 LTS)

Les logiciels appartenant à Olanto sont distribués sous la licence GNU Affero General Public License Version 3, ou AGPL V3.

Suite TAO Olanto

Disponible pour Windows et GNU/Linux