Hace algún tiempo, el hombre imaginaba que al comienzo
del nuevo milenio los coches volarían, y nos desplazaríamos como
Harrison Ford en Blade Runner, que se podría visitar Marte, y que
existirían máquinas que realizasen por nosotros los trabajos más
tediosos y difíciles. Pues bien, aquí estamos, y los coches no
vuelan, son pocos los elegidos que han salido de la órbita de la
tierra, y seguimos suspirando por C3PO, un androide como el que
tenía Luke Skywalker en La guerra de las galaxias, que podía hablar,
(y no sólo una lengua), y que traducía directamente de un idioma a
otro sin ningún problema.
|
C3PO, el traductor automático
ideal |
Teniendo en cuenta lo rápido que avanzan las nuevas
tecnologías, tendremos que esperar menos siglos que Ícaro para ver
nuestros sueños y deseos cumplidos. Sin ir más lejos, ni siquiera
Julio Verne con su portentosa imaginación habría soñado que muchas
de las predicciones que hizo en sus libros se viesen realizadas
apenas un siglo más tarde. ¿Cuánto nos tocará de esperar a nosotros?
Quizá no mucho.
El hombre busca el modo de hacerse la vida más fácil,
por lo que seguirá intentando desarrollar la tecnología que esté a
su alcance, para lograr una mejor calidad de vida. ¿A quién no le
gustaría tener una máquina que realizase los trabajos que nos
resultan más tediosos, difíciles y que requieren un determinado
esfuerzo, ya sea físico o mental?
1. ¿QUÉ ES LA
TRADUCCIÓN AUTOMÁTICA (TA)?
Se podría decir que se llama TA a los sistemas
informáticos que llevan a cabo traducciones de una lengua a otra con
o sin intervención humana. Se usa el ordenador para traducir de un
idioma a otro incorporando investigación en el entendimiento y
generación del lenguaje natural.
De este modo, la traducción automática desempeña la
misma función que un traductor humano, traduciendo textos o
documentos de una lengua a otra, o a más de una, pero sin la
intervención humana, simplemente con un programa informático.
En teoría, estos sistemas deben respetar tres puntos
básicos a la hora de traducir:
· decir todo lo que dice el original
· no decir
nada que el original no diga
· decirlo todo con la corrección y
naturalidad que permite la lengua a la que se traduce.
El término TA engloba la TA de alta calidad y la TA
con participación humana. La traducción automática de alta calidad
es la realizada por un ordenador, sin ningún tipo de presencia
humana, desde que el texto se introduce en él hasta que acaba de
realizarla. Por otro lado, en la traducción automática con
participación humana el programa es el que lleva a cabo la
traducción, pero el traductor interviene cuando es necesario. Esto
puede ocurrir a petición de la propia aplicación o simplemente
mediante la revisión de la traducción obtenida.
Se puede clasificar esta intervención humana en tres
etapas: interacción, preedición y postedición. Hay que señalar que
estas tres etapas no son excluyentes, es decir, que la utilización
de una no conlleva que no se apliquen las otras dos, sino que suelen
ser complementarias.
2. ¿CUÁNDO EMPEZÓ?
Desde el siglo XVII se han intentado desarrollar
diferentes métodos de traducción, evidentemente unos con más éxito
que otros: desde los más rudimentarios, como el propuesto por
Descartes basado en un código numérico, hasta los últimos que se han
elaborado a partir de la segunda mitad del siglo XX llevados a cabo
por ordenadores.
|
Warren Weaver, matemático y pionero de
la traducción automática |
Aunque la diferencia principal estriba en el uso de
computadoras, los problemas lingüísticos que hay que enfrentar son
realmente similares. Imagino que Descarte estaría muy satisfecho con
los resultados conseguidos dos siglos más tarde, pero nosotros que
vivimos en la era de la tecnología, no nos conformamos y aunque se
haya llegado más lejos de lo que él podría suponer, no lo es tanto
como lo que al principio de la TA se planteó.
Se empezó a trabajar en TA a finales de la década de
1950, con unas expectativas poco realistas, que llevaron a que las
fuentes de financiación fuesen retiradas al no conseguirse los
resultados inmediatos y tan espléndidos que se esperaban. En 1949,
Weaver, en lo que se conoce como "Memorandum Weaver" dio a conocer
públicamente la idea de TA sugiriendo varios métodos, entre
ellos:
· los análisis estadísticos
· la exploración de la
lógica subyacente
· las técnicas criptográficas del periodo de
guerras
· las características universales del lenguaje
A partir de aquí, se iniciaron proyectos de TA en
Estados Unidos y en 1951 se nombró al primer investigador de TA,
Yehoshua Bar-Hillel que se dedicó exclusivamente a esta
aplicación.
En la década de los 60, se trabajó en la TA a partir
de métodos empíricos de tanteo, a menudo con base estadística.
En la década de los 70, se pasó la euforia del primer
momento y los proyectos más importantes se realizan en países como
Canadá, y en la década de los 80 se proponen nuevas estrategias para
obtener mejores resultados. En la última década del siglo XX, se
continuó en la línea de la década anterior.
3. ¿SON IGUALES TODOS LOS
SISTEMAS DE TA?
Desde que la traducción automática se empezó a
desarrollar a finales de los años 50, se ha mejorado el diseño de
los programas que se han ido elaborando .
Podemos clasificar los
sistemas de TA atendiendo a diferentes criterios, como el número de
lenguas, la dirección en la que traducen o el enfoque.
Número de lenguas: se dividen en
sistemas bilingües y multilingües. Los sistemas bilingües están
están desarrollados para un único par de lenguas. Uno de los
sistemas bilingües más eficaces es Météo, creado por el grupo TAUM,
en Montreal, para traducir partes meteorológicos del francés al
inglés.
Otros sistemas, los multilingües, se desarrollaron
para traducir a diversos pares de lenguas. De una lengua de origen
traducen a más de una lengua meta, como es el caso de Systran. En
1964, Peter Toma empezó a desarrollarlo para el par ruso-inglés y
desde mediados de los años 70, se elaboraron versiones de Systran
para la traducción de lenguas comunitarias tras un acuerdo con la
UE.
Dirección de la traducción: si
traducen en una única dirección, son llamados unidireccionales, por
ejemplo, si sólo traducen del inglés al español. Son bidireccionales
los que traducen de una lengua a otra y viceversa, por ejemplo, del
inglés al español y del español al inglés.
Enfoque: desde el punto de vista del
diseño, hay tres enfoques diferentes de traducción automática,
generalmente emplazados en tres generaciones diferentes, lo que no
quiere decir que sean exclusivos de esa etapa y que ya no se hayan
vuelto a utilizar, sino que fue en esa etapa en donde se
desarrollaron. Son los sistemas directos, los sistemas de
transferencia y los sistemas interlingua.
 |
Página web de
Systran |
4.¿EN QUÉ CONSISTEN LOS
DIFERENTES ENFOQUES DE TA?
La diferencia fundamental entre los sistemas se basa
en el tipo de enfoque que adoptan. Según sea la relación que se
establece entre la lengua de origen y la lengua meta, por ejemplo,
una relación más o menos directa o con pasos intermedios, los
sistemas adoptan un determinado tipo de diseño, que permite que las
traducciones se desarrollen de una forma u otra y el resultado
obtenido varia. Los sistemas de primera generación son directos,
mientras que los de segunda y tercera generación no hacen un proceso
directo de una lengua a otra, sino que utilizan o bien una lengua
intermedia en el caso de los de segunda generación o
representaciones abstractas en el caso de los de tercera.
Los sistemas de primera generación se llaman sistemas
directos, los de la segunda, interlingua y los de la tercera son
sistemas de transferencia.
Los sistemas de traducción directa
consisten básicamente en grandes diccionarios. Dado que la
información sintáctica que utilizan es mínima, la traducción que
realizan es casi palabra por palabra, y por lo tanto, aunque son muy
rápidos y compatibles con ordenadores de sobremesa tipo PC/Windows,
la calidad de traducción que ofrecen es muy pobre.
Los sistemas de transferencia
contienen, además de grandes léxicos monolingües y
bilingües, un amplio conocimiento sintáctico-semántico de las
lenguas tratadas. Esto les permite realizar un análisis
morfosintáctico y obtener una estructura de constituyentes para cada
frase que se traduce. A partir de esta estructura y de la
información contenida en ella se efectúa la trasferencia léxica (es
decir, se traducen las palabras de una lengua a otra teniendo en
cuenta las condiciones del contexto morfológico, sintáctico y
semántico de la frase; por ejemplo, el verbo inglés “make” se
traduce en castellano por “cometer” cuando el complemento directo de
“cometer” es “error”, pero se traduce como “hacer” en otros
contextos. Al mismo tiempo se lleva a cabo la transferencia
estructural (los cambios en el orden de elementos y en la estructura
de la frase; por ejemplo la oración en inglés " He was given a new
opportunity" se transforma en castellano en “Se le dio una nueva
oportunidad”). Finalmente, existe una fase de generación en la cual
se obtiene la frase final traducida.
Los sistemas interlingua son un caso
particular de los sistemas de transferencia en los que se lleva a
cabo un análisis mucho más profundo de cada frase, obteniéndose una
representación formal “interlingual” del significado mismo de la
frase. A partir de esta representación del significado de la frase
de entrada se genera una frase en el idioma de salida. Aunque
teóricamente se trataría del mejor enfoque de los tres, en realidad
estos sistemas están en fase de laboratorio o se utilizan para
aplicaciones muy restringidas, debido a los problemas prácticos que
presenta el diseño y la implementación de una “interlingua”
eficaz.
Hay que tener en cuenta que no hay sistemas puros de
traducción directa, de transferencia o de interlingua sino sistemas
que se aproximan más a un enfoque determinado, pero que pueden tener
características de uno de los otros.
5. ¿ES RENTABLE LA TA?
Las expectativas que se tienen sobre los sistemas de
TA son confusas fuera de los círculos especializados. Hay que tener
en cuenta que estamos hablando de una tecnología muy desarrollada,
pero que trabaja con algo tan complejo como la lengua.
Evidentemente, a día de hoy, no se puede esperar que un programa
informático sea capaz de manejar el lenguaje humano como lo hacen
las personas. La carencia de conocimiento intuitivo del mundo real
supone un claro límite para esta tecnología.
Solamente podremos sacar provecho de los sistemas de
Ta si somos conscientes de que pueden ser muy útiles para
aplicaciones y en entornos determinados. Es inútil que intentemos
traducir una novela del inglés al castellano o al gallego con un
sistema de traducción automática: el resultado será desastroso. En
cambio, es muy probable que nos ahorremos tiempo y esfuerzo
empleando este tipo de sistemas si tenemos que traducir del
castellano al gallego un informe técnico o administrativo.
Se
puede hablar de TA de baja calidad, que es rentable desde el punto
de vista económico y temporal, aunque no sea una buena traducción, y
que es capaz de ofrecer bastante información para que alguien que
conozca el área específica pueda entender lo suficiente.
 |
Traducción de la primera estrofa de Johnny
B. Goode hecha por Babelfish |
6. ¿A QUÉ TIPO DE
PROBLEMAS SE ENFRENTA LA TA EN EL PROCESO DE TRADUCCIÓN?
Los más importantes no son de índole informática, sino
lingüística. Los problemas lingüísticos que competen a la TA se
basan en una teoría general, que se aplica a las lenguas
particulares a las que se traducen los textos.
La mayor dificultad reside en la ausencia de
conocimiento del mundo real que tienen los ordenadores y a
característica propias de las lenguas como la arbitrariedad o la
recursividad. Por ejemplo, ¿cómo conseguir que los ordenadores
puedan entender todas estas características y las apliquen de forma
adecuada? ¿Cómo resolver una anáfora? ¿ Cómo interpretar los actos
de habla?
También hay que tener en cuenta la complejidad de las
lenguas, y en los principios que rigen la lengua de origen, que no
tiene por qué ser compartidos por la lengua meta, y viceversa. Es
decir, no se puede aplicar los principios de la lingüística
universal a lenguas particulares, ya que los universales no siempre
se corresponden.
7. ¿QUÉ EXPECTATIVAS HAY?
Se sigue investigando para poder crear sistemas
rentables desde el punto de vista lingüístico y comercial. Como ya
se ha señalado, algunos sistemas resultan muy útiles cuando de trata
de parafrasear un texto para que lo entienda, por ejemplo, una
determinada comunidad. Es decir, si se trata de un lenguaje médico,
es posible que a un médico le resulte muy útil un sistema de TA que
esté disponible en el mercado, pues no necesita una traducción de
alta calidad. El camino que se está siguiendo va orientado a la
creación de sistemas de TA basados en sublenguajes, como pueden ser
el médico, el jurídico, el científico, etc. para poder limitar el
vocabulario y la sintaxis de estos textos y hacer más fácil su
traducción. Es el caso de Météo, que se instaló en 1976, y desde el
año siguiente ha estado produciendo partes diarios para el Servicio
meteorológico de Canadá. En la actualidad el programa traduce
alrededor de 37.000 palabras diarias con una precisión del 90%.
Sistemas como Météo permiten demostrar que la TA es rentable y útil
en algunos casos, pero no para todos los ámbitos de la
traducción.