¿Qué tan precisa es la corrección gramatical de la IA?

¿Será útil usar IA para corregir textos? ¿Qué tipo de errores ortográficos y gramaticales puede detectar y corregir la IA? ¿Qué tan precisa es la corrección de la IA?

Como otras tecnologías, los programas de corrección de errores gramaticales y ortográficos se desarrollaron de manera gradual. Sus orígenes se remontan a la década de 1960, cuando la comprobación ortográfica se limitaba a comparar la palabra mal escrita con una palabra correcta en una lista. Treinta años después, se implementaron técnicas estadísticas en los programas, expandiendo su capacidad para detectar errores, tales como la puntuación, las conjugaciones verbales y la concordancia entre sujeto-verbo. Fue en 2010 cuando se produjo un avance significativo, un progreso sin precedentes gracias a la gran cantidad de datos (bigdata). Usando los métodos basados en redes neuronales, estas aplicaciones aprendieron a reconocer patrones a partir de los datos para corregir errores. La implementación de la arquitectura transformer en 2018 representó su último hito, base tecnológica común a sistemas avanzados de IA como Gemini, ChatGPT y Claude.

Actualmente, los mejores programas gratuitos de corrección de texto en español son Languagetool y HIX.

¿Qué tecnologiá usan Languagetool y HIX?

Pensaba que Languagetool era más sofisticado, pero es igual a otras herramientas de corrección basadas en reglas. Por lo tanto, al basarse en patrones predefinidos, puede aceptar oraciones que son técnicamente correctas pero que no tienen ningún sentido.

Por otro lado, HIX usa el modelo de más de 175 mil millones de parámetros, ChatGPT, para corregir el texto. Ignoro el funcionamiento interno y la instrucción dada (el prompt), pero presenta ventajas y desventajas que veremos a continuación.

Puede probar estos correctores automáticos de forma gratuita:

Tal vez le interese saber qué otros correctores automáticos hay: Aplicaciones para corregir texto.

Tipos de errores

No hay una clasificación general para los errores gramaticales y ortográficos. La clasificación de Soni y Thakur servirá como marco de referencia para analizar el desempeño de estos programas. Según este esquema, hay cinco tipos principales de errores. Ordenados por complejidad creciente, los errores son los siguientes:

Tipos de errores gramaticales y ortográficos (Soni y Thakur 2018, citado en Devopedia, 2021)

1. Error ortográfico

Estos errores se relacionan con las palabras mal escritas. Es el error más fácil de detectar, pero puede traer ciertos inconvenientes con palabras poco usuales. Por ejemplo, el programa podría sugerir corregir "hético" por "ético".

  • La novela describe la vida de un personaje hético en un contexto histórico donde la tuberculosis era común.

Languagetool no da falsos positivos con este tipo de frases. Languagetool, además, tiene una opción llamada "añadir al diccionario" que amplía el diccionario del programa. En cambio, HIX alucina con esta frase y sustituye la palabra "hético" por "hétero", la cual no tiene nada que ver con el contexto.

La captura de pantalla muestra la página de HIX: a la izquierda está la caja donde ingreso el texto; a la derecha, la corrección hecha por HIX. Como tengo incoporado Languagetool en el navegador, la corrección de Languagetool aparecen en la caja izquierda. La imagen muestra el círculo azul con el aspa, indicando que no he cometido ningún error según Languagetool.

Si sustituimos "hético" por "ético", Languagetool y HIX no detectan el error semántico, error que veremos en el punto 5.

2. Errores de puntuación

Incluye la identificación precisa de errores en la puntuación: coma, punto y coma, punto, exclamación, signos de interrogación, etc. La mayoría de programas detecta este tipo de error usando reglas predefinidas. Sin embargo, algunas veces los programas pueden sugerir una coma fugitiva; por ejemplo: Pero ¿hay alguna razón...? En estas oraciones no se debe separar con una coma la parte interrogativa.

Languagetool, que es un programa basado en reglas, sugiere una coma en este tipo de oraciones. Por otro lado, HIX tampoco detecta el error.

  • checkPero ¿querrá venir con nosotros a pesar de lo que pasó?
  • cancelPero, ¿querrá venir con nosotros a pesar de lo que pasó?

3. Errores sintácticos

Estos errores se relacionan con la concordancia sujeto-verbo, artículos o preposiciones incorrectos o faltantes, errores en el tiempo verbal o en la forma del verbo, y otros similares. Por ejemplo, la frase mal escrita "Deberían haber pruebas", donde se debe usar el singular cuando se indica la existencia de algo. Error que LanguageTool y HIX detectaron.

  • checkDebería haber pruebas diferentes...
  • cancelDeberían haber pruebas diferentes...

Sin embargo, solo HIX detecta el uso correcto de la preposición del verbo disentir.

  • checkEl profesor Ibáñez disiente de la profesora Juana en temas políticos.
  • cancelEl profesor Ibáñez disiente con la profesora Juana de temas políticos.

4. Errores en la estructura oracional

Este tipo de error es complejo y requiere comprender las relaciones y dependencias dentro de la oración. Por ejemplo, la frase: Aunque estaba cansado. Se fue a trabajar. Esta frase tiene una subordinada que no está conectada correctamente a la oración principal (Aunque estaba cansado, se fue a trabajar).

Languagetool no detecta este tipo de errores, no comprende el lenguaje natural como ChatGPT.

  • checkAunque estaba cansado, se fue a trabajar.
  • cancelAunque estaba cansado. Se fue a trabajar.

5. Errores semánticos

Para corregir este tipo de error, los correctores automáticos deben lidiar con una oración aparentemente bien escrita, pero que no tiene sentido, a menudo, debido a una elección incorrecta de palabras o falta de puntuación. Por ejemplo, la frase "Prohibido fumar gas inflamable" está bien escrita aparentemente; sin embargo, parece referirse a la prohibición de fumar gas inflamable, en lugar de decir que está prohibido fumar en un área donde hay gas inflamable presente. Para corregir estos errores es necesario una comprensión profunda del contexto y el significado. Ejemplo:

  • checkLa novela describe la vida de un personaje hético en un contexto histórico donde la tuberculosis era común.
  • cancelLa novela describe la vida de un personaje ético en un contexto histórico donde la tuberculosis era común.

Resumen

Categoría Languagetool HIX
Error ortográfico BIEN BIEN
Errores de puntuación

Regular

Regular

Errores sintácticos Regular Regular
Errores en la estructura oracional

MAL

BIEN
Errores semánticos

MAL

MAL


Languagetool corrige las frases usando reglas rígidas, lo cual es útil para palabras mal escritas o cuando uno olvida los signos de puntuación; HIX, por otro lado, puede hacer las mismas correcciones, pero el problema son las alucinaciones (inventa respuestas o justifica los cambios). A un nivel básico los dos están bien, pero necesitan supervisión humana para garantizar un mejor resultado.

Next Post Previous Post
No Comment
Add Comment
comment url