Skip to main content

¿Por qué ChatGPT es malo en matemáticas?

Cualquier usuario asiduo de ChatGPT sabe que el modelo de lenguaje amplio de OpenAI es malo en matemáticas. Sí, claro que resolverá problemas simples como una resta, pero cuando le pides una operación relativamente básica como una multiplicación con cifras medianamente grandes, ChatGPT comienza a mostrar sus carencias. ¿Por qué ChatGPT es malo en matemáticas? Hay varias razones, pero también algunas soluciones que podrían resultar interesantes desde un punto de vista de desarrollo que vamos a tratar de explicar.

Es que las matemáticas no son lo suyo

ChatGPT buscador
Digital Trends Español

Hay varias razones que explican por qué ChatGPT es malo en matemáticas. Quizá la más importante es el tipo de material con el que ha sido entrenado: internet. Nos explicamos. ChatGPT es un modelo de lenguaje amplio (large language model o LLM por sus siglas en inglés) diseñado para generar conversaciones similares a las que tendrían dos humanos. Para lograr esta característica fue entrenado con técnicas de deep learning, es decir, ChatGPT “aprende” de patrones y estructuras de millones de textos disponibles en internet. Con esa “fuente de conocimiento” genera respuestas relevantes según el contexto en el que se le pregunta.

Recommended Videos

Sin embargo, uno de los principales problemas es la naturaleza misma de ChatGPT, y con esto nos referimos a que se trata de un modelo generativo basado en probabilidad, lo que a su vez genera cierta incertidumbre en sus respuestas. En este sentido y debido a que las matemáticas son una ciencia en la que se requiere exactitud, el margen de incertidumbre de ChatGPT lo vuelve una mala opción para resolver problemas matemáticos.

Ahora viene la parte más obvia: ChatGPT está diseñado para generar textos similares a los que escribiría un humano, por lo que es fantástico actividades como practicar tu inglés o traducir textos de una manera menos artificial a como lo harían traductores como Google Translate. Sin embargo, si se le pide resolver problemas matemáticos o lógicos, es posible que los resultados sean deficientes.

¿Cómo hacer que ChatGPT sea mejor en matemáticas?

Primero, ¿por qué no pruebas GPT-4? Y es que esta versión se ubicó en el top 11 de puntuaciones de la Prueba de Matemáticas SAT, de la que resolvió 700 de 800 problemas.

Igual, la habilidad de ChatGPT, aun en su versión GPT-4, tiene sus entredichos. Y es que según reporta Baeldung, GPT-4 resolvió 30 de los 150 problemas de la prueba AMC 10 (la American Mathematics Competion, dirigida a estudiantes de décimo grado, pero 60 de los 150 problemas de la prueba AMC 12, dirigida a estudiantes de preparatoria. Es decir, fue más apto para resolver problemas complejos que operaciones con un nivel de dificultad menor.

Solo no olvides que tendrás que pagar una cuota de al menos $2.5 dólares por 1 millón de tokens.

Otra opción es que instales un plugin a ChatGPT como Wolfram. Su desarrollador, Stephen Wolfram, destaca que el plugin funciona haciendo que la solicitud o prompt vaya a Wolfram|Alpha para ser analizada y posteriormente resuelta con mayor precisión.

En una nota en su blog personal, Wolfram destaca dos ejemplos. Uno preguntándole a ChatGPT la distancia entre Chicago y Tokio, desglosada en millas / kilómetros, así como el tiempo que tomaría llegar al destino volando en avión. Sobre su habilidad matemática, Wolfram también permite a ChatGPT resolver y graficar una integral, así que por qué no lo pruebas.

Allan Vélez
Allan Vélez es un periodista mexicano especializado en tecnología. Inició su carrera en 2013 en La Revista Oficial de…
Topics
Sam Altman critica a su ChatGPT: su personalidad es molesta y sus últimos modelos alucinan mucho
Sam Altman

El CEO de OpenAI, Sam Altman, admitió anoche que las últimas actualizaciones de GPT-4o han afectado a la personalidad del chatbot, y no en el buen sentido.

Si utilizas ChatGPT con la suficiente frecuencia, es posible que hayas notado un cambio en su comportamiento últimamente. Parte de esto puede deberse a su memoria, ya que en mi experiencia, el chatbot se dirige a ti de manera diferente cuando no se basa en chats anteriores para guiar la forma en que (potencialmente) querrías que respondiera. Sin embargo, parte de esto es solo que en algún momento del camino, OpenAI ha convertido a ChatGPT en el llamado "hombre del sí", una herramienta que está de acuerdo contigo en lugar de desafiarte y, a veces, el resultado puede ser un poco desagradable.

Leer más
Ranking de los mejores chatbots: Grok explota en crecimiento, pero ¿quién es el rey: ChatGPT, Gemini, DeepSeek?
Grok

La nueva carrera frenética en el mundo de la tecnología es la de los chatbots de IA, donde han habido cambios significativos en el ranking de los mejores (basados en cifras de usuarios), según  el directorio de herramientas de IA aitools.xyz.

El mercado experimentó cambios significativos en marzo de 2025. ChatGPT lideró con un aumento de 400 millones de visitas intermensuales, alcanzando los 5.600 millones de visitas. Grok experimentó el crecimiento más explosivo, añadiendo 105,4 millones de visitas para un aumento del 193,04%, superando a competidores como DeepSeek y Gemini.

Leer más
La investigación profunda de ChatGPT ahora será gratis y más ligera
ChatGPT

Hay mucho bombo publicitario sobre la IA flotando por ahí, y parece que todas las marcas quieren incluirlo en sus productos. Pero también hay algunas herramientas notablemente útiles, aunque son bastante caras. La investigación profunda de ChatGPT es una de esas características, y parece que OpenAI finalmente se siente un poco generoso al respecto.

La compañía ha creado una versión ligera de Deep Research que funciona con su nuevo modelo de lenguaje o4-mini. OpenAI dice que esta variante es "más rentable al tiempo que conserva la alta calidad". Más importante aún, está disponible para su uso de forma gratuita sin ninguna advertencia de suscripción.

Leer más
OSZAR »