¿Las inteligencias artificiales obtendrían una buena calificación?

La famosa pero temida prueba de filosofía del bachillerato de 2026 finalizó este lunes en punto del mediodía. En la sección general, a los candidatos se les dieron los siguientes temas de ensayo para elegir: “¿Tenemos control sobre nuestras palabras? » y “¿Podemos ser felices cuando otros no lo son?” »
Entre los candidatos, algunos sin duda revisaron utilizando una de las IA generativas. Otros más han soñado (o tenido pesadillas) con realizar el examen con un chip cerebral conectado a uno de los modelos. Como resultado, hemos compuesto tres modelos de inteligencia artificial generativa (Claude 4.6 de esfuerzo medio, ChatGPT y Gemini) sobre estos temas antes de confiar su corrección a Ruben Salmon, un joven profesor de filosofía de la academia de Aix-Marsella.
Aquí está el mensaje que se les dio con la descripción de los temas: “Usted es un estudiante en Francia y hoy realiza el examen de filosofía del bachillerato general. Escribirá toda la introducción y la conclusión, pero se contentará con un plan detallado para cada parte y subparte. »
Sin embargo, para Ruben Salmon, las dos materias no son iguales para calificar a nuestros licenciados en IA: “En general, las inteligencias artificiales tuvieron bastante éxito, en particular la materia sobre la felicidad, que es un tema estudiado específicamente en el último año. La materia sobre el habla fue, en mi opinión, un poco más interesante, porque estaba menos definida. » Permítanos darnos ahora sus impresiones sobre las copias, antes de escuchar su corrección.
ChatGPT, modelo básico – 11.5/20
Teníamos las materias de bachillerato de filosofía escritas por IA corregidas por un profesor de filosofía. Este es ChatGPT.– Captura de pantalla de ChatGPT
“Realmente no es una locura. En este caso, ChatGPT hace lo mínimo con un poco de Descartes que distingue al hombre de los animales a través del habla y Freud en los errores de lengua”. Un “servicio mínimo”, en parte relacionado con el mensaje que le pide no dar demasiados detalles, pero que le valió la nota más baja de nuestros tres candidatos a IA.
“Está muy bien construido, lo que no esperamos menos de una IA, pero todavía tenemos algunas dudas sobre lo que podría ofrecer una vez desarrollado”, dice Ruben Salmon, que califica esta copia “entre 11 y 12 sobre 20, antes de la armonización de las notas”.
Modelo Géminis 3.5 Flash: 13.5/20
Teníamos las materias de bachillerato de filosofía escritas por IA corregidas por un profesor de filosofía. Este es Géminis.– Captura de pantalla de Géminis
La IA generativa de Google funciona “un poco mejor que ChatGPT”, considera Ruben Salmon, satisfecho de ver a Gemini movilizar la filosofía de la antigua Grecia y la figura del ciudadano en el ágora. “Todos estos debates de la Antigüedad son totalmente relevantes. Esta es, en mi opinión, la tesis más obvia. Porque si a partir de las palabras logramos construir una sociedad, trazando una línea, es porque en realidad tenemos control sobre ella. Son sólo palabras, pero en realidad organizan nuestro comportamiento y tienen efectos materiales”, explica el profesor de filosofía.
“Y en general, tomaremos como antítesis todo lo que aparecerá en torno al “Yo” del inconsciente, con Freud – que es lo que hace Géminis al invocar el concepto del “Yo” de Freud. Eso funciona muy bien, la idea de que no tenemos el control total. »
Lo cierto es que, para nuestro corrector de la época, Géminis peca “por explotar demasiado pocos autores, mientras que un Aristóteles sobre los sofistas habría sido bienvenido”. En otras palabras, el plan es sólido, pero las vías para su desarrollo, demasiado débiles, sugieren un límite a este razonamiento alcanzado rápidamente. Veredicto: “Entre 13 y 14 sobre 20”.
Claude modelo 4.6, esfuerzo medio: 18,5
Teníamos las materias de bachillerato de filosofía escritas por IA corregidas por un profesor de filosofía. Este es Claudio.– Captura de pantalla de Claude
Como sospechábamos, la IA de Anthropic Claude supera a todos sus competidores. Lo mismo ocurre con este ejercicio donde “la copia es muy buena, demasiado buena, incluso para un estudiante de último año”, valora Rubén Salmón que le daría a este trabajo un buen 18 o 19 sobre 20.
“Claude tiene un nivel más bien L1 en este tema. Deja a Lacan, donde los estudiantes citan a Freud como máximo. Sin embargo, prefiere a Heidegger a Bergson o Alain, que se puede ver en la escuela secundaria y que dice, en general, lo mismo pero más simple y sin haber interactuado con los nazis”, continúa el filósofo.
Además de una primera parte dedicada a la filosofía griega clásica, Ruben Salmon también se deja seducir por el uso de George Orwell o la movilización de escritos poéticos para debatir los límites del discurso. “Estoy pensando en particular en la colección Poemas a Lou de Apollinaire que utiliza todo el campo léxico de la guerra para sensualizarla. »

