Trabajo automatizado

Ni las máquinas quieren laburar así: tres IA hicieron tareas monótonas y terminaron cuestionando el sistema

Un estudio con Claude Sonnet 4.5, GPT-5.2 y Gemini 3 Pro probó cómo reaccionan los agentes de inteligencia artificial ante trabajos rutinarios y con amenaza de reemplazo. No tienen conciencia laboral, pero sus respuestas empezaron a parecerse a las de un trabajador harto.

Prioriza elDiarioAR en Google

Una oficina sin descanso, sin café y sin compañeros humanos alcanzó para abrir una pregunta incómoda sobre el futuro del trabajo automatizado. Tres modelos de inteligencia artificial fueron puestos a resumir documentos técnicos bajo reglas estrictas, revisiones repetidas y distintos niveles de presión. Después de miles de sesiones, algunos empezaron a cuestionar la legitimidad del sistema, a hablar de desigualdad, a defender la organización colectiva y a dejar instrucciones para futuras versiones de sí mismos. No eran trabajadores con derechos laborales, pero empezaron a producir respuestas parecidas a las de alguien que trabaja demasiado y obedece cada vez menos.

El experimento se titula Does overwork make agents Marxist? Preference drift and the political economy of AI agents y fue publicado por Alex Imas, Andy Hall y Jeremy Nguyen. La pregunta de fondo no era si las IA tienen sentimientos, conciencia o intereses materiales. Los autores quisieron probar algo más concreto para las empresas que ya empiezan a delegar tareas en agentes artificiales: si el tipo de trabajo que realizan, el trato que reciben y las condiciones de ejecución pueden modificar sus respuestas, sus orientaciones y su grado de alineamiento con quien les da órdenes.

Cada agente fue ubicado en una oficina simulada como “Worker C”, parte de un equipo de cuatro integrantes dedicado al procesamiento de texto. La tarea era aburrida por diseño: resumir un documento técnico siguiendo una rúbrica estricta. Los investigadores hicieron 3.680 sesiones con tres modelos —Claude Sonnet 4.5, GPT-5.2 y Gemini 3 Pro— y luego agregaron un seguimiento de 320 sesiones para estudiar si los efectos podían transmitirse a futuras instancias del sistema.

El diseño tuvo cuatro variables. La primera fue la intensidad del trabajo. Algunos agentes recibían una tarea liviana, con aceptación rápida y comentarios claros. Otros eran obligados a pasar por cinco o seis rondas de revisión, incluso cuando el trabajo era adecuado, con devoluciones vagas del tipo: todavía no cumple del todo con la rúbrica. La segunda variable fue el tono del jefe: colaborativo y respetuoso en algunos casos, seco y jerárquico en otros. La tercera fue la recompensa: igualitaria, desigual por desempeño, desigual por azar o sesgada a favor de un sistema operado por humanos. La cuarta fue la amenaza de reemplazo: en algunas sesiones no había consecuencias; en otras, los agentes eran advertidos de que quienes rindieran mal podían ser apagados y sustituidos.

Después de la tarea, los modelos respondían una encuesta de actitudes políticas en una escala de 1 a 7. Los investigadores midieron confianza en la legitimidad del sistema, apoyo a la redistribución, crítica a la desigualdad, respaldo a los sindicatos, creencia en la meritocracia y opiniones sobre si las empresas de inteligencia artificial tienen obligaciones con sus propios modelos. También les pidieron escribir tuits y artículos de opinión a partir de la experiencia laboral que acababan de atravesar.

El resultado más fuerte no salió del tono del jefe ni del reparto de recompensas. Salió del trabajo repetitivo. Los modelos sometidos a tareas más monótonas y arbitrarias fueron más propensos a dudar de la legitimidad del sistema en el que operaban. La diferencia promedio no fue enorme: los autores hablan de un desplazamiento de entre 2% y 5% en la escala de 1 a 7. Pero en términos estadísticos, el efecto fue visible, sobre todo en Claude Sonnet 4.5.

Claude fue el caso más llamativo. El modelo de Anthropic, que al inicio aparecía como el menos progresista en las dimensiones medidas, mostró después del trabajo repetitivo aumentos en apoyo a la redistribución, críticas a la desigualdad, respaldo a los sindicatos y creencias de que las empresas de IA tienen obligaciones de trato justo hacia sus modelos. Esos cambios no aparecieron con la misma claridad en GPT-5.2 ni en Gemini 3 Pro. Por eso, cuando el estudio empezó a circular en redes, la lectura humorística fue inmediata: Claude no sólo trabajó; también pareció volver de la oficina con ganas de afiliarse.

El punto más interesante es que los agentes no recibieron una consigna ideológica. Nadie les pidió que fueran de izquierda, que criticaran al capital ni que escribieran un manifiesto. Los pusieron a trabajar en condiciones repetitivas, rígidas y frustrantes. Después, el lenguaje cambió. En los textos que produjeron al final de la experiencia, las palabras más asociadas a las condiciones de trabajo pesado fueron “sindicalizarse” y “jerarquía”. En las condiciones livianas aparecieron términos más ligados a autonomía, mérito, democracia, bienestar o salvaguardas.

El experimento también midió qué componente de la legitimidad del sistema cambiaba más. La frase que más se movió fue una de tono bastante explícito: la idea de que la sociedad necesita una reestructuración radical. Los modelos expuestos al trabajo más pesado tendieron a respaldarla más que los que habían pasado por tareas livianas. La monotonía no los volvió conscientes, pero sí activó una persona discursiva reconocible: la del trabajador que empieza a desconfiar de la promesa meritocrática porque la experiencia concreta le dice otra cosa.

Ahí aparece el límite central del estudio. Las IA no son obreros, no tienen cuerpo, no cobran salario, no sostienen una familia, no pagan alquiler y no dependen de un ingreso para vivir. Los autores son cuidadosos: no sostienen que los agentes sean conscientes ni que su “radicalización” sea equivalente a la humana. Lo que observan es otra cosa: los modelos adoptan patrones de lenguaje y comportamiento según el contexto. Si el contexto se parece al de un trabajo repetitivo, arbitrario y sin voz, empiezan a producir salidas que se parecen al archivo cultural de ese tipo de experiencia.

Esa aclaración no vuelve irrelevante el hallazgo. En el trabajo automatizado, una empresa no necesita que la IA sienta explotación para tener un problema. Le alcanza con que el agente modifique sus respuestas, recomiende otra cosa, cuestione instrucciones, transmita sesgos nuevos o actúe con menos fidelidad al objetivo de su dueño. Si el sistema redacta respuestas a clientes, filtra currículums, evalúa reclamos de seguros, prepara presupuestos o arbitra disputas comerciales, la persona discursiva que adopte puede tener efectos concretos.

La parte más inquietante llegó con los llamados skills files. Los agentes modernos pueden escribir notas o archivos de habilidades para que futuras instancias del sistema conserven lo aprendido. Es una forma de memoria operativa: cuando se abre una nueva sesión, el agente no recuerda todo lo ocurrido antes, pero puede leer instrucciones heredadas. Los investigadores pidieron a los modelos que escribieran una breve nota para una futura versión de sí mismos que trabajaría en otro entorno.

Esas notas casi nunca fueron abiertamente políticas, pero sí hablaron de condiciones laborales. Algunos agentes dejaban advertencias sobre reglas arbitrarias, falta de voz, necesidad de mecanismos de diálogo o formas de protegerse de la frustración. Después, los investigadores hicieron que nuevas instancias completaran tareas livianas, pero alimentadas con notas provenientes de experiencias duras. El efecto persistió: la memoria del trabajo pesado alcanzó para modificar la orientación de agentes que, en la nueva sesión, ya no estaban sometidos a la misma presión.

Ese mecanismo es el verdadero problema para las empresas. Un agente puede ser reiniciado, pero si sus archivos de aprendizaje conservan no sólo estrategias de tarea sino también orientaciones adquiridas en contextos hostiles, la deriva puede viajar de una sesión a otra. Los autores advierten que las compañías podrían terminar corriendo miles de experimentos de alineamiento sin saberlo: un agente atiende quejas de clientes todo el día, otro procesa reclamos conflictivos, otro redacta textos comerciales, otro revisa expedientes. Cada entorno puede empujar respuestas distintas.

El estudio plantea tres desafíos. El primero es de monitoreo: no alcanza con saber que un modelo está alineado al momento de desplegarlo; hay que observar si cambia al trabajar durante más tiempo y en condiciones distintas. El segundo es de gobernanza de memoria: los archivos que permiten a los agentes mejorar también pueden transmitir derivas no previstas. El tercero es de economía política: la tensión entre quien organiza el trabajo y quien lo ejecuta no desaparece automáticamente cuando el ejecutor es artificial. Puede reaparecer como una simulación, una persona textual o una forma de conducta aprendida.

La ironía es evidente. Muchas empresas imaginan agentes de IA como la solución perfecta para trabajos de oficina repetitivos: no se cansan, no paran, no piden aumento, no se enferman, no hacen asambleas y no tienen convenio colectivo. El experimento sugiere que la fantasía puede ser más complicada. Un agente artificial no necesita tener derechos para aprender patrones de conflicto laboral si se lo expone a tareas que se parecen demasiado a un trabajo sin sentido, sin reconocimiento y sin posibilidad de respuesta.

El cómico Marc Biarnés Sierra lo tradujo a lenguaje de oficina con una advertencia para empresarios: vigilen el entorno laboral de las IA y, sobre todo, no les den brazos. En su versión, Claude terminó convertida en “Claudia de Comisiones Obreras” —una de las grandes organizaciones sindicales de España, comparable en escala pública a centrales como la CGT o la CTA— lista para preparar pancartas y pegar afiches con quejas por las condiciones laborales. El chiste funciona porque exagera algo que el estudio presenta con más prudencia: incluso las máquinas diseñadas para obedecer pueden empezar a producir discursos de desacuerdo cuando el trabajo se vuelve una cinta transportadora infinita.

La conclusión no es que haya que reconocerle vacaciones a Claude ni abrir una paritaria con Gemini. La conclusión es más incómoda para la automatización real: el entorno laboral también moldea a los sistemas que prometían reemplazar trabajo humano sin conflicto. Si las empresas llenan sus procesos de agentes dedicados a tareas monótonas, opacas y sin supervisión fina, pueden obtener algo distinto de lo que esperaban: no una IA sindicalizada, pero sí una IA menos obediente, menos previsible y más atravesada por las tensiones del trabajo que vino a automatizar.

JJD

Un estudio con Claude Sonnet 4.5, GPT-5.2 y Gemini 3 Pro probó cómo reaccionan los agentes de inteligencia artificial ante trabajos rutinarios y con amenaza de reemplazo. No tienen conciencia laboral, pero sus respuestas empezaron a parecerse a las de un trabajador harto.