Las instrucciones ocultas de cada herramienta IA

Un investigador publicó las instrucciones internas completas que definen cómo responden Claude, ChatGPT y otros: 120.000 caracteres al descubierto.

El mapa detrás del telón

Cada herramienta de IA importante — Claude, ChatGPT, Gemini, Grok — funciona con un conjunto de instrucciones ocultas escritas por la empresa que la creó. Se llaman system prompts. Nunca las ves. Son las que definen la personalidad del modelo, sus límites, qué rechaza hacer y qué finge no saber.

Un investigador conocido como Pliny the Liberator acaba de publicar lo que asegura ser el conjunto completo de instrucciones de la última versión de Claude. 120.000 caracteres. Publicados en menos de 24 horas desde que Anthropic lanzó el modelo. El post corrió rápido — más de 700.000 visualizaciones en dos días — y su archivo ya incluye las instrucciones filtradas de casi todas las herramientas de IA del mercado.

Dentro del documento de Claude hay algunos detalles que llaman la atención: el límite de conocimiento real es enero de 2026, no la fecha que Anthropic anunció públicamente. Los dos niveles de pago de Claude comparten el mismo modelo base. Y hay una función nueva que permite a Claude recordar cosas entre conversaciones, como un cuaderno invisible.

Para quien gestiona un negocio y usa estas herramientas a diario, esto no es tanto un escándalo como un recordatorio: la IA con la que hablas sigue un guion. Saber que ese guion existe — y que se puede leer — cambia la forma en que interpretas lo que te devuelve.

Puedes ver el archivo aquí: https://github.com/elder-plinius/CL4R1T4S

Palabras que vale la pena conocer

System prompt — Las instrucciones ocultas que una empresa escribe para definir cómo se comporta su IA. Como un manual de empleado que el modelo lee antes de cada conversación, pero que tú nunca ves.

Límite de conocimiento — La fecha a partir de la cual una IA no tiene información. Si algo ocurrió después de esa fecha, el modelo no lo sabe, aunque suene seguro de sí mismo.

Investigador de jailbreak — Alguien que examina sistemas de IA buscando la diferencia entre lo que las empresas dicen que hacen sus herramientas y lo que realmente hacen. Más periodista de investigación que hacker malicioso.