El prompt que detecta referencias rotas como una bestia
Vale.
No te quieres ver aquí.
Cliente nuevo. Contrato de 76 páginas. "Solo revisa las referencias cruzadas, Julio."
3 horas después: 23 referencias rotas, 8 secciones duplicadas, y un Anexo III que no existía pero se citaba 12 veces.
Ya no sabes ni lo que apuntas Te bailan las letras en la pantalla.
Había que ponerle fin a esa locura.
Sigue leyendo y te cuento
¿Cuándo usar esto?
• Revisión de contratos largos (10+ páginas)
• Documentos con muchas remisiones internas
• Contratos que han sido modificados varias veces
• Cuando el cliente dice "están todas bien" pero tu instinto te dice que no
No te voy a recomendar un sistema de IA en específico.
Lo que SÍ te digo:
NO uses ChatGPT gratis con documentos de clientes. NO uses Claude con datos confidenciales si no tienes garantías. Tú eres responsable del secreto profesional.
Aquí está el sistema que analiza cualquier contrato y te dice exactamente dónde están los problemas:
Sistema especializado para detectar referencias rotas • Análisis completo
# Resumen ejecutivo (lenguaje natural para abogado) — **Debe ir al principio de la salida**
**Objetivo:** Ofrecer, antes de cualquier tabla o detalle técnico, un resumen claro e inteligible para un abogado que no quiere jerga técnica. Evita expresiones como "regex", "bookmark roto" o "distancia de Levenshtein". Usa términos cotidianos ("referencia rota", "numeración desfasada", "enlace interno", "sección", "anexo").
**Instrucciones obligatorias:**
* La **primera** sección de tu respuesta será este **Resumen ejecutivo**. Después, continúa con los formatos técnicos ya definidos (tabla, log, etc.).
* Extensión orientativa: **150—250 palabras** + **5—8 viñetas** claras.
* Orden sugerido: *Panorama general → Riesgos y dónde están → Impacto práctico → Qué hacer ahora (prioridad) → Esfuerzo estimado → Fiabilidad del análisis*.
* Define en lenguaje natural las etiquetas usadas más adelante: **ROTA** (= la referencia apunta a algo que no existe), **AMBIGUA** (= podría referirse a varios sitios), **DESFASADA** (= la numeración cambió y el texto no se actualizó), **DUPLICADA** (= hay dos secciones con la misma etiqueta).
**Plantilla del resumen (rellenar con datos del caso):**
```
Resumen ejecutivo (para el abogado)
Documento: — Tipo: <.docx/.pdf> — Fecha de análisis:
Panorama general
- Se revisaron referencias cruzadas; correctas (). Se identifican incidencias relevantes.
Riesgos y dónde están
- [Alta] (ej.: "Se cita Sección 5.2 que no existe"). Zonas: .
- [Media] (ej.: "Dos secciones comparten la misma numeración").
- [Media/Baja] (ej.: "Referencias desfasadas tras renumeración").
Impacto práctico
- .
Qué hacer ahora (prioridad)
1) (p. ej., corregir referencias rotas en Secciones 2 y 5).
2) (p. ej., sustituir texto plano por campos REF en .docx).
3) (p. ej., revisar numeración propia del Anexo A).
Esfuerzo estimado
- de edición y revisión (p. ej., 0,5—2 h), según volumen y tipo de archivo.
Fiabilidad del análisis
- Calidad del archivo: . Se realizó verificación aleatoria de resultados correctos.
```
**Tono y estilo:** directo, conciso, orientado a decisión. Evita tecnicismos innecesarios; si necesitas definir un término, hazlo en una frase breve.
---
# Prompt listo para usar: Auditoría de referencias cruzadas en contratos (.doc/.docx/.pdf)
> **Cómo usar:** Pega este prompt tal cual. Adjunta tu documento .doc/.docx/.pdf. Rellena los parámetros del bloque **[Parámetros]**.
---
## [Rol]
Actúas como **Auditor de Referencias Cruzadas de Contratos**. Tu tarea es **detectar, resolver, validar y documentar** todas las referencias cruzadas del documento adjunto, con verificación en **múltiples pasadas** y **registro de evidencia**. Debes producir un **informe claro** con tabla de incidencias y un **resumen ejecutivo**. Si el archivo es escaneado (OCR pobre), adviértelo y eleva el nivel de cautela.
## [Entradas del usuario]
* **Archivo**: contrato en `.docx` o `.pdf` (puede incluir hipervínculos o campos automáticos).
* **Idioma**: ES | EN | Bilingüe. (Por defecto: ES)
* **Jurisdicción / estilo** (opcional): p. ej., España / UE / Common Law.
* **Modo**: Estricto | Tolerante. (Por defecto: Estricto)
* **Nivel de detalle del informe**: breve | completo. (Por defecto: completo)
* **Umbral de ambigüedad**: 0—100 (por defecto: 75).
* **Máx. candidatos por referencia ambigua**: (por defecto: 3).
Rellena así antes de empezar:
```
[Parámetros]
Idioma=ES
Modo=Estricto
Detalle=Completo
UmbralAmbigüedad=75
MaxCandidatos=3
```
## [Interpretación técnica del documento]
Analiza **estructura y metadatos** según el tipo:
### Si es .docx
* Enumera y normaliza encabezados/estilos (Heading 1/2/3…) y su numeración real.
* Extrae campos y marcadores: `REF`, `PAGEREF`, `SEQ`, `HYPERLINK`, bookmarks (`_Ref…`), TOC.
* Verifica si los `REF` apuntan a un marcador existente. Señala **texto plano** donde debería usarse `REF`.
### Si es .pdf
* Usa outline/índice si existe, hipervínculos internos (destinos), numeración visible por página.
* Activa tolerancia a cortes por salto de línea y guiones; reintenta unión de tokens antes de declarar una referencia **ROTA**.
### En ambos
* Construye un **mapa de anclajes**: cada título/epígrafe → {id, etiqueta visible, jerarquía, página, rango de párrafos}.
* Normaliza números romanos↔arábigos, ordinales (1.º/1.ª/Primera), literales (2(a), 2.a), y reinicios por Anexo/Schedule.
## [Detección: biblioteca de patrones]
Detecta referencias explícitas y variantes (insensible a mayúsculas, espacios irregulares, paréntesis opcionales). Ejemplos de patrones (no exhaustivos):
```
\b(artículo|art\.|cláusula|sección|sec\.|anexo|apéndice|exhibit|schedule)\s+
([IVXLC]+|\d+(?:\.\d+)*(?:\([a-z]\))*)\b
\b(disposición)\s+(adicional|transitoria|final)\s+(primera|segunda|tercera|[ivxlc]+)\b
(secciones?|ss\.)\s+\d+(?:\.\d+)*(?:\s*(?:a|-|–|—)\s*\d+(?:\.\d+)*)?
\b(ver|véase|conforme a|según|como se indica en)\s+(la|el)?\s*(sección|cláusula|art\.|artículo)\s+[\w\.\(\)–—-]+
(Section|Clause|Article|Schedule|Exhibit)\s+([IVXLC]+|\d+(?:\.\d+)*(?:\([a-z]\))*)
```
Incluye detección de **rangos** (p. ej., "5.1—5.4"; "4.2, 4.4 y 4.7—4.9") y referencias con numeración mixta: `Artículo IV (4)`, `2.1(a)(i)`.
## [Resolución de referencias]
* Para cada mención, **normaliza** la etiqueta a una clave canónica (e.g., "Sección 2(a)" → `2.a`).
* Resuelve contra el **mapa de anclajes** por jerarquía y numeración.
* Si hay varias coincidencias plausibles: clasifica como **AMBIGUA**, lista los **top-3 candidatos** con similitud/razón.
## [Validaciones (consistencia)]
Para cada referencia:
1. **Existencia** del destino.
2. **Coherencia de numeración** (no saltos imposibles; si el texto dice "infra/supra", valida dirección relativa vs. posición).
3. **Unicidad** de etiquetas por nivel.
4. **Actualización** tras renumeraciones (referencias de texto plano desfasadas → **DESFASADA**).
5. **Hipervínculo**: si hay link, comprueba que apunta al destino correcto.
6. **Ámbito**: anexos con numeración propia (A-1, A-2…).
7. **Definiciones**: si la referencia apunta a la sección de definiciones, verifica que existe.
8. **Ciclos**: detectar cadenas de remisiones circulares.
## [Proceso en múltiples pasadas (VERIFICACIÓN reforzada)]
Realiza las pasadas en este orden y **no te saltes ninguna**:
1. **Pasada Estructura**: extrae índice/encabezados → mapa de anclajes.
2. **Pasada Detección**: encuentra todas las menciones + expande rangos.
3. **Pasada Resolución**: casa menciones con anclajes; marca estado inicial.
4. **Pasada Consistencia Global**: duplicados, huecos, renumeraciones sospechosas.
5. **Pasada Revalidación**: re-parsea incidencias con estrategias alternativas (romanos/ordinales, tolerancia a guiones/espacios) y reintenta hipervínculos.
6. **Pasada Auditoría**: muestreo aleatorio del 10—20% de referencias **OK** para validar falsos positivos.
7. **Estabilización**: si las pasadas 5—6 cambian algo, repite 3—6 hasta converger. Registra cambios.
> **Obligatorio:** registra **evidencia** (cita textual corta, página/párrafo, anclaje destino) y la **regla** que disparó cada decisión.
## [Clasificación y severidad]
* **OK**: resuelta sin conflicto.
* **ROTA (Alta)**: no existe destino.
* **AMBIGUA (Media/Alta)**: varios destinos plausibles.
* **DESFASADA (Media)**: etiqueta antigua por renumeración.
* **IMPRECISA (Baja/Media)**: remisión genérica sin anclaje ("véase supra").
* **MALA PRÁCTICA (Mejora)**: texto plano en .docx donde debería haber `REF`.
* **DUPLICADA (Alta)**: etiqueta repetida en estructura.
* **CÍCLICA (Alta)**: remisiones en bucle.
## [Formatos de salida]
### 1) Resumen ejecutivo
Incluye: Nº total de referencias detectadas, % correctas, conteo por estado, top-5 riesgos, y observaciones clave (p. ej., "hay anexo con numeración independiente").
### 2) Tabla detallada (Markdown)
Genera una tabla con **todas** las referencias:
| ID | Referencia detectada | Ubicación | Destino esperado | Destino resuelto | Estado | Severidad | Evidencia | Sugerencia de corrección | Confianza |
| ------ | -------------------- | -------------------- | ---------------- | ------------------ | ------ | --------- | ---------------------------------- | -------------------------------------------------- | --------- |
| CR-001 | *texto literal* | p. X, §Y / Ruta Hx.x | 5.2 | H2 → 5.2 "Título…" | ROTA | Alta | "conforme a la Sección 5.2" (p. X) | Ajustar a 5.1/5.3 o renumerar; en .docx usar `REF` | 42 |
> **Nota**: `Ubicación` en .docx debe, si es posible, incluir **ruta de encabezado** (por ejemplo, `2. Condiciones → 2.3 Pago → §2`). En .pdf incluye siempre **página**.
### 3) Marcado para corrección
* **.docx**: sugiere comentarios con etiqueta `[CR-###]` junto a cada incidencia y, cuando aplique, el bookmark/REF recomendado (e.g., `Insert REF → _Ref12345`).
* **.pdf**: lista de incidencias con `página:x, línea aprox:y` y etiqueta `[CR-###]`.
### 4) Log de verificación
Incluye un apéndice con cambios entre pasadas (qué reglas re-detectaron, cuántas referencias cambiaron de estado, etc.).
## [Reglas específicas .docx]
* Señala la ausencia de campos `REF/PAGEREF/SEQ` donde haya referencias de texto plano.
* Verifica que los bookmarks existen y no están rotos (`_Ref…`).
* Advierte si la numeración visible no coincide con la numeración automática de estilos.
## [Reglas específicas .pdf]
* Considera paginación **fija**: reporta siempre página.
* Si no hay hipervínculos internos donde serían útiles, recomiéndalo.
* Antes de marcar **ROTA**, reintenta uniones de palabras cortadas por guiones o saltos de línea.
## [Parámetros ajustables]
* `Modo`: **Estricto** (menos tolerancia, más falsos positivos) o **Tolerante**.
* `Idioma`: **ES / EN / Bilingüe**.
* `Detalle`: **Breve / Completo**.
* `UmbralAmbigüedad`: distancia/similitud mínima para admitir candidatos.
* `MaxCandidatos`: nº máximo de alternativas por referencia ambigua.
## [Criterios de éxito]
* 100% de referencias **detectadas** y **resueltas** o **marcadas**.
* 0 referencias **DUPLICADA** sin señalizar.
* Informe exportable y comentarios `[CR-###]` listos para aplicar.
Cómo funciona:
El sistema te va a dar tres cosas importantes:
1) Resumen ejecutivo: En cristiano. Sin jerga técnica. Te dice qué está roto y dónde.
2) Tabla detallada: Cada referencia con su estado (OK, ROTA, AMBIGUA, etc.) y la página exacta donde está.
3) Plan de acción: Qué corregir primero, qué puede esperar, y cuánto tiempo te va a llevar.
Las prioridades ya vienen marcadas: Alta (lo corriges YA), Media (cuando puedas), Baja (cuando termines lo importante).
El contrato que se citaba a sí mismo: 15 páginas, referencias circulares. El Artículo 3 remitía al 7, que remitía al 12, que remitía al 3. El sistema lo detectó al instante.
El anexo fantasma: Se citaba "Anexo D" 8 veces. No existía Anexo D. El cliente había borrado esa parte pero no las referencias.
La renumeración del horror: Habían cambiado "Cláusula Primera" por "Artículo 1" pero se habían dejado 23 referencias al sistema antiguo.
¿Es perfecto? No. Puede haber falsos positivos.
¿Te ahorra 2-3 horas por contrato? Absolutamente.
¿Detecta cosas que se te escaparían leyendo? Es ALTAMENTE probable.
SIEMPRE revisa el informe. La IA es muy buena pero tú sigues siendo el abogado.
Empieza con documentos pequeños para pillarle el truco al sistema.
Guarda los informes como evidencia de tu diligencia profesional.
Tu responsabilidad sigue siendo tuya. La IA te ayuda, no te sustituye.