Invariantes en juegos: la clave de las estrategias explícitas
Mientras el robo de estrategia (Lección 5.1) demuestra existencia, construir la estrategia ganadora requiere un invariante: una función del estado del juego que (a) el jugador ganador puede mantener en un valor específico en cada uno de sus turnos, y (b) el jugador perdedor no puede mantener si sigue el invariante.
Invariantes de paridad. La forma más común en olimpiadas: el número de fichas, el número de ciertos objetos, o el valor de una suma tiene una paridad que el jugador ganador preserva o cambia en cada turno de manera controlada. Ejemplo: si el juego termina cuando cierta suma es par, y el primer jugador puede siempre asegurarse de que la suma es par después de su turno, el primer jugador gana.
Invariante de XOR en Nim. La invariante de Nim es : el jugador ganador mantiene el XOR igual a 0 después de cada uno de sus turnos, y el oponente no puede mantener XOR (pues toda posición con XOR tiene todos sus sucesores con XOR ). Esta invariante es el caso más importante en olimpiadas.
Diseñar el invariante. Para un problema dado: (1) Probar varios casos pequeños para adivinar quién gana. (2) Buscar una función del estado (suma, paridad, XOR, diferencia) que el ganador puede controlar. (3) Probar que: si el ganador sigue la estrategia basada en el invariante, llega a ganar; y que el perdedor no puede "romper" el invariante en su turno.
Estrategias de simetría: la reflexión como arma
La estrategia especular (mirror strategy) es una de las técnicas más elegantes en juegos olímpicos. La idea: el segundo jugador "refleja" cada movimiento del primero respecto a una simetría del tablero, garantizando que siempre puede mover y eventualmente gana.
Condiciones para la estrategia especular. (1) Existe una involución del tablero (o del conjunto de posiciones) tal que en la posición inicial (el estado inicial es el punto fijo). (2) Si el primer jugador hace el movimiento , el segundo jugador puede hacer el movimiento o algún movimiento que mantenga la propiedad de "simetría reflejada". (3) La simetría garantiza que siempre que el primero pueda mover, el segundo también puede.
**Ejemplo: Juego sobre un tablero .** Se colocan fichas sobre un tablero . En cada turno, un jugador coloca una ficha en una casilla vacía. El que no puede colocar pierde. El segundo jugador usa la reflexión por el centro del tablero: si el primero coloca en , el segundo coloca en . Como el tablero tiene número par de casillas y la reflexión no tiene punto fijo, esta estrategia siempre funciona. El segundo jugador siempre puede mover mientras el primero pueda.
Cuidado con la posición inicial. Si la posición inicial no es el punto fijo de la involución, la estrategia especular puede no funcionar directamente. En esos casos, el primer jugador puede hacer el movimiento "corrector" al inicio (mover a la posición simétrica) y luego seguir la estrategia especular. Esto transforma el primer jugador en el "segundo" respecto a la simetría.
Ejemplo avanzado: Juego en un grafo con emparejamiento. Si el grafo tiene un emparejamiento perfecto , el segundo jugador puede seguir la estrategia especular respecto a : cuando el primero mueve de a , el segundo mueve de a donde . Si el grafo es tal que esta estrategia siempre está disponible (es decir, la ficha siempre puede seguir el emparejamiento), el segundo jugador gana.
Coloraciones y particiones: estrategias estructurales
En muchos juegos olímpicos, la clave es encontrar una coloración del tablero (o del conjunto de movimientos) que da estructura a la estrategia ganadora. La coloración actúa como invariante visual.
Ejemplo: Juego de domino. En un tablero con algunas casillas bloqueadas, los jugadores colocan dominos (piezas ) alternadamente. El que no puede colocar pierde. Si el tablero restante (sin las casillas bloqueadas) tiene un tileado perfecto por dominos, el segundo jugador puede usar la estrategia especular respecto a ese tileado: si el primero coloca un domino en la posición , el segundo coloca en la posición donde es el emparejamiento dado por el tileado. Esta estrategia funciona mientras exista el tileado del estado actual.
Coloración bipartita. Muchos tableros tienen una coloración de ajedrez (blancos y negros alternados). Si el juego tiene la propiedad de que cada movimiento va de una casilla blanca a una negra (o viceversa), los jugadores alternan entre colores. El primer jugador siempre empieza en un color fijo; si la posición ganadora tiene paridad opuesta al inicio, el segundo jugador gana.
Estrategia de pareo. Sea un pareo del conjunto de posiciones disponibles. La estrategia del segundo jugador: si el primero toma (o mueve a) el elemento , el segundo responde tomando (o viceversa). Esta estrategia es ganadora si: (i) la posición inicial no tiene un elemento del pareo "desparejado", y (ii) mover a después de que el primero movió a siempre es un movimiento legal.
Ejemplo: Nim de suma constante. En el juego donde se tienen fichas y en cada turno el jugador toma entre 1 y fichas (con el total de tomas consecutivas ), el pareo óptimo es: poner en par para cada bloque de posiciones consecutivas. Este pareo da la estrategia ganadora que da soporte a la P-posición .
Juegos con condiciones de terminación no estándar
Muchos problemas IMO de juegos tienen reglas de terminación más complejas que "el que no puede mover pierde". Las variantes más comunes:
Primera repetición. El jugador que repite un estado (crea un ciclo) pierde. En estos juegos, el grafo de posiciones es finito pero puede tener ciclos. La teoría de Sprague-Grundy estándar no aplica directamente, pero se puede usar la acicización: considerar el grafo de posiciones alcanzables sin repetición como un DAG.
Límite de movimientos. El juego termina después de exactamente turnos, y el jugador con más puntos (o con cierta propiedad) gana. Estos juegos de suma positiva requieren análisis de minimax, no el marco P/N estándar. Sin embargo, si el juego es de suma cero (lo que uno gana es lo que el otro pierde), la teoría de juegos de suma cero aplica.
Juegos de construcción. Los jugadores construyen algo (un grafo, una secuencia, una coloración) y el ganador es quien logra cierta propiedad (conectividad, 3-coloración, etc.). Para estos juegos, el análisis requiere determinar si la propiedad deseada puede garantizarse o evitarse. La técnica de "construcción incremental" y los teoremas de Ramsey (Capítulo 1) dan las cotas necesarias.
Juegos asimétricos. Los jugadores tienen roles distintos (Constructor vs. Destructor, Creador vs. Anotador). En el clásico juego de emparejamiento de Erdős-Selfridge: un Constructor intenta crear una línea ganadora (como en Tic-Tac-Toe generalizado) y un Destructor trata de impedirlo. El Teorema de Erdős-Selfridge da una condición suficiente para que el Destructor gane: si (donde son las "líneas ganadoras"), el Destructor puede seguir una estrategia de "peso" que impide al Constructor ganar.
Síntesis: identificar la técnica correcta en IMO
Los problemas de juegos en IMO y IMO Shortlist C4–C7 tienen perfiles reconocibles. Dominar el reconocimiento es tan importante como dominar las técnicas.
Perfil 1: "Demuestra que el segundo jugador gana." Busca simetría: ¿hay una involución del tablero que preserva la posición inicial? Si sí, estrategia especular. Si no, busca un pareo o una coloración que da un invariante.
Perfil 2: "¿Quién gana en función de los parámetros iniciales?" Calcula los P-posiciones por retrograde en casos pequeños, identifica el patrón (usualmente periódico), y demuestra el patrón por inducción. Si el juego es una suma de subjuegos, calcula nimeros y aplica Sprague-Grundy.
Perfil 3: "Encuentra la estrategia ganadora explícita." Busca el invariante que el ganador mantiene: suma, XOR, diferencia de paridades, o una función combinatoria del estado. Prueba que el invariante se puede mantener en cada turno y que lleva a la victoria.
Perfil 4: "Demuestra que el primer jugador gana (sin saber la estrategia)." Robo de estrategia. ¿Puede el primer jugador hacer un movimiento "nulo" o un movimiento que no perjudica? Si sí, el robo da la existencia de estrategia ganadora.
La habilidad que distingue a los estudiantes de selectivo IMO es reconocer en 3 minutos de lectura cuál de estos perfiles aplica y ejecutar la técnica correspondiente con rigor. Esto requiere práctica sistemática con los problemas del Shortlist.