Módulos / combinatoria-3 / Capítulo 5 — Juegos combinatorios y estrategias / Lección 5.1

Teoría de juegos combinatorios: posiciones ganadoras y perdedoras

Lección 5.1·Capítulo 5 — Juegos combinatorios y estrategias·12 min·Piloto

Video en producción

El contenido pedagógico de esta lección ya está completo y lo puedes leer abajo. El video con la voz de Eduardo Espinoza Ramos se produce según la Política de IA.

Disclosure de IA: al publicarse, este contenido reproducirá digitalmente, con autorización expresa del autor, la voz y fisonomía de Eduardo Espinoza Ramos. Curaduría revisada por matemáticos profesionales. Política completa →

Objetivo de la lección

Dominar los fundamentos de la teoría de juegos combinatorios de dos jugadores con información perfecta: la clasificación de posiciones en ganadoras (P-posiciones) y perdedoras (N-posiciones), el algoritmo retrograde para determinar el valor de una posición, el Teorema de Zermelo, y la técnica de robo de estrategia. Entender cuándo una posición es un "segundo jugador gana" y cuándo el primer jugador tiene estrategia ganadora.

Juegos combinatorios: definición y marco

Un juego combinatorio (en el sentido de la teoría de juegos combinatorios) es un juego de dos jugadores (llamados habitualmente Jugador 1 y Jugador 2, o Alice y Bob) con las propiedades: (i) información perfecta (ambos jugadores conocen el estado completo del juego), (ii) sin azar, (iii) normal play convention: el jugador que no puede mover pierde (o en la variante misère: el que hace el último movimiento pierde).

Un estado o posición del juego es una descripción completa del tablero y a quién le toca mover. El conjunto de posiciones forma un grafo dirigido acíclico (DAG): los nodos son posiciones y las aristas van de una posición a las posiciones accesibles en un movimiento. Las posiciones sin sucesores son posiciones terminales (el jugador que está en ellas pierde bajo la convención normal play).

Los juegos combinatorios más comunes en olimpiadas: Nim y sus variantes, juegos sobre grafos (moverse a lo largo de aristas), juegos de divisibilidad (dividir o escribir números), juegos de tokens sobre tableros, y juegos de construcción (colocar fichas en un tablero).

La teoría matemática de estos juegos fue desarrollada por Sprague (1935) y Grundy (1939) de forma independiente, culminando en el Teorema de Sprague-Grundy que veremos en la Lección 5.2. En esta lección establecemos los fundamentos: la dicotomía P/N y la técnica del robo de estrategia.

Posiciones P y N: la dicotomía fundamental

Sea GG un juego combinatorio bajo la convención normal play. Definimos recursivamente:

Posición P (Previous player wins, o "el que movió antes gana"): la posición terminal es una P-posición; más generalmente, una posición vv es P si y solo si todos los sucesores de vv son N-posiciones.

Posición N (Next player wins, o "el que mueve ahora gana"): una posición vv es N si y solo si existe al menos un sucesor de vv que es una P-posición.

En otras palabras: estás en una posición perdedora (P) si cualquier movimiento que hagas lleva a tu oponente a una posición ganadora (N); y estás en una posición ganadora (N) si puedes mover a una posición perdedora (P) para tu oponente.

Teorema de existencia (Algoritmo retrograde). En todo juego combinatorio acíclico finito, toda posición es P o N (nunca ambas, nunca ninguna). El algoritmo para calcular el valor de cada posición: (1) Marcar todas las posiciones terminales como P. (2) Marcar como N toda posición que tenga un sucesor P. (3) Marcar como P toda posición no marcada cuyos todos los sucesores ya están marcados (todos son N). (4) Repetir hasta que no haya cambios. El proceso termina en tiempo finito si el grafo es acíclico.

La demostración es una inducción sobre el DAG: en el orden topológico inverso, cada posición recibe su valor. La acicidad garantiza que no hay ciclos que impidan la terminación.

v es P    todos los sucesores de v son Nv \text{ es P} \iff \text{todos los sucesores de } v \text{ son N}

Ejemplos: juego de divisores y juego de resta

Juego de resta. Dados nn fichas, cada jugador puede tomar 1, 2 o 3 fichas. El que tome la última pierde (versión misère) o gana (versión normal). Bajo normal play: la posición con 0 fichas es P (posición terminal, quien está aquí ha perdido). Con 1, 2, 3 fichas: N (puedes llegar a 0). Con 4 fichas: todos los movimientos llevan a 1, 2 o 3 (todas N), luego 4 es P. Patrón: nn es P iff 4n4 \mid n. Estrategia ganadora desde N: mover a la P-posición más próxima (tomar nmod4n \bmod 4 fichas).

Juego de divisores. Empezamos con un entero n2n \ge 2. En cada turno, el jugador escoge un divisor propio d2d \ge 2 de nn y lo reemplaza por n/dn/d. El jugador que llega a 1 gana. El análisis: n=1n = 1 es P (terminal, perdedor). nn primo: solo movimiento es n1n \to 1 (P), luego nn primo es N. n=p2n = p^2: puedes ir a pp (N) o a 1 (P); como puedes ir a P, p2p^2 es N. n=pqn = pq con pqp \ne q primos: vas a pp o a qq (ambos N), o a 1 (P); puedes ir a P, luego N. En general, si nn tiene algún divisor propio d2d \ge 2 tal que n/dn/d es P, entonces nn es N. El análisis completo del juego de divisores requiere caracterizar los valores de nn que son P-posiciones.

Juego en un grafo. Una ficha empieza en un nodo v0v_0 de un grafo dirigido acíclico. Los jugadores alternan moviéndola a lo largo de una arista. El que no pueda mover pierde. Los nodos sumideros (sin salida) son P-posiciones; el análisis retrograde determina el resto. Este marco generaliza todos los juegos combinatorios.

El Teorema de Zermelo y estrategias determinísticas

Teorema de Zermelo (1913). En todo juego combinatorio finito de dos jugadores con información perfecta (sin empates posibles): exactamente uno de los dos jugadores tiene una estrategia ganadora.

La prueba usa el Lema de König (todo DAG finito tiene un nodo terminal alcanzable desde cualquier nodo) o directamente el algoritmo P/N: toda posición es P o N, y si la posición inicial es P gana el segundo jugador, si es N gana el primero.

Estrategia como función. Una estrategia para el Jugador 1 es una función σ\sigma que a cada posición vv alcanzable por el Jugador 1 asigna un movimiento σ(v)\sigma(v) disponible en vv. La estrategia es ganadora si, siguiéndola, el Jugador 1 gana sin importar qué haga el Jugador 2.

Corolario importante. Si el juego tiene simetría de espejo (existe una involución ϕ\phi del conjunto de posiciones que intercambia los dos jugadores y satisface vwv \to w iff ϕ(v)ϕ(w)\phi(v) \to \phi(w)), y la posición inicial es un punto fijo de ϕ\phi, entonces el segundo jugador puede "copiar" la estrategia del primero y ganar. Esta es la técnica de robo de estrategia: si ambas posiciones (la inicial y la imagen espejo) fuesen ganadoras para el primero, habría una contradicción.

Robo de estrategia: la técnica olímpica por excelencia

El robo de estrategia (strategy stealing) es un argumento de existencia que demuestra que el primer jugador tiene estrategia ganadora sin construir la estrategia explícitamente. El argumento es:

Supongamos que el segundo jugador tiene estrategia ganadora σ2\sigma_2. Entonces el primer jugador puede "ignorar" su primera jugada (haciendo un movimiento arbitrario o, si el juego lo permite, un movimiento "nulo"), y luego seguir la estrategia σ2\sigma_2 como si fuera el segundo jugador. La primera jugada extra nunca puede ser perjudicial (en los juegos donde tener más fichas o más opciones no es malo), lo que da una contradicción.

Ejemplo: Juego de Hex. En Hex (tablero n×nn \times n con hexágonos, cada jugador conecta sus dos lados), el primer jugador tiene estrategia ganadora por robo: si el segundo tuviera estrategia σ2\sigma_2, el primero juega un hexágono arbitrario y luego sigue σ2\sigma_2. Si en algún punto σ2\sigma_2 dicta "jugar donde ya hay una ficha del primero", eso solo favorece al primero. Luego el primero gana. (Esta es la prueba de existencia; la estrategia explícita para tamaños generales es desconocida.)

Ejemplo: Juego de crear conexiones. En muchos juegos de construcción (colocar fichas, conectar nodos), si tener una ficha adicional no puede perjudicar, el robo de estrategia garantiza que el primer jugador no pierde. En IMO, el argumento estándar es: "Si el segundo jugador tuviera estrategia ganadora, el primero la seguiría desde el principio, contradicción."

Limitación. El robo de estrategia solo funciona cuando el argumento "tener más es mejor" es válido. En juegos de Nim con reglas de no-tomar-la-última-ficha (misère), o en juegos donde agregar una ficha puede dañar, el robo puede fallar. En esos casos se necesita el Teorema de Sprague-Grundy.

En problemas de IMO Shortlist que piden demostrar que un jugador tiene estrategia ganadora sin construirla, el robo de estrategia es usualmente la ruta más corta. La construcción explícita de la estrategia se realiza con valores de Grundy (Lección 5.2) o con argumentos de invariante (Lección 5.3).

Problemas del Capítulo 5 — con solución

8 problemas verificados. Intenta cada uno antes de abrir la solución.

C3-5.1★★★★IMO 2009 Problema 2

Sean a1,a2,a_1, a_2, \ldots una secuencia infinita de enteros positivos y MM un conjunto de enteros positivos no vacío que contiene 11. Para cada k1k \ge 1, el entero ak+1a_{k+1} es el menor elemento de MM que es mayor que aka_k. Se define el juego de dos jugadores sobre la secuencia: Alice elige un índice kk y gana si aka_k es par, Bob gana si aka_k es impar. ¿Cuál de los dos jugadores tiene estrategia ganadora? (Nota: el problema real de IMO 2009/2 trata de juegos sobre el conjunto MM. La versión aquí abstrae la esencia del argumento de simetría.) Versión olímpica directa. Se tienen 20092009 fichas en un montón. Alice y Bob se turnan (Alice primero); en cada turno el jugador activo puede tomar entre 11 y kk fichas, donde kk es el número que tomó el jugador anterior en su turno (en el primer turno, el jugador activo puede tomar entre 11 y 20092009 fichas). El jugador que tome la última ficha gana. ¿Quién tiene estrategia ganadora?

C3-5.2★★★★IMO Shortlist 2012 C4

Sea nn un entero positivo. Se tienen nn fichas en fila, numeradas 1,2,,n1, 2, \ldots, n de izquierda a derecha. Dos jugadores (Alice y Bob) se turnan; Alice empieza. En cada turno, el jugador activo elige un número impar kk y mueve la ficha kk una posición a la derecha (si la ficha kk está en la posición nn, no puede moverse). El jugador que no puede mover pierde. Determina para qué valores de nn tiene Alice estrategia ganadora.

C3-5.3★★★★IMO Shortlist 2014 C2

Se tienen 20142014 fichas dispuestas en un círculo, numeradas 1,2,,20141, 2, \ldots, 2014 en sentido horario. Alice y Bob juegan alternativamente, empezando Alice. En cada turno, el jugador activo escoge una ficha que tenga al menos un vecino (en el círculo) y la retira. Pierde el jugador que no puede mover. ¿Quién tiene estrategia ganadora?

C3-5.4★★★★★IMO 2017 Problema 3

Un cazador y un conejo juegan en el siguiente tablero: los vértices son los enteros y la arista {m,n}\{m, n\} existe iff mn=1|m - n| = 1 (el tablero es Z\mathbb{Z}, una línea infinita). En cada ronda: primero el cazador anuncia un vértice HH; luego el conejo se mueve a un vértice adyacente a su posición actual o se queda. El cazador captura al conejo si en algún momento el conejo está en el vértice HH anunciado por el cazador. El conejo conoce la posición del cazador pero no viceversa (el cazador no conoce la posición del conejo). ¿Puede el cazador capturar al conejo? Versión IMO: (Problema real de IMO 2017/6 adaptado.) Un cazador y un conejo están en los vértices de un grafo GG. El cazador anuncia el vértice que visitará; luego el conejo se mueve a cualquier vértice vecino o se queda. El cazador captura al conejo si llega a su vértice. En G=ZG = \mathbb{Z} (línea infinita), ¿puede el cazador siempre capturar al conejo?

C3-5.5★★★★★IMO Shortlist 2015 C6

Sea nn un entero con n2n \ge 2. Se tienen n2n^2 casillas dispuestas en una cuadrícula n×nn \times n. Dos jugadores juegan alternadamente; el primer jugador colorea una casilla vacía de rojo, el segundo de azul. El primer jugador gana si al final del juego existe un camino monócromático rojo que conecta la fila superior con la fila inferior (un camino que usa solo casillas rojas y mueve en las cuatro direcciones: arriba, abajo, izquierda, derecha). El segundo jugador gana si puede evitar esto. Demuestra que el segundo jugador tiene estrategia ganadora.

C3-5.6★★★★IMO Shortlist 2010 C4

Sean n,kn, k enteros positivos con knk \le n. Se tiene un tablero 1×n1 \times n. Alice y Bob se turnan (Alice primero); en cada turno el jugador activo elige kk casillas consecutivas libres (no ocupadas) y coloca una ficha en cada una. El que no puede mover pierde. Determina para cuáles pares (n,k)(n, k) tiene Alice estrategia ganadora.

C3-5.7★★★★★IMO Shortlist 2018 C7

Sea n2n \ge 2 un entero. Alice y Bob juegan el siguiente juego sobre un conjunto de nn objetos. En cada turno, el jugador activo elige un subconjunto SS de los objetos restantes con la restricción de que S|S| es una potencia de 22 (es decir, S{1,2,4,8,}|S| \in \{1, 2, 4, 8, \ldots\}), y retira SS. El jugador que retire el último objeto gana. ¿Para qué valores de nn tiene Alice estrategia ganadora?

C3-5.8★★★★★IMO Shortlist 2019 C8

Sea nn un entero positivo. En un tablero n×nn \times n, Alice y Bob juegan alternando turnos, empezando Alice. En cada turno, el jugador activo colorea una casilla no coloreada. Alice usa rojo y Bob usa azul. Al final, una fila es "ganada" por Alice si contiene más casillas rojas que azules; es ganada por Bob en caso contrario (si hay empate en una fila, no es ganada por nadie). Alice gana el juego si gana estrictamente más de la mitad de las filas. Demuestra que Alice tiene estrategia ganadora para todo nn impar.