Módulos / combinatoria-3 / Capítulo 3 — Método probabilístico / Lección 3.1

La idea central: existencia sin construcción explícita

Lección 3.1·Capítulo 3 — Método probabilístico·11 min·Piloto

Video en producción

El contenido pedagógico de esta lección ya está completo y lo puedes leer abajo. El video con la voz de Eduardo Espinoza Ramos se produce según la Política de IA.

Disclosure de IA: al publicarse, este contenido reproducirá digitalmente, con autorización expresa del autor, la voz y fisonomía de Eduardo Espinoza Ramos. Curaduría revisada por matemáticos profesionales. Política completa →

Objetivo de la lección

Comprender el principio filosófico del método probabilístico: demostrar la existencia de un objeto combinatorio sin construirlo, mostrando que un objeto elegido aleatoriamente satisface las propiedades deseadas con probabilidad positiva. Dominar las dos variantes básicas: $\Pr[\mathcal{A}] > 0$ implica existencia, y si $\mathbb{E}[X] > k$ entonces algún valor supera $k$. Aplicar el método a la existencia de grafos con número cromático y cintura grandes, y a la primera prueba probabilística de Erdős del número de Ramsey $R(k,k)$.

La revolución de Erdős: objetos que existen pero nadie ha construido

En 1947, Paul Erdős publicó una prueba de dos páginas que demostró R(k,k)>2k/2R(k,k) > 2^{k/2} —estableciendo que los números de Ramsey crecen al menos exponencialmente. La prueba no construía ningún grafo específico. En cambio, Erdős argumentó: si coloreo al azar las aristas de KnK_n con dos colores, la probabilidad de que exista un clique monocromático de tamaño kk es menor que 1, luego existe una 2-coloración sin clique monocromático de tamaño kk.

Este argumento fundó el método probabilístico: una técnica de existencia pura. Su poder reside en la asimetría: demostrar que un objeto existe es mucho más fácil que construirlo explícitamente. Hoy, décadas después, muchos de los grafos cuya existencia Erdős probó así todavía no se han construido explícitamente.

El principio fundamental es engañosamente simple. Sea Ω\Omega un espacio de probabilidad sobre objetos combinatorios (grafos, coloraciones, permutaciones, conjuntos). Sea A\mathcal{A} la propiedad que queremos que el objeto satisfaga. Si Pr[A]>0\Pr[\mathcal{A}] > 0, entonces existe un objeto en Ω\Omega que satisface A\mathcal{A}. El paso clave es elegir bien el espacio de probabilidad Ω\Omega.

En la práctica, dos herramientas dominan: (1) calcular Pr[A]\Pr[\mathcal{A}] directamente y mostrar que es positiva, y (2) usar la esperanza: si XX es una variable aleatoria con E[X]>c\mathbb{E}[X] > c, entonces con probabilidad positiva X>cX > c, luego existe un objeto donde X>cX > c. El segundo método es más flexible y da lugar a técnicas como la alteración.

El argumento original de Erdős: cotas para $R(k,k)$

Sea nn un entero que fijaremos después. Coloreamos cada arista de KnK_n independientemente de rojo o azul con probabilidad 1/21/2 cada una. Sea SS un conjunto de kk vértices. La probabilidad de que SS induzca un clique monocromático (todos rojo o todos azul) es 2(1/2)(k2)=21(k2)2 \cdot (1/2)^{\binom{k}{2}} = 2^{1-\binom{k}{2}}.

Sea XX el número de cliques monocromáticos de tamaño kk. Por linealidad de la esperanza:

E[X]=(nk)21(k2)\mathbb{E}[X] = \binom{n}{k} \cdot 2^{1-\binom{k}{2}}.

Si E[X]<1\mathbb{E}[X] < 1, entonces Pr[X1]E[X]<1\Pr[X \ge 1] \le \mathbb{E}[X] < 1, lo que implica Pr[X=0]>0\Pr[X = 0] > 0. Luego existe una 2-coloración de KnK_n sin clique monocromático de tamaño kk, y esto prueba R(k,k)>nR(k,k) > n.

La condición E[X]<1\mathbb{E}[X] < 1 se satisface cuando (nk)<2(k2)1\binom{n}{k} < 2^{\binom{k}{2}-1}. Usando la cota (nk)nk/k!\binom{n}{k} \le n^k / k! y la estimación de Stirling k!(k/e)kk! \ge (k/e)^k, si n=2k/2n = \lfloor 2^{k/2} \rfloor se verifica fácilmente que la condición se cumple para kk suficientemente grande. Esto establece:

R(k,k)>2k/2R(k,k) > 2^{k/2}

El método de la alteración

A veces la probabilidad de que el objeto aleatorio satisfaga la propiedad es cero, pero podemos alterar el objeto para repararlo. La idea es: generar un objeto aleatorio, identificar los "defectos", y eliminarlos con un coste controlado.

Ejemplo: grafos de cintura grande y número cromático grande. Para todo k1k \ge 1, existe un grafo con número cromático χ(G)k\chi(G) \ge k y cintura g(G)kg(G) \ge k (sin ciclos cortos). Este teorema de Erdős (1959) es uno de los resultados más sorprendentes de la combinatoria: la intuición dice que la presencia de triángulos (y ciclos cortos) es lo que "fuerza" colores, pero resulta que se puede tener un número cromático arbitrariamente grande sin ningún ciclo corto.

La prueba usa el método de la alteración. Tomamos G=G(n,p)G = G(n,p) con p=n1/k1p = n^{1/k - 1}. Con la elección correcta de nn: (i) el número esperado de ciclos de longitud <k< k es o(n)o(n), y (ii) el número de independencia satisface α(G)<n/2k\alpha(G) < n/2k con alta probabilidad. Luego eliminamos un vértice de cada ciclo corto: perdemos o(n)o(n) vértices. El grafo resultante GG' tiene cintura k\ge k. Además, como α(G)α(G)<n/2k\alpha(G') \le \alpha(G) < n/2k y el número de vértices de GG' es n/2\ge n/2 (solo se eliminaron o(n)o(n) vértices), el número cromático de GG' satisface χ(G)V(G)/α(G)>k\chi(G') \ge |V(G')|/\alpha(G') > k.

El modelo $G(n,p)$: grafos de Erdős-Rényi

El espacio probabilístico más utilizado en combinatoria es el modelo G(n,p)G(n,p): el grafo aleatorio en nn vértices donde cada una de las (n2)\binom{n}{2} aristas se incluye independientemente con probabilidad pp.

Propiedades clave de G(n,p)G(n,p): (1) El grado esperado de cada vértice es (n1)pnp(n-1)p \approx np para pp pequeño. (2) Si p=c/np = c/n con c<1c < 1, la componente conexa más grande tiene O(logn)O(\log n) vértices con alta probabilidad (w.a.p.). Si c>1c > 1, existe una única componente gigante de tamaño Θ(n)\Theta(n) w.a.p. — este es el umbral de conectividad, un fenómeno de umbral brusco típico en grafos aleatorios. (3) La distribución del número de triángulos es aproximadamente Poisson con media (n3)p3\binom{n}{3}p^3 cuando np30np^3 \to 0.

El umbral para la propiedad P\mathcal{P} es el valor p(n)p^*(n) tal que si ppp \gg p^* entonces G(n,p)G(n,p) satisface P\mathcal{P} w.a.p., y si ppp \ll p^* no la satisface w.a.p. Este concepto de umbral, profundamente desarrollado por Bollobás y otros, es fundamental en la combinatoria probabilística moderna.

En olimpiadas, G(n,p)G(n,p) aparece raramente de forma explícita, pero el pensamiento "¿qué pasa si elijo los objetos aleatoriamente?" es exactamente el motor del método probabilístico. Siempre que busques demostrar existencia en combinatoria sin construir explícitamente, pregúntate: ¿cuál sería el espacio de probabilidad natural? ¿qué distribución garantiza que la propiedad se cumpla con probabilidad positiva?

Técnica: el método del primer momento

El método del primer momento (o método de la esperanza) es la herramienta más básica del método probabilístico:

Lema. Para cualquier variable aleatoria X0X \ge 0 entero-valorada: (i) Pr[X>0]E[X]\Pr[X > 0] \le \mathbb{E}[X]. (ii) Si E[X]>0\mathbb{E}[X] > 0 entonces Pr[X>0]>0\Pr[X > 0] > 0. (iii) Pr[XE[X]]>0\Pr[X \ge \mathbb{E}[X]] > 0 (luego existe un resultado donde XE[X]X \ge \mathbb{E}[X]).

La variante (iii) dice: si E[X]=μ\mathbb{E}[X] = \mu, entonces algún resultado en el espacio tiene XμX \ge \mu. Esto es útil para demostrar la existencia de configuraciones con muchas instancias de una propiedad.

Aplicación en IMO Shortlist C6, 2011. En un torneo (grafo dirigido completo) con nn vértices, se define f(T)f(T) como el número de pares ordenados (a,b)(a,b) con aba \to b y bb alcanzable desde aa en exactamente 2 pasos. Prueba que existe un torneo con f(T)n(n1)(n3)/8f(T) \ge n(n-1)(n-3)/8 cuando nn es impar. La prueba usa que el torneo aleatorio uniforme tiene esta esperanza exacta, calculada por linealidad.

Pr[X=0]1(E[X])2E[X2](segunda cota de Chebyshev)\Pr[X = 0] \le 1 - \frac{(\mathbb{E}[X])^2}{\mathbb{E}[X^2]} \quad \text{(segunda cota de Chebyshev)}

La señal olímpica del método probabilístico

En una olimpiada, la señal de que se pide el método probabilístico es típicamente: "Demuestra que existe una [coloracioˊn/seleccioˊn/orientacioˊn/funcioˊn][coloración / selección / orientación / función] con la propiedad P\mathcal{P}" o "Demuestra que en todo [objeto][objeto] de tamaño nn existe un sub-[objeto][objeto] de tamaño f(n)f(n)".

El diagrama de ataque es: (1) Elegir el espacio probabilístico correcto (lo más natural posible). (2) Definir la variable aleatoria XX que cuenta las "violaciones" de P\mathcal{P} o las "instancias" de P\mathcal{P}. (3) Calcular E[X]\mathbb{E}[X] por linealidad. (4) Concluir existencia: si XX cuenta violaciones y E[X]<1\mathbb{E}[X] < 1, existe un objeto con X=0X = 0; si XX cuenta instancias, existe un objeto con XE[X]X \ge \mathbb{E}[X].

En la lección 3.2 veremos por qué la linealidad de la esperanza — el hecho de que E[X1+X2]=E[X1]+E[X2]\mathbb{E}[X_1 + X_2] = \mathbb{E}[X_1] + \mathbb{E}[X_2] incluso cuando X1,X2X_1, X_2 no son independientes — es el corazón computacional del método. Esta propiedad, que parece trivial, tiene consecuencias combinatorias profundísimas.

Problemas del Capítulo 3 — con solución

8 problemas verificados. Intenta cada uno antes de abrir la solución.

C3-3.1★★★IMO Shortlist 2014 C2

Sea n2n \ge 2 un entero. Determina el número mínimo kk de colores necesarios para colorear los enteros 1,2,,n1, 2, \ldots, n de manera que no existan enteros a<ba < b del mismo color tales que bab - a es una potencia de 2 (incluyendo 20=12^0 = 1).

C3-3.2★★★Erdős 1947 / IMO Nivel selectivo

Demuestra que R(k,k)>2k/2R(k,k) > 2^{k/2} para todo k3k \ge 3. Más precisamente, muestra que si n<2k/2n < 2^{k/2}, existe una 2-coloración de las aristas de KnK_n sin clique monocromático de tamaño kk.

C3-3.3★★★★Método de la alteración / Erdős-Spencer

Sea GG un grafo con nn vértices y mm aristas. Demuestra que α(G)n2ln(2m/n)m/n\alpha(G) \ge \dfrac{n}{2} \cdot \dfrac{\ln(2m/n)}{m/n} cuando mnm \ge n. En particular, deduce que si GG es dd-regular entonces α(G)nlnd2d\alpha(G) \ge \dfrac{n \ln d}{2d}.

C3-3.4★★★★IMO Shortlist 2011 C6

En un torneo de nn jugadores (competición donde cada par juega exactamente una vez y no hay empates), se dice que el jugador AA "supera en dos pasos" al jugador BB si AA venció a CC y CC venció a BB para algún jugador CC. Sea f(T)f(T) el número de pares ordenados (A,B)(A, B) con ABA \ne B tales que AA supera en dos pasos a BB. Demuestra que existe un torneo TT con nn jugadores para el cual f(T)n(n1)(n3)/8f(T) \ge n(n-1)(n-3)/8, y que esta cota se alcanza cuando nn es impar.

C3-3.5★★★★Lema Local de Lovász / Problema de 2-coloración

Sea HH un hipergrafo kk-uniforme (cada arista tiene exactamente kk vértices, con k2k \ge 2) tal que cada arista comparte vértices con a lo sumo dd otras aristas. Demuestra que si d2k2/ed \le 2^{k-2}/e entonces HH admite una 2-coloración de vértices sin aristas monocromáticas.

C3-3.6★★★★IMO 1987 Problema 2 / Ramsey clásico

Sea n2n \ge 2 y considera todas las 2(n2)2^{\binom{n}{2}} 2-coloraciones de las aristas de KnK_n. Demuestra que el número de tales coloraciones que contienen al menos un triángulo monocromático es mayor que la mitad del total, para n6n \ge 6. ¿Qué dice esto sobre el número de Ramsey R(3,3)R(3,3)?

C3-3.7★★★★★IMO Shortlist 2007 C6

Sea a1,a2,,ana_1, a_2, \ldots, a_n una permutación de 1,2,,n1, 2, \ldots, n. Una subsucesión ai1,ai2,,aika_{i_1}, a_{i_2}, \ldots, a_{i_k} con i1<i2<<iki_1 < i_2 < \cdots < i_k se llama **mm-buena** si aij+1aijm|a_{i_{j+1}} - a_{i_j}| \le m para todo j=1,,k1j = 1, \ldots, k-1. Demuestra que para todo m1m \ge 1 existe una permutación de 1,,n1, \ldots, n que no tiene ninguna mm-buena subsucesión creciente de longitud mayor que 2mn2\sqrt{mn}.

C3-3.8★★★★★IMO 2014 Problema 6

Sea a1<a2<<ana_1 < a_2 < \cdots < a_n una secuencia de nn enteros. Un subconjunto {ai1,ai2,,aik}\{a_{i_1}, a_{i_2}, \ldots, a_{i_k}\} con i1<i2<<iki_1 < i_2 < \cdots < i_k se llama bueno si aiuaiu1a_{i_u} - a_{i_{u-1}} divide a aiu+1aiu1a_{i_{u+1}} - a_{i_{u-1}} para todo 1<u<k1 < u < k. Sea f(n)f(n) el mínimo valor de kk tal que toda secuencia de nn enteros tiene un subconjunto bueno de tamaño k\ge k. Demuestra que f(n)Ω(logn)f(n) \ge \Omega(\log n), es decir f(n)clog2nf(n) \ge c \log_2 n para alguna constante c>0c > 0.