Módulos / combinatoria-3 / Capítulo 3 — Método probabilístico / Lección 3.2

Linealidad de la esperanza y sus aplicaciones

Lección 3.2·Capítulo 3 — Método probabilístico·13 min·Piloto

Video en producción

El contenido pedagógico de esta lección ya está completo y lo puedes leer abajo. El video con la voz de Eduardo Espinoza Ramos se produce según la Política de IA.

Disclosure de IA: al publicarse, este contenido reproducirá digitalmente, con autorización expresa del autor, la voz y fisonomía de Eduardo Espinoza Ramos. Curaduría revisada por matemáticos profesionales. Política completa →

Objetivo de la lección

Dominar la linealidad de la esperanza como herramienta central del método probabilístico, entendiendo que no requiere independencia. Aplicarla a la prueba del número de Turán-Ramsey via método probabilístico, a la cota de Turán para el número de independencia ($\alpha(G) \ge \sum_v 1/d(v)$), y al problema del torneo: todo torneo con $n$ vértices tiene una caminata hamiltoniana. Identificar las variables indicadoras $\mathbf{1}_{\mathcal{A}_i}$ como las piezas constructivas.

La linealidad de la esperanza: trivial y profunda

La linealidad de la esperanza afirma que para cualesquiera variables aleatorias X1,X2,,XmX_1, X_2, \ldots, X_m (definidas sobre el mismo espacio, sin hipótesis de independencia ni distribución):

E[i=1mXi]=i=1mE[Xi]\mathbb{E}\left[\sum_{i=1}^{m} X_i\right] = \sum_{i=1}^{m} \mathbb{E}[X_i].

Que esto valga sin independencia es el punto crucial y no intuitivo. Normalmente pensar en valores esperados requiere describir la distribución conjunta completa. La linealidad dice: no importa cómo estén correlacionadas las XiX_i entre sí, la esperanza de la suma es la suma de las esperanzas.

Combinada con variables indicadorasXi=1AiX_i = \mathbf{1}_{\mathcal{A}_i} que vale 1 si ocurre el evento Ai\mathcal{A}_i y 0 si no — la linealidad convierte el cálculo de E[X]\mathbb{E}[X] en una suma de probabilidades: E[X]=iPr[Ai]\mathbb{E}[X] = \sum_i \Pr[\mathcal{A}_i]. El número de "instancias de la propiedad" en un objeto aleatorio es simplemente la suma de las probabilidades de cada posible instancia.

E[i=1m1Ai]=i=1mPr[Ai]\mathbb{E}\left[\sum_{i=1}^{m} \mathbf{1}_{\mathcal{A}_i}\right] = \sum_{i=1}^{m} \Pr[\mathcal{A}_i]

La cota de Turán para el número de independencia

El Teorema de Turán para conjuntos independientes (también llamado cota de Turán por el método probabilístico, o cota de Turán-Ramachandran) afirma: para todo grafo GG con nn vértices y mm aristas,

α(G)vV1d(v)+1ndˉ+1\alpha(G) \ge \displaystyle\sum_{v \in V} \frac{1}{d(v)+1} \ge \frac{n}{\bar{d}+1}

donde dˉ=2m/n\bar{d} = 2m/n es el grado medio. Esta cota es óptima asintóticamente para grafos aleatorios.

Prueba por método probabilístico. Tomamos una permutación uniformemente aleatoria σ\sigma de los vértices VV. Definimos S={vV:v viene antes que todos sus vecinos en σ}S = \{v \in V : v \text{ viene antes que todos sus vecinos en } \sigma\}. Afirmamos que SS es siempre un conjunto independiente. En efecto, si u,vSu, v \in S son adyacentes, entonces uu viene antes de todos sus vecinos (incluyendo vv) y vv viene antes de todos sus vecinos (incluyendo uu): pero entonces uu viene antes de vv y vv antes de uu, contradicción.

Calculamos E[S]\mathbb{E}[|S|] por linealidad: E[S]=vPr[vS]\mathbb{E}[|S|] = \sum_v \Pr[v \in S]. El vértice vv pertenece a SS si y solo si vv es el primero entre vv y sus d(v)d(v) vecinos en σ\sigma. Como los d(v)+1d(v)+1 vértices en {v}N(v)\{v\} \cup N(v) son igualmente probables de ser el primero en σ\sigma, Pr[vS]=1/(d(v)+1)\Pr[v \in S] = 1/(d(v)+1). Luego E[S]=v1/(d(v)+1)n/(dˉ+1)\mathbb{E}[|S|] = \sum_v 1/(d(v)+1) \ge n/(\bar{d}+1). Como Sα(G)|S| \le \alpha(G) siempre (S es independiente), concluimos α(G)E[S]n/(dˉ+1)\alpha(G) \ge \mathbb{E}[|S|] \ge n/(\bar{d}+1).

α(G)vV1d(v)+1ndˉ+1\alpha(G) \ge \sum_{v \in V} \frac{1}{d(v)+1} \ge \frac{n}{\bar{d}+1}

Torneos y caminatas hamiltonianas

Un torneo es un grafo completo con cada arista orientada. Una caminata hamiltoniana es un ordenamiento v1,v2,,vnv_1, v_2, \ldots, v_n de todos los vértices tal que vivi+1v_i \to v_{i+1} para todo ii.

Teorema. Todo torneo tiene al menos una caminata hamiltoniana.

Prueba por método probabilístico. Sea TT un torneo con nn vértices. Tomamos una permutación aleatoria σ=(v1,v2,,vn)\sigma = (v_1, v_2, \ldots, v_n) uniformemente aleatoria. Definimos XX = número de índices ii donde vivi+1v_i \to v_{i+1} (arcos "correctos"). Tenemos X=i=1n11vivi+1X = \sum_{i=1}^{n-1} \mathbf{1}_{v_i \to v_{i+1}}, y por linealidad E[X]=i=1n1Pr[vivi+1]=(n1)/2\mathbb{E}[X] = \sum_{i=1}^{n-1} \Pr[v_i \to v_{i+1}] = (n-1)/2 (pues por simetría cada arco en σ\sigma es correcto con probabilidad 1/21/2).

Esto solo dice que la permutación aleatoria tiene en promedio (n1)/2(n-1)/2 arcos correctos, lo que no es suficiente para construir una caminata hamiltoniana. La prueba completa por inducción es más limpia: ordena los vértices como v1,v2,,vnv_1, v_2, \ldots, v_n; si vivi+1v_i \to v_{i+1} para todo ii, terminamos. Si no, hay un jj con vj+1vjv_{j+1} \to v_j; entonces podemos intercambiar e iterar. Esta prueba constructiva es mejor aquí, pero el cálculo de esperanza sirve para determinar cuántas caminatas hamiltonianas existen en promedio en un torneo aleatorio.

La prueba correcta por el método probabilístico del teorema de torneos es vía la perspectiva del máximo: en cualquier permutación, se puede ver que el número de inversiones se puede reducir, pero aquí el método probabilístico se usa en la dirección contraria: para probar que el torneo aleatorio tiene un número de caminatas hamiltonianas que crece como n!/2n1n!/2^{n-1}, se usa que la permutación es hamiltoniana con probabilidad 1/2n11/2^{n-1}, y el torneo aleatorio tiene E[\mathbb{E}[caminatas]=n!/2n1] = n!/2^{n-1}.

El número de bisección y sparsificación

El número de bisección b(G)b(G) de un grafo GG con nn vértices es el mínimo número de aristas que hay que eliminar para partir VV en dos conjuntos de tamaño n/2n/2 (o n/2\lfloor n/2 \rfloor y n/2\lceil n/2 \rceil). La siguiente cota de Edwards-Erdős:

b(G)m2+n14b(G) \le \frac{m}{2} + \frac{n-1}{4}

se demuestra por el método probabilístico. Elegimos la bipartición aleatoriamente: cada vértice va a la parte AA o BB independientemente con probabilidad 1/21/2. El número esperado de aristas cruzadas es m/2m/2 (cada arista cruza con probabilidad 1/21/2), lo que da la primera parte. El ajuste +n14+\frac{n-1}{4} viene del método de la alteración para balancear las partes.

La cota de max-cut de Edwards. Sea GG un grafo con nn vértices y mm aristas. Existe un corte (bipartición de VV) con al menos m/2+(n1)/4m/2 + (n-1)/4 aristas cruzadas. La prueba elegante es por linealidad: el corte aleatorio tiene en promedio m/2m/2 aristas cruzadas; para optimizar hacia (n1)/4(n-1)/4 extra se usa el método de reordenamiento greedy sobre permutaciones. Esta cota es relevante porque la versión de maximización (encontrar el corte máximo) es un problema NP\mathsf{NP}-difícil en general, pero el método probabilístico da la cota no constructiva de forma inmediata.

MaxCut(G)m2+n14\mathrm{MaxCut}(G) \ge \frac{m}{2} + \frac{n-1}{4}

El segundo momento: la desigualdad de Chebyshev y el método

Cuando el método del primer momento da E[X]\mathbb{E}[X] \to \infty pero queremos demostrar que X>0X > 0 con alta probabilidad (no solo con probabilidad positiva), usamos el método del segundo momento: la desigualdad de Paley-Zygmund.

Desigualdad de Paley-Zygmund. Para X0X \ge 0: Pr[X>0](E[X])2E[X2]\Pr\left[X > 0\right] \ge \dfrac{(\mathbb{E}[X])^2}{\mathbb{E}[X^2]}.

Si E[X2]=O((E[X])2)\mathbb{E}[X^2] = O((\mathbb{E}[X])^2), entonces Pr[X>0]=Ω(1)\Pr[X > 0] = \Omega(1), lo que demuestra que X>0X > 0 con probabilidad acotada por abajo. Este método es la herramienta para demostrar umbrales en grafos aleatorios: R(k,k)R(k,k) tiene cota inferior 2k/22^{k/2} por primer momento, pero la cota superior 4k4^k (que sigue de R(k,k)(2k2k1)4kR(k,k) \le \binom{2k-2}{k-1} \le 4^k) requiere argumentos de segundo momento o la recurrencia de Ramsey.

La dicotomía primer/segundo momento es omnipresente: el primer momento demuestra existencia, el segundo momento demuestra alta probabilidad. Para problemas olímpicos, el primer momento es casi siempre suficiente; el segundo momento aparece en problemas donde se pide probar que el número de configuraciones es grande, o estimar con precisión.

Aplicación olímpica: problemas de coloración por esperanza

Problema modelo (IMO Shortlist 2014 C2). Sea n2n \ge 2 y sea kk el número mínimo de colores necesarios para colorear los enteros 1,2,,n1, 2, \ldots, n de modo que no existan a,ba, b del mismo color con a+b=2ta + b = 2^t para ningún tt. Prueba que k1+log2nk \le 1 + \lfloor \log_2 n \rfloor.

La prueba usando el método probabilístico: consideramos la coloración aleatoria con cc colores. El número esperado de pares monocromáticos prohibidos se calcula por linealidad como la suma sobre todos los pares (a,b)(a,b) con a+ba + b potencia de 2, de Pr[mismo color]=1/c\Pr[\text{mismo color}] = 1/c. Si cc es suficientemente grande para que esta esperanza sea menor que la mitad de la cantidad de colores disponibles, existe una coloración válida. La estimación cuidadosa de cuántos pares prohibidos hay (a lo sumo nlog2n/2n \log_2 n / 2 pares) y la condición de esperanza <1< 1 dan la cota buscada.

El patrón: (1) colorear aleatoriamente, (2) definir XX = número de violaciones, (3) calcular E[X]\mathbb{E}[X] por linealidad, (4) pedir E[X]<1\mathbb{E}[X] < 1 para obtener existencia. Los detalles combinatorios de cada problema viven en el paso (3), pero la estructura del argumento es siempre la misma.

Problemas del Capítulo 3 — con solución

8 problemas verificados. Intenta cada uno antes de abrir la solución.

C3-3.1★★★IMO Shortlist 2014 C2

Sea n2n \ge 2 un entero. Determina el número mínimo kk de colores necesarios para colorear los enteros 1,2,,n1, 2, \ldots, n de manera que no existan enteros a<ba < b del mismo color tales que bab - a es una potencia de 2 (incluyendo 20=12^0 = 1).

C3-3.2★★★Erdős 1947 / IMO Nivel selectivo

Demuestra que R(k,k)>2k/2R(k,k) > 2^{k/2} para todo k3k \ge 3. Más precisamente, muestra que si n<2k/2n < 2^{k/2}, existe una 2-coloración de las aristas de KnK_n sin clique monocromático de tamaño kk.

C3-3.3★★★★Método de la alteración / Erdős-Spencer

Sea GG un grafo con nn vértices y mm aristas. Demuestra que α(G)n2ln(2m/n)m/n\alpha(G) \ge \dfrac{n}{2} \cdot \dfrac{\ln(2m/n)}{m/n} cuando mnm \ge n. En particular, deduce que si GG es dd-regular entonces α(G)nlnd2d\alpha(G) \ge \dfrac{n \ln d}{2d}.

C3-3.4★★★★IMO Shortlist 2011 C6

En un torneo de nn jugadores (competición donde cada par juega exactamente una vez y no hay empates), se dice que el jugador AA "supera en dos pasos" al jugador BB si AA venció a CC y CC venció a BB para algún jugador CC. Sea f(T)f(T) el número de pares ordenados (A,B)(A, B) con ABA \ne B tales que AA supera en dos pasos a BB. Demuestra que existe un torneo TT con nn jugadores para el cual f(T)n(n1)(n3)/8f(T) \ge n(n-1)(n-3)/8, y que esta cota se alcanza cuando nn es impar.

C3-3.5★★★★Lema Local de Lovász / Problema de 2-coloración

Sea HH un hipergrafo kk-uniforme (cada arista tiene exactamente kk vértices, con k2k \ge 2) tal que cada arista comparte vértices con a lo sumo dd otras aristas. Demuestra que si d2k2/ed \le 2^{k-2}/e entonces HH admite una 2-coloración de vértices sin aristas monocromáticas.

C3-3.6★★★★IMO 1987 Problema 2 / Ramsey clásico

Sea n2n \ge 2 y considera todas las 2(n2)2^{\binom{n}{2}} 2-coloraciones de las aristas de KnK_n. Demuestra que el número de tales coloraciones que contienen al menos un triángulo monocromático es mayor que la mitad del total, para n6n \ge 6. ¿Qué dice esto sobre el número de Ramsey R(3,3)R(3,3)?

C3-3.7★★★★★IMO Shortlist 2007 C6

Sea a1,a2,,ana_1, a_2, \ldots, a_n una permutación de 1,2,,n1, 2, \ldots, n. Una subsucesión ai1,ai2,,aika_{i_1}, a_{i_2}, \ldots, a_{i_k} con i1<i2<<iki_1 < i_2 < \cdots < i_k se llama **mm-buena** si aij+1aijm|a_{i_{j+1}} - a_{i_j}| \le m para todo j=1,,k1j = 1, \ldots, k-1. Demuestra que para todo m1m \ge 1 existe una permutación de 1,,n1, \ldots, n que no tiene ninguna mm-buena subsucesión creciente de longitud mayor que 2mn2\sqrt{mn}.

C3-3.8★★★★★IMO 2014 Problema 6

Sea a1<a2<<ana_1 < a_2 < \cdots < a_n una secuencia de nn enteros. Un subconjunto {ai1,ai2,,aik}\{a_{i_1}, a_{i_2}, \ldots, a_{i_k}\} con i1<i2<<iki_1 < i_2 < \cdots < i_k se llama bueno si aiuaiu1a_{i_u} - a_{i_{u-1}} divide a aiu+1aiu1a_{i_{u+1}} - a_{i_{u-1}} para todo 1<u<k1 < u < k. Sea f(n)f(n) el mínimo valor de kk tal que toda secuencia de nn enteros tiene un subconjunto bueno de tamaño k\ge k. Demuestra que f(n)Ω(logn)f(n) \ge \Omega(\log n), es decir f(n)clog2nf(n) \ge c \log_2 n para alguna constante c>0c > 0.