Entonces se le acercó Pedro y le preguntó: “Señor, ¿cuántas veces he de perdonar a mi hermano si peca contra mí? ¿Hasta siete veces?” Dícele Jesús: “No digo yo hasta siete veces, sino hasta setenta veces siete”. (Mt. 18,21-22)

1. Presentación:

En la cita evangélica del epígrafe, está claro que la respuesta de Jesús a Pedro no pretende establecer una cota numérica, sino enfatizar que el perdón debe otorgarse un número ilimitado de veces. Y está claro también que no habría querido oscurecer su respuesta con complicaciones aritméticas, incomprensibles para un pescador galileo de hace veintiún siglos.

Sin embargo, en otras circunstancias y con otro auditorio, ¿no habría empleado esos mismos números para obtener resultados que relievaran más el concepto? Concretamente, podía haber recurrido al uso de exponentes - ya Euclides, y también Arquímedes, más de doscientos años antes, los habían introducido - y haber dicho: “hasta 7 a la 70 veces”. O tal vez “hasta 70 a la 7 veces”. ¿O hay alguna interpretación oculta en su respuesta, reservada a siglos posteriores? ¿Cuál es la alternativa más contundente para el efecto?.

Pensando en esto me quedé después de la liturgia del XXIV domingo ordinario, de cuyo evangelio he tomado el epígrafe que motiva este artículo.

No fue difícil, aún sin recurrir más que a una rápida estimación mental, percatarme de que \(7^{70}\) es mucho mayor que \(70^7\): calculemos su cociente, que deberá resultar mucho mayor que 1. Si usamos logaritmos comunes: \[log(\frac{7^{70}}{70^7}) = log(7^{70}) - log(70^7) = 70 \times log(7)-7 \times (1+log(7)) = 63 \times log(7)-7\] Obviamente, esta diferencia es positiva, como se puede concluir a partir de la conocida relación \(2^{10} \sim 10^3\), de donde \(log(2) \sim 0.3\), y \(log(3.2) = log(32)-1 = log(2^5)-1 = 5 \times log(2)-1 \sim 0.5\). Si consideramos que \(7 > 2 \times 3.2\), podemos decir que \(log(7) > 0.3+0.5 = 0.8\), de modo que \(63 \times log(7) - 7 > 50.4 - 7 = 43.4 > 0\). El cociente que nos interesa, entonces, no sólo será mayor que 1, sino que tendrá más de \(44\) cifras enteras.

Ya recurriendo a una calculadora se encuentra que \(log(7^{70})-log(70^7) = 46.24...\), de manera que el cociente \(\frac{7^{70}}{70^7}\) es el número positivo \(1.7425... \times 10^{46}\)).

De donde el mayor número expresable utilizando sólo \(7\) y \(70\) tiene sesenta cifras enteras y es \(7^{70} = 1.435... \times 10^{59}\) (ya considerablemente grande en cualquier contexto).

Pero, desde la perspectiva actual, quedan aún interpretaciones por considerar: no sólo el producto \(70 \times 7\), sino el número entero de \(70\) dígitos, todos iguales a \(7\). No consta aquí, pues es largo de escribir y de leer, y es fácil equivocarse en el conteo. Sin embargo, puede expresarse más cómodamente si lo consideramos como la suma de la progresión geométrica \(7 + 70 + 700 + ... + 7 \times 10^{69}\), de razón \(r = 10\), cuyo primer término es \(a = 7\) y el último \(l = 7E69\). De acuerdo con la conocida fórmula, la suma es: \[S = \frac{l \times r - a}{r - 1} = \frac{7E70 - 7}{10-1} = \frac{7}{9} (1E70 - 1)\] Expresado con 4 cifras significativas redondeadas, corresponde a \(7.778 E69\), mucho mayor que \(7^{70}\), y cerca de diez millones de veces mayor que la estimación de Arquímedes para el número de granos de arena que caben en el universo (según el modelo de Aristarco de Samos).
¡Esta es, pues, la respuesta que la sabiduría divina, al contestar a Pedro, proyectaría hacia tiempos futuros, en que ya habrían de conocerse el sistema decimal y la notación posicional!

1.1 Una variación sobre el tema.

Se puede elucubrar mucho a propósito de este número. Llamémosle \(\mathcal{N}_{70}\). Como ejercicio, hallemos la suma de \(n\) términos de la secuencia {\(\mathcal{N}_i\)}: \[\begin{eqnarray*} S_n = \sum_{i=1}^{n}\mathcal{N}_i = \sum_{i=1}^{n} \big( \frac{7}{9}\times (10^{i} - 1) \big) = \frac{7}{9}\Big(\sum_{i=1}^{n} 10^i -n \Big) \end{eqnarray*}\]

La suma \(T_i = \sum_{i=1}^{n} 10^i\) corresponde a una progresión geométrica con \(a = 10\), \(r = 10\), \(l = 10^n\). Aplicando otra vez la respectiva fórmula \(\frac{l \times r - a}{r - 1}\) resulta: \[T_i = \frac{10^{n+1}-10}{9}\], que al ser reemplazada nos da finalmente: \[S_n = \frac{7}{9} \big(\frac{10^{n+1}-10}{9} - n \big) = \frac{7}{81}(10^{n+1}-9n-10)\]

\(S_{70} = 8641975308641975308641975308641975308641975308641975308641975308641920\), es un número casi perfectamente periódico, calculado con un breve guión MATLAB sin requerimiento especial de precisión, no a partir de la función deducida, sino reproduciendo el algoritmo de la suma manual.

1.2 Lo que aún queda.

Una vez resuelta la incógnita planteada en el título, queda aún algo más por resolver: ¿Cuál es el mayor número que puede alcanzarse al hacer una operación aritmética sobre dos números reales positivos cualesquiera, \(a\) y \(b\)? ¿Cuál es mayor, \(a^b\) o \(b^a\)?
En el ejemplo prevaleció el caso que usaba el menor número como base, pero no es difícil convencerse de que no siempre es así. Bastan dos contraejemplos: \(a =1\), ya que \(1^b < b^1, \forall _{b>1}\); y el par \((a,b) = (2,3)\), pues \(2^3 < 3^2\), pese a que \(2 < 3\).

Lo que sigue analiza el asunto y busca exponer con sencillez el panorama de las soluciones. Se ha usado el ambiente de visualización y programación MATLAB.

2. Solución:

2.1. Definición de funciones adecuadas.

Se trata de determinar en qué intervalos de \(\mathbb{R}^+\) se cumple que \(b^a \geq a^b\) y en cuáles no. Para estudiarlo, buscamos una función adecuada . La más directa sería la que expresa, para cualquier valor de \(x\), la diferencia \(g_a(x) = x^a - a^x\), cuyo parámetro \(a\) representa a uno de los dos números en cuestión, mientras el argumento \(x\) representa al otro.

Sin embargo, como vimos en el ejemplo, los valores que pueden surgir al evaluar esta función pueden ser enormes y algo incómodos de manejar, lo cual sugiere la conveniencia de utilizar el equivalente logarítmico: \[x^a \geq a^x \Leftrightarrow a \times ln(x) \geq x \times ln(a) \Leftrightarrow \frac{ln(x)}{ln(a)} \geq \frac{x}{a} \Leftrightarrow \frac{ln(x)}{ln(a)} - \frac{x}{a} \geq 0\] para valores de \(a\) y \(x\) mayores que 1. Conviene asimismo utilizar ahora logaritmos naturales (\(ln(x)\)). La función que usaremos, es, entonces: \[\begin{equation} f_a(x) = \frac{ln(x)}{ln(a)} - \frac{x}{a} \quad , \quad a \neq 0. \end{equation}\]

continua y derivable para \((a,x) > 0\). Estudiaremos en qué subintervalos es menor, igual o mayor que cero, concretándonos por ahora al intervalo \((1,\infty)\).

2.2. Dominio y alcance:

El dominio de \(f_a\) es \(\mathbb{R}^+\), es decir \((0,\infty)\), pues los logaritmos reales están definidos sólo en ese intervalo.

Su derivada \(\frac{dy}{dx} = \frac{1}{x \times ln(a)} - \frac{1}{a}\) se anula únicamente en \(x = \frac{a}{ln(a)}\) y es positiva a la izquierda de ese punto y negativa a la derecha. De modo que \(f_a(x)\) tiene ahí su punto máximo \(P\), cuya ordenada es \(f_a(\frac{a}{ln(a)}) = \frac{ln(a) - ln(ln(a)) - 1}{ln(a)}\)

Este valor es positivo para \((a,x) > 1\), lo cual indica que es el punto más alto perteneciente al intervalo donde \(\frac{ln(x)}{ln(a)} - \frac{x}{a} \geq 0\), que estamos buscando. Por ejemplo, cuando \(a = 2\) el máximo de \(f_2(x)\) es el punto \(P \leftrightarrow (2.8854,0.08607)\), donde la diferencia \(x^a - a^x\) es la mayor de todas.

Como la función \(f_a\) es primero creciente y luego decreciente, su alcance es \((-\infty,\frac{ln(a) - ln(ln(a)) - 1}{ln(a)}]\).

Si bien se la puede graficar directamente, es más instructivo representar sus dos componentes. Definimos, entonces, en el mismo dominio, otras dos funciones: \(f_{1a}\) y \(f_{2a}\), tales que \(f_a = f_{1a} - f_{2a}\) para \(a \neq 0\): \[\begin{eqnarray*} f_{1a}(x) & = & \frac{ln(x)}{ln(a)} \quad , a \neq 1 \\ f_{2a}(x) & = & \frac{x}{a} \quad \quad , a \neq 0 \end{eqnarray*}\]

2.3. Intersecciones e intervalo buscado:

Al graficar las dos funciones para el mismo valor del parámetro \(a\) en el plano coordenado podemos apreciar que \(f_{1a}(x)\) describe una curva convexa mientras \(f_{2a}(x)\) es una recta ascendente. Las intersecciones de las dos son las dos únicas soluciones de la ecuación \(f_a(x) = 0\) y marcan los extremos del intervalo que nos interesa.

Una obvia solución es \(x = a\), puesto que \(f_a(a) = \frac{ln(a)}{ln(a)} - \frac{a}{a} = 0\). Usando \(g_a(x)\), análogamente, obtenemos \(g_a(a) = a^a - a^a = 0\). Interesa, entonces, hallar la otra solución.

Figura 1

En la Figura 1 pueden verse los gráficos para \(a = 2\) y \(a = 7\). El guión MATLAB que los elaboró calculó la solución en la que \(x \neq a\), mediante el método numérico de Newton-Raphson, e imprimió (registrando sólo 4 dígitos decimales) el intervalo donde \(x^a \geq a^x\). Nótese que, conforme ya se había intuido, en el caso de \(a = 2\) la raíz igual a \(a\) es el extremo izquierdo del intervalo, mientras cuando \(a = 7\) es el derecho, como sucederá a partir de algún valor de \(a\) que se encuentra en \([2,3]\) y que calcularemos más adelante.

Del segundo caso (\(a = 7\)) obtenemos, además, la respuesta al problema inicialmente planteado: el intervalo donde \(x^7 \geq 7^x\) no contiene el valor \(x = 70\). Por consiguiente, \(70^7 < 7^{70}\). Obviamente, usando \(a = 70\) podríamos igualmente comprobar en qué intervalo \(x^{70} \geq 70^x\), y el valor \(x = 7\) estará en él, corroborando lo dicho.

2.4. Vista panorámica:

Si bien el guión utilizado anteriormente puede darnos los resultados de casos particulares, no presenta un panorama suficientemente general de la solución. Se puede elaborar un gráfico global, que permita formular la regla buscada.

2.4.1 Usar los intervalos en delimitar las zonas:

Una vez escogido el intervalo de análisis \(\alpha = (1,a_{max}]\) y un paso conveniente, lo recorremos asignando cada vez un valor a \(a \in \alpha\), y para cada valor determinamos el intervalo en el que \(x^a >= a^x\). Como ya se dijo, este proceso lo realiza el algoritmo de Newton, de orden de convergencia cuadrático, y, con la velocidad actual de los procesadores de punto flotante, la vecindad entre las soluciones para valores de \(a\) vecinos, y la forma regular de la función cuyos ceros se buscan, el proceso es prácticamente transparente. Sólo conviene recordar que, al calcular el extremo diferente (de \(a\)) hay que recordar que en ciertas zonas será el izquierdo y en otras el derecho. De acuerdo con eso se deberá escoger la aproximación inicial \(x_0\).

Conviene visualizar a este proceso como análogo a la evaluación de una función. Pero, en lugar de tener una fórmula explícita para encontrar \(x\), como \(x = h(a)\), que dicte las operaciones necesarias, tenemos la función implícita \(f_a(x) = 0\), (por ejemplo \(a \times ln(x) - x \times ln(a) = 0\)) y al encontrar la raíz no trivial de esta ecuación sólo estamos realizando las operaciones necesarias para hallar la \(x \neq a\) a partir de \(a\), tal como en el caso anterior, y de un algoritmo - es decir, una secuencia finita y perfectamente determinada de operaciones. La única diferencia es que ahora el algoritmo es iterativo.

Asociamos a cada \(a\) considerada los extremos de su intervalo en dos estructuras diferentes, \(\alpha\), ya existente, y \(\beta\), que contendrá los valores de los extremos diferentes. Estas estructuras irán formando los lugares geométricos que limiten la zona del plano donde \(x^a > a^x\).

Para los primeros valores de \(a\), es decir, los que están más cerca de 1, los intervalos tienden a ser amplios: \(a\) en el extremo izquierdo, y un extremo derecho lejano. Por ejemplo, a un valor \(a = 1.01\) le corresponde un extremo derecho de 658.8055. Pero rápidamente disminuye esa distancia: para \(a = 1.21\), ya el extremo derecho está en 18.5321.

Por esta razón, al graficar los puntos guardados en \(\beta\) en la Figura 2, la curva resultante es asintótica a \(x = 1\), y se va separando de la asíntota conforme crece \(a\). Como por otro lado, según lo veremos, es simétrica con respecto a \(y = x\), tiene también asíntota horizontal \(y = 1\).

En cambio, el gráfico de los puntos de \(\alpha\) da, naturalmente, la recta \(y = x\), es decir, la bisectriz del primer cuadrante.

Panorama general
Figura 2

En la Figura 2 se han colocado en el eje horizontal los valores de \(a\) y en el vertical los de \(b\). Los extremos de cada intervalo buscado están representados en dos curvas: la azul (recta) corresponde al extremo donde \(a = b\), mientras la roja (tomada de \(\beta\)) es el lugar geométrico de la otra solución, que por simplicidad ha sido etiquetada como \(a \neq b\), aunque esta desigualdad no se cumple en el punto de intersección de ambas curvas.

En cada ordenada, los extremos de un segmento horizontal \(y = b\) que se trace de una curva a otra representarán los dos extremos del intervalo buscado \(I_b\) (en el cual \(a^b \geq b^a\)) para ese valor de \(b\). La longitud de este segmento se hace cero para una ordenada igual a la del punto de intersección de las dos curvas, y crece conforme se aleja de ella, tanto hacia arriba como hacia abajo, aunque en este último caso tiene espacio limitado por la asíntota \(b = 1\). En el punto de intersección se produce una inversión de los extremos del segmento, pues más arriba de él la curva \(b \neq a\) queda a la izquierda de la recta \(a = b\), mientras por debajo sucede lo opuesto: es \(a = b\) la que está a la izquierda de \(b \neq a\).

Dicho de otra forma, los puntos de coordenadas \((a,b)\) que se encuentran en el triángulo superior, a la izquierda de la recta azul \(b = a\), y sobre la ordenada del punto de intersección, corresponden a casos para los que \(a^b > b^a\); y los que se hallan en el triángulo inferior, a la derecha de esa recta, sobre la ordenada de la intersección, representan los casos en que \(a^b < b^a\). Los puntos que se hallan en cualquiera de las dos curvas cumplen con la ecuación \(a^b = b^a\). El lector puede localizar, entonces, al punto \((7,70)\) en el triángulo superior, indicando que \(7^{70} > 70^7\), y al punto \((70,7)\) en el triángulo inferior, de acuerdo con lo que ya se había analizado.

En la pequeña fracción del gráfico que queda bajo la ordenada de intersección, los papeles se invierten, como mostraremos en seguida.

Aunque, por la escala empleada para poder cubrir un amplio espectro de valores no se pueda apreciar a simple vista el valor correspondiente al extremo que está en la curva \(a \neq b\), ésta se sitúa ligeramente a la derecha de su asíntota \(a = 1\), y se acerca más a ella conforme \(b\) crece. Sus valores pueden apreciarse en gráficos como los de la Figura 1, o mediante la opción Data Cursor del editor de figuras del MATLAB. También la opción zoom de ese mismo editor, que pasamos a utilizar en el siguiente punto, nos permite apreciar esos valores.

2.5. Bordes y raíz doble:

En la Figura 2 hay una estrecha zona que queda entre la curva roja perimetral y los ejes, que no se ha mencionado, porque hemos hecho el análisis sólo para los casos \(a > 1\) y \(b > 1\). La asíntota vertical está en \(a = 1\), puesto que \(f_{1a}\) no está definida, y \(a \in (0,1) \Rightarrow a^b < a < b^a , \; \forall _{b\geq1}\). Esa zona incluye la parte situada entre la asíntota y la curva roja, con límite inferior en la recta \(b = a\). En ella \(a^b < b^a\). En cambio, en la zona situada entre \(b=0\) y la parte prácticamente horizontal de la curva roja, que incluye la zona bajo la asíntota \(b = 1\) a la derecha de \(b = a\), se cumple que \(b^a < a^b\).

Zona de inversión
Figura 3

El punto de inversión de los extremos del intervalo buscado, P, ya mencionado varias veces, merece estudiarse. Como es la intersección entre las dos curvas que delimitan los intervalos, representa el único intervalo que colapsa a un punto; o, dicho de otra manera, el intervalo de extremos coincidentes - que son las dos raíces de la ecuación \(a^b = b^a\). En términos matemáticos, y valiéndonos de la versión logarítmica, la ecuación \(f_{a} = 0\) tiene una raíz doble únicamente para ese valor del parámetro \(a\).

La raíz doble de una ecuación se caracteriza por ser también cero de la derivada de esa ecuación. Al estudiar el máximo de \(f_a\) vimos ya que la derivada de \(f_a(x)\) es: \[ \frac{df_a(x)}{dx} = \frac{1}{x \times ln(a)} - \frac{1}{a}\] Y que \(\frac{df_a(x)}{dx} = 0\) es una ecuación cuya única raíz satisface la expresión \(x \times ln(a) = a \Leftrightarrow x = \frac{a}{ln(a)}\).

Puesto que, al estar también sobre la recta \(b = a\), la raíz \(x\) debe ser igual a \(a\), tenemos que \(\frac{a}{ln(a)} = a \Leftrightarrow ln(a) = 1 \Leftrightarrow a = e\). Así que el punto de inversión es \(P \leftrightarrow (e,e)\), y el intervalo colapsado es \(I_e\). El número trascendente \(e\) es la base de los logaritmos naturales: \(2.718281828459046...\). En la Figura 3 se puede ver que, en efecto, las coordenadas del punto de intersección, expresadas con 4 dígitos significativos, coinciden con ese valor.

La Figura 3 es una ampliación de la zona de inversión de la Figura 2, en donde se pueden ver claramente la forma en que las dos curvas se intersectan, las asíntotas horizontal y vertical, las coordenadas del punto de inversión, y un punto A, de chequeo adicional.

Ese punto A, de coordenadas \((2.7, 1.5)\) está en el intervalo horizontal \(I_{1.5}\) que va de la recta a la curva, y por consiguiente debe satisfacer \(a^b > b^a\). En efecto, \(a^b = 2.7^{1.5} = 4.4366 > 1.5^{2.7} = 2.9885 = b^a\). En la Figura 2 se puede descubrir también, en la misma ordenada, pero hacia la derecha, el punto \((110,1.5)\), que está al otro lado de la curva roja, y por consiguiente en la zona donde \(b^a > a^b\).

2.5.1. El último rincón:

El comportamiento de la solución en el cuadrado inferior izquierdo de la Figura 3, donde \(a \in [0,1)\) y \(b \in [0,1]\) (llamémoslo \(\mathbb{C_0}\)), merece comentarse ahora, pues, al estar fuera del recorrido y la influencia de la curva \(a \neq b\), sólo tiene la raíz trivial \(a = b\), y en ese sentido es especial. Por esa razón no está incluido en la discusión anterior.

Esa única raíz, a diferencia de lo que sucede en el punto de inversión, no puede ser una raíz doble: nótese que en \(\mathbb{C_0}\), \(ln(a)\) y \(ln(b)\) son negativos, por lo que, si buscamos como antes un cero de su derivada \(\frac{df_a(x)}{dx} = \frac{1}{x \times ln(a)} - \frac{1}{a}\), la \(x\) encontrada debería satisfacer \(\frac{1}{x \times ln(a)} = \frac{1}{a}\). Pero ahora el miembro izquierdo es negativo (pues \(x > 0\) y \(ln(a) < 0\)) mientras el derecho es positivo, de modo que no puede existir la duplicidad, y sólo queda la solución simple \(a = b\), situada en la bisectriz de \(\mathbb{C_0}\). Eso significa que, al pasar \(x\) por ese punto, avanzando de izquierda a derecha, se produce en la función \(g_a(x) = x^a - a^x\) un cambio de signo, de negativo a positivo.

En \(\mathbb{C_0}\), entonces: \(a < b \Leftrightarrow a^b < b^a\).

2.6. Conclusión:

Tomando en cuenta todas estas consideraciones e interpretaciones, la visión panorámica de la Figura 2 puede utilizarse para visualizar la solución a la pregunta planteada, en el intervalo cuadrático (o caja) \([0,120] \times [0,120]\).

Como mnemotecnia, el siguiente esquema reduce la Figura 3 a lo fundamental. Las dos curvas ya conocidas, ortogonales en su intersección, dividen el gráfico, fácilmente extrapolable, en cuatro zonas, en cada una de las cuales predomina \(a^b\) o \(b^a\). Además, en todo cuadrado como éste, con la esquina inferior izquierda en el origen, el área total asociada con \(a^b\) es igual a la asociada con \(b^a\), por la simetría de la figura respecto a la bisectriz \(a = b\).

3. Apéndice. Un modelo más potente:

Con el mismo objetivo de dividir el plano coordenado en zonas según la potencia predominante en cada una (\(a^b\) o \(b^a\)), podemos utilizar un modelo matemático más potente, que requiere algunos conceptos tridimensionales y la incursión en el campo de los números complejos.

En este enfoque, las zonas estarán delimitadas por una ecuación en dos variables \(F(x,y) = 0\), cuyo gráfico debemos trazar.

La función obvia para usar será entonces \(Z = F(x,y) = x^y - y^x\). Corresponde a una superficie tridimensional, con \(Z\) igual a la cota sobre el plano base \(Z = 0\). El gráfico que ahora buscamos es la curva de nivel 0, o contorno 0, de esa superficie y puede ser trazado a partir de ese concepto (el guión escrito con este objeto utiliza la función MATLAB ).

Para completar el instrumento matemático, utilicemos un método numérico diseñado para hallar las raíces reales e imaginarias de una ecuación general cualquiera \(G(z) = 0\), donde \(z \in \mathbb{C}\). En este caso, resulta fructífera la separacion de \(G(z)\) en sus partes real \(u\) e imaginaria \(v\): \[G(x+yi) = u(x,y) + i.v(x,y)\], que se puede hacer algebraicamente, o con un software de manipulación simbólica. Luego, por diversos métodos, es factible hallar las intersecciones de \(u(x,y) = 0\) y \(v(x,y) = 0\), que dan las raíces de la ecuación global.

Para poder usar este enfoque en nuestro problema definimos la variable compleja \(z = x + yi\), y la función compleja \(Z(z) = re(z)^{im(z)} - im(z)^{re(z)}\) equivalente a nuestra \(F(x,y)\). Entonces \(Z(z) = u(x,y) + i.v(x,y\)), y los ceros de esta función deben satisfacer las ecuaciones \(u(x,y) = 0\) y \(v(x,y) = 0\).

Nuestra ecuación se ha convertido ahora en un sistema de dos ecuaciones no lineales. Más que resolver este sistema - que a veces se puede hacer algébricamente, pero en general es un proceso iterativo numérico - nos interesa la forma de estas dos curvas, y particularmente de la parte real \(u(x,y) = 0\).

En muchos casos la graficación de las curvas sirve para determinar aproximadamente sus intersecciones, que pueden usarse como aproximaciones iniciales en un proceso de solución iterativa más exacta del sistema. Como se puede suponer, un método muy utilizado en este caso - sobre todo si se puede contar con buenas aproximaciones iniciales - es el de Newton bidimensional, que utiliza derivadas parciales y la matriz jacobiana como matriz de coeficientes. Pero en el problema que nos ocupa concentrémonos en la forma de la curva \(u(x,y)=0\) más que en métodos para hallar valores precisos de las intersecciones.

El guión MATLAB que realiza el proceso descrito hasta trazar las curvas es el siguiente:

%curvasimpl
% Ejemplo de graficación de dos funciones implícitas de 2 variables.

clear all
clf
syms x y z real
warning off  %Evita mensajes por discontinuidades
fprintf('Separación de una función w(z) en su parte real u(x,y) e imaginaria v(x,y)\n')
fprintf('==========================================================================\n')
caso=input('Qué número de función de fz quiere?');
z=x+y*1i;
sfz=char(fz(z,caso));%Para tener en string f(z) (después ya aparece como f(x+yi)).
fprintf('Función: w(z)=%s\n',sfz);
[f,xx,yy]=fz(z,caso);%Define la función y sus rangos.
if ~isnan(xx)
    u=inline(real(simplify(f)))
    v=inline(imag(simplify(f)))
    [X,Y]=meshgrid(xx,yy); % Construye 2 matrices X, Y
    fu=u(X,Y);% Evalúa la función 1 sobre los puntos del producto cartesiano
    fv=v(X,Y);% Idem para la función 2.
    axes('DataAspectRatio',[1 1 1])
    contour(X,Y,fv,[0 0],'r.') % Curva de nivel 0 roja para la función v
    hold on % Aguanta ese gráfico
    contour(X,Y,fu,[0 0],'k.') % Curva de nivel 0 negra para la función u
    title (['Gráfico de las dos funciones desglosadas de w(z)=' sfz])
    fprintf('\nVer el gráfico de las dos curvas y su intersección\n')
    fprintf('La curva real u(x,y)=0 aparece en negro, y la imaginaria v(x,y)=0, en rojo.\n')
    grid on
    axis('square')
end

En la función fz se han definido diversas funciones junto con este guión. Para nuestro ejemplo, la definición es:

F = imag(z).^real(z)-real(z).^imag(z);xx=0:.01:6;yy=0:.01:6;

donde se especifica, además, el entorno del gráfico: \(0 \leq x \leq 6\), \(0 \leq y \leq 6\)

Esta capacidad permite fácilmente ampliar el proceso a todo el plano coordenado. En la figura inmediata se halla el resultado de la aplicación de esta teoría sobre el entorno de los cuatro cuadrantes.

Dimensión desconocida
Figura 5

3.1. Crítica:

En el primer cuadrante puede verse el contorno ya conocido de nuestro simple método, lo cual es reconfortante. Por otro lado, esta figura muestra también la potencia del segundo método: el hecho de que, con tan poco esfuerzo, hayamos podido producir resultados que, de la forma inicial hubieran requerido mucho cuidado y reflexión. Ahora encontramos diferentes contornos en los demás cuadrantes, cuyo significado no es evidente.

Ante todo hay que recordar el propósito del estudio: determinar en qué zonas es mayor \(a^b\) y en cuáles \(b^a\). Este concepto está definido solamente mientras permanecemos en \(\mathbb{R}^+\). Si abrimos el estudio a todo el plano coordenado, bases negativas pueden producir potencias imaginarias; es decir, entramos en el campo de los complejos, que son un campo No Ordenado. Por consiguiente, no tiene sentido tratar de definir cuál potencia será mayor en cada posible caso.

Sin perder de vista esta perspectiva, es ilustrativo analizar la figura anterior. El método que estamos usando persigue hallar la solución de \(F(x,y) = 0\) en la intersección de las curvas \(u(x,y) = 0\) y \(v(x,y) = 0\), las curvas de nivel 0 de la superficie \(Z = F(x,y)\), dibujadas en el plano cartesiano \(x\), \(y\). La superficie en sí no sólo se extiende en tres dimensiones \((x,y,Z)\), sino que \(Z\) a su vez es un número complejo, por lo cual trazarla requeriría dos figuras parciales separadas.

Pero dentro del primer cuadrante \(Z = F(x,y)\) será siempre real: es decir \(v(x,y) = 0\). En otras palabras, la superficie se aplana completamente en este intervalo, y la intersección buscada de las dos curvas ya está dada por los puntos que pertenecen a \(u(x,y) = 0\), puesto que todos los puntos del cuadrante satisfacen la 2da ecuación \(v(x,y) = 0\). Esta es la razón de que la ya conocida solución que hallamos inicialmente aparezca completa y directamente dibujada en este cuadrante. Algo similar sucede en el logotipo del MATLAB, que contiene una meseta plana y cuadrada, en donde todas las ordenadas \(Z\) perpendiculares al plano base son nulas. Claro que la superficie representada en ese logo es más sencilla que la nuestra en el sentido de que todas sus ordenadas son reales.

En los otros tres cuadrantes de \(F(x,y)\), en cambio, ya existe la componente imaginaria en las ordenadas de la superficie. Es decir, ya hay que buscar la solución mediante un proceso ad hoc que determine la intersección de \(u(x,y) = 0\) y \(v(x,y) = 0\), y ya no será una curva continua, sino un conjunto discreto de puntos. Ese proceso, gráfico en nuestro caso, determinará los puntos de intersección de las curvas negras \(u(x,y) = 0\) con las rojas \(v(x,y) = 0\).

Si hacemos un ejercicio en el tercer cuadrante, que parece el más interesante, a más de las soluciones triviales situadas sobre la bisectriz \(x = y\) sólo hay 4 intersecciones simétricas en el intervalo \([-6,0) \times [-6,0)\). Dos de ellas son \((-2,-4)\) y \((-4,-2)\), fácilmente comprobables, y las otras dos pueden estimarse en \((-5.66,-1.63)\) y \((-1.63,-5.66)\).

Utilizando el algoritmo de Newton con las funciones \(u = @(x,y)(real(x.^y - y.^x))\), \(v = @(x,y)(imag(x.^y - y.^x))\), y estas dos últimas aproximaciones iniciales, se obtiene:

 Solución iterativa por Newton 2D:
 =================================
 it         x              y           u(x,y)       v(x,y)
 ----------------------------------------------------------
  1 -5.66397329e+00 -1.66423329e+00  -1.30e-04    -1.41e-03
  2 -5.66471044e+00 -1.66470686e+00   1.32e-05    -6.92e-05
  3 -5.66471407e+00 -1.66471397e+00  -9.10e-07    -3.30e-07
  4 -5.66471427e+00 -1.66471427e+00  -3.16e-08    -1.82e-08
  5 -5.66471428e+00 -1.66471428e+00  -1.23e-09    -6.77e-10
  6 -5.66471428e+00 -1.66471428e+00  -4.75e-11    -2.62e-11
  7 -5.66471428e+00 -1.66471428e+00  -1.83e-12    -1.01e-12
  8 -5.66471428e+00 -1.66471428e+00  -7.06e-14    -3.90e-14
  9 -5.66471428e+00 -1.66471428e+00  -2.78e-15    -1.47e-15

   x = -5.664714280673191,  y = -1.664714280673191 
   con una tolerancia vertical = 5e-15

Se puede comprobar que: 
   x^y = 0.027573829554885 + 0.048443054135943i = y^x

De igual manera se puede proceder con las aproximaciones iniciales al resto de intersecciones, pero, como ya se señaló, no nos servirán para delimitar zonas asociadas a \(a^b > b^a\) o a \(a^b < b^a\), tanto porque no forman una curva continua cuanto, sobre todo, porque no están definidas esas desigualdades en el campo de los complejos.

De cualquier modo, podemos terminar examinando las dos superficies - la una con ordenadas reales y la otra con imaginarias - cuyas intersecciones con el plano \(Z = 0\) dieron lugar a las curvas \(u(x,y) = 0\) y \(v(x,y) = 0\) de la Figura 5, obtenidas con la función surf de MATLAB:

Dimensión desconocida
Figura 6

Llama la atención la amplia discontinuidad que se puede notar en la superficie real. Es un corredor de dos unidades de anchura, que bordea el tercer cuadrante, centrado en los dos ejes, \(x\) y \(y\), como se puede apreciar si se abate la figura verticalmente, y se debe a que el límite de \(x^y - y^x\), cuando \(x\) o \(y\) (no ambos) tienden a cero, es \(\pm \infty\). Es decir, en los ejes existe una discontinuidad puntual, pero el graficador no sólo no puede representar esa ordenada, sino que tampoco puede interpolar los valores inmediatos dentro de la malla. De ese modo, el espacio de una unidad a cada lado de esa brecha queda vacío y aparece en blanco (los colores están asociados con la magnitud de las ordenadas). Se puede disminuir el ancho del corredor acortando el paso del entramado; en ese caso se alcanzan a calcular ordenadas de mayor módulo, tanto negativas como positivas, pero eso tiene efecto en la escala del dibujo, que acarrea la pérdida de detalle de los relieves menores, produciendo la impresión de que la superficie fuera plana en la mayor parte del gráfico.

En la superficie imaginaria de la imagen derecha se puede comprobar a simple vista que el sector del primer cuadrante es plano y de altura nula, pues sus líneas de borde son rectas paralelas a las de la malla en el valor cero. Esto se puede comprobar con la opción Data Cursor del editor de figuras del MATLAB en los puntos de ese cuadrante, que arrojan un valor \(Z = 0\).

El siguiente gráfico ilustra los puntos mencionados en los dos últimos párrafos.

Dimensión aplanada
Figura 7