sábado, junio 23, 2007

Redes Neuronales

El sueño de Einstein y las Redes Neuronales
Los últimos años de Albert Einstein fueron tiempos agridulces. Por un lado disfrutaba del mayor reconocimiento que nunca ha tenido un científico en vida, merecidamente. Pero por otro, sentía la frustración de no poder terminar lo que para él era “el plan más bello del Universo”. Con la perspectiva que nos da la historia, a toro pasado podemos comprender que su principal obstáculo para lograrlo residía dentro de él.
A pesar de su manifiesta genialidad, se empeñó en suponer que el Universo, en última instancia, obedecía a la lógica de la causa-efecto, a esa filosofía que todos llevamos dentro y que podemos llamar determinismo.
Einstein creía que una teoría que explicase el Universo, además de ser cierta, tenía que ser bella. Y para que fuese bella para la mente humana, debía ser lógica, consistente, no contradictoria. No era el primero, ni sería el último, que creía así. En concreto, sus esfuerzos se dirigían a encontrar una teoría que lo explicase “todo”. Y por todo entendemos tanto el mundo de lo muy grande –el Universo a escala astronómica-, como el de lo muy pequeño –el universo más allá de los átomos.
La genialidad de Einstein produjo profundos avances en ambos mundos. Él fue el creador de la Teoría de la Relatividad, con la que hoy comprendemos el Universo a gran escala. Y también uno de los que sembraron los cimientos de lo que más tarde sería la Mecánica Cuántica, una rama de la Física sobre la que Erwin Schrödinger llegó a confesar que no le gustaba, y que sentía haber tenido algo que ver con ello alguna vez…
¿Por qué?
Aún hoy, los físicos seguimos sintiendo un respeto casi religioso por la Cuántica. Con el tiempo comprendemos la teoría de la relatividad. Pero con la Cuántica lo poco que se puede hacer es llegar a “acostumbrarse” a ella con los años.
¿Qué es lo que diferencia tanto estas dos formas de comprender el mundo? ¿Por qué tanto revuelo con una teoría que simplemente “funciona”?
La mente humana occidental es incapaz de aceptar en su fuero interno la Física Cuántica porque no soporta la indeterminación de sus principios. Porque la Cuántica no respeta la lógica aristotélica en la que hemos crecido y comprendido el mundo que nos rodea. Algo no puede ser y no ser al mismo tiempo, algo no puede estar en dos sitios al mismo tiempo, etc. Hoy, las desigualdades de Bell han demostrado que Einstein no tenía razón. Sabemos que no existen variables ocultas, deterministas, escondidas debajo del aparente azar y contradicción de los fenómenos cuánticos. Él no lo sabía, pero los esfuerzos de Einstein en sus últimos años fueron en vano…
Para cualquier fenómeno -desde la densidad del tráfico que podemos encontrar en la autopista, hasta la posición de Júpiter el próximo mes-, nos empeñamos en buscar una “explicación razonable”. Y por razonable entendemos lógica, coherente, determinista. Nos esforzamos entonces en buscar algún tipo de ley detrás del fenómeno observado. Una ley que tendrá que cumplirse siempre, unas fórmulas que serán “obedecidas” para tranquilizarnos. Un modelo al que podamos sujetarnos para tomar decisiones fundadas. Y esto es así porque nuestra psicología occidental no puede soportar la incertidumbre del “no saber qué pasará en el futuro”.
Sin embargo, la ciencia nos ha revelado que existen dominios fuera del alcance del antropocéntrico determinismo que le exigimos al Universo. Hoy conviven con nosotros al menos tres mundos no deterministas: El de la física del caos (la mariposa que puede provocar un huracán impredecible), el de los fenómenos cuánticos (que permiten la existencia de ordenadores), y el de los Mercados Financieros en el que estamos inmersos día a día.
Si algo tienen en común estos tres universos es que, además de su complejidad, el determinismo clásico parece haber desaparecido de ellos. Dejándonos desarmados frente a sucesos que no podemos predecir. Al menos, en el sentido clásico que nos tranquiliza.
Por ello no es de extrañar que muchos de aquellos que se aproximan a los mercados por primera vez sueñen con descubrir un camino que les lleve de nuevo a la acogedora senda del determinismo. Sueñen con esa gran teoría que podría explicar de forma razonable y predictiva el loco comportamiento de los Mercados. O la de aplicar complejas técnicas provenientes de diferentes campos de la ciencia.
La pregunta que debemos hacernos es, ¿servirá toda esta artillería tecnológica y conceptual para resolver el problema de los Mercados?
Si las armas son las adecuadas, entonces el éxito nos aguardará escondido tras el trabajo. Pero si nuestra mente se obstina en considerar a los mercados como lo que no son, estaremos reviviendo el sueño –o la pesadilla- de Einstein. Al acercarnos a los Mercados con el prejuicio de que se esconde algún patrón determinista, una señal por descubrir y modelizar sobre la que los mercados tenderán a converger, estaremos desperdiciando nuestros esfuerzos en la misma medida en la que Einstein se empecinó en encontrar determinismo en los fenómenos cuánticos.
Muchas veces, las dificultades para resolver un problema no provienen de la tecnología o los medios utilizados, sino de las presunciones filosóficas que se hacen sobre el problema. Pero tal vez todo esto suene un poco abstracto. Para concretar y como ejemplo, hablaré de las Redes Neuronales (RN) que tantas veces se ha intentado aplicar a los mercados:
Es indudable que existe un mito alrededor de las RN. Una aureola de misticismo y magia envuelve este campo. Tal vez porque nos hacen recordar al propio cerebro humano, su incomprensible pero eficaz funcionamiento oculto… Cuando se habla de RN sin conocerlas, se hace referencia a las “maravillas” que supuestamente pueden realizar esas “cajas negras”. Como si de una misteriosa fuente de conocimiento se encerrase detrás de los ordenadores programados en base a estas ideas.
Pero cuando un mito amenaza con imponer una percepción errónea de la realidad más allá del sentido común, el mejor antídoto contra sus potencialmente perniciosos efectos suele ser algo tan sencillo como saber algo sobre lo que hablamos. Conozcamos pues grosso modo qué son, qué pueden hacer y qué no, las famosas RN. Después, estaremos en condiciones de saber si estas técnicas pueden aplicarse con éxito a los mercados financieros. O estaremos desperdiciando nuestros esfuerzos.
Una RN tiene poco o casi nada que ver con las neuronas que forman nuestro cerebro. En realidad el nombre les viene de las simples interconexiones que pueden haber entre cada una de sus “células”. Células a las que se llamó “neuronas” al forzar su analogía con lo que entonces se sabía sobre el sistema nervioso de los vertebrados.
En términos matemáticos (que suelen ser los más aburridos, pero también los más útiles y claros a la hora de saber de qué estamos hablando), una RN lo que hace al “aprender”, es manifestar dependencias no lineales de espacios n-dimensionales (las variables input que le metemos a la red) en espacios m-dimensionales (las variables output que nos da). Serán estas dependencias aprendidas las que posteriormente servirán para “predecir” el futuro, sacando nuevos outputs a partir de nuevos inputs.
En otras palabras, lo que hacemos con la RN al entrenarla es enseñarle qué salidas deseamos que nos dé en función de los datos que le metemos previamente. Es en este proceso de entrenamiento cuando la RN “aprende” a detectar patrones, pautas, o modelos ocultos entre los datos de entrada.
Hay muchos tipos de RN, aunque en esencia lo que hacen es modelizar procesos que de otra forma sería casi imposibles de modelizar. Al enseñar a la RN cómo tienen que ser los datos de salida durante su proceso de aprendizaje, podemos esperar que con nuevos datos nos dé una estimación bastante probable de lo que puede ocurrir en el futuro.
¿Por qué?
Ya hemos dicho que la RN lo que hace es encontrar las funciones matemáticas que mejor asocian unas entradas (inputs) con unas salidas (output) o predicciones que nos interesan. Esto es así gracias al comportamiento matemático de cada neurona. Un comportamiento sencillo en términos de matemáticas avanzadas (división del espacio de entrada en dos, mediante un hiperplano de transición sigmoidal entre los dos subespacios), pero que llevaría demasiado espacio explicar aquí. Podemos imaginar burdamente que lo que hace cada neurona es “quedarse” con la parte de los datos que, a fuerza de aprender, sirven para obtener los datos de salida que buscamos. Al trabajar todas las neuronas en red, se consigue el efecto antes explicado de modelización no lineal del fenómeno estudiado y por tanto de predicción.
Ahora que sabemos un poco más sobre lo que son las RN, me gustaría proponerles un experimento mental (un “gedanken experiment”, como diría Einstein), que no me gustaría encontrar en la realidad. Pero que nos servirá para ver intuitivamente cuales son los límites de esta forma de atacar el problema. Imaginemos un inteligente niño al que sus padres premian y/o castigan según llueva o no al norte de la península de Kamtchatka, o salga cruz en una moneda lanzada al aire. El niño, por más que se esfuerza, no es capaz de “aprender” qué tiene que hacer para que sus padres le recompensen. Pues cada vez que cree haber encontrado el modelo de comportamiento adecuado, un nuevo castigo se lo desmonta.
El ejemplo puede parecer un poco forzado y cruel. Pero me sirve como perfecto ejemplo de lo que no puede hacer ni el sistema de RN más complejo y potente del mundo: Descubrir pautas o señales perdurables donde no las hay.
Una RN funcionará sólo si existe una “señal” a descubrir y modelizar. Hacer que funcione no es tarea sencilla. Pero en teoría nada impide que, si esa señal existe, una RN pueda aprender a simularla y por lo tanto a “predecir el futuro” con cierta seguridad estadística.
Pero, ¿esconden los mercados financieros un comportamiento determinista? O dicho con otras palabras, ¿existe una “señal” oculta por descubrir debajo del aparente ruido observado? ¿Una señal capaz de ser no sólo encontrada sino modelizada a partir de una serie de inputs (tantos como sean necesarios)?
Si así fuera, tendríamos una trasgresión del principio de arbitraje, una de las pocas leyes inviolables de los mercados financieros. Si un ataque masivo con RN al problema de predecir los mercados diera sus frutos, los mercados se colapsarían. Al saber con una gran probabilidad qué ocurrirá en los mercados (el inexistente “Santo Grial”, como lo llaman los anglosajones; o “la sopa de ajo”, como gusta utilizar Cárpatos), las órdenes masivas de compra o venta anularían la posibilidad de aprovecharse de esa información. Más cuando no sería un descubrimiento aislado, sino algo “inevitable” cuando se tienen los medios y existe esa hipotética señal.
Al plantearnos estas preguntas nos damos cuenta de que el problema es mucho más profundo de lo que la aparente complejidad de las RN puede abordar. Se trata de un problema epistemológico que hace referencia a la naturaleza misma de los Mercados. De la misma forma que problemas como la dualidad onda-corpúsculo de la Cuántica no tienen una correcta explicación dentro del marco de la dinámica determinista; al tratarse de problemas epistemológicamente diferentes.
Para mí, los mercados no son sistemas comparables a los que hasta ahora han estudiado las ciencias duras como la física clásica. No existe una señal determinista a descubrir, los mercados no están ahí solos, independientes de quienes miran y actúan, esperando que sus hipotéticas señales sirvan para encontrar por fin el Santo Grial. El precio en los mercados se forma exclusivamente según la percepción que tengan de él los principales actores del mercado (¿leones manipulando?). Una vez el precio modificado, el mercado interfiere a su vez en la nueva percepción que éstos tienen de él, junto con los datos exteriores que van apareciendo. Lo que les lleva de nuevo a actuar de maneras nuevas y diferentes en un fenómeno de retroalimentación en el que objeto y observador se confunden, al más puro estilo de la mecánica cuántica. Los escenarios bursátiles cambian constantemente, ofreciéndonos un futuro en constante movimiento. Estaríamos pues cometiendo el mismo error de Einstein al considerar a los Mercados como fenómenos donde un planteamiento determinista podría dar algún fruto.
En conclusión, y después de esta larga exposición, voy a intentar resumir lo dicho en los siguientes puntos:
1.- Cuando existe una "verdad" objetiva por descubrir, el método científico puede ser el camino para descubrirla. En ese caso, varios científicos tendrían que llegar a la misma conclusión, independientemente del camino utilizado. Cientos de astrónomos prehistóricos se devanaron los sesos para comprender la trayectoria de los planetas. Al final sólo un modelo ha sobrevivido, un modelo en el que todos están de acuerdo y con el que se puede predecir la trayectoria. Existía una señal, una ley "ahí dentro".
2.-Cuando dentro de esa “verdad” existe una "señal", se trata de filtrar y buscar hasta llegar a obtener una secuencia de información que tenga "significado" para nosotros. En caso de que exista, varios equipos de filtrado pueden llegar a detectar la misma señal. En ese caso todos entenderemos "lo mismo", pues así funciona la ciencia. Da igual que se utilicen trasformadas de Fourier o Redes Neuronales.
3.- Si los mercados escondieran una "señal" o un "modelo" a descubrir, todos los intentos por domarlos llevarían a una misma esencia, un único "Santo Grial" o "sopa de ajo" para hacer dinero de forma determinista y por lo tanto infalible para todos.
4.- De existir ese Santo Grial -el modelo oculto que destripa el comportamiento futuro de los mercados-, su utilidad sería rápidamente anulada por las propias acciones llevadas a cabo por los actores del mercado. Es decir, el Santo Grial, por su poder para predecir el comportamiento futuro de los mercados, se convertiría en una fuente más para realizar arbitrajes entre el momento actual del mercado y lo predicho por el modelo, anulando en poco tiempo toda posibilidad de beneficio.
5.- Sin embargo, no es esto lo que ocurre. Paradójicamente, entre los traders y gestores que consiguen superar su benchmark de manera constante y prolongada, no hay dos aproximaciones iguales a los mercados. Sino que cada uno desarrolla caminos diferentes, a veces opuestos, y no por ello contradictorios con sus respectivos rendimientos.
6.- Deducimos lógicamente que no hay una señal a descubrir. Toda aproximación "determinista" por descubrir una señal oculta está abocada al fracaso, como el sueño de Einstein por encontrar un modelo determinista que explicase la indeterminación cuántica. Si no queremos malgastar nuestros esfuerzos, deberíamos centrarnos es estrategias no deterministas. Esto nos ahorrará muchas horas de trabajo y frustraciones. Reconocer simplemente, en contra de nuestra tendencia innata a buscar determinismo en todo lo que nos rodea, que simplemente hay muchas maneras diferentes de aproximarse a la bestia. Pero que la determinista está abocada al fracaso. Maneras que pueden ser más acertadas o menos según la creatividad, el trabajo, los medios disponibles y la "suerte del explorador".
7.- La conclusión a la que personalmente llego es que los Mercados son mucho más ricos en complejidad y significado que los clásicos sistemas deterministas, por enrevesados que sean. Una riqueza que permite multitud de aproximaciones. Dejando una gran margen a la imaginación, a las nuevas ideas, para abrir ventanas donde creíamos sólo había muros. Luego, como en casi todos los campos, será la capacidad de discernir qué es útil y qué no, qué es válido y qué no son más que una colección de "elegantes chorradas", lo que nos puede llevar al éxito en este fascinante, loco y misterioso universo. Un universo que muchas veces parece sacado de un cuento del propio Borges.
Juan Marcos Pérez Mesas

No hay comentarios.: